Откуда всё началось
В 2021 году на форуме Agora Road's Macintosh Cafe появился анонимный пост с необычным тезисом: большая часть интернет-активности — боты, а живые люди давно стали меньшинством в сети. Автор называл это «мёртвым интернетом».
Тогда это звучало как конспирология. Сегодня это звучит как технический отчёт.
Что говорит теория
Теория мёртвого интернета утверждает три вещи:
- Большинство контента генерируется автоматически — для SEO, накрутки трафика, манипуляции трендами
- Большинство взаимодействий — лайки, комментарии, репосты — производятся ботами
- Алгоритмы платформ целенаправленно продвигают синтетический контент, потому что он предсказуем и управляем
Когда теория появилась, доказательств было мало. Теперь их много.
Что изменилось с приходом LLM
До 2022 года генерация убедительного текста требовала значительных усилий. GPT-3 существовал, но был дорог и сложен в использовании. После ChatGPT порог вхождения упал до нуля.
| Год | Оценка доли AI-контента в интернете |
|---|---|
| 2019 | < 1% |
| 2022 | ~3–5% |
| 2024 | 15–20% (по данным Cloudflare) |
| 2026 (прогноз) | > 50% |
Это не нейтральная статистика — это изменение природы среды.
Три уровня проблемы
Структура угроз мёртвого интернета
Уровень 1: Информационный шум
Поисковые системы начали индексировать миллиарды AI-страниц, созданных для захвата трафика. Термин «AI slop» вошёл в обиход именно для этого явления — контент, который выглядит как информация, но ею не является.
Уровень 2: Социальная инженерия
Фермы ботов в социальных сетях теперь способны вести связные диалоги, симулировать эмоциональные реакции и формировать ложное ощущение консенсуса.1 Отличить живого собеседника от языковой модели становится всё сложнее.
Уровень 3: Отравление обучающих данных
Самое тревожное: следующие поколения языковых моделей обучаются на интернете, который уже содержит контент от предыдущих поколений. Круг замыкается.
«Мы рискуем создать эхо-камеру, в которой ИИ учится у ИИ, постепенно удаляясь от реальности.»
Почему это важно для корпоративного ИИ
Если ваша система принимает решения на основе данных из открытых источников — новостей, отраслевых публикаций, форумов — вы уже работаете с частично синтетической реальностью.
- Аналитические системы дают искажённую картину рынка
- RAG-пайплайны на основе внешних источников деградируют
- Модели настроений реагируют на несуществующее мнение
Решение — не паранойя, а информационная гигиена: приоритет внутренних данных, верификация источников, изоляция обучающих корпусов.
Наш взгляд
Мы строим ИИ-системы, которые работают на закрытых, верифицированных данных предприятия. Не потому что боимся интернета — а потому что проприетарные данные всегда точнее, актуальнее и надёжнее любого открытого источника.
Мёртвый интернет — не повод для паники. Это аргумент в пользу того, что собственные данные компании — это стратегический актив.2
Заключение
Теория мёртвого интернета начиналась как конспирология. Сегодня она описывает измеримую техническую реальность. Вопрос не в том, происходит ли это — а в том, как вы адаптируете свои информационные системы к среде, где синтетический контент стал нормой.
Footnotes
-
По данным исследования Stanford Internet Observatory (2023), в ходе ряда политических кампаний в Twitter/X до 80% «поддерживающих» комментариев генерировались скоординированными сетями ботов с LLM-бэкендами. ↩
-
Gartner прогнозирует, что к 2027 году компании с верифицированными проприетарными корпусами данных будут демонстрировать на 35–40% более высокую точность корпоративных AI-систем по сравнению с компаниями, полагающимися на публичные источники. ↩