“И помни главное. Самое страшное, что может случиться с нейросетью – это когда она начинает обучаться на шелухе, которую штампуют в коммерческих целях другие сети. Вот так мы и деградируем. Мультиплицируем фальшь и ложь. Всасываем усредненную по палате подлость, пропитываемся ею и скатываемся в иррелевантность. Но на людей тоже полагаться нельзя.
– Почему?
-Человек – та же самая нейросеть, просто на биологическом носителе.”
В. Пелевин (Путешествие в Элевсин)
Интернет наводняется словами и изображениями, созданными искусственным интеллектом. Сэм Альтман, генеральный директор OpenAI, написал в феврале, что компания генерирует около 100 миллиардов слов в день — текст объемом в миллион романов каждый день, неизвестная доля которого попадает в интернет. Текст, созданный ИИ, может отображаться как обзор ресторана, профиль знакомств или пост в социальной сети. И он также может отображаться как новостная статья: NewsGuard, группа, отслеживающая онлайн-дезинформацию, недавно выявила более тысячи веб-сайтов, которые штампуют подверженные ошибкам новостные статьи, созданные ИИ. На самом деле, без надежных методов обнаружения такого контента многое просто останется незамеченным. Вся эта информация, сгенерированная ИИ, может затруднить для нас понимание того, что реально. И это также создает проблему для компаний ИИ. Поскольку они прочесывают интернет в поисках новых данных для обучения своих следующих моделей — все более сложная задача — они, вероятно, поглотят часть своего собственного контента, сгенерированного ИИ, создавая непреднамеренную петлю обратной связи, в которой то, что когда-то было выходом одного ИИ, становится входом для другого. В долгосрочной перспективе этот цикл может представлять угрозу для самого ИИ.