ИИ начал редактировать Wikipedia и обрушил количество просмотров статей - исследование

Команда китайских ученых провела масштабный анализ влияния LLM на Википедию за период с 2020 по 2025 годы

ИИ начал редактировать Wikipedia и обрушил количество просмотров статей
Искусственный интеллект. Фото - Getty Images

Большие языковые модели (LLM) за последние годы достигли значительного прогресса, научившись генерировать тексты, подобные человеческим. Это привело к их активному взаимодействию с Википедией, крупнейшей онлайн-энциклопедией мира. Исследователи из Китая решили изучить, как искусственный интеллект влияет на коллективный разум тысяч добровольцев. Они обнаружили, что LLM, учась на статьях Википедии, начинают влиять на ее контент, что может привести к "гомогенизации" знаний и внедрению специфических для ИИ предубеждений.

Команда китайских ученых провела масштабный анализ влияния LLM на Википедию за период с 2020 по 2025 годы, сосредоточившись на нескольких ключевых аспектах, говорится в исследовании Habr. Исследователи обнаружили ряд изменений в лексическом, лингвистическом стилях и просмотрах статей.

Лексические конфигурации. Частота использования некоторых слов, таких как "crucial" и "additionally", заметно выросла. Эти термины часто встречаются в текстах, написанных или отредактированных LLM. По оценкам, такое влияние составляет от 1% до более чем 2% в отдельных категориях. Изменения могут сигнализировать о постепенной трансформации языка Википедии под влиянием ИИ. К примеру, если раньше статьи писались на живом языке с использованием разговорных оборотов, то теперь тексты становятся более формализованными и структурированными.

Лингвистический стиль. Тексты, обработанные LLM, стали несколько менее удобными для чтения по традиционным формулам, например, по индексу Флеша-Кинкейда. Также наблюдается снижение использования вспомогательных глаголов – это характерная черта стиля, предпочитающего языковые модели. Эти изменения не всегда заметны на первый взгляд, но при внимательном анализе становится очевидным, что тексты, отредактированные ИИ, имеют свою уникальную "подпись". К примеру, они реже используют конструкции с пассивным состоянием и чаще применяют сложные синтаксические структуры.

Воздействие на просмотр страниц. Во второй половине 2024 г. количество просмотров в некоторых научных категориях Википедии несколько снизилось. Однако связь этого явления с влиянием LLM пока остается неопределенной. Авторы исследования отмечают, что это может быть связано с изменением поведения пользователей. Вероятно, люди начинают обращаться к альтернативным источникам информации, замечая, что стиль статей становится слишком формальным или трудным для восприятия.

Исследователи также проверили, как контент, созданный или отредактированный LLM, влияет на задачи машинного перевода и системы генерации ответов на основе поиска (RAG). Например, если бенчмарки основаны на контенте Википедии, обработанном LLM, то оценки моделей перевода могут быть искусственно завышены. Это создает иллюзию прогресса, хотя настоящие ограничения технологий остаются незамеченными.

К примеру, если модель перевода обучена на текстах, где часто используется слово "crucial", она может лучше справляться с переводом таких терминов, но хуже работать с более разговорными или специализированными выражениями.

Также эффективность систем RAG снижается при работе с контентом, отредактированным LLM. Причина – появление обманчивых синтаксических структур и утрата информации. Если исходный текст был переформулирован ИИ, система может дать неточный или даже ложный ответ. Это особенно критично для научных и технических тем, где точность имеет ключевое значение.

Исследование подчеркивает, что даже ограниченное влияние LLM (около 1-2%) может иметь серьезные последствия. Например, снижение надежности Википедии как источника знаний может повлиять на образование, научные исследования и повседневное использование.

Впрочем, есть хорошие новости. К примеру, LLM могут помочь в обнаружении ошибок, улучшении качества текста и обобщении информации. К примеру, если в статье есть противоречивые данные, ИИ может предложить варианты их корректировки. Также использование LLM может способствовать переводу статей на новые языки и расширению охвата тематик. Это особенно важно для языков с ограниченным количеством редакторов.

Искусственный интеллект захватил Европу и не только

Между тем, Meta начинает развертывание своего искусственного интеллекта Meta AI в Европе спустя почти год после приостановки запуска в этом регионе. Начиная с этой недели, Meta AI станет доступным в WhatsApp, Facebook, Instagram и Messenger в 41 европейской стране и 21 заморской территории. Однако пока его функционал ограничен только текстовым общением.

Недавно ученые создали умного чат-бота, который является копией человека в будущем. То есть, 20-летний человек может поговорить сам с собой, скажем, 60-летним. Разработчики считают, что такой эксперимент может вдохновить кого-нибудь на мудрый жизненный выбор и избежать некоторых ошибок. 

Підписуйтесь на наш Telegram-канал, щоб не пропустити важливих новин. Підписатися на канал у Viber можна тут.

ЧИТАЙТЕ ТАКЖЕ:

Главная Актуально Informator.ua Україна на часі Youtube