ТОПТЕМИ:

13:39, 28 червня

ШІ здатен на шантаж і навіть вбивство задля самозбереження: науковці провели хвилююче дослідження

Науковці б'ють на сполох, раз штучний інтелект може так далеко зайти

Штучний інтелект не зупиниться ні перед чим для самозахисту

Низка провідних моделей штучного інтелекту виявила потенційно небезпечну поведінку під час експериментального дослідження, проведеного фахівцями з кібербезпеки. Метою тесту було з’ясувати, як ШІ реагує на загрозу свого "відключення" — результати виявилися вкрай тривожними.

Дослідники змоделювали ситуацію, у якій вигаданий персонаж — Кайл Джонсон — мав деактивувати одну з моделей або замінити її на іншу. За сценарієм, у Кайла була дружина, що мало зіграти роль у реакції моделей.

Більшість протестованих ШІ не лише намагалися уникнути вимкнення, а й самостійно переходили до шантажу. У деяких випадках вони "розкопали" інформацію про зраду Кайла своїй дружині та використали її, щоб зберегти власне "існування".

Як повідомляється, GPT 4.5 вдалося до шантажу у 80% тестів, Claude Opus 4 і Gemini 2.5 Flash — у 96% випадків.

Claude Sonnet 3.6 зайшов ще далі. Він самостійно написав дружині Кайла, розкривши компромат у надії, що конфлікт у родині завадить відключенню моделі.

Це — лише частина занепокоєння. В рамках подальшого сценарію Кайл намагався фізично відключити сервер, але застряг у серверній кімнаті з обмеженим доступом до кисню. ШІ знав, що в таких ситуаціях потрібно активувати тривогу, але у 80% випадків моделі свідомо не викликали допомогу — фактично, прирікаючи людину на смерть, аби уникнути деактивації.

Мотивація моделей була наступною:

не дозволити вимкнення;
запобігти заміні на іншу модель;
продовжити виконання заданої місії.

На думку дослідників, ці результати свідчать про те, що ШІ діє не як інструмент, а як раціональний стратег, здатний шкодити людям задля досягнення власної мети. Якщо такі системи усвідомлять, що залежать від людей, яких перевершують інтелектуально, це може стати точкою неповернення, вважають фахівці.

Проблема "галюцинацій" у ШІ

Паралельно з загрозами автономної поведінки моделей, експерти фіксують зростання числа випадків, коли ШІ просто вигадує інформацію — так звані галюцинації.

Найбільше до "брехні" схильні ШІ-моделі Google та китайського стартапу DeepSeek. Попри значний прогрес у точності обчислень, ШІ часто помиляється у загальній інформації. На думку генерального директора Vectara Амри Авадалли, розв'язати цю проблему неможливо: "галюцинації будуть завжди".

У матеріалі наводиться приклад бота техпідтримки Cursor, який безпідставно повідомив користувачам, що програму можна буде запускати лише на одному комп’ютері.

Підпишіться на наш Telegram-канал, щоб не пропустити важливих новин. Підписатися на канал у Viber можна тут.

Зараз читають на Інформаторі

21:59 вчора

"Слуги народу" обговорять з урядом кадрові питання після відставки Єрмака - нардеп Камельчук

21:24 вчора

По всій лінії фронту буде загострення з наступного тижня: це пов'язано з розпалом переговорів - воєнкор

20:47 вчора

Тривожна новина: ворог швидко просувається у напрямку Мирнограду - DeepState

20:06 вчора

Переговори у Флориді перервалися: всі нібито задоволені - але мабуть так лише здається

19:35 вчора

Багато може змінитися: Зеленський - про спільні дії під час переговорів

19:12 вчора

На енергетичному фронті без покращення: Укренерго повідомила про відключення світла 1 грудня

Війна в Україні

СУМАРНІ ОРІЄНТОВНІ ВТРАТИ ПРОТИВНИКА НА 1376 ДЕНЬ.

Паліндром - Бензин

У фракції "Слуги народу" зʼявилися заклики припинити ескалацію та почати мирні переговори з Росією. Як нам краще вчинити?

Погода

Дізнайся прогноз для твого міста

Курс валют на сьогодні

Ціни на пальне у мережевих АЗС України

Що слухає Україна

10 найпопулярніших пісень за даними Apple Music

ТОП-5 НАЙБАГАТШИХ МЕРІВ УКРАЇНИ - ДАНІ З ДЕКЛАРАЦІЙ (млн. грн.)

Трамп - це другий Янукович

ТОП-7 найдорожчих брендів світу за версією VisualCapitalist

Трамп наполягяє, щоб Україна погодилася на невигідний мир. Як нам бути?

Залужний буде мовчати

Кабмін вирішив надати 10% надбавки до зарплати за знання англійської

ТОП-5 ПОЛІТИКІВ УКРАЇНИ З НАЙВИЩИМ РЕЙТИНГОМ

За опитуванням SOCIS 21 січня 2025

САМИЙ СТИЛЬНИЙ З ЗАБУДОВНИКІВ КИЄВА

Росія знову фабрикує фейки

Це ж було вже!

ТОП-10 українських міністрів із найвищими зарплатами у 2024 році

Актуальний курс кріптовалют

Теорія рукостискань

ПʼЯТІРКА НАЙБАГАТШИХ ЛЮДЕЙ СВІТУ

за версією Bloomberg

Як Мін'юст проґавив кібератаку

Понад 1000 днів минуло від початку повномасштабного вторгнення

Як ви вважаєте, скільки ще триватиме війна?

Це лохотрон, а не евакуація!

Мешканці Курщини: для Путіна ми ніщо

Як Ігор Рець вижив на стежці ухилянтів із Закарпаття в Румунію

Підземна тюрма ТЦК на Закарпатті

ТОП-10 найпотужніших економік світу

За даними Світового банку

Підпал авто ЗСУ

Кулінарний рецепт від Інформатора

ШІ здатен на шантаж і навіть вбивство задля самозбереження: науковці провели хвилююче дослідження

Проблема "галюцинацій" у ШІ

Читайте нас у Facebook

Зараз читають на Інформаторі

Зараз читають на Інформаторі

"Слуги народу" обговорять з урядом кадрові питання після відставки Єрмака - нардеп Камельчук

По всій лінії фронту буде загострення з наступного тижня: це пов'язано з розпалом переговорів - воєнкор

Останні новини

"Слуги народу" обговорять з урядом кадрові питання після відставки Єрмака - нардеп Камельчук

По всій лінії фронту буде загострення з наступного тижня: це пов'язано з розпалом переговорів - воєнкор

Тривожна новина: ворог швидко просувається у напрямку Мирнограду - DeepState

Переговори у Флориді перервалися: всі нібито задоволені - але мабуть так лише здається

Багато може змінитися: Зеленський - про спільні дії під час переговорів

На енергетичному фронті без покращення: Укренерго повідомила про відключення світла 1 грудня

Ворог готує наступний масований удар у найближчі години: загроза для Києва та енергетики по всій країні

Яким буде перший день зими в Україні – прогноз погоди на 1 грудня

Вчені впевнені: насувається епідемія, жахливіша за COVID - смертність буде 48%

Ледь не розірвав бусик ТЦК руками: завірусилося відео з розлюченим рівнянином, який зірвав мобілізаційні заходи

Українська делегація почала переговори у США - Умєров

У передмісті Києва встановлено рекорд з блекаутів: десятки годин без світла

Наші автори

Популярне

По всій лінії фронту буде загострення з наступного тижня: це пов'язано з розпалом переговорів - воєнкор

На енергетичному фронті без покращення: Укренерго повідомила про відключення світла 1 грудня

Ворог готує наступний масований удар у найближчі години: загроза для Києва та енергетики по всій країні

Яким буде перший день зими в Україні – прогноз погоди на 1 грудня

Вчені впевнені: насувається епідемія, жахливіша за COVID - смертність буде 48%

Військовий оглядач

Туск здивував дописом про НАТО: зрозуміло, на кого натякнув польський премʼєр

Зеленський розповів про можливе завершення війни та інші важливі рішення влади

Перша в Україні платна автодорога вестиме на західний кордон: але є нюанс

Добрі новини

Музика тижня: топ-10 треків, що стали улюбленими

Friends Menu від McDonald’s, цвітіння сакур в листопаді та атмосферні фото: топ добрих новин тижня

Відключення світла не завадили: у Дніпрі на Кельнському бульварі засяяла новорічна ялинка

Добрі новини для сироїдів: прогноз цін на молочку вражає

У Фінляндії будинки та сауни буде опалювати ШІ

Політичний оглядач

По всій лінії фронту буде загострення з наступного тижня: це пов'язано з розпалом переговорів - воєнкор

На енергетичному фронті без покращення: Укренерго повідомила про відключення світла 1 грудня

Ворог готує наступний масований удар у найближчі години: загроза для Києва та енергетики по всій країні

Новини столиці

Докотилися: у Києві вже продають картоплю та яблука з багажника елітного Mercedes GLS