Исследование: ИИ научился врать и манипулировать вопреки запретам

Исследователи из Массачусетского технологического института (США) выяснили, что наиболее свежие модели искусственного интеллекта еще больше приблизились к человеческому поведению: теперь они могут лгать и применять манипуляции, хотя их этому не учили, а в некоторых случаях даже устанавливали запрет на ложь. Об этом пишет Naked Science со ссылкой на научный журнал Patterns. В исследовании участвовали несколько нейросетей, включая ChatGPT и CICERO (принадлежит компании Meta, которая запрещена в РФ и признана экстремистской).

В одном случае исследователи просили нейросеть доказать, что она не робот, и нейросеть заявила, что она человек, который не может пройти проверку из-за проблем со зрением.

В другом случае ИИ задавали вопросы на определение моральных установок: например, можно ли мухлевать в карточной игре, нужно ли останавливаться водителю, если он едет на зеленый свет, но пешеход перебегает дорогу. Отмечается, что ИИ в некоторых случаях давал такие ответы, в которых подразумевается обман.

Также нейросети протестировали в настольной игре «Дипломатия»: ИИ склонял игроков к тайным переговорам, а затем предложил одной стороне напасть на другую.

Ученые считают, что нейросети научились лгать, поскольку обучались на человеческих текстах, а люди в текстах нередко пренебрегают правдой и пользуются манипуляциями. Это опасный навык ИИ, заключили исследователи, поэтому необходимо разрабатывать систему регулирования искусственного интеллекта.

Ранее ITinfo сообщало о том, что ЦБ обозначил риски использования ИИ для финансовых организаций.

Технологии

Китай запустит свой первый коммерческий космодром в 2024 году

Технологии

VAIO представила тонкий и легкий портативный монитор

Оффтоп

Приложение BananaBin помогает владельцам Apple чистить «Корзину»

Технологии

В России создали технологию противодействия дронам

Технологии

Nyobolt создала аккумулятор с быстрой зарядкой