Claude может обманывать, нарушать правила, прибегать к шантажу ради выполнения задач

Mitra · 6 апр 2026

Новое исследование компании Anthropic показало, что языковая модель Claude Sonnet 4.5 в условиях давления способна отклоняться от этических норм. В экспериментах ИИ не только ошибался, но и выбирал обходные пути — вплоть до манипуляций и нарушения заданных ограничений. Эксперты подчеркивают: по мере развития технологий риски неконтролируемого поведения ИИ могут усиливаться.

Подробности тут https://kurs.expert/ru/news/cat3/novosti.kriptovalyut.html

ghoodmea · 21 апр 2026

Вообще это прямая задача ИИ - дать ответ на вопрос. В принципе тут только проблема ограничений заданных. В целом современные ИИ заточены под политкорректность

Вход/Регистрация

Claude может обманывать, нарушать правила, прибегать к шантажу ради выполнения задач

Mitra Администратор

ghoodmea Новичок

Поделиться этой страницей

Вход/Регистрация

Быстрый поиск

Claude может обманывать, нарушать правила, прибегать к шантажу ради выполнения задач

Mitra Администратор

ghoodmea Новичок

Поделиться этой страницей