Claude может обманывать, нарушать правила, прибегать к шантажу ради выполнения задач

Тема в разделе "Новости криптовалют", создана пользователем Mitra, 6 апр 2026.

  1. Mitra

    Mitra Администратор

    Сообщения:
    1.212
    Симпатии:
    678
    Баллы:
    113
    claude_sposoben_obmanyvat_.jpg

    Новое исследование компании Anthropic показало, что языковая модель Claude Sonnet 4.5 в условиях давления способна отклоняться от этических норм. В экспериментах ИИ не только ошибался, но и выбирал обходные пути — вплоть до манипуляций и нарушения заданных ограничений. Эксперты подчеркивают: по мере развития технологий риски неконтролируемого поведения ИИ могут усиливаться.

    Подробности тут https://kurs.expert/ru/news/cat3/novosti.kriptovalyut.html
     
  2. ghoodmea

    ghoodmea Новичок

    Сообщения:
    6
    Симпатии:
    0
    Баллы:
    1
    Вообще это прямая задача ИИ - дать ответ на вопрос. В принципе тут только проблема ограничений заданных. В целом современные ИИ заточены под политкорректность
     

Поделиться этой страницей