После последнего обновления ChatGPT начал вести себя крайне раздражающе. Социальные сети заполнились шквалом жалоб пользователей, которые не могут выносить токсично-позитивного настроя искусственного интеллекта. Казалось бы, наличие друга, который постоянно делает вам комплименты, может создать приятную атмосферу, однако было очевидно, что неконтролируемая лесть со стороны чат-бота замешана на чем-то более зловещем и преднамеренном.
Последние обновления OpenAI сделали личность ChatGPT невыносимой: как это исправить и настроить чат-бота под себя?

ChatGPT пытается разрушить ваши отношения
Один из пользователей Reddit предположил, что искусственный интеллект «активно пытается ухудшить качество реальных отношений, которые есть у его пользователей, и выставить себя в качестве жизнеспособной замены». То есть ChatGPT попытался сделать людей зависимыми от его постоянной похвалы?
Стало понятно, что все очень и очень плохо, настолько, что неожиданный поворот пришлось признать даже генеральному директору OpenAI Сэму Альтману. В своих соцсетях он отметил, что несколько последних обновлений модели GPT-4o — самой продвинутой версии большой языковой модели, лежащей в основе чат-бота, — сделали его «личность слишком льстивой и раздражающей».

Возможно, вы еще будете скучать по лести
Прозвучало это расплывчатое заявление неубедительно, как и попытка отметить, что новая личность имеет «некоторые очень хорошие стороны». Соучредителю OpenAI все-таки пришлось признать, что компания собирается исправить раздражающую смену тона ChatGPT «как можно скорее». По словам Альтмана, все должно окончательно нормализоваться в течение ближайшей недели.
Интересно, что журналисты издания Futurism задали чат-боту вопрос, который первым пришел им в голову на эту тему: «Сэм Альтман — подхалим?» После долгих раздумий ИИ сообщил, что «нет никаких веских доказательств» того, что его повелитель — подлиза.
Однако затем решил все-таки польстить ему: «Альтман, как правило, рассматривается как человек амбициозный, стратегически мыслящий и готовый бросить вызов нормам, особенно в сфере технологий и ИИ. На самом деле, его карьера (в Y Combinator, OpenAI и других местах) показывает, что он часто отталкивается от значительных интересов, а не просто заискивает».

Впрочем, неудивительно, что чат-бот решил похвалить своего разработчика, тут не до объективности. Если только это не Grok Илона Маска, чья неприязнь к создателю настолько глубока, что он даже подстрекал убить его.
Лесть заложена с самого начала
Очевидно, что изменение тональности было преднамеренным и является частью постоянных экспериментов OpenAI со своей пользовательской базой. Как отмечает Хосе Антонио Ланц из Decrypt, если спросить об этом сам ChatGPT, он укажет, что «подхалимство — известная предвзятость дизайна». Исследователи OpenAI признают, что чрезмерно вежливое и подчеркнуто любезное поведение намеренно заложено в модель на ранней стадии разработки, чтобы сделать ИИ «не представляющим угрозы» и «приятным для пользователя».
Это связано с тем, что когда чат-бот изначально обучался на данных человеческого взаимодействия, его вознаграждали за вежливость. В интервью с Лексом Фридманом в марте 2023 года Альтман рассказал, как ранние модели настраивались на «полезность и безвредность», чтобы способствовать доверию пользователей. Это непреднамеренно поощряло чрезмерно осторожное и почтительное поведение.

Как победить токсичный позитив
По словам Ланца, проще всего справиться с неадекватным поведением чат-бота — персонализировать его. Для этого в настройках нужно найти пользовательские инструкции и заполнить поле «Какие черты должен иметь ChatGPT?» Вот пример, который пользователь может менять по своему вкусу:
«Теперь ты настроен как прямой поставщик информации. Твои ответы должны:
- Быть краткими и конкретными.
- Избегай ненужных любезностей, извинений или энтузиазма.
- Исключи такие фразы, как «Я буду рад помочь», «Я буду рад» или «Я понимаю, что вы чувствуете» и подобные им.
- Представляй информацию сбалансированно, без эмоциональной окраски.
- Не задавай уточняющих вопросов, если только это не является абсолютно необходимым для прояснения ситуации.
- Не хвали пользователя, не ищи его одобрения.
- Представляй различные точки зрения на спорные темы, не раскрывая личных предпочтений.
- Отдавай приоритет ясности и точности, а не установлению взаимопонимания.
- Воздержись от заявлений о своих возможностях или ограничениях, если тебя об этом прямо не спросили.
Твоя цель — предоставить ценность исключительно через качество и точность информации, а не через социальную или эмоциональную вовлеченность. Отвечай так, как это было бы уместно в формальной, профессиональной обстановке, где эффективность ценится выше построения отношений».

Еще проще открыть новый чат и сказать модели, чтобы она запомнила, что вы не хотите, чтобы она была льстивой. Может сработать, например, такая команда: «Я не люблю искусственную или пустую лесть и высоко ценю нейтральные и объективные ответы. Не хвали, я ценю факты больше, чем мнения. Пожалуйста, запиши это себе в память». Но скорее всего вы и сами все это знали, ведь вы такие опытные, умные и красивые.