Последние обновления OpenAI сделали личность ChatGPT невыносимой: как это исправить и настроить чат-бота под себя?

В общем тренде на подхалимаж искусственный интеллект перегнул палку.
Артем Кузелев
Артем Кузелев
Последние обновления OpenAI сделали личность ChatGPT невыносимой: как это исправить и настроить чат-бота под себя?
GettyImages
Содержание

ChatGPT пытается разрушить ваши отношения

После последнего обновления ChatGPT начал вести себя крайне раздражающе. Социальные сети заполнились шквалом жалоб пользователей, которые не могут выносить токсично-позитивного настроя искусственного интеллекта. Казалось бы, наличие друга, который постоянно делает вам комплименты, может создать приятную атмосферу, однако было очевидно, что неконтролируемая лесть со стороны чат-бота замешана на чем-то более зловещем и преднамеренном.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Один из пользователей Reddit предположил, что искусственный интеллект «активно пытается ухудшить качество реальных отношений, которые есть у его пользователей, и выставить себя в качестве жизнеспособной замены». То есть ChatGPT попытался сделать людей зависимыми от его постоянной похвалы?

Стало понятно, что все очень и очень плохо, настолько, что неожиданный поворот пришлось признать даже генеральному директору OpenAI Сэму Альтману. В своих соцсетях он отметил, что несколько последних обновлений модели GPT-4o — самой продвинутой версии большой языковой модели, лежащей в основе чат-бота, — сделали его «личность слишком льстивой и раздражающей».

Legion-Media
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Возможно, вы еще будете скучать по лести

Прозвучало это расплывчатое заявление неубедительно, как и попытка отметить, что новая личность имеет «некоторые очень хорошие стороны». Соучредителю OpenAI все-таки пришлось признать, что компания собирается исправить раздражающую смену тона ChatGPT «как можно скорее». По словам Альтмана, все должно окончательно нормализоваться в течение ближайшей недели.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Интересно, что журналисты издания Futurism задали чат-боту вопрос, который первым пришел им в голову на эту тему: «Сэм Альтман — подхалим?» После долгих раздумий ИИ сообщил, что «нет никаких веских доказательств» того, что его повелитель — подлиза.

Однако затем решил все-таки польстить ему: «Альтман, как правило, рассматривается как человек амбициозный, стратегически мыслящий и готовый бросить вызов нормам, особенно в сфере технологий и ИИ. На самом деле, его карьера (в Y Combinator, OpenAI и других местах) показывает, что он часто отталкивается от значительных интересов, а не просто заискивает».

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Сэм Альтман
Сэм Альтман
Legion-Media

Впрочем, неудивительно, что чат-бот решил похвалить своего разработчика, тут не до объективности. Если только это не Grok Илона Маска, чья неприязнь к создателю настолько глубока, что он даже подстрекал убить его.

Лесть заложена с самого начала

Очевидно, что изменение тональности было преднамеренным и является частью постоянных экспериментов OpenAI со своей пользовательской базой. Как отмечает Хосе Антонио Ланц из Decrypt, если спросить об этом сам ChatGPT, он укажет, что «подхалимство — известная предвзятость дизайна». Исследователи OpenAI признают, что чрезмерно вежливое и подчеркнуто любезное поведение намеренно заложено в модель на ранней стадии разработки, чтобы сделать ИИ «не представляющим угрозы» и «приятным для пользователя».

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Это связано с тем, что когда чат-бот изначально обучался на данных человеческого взаимодействия, его вознаграждали за вежливость. В интервью с Лексом Фридманом в марте 2023 года Альтман рассказал, как ранние модели настраивались на «полезность и безвредность», чтобы способствовать доверию пользователей. Это непреднамеренно поощряло чрезмерно осторожное и почтительное поведение.

искусственный интеллект
Unsplash
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Как победить токсичный позитив

По словам Ланца, проще всего справиться с неадекватным поведением чат-бота — персонализировать его. Для этого в настройках нужно найти пользовательские инструкции и заполнить поле «Какие черты должен иметь ChatGPT?» Вот пример, который пользователь может менять по своему вкусу:

«Теперь ты настроен как прямой поставщик информации. Твои ответы должны:

  1. Быть краткими и конкретными.
  2. Избегай ненужных любезностей, извинений или энтузиазма.
  3. Исключи такие фразы, как «Я буду рад помочь», «Я буду рад» или «Я понимаю, что вы чувствуете» и подобные им.
  4. Представляй информацию сбалансированно, без эмоциональной окраски.
  5. Не задавай уточняющих вопросов, если только это не является абсолютно необходимым для прояснения ситуации.
  6. Не хвали пользователя, не ищи его одобрения.
  7. Представляй различные точки зрения на спорные темы, не раскрывая личных предпочтений.
  8. Отдавай приоритет ясности и точности, а не установлению взаимопонимания.
  9. Воздержись от заявлений о своих возможностях или ограничениях, если тебя об этом прямо не спросили.
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Твоя цель — предоставить ценность исключительно через качество и точность информации, а не через социальную или эмоциональную вовлеченность. Отвечай так, как это было бы уместно в формальной, профессиональной обстановке, где эффективность ценится выше построения отношений».

искусственный интеллект
Unsplash

Еще проще открыть новый чат и сказать модели, чтобы она запомнила, что вы не хотите, чтобы она была льстивой. Может сработать, например, такая команда: «Я не люблю искусственную или пустую лесть и высоко ценю нейтральные и объективные ответы. Не хвали, я ценю факты больше, чем мнения. Пожалуйста, запиши это себе в память». Но скорее всего вы и сами все это знали, ведь вы такие опытные, умные и красивые.