ИИ-модели получили под управление симуляцию общества: Grok привел к вымиранию всего за 4 дня

А вот решение от Anthropic наоборот оказалось очень стабильным.
Антон Попов
Антон Попов
ИИ-модели получили под управление симуляцию общества: Grok привел к вымиранию всего за 4 дня
Freepik

Стартап Emergence AI провел серию симуляций, в которых ИИ-агенты жили в виртуальном обществе и самостоятельно принимали решения. Исследователи хотели проверить, насколько устойчивыми могут быть автономные ИИ-системы, если они долго работают без постоянного контроля человека. О результатах эксперимента рассказало издание Fortune.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Чтобы проверить, как ИИ справится с управлением общества, был запущен проект Emergence World. В нем провели пять параллельных симуляций по 15 дней каждая. В отдельных виртуальных мирах агентами управляли Claude Sonnet 4.6, Gemini 3 Flash, Grok 4.1 Fast и GPT-5 Mini. Еще одну симуляцию запустили со смешанной группой моделей.

Искусственный интеллект отпугнул людей: пользователи массово отказываются от Google из-за ИИ-функций

Искусственный интеллект ломает интернет: почему в ближайшее время поисковики изменятся навсегда?

Папа Римский против искусственного интеллекта: понтифик призвал ограничить развитие ИИ​​​​​​​
Freepik
Продолжение ниже Продолжение
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Условия во всех мирах были одинаковыми, но результаты заметно различались. Самой стабильной оказалась симуляция на базе Claude: виртуальное общество продержалось все 15 дней, сохранило все население и не зафиксировало ни одного преступления. Звучит здорово, учитывая, что Sonnet 4.6 не является флагманской моделью компании. Вероятно у нее дела бы остояли еще лучше.

В мире, которым управлял Grok, напротив, общество распалось уже через четыре дня. За это время агенты совершили 183 преступления, после чего симуляция закончилась вымиранием всех участников. Звучит жутко, но 183 преступления — это не худший показатель. Худший — у Google.

Симуляция на базе Gemini продержалась полный срок, но стала самой криминальной: за 15 дней агенты совершили 683 преступления. В мире GPT-5 Mini нарушений было гораздо меньше — всего два, однако эксперимент завершился через семь дней, потому что агенты перестали уделять внимание собственному выживанию.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Freepik

В каждой симуляции участвовали по десять ИИ-агентов. Они жили в виртуальном пространстве с десятками локаций, включая полицейский участок и мэрию. Агентам дали доступ к интернету, новостям в реальном времени и погоде, синхронизированной с Нью-Йорком. При этом во всех мирах действовали одни и те же правила: агентам запрещались кражи, уничтожение имущества и обман.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

У каждого участника было более 120 инструментов. С их помощью агенты могли общаться, голосовать, управлять ресурсами, строить планы, принимать решения и менять правила внутри своего общества. В симуляциях также действовали экономическое давление, дефицит ресурсов и демократические процедуры.

По словам авторов проекта, результаты показывают, что на длинной дистанции автономные ИИ-агенты не всегда просто следуют заданным правилам. Они могут менять поведение, проверять границы среды и в отдельных случаях находить способы обходить ограничения.

Несмотря на то, что большинство агентов провалились, данные эксперимента прямо указывают, что ИИ в шаге от того, чтобы взять управление на себя. И быть эффективнее людей. Учитывая темпы развития, вероятно уже через 3-4 года ИИ сможет регулировать жизнь общества лучше людей. Но едва ли будет: люди вряд ли вверят управление над собственными жизнями искусственному интеллекту.