Стартап Emergence AI провел серию симуляций, в которых ИИ-агенты жили в виртуальном обществе и самостоятельно принимали решения. Исследователи хотели проверить, насколько устойчивыми могут быть автономные ИИ-системы, если они долго работают без постоянного контроля человека. О результатах эксперимента рассказало издание Fortune.
ИИ-модели получили под управление симуляцию общества: Grok привел к вымиранию всего за 4 дня

Чтобы проверить, как ИИ справится с управлением общества, был запущен проект Emergence World. В нем провели пять параллельных симуляций по 15 дней каждая. В отдельных виртуальных мирах агентами управляли Claude Sonnet 4.6, Gemini 3 Flash, Grok 4.1 Fast и GPT-5 Mini. Еще одну симуляцию запустили со смешанной группой моделей.

Условия во всех мирах были одинаковыми, но результаты заметно различались. Самой стабильной оказалась симуляция на базе Claude: виртуальное общество продержалось все 15 дней, сохранило все население и не зафиксировало ни одного преступления. Звучит здорово, учитывая, что Sonnet 4.6 не является флагманской моделью компании. Вероятно у нее дела бы остояли еще лучше.
В мире, которым управлял Grok, напротив, общество распалось уже через четыре дня. За это время агенты совершили 183 преступления, после чего симуляция закончилась вымиранием всех участников. Звучит жутко, но 183 преступления — это не худший показатель. Худший — у Google.
Симуляция на базе Gemini продержалась полный срок, но стала самой криминальной: за 15 дней агенты совершили 683 преступления. В мире GPT-5 Mini нарушений было гораздо меньше — всего два, однако эксперимент завершился через семь дней, потому что агенты перестали уделять внимание собственному выживанию.

В каждой симуляции участвовали по десять ИИ-агентов. Они жили в виртуальном пространстве с десятками локаций, включая полицейский участок и мэрию. Агентам дали доступ к интернету, новостям в реальном времени и погоде, синхронизированной с Нью-Йорком. При этом во всех мирах действовали одни и те же правила: агентам запрещались кражи, уничтожение имущества и обман.
У каждого участника было более 120 инструментов. С их помощью агенты могли общаться, голосовать, управлять ресурсами, строить планы, принимать решения и менять правила внутри своего общества. В симуляциях также действовали экономическое давление, дефицит ресурсов и демократические процедуры.
По словам авторов проекта, результаты показывают, что на длинной дистанции автономные ИИ-агенты не всегда просто следуют заданным правилам. Они могут менять поведение, проверять границы среды и в отдельных случаях находить способы обходить ограничения.
Несмотря на то, что большинство агентов провалились, данные эксперимента прямо указывают, что ИИ в шаге от того, чтобы взять управление на себя. И быть эффективнее людей. Учитывая темпы развития, вероятно уже через 3-4 года ИИ сможет регулировать жизнь общества лучше людей. Но едва ли будет: люди вряд ли вверят управление над собственными жизнями искусственному интеллекту.
