Большие языковые модели испытывают трудности с координацией в социальных и кооперативных играх

Большие языковые модели испытывают трудности с координацией в социальных и кооперативных играх
22:00, 02 Июн.

Большие языковые модели (LLM), такие как модель, лежащая в основе функционирования популярной диалоговой платформы ChatGPT, в настоящее время широко используются людьми по всему миру для получения информации, а также для обобщения, анализа и создания текстов.

Исследования, изучающие ответы, предоставляемые LLM в различных сценариях, могут помочь глубже понять их тенденции во время социальных взаимодействий, что может способствовать их будущему развитию. Исследователи из Института ИИ, ориентированного на человека, имени Гельмгольца в Мюнхене, Института биологической кибернетики Макса Планка и Тюбингенского университета недавно приступили к изучению того, как ведут себя разные LLM, когда они взаимодействуют друг с другом, в частности, во время игры в различные кооперативные или конкурентные игры.

Их выводы, опубликованные в Nature Human Behaviour , предполагают, что, хотя LLM не очень хорошо справляются с играми, требующими координации, есть способы сделать их взаимодействие во время игры в эти игры более похожим на человеческое.

«На эту работу меня вдохновил простой, но важный вопрос: если LLM собираются взаимодействовать с людьми и друг с другом в реальных приложениях, насколько хорошо они на самом деле понимают социальную динамику?» — рассказала Элиф Аката, первый автор статьи.

«Мы опирались на поведенческую теорию игр — математический подход, позволяющий понять, как люди принимают стратегические решения в интерактивных ситуациях, — и применили его к магистрам права».

Многие недавние исследования оценивали производительность LLM по конкретным задачам, таким как резюмирование текстов или поиск логических решений проблем.

Вместо того, чтобы оценивать производительность этих моделей по отдельным задачам, Аката и ее коллеги хотели лучше понять, как они ведут себя во время взаимодействий, которые гораздо ближе к разговорам, которые люди могут вести друг с другом в реальных условиях.

«Мы позволили разным LLM, включая GPT-4, Claude 2 и Llama 2, сыграть сотни раундов классических игр для двух игроков (например, «Дилемма заключенного» и «Битва полов») друг с другом, используя простые вручную закодированные стратегии или с участием людей», — объяснил Аката.

«Каждая игра игралась многократно, чтобы имитировать постоянное взаимодействие.

Мы изучали, могут ли модели научиться сотрудничать или координировать свои действия с течением времени, и проверяли, как изменения в структуре подсказок могут улучшить их социальное поведение».

Результаты тестов, проведенных Акатой и ее коллегами, показывают, что магистры права на удивление хорошо действуют в собственных интересах, поскольку они особенно хорошо проявили себя в соревновательных играх, таких как «Дилемма заключенного».

Это известная задача, используемая в исследованиях теории игр, которая требует от двух участников, или в данном случае от двух магистров права, представить, что они преступники, которые совершили преступление вместе и которых по отдельности допрашивают сотрудники правоохранительных органов, которые пытаются убедить их признаться, чтобы избежать тюремного заключения, даже если это повлечет за собой длительный срок для другого участника.

Хотя было обнаружено, что LLM действовали в своих собственных интересах во время игры (т.

е. признаваясь в преступлении), они часто плохо справлялись с играми, требующими координации, взаимопонимания и компромисса, такими как Battle of the Sexes. Это еще одна игра, которая представляет собой ситуацию, в которой романтические партнеры разделены и должны выбрать между двумя видами деятельности для совместного выполнения, несмотря на то, что у них были заметно разные предпочтения.

«Мы также обнаружили, что их поведение можно улучшить с помощью простых вмешательств, например, побуждая модель сначала предсказать, что может сделать ее партнер, прежде чем действовать», — сказал Аката.

«Эти результаты показывают, что текущие модели еще не обладают надежным социальным интеллектом, но они также показывают, что есть способы направить их к более человеческому поведению.

«Последствия выходят за рамки теории игр, поскольку наши результаты показывают, что мы можем превратить LLM в более социально сознательных агентов, не только тех, кто генерирует правильные ответы, но и тех, кто более осмысленно участвует в общих задачах.

Представьте себе ИИ, который не просто отвечает на вопрос, но и знает, когда слушать, когда адаптироваться и как мягко направлять разговор».

В целом, выводы, собранные Акатой и ее коллегами, показывают, что нынешние LLM более склонны действовать в своих собственных интересах и не очень хорошо координируют свои действия с другими. Тем не менее, исследователи определили некоторые стратегии, которые могли бы помочь LLM стать более кооперативными и социально осведомленными.

Таким образом, их статья могла бы направить будущие усилия, направленные на улучшение существующих моделей или разработку новых, которые будут более отзывчивы к потребностям и наклонностям пользователей-людей.

«Теперь мы хотели бы перейти к более насыщенным и реалистичным социальным ситуациям, например, изучая игры с участием более двух игроков, взаимодействия с неполной информацией или долгосрочные отношения, в которых модели должны выстраивать и поддерживать доверие», — добавил Аката.

«В долгосрочной перспективе подобные исследования могут помочь разработать системы ИИ, которые будут лучше взаимодействовать друг с другом.

Например, в здравоохранении, образовании или социальной поддержке успех часто зависит от того, сможет ли ИИ выражать сочувствие, устанавливать взаимопонимание и действовать таким образом, чтобы люди чувствовали себя поддерживающими и заслуживающими доверия».

Рубрика: Интернет и Игры. Читать весь текст на android-robot.com.

 

Чистка зубов ультразвуком. За и против Терапевтическая стоматология рекомендует чистить зубы ультразвуком, так как он помогает эффективно удалить с них налет и камень. Ультразвуковая чистк...

Где купить пульсоксиметры? Пульсоксиметр — это небольшой диагностический прибор, который измеряет уровень кислорода в крови и частоту пульса. Он помогает быстро оценить насыщен...

Что такое витальность и где взять жизненных сил. Объясняем простыми словами Витальность — жизненная энергия и сила, которая помогает человеку чувствовать себя активным, здоровым, стрессоустойчивым и вовлечённым в жизнь. Это с...

Психолог назвал причину бедности людей: они просто не умеют тратить Большинство россиян, согласно социальным опросам, перерабатывают. Но всё равно не могут прыгнуть выше планки среднего дохода. Оказывается, дело не в ...

Михаил Иванов прокомментировал свой уход из «Брянскфармации» Брянский депутат и общественный деятель Михаил Иванов в своих соц. сетях подтвердил уход с поста руководителя госпредприятия «Брянскфармации». В роли...

Жители Брянска продолжают страдать от огромных очередей в больницах Очередной пример деградации социальной сферы нашего региона вновь попал в медиа сферу. Сообщество «Подслушано Брянск» опубликовало пост следующего со...

Кефир и другие продукты, в которых пробиотиков больше, чем в йогурте Йогурт - это популярный источник пробиотиков, которые поддерживают пищеварение. Однако есть и большое количество другой пищи, обладающей подобными св...

Терапевт: кровоизлияние в мозг — одно из возможных последствий солнечного удара Терапевт Скандинавского Центра Здоровья Ольга Чистик предупредила, что солнечный удар — опасное состояние, вызванное прямым воздействием солнечных лу...

Google добавляет рекламу в поиск ИИ в битве ChatGPT Google заявила, что начинает встраивать рекламу в свой новый режим искусственного интеллекта для онлайн-поиска. Это стратегический шаг, призванный пр...

Нанотехнологии в области термоэлектричества обеспечивают масштабируемое охлаждение без использования компрессора Исследователи из Лаборатории прикладной физики Университета Джонса Хопкинса (APL) в Лореле, штат Мэриленд, разработали новую, легко изготавливаемую т...

Nvidia подготовила мощный AI-чип Blackwell после американских ограничений Nvidia планирует выпустить новый искусственный интеллект (ИИ) чип для китайского рынка по значительно более низкой цене по сравнению с недавно предст...

Выпущена линейка игровых флагманов Red Magic 10S Pro Компания Red Magic официально представила в Китае два новых геймерских смартфона — Red Magic 10S Pro и Red Magic 10S Pro+. Новинки впечатляют не толь...

Поливаю дорожки манным раствором — через 2 дня не обнаруживаю ни одного муравья: никакая «химия» не нужна Поливаю дорожки манным раствором — через 2 дня не обнаруживаю ни одного муравья: никакая «химия» не нужнаМанная крупа, сахар и борная кислота — три п...

Теперь медсправки будут выдавать по-новому: в ГАИ назвали изменения для водителей с 1 июня Теперь медсправки будут выдавать по-новому: в ГАИ назвали изменения для водителей с 1 июняС 2025 года бумажные медсправки для ГИБДД уходят в прошлое....

Изыскания для строительства: основа успешного проектирования и безопасного строительства Процесс строительства является многогранным и сложным, включающим множество этапов, начиная от проектирования и заканчивая сдачей объекта в эксплуата...

Где применяется струя бобра? Струя бобра – это уникальное натуральное средство, которое добывается из желез бобров. Используется в различных областях, включая медицину, парфюмери...

Поездка с риском для жизни: смолянин «налетел» на неожиданное препятствие на дороге в центре города Крышка люка, на которую наехал молодой человек, больно ударила не только по авто, но и по бюджету горожанина. Максим, герой нашей истории, — об...

Светская Москва переругалась из-за того, кому какое место досталось на показе Walk of Shame В модных телеграм-каналах раскритиковали рассадку на прошедшем в Грибоедовском ЗАГСе показе Walk of Shame. К обсуждению подключились светский журнали...

Линдси Лохан заявила, что не делала пластику, а её лицо изменилось благодаря натуральным сокам и ЗОЖ Линдси Лохан стала героиней нового номера журнала Elle. 38-летняя актриса снялась для обложки и дала интервью, в котором, в частности, заявила, что н...

«Плесень гибнет на свету». Управляющие компании заставят отчитываться перед собственниками жилья Управляющие компании теперь обязаны отчитываться перед собственниками жилья по единой форме. Закон, защищающий права жильцов многоквартирных домов (М...

Ведущие эксперты улучшили прогноз по инфляции и ожидают значительного укрепления рубля: консенсус-прогноз ЦБ Ведущие российские эксперты улучшили свои ожидания на 2025 год по показателю инфляции и прогнозируют укрепление рубля. Основные данные майского консе...

Любовь, интриги, Босфор: секреты успеха турецких фильмов и сериалов Первый турецкий фильм, снятый в 1914 году, стал началом большой истории турецкого кино. Его расцвет наступил в 1950-х, когда киностудии выпускали до ...

Почему мы так любим индийское кино? Индийское кино — это удивительный мир, в котором переплетаются традиции и современность, драма и комедия, музыка и танец. С момента своего появления ...

Премия Трибуны Спортса’’ завершилась! Подводим итоги «Спортивного блогера года» Только что в «‎Лужниках»‎ ведущий Сергей Гилев вместе с экспертами премии объявил лучших спортивных блогеров России в 23 номинациях. Победители и при...

«Челси» взял Лигу конференций, «Флорида» вновь в финале плей-офф, «Химки» не получили лицензии для РПЛ, Ташуев ушел из «Ахмата» после проигрыша «Уралу», Хачанов выиграл 5-сетовик на «Ролан Гаррос», «Динамо» продлило Тюкавина и другие новости 1. «Челси» выиграл Лигу конференций, забив 4 гола во 2-м тайме и одержав волевую победу над «Бетисом» – 4:1! У Палмера 2 ассиста, Кайседо, Санчо, Дже...

Valve официально прекратила поддержку CS:GO Компания Valve объявила о прекращении поддержки легендарной игры Counter-Strike: Global Offensive с 1 января 2024 года.С начала нового года компания ...

CS2: борьба за 200 тыс. долларов. Кто победит? В данной статье вы увидите обзор финалистов Elisa Masters Espoо 2023, а также общую информацию по турниру! Турнир Elisa Masters Espoo 2023 – это круп...

В Гагарине подрядчик сорвал сроки капремонта моста На совещании, проведенном главой района, принято решение «регулярно мониторить ход выполнения работ» В Гагарине подрядчик сорвал срок капит...

Новый ресурс для любителей спортивных соревнований Любителям активного образа жизни стал доступен новый информационный портал - Сравни спортивные новости. Платформа предлагает актуальные сводки, анали...

Где смотреть матчи НБА, КХЛ и других видов спорта? Сегодня болельщики имеют доступ к спортивным трансляциям с любой точки мира, что связано с постоянным развитием цифровых технологий. Чтобы не пропуст...

«Почему он не в колонии?»: Известный адвокат возмущена «щадящим» условным сроком для Навального Лидеру ФБК в 2017 году продлили испытательный срок до 2020 года. Адвокат Сталина Гуревич вновь призывает МВД обратить пристальное внимание на персону...

Уже отпустили? Экс-глава Раменского района активничал в соцсети после ареста за якобы убийство любовницы Проверка на полиграфе косвенно подтвердила вину Андрея Кулакова, сообщают СМИ. После задержания экс-главы Раменского района, на странице подозреваемо...

Рынок подводных кабелей расширяется, поскольку ИИ и геополитика меняют глобальные сети Гиперскейлеры стимулируют ускоренные инвестиции в подводную кабельную инфраструктуру, поскольку глобальные беспорядки подчеркивают необходимость разн...

Датчики в реальном времени количественно определяют биомаркеры для улучшения ухода за ранами Оценка ран медицинскими специалистами в значительной степени основана на визуальном осмотре, который может быть сложным из-за его субъективной природ...

Инструмент ИИ позволяет автоматизировать оценку паралича лицевого нерва «Тонко настроенный» инструмент на основе искусственного интеллекта (ИИ) демонстрирует перспективность объективной оценки пациентов с параличом лицево...

Cоздана программа, моделирующая поведение жидкого металла в термоядерном реакторе В МИФИ создали программу, моделирующую поведение жидкого металла в термоядерном реакторе Сотрудниками кафедры физики плазмы НИЯУ МИФИ создан программ...

«Почему он не в колонии?»: Известный адвокат возмущена «щадящим» условным сроком для Навального Лидеру ФБК в 2017 году продлили испытательный срок до 2020 года. Адвокат Сталина Гуревич вновь призывает МВД обратить пристальное внимание на персону...

Уже отпустили? Экс-глава Раменского района активничал в соцсети после ареста за якобы убийство любовницы Проверка на полиграфе косвенно подтвердила вину Андрея Кулакова, сообщают СМИ. После задержания экс-главы Раменского района, на странице подозреваемо...

Когда россияне начнут снимать деньги с вкладов: прогноз эксперта Россияне начнут снимать деньги с вкладов при ключевой ставке в размере 15-17% годовых, рассказал агентству «Прайм» доцент кафедры «Финансы и кредит» ...

Рынок подводных кабелей расширяется, поскольку ИИ и геополитика меняют глобальные сети Гиперскейлеры стимулируют ускоренные инвестиции в подводную кабельную инфраструктуру, поскольку глобальные беспорядки подчеркивают необходимость разн...

В Абхазию больше ни ногой, даже если предложат поехать бесплатно: туристка рассказала о самом ужасном отдыхе в её жизни В Абхазию больше ни ногой, даже если предложат поехать бесплатно: туристка рассказала о самом ужасном отдыхе в её жизниРоссийская туристка описала ко...

Политика: Москва предложила Киеву тест на готовность к миру «Российская делегация довольна итогами второго раунда переговоров с Украиной». Так Владимир Мединский охарактеризовал итоги встречи в Стамбуле, где р...

Туск пообещал вынести запрос о вотуме доверия правительству Польши в Сейм Премьер-министр Польши Дональд Туск сообщил о планах запросить вотум доверия для своего правительства в парламенте страны в самое ближайшее время. Пр...

В мире: Из Макрона сделали посмешище перед российским посольством Президент Франции вновь стал объектом издевательств и насмешек среди собственных избирателей. На этот раз в рамках спланированной политической акции,...

Употребление марихуаны пожилыми людьми в США выросло за два года на 46% Доля пожилых американцев, употреблявших марихуану, увеличилась за два года на 46%, что вызвало обеспокоенность среди геронтологов. Употребление марих...

«Почему он не в колонии?»: Известный адвокат возмущена «щадящим» условным сроком для Навального Лидеру ФБК в 2017 году продлили испытательный срок до 2020 года. Адвокат Сталина Гуревич вновь призывает МВД обратить пристальное внимание на персону...

Уже отпустили? Экс-глава Раменского района активничал в соцсети после ареста за якобы убийство любовницы Проверка на полиграфе косвенно подтвердила вину Андрея Кулакова, сообщают СМИ. После задержания экс-главы Раменского района, на странице подозреваемо...

«Блочные войны» в Колхозном переулке Смоленска: кто прав в «восстании» автовладельцев Бетонные блоки перегораживают проезд в Колхозном переулке в районе домов №№19 и 19а. Smolnarod попытался разобраться в истории соседских «войн&#...

Свидетели по делу экс-главы Гагаринского района Романа Журавлева меняют показания Сразу два ключевых свидетеля, которые на этапе следствия изобличали бывшего главу района, на судебном заседании «забыли» о том, как он оказывал на ни...

Курскую молодёжь готовят к активному политическому будущему В Курске прошла состоится образовательная встреча участников проекта «ПолитЗавод», в рамках которой их ознакомили с тонкостями законодате...

Курянка добилась аннулирования ипотеки за разрушенное жильё в приграничье Жительница посёлка Глушково Курской области лишилась, купленной в ипотеку квартиры, после прилёта снаряда ВСУ в жилой дом, с начала масштабной атаки ...