AIRI продемонстрировали превосходство в соревнованиях MindGames Arena и CURE-Bench

December 9, 2025 admin

AIRI достигли значительных успехов, победив в двух престижных соревнованиях: MindGames Arena и CURE-Bench. Эти результаты подчеркивают прогресс в области социального интеллекта и потенциал для медицинских приложений ИИ.

В MindGames Arena команда In2AI (AIRI + Coframe + Иннополис) заняла первое место в сложной дисциплине Generalization. Их модель, основанная на 8 миллиардах параметров, успешно обыграла конкурентов, включая агентов на GPT-5, Gemini 2.5 Pro и Grok 4, показав, что в социальном интеллекте грамотный Reinforcement Learning (RL) имеет приоритет над большим количеством параметров.

Во втором соревновании, CURE-Bench, команда VIM (AIRI + iMak AI Lab) вошла в топ-8. В самом сложном треке Internal Model Reasoning, где не допускалось использование внешних источников информации, модель VIM продемонстрировала высокую согласованность с медицинскими практиками, подтвердив, что клинически осмысленные рекомендации можно создавать без использования больших языковых моделей, RAG и медицинских баз данных, таких как PubMed.

Эти результаты имеют важное значение для реальных сценариев, где доступ к интернету и внешним базам данных может быть ограничен. Успех команд подчеркивает необходимость разработки надежных и эффективных систем ИИ, способных давать точные рекомендации даже в условиях отсутствия подключений и внешних ресурсов.