Секрет успеха: Google обнаружил, как модели рассуждений учатся ‘общаться’

January 21, 2026 admin

Недавние исследования Google выявили ключевой фактор, объясняющий, почему определенные модели искусственного интеллекта, такие как OpenAI o1, DeepSeek-R1, QwQ-32B, демонстрируют выдающиеся результаты в решении сложных задач.

Ученые пришли к выводу, что секрет заключается не только в увеличении продолжительности процесса рассуждений, а в имитации моделями процесса «социального» взаимодействия, подобного обсуждению в группе. В ходе анализа цепочки мыслей, модель принимает на себя различные роли: задает вопросы, меняет точку зрения, предлагает контраргументы и выявляет противоречия. Этот подход, схожий с групповой дискуссией, значительно улучшает способность модели к логическому мышлению.

Интересно, что подобное поведение наблюдается даже при обучении с использованием системы вознаграждений, ориентированной исключительно на правильные ответы. Модель сама учится строить дискуссию, поскольку это эффективно помогает ей решать задачи.

Таким образом, улучшение способности рассуждать в этих моделях частично объясняется их способностью к внутреннему моделированию коллективного интеллекта, аналогичного человеческому.