Секрет успеха: Google обнаружил, как модели рассуждений учатся ‘общаться’
Недавние исследования Google выявили ключевой фактор, объясняющий, почему определенные модели искусственного интеллекта, такие как OpenAI o1, DeepSeek-R1, QwQ-32B, демонстрируют выдающиеся результаты в решении сложных задач.
Ученые пришли к выводу, что секрет заключается не только в увеличении продолжительности процесса рассуждений, а в имитации моделями процесса «социального» взаимодействия, подобного обсуждению в группе. В ходе анализа цепочки мыслей, модель принимает на себя различные роли: задает вопросы, меняет точку зрения, предлагает контраргументы и выявляет противоречия. Этот подход, схожий с групповой дискуссией, значительно улучшает способность модели к логическому мышлению.
Интересно, что подобное поведение наблюдается даже при обучении с использованием системы вознаграждений, ориентированной исключительно на правильные ответы. Модель сама учится строить дискуссию, поскольку это эффективно помогает ей решать задачи.
Таким образом, улучшение способности рассуждать в этих моделях частично объясняется их способностью к внутреннему моделированию коллективного интеллекта, аналогичного человеческому.