Предварительный взгляд на MODEL1: Новая архитектура DeepSeek

January 21, 2026 admin

Недавно, с 20 января 2026 года, в репозитории FlashMLA появились первые признаки новой модели нейронной сети под кодовым названием MODEL1. Об этом сообщает сообщество разработчиков, отмечая, что это не просто обновление модели V3 серии, а скорее, параллельная ветка разработки, указывающая на значительный архитектурный прорыв.

На протяжении долгого времени работа над MODEL1 велась, а с 1 января 2026 года начали публиковаться предварительные релизы. Сообщество выдвигает предположения, что MODEL1 может быть эквивалентен DeepSeek V4 или R2.

Ожидается, что модель продемонстрирует производительность уровня передовых систем (frontier-level), поддерживая миллионный контекст, предлагая новые механизмы управления памятью и обеспечивая сверхэффективный процесс инференса.

Несмотря на отсутствие официального анонса (на данный момент на сайте доступна только версия V3.2), предварительные данные из репозитория указывают на скорый релиз. Рекомендуется следить за обновлениями в репозитории FlashMLA и официальными новостями.