Как пишет портал scmp.com, компания Tencent Holdings представила свою новую модель искусственного интеллекта Hunyuan T1, которая бросает вызов DeepSeek R1 как по производительности, так и по цене. Благодаря передовым технологиям и гибридной архитектуре, разработка Tencent способна занять лидирующие позиции в сфере ИИ.

- Hunyuan T1 продемонстрировала выдающиеся результаты в тестах. Например, в тесте MMLU Pro, который проверяет умение рассуждать и понимать язык, модель набрала 87,2 балла, обогнав DeepSeek-R1 (84 балла), но уступив OpenAI o1 (89,3 балла). В тесте AIME 2024, который построен на базе американского вступительного экзамена по математике, модель получила 78,2 балла, немного отстав от R1 (79,8) и o1 (79,2). В оценке китайского языка с помощью теста C-Eval T1 набрала 91,8 балла, что соответствует показателям R1 и превосходит OpenAI o1 (87,8 балла).
- Одним из главных преимуществ Hunyuan T1 является ее привлекательная цена. Стоимость обработки 1 миллиона токенов на входе составляет 1 юань (0,14 доллара США), а на выходе — 4 юаня (0,56 доллара США). Это соответствует дневным тарифам DeepSeek-R1 и значительно ниже его ночных ставок, что делает T1 конкурентоспособным решением на рынке ИИ.
- Tencent первой в индустрии внедрила гибридную архитектуру, объединяющую Google Transformer и Mamba, разработанную Университетами Карнеги-Меллона и Принстона. По сравнению с традиционной архитектурой Transformer, такой подход снижает затраты на обучение и вывод данных за счет уменьшенного использования памяти. При таком раскладе T1 является более эффективной.
- В целом, Hunyuan T1 является значительным шагом Tencent в развитии искусственного интеллекта. В случае реализации дальнейших доработок данная модель может стать ключевым инструментом для бизнеса и разработчиков ИИ не только в КНР, но и в других странах.