У Китаї презентували ще одну нову модель нейромережі. Фото: із відкритих джерел

Великий китайський маркетплейс Alibaba представив свою нову модель нейромережі Qwen2.5-Max.

Про це повідомили у компанії.

За словами розробників, модель перевершує ChatGPT та DeepSeek за багатьма показниками, або, як кажуть у фахівці у сфері штучного інтелекту, бенчмаркам: Arena-Hard, LiveBench, LiveCodeBench та GPQA-Diamond. Також новинка демонструє близькі до конкурентів результати в інших бенчмарках, наприклад, MMLU-Pro.

Зазначається, що Qwen2.5-Max є великомасштабною моделлю, яка була попередньо навчена більш ніж на 20 трильйонах токенів.

При цьому нейромережа має доступ до інтернету та може працювати з актуальними даними. Також вона вміє писати код, генерувати фото та відео, хоча остання функція поки що недоступна.

Передбачається, що модель викладали поспіхом, щоб встигнути потрапити в інформаційну хвилю про ІІ-сенсації, приурочену до китайського нового року. Тому спочатку у неї можуть виявлятися недоліки.

 

Порівняння з DeepSeek та з LLaMA3.1

 

Порівняння з GPT-4o та Claude Sonnet-3.5

Раніше американська компанія OpenAI, яка розробила чат-бот із генеративним штучним інтелектом ChatGPT, звинуватила китайського конкурента DeepSeek у крадіжці їхніх даних.

Також у ЗМІ писали про те, що китайська модель штучного інтелекту від DeepSeek вперше обійшла ChatGPT, ставши рейтинговим безкоштовним додатком, доступним в App Store.

Нещодавно ми докладно розбирали, що означає поява китайської нейромережі DeepSeek.

Читайте Страну в Google News - натисніть Підписатися