Китайският технологичен гигант Alibaba представи Qwen3 – нова фамилия „хибридни“ езикови модели с отворен код, създадени с амбицията да се конкурират с най-мощните системи на OpenAI и Google. Моделите вече са достъпни за изтегляне и използване в Hugging Face, GitHub и други водещи платформи, като от Alibaba твърдят, че Qwen3 „предлага нов стандарт в агентността, езиковата универсалност и възможностите за логическо разсъждение“.
Серията включва осем модела с размери от 600 милиона до 235 милиарда параметри – като на върха стоят двете „хибридни версии“ с архитектура Mixture-of-Experts: флагманът Qwen3-235B-A22B и по-компактният, но високоефективен Qwen3-30B-A3B. Те работят в два режима – „мислене“ и „незабавен отговор“ – което, според компанията, осигурява „гъвкав контрол върху когнитивния бюджет“, позволявайки на потребителите сами да решат колко време и изчислителни ресурси да отдели моделът за конкретна задача.
Моделите от серията Qwen3 разполагат с контекстен прозорец между 32K и 128K токена, предлагат подобрени агентни способности, могат да използват външни инструменти и поддържат 119 езика – включително български.
Вътрешните тестове показват, чe най-големият модел – Qwen3-235B-A22B – постига представяне, сравнимо или по-добро от това на Google Gemini 2.5 Pro и OpenAI o3-mini в области като математика, програмиране и логическо разсъждение. Дори Qwen3-4B – версия с едва 4 милиарда параметъра – демонстрира производителност, сравнима с далеч по-големи модели.


Според екипа зад проекта, Qwen3 бележи „преломен момент в прехода от езикови модели към автономни агенти“ и представлява „ключова стъпка към създаването на изкуствен общ интелект (AGI) и суперинтелигентност (ASI)“.
Моделите от серията Qwen3 са публикувани под лиценз Apache 2.0, което ги прави свободно достъпни за разработчици, изследователи и организации по целия свят. Тяхното представяне идва на фона на засилващата се надпревара между САЩ и Китай – особено в сферата на изкуствения интелект с отворен код – където към момента изглежда, че Пекин води. Въпреки че Google и Meta наскоро представиха нови отворени модели – Gemma 3 и Llama 4 – през следващите седмици се очаква дебютът на DeepSeek R2, за който се спекулира, че ще предлага способности, сравними с тези на най-мощните затворени системи на OpenAI и Google, включително o3, o4-mini и Gemini 2.5.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: