Китайският технологичен гигант Alibaba пусна “QwQ-32B-Preview” — нов „разсъждаващ модел“, конкуриращ се с “o1” на OpenAI и наскоро представения “DeepSeek-R1” от китайската компания DeepSeek.
Разработен от екипа на Qwen в Alibaba, моделът разполага с 32,5 милиарда параметъра и може да обработва текстове с дължина до 32 000 думи.
Според тестовете на компанията, QwQ-32B-Preview превъзхожда o1-preview и o1-mini — двата „разсъждаващи“ модела на OpenAI — в задачи, свързани с математиката и логиката.
Моделът е достъпен за изтегляне от платформата Hugging Face, но подобно на други китайски модели, е съобразен с регулаторните изисквания на страната. Отговорите му следват „основните социалистически ценности“ на Китай, като например твърдението, че Тайван е „неотменна част от Китай“.
Alibaba предоставя QwQ-32B-Preview под Apache 2.0 лиценз, което означава, че той може да се използва за търговски цели. Въпреки това компанията е публикувала само определени компоненти, запазвайки част от технологията в тайна.
Развитието на т.нар. „разсъждаващи“ модели бележи изключителен растеж през последните месеци, тъй като според мнозина традиционните методи за мащабиране на AI системи — чрез увеличаване на данните и изчислителната мощност — достигат своите лимити. Водещите американски и китайски компании се фокусират върху нови архитектури и техники, като например „изчисление по време на инференция“ (test-time compute) — метод, при който моделите се подобряват в реално време, докато се използват.
Например, според скорошен доклад на The Information, Google е инвестирала значителни ресурси и увеличила екипа си в тази сфера с над 200 души. От OpenAI също са насочили повече ресурси към развитието на своите „разсъждаващи“ модели, за сметка на GPT серията.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: