DeepSeek, китайската лаборатория за изкуствен интелект, представи DeepSeek-R1 – „разсъждаващ“ модел, за който компанията твърди, че превъзхожда o1 моделите на OpenAI в определени задачи.
Китайският модел, подобно на о1 е проектиран да отделя повече време за мислене преди да отговори. В зависимост от сложността на заявката моделът може да „разсъждава“ в продължение на десетки секунди, а в някои случаи – дори минути. При този подход, вместо веднага да избере един отговор, моделът генерира и оценява множество възможности, преди да избере най-добрата. Тази техника, наречена „изчисление по време на инференция“ (test-time compute), позволява на моделите да се подобряват в реално време, докато се използват.
Според китайската компания, предварителната версия на модела – DeepSeek-R1-Lite – показва резултати, сравними с тези на o1-preview на OpenAI в редица популярни тестове, като в някои дори го превъзхожда. Разликата е особенно голяма при математиката.
От DeepSeek твъдят, че планират да отворят кода на DeepSeek-R1 и да пуснат API, но точни срокове все още не са обявени. Въпреки това, тези, които желаят да изпробват новия „разсъждаващ“ китайски модел, могат да го направят чрез чат приложението на DeepSeek, достъпно на адрес https://chat-test.deepseek.com/.
🚀 DeepSeek-R1-Lite-Preview is now live: unleashing supercharged reasoning power!
— DeepSeek (@deepseek_ai) November 20, 2024
🔍 o1-preview-level performance on AIME & MATH benchmarks.
💡 Transparent thought process in real-time.
🛠️ Open-source models & API coming soon!
🌐 Try it now at https://t.co/v1TFy7LHNy#DeepSeek pic.twitter.com/saslkq4a1s
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: