OpenAI пусна два нови модела с изкуствен интелект – o3 и o4-mini, които компанията определя като „най-интелигентните досега“. За разлика от предишните „разсъждаващи“ модели, o3 и o4-mini могат да генерират отговори, използвайки всички налични инструменти в ChatGPT, включително търсене в интернет, интерпретиране на файлове, изпълнение на Python код, обработка и генериране на изображения.
„За първи път нашите разсъждаващи модели могат агентно да използват и комбинират всеки инструмент в ChatGPT“, посочват от компанията, като добавят, че това са първите системи, за които водещи учени потвърждават, че „произвеждат наистина добри и полезни нови идеи“ в области като право, научни изследвания и софтуерна разработка“.
Introducing OpenAI o3 and o4-mini—our smartest and most capable models to date.
— OpenAI (@OpenAI) April 16, 2025
For the first time, our reasoning models can agentically use and combine every tool within ChatGPT, including web search, Python, image analysis, file interpretation, and image generation. pic.twitter.com/rDaqV0x0wE
o3, който компанията описва като „най-мощния разсъждаващ модел досега“, поставя нови стандарти в области като програмиране, математика, наука и визуално възприятие. Моделът постига впечатляващо представяне в състезателното програмиране (Codeforces), където с Elo рейтинг от 2706 се нарежда сред 200-те най-добри програмисти в планетата. В теста SWE-bench Verified, който оценява способността на AI да решава реални софтуерни задачи, o3 постига 69.1% точност – резултат, който превъзхожда всички предишни модели на OpenAI.
Междувременно o4-mini – по-малкият модел – предлага „конкурентен компромис между цена, скорост и производителност“. Въпреки компактния си размер, моделът демонстрира впечатляващи резултати в области като математика, програмиране и визуални задачи. На математическите тестове AIME 2024 и 2025 o4-mini (използвайки Python) постига съответно 98.7% и 99.5% успеваемост, а в SWE-bench Verified – 68.1% точност, доближавайки представянето на o3. Моделът дори изпреварва по-големия си събрат в състезателното програмиране (Codeforces), където постига Elo рейтинг от 2719 – резултат, който го нарежда на 185-то място в света.
Една от най-впечатляващите способности на новите модели е, че могат да „разсъждават върху изображения“ – да ги разбират, обработват и използват като част от логическите си разсъждения (chain-of-thought). Потребителите могат да качват снимки, диаграми или дори ръкописни бележки, а моделите са способни да ги анализират, интерпретират и манипулират (чрез автоматично изрязване, мащабиране, завъртане или подобряване). „Моделите не просто виждат изображението – те разсъждават върху него“, обясняват от OpenAI, като добавят, че „това отключва нов клас решаване на проблеми, който съчетава визуално и текстово мислене.“
Новите модели вече са достъпни за потребителите на платените планове ChatGPT Plus, Pro и Team, като заменят предходните версии (включително o1, o3-mini и o3-mini-high). Enterprise и Edu потребителите ще получат достъп след една седмица, а тези на безплатната версия на ChatGPT могат да изпробват o4-mini, като изберат опцията „Think“.
За разработчици моделите са достъпни чрез Chat Completions API и Responses API, като цената на o3 е $10 за милион входящи и $40 за милион изходящи токени, а за o4-mini – $1.10 за милион входящи и $4.40 за милион изходящи токени.
В близките седмици OpenAI планира да пусне o3-pro – версия, използваща повече изчислителни ресурси за по-точни отговори, която обаче е предназначена единствено за абонатите на ChatGPT Pro. Компанията също така работи върху интегрирането на инструменти в API интерфейса си, което ще позволи на разработчиците да създават по-сложни приложения.
Според индикации от ръководството на OpenAI, o3 и o4-mini вероятно ще бъдат последните самостоятелни разсъждаващи AI модели преди GPT-5, който се очаква да обедини традиционните модели като GPT-4.1 с новото поколение разсъждаващи, създавайки единна и още по-мощна AI система.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: