Google започна поетапното разгръщане на Deep Think – нов режим в приложението Gemini, достъпен за абонати на Google AI Ultra – премиум абонамент на цена от $250 на месец.
Представен за първи път по време на конференцията Google I/O 2025, Deep Think е проектиран да решава сложни задачи чрез удължено „време за мислене“ и „паралелни разсъждения“. Вместо да предлага моментален отговор, системата „генерира потоци от разсъждения, сравнява, преценява и комбинира идеи, за да достигне до по-добри отговори“, обясняват от компанията.
Моделът, задвижващ Deep Think, е оптимизирана версия на системата, която миналия месец спечели златен медал на Международната олимпиада по математика (IMO). За разлика от версията, използвана на олимпиадата – която може да разсъждава с часове върху една задача – текущият режим в Gemini е пригоден за ежедневна употреба и според Google достига ниво, съпоставимо с бронзов медалист на IMO.
For researchers, scientists, and academics tackling hard problems: Gemini 2.5 Deep Think is here. 🤯
— Google DeepMind (@GoogleDeepMind) August 1, 2025
It doesn't just answer, it brainstorms using parallel thinking and reinforcement learning techniques. We put it into the hands of mathematicians who explored what it can do ↓ pic.twitter.com/lsBq3ICvuM
Google твърди, че системата е особено ефективна в научни, инженерни и творчески задачи, които изискват креативност, стратегическо мислене и итеративен подход. Според тестовете на компанията, Gemini 2.5 Deep Think постига водещи резултати в Humanity’s Last Exam – междудисциплинарен бенчмарк, съставен от хиляди задачи в области като математика, природни и хуманитарни науки. Без използване на външни инструменти, моделът постига точност от 34.8%, изпреварвайки Grok 4 на xAI (25.4%) и o3 на OpenAI (20.3%). При LiveCodeBench – бенчмарк за състезателно програмиране – моделът постига 87.6%, в сравнение със 79% за Grok 4 и 72% за o3.


Успоредно с пускането в Gemini, Google ще предостави пълната IMO версия на ограничена група учени и математици, за да събере обратна връзка за академичната ѝ приложимост. Компанията също така планира да пусне модела и чрез API на избран кръг от разработчици и бизнес партньори в следващите седмици, с цел да оцени приложимостта му в „реални корпоративни и инженерни сценарии“.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: