Помните ли филма „Тя“ (Her) от 2013 г., в който Теодор, персонаж изигран от Хоакин Финикс, се влюбва в операционна система с изкуствен интелект на име Саманта, озвучена от Скарлет Йохансон? Е, изглежда, че този научнофантастичен сценарий вече се превръща в реалност.
Sesame, стартъп, съоснован от Брендън Ириб, бивш изпълнителен директор и съосновател на Oculus VR (компания за виртуална реалност, придобита от Facebook през 2014 г. за 3 милиарда долара), представи иновативна технология, която размива границите между научната фантастика и действителността.
Sesame разработва гласов модел, наречен Conversational Speech Model (CSM). Той стои в основата на два AI персонажа – Мая и Майлс – виртуални асистенти, които звучат толкова реалистично, че лесно биха могли да бъдат объркани за истински хора.
Excited to share a peek of what I’ve been working on
— Justin Alvey (@justLV) February 27, 2025
We @sesame believe voice is key to unlocking a future where computers are lifelike
Here’s an early preview you can try! 👇
We’ll be open sourcing a model, and yes…
we’re building hardware! 🧵 pic.twitter.com/c0jHNsb3aa
Tехнологията има за цел да създаде това, което компанията нарича „гласово присъствие“ – „магическо качество, което прави взаимодействията с изкуствения интелект автентични, разбираеми и ценни”. За разлика от традиционните системи за преобразуване на текст в реч (TTS), които често звучат монотонно и неестествено, CSM интегрира както текстовия, така и звуковия контекст, за да създаде реч, която се адаптира към историята, тона и ритъма на разговора. Резултатът – AI асистент, който не само звучи като истински човек, но и реагира с подходящи емоции и интонации, създавайки усещане за естествен и ангажиращ разговор.
Ириб и екипът му вярват, че в бъдеще „компютрите няма да бъдат просто инструменти, а истински партньори с естествен глас и индивидуалност“ – подобно на Саманта от филма „Тя“. Освен технологията за реч, компанията разработва очила с добавена реалност, които ще позволят на потребителите да имат свой AI асистент буквално „в ухото си“. Сред инвеститорите в Sesame са водещи фирми за рисков капитал като Andreessen Horowitz (a16z), Spark Capital, and Matrix Partners.
We’re exploring a future where the computer isn’t just a tool—it’s a partner with a truly natural voice and personality. No big claims, just early work we’re excited to share. @sesame pic.twitter.com/jtTYntVgLy
— Brendan Iribe (@brendaniribe) February 27, 2025
Компанията планира да предостави „ключови компоненти“ от своите изследвания като отворен код под лиценз Apache 2.0, „предоставяйки на глобалната общност възможността да експериментира, надгражда и подобрява технологията“.
Всеки, който желае да се докосне до технологията на Sesame, може да го направи на уебсайта на компанията, където потребителите имат възможност да разговарят с виртуалните асистенти Мая и Майлс.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: