AI Bulgaria AI Bulgaria

Нова AI система превръща филма „Тя (Her)“ в реалност

EVI
Image: Warner Bros

Помните ли филма „Тя (Her)“ от 2013 г., в който Хоакин Финикс се влюбва в операционна система с изкуствен интелект на име Саманта, озвучена от Скарлет Йохансон? Е, изглежда, че този научнофантастичен сценарий вече се превръща в реалност. Базираният в Ню Йорк стартъп Hume AI представи – Empathic Voice Interface (EVI), първия разговорен изкуствен интелект с емоционална интелигентност.

Създадена през 2021 г. от д-р Алън Коуен, бивш изследовател на Google, компанията има за цел „да гарантира, че изкуственият интелект е създаден така, че да служи на човешките цели и емоционално благополучие“.

Hume AI

EVI не е просто още един гласов асистент, а система, която разбира и реагира на емоциите в човешкия глас, създавайки по-дълбока и по-смислена връзка с потребителите. Използвайки най-съвременни техники за разпознаване на тона, EVI улавя нюансите, които често се губят в цифровия превод – треперенето на гласа, което издава вълнение, леката пауза, която подсказва несигурност, повишаването на тона, което сигнализира за нарастващ ентусиазъм.

Системата е обучена въз основа на 10-годишни изследвания в областта на науката на емоциите и милиони човешки разговори, които обхващат целия спектър от емоции и преживявания. Анализирайки тези взаимодействия, EVI придобива дълбоко разбиране не само за начина, по който хората общуват, но и за това какво ги мотивира, вълнува, ангажира, това което ги прави щастливи или ядосани. Това ѝ позволява не само да разбира думите, но и да усеща подтекста и чувствата зад тях.

Резултатът е AI система, която генерира експресивна и емоционално резонираща реч. Всяка дума, всяка фраза, всяка пауза са внимателно калибрирани, за да предизвикат реакция, да изградят връзка и да създадат усещане за истинско разбиране. EVI може да разбере кога потребителите са приключили да говорят, да предвиди техните предпочитания и да генерира отговори, оптимизирани за повишаване на удовлетвореността им с течение на времето.

EVI е изградена на базата на нова мултимодална генеративна AI архитектура, която интегрира големи езикови модели (LLM) с модел за измерване на човешките емоционални изражения от речта, който компанията нарича „емпатични голям езиков модел“ (eLLM). Този eLLM позволява на EVI да разбере емоционалното състояние на потребителя от неговия гласов тон и изражения и след това да генерира контекстуално подходящи отговори в естествено звучаща реч, като съответно модулира езика, тона и гласовия си изказ, посочват от Hume AI.

Компанията уточнява, че техните модели за измерване на емоционалното изражение са разработени въз основа на теорията за семантичното пространство (SST) – революционен компютърен подход за картографиране на емоционалното поведение в пространството, разработен от д-р Коуен.

Вярваме, че гласовите интерфейси скоро ще станат стандартният начин за взаимодействие с AI. Речта е четири пъти по-бърза от писането; освобождава очите и ръцете; и съдържа повече информация в тонa, ритъмa и тембърa

– посочва д-р Коуен.

Ето защо създадохме първият изкуствен интелект с емоционална интелигентност, който разбира гласа отвъд думите и който може да предвиди кога да говори, какво да каже и как да го каже.

В допълнение към емпатичните си функции EVI предлага бърза и надеждна транскрипция и възможност за преобразуване на текст в реч.

Системата ще бъде публично достъпна през април, предлагайки на разработчиците иновативен инструмент за създаване на завладяващи и емпатични гласови интерфейси. Компанията посочва, че разработчиците могат да интегрират EVI във всяко приложение или система, а за тези, които се интересуват от ранен достъп до API, е наличен формуляр за заявка.

За да научите повече или да проведете разговор с EVI, може да посетите уебсайта на компанията.

Последвайте ни в социалните мрежи – FacebookInstagramX и LinkedIn!

Остави коментар

Абонирайте се за нашите седмични бюлетини

Получавайте всяка неделя в 10:00ч последно публикуваните в сайта статии

Бюлетини: