
V zložitých prostrediach dokážu ľudia rozumieť významu reči lepšie ako umelá inteligencia, pretože používame nielen uši, ale aj oči.
Napríklad vidíme, ako sa niekomu hýbu ústa, a intuitívne vieme, že zvuk, ktorý počujeme, musí pochádzať od tejto osoby.
Meta AI pracuje na novom systéme dialógu s umelou inteligenciou, ktorý má naučiť umelú inteligenciu rozpoznávať jemné korelácie medzi tým, čo v konverzácii vidí a počuje.
VisualVoice sa učí podobným spôsobom, ako sa ľudia učia ovládať nové zručnosti, a umožňuje audiovizuálne oddelenie reči učením sa vizuálnych a sluchových podnetov z neoznačených videí.
Pre stroje to vytvára lepšie vnímanie, zatiaľ čo ľudské vnímanie sa zlepšuje.
Predstavte si, že sa môžete zúčastňovať skupinových stretnutí v metaverze s kolegami z celého sveta, pripájať sa k menším skupinovým stretnutiam, ktoré sa pohybujú virtuálnym priestorom, počas ktorých sa zvukové dozvuky a zafarbenia v scéne prispôsobujú prostrediu a zodpovedajúcim spôsobom sa prispôsobujú.
To znamená, že dokáže súčasne získavať zvukové, obrazové a textové informácie a má bohatší model chápania prostredia, čo používateľom umožňuje mať „veľmi úžasný“ zvukový zážitok.
Čas uverejnenia: 20. júla 2022