Do sada, AI glasovni asistenti nalik Siri ili Alexi morali su da rade po starom principu, odnosno da prvo prepoznaju šta govorite, onda pretvaraju govor u tekst, potom generišu odgovor kao tekst, pa ga na kraju pretvaraju u govor. To znači da postoje tri zasebna koraka i svaka od tih faza uzrokuje kašnjenje, prekide i neprirodan osećaj razgovora.
Umesto da koristi odvojene korake i čeka da korisnik završi govor pre nego što odgovori, ovaj model može istovremeno da vas sluša i odgovara, bez prekida i sa vrlo malim zakašnjenjem, baš kao što ljudi razgovaraju.
Nema više komuniciranja kao preko voki-tokija
Stručnjaci to zovu „full-duplex“ komunikacijom, što u praksi znači da AI može da prepozna vaš govor u trenutku kada ga izgovarate i da odmah počne da odgovara, čak i ako ga prekinete usred rečenice.
To deluje veoma jednostavno, ali do sada je bila jedna od najvećih prepreka u govornoj AI tehnologiji. Tradicionalni sistemi su više ličili na stare voki-toki uređaje jer ste prvo govorili, pa ste čekali da AI završi svoju poruku, i tek onda ste vi mogli opet da govorite. PersonaPlex uklanja taj problem i omogućava prirodniji, ljudski dijalog sa računarom.
Foto: Shutterstock
Najbolje od svega je što je besplatno
Model koji se zove PersonaPlex-7B ima oko 7 milijardi parametara tj. složenih matematičkih jedinica koje AI koristi da razume i generiše govor i razvijen je tako da uči iz ogromne količine snimljenih razgovora.
Jedna od najvažnijih karakteristika je i to što je potpuno otvoren kod (open source) i dostupan pod MIT licencom, uz dozvolu komercijalne upotrebe, što znači da kompanije mogu da ga koriste u svojim proizvodima. Zahvaljujući ovome, programeri, startapi i inovatori širom sveta sada mogu da eksperimentišu, unaprede ili naprave sopstvene glasovne AI sisteme bazirane na ovom modelu, bez da moraju da plaćaju skupe licence ili da grade od nule.
Pitali su ChatGPT kako će svet izgledati za 50 godina Foto: Shutterstock
Mislićete da razgovarate sa stvarnom osobom
Do sada smo navikli na glasovne asistente koji odgovaraju sa kašnjenjem ili deluju robotizovano, ali PersonaPlex otvara put za AI koji razgovara prirodnije i brže, slično kao što bi to učinila stvarna osoba.
To znači da u budućnosti možemo očekivati prirodnije AI asistente u telefonima i kol centru, AI koji vas stvarno sluša i odgovara odmah, robotizovane kolege koje mogu voditi razgovore bez prekida, pametne kućne uređaje koji razumeju kontekst i slušaju dok govorite, kao i podršku korisnicima koja ne deluju više kao mučni robot, već kao stvarni sagovornik.
Zabranjeno preuzimanje dela ili čitavog teksta i/ili foto/videa, bez navođenja i linkovanja izvora i autora, a u skladu sa odredbama WMG uslova korišćenja i Zakonom o javnom informisanju i medijima.
Maskov tunel u centru grada izaziva polemike
Preuzeto sa: www.kurir.rs


