În condițiile în care aproape toate mașinile noi sunt așteptate să ofere sisteme de recunoaștere vocală până în 2022, prognozele arată că viitoarele sisteme vor evolua astfel încât vor putea să interpreteze tonul vocii și expresiile faciale. Sistemul de conectivitate SYNC 3 oferit de Ford permite deja comenzi vocale, Apple CarPlay și Android Auto, iar in curand le va oferi șoferilor posibilitatea de a utiliza serviciile Alexa, asistentul virtual al Amazon. Ford și Universitatea RWTH din Aachen cercetează utilizarea mai multor microfoane care să îmbunătățească procesarea vocii și să reducă efectul zgomotelor de fond și al potențialelor întreruperi.
Suntem obișnuiți deja cu mașini care înțeleg ceea ce le spunem. Experții prognozează faptul că acestea vor reuși în viitor să știe cum ne simțim încă dinainte ca noi să spunem vreun cuvânt.
Aproape 90% dintre mașinile noi vor fi capabile să ofere sisteme de recunoaștere vocală până în anul 2022(1). Iar pasul ulterior pentru mașinile de mâine ar putea fi faptul că acestea vor recunoaște chiar și cele mai mici modificări ale expresiilor faciale și modulațiile și inflexiunile din voce, ușurând experiența la volan a clienților.
Sistemele avansate – echipate cu camere inserate în mașină și cu microfoane sofisticate – ar putea să învețe ce melodii ne place să ascultăm atunci când suntem stresați și ocaziile în care preferăm să ne bucurăm de liniște. Iar iluminarea ambientală s-ar putea asorta cu dispoziția de moment.
„Ne aflăm într-un punct avansat pe drumul care duce la dezvoltarea mașinii empatice care ar putea să-ți spună o glumă pentru a te face să te simți mai bine, să-ți ofere sfaturi atunci când ai nevoie de ele, să-ți aducă aminte de zilele de naștere și să te țină în priză în cazul unui drum lung”, spune Fatima Vidal, senior director al biroului Marketing Automotive în cadrul Nuance Communications, companie care a ajutat Ford să dezvolte modulul de recunoaștere vocală integrat în cadrul sistemului de conectivitate SYNC.
Se anticipează faptul că sistemele de control cu ajutorul vocii bazate pe stocarea informațiilor în Cloud vor fi disponibile pe 75% dintre mașinile noi până în 2022(1) și se prognozează că sistemele viitorului vor evolua și se vor transforma în asistenți personali care vor schimba ora de start a întâlnirilor programate și vor comanda mâncare la pachet în momentele în care șoferii sunt blocați în trafic.
Cinefilii își vor aminti cu siguranță de filmul „Her”, în care personajul virtual Samantha (Scarlett Johansson) răspundea la comenzile lui Theodore Twombly (Joaquin Phoenix) sub forma unui sistem de recunoaștere vocală care, cu o acuratețe impresionantă, a învățat să deducă nevoile, dorințele și dispoziția de moment analizând simpla tonalitate a vocii. În curând, mașina ta ar putea să fie capabilă să facă ceva similar.
În această vară, sistemul de conectivitate Ford SYNC 3 va permite șoferilor să se conecteze la asistentul virtual Alexa al companiei Amazon și acoperă serviciul în 23 de limbi diferite și în multe accente locale(2). Accesând resurse stocate în Cloud, mașinile din viitor le vor oferi șoferilor ocazia să vorbească limba lor nativă, o veste bună pentru cei care sărbătoresc Ziua Internațională a Limbii Materne.
„Comenzi vocale precum «Mi-e foame» («I’m hungry») pentru a genera căutarea unui restaurant sau «Vreau o cafea» («I need coffee») au adus deja SYNC 3 în teritoriul asistenților personali”, spune Mareike Sauer, inginer control vocal în cadrul Echipei Connectivity Application, Ford of Europe. „În următorul pas, șoferii nu doar că vor putea să vorbească în limba maternă cu accentul local propriu, dar vor putea să folosească propriile expresii și cuvinte, totul pentru a permite o abordare naturală a dialogului”.
Apple CarPlay™ oferă o metodă simplificată de utilizare a interfeței telefonului pe display-ul touch screen al mașinii, oferindu-le utilizatorilor acces ușor la comenzile vocale către asistentul virtual Siri, dar și la Apple Maps, Apple Music, Phone, Messages și la o varietate mare de aplicații ale altor dezvoltatori. Android Auto™ oferă Google Maps și muzică pe ecranul mașinii în timp ce facilitează controlul vocal al apelurilor telefonice și al mesajelor(1).
Un proiect de cercetare derulat de Ford împreună cu Universitatea RWTH din Aachen, Germania, include utilizarea mai multor microfoane pentru îmbunătățirea procesării discursului și pentru reducerea efectului zgomotului de fond și eliminarea potențialelor întreruperi. Inginerii Nuance Communications susțin că, peste câțiva ani, sistemele de control vocal ne-ar putea interpela cu expresii precum „Vrei să comand flori pentru mama ta cu ocazia zilei de 8 Martie?”, „Dorești să aleg o rută mai liberă, dar mai lungă până acasă?” și „Proviziile din ciocolata ta favorită sunt pe terminate, iar magazinul tău preferat o are în stoc. Vrei să trecem pe acolo ca să cumperi câteva bucăți?”.
Viitoarele sisteme de control al gesturilor și al ochilor le vor permite șoferilor să răspundă la apelurile telefonice prin mișcări subtile ale capului, să ajusteze volumul sistemului audio prin mișcări circulare ale încheieturii sau să stabilească destinația printr-o simplă privire pe harta oferită de sistemul de navigație.
Există, deci, la fel ca în filmul „Her”, pericolul de a ne îndrăgosti de sistemele noastre avansate de recunoaștere vocală?
„Mulți sunt deja îndrăgostiți de propriile mașini, însă odată cu noile sisteme care învață și adaptează ne putem aștepta la formarea unor relații foarte serioase și puternice”, spune Dominic Watt, lector senior al Departamentului de Științe Lingvistice din cadrul Universității York. „Mașina ar putea deveni în scurt timp asistentul nostru, partenerul de drum și prietenul care ne ascultă păsurile, iar noi vom fi capabili să discutăm orice și să întrebăm orice. Se va ajunge la punctul la care vom uita că vorbim, de fapt, cu o mașină”.
Ford va prezenta săptămâna viitoare, în cadrul Mobile World Congress din Barcelona – cel mai mare eveniment global dedicat industriei mobile, noile sale sisteme avansate de mobilitate și conectivitate.