Juraj Recký Juraj Greacă

Controlul vocal al dispozitivelor inteligente are un număr incontestabil de avantaje. V-ați încercat deja asistentul vocal pe smartphone sau căști?

S-ar putea părea că asistenții vocali au fost domeniul smartphone-urilor de când Apple a introdus Siri în 2011, dar istoria controlului vocal este destul de bogată. Prima tehnologie controlată prin voce datează din 1911. Era o jucărie numită Radio Rex. Un câine a ieșit din coliba verde după ce ai spus cuvântul Rex.

Un alt pas important în dezvoltarea asistenților vocali a fost IBM Shoebox, care a recunoscut 16 cuvinte și numere de la 0 la 9. Era un computer care putea fi numit personal în acel moment. A fost introdus în 1962 la Târgul Mondial din Seattle. IBM a introdus primul computer personal așa cum îl cunoaștem astăzi, aproximativ 20 de ani mai târziu.

sunt
RESURSĂ cătredatascience.com

În anii 1970, Universitatea Carnegie Mellon din Pittsburgh, cu sprijinul generos al Departamentului Apărării al Statelor Unite, a dezvoltat Harpy, care avea un vocabular de aproximativ o mie de cuvinte, nivelul unui copil de aproximativ trei ani. Aceeași echipă științifică a prezentat în curând o soluție care era capabilă să recunoască nu numai cuvinte individuale, ci și propoziții simple, respectiv. grupuri de cuvinte.

Poarta către istoria modernă a asistenților vocali digitali a început să cadă în anii 1990, când tehnologia care era capabilă să răspundă vocii umane a început să fie utilizată în computerele de la IBM sau Microsoft.

Poarta imaginară către istoria modernă a asistenților vocali a fost în cele din urmă deschisă în 1994, când într-o etapă foarte timpurie a ceea ce știm astăzi, IBM a oferit un asistent vocal digital în telefonul său mobil Simon. Cu toate acestea, mainstream-ul nu a intrat.

RESURSĂ time.com

Controlul vocal a fost popularizat de Apple doar când Siri a introdus iPhone 4S în octombrie 2011. Așa cum se obișnuiește cu o companie cu logo-ul unui măr mușcat, nu a fost ceva pe care l-au dezvoltat de la pică. Apple a achiziționat Siri Inc în 2010, inițial sub numele SRI International și subvenționat de DARPA și Departamentul Apărării al Statelor Unite.

iPhone 4S - primul cu sursă Siri integrată măr

Dacă v-ați distrat vreodată cu asistentul vocal de pe dispozitivul dvs. inteligent, probabil că ați observat că răspunsurile sale sunt la fel de rapide ca o conexiune bună la internet. Chiar dacă există viziuni îndrăznețe că asistentul vocal va funcționa numai la înscriere, totuși trebuie să fiți online astăzi. Comenzile dvs. sunt trimise către un cloud la distanță, unde comanda este comparată, evaluată și soluția este trimisă înapoi pe dispozitivul dvs.

RESURSĂ itsecurityguru

Întregul proces se bazează pe învățarea automată, deci cu cât folosiți mai mult asistentul, cu atât mai inteligent, mai precis și mai rapid. Inteligența artificială ar trebui să fie atât de avansată încât, dacă îi cereți unui asistent să selecteze un gen de țară din biblioteca dvs. de muzică, dar în loc să îl deschideți, spuneți doar opriți și asistentul va înțelege că a greșit.

Dezavantajul este că, chiar dacă doriți să utilizați asistentul pentru operațiuni care se fac în mod explicit pe dispozitivul dvs., cum ar fi apelarea unui număr de telefon, trebuie totuși să fiți online.

Dacă ați evitat până acum asistenții vocali doar pentru că nu înțeleg slovaca, încercați-i. Tot ce aveți nevoie este un vocabular relativ simplu al cuvintelor în limba engleză. Chiar și cu un accent foarte prost, asistentul te va înțelege destul de bine. Companiile de decriptare a accentului sau argotului lucrează intens. Recent, am scris de mai multe ori despre faptul că comenzile asistenților companiei sunt rescrise și utilizate pentru învățarea mașinilor.

Dispozitivul inteligent cu asistent vocal ascultă constant. Taie comanda pentru ao activa. Când îl trezești, el îți întreabă cum să te ajute. Recunoaște că ați terminat comanda pe baza unei pauze mai lungi sau mai lungi. Prin urmare, este bine ca asistentul să vorbească clar, distinct și, în mod rezonabil, rapid. dinamic. Cu toate acestea, fii atent să nu vorbești repede.

În prezent, cei mai utilizați și cei mai populari asistenți vocali includ Siri, Alexa (sau Echo), Cortana, Bixby și Google Assistant. Revista Reviews.com a analizat mai atent și a evaluat primele trei.

RESURSĂ Wccftech

Alexa a dominat clar în categoria de compatibilitate. Are tehnologie de comparație vocală, poate fi utilizată de mai multe persoane pe un singur dispozitiv, se poate traduce instantaneu în limbi străine și cea mai puternică armă a sa este că o puteți găsi pe mai mult de 7.400 de dispozitive Internet of Things. Dimpotrivă, este un pic trist că el înțelege doar trei limbi.

Google Now a câștigat testul la cea mai bună categorie de răspuns. De asemenea, recunoaște mai multe voci pe un singur dispozitiv, poate traduce instantaneu, poate fi găsit pe aproximativ o mie de dispozitive Internet of Things și înțelege 4 limbi. Atât Alexa, cât și Google Asisten au opțiunea de a dezactiva încărcarea comenzilor dvs. în setări și de a le trimite companiilor-mamă pentru analiză sau pentru a sprijini învățarea profesorului.

RESURSĂ eMarketer

Cel mai popular este Siri. Un motiv? Este în mare parte împins de compania-mamă. Înțelege mai mulți utilizatori pe un singur dispozitiv, poate traduce instantaneu, are setări foarte limitate, chiar și în materie de confidențialitate și poate fi găsit pe aproximativ 50 de dispozitive Internet of Things. Cu toate acestea, el excelează prin numărul de limbi pe care le înțelege. Există doar 21 în slovacă și nu în cehă.

Alexa este puțin specific în comparație cu alți asistenți vocali. Mediul ei de acasă nu este un smartphone. Desigur, puteți folosi Alex pe telefoanele Android folosind aplicația, dar mediul de acasă al acestui asistent este în primul rând gadgeturi pentru casă sau căști.

RESURSĂ Amazon

Un avantaj semnificativ este că poate executa mai multe comenzi la rând fără a fi nevoie să le introduceți în mod repetat. Deci, cereți calendarului o prezentare generală a zilei curente, redați muzică și căutați ceva pe Internet, puteți introduce Alex ca o singură comandă, nu trebuie să o treziți din nou.

După cum am menționat mai sus, Alex poate fi găsit pe aproximativ 7.400 de tipuri de dispozitive IoT. Prin urmare, este clar că există comenzi și sarcini mai apropiate care nu sunt atât de tipice pentru dispozitivele mobile inteligente. În plus, deoarece Alexa provine dintr-un atelier Amazon, cumpărăturile cu ea sunt extrem de ușoare.

Google Now are ambiții uriașe. Motorul de căutare pe Internet stătea undeva în cursa asistentului vocal și i-a trebuit ceva timp să-și dea seama că avea în mână o cantitate uriașă de informații pe care le putea folosi. Dar este deja prins.

Probabil cea mai puternică armă a acestui asistent este că este cea mai apropiată de a fi utilizată complet offline. Smartphone-urile Pixel vor fi echipate cu tehnologie care poate comprima date pentru asistent până la o douăzeci și cinci fără pierderi de calitate. Aproximativ vorbind, aceasta înseamnă că actualul 2 GB de asistent de date de pe cloud ar ocupa doar 80 de megaocteți pe dispozitivul inteligent.

Prin comparație, acest asistent se bazează pe cel care învață cel mai rapid și face cele mai puține greșeli. Acest lucru este destul de logic, având în vedere cantitatea uriașă de date pe care Google o are. Datorită acestora, Asistentul Google poate efectua mai multe sarcini pe o singură comandă. Spre deosebire de Alex, însă, destul de specific.

La prezentarea celor mai recente capabilități ale Asistentului Google, inteligența artificială a reușit să selecteze fotografii dintr-o anumită călătorie dintr-un album foto, pe baza metadatelor, una dintre ele specifice, asistentul a trebuit să selecteze o fotografie a unui animal și să o trimită către un adresa de e-mail specifică. O astfel de succesiune de sarcini este semnificativ mai complicată pentru inteligența artificială decât trei sarcini disparate la rând.

Succesul lui Siri într-adevăr depinde doar de un bun marketing? Cu siguranță nu, dar are o poziție ușor specifică. Apple, ca și compania, își menține asistentul vocal scurt. Adăugați o aplicație terță parte la Siri? Nu vei reuși. Da, puteți folosi Spoti pentru a rula Spotify, de exemplu, dar acolo se termină compatibilitatea aplicației cu asistentul.

Pe de altă parte, Apple oferă din ce în ce mai multe servicii și soluții proprii, așa că dacă acest asistent vi se potrivește cel mai bine, veți obține aproape tot ce aveți nevoie. Cu toate acestea, vă va costa o alegere.

Tocmai din aceste motive nu vă veți bucura de controlul vocii, de exemplu, al unui vas de toaletă inteligent. Deci nu atât de curând. În timp ce alți asistenți vocali folosesc, de asemenea, startup-uri pentru gadget-urile lor mai mult sau mai puțin nebunești, Apple Siri lansează doar produse dovedite.

În 2017, Samsung a decis să se alăture lumii asistenților vocali cu propria sa soluție. El l-a prezentat pe Bixby. În timp ce alți asistenți folosesc microfonul aproape exclusiv pentru a-și îndeplini sarcinile, Bixby lucrează și cu o cameră pentru a identifica obiecte.

Până în prezent, se află în faza relativ timpurie a existenței sale și ajută în primul rând utilizatorii să navigheze pe dispozitiv sau să organizeze ziua. Desigur, această soluție se bazează și pe învățarea automată, așa că Bixby este cu atât mai inteligent cu cât îl folosiți mai mult. La fel ca în cazul asistenților menționați anterior pe un dispozitiv, acesta recunoaște voci diferite și le poate răspunde într-un mod personalizat.

Cu Bixby, se poate ocupa de sarcini de bază, cum ar fi citirea mesajelor primite fără a ridica telefonul, dar și a celor complicate, să presupunem că adăugați un selfie la Instagram. Acest asistent vocal înțelege mai multe aplicații, listate în meniul asistentului sub Ce poate face Bixby.

RESURSĂ Samsung

Bixby Vision folosește o cameră pentru a identifica ceea ce vede și pentru a adăuga informații necesare și interesante. De asemenea, traduce text scanat, poate căuta în meniul magazinului, identifică mâncarea și caloriile sale, vă ajută să încercați machiajul sau recunoaște vinul datorită aplicației Vivino.

Bixby oferă și Bixby Home, unde poate crea mediul de marcaje care vă interesează cel mai mult. De asemenea, poate crea rutine care sunt foarte asemănătoare cu IFTTT. Astfel, începe o secvență programată de sarcini, de exemplu, când ajungeți la o anumită locație.

Utilizatorii de dispozitive Microsoft își pot controla computerele, laptopurile sau tabletele prin voce folosind Cortana. Poate fi instalat și pe dispozitive Android. Când îl lansați pentru prima dată, acesta vă va oferi știri primare și prognoza meteo.

Cortana folosește motorul de căutare Bing, care vă poate oferi sinonime, definiții sau traduceri de cuvinte. Dacă nu sunteți sigur, deschideți fila cu browserul. Dacă permiteți acestui asistent vocal accesul la locația dvs., acesta vă va planifica și călătoria la serviciu. Dar poate găsi și un program de cinematografe în apropiere sau o stație de autobuz.

RESURSĂ Microsoft

De asemenea, poate căuta pe dispozitiv fișierele și documentele create în ultimele zile. Dacă creați un eveniment calendaristic nou, acesta poate interoga informațiile necesare. Puteți activa Cortana în bara de căutare și, dacă dispozitivul dvs. nu are microfon, puteți comunica și cu asistentul tastând comenzi.

Există mai mulți asistenți vocali. Alibaba Group a oferit AliGenie, BlackBerry are un Asistent BlackBerry, interesant este Mycroft, care este un open source și multe altele. Cu toate acestea, în selecția alternativă, trebuie luate în considerare imperfecțiunile, care rezultă din micimea asistentului vocal.