Noua tehnologie de recunoaștere vocală a Microsoft vă poate traduce vocea naturală într -o altă limbă [video]

, există un pic de luptă de comandă vocală în acest moment în spațiul mobil, cu asistentul Digital Siri Apple și căutarea vocală Google Folosind Duking -o unul împotriva celuilalt pentru afecțiunile utilizatorilor. Ambele vin cu propriul set de argumente pro și contra și se vor îmbunătăți doar pe măsură ce mergem înainte în viitor, dar se pare că echipele de cercetare și dezvoltare ale Microsoft au lucrat la ceva voce bazat pe propriile lor scene care ar putea schimba calea Oamenii interacționează unul cu celălalt.

Deși, Siri este mult mai puternic decât căutarea vocală a Google pe platforma iOS, ambele funcționează în general în același mod prin captarea comenzilor audibile de la utilizator înainte de a publica și prelucra acea comandă pe un server de back-end înainte de a scuipa rezultatul Înapoi la utilizator și acționând la cerere. Un videoclip a fost postat de Microsoft cu o prezentare de la Rick Rashid care prezintă îmbunătățirile pe care compania le-a făcut în domeniul interfețelor naturale de utilizator folosind vorbirea umană.

Sistemele bazate pe computer care înțeleg vorbirea umană nu reprezintă o nouă invenție. Am văzut multe lansări de -a lungul anilor care arată progrese semnificative în acest domeniu, Siri și Google Voice Search fiind câteva dintre cele mai recente exemple despre modul în care această tehnologie poate fi aplicată în lumea reală. Cu toate acestea, Microsoft a încercat în liniște să facă lucrurile cu câțiva pași în plus, construind un sistem în jurul tehnologiilor care nu numai că pot recunoaște vorbirea umană, ci și să -l traducă în textul unei limbi străine și apoi să repete cuvintele în acea limbă folosind o voce sintetizată generată să sune ca difuzorul.

Demonstrația de pe scenă care prezintă ofițerul principal de cercetare al Microsoft arată tehnologia în acțiune, recunoscând cuvintele sale de engleză rostite, transformându-le în chineză pe afișajul proiectat și apoi anunțând audibil aceeași propoziție înapoi în mandarină. Toate acestea sunt minții care suflă suficient, dar atunci lucrurile sunt luate puțin în plus, atunci când îți dai seama că Rashid și colegii săi au hrănit sistemul cu peste o oră în valoare de date vocale pentru a permite sistemului să repete propoziția în mandarină folosindu -și a lui Vocea proprie!

Tehnologia nu este cea mai bună și încă face greșeli, dar este cu adevărat uimitor să realizezi că acest lucru este posibil. Viitorul interacțiunii umane este absolut la orizont.

(via TechNetBlog)

Ne puteți urmări pe Twitter, adăugați -ne în cercul dvs. pe Google+ sau ca pagina noastră de Facebook pentru a vă menține la curent cu toate curentul de la Microsoft, Google, Apple și Web.

Leave a Reply Cancel reply

Related Post

Revizuirea unui programator ICRevizuirea unui programator IC

KICAD 4.0 este lansatKICAD 4.0 este lansat

Șase ani, un robot gigant și un kickstarterȘase ani, un robot gigant și un kickstarter