[MUSIC JOC] 

DAVID MALAN: Aceasta este CS50. Acesta este sfÃ¢rÈitul sÄptÄmÃ¢nii 10. Èi bÄiatul, nu avem o clasÄ bun pentru tine azi. Suntem atÃ¢t de entuziasmat de a invita doi prietenii noÈtri de la Yale pÃ¢nÄ la noi astÄzi Èi sÄ se uite la intersecÈia de inteligenta artificiala, robotica, procesarea limbajului natural, Èi mai mult. 

Èi Ã®ntr-adevÄr, peste ultimele cÃ¢teva sÄptÄmÃ¢ni, am petrecut cu siguranÈÄ o mulÈime de timp, Ã®n special Ã®n cele psets anterioare, concentrÃ¢ndu-se pe destul de multe detalii low-level. Èi este foarte uÈor sÄ-Èi piardÄ din vedere de pÄdurea de copaci si sa Ã®nchis pe bucle Èi condiÈii Èi indicii, cu siguranÈÄ, Èi altele asemenea. Dar realitatea este voi au acum ingredientele cu care poate Ã®ntr-adevÄr rezolvarea unor probleme interesante, printre le acele cÄ prietenii noÈtri de la Yale lucra la doar timid de Cambridge. 

Deci permiteÈi-mi mai Ã®ntÃ¢i sÄ introducÄ capul nostru asistent universitar de la Yale, Andy. 

[APLAUZE] 

Andy: Ãn primul rÃ¢nd, doar mulÈumesc te pentru a permite un cuplu Yalies pentru a pop pe jos la Cambridge astÄzi. Am aprecia cu adevÄrat. Ãn al doilea rÃ¢nd, la prietenii noÈtri Ã®napoi home-- Jason, VÄ mulÈumim pentru a rÄmÃ¢ne Èi de funcÈionare curs. Sper cÄ e bine Ã®n New Haven. 

Deci da, sunt super incantat sÄ introducÄ Scaz astÄzi. Scaz conduce laboratorul de robotica. E un profesor de, cum ar fi, de cinci departamente diferite de la Yale. Ãn laboratorul lui, el are multe, multe roboÈi care Ã®i place sÄ se joace cu. El are, cum ar fi, mai tare de locuri de muncÄ din lume. Èi el devine la fel de mizerie Ã®n jurul valorii de cu toatÄ ziua lungÄ Èi de a face ceva de lucru, de asemenea. 

Èi aÈa am adus de fapt o de le Ã®n jos cu noi astÄzi. Deci, fÄrÄ alte formalitÄÈi, Scaz este merge mai departe Èi de a introduce noi prietenului sÄu robot. 

[APLAUZE] BRIAN SCASSELLATI: MulÈumesc, David. MulÈumesc, Andy. Este atÃ¢t de minunat sÄ fie aici cu toatÄ lumea astÄzi. Vreau sÄ fiu foarte clar cÄ primul personalul CS50 aici, Ã®n Cambridge a fost incredibil de ospitalieri cu noi. Suntem atÃ¢t de recunoscÄtor pentru tot au fÄcut sÄ ne sprijine. Èi aÈa am dori sÄ fie Ã®n mÄsurÄ pentru a reveni bunÄtatea. 

AÈa cÄ astÄzi, ajungem sÄ anunÈe cÄ vom avea un nou, unul-de-un-un fel eveniment CS50 Ã®ntÃ¢mplÄ Ã®n New Haven sÄptÄmÃ¢na viitoare. Èi aceasta este CS50 cercetare Expo. AÈa cÄ am de gÃ¢nd sÄ fie primitor everyone-- CS50 studenÈi, Personalul de la atÃ¢t de la Harvard Èi la Yale-- vinÄ Èi sÄ vizitaÈi cu noi vineri. Vom avea o mare varietate de peste 30 de persoane diferite care prezintÄ Èi upperclassmen exhibiting-- aratÄ off unele din produsele lor de cercetare. Vom avea unele startup, chiar, Ã®n cÄutarea pentru un pic de noi talente Tech, startup din ambele Harvard Èi Yale. Èi vom avea unele grupuri de studenti Ã®n cÄutarea unor noi membri. 

O sÄ fie un timp foarte interesant. SperÄm cÄ aceia dintre voi care sunt coborÃ¢nd pentru jocul Harvard-Yale va fi capabil de a opri de un pic mai devreme, chiar Ã®n centrul de campus, Sterling Memorial Library. Vom avea un set de exponate care variazÄ de la autonomÄ Panza de moduri de utilizare a software-ului pentru a pÄstra manuscrise medievale. 

Vom avea de anunÈuri reÈele hoc Èi oamenii predare de codificare software Ã®n Cape Town. Vom avea calculator demonstraÈii de muzicÄ. Èi vom avea, desigur, mai multe roboÈi. AÈa cÄ speri sÄ alaturi de noi pentru acest eveniment. Ar trebui sÄ fie o mulÈime de distracÈie, un pic de mÃ¢ncare, Èi o mulÈime de interesant lucruri pentru a vorbi despre. 

AÈa cÄ astÄzi, vom vorbi despre procesarea limbajului natural. Èi acest lucru este Ã®ncercarea de pentru noi pentru a construi un nou mod de interfaÈare cu dispozitivele noastre, deoarece pentru ultimele cÃ¢teva sÄptÄmÃ¢ni, te-ai concentrat pe cum se face cÄ puteÈi scrie cod, scrie software cÄ este un mod de a fi Ã®n mÄsurÄ sÄ-i spun o maÈinÄ, aceasta este ceea ce vreau sÄ faci. 

Dar noi nu ar trebui sÄ se aÈteaptÄ ca totul asta e acolo, care este folosit de toÈi oamenii din lume va fi competenÈi Ã®n acest tip de instruire. Deci, distingem Ã®ntre calculator limbi Èi languages-- naturale cÄ este, lucrurile pe care oamenii de utilizare pentru a comunica cu alti oameni. Èi vom Ã®ncerca sÄ construim interfeÈe care utilizeazÄ aceste mecanisme de comunicare naturale. 

Acum, la fel ca orice alt subiect care le-am Ã®nceput cu Ã®n CS50, vom Ã®ncepe cu cele mai simple bit de procesarea limbajului natural cÄ ne putem imagina. Vom Ã®ncepe cu parte istoricÄ a limbajului natural. Èi apoi vom construi la Sisteme de mai multe Èi mai recente Èi au unele demo-uri distractive pe parcurs. 

Deci vom Ã®ncepe cu ceea ce a fost probabil prima limbajul natural sistem de prelucrare. Acesta a fost un sistem software scris Ã®n 1966 de Joseph Weizenbaum numit ELIZA. Èi ELIZA fost proiectat pentru a reproduce tipul de interacÈiune ai avea cu un Psihoterapeut Rogerian. Acum, Rogerians, au avut o idee care psihoterapie implicat fiind capabil sÄ reflecte Ã®napoi la un pacient Èi vorbesc cu ei, Practic, doar oferindu-le o tiny pic de terapeut. AdicÄ, totul cÄ terapeutul a spus Trebuia sÄ fie doar o reflectare a ceea ce pacientul spunea sÄ-i. 

Deci, hai sÄ Ã®ncercÄm Èi demo asta. Avem un voluntar care ar fi dispus sÄ Ã®mpÄrtÄÈeascÄ cele mai profunde lor, cele mai Ã®ntunecate, Èi / sau secretele false cu ELIZA? Sigur, de ce nu vii pe sus. Fantastic. Si numele tau? 

MILES: Miles. 

BRIAN SCASSELLATI: Miles. MÄ bucur sÄ te cunosc, Miles. DacÄ v-ar Èine pe asta. Èi am de gÃ¢nd sÄ folosesc o versiune a ELIZA care le-am replicat Ã®n cadrul IDE CS50. Èi ne vom uita la sursÄ cod pentru a acest lucru Ã®n scurt timp. Dar pentru acum, suntem doar gÃ¢nd sÄ-l invoca prin tastarea Eliza. 

Si Eliza este de gÃ¢nd sÄ vÄ dau rÄspunsuri care vor fi Ã®n toate capitalele. Èi o sÄ vÄ punem cÃ¢teva Ã®ntrebÄri. Èi vom rÄspunde Èi tastaÈi Ã®n rÄspunsurile la ELIZA. Deci, ELIZA a spus: "BunÄ, eu sunt ELIZA. Care e problema ta?" Ce doriÈi sÄ spune ELIZA despre ziua de azi? 

MILES: Eu pot cÄdea doar adormit dacÄ am papuci iepuras pe. 

BRIAN SCASSELLATI: Bine. In regula. 

[RÃSETE] 

"Eu pot cÄdea doar adormit cu papuci bunny mai departe. " Si Eliza spune: "Spune, nu-i aÈa are probleme psihice? Poate cÄ acest lucru este un indicator bun. " 

BINE. Deci, ce ai vrea sÄ rÄspundÄ? 

MILES: Da. 

BRIAN SCASSELLATI: Da. Omul de multe cuvinte. Ãmi place asta. Eliza spune: "Pari destul de pozitive." 

MILES: Nu, eu sunt, de fapt, un electron. 

BRIAN SCASSELLATI: "Nu. De fapt, eu sunt un electron. " "Ai venit la mine pentru cÄ eÈti un electron? " Acum, putem vedea o parte din lucruri-- am de gÃ¢nd sÄ vÄ opriÈi doar o secundÄ, Miles. Nu pleca nicÄieri. Noi nu am terminat cu tine Ã®ncÄ. ELIZA este, Ã®n unele privinÈe, rÄspunde la anumite lucruri cÄ el spune, dar fÄrÄ orice Ã®nÈelegere realÄ. Èi este, de asemenea parroting Ã®napoi o parte a pÄrÈilor de pedeapsa. 

AÈa cÄ am spus, "Nu De fapt, eu sunt un electron. " Eliza rÄspuns Ã®napoi: "Ai venit pentru mine pentru cÄ eÈti un electron? " In regula. SÄ dau un rÄspuns mai aici. DÄ-unul bun, Miles. 

MILES: un bun? 

Da, rog ajutÄ-mÄ. BRIAN SCASSELLATI: "Da. Te rog, ajutÄ-mÄ. "" EÈti sigur? " MILES: Nu. BRIAN SCASSELLATI: Nu. "Ce sugereaza pentru tine?" 

MILES: Nu poate fi un electron. 

BRIAN SCASSELLATI: "I nu poate fi un electron. " "Vrei sÄ spui cÄ nu doar pentru a fi negativ?" 

In regula. Deci Miles, vÄ mulÈumesc foarte mult. 

MILES: MulÈumesc. 

BRIAN SCASSELLATI: Multumesc foarte mult. [APLAUZE] 

Deci, acest program ELIZA, Ã®n multe feluri, rÄspunde doar la piesele cÄ suntem furnizarea, fÄrÄ nici o adÃ¢ncime Ã®nÈelegere a ceea ce se Ã®ntÃ¢mplÄ aici. Aceasta este un fel de sistem de numit de potrivire model, Ã®n cazul Ã®n care cÄutÄm anumite biÈi de text pe care suntem atunci de gÃ¢nd sÄ ia din ceea ce au fost furnizate ca intrare, converti, potenÈial, Ã®ntr-un fel, si apoi da-l Ã®napoi la utilizator. 

EfectuaÈi oricare dintre credeÈi cÄ este, de fapt ELIZA efectuarea psihanaliza valabil aici? O persoanÄ, poate. 

AudienÈa: [neauzit]. BRIAN SCASSELLATI: Èi cum nu ca sÄ te simÈi? Da, de fapt, o face. Èi vom vedea, De fapt, codul sursÄ pentru el Ã®ntr-o clipÄ. Èi aÈa vei fi capabil sÄ facÄ exact acest lucru. 

Acum, ELIZA este o formÄ de ce am numi astÄzi un bot de chat. Doar trece prin Textul pe care Ã®l furnizeazÄ, ofera suma minimÄ goale de Ã®nÈelegere sau de prelucrare, Èi apoi papagali Ã®napoi la tine. Deci, haideÈi sÄ aruncÄm o privire, conceptual, Èi vorbesc despre ceea ce este faptul cÄ este, de fapt face ELIZA. 

ELIZA este de a lua un Let sentence-- lui spune, "Vreau sÄ impresioneze Èeful meu." Si Eliza este Ã®n cÄutarea prin aceastÄ tezÄ Èi Ã®ncercarea de a gÄsi Èi se potrivesc anumite tipare. Astfel, de exemplu, unul dintre modelele care este Ã®n cÄutarea pentru ELIZA sunt cuvintele "Eu vreau." Èi ori de cÃ¢te ori vede ceva care are "Vreau" Ã®n ea, se formuleazÄ un rÄspuns. Èi cÄ rÄspunsul este un Èir fix. Ãn acest caz, este "de ce vrei?" Èi am pus un pic stea la la sfÃ¢rÈitul pentru cÄ e doar Ã®nceputul rÄspunsului nostru. Èi steaua indicÄ faptul cÄ vom lua restul de utterance-- utilizatorului "pentru a impresiona seful meu" - Èi vom adÄuga cÄ pe la sfÃ¢rÈitul acestui Èir. 

Deci, acum, mai degrabÄ decÃ¢t a spune, "de ce vrei sa impresionezi seful meu, " existÄ un pic de suplimentare prelucrare care vom face. Asta este, va trebui sÄ converti unele pronumelor aici de la "seful meu" la "seful tau." Èi ar putea fi o altÄ cÃ¢teva SchimbÄri de care avem nevoie pentru a face. Deci, mai degrabÄ decÃ¢t doar o lipit direct pe final, ceea ce vom face este vom lua restul de utterance-- utilizator Ã®n here-- alb Èi vom lua o bucatÄ de la un timp Èi de a converti fiecare Èir semn, fiecare cuvÃ¢nt, Ã®n tezÄ. 

Deci, vom lua cuvÃ¢ntul "a". Nu e nici o conversie cÄ trebuie sÄ facem asta. "Impresiona." Nu e nici o conversie trebuie sÄ facem acolo. "My" va converti la "dumneavoastrÄ". Si "seful" vom lÄsa la fel de "sef". Èi Ã®n final, orice care se terminÄ cu o perioadÄ, vom transforma Ã®ntr-o Ã®ntrebare. 

Acest model foarte simplu de potrivire este, de fapt destul de succes. Èi cÃ¢nd acest lucru a fost introdus Ã®n 1966-- Joseph Weizenbaum programat aceasta pe un computer. Acum, computere la acel moment nu au fost modele desktop. Ei au fost Ã®mpÄrtÄÈite de resurse. Èi studenÈii sÄi ar fi du-te Èi chat cu ELIZA. Ãn cele din urmÄ, el a trebuit sÄ restricÈiona accesul la o deoarece elevii sai nu au fost obtinerea orice lucrare de fÄcut. Ei au fost doar pe chat cu ELIZA. Èi, de fapt, a trebuit sÄ foc asistentul sÄu, care a a petrecut tot timpul vorbind cu ei ELIZA despre problemele ei profunde Èi Ã®ngrijorÄtoare. 

ToatÄ lumea care a folosit aceste sisteme a Ã®nceput sÄ-i anthropomorphize. Au Ã®nceput sÄ se gÃ¢ndeascÄ la ele ca fiind animate Èi oameni reali. Au Ã®nceput sÄ recunoascÄ o parte din lucrurile pe care le spuneau veneau inapoi la ei. Èi au fost aflarea lucruri despre ei Ã®nÈiÈi. Èi, de fapt, chiar Èi experÈii, chiar psihoterapeuÈi, a Ã®nceput sÄ vÄ faceÈi griji cÄ, de fapt, poate ELIZA ar fi Ã®nlocuirea acestora. Èi chiar computerul oamenii de stiinta Ã®ngrijorat de faptul cÄ am fost atÃ¢t de aproape de rezolvarea limbaj natural. 

Acum, cÄ nu a fost nicÄieri aproape de realitate. Dar asta e cum impresionant aceste sisteme pot pÄrea. AÈa cÄ haideÈi sÄ Ã®ncepe sÄ se uite dedesubt Èi sÄ Ã®ncerce pentru a obÈine un pic de o Ã®ntrebare unde acest cod se Ã®ntÃ¢mplÄ de fapt. Deci, vom face acest cod disponibil dupÄ aceea. Èi aceasta este o foarte Portul simplu Èi direct a punerii Ã®n aplicare iniÈiale ELIZA. 

Deci, unele dintre acestea stilistic lucruri pe care le veÈi vedea aici nu sunt stilistic ce ne-ar dori sÄ faci sau ceea ce am fost de predare sÄ faci. Dar am Ã®ncercat sÄ-i ÈinÄ la fel peste multe porturi cÄ acest lucru a avut astfel Ã®ncÃ¢t sÄ are aroma a originalului. AÈa cÄ am de gÃ¢nd sÄ includÄ o gramada de lucruri, si apoi vom avea o set de cuvinte cheie, lucruri care ELIZA va recunoaÈte Èi sÄ rÄspundÄ la direct. Deci, dacÄ aveÈi cuvinte ca "poÈi" sau "Nu" sau "nu" sau "da" sau "de vis" sau "salut", apoi ELIZA va rÄspunde selectiv la cele. Vom avea, de asemenea, o anumit numÄr de lucruri cÄ vom schimba, cum ar fi convertirea "mea" la "dumneavoastrÄ". 

Èi apoi vom avea un set de rÄspunsuri cÄ pentru fiecare dintre aceste cuvinte cheie, vom roti prin aceste raspunsuri diferite. Deci, dacÄ eu spun "da" de trei ori la rÃ¢nd, am ar putea primi trei diferite rÄspunsuri de la ELIZA. Codul nostru, atunci, este de fapt remarcabil de simplu. DacÄ am derulaÈi Ã®n jos trecut toate acestea rÄspunsuri pe care le-am programate Ã®n si ne trecem la principala noastrÄ, vom iniÈializa o pereche de diferite variabile Èi de a face un pic de menaj la Ã®nceput. Dar existÄ o serie absolut de cod pe care le puteÈi Ã®nÈelege. O buclÄ Ã®n timp ce mare care spune cÄ sunt O sÄ repet acest peste si peste. Voi citi Ã®ntr-o linie Èi voi stoca cÄ Ã®ntr-un Èir de intrare. Voi verifica Èi a vedea dacÄ acesta este cuvinte cheie special "la revedere", care Ã®nseamnÄ a ieÈi din program. Èi apoi voi verifica Èi a vedea dacÄ cineva este doar repete din nou si din nou. Èi voi striga la ei, dacÄ o fac. Voi spune "nu te repeta." 

AtÃ¢ta timp cÃ¢t nici unul dintre cei Ã®ntÃ¢mpla, vom apoi scanaÈi prin bucla Èi prin, pe liniile 308 la 313 aici, Èi a verifica Èi a se vedea sunt oricare dintre cei cuvÃ¢nt cheie Expresii conÈinute Ã®n intrare cÄ am fost doar dat? DacÄ existÄ un meci pentru ei, bine apoi, voi amintiÈi-vÄ cÄ locaÈia. Ãmi voi aminti acel cuvÃ¢nt cheie. Èi voi fi capabil de a construi un rÄspuns. 

DacÄ nu gÄsesc o, Ei bine, atunci, ultimul lucru din matrice mea de cuvinte cheie va fi rÄspunsurile mele implicite, atunci cÃ¢nd nimic altceva meciuri. Voi pune Ã®ntrebÄri de genul "De ce ai fÄcut venit aici? "sau" Cu ce ââvÄ pot ajuta? " cÄ sunt doar parÈial adecvate indiferent de ceea ce de intrare este. 

Vom construi apoi Ã®n sus rÄspunsul lui Eliza. Vom fi Ã®n mÄsurÄ sÄ ia cÄ rÄspunsul de bazÄ, la fel cum am fÄcut Ã®n "Èeful meu" exemplu. DacÄ asta e tot ce existÄ este-- daca e doar un singur Èir care eu ar trebui sÄ respond-- Am putea trimite Ã®napoi. DacÄ are un asterisc la la sfÃ¢rÈitul anului acesta, atunci voi procesa fiecare jeton individual restul rÄspunsului utilizatorului Èi se adaugÄ cele din, schimbarea din cuvÃ¢nt cu cuvÃ¢nt ca am nevoie pentru a. 

Toate acest lucru este absolut ceva care te-ar putea construi. Èi, de fapt, modul Ã®n care ne-am au argumente Ã®n linia de comandÄ prelucrate, modul Ã®n care trebuie procesate prin cereri HTTP urmaÈi aceleaÈi tipuri de reguli. Sunt model de potrivire. 

Deci, ELIZA avut un relativ importantÄ impactul asupra limbaj natural pentru cÄ a fÄcut sÄ parÄ cÄ a fost un Scopul foarte realizabil, cum ar fi Ã®ntr-un fel ne-ar fie Ã®n mÄsurÄ sÄ rezolve aceastÄ problemÄ Ã®n mod direct. Acum, asta nu Ã®nseamnÄ cÄ nu ELIZA tot ceea ce ne-am dori sÄ facem. Cu siguranta nu. Dar noi ar trebui sÄ poatÄ de a face ceva mai mult. 

Primul nostru pas pentru a merge dincolo de ELIZA se Ã®ntÃ¢mplÄ pentru a putea sÄ se uite la nu textele fiind introdus Ã®n tastaturÄ, dar discursul, real Discursul Ã®nregistrat Ã®ntr-un microfon. Deci, ca ne uitÄm la aceste piese diferite, suntem Va trebui sÄ construiascÄ un set de modele. Vom avea sÄ fie Ã®n mÄsurÄ pentru a merge la acustica de nivel scÄzut smoalÄ information--, amplitudine, frequency-- Èi de a converti cÄ Ã®n unele unitÄÈi care suntem capabil de a manipula mai uÈor Èi, Ã®n cele din urmÄ, le manipula Ã®n cuvinte Èi propoziÈii. 

Deci, cel mai de recunoaÈtere a vorbirii sisteme care sunt acolo azi urmeze o statisticÄ Modelul Ã®n care ne construim trei reprezentÄri separate de ceea ce care semnal audio conÈine de fapt. Vom Ã®ncepe cu un model de foneticÄ care vorbeÈte despre doar baza SunÄ cÄ eu sunt producÄtoare. Sunt producÄtoare de ceva care este B ca Ã®n bÄiat sau D ca Ã®n cÃ¢ine? Cum recunosc cei doi diferite Telefoane fi separatÄ Èi distinctÄ? 

Pe deasupra, vom construi apoi o pronunÈie cuvÃ¢nt model ceva care leagÄ Ã®mpreunÄ aceste telefoane individuale Èi le combinÄ Ã®ntr-un cuvÃ¢nt. Èi dupÄ aceea, vom lua cuvintele si le vom asambla cu un limbaj modela Ã®ntr-o propoziÈie completÄ. 

Acum, vom vorbi despre fiecare dintre acestea Ã®n mod independent Èi separat. Dar aceste trei modele sunt toate doar de gÃ¢nd sÄ fie statistici. Èi asta Ã®nseamnÄ cÄ atunci cÃ¢nd ne lucra cu ei, vom fie capabil sÄ lucreze cu le pe toate Ã®n acelaÈi timp. In regula. SÄ Ã®ncepem cu modelul nostru fonetic. Deci, modele fonetice se bazeazÄ pe o tehnicÄ de calcul numit modele ascunse Markov. Acestea sunt modele grafice Ã®n care am au Èi sÄ recunoascÄ un stat al lumii ca fiind caracterizat de un set de caracteristici. Èi aceastÄ stare descrie o parte o acÈiune pe care am angajat Ã®n. 

Deci, dacÄ mÄ gÃ¢ndesc la a face sunetul "Ma" ca mama, existÄ diferite componente pentru acel sunet. ExistÄ o parte Ã®n cazul Ã®n care am trage Ã®n respiraÈie. Èi apoi am pungÄ buzele mele. Èi mÄ rostogolesc buzele un pic Ã®napoi bit pentru a face acel sunet "ma". Èi apoi existÄ o eliberare. Buzele mele vin Ã®n afarÄ. Aerul este expulzat. "Ma." 

Aceste trei pÄrÈi diferite ar fi reprezentatÄ de cÄtre statele Ã®n acest graph-- debutul, la mijloc, Èi sfÃ¢rÈitul. Èi mi-ar fi tranziÈii care mi-a permis sÄ cÄlÄtoreascÄ dintr-un stat la alta cu o anumitÄ probabilitate. Astfel, de exemplu, cÄ M sunet ar putea avea o foarte, foarte scurt de admisie la beginning-- "mm" - Èi apoi o lungÄ, faza vibratoare unde am exploataÈie meu buzele Ã®mpreunÄ Èi aproape humming-- "mmmm" - Èi apoi o foarte scurtÄ ocluziv unde am expulza breath-- "ma". 

Modelul Markov ascuns este conceput pentru a capta faptului cÄ modul Ã®n care am face acel sunet "ma" se va sÄ fie uÈor diferitÄ Ã®n calendarul sÄu, este frecventa, Èi caracteristicile sale decÃ¢t modul Ã®n care-l face sau modul Ã®n care am putea face cÃ¢nd vorbesc despre diferite intrebuintari ale scrisorii. "Mama" si "poate eu" va sunet uÈor diferit. 

Deci, pentru a recunoaÈte un sunet special, ne-ar construi modele Markov, acestea ascunse Markov modele, de fiecare telefon posibile pe care am ar putea dori sÄ recunoascÄ, fiecare sunet posibil, Èi apoi uita-te la date acustice cÄ am Èi de a determina statistic care unul este cel mai probabil sÄ fi produs acest sunet. BINE. Cu acest model, am apoi Ã®ncepe sÄ se bazeze pe partea de sus a acesteia. LuÄm un model pronunÈie. Acum, uneori pronunÈia Modelele sunt simple Èi uÈor de pentru cÄ existÄ o singurÄ mod se pronunÈÄ ceva. Alteori, ele sunt o pic mai complicat. IatÄ un ghid pronunÈie pentru acel lucru care este de culoare roÈie un fruct pe care le face ketchup din. Oamenii nu cred cÄ este un fruct. Dreapta? 

Acum, existÄ mai multe moduri diferite cÄ oamenii vor pronunÈa acest cuvÃ¢nt. Unii vor spune "toe-mai-toe." Unii vor spune "toe-mah-toe." Èi putem surprinde cÄ, odatÄ cu unul dintre aceste modele grafice Ã®n cazul Ã®n care, din nou, ne-am reprezenta tranziÈii ca avÃ¢nd o anumitÄ probabilitate Èi probabilitate asociatÄ cu ei. 

Deci, Ã®n acest caz, dacÄ ar fi sÄ urmeze traseul de sus, prin toatÄ aceastÄ grafic, Mi-ar fi incepand de la litera pe departe stÃ¢nga, "TA" sunetul. Mi-ar lua jumÄtate de sus, de "oh", Èi apoi un "ma", Èi apoi o "o", Èi apoi o "TA", Èi un "oh". "Toe-May-toe." DacÄ am luat calea de jos prin acest lucru, voi primi "ta-mah-toe." Èi dacÄ m-am dus Ã®n jos Èi apoi up, mi-ar lua "ta-May-toe." 

Aceste modele de captare acestea diferenÈe, deoarece ori de cÃ¢te ori am implementa una dintre acestea sisteme de recunoaÈtere, cÄ va trebui sÄ lucreze cu o mulÈime de diferite tipuri de oameni, o mulÈime de diferite accente, Èi chiar diferite utilizÄri ale aceleaÈi cuvinte. Ãn cele din urmÄ, pe deasupra, vom construi ceva care pare foarte complicat, numit modelul de limbÄ, dar, de fapt este cea mai simplÄ de trei deoarece acestea funcÈioneazÄ pe ceea ce se numesc modele n-gram. Èi Ã®n acest caz, te aratÄ o douÄ pÄrÈi n-gram de model, un bigram. Vom face fizic ideea cÄ, uneori, anumite cuvinte sunt mai multe sanse de a urma un dat cuvÃ¢ntul decÃ¢t altele. DacÄ am spus "prognoza" cuvÃ¢ntul urmÄtor ar putea fi probabil "astÄzi" sau ar putea fi "vremea prognoza mÃ¢ine. " Dar e puÈin probabil sÄ fi " Vremea anghinare. " 

Ce model de limbÄ nu este surprinde pe cei statistic prin numÄrarea, de la unele foarte mari corpus, toate instanÈele Ã®n care un cuvÃ¢nt urmeazÄ altul. Deci, dacÄ am lua o corpus-- mare ca orice Wall Street Journal care a fost produs din 1930, care este unul din corpuses-- standardului Èi mÄ uit prin toate acest text, Èi contez up cÃ¢te ori dupÄ "Prognoza" nu am vedea "astÄzi" Èi de cÃ¢te ori Ã®mi vÄd "Prognoza", urmat de "anghinare" prima se Ã®ntÃ¢mplÄ sÄ fie mult mai probabil. Va sÄ aparÄ mult mai frecvent. Èi aÈa va avea o mai mare probabilitate asociate cu aceasta. 

DacÄ vreau sÄ dau seama de probabilitatea unui Ã®ntreg exprimare, apoi, tocmai am despart. Deci probabilitatea de auz propoziÈia "Èobolanul mÃ¢ncat brÃ¢nzÄ" este probabilitatea cuvÃ¢ntului "The" Ã®ncepÃ¢nd cu o propoziÈie, Èi apoi probabilitatea ca CuvÃ¢ntul "Èobolan" urmeazÄ cuvÃ¢ntul "The" Èi probabilitatea ca CuvÃ¢ntul "mÃ¢ncat" urmeazÄ "Èobolan", iar probabilitatea ca "brÃ¢nzÄ" urmeazÄ "mÃ¢ncat". 

Aceasta pare a fi o mulÈime de statistici, o mulÈime de probabilitÄÈi. Èi asta e tot ce este. Dar lucrul uimitor este dacÄ faci acest lucru cu un eÈantion suficient de mare de date, functioneaza. Èi funcÈioneazÄ extrem de bine. Ètim cu toÈii aceste tehnologii. Cele mai multe sisteme de operare sunt dotate cu recunoaÈtere a vocii Ã®n acest moment. Noi folosim Siri Èi Cortana Èi Echo. Èi aceste lucruri se bazeazÄ pe acest tip de trei straturi model-- un model de foneticÄ la partea de jos, A pronunÈat model din mijloc, Èi un model de limbÄ pe partea de sus a ei. 

Acum, ei trebuie sÄ facÄ un pic mai mult decÃ¢t cÄ, pentru a rÄspunde la Ã®ntrebÄri. Dar recunoaÈterea a ceea ce eÈti spunÃ¢nd depinde exact pe asta. AÈa cÄ haideÈi sÄ luÄm un exemplu aici. AÈa cÄ am telefonul meu ÈedinÈei aici sub camera pentru documente. Èi am de gÃ¢nd sÄ solicitÄ Siri cÃ¢teva Ã®ntrebÄri. In regula? 

Deci, haideÈi sÄ se trezeascÄ telefonul meu aici. Siri, ceea ce este vremea ca Ã®n New Haven azi? 

Siri: IatÄ vremea pentru New Haven, Connecticut astÄzi. 

BRIAN SCASSELLATI: OK. Deci Ã®n primul rÃ¢nd ai vÄzut cÄ Siri a recunoscut fiecare dintre cuvintele individuale Èi apoi a produs un rÄspuns. Vom vorbi despre cum sa rÄspuns vine vorba Ã®ntr-un pic. Dar acum, cÄ Ètim cÄ aceasta este doar pe bazÄ de pe statisticile prime Èi acest model tip de potrivire de abordare, putem juca unele jocuri cu Siri. 

Deci, eu pot Ã®ncerca din nou. Siri, ceea ce este vremea hipopotam New Haven, azi? 

Siri: OK. Aici e vremea pentru noi Haven, Connecticut pentru ziua de azi. BRIAN SCASSELLATI: Siri nu descurajat de faptul cÄ deoarece este gÄsit pattern-- "Vremea", "astÄzi", "New Haven." Asta e ceea ce rÄspunde la, la fel ca ELIZA. In regula. SÄ-i dau una mai mult, chiar mai exemplu ridicol. Siri, anghinare vreme armadillo hipopotam New Haven? 

Siri: PermiteÈi-mi sÄ verific asta. IatÄ ce am gÄsit pe web pentru care sunt anghinare Armadillo hipopotam New Haven. 

BRIAN SCASSELLATI: OK. Deci, dacÄ am merge suficient de departe departe de acest model, Sunt Ã®n stare sÄ-l confunde, deoarece nu mai potriveÈte cu modelul pe care Ã®l are. Èi cÄ statistica motor care spune, ceea ce este probabilitatea ca ai hipopotam cuvinte Èi anghinare Ã®mpreunÄ, Èi Armadillo? Asta trebuie sÄ fie ceva nou. 

Deci, aceste tehnologii folosim Ã®n fiecare zi. DacÄ vrem sÄ-i ia un pas Ã®n plus, deÈi, dacÄ am de fapt doresc sÄ fie Ã®n mÄsurÄ sÄ vorbeascÄ despre ceea ce este faptul cÄ aceste sisteme sunt raspunde la, trebuie sÄ vorbim, din nou, despre o set mai fundamental de Ã®ntrebÄri. Èi asta e un subiect Ã®n comunicare pe care o numim Ã®ntrebare rÄspuns. Asta este, ne dorim sÄ fie Ã®n mÄsurÄ sa-- da? AudienÈa: [neauzit]. BRIAN SCASSELLATI: Nu ne Ã®n procesarea semanticÄ latent? Deci da. ExistÄ o mulÈime de lucruri care sunt Ã®ntÃ¢mplÄ sub suprafaÈa cu Siri Èi Ã®n unele dintre exemplele Am de gÃ¢nd sÄ-Èi arÄt urmÄtor Ã®n cazul Ã®n care existÄ destul de un pic Ã®n ceea ce priveÈte structura de ce spui cÄ e important. Èi, de fapt, cÄ este o mare precursor pentru urmatorul diapozitiv pentru mine. 

Deci Ã®n acelaÈi fel Ã®n care ne de recunoaÈtere a vorbirii a fost construit din mai multe straturi, dacÄ vrem sÄ sÄ Ã®nÈeleagÄ ceea ce este ca de fapt fiind spuse, vom din nou la se bazeazÄ pe o analizÄ multi-strat textului care fiind recunoscut. Deci, atunci cÃ¢nd Siri este, de fapt Ã®n mÄsurÄ sÄ sÄ zicem, uite am gÄsit aceste cuvinte. Acum ce fac cu ele? Prima componentÄ este de multe ori a du-te prin Èi sÄ Ã®ncerce sÄ analizeze structura propoziÈiei. Èi Ã®n ceea ce am vÄzut Ã®n Ècoala primarÄ, de multe ori, ca un fel de diagrame Exemple, vom sÄ recunoascÄ faptul cÄ anumite Cuvintele au anumite roluri. Acestea sunt substantive. Acestea sunt pronume. Acestea sunt verbe. Èi am de gÃ¢nd sÄ recunoascÄ cÄ pentru o anumitÄ gramaticÄ, Ã®n acest caz gramatica limbii engleze, existÄ modalitÄÈi valide Ã®n care le-am putea combina Èi alte modalitÄÈi care nu sunt valide. 

CÄ recunoaÈterea, cÄ structura, ar putea fi de ajuns pentru a ne ajuta sÄ ghideze putin. Dar nu este de ajuns pentru noi sÄ fie capabil sÄ ofere nici un sens la ceea ce se spune aici. Pentru a face acest lucru, va trebui sÄ se bazeze pe o anumitÄ cantitate de prelucrare semanticÄ. Asta este, vom trebui sÄ se uite la sub ceea ce fiecare dintre aceste cuvinte exercitÄ Ã®n mod efectiv ca un sens. Èi Ã®n cel mai simplu mod de a face acest lucru, vom asocia cu fiecare cuvÃ¢nt ca stim o anumitÄ funcÈie, o anumitÄ transformare cÄ permite sÄ se Ã®ntÃ¢mple. 

Ãn acest caz, am putea eticheta CuvÃ¢ntul "John", ca fiind un nume propriu, cÄ poartÄ cu ea o identitate. Èi am putea eticheta "Maria", ca Ã®n acelaÈi mod. ÃntrucÃ¢t un verb ca "iubeÈte, cÄ" constituie un anumit relaÈie cÄ suntem Ã®n stare sÄ reprezinte. Acum, asta nu Ã®nseamnÄ cÄ ne Ã®nÈelegem ce este dragostea, ci doar cÄ ne Ã®nÈelegem l Ã®n calea unui sistem simbolic. Asta este, putem eticheta ea Èi-l manipuleze. 

Cu fiecare dintre aceste tipuri de abordÄri, orice tip de prelucrare semantic aici este de gÃ¢nd sÄ nevoie de un pic de pic de cunoÈtinÈe Èi o mulÈime de muncÄ din partea noastrÄ. Nu mai suntem Ã®n domeniul Ã®n cazul Ã®n care statisticile pur Èi simplu vor fi de ajuns pentru noi. Acum, Ã®n scopul de a merge din acest punct de a fi posibilitatea de a vorbi despre interiorul ceea ce se Ã®ntÃ¢mplÄ de fapt aici, pentru a fi capabil de a manipula acest structura Èi sÄ Ã®nÈeleagÄ o Ã®ntrebare Èi apoi de a putea sÄ iasÄ Èi de cÄutare, care necesitÄ o mai Modelul cognitiv complex. 

Modul Ã®n care sunt construite aceste sisteme este cea mai mare parte foarte, foarte forÈei de muncÄ intens. Acestea implicÄ oameni petrecut o mare de timp structurarea modalitÄÈile Ã®n care aceste tipuri de propoziÈii pot fi reprezentate Ã®ntr-o anumitÄ logicÄ. Ea devine chiar un pic mai complexÄ, totuÈi. 

Chiar Èi dupÄ ce ne-am ocupat cu semantica, vom Ã®ncÄ mai trebuie sÄ se uite la pragmatica a ceea ce se spune. Asta este, cum am se referÄ cuvintele cÄ am ceva fizic acolo, Ã®n lume sau la puÈin unele sursÄ de informare pe care le pot manipula? 

Uneori, acestea conduc la biÈi minunate ale ambiguitate. "Red-hot stele sÄ se cÄsÄtoreascÄ astronom." BINE. Acum, am citit cÄ, Ã®n tip amuzant de titlu care ne-ar vedea la televizor noaptea tÃ¢rziu pentru cÄ noi nu interpretÄm "stea" sÄ aibÄ sensul sÄu corp ceresc. Ètim cÄ aceasta Ã®nseamnÄ mai mult actor obiÈnuit sau actrita cu cantitÄÈi mari de vizibilitate. 

"Squad ajuta muscatura de caine victimÄ." Este cÄ echipa este de fapt acolo asistarea un cÃ¢ine Ã®n Ã®ntÃ¢mplÄ Ã®n jurul Èi muÈcÄ victimele? Sau este cÄ nu a existat o persoanÄ care a fost muscat de un caine care avea nevoie de ajutor? Doar de la uita la sintaxa Èi semantica propoziÈiilor, nu putem determina acest lucru. 

"Elicopter alimentat de muÈte umane." ExistÄ, de fapt, real lucruri mici care zboarÄ Ã®n jurul sunt oameni cu aripi alimentarea elicoptere pentru binele omenirii? Sau existÄ un dispozitiv mecanic care derivÄ puterea de la o persoanÄ? 

CÃ¢nd ne uitÄm la Ã®ntrebare Sisteme de rÄspuns, acestea sunt straturile care avem nevoie pentru a face faÈÄ. Acum, cele mai bune Èi cele mai fel de rÄspÃ¢nditÄ a acestor sisteme astÄzi sunt capabili sÄ facÄ lucrurile la un nivel care sunt mult dincolo de ceea ce am avut Ã®n urmÄ cu 10 de ani. IatÄ una dintre cele mai bune sisteme cÄ e acolo azi. Èi aceasta este un sistem de de la IBM Watson numit. Acest lucru este de la prietenii noÈtri de la IBM. Acest lucru este bÄncile Katherine, Jia Chen, Èi Priscilla Moraes ne da o demonstraÈie de Watson ieri, Ã®n IBM Yorktown. [VIDEO PLAYBACK] -Ce mai faci? 

-Sunt bine. Sunt Ã®ntotdeauna fericit atunci cÃ¢nd sunt gÃ¢ndire, mai ales atunci cÃ¢nd am pot sta rece Ã®n aceste camere de servere. Cine este actrita ta preferata? 

Actrita -My favorit Angelina Jolie ca Lara Croft Ã®n Tomb Raider, deoarece originalul ei Formularul a fost ca un personaj virtual ca mine. 

-Cum Poate Watson ajuta pacientii? 

-este Planul pentru pacientii la au acces la Watson direct? Accesul la consultativ Watson cererile vor varia Ã®n funcÈie de utilizarea caz. Dar Ã®n prezent, Watson va oferi doar posibil diagnostic si tratament opÈiuni profesionale medicale. DacÄ este cazul, pacientii poate furniza informaÈii la Watson, poate printr-o interfata web portal, tabletÄ, sau chiar un telefon mobil. De exemplu, un pacient poate fi a cerut sÄ descrie simptomele lor Ã®n limbaj natural direct Ã®ntr-o soluÈie Watson, care sa permita medicului sa se concentreze asupra diagnostic Èi nu de colectare a datelor. 

-Cine Asasinat Abraham Lincoln? 

Ioan Wilkes Booth. 

-Ãn Ceea ce an a fÄcut Arizona Diamondbacks cÃ¢Ètiga World Series? 

-2001. 

[END PLAYBACK] 

BRIAN SCASSELLATI: Deci aceste tipuri de sisteme trebuie sÄ se bazeze Ã®n primul rÃ¢nd pe recunoscÃ¢nd discursul; doilea, convertind-o Ã®ntr-un interne semnificative reprezentare; Èi apoi, a treia, posibilitatea de a ieÈi Èi de a gÄsi sursa de informaÈii care le permite sÄ rÄspundÄ la aceastÄ Ã®ntrebare. Acest nivel de complexitate implicÄ aceleaÈi tipuri de lucruri programatice care le-au fost face Ã®n seturi de probleme. 

Suntem capabili sÄ elimine cereri HTTP Ã®n acelaÈi tip de model de nivel scÄzut potrivire care ELIZA poate face. Suntem capabili de a converti pe cei Ã®ntr-o reprezentare internÄ, Èi apoi sÄ le utilizeze pentru a interoga unele bazÄ de date externÄ, eventual folosind SQL. Toate sistemele care sunt construite astÄzi pentru a face acest tip de naturale comunicare limba sunt construite pe aceste aceleaÈi principii. 

Acum, chiar Èi un sistem ca Watson nu este suficient de complex pentru a putea sÄ rÄspundÄ arbitrarÄ Ã®ntrebÄri despre orice subiect. Èi, de fapt, acestea trebuie sÄ fie structurat Ã®ntr-un domeniu dat. Astfel Ã®ncÃ¢t sÄ puteÈi merge online Èi puteÈi gÄsi versiuni ale Watson, care opereazÄ bine Ã®n informaticÄ medicalÄ. Sau nu e online, care tocmai se ocupÄ cu modul Ã®n care de a face recomandÄri bune despre ce bere se va merge cu care alimente. Èi Ã®n aceste domenii, se poate rÄspunde la Ã®ntrebÄri, gÄsi informaÈiile de care are nevoie. 

Dar nu se poate amesteca Èi le potrivi. Sistemul care a fost instruit cu baza de date de produse alimentare Èi bere nu funcÈioneazÄ bine atunci cÃ¢nd dintr-o datÄ pune-l Ã®n cu informaticii medicale BazÄ de date. Deci, chiar cele mai bune noastre de astÄzi sistemele se bazeazÄ pe un nivel de prelucrare Ã®n care suntem de codificare de mÃ¢nÄ Èi construirea Ã®n infrastructura pentru pentru a face acest sistem rula. 

Acum, ultimul subiect vreau pentru a putea ajunge la ziua de azi este despre comunicare nonverbala. O masÄ mare de informaÈii care ne comunice unul cu celÄlalt nu vine despre prin cuvinte individuale, care ne solicitÄ. Ea are de a face cu lucruri, cum ar fi proximitate, privirea, tonul vocii, inflexiune dumneavoastrÄ. Èi cÄ, de asemenea, comunicarea este ceva care de multe interfete diferite Ã®ngrijire foarte multe despre. Nu e ceea ce ii pasa Siri despre. Pot cere Siri ceva Ã®ntr-o singurÄ voce sau Ã®ntr-un ton diferit de voce, Èi Siri va da-mi acelaÈi rÄspuns. Dar asta nu e ceea ce am construit pentru multe alte tipuri de interfeÈe. 

Vreau sÄ vÄ prezint acum la unul dintre roboÈi. Acest lucru a fost construit de mult timp mi prieten Èi coleg Cynthia Breazeal Èi compania ei Jibo. Èi aceasta robot-- vom de a avea un cuplu de voluntari veni pentru a interacÈiona cu acest lucru. Deci, pot avea douÄ oameni dispuÈi sÄ se joace cu robotul pentru mine? De ce nu vii pe sus, si de ce nu vii pe sus. DacÄ ai alÄtura mÄ aici, te rog. 

Èi dacÄ aÈ putea aveÈi vin chiar aici. MulÈumesc. BunÄ. 

ALFREDO: MÄ bucur sÄ te cunosc. Alfredo. 

BRIAN SCASSELLATI: Alfredo. 

RACHEL: Rachel. BRIAN SCASSELLATI: Rachel. MÄ bucur sÄ te cunosc ambele. Alfredo, am de gÃ¢nd sÄ te duci mai Ã®ntÃ¢i. Vino chiar aici. Am de gÃ¢nd sÄ introducÄ Tu-- dacÄ pot obÈine acest off fÄrÄ bate microphone-- la un mic robot de nume Jibo. OK? 

Acum, Jibo este proiectat pentru a fi interactiv. Èi, deÈi poate da discurs, o mare parte din interacÈiunea cu robotul este non-verbal. Alfredo, am de gÃ¢nd sÄ vÄ rog sÄ spune ceva frumos Èi gratuit la robot, vÄ rog. ALFREDO: Cred cÄ arÄÈi drÄguÈ. 

[ZbÃ¢rnÃ¢it SOUND] BRIAN SCASSELLATI: OK. RÄspunsul sÄu nu este verbal. Èi totuÈi, ai dat atÃ¢t o confirmare clarÄ cÄ a auzit ce ai spus Èi, de asemenea, Ã®nÈeles Ã®ntr-un fel care. OK? Pas Ã®napoi aici timp de o secundÄ. Multumesc. 

Rachel, dacÄ ar fi. Acum, am de gÃ¢nd sÄ dea vÄ de locuri de muncÄ mult mai greu. DacÄ doriÈi stai aici, copii de rezervÄ doar un pic, astfel ne puteÈi obÈine de pe camera foto si uita-te Ã®n acest fel. Am de gÃ¢nd sÄ vÄ rog sÄ spui ceva Ã®ntr-adevÄr Ã®nseamnÄ Èi urÃ¢t la robot. 

RACHEL: Ce-ai pÄrea de a face a fost complet absurdÄ. 

[BÃ¢zÃ¢it] 

Asta a fost chiar mai absurd. Ce se intampla cu tine? Aw, nu se simt rÄu. O sÄ-Èi dau o Ã®mbrÄÈiÈare. BRIAN SCASSELLATI: Bine. MulÈumesc, Rachel. Alfredo, Rachel, baieti Multumesc foarte mult. 

[APLAUZE] 

Deci, acest tip de interacÈiune are Ã®n multe moduri Unele dintre aceleaÈi reguli iar unele dintre aceleaÈi structurÄ ce am ar putea avea Ã®n interacÈiune lingvisticÄ. Este atÃ¢t de comunicare Èi serveÈte un scop important. Èi cÄ interacÈiunea, Ã®n multe feluri, este proiectat pentru a avea un efect special pe persoanÄ care interacÈioneazÄ cu sau de a asculta la robot. 

Acum, eu sunt destul de norocos sÄ aibÄ Jibo astÄzi aici. Sam Spaulding este aici ajuta ne cu robotul. Èi am de gÃ¢nd sÄ Ã®ntreb Sam pentru a da ne unul demo frumos de Jibo dans pe care le pot viziona la sfÃ¢rÈitul aici. Deci, mergeÈi mai departe, Jibo. 

SAM: OK, Jibo. AratÄ-ne miÈcÄrile tale de dans. 

[MUSIC JOC] BRIAN SCASSELLATI: Bine, toatÄ lumea. VÄ mulÈumim pentru prietenii noÈtri de la Jibo. 

[APLAUZE] 

Èi datoritÄ prietenilor noÈtri de la IBM pentru a ajuta azi. Comunicarea este ceva care ai de gÃ¢nd pentru a vedea venind mai mult ca vom construi interfete mai complexe. SÄptÄmÃ¢na viitoare, vom vorbi despre cum sÄ interfaÈÄ cu adversarii de calculator Ã®n jocuri. Dar, dacÄ aveÈi Ã®ntrebÄri cu privire la acest lucru, Voi fi Ã®n jurul valorii de la ore de birou Ã®n seara asta. Sunt fericit sÄ vorbesc cu tine despre AI subiecte sau pentru a intra Ã®n mai multe detalii. Au un weekend mare. 

[APLAUZE] [MUSIC JOC]