[MUSIC JOC] DAVID MALAN: Aceasta este CS50. Acesta este sfârșitul săptămânii 10. Și băiatul, nu avem o clasă bun pentru tine azi. Suntem atât de entuziasmat de a invita doi prietenii noștri de la Yale până la noi astăzi și să se uite la intersecția de inteligenta artificiala, robotica, procesarea limbajului natural, și mai mult. Și într-adevăr, peste ultimele câteva săptămâni, am petrecut cu siguranță o mulțime de timp, în special în cele psets anterioare, concentrându-se pe destul de multe detalii low-level. Și este foarte ușor să-și piardă din vedere de pădurea de copaci si sa închis pe bucle și condiții și indicii, cu siguranță, și altele asemenea. Dar realitatea este voi au acum ingredientele cu care poate într-adevăr rezolvarea unor probleme interesante, printre le acele că prietenii noștri de la Yale lucra la doar timid de Cambridge. Deci permiteți-mi mai întâi să introducă capul nostru asistent universitar de la Yale, Andy. [APLAUZE] Andy: În primul rând, doar mulțumesc te pentru a permite un cuplu Yalies pentru a pop pe jos la Cambridge astăzi. Am aprecia cu adevărat. În al doilea rând, la prietenii noștri înapoi home-- Jason, Vă mulțumim pentru a rămâne și de funcționare curs. Sper că e bine în New Haven. Deci da, sunt super incantat să introducă Scaz astăzi. Scaz conduce laboratorul de robotica. E un profesor de, cum ar fi, de cinci departamente diferite de la Yale. În laboratorul lui, el are multe, multe roboți care îi place să se joace cu. El are, cum ar fi, mai tare de locuri de muncă din lume. Și el devine la fel de mizerie în jurul valorii de cu toată ziua lungă și de a face ceva de lucru, de asemenea. Și așa am adus de fapt o de le în jos cu noi astăzi. Deci, fără alte formalități, Scaz este merge mai departe și de a introduce noi prietenului său robot. [APLAUZE] BRIAN SCASSELLATI: Mulțumesc, David. Mulțumesc, Andy. Este atât de minunat să fie aici cu toată lumea astăzi. Vreau să fiu foarte clar că primul personalul CS50 aici, în Cambridge a fost incredibil de ospitalieri cu noi. Suntem atât de recunoscător pentru tot au făcut să ne sprijine. Și așa am dori să fie în măsură pentru a reveni bunătatea. Așa că astăzi, ajungem să anunțe că vom avea un nou, unul-de-un-un fel eveniment CS50 întâmplă în New Haven săptămâna viitoare. Și aceasta este CS50 cercetare Expo. Așa că am de gând să fie primitor everyone-- CS50 studenți, Personalul de la atât de la Harvard și la Yale-- vină și să vizitați cu noi vineri. Vom avea o mare varietate de peste 30 de persoane diferite care prezintă și upperclassmen exhibiting-- arată off unele din produsele lor de cercetare. Vom avea unele startup, chiar, în căutarea pentru un pic de noi talente Tech, startup din ambele Harvard și Yale. Și vom avea unele grupuri de studenti în căutarea unor noi membri. O să fie un timp foarte interesant. Sperăm că aceia dintre voi care sunt coborând pentru jocul Harvard-Yale va fi capabil de a opri de un pic mai devreme, chiar în centrul de campus, Sterling Memorial Library. Vom avea un set de exponate care variază de la autonomă Panza de moduri de utilizare a software-ului pentru a păstra manuscrise medievale. Vom avea de anunțuri rețele hoc și oamenii predare de codificare software în Cape Town. Vom avea calculator demonstrații de muzică. Și vom avea, desigur, mai multe roboți. Așa că speri să alaturi de noi pentru acest eveniment. Ar trebui să fie o mulțime de distracție, un pic de mâncare, și o mulțime de interesant lucruri pentru a vorbi despre. Așa că astăzi, vom vorbi despre procesarea limbajului natural. Și acest lucru este încercarea de pentru noi pentru a construi un nou mod de interfațare cu dispozitivele noastre, deoarece pentru ultimele câteva săptămâni, te-ai concentrat pe cum se face că puteți scrie cod, scrie software că este un mod de a fi în măsură să-i spun o mașină, aceasta este ceea ce vreau să faci. Dar noi nu ar trebui să se așteaptă ca totul asta e acolo, care este folosit de toți oamenii din lume va fi competenți în acest tip de instruire. Deci, distingem între calculator limbi și languages-- naturale că este, lucrurile pe care oamenii de utilizare pentru a comunica cu alti oameni. Și vom încerca să construim interfețe care utilizează aceste mecanisme de comunicare naturale. Acum, la fel ca orice alt subiect care le-am început cu în CS50, vom începe cu cele mai simple bit de procesarea limbajului natural că ne putem imagina. Vom începe cu parte istorică a limbajului natural. Și apoi vom construi la Sisteme de mai multe și mai recente și au unele demo-uri distractive pe parcurs. Deci vom începe cu ceea ce a fost probabil prima limbajul natural sistem de prelucrare. Acesta a fost un sistem software scris în 1966 de Joseph Weizenbaum numit ELIZA. Și ELIZA fost proiectat pentru a reproduce tipul de interacțiune ai avea cu un Psihoterapeut Rogerian. Acum, Rogerians, au avut o idee care psihoterapie implicat fiind capabil să reflecte înapoi la un pacient și vorbesc cu ei, Practic, doar oferindu-le o tiny pic de terapeut. Adică, totul că terapeutul a spus Trebuia să fie doar o reflectare a ceea ce pacientul spunea să-i. Deci, hai să încercăm și demo asta. Avem un voluntar care ar fi dispus să împărtășească cele mai profunde lor, cele mai întunecate, și / sau secretele false cu ELIZA? Sigur, de ce nu vii pe sus. Fantastic. Si numele tau? MILES: Miles. BRIAN SCASSELLATI: Miles. Mă bucur să te cunosc, Miles. Dacă v-ar ține pe asta. Și am de gând să folosesc o versiune a ELIZA care le-am replicat în cadrul IDE CS50. Și ne vom uita la sursă cod pentru a acest lucru în scurt timp. Dar pentru acum, suntem doar gând să-l invoca prin tastarea Eliza. Si Eliza este de gând să vă dau răspunsuri care vor fi în toate capitalele. Și o să vă punem câteva întrebări. Și vom răspunde și tastați în răspunsurile la ELIZA. Deci, ELIZA a spus: "Bună, eu sunt ELIZA. Care e problema ta?" Ce doriți să spune ELIZA despre ziua de azi? MILES: Eu pot cădea doar adormit dacă am papuci iepuras pe. BRIAN SCASSELLATI: Bine. In regula. [RÂSETE] "Eu pot cădea doar adormit cu papuci bunny mai departe. " Si Eliza spune: "Spune, nu-i așa are probleme psihice? Poate că acest lucru este un indicator bun. " BINE. Deci, ce ai vrea să răspundă? MILES: Da. BRIAN SCASSELLATI: Da. Omul de multe cuvinte. Îmi place asta. Eliza spune: "Pari destul de pozitive." MILES: Nu, eu sunt, de fapt, un electron. BRIAN SCASSELLATI: "Nu. De fapt, eu sunt un electron. " "Ai venit la mine pentru că ești un electron? " Acum, putem vedea o parte din lucruri-- am de gând să vă opriți doar o secundă, Miles. Nu pleca nicăieri. Noi nu am terminat cu tine încă. ELIZA este, în unele privințe, răspunde la anumite lucruri că el spune, dar fără orice înțelegere reală. Și este, de asemenea parroting înapoi o parte a părților de pedeapsa. Așa că am spus, "Nu De fapt, eu sunt un electron. " Eliza răspuns înapoi: "Ai venit pentru mine pentru că ești un electron? " In regula. Să dau un răspuns mai aici. Dă-unul bun, Miles. MILES: un bun? Da, rog ajută-mă. BRIAN SCASSELLATI: "Da. Te rog, ajută-mă. "" Ești sigur? " MILES: Nu. BRIAN SCASSELLATI: Nu. "Ce sugereaza pentru tine?" MILES: Nu poate fi un electron. BRIAN SCASSELLATI: "I nu poate fi un electron. " "Vrei să spui că nu doar pentru a fi negativ?" In regula. Deci Miles, vă mulțumesc foarte mult. MILES: Mulțumesc. BRIAN SCASSELLATI: Multumesc foarte mult. [APLAUZE] Deci, acest program ELIZA, în multe feluri, răspunde doar la piesele că suntem furnizarea, fără nici o adâncime înțelegere a ceea ce se întâmplă aici. Aceasta este un fel de sistem de numit de potrivire model, în cazul în care căutăm anumite biți de text pe care suntem atunci de gând să ia din ceea ce au fost furnizate ca intrare, converti, potențial, într-un fel, si apoi da-l înapoi la utilizator. Efectuați oricare dintre credeți că este, de fapt ELIZA efectuarea psihanaliza valabil aici? O persoană, poate. Audiența: [neauzit]. BRIAN SCASSELLATI: Și cum nu ca să te simți? Da, de fapt, o face. Și vom vedea, De fapt, codul sursă pentru el într-o clipă. Și așa vei fi capabil să facă exact acest lucru. Acum, ELIZA este o formă de ce am numi astăzi un bot de chat. Doar trece prin Textul pe care îl furnizează, ofera suma minimă goale de înțelegere sau de prelucrare, și apoi papagali înapoi la tine. Deci, haideți să aruncăm o privire, conceptual, și vorbesc despre ceea ce este faptul că este, de fapt face ELIZA. ELIZA este de a lua un Let sentence-- lui spune, "Vreau să impresioneze șeful meu." Si Eliza este în căutarea prin această teză și încercarea de a găsi și se potrivesc anumite tipare. Astfel, de exemplu, unul dintre modelele care este în căutarea pentru ELIZA sunt cuvintele "Eu vreau." Și ori de câte ori vede ceva care are "Vreau" în ea, se formulează un răspuns. Și că răspunsul este un șir fix. În acest caz, este "de ce vrei?" Și am pus un pic stea la la sfârșitul pentru că e doar începutul răspunsului nostru. Și steaua indică faptul că vom lua restul de utterance-- utilizatorului "pentru a impresiona seful meu" - și vom adăuga că pe la sfârșitul acestui șir. Deci, acum, mai degrabă decât a spune, "de ce vrei sa impresionezi seful meu, " există un pic de suplimentare prelucrare care vom face. Asta este, va trebui să converti unele pronumelor aici de la "seful meu" la "seful tau." Și ar putea fi o altă câteva Schimbări de care avem nevoie pentru a face. Deci, mai degrabă decât doar o lipit direct pe final, ceea ce vom face este vom lua restul de utterance-- utilizator în here-- alb și vom lua o bucată de la un timp și de a converti fiecare șir semn, fiecare cuvânt, în teză. Deci, vom lua cuvântul "a". Nu e nici o conversie că trebuie să facem asta. "Impresiona." Nu e nici o conversie trebuie să facem acolo. "My" va converti la "dumneavoastră". Si "seful" vom lăsa la fel de "sef". Și în final, orice care se termină cu o perioadă, vom transforma într-o întrebare. Acest model foarte simplu de potrivire este, de fapt destul de succes. Și când acest lucru a fost introdus în 1966-- Joseph Weizenbaum programat aceasta pe un computer. Acum, computere la acel moment nu au fost modele desktop. Ei au fost împărtășite de resurse. Și studenții săi ar fi du-te și chat cu ELIZA. În cele din urmă, el a trebuit să restricționa accesul la o deoarece elevii sai nu au fost obtinerea orice lucrare de făcut. Ei au fost doar pe chat cu ELIZA. Și, de fapt, a trebuit să foc asistentul său, care a a petrecut tot timpul vorbind cu ei ELIZA despre problemele ei profunde și îngrijorătoare. Toată lumea care a folosit aceste sisteme a început să-i anthropomorphize. Au început să se gândească la ele ca fiind animate și oameni reali. Au început să recunoască o parte din lucrurile pe care le spuneau veneau inapoi la ei. Și au fost aflarea lucruri despre ei înșiși. Și, de fapt, chiar și experții, chiar psihoterapeuți, a început să vă faceți griji că, de fapt, poate ELIZA ar fi înlocuirea acestora. Și chiar computerul oamenii de stiinta îngrijorat de faptul că am fost atât de aproape de rezolvarea limbaj natural. Acum, că nu a fost nicăieri aproape de realitate. Dar asta e cum impresionant aceste sisteme pot părea. Așa că haideți să începe să se uite dedesubt și să încerce pentru a obține un pic de o întrebare unde acest cod se întâmplă de fapt. Deci, vom face acest cod disponibil după aceea. Și aceasta este o foarte Portul simplu și direct a punerii în aplicare inițiale ELIZA. Deci, unele dintre acestea stilistic lucruri pe care le veți vedea aici nu sunt stilistic ce ne-ar dori să faci sau ceea ce am fost de predare să faci. Dar am încercat să-i țină la fel peste multe porturi că acest lucru a avut astfel încât să are aroma a originalului. Așa că am de gând să includă o gramada de lucruri, si apoi vom avea o set de cuvinte cheie, lucruri care ELIZA va recunoaște și să răspundă la direct. Deci, dacă aveți cuvinte ca "poți" sau "Nu" sau "nu" sau "da" sau "de vis" sau "salut", apoi ELIZA va răspunde selectiv la cele. Vom avea, de asemenea, o anumit număr de lucruri că vom schimba, cum ar fi convertirea "mea" la "dumneavoastră". Și apoi vom avea un set de răspunsuri că pentru fiecare dintre aceste cuvinte cheie, vom roti prin aceste raspunsuri diferite. Deci, dacă eu spun "da" de trei ori la rând, am ar putea primi trei diferite răspunsuri de la ELIZA. Codul nostru, atunci, este de fapt remarcabil de simplu. Dacă am derulați în jos trecut toate acestea răspunsuri pe care le-am programate în si ne trecem la principala noastră, vom inițializa o pereche de diferite variabile și de a face un pic de menaj la început. Dar există o serie absolut de cod pe care le puteți înțelege. O buclă în timp ce mare care spune că sunt O să repet acest peste si peste. Voi citi într-o linie și voi stoca că într-un șir de intrare. Voi verifica și a vedea dacă acesta este cuvinte cheie special "la revedere", care înseamnă a ieși din program. Și apoi voi verifica și a vedea dacă cineva este doar repete din nou si din nou. Și voi striga la ei, dacă o fac. Voi spune "nu te repeta." Atâta timp cât nici unul dintre cei întâmpla, vom apoi scanați prin bucla și prin, pe liniile 308 la 313 aici, și a verifica și a se vedea sunt oricare dintre cei cuvânt cheie Expresii conținute în intrare că am fost doar dat? Dacă există un meci pentru ei, bine apoi, voi amintiți-vă că locația. Îmi voi aminti acel cuvânt cheie. Și voi fi capabil de a construi un răspuns. Dacă nu găsesc o, Ei bine, atunci, ultimul lucru din matrice mea de cuvinte cheie va fi răspunsurile mele implicite, atunci când nimic altceva meciuri. Voi pune întrebări de genul "De ce ai făcut venit aici? "sau" Cu ce ​​vă pot ajuta? " că sunt doar parțial adecvate indiferent de ceea ce de intrare este. Vom construi apoi în sus răspunsul lui Eliza. Vom fi în măsură să ia că răspunsul de bază, la fel cum am făcut în "șeful meu" exemplu. Dacă asta e tot ce există este-- daca e doar un singur șir care eu ar trebui să respond-- Am putea trimite înapoi. Dacă are un asterisc la la sfârșitul anului acesta, atunci voi procesa fiecare jeton individual restul răspunsului utilizatorului și se adaugă cele din, schimbarea din cuvânt cu cuvânt ca am nevoie pentru a. Toate acest lucru este absolut ceva care te-ar putea construi. Și, de fapt, modul în care ne-am au argumente în linia de comandă prelucrate, modul în care trebuie procesate prin cereri HTTP urmați aceleași tipuri de reguli. Sunt model de potrivire. Deci, ELIZA avut un relativ importantă impactul asupra limbaj natural pentru că a făcut să pară că a fost un Scopul foarte realizabil, cum ar fi într-un fel ne-ar fie în măsură să rezolve această problemă în mod direct. Acum, asta nu înseamnă că nu ELIZA tot ceea ce ne-am dori să facem. Cu siguranta nu. Dar noi ar trebui să poată de a face ceva mai mult. Primul nostru pas pentru a merge dincolo de ELIZA se întâmplă pentru a putea să se uite la nu textele fiind introdus în tastatură, dar discursul, real Discursul înregistrat într-un microfon. Deci, ca ne uităm la aceste piese diferite, suntem Va trebui să construiască un set de modele. Vom avea să fie în măsură pentru a merge la acustica de nivel scăzut smoală information--, amplitudine, frequency-- și de a converti că în unele unități care suntem capabil de a manipula mai ușor și, în cele din urmă, le manipula în cuvinte și propoziții. Deci, cel mai de recunoaștere a vorbirii sisteme care sunt acolo azi urmeze o statistică Modelul în care ne construim trei reprezentări separate de ceea ce care semnal audio conține de fapt. Vom începe cu un model de fonetică care vorbește despre doar baza Sună că eu sunt producătoare. Sunt producătoare de ceva care este B ca în băiat sau D ca în câine? Cum recunosc cei doi diferite Telefoane fi separată și distinctă? Pe deasupra, vom construi apoi o pronunție cuvânt model ceva care leagă împreună aceste telefoane individuale și le combină într-un cuvânt. Și după aceea, vom lua cuvintele si le vom asambla cu un limbaj modela într-o propoziție completă. Acum, vom vorbi despre fiecare dintre acestea în mod independent și separat. Dar aceste trei modele sunt toate doar de gând să fie statistici. Și asta înseamnă că atunci când ne lucra cu ei, vom fie capabil să lucreze cu le pe toate în același timp. In regula. Să începem cu modelul nostru fonetic. Deci, modele fonetice se bazează pe o tehnică de calcul numit modele ascunse Markov. Acestea sunt modele grafice în care am au și să recunoască un stat al lumii ca fiind caracterizat de un set de caracteristici. Și această stare descrie o parte o acțiune pe care am angajat în. Deci, dacă mă gândesc la a face sunetul "Ma" ca mama, există diferite componente pentru acel sunet. Există o parte în cazul în care am trage în respirație. Și apoi am pungă buzele mele. Și mă rostogolesc buzele un pic înapoi bit pentru a face acel sunet "ma". Și apoi există o eliberare. Buzele mele vin în afară. Aerul este expulzat. "Ma." Aceste trei părți diferite ar fi reprezentată de către statele în acest graph-- debutul, la mijloc, și sfârșitul. Și mi-ar fi tranziții care mi-a permis să călătorească dintr-un stat la alta cu o anumită probabilitate. Astfel, de exemplu, că M sunet ar putea avea o foarte, foarte scurt de admisie la beginning-- "mm" - și apoi o lungă, faza vibratoare unde am exploatație meu buzele împreună și aproape humming-- "mmmm" - și apoi o foarte scurtă ocluziv unde am expulza breath-- "ma". Modelul Markov ascuns este conceput pentru a capta faptului că modul în care am face acel sunet "ma" se va să fie ușor diferită în calendarul său, este frecventa, și caracteristicile sale decât modul în care-l face sau modul în care am putea face când vorbesc despre diferite intrebuintari ale scrisorii. "Mama" si "poate eu" va sunet ușor diferit. Deci, pentru a recunoaște un sunet special, ne-ar construi modele Markov, acestea ascunse Markov modele, de fiecare telefon posibile pe care am ar putea dori să recunoască, fiecare sunet posibil, și apoi uita-te la date acustice că am și de a determina statistic care unul este cel mai probabil să fi produs acest sunet. BINE. Cu acest model, am apoi începe să se bazeze pe partea de sus a acesteia. Luăm un model pronunție. Acum, uneori pronunția Modelele sunt simple și ușor de pentru că există o singură mod se pronunță ceva. Alteori, ele sunt o pic mai complicat. Iată un ghid pronunție pentru acel lucru care este de culoare roșie un fruct pe care le face ketchup din. Oamenii nu cred că este un fruct. Dreapta? Acum, există mai multe moduri diferite că oamenii vor pronunța acest cuvânt. Unii vor spune "toe-mai-toe." Unii vor spune "toe-mah-toe." Și putem surprinde că, odată cu unul dintre aceste modele grafice în cazul în care, din nou, ne-am reprezenta tranziții ca având o anumită probabilitate și probabilitate asociată cu ei. Deci, în acest caz, dacă ar fi să urmeze traseul de sus, prin toată această grafic, Mi-ar fi incepand de la litera pe departe stânga, "TA" sunetul. Mi-ar lua jumătate de sus, de "oh", și apoi un "ma", și apoi o "o", și apoi o "TA", și un "oh". "Toe-May-toe." Dacă am luat calea de jos prin acest lucru, voi primi "ta-mah-toe." Și dacă m-am dus în jos și apoi up, mi-ar lua "ta-May-toe." Aceste modele de captare acestea diferențe, deoarece ori de câte ori am implementa una dintre acestea sisteme de recunoaștere, că va trebui să lucreze cu o mulțime de diferite tipuri de oameni, o mulțime de diferite accente, și chiar diferite utilizări ale aceleași cuvinte. În cele din urmă, pe deasupra, vom construi ceva care pare foarte complicat, numit modelul de limbă, dar, de fapt este cea mai simplă de trei deoarece acestea funcționează pe ceea ce se numesc modele n-gram. Și în acest caz, te arată o două părți n-gram de model, un bigram. Vom face fizic ideea că, uneori, anumite cuvinte sunt mai multe sanse de a urma un dat cuvântul decât altele. Dacă am spus "prognoza" cuvântul următor ar putea fi probabil "astăzi" sau ar putea fi "vremea prognoza mâine. " Dar e puțin probabil să fi " Vremea anghinare. " Ce model de limbă nu este surprinde pe cei statistic prin numărarea, de la unele foarte mari corpus, toate instanțele în care un cuvânt urmează altul. Deci, dacă am lua o corpus-- mare ca orice Wall Street Journal care a fost produs din 1930, care este unul din corpuses-- standardului și mă uit prin toate acest text, și contez up câte ori după "Prognoza" nu am vedea "astăzi" și de câte ori îmi văd "Prognoza", urmat de "anghinare" prima se întâmplă să fie mult mai probabil. Va să apară mult mai frecvent. Și așa va avea o mai mare probabilitate asociate cu aceasta. Dacă vreau să dau seama de probabilitatea unui întreg exprimare, apoi, tocmai am despart. Deci probabilitatea de auz propoziția "șobolanul mâncat brânză" este probabilitatea cuvântului "The" începând cu o propoziție, și apoi probabilitatea ca Cuvântul "șobolan" urmează cuvântul "The" și probabilitatea ca Cuvântul "mâncat" urmează "șobolan", iar probabilitatea ca "brânză" urmează "mâncat". Aceasta pare a fi o mulțime de statistici, o mulțime de probabilități. Și asta e tot ce este. Dar lucrul uimitor este dacă faci acest lucru cu un eșantion suficient de mare de date, functioneaza. Și funcționează extrem de bine. Știm cu toții aceste tehnologii. Cele mai multe sisteme de operare sunt dotate cu recunoaștere a vocii în acest moment. Noi folosim Siri și Cortana și Echo. Și aceste lucruri se bazează pe acest tip de trei straturi model-- un model de fonetică la partea de jos, A pronunțat model din mijloc, și un model de limbă pe partea de sus a ei. Acum, ei trebuie să facă un pic mai mult decât că, pentru a răspunde la întrebări. Dar recunoașterea a ceea ce ești spunând depinde exact pe asta. Așa că haideți să luăm un exemplu aici. Așa că am telefonul meu ședinței aici sub camera pentru documente. Și am de gând să solicită Siri câteva întrebări. In regula? Deci, haideți să se trezească telefonul meu aici. Siri, ceea ce este vremea ca în New Haven azi? Siri: Iată vremea pentru New Haven, Connecticut astăzi. BRIAN SCASSELLATI: OK. Deci în primul rând ai văzut că Siri a recunoscut fiecare dintre cuvintele individuale și apoi a produs un răspuns. Vom vorbi despre cum sa răspuns vine vorba într-un pic. Dar acum, că știm că aceasta este doar pe bază de pe statisticile prime și acest model tip de potrivire de abordare, putem juca unele jocuri cu Siri. Deci, eu pot încerca din nou. Siri, ceea ce este vremea hipopotam New Haven, azi? Siri: OK. Aici e vremea pentru noi Haven, Connecticut pentru ziua de azi. BRIAN SCASSELLATI: Siri nu descurajat de faptul că deoarece este găsit pattern-- "Vremea", "astăzi", "New Haven." Asta e ceea ce răspunde la, la fel ca ELIZA. In regula. Să-i dau una mai mult, chiar mai exemplu ridicol. Siri, anghinare vreme armadillo hipopotam New Haven? Siri: Permiteți-mi să verific asta. Iată ce am găsit pe web pentru care sunt anghinare Armadillo hipopotam New Haven. BRIAN SCASSELLATI: OK. Deci, dacă am merge suficient de departe departe de acest model, Sunt în stare să-l confunde, deoarece nu mai potrivește cu modelul pe care îl are. Și că statistica motor care spune, ceea ce este probabilitatea ca ai hipopotam cuvinte și anghinare împreună, și Armadillo? Asta trebuie să fie ceva nou. Deci, aceste tehnologii folosim în fiecare zi. Dacă vrem să-i ia un pas în plus, deși, dacă am de fapt doresc să fie în măsură să vorbească despre ceea ce este faptul că aceste sisteme sunt raspunde la, trebuie să vorbim, din nou, despre o set mai fundamental de întrebări. Și asta e un subiect în comunicare pe care o numim întrebare răspuns. Asta este, ne dorim să fie în măsură sa-- da? Audiența: [neauzit]. BRIAN SCASSELLATI: Nu ne în procesarea semantică latent? Deci da. Există o mulțime de lucruri care sunt întâmplă sub suprafața cu Siri și în unele dintre exemplele Am de gând să-ți arăt următor în cazul în care există destul de un pic în ceea ce privește structura de ce spui că e important. Și, de fapt, că este o mare precursor pentru urmatorul diapozitiv pentru mine. Deci în același fel în care ne de recunoaștere a vorbirii a fost construit din mai multe straturi, dacă vrem să să înțeleagă ceea ce este ca de fapt fiind spuse, vom din nou la se bazează pe o analiză multi-strat textului care fiind recunoscut. Deci, atunci când Siri este, de fapt în măsură să să zicem, uite am găsit aceste cuvinte. Acum ce fac cu ele? Prima componentă este de multe ori a du-te prin și să încerce să analizeze structura propoziției. Și în ceea ce am văzut în școala primară, de multe ori, ca un fel de diagrame Exemple, vom să recunoască faptul că anumite Cuvintele au anumite roluri. Acestea sunt substantive. Acestea sunt pronume. Acestea sunt verbe. Și am de gând să recunoască că pentru o anumită gramatică, în acest caz gramatica limbii engleze, există modalități valide în care le-am putea combina și alte modalități care nu sunt valide. Că recunoașterea, că structura, ar putea fi de ajuns pentru a ne ajuta să ghideze putin. Dar nu este de ajuns pentru noi să fie capabil să ofere nici un sens la ceea ce se spune aici. Pentru a face acest lucru, va trebui să se bazeze pe o anumită cantitate de prelucrare semantică. Asta este, vom trebui să se uite la sub ceea ce fiecare dintre aceste cuvinte exercită în mod efectiv ca un sens. Și în cel mai simplu mod de a face acest lucru, vom asocia cu fiecare cuvânt ca stim o anumită funcție, o anumită transformare că permite să se întâmple. În acest caz, am putea eticheta Cuvântul "John", ca fiind un nume propriu, că poartă cu ea o identitate. Și am putea eticheta "Maria", ca în același mod. Întrucât un verb ca "iubește, că" constituie un anumit relație că suntem în stare să reprezinte. Acum, asta nu înseamnă că ne înțelegem ce este dragostea, ci doar că ne înțelegem l în calea unui sistem simbolic. Asta este, putem eticheta ea și-l manipuleze. Cu fiecare dintre aceste tipuri de abordări, orice tip de prelucrare semantic aici este de gând să nevoie de un pic de pic de cunoștințe și o mulțime de muncă din partea noastră. Nu mai suntem în domeniul în cazul în care statisticile pur și simplu vor fi de ajuns pentru noi. Acum, în scopul de a merge din acest punct de a fi posibilitatea de a vorbi despre interiorul ceea ce se întâmplă de fapt aici, pentru a fi capabil de a manipula acest structura și să înțeleagă o întrebare și apoi de a putea să iasă și de căutare, care necesită o mai Modelul cognitiv complex. Modul în care sunt construite aceste sisteme este cea mai mare parte foarte, foarte forței de muncă intens. Acestea implică oameni petrecut o mare de timp structurarea modalitățile în care aceste tipuri de propoziții pot fi reprezentate într-o anumită logică. Ea devine chiar un pic mai complexă, totuși. Chiar și după ce ne-am ocupat cu semantica, vom încă mai trebuie să se uite la pragmatica a ceea ce se spune. Asta este, cum am se referă cuvintele că am ceva fizic acolo, în lume sau la puțin unele sursă de informare pe care le pot manipula? Uneori, acestea conduc la biți minunate ale ambiguitate. "Red-hot stele să se căsătorească astronom." BINE. Acum, am citit că, în tip amuzant de titlu care ne-ar vedea la televizor noaptea târziu pentru că noi nu interpretăm "stea" să aibă sensul său corp ceresc. Știm că aceasta înseamnă mai mult actor obișnuit sau actrita cu cantități mari de vizibilitate. "Squad ajuta muscatura de caine victimă." Este că echipa este de fapt acolo asistarea un câine în întâmplă în jurul și mușcă victimele? Sau este că nu a existat o persoană care a fost muscat de un caine care avea nevoie de ajutor? Doar de la uita la sintaxa și semantica propozițiilor, nu putem determina acest lucru. "Elicopter alimentat de muște umane." Există, de fapt, real lucruri mici care zboară în jurul sunt oameni cu aripi alimentarea elicoptere pentru binele omenirii? Sau există un dispozitiv mecanic care derivă puterea de la o persoană? Când ne uităm la întrebare Sisteme de răspuns, acestea sunt straturile care avem nevoie pentru a face față. Acum, cele mai bune și cele mai fel de răspândită a acestor sisteme astăzi sunt capabili să facă lucrurile la un nivel care sunt mult dincolo de ceea ce am avut în urmă cu 10 de ani. Iată una dintre cele mai bune sisteme că e acolo azi. Și aceasta este un sistem de de la IBM Watson numit. Acest lucru este de la prietenii noștri de la IBM. Acest lucru este băncile Katherine, Jia Chen, și Priscilla Moraes ne da o demonstrație de Watson ieri, în IBM Yorktown. [VIDEO PLAYBACK] -Ce mai faci? -Sunt bine. Sunt întotdeauna fericit atunci când sunt gândire, mai ales atunci când am pot sta rece în aceste camere de servere. Cine este actrita ta preferata? Actrita -My favorit Angelina Jolie ca Lara Croft în Tomb Raider, deoarece originalul ei Formularul a fost ca un personaj virtual ca mine. -Cum Poate Watson ajuta pacientii? -este Planul pentru pacientii la au acces la Watson direct? Accesul la consultativ Watson cererile vor varia în funcție de utilizarea caz. Dar în prezent, Watson va oferi doar posibil diagnostic si tratament opțiuni profesionale medicale. Dacă este cazul, pacientii poate furniza informații la Watson, poate printr-o interfata web portal, tabletă, sau chiar un telefon mobil. De exemplu, un pacient poate fi a cerut să descrie simptomele lor în limbaj natural direct într-o soluție Watson, care sa permita medicului sa se concentreze asupra diagnostic și nu de colectare a datelor. -Cine Asasinat Abraham Lincoln? Ioan Wilkes Booth. -În Ceea ce an a făcut Arizona Diamondbacks câștiga World Series? -2001. [END PLAYBACK] BRIAN SCASSELLATI: Deci aceste tipuri de sisteme trebuie să se bazeze în primul rând pe recunoscând discursul; doilea, convertind-o într-un interne semnificative reprezentare; și apoi, a treia, posibilitatea de a ieși și de a găsi sursa de informații care le permite să răspundă la această întrebare. Acest nivel de complexitate implică aceleași tipuri de lucruri programatice care le-au fost face în seturi de probleme. Suntem capabili să elimine cereri HTTP în același tip de model de nivel scăzut potrivire care ELIZA poate face. Suntem capabili de a converti pe cei într-o reprezentare internă, și apoi să le utilizeze pentru a interoga unele bază de date externă, eventual folosind SQL. Toate sistemele care sunt construite astăzi pentru a face acest tip de naturale comunicare limba sunt construite pe aceste aceleași principii. Acum, chiar și un sistem ca Watson nu este suficient de complex pentru a putea să răspundă arbitrară întrebări despre orice subiect. Și, de fapt, acestea trebuie să fie structurat într-un domeniu dat. Astfel încât să puteți merge online și puteți găsi versiuni ale Watson, care operează bine în informatică medicală. Sau nu e online, care tocmai se ocupă cu modul în care de a face recomandări bune despre ce bere se va merge cu care alimente. Și în aceste domenii, se poate răspunde la întrebări, găsi informațiile de care are nevoie. Dar nu se poate amesteca și le potrivi. Sistemul care a fost instruit cu baza de date de produse alimentare și bere nu funcționează bine atunci când dintr-o dată pune-l în cu informaticii medicale Bază de date. Deci, chiar cele mai bune noastre de astăzi sistemele se bazează pe un nivel de prelucrare în care suntem de codificare de mână și construirea în infrastructura pentru pentru a face acest sistem rula. Acum, ultimul subiect vreau pentru a putea ajunge la ziua de azi este despre comunicare nonverbala. O masă mare de informații care ne comunice unul cu celălalt nu vine despre prin cuvinte individuale, care ne solicită. Ea are de a face cu lucruri, cum ar fi proximitate, privirea, tonul vocii, inflexiune dumneavoastră. Și că, de asemenea, comunicarea este ceva care de multe interfete diferite îngrijire foarte multe despre. Nu e ceea ce ii pasa Siri despre. Pot cere Siri ceva într-o singură voce sau într-un ton diferit de voce, și Siri va da-mi același răspuns. Dar asta nu e ceea ce am construit pentru multe alte tipuri de interfețe. Vreau să vă prezint acum la unul dintre roboți. Acest lucru a fost construit de mult timp mi prieten și coleg Cynthia Breazeal și compania ei Jibo. Și aceasta robot-- vom de a avea un cuplu de voluntari veni pentru a interacționa cu acest lucru. Deci, pot avea două oameni dispuși să se joace cu robotul pentru mine? De ce nu vii pe sus, si de ce nu vii pe sus. Dacă ai alătura mă aici, te rog. Și dacă aș putea aveți vin chiar aici. Mulțumesc. Bună. ALFREDO: Mă bucur să te cunosc. Alfredo. BRIAN SCASSELLATI: Alfredo. RACHEL: Rachel. BRIAN SCASSELLATI: Rachel. Mă bucur să te cunosc ambele. Alfredo, am de gând să te duci mai întâi. Vino chiar aici. Am de gând să introducă Tu-- dacă pot obține acest off fără bate microphone-- la un mic robot de nume Jibo. OK? Acum, Jibo este proiectat pentru a fi interactiv. Și, deși poate da discurs, o mare parte din interacțiunea cu robotul este non-verbal. Alfredo, am de gând să vă rog să spune ceva frumos și gratuit la robot, vă rog. ALFREDO: Cred că arăți drăguț. [Zbârnâit SOUND] BRIAN SCASSELLATI: OK. Răspunsul său nu este verbal. Și totuși, ai dat atât o confirmare clară că a auzit ce ai spus și, de asemenea, înțeles într-un fel care. OK? Pas înapoi aici timp de o secundă. Multumesc. Rachel, dacă ar fi. Acum, am de gând să dea vă de locuri de muncă mult mai greu. Dacă doriți stai aici, copii de rezervă doar un pic, astfel ne puteți obține de pe camera foto si uita-te în acest fel. Am de gând să vă rog să spui ceva într-adevăr înseamnă și urât la robot. RACHEL: Ce-ai părea de a face a fost complet absurdă. [Bâzâit] Asta a fost chiar mai absurd. Ce se intampla cu tine? Aw, nu se simt rău. O să-ți dau o îmbrățișare. BRIAN SCASSELLATI: Bine. Mulțumesc, Rachel. Alfredo, Rachel, baieti Multumesc foarte mult. [APLAUZE] Deci, acest tip de interacțiune are în multe moduri Unele dintre aceleași reguli iar unele dintre aceleași structură ce am ar putea avea în interacțiune lingvistică. Este atât de comunicare și servește un scop important. Și că interacțiunea, în multe feluri, este proiectat pentru a avea un efect special pe persoană care interacționează cu sau de a asculta la robot. Acum, eu sunt destul de norocos să aibă Jibo astăzi aici. Sam Spaulding este aici ajuta ne cu robotul. Și am de gând să întreb Sam pentru a da ne unul demo frumos de Jibo dans pe care le pot viziona la sfârșitul aici. Deci, mergeți mai departe, Jibo. SAM: OK, Jibo. Arată-ne mișcările tale de dans. [MUSIC JOC] BRIAN SCASSELLATI: Bine, toată lumea. Vă mulțumim pentru prietenii noștri de la Jibo. [APLAUZE] Și datorită prietenilor noștri de la IBM pentru a ajuta azi. Comunicarea este ceva care ai de gând pentru a vedea venind mai mult ca vom construi interfete mai complexe. Săptămâna viitoare, vom vorbi despre cum să interfață cu adversarii de calculator în jocuri. Dar, dacă aveți întrebări cu privire la acest lucru, Voi fi în jurul valorii de la ore de birou în seara asta. Sunt fericit să vorbesc cu tine despre AI subiecte sau pentru a intra în mai multe detalii. Au un weekend mare. [APLAUZE] [MUSIC JOC]