[Glazbom] 

DAVID Malan: Ovo je CS50. To je kraj tjedna 10. A djeÄak, mi imamo dobra klasa za vas danas. Mi smo tako uzbuÄeni pozvati dvojicu naÅ¡i prijatelji iz Yalea do nas danas i gledati na raskriÅ¾ju umjetne inteligencije, robotike, obrada prirodnoga jezika, i joÅ¡ mnogo toga. 

I doista, nad posljednjih nekoliko tjedana, mi smo sigurno proveo puno vremena, osobito u ranijim psets, s naglaskom na lijepe detalje niske razine. I to je vrlo lako izgubiti iz vida Å¡ume za stabla i zadrÅ¾ati se na petlje i uvjetima i naputke, svakako, i sliÄno. No, stvarnost je vi sada imate Sastojci s kojima moÅ¾ete stvarno rijeÅ¡iti neke zanimljive probleme, meÄu ih ti da su naÅ¡i prijatelji u Yaleu rad na samo sramiti od Cambridgea. 

Dakle, dopustite mi da najprije predstaviti naÅ¡u glavu asistent s Yalea, Andy. 

[PLJESAK] 

ANDY: Prije svega, samo zahvaliti Å¡to je dopustila par Yalies pop na dolje na Cambridgeu danas. Stvarno smo ga cijeniti. Drugo, naÅ¡im prijateljima natrag home-- Jason, hvala za boravak i trÄanje predavanje. Nadam se da je sve dobro u New Havenu. 

Tako da, ja sam super uzbuÄen uvesti Scaz danas. Scaz pokreÄe robotike laboratorij. On je profesor, kao Å¡to su, pet razliÄiti odjeli na Yaleu. U svom laboratoriju, on ima mnogo, mnogo roboti koji voli igrati. On je, kao Å¡to je zgodnih posao na svijetu. A on dobiva vrsta nered oko s tim cijeli dan dugo i napraviti neki posao, kao dobro. 

I tako smo zapravo donio jedan Od ih s nama danas. Dakle, bez dodatnih teÅ¡koÄa, Scaz je iÄi naprijed i uvesti nas njegove robota prijatelj. 

[PLJESAK] BRIAN SCASSELLATI: Hvala, David. Hvala, Andy. To je tako divno da se ovdje sa svima danas. Å½elim prvo biti vrlo jasno da CS50 osoblje ovdje u Cambridgeu je nevjerojatno gostoljubivi prema nama. Mi smo tako zahvalan za sve Å¡to ste uÄinili za nas podrÅ¾ati. I tako bismo Å¾eljeli biti u moguÄnosti vratiti dobrotu. 

Tako je danas, dobili smo objaviti da Äemo imati novu, jedan-of-a-vrste CS50 dogaÄaja dogaÄa se u New Havenu sljedeÄi tjedan. A to je CS50 IstraÅ¾ivanje Expo. Tako Äemo se pozivaju everyone-- CS50 studentima, Osoblje iz oba Harvard i Yale-- se doÄi i posjetiti nas u petak. Mi Äemo imati razne od preko 30 razliÄitih ljudi predstavljanje i exhibiting-- upperclassmen prikazuje off neke od svojih istraÅ¾ivaÄkih proizvoda. Mi Äemo imati neke startupima, Äak, u potrazi za malo nove tehnologije talenta, startupima iz oba Harvarda i Yalea. I mi Äemo imati neke studentske grupe u potrazi za nekim novim Älanstvom. 

To Äe biti vrlo uzbudljivo vrijeme. Nadam se one od vas koji su silazi na Harvardu Yale igre Äe biti u moguÄnosti da se zaustavi po malo rano, u samom srediÅ¡tu kampusa, Spomen knjiÅ¾nica Sterling. Äemo imati niz eksponati koji se kreÄu od autonomna jedrilice na naÄine pomoÄu softvera saÄuvati srednjovjekovne rukopise. 

Mi Äemo morati oglas hoc mreÅ¾a i ljudi nastave softver kodiranje u Cape Town. Morat Äemo raÄunalo glazba demonstracije. A mi Äemo, naravno, imati viÅ¡e robota. Tako smo se nadaÅ¡ Äu pridruÅ¾ite nam se za ovaj dogaÄaj. To bi trebao biti puno zabavno, malo hrane, i puno zanimljivije stvari za razgovor o tome. 

Tako je danas, idemo razgovarati O obrada prirodnoga jezika. A to je pokuÅ¡aj za nas izgraditi novi naÄin suÄelja s naÅ¡im ureÄaja, jer u posljednjih nekoliko tjedana, ste usredotoÄeni na to kako je to moÅ¾ete pisati kod, pisanje softvera to je naÄin da bude u moguÄnosti reÄi do stroj, to je ono Å¡to Å¾elim uÄiniti. 

No, ne treba da OÄekujemo da se sve to je vani da se koristi svi u svijetu Äe biti struÄnjak u ovoj vrsti nastave. Tako razlikujemo raÄunala jezika i prirodnih languages-- to je, stvari koje ljudi koriste komunicirati s drugim ljudima. A mi pokuÅ¡ati izgraditi suÄelja koje koriste ove prirodne mehanizme komunikacije. 

Sada, baÅ¡ kao i svaki drugi topic da smo zapoÄeli s u CS50, Äemo zapoÄeti s najjednostavnijim Malo obrada prirodnoga jezika koje moÅ¾emo zamisliti. Idemo poÄeti s Povijesni dio prirodnog jezika. A onda Äemo izgraditi do sve viÅ¡e i viÅ¡e nedavnih sustavi i imaju neke zabave demo na putu. 

Tako Äemo poÄeti s onim Å¡to je vjerojatno prvi prirodnog jezika Sustav za obradu. To je programski sustav napisan u 1966. Joseph Weizenbaum zove Eliza. I ELIZA je dizajniran za ponoviti vrste interakcije ti bi s Rogerianskog psihoterapeut. Sada, Rogerians, imali su ideja koja psihoterapija sudjeluje se moÄi zrcaliti nazad na pacijentu i razgovarati s njima, u osnovi, za samo ih je davanje maleni malo terapeuta. To je sve da terapeut rekao je trebao biti samo odraz ono Å¡to pacijent govori im. 

Tako Äemo pokuÅ¡ati demo to. Da imamo dobrovoljca koji bi bio spremni podijeliti svoje najdublje, NajmraÄniji i / ili laÅ¾ni tajne s Eliza? Naravno, zaÅ¡to ne doÄeÅ¡ gore. FantastiÄan. A tvoje ime? 

MILES: Miles. 

BRIAN SCASSELLATI: Miles. Drago mi je, Miles. Ako bi zadrÅ¾ati na tome. I idemo koristite inaÄicu Eliza da smo replicirati u CS50 IDE. A mi Äemo gledati na izvoru kod za to malo vremena. No, za sada, mi smo samo Äe ga pozivati ââna gumb Elizu. 

I ELIZA Äe vam dati odgovore koji Äe biti u svim glavnim gradovima. I neÄe vam postaviti nekoliko pitanja. A mi Äemo odgovoriti i tip u odgovorima na Eliza. Dakle ELIZA je rekao: "Bok, ja sam Eliza. Koji je tvoj problem?" Å to biste Å¾eljeli reci Eliza o danas? 

MILES: Ja samo mogu zaspati ako imam zeko papuÄe na. 

BRIAN SCASSELLATI: U redu. U redu. 

[SMIJEH] 

"Mogu samo zaspati s bunny papuÄe na. " I ELIZA kaÅ¾e: "Reci, zar ne imate bilo kakvih psihiÄkih problema? MoÅ¾da je to dobar pokazatelj. " 

U REDU. Dakle, Å¡to biste Å¾eljeli odgovoriti? 

MILES: Da. 

BRIAN SCASSELLATI: Da. Äovjek od mnogih rijeÄi. UÅ¾ivam da. Eliza kaÅ¾e: "Äini se priliÄno pozitivno." 

MILES: Ne, ja sam, u stvari, elektron. 

BRIAN SCASSELLATI: "Ne U stvari, ja sam elektron. " "Jeste li doÅ¡li k meni jer ste elektron? " Sada, moÅ¾emo vidjeti neke od things-- idem da vas pauzu za samo sekundu, Miles. Nemojte iÄi nigdje. Nismo uÄinili s vama joÅ¡. ELIZA je, na neki naÄin, reagira na odreÄene stvari da je on rekao, ali bez bilo pravo razumijevanje. I to je takoÄer parroting natrag neke od dijelova kazne. 

Tako smo, rekao je: "Ne U stvari, ja sam elektron. " Eliza je odgovorio natrag, "Jeste li doÅ¡li za mene, jer ti si jedan elektron? " U redu. Dajmo mu joÅ¡ jedan odgovor ovdje. Daju dobar jedan, Miles. 

MILES: Dobro on? 

Da, molim te pomozi mi. BRIAN SCASSELLATI: "Da. Molim te pomozi mi. "" Jeste li sigurni? " MILES: Ne BRIAN SCASSELLATI: Ne "Å to to sugeriraju za vas?" 

MILES: Ja ne mogu biti elektron. 

BRIAN SCASSELLATI: "Ja ne moÅ¾e biti elektron. " "Å½elite li reÄi ne samo da se negativni?" 

U redu. Dakle Miles, hvala vam toliko. 

MILES: Hvala vam. 

BRIAN SCASSELLATI: Hvala puno. [PLJESAK] 

Dakle, ovo ELIZA programa, na mnogo naÄina, reagira samo na komadiÄe da smo pruÅ¾iti bez dubine razumijevanje onoga Å¡to se dogaÄa ovdje. To je vrsta sustava naziva uzorak podudaranja, gdje mi smo u potrazi za odreÄeni komadiÄi teksta koji smo tada uzeti od onoga Å¡to dao kao ulaz, pretvoriti ga, potencijalno, na neki naÄin, a zatim ga vratiti korisniku. 

Da li itko od vas misle da ELIZA je zapravo obavljanje valjanu psihoanalizu ovdje? Jedna osoba, moÅ¾da. 

PUBLIKA: [neÄujan]. BRIAN SCASSELLATI: A kako to Äine se osjeÄate? Da, u stvari, to radi. I mi Äemo vidjeti, u stvari, izvorni kod za to u samo trenutak. I tako ti ÄeÅ¡ biti u moguÄnosti to uÄiniti upravo to. 

Sada, ELIZA je jedan oblik onoga Å¡to bismo danas chat bot nazvati. To samo ide kroz tekst koji ste pruÅ¾a, osigurava minimum koliÄinu razumijevanja ili obrade, a zatim ga papige natrag na vas. Tako Äemo pogledati, konceptualno, i razgovarati o tome Å¡to to je da ELIZA zapravo radi. 

ELIZA je uzimanje sentence-- neka je kaÅ¾u: "Å½elim impresionirati moj Å¡ef." I ELIZA gleda kroz tu reÄenicu i pokuÅ¡ava pronaÄi i odgovaraju odreÄene obrasce. Tako je, na primjer, jedan od uzoraka da ELIZA traÅ¾i su rijeÄi "Å½elim." I bilo je to vrijeme vidi neÅ¡to da ima "Å½elim" u njoj, to formulira odgovor. I to je odgovor fiksna niz. U ovom sluÄaju, to je "zaÅ¡to Å¾elite?" I ja sam stavio malo zvijezdu na kraj, jer to je samo poÄetak naÅ¡eg odgovora. A zvijezda ukazuje na to da Äemo uzeti ostatak od korisnika utterance-- "impresionirati moj Å¡ef" - a mi Äemo dodati da je na kraju ovog niza. 

Tako sada, umjesto da govori: "ZaÅ¡to Å¾elite impresionirati moj Å¡ef ", postoji malo dodatnog Obrada da Äemo uÄiniti. To je, morat Äemo pretvoriti neke od zamjenica ovdje iz "moj Å¡ef" na "svoj gazda". I tu bi moglo biti nekoliko drugih promjene koje moramo napraviti. Dakle, umjesto da ga samo drÅ¾ati izravno na kraju, Å¡to Äemo uÄiniti je Äemo uzeti ostatak od korisnika utterance-- u bijeloj here-- a mi Äemo ga uzeti jedan komad na vrijeme i pretvoriti svaku string tokena, svaka rijeÄ, u reÄenici. 

Dakle, mi Äemo se rijeÄ "da". Nema pretvorbe da moramo uÄiniti. "Impresionirati." Nema pretvorbe moramo raditi tamo. "Moj" Äe se pretvoriti u "svoj". A "Å¡ef" samo Äemo ostaviti kao "gazda". I onda na kraju, niÅ¡ta koji zavrÅ¡ava period, Äemo pretvoriti ga u pitanje. 

Ovo je vrlo jednostavan uzorak podudaranja je zapravo vrlo uspjeÅ¡na. A kada je to uvedeno u 1966-- Joseph Weizenbaum programirati ovaj na raÄunalu. Sada, raÄunala u to vrijeme nisu bili desktop modele. Oni su zajedniÄkim resursima. A njegovi uÄenici bi otiÄi i razgovarati s Eliza. Naposljetku, morao je ograniÄiti pristup do njih jer su njegovi uÄenici nisu bili uzimajuÄi bilo koji posao ispunjavanja. Samo su razgovor s Eliza. A, u stvari, morao je vatru njegov pomoÄnik, koji je proveo sve svoje vrijeme u razgovoru s Eliza o njezinim dubokim i zabrinjavajuÄe probleme. 

Svatko tko koristi ove sustave poÄeo ih anthropomorphize. PoÄeli su razmiÅ¡ljati o njima kao se Å¾ivi i stvarni ljudi. PoÄeli su prepoznati neke od stvari koje su govorili su se vraÄaju na njih. I oni su bili saznate stvari o sebi. A, u stvari, Äak i struÄnjaci, Äak i psihoterapeuti, poÄeo brinuti da, zapravo, moÅ¾da ELIZA bi ih zamijeniti. A Äak i raÄunalo Znanstvenici zabrinuti da smo bili tako blizu rjeÅ¡avanja prirodnog jezika. 

Sada, to nije bilo ni blizu istina. No, to je kako impresivni ovi sustavi mogu Äiniti. Tako Äemo poÄeti traÅ¾iti ispod i pokuÅ¡ajte da se malo pitanje gdje ovaj kod zapravo dogaÄa. Tako Äemo uÄiniti ovaj kod dostupan nakon toga. A to je vrlo jednostavna i izravna luka izvorne provedbe Eliza. 

Tako su neki od njih stilska stvari koje Äete vidjeti ovdje nisu stilski Å¡to bismo Å¾eljeli da uÄinite ili Å¡to smo poduÄava vas uÄiniti. Ali mi smo pokuÅ¡ali ih zadrÅ¾ati isti u mnogim lukama da je to tako da se imalo ima okus originala. Tako Äemo ukljuÄiti hrpa stvari, a onda Äemo imati skup kljuÄnih rijeÄi, stvari koji Äe ELIZA prepoznati i odgovoriti na izravno. Dakle, ako imate rijeÄi poput "MoÅ¾ete li" ili "ne znam" ili "ne" ili "da" ili "san" ili "Hello", a zatim ELIZA Äe odgovoriti selektivno onima. TakoÄer Äemo imati odreÄeni broj stvari da Äemo zamijeniti, poput pretvoriti "moj" na "svoje". 

A onda Äemo imati niz odgovora da se za svaki od tih rijeÄi, Äemo rotirati kroz ti razliÄiti odgovori. Dakle, ako ja kaÅ¾em "da" tri puta za redom, sam moÅ¾e dobiti tri razliÄita odgovori Eliza. NaÅ¡ broj je, dakle, zapravo nevjerojatno jednostavna. Ako sam se pomaknite prema dolje pokraj sve te Odgovori koje smo programirani u i doÄemo do naÅ¡ glavni, idemo inicijalizirati nekoliko razliÄitih varijabli i to malo rutine u poÄetku. Ali onda postoji apsolutno set koda koji moÅ¾ete razumjeti. Jedna velika while petlja koja kaÅ¾e da sam Äe ponoviti iznova i iznova. Ja Äu Äitati u nizu, a ja Äu pohraniti da ulaznog niza. Provjerit Äu i vidjeti ako je to posebna kljuÄna rijeÄ "oprostiti", koja znaÄi izlazak iz programa. A onda Äu provjeriti i vidjeti je li netko samo sebe ponavlja viÅ¡e i viÅ¡e. A ja Äu vikati na njih, ako im je Äiniti. Ja Äu reÄi "ne ponavljati se." 

Dokle god nitko od onih koji se dogoditi, mi Äemo zatim skenirati kroz i loop, na linijama 308 do 313 ovdje, i provjeriti i vidjeti bilo koji od onih kljuÄnu izrazi sadrÅ¾ani u unosu da sam samo dobio? Ako je utakmica za njih, i onda Äu pamtiti tu lokaciju. Zapamtit Äu tu kljuÄnu rijeÄ. A ja Äu biti u moguÄnosti izgraditi odgovor. 

Ako ne pronaÄete jednu, i onda, zadnja stvar u mom kljuÄne rijeÄi niza Äe biti moj propust odgovora, kad niÅ¡ta drugo odgovara. Ja Äu postavljati pitanja poput: "ZaÅ¡to ste uÄinili doÅ¡ao ovamo? "ili" Kako vam mogu pomoÄi? " koji su samo djelomiÄno potrebi bez obzira Å¡to je ulaz. 

Zatim Äemo izgraditi Eliza odgovor. Mi Äemo biti u moguÄnosti uzeti da baza odgovora, baÅ¡ kao Å¡to smo uÄinili u to "moj Å¡ef" primjer. Ako je to sve Å¡to postoji is-- ako je samo jedan niz koji sam trebao respond-- Ja samo mogu poslati ga natrag van. Ako ima zvjezdicu na kraj njega, onda Äu obraditi svaku pojedinaÄnu oznaku u ostatak korisnika odgovor i dodati one u, zamjene iz RijeÄ po rijeÄ kako moram. 

Sve to je apsolutno neÅ¡to Å¡to bi moglo graditi. I doista, naÄini na koje smo Obradili argumente naredbenog retka, naÄin na koji ste obraÄeni kroz HTTP zahtjeve slijedite iste vrste pravila. Oni uzorak podudaranja. 

Dakle ELIZA imali relativno vaÅ¾an utjecaj na prirodnom jeziku jer se to Äini kao da je vrlo dostiÅ¾an cilj, kao Å¡to je na neki naÄin mi bismo biti u moguÄnosti rijeÅ¡iti ovaj problem izravno. Sada, to ne znaÄi da ne ELIZA sve Å¡to bismo Å¾eljeli uÄiniti. Sigurno ne. Ali mi bi trebali biti u moguÄnosti uÄiniti neÅ¡to viÅ¡e. 

NaÅ¡ prvi korak otiÄi izvan ELIZA ide kako biste mogli pogledati ne tekst koji se upisuje u tipkovnicu, ali govor, stvarna Govor zabiljeÅ¾eno u mikrofon. Dakle, kao Å¡to mi gledamo na to razliÄita komada, mi smo morati izgraditi niz modela. Mi Äemo biti u moguÄnosti iÄi od niske razine zvuÄne i information-- parcele, amplituda, frequency-- i pretvoriti to u neke jedinice koje smo mogli lakÅ¡e manipulirati viÅ¡e i, konaÄno, manipulirati njima u rijeÄi i reÄenica. 

Dakle, najveÄi prepoznavanje govora sustavi koji su tamo i danas slijedite statistiÄka model u kojem Äemo graditi tri odvojena prikazi Å¡to koji audio signal zapravo sadrÅ¾i. PoÄinjemo s fonetske modelu koji govori o samo bazi zvuÄi da sam proizvodi. Jesam li proizvoditi neÅ¡to Å¡to je B kao u djeÄaka ili D kao u psa? Kako prepoznati one dvije razliÄite telefoni su odvojeni i zasebni? 

Povrh toga, mi Äemo onda graditi izgovor modelu rijeÄ, neÅ¡to Å¡to povezuje one pojedinaÄne telefoni i kombinira ih u rijeÄi. A nakon toga, mi Äemo se rijeÄi a mi Äemo ih sastaviti sa jeziku modelirati u potpuni reÄenici. 

Sada Äemo govoriti o svakoj od njih samostalno i pojedinaÄno. Ali ta tri modela su sve samo Äe biti statistika. A to znaÄi kad smo raditi s njima, mi Äemo biti u moguÄnosti da rade s ih sve istovremeno. U redu. PoÄnimo s naÅ¡im fonetske model. Dakle fonetske modeli oslanjaju na raÄunalna tehnika zove skriveni Markovljevi modeli. To su grafiÄki modeli u kojima sam ima i prepoznati stanje svijeta kao Å¡to je naznaÄeno skupom znaÄajki. A to stanje opisuje jedan dio od djelovanja koje sam bavi. 

Dakle, ako ja mislim o tome zvuk "ma" kao majka, postoje razliÄiti komponente za taj zvuk. Tu je dio gdje sam nacrtati u dahu. A onda sam kese moje usne. A ja uvaljati moje usne natrag malo malo da bi taj "ma" zvuk. A onda tu je oslobaÄanje. Moje usne apart. Zrak je protjeran. "Ma." 

Te tri razliÄite dijelove bi zastupa drÅ¾ava u ovom graph-- poÄetak, sredina i kraj. I ja bi da prijelaze dopustio da putuju iz jedne drÅ¾ave na sljedeÄi s odreÄenom vjerojatnoÅ¡Äu. Tako je, na primjer, da je M zvuÄi moÅ¾da vrlo, vrlo kratko unos u beginning-- "mm" - a onda viÅ¡e, vibracijska faza u kojoj sam drÅ¾ao moje usne i gotovo humming-- "mmmm" - i tada vrlo kratko eksplozivni gdje sam izbaci breath-- "ma". 

Skrivena Markov model dizajniran za hvatanje Äinjenicu da naÄin na koji sam napraviti da je zvuk "ma" ide biti malo drugaÄiji u njegova vremena, je frekvencija, a njegove karakteristike od naÄin na koji ste to uÄiniti ili naÄin na koji sam moÅ¾da Äine ga kad govorim oko razliÄitih koristi pisma. "Majka" i "Mogu li" Äe zvuÄi malo drugaÄije. 

Dakle prepoznati Konkretno zvuk, mi bi graditi Markovljevi modeli, ovi skriveni Markovljev modeli, svakog moguÄeg telefon koji ja moÅ¾da Å¾ele prepoznati, svaki moguÄi zvuk, a zatim pogled na akustiÄki podaci da imam i odrediti statistiÄki koje je najvjerojatnije jedan da je proizveo taj zvuk. U REDU. S tim modelom, onda bismo poÄeti graditi na vrhu. Mi uzeti izgovor model. Sada, ponekad izgovor modeli su jednostavno i lako jer postoji samo jedan naÄin izgovoriti neÅ¡to. Drugi puta, oni su malo viÅ¡e komplicirano. Evo izgovor vodiÄ za tu crvenu stvar koja je voÄe da bi keÄap iz. Ljudi ne misle da je to plod. Pravo? 

Sada, postoji mnogo razliÄitih naÄina da Äe ljudi izgovoriti tu rijeÄ. Neki Äe reÄi: "usmjeravanje svibnja noÅ¾ni prst." Neki Äe reÄi: "usmjeravanje Mah-noÅ¾ni prst." I moÅ¾emo uhvatiti da s jedan od ovih grafiÄkih modela gdje je, opet, mi predstavljaju prijelaze da ima odreÄenu vjerojatnost i povezane vjerojatnosti s njima. 

Dakle, u ovom sluÄaju, ako su slijediti vrh put kroz cijeli ovaj graf, Ja bih se s poÄetkom u pismu na lijevoj strani je "ta" zvuk. Ja bi gornju polovicu, na "oh", a zatim "ma" a onda je "," a zatim "ta" i "Oh." "Toe-svibanj-noÅ¾ni prst." Ako sam uzeo donji put kroz to, ja Äu doÄi "Ta-Mah-noÅ¾ni prst." I ako sam dolje, a zatim gore, ja bih se "ta-May-noÅ¾ni prst." 

Ovi modeli hvatanje tih razlike, jer kad god smo implementirati jedan od tih Sustavi za prepoznavanje, to Äe morati raditi s puno razliÄitih vrsta ljudi, mnogo razliÄitih naglasaka, pa Äak i razliÄite namjene istih rijeÄi. KonaÄno, na vrhu toga, Äemo graditi neÅ¡to da izgleda jako komplicirano, zove jeziÄni model, ali u stvari je najjednostavniji od tri jer to rade na ono Å¡to se naziva n-gram modeli. I u ovom sluÄaju, ja sam ti se prikazuje dva dijela n-gram model, Bigram. Idemo napraviti fiziÄku ideju da ponekad, odreÄene rijeÄi su viÅ¡e vjerojatno da Äe slijediti dao rijeÄ od drugih. Ako sam samo rekao "vremenska prognoza" sljedeÄi rijeÄ vjerojatno mogao biti "danas" ili bi moglo biti "vrijeme prognoza sutra. " Ali to je malo vjerojatno da Äe biti " vremenska prognoza artiÄoke. " 

Koji model jezik se je to biljeÅ¾i one statistiÄki brojanjem, iz neke vrlo velike korpus, sve instance u kojoj jedna rijeÄ slijedi joÅ¡ jedna. Dakle, ako sam uzeti veliki corpus-- kao i svaki Wall Street Journal koje se proizvodi od 1930. godine, Å¡to je jedan od standardnih corpuses-- i gledam kroz sve taj tekst, a ja sam brojati do koliko puta nakon "prognoza" ne vidim "Danas" i koliko puta to vidim "prognoza", a zatim "artiÄoka" prvi ide biti mnogo viÅ¡e vjerojatno. To Äe se pojaviti daleko ÄeÅ¡Äe. I tako Äete imati veÄi Vjerojatnost povezane s njom. 

Ako Å¾elim shvatiti vjerojatnost cijelog izriÄaja, onda, samo sam ga razbiti. Dakle, vjerojatnost sluha reÄenica "Å¡takor pojeo sir" je vjerojatnost rijeÄi "na" poÄinje reÄenicu, a onda je vjerojatnost da je RijeÄ "rat" slijedi rijeÄ je "," a vjerojatnost da je RijeÄ "pojeo" slijedi "rat" a vjerojatnost da "sir" slijedi "pojeo". 

To zvuÄi kao puno statistika, puno vjerojatnosti. I to je sve Å¡to je. Ali nevjerojatna stvar je ako to uÄinite s dovoljno velikom uzorku podataka, radi. I to radi strahovito dobro. Svi znamo ove tehnologije. VeÄina operativnih sustava dolaze s prepoznavanje glasa u ovom trenutku. Mi koristimo Siri i Cortana i Echo. A te stvari su na temelju Ovaj tip tri sloja model-- fonetski modela na dnu, a izgovor model u sredini, i jeziÄni model na vrhu njih. 

Sada, oni moraju uÄiniti malo viÅ¡e nego da, kako bi odgovorili na pitanja. Ali priznanje Å¡to ste izreka upravo ovisi o tome. Tako Äemo ovdje jedan primjer. Dakle, imam moj telefon sjedi ovdje ispod kamera za dokumente. I mi Äemo pita Siri nekoliko pitanja. U redu? 

Tako Äemo se probuditi moj telefon ovdje. Siri, Å¡to je vrijeme kao u New Havenu danas? 

Siri: Evo vrijeme za New Haven, Connecticut i danas. 

BRIAN SCASSELLATI: U redu. Dakle, prvo Å¡to je vidio da Siri prepoznao svaki od pojedinih rijeÄi a zatim producirao odgovor. Razgovarat Äemo o tome da je odgovor dolazi u malo. Ali sada znamo da je da je to samo temelji na sirove statistike i to uzorak podudaranja vrsta pristupa, moÅ¾emo igrati neke igre s Siri. 

Dakle, ja mogu pokuÅ¡ati ponovno. Siri, Å¡to je vrijeme nilski konj New Haven, danas? 

Siri: U redu. Ovdje je vrijeme za nove Haven, Connecticut za danas. BRIAN SCASSELLATI: Siri je Ne pokolebalo time zato Å¡to je pronaÅ¡ao pattern-- "vrijeme", "Danas", "New Haven." To je ono Å¡to je reagirati da, baÅ¡ kao Eliza. U redu. Idemo dati joÅ¡ jedan, Äak viÅ¡e smijeÅ¡no primjer. Siri, vrijeme artiÄoke Armadillo nilski konj New Haven? 

Siri: Dopustite mi da provjerite na to. Evo Å¡to sam naÅ¡ao na webu za koje su artiÄoke Armadillo nilski konj New Haven. 

BRIAN SCASSELLATI: U redu. Dakle, ako ja iÄi dovoljno daleko daleko od ovog modela, Ja sam u moguÄnosti da ga zbuniti, jer toga nema ViÅ¡e odgovara uzorak da ima. I to statistiÄki motor koji govori, Å¡to je vjerojatnost da imaÅ¡ RijeÄi nilski konj i artiÄoka zajedno, i Armadillo? To mora biti neÅ¡to novo. 

Dakle, tih tehnologija koristimo svaki dan. Ako Å¾elimo im uzeti jedan korak dalje, iako, ako smo zapravo Å¾elite biti u moguÄnosti razgovarati o tome Å¡to je je da su ti sustavi reagiraju na, moramo razgovarati, opet, o viÅ¡e temeljni set pitanja. I to je tema u komunikaciji koje zovemo pitanje odgovori. To je, Å¾elimo biti u moguÄnosti to-- da? PUBLIKA: [neÄujan]. BRIAN SCASSELLATI: Dali smo dobili u latentnom semantiÄke obrade? Pa da. Postoji puno stvari koje su dogaÄa ispod povrÅ¡ine sa Siri a u nekim primjerima Ja Äu vam pokazati sljedeÄi tamo gdje je vrlo malo u smislu strukture onoga Å¡to si rekao da je to vaÅ¾no. A, u stvari, to je velik prekursor za sljedeÄi slajd za mene. 

Dakle, na isti naÄin da je naÅ¡ prepoznavanje govora je izgradio viÅ¡estrukih slojeva, ako Å¾elimo razumjeti Å¡to je to Å¡to je zapravo se, rekao je, idemo opet osloniti na analizu viÅ¡eslojnog teksta koji je prepoznat. Pa kad Siri je zapravo u stanju recimo, izgleda NaÅ¡ao sam ove rijeÄi. Sad Å¡to da radim s njima? Prva komponenta je Äesto proÄi i pokuÅ¡ati analizirati struktura reÄenice. A ono Å¡to smo vidjeli u osnovnoj Å¡koli, Äesto, kao svojevrsno dijagrame reÄenice, idemo prepoznati da odreÄeni RijeÄi imaju odreÄene uloge. To su imenice. To su zamjenice. To su glagoli. A mi Äemo prepoznati da se za odreÄenu gramatike, u ovom sluÄaju engleske gramatike, postoje valjani naÄini na koje ih se moÅ¾e kombinirati sam i druge naÄine koji nisu valjani. 

To priznanje da struktura, moglo biti dovoljno da bi se voditi nas malo. No to nije sasvim dovoljno za nas biti u moguÄnosti dati bilo znaÄenje onoga Å¡to je reÄeno ovdje. Da biste to postigli, morat Äemo se osloniti na neki iznos semantiÄke obrade. To je, mi smo iduÄi u morati gledati na ispod onoga Å¡to je svaki od ovih rijeÄi zapravo nosi kao znaÄenje. I na najjednostavniji naÄin za to, Äemo povezati sa svakom rijeÄi da znamo odreÄenu funkciju, neki preobrazba koja njemu dopuÅ¡ta da se dogodi. 

U tom sluÄaju, mogli bismo oznaÄite oznakom RijeÄ "Ivan" kao vlastito ime, da sa sobom nosi identitet. A mogli bismo oznaÄiti "Marija", kao na isti naÄin. Dok glagol poput "ljubavi", koja predstavlja odreÄeni odnos da smo u stanju zastupati. Sad, to ne znaÄi da razumijemo Å¡to je ljubav, ali samo da mi razumijemo je na putu simboliÄkog sustava. To je, moÅ¾emo oznaÄiti to i manipulirati. 

Uz svaku od tih vrsta pristupa, bilo koja vrsta semantiÄke obrade Ovdje Äe zahtijevati malo malo znanja i puno posla s naÅ¡e strane. ViÅ¡e nismo u podruÄju gdje je samo obiÄan statistika Äe biti dovoljno za nas. Sada, kako bi se iÄi od ove toÄke na Å¡to mogli govoriti o unutarnjoj Å¡to se zapravo dogaÄa ovdje, da bude u moguÄnosti da manipuliraju ovo strukturu i razumjeti pitanje a zatim biti u moguÄnosti iÄi van i traÅ¾iti, koji zahtijeva viÅ¡e Kompleks kognitivni model. 

NaÄin na koji se grade ti sustavi je za najveÄi dio vrlo, vrlo rada intenzivna. Oni ukljuÄuju ljude troÅ¡enja mnogo vremena strukturiranje naÄina na koji ove vrste reÄenica moÅ¾e biti zastupljena u nekom logikom. Ona dobiva Äak i malo sloÅ¾eniji, ipak. 

Äak i nakon Å¡to sam se bavila smo s semantike, mi Äemo i dalje morati gledati na pragmatika onoga Å¡to je reÄeno. To je, kako mogu odnositi rijeÄi da moram neÅ¡to fiziÄki se postoji u svijetu ili barem neki izvor informacija da mogu manipulirati? 

Ponekad, to dovesti do divne komadiÄi dvosmislenosti. "Crveno-vruÄe zvijezda oÅ¾eniti astronom." U REDU. Sada, Äitamo da kao smijeÅ¡no vrsta naslov da bismo vidjeli na kasno noÄu TV jer mi ne tumaÄe "Star" da imaju svoje znaÄenje nebeskog tijela. Mi znamo da to znaÄi viÅ¡e uobiÄajena glumac ili glumica s visokim koliÄinama vidljivosti. 

"MomÄad pomaÅ¾e Å¾rtvi pas ugristi." Je li to da je momÄad zapravo tamo pomaÅ¾uÄi psa u ide okolo i grize Å¾rtve? Ili je to da je pojedinac koji je bio ugrizla psa koji treba pomoÄ? Samo iz gleda na sintaksu i semantici reÄenica, ne moÅ¾emo utvrditi da. 

"Helikopter powered by ljudskih muhe." Postoje li, u stvari, stvarna sitnice leteÄi oko toga ljudi s krilima napajanje helikopteri za dobrobit ÄovjeÄanstva? Ili postoji jedan mehaniÄki ureÄaj koja crpi snagu iz osobom? 

Kada gledamo pitanje odgovaranje sustava, to su slojevi koje moramo baviti. Sada, najbolje i najviÅ¡e vrsta od prevladava tih sustava Danas su u moguÄnosti to uÄiniti stvari na razini koja se daleko izvan onoga Å¡to smo imali prije 10 godina. Evo jedan od najboljih sustava to je vani danas. A to je sustav IBM zove Watson. To je od naÅ¡ih prijatelja u IBM-u. To je Katherine banke, Jia Chen, i Priscilla Moraes nam daje demonstracija Watson juÄer u IBM Yorktown. [VIDEO PLAYBACK] -Kako si? 

-Dobro sam. Ja sam uvijek sretna kad sam razmiÅ¡ljanja, pogotovo kada sam moÅ¾e ostati cool u ovim server sobama. Tko je vaÅ¡ omiljeni glumica? 

-Moj Omiljeni glumica Angelina Jolie kao Lara Croft u Tomb Raider zbog njezina izvornika Oblik je kao virtualni lik poput mene. 

-Kako Watson moÅ¾e pomoÄi pacijentima? 

-je Plan za pacijente imati pristup Watson izravno? Pristup Watson savjetovanja aplikacija Äe se razlikovati od sluÄaja koriÅ¡tenja. Ali sada, Watson Äe samo pruÅ¾iti MoguÄe dijagnoza i lijeÄenje opcije za struÄno medicinsko osoblje. Ako je potrebno, bolesnici mogu pruÅ¾iti informacije da Watson, moÅ¾da kroz Portal web suÄelje, tableta, ili Äak mobilni telefon. Na primjer, pacijent moÅ¾e biti zamoljeni da opiÅ¡u svoje simptome u prirodnom jeziku izravno u Watson rjeÅ¡enja, Äime je lijeÄnik da se usredotoÄe na dijagnoza, a ne prikupljanje podataka. 

Tko ubijen Abraham Lincoln? 

-John Wilkes Booth. 

-U Je godine Arizona Diamondbacks osvojiti Svjetsko prvenstvo? 

-2001. 

[END PLAYBACK] 

BRIAN SCASSELLATI: Pa ove vrste sustava moraju osloniti na svega prepoznavanje govora; drugi, ga pretvoriti u jedan smisleni unutarnja zastupanje; a onda, treÄi, biti u moguÄnosti otiÄi van i naÄi izvor informacije koje omoguÄuje im da odgovor na to pitanje. Ova razina sloÅ¾enosti ukljuÄuje iste vrste programskih stvari da ste bili radi u problematiÄnim setovima. 

Mi smo u moguÄnosti analizirati HTTP zahtjeva u ista vrsta low-level uzorak podudaranje koji ELIZA moÅ¾e uÄiniti. Mi smo u moguÄnosti to pretvoriti one u unutarnje reprezentacije, a zatim ih koristiti za upit neke vanjske baze podataka, eventualno pomoÄu SQL. Sve od sustava koji se grade i danas uÄiniti ovu vrstu prirodnih jeziÄna komunikacija se grade na ti isti principi. 

Sada, Äak i sustav kao Watson nije dovoljno kompleksan biti u moguÄnosti odgovoriti na proizvoljan pitanja o bilo kojoj temi. A u stvari, oni moraju biti strukturirani unutar odreÄenog podruÄja. Dakle, moÅ¾ete otiÄi online i moÅ¾ete pronaÄi verzije Watson koje posluju dobro u medicinske informatike. Ili postoji jedan online samo da se bavi kako napraviti dobre preporuke o ono pivo Äe iÄi s kojima hrana. A unutar tih podruÄja, moÅ¾e odgovoriti na pitanja, naÄi informacije koje su mu potrebne. 

Ali ne moÅ¾ete mijeÅ¡ati i odgovaraju ih. Sustav koji je trenirao s bazom podataka hrane i piva ne rade dobro kada se iznenada stavite ga u s medicinskom informatike baza podataka. Pa Äak i naÅ¡i najbolji sustavi danas osloniti na razini obrade u kojoj su ruÄno kodiranje i zgrada u infrastrukturu kako bi kako bi ovaj sustav trÄanje. 

Sada, zadnja tema Å¾elim biti u moguÄnosti doÄi do danas o neverbalnoj komunikaciji. Velika masa informacija koje komuniciramo jedni s drugima ne doÄi kroz pojedine rijeÄi koje se prijavljujete. To ima veze sa stvarima kao Å¡to su Blizina, pogled, tvoj ton glasa, VaÅ¡ infleksije. A to je i komunikacija neÅ¡to Å¡to mnogo razliÄitih suÄelja briga mnogo o tome. To nije ono Å¡to Siri stalo. Mogu pitati neÅ¡to Å¡iri u jedan glas ili u nekom drugom tonu glasa, i Siri Äe daj mi isti odgovor. Ali to nije ono Å¡to mi gradimo za mnoge druge vrste suÄelja. 

Å½elim vam predstaviti Sada se jedan od robota. To je sagradio moj dugogodiÅ¡nji prijatelj i kolega Cynthia Breazeal i njezina tvrtka Jibo. A to robot-- Äemo imati par volontera doÄi do interakciju s ovim. Dakle, mogu li dvoje ljudi spremni igrati s robotom za mene? ZaÅ¡to ne doÄeÅ¡ gore, i zaÅ¡to ne dolaze na gore. Ako bi mi se pridruÅ¾iti ovdje, molim. 

A ako bih mogao si doÄi odmah ovdje. Hvala. Bok. 

ALFREDO: Drago mi je. Alfredo. 

BRIAN SCASSELLATI: Alfredo. 

Rachel: Rachel. BRIAN SCASSELLATI: Rachel. Drago mi oboje. Alfredo, ja Äu vas iÄi prvi. DoÄite ovdje. Idem predstaviti you-- ako ja mogu dobiti ovu off bez kucanja na microphone-- na malo robota po imenu Jibo. U REDU? 

Sada, Jibo je osmiÅ¡ljen kako bi biti interaktivan. I iako to moÅ¾e vam dati govor, mnogo interakcije s robotom je neverbalna. Alfredo, ja Äu vas da reÄi neÅ¡to lijepo i besplatno na robota, molim. ALFREDO: Mislim da izgledaju slatko. 

[Zujanja SOUND] BRIAN SCASSELLATI: U redu. Njegov odgovor je ne verbalno. A ipak vam je dao i jasno priznanje da je Äuo Å¡to je rekao i nekako shvatio da. U REDU? Korak natrag ovamo na sekundu. Hvala. 

Rachel, ako bi. Sada Äu dati vam mnogo teÅ¾e posao. Ako bih stajati ovdje, back up samo malo, tako moÅ¾emo vam doÄi na kameru i gledati na taj naÄin. Ja Äu vas pitati neÅ¡to reÄi zapravo znaÄi i gadno na robota. 

Rachel: Ono Å¡to se Äinilo uÄiniti je potpuno apsurdno. 

[Zuji SOUND] 

To je joÅ¡ viÅ¡e apsurdno. Å to se dogaÄa s tobom? Ah, ne osjeÄam loÅ¡e. Ja Äu vam dati zagrljaj. BRIAN SCASSELLATI: U redu. Hvala, Rachel. Alfredo, Rachel, hvala deÄki jako puno. 

[PLJESAK] 

Dakle, ova vrsta interakcije je u mnogo naÄina neke od istih pravila i neki od istog Struktura kao Å¡to smo moÅ¾da u jeziÄnom interakcije. To je i komunikativan i sluÅ¾i vaÅ¾nu svrhu. I da interakcija u mnogo naÄina, osmiÅ¡ljen da imaju odreÄeni uÄinak na Osoba interakciji sa ili sluÅ¡anje robotu. 

Sada, ja sam dovoljno sretan imati Jibo danas ovdje. Sam Spaulding je ovdje pomoÄi nam se s robotom. A ja Äu pitati Sam dati nas jedna lijepa demo Jibo ples da moÅ¾emo gledati na kraju ovdje. Pa iÄi naprijed, Jibo. 

SAM: OK, Jibo. PokaÅ¾i nam svoje plesne pokrete. 

[Glazbom] BRIAN SCASSELLATI: U redu, svi. ZahvaljujuÄi naÅ¡im prijateljima u Jibo. 

[PLJESAK] 

A zahvaljujuÄi naÅ¡im prijateljima u IBM za pomaganje danas. Komunikacija je neÅ¡to da idete vidjeti dolazi sve viÅ¡e i viÅ¡e kao gradimo sloÅ¾enije suÄelja. SljedeÄi tjedan Äemo razgovarati o tome kako suÄelje s raÄunalnih protivnika u igrama. Ali, ako imate pitanja o tome, Ja Äu biti ovdje na radnog vremena veÄeras. Sretan sam s vama razgovarati o AI teme ili da se u viÅ¡e detalja. Ugodan vikend. 

[PLJESAK] [Glazbom]