[Glazbom] DAVID Malan: Ovo je CS50. To je kraj tjedna 10. A dječak, mi imamo dobra klasa za vas danas. Mi smo tako uzbuđeni pozvati dvojicu naši prijatelji iz Yalea do nas danas i gledati na raskrižju umjetne inteligencije, robotike, obrada prirodnoga jezika, i još mnogo toga. I doista, nad posljednjih nekoliko tjedana, mi smo sigurno proveo puno vremena, osobito u ranijim psets, s naglaskom na lijepe detalje niske razine. I to je vrlo lako izgubiti iz vida šume za stabla i zadržati se na petlje i uvjetima i naputke, svakako, i slično. No, stvarnost je vi sada imate Sastojci s kojima možete stvarno riješiti neke zanimljive probleme, među ih ti da su naši prijatelji u Yaleu rad na samo sramiti od Cambridgea. Dakle, dopustite mi da najprije predstaviti našu glavu asistent s Yalea, Andy. [PLJESAK] ANDY: Prije svega, samo zahvaliti što je dopustila par Yalies pop na dolje na Cambridgeu danas. Stvarno smo ga cijeniti. Drugo, našim prijateljima natrag home-- Jason, hvala za boravak i trčanje predavanje. Nadam se da je sve dobro u New Havenu. Tako da, ja sam super uzbuđen uvesti Scaz danas. Scaz pokreće robotike laboratorij. On je profesor, kao što su, pet različiti odjeli na Yaleu. U svom laboratoriju, on ima mnogo, mnogo roboti koji voli igrati. On je, kao što je zgodnih posao na svijetu. A on dobiva vrsta nered oko s tim cijeli dan dugo i napraviti neki posao, kao dobro. I tako smo zapravo donio jedan Od ih s nama danas. Dakle, bez dodatnih teškoća, Scaz je ići naprijed i uvesti nas njegove robota prijatelj. [PLJESAK] BRIAN SCASSELLATI: Hvala, David. Hvala, Andy. To je tako divno da se ovdje sa svima danas. Želim prvo biti vrlo jasno da CS50 osoblje ovdje u Cambridgeu je nevjerojatno gostoljubivi prema nama. Mi smo tako zahvalan za sve što ste učinili za nas podržati. I tako bismo željeli biti u mogućnosti vratiti dobrotu. Tako je danas, dobili smo objaviti da ćemo imati novu, jedan-of-a-vrste CS50 događaja događa se u New Havenu sljedeći tjedan. A to je CS50 Istraživanje Expo. Tako ćemo se pozivaju everyone-- CS50 studentima, Osoblje iz oba Harvard i Yale-- se doći i posjetiti nas u petak. Mi ćemo imati razne od preko 30 različitih ljudi predstavljanje i exhibiting-- upperclassmen prikazuje off neke od svojih istraživačkih proizvoda. Mi ćemo imati neke startupima, čak, u potrazi za malo nove tehnologije talenta, startupima iz oba Harvarda i Yalea. I mi ćemo imati neke studentske grupe u potrazi za nekim novim članstvom. To će biti vrlo uzbudljivo vrijeme. Nadam se one od vas koji su silazi na Harvardu Yale igre će biti u mogućnosti da se zaustavi po malo rano, u samom središtu kampusa, Spomen knjižnica Sterling. Ćemo imati niz eksponati koji se kreću od autonomna jedrilice na načine pomoću softvera sačuvati srednjovjekovne rukopise. Mi ćemo morati oglas hoc mreža i ljudi nastave softver kodiranje u Cape Town. Morat ćemo računalo glazba demonstracije. A mi ćemo, naravno, imati više robota. Tako smo se nadaš ću pridružite nam se za ovaj događaj. To bi trebao biti puno zabavno, malo hrane, i puno zanimljivije stvari za razgovor o tome. Tako je danas, idemo razgovarati O obrada prirodnoga jezika. A to je pokušaj za nas izgraditi novi način sučelja s našim uređaja, jer u posljednjih nekoliko tjedana, ste usredotočeni na to kako je to možete pisati kod, pisanje softvera to je način da bude u mogućnosti reći do stroj, to je ono što želim učiniti. No, ne treba da Očekujemo da se sve to je vani da se koristi svi u svijetu će biti stručnjak u ovoj vrsti nastave. Tako razlikujemo računala jezika i prirodnih languages-- to je, stvari koje ljudi koriste komunicirati s drugim ljudima. A mi pokušati izgraditi sučelja koje koriste ove prirodne mehanizme komunikacije. Sada, baš kao i svaki drugi topic da smo započeli s u CS50, ćemo započeti s najjednostavnijim Malo obrada prirodnoga jezika koje možemo zamisliti. Idemo početi s Povijesni dio prirodnog jezika. A onda ćemo izgraditi do sve više i više nedavnih sustavi i imaju neke zabave demo na putu. Tako ćemo početi s onim što je vjerojatno prvi prirodnog jezika Sustav za obradu. To je programski sustav napisan u 1966. Joseph Weizenbaum zove Eliza. I ELIZA je dizajniran za ponoviti vrste interakcije ti bi s Rogerianskog psihoterapeut. Sada, Rogerians, imali su ideja koja psihoterapija sudjeluje se moći zrcaliti nazad na pacijentu i razgovarati s njima, u osnovi, za samo ih je davanje maleni malo terapeuta. To je sve da terapeut rekao je trebao biti samo odraz ono što pacijent govori im. Tako ćemo pokušati demo to. Da imamo dobrovoljca koji bi bio spremni podijeliti svoje najdublje, Najmračniji i / ili lažni tajne s Eliza? Naravno, zašto ne dođeš gore. Fantastičan. A tvoje ime? MILES: Miles. BRIAN SCASSELLATI: Miles. Drago mi je, Miles. Ako bi zadržati na tome. I idemo koristite inačicu Eliza da smo replicirati u CS50 IDE. A mi ćemo gledati na izvoru kod za to malo vremena. No, za sada, mi smo samo će ga pozivati ​​na gumb Elizu. I ELIZA će vam dati odgovore koji će biti u svim glavnim gradovima. I neće vam postaviti nekoliko pitanja. A mi ćemo odgovoriti i tip u odgovorima na Eliza. Dakle ELIZA je rekao: "Bok, ja sam Eliza. Koji je tvoj problem?" Što biste željeli reci Eliza o danas? MILES: Ja samo mogu zaspati ako imam zeko papuče na. BRIAN SCASSELLATI: U redu. U redu. [SMIJEH] "Mogu samo zaspati s bunny papuče na. " I ELIZA kaže: "Reci, zar ne imate bilo kakvih psihičkih problema? Možda je to dobar pokazatelj. " U REDU. Dakle, što biste željeli odgovoriti? MILES: Da. BRIAN SCASSELLATI: Da. Čovjek od mnogih riječi. Uživam da. Eliza kaže: "Čini se prilično pozitivno." MILES: Ne, ja sam, u stvari, elektron. BRIAN SCASSELLATI: "Ne U stvari, ja sam elektron. " "Jeste li došli k meni jer ste elektron? " Sada, možemo vidjeti neke od things-- idem da vas pauzu za samo sekundu, Miles. Nemojte ići nigdje. Nismo učinili s vama još. ELIZA je, na neki način, reagira na određene stvari da je on rekao, ali bez bilo pravo razumijevanje. I to je također parroting natrag neke od dijelova kazne. Tako smo, rekao je: "Ne U stvari, ja sam elektron. " Eliza je odgovorio natrag, "Jeste li došli za mene, jer ti si jedan elektron? " U redu. Dajmo mu još jedan odgovor ovdje. Daju dobar jedan, Miles. MILES: Dobro on? Da, molim te pomozi mi. BRIAN SCASSELLATI: "Da. Molim te pomozi mi. "" Jeste li sigurni? " MILES: Ne BRIAN SCASSELLATI: Ne "Što to sugeriraju za vas?" MILES: Ja ne mogu biti elektron. BRIAN SCASSELLATI: "Ja ne može biti elektron. " "Želite li reći ne samo da se negativni?" U redu. Dakle Miles, hvala vam toliko. MILES: Hvala vam. BRIAN SCASSELLATI: Hvala puno. [PLJESAK] Dakle, ovo ELIZA programa, na mnogo načina, reagira samo na komadiće da smo pružiti bez dubine razumijevanje onoga što se događa ovdje. To je vrsta sustava naziva uzorak podudaranja, gdje mi smo u potrazi za određeni komadići teksta koji smo tada uzeti od onoga što dao kao ulaz, pretvoriti ga, potencijalno, na neki način, a zatim ga vratiti korisniku. Da li itko od vas misle da ELIZA je zapravo obavljanje valjanu psihoanalizu ovdje? Jedna osoba, možda. PUBLIKA: [nečujan]. BRIAN SCASSELLATI: A kako to čine se osjećate? Da, u stvari, to radi. I mi ćemo vidjeti, u stvari, izvorni kod za to u samo trenutak. I tako ti ćeš biti u mogućnosti to učiniti upravo to. Sada, ELIZA je jedan oblik onoga što bismo danas chat bot nazvati. To samo ide kroz tekst koji ste pruža, osigurava minimum količinu razumijevanja ili obrade, a zatim ga papige natrag na vas. Tako ćemo pogledati, konceptualno, i razgovarati o tome što to je da ELIZA zapravo radi. ELIZA je uzimanje sentence-- neka je kažu: "Želim impresionirati moj šef." I ELIZA gleda kroz tu rečenicu i pokušava pronaći i odgovaraju određene obrasce. Tako je, na primjer, jedan od uzoraka da ELIZA traži su riječi "Želim." I bilo je to vrijeme vidi nešto da ima "Želim" u njoj, to formulira odgovor. I to je odgovor fiksna niz. U ovom slučaju, to je "zašto želite?" I ja sam stavio malo zvijezdu na kraj, jer to je samo početak našeg odgovora. A zvijezda ukazuje na to da ćemo uzeti ostatak od korisnika utterance-- "impresionirati moj šef" - a mi ćemo dodati da je na kraju ovog niza. Tako sada, umjesto da govori: "Zašto želite impresionirati moj šef ", postoji malo dodatnog Obrada da ćemo učiniti. To je, morat ćemo pretvoriti neke od zamjenica ovdje iz "moj šef" na "svoj gazda". I tu bi moglo biti nekoliko drugih promjene koje moramo napraviti. Dakle, umjesto da ga samo držati izravno na kraju, što ćemo učiniti je ćemo uzeti ostatak od korisnika utterance-- u bijeloj here-- a mi ćemo ga uzeti jedan komad na vrijeme i pretvoriti svaku string tokena, svaka riječ, u rečenici. Dakle, mi ćemo se riječ "da". Nema pretvorbe da moramo učiniti. "Impresionirati." Nema pretvorbe moramo raditi tamo. "Moj" će se pretvoriti u "svoj". A "šef" samo ćemo ostaviti kao "gazda". I onda na kraju, ništa koji završava period, ćemo pretvoriti ga u pitanje. Ovo je vrlo jednostavan uzorak podudaranja je zapravo vrlo uspješna. A kada je to uvedeno u 1966-- Joseph Weizenbaum programirati ovaj na računalu. Sada, računala u to vrijeme nisu bili desktop modele. Oni su zajedničkim resursima. A njegovi učenici bi otići i razgovarati s Eliza. Naposljetku, morao je ograničiti pristup do njih jer su njegovi učenici nisu bili uzimajući bilo koji posao ispunjavanja. Samo su razgovor s Eliza. A, u stvari, morao je vatru njegov pomoćnik, koji je proveo sve svoje vrijeme u razgovoru s Eliza o njezinim dubokim i zabrinjavajuće probleme. Svatko tko koristi ove sustave počeo ih anthropomorphize. Počeli su razmišljati o njima kao se živi i stvarni ljudi. Počeli su prepoznati neke od stvari koje su govorili su se vraćaju na njih. I oni su bili saznate stvari o sebi. A, u stvari, čak i stručnjaci, čak i psihoterapeuti, počeo brinuti da, zapravo, možda ELIZA bi ih zamijeniti. A čak i računalo Znanstvenici zabrinuti da smo bili tako blizu rješavanja prirodnog jezika. Sada, to nije bilo ni blizu istina. No, to je kako impresivni ovi sustavi mogu činiti. Tako ćemo početi tražiti ispod i pokušajte da se malo pitanje gdje ovaj kod zapravo događa. Tako ćemo učiniti ovaj kod dostupan nakon toga. A to je vrlo jednostavna i izravna luka izvorne provedbe Eliza. Tako su neki od njih stilska stvari koje ćete vidjeti ovdje nisu stilski što bismo željeli da učinite ili što smo podučava vas učiniti. Ali mi smo pokušali ih zadržati isti u mnogim lukama da je to tako da se imalo ima okus originala. Tako ćemo uključiti hrpa stvari, a onda ćemo imati skup ključnih riječi, stvari koji će ELIZA prepoznati i odgovoriti na izravno. Dakle, ako imate riječi poput "Možete li" ili "ne znam" ili "ne" ili "da" ili "san" ili "Hello", a zatim ELIZA će odgovoriti selektivno onima. Također ćemo imati određeni broj stvari da ćemo zamijeniti, poput pretvoriti "moj" na "svoje". A onda ćemo imati niz odgovora da se za svaki od tih riječi, ćemo rotirati kroz ti različiti odgovori. Dakle, ako ja kažem "da" tri puta za redom, sam može dobiti tri različita odgovori Eliza. Naš broj je, dakle, zapravo nevjerojatno jednostavna. Ako sam se pomaknite prema dolje pokraj sve te Odgovori koje smo programirani u i dođemo do naš glavni, idemo inicijalizirati nekoliko različitih varijabli i to malo rutine u početku. Ali onda postoji apsolutno set koda koji možete razumjeti. Jedna velika while petlja koja kaže da sam će ponoviti iznova i iznova. Ja ću čitati u nizu, a ja ću pohraniti da ulaznog niza. Provjerit ću i vidjeti ako je to posebna ključna riječ "oprostiti", koja znači izlazak iz programa. A onda ću provjeriti i vidjeti je li netko samo sebe ponavlja više i više. A ja ću vikati na njih, ako im je činiti. Ja ću reći "ne ponavljati se." Dokle god nitko od onih koji se dogoditi, mi ćemo zatim skenirati kroz i loop, na linijama 308 do 313 ovdje, i provjeriti i vidjeti bilo koji od onih ključnu izrazi sadržani u unosu da sam samo dobio? Ako je utakmica za njih, i onda ću pamtiti tu lokaciju. Zapamtit ću tu ključnu riječ. A ja ću biti u mogućnosti izgraditi odgovor. Ako ne pronađete jednu, i onda, zadnja stvar u mom ključne riječi niza će biti moj propust odgovora, kad ništa drugo odgovara. Ja ću postavljati pitanja poput: "Zašto ste učinili došao ovamo? "ili" Kako vam mogu pomoći? " koji su samo djelomično potrebi bez obzira što je ulaz. Zatim ćemo izgraditi Eliza odgovor. Mi ćemo biti u mogućnosti uzeti da baza odgovora, baš kao što smo učinili u to "moj šef" primjer. Ako je to sve što postoji is-- ako je samo jedan niz koji sam trebao respond-- Ja samo mogu poslati ga natrag van. Ako ima zvjezdicu na kraj njega, onda ću obraditi svaku pojedinačnu oznaku u ostatak korisnika odgovor i dodati one u, zamjene iz Riječ po riječ kako moram. Sve to je apsolutno nešto što bi moglo graditi. I doista, načini na koje smo Obradili argumente naredbenog retka, način na koji ste obrađeni kroz HTTP zahtjeve slijedite iste vrste pravila. Oni uzorak podudaranja. Dakle ELIZA imali relativno važan utjecaj na prirodnom jeziku jer se to čini kao da je vrlo dostižan cilj, kao što je na neki način mi bismo biti u mogućnosti riješiti ovaj problem izravno. Sada, to ne znači da ne ELIZA sve što bismo željeli učiniti. Sigurno ne. Ali mi bi trebali biti u mogućnosti učiniti nešto više. Naš prvi korak otići izvan ELIZA ide kako biste mogli pogledati ne tekst koji se upisuje u tipkovnicu, ali govor, stvarna Govor zabilježeno u mikrofon. Dakle, kao što mi gledamo na to različita komada, mi smo morati izgraditi niz modela. Mi ćemo biti u mogućnosti ići od niske razine zvučne i information-- parcele, amplituda, frequency-- i pretvoriti to u neke jedinice koje smo mogli lakše manipulirati više i, konačno, manipulirati njima u riječi i rečenica. Dakle, najveći prepoznavanje govora sustavi koji su tamo i danas slijedite statistička model u kojem ćemo graditi tri odvojena prikazi što koji audio signal zapravo sadrži. Počinjemo s fonetske modelu koji govori o samo bazi zvuči da sam proizvodi. Jesam li proizvoditi nešto što je B kao u dječaka ili D kao u psa? Kako prepoznati one dvije različite telefoni su odvojeni i zasebni? Povrh toga, mi ćemo onda graditi izgovor modelu riječ, nešto što povezuje one pojedinačne telefoni i kombinira ih u riječi. A nakon toga, mi ćemo se riječi a mi ćemo ih sastaviti sa jeziku modelirati u potpuni rečenici. Sada ćemo govoriti o svakoj od njih samostalno i pojedinačno. Ali ta tri modela su sve samo će biti statistika. A to znači kad smo raditi s njima, mi ćemo biti u mogućnosti da rade s ih sve istovremeno. U redu. Počnimo s našim fonetske model. Dakle fonetske modeli oslanjaju na računalna tehnika zove skriveni Markovljevi modeli. To su grafički modeli u kojima sam ima i prepoznati stanje svijeta kao što je naznačeno skupom značajki. A to stanje opisuje jedan dio od djelovanja koje sam bavi. Dakle, ako ja mislim o tome zvuk "ma" kao majka, postoje različiti komponente za taj zvuk. Tu je dio gdje sam nacrtati u dahu. A onda sam kese moje usne. A ja uvaljati moje usne natrag malo malo da bi taj "ma" zvuk. A onda tu je oslobađanje. Moje usne apart. Zrak je protjeran. "Ma." Te tri različite dijelove bi zastupa država u ovom graph-- početak, sredina i kraj. I ja bi da prijelaze dopustio da putuju iz jedne države na sljedeći s određenom vjerojatnošću. Tako je, na primjer, da je M zvuči možda vrlo, vrlo kratko unos u beginning-- "mm" - a onda više, vibracijska faza u kojoj sam držao moje usne i gotovo humming-- "mmmm" - i tada vrlo kratko eksplozivni gdje sam izbaci breath-- "ma". Skrivena Markov model dizajniran za hvatanje činjenicu da način na koji sam napraviti da je zvuk "ma" ide biti malo drugačiji u njegova vremena, je frekvencija, a njegove karakteristike od način na koji ste to učiniti ili način na koji sam možda čine ga kad govorim oko različitih koristi pisma. "Majka" i "Mogu li" će zvuči malo drugačije. Dakle prepoznati Konkretno zvuk, mi bi graditi Markovljevi modeli, ovi skriveni Markovljev modeli, svakog mogućeg telefon koji ja možda žele prepoznati, svaki mogući zvuk, a zatim pogled na akustički podaci da imam i odrediti statistički koje je najvjerojatnije jedan da je proizveo taj zvuk. U REDU. S tim modelom, onda bismo početi graditi na vrhu. Mi uzeti izgovor model. Sada, ponekad izgovor modeli su jednostavno i lako jer postoji samo jedan način izgovoriti nešto. Drugi puta, oni su malo više komplicirano. Evo izgovor vodič za tu crvenu stvar koja je voće da bi kečap iz. Ljudi ne misle da je to plod. Pravo? Sada, postoji mnogo različitih načina da će ljudi izgovoriti tu riječ. Neki će reći: "usmjeravanje svibnja nožni prst." Neki će reći: "usmjeravanje Mah-nožni prst." I možemo uhvatiti da s jedan od ovih grafičkih modela gdje je, opet, mi predstavljaju prijelaze da ima određenu vjerojatnost i povezane vjerojatnosti s njima. Dakle, u ovom slučaju, ako su slijediti vrh put kroz cijeli ovaj graf, Ja bih se s početkom u pismu na lijevoj strani je "ta" zvuk. Ja bi gornju polovicu, na "oh", a zatim "ma" a onda je "," a zatim "ta" i "Oh." "Toe-svibanj-nožni prst." Ako sam uzeo donji put kroz to, ja ću doći "Ta-Mah-nožni prst." I ako sam dolje, a zatim gore, ja bih se "ta-May-nožni prst." Ovi modeli hvatanje tih razlike, jer kad god smo implementirati jedan od tih Sustavi za prepoznavanje, to će morati raditi s puno različitih vrsta ljudi, mnogo različitih naglasaka, pa čak i različite namjene istih riječi. Konačno, na vrhu toga, ćemo graditi nešto da izgleda jako komplicirano, zove jezični model, ali u stvari je najjednostavniji od tri jer to rade na ono što se naziva n-gram modeli. I u ovom slučaju, ja sam ti se prikazuje dva dijela n-gram model, Bigram. Idemo napraviti fizičku ideju da ponekad, određene riječi su više vjerojatno da će slijediti dao riječ od drugih. Ako sam samo rekao "vremenska prognoza" sljedeći riječ vjerojatno mogao biti "danas" ili bi moglo biti "vrijeme prognoza sutra. " Ali to je malo vjerojatno da će biti " vremenska prognoza artičoke. " Koji model jezik se je to bilježi one statistički brojanjem, iz neke vrlo velike korpus, sve instance u kojoj jedna riječ slijedi još jedna. Dakle, ako sam uzeti veliki corpus-- kao i svaki Wall Street Journal koje se proizvodi od 1930. godine, što je jedan od standardnih corpuses-- i gledam kroz sve taj tekst, a ja sam brojati do koliko puta nakon "prognoza" ne vidim "Danas" i koliko puta to vidim "prognoza", a zatim "artičoka" prvi ide biti mnogo više vjerojatno. To će se pojaviti daleko češće. I tako ćete imati veći Vjerojatnost povezane s njom. Ako želim shvatiti vjerojatnost cijelog izričaja, onda, samo sam ga razbiti. Dakle, vjerojatnost sluha rečenica "štakor pojeo sir" je vjerojatnost riječi "na" počinje rečenicu, a onda je vjerojatnost da je Riječ "rat" slijedi riječ je "," a vjerojatnost da je Riječ "pojeo" slijedi "rat" a vjerojatnost da "sir" slijedi "pojeo". To zvuči kao puno statistika, puno vjerojatnosti. I to je sve što je. Ali nevjerojatna stvar je ako to učinite s dovoljno velikom uzorku podataka, radi. I to radi strahovito dobro. Svi znamo ove tehnologije. Većina operativnih sustava dolaze s prepoznavanje glasa u ovom trenutku. Mi koristimo Siri i Cortana i Echo. A te stvari su na temelju Ovaj tip tri sloja model-- fonetski modela na dnu, a izgovor model u sredini, i jezični model na vrhu njih. Sada, oni moraju učiniti malo više nego da, kako bi odgovorili na pitanja. Ali priznanje što ste izreka upravo ovisi o tome. Tako ćemo ovdje jedan primjer. Dakle, imam moj telefon sjedi ovdje ispod kamera za dokumente. I mi ćemo pita Siri nekoliko pitanja. U redu? Tako ćemo se probuditi moj telefon ovdje. Siri, što je vrijeme kao u New Havenu danas? Siri: Evo vrijeme za New Haven, Connecticut i danas. BRIAN SCASSELLATI: U redu. Dakle, prvo što je vidio da Siri prepoznao svaki od pojedinih riječi a zatim producirao odgovor. Razgovarat ćemo o tome da je odgovor dolazi u malo. Ali sada znamo da je da je to samo temelji na sirove statistike i to uzorak podudaranja vrsta pristupa, možemo igrati neke igre s Siri. Dakle, ja mogu pokušati ponovno. Siri, što je vrijeme nilski konj New Haven, danas? Siri: U redu. Ovdje je vrijeme za nove Haven, Connecticut za danas. BRIAN SCASSELLATI: Siri je Ne pokolebalo time zato što je pronašao pattern-- "vrijeme", "Danas", "New Haven." To je ono što je reagirati da, baš kao Eliza. U redu. Idemo dati još jedan, čak više smiješno primjer. Siri, vrijeme artičoke Armadillo nilski konj New Haven? Siri: Dopustite mi da provjerite na to. Evo što sam našao na webu za koje su artičoke Armadillo nilski konj New Haven. BRIAN SCASSELLATI: U redu. Dakle, ako ja ići dovoljno daleko daleko od ovog modela, Ja sam u mogućnosti da ga zbuniti, jer toga nema Više odgovara uzorak da ima. I to statistički motor koji govori, što je vjerojatnost da imaš Riječi nilski konj i artičoka zajedno, i Armadillo? To mora biti nešto novo. Dakle, tih tehnologija koristimo svaki dan. Ako želimo im uzeti jedan korak dalje, iako, ako smo zapravo želite biti u mogućnosti razgovarati o tome što je je da su ti sustavi reagiraju na, moramo razgovarati, opet, o više temeljni set pitanja. I to je tema u komunikaciji koje zovemo pitanje odgovori. To je, želimo biti u mogućnosti to-- da? PUBLIKA: [nečujan]. BRIAN SCASSELLATI: Dali smo dobili u latentnom semantičke obrade? Pa da. Postoji puno stvari koje su događa ispod površine sa Siri a u nekim primjerima Ja ću vam pokazati sljedeći tamo gdje je vrlo malo u smislu strukture onoga što si rekao da je to važno. A, u stvari, to je velik prekursor za sljedeći slajd za mene. Dakle, na isti način da je naš prepoznavanje govora je izgradio višestrukih slojeva, ako želimo razumjeti što je to što je zapravo se, rekao je, idemo opet osloniti na analizu višeslojnog teksta koji je prepoznat. Pa kad Siri je zapravo u stanju recimo, izgleda Našao sam ove riječi. Sad što da radim s njima? Prva komponenta je često proći i pokušati analizirati struktura rečenice. A ono što smo vidjeli u osnovnoj školi, često, kao svojevrsno dijagrame rečenice, idemo prepoznati da određeni Riječi imaju određene uloge. To su imenice. To su zamjenice. To su glagoli. A mi ćemo prepoznati da se za određenu gramatike, u ovom slučaju engleske gramatike, postoje valjani načini na koje ih se može kombinirati sam i druge načine koji nisu valjani. To priznanje da struktura, moglo biti dovoljno da bi se voditi nas malo. No to nije sasvim dovoljno za nas biti u mogućnosti dati bilo značenje onoga što je rečeno ovdje. Da biste to postigli, morat ćemo se osloniti na neki iznos semantičke obrade. To je, mi smo idući u morati gledati na ispod onoga što je svaki od ovih riječi zapravo nosi kao značenje. I na najjednostavniji način za to, ćemo povezati sa svakom riječi da znamo određenu funkciju, neki preobrazba koja njemu dopušta da se dogodi. U tom slučaju, mogli bismo označite oznakom Riječ "Ivan" kao vlastito ime, da sa sobom nosi identitet. A mogli bismo označiti "Marija", kao na isti način. Dok glagol poput "ljubavi", koja predstavlja određeni odnos da smo u stanju zastupati. Sad, to ne znači da razumijemo što je ljubav, ali samo da mi razumijemo je na putu simboličkog sustava. To je, možemo označiti to i manipulirati. Uz svaku od tih vrsta pristupa, bilo koja vrsta semantičke obrade Ovdje će zahtijevati malo malo znanja i puno posla s naše strane. Više nismo u području gdje je samo običan statistika će biti dovoljno za nas. Sada, kako bi se ići od ove točke na što mogli govoriti o unutarnjoj što se zapravo događa ovdje, da bude u mogućnosti da manipuliraju ovo strukturu i razumjeti pitanje a zatim biti u mogućnosti ići van i tražiti, koji zahtijeva više Kompleks kognitivni model. Način na koji se grade ti sustavi je za najveći dio vrlo, vrlo rada intenzivna. Oni uključuju ljude trošenja mnogo vremena strukturiranje načina na koji ove vrste rečenica može biti zastupljena u nekom logikom. Ona dobiva čak i malo složeniji, ipak. Čak i nakon što sam se bavila smo s semantike, mi ćemo i dalje morati gledati na pragmatika onoga što je rečeno. To je, kako mogu odnositi riječi da moram nešto fizički se postoji u svijetu ili barem neki izvor informacija da mogu manipulirati? Ponekad, to dovesti do divne komadići dvosmislenosti. "Crveno-vruće zvijezda oženiti astronom." U REDU. Sada, čitamo da kao smiješno vrsta naslov da bismo vidjeli na kasno noću TV jer mi ne tumače "Star" da imaju svoje značenje nebeskog tijela. Mi znamo da to znači više uobičajena glumac ili glumica s visokim količinama vidljivosti. "Momčad pomaže žrtvi pas ugristi." Je li to da je momčad zapravo tamo pomažući psa u ide okolo i grize žrtve? Ili je to da je pojedinac koji je bio ugrizla psa koji treba pomoć? Samo iz gleda na sintaksu i semantici rečenica, ne možemo utvrditi da. "Helikopter powered by ljudskih muhe." Postoje li, u stvari, stvarna sitnice leteći oko toga ljudi s krilima napajanje helikopteri za dobrobit čovječanstva? Ili postoji jedan mehanički uređaj koja crpi snagu iz osobom? Kada gledamo pitanje odgovaranje sustava, to su slojevi koje moramo baviti. Sada, najbolje i najviše vrsta od prevladava tih sustava Danas su u mogućnosti to učiniti stvari na razini koja se daleko izvan onoga što smo imali prije 10 godina. Evo jedan od najboljih sustava to je vani danas. A to je sustav IBM zove Watson. To je od naših prijatelja u IBM-u. To je Katherine banke, Jia Chen, i Priscilla Moraes nam daje demonstracija Watson jučer u IBM Yorktown. [VIDEO PLAYBACK] -Kako si? -Dobro sam. Ja sam uvijek sretna kad sam razmišljanja, pogotovo kada sam može ostati cool u ovim server sobama. Tko je vaš omiljeni glumica? -Moj Omiljeni glumica Angelina Jolie kao Lara Croft u Tomb Raider zbog njezina izvornika Oblik je kao virtualni lik poput mene. -Kako Watson može pomoći pacijentima? -je Plan za pacijente imati pristup Watson izravno? Pristup Watson savjetovanja aplikacija će se razlikovati od slučaja korištenja. Ali sada, Watson će samo pružiti Moguće dijagnoza i liječenje opcije za stručno medicinsko osoblje. Ako je potrebno, bolesnici mogu pružiti informacije da Watson, možda kroz Portal web sučelje, tableta, ili čak mobilni telefon. Na primjer, pacijent može biti zamoljeni da opišu svoje simptome u prirodnom jeziku izravno u Watson rješenja, čime je liječnik da se usredotoče na dijagnoza, a ne prikupljanje podataka. Tko ubijen Abraham Lincoln? -John Wilkes Booth. -U Je godine Arizona Diamondbacks osvojiti Svjetsko prvenstvo? -2001. [END PLAYBACK] BRIAN SCASSELLATI: Pa ove vrste sustava moraju osloniti na svega prepoznavanje govora; drugi, ga pretvoriti u jedan smisleni unutarnja zastupanje; a onda, treći, biti u mogućnosti otići van i naći izvor informacije koje omogućuje im da odgovor na to pitanje. Ova razina složenosti uključuje iste vrste programskih stvari da ste bili radi u problematičnim setovima. Mi smo u mogućnosti analizirati HTTP zahtjeva u ista vrsta low-level uzorak podudaranje koji ELIZA može učiniti. Mi smo u mogućnosti to pretvoriti one u unutarnje reprezentacije, a zatim ih koristiti za upit neke vanjske baze podataka, eventualno pomoću SQL. Sve od sustava koji se grade i danas učiniti ovu vrstu prirodnih jezična komunikacija se grade na ti isti principi. Sada, čak i sustav kao Watson nije dovoljno kompleksan biti u mogućnosti odgovoriti na proizvoljan pitanja o bilo kojoj temi. A u stvari, oni moraju biti strukturirani unutar određenog područja. Dakle, možete otići online i možete pronaći verzije Watson koje posluju dobro u medicinske informatike. Ili postoji jedan online samo da se bavi kako napraviti dobre preporuke o ono pivo će ići s kojima hrana. A unutar tih područja, može odgovoriti na pitanja, naći informacije koje su mu potrebne. Ali ne možete miješati i odgovaraju ih. Sustav koji je trenirao s bazom podataka hrane i piva ne rade dobro kada se iznenada stavite ga u s medicinskom informatike baza podataka. Pa čak i naši najbolji sustavi danas osloniti na razini obrade u kojoj su ručno kodiranje i zgrada u infrastrukturu kako bi kako bi ovaj sustav trčanje. Sada, zadnja tema želim biti u mogućnosti doći do danas o neverbalnoj komunikaciji. Velika masa informacija koje komuniciramo jedni s drugima ne doći kroz pojedine riječi koje se prijavljujete. To ima veze sa stvarima kao što su Blizina, pogled, tvoj ton glasa, Vaš infleksije. A to je i komunikacija nešto što mnogo različitih sučelja briga mnogo o tome. To nije ono što Siri stalo. Mogu pitati nešto širi u jedan glas ili u nekom drugom tonu glasa, i Siri će daj mi isti odgovor. Ali to nije ono što mi gradimo za mnoge druge vrste sučelja. Želim vam predstaviti Sada se jedan od robota. To je sagradio moj dugogodišnji prijatelj i kolega Cynthia Breazeal i njezina tvrtka Jibo. A to robot-- ćemo imati par volontera doći do interakciju s ovim. Dakle, mogu li dvoje ljudi spremni igrati s robotom za mene? Zašto ne dođeš gore, i zašto ne dolaze na gore. Ako bi mi se pridružiti ovdje, molim. A ako bih mogao si doći odmah ovdje. Hvala. Bok. ALFREDO: Drago mi je. Alfredo. BRIAN SCASSELLATI: Alfredo. Rachel: Rachel. BRIAN SCASSELLATI: Rachel. Drago mi oboje. Alfredo, ja ću vas ići prvi. Dođite ovdje. Idem predstaviti you-- ako ja mogu dobiti ovu off bez kucanja na microphone-- na malo robota po imenu Jibo. U REDU? Sada, Jibo je osmišljen kako bi biti interaktivan. I iako to može vam dati govor, mnogo interakcije s robotom je neverbalna. Alfredo, ja ću vas da reći nešto lijepo i besplatno na robota, molim. ALFREDO: Mislim da izgledaju slatko. [Zujanja SOUND] BRIAN SCASSELLATI: U redu. Njegov odgovor je ne verbalno. A ipak vam je dao i jasno priznanje da je čuo što je rekao i nekako shvatio da. U REDU? Korak natrag ovamo na sekundu. Hvala. Rachel, ako bi. Sada ću dati vam mnogo teže posao. Ako bih stajati ovdje, back up samo malo, tako možemo vam doći na kameru i gledati na taj način. Ja ću vas pitati nešto reći zapravo znači i gadno na robota. Rachel: Ono što se činilo učiniti je potpuno apsurdno. [Zuji SOUND] To je još više apsurdno. Što se događa s tobom? Ah, ne osjećam loše. Ja ću vam dati zagrljaj. BRIAN SCASSELLATI: U redu. Hvala, Rachel. Alfredo, Rachel, hvala dečki jako puno. [PLJESAK] Dakle, ova vrsta interakcije je u mnogo načina neke od istih pravila i neki od istog Struktura kao što smo možda u jezičnom interakcije. To je i komunikativan i služi važnu svrhu. I da interakcija u mnogo načina, osmišljen da imaju određeni učinak na Osoba interakciji sa ili slušanje robotu. Sada, ja sam dovoljno sretan imati Jibo danas ovdje. Sam Spaulding je ovdje pomoći nam se s robotom. A ja ću pitati Sam dati nas jedna lijepa demo Jibo ples da možemo gledati na kraju ovdje. Pa ići naprijed, Jibo. SAM: OK, Jibo. Pokaži nam svoje plesne pokrete. [Glazbom] BRIAN SCASSELLATI: U redu, svi. Zahvaljujući našim prijateljima u Jibo. [PLJESAK] A zahvaljujući našim prijateljima u IBM za pomaganje danas. Komunikacija je nešto da idete vidjeti dolazi sve više i više kao gradimo složenije sučelja. Sljedeći tjedan ćemo razgovarati o tome kako sučelje s računalnih protivnika u igrama. Ali, ako imate pitanja o tome, Ja ću biti ovdje na radnog vremena večeras. Sretan sam s vama razgovarati o AI teme ili da se u više detalja. Ugodan vikend. [PLJESAK] [Glazbom]