[Prehrávanie hudby] 

DAVID Malan: Toto je CS50. To je koniec týždňa 10. A chlapec, to máme dobrá trieda pre vás dnes. Sme tak nadšení pozvať dva Naši priatelia z Yale až sa nám dnes a pozrieť sa na križovatke umelá inteligencia, robotika, spracovanie prirodzeného jazyka, a ďalšie. 

A skutočne, cez Posledných pár týždňov, máme iste strávil veľa času, obzvlášť v skorších psets, so zameraním na detaily celkom nízkej úrovni. A to je veľmi ľahké stratiť zo zreteľa v lese stromy a dostať zavesil na slučky a podmienky a ukazovatele, určite, a podobne. Ale realita je vy teraz majú zložky, s ktorými sa môžete naozaj vyriešiť niektoré zaujímavé problémy, medzi nich tie, ktoré naši priatelia na Yale pracovať na tesne pred Cambridge. 

Takže mi dovoľte, aby som najprv predstaviť našu hlavu asistent pedagóga z Yale, Andy. 

[APPLAUSE] 

ANDY: Po prvé, len Ďakujeme ste pre umožnenie pár Yalies pop dole do Cambridge dnes. Naozaj si to vážim. Po druhé, k našim priateľom späť home-- Jasona, vďaka za pobyt a beh prednášku. Dúfam, že je to všetko dobré v New Haven. 

Tak jo, som super nadšený zaviesť Scaz dnes. Scaz prevádzkuje robotika laboratórium. Je to profesor, ako je päť rôzne oddelenia v Yale. Vo svojom laboratóriu, má mnoho, mnoho roboty, ktoré sa mu páči hrať. Má, ako je najúžasnejšie prácu na svete. A on sa dostáva do trochu neporiadok okolo sa, že po celý deň dlhé a robiť nejakú prácu, rovnako. 

A tak sme vlastne priniesli jeden Z nich sa s nami dnes. Takže bez ďalších okolkov, je Scaz bude pokračovať a predstaviť nás jeho priateľ robot. 

[APPLAUSE] BRIAN SCASSELLATI: Vďaka, David. Vďaka, Andy. Je to tak skvelé byť tu so všetkými dnes. Chcem byť najprv veľmi jasné, že Personál CS50 tu v Cambridge bol neuveriteľne pohostinní k nám. Sme tak vďační za všetko urobili, aby ste nás podporili. A tak sme chceli byť schopní vrátiť láskavosť. 

Takže dnes, dostaneme oznámiť že budeme mať novú, one-za-druhu CS50 udalostí deje v New Havene budúci týždeň. A to je CS50 Research Expo. Takže budeme pozývať everyone-- CS50 študentov, zamestnanci z oboch Harvarde a na Yale-- zostúpi a navštívte s nami v piatok. Budeme mať širokú škálu Over 30 rôznych ľudí, ktoré predstavujú a exhibiting-- upperclassmen ukazovať off niektoré zo svojich produktov výskumu. Budeme mať nejaké uvedenie do chodu, dokonca, hľadáte na trochu nových tech talent, nováčikov z oboch Harvarde a Yale. A budeme mať nejaké študentské skupiny hľadáte nejaké nové členstvo. 

Je to bude veľmi vzrušujúce doba. Dúfajme, že tie z vás, ktorí sú zostupujúcich pre hru Harvard-Yale bude schopný zastaviť o trochu skôr, priamo v centre areálu, Sterling Memorial Library. Budeme mať súbor Exponáty, ktoré siahajú od autonómnej plachetnica na spôsoby využitia softvéru zachovať stredovekých rukopisov. 

Budeme mať inzerát hoc siete a ľudia výučbový softvér kódovanie v Kapskom Meste. Budeme mať počítač hudobné ukážky. A budeme samozrejme mať viac robotov. Takže dúfame, že budete Pripojte sa k nám na túto akciu. To by malo byť veľa legrace, trochu jedla, a veľa zaujímavý veci hovoriť. 

Takže dnes, budeme hovoriť o spracovanie prirodzeného jazyka. A to je pokus o nás vybudovať nový spôsob prepojenia s našimi zariadeniami, pretože v posledných niekoľkých týždňoch, ste sa zameral na to, ako to je, že môžete písať kód, písať softvér to je spôsob, ako byť schopný povedať: stroj, to je to, čo chcem, aby si urobil. 

Ale nemali by sme nemusíte Očakávame, že všetko to je tam, že sa používa všetci na svete bude vedieť v tomto druhu výučby. Tak sme sa rozlišovať medzi počítačom jazyky a prírodné languages-- to znamená, že veci, ktoré ľudia používajú komunikovať s ostatnými ľuďmi. A snažíme sa budovať rozhranie, ktoré používajú Tieto prírodné komunikačné mechanizmy. 

Teraz, rovnako ako každý iný téma že sme začali s v CS50, budeme začať s najjednoduchšou bit spracovanie prirodzeného jazyka že môžeme predstaviť. Chystáme sa začať s Historická časť prirodzeného jazyka. A potom budeme stavať až do viac a viac novšie systémy a trochu sa pobaviť dema pozdĺž cesty. 

Takže budeme začať s tým, čo bolo pravdepodobne prvý prirodzený jazyk systém spracovania. Jednalo sa o softvérový systém napísaný v 1966 Joseph Weizenbaum volal Elizu. A ELIZA bol navrhnutý tak, aby replikovať druh interakcie by ste si s Rogerian psychoterapeut. Teraz, Rogerians, mali nápad, ktorý psychoterapia zapojené schopnosti odrážať späť pacientovi a hovoriť s nimi, v podstate tým, že len, že im maličký trochu terapeuta. To znamená, že všetko, čo že terapeut povedal, Mala to byť len odraz čo pacient hovoril k nim. 

Tak poďme skúsiť a to demo. Máme dobrovoľníka, ktorý by byť ochotný zdieľať svoje najhlbšie, najtemnejšie, a / alebo Fake tajomstvo s Elizy? Iste, prečo nejdeš hore. Fantastický. A vaše meno? 

MILES: Miles. 

BRIAN SCASSELLATI: Miles. Teší ma, Milesi. Ak by ste držať to. A ideme použite verziu Elizy že sme replikované v rámci CS50 IDE. A my sa pozrieme na zdroje Kód k tomu za chvíľu. Ale práve teraz, sme len bude to tiež vyvolať zadaním Eliza. 

A Eliza sa chystá dať vám odpovede že sa bude vo všetkých hlavných mestách. A bude vám položiť pár otázok. A budeme reagovať a zadajte v odpovediach na Elizy. Takže Eliza povedal: "Ahoj, ja som Elizu. Čo máš za problém?" Čo by ste chceli povedzte Elizu dnes? 

MILES: Môžem padať len spí keď mám zajačik papuče. 

BRIAN SCASSELLATI: Dobre. Dobre. 

[SMIECH] 

"Môžem len padať spiace s králičie papuče ďalej. " A Eliza hovorí: "Povedz, že nie majú nejaké psychické problémy? Možno, že je to dobrý indikátor. " 

OK. Takže to, čo by ste chceli odpovedať? 

MILES: Áno. 

BRIAN SCASSELLATI: Áno. Muž mnohých slov. Baví ma to. Eliza hovorí: "Vyzeráš celkom pozitívne." 

MILES: Nie, ja som v skutočnosti, elektrón. 

BRIAN SCASSELLATI: "Nie. V skutočnosti, som elektrón. " "Prišla si ku mne pretože ste elektrón? " Teraz môžeme vidieť niektoré z things-- Idem k zasielaniu pozastaviť len na sekundu, Milesi. Nechoď nikam. Ešte sme neskončili s vami doteraz. Eliza, v niektorých ohľadoch, reagovať na určité veci že on hovorí, ale bez žiadne skutočné porozumenie. A je to tiež papagájiť späť niektoré z častí svojho trestu. 

Tak sme si povedali, "Nie. V skutočnosti, som elektrón. " Eliza odpovedal späť, "Prišiel ste pre mňa, pretože ste elektrón? " Dobre. Poďme si dať ešte jednu odpoveď tu. Daj to dobrý, Miles. 

MILES: Dobrý človek? 

Áno, prosím, pomôžte mi. BRIAN SCASSELLATI: "Áno. Prosím, pomôžte mi. "" Si si istý? " MILES: Nie. BRIAN SCASSELLATI: Nie. "Čo to naznačuje pre vás?" 

MILES: Možno nie som elektrón. 

BRIAN SCASSELLATI: "I nemusí byť elektrón. " "Chceš povedať, že nie, len aby sa negatívne?" 

Dobre. Takže Miles, ďakujem moc. 

MILES: Ďakujem. 

BRIAN SCASSELLATI: Vďaka moc. [APPLAUSE] 

Takže tento program Eliza, v mnohých ohľadoch, reaguje len na kusy že sme poskytuje bez akýchkoľvek hlboké pochopenie toho, čo sa tu deje. Jedná sa o druh systému volal vzorov, kde hľadáme určitá kúsky textu, že sme potom bude trvať z toho, čo bola poskytnutá ako vstup, previesť, prípadne, nejakým spôsobom, a potom ju dať späť k užívateľovi. 

Vykonajte niektorý z vás si myslí, že Eliza je vlastne vykonávanie platné psychoanalýzu tu? Jeden človek, možno. 

Divákov: [Nepočuteľné]. BRIAN SCASSELLATI: A ako Znamená to, že máte pocit? Áno, v skutočnosti, že áno. A budeme vidieť, v skutočnosti sa zdrojový kód pre neho za chvíľu. A tak budete mať schopný robiť presne to. 

Teraz, Eliza je jedna z foriem, čo by sme nazvali dnes chat topánok. Je to len prechádza text, ktorý ste poskytujúce, poskytuje holé minimálnu čiastku porozumenie alebo spracovanie, a potom ju papagáje späť k vám. Takže poďme sa pozrieť, koncepčne, a hovoriť o tom, čo to je, že Eliza je skutočne robí. 

ELIZA berie sentence-- poďme povedal: "Chcem, aby zapôsobiť na svojho šéfa." A ELIZA hľadá prostredníctvom tejto vety a snaží sa nájsť a spĺňať určité vzory. Tak, napríklad, jeden zo vzorov že Eliza hľadá sú slová "Chcem." A kedykoľvek to uzná za niečo že má "ja chcem" v tom, formuluje odpoveď. A že odpoveď je pevný reťazec. V tomto prípade je to "prečo chceš?" A ja som dal malá hviezda na koniec, pretože to je jednoducho začiatok nášho reakcie. A hviezda naznačuje, že budeme brať po zvyšok of utterance-- užívateľa "zapôsobiť na svojho šéfa" - a budeme sa pripojiť, že na koniec tohto reťazca. 

Takže teraz, skôr než hovoriť, "prečo chcete zapôsobiť na svojho šéfa, " tam je trochu ďalší spracovania, ktoré budeme robiť. To znamená, že budeme musieť previesť niektoré zámen sem z "šéfom" na "svojho šéfa." A tam by mohlo byť niekoľko ďalších Zmeny, ktoré musíme urobiť. Takže skôr než len držať ju priamo na koniec, čo budeme robiť, je vezmeme zvyšku utterance-- užívateľa v bielom here-- a my si to jeden kus na čas a previesť každý reťazec tokenu, každé slovo, do vety. 

Tak sme si vezmem slovo "do". Neexistuje žiadna konverzie že musíme urobiť. "Impress". Neexistuje žiadna konverzie musíme tam robiť. "My", bude previesť na "svoj". A "boss" my len tak nechať ako "šéf". A nakoniec, čokoľvek , Ktorý končí na dobu, budeme previesť ho do otázky. 

Tento veľmi jednoduchý vzorov je vlastne celkom úspešný. A keď toto bolo zavedené v 1966-- Joseph Weizenbaum naprogramovaný to na počítači. Teraz, počítače v tej dobe neboli stolové modely. Boli zdieľané prostriedky. A jeho študenti by ísť a rozprávať sa s Elizy. Nakoniec musel obmedziť prístup k nemu pretože jeho študenti neboli získanie akejkoľvek práci. Oni boli len chatovanie s Elizy. A v skutočnosti, musel oheň jeho asistenta, ktorý strávil celý jej čas hovoriť s Elizy o jej hlbokých a znepokojujúce problémy. 

Každý, kto používa tieto systémy začal ich antropomorfizovat. Začali uvažovať o nich ako je živý a skutoční ľudia. Začali rozpoznať niektoré veci, ktoré hovorili sa vracali k nim. A oni boli zistiť, vecí o sebe. A v skutočnosti, dokonca aj odborníci, dokonca aj psychoterapeuti, sa začal obávať, že v skutočnosti, Možno ELIZA by ich nahradenie. A dokonca aj počítač Vedci strach, že sme boli tak blízko k riešeniu prirodzeného jazyka. 

Teraz, že nebol nikde v blízkosti pravda. Ale to je, ako pôsobivé tieto systémy môžu zdať. Takže poďme začať hľadať naspodku a skúste aby si trochu otázku kde tento kód vlastne stane. Takže urobíme tento kód k dispozícii neskôr. A to je veľmi jednoduché a priame prístav pôvodná implementácia ELIZA. 

Takže niektoré z týchto štylistický veci, ktoré budete vidieť tu sú štýlovo čo nie by sme chceli, aby si alebo to, čo sme sa učiť, aby si urobil. Ale my sme sa snažili udržať je rovnaké pre mnoho portov že táto má tak, že má chuť originálu. Takže budeme zahŕňať veľa vecí, a potom budeme mať sada kľúčových slov, vecí že ELIZA rozpozná a reagovať na priamo. Takže ak máte slová ako "môžeš", alebo "Ja nie", alebo "nie" alebo "áno" alebo "sen" alebo "ahoj", potom ELIZA selektívne reagovať na tieto. Budeme mať tiež určitý počet vecí, že budeme vymeniť, rovnako ako konverzie "my" na "svoj". 

A potom budeme mať súbor odpovedí že pre každý z týchto kľúčových slov, budeme otáčať cez tieto rôzne reakcie. Takže keď hovorím "áno" trikrát v rade, som mohol dostať tri rôzne Odpovede od Elizy. Náš kód, potom je vlastne pozoruhodne jednoduchá. Ak by som posunúť nadol za všetky z nich reakcie, ktoré sme programované a dostaneme sa do našej hlavnej, budeme inicializovať niekoľko rôznych premenných a urobiť trochu domácnosť na začiatku. Ale potom je tu absolútne sada kódu, ktorý vám môže pochopiť. Jeden veľký while, ktorý hovorí, že som bude opakovať znovu a znovu. Prečítam v rade, a budem obchod, ktorý vo vstupnom reťazci. Pozriem sa a uvidíme, či to je špeciálny kľúčové slovo "bye", ktorý znamená, ukončite program. A potom budem skontrolovať a zistiť, či niekto sa len opakujú znova a znova. A ja budem kričať na ne, ak to robia. Poviem "neopakovať sa." 

Tak dlho, ako nikto z tých nestane, budeme potom kontrolovať a prechádzať, na tratiach 308 až 313 tu, a kontrolovať a vidieť sú niektoré z týchto kľúčových slov vety obsiahnuté vo vstupe že som práve dal? Ak je zhoda pre nich, dobre Potom budem pamätať toto miesto. Budem si to pamätať kľúčové slovo. A ja budem môcť vybudovať odpoveď. 

Ak nemám nájsť jednu, no a potom, posledná vec v mojom poli kľúčového slova bude môj predvolený odpovede, keď nič iné stretnutia. Opýtam sa na otázky typu: "Prečo si sem prišiel? "alebo" Ako vám môžem pomôcť? " ktoré sú len čiastočne vhodné bez ohľadu na to, čo je vstup. 

Budeme potom vybudovať Elizy reakciu. Budeme môcť vziať že základňa reakcia, ako sme to urobili v tom, že "môj šéf" príkladom. Ak je to všetko, čo tam je--, ak je to len jeden Reťazec, ktorý mám respond-- Môžem len poslať ju späť. Ak má hviezdičku na jej koniec, potom budem spracovávať jednotlivé token zvyšok odozvu užívateľa a pridať tie, zámenu slovo od slova, ako potrebujem. 

To všetko je úplne niečo, čo by ste mohli postaviť. A v skutočnosti, spôsob, akým sme sa Spracovali argumenty príkazového riadku, spôsob, akým máte spracované prostredníctvom HTTP požiadaviek sa riadi rovnakými druhmi pravidiel. Sú vzorov. 

Takže Eliza mali pomerne dôležitý vplyv na prirodzeného jazyka pretože to robilo sa mohlo zdať, ako by to bol veľmi dosiahnuteľný cieľ, ako by sme boli nejako byť schopný vyriešiť tento problém priamo. Teraz, že to neznamená, že Eliza robí všetko, čo by som chcel robiť. Rozhodne nie. Ale mali by sme byť schopní urobiť niečo viac. 

Naším prvým krokom ísť za ELIZA sa deje aby bolo možné sa na Nie je text zadaný do klávesnice, ale reči, skutočné reč zaznamenané do mikrofónu. Takže, ako sa pozeráme na tieto rôzne kúsky, my sme bude musieť vybudovať sadu modelov. Budeme musieť byť schopní ísť z low-hladina akustického information-- ihrisko, amplitúda, frequency-- a previesť že do Niektoré jednotky, ktoré sme schopný ľahšie manipulovať a konečne, manipulovať s nimi do slov a viet. 

Takže väčšina rozpoznávanie reči systémy, ktoré sú tam dnes nasledovať štatistický model, v ktorom staviame tri samostatné reprezentácia toho, čo že zvukový signál v skutočnosti obsahuje. Začneme s fonetickým modelom že hovorí len o základni Znie to, že som produkovať. Som produkovať niečo, čo je B ako chlapec, alebo D, ako v pes? Ako môžem spoznať tie dve rôzne telefóny sú oddelené a odlišné? 

Na vrchole sa, že budeme potom stavať slovo výslovnosť model niečo, čo spája tieto jednotlivé telefóny a kombinuje ich do slova. A po tom, vezmeme slová a my zostaviť z nich s jazykom modelovať v kompletnej vetu. 

Teraz budeme hovoriť o sebe z nich samostatne a oddelene. Ale tieto tri modely sú všetky len bude štatistiky. A to znamená, že keď sme sa pracovať s nimi, budeme byť schopný pracovať s ich všetky naraz. Dobre. Začnime s naším fonetickú modelom. Takže fonetickej modely sa spoliehajú na Výpočtová technika volal skryté Markovovy modely. Tie sú grafické modely, v ktorých I majú a uznať stav sveta ako sa vyznačuje tým, sadou funkcií. A že štátna opisuje jednu časť žaloby, že som zaoberal. 

Takže ak si myslím o tom, zvuk "ma", ako matka, existujú rôzne komponenty za týmto zvukom. Je tu časť, kedy som sa čerpať v dychu. A potom som peňaženku pery. A ja vrátiť moje pery trochu pozadu bit, aby to "ma" zvuk. A potom je tu spúšť. Moje pery príde od seba. Vzduch je vylúčený. "Ma". 

Tieto tri rôzne časti boli zastúpené štáty v tejto graph-- začiatok, stred a koniec. A ja by som mať prechody, ktoré mi umožnilo cestovať z jedného štátu do druhého s určitou pravdepodobnosťou. Tak, napríklad, že M zvuk môže mať veľmi, veľmi krátka príjem na beginning-- "mm" - a potom dlhšia, vibračné fázy, kde som držal môj pery a takmer humming-- "mmmm" - a potom veľmi krátky plosive, kde som vyhnať breath-- "ma". 

Skrytý Markov model je navrhnutá tak, aby zachytenie skutočnosť že spôsob, ktorým sa zaoberám že zvuk "ma" sa deje sa mierne líšiť v jeho načasovanie, je frekvencia, a jeho funkcie, ako tak, že ste to urobiť alebo tak, že by som mohol robiť to, keď hovorím o rôznych použití listu. "Matka" a "Môžem" vôľa znieť trochu inak. 

Takže uznávajú Najmä zvuk, by sme stavať Markov modely, tieto skryté Markov modely, z každej možnej telefón, ktorý ja chcieť poznať, všetky možné zvuk, a potom sa pozrite na akustické údaje, že mám a určiť štatisticky ktorý z nich je s najväčšou pravdepodobnosťou jedným aby boli vyrobené tento zvuk. OK. S týmto modelom, potom sme začať stavať na vrchole. Berieme výslovnosť model. Teraz, niekedy výslovnosť modely sú jednoduché a ľahko pretože tam je len jeden spôsob, ako sa vyslovuje niečo. Inokedy sú to trochu zložitejšie. Tu je výslovnosť sprievodca za týmto červenú vec, ktorá je ovocie, ktoré stránky ako kečup z. Ľudia si nemyslím, že je to ovocie. Je to tak? 

Teraz máme k dispozícii mnoho rôznych spôsobov, že ľudia budú vyslovovať to slovo. Niektorí budú hovoriť "prst-May-prst." Niektorí budú hovoriť "špičkou Mah-prst." A môžeme zachytiť, že sa jeden z týchto grafických modelov kde, opäť, zastupujeme prechody tak, že má určitú pravdepodobnosť a spojené pravdepodobnosť s nimi. 

Takže v tomto prípade, keby som mal nasledovať horná trasa cez celý tento graf, Chcem sa začína na písmeno úplne vľavo, ďalej len "tá" zvuk. Chcel by som mať hornú polovicu, ďalej len "ach," a potom "ma," a potom "A" a potom "tá", a "oh." "Toe-may-toe." Keby som vzal spodnej cestou cez to, dostanem "Ta-Mah-prst." A keď som išiel dole a potom up, tak by som si "TA-May-prst." 

Tieto modely zachytiť tieto Rozdiely pretože kedykoľvek sme sa nasadiť jeden z nich systémy rozpoznávania, to bude musieť pracovať s veľa rôznych druhov ľudí, veľa rôznych prízvukov, a dokonca aj rôzne použitia rovnakých slov. A konečne, v hornej časti, ktorý, budeme budovať niečo, čo že vyzerá naozaj zložité, volal jazykový model, ale v skutočnosti je najjednoduchšie tri, pretože sa v týchto pretekoch na to, čo sa nazýva n-gram modely. A v tomto prípade, som ukazovať vás dvojdielny n-gram modelu, je bigram. Budeme robiť fyzické myšlienku že niekedy, určité slová sú s väčšou pravdepodobnosťou nasledovať vzhľadom k tomu, slovo, než ostatní. Ak by som len povedal: "predpoveď počasia," ďalšie slovo by mohla pravdepodobne byť "dnes" alebo by mohli byť "počasie počasie zajtra. " Ale je to nepravdepodobné, že byť " predpoveď počasia artičok. " 

Aký jazykový model robí, je zachytáva tie štatisticky tým, že počíta, od niektorých veľmi veľký korpus, všetky inštancie v ktorom jedno slovo nasleduje druhý. Takže keď vezmem veľkú corpus-- ako každý Wall Street Journal ktorý bol vyrábaný od roku 1930, ktorý je jedným zo štandardných corpuses-- a ja sa cez všetky že text, a počítam up Koľkokrát po "počasie" nevidím "dnes" a koľkokrát môžem vidieť "počasie" a následne "artičoky," prvý sa deje byť oveľa pravdepodobnejšie. Bude to vyzerať oveľa častejšie. A tak to bude mať vyššiu Pravdepodobnosť, s ním spojené. 

Ak chcem prísť na pravdepodobnosť, že celé príhovory, potom som sa s tým skonči. Takže pravdepodobnosť sluchu veta "krysa jedol syr" je pravdepodobnosť slová "the" začína vetu, a pravdepodobnosť, že Slovo "krysa" nasleduje slovo "uzávierky," a pravdepodobnosť, že Slovo "jedol" nasleduje "krysa," a pravdepodobnosť, že "syr" nasleduje "jedol." 

To znie ako veľa štatistiky, veľa pravdepodobnosťou. A to je všetko, čo to je. Ale úžasná vec je, ak to budete robiť s dostatočne veľkou vzorky dát, funguje to. A funguje to ohromne dobre. Všetci vieme, že tieto technológie. Väčšina operačných systémov prísť s rozpoznávanie hlasu v tomto bode. Používame Siri a Cortana a Echo. A tieto veci sú založené na Tento typ trojvrstvové model-- fonetickej modelu na dne, A Výslovnosť model v polovici, a model jazyk nad nimi. 

Teraz, čo musíte urobiť trochu viac než aby odpovedal na otázky. Ale uznanie toho, čo ste porekadlá závisí práve na tom. Takže poďme sa vziať príklad tu. Takže mám môj telefón tu hore pod kamerou dokumentov. A budeme sa žiada SIRI na pár otázok. Dobre? 

Takže poďme sa prebudiť môj telefón tu. Siri, aké je počasie rovnako ako v New Haven dnes? 

SIRI: Tu je počasie New Haven, Connecticut dnes. 

BRIAN SCASSELLATI: OK. Takže najprv ste videli, že Siri uznaná každý z jednotlivých slov a potom produkoval odpoveď. Porozprávame sa o tom, ako túto odpoveď príde za chvíľu. Ale teraz, keď vieme, že je to len na základe Na surovín štatistiky a to vzorov typ prístupu, môžeme hrať nejaké hry s Siri. 

Tak som sa to skúsiť znova. Siri, aké je počasie hroch New Haven, dnes? 

SIRI: OK. Tu je počasie pre New Haven, Connecticut pre dnešok. BRIAN SCASSELLATI: Siri je nie odradiť, že pretože to našiel pattern-- "počasie", "dnes", "New Haven." To je to, čo to reagovať sa, rovnako ako Elizu. Dobre. Poďme si dať ešte jeden ešte viac smiešny príklad. Siri, počasie artičok pásavec hrocha New Haven? 

SIRI: Dovoľte mi, aby som skontrolovať, že. Tu je to, čo som našiel na webe za to, čo sú artičoky pásavec hroch New Haven. 

BRIAN SCASSELLATI: OK. Takže keď som dostatočne ďaleko sa z tohto modelu, Som schopný zameniť, pretože to nie je už zodpovedá vzoru, že má. A že štatistická motor, ktorý hovorí, aká je pravdepodobnosť, že máte Slová hroch a artičok dohromady, a pásavec? To musí byť niečo nové. 

Takže týchto technológií každý deň používame. Ak chceme, aby sa im jeden krok Ďalej, aj keď, ak sme vlastne chcete byť schopní hovoriť o tom, čo je, že tieto systémy sú reagovať na, musíme hovoriť, opäť, asi viac základná sada otázok. A to je téma v komunikácii že hovoríme otázka záznamník. To znamená, že chceme byť schopní to-- jo? Divákov: [Nepočuteľné]. BRIAN SCASSELLATI: Získame do latentnej sémantickej spracovania? Takže áno. Existuje veľa vecí, ktoré sú deje pod povrchom s Siri a v niektorých z príkladov Chystám sa vám ukázať ďalšie tam, kde je dosť pokiaľ ide o štruktúru z toho, čo hovoríte, že je to dôležité. A v skutočnosti, že je to skvelý predchodca pre ďalšiu snímku pre mňa. 

Takže rovnakým spôsobom, že naše rozpoznávanie reči bola vybudovaná z niekoľkých vrstiev, ak chceme pochopiť, čo to je, že to vlastne Ako už bolo povedané, budeme znovu spoliehajú na analýze viacvrstvového textu, ktorý je práve uznaný. Takže keď Siri je skutočne schopný povedzme, pozri našiel som tieto slová. A teraz čo mám robiť s nimi? Prvá zložka je často prejsť a pokúsiť sa analyzovať štruktúra vety. A v čom sme videli na základnej škole, často, ako druh diagramov vety, ideme uznať, že niektoré slová majú určité role. Sú to podstatné mená. Sú to zámená. Jedná sa o slovesá. A ideme rozpoznať že pre určitý gramatiky, v tomto prípade anglickej gramatiky, tam sú platné spôsoby, ako som im možno kombinovať a ďalšie spôsoby, ktoré nie sú platné. 

Že uznanie, že štruktúra, by mohlo byť dosť, aby nás viedol pomôcť trochu. Ale to nie je dosť aby sme boli schopní dať pričom akýkoľvek význam toho, čo bolo povedané tu. K tomu, budeme musieť spoliehať na nejaké množstvo sémantickej spracovanie. To znamená, že budeme musieť pozrieť na spodnej, čo každý z týchto slov skutočne vykonáva ako význam. A najjednoduchší spôsob, ako robiť to, budeme stýkať sa s každým slovom že vieme, že určité funkcie, určité transformácie, ktorá jej umožňuje stáť. 

V tomto prípade, mohli by sme označte štítkom Slovo "John", ako o vlastné meno, že to so sebou nesie identity. A môžeme označiť "Mary", ako je rovnakým spôsobom. Vzhľadom k tomu, sloveso ako "lások", ktoré predstavuje osobitný vzťah že sme schopní reprezentovať. Teraz, to neznamená, že sme pochopili, čo je láska, ale len to, že sme pochopili, že v ceste symbolického systému. To znamená, že môžeme označiť to a manipulovať s ňou. 

S každou z týchto typov prístupov, akýkoľvek typ sémantické spracovanie Tu bude trochu požadovať bit znalostí a veľa práce z našej strany. Sme už v ríši kde proste štatistika sa bude dosť pre nás. Teraz, aby sa ísť od tohto bodu toho, že je schopný hovoriť o vnútrajšku čo sa to vlastne deje, k schopnosti manipuláciu s touto štruktúru a pochopiť otázku a potom budú môcť ísť von a hľadať, , Ktorá vyžaduje viac komplexné poznávacie modelu. 

Spôsob, akým sú postavené tieto systémy je z väčšej časti veľmi, veľmi práce intenzívny. Zahŕňajú ľudí utrácať veľké množstvo času štruktúrovanie spôsobov, ktorý tieto druhy viet môžu byť reprezentované v niektorých logike. To dostane dokonca aj trochu zložitejšie, hoci. 

Ani raz sa vysporiadame sa sémantikou, budeme ešte sa pozrieť na pragmatika toho, čo bolo povedané. To znamená, že ako mám sa vzťahujú slová že musím niečo fyzicky von existuje vo svete, alebo na aspoň niektoré informačný zdroj že môžem manipulovať? 

Niekedy tieto viesť k nádherné kúsky nejasností. "Red-hot hviezda oženiť astronóma." OK. Teraz, čítame, že ako funny typ titulku že by sme vidieť na neskoré nočné televíziu pretože nemáme interpretovať "hviezda" mať jeho nebeské teleso význam. Vieme, že to znamená, že čím viac samozrejmosť herec alebo herečka s vysokým množstvom viditeľnosti. 

"Squad pomáha pohryznutím obeť." Je možné, že tím je vlastne tam pomôcť psa V deje okolo a hrýzť obete? Alebo je možné, že tam bolo jednotlivec, ktorý bol pohrýzol pes, ktorý potreboval nejakú pomoc? Len z pohľadu na syntax a sémantika viet, nemôžeme určiť, že. 

"Vrtuľník poháňaný ľudskými muchy." Existujú, v skutočnosti, skutočná malé veci, lietajúce okolo toho Sú to ľudia s krídla napájanie vrtuľníky pre dobro ľudstva? Alebo je tam raz mechanické zariadenie že odvodzuje svoju moc od osoby? 

Keď sa pozrieme na otázku, záznamníky systémy, to sú vrstvy, ktoré musíme sa zaoberať. Teraz, najlepšie a najviac druh z prevládajúci týchto systémov dnes sú schopní urobiť veci na úrovni, ktorá sú ďaleko za to, čo sme mali pred 10 rokmi. Tu je jeden z najlepších systémov že je tam dnes. A to je systém od IBM volal Watson. To je od našich priateľov v IBM. To je Katherine banky, Jia Chen, a Priscilla Moraes nám dáva ukážka Watson včera v IBM Yorktown. [Videoprehrávanie] -Ako sa máš? 

-Mám sa dobre. Ja som vždy rád, keď som myslenie, zvlášť keď som môžu zostať v pohode v týchto serverovniach. Kto je vaša obľúbená herečka? 

-Môj Obľúbená herečka Angelina Jolie ako Lara Croft v Tomb Raider, pretože jej pôvodný forma bola ako virtuálne postavy, ako som ja. 

-Ako Môže Watson pomôcť pacientom? 

-je Plán pre pacientov do majú prístup k Watson priamo? Prístup k Watson poradenstvo Žiadosti sa líši podľa prípad použitia. Ale v súčasnej dobe, Watson bude poskytovať iba možná diagnóza a liečba Možnosti k zdravotníckym pracovníkom. Tam, kde je to vhodné, pacienti môže poskytnúť informácie Watsona, snáď prostredníctvom portálu webové rozhranie, tabliet, alebo dokonca mobilný telefón. Napríklad, môže byť pacient žiadal, aby opisoval ich symptómy v prirodzenom jazyku priamo do roztoku Watson, umožňuje lekár zamerať sa na diagnostika a nie zhromažďovanie údajov. 

Kto zavraždil Abraham Lincoln? 

-John Wilkes Booth. 

-V Čo rok robil Arizona Diamondbacks vyhrať svetovej série? 

-2001. 

[END Prehrávanie] 

BRIAN SCASSELLATI: So tieto druhy systémov musieť spoliehať na prvom rade rozpoznávať reč; Druhá, prevod do zmysluplnej internej zastúpenie; a potom, za tretie, budú môcť ísť von a nájsť zdroj informácií, ktoré im umožňuje odpovedať na túto otázku. Táto úroveň zložitosti zahŕňa rovnaké typy programových vecí že ste boli robí v problémových sadách. 

Sme schopní analyzovať HTTP požiadaviek v rovnaký typ low-level vzorom zhoda, že Eliza môže robiť. Sme schopní previesť tie, do vnútornej reprezentácie, a potom použiť k dotazu niektorej externé databázy, prípadne pomocou SQL. Všetky systémy, ktoré sú dnes postavené robiť tento typ prírodného jazyková komunikácia sú postavené na tie isté zásady. 

Teraz, dokonca aj systém, ako je Watson nie je dosť zložitý aby bol schopný odpovedať na ľubovoľný otázky týkajúce sa akejkoľvek tému. A v skutočnosti, že majú byť štruktúrované v danej oblasti. Takže sa môžete ísť on-line a môžete nájsť verzia Watson, ktoré fungujú dobre v medicínskej informatike. Alebo je tu ešte jedna on-line že práve spoločnosti s tým, ako aby dobré odporúčania k Aké pivo pôjde, s ktorými potraviny. A v týchto oblastiach, je schopný odpovedať na otázky, nájsť informácie, ktoré potrebuje. 

Ale nemôžete kombinovať ich. Systém, ktorý je vyškolený s databázou potravín a piva nefunguje dobre, keď sa náhle dať sa do lekárskej informatiky databáz. Takže aj naše najlepšie systémy dnes spoliehajú na úrovni spracovania v ktorých sú ručne kódovanie a Stavebné do infraštruktúry za účelom aby tento systém bežať. 

Teraz, posledný téma chcem aby bolo možné sa dostať do dneška je o neverbálnej komunikácie. Veľké množstvo informácií, ktoré sme sa navzájom komunikovať neprichádza o prostredníctvom jednotlivé slová, že sme sa uchádzate. To má čo do činenia s vecami, ako je blízkosť, zadívať, váš tón hlasu, Váš skloňovanie. A že komunikácia je tiež niečo, že mnoho rôznych rozhraní záleží veľa o. To nie je to, čo sa stará o Siri. Môžem sa opýtať Siri niečo jedným hlasom alebo iným tónom, a Siri to bude daj mi rovnakú odpoveď. Ale to nie je to, čo budujeme pre mnoho ďalších typov rozhraní. 

Chcem ťa predstaviť Teraz k jednému z robotov. To bol postavený môj dlhoročný priateľ a kolega Cynthia Breazeal a jej spoločnosť Jibou. A to robot-- ideme mať pár dobrovoľníkov prísť k interakcii s tým. Takže môžem mať dvaja ľudia ochotní hrať s robotom pre mňa? Prečo ste prišiel hore, a prečo nejdeš hore. Keby si mi spojiť tu, prosím. 

A ak by som mohol mať ťa ísť rovno sem. Vďaka. Ahoj. 

ALFREDO: Teší ma. Alfredo. 

BRIAN SCASSELLATI: Alfredo. 

Rachel: rachel. BRIAN SCASSELLATI: Rachel. Teší ma oboje. Alfredo, budem musieť ísť ako prvý. Poďte sem. Chystám sa predstaviť vás-- či môžem dostať to preč bez zaklopania na microphone-- na malý robot menom Jibou. OK? 

Teraz, Jibou je navrhnutý tak, aby interaktívne. A aj keď to môže dať vám reč, veľa z interakcie s robotom je neverbálne. Alfredo, budem vás požiadať, aby ste hovoriť niečo pekného a zadarmo na robota, prosím. ALFREDO: Myslím si, že vyzerať roztomilo. 

[Vrčanie SOUND] BRIAN SCASSELLATI: OK. Jeho odpoveď nie je verbálne. A napriek tomu, že vám dal oba jasné potvrdenie že počul, čo ste povedal, a tiež nejako rozumie sa, že. OK? Krok späť tu na jednu sekundu. Ďakujem. 

Rachel, ak by ste. Teraz, budem dávať Si oveľa ťažšia úloha. Ak by ste sa stať tu, zálohovať len trochu tak, môžeme dostať vás na kameru a pozrieť sa týmto spôsobom. Budem sa vás opýtať na niečo povedať vlastne znamená a škaredý na robote. 

Rachel: Čo sa mi zdalo urobiť, bolo úplne absurdné. 

[Brum] 

To bolo ešte absurdnejšie. Čo sa to s tebou deje? Ále, necíti zle. Dám vám objať. BRIAN SCASSELLATI: Dobre. Vďaka, Rachel. Alfredo, Rachel, vďaka chlapci moc. 

[APPLAUSE] 

Takže tento druh interakcie má v mnoho spôsobov, ako niektorí z rovnakých pravidiel a niektoré tie isté štruktúra ako to, čo sme môže mať v jazykovej interakcie. Je to ako komunikatívna a slúži dôležitý účel. A to interakcie, v mnoho spôsobov, je navrhnutý tak, aby mal osobitný účinok na osoba interakciu s alebo počúvaní k robotu. 

Teraz, ja som to šťastie, mať Jibou tu dnes. Sam Spaulding je tu pomôcť nás z s robotom. A ja som sa opýtať Sam dať sme raz pekné demo Jibou tance ktoré môžeme pozorovať na konci sem. Tak choďte do toho, Jibou. 

SAM: OK, Jibou. Ukáž nám svoje tanečné pohyby. 

[Prehrávanie hudby] BRIAN SCASSELLATI: Dobre, všetci. Vďaka našim priateľom v Jibou. 

[APPLAUSE] 

A vďaka našim priateľom na IBM za pomoc dnes. Komunikácia je niečo, že ideš vidieť, prichádza stále viac a viac as staviame zložitejších rozhraní. Budúci týždeň budeme hovoriť o tom, ako sa rozhranie s počítačovými oponentov v hrách. Ale ak máte otázky týkajúce sa tohto, Budem sa okolo úradné hodiny večer. Som rád, že s vami hovoriť o AI témy alebo sa dostať do väčších detailov. Prajem krásny víkend. 

[APPLAUSE] [Prehrávanie hudby]