[Přehrávání hudby] 

DAVID Malan: Toto je CS50. To je konec týdne 10. A chlapec, to máme dobrá třída pro vás dnes. Jsme tak nadšeni pozvat dva Naši přátelé z Yale až se nám dnes a podívat se na křižovatce umělá inteligence, robotika, zpracování přirozeného jazyka, a další. 

A skutečně, přes Posledních pár týdnů, máme jistě strávil spoustu času, obzvláště v časnějších psets, se zaměřením na detaily docela nízké úrovni. A to je velmi snadné ztratit ze zřetele v lese stromy a dostat zavěsil na smyčky a podmínky a ukazatele, určitě, a podobně. Ale realita je vy nyní mají složky, se kterými se můžete opravdu vyřešit některé zajímavé problémy, mezi nich ty, které naši přátelé na Yale pracovat na těsně před Cambridge. 

Takže mi dovolte, abych nejprve představit naši hlavu asistent pedagoga z Yale, Andy. 

[POTLESK] 

ANDY: Za prvé, jen Děkujeme jste pro umožnění pár Yalies pop dolů do Cambridge dnes. Opravdu si toho vážím. Za druhé, k našim přátelům zpět home-- Jasona, díky za pobyt a běh přednášku. Doufám, že je to všechno dobré v New Haven. 

Tak jo, jsem super nadšený zavést Scaz dnes. Scaz provozuje robotika laboratoř. Je to profesor, jako je pět různá oddělení v Yale. Ve své laboratoři, má mnoho, mnoho roboty, které se mu líbí hrát. Má, jako je nejúžasnější práci na světě. A on se dostává do trochu nepořádek kolem se, že po celý den dlouhé a dělat nějakou práci, stejně. 

A tak jsme vlastně přinesli jeden Z nich se s námi dnes. Takže bez dalších okolků, je Scaz bude pokračovat a představit nás jeho přítel robot. 

[POTLESK] BRIAN SCASSELLATI: Díky, David. Díky, Andy. Je to tak skvělé být zde se všemi dnes. Chci být nejprve velmi jasné, že Personál CS50 tady v Cambridge byl neuvěřitelně pohostinní k nám. Jsme tak vděční za všechno udělali, abyste nás podpořili. A tak jsme chtěli být schopni vrátit laskavost. 

Takže dnes, dostaneme oznámit že budeme mít novou, one-za-druhu CS50 událostí děje v New Havenu příští týden. A to je CS50 Research Expo. Takže budeme zvát everyone-- CS50 studentů, zaměstnanci z obou Harvardu a na Yale-- sestoupí a navštivte s námi v pátek. Budeme mít širokou škálu Over 30 různých lidí, které představují a exhibiting-- upperclassmen ukazovat off některé ze svých produktů výzkumu. Budeme mít nějaké uvedení do chodu, dokonce, hledáte na trochu nových tech talent, nováčky z obou Harvardu a Yale. A budeme mít nějaké studentské skupiny hledáte nějaké nové členství. 

Je to bude velmi vzrušující doba. Doufejme, že ty z vás, kteří jsou sestupujících pro hru Harvard-Yale bude schopen zastavit o trochu dříve, přímo v centru areálu, Sterling Memorial Library. Budeme mít soubor Exponáty, které sahají od autonomní plachetnice na způsoby využití softwaru zachovat středověkých rukopisů. 

Budeme mít inzerát hoc sítě a lidé výukový software kódování v Kapském Městě. Budeme mít počítač hudební ukázky. A budeme samozřejmě mít více robotů. Takže doufáme, že budete Připojte se k nám na tuto akci. To by mělo být hodně legrace, trochu jídla, a hodně zajímavý věci mluvit. 

Takže dnes, budeme mluvit o zpracování přirozeného jazyka. A to je pokus o nás vybudovat nový způsob propojení s našimi zařízeními, protože v posledních několika týdnech, jste se zaměřil na to, jak to je, že můžete psát kód, psát software to je způsob, jak být schopen říci: stroj, to je to, co chci, abys udělal. 

Ale neměli bychom nemusíte Očekáváme, že všechno to je tam, že se používá všichni na světě bude umět v tomto druhu výuky. Tak jsme se rozlišovat mezi počítačem jazyky a přírodní languages-- to znamená, že věci, které lidé používají komunikovat s ostatními lidmi. A snažíme se budovat rozhraní, která používají Tyto přírodní komunikační mechanismy. 

Nyní, stejně jako každý jiný téma že jsme začali s v CS50, budeme začít s nejjednodušší bit zpracování přirozeného jazyka že můžeme představit. Chystáme se začít s Historická část přirozeného jazyka. A pak budeme stavět až do více a více novější systémy a trochu se pobavit dema podél cesty. 

Takže budeme začít s tím, co bylo pravděpodobně první přirozený jazyk systém zpracování. Jednalo se o softwarový systém napsaný v 1966 Joseph Weizenbaum volal Elizu. A ELIZA byl navržen tak, aby replikovat druh interakce byste si s Rogerian psychoterapeut. Nyní, Rogerians, měli nápad, který psychoterapie zapojeny schopnosti odrážet zpět pacientovi a mluvit s nimi, v podstatě tím, že jen, že jim maličký trochu terapeuta. To znamená, že vše, co že terapeut řekl, Měla to být jen odraz co pacient říkal k nim. 

Tak pojďme zkusit a to demo. Máme dobrovolníka, který by být ochoten sdílet své nejhlubší, nejtemnější, a / nebo Fake tajemství s Elizy? Jistě, proč nejdeš nahoru. Fantastický. A vaše jméno? 

MILES: Miles. 

BRIAN SCASSELLATI: Miles. Těší mě, Milesi. Pokud byste držet to. A jdeme použijte verzi Elizy že jsme replikovány v rámci CS50 IDE. A my se podíváme na zdroje Kód k tomu za chvíli. Ale právě teď, jsme jen bude to také vyvolat zadáním Eliza. 

A Eliza se chystá dát vám odpovědi že se bude ve všech hlavních městech. A bude vám položit pár otázek. A budeme reagovat a zadejte v odpovědích na Elizy. Takže Eliza řekl: "Ahoj, já jsem Elizu. Co máš za problém?" Co byste chtěli řekněte Elizu dnes? 

MILES: Mohu padat jen spí když mám zajíček pantofle. 

BRIAN SCASSELLATI: Dobře. Dobře. 

[SMÍCH] 

"Mohu jen padat spící s králičí pantofle dále. " A Eliza říká: "Řekni, že ne mají nějaké psychické problémy? Možná, že je to dobrý indikátor. " 

DOBŘE. Takže to, co byste chtěli odpovědět? 

MILES: Ano. 

BRIAN SCASSELLATI: Ano. Muž mnoha slov. Baví mě to. Eliza říká: "Vypadáš docela pozitivní." 

MILES: Ne, já jsem ve skutečnosti, elektron. 

BRIAN SCASSELLATI: "Ne. Ve skutečnosti, jsem elektron. " "Přišla jsi ke mně protože jste elektron? " Nyní můžeme vidět některé z things-- Jdu k zasílání pozastavit jen na vteřinu, Milesi. Nechoď nikam. Ještě jsme neskončili s vámi dosud. Eliza, v některých ohledech, reagovat na určité věci že on říká, ale bez žádné skutečné porozumění. A je to také papouškovat zpět některé z částí svého trestu. 

Tak jsme si řekli, "Ne. Ve skutečnosti, jsem elektron. " Eliza odpověděl zpátky, "Přišel jste pro mě, protože jste elektron? " Dobře. Pojďme si dát ještě jednu odpověď zde. Dej to dobrý, Miles. 

MILES: Dobrý člověk? 

Ano, prosím, pomozte mi. BRIAN SCASSELLATI: "Ano. Prosím, pomozte mi. "" Jsi si jistý? " MILES: Ne. BRIAN SCASSELLATI: Ne. "Co to naznačuje pro vás?" 

MILES: Možná nejsem elektron. 

BRIAN SCASSELLATI: "I nemusí být elektron. " "Chceš říct, že ne, jen aby se negativní?" 

Dobře. Takže Miles, děkuji moc. 

MILES: Děkuji. 

BRIAN SCASSELLATI: Díky moc. [POTLESK] 

Takže tento program Eliza, v mnoha ohledech, reaguje jen na kusy že jsme poskytuje bez jakýchkoli hluboké pochopení toho, co se tu děje. Jedná se o druh systému volal vzorů, kde hledáme určitá kousky textu, že jsme pak bude trvat z toho, co byla poskytnuta jako vstup, převést, případně, nějakým způsobem, a pak ji dát zpět k uživateli. 

Proveďte některý z vás si myslí, že Eliza je vlastně provádění platné psychoanalýzu tady? Jeden člověk, možná. 

Diváků: [Neslyšitelné]. BRIAN SCASSELLATI: A jak Znamená to, že máte pocit? Ano, ve skutečnosti, že ano. A budeme vidět, ve skutečnosti se zdrojový kód pro něj za chvíli. A tak budete mít schopný dělat přesně to. 

Nyní, Eliza je jedna z forem, co bychom nazvali dnes chat bot. Je to jen prochází text, který jste poskytující, poskytuje holé minimální částku porozumění nebo zpracování, a pak ji papoušci zpět k vám. Takže pojďme se podívat, koncepčně, a mluvit o tom, co to je, že Eliza je skutečně dělá. 

ELIZA bere sentence-- pojďme řekl: "Chci, aby zapůsobit na svého šéfa." A ELIZA hledá prostřednictvím této věty a snaží se najít a splňovat určité vzory. Tak, například, jeden ze vzorů že Eliza hledá jsou slova "Chci." A kdykoli to uzná za něco že má "já chci" v tom, formuluje odpověď. A že odpověď je pevný řetězec. V tomto případě je to "proč chceš?" A já jsem dal malá hvězda na konec, protože to je prostě začátek našeho reakce. A hvězda naznačuje, že budeme brát po zbytek of utterance-- uživatele "zapůsobit na svého šéfa" - a budeme se připojit, že na konec tohoto řetězce. 

Takže teď, spíše než říkat, "proč chcete zapůsobit na svého šéfa, " tam je trochu další zpracování, které budeme dělat. To znamená, že budeme muset převést některé zájmen sem z "šéfem" na "svého šéfa." A tam by mohlo být několik dalších Změny, které musíme udělat. Takže spíše než jen držet ji přímo na konec, co budeme dělat, je vezmeme zbytku utterance-- uživatele v bílém here-- a my si to jeden kus na čas a převést každý řetězec tokenu, každé slovo, do věty. 

Tak jsme si vezmu slovo "do". Neexistuje žádná konverze že musíme udělat. "Zapůsobit." Neexistuje žádná konverze musíme tam dělat. "My", bude převést na "svůj". A "boss" my jen tak nechat jako "šéf". A nakonec, cokoliv , který končí na dobu, budeme převést jej do otázky. 

Tento velmi jednoduchý vzorů je vlastně docela úspěšný. A když toto bylo zavedeno v 1966-- Joseph Weizenbaum naprogramovaný to na počítači. Nyní, počítače v té době nebyly stolní modely. Byli sdílené prostředky. A jeho studenti by jít a povídat si s Elizy. Nakonec musel omezit přístup k němu protože jeho studenti nebyli získání jakékoli práci. Oni byli jen chatování s Elizy. A ve skutečnosti, musel oheň jeho asistenta, který strávil celý její čas mluvit s Elizy o jejích hlubokých a znepokojující problémy. 

Každý, kdo používá tyto systémy začal je antropomorfizovat. Začali uvažovat o nich jako je živý a skuteční lidé. Začali rozpoznat některé věci, které říkali se vraceli k nim. A oni byli zjistit, věcí o sobě. A ve skutečnosti, dokonce i odborníci, dokonce i psychoterapeuti, se začal obávat, že ve skutečnosti, Možná ELIZA by jejich nahrazení. A dokonce i počítač Vědci strach, že jsme byli tak blízko k řešení přirozeného jazyka. 

Nyní, že nebyl nikde v blízkosti pravda. Ale to je, jak působivé tyto systémy mohou zdát. Takže pojďme začít hledat vespod a zkuste aby si trochu otázku kde tento kód vlastně stane. Takže uděláme tento kód k dispozici později. A to je velmi jednoduché a přímé přístav původní implementace ELIZA. 

Takže některé z těchto stylistický věci, které budete vidět zde jsou stylově co ne bychom chtěli, abys nebo to, co jsme se učit, abys udělal. Ale my jsme se snažili udržet je stejné pro mnoho portů že tato má tak, že má chuť originálu. Takže budeme zahrnovat spoustu věcí, a pak budeme mít sada klíčových slov, věcí že ELIZA rozpozná a reagovat na přímo. Takže pokud máte slova jako "můžeš", nebo "Já ne", nebo "ne" nebo "ano" nebo "sen" nebo "ahoj", pak ELIZA selektivně reagovat na tyto. Budeme mít také určitý počet věcí, že budeme vyměnit, stejně jako konverze "my" na "svůj". 

A pak budeme mít soubor odpovědí že pro každý z těchto klíčových slov, budeme otáčet přes tyto různé reakce. Takže když říkám "ano" třikrát v řadě, jsem mohl dostat tři různé Odpovědi od Elizy. Náš kód, pak je vlastně pozoruhodně jednoduchá. Pokud bych posunout dolů za všechny z nich reakce, které jsme programované a dostaneme se do naší hlavní, budeme inicializovat několik různých proměnných a udělat trochu domácnost na začátku. Ale pak je tu naprosto sada kódu, který vám může pochopit. Jeden velký while, který říká, že jsem bude opakovat znovu a znovu. Přečtu v řadě, a budu obchod, který ve vstupním řetězci. Podívám se a uvidíme, jestli to je speciální klíčové slovo "bye", který znamená, ukončete program. A pak budu zkontrolovat a zjistit, zda někdo se jen opakují znovu a znovu. A já budu křičet na ně, pokud to dělají. Řeknu "neopakovat se." 

Tak dlouho, jak nic z toho nestane, budeme pak kontrolovat a procházet, na tratích 308 až 313 tady, a kontrolovat a vidět jsou některé z těchto klíčových slov věty obsažené ve vstupu že jsem právě dal? Pokud je shoda pro ně, dobře Pak budu pamatovat toto místo. Budu si to pamatovat klíčové slovo. A já budu moci vybudovat odpověď. 

Pokud nemám najít jednu, no a pak, poslední věc v mém poli klíčového slova bude můj výchozí odpovědi, když nic jiného utkání. Zeptám se na otázky typu: "Proč jsi sem přišel? "nebo" Jak vám mohu pomoci? " které jsou jen částečně vhodná bez ohledu na to, co je vstup. 

Budeme pak vybudovat Elizy reakci. Budeme moci vzít že základna reakce, jako jsme to udělali v tom, že "můj šéf" příkladem. Jestli je to všechno, co tam je--, pokud je to jen jeden Řetězec, který mám respond-- Mohu jen poslat ji zpátky. Pokud má hvězdičku na její konec, pak budu zpracovávat jednotlivé token zbytek odezvu uživatele a přidat ty, záměnu slovo od slova, jak potřebuji. 

To vše je naprosto něco, co byste mohli postavit. A ve skutečnosti, způsob, jakým jsme se Zpracovali argumenty příkazového řádku, způsob, jakým máte zpracovány prostřednictvím HTTP požadavků se řídí stejnými druhy pravidel. Jsou vzorů. 

Takže Eliza měli poměrně důležitý vliv na přirozeného jazyka protože to dělalo se mohlo zdát, jako by to byl velmi dosažitelný cíl, jako bychom byli nějak být schopen vyřešit tento problém přímo. Teď, že to neznamená, že Eliza dělá všechno, co bych chtěl dělat. Určitě ne. Ale měli bychom být schopni udělat něco víc. 

Naším prvním krokem jít za ELIZA se děje aby bylo možné se na Není text zadaný do klávesnice, ale řeči, skutečné řeč zaznamenány do mikrofonu. Takže, jak se díváme na tyto různé kousky, my jsme bude muset vybudovat sadu modelů. Budeme muset být schopni jít z low-hladina akustického information-- hřiště, amplituda, frequency-- a převést že do Některé jednotky, které jsme schopen snadněji manipulovat a konečně, manipulovat s nimi do slov a vět. 

Takže většina rozpoznávání řeči systémy, které jsou tam dnes následovat statistický model, ve kterém stavíme tři samostatné reprezentace toho, co že zvukový signál ve skutečnosti obsahuje. Začneme s fonetickým modelem že mluví jen o základně Zní to, že jsem produkovat. Jsem produkovat něco, co je B jako chlapec, nebo D, jak v pes? Jak mohu poznat ty dvě různé telefony jsou oddělené a odlišné? 

Na vrcholu se, že budeme pak stavět slovo výslovnost model něco, co spojuje tyto jednotlivé telefony a kombinuje je do slova. A po tom, vezmeme slova a my sestavit z nich s jazykem modelovat v kompletní větu. 

Teď budeme mluvit o sobě z nich samostatně a odděleně. Ale tyto tři modely jsou všechny jen bude statistiky. A to znamená, že když jsme se pracovat s nimi, budeme být schopen pracovat s je všechny najednou. Dobře. Začněme s naším fonetickou modelem. Takže fonetické modely se spoléhají na Výpočetní technika volal skryté Markovovy modely. Ty jsou grafické modely, ve kterých I mají a uznat stav světa jak se vyznačuje tím, sadou funkcí. A že státní popisuje jednu část žaloby, že jsem zabýval. 

Takže pokud si myslím o tom, zvuk "ma", jako matka, existují různé komponenty za tímto zvukem. Je tu část, kdy jsem se čerpat v dechu. A pak jsem peněženku rty. A já vrátit mé rty trochu pozadu bit, aby to "ma" zvuk. A pak je tu spoušť. Mé rty přijde od sebe. Vzduch je vyloučen. "Ma". 

Tyto tři různé části byly zastoupené státy v této graph-- počátek, střed a konec. A já bych mít přechody, které mi umožnilo cestovat z jednoho státu do druhého s určitou pravděpodobností. Tak, například, že M zvuk může mít velmi, velmi krátká příjem na beginning-- "mm" - a pak delší, vibrační fáze, kde jsem držel můj rty a téměř humming-- "mmmm" - a pak velmi krátký plosive, kde jsem vyhnat breath-- "ma". 

Skrytý Markov model je navržena tak, aby zachycení skutečnost že způsob, kterým se zabývám že zvuk "ma" se děje se mírně lišit v jeho načasování, je frekvence, a jeho funkce, než tak, že jste to udělat nebo tak, že bych mohl dělat to, když mluvím o různých použití dopisu. "Matka" a "Mohu" vůle znít trochu jinak. 

Takže uznávají Zejména zvuk, by jsme stavět Markov modely, tyto skryté Markov modely, z každé možné telefon, který já chtít poznat, všechny možné zvuk, a pak se podívejte na akustické údaje, že mám a určit statisticky který z nich je s největší pravděpodobností jedním aby byly vyrobeny tento zvuk. DOBŘE. S tímto modelem, pak jsme začít stavět na vrcholu. Bereme výslovnost model. Teď, někdy výslovnost modely jsou jednoduché a snadno protože tam je jen jeden způsob, jak se vyslovuje něco. Jindy jsou to trochu složitější. Zde je výslovnost průvodce za tímto červenou věc, která je ovoce, které stránky jak kečup z. Lidé si nemyslím, že je to ovoce. Právo? 

Nyní máme k dispozici mnoho různých způsobů, že lidé budou vyslovovat to slovo. Někteří budou říkat "prst-May-prst." Někteří budou říkat "špičkou Mah-prst." A můžeme zachytit, že se jeden z těchto grafických modelů kde, opět, zastupujeme přechody tak, že má určitou pravděpodobnost a spojené pravděpodobnost s nimi. 

Takže v tomto případě, kdybych měl následovat horní trasa přes celý tento graf, Chci se začíná na písmeno zcela vlevo, dále jen "ta" zvuk. Chtěl bych mít horní polovinu, dále jen "ach," a pak "ma," a pak "A" a pak "ta", a "oh." "Toe-may-toe." Kdybych vzal spodní cestou přes to, dostanu "Ta-Mah-prst." A když jsem šel dolů a poté up, tak bych si "TA-May-prst." 

Tyto modely zachytit tyto Rozdíly protože kdykoli jsme se nasadit jeden z nich systémy rozpoznávání, to bude muset pracovat s spousta různých druhů lidí, mnoho různých přízvuků, a dokonce i různá použití stejných slov. A konečně, v horní části, který, budeme budovat něco, co že vypadá opravdu složité, volal jazykový model, ale ve skutečnosti je nejjednodušší tři, protože se v těchto závodech na to, co se nazývá n-gram modely. A v tomto případě, jsem ukazovat vás dvoudílný n-gram modelu, je bigram. Budeme dělat fyzické myšlenku že někdy, určitá slova jsou s větší pravděpodobností následovat vzhledem k tomu, slovo, než ostatní. Pokud bych jen řekl: "předpověď počasí," další slovo by mohla pravděpodobně být "dnes" nebo by mohly být "počasí počasí zítra. " Ale je to nepravděpodobné, že být " předpověď počasí artyčok. " 

Jaký jazykový model dělá, je zachycuje ty statisticky tím, že počítá, od některých velmi velký korpus, všechny instance ve kterém jedno slovo následuje druhý. Takže když vezmu velkou corpus-- jako každý Wall Street Journal který byl vyráběn od roku 1930, který je jedním ze standardních corpuses-- a já se přes všechny že text, a počítám up Kolikrát po "počasí" nevidím "dnes" a kolikrát mohu vidět "počasí" a následně "artyčoky," první se děje být mnohem pravděpodobnější. Bude to vypadat mnohem častěji. A tak to bude mít vyšší Pravděpodobnost, s ním spojené. 

Pokud chci přijít na pravděpodobnost, že celé promluvy, pak jsem se s tím skonči. Takže pravděpodobnost sluchu věta "krysa jedl sýr" je pravděpodobnost slova "the" začíná větu, a pravděpodobnost, že Slovo "krysa" následuje slovo "závěrky," a pravděpodobnost, že Slovo "jedl" následuje "krysa," a pravděpodobnost, že "sýr" následuje "jedl." 

To zní jako hodně statistiky, hodně pravděpodobností. A to je vše, co to je. Ale úžasná věc je, pokud to budete dělat s dostatečně velkou vzorku dat, funguje to. A funguje to ohromně dobře. Všichni víme, že tyto technologie. Většina operačních systémů přijít s rozpoznávání hlasu v tomto bodě. Používáme Siri a Cortanu a Echo. A tyto věci jsou založeny na Tento typ třívrstvé model-- fonetické modelu na dně, A Výslovnost model v polovině, a model jazyk nad nimi. 

Teď, co musíte udělat trochu více než aby odpověděl na otázky. Ale uznání toho, co jste rčení závisí právě na tom. Takže pojďme se vzít příklad zde. Takže mám můj telefon tady nahoře pod kamerou dokumentů. A budeme se žádá SIRI na pár otázek. Dobře? 

Takže pojďme se probudit můj telefon zde. Siri, jaké je počasí stejně jako v New Haven dnes? 

SIRI: Tady je počasí New Haven, Connecticut dnes. 

BRIAN SCASSELLATI: OK. Takže nejprve jste viděli, že Siri uznána každý z jednotlivých slov a pak produkoval odpověď. Promluvíme si o tom, jak tuto odpověď přijde za chvíli. Ale teď, když víme, že je to jen na základě Na surovin statistiky a to vzorů typ přístupu, můžeme hrát nějaké hry s Siri. 

Tak jsem se to zkusit znovu. Siri, jaké je počasí hroch New Haven, dnes? 

SIRI: OK. Zde je počasí pro New Haven, Connecticut pro dnešek. BRIAN SCASSELLATI: Siri je ne odradit, že protože to našel pattern-- "počasí", "dnes", "New Haven." To je to, co to reagovat se, stejně jako Elizu. Dobře. Pojďme si dát ještě jeden ještě víc směšný příklad. Siri, počasí artyčok pásovec hrocha New Haven? 

SIRI: Dovolte mi, abych zkontrolovat, že. Tady je to, co jsem našel na webu za to, co jsou artyčoky pásovec hroch New Haven. 

BRIAN SCASSELLATI: OK. Takže když jsem dostatečně daleko se z tohoto modelu, Jsem schopen zaměnit, protože to není již odpovídá vzoru, že má. A že statistická motor, který říká, jaká je pravděpodobnost, že máte Slova hroch a artyčok dohromady, a pásovec? To musí být něco nového. 

Takže těchto technologií každý den používáme. Pokud chceme, aby se jim jeden krok Dále, i když, pokud jsme vlastně chcete být schopni hovořit o tom, co je, že tyto systémy jsou reagovat na, musíme hovořit, opět, asi více základní sada otázek. A to je téma v komunikaci že říkáme otázka záznamník. To znamená, že chceme být schopni to-- jo? Diváků: [Neslyšitelné]. BRIAN SCASSELLATI: Získáme do latentní sémantické zpracování? Takže ano. Existuje mnoho věcí, které jsou děje pod povrchem s Siri a v některých z příkladů Chystám se vám ukázat další tam, kde je dost pokud jde o strukturu z toho, co říkáte, že je to důležité. A ve skutečnosti, že je to skvělý předchůdce pro další snímek pro mě. 

Takže stejným způsobem, že naše rozpoznávání řeči byla vybudována z několika vrstev, pokud chceme pochopit, co to je, že to vlastně Jak již bylo řečeno, budeme znovu spoléhají na analýze vícevrstvého textu, který je právě uznán. Takže když Siri je skutečně schopen řekněme, podívej našel jsem tato slova. A teď co mám dělat s nimi? První složka je často projít a pokusit se analyzovat struktura věty. A v čem jsme viděli na základní škole, často, jako druh diagramů věty, jdeme uznat, že některé slova mají určité role. Jsou to podstatná jména. Jsou to zájmena. Jedná se o slovesa. A jdeme rozpoznat že pro určitý gramatiky, v tomto případě anglické gramatiky, tam jsou platné způsoby, jak jsem jim lze kombinovat a další způsoby, které nejsou platné. 

Že uznání, že struktura, by mohlo být dost, aby nás vedl pomoci trochu. Ale to není dost abychom byli schopni dát přičemž jakýkoliv význam toho, co bylo řečeno zde. K tomu, budeme muset spoléhat na nějaké množství sémantické zpracování. To znamená, že budeme muset podívat na spodní, co každý z těchto slov skutečně vykonává jako význam. A nejjednodušší způsob, jak dělat to, budeme stýkat se s každým slovem že víme, že určité funkce, určité transformace, která jí umožňuje stát. 

V tomto případě, mohli bychom označte štítkem Slovo "John", jako o vlastní jméno, že to s sebou nese identity. A můžeme označit "Mary", jak je stejným způsobem. Vzhledem k tomu, sloveso jako "lásek", které představuje zvláštní vztah že jsme schopni reprezentovat. Nyní, to neznamená, že jsme pochopili, co je láska, ale pouze to, že jsme pochopili, že v cestě symbolického systému. To znamená, že můžeme označit to a manipulovat s ní. 

S každou z těchto typy přístupů, jakýkoliv typ sémantické zpracování Zde bude poněkud požadovat bit znalostí a hodně práce z naší strany. Jsme již v říši kde prostě statistika se bude dost pro nás. Nyní, aby se jít od tohoto bodu toho, že je schopen hovořit o vnitřku co se to vlastně děje, ke schopnosti manipulaci s touto strukturu a pochopit otázku a pak budou moci jít ven a hledat, , která vyžaduje více komplexní poznávací modelu. 

Způsob, jakým jsou postaveny tyto systémy je z větší části velmi, velmi práce intenzivní. Zahrnují lidi utrácet velké množství času strukturování způsobů, který tyto druhy vět mohou být reprezentovány v některých logice. To dostane dokonce i trochu složitější, ačkoli. 

Ani jednou se vypořádáme se sémantikou, budeme ještě se podívat na pragmatika toho, co bylo řečeno. To znamená, že jak mám se vztahují slova že musím něco fyzicky ven existuje ve světě, nebo na alespoň některé informační zdroj že mohu manipulovat? 

Někdy tyto vést k nádherné kousky nejasností. "Red-hot hvězda oženit astronoma." DOBŘE. Teď, čteme, že jako funny typ titulku že bychom vidět na pozdní noční televizi protože nemáme interpretovat "hvězda" mít jeho nebeské těleso význam. Víme, že to znamená, že čím více samozřejmost herec nebo herečka s vysokým množstvím viditelnosti. 

"Squad pomáhá pokousáním oběť." Je možné, že tým je vlastně tam pomoci psa V děje kolem a kousat oběti? Nebo je možné, že tam bylo jednotlivec, který byl pokousal pes, který potřeboval nějakou pomoc? Jen z pohledu na syntaxi a sémantika vět, nemůžeme určit, že. 

"Vrtulník poháněn lidskými mouchy." Existují, ve skutečnosti, skutečná malé věci, létající kolem toho Jsou to lidé s křídla napájení vrtulníky pro dobro lidstva? Nebo je tam jednou mechanické zařízení že odvozuje svou moc od osoby? 

Když se podíváme na otázku, záznamníky systémy, to jsou vrstvy, které musíme se zabývat. Nyní, nejlepší a nejvíce druh z převládající těchto systémů dnes jsou schopni udělat věci na úrovni, která jsou daleko za to, co jsme měli před 10 lety. Zde je jeden z nejlepších systémů že je tam dnes. A to je systém od IBM volal Watson. To je od našich přátel v IBM. To je Katherine banky, Jia Chen, a Priscilla Moraes nám dává ukázka Watson včera v IBM Yorktown. [VIDEOPŘEHRÁVÁNÍ] -Jak se máš? 

-Je mi dobře. Já jsem vždycky rád, když jsem myšlení, zvláště když jsem mohou zůstat v pohodě v těchto serverovnách. Kdo je vaše oblíbená herečka? 

-můj Oblíbená herečka Angelina Jolie jako Lara Croft v Tomb Raider, protože její původní forma byla jako virtuální postavy, jako jsem já. 

-Jak Může Watson pomoci pacientům? 

-Je Plán pro pacienty do mají přístup k Watson přímo? Přístup k Watson poradenství Žádosti se liší podle případ použití. Ale v současné době, Watson bude poskytovat pouze možná diagnóza a léčba Možnosti k zdravotnickým pracovníkem. Tam, kde je to vhodné, pacienti může poskytnout informace Watsona, snad prostřednictvím portálu webové rozhraní, tablet, nebo dokonce mobilní telefon. Například, může být pacient žádal, aby popisoval jejich symptomy v přirozeném jazyce přímo do roztoku Watson, umožňuje lékař zaměřit se na diagnostika a ne shromažďování údajů. 

Kdo zavraždil Abraham Lincoln? 

-John Wilkes Booth. 

-V Co rok dělal Arizona Diamondbacks vyhrát světové série? 

-2001. 

[END Přehrávání] 

BRIAN SCASSELLATI: So tyto druhy systémů muset spoléhat na první řadě rozpoznávat řeč; druhý, převod do smysluplné interní zastoupení; a pak, za třetí, budou moci jít ven a najít zdroj informací, které jim umožňuje odpovědět na tuto otázku. Tato úroveň složitosti zahrnuje stejné typy programových věcí že jste byli dělá v problémových sadách. 

Jsme schopni analyzovat HTTP požadavků v stejný typ low-level vzorem shoda, že Eliza může dělat. Jsme schopni převést ty, do vnitřní reprezentace, a pak použít k dotazu některé externí databáze, případně pomocí SQL. Všechny systémy, které jsou dnes postaveny dělat tento typ přírodního jazyková komunikace jsou postaveny na tytéž zásady. 

Nyní, dokonce i systém, jako je Watson není dost složitý aby byl schopen odpovědět na libovolný otázky týkající se jakékoli téma. A ve skutečnosti, že mají být strukturovány v dané oblasti. Takže se můžete jít on-line a můžete najít verze Watson, které fungují dobře v medicínské informatice. Nebo je tu ještě jedna on-line že právě společnosti s tím, jak aby dobrá doporučení ohledně Jaké pivo půjde, se kterými potraviny. A v těchto oblastech, je schopen odpovídat na otázky, najít informace, které potřebuje. 

Ale nemůžete kombinovat je. Systém, který je vyškolen s databází potravin a piva nefunguje dobře, když se náhle dát se do lékařské informatiky databáze. Takže i naše nejlepší systémy dnes spoléhají na úrovni zpracování ve kterých jsou ručně kódování a Stavební do infrastruktury za účelem aby tento systém běžet. 

Nyní, poslední téma chci aby bylo možné se dostat do dneška je o neverbální komunikace. Velké množství informací, které jsme se navzájem komunikovat nepřichází o prostřednictvím jednotlivá slova, že jsme se ucházíte. To má co do činění s věcmi, jako je blízkost, zadívat, váš tón hlasu, Váš skloňování. A že komunikace je také něco, že mnoho různých rozhraní záleží hodně o. To není to, co se stará o Siri. Mohu se zeptat Siri něco jedním hlasem nebo jiným tónem, a Siri to bude dej mi stejnou odpověď. Ale to není to, co budujeme pro mnoho dalších typů rozhraní. 

Chci tě představit Nyní k jednomu z robotů. To byl postaven můj dlouholetý přítel a kolega Cynthia Breazeal a její společnost Jibo. A to robot-- jedeme mít pár dobrovolníků přijít k interakci s tím. Takže můžu mít dva lidé ochotní hrát s robotem pro mě? Proč jste přišel nahoru, a proč nejdeš nahoru. Kdybys mi spojit tady, prosím. 

A pokud bych mohl mít tě jít rovnou sem. Díky. Ahoj. 

ALFREDO: Těší mě. Alfredo. 

BRIAN SCASSELLATI: Alfredo. 

Rachel: Rachel. BRIAN SCASSELLATI: Rachel. Těší mě obojí. Alfredo, budu muset jít jako první. Pojďte sem. Chystám se představit vás-- jestli můžu dostat to pryč bez zaklepání na microphone-- na malý robot jménem Jibo. DOBŘE? 

Nyní, Jibo je navržen tak, aby interaktivní. A i když to může dát vám řeč, hodně z interakce s robotem je neverbální. Alfredo, budu vás požádat, abyste říkat něco hezkého a zdarma na robota, prosím. ALFREDO: Myslím si, že vypadat roztomile. 

[Vrčení SOUND] BRIAN SCASSELLATI: OK. Jeho odpověď není verbální. A přesto, že vám dal oba jasné potvrzení že slyšel, co jste řekl, a také nějak rozumí se, že. DOBŘE? Krok zpátky tady na jednu sekundu. Děkuji. 

Rachel, pokud byste. Teď, budu dávat Jsi mnohem těžší úkol. Pokud byste se stát tady, zálohovat jen trochu tak, můžeme dostat vás na kameru a podívat se tímto způsobem. Budu se vás zeptat na něco říct vlastně znamená a ošklivý na robotu. 

Rachel: Co se mi zdálo udělat, bylo naprosto absurdní. 

[Brum] 

To bylo ještě absurdnější. Co se to s tebou děje? Ále, necítí špatně. Dám vám obejmout. BRIAN SCASSELLATI: Dobře. Díky, Rachel. Alfredo, Rachel, díky kluci moc. 

[POTLESK] 

Takže tento druh interakce má v mnoho způsobů, jak někteří ze stejných pravidel a některé ty stejné struktura jako to, co jsme může mít v jazykové interakce. Je to jak komunikativní a slouží důležitý účel. A to interakce, v mnoho způsobů, je navržen tak, aby měl zvláštní účinek na osoba interakci s nebo poslechu k robotu. 

Teď, já jsem to štěstí, mít Jibo zde dnes. Sam Spaulding je tady pomoci nás se s robotem. A já jsem se zeptat Sam dát jsme jednou pěkné demo Jibo tance které můžeme pozorovat na konci sem. Tak jděte do toho, Jibo. 

SAM: OK, Jibo. Ukaž nám své taneční pohyby. 

[Přehrávání hudby] BRIAN SCASSELLATI: Dobře, všichni. Díky našim přátelům v Jibo. 

[POTLESK] 

A díky našim přátelům na IBM za pomoc dnes. Komunikace je něco, že jdeš vidět, přichází stále více a více as stavíme složitějších rozhraní. Příští týden budeme mluvit o tom, jak se rozhraní s počítačovými oponentů v hrách. Ale pokud máte dotazy týkající se tohoto, Budu se kolem úřední hodiny večer. Jsem rád, že s vámi mluvit o AI témata nebo se dostat do větších detailů. Užij si víkend. 

[POTLESK] [Přehrávání hudby]