[Zenelejátszási] 

DAVID MALAN: Ez CS50. Ez a hét végéig 10. És a fiú, van még egy jó osztály az Ön számára ma. Annyira izgatott, hogy meghívják a két barátaink Yale akár nekünk ma és nézd meg a kereszteződésekben a mesterséges intelligencia, robotika, természetes nyelvi feldolgozás, és így tovább. 

És valóban, az elmúlt hetekben, most már biztosan töltött sok időt, különösen a korábbi psets, összpontosítva elég alacsony szintű részleteit. És ez nagyon könnyű szem elől téveszteni Az erdőben a fák és kap letette a hurkok és feltételek és a mutatók, természetesen, és a hasonlók. De a valóság az, srácok most már a összetevők, amelyekben nagyon megoldani néhány érdekes problémákat, többek között ezek azok, barátaink a Yale dolgozni Röpke Cambridge-ben. 

Ezért engedje meg, elsőként vezette be a fejünk tanársegéd a Yale, Andy. 

[TAPS] 

Andy: Először is, csak megköszönni hogy lehetővé teszi egy pár Yalies a pop le, hogy Cambridge ma. Igazán értékelem. Másodszor, hogy a barátaink vissza home-- Jason, kösz tartózkodó és futó előadás. Remélem minden rendben New Havenben. 

Szóval igen, én vagyok szuper izgatott bevezetni Scaz ma. Scaz fut a robotika labor. Ő egy tanár, csak öt különböző szervezeti egységek a Yale. Laborjában, aki sok-sok robotok, hogy ő szeret játszani. Ő, mint a legmenőbb munka a világon. És ő kapja a fajta rendetlenség körül, hogy egész nap Hosszú és némi munkát is. 

És így valóban hozott egy közülük le velünk ma. Tehát minden további nélkül, Scaz van fog menni előre, és vezessen be minket hogy a robot barátja. 

[TAPS] Brian SCASSELLATI: Köszönöm, David. Köszönöm, Andy. Ez annyira csodálatos, hogy Itt mindenki ma. Azt akarom, hogy az első nagyon világos, hogy A CS50 személyzet itt Cambridge hihetetlenül vendégszerető nekünk. Annyira hálásak vagyunk mindenért csináltak, hogy támogasson minket. És így szeretnénk, hogy képes vissza a kedvesség. 

Tehát ma, megkapjuk, hogy be hogy megyünk, hogy egy új, egy-az-egy-fajta CS50 esemény történik New Haven jövő héten. És ez a CS50 Kutatási Expo. Így fogunk meghívja everyone-- CS50 diákok, személyzet mind a Harvard és a Yale-- jöjjön le, és látogasson el velünk pénteken. Mi lesz a legkülönbözőbb felett 30 különböző emberek bemutató és exhibiting-- upperclassmen bemutató le néhány kutatási termékek. Majd néhány induló, sőt, már alig egy kicsit az új tech tehetség, induló mind a Harvard és a Yale-en. És mi lesz néhány diákcsoportok keres egy új tagságot. 

Ez lesz egy nagyon izgalmas időszak. Remélhetőleg Azoknak, akik jön le a Harvard-Yale játék lesz képes megállítani egy kicsit korai, kellős közepén a campus, Sterling Memorial Library. Fogunk egy sor kiállítási, hogy a tartomány autonóm vitorlások, hogy kihasználhassák a szoftver megőrzése középkori kéziratok. 

Megyünk, hogy hirdetése hoc hálózati és az emberek oktatási szoftver kódolás Fokvárosban. Lesz számítógép zenei bemutatók. És mi természetesen több robotokat. Szóval reméljük azt is megtudhatod csatlakozzon hozzánk erre az eseményre. Meg kell egy csomó szórakozás, egy kis étel, és sok érdekes miről beszélni. 

Tehát ma fogunk beszélni a természetes nyelvi feldolgozás. És ez a kísérlet nekünk hogy egy új módon kapcsolódni a mi eszközök miatt Az elmúlt hetekben, ha már összpontosítottak, hogyan van az, hogy akkor írj kódot, írni szoftver ez egy módja, hogy képes azt mondani, hogy a gép, ez az, amit akarok, hogy nem. 

De nem szabad kell elvárják, hogy mindent hogy van odakint, ami használt mindenki a világon lesz jártasak ez a fajta utasítást. Szóval mi különbözteti számítógép nyelvek és természetes languages-- vagyis a dolgok, hogy az emberek használatára kommunikálni más emberekkel. És megpróbáljuk felépíteni interfészeket használó ezek a természetes kommunikációs mechanizmusok. 

Most, mint minden más téma hogy már kezdődött a CS50, fogunk kezdeni a legegyszerűbb kis természetes nyelvi feldolgozás hogy el tudjuk képzelni. Fogunk kezdeni a történelmi része természetes nyelv. És akkor majd felépíteni, hogy újabb és újabb rendszerek és egy kis móka demók az út mentén. 

Mi is így fogjuk kezdeni, mi volt Valószínűleg az első természetes nyelv feldolgozó rendszer. Ez egy szoftver rendszert írt 1966 Joseph Weizenbaum nevű ELIZA. Eliza volt a célja, hogy megismételni a fajta interakció ha volna egy Rogersi pszichoterapeuta. Most, a Rogerians, hogy volt egy ötlet, hogy a pszichoterápia részt, hogy képes tükrözni vissza hogy a beteg és beszélgetni velük, Alapvetően, csak így számukra a hangyányival a terapeuta. Azaz, mindent hogy a terapeuta azt mondta kellett volna, hogy csak egy visszatükröződése amit a beteg mond nekik. 

Így próbáljuk meg demo ezt. Van már egy önkéntes, aki lennék hajlandó megosztani a legmélyebb, legsötétebb, és / vagy hamis titkok Eliza? Persze, miért nem jössz akár. Fantasztikus. És a neved? 

MILES: Miles. 

Brian SCASSELLATI: Miles. Örülök, hogy találkoztunk, Miles. Ha ragaszkodsz, hogy. És megyünk egyik változatát használja ELIZA hogy már reprodukálni a CS50 IDE. És akkor nézd meg a forrás kód erre a kis időre. De most, mi csak szeretnénk hívni azt írja Eliza. 

És Eliza fog adni válaszok hogy lesznek minden nagybetűvel. És szeretnék feltenni néhány kérdést. És mi válaszolunk, és írja A válaszok ELIZA. Tehát Eliza azt mondta: "Szia, én vagyok Eliza. Mi a bajod?" Mit szeretne mondd ELIZA a mai? 

MILES: Én csak elaludni ha van nyuszi papucs. 

Brian SCASSELLATI: Rendben. Minden rendben. 

[NEVETÉS] 

"Én csak elaludni nyuszi papucs. " Eliza azt mondja: "Mondd, mit bármilyen pszichológiai problémák? Lehet, hogy ez egy jó indikátor. " 

OKÉ. Szóval mit szeretne reagálni? 

MILES: Igen. 

Brian SCASSELLATI: Igen. A szavak embere. Élvezem, hogy. Eliza azt mondja: "Úgy tűnik nagyon pozitív." 

MILES: Nem, nem vagyok, sőt, egy elektron. 

Brian SCASSELLATI: "Nem. Tény, hogy én vagyok az elektron. " "Azért jött hozzám mert te egy elektron? " Most látható néhány A things-- megyek szüneteltetheti akkor egy pillanatra, Miles. Ne menj sehova. Mi nem végeztem veled még. Eliza, bizonyos szempontból, reagál bizonyos dolgokra hogy azt mondja, de nem minden valódi megértés. És ez is parroting vissza néhány Az alkatrészeket a büntetését. 

Így szólt: "Nem. Tény, hogy én vagyok az elektron. " Eliza reagált vissza, "Azért jöttél nekem, mert te egy elektron? " Minden rendben. Adjunk még egy választ itt. Adj neki egy jó, Miles. 

MILES: Jó volt? 

Igen, kérem, segítsen nekem. Brian SCASSELLATI: "Igen. Kérem, segítsen nekem. "" Biztos benne? " MILES: Nem Brian SCASSELLATI: Nem "Mit jelent javaslom neked?" 

MILES: Lehet, hogy nem egy elektron. 

Brian SCASSELLATI: "Én lehet, hogy nem egy elektron. " "Azt mondod, nem csak azért, hogy negatív lesz?" 

Minden rendben. Tehát Miles, köszönöm szépen. 

MILES: Köszönöm. 

Brian SCASSELLATI: Köszönöm szépen. [TAPS] 

Tehát ez ELIZA program sok szempontból, reagál, csak a darab hogy mi biztosítja nélkül mély megértése, hogy mi történik itt. Ez egy ilyen rendszer nevű egyeznek, ahol keresünk bizonyos bit szöveget, hogy mi vagyunk, akkor fog tartani abból, ami nyújtottak a bemenet, alakítani, esetleg valamilyen módon, majd adja vissza a felhasználónak. 

Végezze el úgy gondolja, hogy Eliza valójában teljesítő érvényes pszichoanalízis itt? Egy ember, talán. 

Közönség: [hallható]. Brian SCASSELLATI: És hogyan nem hogy érzed magad? Igen, sőt, ez nem. És fogunk látni, valóban, a forráskódját is csak egy pillanatra. És így leszel képes pontosan ezt. 

Most, Eliza egyik formája, amit mondanánk ma a chat bot. Csak azt a szöveget, hogy te nyújtó, biztosítja a minimális összeget megértés vagy feldolgozás, majd papagájok vissza is. Szóval vessünk egy pillantást, koncepcionálisan és beszélni, mi ez az, hogy Eliza valójában csinál. 

Eliza vesz egy sentence-- nézzük azt mondja: "Azt akarom, hogy lenyűgözni a főnököm." Eliza keres révén ez a mondat és megpróbálja megtalálni és egyezik egy bizonyos mintát. Így például, az egyik a minták hogy Eliza keres azok a szavak, "Azt akarom." És minden alkalommal, amikor meglát valamit amely "Azt akarom," benne, fogalmaz meg a választ. És ez a válasz egy fix karakterlánc. Ebben az esetben ez a "miért akarsz?" És tettem egy kis csillag a végén, mert ez csak kezdetben a választ. És a csillag azt jelzi, hogy megyünk, hogy a többi a felhasználó utterance-- "lenyűgözni a főnököm" - és fogunk hozzáfűzni, hogy rá a végén ezt a fonalat. 

Tehát most, ahelyett, mondván, "miért akarsz hatni a főnököm, " van egy kis kiegészítő feldolgozás, amely fogjuk tenni. Azaz, mi kell konvertálni néhány, a névmások Itt az "főnököm", hogy "a főnök." És ott lehet néhány más változásokat kell tennünk. Tehát ahelyett, hogy csak ragadt meg közvetlenül a végén, mit fogunk csinálni A elvisszük a többi Felhasználó utterance-- fehér here-- és mi elviszem egy darab egy időben, és konvertálni minden húr token, minden szó, a mondat. 

Szóval elvisszük a szó ", hogy". Nincs átalakítás hogy meg kell csinálni. "Impress." Nincs átalakítás meg kell csinálni. "Saját" átáll "a." És a "főnök" mi csak hagyjuk a "főnök". És végül, semmit végződő időszak, fogjuk alakítani egy kérdést. 

Ez nagyon egyszerű mintaillesztést valójában igen sikeres. És amikor ezt bevezették A 1966-- Joseph Weizenbaum programoznak a számítógépen. Most, számítógépekhez akkoriban nem voltak asztali modellek. Ők voltak a megosztott erőforrások. És a hallgatók menj és beszélgetni ELIZA. Végül meg kellett korlátozza a hozzáférést az mert a diákok nem voltak kapok semmilyen munkát. Ők csak beszélgetni ELIZA. És valóban, volt, tűz segédje, aki töltött minden idejét beszél ELIZA róla mély és aggasztó probléma. 

Mindenki, aki használta ezeket a rendszereket kezdett antropomorfizálni őket. Elkezdték gondolni rájuk, mint hogy élő és valódi emberek. Kezdték felismerni néhány a dolgokat, hogy azt mondták: jöttek vissza őket. És ők kideríteni dolgokat magukról. És valóban, még a szakértők, még a pszichoterapeuták, aggódni kezdett, hogy valójában, Talán Eliza lenne helyettük. És még a számítógép tudósok aggódnak, hogy mi voltunk Olyan közel megoldásában természetes nyelv. 

Most, hogy nem volt a közelébe igaz. De így lenyűgöző ezek a rendszerek is úgy tűnik. Szóval kezdjük keresni alatta, és próbálja hogy egy kicsit a kérdés hol ez a kód valójában történik. Szóval mi megpróbáljuk ezt a kódot álló utána. És ez egy nagyon egyszerű és közvetlen port Az eredeti ELIZA végrehajtását. 

Szóval ezek közül néhány stilisztikai dolgokat, hogy látni fogod itt nem stilisztikailag mi mi lenne Tegyél vagy mi az, amit tanít, hogy nem. De már próbáltam tartani őket ugyanaz az egész sok port hogy ez volt oly módon, hogy van az íze az eredeti. Szóval megyünk közé egy csomó dolgot, és akkor lesz egy kulcsszókészletre, a dolgok hogy Eliza felismeri és válaszol közvetlenül. Tehát, ha van szó, mint a "tud", vagy "én nem", vagy "nem" vagy "igen" vagy "álom" vagy "hello", akkor ELIZA reagálni fog szelektíven azokat. Majd is van egy Bizonyos számú dolog hogy mi fog cserélni, mint a átalakítása "én", hogy "a." 

És akkor mi van egy sor olyan válaszok hogy minden egyes ilyen kulcsszavak, mi pedig felváltva keresztül Ezek különböző válaszokat. Tehát ha azt mondom "igen" háromszor egymás után, én lehet, hogy három különböző válaszok Eliza. Kódunkat, akkor az, valójában rendkívül egyszerű. Ha én lépjünk le már az összes ilyen válaszokat, hogy mi programozott és mi most az a legfontosabb, fogunk alaphelyzetbe egy pár különböző változók és csinál egy kis takarítás kezdetben. De aztán ott egyáltalán egy sor kód, amely meg tudja érteni. Az egyik nagy while ciklus, amely azt mondja én vagyok fogja megismételni ezt újra és újra. Én olvastam egy sort, és én tárolni, hogy a bemeneti karakterlánc. Majd megvizsgálja azt, hogy ez a speciális kulcsszó "bye", amely azt jelenti, kilép a program. Aztán megnézem, hátha valaki csak ismétlődő magukat újra és újra. És én kiabálni őket, ha nem. Azt fogom mondani: "ne ismételje meg magát." 

Amíg ezek egyike sem történne, akkor majd beolvasni és áthidalás, vonalakon 308-313 Itt, és ellenőrizze, és nézd vannak bármely olyan kulcsszó kifejezések tartalmazott a bemeneti hogy én csak adni? Ha van egy meccs számukra, valamint Ezután, emlékezni fogok arra a helyre. Emlékezni fogok, hogy a kulcsszó. És én leszek képes építeni egy választ. 

Ha nem találok egyet, hát akkor, Az utolsó dolog, amit a kulcsszó tömb lesz az alapértelmezett válaszok, ha semmi más meccsek. Megkérdezem kérdésekre, mint "Miért idejönni? "vagy" Hogyan segíthetek? " hogy csak részben megfelelő nem számít, milyen a bemenet. 

Majd ezután felépíteni Eliza választ. Mi lesz képes venni hogy bázis választ, mint ahogy tettük, hogy "főnököm" példa. Ha ez minden, ami létezik is-- ha ez csak egy húr, hogy kéne respond-- Én is csak küldje vissza. Ha van egy csillag a a vége, akkor én feldolgozni az egyes token a többi a felhasználó választ és add azokat a, kicserélni szóról szóra, ahogy kell. 

Mindez teljesen valami, ami meg tudná építeni. És valóban, a módszereket, amelyek mi Van feldolgozott parancssori milyen módon van feldolgozott keresztül HTTP kérések kövesse az azonos típusú szabályok. Ők mintaillesztést. 

Tehát Eliza viszonylag jelentős hatása a természetes nyelv mert azt a látszatot, mintha egy Nagyon elérhető cél, mint valahogy mi lenne tudja megoldani ezt a problémát közvetlenül. Nos, ez nem jelenti azt, hogy nem ELIZA mindent, amit szeretne csinálni. Biztosan nem. De képesnek kell lennünk hogy többet. 

Az első lépés, hogy menjen túl ELIZA megy hogy képes nézni Nem szövegbevitelt a billentyűzet, de a beszéd, a tényleges beszéd felvett egy mikrofont. Így például megnézzük ezeket a különböző darab vagyunk kell majd építeni egy sor modellt. Fogunk kell tudni hogy menjen az alacsony szintű akusztikai information-- pályán, amplitúdó, frequency-- és átalakítani, hogy a Egyes egységek vagyunk képes könnyebben manipulálni és végül, manipulálja őket a szavak és mondatok. 

Így a legtöbb beszédfelismerő rendszerek, amelyek ott ma kövesse a statisztikai modell, amelyben építünk három különböző ábrázolását, amit hogy hangjelet valóban tartalmaz. Kezdjük egy fonetikai modell arról beszél, hogy csak a bázis hangzik, hogy én vagyok termelő. Vagyok termelő valamit, ami B, mint a fiú vagy D, mint a kutya? Hogyan ismeri fel a két különböző telefonokra különálló és különböző? 

Ezen felül, akkor majd építeni Egy szó kiejtése modell, valami, ami összeköti ezeket az egyedi telefonok és egyesíti őket egy szót sem. És azután, elvisszük a szavakat és mi össze őket egy nyelvet modellt egy teljes mondatot. 

Most fogunk beszélni az egyes Ezen függetlenül és külön-külön. De ez a három modell mind csak lesz statisztikák. És ez azt jelenti, amikor velük együtt dolgozni, akkor képes legyen együttműködni mindet egyszerre. Minden rendben. Kezdjük a fonetikus modell. Tehát fonetikai modellek támaszkodnak A számítógépes technikát úgynevezett rejtett Markov modellek. Ezek grafikus modellek, amelyben én van, és elismerik az állam a világon amelyre jellemző egy készlet jellemzői. És hogy az állami leírja egy részét egy cselekvés, hogy én részt vesz. 

Tehát, ha belegondolok, hogy A hang "ma" mint anya, vannak különböző komponensek, hogy a hang. Van egy rész, ahol vonok levegőt. És akkor én pénztárca ajkamat. És én forgatom a száját egy kicsit vissza kicsit, hogy, hogy "ma" hangot. És akkor ott van a kibocsátás. Az ajkam szétesik. Air távozik. "Ma". 

E három különböző részein lenne által képviselt államok ebben graph-- A fellépő, a középső és a végén. És szerettem volna átmenetek lehetővé tette számomra, az utazás egyik állam hogy a következő egy bizonyos valószínűséggel. Tehát, például, hogy az M hangzik lehet, hogy egy nagyon- nagyon rövid bevitel a beginning-- "mm" -, majd egy hosszabb, vibrátoros fázis, amikor nálam én ajkait, és szinte humming-- "mmmm" -, majd egy nagyon rövid zárhang ahol kiutasítja breath-- "ma". 

A rejtett Markov modell célja, hogy rögzítse azt a tényt, hogy az út, hogy én hogy ez a hang "ma" folyik kissé eltérő időzítése, a frekvencia, és jellemzői, mint az utat, amit tenni vagy az is, hogy talán hogy ha én beszélek a különböző felhasználási a levél. "Anya" és a "hadd" lesz hang kicsit másképp. 

Így ismerjük fel a különös hangot, mi lenne építeni Markov modellek, ezeket a rejtett Markov modellek, minden lehetséges telefonon, hogy én Érdemes felismerni, minden lehetséges hang, majd nézd meg a akusztikai adatok, hogy van és meghatározza statisztikailag melyik a legvalószínűbb egy hogy elő ez a hang. OKÉ. Ez a modell, amit aztán elkezdi építeni a tetején. Veszünk egy kiejtése modellt. Most, néha kiejtése modellek egyszerű és könnyen mert csak egy van módon kell mondani valamit. Máskor, ők egy kicsit bonyolultabb. Itt egy kiejtési kalauz e piros dolog, ami egy gyümölcs, amit csinál ketchup ki. Az emberek nem hiszem, hogy ez egy gyümölcs. Jobbra? 

Most, sok különböző módon hogy az emberek kimondani ezt a szót. Egyesek azt mondják, hogy "toe-május-talpig." Egyesek azt mondják, hogy "toe-mah-talpig." És mi lehet rögzíteni, hogy a az egyik ilyen grafikus modellek ahol ismét az általunk képviselt átmenetek mint amelynek egy bizonyos valószínűséggel és a kapcsolódó valószínűség velük. 

Tehát ebben az esetben, ha én is követni a felső útvonal az egész gráfot, Lennék kezdve a levél a bal szélen, a "ta" hangot. Én meg az első félévben, A "ó", majd a "ma" majd egy "a", majd egy "ta" és "ó". "Toe-May-talpig." Ha vettem az alsó utat Ennek én lesz "ta-mah-talpig." És ha lementem, majd fel, azt kapnánk "ta-May-talpig." 

Ezek a modellek megragadni ezeket a különbségek mert valahányszor mi telepíteni egy ilyen elismerési rendszerek, ez megy, hogy dolgozni sok különböző fajta ember, sok különböző hangsúlyok, és még különböző felhasználási ugyanazokkal a szavakkal. Végül, a tetején, hogy, fogunk építeni valamit hogy néz ki igazán bonyolult, az úgynevezett nyelvi modell, de valójában a legegyszerűbb A három, mert ezek működnek A úgynevezett n-gram modellek. És ebben az esetben én mutatja meg egy kétrészes n-gram modell, egy Bigram. Megyünk a fizikai az ötletet hogy néha, bizonyos szavak nagyobb valószínűséggel, hogy kövesse egy adott szó, mint mások. Ha én csak azt mondta: "időjárás" A következő szót is valószínűleg "ma" vagy lehet "az időjárás előrejelzés holnap. " De ez nem valószínű, hogy "a Időjárás előrejelzés articsóka. " 

Milyen nyelven modellnek igenis van méri azok statisztikailag hogy megszámolják, néhány nagyon nagy corpus, minden esetben amelyben egy szót következőképpen másik. Tehát, ha veszek egy nagy corpus-- mint minden Wall Street Journal állítottak elő 1930 óta, amely egyike a standard corpuses-- és végignéztem az összes hogy a szöveg, és számítok akár hányszor után "előrejelzés" látom "ma" és hányszor látok "előrejelzés", majd a "articsóka" Az első az egyik megy hogy sokkal nagyobb valószínűséggel. Meg fog megjelenni Sokkal gyakrabban. És ez így lesz egy nagyobb valószínűségi társul hozzá. 

Ha azt akarom, hogy kitaláljuk, a valószínűsége egy egész megnyilatkozás, Akkor én csak törd fel. Így a valószínűsége a tárgyaláson A mondat: "a patkány megette sajt" annak a valószínűsége, a szó "A" kezdő mondata, és akkor annak a valószínűsége, hogy a szó "patkány" szó után "a" és a valószínűsége, hogy a szó "megette" következik "patkány" és a valószínűsége, hogy a "sajt" követi "megette". 

Ez úgy hangzik, mint egy csomó statisztikák, sok valószínűségek. És ez minden, ami van. De a csodálatos dolog, ha ezt egy elég nagy minta adatokat, működik. És ez működik, rettenetesen jól. Mindannyian tudjuk, ezek a technológiák. A legtöbb operációs rendszerek jönnek hangfelismerő ezen a ponton. Az általunk használt Siri és Cortana és az Echo. És ezek a dolgok épülnek az ilyen típusú háromrétegű model-- fonetikai modell alján, egy kiejtése modell a közepén, és a nyelvi modell a tetejükön. 

Most, hogy meg kell csinálni egy kicsit mint hogy annak érdekében, hogy válaszoljon a kérdésekre. De az elismerése, amit te mondás függ pontosan, hogy. Szóval vessünk egy példa van. Szóval van a telefonom ül itt alatta a dokumentum kamera. És megyünk kéri Siri néhány kérdést. Minden rendben? 

Úgyhogy felébredjen a telefonom itt. Siri, milyen az időjárás mint a New Haven ma? 

Siri: Íme az időjárás New Haven, Connecticut ma. 

Brian SCASSELLATI: OK. Tehát először láttad, hogy Siri elismert minden egyes szavak majd készített egy választ. Megbeszéljük, hogy hogyan választ jön egy kicsit. De most, hogy tudjuk hogy ez csak alapul a nyers statisztikák, és ez mintaillesztést a fajta megközelítés, tudjuk játszani néhány játékot Siri. 

Szóval lehet, próbálja újra. Siri, milyen az időjárás víziló New Haven, ma? 

Siri: OK. Itt van az időjárás új Haven, Connecticut ma. Brian SCASSELLATI: Siri Nem daunted, hogy mert ez megtalálható a pattern-- "időjárás", "ma", "New Haven." Ez az, amit ez reagál hogy, csakúgy, mint Eliza. Minden rendben. Adjunk még egy, még nevetségesebb példa. Siri, időjárás articsóka tatu víziló New Haven? 

Siri: Hadd nézzem ezt. Itt van, amit találtam a neten A mi articsókát Armadillo víziló New Haven. 

Brian SCASSELLATI: OK. Szóval ha megy elég messzire re ez a modell, Én vagyok képes összezavarni, mert nem már nem egyezik a minta, hogy van. És, hogy a statisztikai motor, amely azt mondja: mi a valószínűsége, hogy megvan A szavak víziló és articsókával együtt, és tatu? Ez van, hogy valami újat. 

Tehát ezek a technológiák nap mint nap használunk. Ha azt akarjuk, hogy vigye őket egy lépéssel További, bár, ha valóban akarjuk, hogy képes beszélni, mi ez az, hogy ezek a rendszerek reagálnak, beszélnünk kell, megint egy alapvetőbb sor kérdést. És ez olyan téma, a kommunikáció hogy hívjuk kérdést üzenetrögzítő. Azaz, azt akarjuk, hogy képes az alábbiakra: Igen? Közönség: [hallható]. Brian SCASSELLATI: Kapunk a látens szemantikai feldolgozás? Szóval igen. Van egy csomó dolog, hogy történik a felszín alatt Siri és néhány a példák Megyek mutatni legközelebb ahol van egy kicsit szempontjából a struktúra Az, amit mondasz, hogy ez fontos. És valóban, ez egy nagyszerű prekurzor a következő dia nekem. 

Tehát azonos módon, hogy a mi beszédfelismerés épült fel Több réteg, ha azt akarjuk, hogy értem, mi ez, hogy valójában azt mondta, megyünk újra támaszkodnak egy többrétegű elemzés A szöveg, amit most elismerte. Tehát amikor Siri valójában képes mondjuk, nézd találtam ezeket a szavakat. Most mit csináljak velük? Az első komponens gyakran megy keresztül, és próbálja elemezni a szerkezet a mondat. És amit láttunk az iskolában, gyakran, mint egyfajta diagramm mondatokat, megyünk felismerni, hogy bizonyos szavaknak bizonyos szerepeket. Ezek főnevek. Ezek a névmások. Ezek az igék. És mi lesz felismerni hogy egy adott nyelvtani, ebben az esetben angol nyelvtan, vannak Érvényes módszereket, amelyekkel én is össze őket és más módon, amelyek nem érvényesek. 

Ez az elismerés, hogy a struktúra, Lehet, hogy ahhoz, hogy segítsen vezessen bennünket kicsit. De ez nem elég számunkra, hogy meg tudja adni értelme, hogy mit mondanak itt. Ehhez, akkor meg kell támaszkodni bizonyos mennyiségű szemantikai feldolgozás. Ez azt jelenti, megyünk kell nézni A alatta, amit ezen szavak ténylegesen folytatja a jelentését. És a legegyszerűbb módja ennek, fogunk társítani minden szó hogy tudjuk, egy bizonyos funkciót, egy bizonyos átalakulás, hogy lehetővé teszi, hogy megtörténjen. 

Ebben az esetben azt címkén a szó "John", hogy a megfelelő nevet, hogy hordozza a személyazonosságát. És talán címke "Mária", mint az azonos módon. Mivel az ige, mint a "szereti", hogy minősül különösen kapcsolat hogy képesek vagyunk képviseli. Most, hogy nem jelenti azt, hogy megértsük mi a szerelem, de csak, hogy megértsük ez a módja a szimbolikus rendszer. Vagyis, mi lehet címkézni , és manipulálni azt. 

Minden egyes ilyen típusú megközelítések, bármilyen típusú szemantikai feldolgozás Itt lesz szükség egy kicsit kicsit a tudás és a sok munka a részünkről. Már nem vagyunk a birodalmában ahol csak sima statisztikák lesznek elég nekünk. Most, annak érdekében, hogy menjen ettől a ponttól, hogy képes beszélni a belsejében amit valójában itt, hogy képes kezelni ezt strukturálják és megérteni a kérdést majd képes menni, és keresni, amely előírja, hogy egy több, komplex kognitív modellt. 

A mód, ahogyan ezek a rendszerek épülnek ez a legtöbb esetben nagyon-nagyon munkaerő- alapos. Magukban emberek költ sokat az idő strukturálása a módszereket, amely az ilyen típusú mondatok is képviselteti magát némi logika. Ez még egy kicsit bonyolultabb, mégis. 

Még ha egyszer már foglalkozott a szemantika, akkor Még mindig meg kell nézni a pragmatikája mit mondanak. Azaz, hogyan kapcsolódnak a szavakat hogy van valami fizikálisan van a világon, vagy legalább néhány információforrás hogy tudok manipulálni? 

Néha ezek vezetnek Csodálatos bit kétértelműséget. "Vörös-forró csillag nősül csillagász." OKÉ. Most olvastam, hogy a vicces típusú címsort hogy mi lenne látni a késő esti TV mert nem értelmezi a "csillag" hogy annak égitest jelentését. Tudjuk, hogy ez azt jelenti, minél több közhely színész vagy színésznő nagy mennyiségű láthatóságot. 

"Squad segít kutya harap áldozat." Van az, hogy a csapat tulajdonképpen ott a segítő kutya A fog körül, és harapós áldozatok? Vagy azt, hogy nem volt egyén, aki megharapott egy kutya, aki segítségre van szükségem? Csak az nézi a szintaxis és a szemantika a mondatok, nem tudjuk megállapítani, hogy. 

"Helikopter powered by emberi legyek." Vannak-e, sőt, a tényleges kis dolgok repkednek, hogy olyan emberek szárnyakkal bekapcsolása helikopterek az emberiség javára? Vagy van még egy mechanikus szerkezet hogy energiaszükségletét a személy? 

Ha megnézzük a kérdést üzenetrögzítő rendszerek, ezek azok a rétegek, amelyek meg kell foglalkozni. Most, a legjobb és a legtöbb rendezési Az elterjedt ezen rendszerek ma is alkalmasak arra, hogy nem dolgokat olyan szinten, amelyek messze túl mi volt 10 évvel ezelőtt. Itt van az egyik legjobb rendszerek ez kint ma. És ez egy olyan rendszer, Az IBM Watson nevű. Ez a barátainktól az IBM-nél. Ez Katherine bankok, Jia Chen, és Priscilla Moraes ami nekünk a demonstráció Watson Tegnap az IBM Yorktown. [Videó lejátszás] -Hogy van? 

-Én Vagyok jól. Én mindig boldog vagyok, ha gondolkodás, különösen, amikor maradhat hűvös ezekben kiszolgáló helyiségekkel. -Ki A kedvenc színésznő? 

-A Kedvenc színésznője Angelina Jolie, mint Lara Croft Tomb Raider, mert ő eredeti formában volt, mint egy virtuális karakter, mint én. 

-Hogy Lehet Watson segítséget nyújtanak a betegeknek? 

-Van A terv, hogy a betegek férhetnek hozzá Watson közvetlenül? Hozzáférés a Watson tanácsadó alkalmazások változik a használat esetén. De jelenleg, Watson csak olyan lehetséges diagnózis és a kezelés lehetőségek orvos. Adott esetben, a betegek nyújthatnak információt Watson, esetleg egy portál webes felületen, tabletta, vagy akár egy mobiltelefon. Például egy beteg lehet felkérték, hogy tüneteik a természetes nyelvben közvetlenül egy Watson-oldattal, lehetővé teszi az orvos, hogy összpontosítson diagnózis és nem az adatgyűjtést. 

-Ki Meggyilkolták Abraham Lincoln? 

János Wilkes Booth. 

-A Melyik évben az Arizona Diamondbacks megnyerte a World Series? 

-2001. 

[Lejátszás vége] 

Brian SCASSELLATI: Tehát az ilyen típusú rendszerek kell támaszkodni először felismerve a beszédet; második, átalakítása egy értelmes belső képviselet; majd, a harmadik, hogy képes menni, és talál Az információ forrása, hogy lehetővé teszi számukra, hogy erre a kérdésre válaszolni. Ez a szint a komplexitás jár az azonos típusú programadó dolgok hogy már Ennek a problémát készletek. 

Tudjuk elemezni a HTTP kérések az azonos típusú alacsony szintű minta megfelelő, hogy Eliza tehet. Tudjuk alakítani azokat a belső reprezentáció, és majd őket, hogy a lekérdezés néhány külső adatbázis, esetleg SQL. Mind a rendszerek, amelyek épülnek ma hogy ezt a fajta természetes nyelvi kommunikáció épülnek fel ugyanezeket az alapelveket. 

Most még egy ilyen rendszer Watson nem elég bonyolult hogy képes legyen válaszolni önkényes kérdést bármely témában. És valóban, azokat kell strukturált egy adott területen. Így megy online és talál változatai Watson, hogy jól működnek belül az orvosi informatika. Vagy van még egy on-line hogy csak foglalkozik, hogyan hogy jó ajánlásokat milyen sört fog menni, amely élelmiszerrel. És azon belül tartományok, akkor válaszolni a kérdésekre, megtalálni az információt, amelyre szüksége van. 

De nem tudod keverheted azokat. A rendszer, hogy a már képzett az adatbázis, az élelmiszerek és a sör nem működik jól, ha hirtelen betette az orvosi informatika adatbázis. Tehát még a legjobb rendszerek ma támaszkodik a feldolgozottsági szint amelyben vagyunk kézzel kódolás és kiépítése az infrastruktúra érdekében hogy ez a rendszer fut. 

Most, az utolsó téma akarok hogy tudja, hogy a mai kb nonverbális kommunikáció. A nagy tömegű információ, kommunikálnak egymással nem jött át a az egyes szavakat, hogy mi alkalmazása. Meg kell csinálni a dolgokat, mint közelsége, tekintete, a hangnem, Ön inflexiós. És, hogy a kommunikáció is valami, hogy sok különböző interfészek érdekel sokat beszél. Ez nem az, amit Siri törődik. Megkérdezhetem Siri valamit egy hangon vagy egy más hangon, és Siri fog adj ugyanazt a választ. De ez nem az, amit mi építünk Sok más típusú interfészek. 

Szeretném bemutatni Önnek most, hogy az egyik robot. Ez építtette én régi barátom és kollégám Cynthia Breazeal, és a cége Jibo. És ez robot-- megyünk hogy van egy pár önkéntesek jön, hogy befolyásolja ezt. Szóval lehet, hogy két ember hajlandó játszani a robot nekem? Miért nem jössz fel, és miért nem jössz fel. Ha azt csatlakozzon hozzám itt, kérem. 

És ha tudtam volna neked jöjjön ide. Kösz. Szia. 

ALFREDO: Örülök, hogy találkoztunk. Alfredo. 

Brian SCASSELLATI: Alfredo. 

Rachel: Rachel. Brian SCASSELLATI: Rachel. Örülök, hogy találkoztunk mind. Alfredo, én megyek is megy először. Jöjjön ide. Megyek bevezetni you-- ha tudok szerezni ezt le kopogás nélkül a microphone-- egy kis robot nevű Jibo. OKÉ? 

Most, Jibo célja, hogy interaktív. És bár ez adhat beszédet, sok a kölcsönhatás a robot a nonverbális. Alfredo, fogom kérni, hogy mondjuk valami szép és ingyenes A robot, kérem. ALFREDO: Azt hiszem nézel. 

[Berregő hang] Brian SCASSELLATI: OK. A válasz nem verbális. És mégis ez adta mindketten egyértelmű elismerése hogy hallotta, amit mondott és valahogy megértette. OKÉ? Állj ide egy pillanatra. Köszönöm. 

Rachel, ha úgy tetszik. Most fogok adni Ön a sokkal nehezebb feladat. Ha azt álljon itt, mentést csak egy kicsit, így mi lehet kapni a kamera és nézd így. Azt fogom kérni, hogy mondjon valamit Komolyan, és csúnya a robot. 

Rachel: Amit csak úgy tűnt, hogy nem volt teljesen abszurd. 

[Zúgás] 

Ez volt még abszurd. Mi történt veled? Á, nem érzem rosszul. Adok egy ölelés. Brian SCASSELLATI: Rendben. Köszönöm, Rachel. Alfredo, Rachel, köszönöm srácok nagyon. 

[TAPS] 

Tehát ez a fajta kölcsönhatás van a Sok szempontból néhány azonos szabályok és néhány azonos struktúra, amit Lehet, hogy a nyelvi interakció. Ez mind kommunikatív és szolgál fontos célja. És interakciót, a Sok szempontból, úgy tervezték, hogy egy adott hatás a személy kölcsönhatásban áll, vagy hallgat A robot. 

Most én vagyok szerencsés, hogy Jibo ma itt. Sam Spaulding itt segít minket a robot. És én fogom kérni, hogy Sam nekünk egy szép demo Jibo tánc hogy mi lehet nézni a végén itt. Szóval gyerünk, Jibo. 

SAM: OK, Jibo. Mutasd meg nekünk a tánc mozog. 

[Zenelejátszási] Brian SCASSELLATI: Rendben, mindenki. Hála barátaink a Jibo. 

[TAPS] 

És hála a barátainkkal Az IBM a segítettem ma. A kommunikáció valamit hogy fogsz hogy jön egyre több, mint építünk bonyolultabb felületek. A jövő héten lesz szó arról, hogyan illeszthetjük számítógépes ellenfelek játékok. De ha kérdése van az, Leszek körül munkaidőn este. Boldog vagyok, hogy veled beszélni AI A téma vagy bejutni részletesebben. Kellemes hétvégét. 

[TAPS] [Zenelejátszási]