[Mūzikas atskaņošanai] DAVID Malan: Tas ir CS50. Tas ir beigu 10. nedēļā. Un zēns, vai mums ir labs klase jums šodien. Mēs esam tik satraukti, lai uzaicināt divus no Mūsu draugi no Jēlas līdz mums šodien un apskatīt krustojumā mākslīgais intelekts, robotika, dabiskās valodas apstrāde, un daudz ko citu. Un tiešām, pār pēdējo nedēļu laikā, mēs esam protams, pavadīja daudz laika, it īpaši agrākās psets, koncentrējoties uz diezgan zema līmeņa informāciju. Un tas ir ļoti viegli aizmirst no mežā kokiem un get hung up par cilpas un nosacījumiem un norādes, protams, un tamlīdzīgi. Bet realitāte ir jums puiši tagad ir sastāvdaļas, ar kuru jūs varat patiešām atrisināt dažas interesantas problēmas, starp viņiem tie, kas mūsu draugi at Yale strādāt tikai kautrīgam Cambridge. Tātad, ļaujiet man vispirms iepazīstināt mūsu galvas mācību palīgs no Jēlas, Endijs. [Aplausi] ANDY: Pirmkārt, tikai pateikties Jums, kas ļauj pāris Yalies pop uz leju, lai Cambridge šodien. Mēs patiešām novērtējam to. Otrkārt, mūsu draugiem atpakaļ home-- Jason, paldies par uzturas un darbojas lekciju. Ceru, ka tas viss ir labi, New Haven. Tātad yeah, es esmu super satraukti ieviest Scaz šodien. Scaz vada robotikas lab. Viņš ir profesors, piemēram, pieci dažādi departamenti at Yale. Savā lab, viņš ir daudz, daudz roboti, ka viņam patīk spēlēt ar. Viņam ir, piemēram, tad Stilīgākais darbs pasaulē. Un viņš saņem veida haoss apkārt ar to visu dienu garš un darīt kādu darbu, kā arī. Un tā mēs tiešām cēla vienu No tiem uz leju ar mums šodien. Tātad bez papildu ADO, Scaz ir gatavojas iet uz priekšu un iepazīstināt mūs viņa robotu-pastu. [Aplausi] BRIAN SCASSELLATI: Paldies, David. Thanks, Andy. Tas ir tik brīnišķīgi, lai būtu šeit ar visiem šodien. Es gribu, lai vispirms būtu ļoti skaidrs, ka CS50 darbinieki šeit Cambridge ir neticami viesmīlīga mums. Mēs esam tik pateicīgi par visu tie esam darīts, lai atbalstītu mūs. Un tāpēc mēs gribētu, lai spētu atgriezt laipnību. Tātad šodien, mēs paziņojam ka mēs esam nāksies jaunu, viens-of-a-kind CS50 notikums notiek New Haven nākamnedēļ. Un tas ir CS50 Research Expo. Tātad mēs ejam, lai būtu aicinot everyone-- CS50 studenti, personāls gan no Hārvardas un Yale-- līdz nokāpt un apmeklēt kopā ar mums piektdien. Mums būs dažādas over 30 dažādi cilvēki, kas rada un exhibiting-- upperclassmen parādot off daži no to pētniecības produktu. Mums nāksies dažas jaunizveidotiem, pat, looking par mazliet jauno tehnoloģiju talantu, jaunizveidotiem gan no Hārvardas un Jēlas. Un mums būs dažas studentu grupas meklē kādu jaunu biedru. Tas būs ļoti aizraujošs laiks. Cerams, ka tiem no jums, kas ir nokāpjam uz Harvard-Yale spēles varēs apstāties ar mazliet agri, Tiesības centrā Campus, Sterling Memorial Library. Mēs ejam, lai būtu komplekts eksponāti, kas svārstās no autonoma Buru veidiem, kā, izmantojot programmatūru lai saglabātu viduslaiku manuskripti. Mēs ejam, lai būtu reklāma hoc tīklu un cilvēki mācību programmatūras kodēšana Keiptaunā. Mums būs dators mūzikas paraugdemonstrējumi. Un mēs, protams, ir vairāk roboti. Tāpēc mēs ceram, ka jums pievienoties mums par šo notikumu. Tas būtu daudz fun, mazliet pārtikas, un daudz interesanta lietas runāt. Tātad šodien, mēs ejam, lai runātu par dabiskās valodas apstrādē. Un tas ir mēģinājums mums būvēt jaunu veidu, kā saskarsme ar mūsu ierīcēm, jo par pēdējo pāris nedēļu laikā, Jūs esat bijusi vērsta uz to, kā tas ir, ka jūs varat rakstīt kodu, rakstiet programmatūru tas ir veids, kā to var pateikt līdz A mašīna, tas ir tas, ko es gribu, lai jūs darīt. Bet mums nevajadzētu nepieciešams sagaida, ka viss tas ir tur, ka ir izmantots ikviens pasaulē būs ieguvēji šāda veida apmācību. Tātad mēs atšķirt datoru valodas un dabas languages-- tas ir, lietas, ka cilvēki izmantošanu lai sazinātos ar citiem cilvēkiem. Un mēs cenšamies veidot saskarnes, kas izmanto Šīs dabiskās saziņas mehānismi. Tagad, tāpat kā jebkuru citu tēmu ka mēs esam sākuši ar in CS50, mēs esam gatavojas sākt ar vienkāršāko mazliet dabiskās valodas apstrādes ka mēs varam iedomāties. Mēs ejam, lai sāktu ar vēsturiskā daļa no dabiskās valodas. Un tad mēs veidot līdz vairāk un vairāk nesenie sistēmas un ir dažas jautri demos gar ceļu. Tāpēc mēs esam gatavojas sākt ar to, kas bija iespējams, pirmā dabiskās valodas apstrādes sistēmu. Tas bija programmatūras sistēmu uzrakstīts 1966 Joseph Weizenbaum sauc Elīza. Un ELIZA tika izstrādāta, lai atkārtot veida mijiedarbības jums būtu ar Rogerian psihoterapeits. Tagad, Rogerians, tie bija doma, ka psihoterapija iesaistīti spēja atspoguļot atpakaļ pacientam un runāt ar viņiem, Būtībā, ko tikai dodot viņiem tiny mazliet terapeits. Tas ir, viss ka terapeits teica vajadzēja būt tikai atspulgs ko pacients stāsta viņiem. Tātad pamēģināsim un DEMO. Vai mums ir brīvprātīgais, kurš gribētu būt vēlas dalīties savas dziļākās, tumšākās, un / vai viltus noslēpumus ar Elīza? Protams, kāpēc nav jūs nākt uz augšu. Fantastic. Un jūsu vārds? MILES: Miles. BRIAN SCASSELLATI: Miles. Nice to meet you, Miles. Ja jūs turēt uz to. Un mēs ejam izmantot versiju Elīza ka mēs esam atkārtot ietvaros CS50 IDE. Un mēs apskatīt avota kodu tas pēc kāda brīža. Bet tieši tagad, mēs esam tikai gatavojas izmantot to, ierakstot Eliza. Un ELIZA gatavojas sniegt jums atbildes kas būs visās galvaspilsētās. Un gatavojas lūgt jums dažus jautājumus. Un mēs reaģēt un tips atbildēs uz Elīza. Tātad ELIZA ir teicis: "Sveiki, es esmu Elīza. Kāda ir jūsu problēma? " Ko jūs vēlētos pastāstīt Elīza par šodien? MILES: Es varu krist tikai miegā ja man ir bunny čības on. BRIAN SCASSELLATI: Nu labi. Viss kārtībā. [Smiekli] "Es varu krist tikai miegā ar bunny čības tālāk. " Un ELIZA saka: "Saki, vai ne ir kādas psiholoģiskas problēmas? Varbūt tas ir labs rādītājs. " LABI. Tātad, ko jūs vēlētos, lai atbildētu? MILES: Jā. BRIAN SCASSELLATI: Jā. Man ir daudz vārdu. Man patīk, ka. Eliza saka: "Jūs, šķiet diezgan pozitīva." MILES: Nē, es esmu, patiesībā, elektronu. BRIAN SCASSELLATI: "Nē. Patiesībā, es esmu elektronu. " "Vai tu nāc pie manis jo jūs esat elektronu? " Tagad mēs varam redzēt dažus no things-- es eju lai apturētu jums tikai sekundi, Miles. Vai nav iet visur. Mēs neesam darījuši ar jums vēl. ELIZA ir, dažos veidos, atbildot uz dažām lietām ka viņš saka, bet bez kāds reāls izpratne. Un tas ir arī parroting atpakaļ dažus no daļām soda izciešanas. Tātad mēs teicām, "Nē. Patiesībā, es esmu elektronu. " Eliza atbildēja atpakaļ, "Vai tu nāc man, jo esat elektronu? " Viss kārtībā. Let 's to vēl vienu atbildi šeit. To labi vienu, Miles. MILES: labs? Jā, lūdzu, palīdziet man. BRIAN SCASSELLATI: "Jā. Lūdzu, palīdziet man. "" Vai tu esi pārliecināts? " MILES: Nē. BRIAN SCASSELLATI: Nē. "Ko tas liecina par jums?" MILES: Es nevar būt elektronu. BRIAN SCASSELLATI: "Es nevar būt elektronu. " "Vai Jūs sakāt, ne tikai, lai būtu negatīvs?" Viss kārtībā. Tātad Miles, paldies jums tik daudz. MILES: Paldies. BRIAN SCASSELLATI: Pateicoties ļoti daudz. [Aplausi] Tātad šis ELIZA programma, daudzos veidos, reaģē tikai uz gabalu ka mēs esam sniedzot bez jebkāda dziļi izpratne par to, kas notiek šeit. Tas ir sava veida sistēmas sauc modeļa saskaņošana, kur mēs meklējam dažu biti teksta, kas mēs esam, tad gatavojas ņemt ārā no tā, ko tika sniegta kā ievade, pārvērst to, iespējams, kaut kādā veidā, un tad dot to atpakaļ uz lietotāja. Vai kāds no jums domā ka ELIZA faktiski Veicot derīga psihoanalīzi šeit? Viens cilvēks, varbūt. Mērķauditorija: [nedzirdama]. BRIAN SCASSELLATI: Un cik Vai, kas padara jūs jūtaties? Jā, patiesībā, tā dara. Un mēs ejam, lai redzētu, faktiski, tad pirmkods to tikai brīdi. Un tā jūs esat būs iespēja darīt tieši to. Tagad, ELIZA ir viens veids, ko mēs saucam šodien tērzēšanas bot. Tas tikai iet cauri Teksta ka jūs nodrošināt, nodrošina absolūtu minimālo summu izpratnes vai pārstrāde, un tad papagaiļi to atpakaļ uz jums. Tātad, pieņemsim to apskatīt, konceptuāli, un runāt par to, kas tas ir, ka ELIZA ir faktiski dara. ELIZA sper sentence-- pieņemsim saka: "Es vēlos, lai ieskaidrot mans priekšnieks." Un ELIZA meklē caur šo teikumu un mēģina atrast un atbilst noteiktiem modeļiem. Tā, piemēram, viens no veidiem ka ELIZA meklē ir vārdi "Es gribu." Un jebkurā laikā tas redz kaut ko ka ir "es gribu" tajā, tā formulē atbildi. Un šī atbilde ir fiksēta virkne. Šajā gadījumā tas ir "kāpēc tu gribi?" Un man mazliet zvaigzne pie beigas, jo tas ir tikai sākums mūsu reakciju. Un zvaigzne norāda, ka mēs spēsim veikt pārējo no lietotāja utterance-- "ieskaidrot mans priekšnieks" - un mēs esam gatavojas pievienot ka uz beigām šīs virknes. Tāpēc tagad, nevis sakot, "kāpēc Vai jūs vēlaties pārsteigt mans priekšnieks, " tur ir mazliet papildus apstrādi, ko mēs darīsim. Tas ir, mums nāksies pārvērst daži no vietniekvārdu šeit no "mans boss" "Jūsu boss." Un tur varētu būt daži citi izmaiņas, kas mums ir nepieciešams veikt. Tātad, nevis tikai uzlīmēšanu to tieši uz beigām, ko mēs darīsim ir mēs ņemšu pārējo lietotāja utterance-- baltā here-- un mēs ņemšu to vienā gabalā pie laiks un pārvērst katru stīgu pilnvara, katrs vārds, uz teikumā. Tātad mēs ņemšu vārdu "to." Nav konversija ka mums ir nepieciešams, lai to izdarītu. "Impress." Nav konversija mums jādara tur. "My" būs konvertēt uz "savu". Un "boss", mēs vienkārši atstāt kā "boss." Un tad beidzot, kaut kas kas beidzas ar uz laiku, mēs pārvērst to par jautājumu. Tas ir ļoti vienkāršs modelis saskaņošana faktiski ir diezgan veiksmīga. Un, kad tas tika ieviests in 1966-- Joseph Weizenbaum ieprogrammēts šis datorā. Tagad, datori tajā laikā nebija galddatora modeļus. Tie tika dalīta resursus. Un viņa skolēni iet un tērzēt ar Elīza. Galu galā, viņš bija ierobežot piekļuvi tai jo viņa studentiem nebija iegūt jebkuru darbu. Viņi bija tikai čatā ar Elīza. Un, patiesībā, viņš bija uguns viņa palīgs, kurš pavadīja visu savu laiku runājot ar Elīza par viņas dziļas un problemātiskākajiem problēmām. Ikvienam, kas izmanto šo sistēmu sāka anthropomorphize tos. Viņi sāka domāt par to, kā ir dzīva un reāli cilvēki. Viņi sāka atzīt dažus lietas, ko viņi saka nāca atpakaļ uz tiem. Un viņi bija uzzināt lietas par sevi. Un, patiesībā, pat ekspertiem, pat psihoterapeiti, sāka uztraukties, ka, patiesībā, varbūt ELIZA būtu aizstāt tos. Un pat dators zinātnieki uztraucas, ka mēs bijām tik tuvu, lai atrisinātu dabisko valodu. Tagad, ka nebija nekur tuvu taisnība. Bet tas, cik iespaidīgs šīs sistēmas var šķist. Tāpēc sāksim meklēt zem un mēģināt lai iegūtu mazliet jautājumu no tā, kur šis kods patiesībā notiek. Tāpēc mēs veiksim šo kodu pieejama. Un tas ir ļoti vienkāršs un tiešs osta no sākotnējā Elīza īstenošanu. Tāpēc daži no šiem stilistisks lietas, ko jūs redzat šeit ir ne stilistiski ko mēs vēlamies, lai jūs darīt vai tas, ko mēs esam māca jums darīt. Bet mēs esam centušies, lai saglabātu tos pats pāri daudzām ostām ka tas ir bijis tā, ka tas ir aromāts oriģinālu. Tātad mēs ejam, lai iekļautu ķekars lietas, un tad mums būs noteikt atslēgvārdu, lietas ka ELIZA atzīs un atbildēt tieši. Tātad, ja jums ir vārdi, piemēram, "Vai jūs varat" vai "Man nav" vai "nē" vai "jā" vai "sapnis" vai "hello", tad ELIZA būs selektīvi atbildēt uz tiem. Mēs ir arī noteikts skaits lietas ka mēs swap, piemēram, pārveidojot "mans" uz "savu". Un tad mums būs kopums atbildes ka par katru no šiem atslēgvārdiem, mēs rādīsim cauri šie dažādie atbildes. Tātad, ja es saku "jā" trīs reizes pēc kārtas, es varētu saņemt trīs dažādas atbildes no Elīza. Mūsu kods, tad ir patiesībā ļoti vienkārši. Ja es ritiniet uz leju garām visiem šiem atbildes, ka mēs esam programmēt un mēs jāķeras pie mūsu galvenais, mēs ejam, lai sāktu pāris dažādiem mainīgajiem un darīt mazliet mājturība sākumā. Bet tad tur ir absolūti kopums kodu, ka jūs varat saprast. Viens liels kamēr cilpa, kas saka, ka es esmu gatavojas atkārtot šo vairāk un vairāk. Es izlasīju rindā, un es ņemšu uzglabāt, ka ievades virkni. Es ņemšu pārbaudīt un redzēt, ja tas ir special atslēgvārdu "bye", kas nozīmē iziet no programmas. Un tad es ņemšu pārbaudīt un redzēt, vai kāds ir tikai atkārtojot sevi atkal un atkal. Un es kliegt pie viņiem, ja viņi dara. Es saku "neatkārtot sevi." Tik ilgi, kamēr neviens no tiem notikt, mēs tad skenēt cauri un cilpas cauri, līnijās 308 līdz 313 šeit, un pārbaudīt un redzēt ir kāda no šīm atslēgvārda frāzes ietvertie ievadi ka man bija tikai dota? Ja ir spēle tiem, labi Tad, es atceros, ka atrašanās vietu. Es atceros, ka atslēgvārdu. Un es būšu spējīgs veidot atbildi. Ja man nav atrast vienu, arī tad, pēdējā lieta manā atslēgvārdu masīvs būs noklusējuma atbildes, ja nekas cits sacensībām. Es uzdot jautājumus, piemēram: "Kāpēc jūs nākt šeit? "vai" Kā es varu jums palīdzēt? " ka ir tikai daļēji atbilstošs vienalga kāds ieguldījums ir. Pēc tam mēs veidot Elīza atbildi. Mums būs iespēja veikt atbilde, ka bāze, tāpat kā mēs to darījām ar to, ka "mans boss" piemērs. Ja tas ir viss, kas tur is-- ja tas ir tikai viens virkne, kas es esmu vajadzēja respond-- Es varu tikai nosūtīt to atpakaļ out. Ja tas ir zvaigznīti pie beigas tā, tad es ņemšu apstrādāt katru atsevišķu pilnvara pārējā lietotāja atbildes reakciju un pievienot tiem, pārnešana no vārds pa vārdam, jo ​​man ir nepieciešams. Tas viss ir absolūti kaut kas jūs varētu veidot. Un, veidi, kas faktiski mēs ir apstrādāti komandrindas argumentus, veids, kurā jums ir apstrādāti, izmantojot HTTP pieprasījumus ievēro tos pašus veidu noteikumiem. Viņi modelis saskaņošana. Tātad ELIZA bija samērā svarīgs ietekme uz dabisko valodu jo tas padarīja šķist tas bija ļoti sasniedzams mērķis, piemēram, kaut kā mēs gribētu varētu atrisināt šo problēmu tieši. Tagad, tas nav teikt, ka ELIZA dara viss, ko mēs vēlamies darīt. Protams, ne. Bet mums ir jāspēj darīt kaut ko vairāk. Mūsu pirmais solis, lai dotos aiz ELIZA notiek lai varētu apskatīt nav teksta ievadīšanas uz klaviatūras, bet runā, faktiskais runas ierakstīti mikrofonā. Tātad, kā mēs skatāmies uz šiem dažādi gabali, mēs esam nāksies veidot kopumu modeļiem. Mēs ejam, lai būtu jāspēj lai iet no zema līmeņa akustiskās information-- piķis, amplitūda, frequency-- un pārvērst kas stājas Dažas vienības, ka mēs esam spēj vieglāk manipulēt un, visbeidzot, manipulēt ar viņiem vārdos un teikumos. Tātad lielākā daļa runas atpazīšanas sistēmas, kas ir, kas tur šodien sekot statistisks modelis, kurā mēs veidojam Trīs atsevišķas priekšstati par to, ko ka audio signāls faktiski ir. Sākam ar fonētisko modeli kas runā par tikai pamatnes izklausās, ka es esmu ražo. Es esmu, kas ražo kaut ko, kas ir B kā zēns vai D kā suns? Kā es varu atpazīt tos divas dažādas Tālruņi kā atsevišķa un atšķirīga? Papildus, ka, mēs tad būvēt vārdu izruna modelis, kaut kas saista kopā šie individuālie phones un apvieno tos vārdu. Un pēc tam, mēs ņemšu vārdus un mēs apkopot tos ar valodu modelis par pilnīgu teikumā. Tagad mēs gatavojamies runāt par katru no tām neatkarīgi un atsevišķi. Bet šie trīs modeļi ir visi tikai būs statistika. Un tas nozīmē, ka tad, kad mēs strādāt ar viņiem, mēs varētu strādāt ar tos visus vienlaicīgi. Viss kārtībā. Sāksim ar mūsu fonētisko modeli. Tātad fonētiskās modeļi paļauties uz skaitļošanas tehnika sauc slēptie Markova modeļi. Tie ir grafiskie modeļi, kurā es ir, un jāatzīst stāvokli pasaulē kā ir raksturīga ar pazīmju kopums. Un ka valsts apraksta vienu daļu darbībās, kas es esmu iesaistīts. Tātad, ja es domāju par pieņemšanas skaņa "ma", piemēram, māte, ir dažādi komponenti, ka skaņu. Tur ir daļa, kur es ievilkt elpu. Un tad es maku manas lūpas. Un es roll manas lūpas atpakaļ mazliet bit, lai šo "MA" skaņu. Un tad tur ir release. Manas lūpas nāk intervālu. Gaiss tiek izspiests. "Ma." Šie trīs dažādas daļas būtu pārstāv valstis šajā graph-- sākums, vidus un beigas. Un es būtu pārejām, ka ļāva man ceļot no vienas valsts uz nākamo ar noteiktu varbūtību. Tā, piemēram, ka M skaņa varētu būt ļoti, ļoti īss uzņemšana pie beginning-- "mm" - un pēc tam garāks, vibrācijas posms, kur es esmu, turēja manu lūpas kopā un gandrīz humming-- "mmmm" - un pēc tam ļoti īss eksplozīvs kur es izraidīt breath-- "ma." Slēptās Markov modelis paredzēts, lai attēlotu to, ka tā, ka es veicu ka skaņa "MA" gatavojas būs nedaudz atšķirīga tā laika, ir frekvence, un tās funkciju nekā tā, ka jūs darīt to vai tā, ka es varētu darīt to, kad es runāju Par izmantot dažādi vēstules. "Māte", un "es var" būs skaņas nedaudz savādāk. Tātad, lai atzīt īpaši skaņu, mēs būtu būvēt Markova modeļus, šie slēptās Markova modeļus, no visu iespējamo tālrunis, I varētu vēlēties atzīt, Katru iespējams skaņas, un tad apskatīt akustiskā dati, ka man ir un noteikt statistiski kuriem viens ir visticamāk, viens ir radījusi šo skaņu. LABI. Ar šo modeli, mēs pēc tam sāk veidot uz augšu no tā. Mēs to izruna modeli. Tagad, dažreiz izruna modeļi ir vienkārši un viegli jo tur ir tikai viens veids, kā izrunāt kaut ko. Citas reizes, viņi Mazliet vairāk sarežģī. Lūk izruna guide par šo sarkano lieta, kas ir auglis, kas jūs veicat kečupu no. Cilvēki nedomāju, ka tas ir auglis. Tiesības? Tagad tur ir daudz dažādi veidi ka cilvēki izrunāt šo vārdu. Daži teiks "toe-maijā-toe." Daži teiks "toe-Mah-toe." Un mēs varam uzņemt, ka ar viens no šiem grafiskos modeļus ja, atkal, mēs pārstāvam pārejas kā ar zināmu varbūtību un saistīta varbūtību ar tiem. Tātad šajā gadījumā, ja man bija, lai sekotu top maršruts cauri visam šīs diagrammas, Es būtu sākot ar burtu par tālu pa kreisi, tad "ta" skaņa. Es vēlētos veikt augšējo pusi, uz "oh," un tad "ma," un tad "A", un pēc tam "ta" un "oh." "Toe-var-toe." Ja es ņēma apakšējo ceļu cauri Tas, es saņems "TA-Mah-toe." Un, ja es devos uz leju un pēc tam up, es varētu saņemt "TA-May-toe." Šie modeļi attēlotu šos atšķirības, jo ikreiz, kad Mēs izvietot viens no šiem atpazīšanas sistēmas, tas nāksies strādāt ar daudz dažāda veida cilvēku, daudz dažādu akcentiem, un pat izmantot dažādi tiem pašiem vārdiem. Visbeidzot, papildus, ka, mēs veidot kaut ko kas izskatās tiešām sarežģīta, sauc valoda modelis, bet patiesībā ir visvienkāršākais no trīs, jo tie darbojas par to, ko sauc par n-gramu modeļiem. Un šajā gadījumā, es esmu parādot, divu daļa n-gramu modelis A bigram. Mēs ejam, lai padarītu fiziskās ideju ka reizēm daži vārdi ir visticamāk sekot dots vārds nekā citi. Ja es tikko teicu "laika prognoze," nākamais vārds varētu būt iespējams, "šodien" vai varētu būt "laika apstākļi prognoze rīt. " Bet tas ir maz ticams, ka par " Laika prognoze artišoks. " Kas valoda modelis tas ir tas ietver tos statistiski skaitīšana, no dažām ļoti liela corpus, visi no gadījumiem kurā viens vārds seko otru. Tātad, ja es lielu corpus-- tāpat katru Wall Street Journal kas ir ražots kopš 1930. gada, kas ir viens no standarta corpuses-- un es ceru, izmantojot visu šis teksts, un es paļaujos up Cik reizes pēc "prognoze" es redzu "šodien" un cik reizes es varu redzēt "prognoze", kam seko "artišoks," pirmais notiek būt daudz biežāk. Tas notiek, lai parādās daudz biežāk. Un tā tas būs augstāks varbūtība, kas saistītas ar to. Ja es gribu, lai noskaidrotu varbūtība visu izteikuma, tad, es vienkārši lauzt uz augšu. Tātad varbūtību sēdes teikumu "žurkas ēda sieru" ir varbūtība vārda "par", sākot teikumu, un tad varbūtība, ka vārds "žurka" seko vārdu par "," un varbūtība, ka Vārds "ēda" seko "žurkas," un varbūtība, ka "siers" seko "ēda." Tas izklausās daudz statistika, daudz varbūtībām. Un tas ir viss, kas tas ir. Bet apbrīnojamo lieta ir, ja jūs to izdarītu ar pietiekami liela paraugu datiem, tas strādā. Un tas darbojas ārkārtīgi labi. Mēs visi zinām, šīs tehnoloģijas. Lielākā daļa operētājsistēmas nāk ar balss atpazīšanas šajā brīdī. Mēs izmantojam Siri un Cortana un ECHO. Un šīs lietas pamatā ir šāda veida trīsslāņu model-- fonētiska modelis apakšējā A izruna modelis vidū, un valodu modelis virsū tiem. Tagad viņi ir jādara mazliet vairāk nekā, ka, lai atbildētu uz jautājumiem. Bet atzīšana, ko jūs esat teiciens ir atkarīgs tieši no tā. Tātad pieņemsim ņemt piemēru šeit. Tāpēc man ir mans telefons sēdētu šeit zem dokumentu kameru. Un mēs ejam, lai lūdz Siri dažus jautājumus. Viss kārtībā? Tātad pieņemsim pamosties manu tālruni šeit. Siri, kas ir laika apstākļi tāpat New Haven šodien? Siri: Lūk laika apstākļi New Haven, Connecticut šodien. BRIAN SCASSELLATI: OK. Tātad vispirms redzējāt, ka Siri atzīta katrs no atsevišķo vārdiem un tad ražo atbildi. Mēs runājam par to, kā šī atbilde nāk par in mazliet. Bet tagad, kad mēs zinām, ka tas ir tikai, pamatojoties par izejvielu statistiku un tas modelis saskaņošana veida pieeja, mēs varam spēlēt dažas spēles ar Siri. Lai es varētu mēģināt vēlreiz. Siri, kas ir laika apstākļi nīlzirgs New Haven, šodien? Siri: OK. Lūk laika, lai jauns Haven, Connecticut šodien. BRIAN SCASSELLATI: Siri s ne daunted ka jo tas ir atradis pattern-- "Laika", "šodien", "New Haven." Tas ir tas, ko tas reaģē lai, tāpat kā Elīza. Viss kārtībā. Let 's to vēl viens pat vairāk smieklīgi piemērs. Siri, laika artišoks Armadillo nīlzirgs New Haven? Siri: Ļaujiet man pārbaudīt, ka. Lūk, ko es atradu tīmeklī par to, kas ir artišoki bruņnesis nīlzirgs New Haven. BRIAN SCASSELLATI: OK. Tātad, ja es pietiekami tālejošs prom no šī modeļa, Es esmu spējīgs, lai maldinātu, jo tas nav ilgāk atbilst modelis, kas tas ir. Un tas statistiskā dzinējs, kas saka, kāda ir iespēja, ka jūs esat ieguvuši vārdi nīlzirgs un artišoks kopā, un Armadillo? Tas ir got būt kaut kas jauns. Tātad šo tehnoloģiju mēs izmantojam katru dienu. Ja mēs gribam, lai viņiem vienu soli turklāt, lai gan, ja mēs faktiski vēlas, lai varētu runāt par to, ko tā ir tā, ka šīs sistēmas reaģē uz, mums ir jārunā, atkal, apmēram daudz nopietnāka komplekts jautājumiem. Un tas ir temats komunikācijas ka mēs saucam jautājumu atbildēšanas. Tas ir, mēs vēlamies, lai varētu kuri paredzēti, yeah? Mērķauditorija: [nedzirdama]. BRIAN SCASSELLATI: Vai mēs par apslēptu semantisku apstrādi? Tātad, jā. Ir daudz lietas, kas ir notiek zem virsmas ar Siri un dažu piemēriem Es esmu gatavojas parādīs nākamo kur ir diezgan daudz ziņā struktūrā par to, ko jūs sakāt, ka ir svarīgi. Un, patiesībā, tas ir liels priekšnoteikums nākamo slaidu par mani. Tātad, tādā pašā veidā, ka mūsu runas atpazīšanas tika uzcelta no vairākiem slāņiem, ja mēs gribam, lai saprast, kas tas ir, ka ir faktiski ir teikt, mēs ejam, lai atkal paļauties uz daudzslāņu analīze Teksta, kas ir tiek atzītas. Tātad, kad Siri ir faktiski spēj teiksim, izskatās es atklāju šos vārdus. Tagad, ko man darīt ar viņiem? Pirmais komponents ir bieži iet cauri un mēģināt analizēt struktūra teikumā. Un ko mēs esam redzējuši pakāpē skolā, bieži vien, kā sava veida shēmu teikumi, mēs ejam atzīt, ka dažu Vārdi ir noteiktas lomas. Tie ir lietvārdi. Tie ir vietniekvārdi. Tie ir vārdi. Un mēs ejam atpazīt ka par konkrētu gramatikas, šajā gadījumā angļu valodas gramatikas, ir derīgas veidi, kā es varu tos apvienot un citi veidi, kas nav derīgs. Tas atzīšana, ka struktūra, varētu būt pietiekami, lai palīdzētu virzīt mums mazliet. Bet tas nav gluži pietiekami lai mēs varētu sniegt jebkurš nozīmē to, kas tiek šeit teica. Lai to izdarītu, mums būs jāpaļaujas uz daži summa semantiskā apstrādi. Tas ir, mēs esam nāksies meklēt at zem to, ko katrs no šiem vārdiem faktiski veic kā jēgu. Un vienkāršākais veids, kā to izdarīt, mēs ejam saistīt ar katru vārdu ka mēs zinām, noteiktu funkciju, zināma transformācija, kas to ļauj notikt. Šajā gadījumā mēs varētu apzīmēt vārds "Jānis", kā pareizi nosaukums, ka tas veic ar to identitātes. Un mēs varētu marķēt "Mary" kā tādā pašā veidā. Tā kā darbības vārds, piemēram, "mīl", kas rada īpašu saikni ka mēs esam spējīgi pārstāvēt. Tagad, tas nenozīmē, ka ka mēs saprotam kas ir mīlestība, bet tikai to, ka mēs saprotam tā ceļā simbolisku sistēmu. Tas ir, mēs varam apzīmēt tas un manipulēt ar to. Ar katru no šīm pieejām veidiem, jebkāda veida semantiskās apstrādes šeit gatavojas prasīt nedaudz Zināšanu bit un daudz darba no mūsu puses. Mēs vairs valstība kur tikai plain statistika gribam būt pietiekami mums. Tagad, lai iet no šā punkta līdz to varētu sarunāties par iekšpusē to, kas patiesībā notiek šeit, līdz ar to var manipulēt šo strukturēt un saprast jautājumu un pēc tam to var lai iet un meklēt, kas prasa vairāk sarežģīts kognitīvo modeli. Veids, kādā šīs sistēmas ir būvētas ir lielākā daļa ļoti, ļoti darba intensīva. Tie ietver cilvēkus izdevumu daudz laika strukturēšanas veidiem, kas šie sodu veidi var attēlot kādu loģiku. Tas izpaužas pat nedaudz sarežģītāka, though. Pat tad, kad mēs esam aplūkoti ar semantiku, mēs vēl apskatīt pragmatika par to, kas tiek teica. Tas ir, kā es varu attiekties vārdus ka man ir kaut kas fiziski out tur pasaulē vai Vismaz daļa informācijas avots ka es varu manipulēt? Dažreiz, tie noved pie brīnišķīgi biti neskaidrību. "Red-karsti zvaigzne precēties astronoms." LABI. Tagad mēs lasām, ka kā funny veids virsraksta ka mēs varētu redzēt uz vēlu vakarā TV jo mums nav interpretēt "zvaigzne" lai tās debess ķermeņa jēgu. Mēs zinām, ka tas nozīmē, ka vairāk parasts aktieris vai aktrise ar lielu daudzumu redzamību. "Squad palīdz suns iekost upuri." Vai tas, ka komanda ir faktiski kas tur palīdzot suns jo iet apkārt un nokošana upurus? Vai ir tā, ka tur bija fiziskai personai, kas iekoda suns, kurš bija nepieciešama palīdzība? Tikai no apskatot sintakse un semantika teikumus, mēs nevaram noteikt, ka. "Helikopters, ko darbina cilvēka mušas." Vai ir, faktiski, faktiskais maz lietas, kas peld apkārt, ka ir cilvēki ar spārni darbinātu helikopteri par cilvēces labā? Vai ir vēl kāda mehāniska ierīce kas iegūst savu spēku no personas? Kad mēs skatāmies uz jautājumu atbildētāji sistēmas, šie ir slāņi, kas mums ir nepieciešams, lai risinātu ar. Tagad, labākais un visvairāk kārtošanas no izplatīta no šīm sistēmām šodien ir iespēja to darīt lietas, tādā līmenī, kas ir tālu pārsniedz to, ko mums bija pirms 10 gadiem. Lūk, viens no labākajiem sistēmu tas, kas tur šodien. Un šī ir sistēma no IBM Watson sauc. Tas ir no mūsu draugiem pie IBM. Tas ir Katherine bankas, Jia Chen, un Priscilla Moraes sniedzot mums demonstrācija Watson vakar IBM Yorktown. [Video atskaņošana] -Kā tev iet? -Man iet labi. Es vienmēr esmu laimīgs, kad es esmu domāšana, jo īpaši, kad es var palikt atdzist šajos serveru telpās. -Kas Ir tava mīļākā aktrise? -Mana Mīļākā aktrise Angelina Jolie kā Lara Croft in Tomb Raider jo viņas oriģināls forma bija kā virtuālo raksturu, piemēram, man. -Kā Var Watson palīdzēt pacientiem? -Vai Plānu pacientiem līdz piekļūt Watson tieši? Piekļuve Watson konsultāciju Pieteikumus var atšķirties atkarībā no izmantošanas gadījumā. Bet šobrīd, Watson tikai sniedz iespējams diagnostika un ārstēšana iespējas, lai medicīnas darbinieks. Vajadzības gadījumā, pacientiem var sniegt informāciju, Watson, varbūt caur Portāls web interfeiss, tablete, vai pat mobilo telefonu. Piemēram, pacients var būt lūgts aprakstīt savus simptomus dabiskā valodā tieši par Watson risinājumu, ļaujot ārsts pievērsties diagnozi un nav datu vākšana. -Kas Noslepkavots Abraham Lincoln? -Jāņa Wilkes Booth. -In Ko šogad darīja Arizona Diamondbacks uzvarēt World Series? -2001. [Beigtu atskaņošanu] BRIAN SCASSELLATI: So Šie sistēmu veidi jāpaļaujas uz vispirms atzīstot runu; otrkārt, pārveidojot to par nozīmīgu iekšējā pārstāvība; un tad, treškārt, to var iet ārā un atrast informācijas avots, kas ļauj viņiem atbildēt uz šo jautājumu. Šī sarežģītības līmenis ietver paši veidi programmatiski lietas ka jūs esat bijis darot problemātiskajās komplektos. Mēs varam apstrādāt HTTP pieprasījumus tāda paša veida zema līmeņa modelī saskaņošana ka ELIZA var darīt. Mēs varam pārvērst tos uz iekšējo pārstāvību, un tad izmanto tos, lai vaicājumu daži ārējās datubāzes, iespējams, izmantojot SQL. Visas sistēmas, kas Tiek šodien būvēts darīt šāda veida dabas valoda komunikācija tiek būvētas uz šie paši principi. Tagad, pat, piemēram, sistēma Watson nav pietiekami sarežģīts lai varētu atbildēt uz patvaļīgu jautājumus par jebkuru tēmu. Un patiesībā, viņiem ir jābūt strukturēta dotajā sfērā. Tātad jūs varat doties tiešsaistē, un jūs varat atrast versijas Watson, kas darbojas labi ietvaros medicīnas informātika. Vai tur ir viens online kas tieši nodarbojas ar to, kā veikt labus ieteikumus par ko alus dosies ar kuru pārtika. Un šajās jomās, tā var atbildēt uz jautājumiem, atrast informāciju, kas tai vajadzīga. Bet jūs nevarat samaisa un saskaņot tos. Sistēma, kas ir bijis apmācīts ar datu bāzi, pārtikas un alus nedarbojas labi, ja jūs pēkšņi ielieciet to ar medicīnas informātikas datubāzi. Tātad, pat mūsu labākie sistēmas šodien paļauties līmeņa apstrādei kurā mēs esam roku kodēšana un ēkas infrastruktūrā, lai lai padarītu šo sistēmu palaist. Tagad, pēdējo tēmu es gribu lai varētu nokļūt uz šodienu ir par neverbālā komunikācija. Liels masu informācijas, ka mēs komunicēt ar otru nenāk par cauri individuālie vārdi, kas mēs esam, ko piemēro. Tas ir saistīts ar lietām, piemēram, tuvums, skatiens, jūsu balss tonis, Jūsu lēciena. Un, ka komunikācija ir arī kaut kas daudz dažādas saskarnes vienalga daudz par. Tas nav tas, ko Siri rūp. Es varu uzdot Siri kaut vienā balsī vai citā balsī, un Siri gatavojas dod man to pašu atbildi. Bet tas nav tas, ko mēs celt daudzi citi veidi saskarnes. Es gribu, lai jūs iepazīstināt tagad ar vienu no robotiem. Tas tika būvēts mans longtime draugs un kolēģis Cynthia Breazeal un viņas uzņēmums Jibo. Un tas robot-- mēs ejam lai būtu pāris brīvprātīgie nākt klajā mijiedarboties ar to. Tātad es varu būt divi cilvēki gatavi spēlēties ar robotu par mani? Kāpēc jūs nākt uz augšu, un kāpēc nav jums nākt uz augšu. Ja vēlaties pievienoties man šeit, lūdzu. Un, ja es varētu būt jums nākt tiesības pār šeit. Pateicība. Hi. ALFREDO: Prieks iepazīties. Alfredo. BRIAN SCASSELLATI: Alfredo. RACHEL: Rachel. BRIAN SCASSELLATI: Rachel. Prieks iepazīties gan. Alfredo, es esmu nāksies jums iet pirmais. Nāciet līdz pat šeit. Es esmu gatavojas ieviest you-- ja es varētu saņemt šo off bez klauvē microphone-- uz nelielu robotu nosaukts Jibo. LABI? Tagad, Jibo ir izstrādāta, lai būtu interaktīvs. Un, lai gan tas var sniegt jums runu, daudz mijiedarbību ar robotu ir neverbālā. Alfredo, es esmu gatavojas lūgt jums pateikt kaut ko jauku un bezmaksas ar robotu, lūdzu. ALFREDO: Es domāju, ka jums izskatīties gudrs. [Švīkstoša SOUND] BRIAN SCASSELLATI: OK. Tās atbilde nav verbālās. Un tomēr tas deva jums abiem skaidrs apliecinājums ka tā bija dzirdējis, ko jūs teicāt un arī kaut kā saprata, ka. LABI? Solis pa labi atpakaļ šeit vienu sekundi. Paldies. Rachel, ja jūs būtu. Tagad es esmu gatavojas sniegt Jums ir daudz grūtāk darbs. Ja vēlaties stāvēt tieši šeit, dublēt tikai nedaudz, lai mēs varam iegūt jums uz kameru un izskatās šādā veidā. Es esmu gatavojas lūgt jums kaut ko pateikt īsti nozīmē un vētraina uz robotu. RACHEL: Ko jūs vienkārši šķita to darīt, bija pilnīgi absurds. [Kolibri SOUND] Tas bija vēl absurds. Kas notiek ar tevi? Aw, nejūtos slikti. Es došu jums ķēriens. BRIAN SCASSELLATI: Nu labi. Thanks, Rachel. Alfredo, Rachel, paldies puiši ļoti daudz. [Aplausi] Tātad šāda veida mijiedarbība ir in daudzi veidi, kā daži no tiem pašiem noteikumiem un daži no tās pašas struktūru, kā to, ko mēs varētu būt valodas mijiedarbību. Tas ir gan komunikatīvā un kalpo svarīgu mērķi. Un šī mijiedarbība, jo daudzi veidi, ir izstrādāta lai ir īpaša ietekme uz attiecīgo cilvēks mijiedarbojas ar vai klausoties uz robotu. Tagad, es esmu paveicies ir Jibo šeit šodien. Sam Spaulding ir šeit, lai palīdzētu mums veic ar robotu. Un es esmu gatavojas lūgt Sam, lai dotu mums viens jauks demo no Jibo dejas ka mēs varam skatīties beigās šeit. Tātad uz priekšu, Jibo. SAM: OK, Jibo. Parādiet mums savu deju soļus. [Mūzikas atskaņošanai] BRIAN SCASSELLATI: Labi, visiem. Pateicoties mūsu draugiem Jibo. [Aplausi] Un, pateicoties mūsu draugiem IBM par palīdzot šodien. Paziņojums ir kaut kas ka jūs gatavojas lai redzētu, kas nāk uz augšu vairāk un vairāk kā mēs veidot sarežģītākas saskarnes. Nākamnedēļ, mēs runājam par to, kā interfeiss ar datoru pretiniekiem spēlēs. Bet, ja jums ir jautājumi par to, Es būšu ap darba laika šovakar. Es esmu laimīgs, lai runāt ar jums par AI tēmas vai iekļūt sīkāk. Jauku nedēlas nogali. [Aplausi] [Mūzikas atskaņošanai]