[TÓNLIST spila] 

DAVID Malan: Þetta er CS50. Þetta er í lok 10. viku. Og drengur, höfum við a gott flokki fyrir þig í dag. Við erum svo spennt að bjóða tvö af vinir okkar frá Yale upp við okkur í dag og að horfa á mótum gervigreind, vélfærafræði, máltækni, og fleira. 

Og reyndar, yfir undanfarnar vikur, höfum við vissulega eyddi miklum tíma, sérstaklega í fyrri psets, með áherslu á ansi lágu stigi upplýsingar. Og það er mjög auðvelt að missa sjónar af skóginum fyrir trjánum og hengdur upp á lykkjur og skilyrðum og ábendingum, vissulega, og þess háttar. En raunin er að þú krakkar hafa nú innihaldsefni sem þú getur raunverulega leysa nokkrar áhugaverðar vandamál, meðal þá þeir sem vinir okkar á Yale vinna á bara feiminn af Cambridge. 

Svo leyfa mér fyrst að kynna höfuð okkar Aðstoðarkennari frá Yale, Andy. 

[Applause] 

ANDY: Fyrst af öllu, bara þakka þú fyrir að leyfa nokkra Yalies að skjóta niður til Cambridge í dag. Við kunnum að meta það virkilega. Í öðru lagi, að vinum okkar aftur home-- Jason, takk fyrir að gista og keyra fyrirlestur. Vona að það er allt gott í New Haven. 

Svo já, ég er frábær spenntur að kynna Scaz dag. Scaz rekur vélfærafræði Lab. Hann er prófessor í eins, fimm mismunandi deildir á Yale. Í Lab hans, hefur hann margir, margir vélmenni sem hann hefur gaman að spila með. Hann hefur, eins og er svalasta starf í heimi. Og hann fær að eins konar óreiðu kring með það allan daginn lengi og gera sumir vinna, eins og heilbrigður. 

Og svo við fært í raun einn Af þeim niður með okkur í dag. Svo án frekari fjaðrafok, Scaz er að fara á undan og kynna okkur til vélmenni vini sínum. 

[Applause] BRIAN SCASSELLATI: Takk, David. Takk, Andy. Það er svo dásamlegt að vera hér með allir í dag. Ég vil fyrst vera mjög ljóst að CS50 starfsfólk hér í Cambridge hefur verið ótrúlega gestrisin okkur. Við erum svo þakklát fyrir allt þeir hafa gert til að styðja okkur. Og svo við myndum eins og að vera fær um að skila góðvild. 

Svo í dag, fáum við að tilkynna sem við erum að fara að hafa nýtt, einn-af-a-góður CS50 atburði gerast í New Haven í næstu viku. Og þetta er CS50 Research Expo. Þannig að við erum að fara að bjóða everyone-- CS50 nemendur, Starfsfólk bæði Harvard og Yale-- að koma niður og fara með okkur á föstudaginn. Við munum hafa a breiður fjölbreytni af yfir 30 mismunandi fólk kynna og exhibiting-- upperclassmen sýna burt sumir af rannsóknum vörur sínar. Við munum hafa sumir gangsetning, jafnvel, að fyrir smá nýrra tækni hæfileika, gangsetning frá bæði Harvard og Yale. Og við munum hafa sumir nemenda hópa leita að einhverjum nýjum aðild. 

Það er að fara að vera mjög spennandi tími. Vonandi þá sem eru koma niður fyrir Harvard-Yale leik vilja vera fær til stöðva eftir smá snemma, rétt í miðju háskólasvæðinu, Sterling Memorial Library. Við erum að fara að hafa sett af sýnir allt frá sjálfstæði skútur til leiðir til að nota hugbúnaðinn að varðveita handritin. 

Við erum að fara að hafa auglýsinguna hoc net og fólk kennslu hugbúnaður kóða í Cape Town. Við munum hafa tölvuna tónlist sýnikennslu. Og við munum að sjálfsögðu hafa fleiri vélmenni. Þannig að við vonum að þú munt tengja okkur fyrir þennan atburð. Það ætti að vera a einhver fjöldi af gaman, svolítið af mat, og a einhver fjöldi af áhugaverðum atriði sem þarf að tala um. 

Svo í dag, við erum að fara að tala um máltækni. Og þetta er tilraun fyrir okkur að byggja nýja leið tengsl með tæki okkar vegna fyrir síðustu vikum, þú hefur verið lögð áhersla á hvernig það er að þú getur skrifað kóða, skrifa hugbúnað sem er leið til að vera fær um að segja að a vél, þetta er það sem ég vil að þú gerir. 

En við ættum ekki að þurfa að búast við að allt sem það er þarna úti sem er notað með alla í heiminum er að fara að vera vandvirkur í þessari tegund af kennslu. Þannig að við að greina á milli tölva tungumál og náttúruleg languages-- það er það sem menn nota til að hafa samskipti við aðra menn. Og við reynum að byggja upp tengi sem nota Þessar náttúrulegu aðferðir samskipti. 

Nú, rétt eins og öll önnur efni að við höfum byrjað með í CS50, við erum að fara að byrja með einföldustu hluti af máltækni að við getum ímyndað okkur. Við erum að fara að byrja með Sögulegu hluti af náttúrulegu tungumáli. Og þá munum við byggja upp fleiri og fleiri nýlegar kerfi og hafa sumir gaman demo á leiðinni. 

Þannig að við erum að fara að byrja með það sem var líklega fyrsta náttúrulegu tungumáli vinnslukerfi. Þetta var a hugbúnaður kerfi skrifað í 1966 af Joseph Weizenbaum heitir Eliza. Og Eliza var hönnuð til að endurtaka konar samskipti þú þyrftir við Rogerian psychotherapist. Nú, Rogerians, þeir höfðu hugmynd sem sálfræðimeðferð þátt að vera fær um að spegla aftur sjúklingi og tala við þá, grundvallaratriðum, því aðeins gefa þeim pínulítill lítill hluti af geðlækni. Það er, allt að sálfræðingurinn sagði átti að vera bara spegilmynd af hvað sjúklingurinn var að segja við þá. 

Svo skulum reyna og kynningu á þessu. Höfum við sjálfboðaliða sem myndi vera tilbúnir til að deila dýpstu þeirra, dimma, og / eða falsa leyndarmál við Eliza? Jú, hvers vegna ertu ekki að koma á upp. Fantastic. Og nafn þitt? 

MILES: Miles. 

BRIAN SCASSELLATI: Miles. Gaman að hitta þig, Miles. Ef þú vildi halda á því. Og við erum að fara að nota útgáfu af Eliza sem við höfum endurtaka innan CS50 IDE. Og við munum líta á the uppspretta kóða til að þetta í smá stund. En núna erum við bara fara að beita með því að slá Eliza. 

Og Eliza er að fara að gefa þér svar sem eru að fara að vera í öllum höfuðborgum. Og fara að spyrja þig nokkurra spurninga. Og við munum svara og slá í viðbrögðum við Eliza. Svo ELIZA hefur sagt, "Hæ, ég er Eliza. Hvað er vandamálið? " Hvað viltu að segja Eliza um í dag? 

MILES: Ég get bara sofna ef ég hef kanína inniskór á. 

BRIAN SCASSELLATI: Allt í lagi. Allt í lagi. 

[Hlátur] 

"Ég get bara sofna með bunny inniskór á. " Og Eliza segir, "Say, gera þér hafa allir sálfræðileg vandamál? Kannski er þetta góð vísbending. " 

OK. Svo hvað viltu að svara? 

MILES: Já. 

BRIAN SCASSELLATI: Já. Orðamaður. Ég njóta að. Eliza segir, "Þú virðist alveg jákvætt." 

MILES: Nei, ég er í raun að rafeind. 

BRIAN SCASSELLATI: "Nei Í raun er ég að rafeind. " "Vissir þú að koma til mín vegna þess að þú ert að rafeind? " Nú getum við séð nokkrar af sem things-- Ég ætla til að gera hlé þér fyrir bara annað, Miles. Ekki fara neitt. Við erum ekki búin með þér ennþá. Eliza er, að sumu leyti, bregðast við ákveðnum hlutum að hann er að segja en án allir alvöru skilningi. Og það er líka parroting aftur sumir af þeim hlutum refsingu hans. 

Svo ég sagði, "Nei Í raun er ég að rafeind. " Eliza svaraði aftur, "Komstu mér vegna þess að þú ert að rafeind? " Allt í lagi. Við skulum gefa það eitt svar hér. Gefa það góða, Miles. 

MILES: Good einn? 

Já, vinsamlegast hjálpa mér. BRIAN SCASSELLATI: "Já. Vinsamlegast hjálpa mér. "" Ertu viss? " MILES: Nei BRIAN SCASSELLATI: Nei "Hvað þýðir það benda til þín?" 

MILES: Ég má ekki vera að rafeind. 

BRIAN SCASSELLATI: "Ég mega ekki vera rafeinda. " "Ertu að segja nei bara til að vera neikvæð?" 

Allt í lagi. Svo Miles, þakka þér svo mikið. 

MILES: Þakka þér. 

BRIAN SCASSELLATI: Takk kærlega. [Applause] 

Þannig að þetta ELIZA program, á margan hátt, er að bregðast rétt við stykki sem við erum að veita án djúpt skilning á því hvað er að gerast hér. Þetta er eins konar kerfi kallað leitarkerfið, þar við erum að leita fyrir víst bitar af texta sem við erum þá að fara að taka út af því var veitt sem inntak, umbreyta það, hugsanlega á einhvern hátt, og þá gefa það til baka til notandans. 

Gera eitthvað af þú heldur sem ELIZA er í raun framkvæma gilt sálgreining hér? Ein manneskja, kannski. 

Áhorfendur: [inaudible]. BRIAN SCASSELLATI: Og hvernig þýðir það sem þér finnst? Já, í raun er það. Og við erum að fara að sjá, reyndar er Kóðinn fyrir það í bara smá stund. Og svo þú ert að fara að vera fær um að gera einmitt þetta. 

Nú, Eliza er ein mynd af því við viljum kalla í dag spjall láni. Það fer bara í gegnum texta sem þú ert að gefa, veitir ber lágmarksfjárhæð skilning eða vinnslu, og þá Parrots það aftur til þín. Svo skulum taka a líta, hugtök, og tala um hvað það er að Eliza er í raun að gera. 

Eliza er að taka a sentence-- skulum segja, "Ég vil vekja hrifningu yfirmann minn." Og Eliza er að leita gegnum þessi setning og reyna að finna og passa tiltekin mynstur. Svo, til dæmis, eitt af mynstur sem ELIZA er að leita að eru orð "Ég vil." Og hvenær það sér eitthvað sem hefur "ég vil" í það, það mótar svar. Og það svar er fast band. Í þessu tilfelli, það er "hvers vegna viltu?" Og ég setti smá stjörnu á enda því það er bara upphaf viðbrögð okkar. Og stjarnan sýnir að við erum að fara að taka restina af utterance-- notanda "til að vekja hrifningu yfirmann minn" - og við erum að fara að bæta það á the endir af this band. 

Svo nú, frekar en að segja, "hvers vegna þú vilt að vekja hrifningu yfirmann minn, " það er smá viðbótar vinnslu sem við munum gera. Það er, við verðum að umbreyta sum fornöfn hér frá "yfirmanni mínum" til "yfirmann þinn." Og það gæti verið nokkrar aðrar breytingar sem við þurfum að gera. Svo frekar en bara stafur það beint á endanum, hvað við munum gera er að við munum taka restina af utterance-- notanda í hvítu here-- og við munum taka það eitt stykki á tími og umbreyta hverri band tákn, hvert orð, í setningunni. 

Þannig að við munum taka orð "til." Það er engin umbreyting að við þurfum að gera það. "Komdu." Það er engin umbreyting við þurfum að gera það. "My" mun umbreyta til "ykkar". Og "stjóri" við verðum bara að fara eins "stjóri." Og svo að lokum, eitthvað sem endar á punkti, við munum breyta því í spurningu. 

Þetta mjög einfalt leitarkerfið er í raun alveg vel. Og þegar þetta var kynnt í 1966-- Joseph Weizenbaum forritað þetta á tölvunni. Nú, tölvur á þeim tíma voru ekki skrifborð módel. Þeir voru hluti auðlindir. Og nemendur hans myndi fara og spjalla við Eliza. Að lokum, hann þurfti að takmarka aðgang að henni vegna þess að nemendur hans voru ekki fá allir vinnu. Þeir voru bara að spjalla við Eliza. Og í raun, hann þurfti að eldur aðstoðarmaður hans, sem eyddi öllum tíma sínum að tala við Eliza um djúpt og áhyggjuefni vandamál hennar. 

Allir sem nota þessi kerfi byrjaði að anthropomorphize þá. Þau byrjuðu að hugsa um þá eins vera lifandi og raunverulegt fólk. Þau byrjuðu að viðurkenna sumir af það sem þeir voru að segja voru að koma aftur til þeirra. Og þeir voru að finna út atriði um sig. Og í raun, jafnvel sérfræðinga, jafnvel psychotherapists, byrjaði að hafa áhyggjur að í raun, kannski ELIZA væri að skipta þeim. Og jafnvel tölva vísindamenn áhyggjur af því að við vorum svo nálægt því að leysa náttúruleg tungumál. 

Nú, það var ekki neitt nálægt því að sanna. En það er hvernig áhrifamikill Þessi kerfi geta virst. Svo skulum byrja á að líta undir og reyna að fá smá spurningu hvar þetta númer gerist í raun. Þannig að við munum gera þennan kóða í boði á eftir. Og þetta er mjög einföld og bein tengi af upprunalegu Eliza framkvæmd. 

Svo sumir af þessum stylistic hlutir sem þú munt sjá hér eru ekki Stylistically hvað við viljum að þú að gera eða það sem við höfum verið að kenna þér að gera. En við höfum reynt að halda þeim sama í mörgum höfnum að þetta hafi haft þannig að það hefur bragðið af upprunalega. Þannig að við erum að fara að fela fullt af hlutum, og þá munum við hafa a mengi leitarorða hlutum sem ELIZA vilja viðurkenna og bregðast við beint. Svo ef þú ert með orð eins "þú" eða "Ég er ekki" eða "nei" eða "já" eða "draumur" eða "halló" þá ELIZA mun svara vali þeim. Við munum einnig hafa a ákveðinn fjölda af hlutum að við munum skipta, eins og umbreyta "minn" til að "þinn." 

Og þá munum við hafa sett af svörum að fyrir hvern af þessum leitarorðum, við munum snúast þessar mismunandi viðbrögð. Þannig að ef ég segi "já" þrisvar sinnum í röð, ég gæti fengið þrjú mismunandi svör frá Eliza. Númer okkar, þá er, raun ótrúlega einfalt. Ef ég skruna niður framhjá öllum þessum viðbrögð sem við höfum forritað í og við fá niður til okkar helstu, við erum að fara að frumstilla a par af mismunandi breytum og gera smá tiltekt í upphafi. En þá er það algerlega sett af kóða sem þú getur skilið. Ein stór en lykkja sem segir að ég að fara að endurtaka þetta aftur og aftur. Ég las í línu, og ég ætla geyma það í inntak band. Ég skal athuga og sjá hvort það er sérstakt leitarorð "bless", sem þýðir loka forritinu. Og svo ég athuga og sjá hvort einhver er bara að endurtaka sig aftur og aftur. Og ég ætla að öskra á þá ef þeir gera. Ég segi "ekki endurtaka ekki sjálfur." 

Svo lengi sem enginn af þeim gerast, munum við þá skanna í gegnum og lykkja í gegnum, á línum 308 til 313 hér, og athuga og sjá eru einhver þau leitarorð setningar sem eru í inntak að ég var bara gefið? Ef það er jafningi fyrir þá, vel þá, ég man að staðsetningu. Ég man það leitarorð. Og ég mun vera fær um að byggja svar. 

Ef ég finn ekki einn, og þá, the síðastur hlutur í leitarorði array minn verður vanræksla viðbrögð mín, þegar ekkert annað passar. Ég spyr spurninga eins og "Hvers vegna gerðir þú koma hingað? "eða" Hvernig get ég hjálpað þér? " sem eru bara að hluta rétt sama hvað inntak er. 

Við munum þá byggja upp svar Eliza er. Við munum vera fær um að taka að stöð svar, rétt eins og við gerðum í því "yfirmaður minn" dæmi. Ef það er allt sem það is-- ef það er bara ein band sem ég átti að respond-- Ég get bara senda hana aftur út. Ef það hefur stjörnu á the endir af það, þá verð ég vinna hvern táknið í restin af viðbrögðum notanda og bæta þeim í, skipta út orð fyrir orð eins og ég þarf að. 

Allt þetta er algerlega eitthvað sem þú gætir byggja. Og í raun, hvernig sem við hafa unnin viðföng, hvernig sem þú ert afgreidd með HTTP beiðnir fylgja sömu tegundir af reglum. Þeir eru leitarkerfið. 

Svo Eliza hafði tiltölulega mikilvægt áhrif á náttúrulegu tungumáli vegna þess að það gerði það virðast eins og það var mjög að ná markmiði, eins og einhvern veginn að við myndum vera fær um að leysa þetta vandamál beint. Nú, það er ekki að segja að ELIZA er allt sem við myndum vilja gera. Vissulega ekki. En við ættum að vera fær um að gera eitthvað meira. 

Fyrsta skref okkar til að fara utan ELIZA er að fara að vera fær um að líta á ekki texti verði gert í lyklaborðinu en ræðu, raunverulegur ræðu skráð í hljóðnema. Svo eins og við lítum á þetta mismunandi stykki, við erum fara að byggja upp safn af líkan. Við erum að fara að þurfa að vera fær um að fara frá lágu stigi hljóðeinangrun information-- kasta, amplitude, frequency-- og umbreyta það inn Sumir einingar sem við erum geta fleiri auðveldlega handleika og að lokum, vinna þau í orð og setningar. 

Svo flestir talgreiningu kerfi sem eru þarna úti í dag fylgja tölfræðileg líkan þar sem við byggjum þrjú aðskilin framsetningar hvað sem hljóð merki inniheldur í raun. Við byrjum með hljóðrétt fyrirmynd sem talar um bara stöð hljóð sem ég framleiða. Er ég að framleiða eitthvað sem er a B eins og í dreng eða D eins og í hundi? Hvernig þekki ég þá tvær mismunandi sími eins aðskilin og greinilegur? 

Á toppur af þessi, munum við þá byggja a framburð orð fyrirmynd, eitthvað sem tengir saman þessir einstaka símar og sameinar þær í orði. Og eftir það, munum við taka orð og við munum safna þeim með tungumál fyrirmynd í heil setning. 

Nú erum við að fara að tala um hver af þessum óháð öðru. En þessi þrjú módel eru bara að fara að vera tölfræði. Og það þýðir þegar við vinna með þeim, við munum vera fær um að vinna með þá alla samtímis. Allt í lagi. Við skulum byrja með hljóðrétt fyrirmynd okkar. Svo hljóðrétt módel treysta á a computational tækni kallað falinn Markov líkön. Þetta eru grafísku módel sem ég hafa og viðurkenna ástand heimsins sem einkennist með a setja af lögun. Og að ríkið lýsir einn hluti á aðgerð sem ég stunda. 

Þannig að ef ég hugsa um að gera hljóðið "ma" eins og móðir, það eru mismunandi þættir til þessi hljóð. Það er hluti þar sem ég teikna í anda. Og þá er ég tösku varir mínar. Og ég rúlla varir mínar aftur smá hluti til að gera það "MA" hljóð. Og þá er það út. Varir mínar koma í sundur. Air er rekinn. "Ma." 

Þessir þrír mismunandi hlutar þeirra séu fulltrúa ríkja í þessari graph-- upphaf, miðju og endi. Og ég hefði umbreytingum sem leyfa mér að ferðast frá einu ríki til næsta með ákveðnum líkum. Svo, til dæmis, að M hljóð gæti hafa mjög, mjög stutt inntaka á beginning-- "mm" - og þá lengur, vibratory áfanga þar sem ég ætla að halda mínum varir saman og næstum humming-- "MMMM" - og þá mjög stutt plosive þar sem ég reka breath-- "Ma." 

Falinn Markov líkan er sem ætlað er til að fanga staðreynd að leiðin sem ég geri þessi hljóð "ma" er að fara að vera aðeins öðruvísi í tímasetning hennar, er tíðni, og eiginleika hennar en hvernig sem þú gerir það eða hvernig sem ég gæti gera það þegar ég er að tala um mismunandi notkun af bréfinu. "Móðir" og "Má ég" mun hljómar örlítið öðruvísi. 

Svo til að viðurkenna a Einkum hljóð, við gerðum byggja Markov líkön þessir falinn Markov módel, öll möguleg Síminn sem ég might vilja til að viðurkenna, allar mögulegar hljóð, og þá líta á Acoustic gögn sem ég hef og ákvarða tölfræðilega sem einn er líklega einn hafa framleitt þetta hljóð. OK. Með því líkani, við þá byrja að byggja ofan á það. Við taka framburð líkan. Nú, stundum framburð módel eru einfaldar og auðvelt vegna þess að það er bara ein leið til að dæma eitthvað. Aðrar sinnum, þá eru þeir a svolítið flóknari. Hér er framburður fylgja fyrir þessi rauðu hlutur sem er ávöxtur sem þú gerir tómatsósu úr. Fólk held ekki að það er ávöxtur. Ekki satt? 

Nú, það eru margar mismunandi leiðir að fólk mun kveða þetta orð. Sumir vilja segja "tá-May-tá." Sumir vilja segja "tá-MAH-tá." Og við getum ná að með einn af þessum myndræna módel þar, aftur, að tákna umbreytingum sem hafa ákveðin líkur og tengd líkurnar með þeim. 

Þannig að í þessu tilfelli, ef ég væri að fylgja efst leið í gegnum þetta allt línurit, Ég myndi byrja á stafnum lengst til vinstri, á "ta" hljóð. Ég myndi taka the toppur helmingur, á "ó," og þá "ma," og síðan til "A," og síðan "ta," og "ó". "Toe-may-tá." Ef ég tók botn leið í gegnum þetta mun ég fá "ta-MAH-tá." Og ef ég fór niður og þá upp, ég vildi fá "ta-May-tá." 

Þessi líkön ná þessum mismun vegna þess þegar við dreifa einn af þessum viðurkenningu kerfi, það er að fara að þurfa að vinna með hellingur af mismunandi tegundir af fólki, hellingur af mismunandi kommur, og jafnvel mismunandi notkun sömu orðum. Loks á toppur af þessi, við munum byggja eitthvað sem lítur mjög flókið, kallað tungumál líkan, en í raun er einfaldasta þriggja vegna þeirra starfrækja á það sem kallast n-gram módel. Og í þessu tilfelli, ég sýna þér tveggja hluta n-g líkan, a bigram. Við erum að fara að gera líkamlega hugmynd sem stundum eru ákveðin orð líklegri til að fylgja a gefið þeim orð en aðrir. Ef ég sagði bara "veðurspá," næsta orð gæti líklega verið "í dag" eða gæti verið "veður spá á morgun. " En það er ólíklegt að vera " veðurspá artichoke. " 

Hvað tungumál líkan gerir er það tekur þá tölfræðilega með því að telja, frá sumum mjög stór Corpus, öll tilvik þar sem eitt orð og hér segir annan. Svo ef ég tek upp á corpus-- eins og sérhver Wall Street Journal sem hefur verið framleitt síðan 1930, sem er eitt af stöðluðu corpuses-- og ég lít í gegnum allt þessi texti, og ég tel upp hversu oft eftir "spá" sé ég "í dag" og hversu oft sé ég "spá" eftir "artichoke," sá fyrsti er að fara að vera miklu líklegri. Það er að fara að birtast miklu oftar. Og svo það verður meiri líkindi tengd við það. 

Ef ég vil að reikna út líkur á öllu atkvæða, þá ég brjóta bara upp. Þannig að líkur á heyrn setningin "rotta át ost" eru líkurnar á orðinu "the" byrja setningu, og þá líkurnar á því að Orðið "rotta" segir orðið "á" og líkurnar á því að Orðið "át" fylgir "rotta" og líkurnar á því að "ostur" segir "át." 

Þetta hljómar eins og a einhver fjöldi af tölfræði, a einhver fjöldi af líkum. Og það er allt sem það er. En furðulegur hlutur er ef þú gerir þetta með nógu stóru úrtaki gagna, það virkar. Og það virkar ógurlega vel. Við vitum öll að þessa tækni. Flest stýrikerfi koma með rödd orðstír á þessum tímapunkti. Við notum Siri og Cortana og Echo. Og þessir hlutir eru byggðar á þessi tegund af þriggja lag model-- a hljóðrétt líkan á botni, Framburður líkan í miðju, og tungumál líkan ofan á þeim. 

Nú hafa þeir að gera smá meira en til að svara spurningum. En viðurkenning á því sem þú ert orðatiltæki fer nákvæmlega á það. Svo skulum við taka dæmi hér. Þannig að ég hef síminn minn situr hérna undir skjal myndavél. Og við erum að fara að spyr Siri nokkrum spurningum. Allt í lagi? 

Svo skulum vakna upp símann minn hér. Siri, hvað er veðrið eins og í New Haven í dag? 

SIRI: Hér er veður fyrir New Haven, Connecticut í dag. 

BRIAN SCASSELLATI: OK. Svo fyrst þú sást að Siri viðurkennt hverja um sig, orða og þá framleitt svar. Við munum tala um hvernig það svar kemur um í smá. En nú að við vitum að þetta er bara byggt á hráefni tölfræði og þetta leitarkerfið tegund af nálgun, getum við spilað nokkra leiki með Siri. 

Svo ég get að reyna aftur. Siri, hvað er veðrið flóðhestur New Haven, í dag? 

SIRI: OK. Hér er veðrið fyrir New Haven, Connecticut í dag. BRIAN SCASSELLATI: Siri er ekki daunted að vegna þess að það er að finna á pattern-- "veður," "í dag", "New Haven." Það er það sem það er að bregðast að, rétt eins og Eliza. Allt í lagi. Við skulum gefa það eitt jafnvel fáránlegt dæmi. Siri, veður artichoke armadillo flóðhestur New Haven? 

SIRI: Leyfðu mér að kíkja á það. Hér er það sem ég fann á vefnum fyrir hvað eru þistilhjörtu Armadillo flóðhestur New Haven. 

BRIAN SCASSELLATI: OK. Svo ef ég fer langt frá þessu líkani, Ég er fær um að rugla það vegna þess að það eigi lengur passar mynstur sem það hefur. Og það tölfræðileg vél sem er að segja, hvað er líkurnar á því að þú hafir fengið orðin flóðhestur og artichoke saman, og Armadillo? Það er got að vera eitthvað nýtt. 

Svo þessa tækni sem við notum á hverjum degi. Ef við viljum taka þá eitt skref frekar, þó, ef við í raun vilja til vera fær til að tala um hvað það er að þessi kerfi eru að bregðast við, við verðum að tala aftur, um a meira grundvallaratriði sett af spurningum. Og það er umræða í samskiptum sem við köllum spurning að svara. Það er, við viljum vera fær um to-- já? Áhorfendur: [inaudible]. BRIAN SCASSELLATI: Eigum við að fá í duldum merkingartækni vinnslu? Svo já. There ert a einhver fjöldi af hlutur sem eru gerast undir yfirborðinu með Siri og í sumum af dæmunum Ég ætla að sýna þér næsta þar er töluvert hvað varðar uppbyggingu um hvað þú ert að segja það er mikilvægt. Og í raun, það er frábær undanfara fyrir næstu glæru fyrir mig. 

Svo á sama hátt að okkar mál orðstír var byggt upp af mörgum lögum, ef við viljum skilja hvað það er sem er í raun að segja, við erum að fara að aftur treysta á multi-lag greiningu textans sem er verið viðurkennd. Svo þegar Siri er í raun fær um að segja, ég lít fann þessi orð. Nú hvað á ég að gera við þá? Fyrsta hluti er oft hægt að fara í gegnum og reyna að greina uppbyggingu setningarinnar. Og í hvað við höfum séð í grunnskóla, oft, eins konar diagramming setningar, við erum að fara að viðurkenna að ákveðin orð hafa ákveðnar hlutverk. Þetta eru nafnorð. Þetta eru fornöfn. Þetta eru sagnir. Og við erum að fara að viðurkenna að fyrir ákveðna málfræði, í þessu tilfelli enska málfræði, það eru gilda leiðir sem ég get sameinað þá og aðrar leiðir sem eru ekki gild. 

Að viðurkenning, að uppbygging, gæti verið nóg til að hjálpa leiða okkur pínulítið. En það er ekki alveg nóg fyrir okkur að vera fær um að gefa Sú merking sem hugtakið hvað er verið að segja hér. Til að gera það, verðum við að treysta á talsverða merkingartækni vinnslu. Það er, við erum að fara að þurfa að líta á undir hvað hver þessara orða reyndar ber sem merkingu. Og í einfaldasta leið til að gera þetta, við erum að fara að tengja við hvert orð sem við vitum ákveðna aðgerð, ákveðin umbreyting sem það gerir að gerast. 

Í þessu tilviki, gætum við merkimiða Orðið "Jóhannes" eins og að vera rétt nafn, að það ber með það sjálfsmynd. Og við gætum merkja "Mary" sem á sama hátt. Nauðsynlegt er að sögn eins og "elskar", það telst ákveðna samband að við erum fær um að tákna. Nú, það þýðir ekki að að við skiljum hvað ást er en bara að við skiljum það í því að táknrænum kerfi. Það er, að við getum merkja það og vinna það. 

Með hverri af þessum tegundum af aðferðum, hvers konar merkingartækni vinnslu hér er að fara að krefjast smá hluti af þekkingu og mikil vinna af okkar hálfu. Við erum ekki lengur í ríki þar bara látlaus tölfræði eru að fara að vera nóg fyrir okkur. Nú, í því skyni að fara frá þessum tímapunkti að vera fær um að tala um innan við hvað er raunverulega að gerast hér, að vera fær um að vinna þetta uppbygging og skilja spurningu og þá vera fær um til að fara út og leita, sem krefst meira flókin vitsmunaleg líkan. 

Leiðin sem þessi kerfi eru byggð er að mestu leyti mjög vinnu- ákafur. Þeir taka menn eyða miklum tíma uppbyggingu leiðir í sem þessar tegundir af setningar má fulltrúa í sumum rökfræði. Það gerist jafnvel smá flóknari, þó. 

Jafnvel þegar við höfum fjallað með merkingarfræði, munum við samt að líta á pragmatics um hvað er verið að segja. Það er, hvernig ég tengist orð að ég þarf að eitthvað líkamlega út úti í heimi eða kosti sumum upplýsingaveita sem ég get stjórna? 

Stundum, þetta leiða til dásamlegt bita af tvíræðni. "Red-heitt stjörnu að gifta stjörnufræðingur." OK. Nú lesum við að eftir því sem fyndið gerð fyrirsögn að við myndum sjá á seint nóttina TV vegna þess að við túlka ekki "star" að hafa himneskur líkami hennar merkingu. Við vitum að það þýðir að fleiri algeng leikari eða leikkona með miklu magni af skyggni. 

"Squad hjálpar hundur bit fórnarlamb." Er það að liðið er í raun þarna aðstoða hund í að fara í kring og naga fórnarlömb? Eða er það að það var einstaklingur sem var bitinn af hundi sem þarf smá hjálp? Bara frá því að horfa á setningafræði og merkingarfræði setningar, við getum ekki ákvarðað það. 

"Helicopter gengur manna flugur." Eru í raun raunverulegt lítill hluti fljúga í kringum það er fólk með vængi máttur þyrlur til góðs mannkyns? Eða er það eitt vélrænni tæki sem fær afl sitt frá einstaklingi? 

Þegar við lítum á viðkomandi svara kerfi, þetta eru lögin sem við þurfum að takast á við. Nú, besta og mest raða ríkjandi þessara kerfa í dag eru fær um að gera hluti á stigi sem eru langt umfram það sem við höfðum fyrir 10 árum. Hér er einn af bestu kerfum það er þarna úti í dag. Og þetta er kerfi frá IBM heitir Watson. Þetta er frá vinum okkar á IBM. Þetta er Katherine bankar, Jia Chen, og Priscilla Moraes gefa okkur sýning Watson í gær í IBM Yorktown. [Vídeó spilun] -Hvernig hefurðu það? 

-Mér líður vel. Ég er alltaf ánægð þegar ég er hugsa, sérstaklega þegar ég getur vera kúl í þessum miðlara herbergjum. -Hver Er uppáhalds leikkona þinn? 

Uppáhalds leikkona -My Angelina Jolie og Lara Croft í Tomb Raider því upprunalega hennar mynd var eins og a raunverulegur karakter eins og mig. 

-Hvernig Getur Watson hjálpa sjúklingum? 

-er Áætlun fyrir sjúklinga til hafa aðgang að Watson beint? Aðgangur að Watson ráðgjöf forrit breytileg eftir notkun tilfelli. En nú, Watson mun aðeins veita hægt greining og meðferð möguleikar til læknis. Þar sem við á, sjúklingar heimilt að veita upplýsingar Watson, kannski gegnum Portal vefur tengi, tafla, eða jafnvel farsíma. Til dæmis, sem sjúklingur getur verið beðinn um að lýsa einkennum þeirra í náttúrulegu tungumáli beint í Watson lausn, gera lækninum kleift að einbeita sér að greining og ekki gagnasöfnun. 

-Hver Myrti Abraham Lincoln? 

Jóhannes Wilkes Booth. 

-Í Hvaða ár gerði Arizona Diamondbacks vinna World Series? 

-2001. 

[END spilun] 

BRIAN SCASSELLATI: So þessar tegundir af kerfi að treysta á fyrst af öllu viðurkenna ræðu; Annað, umbreyta það inn í a þýðingarmikill innri framsetning; og þá, í ​​þriðja lagi vera fær um að fara út og finna upplýsingar uppspretta sem gerir þeim kleift að svara þeirri spurningu. Þessi stigi flókið felur sömu tegundir af forritanlegur hluti að þú hafir verið gera í vandamál setur. 

Við erum fær um að flokka HTTP beiðnir í sama tegund af lágmark-láréttur flötur mynstur passa að ELIZA getur gert. Við erum fær um að umbreyta þeim í innri framsetning, og þá nota þá til að fyrirspurn sumir ytri gagnagrunninum, hugsanlega með SQL. Öll kerfi sem eru byggð í dag að gera þessa tegund af náttúrulegum Tungumál samskipti eru byggð á þessir sömu reglur. 

Nú, jafnvel kerfi eins og Watson er ekki flókið nóg að vera fær um að svara handahófskennt spurningar um hvaða efni. Og í raun, þeir verða að vera byggð á tilteknu svæði. Svo þú getur farið á netinu og þú getur fundið útgáfur af Watson sem starfa vel innan læknisfræði upplýsingatækni. Eða það er einn á netinu sem bara fjallar um hvernig að gera góð meðmæli um hvað bjór mun fara með sem mat. Og innan þessara léna, það er hægt að svara spurningum, finna þær upplýsingar sem það þarfnast. 

En þú getur ekki blandað og passa þá. Kerfið sem hefur verið þjálfaðir við gagnagrunn á mat og bjór virkar ekki vel þegar þú skyndilega setja það í við læknisfræðilega upplýsingatækni gagnagrunnur. Svo jafnvel okkar kerfi bestu dag treysta á stigi vinnslu þar sem við erum hönd kóðun og byggja í innviðum til til að gera þetta kerfi hlaupa. 

Nú, síðasta umræða sem ég vil að vera fær um að fá að í dag er um án orða samskipti. A mikill massi upplýsingar sem við samskipti við hvert annað kemur ekki um gegnum einstök orð sem við erum að sækja um. Það hefur að gera með hluti eins og nálægð, augnaráð, tónn af rödd, beyging þinn. Og að samskipti er einnig eitthvað sem margir mismunandi tengi umönnun mikið um. Það er ekki það sem Siri annt um. Ég get spurt Siri eitthvað í einni röddu eða í öðrum tón af rödd, og Siri er að fara að gefa mér sama svarið. En það er ekki það sem við að byggja á margar aðrar gerðir af tengi. 

Mig langar að kynna þig nú einn af vélmenni. Þetta var byggt af longtime minn vinur og samstarfsmaður Cynthia Breazeal og fyrirtæki hennar Jibo. Og þetta robot-- við erum að fara að hafa nokkra sjálfboðaliða koma upp til að hafa samskipti við þetta. Svo get ég tvær manneskjur tilbúin að spila með vélmenni fyrir mig? Hvers vegna ertu ekki að koma á upp, og hvers vegna ekki þú kemur á upp. Ef þú vilt taka þátt í mig hérna, takk. 

Og ef ég gæti hafa þig koma hérna. Takk. Hi. 

ALFREDO: Gaman að hitta þig. Alfredo. 

BRIAN SCASSELLATI: Alfredo. 

Rachel: Rachel. BRIAN SCASSELLATI: Rachel. Gaman að hitta þig bæði. Alfredo, ég ætla að hafa sem þú ferð fyrst. Komdu allt hér. Ég ætla að kynna you-- ef ég get fengið þetta burt án þess að berja á microphone-- til smá vélmenni sem heitir Jibo. OK? 

Nú, Jibo er hannað til að vera gagnvirkt. Og enda þótt það getur gefið þér ræðu, mikið af samskiptum við vélmenni er óyrt. Alfredo, ég ætla að biðja þig um að segja eitthvað gott og ókeypis til vélmenni, vinsamlegast. ALFREDO: Ég held að þú líta sætur. 

[Whirring SOUND] BRIAN SCASSELLATI: OK. Svar hennar er ekki munnleg. Og enn er það gaf þér bæði skýr viðurkenning að það hefði heyrt það sem þú sagðir og einnig einhvern veginn skilið það. OK? Skref strax aftur hér í eina sekúndu. Þakka þér fyrir. 

Rachel, ef þú vilt. Nú, ég ætla að gefa þú miklu erfiðara starf. Ef þú vilt standa hérna, aftur upp bara svolítið þannig við getum fengið þér á myndavélinni og líta á þennan hátt. Ég ætla að biðja þig að segja eitthvað í raun þýtt og viðbjóðslegur að vélmenni. 

Rachel: Það sem þú virtist bara að gera var alveg fáránlegt. 

[Humming SOUND] 

Það var jafnvel meira fáránlegt. Hvað er að gerast hjá þér? Aw, finnst ekki slæmt. Ég skal gefa þér faðmlag. BRIAN SCASSELLATI: Allt í lagi. Takk, Rachel. Alfredo, Rachel, takk krakkar mjög mikið. 

[Applause] 

Svo hefur í svona samskipti margar leiðir sumir af sömu reglum og sumir af sama uppbyggingu og það sem við gæti hafa tungumála samskipti. Það er bæði tjáskiptum og þjónar mikilvægu hlutverki. Og að samskipti í margar leiðir, er hannað að hafa ákveðna áhrif á maður samskipti við eða hlusta til vélmenni. 

Nú, ég er svo heppin að hafa Jibo hér í dag. Sam Spaulding er hér að hjálpa okkur út með vélmenni. Og ég ætla að biðja Sam að gefa okkur einn ágætur kynningu á Jibo dansi að við getum horft á enda hér. Svo fara á undan, Jibo. 

SAM: OK, Jibo. Sýna okkur dans hreyfingar. 

[TÓNLIST spila] BRIAN SCASSELLATI: Allt í lagi, allir. Þökk sé vinum okkar á Jibo. 

[Applause] 

Og þökk sé vinum okkar á IBM til að hjálpa út í dag. Samskipti er eitthvað að þú ert að fara að sjá koma upp fleiri og fleiri sem við að byggja flóknari tengi. Í næstu viku munum við tala um hvernig á að tengi við andstæðinga tölva í leikjum. En ef þú hefur einhverjar spurningar um þetta, Ég kem í kring á skrifstofutíma í kvöld. Ég er fús til að tala við þig um AI efni eða til að fá inn í fleiri smáatriði. Hafa a mikill helgi. 

[Applause] [TÓNLIST spila]