[Musika jotzen] DAVID MALAN: Hau CS50 da. Aste honetan 10 urte amaieran da. Eta mutila, ez bat dugu Klase ona zuretzat gaur. Beraz, ilusioa bi gonbidapena luzatu nahi dizuegu Yale gure lagunak gaur arte gurekin eta bidegurutzean begiratu adimen artifiziala, robotika, Hizkuntza naturala prozesatzeko, eta gehiago. Eta, hain zuzen, zehar azken asteetan, dugu Zalantzarik gabe, denbora asko igaro, batez ere, lehenago psets ere, nahiko behe-mailako xehetasun bideratua. Eta oso erraza da ikusmena galtzen zuhaitzak basoaren eta zintzilika sortu loops eta baldintzen eta erakusleak, zalantzarik gabe, eta antzekoak. Baina errealitatea da you guys orain behar du Osagai horrekin benetan dezakezu interesgarria arazo batzuk konpondu, besteak Gure duten Yale lagun horiek lan on besterik Cambridge lotsati. Beraz, aukera ematen lehen gure burua aurkeztera me Yale, Andy laguntzailea irakastea. [Txaloak] ANDY: Lehenik eta behin, eskerrak eman besterik ez Bikote Yalies bat uzteagatik duzu on pop Cambridge behera gaur. Benetan eskertzen dugu bertan. Bigarrenik, gure lagunak Atzera home-- Jason, ostatu eta hitzaldia martxan esker. Espero guztiak New Haven ona da. Beraz, bai, super ilusioa dut Scaz aurkeztu du gaur. Scaz robotika laborategian exekutatzen. Irakaslea bat zuen, bezala, bost Yale sail desberdinetan. Bere laborategi batean, asko, asko ditu jolastu zuen gustuko duten robotak. Ditu, adibidez, munduko coolest lana. Eta lortzen den nahastea mota zuen Egun hori guztia inguruan luze eta lan batzuk egin, bai. Eta orain benetan ekarri dugu bat horietako behera gurekin gaur egun. Beraz, besterik esan gabe, Scaz da Aurrera joan eta Gurekin joan bere robot lagunari. [Txaloak] BRIAN SCASSELLATI: Eskerrik asko, David. Eskerrik asko, Andy. Beraz, zoragarria izan da Hemen gaur denek batera. Oso argi horretara lehenengo izan nahi dut CS50 langileek hemen Cambridge izugarri Jar abegitsua izan da. Beraz, dena eskertzen ditugu egin zuten onartzen. Eta beraz, gai izan behar dugu, antzerki adeitasuna itzultzeko. Beraz, gaur egun, iragarriko lortuko dugu ari garela berri bat izan da joan, Bat-bateko-mota CS50 gertaera datorren astean New Haven gertatzen. Eta hau CS50 Research Expo da. Beraz ari den gonbidatzen ditugu everyone-- CS50 ikasleak, bai Harvard eta Yale-- tik langileak llegado eta gurekin bisitatu ostiralean. Gorako askotariko bat izan dugu 30 pertsona desberdinak aurkeztuz eta erakusten exhibiting-- upperclassmen beren ikerketa produktu batzuk off. Startups batzuk izan dugu, nahiz eta, bila teknologiako talentu berriak pixka bat egiteko, bai Harvard eta Yale startups. Eta ikasle talde batzuk izan dugu kide berri batzuk bila. Honez denbora oso zirraragarria izango da. Zorionez duzuenontzat dira behera datozen Harvard-Yale Partida gelditzeko gai izango da Pixka bat by hasieran, eskubidea campus erdian kokatuta, Sterling Memorial Library. Multzo bat izan behar gara autonomia bitartekoa duten erakusketak software erabiltzeko moduak den sailboats Erdi Aroko eskuizkribuak zaintzeko. Ad dute goaz hoc sareko lana eta pertsona software kodetze irakaskuntza Lurmutur Hirian. Ordenagailua beharko dugu musika erakustaldiak. Eta egingo dugu robotak gehiago jakina dute. Beraz, espero ez dugun ikusiko duzu apunta zaitez ekitaldi honetan. Asko izan behar da fun, janaria pixka bat, eta interesgarri asko gauzei buruz hitz egiteko. Hala, gaur egun ari gara hitz joan Hizkuntza naturala prozesatzeko buruz. Eta hau guretzat saiakera da interfazearen modu berri bat eraikitzeko Gure gailu delako Azken asteetan, Zuk izan nola dela bideratuta kodea idatzi ahal izango duzu, software idatzi dela esateko gai izatea modu bat da makina, hau da, zer egin nahi dut. Baina ez genuke behar den Espero dena dela hori ez dela erabiltzen munduko pertsona guztiek arabera da trebea izango da Instrukzio-mota honetan. Beraz, ordenagailu bereizten ditugu Hizkuntza eta languages-- natural hau da, erabilera gizakiak gauzak beste gizakiak komunikatzeko. Eta erabiltzen dituzten interfazeak eraikitzeko saiatzen gara komunikazio mekanismoak natural horiek. Orain, besterik ez du nahi beste gai guztietan Nik dugun CS50 batekin hasi zen, to errazena hasteko goaz Hizkuntza naturala prozesatzeko pixka pentsa dezakegu. To batera hasiko gara Hizkuntza naturalaren zati historikoak. Eta ondoren, eraikitzeko sortu dugu nahi En los Ășltimos gero eta gehiago sistemetan eta bidean zenbait fun demoak dute. Beraz, zer zen has joan ziurrenik, lehen hizkuntza natural prozesatzeko sistema. Hau idatzitako software sistema bat izan zen 1966an Joseph Weizenbaum arabera ELIZA deitzen. Eta ELIZA diseinatu zen errepikatzeko elkarrekintza mota you bat izango litzateke Rogerian psikoterapeuta. Orain, Rogerians du, izan zuten Ideia bat psikoterapia inplikatutako atzeko ispilu gai izatea Gaixo bat eta beraiekin hitz egin nahi, Funtsean, soilik horietako bat emanez txiki txiki terapeuta pixka. Hau da, dena terapeuta esan duenez zen ustezko besterik isla izan nahi zer gaixoaren haiei kontatzea zen. Hargatik saiatu eta demo honetan. Ez duten litzaidake izan boluntario behar ditugu bere sakonena partekatzeko prest, ilunena, eta / edo ELIZA dituzten sekretuak faltsuak? Noski, zergatik ez zatoz gora. Fantastic. Eta zure izena? MILES: Miles. BRIAN SCASSELLATI: Miles. Politak zu ezagutzeaz, Miles. Zenukete kalera bada eutsi. Eta goaz ELIZA bertsio bat erabili Hori erreplika ditugu CS50 IDE barruan. Eta iturburu bilatuko dugu pixka bat horri kodea. Baina oraintxe, besterik ez gara deitu da eliza idatziz joan. Eta ELIZA da erantzunak emateko joan diren hiriburuetan izango da. Eta zuk zenbait galdera egin behar dut. Eta erantzun eta idatzi egingo dugu ELIZA erantzunak ere. Beraz ELIZA esan du, "Kaixo, ni ELIZA. Zein da zure arazoa? " Zer nahi duzu gaur kontatzeko ELIZA? MILES: I bakarrik erori daiteke lotan bunny zapatilak badut. BRIAN SCASSELLATI: Ondo da. Ados. [Barreak] "I bakarrik erori daiteke lotan bunny zapatilak batera. " Eta ELIZA dio, "Esan, ez duzu Edozein arazo psikologikoak izan? Agian hau adierazle ona da. " ONDO DA. Beraz, zer erantzungo nahi duzu? MILES: Bai. BRIAN SCASSELLATI: Bai. Hitz askoren Man. Gozatzen dut. Eliza dio, "oso positiboa zarela dirudi." MILES: Ez, ni naiz, hain zuzen ere, elektroi bat. BRIAN SCASSELLATI: "Ez Izan ere, elektroi bat naiz. " "Ba zatoz nigana duzu zara elektroi bat delako? " Orain, batzuk ikusteko aukera izango dugu gauza noa you pausatu den bigarren bat besterik ez da, Miles. Ez edonora joateko. Ez gara zuekin egin oraindik. ELIZA da, nolabait, zenbait gauza erantzuten zuela esaten da, baina gabe Edozein benetako ulertzeko. Eta hori ere atzera parroting batzuk bere esaldi zatiak. Beraz, esan genuen "Kop Izan ere, elektroi bat naiz. " Eliza erantzun back, "heldu zara me to zara elektroi bat delako? " Ados. Dezagun eman erantzun bat gehiago hemen. Eman on bat, Miles. MILES: alde onak? Bai, lagundu dit. BRIAN SCASSELLATI: "Bai. Mesedez, lagundu dit. "" Ziur zaude? " MILES: No. BRIAN SCASSELLATI: No. "Zer esan gomendatzen du?" MILES: Agian ez dut elektroi bat izan. BRIAN SCASSELLATI: "I daiteke elektroi bat ez da izan. " "Are you no esanez besterik negatiboa da?" Ados. Beraz, Miles, eskerrik asko hainbeste. MILES: Eskerrik asko. BRIAN SCASSELLATI: Eskerrik asko. [Txaloak] Beraz ELIZA programa honek, modu askotan, hau da, besterik gabe, erantzuten piezak ari garela sakona gabe emanez Zer ari da gertatzen ari dena ulertzeko. Honek sistemaren moduko bat da ereduarekin bat datorren izeneko, non Zenbait bilatzen ari gara Testu bit hori gero gaude ra atera joan zer sarrera gisa ematen zen, bihurtzeko, potentzialki, nolabait, eta ondoren, eman erabiltzaileak itzuli. Ba al duzu edozein uste ELIZA da benetan baliozko psikoanalisia hemen lantzean? Pertsona, agian. Ikusleak: [INAUDIBLE]. BRIAN SCASSELLATI: Eta nola hori egin duzu sentitzen? Bai, hain zuzen ere, egiten du. Eta ari gara ikusten benetan gertatzen, eta source da kodea une bat besterik ez. Eta beraz, zu izan da joan zehazki Horretarako gai. Orain, ELIZA forma bat da, zer gaur chat bot bat deitzen dugu. Bidez besterik ez doa emateaz ari zaren testua, biluzi gutxieneko zenbatekoa ematen du ulermena edo prozesatzeak, eta, ondoren, Loras da itzuli. Beraz, dezagun begirada bat, kontzeptualki, eta buruz hitz zer ELIZA benetan, hori da. ELIZA hartzen ari da a sentence-- dezagun esan, "nire boss harritu nahi nuen." Eta ELIZA ari da esaldi hori bidez eta aurkitu nahi eta eredu jakin batzuk datoz. Beraz, adibidez, eredu bat ELIZA hori bila hitzak dira "Nahi dut". Eta edonoiz zerbait ikusten du duela "nahi dut" delakoan, erantzun bat formulatu da. Eta erantzun hori kate finkoa da. Kasu honetan, ez da "zergatik nahi duzu?" Eta izar apur bat jarri dut at Amaieran hori delako, besterik gabe, Gure erantzuna hasieran. Eta izarraren dela adierazten Gainerako hartu goaz erabiltzailearen utterance-- of "Nire boss txunditzea" - eta horretan ari gara hori erantsi joan kate honen bukaera aldera. Beraz, orain, baino, esanez "zergatik "nire boss harritu nahi duzu, Han osagarriak pixka bat da prozesatzeko, egin dugu. Hau da, ez dugu izan Izenorde batzuk bihurtzeko Hemen "my boss" behar diren "Zure boss." Eta badira beste batzuk bat izan liteke hori egin behar dugu aldaketa. Beraz baino gehiago besterik ez da itsastea zuzenean amaiera aldera, zer egin dugu da gainerako hartuko dugu Erabiltzaile hemen zuriz utterance-- eta, kendu egingo dugu pieza batean denbora bat eta kate bakoitza bihurtzeko token, hitz bakoitza, esaldiaren sartu. Beraz, hitza hartu dugu "da." Ez da, bihurketarik Hori egin behar dugula. "Harritu". Ez da, bihurketarik Han egin behar dugu. "Nire" bihurtuko du "zure". Eta "buruzagia" besterik ez dugu gisa utzi "boss". Eta, azkenik, ezer hau da, denboraldi batez amaitzen da, bihurtzeko egingo dugu galdera bat sartu. Ereduarekin parekatzean oso erraz hau da, benetan oso arrakastatsua. Eta hori zen abian 1966-- Joseph Weizenbaum ere programatutako hau ordenagailu batean. Orain, garai hartako ordenagailuak ez ziren mahai gaineko ereduak. Baliabide partekatuak ari ziren. Eta bere ikasleak litzateke joan eta ELIZA berriketan. Azkenean, izan behar zuen bertarako sarbidea mugatzeko bere ikasle ziren ez delako egin duen lana lortzeko. ELIZA batera besterik ez dute berriketan ziren. Eta, hain zuzen ere, izan zuen Sutan bere laguntzailea, nor eman zituen bere garaiko guztiak ELIZA hizketan Bere arazo sakon eta kezkagarria. Denek sistema horiek erabiltzen duten Horietako anthropomorphize hasi. Horietako pentsatzea bezala hasi dute Animatu eta benetako pertsona izatea. Batzuk ezagutzen hasi ziren, Hori esaten ziren gauzak ziren haiek itzultzea. Eta jakiteko ari zirela beraiek buruz gauza. Eta, hain zuzen ere, nahiz eta adituek, nahiz eta psikoterapeutak du, Hori kezkatu, hain zuzen ere hasi zen, Agian ELIZA horien ordez izango litzateke. Eta nahiz eta ordenagailua Zientzialari kezkatuta geunden beraz, hizkuntza natural konpontzeko hurbil. Orain, hori ez zen edonon egia hurbil. Baina hori nola ikusgarria sistema horiek dirudi daiteke. Hargatik begiratu azpian eta saiatu Galdera bat pixka bat lortzeko non kode hau benetan gertatzen. Beraz, kode hau egin dugu eskuragarri gutxira. Eta hori oso bat portu erraza eta zuzena Jatorrizko ELIZA Gauzatzeko. Beraz estilistiko horietako batzuen duten ikusiko duzu hemen gauzak ez dira estilistikoki zer egin duzu nahi genuke edo zer egin dugu irakaskuntza egin duzu. Baina horiek mantentzeko saiatu gara portu askotan zehar bera du hori eta, beraz, izan da jatorrizko zaporea ditu. Beraz, besteak beste, joan Gauza mordo bat, eta, ondoren, bat izan dugu Hitz, gauzen ezarri ELIZA duten ezagutuko ditu eta zuzenean erantzuteko. Beraz bezala hitz egin behar baduzu "Dezakezu" edo "Ez dut" edo "no" edo "bai" edo "ametsa" edo "kaixo," gero ELIZA selektibo erantzungo dutenei. Halaber, ez dugu izan bat zenbait gauza kopurua Egingo dugu, atsegin trukatu bihurtzeko "nire" eta "zure". Eta gero, erantzun multzo bat izan dugu hitz hauetako bakoitzeko, biratu bidez dugu ezberdinetan erantzun horiek. Beraz, bada, esan nuen, "bai" segidan hiru aldiz, I Hiru ezberdinak egin daitezke, ELIZA erantzunak. Gure kode Zuek, Egia esan, oso erraza. Joan I behera horiek guztiak iragan bada garela programatutako dituzte erantzunak eta behera lortuko dugu gure nagusira, hasieratzeko goaz aldagai desberdinak pare bat eta egin garbikuntza pixka bat hasieran. Baina gero, ez da erabat multzo bat Ulertzen duzu kodearen. One big bitartean loop esaten naiz hau eta gehiagoko errepikatu egingo da. Lerro bat ere egin dut irakurri, eta ez dut gordetzen duten sarrerako kate batean. Egiaztatu eta ikusiko dut bada keyword berezia "bye", eta horrek esan nahi programatik irten. Eta, ondoren, egiaztatu eta ikusi ala dut Norbait beraiek da besterik errepikatuz behin eta berriro. Eta egingo haiek Yell dut hala egiten badute. Esango dut "ez errepikatu zeure burua." Harik eta horietako bat ere ez zen gertatu bezala, dugu Orduz bidez eta begizta aztertzea, 308 313 lerro on hemen, eta begiratu eta ikusi dira keyword horietako edozein sarrerako jasotako esaldi besterik ez dut eman zela? Ez bada partida bat da beraientzat, bai gero, gogoratzen dut kokaleku horretan. Keyword gogoratzen dut. Eta erantzun bat eraikitzeko gai izango naiz. Ez badut bat aurkitzeko, bai eta ondoren, Nire keyword array azken gauza Nire erantzunak default izango da, denean kito datorrenean. Bezalako galdera galdetu dut "Zergatik utzi duzu etortzen hemen? "edo" Nola lagun dezaket? " Hori besterik ez dira partzialki egokia berdin dio sarrerako zein den. Gero ikusiko dugu eraikitzeko ELIZA erantzuna. Hartu ahal izango dugu base erantzuna, urtean egin genuen bezala, era "Nire buruzagia" adibidez. Hori da dena bada ez dagoela is-- besterik ez da falta bada hori ez omen naiz nahi respond-- katea Besterik ezin dut bidali da atzera. Tan Asteriskoa badauka Horren amaieran, orduan ez dut prozesatu ere banakako token bakoitzari erabiltzailearen erantzunaren gainerako eta horiek gehitzeko ere, aldaketa hitzez hitz egin behar nuen bezala. Hori guztia da erabat Zerbait hori eraiki ahal izango dituzu. Eta hain zuzen ere, modu horretan dugu prozesatu komando lerroko argumentuak dute, modu horretan, duzu HTTP eskaeren bidez izapidetu arau mota bera jarraitu. Ereduarekin parekatzean ari dira. Beraz ELIZA nahiko garrantzitsua izan hizkuntza naturaletan duen eragina Dirudienez, egin delako bat izan zen bezala oso bideragarriak helburu, nolabait nahi genuke izan arazo hau zuzenean konpontzeko gai. Orain, hori ez da horrela, ez ELIZA esateko Hori egin nahi genuke dena. Zalantzarik ez. Baina, gai izango gara zerbait gehiago egin. Gure lehen urratsa joan ELIZA va haratago begiratzen ahal izateko Ez testuei ari sartutako teklatuan baina hitzaldian sartu, benetako hitzaldian mikrofono batean grabatu. Beraz, itxura denez hauek kontuan hartuz pieza desberdinak, gaude ereduen multzo bat eraiki nahi izan du. Gai izan behar goaz Behe-maila akustiko batetik joan information-- zelaia, anplitudea, frequency-- eta bihurtzeko sartu unitateak batzuk gaude errazago manipulatzeko gai eta, azkenik, manipulatu horiek Hitzak eta esaldiak sartu. Beraz, ahots ezagutza gehien daude gaur sistemetan jarraitu estatistikotik eredua, eta bertan eraikiko dugu Hiru zer irudikapen bereizi audio seinale hori benetan dauka. Hasteko eredu fonetiko bat egiten dugu oinarri besterik buruz hitz egiten du soinuak ekoizten ari naiz. Am dela zerbait ekoizten dut B a boy bezala edo D a txakurra bezala? Zelan aitortu bi horiek ezberdinak dut telefonoetan bereizi eta gisa? Horren gainean, eta gero ikusiko dugu eraikitzeko a word ahoskera eredua, lotzen elkarrekin zerbait banakako telefono horiek eta uztartzen haiekin hitz bat sartu. Eta horren ondoren, hitz hartu dugu eta berriro biltzeko zaitugu hizkuntza batekin esaldi osoa sartu ereduetan. Orain, bakoitzari buruz hitz egin dugu independentean horiek eta, banan-banan. Baina hiru eredu horiek dira guztiak besterik estatistikak izango. Eta horrek esan nahi dugunean haiekin lan, dizkizugu izan dadin lan egiteko gai horiek guztiak aldi berean. Ados. Hasteko gure eredu fonetikoa Dezagun. Beraz modeloak fonetikoa fidatu Teknika konputazional ezkutuko Markov modeloak deitzen. Hauek modeloak grafiko dira eta bertan I dute eta munduko egoera bat ezagutzen ezaugarriak dituzten bezala ezaugarri multzo batek. Eta egoera horretan parte bat deskribatzen horretan ari naiz arduratzen ekintzetarako. Beraz, uste dut egiten bada soinu-"ma" ama bezala, desberdinak daude soinua duten osagaiak. Ez dago zati bat non marraztu arnasa dut. Eta gero poltsan dut nire ezpainetan. Eta nire ezpainak jaurti dut pixka bat atzera bit "ma" soinu hori egiteko. Eta gero ez askatzea da. Nire ezpainak etorri ez ezik. Air kanporatu. "Ma." Hiru zati ezberdin horiek izango litzateke estatuek irudikatzen graph-- honetan agerpena, erdian, eta amaieran. Eta trantsizio behar nuke baimenduta me egoera batetik bidaiatzeko probabilitatea jakin batekin hurrengo. Beraz, adibidez, M soinua oso bat izan liteke, hasieran du at sarrerarekin oso laburra "Mm" - eta, ondoren, luzeagoa, Fase bibrazio non naiz eusten my ezpainak elkarrekin eta ia humming-- "Mmmm" -, eta gero oso laburrean Plosive non kanporatzen dut breath-- "ma". Ezkutuko Markov eredua da Izan ere harrapatzeko diseinatu Hori modu dudala egin soinu hori "ma" va zertxobait desberdina izango da bere erritmoaren, frekuentzia da, eta bere ezaugarri baino bidea egiten duzun hori edo modu hori gerta daiteke hitz egiten ari naiz, beraz, eta Gutun horren erabilera desberdin. "Ama" eta "baliteke I" borondatea soinua desberdinean. Beraz, bat ezagutzen Soinu jakin, ez genuke Markov-ereduak, ezkutuko Markov horiek eraikitzeko ereduak, posible telefono guztietan dut aitortu nahi izatea, soinu posible bakoitza, eta, ondoren, begiratu que tengo datuak akustiko eta estatistikoki zehaztu zeinek bat ziurrenik da Soinu hau ekoiztu dute. ONDO DA. Eredu horrekin, orduan dugu hasteko gainean eraikitzeko. Ahoskera eredu bat hartuko dugu. Hala, batzuetan ahoskera eredu sinple eta erraza dira ez duen bakarra delako horrela zerbait ahoskatu. Beste batzuetan, ari dira Pixka zailagoa da. Hona hemen ahoskera gida Gauza gorri hori da Hori ketchup egiten duzun daudelarik fruta bat. Jendeak ez du uste fruta bat da. Eskuin? Orain, badira hainbat modu Jende esana ahoskatu egingo da. Batzuek esango dute "behatz-Maiatza-behatz". Batzuek esango dute "behatz-mah-behatz". Eta hori harrapa dezakegu modeloak grafikoa hauetako bat Bertan, berriro, trantsizio adierazten dugu probabilitatea jakin bat izatea, eta probabilitatea lotutako haiekin. Beraz, kasu honetan, jarraitu beharreko banintz goi ibilbidea grafikoan osoa honen bidez, Gutun egon nintzen hasita litzateke Oso urrun geratzen da, "ta" soinua. I goiko erdia hartzea, "Oh," eta ondoren "ma" bat eta, ondoren, "A", eta, ondoren, bat "Ta", eta "ai." An "Toe-may-behatz". Beheko bidea hartu nuen bitartez bada honetan, lortuko dut "ta-mah-behatz". Eta behera, eta gero joan nintzen bada sortu, lortu nahi nuke "ta-may-behatz". Eredu horiek harrapatzeko horiek desberdintasunak, betiere delako horietako bat zabaldu dugu aitorpen-sistemak, Nik lan egin behar da joan pertsona mota desberdinak asko, Azentu desberdinak asko, eta are gehiago, Hitzak bereko erabilera desberdinak. Azkenik, horren gainean, zerbait eraiki ahal izango dugu hori itxura oso konplikatuak, hizkuntza eredua deitzen, baina, egia esan, errazena da horiek funtzionatzeko hiru delako zer dira n-gramo modeloak izeneko gunean. Eta, kasu honetan, zuk erakusten dut bi parte n-gramo eredu bat, bigram bat. Fisiko ideia egiteko goaz batzuetan, hitz batzuk daude gehiago litekeena bat jarraitu behar da Emandako hitza besteak baino. I esan bada besterik "iragarpena," Hurrengo hitza ezin litekeena izan "gaur" edo "eguraldia izan daiteke aurreikusten da bihar. " Baina zaila da izango da " eguraldiaren iragarpena alkatxofa ". Zer hizkuntza eredu bat egiten da horiek harrapatzen estatistikoki , kontatuta batzuk oso handiak arabera corpus, instantzia guztiak non hitz bat bestearen ondoren. Beraz corpus-- handi bat hartzen badut guztietan Wall Street Journal bezalako hori izan da 1930 urteaz geroztik sortutako, hau da, corpuses-- estandar bat eta itxura guztien bidez I Testu horretan, eta I zenbatu zenbat aldiz eman ondoren "Iragarpena" egiten ikusi nuen "gaur" eta zenbat aldiz egiten ikusi nuen "Iragarpena" jarraian "orburu" lehenengoa va askoz ere litekeena da. Honez agertzen joan urrun sarriago. Eta hala ere handiagoa izango da Berarekin probabilitatea lotutako. Irudikatu nahi badut utterance oso baten probabilitatea, gero, hautsi besterik ez dut eman. Beraz, entzumena probabilitatea zigorraren "arratoi jaten gazta" hitzaren probabilitatea "Eta" esaldi bat hasita, eta orduan probabilitatea du "arratoi" hitzez hitz jarraitzen "du," eta probabilitatea du "ate" hitza honela "arratoi" eta probabilitatea "Gazta" honela "jaten". Hau asko bezalako soinuak estatistikak, probabilitate handia. Eta hori da dena dela. Baina gauza harrigarria da hau egiten baduzu nahikoa datu lagin handi batekin, Badabil. Eta izugarri ondo funtzionatzen du. Denok teknologia horiek ezagutzen. Sistema eragile gehienek etortzen ahots puntu honetan errekonozimendua. Siri eta Cortana eta Echo erabiltzen ditugu. Eta gauza horiek dira oinarritzen Hiru geruza mota hau Eredua behean, batean eredu fonetikoa ahoskera erdian eredua, eta horietako gainean hizkuntza eredu bat. Orain, apur bat gehiago egin behar dute Ordena galderak erantzuteko ere, hori baino. Baina zer zaren onarpena Esaera araberakoa zehazki horretan. Beraz, dezagun adibide bat hemen. Beraz, nire telefono hemen eserita daukat dokumentu kameraren azpian. Eta ari gara galdetzen joan den Galdera batzuk Siri. Ados? Hargatik esnatu nire telefono hemen. Siri, eguraldia New Haven gaur bezala? SIRI: Hemen da eguraldia New Haven, Connecticut gaur. BRIAN SCASSELLATI: OK. Beraz, lehenengo Siri dagoela aitortu ikusi duzu banakako hitz bakoitzaren eta, ondoren, erantzun bat ekoiztu. Egingo erantzuna nola buruz hitz egin dugu Pixka bat eratzen da. Baina gaur egun ezagutzen dugun hori besterik ez da, oinarri Espainiako Estatistika gordinak eta horri buruzko ereduarekin bat datorren planteamendu mota, batzuk jokatu ahal izango dugu Siri batera. Beraz, ahal saiatzen naiz berriro. Siri, eguraldia hippopotamus New Haven, gaur egun? SIRI: OK. Hemen da New eguraldia Haven, Connecticut gaur. BRIAN SCASSELLATI: Siri en Ez hori daunted nik aurkitu ez delako pattern-- du "Eguraldi", "gaur egun", "New Haven." Horrexek erantzuteari ahal izateko, bezala ELIZA. Ados. Eman dezagun, nahiz eta bat gehiago barregarria adibide gehiago. Siri, eguraldi alkatxofa armadillo hippopotamus New Haven? SIRI: Let egiaztatu duten on me. Hona hemen zer aurkitu webean dut zer dira alkatxofak Armadillo hippopotamus New Haven. BRIAN SCASSELLATI: OK. Orain arte nahikoa joaten naizen Eredu honen kanpoan, Da nahastu delako gai naiz ez luzeagoak patroia du ez duela bat egiten badute. Eta hori estatistika- motorra dela esanez, Zer da hori lortu duzun probabilitatea du hitz hippopotamus eta alkatxofa elkarrekin, eta Armadillo? Hori lortu zerbait berria izan nahi du. Beraz, teknologia horiek egunero erabiltzen ditugu. Horietako pausorik nahi badugu are gehiago, ordea, ikusteko benetan Zein da horri buruz hitz egiteko gai izan nahi sistema horiek direla erantzuteaz da, hitz egin, berriro, bat buruz dugun galdera gehiago oinarrizko multzoa. Eta hori komunikazioan gai bat da galderari erantzun deitzen diogu. Hau da, bai zaie gai izan nahi dugu? Ikusleak: [INAUDIBLE]. BRIAN SCASSELLATI: Ba lortuko dugu prozesatzeko semantikoa sorra sartu? Beraz, bai. Badira gauza asko direla Siri azalera azpian gertatzen ari eta adibide batzuk Hurrengo erakusteko noa eta han pixka bat nahiko da egituraren aldetik zer esaten ari zaren hori garrantzitsua da. Eta, hain zuzen ere, hori handia bat Niretzat hurrengo diapositiba aitzindaria. Beraz, modu berean, gure ahots ezagutza eraiki zen eman geruza bat baino gehiago, bada, nahi dugu zer da hori benetan ulertu Ari esan, ez gara berriro joan geruza anitzeko analisi oinarritzea aitortzen ari testuaren. Beraz Siri da benetan gai esan, begiratu hitz hauek aurkitu dut. Orain zer egiten dut haiekin? Lehen osagaiak askotan da pasatzen eta saiatu aztertzeko esaldiaren egituran. Eta zer ikusi dugu eskola kalifikazioa, askotan, diagramming moduko gisa esaldiak, goazen zenbait aitortu hitz rolak jakin dute. Hauek Izen dira. Hauek Izenorde dira. Hauek aditzak dira. Eta ari gara ezagutzen joan gramatika jakin bat dela, Kasu ingelesa gramatika honetan, badira baliozko modu horretan, horiek konbinatu daiteke eta hori ez dute balio, beste bide batzuetatik. Aitorpen hori, egitura hori, nahikoa gidatzen gaituzte laguntzeko izan liteke Piska bat. Baina ez da aski Gurekin eman ahal izateko Zer ari da esaten den edozein esanahia. Horretarako, fidatu beharko dugu prozesatzeko semantikoa zenbatekoa batzuk. Hau da, begiratzen dute goaz tan azpian zer hitz hauetako bakoitzak benetan esanahia gisa darama. Eta hori egiteko modu errazena, Hitz bakoitza lotu goaz funtzio jakin bat ezagutzen dugu, eraldaketa jakin bat egiten duten gertatuko aukera ematen du. Kasu honetan, etiketatu liteke dugu hitza "John" izen berezi bat izateaz gain, egiten dituen berarekin identitate bat. Eta agian etiketatuko dugu "Mary" gora-behera. "Amodio" bezalako aditz bat, berriz, hori harreman jakin bat osatzen irudikatzeko gai garela. Orain, horrek ez du esan nahi ulertzen dugu maitasuna zer den, baina ulertzen duten bakarra dugu sistema sinboliko bat bidean da. Hau da, etiketatu ahal dugu da eta manipulatu. Planteamendu mota horietako bakoitzean, Edozein prozesatzeko semantikoa mota Hemen da apur bat eskatzeko Jakintza-bit eta lan asko gure aldetik. Jada ez gara oso besarkatzen non estatistika besterik ez arrunta dira guretzat nahikoa izango da. Orain, ordena joan izateaz puntu honetatik to barrutik hitz egin ahal zer benetan hemen gertatzen ari dena, hau manipulatzeko gai izateaz egituratzeko eta galdera bat ulertzen eta, ondoren, gai izatea irteteko eta bilatu, Hori egin behar da gehiago bat eredu kognitibo konplexuak. Modu horretan, sistema horiek eraiki dira Gehienetan, oso, oso lan egiteko da intentsiboa. Gizakiak inplikatzen dute handia gastua Denboraren bideak egituratzeko bertan esaldiak mota horiek logika batzuk ere irudika daitezke. Nahiz eta pixka bat egingo du konplexuagoa da, ordea. Nahiz landu ditugu behin semantics batera, dugu oraindik ere begiratu behar zer esan of pragmatika. Hau da, nola ez, hitz erlazionatzen dut badudala zerbait fisikoki atera munduan edo ez Gutxienez informazio iturri batzuk ezin dela manipulatu dut? Batzuetan, horiek eramango Anbiguotasun bit wonderful. "Gori-gori izar astronomo eran den." ONDO DA. Orain, gisa horretan irakurri dugu Dibertigarria titular mota litzateke dugun gau telebistan ikusi ez dugulako "star" interpretatu Bere gorputza zerutiar esanahia dute. Badakigu gehiago esan nahi du, aktore normalagoa edo aktoresa ikusgarritasuna kopuru altua izan da. "Taldea txakur mokadu biktima laguntzen du." Da zuzen hori da benetan han txakur bat lagunduz inguruan joan eta biktimak ziztada? Edo da ez dela izan zen pertsona bat nor izan zen laguntza handiagoa behar duten txakur batek hozka? Just sintaxia begira eta esaldiak semantika, Ezin dugu zehazten duten. "Helikoptero powered giza euli arabera." Ba al dago, hain zuzen ere, benetako gauza txiki inguruan hegan hegoak itzali dituzten pertsonak dira gizadiaren onerako helikopteroak? Edo dago gailu mekaniko bat izan zen bere boterea ondorioa pertsona bat? Noiz begiratu Galdera dugun erantzuteko sistemak, horiek dira geruzak landu behar dugu. Orain, onena eta gehien moduko ren sistema horien nagusi gaur egun ez dira gai mailan gauza dira zer harago duela 10 urte izan genuen. Hona hemen sistemetan onenetariko bat hori da han gaur. Eta hau sistema bat da IBM Watson izeneko. Hau da gure IBMko lagunen da. Hau Katherine bankuek da, Jia Chen, eta emango digu Priscilla Moraes Watson erakustaldia IBM Yorktownen atzo. [Bideo-erreprodukzioa] -Zelan zaude? -Ondo nago. Beti pozik naizenean naiz , pentsatzen batez ere I zerbitzari gela horietako cool gera daitezke. Nor da zure aktore gustukoena? -My Aktore gogokoena Angelina Jolie Lara Croft bezalako Tomb Raider ere bere jatorrizko delako Formulario ni bezalako pertsonaia birtual bat bezala zen. Nola daiteke Watson laguntzeko gaixoen? Gaixoak planean -Da Watson zuzenean sartzeko aukera izango? Watson aholku-era sartu aplikazioek erabiltzeko kasuan aldatu egiten dira. Baina gaur egun, Watson izango bakarrik ematen posible diagnostikoa eta tratamendua profesionala mediku aukerak. Hala badagokio, gaixoen Informazio hau eman beharko a Watson, agian bitartez portal web interface, tablet, edo baita telefono mugikorra. Esate baterako, gaixo bat izan daiteke beren sintomak deskribatzeko eskatu hizkuntza naturalean zuzenean Watson irtenbide bat sartu, medikuak ardatz aukera emanez diagnostikoa eta ez datu bilketa. -Nork Hil zuten Abraham Lincoln? -Joan Wilkes Booth. Arizona zer urteko -in egin Diamondbacks irabazi World Series? -2001. [END erreprodukzioa] BRIAN SCASSELLATI: So sistema mota hauek lehenik eta behin, haren konfiantza dute hizkera onartuz; bigarrena, bihurtzeko barneko esanguratsu batean ordezkaritza; eta, ondoren, hirugarren, gai izatea irteteko eta aurkitu Informazio iturri dela ahalbidetzen galdera horri erantzun die. Konplexutasun maila honek dakar programazioko gauzak mota bereko hori izan dituzu Arazo multzo egiten. Gai HTTP eskaerak analizatu ere ari gara behe-mailako patroia mota bera lotu ELIZA egin dezake. Horiek bihurtzeko gai gara Barneko ordezkaritza bat sartu, eta ondoren, horiek erabili batzuk zein den jakiteko kanpoko datu-basea, seguru SQL erabiliz. Sistema guztiak direla gaur eraikitzen ari dira natural mota hau egin ahal izateko Hizkuntza komunikaziorako gainean eraikitzen ari dira printzipioak. horiexen Orain, nahiz eta antzeko sistema bat Watson ez da nahikoa konplexua arbitrarioa erantzun ahal izateko Edozein gaiari buruz galderak. Eta hain zuzen ere, izango dute arlo jakin batean egituratuta. Beraz, online joan ahal izango duzu eta aurkitu ahal izango duzu ondo funtzionatu duela Watson bertsioak informatika medikoa barruan. Edo ez-line bat da Hori besterik ez nola jorratzen gomendio ona egiteko zer garagardo izango bertan janaria joan. Eta eurak barruan, galderei erantzun ahal izango da, berau behar duten informazioa aurkitzeko. Baina ezin duzu nahastu eta lotu. Hori trebatu dira sistema janaria eta garagardoa datu-basea ez du ondo funtzionatuko duzunean, bat-batean ipini in the informatika medikoa dituzten datu-basea. Beraz, nahiz eta gure gaur sistemarik onenak prozesatzeko maila baten mende bertan, alde batetik kodetze gara eta ordena azpiegitura eraikitzeko Sistema honen run egiteko. Orain, azken gaia nahi dut gaur egun iritsi ahal izateko hitzik gabeko komunikazioaren ingurukoa da. Informazio gehiengo handi batek komunikatzeko elkarren dugu ez du etorri buruz bitartez Hori aplikatuz ari gara hitz solteak. Den bezala gauzak egin ditu hurbiltasuna, begirada, zure ahotsaren tonua, Zure inflexioa. Eta komunikazio dela ere Zerbait duten interfazeak hainbat buruz asko axola. Ez da zer Siri zaintzen. Siri zerbait galdetzen diot ahots bat edo ahotsaren Beste giro batean, eta Siri Honez joan eman zidan erantzun bera. Baina hori ez da zer eraikitzen dugu beste interfaces mota asko. Zuk aurkeztu nahi dut orain robot bat da. Hau izan zen nire longtime arabera eraiki lagun eta lankide Cynthia Breazeal eta bere enpresa Jibo. Eta robot-- hau goaz Bikote boluntarioek bat izatea zatoz gora jarri hau elkarreragin. Beraz daiteke bi pertsona prest daukat niretzat robot jolastu? Zergatik ez zatoz gora, eta zergatik ez zatoz gora. Zuk sartu hemen eman litzaidake niri, mesedez. Eta badut izan dezakezu hementxe baino gehiago etorri. Eskerrik asko. Hi. ALFREDO: Nice zu ezagutzeaz. Alfredo. BRIAN SCASSELLATI: Alfredo. RACHEL: Rachel. BRIAN SCASSELLATI: Rachel. Nice duzu bai asetzeko. Alfredo, lehen dut joan behar izan du. Zatoz eskubidea hemen. Aurkeztu noa Baduzu dut hau lortu ahal bada itzali microphone-- joka gabe Jibo izeneko robot txiki bat egitea. ONDO DA? Orain, Jibo interaktiboa izatea du helburu. Eta nahiz eta hitzaldian eman ahal izango, robot elkarrekintza askoz verbal da. Alfredo, naiz galdetzera joan nintzen Zerbait atsegina eta osagarriak esaten robot, mesedez. ALFREDO: polita dela uste dut. [Whirring soinu] BRIAN SCASSELLATI: OK. Bere erantzuna ez da hitzezko. Eta, hala ere eman du, bai aitorpen argi bat Hori entzun zuenean zer esan duzu eta, gainera, nolabait ulertu zuen. ONDO DA? Urratsera hementxe back bigarren. Eskerrik asko. Rachel, zenituzkeen bada. Orain, nik emango dut zuk askoz zailagoa lana. Hementxe stand izanez gero, babeskopiak pixka bat besterik ez, beraz lor dezakezu dugu kamera eta hau begiratu. Zerbait esan nahi duzu eskatu noa Benetan esan eta robotaren gaizto. RACHEL: Zer zirudien besterik ez duzu Egin erabat absurdu zen. [Burrunba SOUND] Hori izan zen, are gehiago absurdu. Zer gertatzen ari da zuen artean? Aw, ez sentitzen txarra. Emango dizut besarkada bat. BRIAN SCASSELLATI: Ondo da. Eskerrik asko, Rachel. Alfredo, Rachel, eskerrik asko guys asko. [Txaloak] Beraz, elkarrekintza mota hau dauka Modu askotan arau bera batzuk eta bera batzuk egitura zein den bezala dugu Baliteke hizkuntza harreman dute. Halaxe da bai komunikazio eta helburu garrantzitsu bat balio du. Eta elkarrekintza hori, in Modu askotan, diseinatuta dago du eragin jakin bat izango dute Pertsona elkarreraginean edo entzuten robota da. Orain, zortea nahikoa dut Jibo dute gaur hemen. Sam Spaulding Hemen da laguntzen gurekin robot batera. Eta ez dut Sam galdetzeko ematen joan Jibo dantzaren demo polita digu inork amaieran dugun ikusi ahal izango da hemen. Anima zaitez, Jibo. SAM: OK, Jibo. Erakutsi zure dantza mugitzen. [Musika jotzen] BRIAN SCASSELLATI: Ondo da, denek. Gure Jibo lagunekin esker. [Txaloak] Eta gure lagunak esker IBM gaur egindako laguntzeagatik. Komunikazioa zerbait da Hori ari zaren gero eta gehiago gisa datozen ikusteko interfaces konplexuagoak eraikitzeko dugu. Hurrengo astean, hitz egiten egon beharko dugu nola komunika buruz ordenagailu jokoak aurkariei. Baina honetaz Zalantzaren bat izanez gero, Inguruan izango naiz bulego orduetan gauean. Zoriontsu AI buruz nahi duzu hitz egin naiz gaiak edo xehetasun gehiago sartu. Handia dute, asteburuan. [Txaloak] [Musika jotzen]