[Muzika] DAVID Malan: Kjo është CS50. Ky është fundi i javës së 10. Dhe djali, nuk kemi një klasë e mirë për ju sot. Ne jemi aq të ngazëllyer për të ftuar dy miqtë tanë nga Yale deri ne sot dhe të shikojmë në kryqëzimin e inteligjencës artificiale, robotikë, të përpunimit të gjuhës natyrore, dhe më shumë. Dhe me të vërtetë, mbi të javët e fundit, ne kemi sigurisht shpenzuar shumë kohë, sidomos në psets mëparshme, duke u përqendruar në detaje të bukura të nivelit të ulët. Dhe kjo është shumë e lehtë për të humbur shikim i pyjeve për të pemëve dhe merrni varur deri në sythe dhe kushtet dhe pointers, sigurisht, dhe të ngjashme. Por realiteti është që ju djema tani kanë përbërësit me të cilat ju mund të vërtetë zgjidhur disa probleme interesante, në mesin e tyre që miqtë tanë në Yale punojnë në vetëm turpërohet prej Kembrixhit. Pra, më lejoni së pari për të futur kokën tonë Asistenti nga Yale, Andy. [Duartrokitje] ANDY: Para së gjithash, falënderoj vetëm ju për të lejuar një Yalies çift të pop në poshtë në Kembrixh sot. Ne me të vërtetë appreciate it. Së dyti, për miqtë tanë prapa home-- Jason, Faleminderit për të qëndruar dhe drejtimin leksion. Shpresoj se kjo është e gjitha e mirë në New Haven. Pra, vërtet, unë jam i ngacmuar super për të futur Scaz sot. Scaz shkon laborator robotikë. Ai është një profesor i, si, pesë departamentet e ndryshme në Yale. Në laboratorin e tij, ai ka shumë, shumë robots që atij i pëlqen të luajë me të. Ai ka, si, The punë coolest në botë. Dhe ai merr për lloj rrëmujë rreth me atë gjatë gjithë ditës gjatë dhe të bëjë disa punë, si edhe. Dhe kështu ne fakt solli një Prej tyre poshtë me ne sot. Pra, pa zhurmë më tej, Scaz është do të shkojnë përpara dhe të na prezantoj për mikun e tij robot. [Duartrokitje] Brian SCASSELLATI: Faleminderit, David. Thanks, Andy. Ajo është aq e mrekullueshme që të jetë këtu me të gjithë sot. Unë dua që së pari të jetë shumë e qartë se stafi CS50 këtu në Kembrixh ka qenë tepër mikpritës për ne. Ne jemi aq mirënjohës për gjithçka ata kanë bërë për të na mbështesin. Dhe kështu që ne do të donim që të jenë në gjendje për t'u kthyer mirësinë. Pra sot, ne kemi marrë për të njoftuar se ne do të kemi një të ri, një-e-nje-lloj ngjarje CS50 ndodh në New Haven javën e ardhshme. Dhe kjo është Research Expo CS50. Pra, ne jemi duke shkuar për të ftuar everyone-- CS50 studentëve, Stafi nga të dy Harvardit dhe Yale-- të të zbresë dhe do të vizitojë me ne të premten. Ne do të kemi një shumëllojshmëri të gjerë e mbi 30 njerëz të ndryshëm paraqitur dhe upperclassmen exhibiting-- treguar off disa nga prodhimet e tyre kërkimore. Ne do të kemi disa startups, madje, duke kërkuar për pak e talenteve të reja të teknologjisë, startups nga të dy Harvardit dhe Yale. Dhe ne do të kemi disa grupe të studentëve duke kërkuar për disa anëtarësim të ri. Ajo do të jetë një kohë shumë emocionuese. Shpresojmë ata prej jush që janë që vijnë poshtë për lojë Harvard Yale do të jetë në gjendje për të ndaluar nga pak në fillim, të drejtë në qendër të kampusit, Sterling Biblioteka Memorial. Ne do të kemi një sërë ekspozitave që shkojnë nga autonom Sailboats për mënyrat e përdorimit të softuerit për të ruajtur dorëshkrime mesjetare. Ne do të kemi ad rrjeteve hoc dhe njerëz mësuar software kodim në Cape Town. Ne do të kemi kompjuter demonstrata muzikë. Dhe ne do të sigurisht të ketë më shumë robots. Pra, ne shpresojmë që ju do të bashkohen me ne për këtë ngjarje. Ajo duhet të jetë shumë i argëtim, pak e ushqimit, dhe shumë interesante gjëra për të folur rreth. Pra sot, ne jemi duke shkuar për të folur për përpunimin e gjuhës natyrore. Dhe kjo është përpjekja për ne për të ndërtuar një mënyrë të re të interfacing me pajisjet tona, sepse për javët e fundit, ju keni qenë të fokusuar në atë se si ajo është se ju mund të shkruani kodin, shkruani software kjo është një mënyrë për të qenë në gjendje të thonë se për një makinë, kjo është ajo që unë dua që ju të bëni. Por ne nuk duhet të duhet të presin se çdo gjë se është atje që është përdorur nga të gjithë në botë do të jetë i aftë në këtë lloj të mësimit. Pra, ne dallimin midis kompjuterit gjuhë dhe languages-- natyrore që është, gjëra që njerëzit përdorimit për të komunikuar me njerëzit tjera. Dhe ne përpiqemi për të ndërtuar ndërfaqe që përdorin këto mekanizma natyrore të komunikimit. Tani, ashtu si çdo temë tjetër që ne kemi filluar me në CS50, ne jemi duke shkuar për të filluar me më të thjeshtë bit të përpunimit të gjuhës natyrore që ne mund të imagjinohet. Ne jemi duke shkuar për të filluar me pjesë historike e gjuhës natyrore. Dhe pastaj ne do të ndërtuar deri në sisteme gjithnjë e më shumë të fundit dhe kanë disa popull fun gjatë rrugës. Pra, ne jemi duke shkuar për të filluar me atë që ishte ndoshta gjuha e parë natyrore përpunimin e sistemit. Ky ishte një sistem software shkruar në 1966 nga Joseph Weizenbaum quajtur Eliza. Dhe Eliza është projektuar për të replikuar llojin e ndërveprimit ju do të keni me një Psikoterapist Rogerian. Tani, Rogerians, ata kishin një ide që psikoterapia përfshirë të qenit në gjendje për të pasqyruar përsëri të një pacienti dhe të bisedoni me ta, në thelb, duke u dhënë atyre një vetëm grimcë e vogël e terapist. Kjo është, çdo gjë se terapist tha është dashur të jetë vetëm një reflektim i çfarë pacienti ishte thënë atyre. Pra, le të përpiqemi dhe të demo kjo. A kemi një vullnetar i cili do të jetë të gatshëm për të ndarë thellë të tyre, më të errëta, dhe / ose sekretet rreme me Eliza? I sigurt, pse nuk ju vijnë më lart. Fantastike. Dhe emri juaj? MILES: Miles. Brian SCASSELLATI: Miles. Gëzohem që u njohëm, Miles. Në qoftë se ju do të mbajë mbi atë. Dhe ne jemi duke shkuar për përdorin një version të Eliza që ne i kemi të njëjta brenda IDE CS50. Dhe ne do të shikojmë në burim kodi për këtë në një kohë të shkurtër. Por për tani, ne jemi vetëm do ta kërkoj atë nga shtypja Eliza. Dhe Eliza do të ju jap përgjigje që do të jetë në të gjitha kryeqytetet. Dhe do të ju pyes disa pyetje. Dhe ne do të përgjigjet dhe shkruani në përgjigjet ndaj Eliza. Pra, Eliza ka thënë: "Hi, unë jam Eliza. Çfarë është problemi juaj? " Çfarë do të dëshironit të tregoni Eliza për sot? MILES: Unë mund të bie në gjumë vetëm në qoftë se unë kam pantofla lepur në. Brian SCASSELLATI: Në rregull. Në rregull. [Qeshura] "Unë mund të bien vetëm gjumë me pantofla Bunny me radhë. " Dhe Eliza thotë: "Thuaj, a keni ndonjë probleme psikologjike? Ndoshta kjo është një tregues i mirë. " NE RREGULL. Pra, çfarë do të dëshironit të përgjigjet? MILES: Po. Brian SCASSELLATI: Po. Njeri i shumë fjalëve. Mua më pëlqen se. Eliza thotë: "Ju duket mjaft pozitive." MILES: Jo, unë jam, në fakt, një elektron. Brian SCASSELLATI: "Jo. Në fakt, unë jam një elektron. " "A ke ardhur tek unë sepse ju jeni një elektron? " Tani, ne mund të shohim disa prej things-- unë jam duke shkuar për pushim të për vetëm një të dytë, Miles. Mos shkoni kudo. Ne nuk jemi duke bërë me ty akoma. Eliza është, në disa mënyra, duke iu përgjigjur disa gjëra se ai është duke thënë, por pa ndonjë kuptim të vërtetë. Dhe kjo është gjithashtu i konfuzuar përsëri disa nga pjesët e dënimit të tij. Pra ne thamë: "Jo. Në fakt, unë jam një elektron. " Eliza përgjigj përsëri: "A ke ardhur për mua sepse ju jeni një elektron? " Në rregull. Le t'i jepte edhe një përgjigje këtu. T'i jepte një të mirë, Miles. MILES: një e mirë? Po, ju lutem më ndihmoni. Brian SCASSELLATI: "Po. Ju lutem më ndihmoni. "" Jeni i sigurt? " MILES: Jo. Brian SCASSELLATI: Jo. "Çfarë do të sugjerojnë për ju?" MILES: Unë nuk mund të jetë një elektron. Brian SCASSELLATI: "Unë nuk mund të jetë një elektron ". "A jeni duke thënë jo vetëm të jetë negativ?" Në rregull. Pra Miles, thank you so much. MILES: Ju faleminderit. Brian SCASSELLATI: Faleminderit shumë. [Duartrokitje] Pra, ky program Eliza, në shumë mënyra, është përgjigjur vetëm në copa se ne jemi duke ofruar pa asnjë thellë të kuptuarit e asaj që po ndodh këtu. Kjo është një lloj i sistemit quajtur përputhen model, ku ne jemi duke kërkuar për të caktuar pjesë të tekstit që ne jemi pas do të marrë nga ajo që është dhënë si input, kthyer atë, potencialisht, në një farë mënyre, dhe pastaj jepni atë për përdoruesit. A ndonjë prej jush mendojnë se Eliza është në fakt kryerjen psikoanalizën vlefshme këtu? Një person, ndoshta. Audienca: [padëgjueshme]. Brian SCASSELLATI: Dhe si bën që të bëjnë të ndjeheni? Po, në fakt, ajo bën. Dhe ne jemi duke shkuar për të parë, aktualisht, kod burim për atë në vetëm një moment. Dhe kështu që ju jeni do të jetë në gjendje të bëjë pikërisht këtë. Tani, Eliza është një formë e asaj që ne do të thërrasë sot një chat bot. Ajo thjesht shkon nëpër Teksti që ju jeni duke ofruar, siguron shumën minimale zhveshur e të kuptuarit ose përpunimi, dhe pastaj parrots atë për ju. Pra, le të marrin një vështrim, konceptualisht, dhe flasim për atë që ajo është se Eliza është në të vërtetë duke bërë. Eliza është duke marrë një le sentence---së thonë: "Unë dua të bërë përshtypje shefit tim." Dhe Eliza është në kërkim nëpër atë dënimit dhe duke u përpjekur për të gjetur dhe përputhen me modele të caktuara. Kështu, për shembull, një prej modeleve se Eliza është në kërkim të janë fjalët "Unë dua." Dhe çdo herë që sheh diçka se ka "unë dua" në të, ajo formulon një përgjigje. Dhe kjo përgjigje është një varg të caktuar. Në këtë rast, është "pse nuk ju duan?" Dhe kam vënë një yll të vogël në në fund, sepse kjo është vetëm fillimi i përgjigjen tonë. Dhe ylli tregon se ne jemi duke shkuar për të marrë pjesën tjetër i utterance-- e përdoruesit "për të bërë përshtypje shefin tim" - dhe ne jemi duke shkuar për append se në fund të këtij vargut. Deri tani, në vend se duke thënë: "pse nuk ju duan për të bërë përshtypje shefit tim " ka pak e shtesë përpunimi që ne do të bëjmë. Kjo është, ne do të duhet të kthyer disa përemrave këtu nga "bosi im" ndaj "shefit tuaj." Dhe nuk mund të jetë një tjetër pak Ndryshimet që ne kemi nevojë për të bërë. Pra, në vend se vetëm fërkimit atë direkt mbi fund, çfarë ne do të bëjmë po ne do të marrin pjesën tjetër të utterance-- përdoruesit në here-- bardhë dhe ne do të të marrë atë një pjesë në një kohë dhe të konvertohet çdo varg shenjë, çdo fjalë, në fjalinë. Pra, ne do të marrin fjalën "për të." Nuk ka asnjë konvertimit që ne duhet të bëjmë atë. "Përshtypje". Nuk ka asnjë konvertimit ne duhet të bëjmë atje. "My" do të konvertohet në "tuaj." Dhe "bosi" ne do të largohet ashtu si "bosi". Dhe pastaj në fund, çdo gjë që përfundon me një periudhë, ne do të kthyer atë në një pyetje. Kjo përputhet shumë e thjeshtë model në fakt është mjaft i suksesshëm. Dhe kur kjo u prezantua në 1966-- Joseph Weizenbaum programuar këtë në një kompjuter. Tani, kompjutera në atë kohë nuk ishin modelet e desktop. Ata u ndanë burime. Dhe studentët e tij do të shkoni dhe bisedoni me Elizën. Përfundimisht, ai kishte për të kufizuar qasjen në të sepse nxënësit e tij nuk ishin të marrjen e ndonjë punën e bërë. Ata ishin vetëm të biseduar me Elizën. Dhe, në fakt, ai kishte për të zjarri asistent i tij, i cili kaloi të gjithë kohën e saj duke biseduar me Eliza në lidhje me problemet e saj të thella dhe shqetësuese. Të gjithë ata që kanë përdorur këto sisteme filloi të anthropomorphize ato. Ata filluan të mendojnë për to si qenë animate dhe njerëz të vërtetë. Ata filluan të njohin disa nga gjërat që ata ishin duke thënë po vijnë për ta. Dhe ata u gjetur nga gjëra për veten. Dhe, në fakt, edhe ekspertët, edhe psikoterapistëve, filluan të shqetësohen se, në fakt, ndoshta Eliza do të jetë në zëvendësimin e tyre. Dhe madje edhe kompjuteri Shkencëtarët të shqetësuar se ne ishim aq afër zgjidhjen e gjuhës natyrore. Tani, kjo nuk ishte diku afër e vërtetë. Por kjo është se si mbresëlënëse këto sisteme mund të duket. Pra, le të fillojnë të duken nën dhe provoni për të marrë një pak e një pyetje e ku ky kod ndodh aktualisht. Pra, ne do të bëjmë këtë kod në dispozicion pas. Dhe kjo është një shumë port thjeshtë dhe i drejtpërdrejtë e zbatimit origjinale Eliza. Pra, disa nga këto stilistike gjëra që ju do të shihni këtu nuk janë stilistikisht çfarë ne do të duan që ju të bëni apo atë që ne kemi qenë të mësuar që ju të bëni. Por, ne kemi provuar për të mbajtur ata e njëjta nëpër portet shumë kjo ka patur mënyrë që ajo ka shijen e origjinalit. Pra, ne jemi duke shkuar për të përfshirë një bandë e gjëra, dhe pastaj ne do të kemi një sërë fjalë kyçe, gjëra që Eliza do të njohin dhe për t'iu përgjigjur direkt. Pra, nëse ju keni fjalë të tilla si "mund të" ose "Unë nuk e bëj" ose "jo" ose "po" ose "ëndërr" ose "hello", atëherë ELIZA do të përgjigjet selektive për ata. Ne gjithashtu do të kemi një numër të caktuar të gjërave që ne do të bie në ujdi, si konvertimin "tim" për të "tuaj." Dhe atëherë ne do të kemi një grup të përgjigjeve që për secilën nga këto kyçe, ne do të rrotullohen përmes këto përgjigje të ndryshme. Pra, nëse unë them "po" tri herë në një rresht, unë mund të merrni tre të ndryshme përgjigjet nga Eliza. Kodi ynë, atëherë, është në fakt shumë e thjeshtë. Nëse unë lëvizni poshtë e kaluara të gjitha këto përgjigjet që kemi programuar në dhe ne të merrni poshtë për të kryesore tonë, ne jemi duke shkuar për nisja një çift i variablave të ndryshme dhe të bëjë një grimë të vogël e shtëpisë ne fillim. Por atëherë nuk ka absolutisht një grup e kodit që ju mund të kuptoni. Një lak i madh, ndërsa që thotë se unë jam do ta përsëris këtë mbi dhe mbi. Unë do të lexuar në një vijë, dhe unë do të dyqan që në një varg të dhëna. Unë do të kontrolloni dhe të shohim nëse kjo është fjalen special "bye", e cila do të thotë të dalë nga programi. Dhe atëherë unë do të kontrolloni për të parë nëse dikush është vetëm duke përsëritur veten mbi dhe mbi. Dhe unë do të bërtas me ta nëse ata e bëjnë. Unë do të them "mos përsërisë veten." Për sa kohë që asnjë nga ata që të ndodhë, ne do të pastaj scan përmes dhe përmes lak, në linjat 308 deri 313 këtu, dhe kontrolloni dhe të shohim ndonjë nga ato fjalen frazat përfshira në input që unë u dhënë vetëm? Nëse ka një ndeshje për ta, mirë atëherë, unë do të mbani mend atë vend. Unë do të mbaj mend atë fjalë. Dhe unë do të jetë në gjendje për të ndërtuar një përgjigje. Në qoftë se unë nuk e gjeni një, edhe atëherë, gjëja e fundit në grup time fjalen do të jetë përgjigje e mia parazgjedhur, kur asgjë tjetër ndeshje. Unë do të bëni pyetje të tilla si "Pse e bëre ardhur këtu? "ose" Si mund t'ju ndihmoj? " që janë vetëm pjesërisht të përshtatshme pa marrë parasysh çfarë është input. Ne pastaj do të ndërtojmë përgjigjen Eliza-së. Ne do të jetë në gjendje për të marrë se reagimi bazë, ashtu siç bëmë në atë "shefi im" shembull. Nëse kjo është e gjitha se ka is-- nëse kjo është vetëm një varg që unë jam duke menduar për të respond-- Unë vetëm mund të dërgoni atë përsëri jashtë. Në qoftë se ka një yll në në fund të tij, atëherë unë do të përpunojnë çdo shenjë individuale në pjesa tjetër e përgjigjes së përdoruesit dhe shtoni ato në, shkëmbejnë jashtë fjalë për fjalë si kam nevojë për të. E gjithë kjo është absolutisht e diçka që ju mund të ndërtojë. Dhe në fakt, mënyra në të cilat ne kanë argumente command line të përpunuara, mënyra në të cilën ju keni procesohen përmes kërkesave HTTP ndjekin të njëjtat lloje të rregullave. Ata janë model përputhen. Pra, Eliza kishte një relativisht i rëndësishëm ndikimi në gjuhë natyrale për shkak se ajo e bëri atë të duket si ajo ishte një Qëllimi shumë i arritshëm, si në njëfarë mënyre ne do të më të jetë në gjendje për të zgjidhur këtë problem të drejtpërdrejtë. Tani, kjo nuk do të thotë që Eliza nuk çdo gjë që ne do të duan të bëjnë. Sigurisht që jo. Por ne duhet të jetë në gjendje për të bërë diçka më shumë. Hapi ynë i parë për të shkuar përtej Eliza po shkon të jetë në gjendje për të parë në nuk tekst është futur në tastierë, por të folurit, aktual Fjalimi i regjistruar në një mikrofon. Pra, si ne shikojmë në këto copa të ndryshme, ne jemi do të keni për të ndërtuar një grup të modeleve. Ne do të duhet të jetë në gjendje për të shkuar nga të nivelit të ulët akustike katran information--, amplitudë, frequency-- dhe të konvertohet atë në disa njësi që ne jemi në gjendje për të manipuluar më lehtë dhe, më në fund, të manipuluar ato në fjalë dhe fjali. Pra, njohjen më të madhe të folurit sistemet që janë atje sot ndjekin një statistikore model në të cilin ne ndërtojmë tre përfaqësitë veçanta të çfarë që sinjali audio në fakt përmban. Ne të fillojë me një model fonetik që flet për vetëm bazës tingujt që unë jam prodhimin. A jam duke prodhuar diçka që është një B si në djalë ose një D si në qen? Si mund të njohin ato dy të ndryshme Telefonat si i ndarë dhe dallon? Në krye të kësaj, atëherë ne do të ndërtojmë një model shqiptim fjalë, diçka që lidh së bashku ato telefonat individuale dhe kombinon ato në një fjalë. Dhe pas kësaj, ne do të marrin fjalët dhe ne do të mblidhen ato me një gjuhë modeli në një fjali të plotë. Tani, ne jemi duke shkuar për të folur në lidhje me çdo prej tyre në mënyrë të pavarur dhe veç e veç. Por këto tre modele janë të gjithë vetëm do të jetë statistika. Dhe kjo do të thotë kur ne punojnë me ta, ne do të të jetë në gjendje për të punuar me ata të gjithë të njëjtën kohë. Në rregull. Le të fillojmë me modelin tonë fonetik. Pra, modele fonetike mbështetet në një teknikë kompjuterike quajtur modele të fshehur Markov. Këto janë modele grafike në të cilën unë kanë dhe njohin një shtet të botës siç u karakterizuar nga një grup i karakteristika. Dhe se shteti përshkruan një pjesë nga një veprim që unë jam i angazhuar në. Pra, nëse unë mendoj për të bërë të shëndoshë "ma" si nëna, atje janë të ndryshme Komponentët për këtë zë. Ka një pjesë ku kam nxjerrë në frymëmarrje. Dhe atëherë unë çantë buzët e mia. Dhe unë roll buzët e mia prapa pak bit për të bërë se "MA" shëndoshë. Dhe pastaj ka një lirim. Buzët e mia të vijnë veç e veç. Ajrit është dëbuar. "Ma." Këto tri pjesë të ndryshme do të jetë përfaqësuar nga shtetet në këtë graph-- fillimi, mesi dhe fundi. Dhe unë do të duhet tranzicionit që lejohet mua që të udhëtojë nga një shtet të ardhshëm me një probabilitet të caktuar. Kështu, për shembull, se M tingëllojë si mund të ketë një shumë, konsum shumë të shkurtër në beginning-- "mm" - dhe pastaj a gjatë, Faza dridhës ku unë jam duke mbajtur tim Buzët së bashku dhe pothuajse humming-- "mmmm" - dhe pastaj një shumë të shkurtër shpërthyes ku unë i dëboj breath-- "ma." Modeli i fshehur Markov është projektuar për të kapur faktin se mënyra që kam bërë që zë "ma" po shkon të jetë pak më ndryshe në koha e saj, është frekuenca, dhe karakteristikat e tij se mënyrë që ju të bëni atë ose mënyra se si unë mund të bëjë atë kur unë jam duke folur rreth Përdorime të ndryshme të letrës. "Nëna" dhe "mund unë" do të tingëllojë pak më ndryshe. Pra, për të njohur një tingull të veçantë, ne do të ndërtuar modele Markov, këto fshehur Markov modele, e çdo telefon e mundur që unë mund të duan të njohin, çdo zë e mundur, dhe pastaj të shohim në të dhënat akustike që unë kam dhe të përcaktojë statistikisht të cilat një është më shumë gjasa kanë prodhuar këtë tingull. NE RREGULL. Me këtë model, ne atëherë të fillojë për të ndërtuar në krye të saj. Ne kemi marrë një model shqiptim. Tani, nganjëherë shqiptim Modelet janë të thjeshta dhe të lehta sepse ka vetëm një mënyrë për të shpallë diçka. Herë të tjera, ata janë një pak më e komplikuar. Këtu ka një udhëzues shqiptim për atë gjë që është e kuqe një fryt që ju bëni ketchup nga. Njerëzit nuk mendoj se është një fryt. E drejtë? Tani, ka shumë mënyra të ndryshme se njerëzit do të shpallë këtë fjalë. Disa do të thonë "shputë-May-shputë." Disa do të thonë "shputë-Mah-shputë." Dhe ne mund të kapur atë me njëri prej këtyre modeleve grafike ku, përsëri, ne përfaqësojmë tranzicionit si të paturit e një probabilitet të caktuar dhe lidhur me probabilitetin e tyre. Pra, në këtë rast, në qoftë se unë do të ndjek rruga lartë nëpër tërë këtë grafik, Unë do të jetë duke filluar në letrën në të majtë tani, "ta" shëndoshë. Unë do të marrë gjysmën e parë, e "oh", dhe pastaj një "ma" dhe pastaj një "a", dhe pastaj një "ta" dhe një "oh". "Toe-mund-shputë." Nëse unë e mori rrugën e poshtme përmes kjo, unë do të shkoj "Ta-Mah-shputë." Dhe në qoftë se unë shkova poshtë dhe pastaj lart, unë do të shkoj "Ta-Maj-shputë." Këto modele të kapur këto Dallimet sepse sa herë ne vendosë një nga këto Sistemet e njohjes, ajo do të duhet të punojnë me shumë llojet e ndryshme të njerëzve, shumë thekse të ndryshme, dhe madje edhe Përdorime të ndryshme të njëjtat fjalë. Së fundi, në krye të kësaj, ne do të ndërtojmë diçka që duket me të vërtetë e komplikuar, quajtur modeli gjuha, por në fakt është e thjeshte e tre për shkak se këto të veprojë në atë që quhen modele n-gram. Dhe në këtë rast, unë jam duke ju treguar një dy pjesë n-gram model, një bigram. Ne jemi duke shkuar për të bërë fizik idenë që nganjëherë, fjalë të caktuara janë më shumë të ngjarë të ndjekin një dhënë fjalën se të tjerët. Në qoftë se unë vetëm tha se "parashikimi i motit," fjala i ardhshëm mund të ngjarë të jetë "sot" ose mund të jetë "moti Parashikimi nesër. " Por është e pamundur që të jetë " Parashikimi i motit Angjinarja. " Çfarë një model gjuhë nuk është ajo kap ata statistikisht duke numëruar, nga disa shumë të mëdha korpus, të gjitha instancat në të cilin një fjalë vijon tjetrit. Pra, nëse unë të marrë një corpus-- madhe si çdo Wall Street Journal që ka qenë prodhuar që nga viti 1930, e cila është një nga corpuses-- standarte dhe unë shoh nga të gjithë që teksti, dhe i konsideroj deri sa herë pas "Parashikimi" bëj unë shoh "sot" dhe sa herë jam shoh "Parashikimi" e ndjekur nga "artichoke" e para po shkon të jetë shumë më shumë gjasa. Ajo do të dalë shumë më shpesh. Dhe kështu ajo do të ketë një më të lartë probabiliteti lidhur me të. Nëse unë dua të gjej probabiliteti i një të folur të gjithë, atëherë, unë vetëm të thyejnë atë. Pra, probabilitetin e dëgjimit fjalia "miu ngrënë djathë" është probabiliteti i fjalës "e" fillimit të një dënim, dhe atëherë probabiliteti që fjala "rat" ndjek fjalën ", i" dhe probabiliteti që fjala "hëngrën" ndjek "rat" dhe probabiliteti që "djathë" poshtë "e hëngra". Kjo tingëllon si një shumë e statistikat, një shumë e probabiliteteve. Dhe kjo është e gjitha që ajo është. Por gjëja e mahnitshme është në qoftë se ju bëni këtë me një mostër të madhe të mjaftueshme të të dhënave, punon. Dhe punon jashtëzakonisht mirë. Ne të gjithë e dimë këto teknologji. Shumica e sistemeve operative të vijë me njohjen e zërit në këtë pikë. Ne përdorim Siri dhe Cortana dhe Echo. Dhe këto gjëra janë të bazuara në ky lloj i tre-shtresa model-- një model fonetik në fund, a Modeli shqiptim në mes, dhe një model gjuhë në krye të tyre. Tani, ata duhet të bëjnë pak më shumë se se në mënyrë për t'iu përgjigjur pyetjeve. Por njohja e asaj që ju jeni thënie varet pikërisht nga kjo. Pra, le të marrim një shembull këtu. Pra, unë kam telefonin tim ulur këtu nën kamera dokument. Dhe ne jemi duke shkuar për të pyet SIRI disa pyetje. Në rregull? Pra, le të zgjoheni telefonin tim këtu. Siri, ajo që është moti si në New Haven sot? SIRI: Ja moti për New Haven, Connecticut sot. Brian SCASSELLATI: OK. Pra, së pari ju pa se Siri njohur secili prej fjalë individuale dhe pastaj të prodhuar një përgjigje. Ne do të flasim rreth asaj se si ajo përgjigje vjen rreth në një pak. Por tani që ne e dimë se kjo është e bazuar vetëm në statistikat e para dhe kjo model përputhen lloj i qasjes, ne mund të luajnë disa lojëra me Siri. Kështu që unë mund të provoni përsëri. Siri, ajo që është moti hipopotam New Haven, sot? SIRI: OK. Këtu është moti për New Haven, Connecticut për sot. Brian SCASSELLATI: Siri-së nuk tmerruar nga ajo për shkak se është gjetur pattern-- "motit", "sot", "New Haven." Kjo është ajo që është duke iu përgjigjur për të, ashtu si Eliza. Në rregull. Le të japim atë një shumë edhe më shumë shembull qesharak. Siri, artichoke motit Armadillo hipopotam New Haven? SIRI: Më lejoni të shikoni në atë. Ja se çfarë kam gjetur në internet për çfarë janë karçof Armadillo hipopotam New Haven. Brian SCASSELLATI: OK. Pra, nëse unë shkoj aq larg sa larg nga ky model, Unë jam në gjendje për të ngatërruar atë, sepse ajo nuk ka ndeshjet më të gjatë modelin që ai ka. Dhe kjo statistikore motor që është thënë: çfarë është mundësia që ju keni marrë hipopotami fjalët dhe Angjinarja së bashku, dhe Armadillo? Që e mori të jetë diçka e re. Pra këtyre teknologjive ne i përdorim çdo ditë. Në qoftë se ne duam të marrë atyre një hap më tej, edhe pse, në qoftë se ne fakt duan të jenë në gjendje për të folur për atë që është se këto sisteme janë duke iu përgjigjur, ne duhet të flasim, përsëri, në lidhje me një grup më themelor i pyetjeve. Dhe kjo është një temë në komunikim që ne e quajmë, duke u përgjigjur pyetje. Kjo është, ne duam të jetë në gjendje to-- vërtet? Audienca: [padëgjueshme]. Brian SCASSELLATI: A marrim në përpunimin e fshehur Semantic? Pra, po. Ka shumë gjëra që janë të ndodh nën sipërfaqe me Siri dhe në disa nga shembujt Unë jam duke shkuar për të treguar ju ardhshëm ku ka mjaft pak në aspektin e strukturës së të asaj që ju jeni duke thënë se është e rëndësishme. Dhe, në fakt, kjo është një e madhe shenjë paralajmëruese për rrëshqitje tjetër për mua. Pra, në të njëjtën mënyrë që tonë njohjen e të folurit është e ndërtuar e shtresa të shumëfishta, në qoftë se ne duam të kuptuar se çfarë është ajo që është në të vërtetë u tha, ne jemi duke shkuar për të përsëri mbështetet në një analizë të multi-layer i tekstit që është duke u njohur. Pra, kur Siri është në të vërtetë në gjendje të të themi, shikoni gjeta këto fjalë. Tani çfarë të bëj me ta? Komponenti i parë është shpesh shkoni nëpër dhe të përpiqen për të analizuar struktura e fjalisë. Dhe në atë që ne kemi parë në klasën e shkollës, shpesh, si lloj diagramimin fjali, ne jemi duke shkuar të njohin se të caktuara Fjalët kanë role të caktuara. Këto janë emra. Këto janë përemra. Këto janë folje. Dhe ne jemi duke shkuar për të njohur se për një gramatikë të veçantë, në këtë rast English Grammar, ka mënyra vlefshme në të cilën unë mund të kombinohen ato dhe mënyra të tjera që nuk janë të vlefshme. Se njohja, se struktura, mund të jetë e mjaftueshme për të ndihmuar të na drejtojë pak. Por kjo nuk është mjaft e mjaftueshme për ne që të jetë në gjendje për të dhënë çdo kuptim të asaj që u tha këtu. Për ta bërë këtë, ne do të duhet të mbështetet në disa shuma e përpunimit semantik. Kjo është, ne do të duhet të shohim në nën çfarë secili prej këtyre fjalëve në fakt mbart si një kuptim. Dhe në mënyrën më të thjeshtë të bërë këtë, ne jemi duke shkuar për të lidhen me çdo fjalë që ne e dimë një funksion të caktuar, një transformim i sigurt se ajo lejon të ndodhë. Në këtë rast, ne mund të emërtim Fjala "Gjoni" si një emër i duhur, që mbart një identitet. Dhe ne mund të etiketë "Mary", si në të njëjtën mënyrë. Ndërsa një folje si "dashurive", që përbën një marrëdhënie të veçantë se ne jemi në gjendje për të përfaqësuar. Tani, kjo nuk do të thotë se ne e kuptojmë çfarë është dashuria, por vetëm që ne e kuptojmë ajo në anë të një sistemi simbolik. Kjo është, ne mund të etiketë ajo dhe manipuluar atë. Me secilën nga këto lloje të metodave, çdo lloj i përpunimit semantik këtu do të kërkojë pak bit e dijes dhe shumë punë nga ana jonë. Ne nuk jemi në fushën ku statistika vetëm plain do të jetë e mjaftueshme për ne. Tani, në mënyrë për të shkuar nga kjo pikë për të qenë në gjendje për të folur për pjesën e brendshme të çfarë po ndodh në të vërtetë këtu, për të qenë në gjendje për të manipuluar këtë strukturës dhe të kuptojnë një pyetje dhe pastaj janë në gjendje për të shkuar jashtë dhe të kërkoni, që kërkon një më shumë modeli kompleks njohëse. Mënyra në të cilën këto sisteme janë ndërtuar është për pjesën më të madhe shumë, shumë punë intensive. Ato përfshijnë njerëzit shpenzimet e një marrëveshje e madhe e kohës strukturimin mënyrat në që këto lloje të dënimeve mund të përfaqësohet në disa logjikën. Ajo merr edhe pak më komplekse, edhe pse. Edhe një herë ne kemi marrë me semantikë, ne do të ende duhet të shikoni në pragmatikës e çfarë është duke thënë. Kjo është, si mund ta bëjnë fjalët se unë kam diçka fizikisht jashtë atje në botë, ose në paku disa burim informacioni që unë mund të manipulojë? Ndonjëherë, këto të çojnë në bit e mrekullueshme e dykuptimësi. "Red-hot yll të martohet astronom." NE RREGULL. Tani, ne lexojmë se si lloj funny titull se ne do të shohim në fund të TV natën sepse ne nuk e interpretojmë "yll" të ketë kuptimin e saj Trupi qiellor. Ne e dimë se kjo do të thotë më shumë aktor zakonshme apo aktore me sasi të lartë të shikimit. "Skuadra ndihmon viktimën kafshimit qen." A është kjo se skuadra është në fakt atje ndihmuar një qen në duke shkuar përreth dhe thumbues viktimat? Apo është ajo që ka pasur një individ i cili ishte kafshuar nga një qen i cili nevojshme për ndihmë? Vetëm nga të shikuarit e sintaksë dhe semantikë e dënimeve, ne nuk mund të përcaktojë se. "Helikopter mundësuar nga mizat e njeriut." A ka, në fakt, aktuale pak gjëra fluturues rreth se janë njerëz me krahë vë në lëvizje helikopterët për të mirën e njerëzimit? Apo ka një pajisje mekanike që rrjedh fuqinë e saj nga një person? Kur ne shikojmë në fjalë Sistemet u përgjigjur, këto janë shtresa që ne duhet të merren me. Tani, më të mirë dhe më të lloj i përhapur i këtyre sistemeve sot janë në gjendje të bëjë gjëra në një nivel që janë shumë përtej asaj që kemi pasur 10 vjet më parë. Këtu është një nga sistemet më të mira kjo është atje sot. Dhe kjo është një sistem nga IBM quajtur Watson. Kjo është nga miqtë tanë në IBM. Kjo është banka Katherine, Jia Chen, dhe Prishila Moraes duke na dhënë një demonstrim i Watson dje në IBM Yorktown. [VIDEO rishikim] -Si jeni? -Jam mirë. Unë jam gjithmonë i lumtur kur unë jam i të menduarit, sidomos kur unë mund të qëndrojmë të qetë në këto dhomat e serverëve. -Kush Është aktorja juaj i preferuar? Aktorja -Im favorite Angelina Jolie si Lara Croft në Tomb Raider, sepse origjinalin e saj Forma ishte si një karakter virtual si unë. -Si Mund Watson ndihmojë pacientët? -A Planin për pacientët të kanë qasje në Watson direkt? Qasja në Watson këshilluese Aplikacionet do të ndryshojnë nga përdorimi rast. Por aktualisht, Watson do të sigurojë vetëm Diagnoza dhe trajtimi i mundshëm Opsionet për profesionist mjekësor. Kur është e përshtatshme, pacientët mund të japin informacion të Watson, ndoshta përmes një Portali ndërfaqe web, tabletë, apo edhe një telefon celular. Për shembull, një pacient mund të jetë kërkohet të përshkruajnë simptomet e tyre në gjuhë natyrale direkt në një zgjidhje Watson, duke lejuar mjeku të përqëndrohet në Diagnoza dhe jo mbledhjes së të dhënave. -Kush Vrarë Abraham Lincoln? -Gjoni Wilkes Booth. -Në Çfarë viti bëri Arizona Diamondbacks fituar World Series? -2001. [END rishikim] Brian SCASSELLATI: Pra, këto lloje të sistemeve të duhet të mbështeten para së gjithash njohjen e të folurit; i dytë, konvertimin e saj në një të brendshme kuptimplotë përfaqësimi; dhe pastaj, të tretë, duke qenë në gjendje për të dalë dhe për të gjetur burim informacioni që lejon atyre për t'iu përgjigjur kësaj pyetjeje. Ky nivel i kompleksitetit përfshin të njëjtat lloje të gjërave programore se ju keni qenë bërë në grupe problemit. Ne jemi në gjendje të kuptoj HTTP kërkesave në të njëjtin lloj të modelit të nivelit të ulët përputhen që Eliza mund të bëjë. Ne jemi në gjendje për të kthyer ato në një përfaqësim të brendshme, dhe pastaj të përdorin ato për të query disa Baza e të dhënave të jashtme, ndoshta duke përdorur SQL. Të gjitha sistemet që janë duke u ndërtuar sot për të bërë këtë lloj të natyrshme komunikimi gjuhë janë duke u ndërtuar mbi këto parime të njëjta. Tani, edhe një sistem si Watson nuk është mjaft komplekse të jetë në gjendje për t'iu përgjigjur arbitrar pyetje në lidhje me ndonjë temë. Dhe në fakt, ata duhet të jenë të strukturuar brenda një domain të caktuar. Kështu që ju mund të shkoni në internet dhe ju mund të gjeni versionet e Watson që veprojnë mirë brenda informatikës mjekësore. Ose ka një internet që vetëm merret me sa për të bërë rekomandime të mira në lidhje çfarë birrë do të shkojë me të cilin ushqim. Dhe brenda këtyre fushave, ajo mund t'i përgjigjet pyetjeve, gjetur informacionin që ajo ka nevojë. Por ju nuk mund të përzierje dhe ndeshjen e tyre. Sistemi që është trajnuar me bazën e të dhënave e ushqimit dhe birrës nuk punojnë mirë, kur ju papritmas vënë atë në me informatikës mjekësore bazës së të dhënave. Pra, edhe në sistemet tona më të mira sot mbështeten në një nivel të përpunimit në të cilën ne jemi coding dorë dhe ndërtimit në infrastrukturë, në mënyrë për të bërë këtë të drejtuar sistemin. Tani, tema e fundit që unë dua të jetë në gjendje për të marrë në sot ka të bëjë me komunikimin joverbal. Një masë e madhe e informacionit që ne komunikuar me njëri-tjetrin nuk ka ardhur në lidhje përmes Fjalët individuale që ne jemi duke aplikuar. Ajo ka të bëjë me gjëra të tilla si Afërsia, vështrimi, tonin e zërit tuaj, ndryshim tuaj. Dhe se komunikimi është edhe diçka që shumë interfaces të ndryshme kujdesen shumë për. Kjo nuk është ajo që kujdeset për Siri. Unë mund të kërkoni Siri diçka në një zë ose në një ton të ndryshme të zërit, dhe Siri do të më jep të njëjtën përgjigje. Por kjo nuk është ajo që ne ndërtojmë për shumë lloje të tjera të ndërfaqeve. Unë dua të prezantoj tani në një nga robots. Kjo u ndërtua nga kohë të gjatë e mia Miku dhe kolegu Cynthia Breazeal dhe kompania e saj Jibo. Dhe kjo robot-- ne jemi duke shkuar të ketë një çift vullnetarë dalë për të bashkëvepruar me këtë. Kështu që mund të ketë dy njerëz të gatshëm për të luajtur me robot për mua? Pse nuk vijnë më lart, dhe pse nuk ju vijnë në dorë. Në qoftë se ju do të bashkohet me mua këtu, ju lutem. Dhe në qoftë se unë mund të ketë të vijë të drejtë mbi këtu. Faleminderit. Hi. Alfredo: Gëzohem që u njohëm. Alfredo. Brian SCASSELLATI: Alfredo. RACHEL: Rachel. Brian SCASSELLATI: Rachel. Gëzohem që u njohëm dyja. Alfredo, unë jam do të ketë të shkoni në fillim. Vijë të drejtë deri këtu. Unë jam duke shkuar për të futur ju, duke filluar në qoftë se unë mund të merrni këtë off pa trokitur microphone-- në një robot të vogël të quajtur Jibo. NE RREGULL? Tani, Jibo është projektuar të jetë interaktive. Dhe edhe pse ajo mund të ju jap fjalën, shumë i ndërveprimit me robot është joverbal. Alfredo, unë jam duke shkuar për të ju pyes për thonë diçka të bukur dhe kompliment në robot, ju lutem. Alfredo: Unë mendoj se ju duken bukur. [Gumëzhitës SOUND] Brian SCASSELLATI: OK. Përgjigja e saj nuk është verbale. E megjithatë kjo ju dha të dy një njohje të qartë se ai kishte dëgjuar se çfarë keni thënë dhe gjithashtu disi e kuptueshme se. NE RREGULL? Hap drejtë mbrapa këtu për një sekondë. Faleminderit. Rachel, në qoftë se ju do. Tani, unë jam duke shkuar për të dhënë ju puna shumë më të vështirë. Nëse ju do të qëndroni të drejtë këtu, mbështetur vetëm pak kështu ne mund të merrni ju në kamera dhe të kërkoni në këtë mënyrë. Unë jam duke shkuar për të ju pyes për të thënë diçka vërtetë do të thotë dhe e keqe për robot. RACHEL: Çfarë ju vetëm dukej për të bërë ishte krejtësisht absurde. [Gjallë SOUND] Kjo ishte edhe më absurde. Çfarë po ndodh me ty? Aw, nuk ndihen keq. Unë do të ju jap një përqafim. Brian SCASSELLATI: Në rregull. Thanks, Rachel. Alfredo, Rachel, Thanks guys shumë. [Duartrokitje] Pra, ky lloj i ndërveprimit ka në shumë mënyra disa prej të njëjtave rregulla dhe një pjesë e njëjtë Struktura si ajo që ne mund të ketë në ndërveprim gjuhësor. Kjo është edhe komunikues dhe i shërben një qëllimi të rëndësishëm. Dhe kjo ndërveprim, në shumë mënyra, është hartuar të ketë një efekt të veçantë në Personi bashkëveprojmë me ose duke dëgjuar në robot. Tani, unë jam mjaft me fat të ketë Jibo këtu sot. Sam Spaulding është këtu duke ndihmuar na me robot. Dhe unë jam duke shkuar për të kërkuar Sam për të dhënë ne një demo e bukur e Jibo vallëzimi që ne mund të shikojnë në fund këtu. Pra shkoni përpara, Jibo. SAM: OK, Jibo. Na tregojnë lëviz tuaj valle. [Muzika] Brian SCASSELLATI: Në rregull, të gjithë. Falë miqve tanë në Jibo. [Duartrokitje] Dhe në sajë të miqve tanë në IBM për të ndihmuar jashtë sot. Komunikimi është diçka se ju jeni duke shkuar për të parë vijnë gjithnjë e më shumë si ne ndërtojmë ndërfaqe të më komplekse. Javën e ardhshme, ne do të flasim se si të kryesh me kundërshtarëve kompjuter në lojëra. Por në qoftë se ju keni pyetje në lidhje me këtë, Unë do të jetë rreth në orarit të punës sonte. Unë jam i lumtur të flas me ju në lidhje me UA tema ose për të marrë në më shumë detaje. Keni një fundjavë të madh. [Duartrokitje] [Muzika]