[Muzikos grojimo] DAVID Malan: Tai CS50. Tai yra 10 savaitės pabaigos. Ir berniukas, mes turime geras klasė jums šiandien. Mes taip džiaugiamės pakviesti du mūsų draugai iš Jeilio iki mums šiandien ir ieškoti susikirtimo dirbtinis intelektas, robotika, natūralios kalbos apdorojimas, ir dar daugiau. Ir iš tiesų, per pastaruosius keletą savaičių, mes tikrai praleido daug laiko, ypač ankstesnių psets, sutelkiant dėmesį į gana žemo lygio detalių. Ir tai labai lengva pamiršti iš miško už medžių ir įsikibę linijų ir sąlygos ir patarimų, žinoma, ir pan. Tačiau realybė yra vaikinai dabar turi Pagalbinės medžiagos, su kuria jūs galite tikrai išspręsti kai kurias įdomias problemas, tarp juos tie, kurie mūsų draugai Jeilio dirbti tik drovūs Cambridge. Taigi leiskite man pirmiausia pristatyti mūsų galvos asistentas nuo Yale, Andy. [Plojimai] ANDY: Pirmiausia, tiesiog padėkoti Jums leisti pora Yalies pop žemyn į Kembridžą šiandien. Mes tikrai vertiname tai. Antra, mūsų draugai Atgal home-- Jasonas Ačiū už gyvena ir veikia paskaitą. Tikiuosi, kad viskas gerai, New Haven. Taigi, taip, aš super excited pristatyti Scaz šiandien. Scaz veikia robotų laboratoriją. Jis iš profesorius, primenantis, penkių skirtingų departamentų Jeilio. Savo laboratorijoje, jis turi daug, daug robotai, kad jis mėgsta žaisti su. Jis turi, pavyzdžiui, The super darbas pasaulyje. Ir jis pasireiškia rūšies netvarka aplink, kad visą dieną ilgai ir padaryti tam tikrą darbą, taip pat. Ir taip mes iš tikrųjų atnešė vieną jų žemyn su mumis šiandien. Taigi be tolesnio ceremonija, Scaz yra ketina eiti į priekį ir pristatyti mums Jo robotas draugui. [Plojimai] BRIAN SCASSELLATI: Ačiū, Davidas. Ačiū, Andy. Tai taip nuostabu būti čia su visais šiandien. Noriu pirmas būti labai aišku, kad CS50 darbuotojai čia Kembridže buvo neįtikėtinai svetingi mums. Mes esame labai dėkinga už viską jie padarė mus paremti. Ir todėl mes norėtume, kad būtų galima grįžti į gerumą. Taigi, šiandien mes gauti pranešti kad mes ketiname turėti naują, viena-of-a-kind CS50 renginio vyksta New Haven kitą savaitę. Ir tai yra CS50 tyrimų Expo. Taigi mes ketiname būti pakviesti everyone-- CS50 studentų, darbuotojai iš abiejų Harvardo ir Yale-- į nusileisti ir aplankyti pas mus penktadienį. Mes turime platų daugiau nei 30 skirtingi žmonės pristatantys ir exhibiting-- upperclassmen rodo išjungti kai kuriuos savo mokslinių tyrimų produktų. Mes turime keletą pradedantiesiems, net, ieško už trupučiu naujų technologijų talentą, pradedantiesiems iš tiek Harvardo ir Jeilio. Ir mes turime keletą studentų grupes looking for some naujos narystės. Tai bus labai įdomi laiko. Tikimės, kad tiems iš jūsų, kurie Besileidžiant už Harvardo-Jeilio žaidimą galės sustabdyti iki šiek tiek per anksti, pačiame miestelio centre, Sterlingas memorialinė biblioteka. Mes ketiname turėti rinkinį eksponatų, kad nuo savarankiška burlaiviai būdus, kaip naudojant programinę įrangą išsaugoti viduramžių rankraščių. Mes ketiname turėti skelbimą hoc tinklų ir žmonės mokymo programinės įrangos kodavimas Keiptaune. Mes turime kompiuterį muzikos demonstracijos. Ir mes, žinoma, turime daugiau robotų. Taigi mes tikimės, kad jūs prisijungti prie mūsų šį įvykį. Ji turėtų būti daug įdomus, šiek tiek maisto, ir įdomu daug dalykų kalbėti apie. Taigi, šiandien, mes ketiname kalbėti apie natūralios kalbos apdorojimas. Ir tai yra mums bandymas statyti naują būdą sąsajos su mūsų prietaisais, nes per pastaruosius keletą savaičių, Jūs buvo sutelktas į tai, kaip ji yra, kad galite rašyti kodą, rašyti programinę įrangą tai yra, kad galėtų pasakyti būdas mašina, tai, ką aš noriu jums padaryti. Tačiau mes neturėtume reikia tikėtis, kad viskas tai ten, kad manimi naudojama kiekvienas pasaulyje bus įgudę šioje instrukcijoje rūšies. Taigi, mes atskirti kompiuterio Kalbos ir natūralus languages-- tai yra, dalykų, kad žmogui naudoti bendrauti su kitais žmonėms. Ir mes stengiamės sukurti sąsajas, kurios naudoja Šie natūralūs ryšio mechanizmai. Dabar, kaip ir kiekvieną kitą temą kad mes pradėjome iš CS50, mes ketiname pradėti paprasčiausias tiek natūralios kalbos apdorojimo kad mes galime įsivaizduoti. Mes ketiname pradėti su istorinė dalis natūralios kalbos. Ir tada mes statyti iki vis daugiau ir daugiau neseniai sistemos ir turėti tam tikrą įdomus demo pakeliui. Taigi mes ketiname pradėti su tuo, kas buvo turbūt pirmasis natūralios kalbos apdorojimo sistema. Tai buvo programinės įrangos sistema, parašyta 1966 Joseph Weizenbaum vadinama Eliza. Ir ELIZA buvo sukurta siekiant atkartoti sąveikos natūra jums reikės su Rogerian psichoterapeutas. Šiol, Rogerians, jie turėjo idėja, kad psichoterapija dalyvauja galėtų atspindėti atgal pacientui ir pasikalbėti su jais, iš esmės, kurią tik suteikiant jiems maža šiek tiek terapeutas. Tai reiškia, kad viskas kad terapeutas sakė turėjo būti tik atspindys ką pacientas pasakojo jiems. Taigi pabandykime ir demo tai. Ar mes turime savanorį, kuris nori būti nori pasidalinti savo giliausius, tamsiausias ir / ar netikras paslaptys su Eliza? Žinoma, kodėl gi ne jums ateiti iki. Mobiliesiems telefonams. Ir tavo vardas? MILES: mylių. BRIAN SCASSELLATI: mylių. Nice to meet you, Miles. Jei norite eiti į tai. Ir mes ketiname naudoja Eliza versija kad mes pakartotas per CS50 IDE. Ir mes pažvelgti šaltinio kodas tai truputį. Bet dabar, mes tiesiog ketina pasitelkti jį įvesdami Eliza. Ir ELIZA ketina suteikti jums atsakymus kurie bus visose sostinėse. Ir vyksta užduoti jums keletą klausimų. Ir mes atsakysime ir įveskite ir atsakymuose į Eliza. Taigi ELIZA sakė, "Sveiki, aš Eliza. Kokios problemos?" Ką norėtumėte pasakyti Eliza apie šiandien? MILES: galiu patenka tik miega jei turiu triušiuko šlepetės ant. BRIAN SCASSELLATI: Visos dešinę. Gerai. [Juokas] "Aš galiu patenka tik miega su bunny šlepetės On ". Ir ELIZA sako: "Sakyk, ar ne jokių psichologinių problemų? Gal tai yra geras rodiklis. " GERAI. Taigi, ką norėtumėte atsakyti? MILES: Taip. BRIAN SCASSELLATI: Taip. Žmogus daug žodžių. Man patinka, kad. Eliza sako: "Jūs, atrodo gana teigiamas." MILES: Ne, aš esu iš tikrųjų, elektronas. BRIAN SCASSELLATI: "Ne Tiesą sakant, aš esu elektronas ". "Ar tu atėjai pas mane nes esate elektronas? " Dabar matome, kai Quake aš ruošiuosi pristabdyti jus tik sekundę, Miles. Negalima eiti bet kur. Mes ne viskas su jumis dar. ELIZA yra, tam tikrais būdais, reaguoti į tam tikrus dalykus kad jis sako, bet be bet realaus supratimo. Ir jis taip pat parroting atgal kai iš jo sakinio dalių. Taigi, mes pasakė: "Ne Tiesą sakant, aš esu elektronas ". Eliza atsakė atgal, "Ar tu atėjai man, nes esate elektronas? " Gerai. Leiskite suteikti jai dar vieną atsakymą čia. Give it a geras, Miles. MILES: Geras viena? Taip, prašau man padėti. BRIAN SCASSELLATI: "Taip. Prašome padėti man. "Ar tikrai?" MILES: Ne BRIAN SCASSELLATI: Ne "Ką tai rodo jums?" MILES: Aš negali būti elektronas. BRIAN SCASSELLATI: "Aš negali būti elektronas ". "Ar tu sakai, ne tik bus neigiamas?" Gerai. Taigi Miles, Thank you so much. MILES: Ačiū. BRIAN SCASSELLATI: Ačiū labai. [Plojimai] Taigi tai ELIZA programa, įvairiais būdais, reaguoja tik į gabalus kad mes teikti be jokių giliai supratimas, kas vyksta čia. Tai sistema natūra vadinamas modelio atitikimo, kur mes ieškome tam tikros bitai tekstą, mes tada ketina imti ką buvo numatyta, kaip įvestį, konvertuoti jį, potencialiai, tam tikru būdu, ir tada duoti jį atgal į vartotojo. Ar kas nors iš jūsų manote kad ELIZA yra iš tikrųjų Atliekant galiojantį psichoanalizės čia? Vienas asmuo, o gal. Auditorija: [nesigirdi]. BRIAN SCASSELLATI: Ir kaip ar tai, kad Jūs jaustumėtės? Taip, iš tiesų, ji daro. Ir mes ketiname pamatyti, Tiesą sakant, kodo už jį vos akimirką. Ir taip, jūs ketinate būti galėtų daryti būtent tai. Dabar ELIZA yra viena forma, kas mes vadiname šiandien pokalbių botas. Jis tiesiog eina per tekstas, jūs suteikiate, suteikia minimumo sumą supratimo ar perdirbimas, ir tada papūgos jį atgal į jus. Taigi leiskite pažvelgti, konceptualiai, ir kalbėti apie tai, ką tai yra, kad ELIZA iš tikrųjų daro. ELIZA yra pradėdami vartoti bet kurį sentence-- tegul pasakyti: "Aš noriu padaryti įspūdį savo viršininkui." Ir ELIZA ieško per tą sakinį ir bando rasti ir atitiktų tam tikrus modelius. Taigi, pavyzdžiui, vienas iš šablonų kad ELIZA ieško esate žodžiai "Noriu." Ir bet kuriuo metu jį mato kažką kad turi "Noriu" jame, jis formuluoja atsakymą. Ir atsakymas yra fiksuota eilutę. Šiuo atveju, tai "kodėl tu nori?" Ir aš įdėti truputį žvaigždę pabaiga, nes tai tik mūsų reaguojant pradžia. Ir žvaigždė rodo, kad mes ketiname imtis poilsio naudotojo utterance-- "įspūdį mano bosas", - ir mes ketiname pridėti, kad ant šio gale eilutę. Taigi dabar, o ne sakydamas: "Kodėl norite nustebinti savo bosą " ten šiek tiek papildomos apdorojimas, kad mes padarysime. Tai reiškia, kad mes turime konvertuoti kai kurių įvardžių čia iš "Mano bosas", kad "savo viršininku". Ir ten gali būti keletas kitų pokyčiai, kurie mums reikia padaryti. Taigi, o ne tik klijuoti tiesiai ant galo, ką mes padarysime yra mes priimsime į poilsį vartotojo anketa utterance-- balta here-- ir mes jį vienas gabalas tuo laikas ir paversti kiekvieną eilutę raktas, kiekvienas žodis, į sakinį. Taigi, mes priimsime žodžio "IKI". Nėra konversijos kad mes turime tai padaryti. "Impress". Nėra konversijos mums reikia ten daryti. "Mano" bus konvertuoti į "savo". Ir "bosas" mes tiesiog palikti kaip "bosas". Ir tada, pagaliau, nieko, kad baigiasi su tam tikrą laikotarpį, mes konvertuoti jį į klausimą. Tai labai paprasta modelio atitikimo iš tiesų yra gana sėkminga. Ir kai šis buvo įvesta į 1966-- Joseph Weizenbaum užprogramuotas šis kompiuteryje. Dabar, kompiuteriai tuo metu nebuvo staliniai modeliai. Jie buvo dalijamasi ištekliais. Ir jo mokiniai būtų eiti ir kalbėtis su Eliza. Galų gale, jis turėjo apriboti prieigą prie savo nes jo mokiniai nebuvo gauti bet atliktą darbą. Jie buvo tiesiog kalbasi su Eliza. Ir, tiesą sakant, jis turėjo ugnies savo padėjėją, kuris praleido visą savo laiką kalbėti su Eliza apie savo gilių ir neraminančių problemų. Kiekvienas, kuris naudojamas šių sistemų pradėjo anthropomorphize juos. Jie pradėjo galvoti apie juos kaip yra animuoti ir realūs žmonės. Jie pradėjo pripažinti kai ką, kad jie buvo pasakyti buvo grįžta prie jų. Ir jie buvo išsiaiškinti dalykų apie save. Ir, tiesą sakant, net ekspertai, net psichoterapeutai, pradėjo nerimauti, kad, tiesą sakant, gal ELIZA būtų juos pakeisti. Ir net kompiuteris Mokslininkai nerimauja, kad mes buvome taip arti sprendžiant gamtos kalbą. Dabar, kad nebuvo niekur arti tiesa. Bet tai, kaip įspūdingai šios sistemos gali atrodyti. Taigi pradėkime ieškoti po ir bandykite gauti šiek tiek klausimu kur šis kodas tikrųjų vyksta. Taigi mes padaryti šį kodą galima vėliau. Ir tai yra labai paprasta ir tiesioginė uosto pirminio ELIZA įgyvendinimą. Taigi kai kurie iš jų stilistinė dalykų, kad jūs pamatysite čia yra ne kas stilistiškai mes norime, kad jūs padaryti ar tai, ką mes jau moko jus padaryti. Bet mes bandėme išlaikyti juos tas pats per daug uostus kad tai turėjo taip, kad ji turi originalo skonį. Taigi mes ketiname įtraukti dalykų krūva, ir tada mes turime raktažodžių rinkinį, daiktų kad ELIZA bus pripažinti ir reaguoti į tiesiogiai. Taigi, jei turite tokius žodžius kaip "galite", arba "aš ne" arba "ne" arba "taip" arba "svajonė" arba "labas", tada ELIZA bus selektyviai reaguoti į juos. Mes taip pat turime tam tikras skaičius dalykų kad mes apsikeitimo, kaip konvertuoti "mano", kad "jūsų". Ir tada mes turime atsakymų rinkinys kad kiekviena iš šių raktinių žodžių, mes pasukti per šie skirtingi atsakymai. Taigi, jei aš sakau "taip" tris kartus iš eilės, aš gali gauti trys skirtingi atsakymai Eliza. Mūsų kodą, tada, yra iš tikrųjų nepaprastai paprasta. Jei aš slinkite žemyn pro visa tai atsakymai, kad mes suplanuotos ir mes kibti į mūsų pagrindinis, mes ketiname inicijuoti įvairių kintamųjų pora ir padaryti šiek tiek namų ruošą pradžioje. Bet ten absoliučiai rinkinys kodo, kad jūs galite suprasti. Vienas didelis, o kilpa, kuri sako aš ketina pakartoti vėl ir vėl. Aš perskaičiau eilutę, ir aš saugoti, kad į įvesties eilutę. Aš patikrinti ir pamatyti, jei tai būtų ypatingą raktažodis "bye", kuri reiškia išeiti iš programos. Ir tada aš patikrinti ir pamatyti, ar kas nors tiesiog kartoti save vėl ir vėl. Ir aš klykauti ne juos, jei jie daro. Aš sakau "nekartoti sau." Tol, kol nė vienas iš tų atsitikti, mes tada nuskaityti per ir kilpa per, linijose 308 313 čia ir patikrinti ir pamatyti, yra bet kuri iš tų raktažodį frazės, esančios įėjimo kad man buvo tik suteikta? Jei yra rungtynės už juos, taip pat tada aš prisimenu tą vietą. Aš prisimenu tą žodį. Ir aš galės statyti atsakymą. Jeigu aš neturiu rasti vieną, gerai tada, paskutinis dalykas, mano žodžių masyvas bus pagal nutylėjimą atsakymai, kai nieko rungtynes. Aš užduoti klausimus, pavyzdžiui, "Kodėl tu čia ateina? "arba" Kaip aš galiu jums padėti? " kad yra tik iš dalies tinkamas nesvarbu koks indėlis yra. Mes tada sukurti Eliza atsakymą. Galėsime imtis kad pagrindas atsakas, kaip mes padarėme, kad "Mano bosas" pavyzdys. Jei tai viskas, kad is-- jei tai tik vienas eilutė, kad aš turėjo respond-- Aš galiu tik siųsti jį atgal. Jei ji turi ne žvaigždutę jo pabaigoje, tada aš apdoroti kiekvieną atskirą raktą į naudotojo atsako poilsio ir pridėti tuos, Swapping iš pažodžiui, kaip man reikia. Visa tai yra visiškai kažkas, kad jūs galite sukurti. Ir iš tiesų, būdai, kuriais mes perdirbo komandų eilutės argumentus, būdas, kuriuo jūs turite tvarkomi per HTTP užklausas atlikite tuos pačius rūšių taisykles. Jie modelio atitikimo. Taigi ELIZA buvo gana svarbus poveikis natūralios kalbos nes ji tapo atrodyti, kad tai buvo labai pasiekiamas tikslas, kaip ir kažkaip mes norime būtų galima išspręsti šią problemą tiesiogiai. Dabar, kad manimi negalima teigti, kad ELIZA daro Viskas, ką norėtumėte daryti. Tikrai ne. Bet mes turėtų galėti daryti kažką daugiau. Mūsų pirmasis žingsnis eiti už ELIZA vyksta gebėti pažvelgti į ne tekstą būtų įtraukti į klaviatūrą, bet kalboje faktinis kalbos įrašyti į mikrofoną. Taigi, kaip mes žiūrime į juos skirtingi gabalai, mes teks statyti modelių rinkinys. Mes ketiname turėti, kad būtų galima eiti iš žemo lygio akustinės informacija-- pikis, amplitudė, frequency-- ir konvertuoti, kad į Kai kurie padaliniai, kad mes galėtų lengviau manipuliuoti ir, galiausiai, manipuliuoti juos į žodžių ir sakinių. Taigi didžioji kalbos atpažinimas sistemos, kurios yra ten šiandien sekti statistinis modelis, kuriame mes statome trys atskiri atstovybės ką kad garso signalas iš tikrųjų yra. Mes pradedame su fonetiniu modelį kad kalbama apie tik bazę skamba, kad aš gaminti. Ar aš gaminti kažką, kad yra B kaip berniukas ar D kaip šuo? Kaip aš pripažįstu, tų dviejų skirtingų telefonai kaip atskiri ir skiriasi? Viršuje, kad mes tada statyti žodis tarimas modelis, kažkas, kad susieja kartu tie atskiri telefonai ir sujungia juos į žodį. Ir po to, mes priimsime žodžius ir mes surinkti juos su kalba modeliuoti į visą sakinį. Dabar, mes ketiname kalbėti apie kiekvieną iš jų nepriklausomai ir atskirai. Tačiau šie trys modeliai yra visi tik bus statistika. Ir tai reiškia, kad, kai mes dirbti su jais, mes būtų galima dirbti su juos visus vienu metu. Gerai. Pradėkime mūsų fonetinio modelį. Taigi fonetiniai modeliai remtis skaičiavimo technika vadinamas paslėptų Markovo modelių. Tai yra grafinis modeliai, kurioje aš turėti ir pripažinti pasaulio būklę kaip charakterizuojama pagal funkcijų rinkinys. Ir, kad valstybės apibūdina vieną dalį ieškinio, kad aš užsiima. Taigi, jei manau, kad apie tai garsas "Ma", kaip motina, yra skirtingi komponentai į tą garsą. Yra dalis, kur aš atkreipti kvėpavimas. Ir tada aš rankinėje mano lūpas. Ir aš riedėti mano lūpos šiek tiek atgal tiek padaryti, kad "Ma" garsą. Ir tada ten išleisti. Mano lūpos irti. Oro šalinamas. "Ma". Šios trys skirtingos dalys būtų atstovauja narių šioje graph-- Į pradžią, vidurinioji ir pabaiga. Ir aš norėčiau turėti perėjimus, kad leido man keliauti iš vienos valstybės į kitą su tam tikra tikimybe. Taigi, kad, pavyzdžiui, M garsas gali būti labai, labai trumpas įsiurbimo tuo beginning-- "MM" - ir tada ilgiau, vibracinis etapas, kai aš holdingo Mano lūpos kartu ir beveik humming-- "mmmm" - ir tada labai trumpas Plosive kur aš išsiųsti breath-- "Ma". Paslėptas Markovo modelis skirtos fiksuoti tai, kad būdas, kad aš darau kad garsas "Ma" ketina šiek tiek skiriasi jos laikas yra dažnis, ir įsitikinti, nei būdas, kad jūs padaryti jį arba taip, kad galėčiau padaryti jį, kai aš kalbu apie skirtingus naudojimo būdus laiške. "Motina" ir "aš galiu" bus skamba šiek tiek kitaip. Taigi, norint pripažinti ypač garso, Norime statyti Markovo modelius, tai paslėpta Markovo modeliai, kiekvieno galimo telefonu, kad aš norėti pripažinti, kas įmanoma, garso, ir tada pažvelgti į akustinių duomenų, kad turiu ir nustatyti statistiškai kurių vienas yra labiausiai tikėtina, vienas kad parengėme šį garsą. GERAI. Su šiuo modeliu, tada mes pradėti statyti ant jo. Mes priimame tarimas modelį. Dabar, kartais tarimas modeliai yra paprasta ir lengva nes ten tik vienas būdas ištarti kažką. Kiti kartus, jie yra šiek tiek daugiau sudėtinga. Štai tarimo vadovas tos raudonos dalykas, kad yra vaisių, kad jūs padaryti kečupas iš. Žmonės nemanau, kad tai vaisius. Teisė? Dabar, yra daug skirtingų būdų, kad žmonės bus ištarti šį žodį. Kai bus pasakyti "tne-Geg-toe". Kai bus pasakyti "tne mah-Toe". Ir mes galime užfiksuoti, kad su vienas iš šių grafinių modelių kur, kartą, mes atstovauja perėjimus kaip turintis tam tikrą tikimybę ir susijusią tikimybę, kad su jais. Taigi, šiuo atveju, jei aš buvo sekti viršutinis maršrutas per visą šio grafiko, I būtų pradedant raide tolimajame kairiajame kampe, "TP" garsą. Norėčiau imtis viršutinę, į "Oh," ir tada "Ma" ir tada "A", ir tada "TA", ir "O". "Toe-Geg-Toe". Jei aš paėmė iš apačios kelią per tai, aš gausite "TA-mah-Toe". Ir jei aš nuėjau žemyn ir tada iki, aš norėčiau gauti "TA-May-toe". Šie modeliai užfiksuoti šie skirtumai, nes kai mes dislokuoti vienas iš šių pripažinimo sistemos, tai teks dirbti su daug įvairių rūšių žmonių, daug skirtingų akcentų, ir net pasirinko skirtingas tais pačiais žodžiais. Galiausiai, viršuje, kad, mes sukurti kažką kad atrodo tikrai sudėtinga, vadinamas kalbos modelis, bet iš tikrųjų yra paprasčiausias trys, nes jose apie tai, kas yra vadinama n-gramas modeliai. Ir šiuo atveju, aš parodyti jums, dviejų dalių N-gramų modelis, Bigramų. Mes ketiname padaryti fizinę idėja kad kartais tam tikri žodžiai labiau tikėtina, kad sekti suteikta žodžio, nei kiti. Jei aš ką tik pasakė "orų prognozė" kitą žodį tikėtina galėtų būti "šiandien" arba galėtų būti "oras Prognozuojama, rytoj ". Bet tai mažai tikėtina, kad būti " orų prognozė artišokų. " Kokia kalba modeliu daro, yra jis fiksuoja tuos statistiškai skaičiuojant nuo kai labai didelis Corpus, visi atvejai kurioje vienas žodis taip kitą. Taigi, jei aš didelį corpus-- kaip ir kiekvienas Wall Street Journal " kad buvo gaminamas nuo 1930 kuris yra vienas iš standartinio corpuses-- ir man atrodo per visus kad tekstas ir tikiuosi iki kiek kartų po "prognozė" matau "Šiandien" ir kiek kartų tai matau "prognozė", po "artišokų" pirmasis vyksta bus daug labiau tikėtina. Jis ketina pasirodyti kas dažniau. Ir todėl turėsite didesnis tikimybė, susijęs su juo. Jei aš noriu išsiaiškinti tikimybė visą žodžio, tada aš tiesiog nutraukti jį. Taigi klausymo tikimybe sakinys "žiurkės valgė sūrį" yra žodžio tikimybė "į" pradeda sakinį, ir tada tikimybė, kad Žodis "žiurkė" taip žodį "The," ir tikimybė, kad Žodis "suvalgė" pildoma "žiurkės" ir tikimybė, kad "sūris" taip "suvalgė". Tai skamba kaip daug statistika, tikimybių daug. Ir tai viskas, kad ji yra. Bet nuostabus dalykas yra, jei jums tai padaryti su pakankamai didelis mėginio duomenų, tai veikia. Ir tai veikia ypatingai gerai. Mes visi žinome, šias technologijas. Dauguma operacinių sistemų ateiti su balso atpažinimo šiuo metu. Mes naudojame Siri ir Cortana ir aido. Ir šie dalykai yra pagrįsti Šio tipo iš trijų sluoksnių model-- fonetinį modelis apačioje, A tarimas modelis centru, ir kalbos modelis, ant jų. Dabar jie turi padaryti šiek tiek daugiau nei, kad norint atsakyti į klausimus. Bet ką jūs pripažinimas posakis priklauso būtent apie tai. Taigi galime imtis pavyzdį čia. Taigi turiu mano telefonas sėdi čia po dokumento kamera. Ir mes ketiname prašo Siri keletą klausimų. Gerai? Taigi leiskite pabusti savo telefoną čia. "Siri", kas yra oras kaip ir New Haven šiandien? SIRI: Štai ir oras Niu Heivenas, Konektikutas šiandien. BRIAN SCASSELLATI: Gerai. Taigi, pirmiausia, kad matėte, kad Siri "pripažinta kiekviename iš atskirų žodžių ir tada pagamintas atsaką. Mes kalbame apie tai, kaip, kad atsakas ateina, apie truputį. Bet dabar, kad mes žinome, kad tai yra pagrįstas tik nuo žaliavų statistikos ir tai modelio atitikimo tipo požiūrio, mes galime žaisti kai kuriuos žaidimus su "Siri". Taigi aš galiu pabandyti dar kartą. "Siri", kas yra oras hipopotamas New Haven, šiandien? SIRI: Gerai. Štai naujų oras Heivenas, Konektikutas šiandien. BRIAN SCASSELLATI: "Siri" s ne išsigandę, kad nes jis rado pattern-- "oras", "šiandien", "New Haven." Štai ką jis reaguoja kad, kaip ir Eliza. Gerai. Leiskite duoti dar vieną, net daugiau juokinga pavyzdys. "Siri", oras artišokų šarvuotis hipopotamas New Haven? SIRI: Leiskite patikrinti, kad. Štai ką radau internete už tai, ką yra artišokai šarvuotis hipopotamas New Haven. BRIAN SCASSELLATI: Gerai. Taigi, jei aš einu pakankamai toli nuo šio modelio, Aš galėtų klaidinti, nes ji ne ilgiau atitinka modelį, kad ji turi. Ir kad statistinė variklis, sakydamas, kas tikimybė, kad jūs turite žodžiai hipopotamas ir artišokų kartu, ir šarvuotis? Štai turiu būti kažkas naujo. Taigi šių technologijų mes naudojame kiekvieną dieną. Jei norime juos vieną žingsnį Be to, nors, jei mes iš tikrųjų nori, kad būtų galima kalbėti apie tai, kas yra tai, kad šios sistemos yra reaguoti į, mes turime pasikalbėti,, apie daugiau pagrindinė rinkinys klausimus. Ir tai tem komunikacijos kurį mes vadiname klausimas atsakiklis. Tai reiškia, kad mes norime, kad būtų galima to-- Yeah? Auditorija: [nesigirdi]. BRIAN SCASSELLATI: Ar mes gauname į slaptas semantikos perdirbimo? Taigi taip. Yra daug dalykų, kurie yra vyksta žemiau paviršiaus su "Siri" ir kai kurie iš pavyzdžių Aš ketinu parodyti jums, šalia kur yra gana šiek tiek požiūriu struktūros ką jūs sakote, kad tai svarbu. Ir, tiesą sakant, tai puikus pirmtakas už kitą skaidrę už mane. Taigi, tuo pačiu būdu, kad mūsų kalbos atpažinimas buvo pastatyta iki iš daugelio sluoksnių, jei norime suprasti, kas tai yra, kad tikrai Cela dit, mes ketiname vėl remtis kelių sluoksnių analizė teksto, kad manimi buvo pripažinta. Taigi, kai "Siri" yra iš tikrųjų galėtų tarkim, atrodo radau šiuos žodžius. Dabar ką man su jais daryti? Pirmasis komponentas yra dažnai eiti per ir pabandyti analizuoti sakinio struktūra. Ir tai, ką mes matėme pradinėje mokykloje, dažnai kaip rūšies diagramų sakiniai, mes ketiname pripažinti, kad tam tikra žodžiai turi tam tikrų vaidmenis. Tai yra daiktavardžiai. Tai yra įvardžiai. Tai yra veiksmažodžiai. Ir mes ketiname pripažinti kad tam tikram gramatikos, šiuo atveju anglų kalbos gramatikos, yra Galioja būdų, kuriais galiu juos sujungti ir kiti būdai, kad negalioja. Šis pripažinimas, tai struktūra, gali būti pakankamai, kad padėtų vesk mus truputį. Bet tai ne visai pakankamai kad galėtume galėtų suteikti bet prasmę, kas buvo čia pasakyta. Norėdami tai padaryti, mes turime remtis kai semantinio apdorojimo suma. Tai reiškia, kad mes ketiname pažvelgti ne po tai, ką kiekvienas iš šių žodžių faktiškai vykdo kaip apibrėžta. Ir paprasčiausias būdas tai padaryti, mes ketiname bendrauti su kiekvieno žodžio kad mes žinome tam tikrą funkciją, tam tikra transformacija, kad jį leidžia įvykti. Tokiu atveju, mes galime etiketėje Žodis "jonas" kaip tikrinis vardas, kad ji vykdo su juo tapatybės. Ir mes galime pažymėti "Mary", kaip tuo pačiu būdu. Kadangi, kaip "myli", veiksmažodis, kad yra ypač santykius kad mes galime atstovauti. Dabar, tai nereiškia, kad mes suprantame, kas yra meilė, bet tik tai, kad mes suprantame, jį į simbolinę sistemą būdas. Tai yra, galime pažymėti IT ir manipuliuoti. Su kiekvienu iš šių metodų tipų, bet semantinio apdorojimo tipas čia ketina reikalauti šiek tiek tiek žinių ir daug darbo mūsų pusės. Mes nebėra sferos kur tiesiog statistika ketinate būti pakankamai už mus. Dabar, norint eiti iš šio taško iki yra galės kalbėtis apie viduje kas iš tikrųjų vyksta čia, , kad galėtų manipuliuoti tai susisteminti ir suprasti klausimą ir tada galėtų išeiti ir ieškoti, kad reikia daugiau sudėtinga pažinimo modelis. Būdas, kuriuo yra pastatytas šios sistemos yra, kad didžioji dalis labai, labai darbo intensyvus. Jie įtraukti žmones išleisti daug laiko struktūrizavimo į būdus kurios šie sakiniai rūšių gali būti atstovaujama kai logika. Ji gauna net šiek tiek sudėtingesnis, nors. Net kai mes nagrinėjami su semantika, mes vis dar turi pažvelgti į pragmatika, kas buvo pasakyta. Tai yra, kaip man susieti žodžius kad aš turiu kažką fiziškai atlikti ten pasaulyje arba jau kai informacijos šaltinis kad aš galiu manipuliuoti? Kartais šie sukelti nuostabūs bitai dviprasmiškumo. "Karštas žvaigždė Treč astronomas." GERAI. Dabar mes skaitome, kad, kaip juokinga tipo antraštę kad mes pamatyti vėlyvo vakaro TV nes mes neturime interpretuoti "žvaigždė" turėti savo dangaus kūnas prasmę. Mes žinome, kad tai reiškia, kad daugiau įprastas aktorius ar aktorė su dideliu kiekiu matomumą. "Būrys padeda Šuo Bitė auka." Ar tai, kad būrys yra iš tikrųjų ten padėti šunį į vyksta aplink ir kramtymas aukoms? Ar tai, kad buvo fizinis asmuo, kuris buvo įkando šuo, kuriems reikėjo pagalbos? Tiesiog iš žiūri į sintaksę Ir sakinių semantika, mes negalime nustatyti, kad. "Sraigtasparnis powered by žmogaus musės". Ar, iš tiesų, faktinis smulkmenos plaukioja aplink, kad Yra žmonių, su sparnais maitinimui Sraigtasparniai už žmonijos labui? Ar yra vienas mechaninis įtaisas kad gauna savo galią iš asmens? Kai mes žiūrime į klausimą atsakiklių sistemos, tai yra, kad sluoksniai turime spręsti. Dabar geriausias ir labiausiai rūšiuoti iš paplitusi iš šių sistemų šiandien galime daryti viskas iki tokio lygio, kad yra toli už ką turėjome prieš 10 metų. Štai vienas iš geriausių sistemų tai ten šiandien. Ir šis yra sistema, iš IBM Watson vadinamas. Tai iš mūsų draugais IBM. Tai Katherine bankai Jia Chen ir Priscilla Moraes suteikiant mus iš Watson demonstracija vakar IBM Jorktaunas. [Vaizdo įrašų atkūrimas] -Kaip laikaisi? -As laikausi gerai. Aš visada esu laimingas, kai esu galvoju, ypač, kai aš gali sustabdyti atvėsti šių serverių patalpose. -Kas Yra jūsų mėgstamiausia aktorė? -My Mėgstamiausia aktorė Angelina Jolie, kaip Lara Croft Tomb Raider, nes jos originalas forma buvo kaip virtualus charakterio, kaip man. -Kaip Watsonas gali padėti pacientams? -Ar Pacientams planuoti turėti prieigą prie Watson tiesiogiai? Prieiga prie Watson patariamoji paraiškos bus skirtis priklausomai nuo naudojimo atveju. Tačiau šiuo metu, Watsonas bus pateikti tik įmanoma diagnostika ir gydymas galimybės į medicinos specialistas. Prireikus pacientai gali suteikti informacijos į Watson, galbūt per portalo žiniatinklio sąsaja, tabletė, ar net mobilųjį telefoną. Pavyzdžiui, pacientas, gali būti paprašyta apibūdinti savo simptomus Natūrali kalba tiesiogiai į Watson tirpalu, todėl gydytojas sutelkti dėmesį į diagnozė, o ne duomenų rinkimas. -Kas Nužudytas Abraomas Linkolnas? Jono numeris- Wilkes Booth. -Be Kas metus padarė Arizona Diamondbacks laimėti World Series? -2001. [PABAIGA PLAYBACK] BRIAN SCASSELLATI: Taigi Šios sistemos rūšių turi remtis visų pirma pripažįstant kalbą; antra, konvertuoti jį į prasmingą vidaus atstovavimas; ir tada, trečia, kad galėtų išeiti ir rasti informacijos šaltinis, kad leidžia jiems atsakyti į šį klausimą. Šis sudėtingumo lygis apima tie patys tipai programinių dalykų kad tapote daro probleminėse rinkinių. Mes galime išanalizuoti HTTP užklausas to paties tipo žemo lygio modelis atitikimo, kad Eliza, gali tai padaryti. Mes galime konvertuoti tuos į vidaus atstovavimo, ir tada naudoti juos užklausti kai išorės duomenų, galbūt naudojant SQL. Visi sistemų, kurios statomi šiandien tai padaryti gamtinių tipas Kalba komunikacijos statomi ant tie patys principai. Dabar, net kaip sistema Watsonas nepakanka kompleksas kad būtų galima atsakyti į savavališkas Turite klausimų apie bet kokią temą. Ir iš tikrųjų, jie turi būti struktūriškai apibrėžtoje srityje. Taigi, galite prisijungti prie interneto ir jūs galite rasti versijos Watson, kad veikia gerai per medicininės informatikos. Arba yra dar vienas internete kad tik susijusi su kaip padaryti gerų rekomendacijų apie kas alaus eisiu, su kuriuo maistas. Ir tose srityse, jis gali atsakyti į klausimus, rasti informaciją, kad ji turi. Bet jūs negalite sumaišoma ir suderinti juos. Sistema kad buvo apmokyti su maisto ir alaus duomenų bazėje neveikia gerai, kai staiga įdėti ją su medikų informatikos duomenų bazė. Taigi, net geriausi mūsų sistemos Šiandien remtis į perdirbimo lygį kurioje mes rankomis kodavimo ir pastato infrastruktūros, siekiant kad ši sistema paleisti. Dabar, paskutinis temą Noriu kad būtų galima gauti šiandien apie Neverbalinis bendravimas. Puiki masė informaciją, kuri mes bendraujame vieni su kitais neateina apie per atskiri žodžiai, kad mes taikomos. Ji turi daryti su dalykų, pavyzdžiui, artumo, žvilgsnis, balso tonas, Jūsų vingio. Ir, kad bendravimas yra taip pat kažkas, kad daug skirtingų sąsajos rūpintis daug apie. Tai ne tai, ką "Siri" rūpinasi. Gebu klausti Siri kažką vienu balsu arba kitoje balso tonas, ir "Siri" ketina duok man tą patį atsakymą. Bet tai nėra tai, ką mes statome už daug kitų rūšių sąsajų. Noriu jums pristatyti dabar į vieną iš robotų. Tai buvo pastatyta mano ilgo laiko tarpo draugas ir kolega Cynthia Breazeal ir jos kompanija Jibo. Ir tai robot-- mes ketiname turėti keletą savanorių sugalvoti bendrauti su tai. Taigi galiu turėti du žmonės nori žaisti su man robotas? Kodėl ne jūs ateiti iki, ir kodėl gi ne jums ateiti iki. Jei norite prisijungti prie manęs čia, prašau. Ir jei galėčiau jus atvyks tiesiai čia. Ačiū. Sveiki. ALFREDO: Nice to meet jums. Alfredo. BRIAN SCASSELLATI: Alfredo. RACHEL: Rachelė. BRIAN SCASSELLATI: Rachelė. Nice to meet you abu. Alfredo, aš ruošiuosi eiti pirmas. Ateik į dešinę čia. Aš ruošiuosi pristatyti you-- jei aš galiu gauti šią funkciją be barbenimas į microphone-- kad mažai robotas pavadintas Jibo. GERAI? Dabar Jibo yra skirta būti interaktyvus. Ir nors ji gali suteikti jums kalboje, daug sąveikos su roboto yra nežodinis. Alfredo, aš ruošiuosi paprašyti jūsų pasakyti kažką gražaus ir nemokami į roboto, prašau. ALFREDO: Manau, kad jums atrodo mielas. [Whirring GARSO] BRIAN SCASSELLATI: Gerai. Jo atsakymas yra ne žodinis. Ir dar jis padovanojo tau tiek aiškus pripažinimas kad jis girdėjo, ką jūs pasakėte ir kažkaip supratau, kad. GERAI? Žingsnis atgal čia vieną sekundę. Ačiū. Rachelė, jei būtų. Dabar aš ruošiuosi duoti Jums daug sunkiau darbas. Jei norite išsiskirti čia, atsargines truputį taip mes galime jums kamerą ir surasti šiuo būdu. Aš ruošiuosi paprašyti jus ką nors pasakyti iš tikrųjų reiškia ir bjaurus į roboto. RACHEL: Ką jūs tiesiog atrodė padaryti buvo visiškai absurdiška. [Dūzgiantis GARSO] Tai buvo dar labiau absurdiška. Kas vyksta su jumis? Aw, nesijaučia blogai. Aš duosiu jums apkabinti. BRIAN SCASSELLATI: Visos dešinę. Ačiū, Rachelė. Alfredo Rachelė, AČIŪ vaikinai labai daug. [Plojimai] Taigi ši sąveika rūšis turi ir daug būdų keletas tų pačių taisyklių ir kai kurie iš tos pačios struktūra, ką mes gali turėti kalbinę sąveika. Tai tiek bendravimo ir tarnauja svarbų tikslą. Ir tai sąveika, į daug būdų, skirta turėti ypatingą efektą ant asmuo bendrauja su ar klausytis į roboto. Dabar, aš laimė turėti Jibo čia šiandien. Sam Spaulding yra čia padėti mus su robotu. Ir aš ruošiuosi paprašyti Sam duoti mus viena graži demo Jibo šokių kad mes galime žiūrėti pabaigoje čia. Taigi pirmyn, Jibo. SAM: Gerai, Jibo. Parodyk mums savo šokio judesiais. [Muzikos grojimo] BRIAN SCASSELLATI: Gerai, visi. Dėka mūsų draugai Jibo. [Plojimai] Dėka mūsų draugais IBM padedant atlikti šiandien. Bendravimas yra kažkas kad jūs ketinate pamatyti artėja vis daugiau ir daugiau kaip statome daugiau sudėtingų sąsajų. Kitą savaitę, mes kalbėti apie tai, kaip sąsaja su kompiuterių oponentų žaidimus. Tačiau, jei turite klausimų apie tai, Aš būsiu aplink ne darbo valandomis vakarą. Aš laimingas su jumis pasikalbėti apie AI temų arba patekti į išsamiau. Gero savaitgalio. [Plojimai] [Muzikos grojimo]