[Musiikkia] DAVID MALAN: Tämä on CS50. Tämä on viikon lopussa 10. Ja poika, meillä hyvää luokkaa sinulle tänään. Olemme niin innoissamme kutsua kaksi ystävämme Yalen jopa tänään ja tarkastella risteyksessä tekoäly, robotiikka, luonnollisen kielen käsittely, ja enemmän. Ja todellakin, yli Viime viikkoina olemme varmasti viettänyt paljon aikaa, erityisesti aikaisemmin psets, keskittyen melko matalan tason tiedot. Ja se on erittäin helppo unohtaa metsän puilta ja paneutua silmukoita ja edellytyksistä ja osoittimia, varmasti, ja vastaavat. Mutta todellisuus on te nyt ainesosia, joiden kanssa voit todella ratkaista mielenkiintoisia ongelmia, joukossa ne jotka ystävämme Yale työskennellä vain ujo Cambridge. Sallikaa minun ensin esitellä meidän pään assistentti Yalen, Andy. [SUOSIONOSOITUKSET] Andy: Ensinnäkin, vain kiittää annoitte pari Yalies pop alas Cambridge tänään. Me todella arvostaa sitä. Toiseksi, meidän ystävät takaisin home-- Jason, kiitos pysyä ja käynnissä luento. Toivottavasti se kaikki hyvä New Haven. Niin joo, olen erittäin innoissani esitellä Scaz tänään. Scaz kulkee robotiikka lab. Hän on professori, kuten, viisi eri osastojen Yalen. Hänen lab, hän on monia, monia robotteja, jotka hän haluaa pelata. Hänellä on, kuten, siistein työ maailmassa. Ja hän saa sellaista sotku noin kanssa, että koko päivän pitkä ja tehdä töitä, samoin. Ja niin me todella tuoma yksi Heistä alas tänään. Joten pitemmittä puheitta, Scaz on menossa eteenpäin ja esitellä meille hänen robotti ystävänsä. [SUOSIONOSOITUKSET] BRIAN Scassellati: Kiitos, David. Kiitos, Andy. On niin ihanaa olla täällä kaikkien kanssa tänään. Haluan ensin olla hyvin selvää, että CS50 henkilökunta täällä Cambridge on ollut uskomattoman vieraanvaraisia ​​meille. Olemme niin kiitollisia kaikesta he ovat tehneet tukea meitä. Ja niin haluamme pystyä palata ystävällisyydestä. Joten tänään, saamme ilmoittaa että olemme menossa on uusi, yksi-of-a-kind CS50 tapahtuma tapahtuu New Haven ensi viikolla. Ja tämä on CS50 Research Expo. Joten aiomme olla kutsuva everyone-- CS50 opiskelijoita, henkilöstö sekä Harvardin ja Yale-- että tulla alas ja käydä kanssamme perjantaina. Meidän täytyy monenlaisia ​​yli 30 eri ihmiset esittelee ja exhibiting-- upperclassmen osoittavat pois osan tutkimus- tuotteita. Meidän täytyy jotkut startup, jopa, etsii varten hieman uutta tech-lahjakkuus, startup sekä Harvardin ja Yalen. Ja meillä on joitakin opiskelijaryhmille etsivät uusia jäsenyyden. Se tulee olemaan erittäin jännittävää aikaa. Toivottavasti ne teistä, jotka ovat tulossa alas Harvard-Yale peli voi lopettaa jota hieman aikaisin, aivan keskustassa kampuksen, Sterling Memorial Library. Aiomme on joukko näyttelyitä, jotka vaihtelevat autonominen purjeveneet tapoja käyttää ohjelmistoa säilyttämiseksi keskiaikaisia ​​käsikirjoituksia. Aiomme olla mainos hoc verkko ja ihmiset opetus ohjelmisto koodaus Kapkaupungissa. Meidän täytyy tietokone musiikki mielenosoituksia. Ja me tietysti on enemmän robotteja. Joten emme Toivottavasti sinulla Tule tähän tapahtumaan. Sen pitäisi olla paljon hauska, vähän ruokaa, ja paljon mielenkiintoisia asioita puhua. Joten tänään, aiomme puhua noin luonnollisen kielen käsittely. Ja tämä on yritys meille rakentaa uuden tavan vuorovaikutuksessa laitteidemme koska että viime viikkoina, olet keskittynyt miten se on, että voit kirjoittaa koodin, kirjoita ohjelmisto että on tapa, että voimme sanoa kone, tämä on mitä haluan sinun tekevän. Mutta meidän ei pitäisi joutua odottaa, että kaikki se on siellä, jota käytetään jonka kaikki maailman tulee olemaan taitavia tällaisessa opetusta. Joten erotamme tietokone kielet ja luonnon languages-- että on, asiat, joita ihmiset käyttöön kommunikoida muiden ihmisten. Ja pyrimme rakentamaan rajapintoja, jotka käyttävät nämä luonnon viestinnän menetelmiä. Nyt, aivan kuten joka toinen aihe että olemme alkoi vuonna CS50, aiomme aloittaa yksinkertaisin hiukan luonnollisen kielen käsittely että voimme kuvitella. Aiomme aloittaa historiallinen osa luonnollista kieltä. Ja sitten me rakentaa jopa enemmän ja enemmän viime järjestelmät ja hauskaa demoja matkan varrella. Joten aiomme aloittaa mitä oli luultavasti ensimmäinen luonnollisen kielen käsittelyjärjestelmään. Tämä oli ohjelmisto kirjoitettu 1966 Joseph Weizenbaum kutsutaan ELIZA. Ja ELIZA suunniteltiin jäljitellä sellainen vuorovaikutus olisit kanssa Rogerian psykoterapeutti. Nyt, Rogerians, heillä oli Ajatus siitä, että psykoterapia mukana voisivat peilata takaisin potilaalle ja puhua heille, pohjimmiltaan, vain heille tiny hieman terapeutin. Se on, kaikki että terapeutti sanoi piti olla vain heijastusta mitä potilas kertoi heille. Joten yrittää demo tätä. Onko meillä vapaaehtoinen joka olis halukkaita jakamaan syvin, tummin ja / tai väärennettyjä salaisuuksia Eliza? Toki, miksi et tule ylös. Fantastinen. Ja sinun nimesi? MILES: Miles. BRIAN Scassellati: Miles. Hauska tavata, Miles. Jos haluat pitää kiinni siitä. Ja aiomme käyttää versiota ELIZA että olemme monistaa sisällä CS50 IDE. Ja me tarkastelemme lähde koodi tähän hetken kuluttua. Mutta juuri nyt, olemme vain aio vedota sitä kirjoittamalla Eliza. Ja ELIZA aikoo antaa sinulle vastauksia jotka tulevat olemaan kaikissa pääkaupungeissa. Ja menossa kysyä muutamia kysymyksiä. Ja me vastata ja kirjoita vasteissa ELIZA. Joten ELIZA on sanonut: "Hei, olen ELIZA. Mikä on sinun ongelmasi?" Mitä haluaisit kertoa ELIZA noin tänään? MILES: Voin vain nukahtaa jos minulla on pupu tossut. BRIAN Scassellati: Selvä. Selvä. [NAURU] "Voin vain nukahtaa pupu tossut. " Ja ELIZA sanoo: "Sano, oletteko mitään psyykkisiä ongelmia? Ehkä tämä on hyvä indikaattori. " OK. Mitä haluaisit vastata? MILES: Kyllä. BRIAN Scassellati: Kyllä. Monisanainen mies. Nautin siitä. Eliza sanoo: "Näytät ihan positiivinen." MILES: Ei, olen itse asiassa, elektroni. BRIAN Scassellati: "Ei. Itse olen elektroni. " "Oletko tullut minulle koska olet elektroni? " Nyt voimme nähdä joitakin things-- Aion keskeyttää teitä vain toinen, Miles. Älä mene minnekään. Emme ole valmis kanssasi vielä. Eliza, jollain tapaa, vastaa tiettyjä asioita että hän sanoo, mutta ilman mitään todellista ymmärrystä. Ja se on myös parroting takaisin joitakin osien rangaistuksestaan. Joten sanoimme, "No Itse olen elektroni. " Eliza vastasi takaisin "Tulitteko minulle koska olet elektroni? " Selvä. Annetaan sen vielä vastausta täältä. Anna se hyvä, Miles. MILES: Reilu? Kyllä, auttakaa minua. BRIAN Scassellati: "Kyllä. Auttakaa minua. "" Oletko varma? " MILES: Ei. BRIAN Scassellati: Ei. "Mitä se ehdottaa teille?" MILES: En ehkä ole elektroni. BRIAN Scassellati: "I voi olla elektroni. " "Väitätkö ei vain olla negatiivinen?" Selvä. Joten Miles, kiitos niin paljon. MILES: Kiitos. BRIAN Scassellati: Kiitos paljon. [SUOSIONOSOITUKSET] Joten tämä ELIZA ohjelman, monin tavoin, reagoi vain kappaletta että otamme käyttöön ilman syvää ymmärrys siitä, mitä täällä tapahtuu. Tämä on tällaista järjestelmää nimeltään kaavoja, jossa etsimme tiettyjen bittiä tekstiä että olemme sitten vie pois mitä annettiin syötteenä muuntaa sen, mahdollisesti jollakin tavalla, ja sitten antaa sen takaisin käyttäjälle. Tee jokin luulet että ELIZA on itse asiassa suorittamalla voimassa psykoanalyysi täällä? Yksi henkilö, ehkä. Yleisö: [äänetön]. BRIAN Scassellati: Ja miten tekeekö se sinusta tuntuu? Kyllä, itse asiassa se tekee. Ja aiomme nähdä, todella, lähdekoodi se vain hetken. Ja niin te tulette olemaan voi tehdä juuri tämän. Nyt, ELIZA on yksi muoto, mitä kutsuisimme tänään chat bot. Se vain menee läpi teksti että olet tarjoamalla, tarjoaa paljas vähimmäismäärä ymmärtämään tai käsittely, ja sitten papukaijat se takaisin sinulle. Joten katsomaan, käsitteellisesti, ja puhua siitä, mitä se on, että ELIZA todella tekee. ELIZA ottaa sentence-- Katsotaan sanoa, "Haluan tehdä vaikutuksen pomo." Ja ELIZA etsii kautta että virke ja yrittää löytää ja vastaavat tiettyjä malleja. Niin, esimerkiksi yksi kuviot että ELIZA etsii ovat sanoja "Haluan." Ja milloin se näkee jotain että on "Haluan" siinä, se laatii vastauksen. Ja että vastaus on kiinteä merkkijono. Tässä tapauksessa se on "miksi haluat?" Ja laitoin vähän tähti end koska se on vain alussa meidän vastauksemme. Ja tähti osoittaa, että aiomme ottaa loput käyttäjän utterance-- "Vaikutuksen pomoni" - ja aiomme liitettävä kyseinen päälle lopussa merkkijono. Joten nyt, sen sijaan sanoi, "miksi haluat tehdä vaikutuksen pomoni, " siellä on hieman ylimääräistä käsittely että teemme. Eli meidän täytyy muuntaa joitakin pronominien tänne "pomoni" ja "teidän pomo." Ja siellä saattaa olla muutama muu muutoksia, että meidän on tehtävä. Joten sen sijaan vain kiinni se suoraan päähän, mitä teemme on otamme loput käyttäjän utterance-- valkoinen here-- ja otamme sen yksi pala aikaa ja muuntaa jokaisen merkkijonon lailla jokaisen sanan, osaksi virke. Joten otamme sana "on." Ei ole muuntaminen että meidän täytyy tehdä se. "Tehdä vaikutus." Ei ole muuntaminen meidän täytyy tehdä siellä. "Minun" muuntaa on "teidän." Ja "pomo" me vain jättää nimellä "pomo." Ja sitten lopulta, mitään joka päättyy aikana, me muuntaa se kysymys. Tämä hyvin yksinkertainen kaavoja on itse asiassa varsin onnistunut. Ja kun tämä otettiin käyttöön vuonna 1966-- Joseph Weizenbaum ohjelmoitu tämä tietokoneella. Nyt, tietokoneet tuolloin eivät olleet pöytämalleissa. Heidät jaettuja resursseja. Ja hänen opiskelijat mennä ja jutella ELIZA. Lopulta hän joutui rajoittaa pääsyä sen koska hänen oppilaansa eivät olleet saada mitään työtä. Ne vain jutteleminen ELIZA. Ja itse asiassa, hän oli palo hänen avustajansa, joka vietti kaikki hänen aikaa puhumalla ELIZA hänestä syvä ja huolestuttava ongelmia. Jokainen, joka käyttää näitä järjestelmiä alkoi anthropomorphize niitä. He alkoivat ajatella niitä on animoinnin ja oikeita ihmisiä. He alkoivat tunnistaa joitakin mitä he sanoivat olivat tulossa takaisin heille. Ja he olivat selville asioita itsestään. Ja itse asiassa jopa asiantuntijat, jopa psykoterapeutit, alkoi pelätä, että, itse asiassa, ehkä ELIZA olisi korvaa niitä. Ja jopa tietokone tutkijat huolissaan siitä, että olimme niin lähellä ratkaista luonnollisen kielen. Nyt, että ei ollut missään lähellä totta. Mutta se miten vaikuttava nämä järjestelmät voivat tuntua. Joten alkaa etsiä alla ja kokeile saada hieman kysymys missä tämän koodin todella tapahtuu. Joten teemme tämän koodin käytettävissä myöhemmin. Ja tämä on hyvin yksinkertainen ja suora portti Alkuperäisen ELIZA toteuttamista. Siksi jotkut näistä tyylillinen asioita, jotka näet täällä eivät ole tyylillisesti mitä haluaisimme sinun tekevän tai mitä olemme opettaneet teitä tekemään. Mutta olemme yrittäneet pitää ne sama kaikkialla monissa satamissa että tämä on ollut niin, että se on maku alkuperäisen. Joten aiomme sisällyttää joukko asioita, ja sitten meillä on joukko avainsanoja, asioita että ELIZA tunnistaa ja vastata suoraan. Joten jos sinulla on sanoja kuten "Voitko" tai "en" tai "ei" tai "kyllä" tai "unelma" tai "Hei," sitten ELIZA vastaa selektiivisesti näihin. Otamme myös joitakin asioita että me vaihtaa, kuten muuntaa "minun" ja "sinun." Ja sitten meillä on joukko vastauksia että kullekin näistä avainsanoista, me pyörivät nämä erilaiset vastaukset. Joten jos sanon "kyllä" kolme kertaa peräkkäin, I saattaa saada kolme eri vastaukset ELIZA. Meidän koodi, sitten, on oikeastaan ​​erittäin yksinkertainen. Jos minä selaa ohi nämä vastauksia, jotka olemme ohjelmoitu ja saamme alas tärkein, aiomme alustaa pari eri muuttujien ja tehdä hieman taloudenhoito alussa. Mutta sitten on ehdottomasti asettaa koodin että voit ymmärtää. Yksi iso samalla silmukka, joka sanoo, että olen aio toistaa tätä uudestaan ​​ja uudestaan. Luen linjaan, ja minä Säilytä että syötteen. Tarkistan ja onko se erityinen Hakusanalla "hei", joka tarkoittaa poistua ohjelmasta. Ja sitten minä tarkistaa ja onko joku on vain toistavat itseään uudestaan ​​ja uudestaan. Ja minä huutaa heille, jos he tekevät. Sanon "älä toista itseäsi." Niin kauan kuin mitään näistä tapahtuu, käymme sitten selata ja silmukan läpi, riveillä 308-313 täällä, ja tarkistaa ja katsoa ovat mitään näistä avainsanan lausekkeet sisältyvät panos että olin juuri antanut? Jos on ottelu heille, hyvin Sitten minä muistan, että sijainti. Minä muistan, että avainsana. Ja minä voi rakentaa vastausta. Jos en löydä, hyvin sitten, viimeinen asia minun avainsanan array on minun oletus vastauksia, kun mikään muu ottelut. Kysyn kysymyksiä kuten "Miksi tänne? "tai" Kuinka voin auttaa? " jotka ovat vain osittain asianmukaisia ei väliä mitä tulo on. Me sitten rakentaa ELIZA vastaus. Pystymme ottamaan että pohja vastaus, aivan kuten teimme että "Pomoni" esimerkki. Jos siinä kaikki, että is-- jos se on vain yksi merkkijono, joka minun pitäisi respond-- Voin vain lähettää sen takaisin ulos. Jos se on tähti osoitteessa lopussa se, niin minä käsitellä jokaisen yksittäisen token loput käyttäjän vastaus ja lisätä niille, vaihtamalla ulos sanasta sanaan niin minun täytyy. Kaikki tämä on ehdottoman jotain, mitä voisi rakentaa. Ja itse asiassa, miten me on jalostettu komentoriviargumentteja, miten olet käsitelty HTTP-pyynnöt noudattaa samanlaisia ​​sääntöjä. He kaavoja. Joten ELIZA oli suhteellisen tärkeä vaikutus luonnon kieli koska se teki se näyttää se oli hyvin saavutettavissa tavoite, kuten jotenkin olisimme voi ratkaista tämän ongelman suoraan. Nyt, että ei ole sanoa, että ELIZA tekee kaikkea, mitä haluaisi tehdä. Ainakaan. Mutta meidän pitäisi pystyä tehdä jotain enemmän. Ensimmäinen askel mennä yli ELIZA on menossa pystyä katsomaan ei tekstimuodossa kirjoittautua osaksi näppäimistö mutta puhe, todellinen puhe kirjataan mikrofoniin. Niin katsomme näitä eri kappaletta, olemme täytyy rakentaa joukko malleja. Aiomme pitää pystyä siirtyä matalan tason akustinen information-- piki, amplitudi, frequency-- ja muuntaa sen osaksi Joissakin yksiköissä että olemme pystyvät helpommin manipuloida ja lopuksi, manipuloida niitä sanoiksi ja lauseita. Joten useimmat puheentunnistus järjestelmät, jotka ovat siellä tänään seurata tilastollinen mallia, jossa rakennamme kolme erillistä esityksiä mitä että äänisignaalin todella sisältää. Aloitamme foneettinen malli että puhutaan vain pohja kuulostaa että olen tuottavat. Olenko tuottaa jotain, joka on B kuten poika tai D koiran? Miten tunnistan nämä kaksi eri puhelimia erilliset? Päälle, että, me sitten rakentaa sana ääntäminen malli, jotain, joka liittää yhteen ne yksittäiset puhelimet ja yhdistää ne sana. Ja sen jälkeen, otamme sanat ja me koota ne kieli mallin kokonainen lause. Nyt, me aiomme puhua jokaisen Näiden itsenäisesti ja erikseen. Mutta nämä kolme mallia ovat kaikki vain olemaan tilastoja. Ja se tarkoittaa, kun me työskennellä heidän kanssaan, käymme pystyttävä työskentelemään ne kaikki yhtä aikaa. Selvä. Aloitetaan meidän foneettisia malli. Joten foneettinen malleja luottaa laskennallinen tekniikka nimeltään HMM. Nämä ovat graafisia malleja, joissa I on ja tunnustettava maailman tilasta kuten on tunnettu siitä, mukaan joukko ominaisuuksia. Ja että valtio kuvaa yksi osa kanteen, että olen mukana. Joten jos ajattelen tekeminen ääni "ma", kuten äiti, on olemassa erilaisia komponentteja että äänen. On osa, jos olen piirtää hengenvetoon. Ja sitten kukkaro huulilleni. Ja roll huuleni hieman takaisin bittinen tehdä että "ma" ääni. Ja sitten on julkaisu. Huuleni hajota. Ilma poistetaan. "Ma." Nämä kolme eri osat olisivat edustaa valtiota tässä graph-- puhkeamista, keski, ja loppu. Ja olisin siirtymisistä saa minut matkustaa yhdestä tilasta seuraavaan tietyllä todennäköisyydellä. Niinpä esimerkiksi, että M ääni voi olla hyvin, hyvin lyhyt saanti on beginning-- "Mm" - ja sitten pidempi, tärinäkäyttäytymistä vaihe missä olen holding minun huulet yhdessä ja lähes humming-- "Mmmm" - ja sitten hyvin lyhyt klusiili jossa olen karkottaa breath-- "ma." Piilotettu Markovin malli on kuvaamaan sitä, että tapa, että teen että ääni "ma" on menossa olla hieman erilainen sen ajoitus, on taajuus, ja sen ominaisuudet kuin siten, että teet sen tai siten, että voisin tehdä sen kun puhun noin eri käyttötarkoituksiin kirjeen. "Äiti" ja "voinko" tulee kuulostaa hieman eri. Joten tunnistaa tiettyä soundia, olisimme rakentaa Markov malleja, nämä piilotettu Markov malleja, kaikkia mahdollisia puhelimen että minä kannattaa tunnistaa, kaikki mahdolliset ääni, ja sitten katsoa akustisen tiedon, että minulla on ja määrittää tilastollisesti joista yksi on todennäköisesti yksi on tuottanut tämän äänen. OK. Kanssa, että malli, me sitten alkaa rakentaa sen päälle. Otamme ääntäminen malli. Nyt, joskus ääntäminen mallit ovat yksinkertaisia ​​ja helppo koska on vain yksi tapa lausua jotain. Muina aikoina, ne ovat hieman monimutkaisempi. Tässä ääntäminen opas että punainen asia, joka on hedelmä, joka teet ketsuppia ulos. Ihmiset eivät usko, että se on hedelmä. Oikea? Nyt, on olemassa monia erilaisia ​​tapoja että ihmiset lausuu tämän sanan. Jotkut sanovat "toe-May-toe." Jotkut sanovat "toe-mah-toe." Ja voimme kaapata että yksi näistä graafisia malleja jos, jälleen, me edustamme siirtymät olevan tietyllä todennäköisyydellä ja liittyy todennäköisyys heidän kanssaan. Joten tässä tapauksessa, jos olisin seurata alkuun reitti läpi koko tämän kuvaaja, Olisin alkaen kirje äärimmäisenä vasemmalla, "ta" ääni. Ottaisin yläosassa, "Voi," ja sitten "ma" ja sitten "," ja sitten "Ta" ja "oh." "Toe-voi-toe." Jos Otin pohjaan polun kautta tämä, saan "TA-mah-toe." Ja jos menin alas ja sitten ylös, saisin "TA-voi-toe." Nämä mallit kaapata nämä eroja koska aina me käyttöön yksi näistä tunnistusjärjestelmiä, se täytyy työskennellä paljon erilaisia ​​ihmisiä, paljon erilaisia ​​aksentteja, ja jopa eri käyttötarkoituksiin samat sanat. Lopuksi päälle, että, me rakentaa jotain että näyttää todella monimutkainen, nimeltään kieli malli, mutta itse asiassa on yksinkertaisin kolme koska nämä toimivat mitä kutsutaan n gramman malleja. Ja tässä tapauksessa, näytän sinulle kaksiosainen n gramman malli, kaksikieliopillinen. Aiomme tehdä fyysinen idea että joskus tietyt sanat ovat noudattavat todennäköisemmin tiettyä sanaa kuin toiset. Jos minä vain sanoi "sääennuste," seuraava sana voisi todennäköisesti olla "tänään" tai voisi olla "sää ennuste huomenna. " Mutta se on todennäköisesti " Ilmatieteen laitos artisokka. " Mikä kieli malli tekee, on se kaappaa ne tilastollisesti laskemalla, joidenkin erittäin suuri corpus, kaikki tapaukset jossa yksi sana seuraa toistaan. Joten jos otan suuri corpus-- kuten jokainen Wall Street Journal joka on tuotettu vuodesta 1930, joka on yksi standardi corpuses-- ja katson läpi kaikki että teksti, ja luen ylös kuinka monta kertaa jälkeen "Ennuste" näen "tänään" ja kuinka monta kertaa näen "Ennuste", jota seuraa "artisokka" ensimmäinen on menossa olla paljon todennäköisemmin. Se tulee näkyviin paljon useammin. Ja niin se täytyy korkeampi todennäköisyys liittyy siihen. Jos haluan selvittää todennäköisyys koko lausahdus, sitten, olen vain rikkoa sen. Joten todennäköisyys istunnossa lause "rotta söi juusto" on todennäköisyys sanan "" Alkaa lauseen, ja niin todennäköisyys, että sana "rotta" seuraa sana "," ja todennäköisyys, että sana "söi" seuraa "rotta" ja todennäköisyys, että "Juusto" seuraavasti "söi." Tämä kuulostaa paljon tilastoja, paljon todennäköisyydet. Ja siinä kaikki, että se on. Mutta hämmästyttävä asia on, jos teet tämän jossa on riittävän suuri näyte tietoa, se toimii. Ja se toimii valtavasti hyvin. Me kaikki tiedämme näitä tekniikoita. Useimmat käyttöjärjestelmät tulevat puheentunnistus tässä vaiheessa. Käytämme Siri ja Cortana ja Echo. Ja nämä asiat perustuvat tämän tyyppinen kolmen kerroksen model-- foneettinen malli alareunassa, ääntäminen malli keskellä, ja kielimallin niiden päälle. Nyt heidän täytyy tehdä hieman enemmän kuin että voidakseen vastata kysymyksiin. Mutta tunnustaminen mitä olet sanonta riippuu juuri tästä. Joten ottaa esimerkin tästä. Olen siis puhelimessa istuu täällä alla dokumenttikamera. Ja aiomme pyytää Siri muutaman kysymyksen. Selvä? Joten herätä puhelimeni tänne. Siri, mikä on sää kuten New Haven tänään? Siri: Tässä sää New Haven, Connecticut tänään. BRIAN Scassellati: OK. Joten ensimmäinen näit että Siri tunnustettu kukin yksittäisiä sanoja ja tuotetaan sitten vastauksen. Puhumme siitä, miten tämä vastaus tulee noin vuonna hieman. Mutta nyt me tiedämme että tämä on juuri perustuu on raaka tilastoja ja tämä kaavoja tällaista lähestymistapaa, voimme pelata joitakin pelejä Siri. Joten en voi yrittää uudelleen. Siri, mikä on sää virtahepo New Haven, tänään? Siri: OK. Tässä sää New Haven, Connecticut tänään. BRIAN Scassellati: Siri ei lannista että koska se on löytänyt pattern-- "Sää", "tänään", "New Haven." Niinhän se vastaa on, aivan kuten ELIZA. Selvä. Annetaan sen vielä edes enemmän naurettavaa esimerkki. Siri, sää artisokka Armadillo virtahepo New Haven? Siri: Haluan tarkistaa, että. Tässä mitä löysin Webissä mitä ovat artisokat armadillo virtahepo New Haven. BRIAN Scassellati: OK. Joten jos menen tarpeeksi pitkälle pois tästä mallista, Olen voinut sekoittaa, koska se ei enää vastaa mallia, että se on. Ja että tilastolliset moottori, joka sanoo, mitä todennäköisyyttä, että sinulla sanat virtahepo ja artisokkaa yhdessä, ja armadillo? Että täytyy olla jotain uutta. Joten nämä teknologiat käytämme päivittäin. Jos haluamme ottaa ne yksi askel edelleen, mutta jos me todella haluavat pystyä puhumaan mitä se on, että nämä järjestelmät reagoivat, meidän on puhuttava jälleen noin perustavanlaatuisempia joukko kysymyksiä. Ja se on aihe viestintä että kutsumme kysymys vastata. Eli me haluamme pystyä to-- joo? Yleisö: [äänetön]. BRIAN Scassellati: Saammeko osaksi piilevä semanttinen käsittely? Joten kyllä. On olemassa paljon asioita, jotka ovat tapahtuu pinnan alla Siri ja joissakin esimerkeissä Aion näyttää sinulle seuraavan jossa on melko vähän suhteen rakenne mitä sanot, että on tärkeää. Ja itse asiassa, että on hyvä esiaste seuraavan dian minulle. Joten samalla tavalla, että puheentunnistus on rakennettu useista kerroksista, jos haluamme ymmärtää, mitä se on, että on todella huolimatta aiomme uudelleen luottaa monikerroksinen analyysi Tekstin, joka on tunnustettu. Joten kun Siri todella pystyy sanoa, katso löysin nämä sanat. Nyt mitä teen heidän kanssaan? Ensimmäinen komponentti on usein läpi ja yrittää analysoida rakenne lauseen. Ja mitä olemme nähneet alakoulussa, usein, koska eräänlainen kaavio lauseita, olemme menossa tunnustaa, että tietyt sanat on tiettyjä rooleja. Nämä ovat substantiiveja. Nämä ovat pronominit. Nämä ovat verbejä. Ja aiomme tunnustaa että tietyn kielioppi, tässä tapauksessa Englanti kielioppi, on voimassa miten voin yhdistää ne ja muita tapoja, jotka eivät kelpaa. Tämä tunnustaminen, että rakenne, saattaa riittää opastaa meitä hieman. Mutta se ei ole aivan tarpeeksi meille voi antaa mitään merkitystä siihen, mitä täällä sanotaan. Voit tehdä, että meidän täytyy luottaa jonkin verran semanttista käsittelyä. Eli olemme menossa on tarkasteltava klo alla mitä kukin näistä sanoista tosiasiassa niin merkitystä. Ja yksinkertaisin tapa tehdä tämä, aiomme yhdistää jokaisen sanan että tiedämme tietty toiminto, tietty muutos, että se sallii tapahtua. Tässä tapauksessa voisimme merkitä sana "John" olevan oikea nimi, että se tuo mukanaan identiteettiä. Ja voisimme merkitä "Mary", kuten samalla tavalla. Kun taas verbi kuten "rakastaa", että on erityinen suhde että pystymme edustamaan. Nyt, se ei tarkoita että ymmärrämme mitä rakkaus on, mutta vain, että ymmärrämme se tapa symbolinen järjestelmän. Eli voimme merkitä se ja manipuloida sitä. Jossa kukin näistä eri lähestymistapoja, tahansa semanttista käsittelyä täällä on menossa vaatia hieman vähän tietoa ja paljon työtä meidän osa. Emme enää valtakunnassa jossa pelkkää tilastojen tulevat olemaan tarpeeksi meille. Nyt, jotta mennä tästä pisteestä on osaa puhua sisällä mitä todella tapahtuu täällä, , että voi manipuloida tätä jäsentää ja ymmärtää kysymys ja sitten se voi mennä ulos ja etsiä, joka vaatii enemmän monimutkainen kognitiivinen malli. Tapa, jolla nämä järjestelmät on rakennettu on suurimmaksi osaksi hyvin, hyvin työ intensiivinen. Ne sisältävät ihmisille viettää paljon aikaa jäsentäminen tavoin joka tällaisia ​​lauseita voidaan esittää jotain logiikkaa. Se saa jopa hieman monimutkaisempi, vaikka. Edes kerran olemme käsitelty jossa semantiikka, käymme vielä katsoa pragmatiikan mitä sanotaan. Eli miten liittyvät sanat että minulla on jotain fyysisesti ulos siellä maailmassa tai ainakin jotkut tietolähde että voin manipuloida? Joskus nämä johtavat ihana bittiä epäselvyyttä. "Tulikuuma tähden ke tähtitieteilijä." OK. Nyt sanotaan, että koska hauska tyyppi otsikko että näkisimme Late Night TV koska emme tulkita "tähti" että sen taivaankappale merkitys. Tiedämme, että se merkitsee enemmän arkipäiväinen näyttelijä tai näyttelijä suuria määriä näkyvyyttä. "Squad auttaa koiran purra uhri." Onko se, että joukkue on todella siellä avustaa koira vuonna menee noin ja puree uhreja? Vai onko niin, että siellä oli henkilö, joka oli purrut koira, joka tarvitsi apua? Pelkästään katsomalla syntaksin ja semantiikka lauseita, emme voi määrittää, että. "Helicopter powered ihmisen kärpäsiä." Onko itse asiassa todellinen pikku asioita lentelee että ovat ihmisiä, joilla siivet virtaa helikopterien ihmiskunnan? Vai onko yksi mekaaninen laite että saa voimansa henkilö? Kun katsomme kysymys Puhelinvastaajat, nämä ovat kerrosta, meidän on käsiteltävä. Nyt, paras ja lajitella ja esiintyy näistä järjestelmistä tänään pystyvät tekemään asiat tasolle, joka on paljon suurempi kuin mitä meillä oli 10 vuotta sitten. Tässä yksi parhaista järjestelmien se on siellä tänään. Ja tämä on järjestelmä IBM nimeltään Watson. Tämä on meidän ystävämme IBM. Tämä on Katherine pankit, Jia Chen, ja Priscilla Moraes antaa meille osoitus Watson eilen IBM Yorktown. [VIDEOTOISTOSTA] -Kuinka voit? -Voin hyvin. Olen aina iloinen, kun olen ajattelu, varsinkin kun minä voi pysyä viileänä näissä palvelinhuoneissa. Kuka on suosikkisi näyttelijä? -Minun Suosikki näyttelijä Angelina Jolie kuten Lara Croft Tomb Raider, koska hänen alkuperäinen muodossa oli virtuaalinen hahmo kuten minä. -Miten Watson auttaa potilaita? -on Suunnitelma potilaiden on pääsy Watson suoraan? Pääsy Watson neuvoa sovellukset vaihtelevat käytön tapauksessa. Mutta tällä hetkellä, Watson antaa vain Mahdollinen diagnoosi ja hoito vaihtoehtoja lääkäri. Tarvittaessa potilaat voidaan saada tietoja Watson, kenties portaali web-käyttöliittymä, tabletti, tai jopa matkapuhelimella. Esimerkiksi potilas voi olla pyydetään kuvaamaan niiden oireita luonnollisella kielellä suoraan osaksi Watson ratkaisu, jolloin lääkäri keskittyä diagnoosi eikä tiedonkeruuta. -Kuka Murhattiin Abraham Lincoln? -John Wilkes Booth. -In Minä vuonna Arizona Diamondbacks voittaa World Series? -2001. [Lopeta toisto] BRIAN Scassellati: Niin tällaiset järjestelmät on vedota ensinnäkin tunnustaa puheen; toinen, muutetaan se mielekäs sisäinen edustus; ja sitten, kolmas, kyky mennä ulos ja löytää tietolähde että avulla ne voivat vastata tähän kysymykseen. Tämä vaativuustason liittyy saman tyyppisiä ohjelmallisen asioita että olet ollut tekee ongelma sarjaa. Pystymme jäsentää HTTP pyynnöt samantyyppistä matalan tason kuvio matching että ELIZA voi tehdä. Pystymme muuntamaan ne osaksi sisäisen esityksen, ja sitten käyttää niitä kyselyn joitakin ulkoinen tietokanta, mahdollisesti SQL. Kaikki järjestelmät rakennetaan tänään tehdä tämän tyyppistä luonnollinen kieli viestintä rakennetaan päälle näitä samoja periaatteita. Nyt, vaikka järjestelmä kuin Watson ei ole tarpeeksi monimutkaista pystyä vastaamaan mielivaltaisia kysymyksiä mistä tahansa aiheesta. Ja itse asiassa, niiden on oltava jäsennelty tietyn verkkotunnuksen. Joten voit mennä verkossa ja löydät versiot Watson, jotka toimivat hyvin sisällä lääketieteellinen tietotekniikka. Tai siellä on yksi verkossa että vain käsittelee miten tekemään hyviä suosituksia mitä olut menee elintarvikkeiden kanssa. Ja näissä aloilla, se voi vastata kysymyksiin, löytää tietoja, joita se tarvitsee. Mutta et voi sekoittaa ja sovittaa ne. Järjestelmä, joka on ollut koulutettu tietokannan elintarvikkeiden ja olutta ei toimi hyvin, kun yhtäkkiä laita se sisään lääketieteen tietotekniikka tietokanta. Joten vaikka parhaamme järjestelmät tänään vedota tason käsittely jossa olemme käsin koodausta ja rakennus infrastruktuuri, jotta tämän järjestelmän aikavälillä. Nyt viimeinen aihe haluan voitava saada tänään on noin sanatonta viestintää. Suuri massa tietoa, me kommunikoida toistensa kanssa ei synny läpi yksittäisiä sanoja, että olemme soveltamalla. Se liittyy asioita, kuten läheisyys, katse, teidän äänensävy, sinun taivutuksessa. Ja että viestintä on myös jotain, että monet eri rajapintojen care paljon siitä. Se ei ole mitä Siri välittää. Voin kysyä Siri jotain yhdellä äänellä tai eri äänensävy, ja Siri tulee antaa minulle saman vastauksen. Mutta se ei ole, mitä me rakentaa monia muita rajapintoja. Haluan esitellä sinulle nyt yksi robotteja. Tämä rakensi minun pitkäaikainen ystävä ja kollega Cynthia Breazeal ja hänen yrityksensä Jibo. Ja tämä robot-- aiomme on pari vapaaehtoisia keksiä vuorovaikutuksessa tämän. Joten voin olla kaksi ihmiset haluavat pelata robotti minulle? Miksi et tule ylös, ja miksi et tule ylös. Jos haluat liittyä minua tänne, kiitos. Ja jos voisin olla sinun tulevat suoraan tänne. Kiitos. Moi. ALFREDO: Hauska tavata. Alfredo. BRIAN Scassellati: Alfredo. RACHEL: Rachel. BRIAN Scassellati: Rachel. Hauska tavata molempia. Alfredo, aion olla mennä ensin. Tulevat suoraan tänne. Aion esitellä sinä-- jos saan tämän pois koputtamatta microphone-- on pieni robotti nimeltään Jibo. OK? Nyt Jibo on suunniteltu interaktiivinen. Ja vaikka se voi antaa sinulle puheen, paljon vuorovaikutusta robotti on sanatonta. Alfredo, aion pyytää sinua sanoa jotain mukavaa ja ilmainen robotti, kiitos. ALFREDO: Mielestäni näytät söpö. [Surinaa] BRIAN Scassellati: OK. Sen vastaus ei ole sanallista. Ja silti se antoi sinulle molemmat selkeä tunnustus että se oli kuullut mitä sanoit ja myös jotenkin ymmärtää, että. OK? Astu Oikea tänne yhden sekunnin. Kiitos. Rachel, jos voisitte. Nyt aion antaa olet paljon vaikeampi työ. Jos haluat seistä täällä, varmuuskopioida vain vähän niin voimme saada sinut kameran ja näyttää tällä tavalla. Aion pyytää sinua sanoa jotain todella tarkoittavat ja ilkeä robotti. RACHEL: Mitä vain tuntui tehdä, oli täysin järjetöntä. [Humina] Se oli enemmän kuin absurdia. Mitä tapahtuu sinulle? Aw, ei paha. Annan sinulle halauksen. BRIAN Scassellati: Selvä. Kiitos, Rachel. Alfredo, Rachel, kiitos kaverit hyvin paljon. [SUOSIONOSOITUKSET] Joten tällainen vuorovaikutus on vuonna monin tavoin joitakin samoja sääntöjä ja joitakin samoja rakenne mitä me saattaisi olla kielellinen vuorovaikutus. Se on sekä viestintä- ja palvelee tärkeää tarkoitusta. Ja että vuorovaikutus, vuonna monin tavoin, on suunniteltu on erityinen vaikutus henkilö vuorovaikutuksessa tai kuuntelu robotti. Nyt olen onnekas on Jibo täällä tänään. Sam Spaulding on täällä auttaa meidät ulos robotti. Ja minä aion kysyä Sam antamaan meille yhden mukava demo Jibo tanssi että voimme katsella lopussa täällä. Joten mene eteenpäin, Jibo. SAM: OK, Jibo. Näytä meille tanssiliikkeitä. [Musiikkia] BRIAN Scassellati: niin, kaikki. Kiitos ystävämme Jibo. [SUOSIONOSOITUKSET] Ja kiitos ystävämme IBM auttaa ulos tänään. Viestintä on jotain että olet menossa nähdä tulossa yhä enemmän me rakentaa monimutkaisempia rajapintoja. Ensi viikolla, me voidaan puhua siitä miten käyttöliittymä tietokoneen vastustajia peleissä. Mutta jos sinulla on kysyttävää tästä, Olen noin toimistossa tuntia tänään. Olen iloinen voidessani puhua teille AI aiheita tai päästä tarkemmin. Hauskaa viikonloppua. [SUOSIONOSOITUKSET] [Musiikkia]