[REPRODUCCIÓ DE MÚSICA] DAVID Malan: Aquest és CS50. Aquest és el final de la setmana 10. I el noi, ¿tenim una bona classe per a vostè avui. Estem molt emocionats de convidar a dues de els nostres amics de Yale fins a nosaltres avui i buscar a la intersecció de intel·ligència artificial, la robòtica, processament del llenguatge natural, i més. I, en efecte, sobre el últimes setmanes, hem Certament passat molt de temps, especialment en els conjunts de processadors anteriors, centrant-se en bonics detalls de baix nivell. I és molt fàcil perdre de vista del bosc pels arbres i es va penjar en bucles i condicions i punters, sens dubte, i similars. Però la realitat és que vostès tenen ara la ingredients amb què es pot realment resoldre alguns problemes interessants, entre ells els que els nostres amics de Yale treballar en tot just per sota de Cambridge. Així que permetin-me primer a introduir el cap professor ajudant de la Universitat de Yale, Andy. [Aplaudiments] ANDY: En primer lloc, simplement gràcies per permetre un parell Yalies fer esclatar baix a Cambridge en l'actualitat. Realment apreciem. En segon lloc, als nostres amics tornar casa- Jason, gràcies per estar en funcionament conferència. Espero que tot està bé a New Haven. Així que sí, estic súper emocionada introduir Scaz avui. Scaz dirigeix ​​el laboratori de robòtica. Ell és un professor de, com a, cinc diferents departaments de la Universitat de Yale. En el seu laboratori, ell té molts, molts robots que li agrada jugar amb. Ell té, com, la millor treball al món. I arriba a la classe de desastre voltant amb això tot el dia de llarg i fer algun treball, també. I així que en realitat va portar 1 d'ells cap avall amb nosaltres avui. Així que sense més preàmbuls, Scaz és seguirà endavant i presentar- al seu amic robot. [Aplaudiments] BRIAN Scassellati: Gràcies, David. Gràcies, Andy. És tan meravellós estar aquí amb tot el món en l'actualitat. Vull ser molt clar que primer el personal CS50 aquí a Cambridge ha estat molt hospitalaris amb nosaltres. Estem molt agraïts per tot el que han fet perquè ens donin suport. I així, ens agradaria poder per tornar la amabilitat. Així que avui, arribem a anunciar que tindrem una nova, un-de-una espècie d'esdeveniment CS50 passant a New Haven la setmana que ve. I aquest és el CS50 Investigació Expo. Així que estarem convidant everyone-- CS50 estudiants, el personal tant de Harvard i Yale-- a baixar i visitar amb nosaltres divendres. Tindrem una gran varietat de més de 30 persones diferents que presenten i upperclassmen exhibiting-- mostrant a alguns dels seus productes de recerca. Tindrem algunes noves empreses, fins i tot, mirant per una mica de nous talents tecnologia, noves empreses, tant de la Universitat de Harvard i Yale. I tindrem alguns grups d'estudiants buscant alguna nova composició. Serà un moment molt emocionant. Esperem que aquells de vostès que són que baixa per al partit de Harvard-Yale serà capaç d'aturar per una mica d'hora, just al centre del campus, Sterling Memorial Library. Tindrem un conjunt de exposicions que van des autònoma velers a formes d'utilitzar el programari per preservar els manuscrits medievals. Tindrem l'anunci xarxes hoc i la gent l'ensenyament de la codificació del programari a Ciutat del Cap. Tindrem equip manifestacions musicals. I anem a per descomptat tenim més robots. Així que vostè Esperem vaig uneix-t'hi per a aquest esdeveniment. Hi ha d'haver un munt de diversió, una mica de menjar, i un munt d'interessant coses que parlar. Així que avui, parlarem sobre el processament del llenguatge natural. I aquest és l'intent per nosaltres per construir una nova forma d'interactuar amb els nostres dispositius, ja des de fa unes setmanes, vostè ha estat enfocat en com és que pot escriure codi, escriure programari que és una manera de ser capaç de dir-li a un màquina, això és el que vull que facis. Però no hauríem necessitar esperar que tot això és per aquí que s'utilitza per tots en el món va ser competents en aquest tipus d'instrucció. Així distingim entre l'ordinador idiomes i Les Llengües del és a dir, les coses que els éssers humans utilitzen per comunicar-se amb altres éssers humans. I tractem de construir interfícies que utilitzen aquests mecanismes de comunicació naturals. Ara, igual que qualsevol altre tema que hem començat amb en CS50, anem a començar amb el més simple mica de processament del llenguatge natural que podem imaginar. Anem a començar amb el part històrica del llenguatge natural. I després construirem fins sistemes cada vegada més recents i tenen alguns donem diversió en el camí. Així que anem a començar amb el que era probablement el primer llenguatge natural sistema de processament. Això era un sistema de programari escrit en 1966 per Joseph Weizenbaum anomenat ELIZA. I Eliza va ser dissenyat per replicar el tipus d'interacció que tindria amb un Psicoterapeuta de Rogers. Ara, els rogerianos, tenien una idea que la psicoteràpia involucrats poder reflectir de tornada a un pacient i parlar amb ells, bàsicament, per només els dóna una miqueta del terapeuta. És a dir, tot que el terapeuta va dir se suposava que era només un reflex de el que el pacient estava dient a ells. Així que anem a tractar de Demo Aquesta. Tenim un voluntari que estaria disposats a compartir la seva més profunda, més fosques, i / o secrets falsos amb ELIZA? És clar, per què no anem cap amunt. Fantàstic. I el seu nom? MILERS: Miles. BRIAN Scassellati: Miles. Encantat de conèixer-te, Miles. Si voleu aferrar-se a això. I anem a utilitzar una versió de ELIZA que hem replicat dins de l'IDE CS50. I anem a veure la font codi per això en una estona. Però per ara, només som va invocar escrivint eliza. I Eliza es va a donar respostes que seran en totes les capitals. I vaig a fer-li algunes preguntes. I anem a respondre i tipus en les respostes a ELIZA. Així ELIZA ha dit: "Hola, sóc ELIZA. Quin és el teu problema?" Què t'agradaria dir-li ELIZA avui? MILERS: Només puc agafar el son si tinc sabatilles de conill en. BRIAN Scassellati: D'acord. Tot bé. [El] "Només puc agafar el son amb sabatilles de conill en ". I Eliza diu: "Escolta, oi tenir problemes psicològics? Potser això és un bon indicador ". D'ACORD. Llavors, ¿què li agradaria respondre? MILERS: Sí. BRIAN Scassellati: Sí. Home de moltes paraules. M'agrada això. Eliza diu: "Vostè sembla força positiu." MILERS: No, jo sóc, de fet, un electró. BRIAN Scassellati: "No. De fet, sóc un electró ". "Has vingut a mi perquè vostè és un electró? " Ara, podem veure alguns el coses-- vaig a vostè fer una pausa per un segon, Miles. No anar enlloc. No hem acabat amb tu encara. ELIZA és, en certa manera, respondre a certes coses que ell està dient, però sense cap comprensió real. I també està repetint recuperar part de les parts de la seva condemna. Així que ens va dir: "No. De fet, sóc un electró ". Eliza va respondre de tornada, "Has vingut per a mi, perquè vostè és un electró? " Tot bé. Anem a donar-li una resposta més aquí. Donar-li una bona, Miles. MILERS: Bé un? Sí, si us plau, ajudeu-me. BRIAN Scassellati: "Sí. Si us plau, ajudeu-me "." Estàs segur? " MILERS: No. BRIAN Scassellati: No. "Què suggereix per a vostè?" MILERS: Jo no pot ser un electró. BRIAN Scassellati: "Jo no pot ser un electró ". "Estàs dient que no acaba de ser negatiu?" Tot bé. Així Milers, moltes gràcies. MILERS: Gràcies. BRIAN Scassellati: Moltes gràcies. [Aplaudiments] Així que aquest programa ELIZA, en molts sentits, està responent simplement a les peces que estem oferint sense cap profunda comprensió del que està passant aquí. Aquest és un tipus de sistema de denominat coincidència de patrons, on estem buscant certa fragments de text que estem continuació va a treure del que va ser proporcionat com a entrada, convertir-lo, potencialment, d'alguna manera, i després donar-li l'esquena a l'usuari. Algun de vostès pensen ELIZA que és en realitat realitzar la psicoanàlisi vàlida aquí? A una persona, potser. AUDIÈNCIA: [inaudible]. BRIAN Scassellati: I com et fa sentir això? Sí, de fet, ho fa. I anem a veure, en realitat, la codi font perquè en un moment. I pel que seràs capaç de fer exactament això. Ara, ELIZA és una forma del que avui en diríem un bot de xat. Simplement va a través de la text que vostè està proporcionant, proporciona la suma mínim de comprensió o de processament, i després lloros de nou a vostè. Així que anem a fer una ullada, conceptualment, i parlar del que és que Eliza està fent realitat. ELIZA està prenent d'un let sentence-- dic: "Vull impressionar al meu cap." I Eliza està mirant a través d'aquesta frase, i tractant de trobar i coincidir amb certs patrons. Així, per exemple, un dels patrons ELIZA que està buscant són les paraules "Vull." I cada vegada que veu alguna cosa que té "Vull" en ella, formula una resposta. I aquesta resposta és una cadena fixa. En aquest cas, es tracta de "què és el que vols?" I vaig posar una petita estrella en al final, perquè això és només el començament de la nostra resposta. I l'estrella indica que anem a prendre la resta de utterance-- de l'usuari "per impressionar al meu cap" - i anem a afegir que a l'extrem d'aquesta cadena. Així que ara, en lloc de dir, "per què Què vols impressionar al meu cap " hi ha una mica de addicional processament que farem. És a dir, haurem de convertir alguns dels pronoms aquí des de "el meu cap" a "seu cap". I podria haver alguns altres canvis que necessitem fer. Així que en comptes de enganxant directament sobre el final, el que farem està prendrem la resta del utterance-- d'usuari en aquí-- blanc i ho prendrem una peça a un temps i convertir cada corda manera, cada paraula, en la sentència. Així que anem a prendre la paraula "per". No hi ha conversió que hem de fer això. "Impressiona". No hi ha conversió hem de fer. "El meu" es convertirà en "la seva". I "cap" només haurem de deixem com "cap". I finalment, qualsevol cosa que acaba amb un punt, ens convertirem en una pregunta. Aquesta molt simple coincidència de patrons és en realitat bastant èxit. I quan això es va introduir en 1966-- Joseph Weizenbaum programada en un equip. Ara, els ordinadors de l'època no eren models d'escriptori. Ells es van compartir recursos. I els seus estudiants ho faria anar i xerrar amb ELIZA. Finalment, va haver de restringir l'accés a la mateixa perquè els seus estudiants no estaven aconseguir qualsevol feina feta. Estaven xerrant amb ELIZA. I, de fet, va haver de acomiadar al seu ajudant, que gastat tot el seu temps parlant amb ELIZA sobre els seus problemes profunds i preocupants. Tot el que utilitza aquests sistemes començat a antropomorfitzar ells. Van començar a pensar en ells com sent animat i persones reals. Van començar a reconèixer alguns les coses que ells estaven dient van anar arribant de nou a ells. I van anar descobrint coses sobre si mateixos. I, de fet, fins i tot els experts, fins i tot els psicoterapeutes, va començar a preocupar-se que, de fet, potser ELIZA seria substituir-los. I fins i tot l'ordinador Els científics temen que estàvem tan a prop de la solució de llenguatge natural. Ara, això no era qualsevol lloc prop de la veritat. Però això és el impressionant aquests sistemes poden semblar. Així que anem a començar a buscar sota i tractar per aconseguir una mica d'una pregunta d'on el codi que realment passa. Així que farem aquest codi disponibles després. I aquesta és una molt port simple i directe de la implementació original ELIZA. Així que alguns d'aquests estilística coses que veuràs aquí no són estilísticament el ens agradaria que fessis o el que hem estat ensenyant que facis. Però hem tractat de mantenir- la mateixa a través dels molts ports que això ha tingut de manera que té el gust de l'original. Així que anem a incloure un munt de coses, i després tindrem un un conjunt de paraules clau, les coses que ELIZA reconeixerà i respondre directament a. Així que si vostè té paraules com "Pot vostè" o "no fer" o "no" o "sí" o "somni" o "hola", llavors ELIZA respondrà selectivament a aquells. També tindrem un força coses que canviarem, igual que la conversió de "el meu" al "seu". I després tindrem un conjunt de respostes que per a cadascuna d'aquestes paraules clau, anem a girar a través de aquestes diferents respostes. Així que si dic "sí" tres vegades seguides, em podria obtenir tres diferents respostes d'ELIZA. El nostre codi és, doncs, realment molt simple. Si em desplaço cap avall més enllà tots ells respostes que hem programats en i ens posem mans al nostre principal, anem a inicialitzar un parell de diferents variables i fer una mica de neteja al principi. Però llavors no hi ha absolutament un conjunt de codi que vostè pugui entendre. Un bucle while gran que diu que sóc va a repetir això una i altra. Vaig a llegir en una línia, i vaig a emmagatzemar que, en una cadena d'entrada. Vaig a comprovar i veure si és la paraula clau especial "bye", que significa sortir del programa. I després vaig a comprovar i veure si algú està simplement repetint-se a si mateixos un cop rere altre. I vaig a cridar a ells si ho fan. Vaig a dir "no et repeteixis". Mentre que cap dels que passi, anem a a continuació, analitzar a través i recórrer, en les línies 308-313 aquí, i comprovar i veure són qualsevol de les paraules clau frases contingudes a l'entrada que m'acaben de donar? Si hi ha una coincidència per a ells, així a continuació, recordaré aquesta ubicació. Recordaré aquesta paraula clau. I seré capaç de construir una resposta. Si no trobo un, bé, llavors, l'última cosa en el meu arsenal de paraules clau seran les meves respostes predeterminades, quan res més partits. Li preguntaré a preguntes com "Per què ho vas fer vinc aquí? "o" Com puc ajudar? " que són només parcialment adequada no importa el que és l'entrada. A continuació, li construïm la resposta d'ELIZA. Serem capaços de prendre que la resposta de base, tal com ho vam fer en aquest exemple "el meu cap". Si això és tot el que hi ha és-- si és només una cadena que se suposa que he respond-- Jo només puc enviar de tornada. Si té un asterisc al el final de la mateixa, llavors vaig a processar cada fitxa individual en la resta de la resposta de l'usuari i afegir els de, intercanviant paraula per paraula el que necessito. Tot això és absolutament cosa que es podria construir. I de fet, les formes en què ens tenir arguments de línia de comandes processats, la forma en què vostè té processat a través de peticions HTTP segueixi el mateix tipus de regles. Són patrons. Així ELIZA tenia una relativament important impacte en llenguatge natural perquè feia semblar com si fos una meta molt assolible, igual que d'alguna manera ens havíem ser capaç de resoldre aquest problema directament. Ara, això no vol dir que ELIZA fa tot el que ens agradaria fer. Certament no. Però hem de ser capaços de fer alguna cosa més. El nostre primer pas per anar més enllà de ELIZA va ser capaç de mirar a No està ingressat text en el teclat, però la parla, real discurs gravat en un micròfon. Així que si ens fixem en aquests diferents peces, estem va a haver de construir un conjunt de models. Haurem de ser capaç de per anar de l'acústica de baix nivell tirada informació--, amplitud, frequency-- i convertir això en algunes unitats que estem capaç de manipular amb més facilitat i, finalment, manipular- en paraules i oracions. Així que la majoria de reconeixement de veu sistemes que hi són fora avui seguir una estadística model en el qual construïm tres representacions diferents del que que el senyal d'àudio conté en realitat. Comencem amb un model de fonètica que parla de només la base sons que estic produint. Estic produint una cosa que és un B com en nen o una D com en el gos? Com puc reconèixer els dos diferents mòbils com separat i diferent? A més d'això, anem a continuació, construïm un model de pronunciació de les paraules, alguna cosa que uneix aquests telèfons individuals i els combina en una sola paraula. I després d'això, anem a prendre les paraules i nosaltres muntem amb un llenguatge modelar en una oració completa. Ara, anem a parlar de cadascun d'ells de forma independent i per separat. Però aquests tres models són tots només serà estadístiques. I això vol dir que quan ens treballar amb ells, anem a ser capaç de treballar amb tots ells simultàniament. Tot bé. Anem a començar amb el nostre model de fonètica. Així models fonètics depenen de una tècnica computacional anomenada models ocults de Markov. Aquests són models gràfics en què em tenir i reconèixer un estat del món com es caracteritza per un conjunt de característiques. I aquest estat descriu una part d'una acció que estic compromès en. Així que si ho penso fer el so "ma", com a mare, hi ha diferents components a aquest so. Hi ha una part en què em baso en la respiració. I després Premo els llavis. I Poso els llavis una mica cap enrere granet de sorra per fer que el so "ma". I després hi ha un comunicat. Els meus llavis se separen. L'aire és expulsat. "Ma". Aquestes tres parts diferents serien representat pels estats en aquest graph-- el començament, el medi i la fi. I jo hauria transicions que em va permetre viatjar d'un estat a la següent amb una certa probabilitat. Així, per exemple, que M sonar podria tenir un molt, ingesta molt curt en el beginning-- "mm" - i després un més llarg, fase vibratòria on m'estic contenint els llavis i gairebé humming-- "mmmm" - i després un molt curt plosive on jo expulso breath-- "ma". El model ocult de Markov és dissenyat per capturar el fet que la forma en què faig aquest so "ma" es va a ser lleugerament diferent en seva temporització, és la freqüència, i les seves funcions que la forma en què vostè ho fa o la manera en què jo podria fer-ho quan estic parlant uns usos diferents de la lletra. "Mare" i "pot ser que" voluntat sonar lleugerament diferent. Així que per reconèixer una en particular so, ho faríem construir models de Markov, aquests ocult de Markov models, de tots els telèfons possible que jo pot ser que vulgui reconèixer, cada so possible, i després mirar el dades acústics que tinc i determinar estadísticament quina és la més probable haver produït aquest so. D'ACORD. Amb aquest model, que després començar a construir a la part superior de la mateixa. Prenem un model de pronunciació. Ara, pronunciació vegades models són simples i fàcils perquè només hi ha una manera de pronunciar alguna cosa. Altres vegades, són un poc més complicat. Heus aquí una guia de pronunciació per aquesta cosa vermella que és una fruita que vostè fa la salsa de tomàquet fora de. La gent no pensa que és una fruita. Oi? Ara, hi ha moltes maneres diferents que les persones es pronuncia aquesta paraula. Alguns diran "toe-mai-toe". Alguns diran "toe-mah-toe". I podem copsar que amb un d'aquests models gràfics on, de nou, representem transicions com tenint una certa probabilitat i associat probabilitat amb ells. Així que en aquest cas, si hagués de seguir la ruta superior a través de tot aquest gràfica, Jo estaria començant a la lletra A l'extrem esquerre, el "ta" de so. Em prendré la meitat superior, el "oh" i després un "ma" i després una "a", i després un "ta", i un "oh". "Toe-mai-toe". Si vaig prendre el camí de fons a través de això, vaig a aconseguir "ta-mah-toe". I si em vaig baixar i després fins, m'agradaria tenir "ta-mai-dit del peu." Aquests models capturen aquests diferències perquè sempre despleguem d'elles sistemes de reconeixement, que va a haver de treballar amb un munt de diferents tipus de persones, un munt de diferents accents, i fins i tot diferents usos de les mateixes paraules. Finalment, a més d'això, construirem una mica que es veu molt complicat, anomenat el model de llenguatge, però en realitat és el més simple de els tres pel fet que aquests operen en el que es diuen models de n-gram. I en aquest cas, t'estic mostrant un model de n-grames de dues parts, una bigrama. Farem física la idea que de vegades, certes paraules són més propensos a seguir una donada paraula que altres. Si acabo de dir "el pronòstic del temps" la següent paraula probablement podria ser "avui" o podria ser "el clima la predicció per demà ". Però és poc probable que sigui "la previsió meteorològica de la carxofa ". El que un model de llenguatge fa és que captura els estadísticament comptant, des d'algunes molt grans corpus, totes les instàncies en què una paraula segueix a un altre. Així que si em prenc un gran corpus-- com cada Wall Street Journal que s'ha produït des de 1930, que és un dels corpuses-- estàndard i miro a través de tot aquest text, i conte fins quantes vegades després "pronòstic" què veig "avui" i quantes vegades ho faig veig "previsió", seguit de "carxofa" el primer va a ser molt més probable. Va a aparèixer amb molta més freqüència. I pel que tindrà un major probabilitat associada a ella. Si vull esbrinar la probabilitat de tot un enunciat, llavors, jo només trencar-lo. Per tant la probabilitat d'audiència la frase "la rata es va menjar el formatge" és la probabilitat de la paraula "el" a partir d'una frase, i llavors la probabilitat que el paraula "rata" segueix a la paraula "the" i la probabilitat que la paraula "va menjar" següent "rata" i la probabilitat que "formatge" segueix "va menjar". Això sona com una gran quantitat de estadístiques, una gran quantitat de probabilitats. I això és tot el que és. Però el sorprenent és que si vostè fa això amb una mostra prou gran de dades, funciona. I funciona tremendament bé. Tots sabem que aquestes tecnologies. La majoria dels sistemes operatius vénen amb reconeixement de veu en aquest punt. Utilitzem Siri i Cortana i Echo. I aquestes coses es basen en aquest tipus de de tres capes model-- un model fonètica en la part inferior, un model de pronunciació en el medi, i un model de llenguatge a la part superior d'ells. Ara, han de fer una mica més que per tal de respondre a les preguntes. Però el reconeixement del que ets dit depèn exactament en això. Així que donem un exemple aquí. Així que tinc el meu telèfon assegut aquí per sota de la càmera de documents. I anem a demana Siri algunes preguntes. Tot bé? Així que anem a despertar al meu telèfon aquí. Siri, quin és el clima com a New Haven avui? SIRI: Aquí està el clima per New Haven, Connecticut avui. BRIAN Scassellati: OK. Així que primer que va veure que Siri reconegut cadascuna de les paraules individuals i després produït una resposta. Parlarem de com aquesta resposta ve voltant d'una mica. Però ara que sabem que això es basa simplement en les estadístiques de primes i aquest patró de tipus coincidència d'enfocament, podem jugar alguns jocs amb Siri. Així que puc intentar-ho de nou. Siri, quin és el clima hipopòtam New Haven, avui? SIRI: OK. Aquí està el temps a New Haven, Connecticut per avui. BRIAN Scassellati: Siri No intimidat per que perquè es va trobar la pattern-- "temps", "avui", "New Haven". Això és el que està responent que, igual que ELIZA. Tot bé. Anem a donar-li una més encara exemple més ridícul. Siri, carxofa temps armadillo hipopòtam New Haven? SIRI: Déjame veure com està això. Això és el que vaig trobar a la web per al que són les carxofes armadillo hipopòtam New Haven. BRIAN Scassellati: OK. Així que si em vaig prou lluny d'aquest model, Sóc capaç de confondre perquè hi ha ja coincideix amb el patró que té. I aquesta estadística motor que està dient, ¿Quina és la probabilitat que tens les paraules de hipopòtam i carxofa junts, i armadillo? Això ha de ser alguna cosa nova. Així que aquestes tecnologies que fem servir cada dia. Si volem portar-un pas A més, però, si en realitat vull ser capaç de parlar del que és que aquests sistemes estan responent a, hem de parlar, de nou, sobre un conjunt més fonamental de preguntes. I això és un tema de la comunicació que anomenem pregunta de resposta. És a dir, volem ser capaços A-- sí? AUDIÈNCIA: [inaudible]. BRIAN Scassellati: ¿Aconseguim en el processament semàntic latent? Així que si. Hi ha un munt de coses que són passant per sota de la superfície amb Siri i en alguns dels exemples Vaig a mostrar-li al costat on hi ha una mica en termes de l'estructura del que estàs dient que això és important. I, de fet, això és un gran precursor per a la següent diapositiva per a mi. Així que de la mateixa manera que el nostre reconeixement de veu es va construir de múltiples capes, si volem entendre què és el que en realitat és Dit això, anem a tornar basar-se en una anàlisi multicapa de del text que està sent reconegut. Així que quan Siri és realment capaç de per exemple, veig que vaig trobar aquestes paraules. Ara, què faig amb ells? El primer component és sovint passar i tractar d'analitzar l'estructura de la frase. I en el que hem vist a l'escola primària, sovint, com una mena de diagramació frases, anem reconèixer que certa les paraules tenen certs rols. Aquests són els noms. Aquests són els pronoms. Aquests són els verbs. I anem a reconèixer que per a una gramàtica particular en aquest cas Anglès gramàtica, hi ha formes vàlides en què puc combinar- i altres formes que no són vàlids. Aquest reconeixement, que l'estructura, podria ser suficient per ajudar a guiar-nos una mica. Però no és suficient perquè siguem capaços de donar qualsevol sentit al que es diu aquí. Per fer això, anem a haver de dependre de una certa quantitat de processament semàntic. És a dir, que anem a haver de mirar en sota del que cadascuna d'aquestes paraules en realitat porta com a significat. I en la forma més senzilla de fer això, anem a associar amb cada paraula que sabem que una determinada funció, una certa transformació que permet que succeeixi. En aquest cas, podríem etiquetar el paraula "Juan" com un nom propi, que porta amb si una identitat. I podríem etiquetar "Maria", com de la mateixa manera. Mentre que un verb com "amors", que constitueix una relació particular que som capaços de representar. Ara, això no vol dir que entenem què és l'amor, sinó només que entenem en la forma d'un sistema simbòlic. És a dir, podem etiquetar i manipular-lo. Amb cada un d'aquests tipus d'enfocaments, qualsevol tipus de processament semàntic aquí va requerir una mica mica de coneixement i un munt de treball per la nostra part. Ja no estem en el regne on les estadístiques prou feines pla van a ser suficient per a nosaltres. Ara, per tal d'anar des d'aquest punt de ser capaç de parlar sobre l'interior de el que en realitat està passant aquí, per ser capaç de manipular aquest estructurar i entendre una pregunta i després poder per sortir a buscar, que requereix un major model cognitiu complex. La forma en què es construeixen aquests sistemes és en la seva major part molt, molt laboral intensiva. Impliquen humans gastar una gran quantitat de temps estructurar les formes en que aquest tipus de sentències es pot representar en certa lògica. Es fa encara una mica més complex, però. Fins i tot una vegada que hem tractat amb la semàntica, anem a encara ha de mirar el pragmàtica del que es diu. És a dir, com em relaciono les paraules que he de mica físicament hi ha al món, o menys alguns font d'informació que puc manipular? A vegades, aquests condueixen a meravellosos trossos d'ambigüitat. "Al rojo vivo estrelles per casar astrònom." D'ACORD. Ara, llegim que com el Tipus divertida del títol que anàvem a veure a la nit de TV perquè nosaltres no interpretem "estrella" tenir el seu significat cos celeste. Sabem que això significa més l'actor o actriu habitual amb altes quantitats de visibilitat. "Esquadró d'ajuda a les víctimes de mossegada de gos." És que l'equip és en realitat per aquí ajudant a un gos en donar la volta i mossegar les víctimes? O és que no hi havia un individu que era mossegat per un gos que necessita una mica d'ajuda? Només de mirar a la sintaxi i la semàntica de les sentències, no podem determinar això. "Helicòpter accionat per mosques humans." Hi ha, de fet, real petites coses volant al voltant són persones amb ales alimentació helicòpters per al bé de la humanitat? ¿O hi ha un dispositiu mecànic que deriva la seva energia d'una persona? Quan ens fixem en qüestió contestadors, aquestes són les capes que hem de tractar. Ara, els millors i els més sort d'prevalent d'aquests sistemes avui en dia són capaços de fer les coses a un nivell que són molt més enllà del que teníem fa 10 anys. Aquí està un dels millors sistemes això és per aquí avui en dia. I aquest és un sistema d'IBM anomenat Watson. Això és dels nostres amics de IBM. Es tracta dels bancs Katherine, Jia Chen, i Priscila Moraes donant-nos una demostració de Watson ahir a IBM a Yorktown. [REPRODUCCIÓ DE VÍDEO] -Com estàs? -Estic bé. Sempre estic feliç quan estic pensant, sobretot quan em pot mantenir-se fresc en aquestes sales de servidors. Qui És el teu actriu preferida? -La Meva Actriu favorita Angelina Jolie com Lara Croft en Tomb Raider perquè el seu original, forma era com un personatge virtual com jo. -Com Pot Watson ajudar els pacients? -És El pla per als pacients a tenir accés a Watson directament? L'accés a Watson d'assessorament aplicacions varien segons el cas d'ús. Però en l'actualitat, Watson només proporcionarà possible diagnòstic i tractament opcions al professional de la medicina. Si és el cas, els pacients pot proporcionar informació a Watson, potser a través d'una interfície de portal web, tauleta, o fins i tot un telèfon mòbil. Per exemple, un pacient pot estar els va demanar que descrivissin els seus símptomes en llenguatge natural directament en una solució Watson, permetent que el metge se centri en recopilació de dades i no diagnòstic. -Qui Assassinat Abraham Lincoln? -John Wilkes Booth. -En Quin any va fer l'Arizona Diamondbacks guanyen la Sèrie Mundial? -2001. [FI DE REPRODUCCIÓ] BRIAN Scassellati: Així aquest tipus de sistemes ha de confiar en primer lloc el reconeixement de la veu; segon, convertint-la en una interna significativa la representació; i després, tercer, ser capaç de sortir i trobar la font d'informació que els permet respondre a aquesta pregunta. Aquest nivell de complexitat implica els mateixos tipus de coses programàtiques que ha estat fent en els butlletins de problemes. Som capaços d'analitzar les peticions HTTP en el mateix tipus de patró de baix nivell coincident que ELIZA pot fer. Som capaços de convertir els en una representació interna, i després usar-los per consultar alguna base de dades externa, possiblement utilitzant SQL. Tots els sistemes que s'estan construint avui per fer aquest tipus de recursos naturals comunicació lingüística s'estan construint a aquests mateixos principis. Ara, fins i tot un sistema com Watson no és prou complexa ser capaç de respondre arbitrari preguntes sobre qualsevol tema. I de fet, han d'estar estructurat dins d'un domini donat. Així que vostè pot anar en línia i vostè pot trobar versions de Watson que operen bé dins de la informàtica mèdica. O hi ha una línia que només s'ocupa de la forma per fer bones recomanacions sobre què cervesa anirà amb el qual els aliments. I dins d'aquests dominis, que pot respondre a les preguntes, trobar la informació que necessita. Però no es pot barrejar i combinar. El sistema que s'ha entrenat amb la base de dades del menjar i la cervesa no funciona bé quan de sobte el va posar en la informàtica mèdica base de dades. Així que fins i tot els nostres millors sistemes actuals confiar en un nivell de processament en el qual estem codificació manual i la construcció de la infraestructura per tal perquè aquest sistema funcioni. Ara, l'últim tema que vull per poder arribar a l'actualitat és sobre la comunicació no verbal. Una gran massa d'informació que ens comuniquem amb els altres no es produeix a través de la paraules individuals que estem demanant. Té a veure amb coses com proximitat, la mirada, el to de la seva veu, seva inflexió. I que la comunicació és també cosa que moltes interfícies diferents cuidar molt sobre. No és el que Siri li importa. Puc demanar a Siri alguna cosa en una sola veu o en un to de veu diferent, i Siri va a dóna'm la mateixa resposta. Però això no és el que construïm per molts altres tipus d'interfícies. Vull presentar- ara a un dels robots. Aquest va ser construït per la meva des de fa molt temps amic i col·lega Cynthia Breazeal i la seva companyia Jibo. I això robot-- anem tenir un parell de voluntaris arribar a interactuar amb aquest. Així que puc tenir dues persones disposades jugar amb el robot per a mi? Per què no véns a un màxim, i per què no véns a endavant. Si voleu unir-se a mi aquí, si us plau. I si pogués tenir-te venir per aquí. Gràcies. Hola. ALFREDO: Encantat de conèixer-te. Alfredo. BRIAN Scassellati: Alfredo. Raquel: Raquel. BRIAN Scassellati: Rachel. Encantat de conèixer tots dos. Alfred, jo vaig a haver d'anar primer. Vine fins aquí. Vaig a introduir usted-- si puc aconseguir això de sense cridar l'microphone-- a un petit robot anomenat Jibo. D'ACORD? Ara, Jibo està dissenyat per a ser interactiu. I tot i que li pot donar el discurs, gran part de la interacció amb el robot és no verbal. Alfred, et vaig a demanar que dir alguna cosa agradable i connexió al robot, si us plau. ALFREDO: Crec que et veus bonica. [Brunzit] BRIAN Scassellati: OK. La seva resposta no és verbal. I no obstant això, et va donar tant un clar reconeixement que havia sentit el que ha dit i també s'entén que d'alguna manera. D'ACORD? Pas de tornada aquí durant un segon. Gràcies. Rachel, si ho faria. Ara, jo donaré que la feina molt més difícil. Si voleu parat aquí, còpia de seguretat de només una mica pel que podem aconseguir que a la cambra i buscar d'aquesta manera. Vaig a demanar-li que dir alguna cosa realment significa i desagradable al robot. RACHEL: El que semblava de fer era completament absurd. [Brunzit] Això va ser encara més absurd. Què està passant amb vostè? Ah, no et sentis malament. Et vaig a donar una abraçada. BRIAN Scassellati: D'acord. Gràcies, Rachel. Alfred, Rachel, gràcies nois molt. [Aplaudiments] Així que aquest tipus d'interacció té en moltes maneres algunes de les mateixes regles i alguns dels mateixos estructura com el que podria tenir en la interacció lingüística. És alhora comunicatiu i serveix un propòsit important. I aquesta interacció, en moltes maneres, està dissenyat per tenir un efecte particular sobre la persona que interactua amb o escoltant al robot. Ara, tinc la sort tenir Jibo aquí avui. Sam Spaulding aquí per ajudar ens terme amb el robot. I jo demanaré Sam per donar nosaltres una bona demostració de la dansa Jibo que podem veure al final aquí. Així que endavant, Jibo. SAM: OK, Jibo. Mostra'ns els teus moviments de ball. [REPRODUCCIÓ DE MÚSICA] BRIAN Scassellati: Molt bé, tothom. Gràcies als nostres amics de Jibo. [Aplaudiments] I gràcies als nostres amics de IBM per ajudar a terme avui. La comunicació és una cosa que vas per veure pujant més i més a mesura construïm les interfícies més complexes. La setmana que ve, estarem parlant sobre com interactuar amb oponents de l'ordinador en els jocs. Però si vostè té preguntes sobre això, Vaig a estar al voltant de les hores d'oficina aquesta nit. Estic feliç de parlar amb vostè sobre la IA temes o per entrar en més detall. Bon cap de setmana. [Aplaudiments] [REPRODUCCIÓ DE MÚSICA]