1 00:00:00,000 --> 00:00:02,928 >> [REPRODUCCIÓN DE MÚSICA] 2 00:00:02,928 --> 00:00:11,230 3 00:00:11,230 --> 00:00:12,790 >> DAVID MALAN: Este es CS50. 4 00:00:12,790 --> 00:00:14,072 Este es el final de la semana 10. 5 00:00:14,072 --> 00:00:16,030 Y el muchacho, ¿tenemos una buena clase para usted hoy. 6 00:00:16,030 --> 00:00:20,040 Estamos muy emocionados de invitar a dos de nuestros amigos de Yale hasta nosotros hoy 7 00:00:20,040 --> 00:00:23,920 y buscar en la intersección de inteligencia artificial, la robótica, 8 00:00:23,920 --> 00:00:25,710 procesamiento del lenguaje natural, y más. 9 00:00:25,710 --> 00:00:27,090 >> Y, en efecto, sobre el últimas semanas, hemos 10 00:00:27,090 --> 00:00:29,714 Ciertamente pasado mucho tiempo, especialmente en los conjuntos de procesadores anteriores, 11 00:00:29,714 --> 00:00:31,560 centrándose en bonitos detalles de bajo nivel. 12 00:00:31,560 --> 00:00:34,520 Y es muy fácil perder de vista del bosque por los árboles 13 00:00:34,520 --> 00:00:38,170 y se colgó en bucles y condiciones y punteros, sin duda, y similares. 14 00:00:38,170 --> 00:00:41,770 Pero la realidad es que ustedes tienen ahora la ingredientes con los que se puede realmente 15 00:00:41,770 --> 00:00:45,300 resolver algunos problemas interesantes, entre ellos los que nuestros amigos de Yale 16 00:00:45,300 --> 00:00:48,790 trabajar en apenas por debajo de Cambridge. 17 00:00:48,790 --> 00:00:52,410 >> Así que permítanme primero en introducir la cabeza profesor ayudante de la Universidad de Yale, Andy. 18 00:00:52,410 --> 00:00:55,182 >> [APLAUSOS] 19 00:00:55,182 --> 00:00:57,030 20 00:00:57,030 --> 00:01:00,710 >> ANDY: En primer lugar, simplemente gracias por permitirme un par Yalies 21 00:01:00,710 --> 00:01:02,700 hacer estallar abajo a Cambridge en la actualidad. 22 00:01:02,700 --> 00:01:05,299 Nosotros realmente lo apreciamos. 23 00:01:05,299 --> 00:01:07,090 En segundo lugar, a nuestros amigos volver casa- Jason, 24 00:01:07,090 --> 00:01:09,670 gracias por estar en funcionamiento conferencia. 25 00:01:09,670 --> 00:01:12,970 Espero que todo está bien en New Haven. 26 00:01:12,970 --> 00:01:15,720 >> Así que sí, estoy súper emocionada introducir Scaz hoy. 27 00:01:15,720 --> 00:01:17,020 Scaz dirige el laboratorio de robótica. 28 00:01:17,020 --> 00:01:19,690 Él es un profesor de, como, cinco diferentes departamentos de la Universidad de Yale. 29 00:01:19,690 --> 00:01:23,159 En su laboratorio, él tiene muchos, muchos robots que le gusta jugar con. 30 00:01:23,159 --> 00:01:24,950 Él tiene, como, la mejor trabajo en el mundo. 31 00:01:24,950 --> 00:01:27,116 Y llega a la clase de desastre alrededor con eso todo el día 32 00:01:27,116 --> 00:01:29,090 de largo y hacer algún trabajo, también. 33 00:01:29,090 --> 00:01:33,070 >> Y así que en realidad trajo uno de ellos hacia abajo con nosotros hoy. 34 00:01:33,070 --> 00:01:36,900 Así que sin más preámbulos, Scaz es va a seguir adelante y presentarnos 35 00:01:36,900 --> 00:01:38,660 a su amigo robot. 36 00:01:38,660 --> 00:01:41,546 >> [APLAUSOS] 37 00:01:41,546 --> 00:01:42,935 38 00:01:42,935 --> 00:01:44,310 BRIAN Scassellati: Gracias, David. 39 00:01:44,310 --> 00:01:45,380 Gracias, Andy. 40 00:01:45,380 --> 00:01:50,050 Es tan maravilloso estar aquí con todo el mundo en la actualidad. 41 00:01:50,050 --> 00:01:56,490 Quiero ser muy claro que primero el personal CS50 aquí en Cambridge 42 00:01:56,490 --> 00:01:59,190 ha sido muy hospitalarios con nosotros. 43 00:01:59,190 --> 00:02:02,130 Estamos muy agradecidos por todo lo que han hecho para que nos apoyen. 44 00:02:02,130 --> 00:02:05,690 Y así, nos gustaría poder para devolver la amabilidad. 45 00:02:05,690 --> 00:02:09,370 >> Así que hoy, llegamos a anunciar que vamos a tener una nueva, 46 00:02:09,370 --> 00:02:15,240 uno-de-una especie de evento CS50 pasando en New Haven la semana que viene. 47 00:02:15,240 --> 00:02:18,040 Y este es el CS50 Investigación Expo. 48 00:02:18,040 --> 00:02:21,300 Así que vamos a estar invitando everyone-- CS50 estudiantes, 49 00:02:21,300 --> 00:02:26,510 el personal tanto de Harvard y Yale-- a bajar y visitar con nosotros el viernes. 50 00:02:26,510 --> 00:02:30,400 Vamos a tener una gran variedad de más de 30 personas diferentes que presentan 51 00:02:30,400 --> 00:02:34,830 y upperclassmen exhibiting-- mostrando a algunos de sus productos de investigación. 52 00:02:34,830 --> 00:02:38,480 Tendremos algunas nuevas empresas, incluso, mirando para un poco de nuevos talentos tecnología, 53 00:02:38,480 --> 00:02:40,460 nuevas empresas, tanto de la Universidad de Harvard y Yale. 54 00:02:40,460 --> 00:02:44,550 Y vamos a tener algunos grupos de estudiantes buscando alguna nueva composición. 55 00:02:44,550 --> 00:02:46,357 >> Va a ser un momento muy emocionante. 56 00:02:46,357 --> 00:02:49,190 Esperemos que aquellos de ustedes que son que baja para el partido de Harvard-Yale 57 00:02:49,190 --> 00:02:51,360 será capaz de detener por un poco temprano, 58 00:02:51,360 --> 00:02:54,060 justo en el centro del campus, Sterling Memorial Library. 59 00:02:54,060 --> 00:02:58,040 Vamos a tener un conjunto de exposiciones que van desde autónoma 60 00:02:58,040 --> 00:03:04,460 veleros a formas de utilizar el software para preservar los manuscritos medievales. 61 00:03:04,460 --> 00:03:07,860 >> Vamos a tener el anuncio redes hoc y la gente 62 00:03:07,860 --> 00:03:11,230 la enseñanza de la codificación del software en Ciudad del Cabo. 63 00:03:11,230 --> 00:03:13,730 Tendremos equipo manifestaciones musicales. 64 00:03:13,730 --> 00:03:16,020 Y vamos a por supuesto tenemos más robots. 65 00:03:16,020 --> 00:03:18,900 Así que usted Esperamos voy únase a nosotros para este evento. 66 00:03:18,900 --> 00:03:21,350 Debe haber un montón de diversión, un poco de comida, 67 00:03:21,350 --> 00:03:24,430 y un montón de interesante cosas de que hablar. 68 00:03:24,430 --> 00:03:28,230 >> Así que hoy, vamos a hablar sobre el procesamiento del lenguaje natural. 69 00:03:28,230 --> 00:03:32,560 Y este es el intento por nosotros para construir una nueva forma de interactuar 70 00:03:32,560 --> 00:03:35,150 con nuestros dispositivos, ya desde hace unas semanas, 71 00:03:35,150 --> 00:03:40,800 usted ha estado enfocado en cómo es que puede escribir código, escribir software 72 00:03:40,800 --> 00:03:47,110 que es una forma de ser capaz de decirle a un máquina, esto es lo que quiero que hagas. 73 00:03:47,110 --> 00:03:50,210 >> Pero no deberíamos necesitar esperar que todo 74 00:03:50,210 --> 00:03:53,760 eso es por ahí que se utiliza por todos en el mundo 75 00:03:53,760 --> 00:03:57,480 va a ser competentes en este tipo de instrucción. 76 00:03:57,480 --> 00:04:02,540 Así distinguimos entre el ordenador idiomas y Las Lenguas naturales 77 00:04:02,540 --> 00:04:06,720 es decir, las cosas que los seres humanos utilizan para comunicarse con otros seres humanos. 78 00:04:06,720 --> 00:04:12,270 Y tratamos de construir interfaces que utilizan estos mecanismos de comunicación naturales. 79 00:04:12,270 --> 00:04:16,029 >> Ahora, al igual que cualquier otro tema que hemos empezado con en CS50, 80 00:04:16,029 --> 00:04:19,589 vamos a empezar con el más simple poco de procesamiento del lenguaje natural 81 00:04:19,589 --> 00:04:21,269 que podemos imaginar. 82 00:04:21,269 --> 00:04:24,940 Vamos a comenzar con el parte histórica del lenguaje natural. 83 00:04:24,940 --> 00:04:28,740 Y luego vamos a construir hasta sistemas cada vez más recientes 84 00:04:28,740 --> 00:04:31,450 y tienen algunos demos diversión en el camino. 85 00:04:31,450 --> 00:04:35,900 >> Así que vamos a empezar con lo que era probablemente el primer lenguaje natural 86 00:04:35,900 --> 00:04:38,210 sistema de procesamiento. 87 00:04:38,210 --> 00:04:45,080 Esto era un sistema de software escrito en 1966 por Joseph Weizenbaum llamado ELIZA. 88 00:04:45,080 --> 00:04:49,640 Y Eliza fue diseñado para replicar el tipo de interacción 89 00:04:49,640 --> 00:04:53,850 que tendría con un Psicoterapeuta de Rogers. 90 00:04:53,850 --> 00:04:57,210 Ahora, los rogerianos, tenían una idea que la psicoterapia 91 00:04:57,210 --> 00:05:02,800 involucrados poder reflejar de vuelta a un paciente y hablar con ellos, 92 00:05:02,800 --> 00:05:08,100 básicamente, por sólo les da una poquito del terapeuta. 93 00:05:08,100 --> 00:05:09,920 Es decir, todo que el terapeuta dijo 94 00:05:09,920 --> 00:05:16,500 se suponía que era sólo un reflejo de lo que el paciente estaba diciendo a ellos. 95 00:05:16,500 --> 00:05:18,990 >> Así que vamos a tratar de Demo Esta. 96 00:05:18,990 --> 00:05:22,820 ¿Tenemos un voluntario que estaría dispuestos a compartir su más profunda, 97 00:05:22,820 --> 00:05:26,650 más oscuras, y / o secretos falsos con ELIZA? 98 00:05:26,650 --> 00:05:29,680 Claro, ¿por qué no vamos para arriba. 99 00:05:29,680 --> 00:05:30,847 Fantástico. 100 00:05:30,847 --> 00:05:31,430 ¿Y tu nombre? 101 00:05:31,430 --> 00:05:32,000 >> MILES: Miles. 102 00:05:32,000 --> 00:05:33,041 >> BRIAN Scassellati: Miles. 103 00:05:33,041 --> 00:05:34,270 Encantado de conocerte, Miles. 104 00:05:34,270 --> 00:05:36,270 Si desea aferrarse a eso. 105 00:05:36,270 --> 00:05:40,840 Y vamos a utilizar una versión de ELIZA 106 00:05:40,840 --> 00:05:44,640 que hemos replicado dentro del IDE CS50. 107 00:05:44,640 --> 00:05:47,140 Y vamos a ver la fuente código para esto en un rato. 108 00:05:47,140 --> 00:05:49,910 Pero por ahora, sólo somos va a invocarlo escribiendo eliza. 109 00:05:49,910 --> 00:05:55,480 >> Y Eliza se va a dar respuestas que van a ser en todas las capitales. 110 00:05:55,480 --> 00:05:57,950 Y voy a hacerle algunas preguntas. 111 00:05:57,950 --> 00:06:02,130 Y vamos a responder y tipo en las respuestas a ELIZA. 112 00:06:02,130 --> 00:06:04,310 Así ELIZA ha dicho: "Hola, soy ELIZA. 113 00:06:04,310 --> 00:06:05,462 ¿Cuál es tu problema?" 114 00:06:05,462 --> 00:06:08,092 Que te gustaría decirle ELIZA hoy? 115 00:06:08,092 --> 00:06:10,750 >> MILES: Sólo puedo conciliar el sueño si tengo zapatillas de conejo en. 116 00:06:10,750 --> 00:06:12,440 >> BRIAN Scassellati: De acuerdo. 117 00:06:12,440 --> 00:06:13,360 Correcto. 118 00:06:13,360 --> 00:06:15,300 >> [RISA] 119 00:06:15,300 --> 00:06:22,410 >> "Sólo puedo conciliar el sueño con zapatillas de conejo en ". 120 00:06:22,410 --> 00:06:29,000 Y Eliza dice: "Oye, ¿verdad tener problemas psicológicos? 121 00:06:29,000 --> 00:06:30,450 Tal vez esto es un buen indicador ". 122 00:06:30,450 --> 00:06:30,780 >> OK. 123 00:06:30,780 --> 00:06:32,245 Entonces, ¿qué le gustaría responder? 124 00:06:32,245 --> 00:06:36,110 125 00:06:36,110 --> 00:06:36,970 >> MILES: Sí. 126 00:06:36,970 --> 00:06:38,660 >> BRIAN Scassellati: Sí. 127 00:06:38,660 --> 00:06:39,570 Hombre de muchas palabras. 128 00:06:39,570 --> 00:06:41,870 Me gusta eso. 129 00:06:41,870 --> 00:06:50,200 Eliza dice: "Usted parece bastante positivo." 130 00:06:50,200 --> 00:06:53,200 >> MILES: No, yo soy, de hecho, un electrón. 131 00:06:53,200 --> 00:06:55,150 >> BRIAN Scassellati: "No. 132 00:06:55,150 --> 00:07:02,240 De hecho, soy un electrón ". "¿Has venido a mí 133 00:07:02,240 --> 00:07:06,954 porque usted es un electrón? " 134 00:07:06,954 --> 00:07:08,870 Ahora, podemos ver algunos de el cosas-- voy 135 00:07:08,870 --> 00:07:10,200 a usted hacer una pausa por un segundo, Miles. 136 00:07:10,200 --> 00:07:11,010 No ir a ninguna parte. 137 00:07:11,010 --> 00:07:12,650 No hemos terminado contigo todavía. 138 00:07:12,650 --> 00:07:16,490 ELIZA es, en cierto modo, responder a ciertas cosas 139 00:07:16,490 --> 00:07:21,140 que él está diciendo, pero sin ninguna comprensión real. 140 00:07:21,140 --> 00:07:26,090 Y también está repitiendo recuperar parte de las partes de su condena. 141 00:07:26,090 --> 00:07:27,310 >> Así que nos dijo: "No. 142 00:07:27,310 --> 00:07:29,090 De hecho, soy un electrón ". 143 00:07:29,090 --> 00:07:34,190 Eliza respondió de vuelta, "¿Has venido para mí, porque usted es un electrón? " 144 00:07:34,190 --> 00:07:34,690 Correcto. 145 00:07:34,690 --> 00:07:36,050 Vamos a darle una respuesta más aquí. 146 00:07:36,050 --> 00:07:37,140 Darle una buena, Miles. 147 00:07:37,140 --> 00:07:37,806 >> MILES: Bueno uno? 148 00:07:37,806 --> 00:07:48,400 149 00:07:48,400 --> 00:07:49,570 >> Sí, por favor, ayúdame. 150 00:07:49,570 --> 00:07:50,570 BRIAN Scassellati: "Sí. 151 00:07:50,570 --> 00:07:58,010 Por favor, ayúdame "." ¿Estás seguro? " 152 00:07:58,010 --> 00:07:58,510 MILES: No. 153 00:07:58,510 --> 00:08:00,860 BRIAN Scassellati: No. 154 00:08:00,860 --> 00:08:03,562 "¿Qué sugiere para usted?" 155 00:08:03,562 --> 00:08:06,760 >> MILES: Yo no puede ser un electrón. 156 00:08:06,760 --> 00:08:11,170 >> BRIAN Scassellati: "Yo no puede ser un electrón ". 157 00:08:11,170 --> 00:08:13,790 "¿Estás diciendo que no acaba de ser negativo?" 158 00:08:13,790 --> 00:08:14,390 >> Correcto. 159 00:08:14,390 --> 00:08:16,030 Así Miles, muchas gracias. 160 00:08:16,030 --> 00:08:16,860 >> MILES: Gracias. 161 00:08:16,860 --> 00:08:18,360 >> BRIAN Scassellati: Muchas gracias. 162 00:08:18,360 --> 00:08:20,230 [APLAUSOS] 163 00:08:20,230 --> 00:08:21,230 164 00:08:21,230 --> 00:08:26,700 >> Así que este programa ELIZA, en muchos sentidos, está respondiendo simplemente a las piezas 165 00:08:26,700 --> 00:08:32,730 que estamos ofreciendo sin ningún profunda comprensión de lo que está pasando aquí. 166 00:08:32,730 --> 00:08:36,640 Este es un tipo de sistema de denominado coincidencia de patrones, donde 167 00:08:36,640 --> 00:08:40,490 estamos buscando cierta fragmentos de texto que estamos continuación 168 00:08:40,490 --> 00:08:44,860 va a sacar de lo fue proporcionado como entrada, 169 00:08:44,860 --> 00:08:52,580 convertirlo, potencialmente, de alguna manera, y luego darle la espalda al usuario. 170 00:08:52,580 --> 00:08:55,150 >> ¿Alguno de ustedes piensan ELIZA que es en realidad 171 00:08:55,150 --> 00:08:58,230 realizar el psicoanálisis válida aquí? 172 00:08:58,230 --> 00:08:59,250 A una persona, tal vez. 173 00:08:59,250 --> 00:09:00,166 >> AUDIENCIA: [inaudible]. 174 00:09:00,166 --> 00:09:03,315 175 00:09:03,315 --> 00:09:05,440 BRIAN Scassellati: ¿Y cómo te hace sentir eso? 176 00:09:05,440 --> 00:09:06,530 Sí, de hecho, lo hace. 177 00:09:06,530 --> 00:09:10,890 Y vamos a ver, en realidad, la código fuente para que en un momento. 178 00:09:10,890 --> 00:09:13,580 Y por lo que vas a ser capaz de hacer exactamente esto. 179 00:09:13,580 --> 00:09:17,420 >> Ahora, ELIZA es una forma de lo que hoy llamaríamos un bot de chat. 180 00:09:17,420 --> 00:09:19,950 Simplemente va a través de la texto que usted está proporcionando, 181 00:09:19,950 --> 00:09:24,030 proporciona el monto mínimo de comprensión o de procesamiento, 182 00:09:24,030 --> 00:09:26,790 y luego loros de nuevo a usted. 183 00:09:26,790 --> 00:09:31,830 Así que vamos a echar un vistazo, conceptualmente, y hablar de lo 184 00:09:31,830 --> 00:09:34,690 es que Eliza está haciendo realidad. 185 00:09:34,690 --> 00:09:42,000 >> ELIZA está tomando de un let sentence-- digo: "Quiero impresionar a mi jefe." 186 00:09:42,000 --> 00:09:45,130 Y Eliza está mirando a través de esa frase, 187 00:09:45,130 --> 00:09:48,730 y tratando de encontrar y coincidir con ciertos patrones. 188 00:09:48,730 --> 00:09:52,850 Así, por ejemplo, uno de los patrones ELIZA que está buscando son las palabras 189 00:09:52,850 --> 00:09:55,110 "Yo quiero." 190 00:09:55,110 --> 00:09:59,330 Y cada vez que ve algo que tiene "Quiero" en ella, 191 00:09:59,330 --> 00:10:01,770 formula una respuesta. 192 00:10:01,770 --> 00:10:05,040 Y esa respuesta es una cadena fija. 193 00:10:05,040 --> 00:10:07,915 En este caso, se trata de "qué es lo que quieres?" 194 00:10:07,915 --> 00:10:11,330 Y puse una pequeña estrella en el final, porque eso es sólo 195 00:10:11,330 --> 00:10:13,310 el comienzo de nuestra respuesta. 196 00:10:13,310 --> 00:10:16,310 Y la estrella indica que vamos a tomar el resto 197 00:10:16,310 --> 00:10:19,850 de utterance-- del usuario "para impresionar a mi jefe" - 198 00:10:19,850 --> 00:10:24,500 y vamos a añadir que en el extremo de esta cadena. 199 00:10:24,500 --> 00:10:28,990 >> Así que ahora, en lugar de decir, "¿por qué Qué quieres impresionar a mi jefe " 200 00:10:28,990 --> 00:10:31,800 hay un poco de adicional procesamiento que vamos a hacer. 201 00:10:31,800 --> 00:10:34,440 Es decir, tendremos que convertir algunos de los pronombres 202 00:10:34,440 --> 00:10:38,670 aquí desde "mi jefe" a "su jefe". 203 00:10:38,670 --> 00:10:41,300 Y podría haber algunos otros cambios que necesitamos hacer. 204 00:10:41,300 --> 00:10:44,990 Así que en lugar de simplemente pegándolo directamente sobre el final, lo que vamos a hacer 205 00:10:44,990 --> 00:10:49,160 está tomaremos el resto del utterance-- de usuario en aquí-- blanco 206 00:10:49,160 --> 00:10:54,090 y lo tomaremos una pieza a un tiempo y convertir cada cuerda 207 00:10:54,090 --> 00:10:58,180 modo, cada palabra, en la sentencia. 208 00:10:58,180 --> 00:10:59,580 >> Así que vamos a tomar la palabra "para". 209 00:10:59,580 --> 00:11:01,650 No hay conversión que tenemos que hacer eso. 210 00:11:01,650 --> 00:11:02,340 "Impresionar." 211 00:11:02,340 --> 00:11:04,140 No hay conversión tenemos que hacer allí. 212 00:11:04,140 --> 00:11:06,670 "Mi" se convertirá en "su". 213 00:11:06,670 --> 00:11:10,070 Y "jefe" sólo tendremos que dejamos como "jefe". 214 00:11:10,070 --> 00:11:12,740 Y finalmente, cualquier cosa que termina con un punto, 215 00:11:12,740 --> 00:11:16,640 nos convertiremos en una pregunta. 216 00:11:16,640 --> 00:11:22,600 >> Esta muy simple coincidencia de patrones es en realidad bastante éxito. 217 00:11:22,600 --> 00:11:27,260 Y cuando esto se introdujo en 1966-- Joseph Weizenbaum 218 00:11:27,260 --> 00:11:28,986 programada en un equipo. 219 00:11:28,986 --> 00:11:31,110 Ahora, las computadoras de la época no eran modelos de escritorio. 220 00:11:31,110 --> 00:11:33,950 Ellos se compartieron recursos. 221 00:11:33,950 --> 00:11:39,090 Y sus estudiantes lo haría ir y charlar con ELIZA. 222 00:11:39,090 --> 00:11:41,570 Finalmente, tuvo que restringir el acceso a la misma 223 00:11:41,570 --> 00:11:43,890 porque sus estudiantes no estaban conseguir cualquier trabajo hecho. 224 00:11:43,890 --> 00:11:46,190 Estaban charlando con ELIZA. 225 00:11:46,190 --> 00:11:48,850 Y, de hecho, tuvo que despedir a su ayudante, que 226 00:11:48,850 --> 00:11:55,840 gastado todo su tiempo hablando con ELIZA sobre sus problemas profundos y preocupantes. 227 00:11:55,840 --> 00:12:00,350 >> Todo el que utiliza estos sistemas comenzado a antropomorfizar ellos. 228 00:12:00,350 --> 00:12:04,490 Empezaron a pensar en ellos como siendo animado y personas reales. 229 00:12:04,490 --> 00:12:07,969 Empezaron a reconocer algunos de las cosas que ellos estaban diciendo 230 00:12:07,969 --> 00:12:09,010 fueron llegando de nuevo a ellos. 231 00:12:09,010 --> 00:12:12,120 Y fueron descubriendo cosas sobre sí mismos. 232 00:12:12,120 --> 00:12:17,290 Y, de hecho, incluso los expertos, incluso los psicoterapeutas, 233 00:12:17,290 --> 00:12:22,930 comenzó a preocuparse de que, de hecho, quizá ELIZA sería sustituirlos. 234 00:12:22,930 --> 00:12:25,640 E incluso el ordenador Los científicos temen que estábamos 235 00:12:25,640 --> 00:12:30,040 tan cerca de la solución de lenguaje natural. 236 00:12:30,040 --> 00:12:33,520 >> Ahora, eso no era cualquier lugar cerca de la verdad. 237 00:12:33,520 --> 00:12:37,280 Pero eso es lo impresionante estos sistemas pueden parecer. 238 00:12:37,280 --> 00:12:40,080 Así que vamos a empezar a buscar debajo y tratar 239 00:12:40,080 --> 00:12:46,190 para conseguir un poco de una pregunta de donde el código que realmente sucede. 240 00:12:46,190 --> 00:12:48,170 Así que vamos a hacer este código disponibles después. 241 00:12:48,170 --> 00:12:50,880 Y esta es una muy puerto simple y directo 242 00:12:50,880 --> 00:12:53,240 de la implementación original ELIZA. 243 00:12:53,240 --> 00:12:56,350 >> Así que algunos de estos estilística cosas que verás aquí 244 00:12:56,350 --> 00:12:59,360 no son estilísticamente lo nos gustaría que hicieras 245 00:12:59,360 --> 00:13:01,480 o lo que hemos estado enseñando que hagas. 246 00:13:01,480 --> 00:13:04,770 Pero hemos tratado de mantenerlos la misma a través de los muchos puertos 247 00:13:04,770 --> 00:13:08,087 que esto ha tenido de manera que tiene el sabor de la original. 248 00:13:08,087 --> 00:13:09,920 Así que vamos a incluir un montón de cosas, 249 00:13:09,920 --> 00:13:12,920 y luego tendremos un un conjunto de palabras clave, las cosas 250 00:13:12,920 --> 00:13:16,460 que ELIZA reconocerá y responder directamente a. 251 00:13:16,460 --> 00:13:20,780 Así que si usted tiene palabras como "Puede usted" o "no hacer" o "no" 252 00:13:20,780 --> 00:13:24,680 o "sí" o "sueño" o "hola", entonces ELIZA 253 00:13:24,680 --> 00:13:27,920 responderá selectivamente a aquellos. 254 00:13:27,920 --> 00:13:30,010 También tendremos un cierto número de cosas 255 00:13:30,010 --> 00:13:34,940 que vamos a cambiar, al igual que la conversión de "mi" a "su". 256 00:13:34,940 --> 00:13:39,920 >> Y luego vamos a tener un conjunto de respuestas que para cada una de estas palabras clave, 257 00:13:39,920 --> 00:13:42,580 vamos a girar a través de estas diferentes respuestas. 258 00:13:42,580 --> 00:13:45,350 Así que si digo "sí" tres veces seguidas, me 259 00:13:45,350 --> 00:13:50,429 podría obtener tres diferentes respuestas de ELIZA. 260 00:13:50,429 --> 00:13:52,345 Nuestro código es, pues, realmente muy simple. 261 00:13:52,345 --> 00:13:59,490 Si me desplazo hacia abajo más allá todos ellos respuestas que hemos programados en 262 00:13:59,490 --> 00:14:02,920 y nos ponemos manos a nuestro principal, vamos a inicializar 263 00:14:02,920 --> 00:14:06,540 un par de diferentes variables y hacer un poco de limpieza 264 00:14:06,540 --> 00:14:08,480 al principio. 265 00:14:08,480 --> 00:14:11,760 Pero entonces no hay absolutamente un conjunto de código que usted pueda entender. 266 00:14:11,760 --> 00:14:15,820 Un bucle while grande que dice que soy va a repetir esto una y otra. 267 00:14:15,820 --> 00:14:20,420 Voy a leer en una línea, y voy a almacenar que, en una cadena de entrada. 268 00:14:20,420 --> 00:14:23,880 Voy a comprobar y ver si es la palabra clave especial "bye", que 269 00:14:23,880 --> 00:14:26,199 significa salir del programa. 270 00:14:26,199 --> 00:14:29,240 Y luego voy a comprobar y ver si alguien está simplemente repitiendo a sí mismos 271 00:14:29,240 --> 00:14:29,800 una y otra vez. 272 00:14:29,800 --> 00:14:31,174 Y voy a gritar a ellos si lo hacen. 273 00:14:31,174 --> 00:14:34,820 Voy a decir "no te repitas". 274 00:14:34,820 --> 00:14:40,500 >> Mientras que ninguno de los que suceda, vamos a a continuación, analizar a través y recorrer, 275 00:14:40,500 --> 00:14:45,330 en las líneas 308 a 313 aquí, y comprobar y ver 276 00:14:45,330 --> 00:14:49,090 son cualquiera de las palabras clave frases contenidas en la entrada 277 00:14:49,090 --> 00:14:50,620 que me acaban de dar? 278 00:14:50,620 --> 00:14:54,845 Si hay una coincidencia para ellos, así a continuación, voy a recordar esa ubicación. 279 00:14:54,845 --> 00:14:57,050 Voy a recordar esa palabra clave. 280 00:14:57,050 --> 00:14:58,620 Y voy a ser capaz de construir una respuesta. 281 00:14:58,620 --> 00:15:03,150 >> Si no encuentro uno, bueno, entonces, la última cosa en mi arsenal de palabras clave 282 00:15:03,150 --> 00:15:08,070 serán mis respuestas predeterminadas, cuando nada más partidos. 283 00:15:08,070 --> 00:15:14,160 Le preguntaré a preguntas como "¿Por qué lo hiciste vengo aquí? "o" ¿Cómo puedo ayudarle? " 284 00:15:14,160 --> 00:15:19,710 que son sólo parcialmente adecuada no importa lo que es la entrada. 285 00:15:19,710 --> 00:15:22,580 >> A continuación, le construimos la respuesta de ELIZA. 286 00:15:22,580 --> 00:15:26,040 Seremos capaces de tomar que la respuesta de base, 287 00:15:26,040 --> 00:15:28,370 tal como lo hicimos en ese ejemplo "mi jefe". 288 00:15:28,370 --> 00:15:30,970 289 00:15:30,970 --> 00:15:33,990 Si eso es todo lo que hay es-- si es sólo una 290 00:15:33,990 --> 00:15:36,860 cadena que se supone que debo respond-- Yo sólo puedo enviarlo de vuelta. 291 00:15:36,860 --> 00:15:40,610 Si tiene un asterisco al el final de la misma, entonces voy a 292 00:15:40,610 --> 00:15:45,710 procesar cada ficha individual en el resto de la respuesta del usuario 293 00:15:45,710 --> 00:15:51,590 y añadir los de, intercambiando palabra por palabra lo que necesito. 294 00:15:51,590 --> 00:15:56,100 >> Todo esto es absolutamente algo que se podría construir. 295 00:15:56,100 --> 00:15:59,230 Y de hecho, las formas en que nos tener argumentos de línea de comandos procesados, 296 00:15:59,230 --> 00:16:03,570 la forma en que usted tiene procesado a través de peticiones HTTP 297 00:16:03,570 --> 00:16:05,510 siga el mismo tipo de reglas. 298 00:16:05,510 --> 00:16:08,220 Son patrones. 299 00:16:08,220 --> 00:16:15,170 >> Así ELIZA tenía una relativamente importante impacto en lenguaje natural 300 00:16:15,170 --> 00:16:21,620 porque hacía parecer como si fuera una meta muy alcanzable, al igual que de alguna manera nos habíamos 301 00:16:21,620 --> 00:16:25,550 ser capaz de resolver este problema directamente. 302 00:16:25,550 --> 00:16:30,670 Ahora, eso no quiere decir que ELIZA hace todo lo que nos gustaría hacer. 303 00:16:30,670 --> 00:16:33,710 Ciertamente no. 304 00:16:33,710 --> 00:16:35,660 Pero debemos ser capaces de hacer algo más. 305 00:16:35,660 --> 00:16:38,280 306 00:16:38,280 --> 00:16:41,490 >> Nuestro primer paso para ir más allá de ELIZA va 307 00:16:41,490 --> 00:16:44,840 ser capaz de mirar a No está ingresado texto 308 00:16:44,840 --> 00:16:53,750 en el teclado, pero el habla, real discurso grabado en un micrófono. 309 00:16:53,750 --> 00:16:56,880 Así que si nos fijamos en estos diferentes piezas, estamos 310 00:16:56,880 --> 00:17:00,304 va a tener que construir un conjunto de modelos. 311 00:17:00,304 --> 00:17:02,970 Vamos a tener que ser capaz de para ir de la acústica de bajo nivel 312 00:17:02,970 --> 00:17:07,180 echada información--, amplitud, frequency-- 313 00:17:07,180 --> 00:17:09,530 y convertir esto en algunas unidades que estamos 314 00:17:09,530 --> 00:17:14,619 capaz de manipular con mayor facilidad y, por último, manipularlos 315 00:17:14,619 --> 00:17:18,609 en palabras y oraciones. 316 00:17:18,609 --> 00:17:22,880 >> Así que la mayoría de reconocimiento de voz sistemas que están ahí fuera hoy 317 00:17:22,880 --> 00:17:26,069 seguir una estadística modelo en el que construimos 318 00:17:26,069 --> 00:17:35,090 tres representaciones diferentes de lo que que la señal de audio contiene en realidad. 319 00:17:35,090 --> 00:17:38,640 Comenzamos con un modelo de fonética que habla de solo la base 320 00:17:38,640 --> 00:17:41,250 sonidos que estoy produciendo. 321 00:17:41,250 --> 00:17:46,900 ¿Estoy produciendo algo que es un B como en niño o una D como en el perro? 322 00:17:46,900 --> 00:17:53,220 ¿Cómo puedo reconocer los dos diferentes móviles como separado y distinto? 323 00:17:53,220 --> 00:17:56,600 >> Además de eso, vamos a continuación, construimos un modelo de pronunciación de las palabras, 324 00:17:56,600 --> 00:18:01,350 algo que une esos teléfonos individuales 325 00:18:01,350 --> 00:18:04,724 y los combina en una sola palabra. 326 00:18:04,724 --> 00:18:07,890 Y después de eso, vamos a tomar las palabras y nosotros montamos con un lenguaje 327 00:18:07,890 --> 00:18:13,010 modelar en una oración completa. 328 00:18:13,010 --> 00:18:17,230 >> Ahora, vamos a hablar de cada uno de ellos de forma independiente y por separado. 329 00:18:17,230 --> 00:18:21,580 Pero estos tres modelos son todos sólo va a ser estadísticas. 330 00:18:21,580 --> 00:18:23,502 Y eso significa que cuando nos trabajar con ellos, vamos a 331 00:18:23,502 --> 00:18:25,376 ser capaz de trabajar con todos ellos simultáneamente. 332 00:18:25,376 --> 00:18:28,100 333 00:18:28,100 --> 00:18:28,600 Correcto. 334 00:18:28,600 --> 00:18:30,890 Vamos a empezar con nuestro modelo de fonética. 335 00:18:30,890 --> 00:18:34,470 Así modelos fonéticos dependen de una técnica computacional 336 00:18:34,470 --> 00:18:37,320 llamada modelos ocultos de Markov. 337 00:18:37,320 --> 00:18:43,050 Estos son modelos gráficos en los que me tener y reconocer un estado del mundo 338 00:18:43,050 --> 00:18:46,500 como se caracteriza por un conjunto de características. 339 00:18:46,500 --> 00:18:51,960 Y ese estado describe una parte de una acción que estoy comprometido en. 340 00:18:51,960 --> 00:19:00,190 >> Así que si lo pienso hacer el sonido "ma", como madre, 341 00:19:00,190 --> 00:19:03,970 hay diferentes componentes a ese sonido. 342 00:19:03,970 --> 00:19:07,230 Hay una parte en la que me baso en la respiración. 343 00:19:07,230 --> 00:19:09,560 Y luego Aprieto los labios. 344 00:19:09,560 --> 00:19:13,710 Y Pongo los labios un poco hacia atrás granito de arena para hacer que el sonido "ma". 345 00:19:13,710 --> 00:19:15,340 Y luego está un comunicado. 346 00:19:15,340 --> 00:19:17,020 Mis labios se separan. 347 00:19:17,020 --> 00:19:19,030 El aire es expulsado. 348 00:19:19,030 --> 00:19:22,650 "Mamá." 349 00:19:22,650 --> 00:19:29,250 >> Esas tres partes diferentes serían representado por los estados en este graph-- 350 00:19:29,250 --> 00:19:33,420 el comienzo, el medio y el fin. 351 00:19:33,420 --> 00:19:38,060 Y yo tendría transiciones que me permitió viajar de un estado 352 00:19:38,060 --> 00:19:42,260 a la siguiente con una cierta probabilidad. 353 00:19:42,260 --> 00:19:47,250 Así, por ejemplo, que M sonar podría tener un muy, 354 00:19:47,250 --> 00:19:51,850 ingesta muy corto en el beginning-- "mm" - y luego un más largo, 355 00:19:51,850 --> 00:19:55,640 fase vibratoria donde me estoy conteniendo los labios y casi humming-- 356 00:19:55,640 --> 00:20:05,090 "mmmm" - y luego un muy corto plosive donde yo expulso breath-- "ma". 357 00:20:05,090 --> 00:20:09,370 >> El modelo oculto de Markov es diseñado para capturar el hecho de 358 00:20:09,370 --> 00:20:13,340 que la forma en que hago ese sonido "ma" se va 359 00:20:13,340 --> 00:20:17,350 a ser ligeramente diferente en su temporización, es la frecuencia, 360 00:20:17,350 --> 00:20:21,030 y sus funciones que la forma en que usted lo hace 361 00:20:21,030 --> 00:20:23,300 o la manera en que yo podría hacerlo cuando estoy hablando 362 00:20:23,300 --> 00:20:26,030 unos usos diferentes de la letra. 363 00:20:26,030 --> 00:20:33,240 "Madre" y "puede que" voluntad sonar ligeramente diferente. 364 00:20:33,240 --> 00:20:36,800 >> Así que para reconocer una en particular sonido, lo haríamos 365 00:20:36,800 --> 00:20:42,020 construir modelos de Markov, éstos oculto de Markov modelos, de todos los teléfonos posible que yo 366 00:20:42,020 --> 00:20:45,840 puede ser que desee reconocer, cada sonido posible, 367 00:20:45,840 --> 00:20:49,750 y luego mirar el datos acústicos que tengo 368 00:20:49,750 --> 00:20:54,430 y determinar estadísticamente cuál es la más probable 369 00:20:54,430 --> 00:20:58,110 haber producido este sonido. 370 00:20:58,110 --> 00:20:58,610 OK. 371 00:20:58,610 --> 00:21:01,540 372 00:21:01,540 --> 00:21:06,750 Con ese modelo, que luego empezar a construir en la parte superior de la misma. 373 00:21:06,750 --> 00:21:09,330 Tomamos un modelo de pronunciación. 374 00:21:09,330 --> 00:21:11,790 Ahora, pronunciación veces modelos son simples y fáciles 375 00:21:11,790 --> 00:21:14,440 porque sólo hay una manera de pronunciar algo. 376 00:21:14,440 --> 00:21:17,990 Otras veces, son un poco más complicado. 377 00:21:17,990 --> 00:21:21,340 He aquí una guía de pronunciación para esa cosa roja que es 378 00:21:21,340 --> 00:21:25,210 una fruta que usted hace la salsa de tomate fuera de. 379 00:21:25,210 --> 00:21:27,360 La gente no piensa que es una fruta. 380 00:21:27,360 --> 00:21:27,860 ¿Correcto? 381 00:21:27,860 --> 00:21:30,880 382 00:21:30,880 --> 00:21:35,300 >> Ahora, hay muchas maneras diferentes que las personas se pronuncia esta palabra. 383 00:21:35,300 --> 00:21:37,780 Algunos dirán "toe-may-toe". 384 00:21:37,780 --> 00:21:40,880 Algunos dirán "toe-mah-toe". 385 00:21:40,880 --> 00:21:44,800 Y podemos captar que con uno de estos modelos gráficos 386 00:21:44,800 --> 00:21:48,305 donde, de nuevo, representamos transiciones como teniendo una cierta probabilidad 387 00:21:48,305 --> 00:21:51,360 y asociado probabilidad con ellos. 388 00:21:51,360 --> 00:21:58,290 >> Así que en este caso, si tuviera que seguir la ruta superior a través de todo este gráfica, 389 00:21:58,290 --> 00:22:03,330 Yo estaría empezando en la letra En el extremo izquierdo, el "ta" de sonido. 390 00:22:03,330 --> 00:22:07,570 Me tomaré la mitad superior, el "oh" y luego un "ma" 391 00:22:07,570 --> 00:22:14,530 y luego una "a", y luego un "ta", y un "oh". "Toe-may-toe". 392 00:22:14,530 --> 00:22:19,610 Si tomé el camino de fondo a través de esto, voy a conseguir "ta-mah-toe". 393 00:22:19,610 --> 00:22:26,810 Y si me bajé y después hasta, me gustaría tener "ta-may-dedo del pie." 394 00:22:26,810 --> 00:22:29,950 >> Estos modelos capturan éstos diferencias porque siempre 395 00:22:29,950 --> 00:22:32,410 desplegamos una de ellas sistemas de reconocimiento, 396 00:22:32,410 --> 00:22:35,340 que va a tener que trabajar con un montón de diferentes tipos de personas, 397 00:22:35,340 --> 00:22:39,295 un montón de diferentes acentos, e incluso diferentes usos de las mismas palabras. 398 00:22:39,295 --> 00:22:42,204 399 00:22:42,204 --> 00:22:44,120 Por último, además de eso, vamos a construir algo 400 00:22:44,120 --> 00:22:48,780 que se ve muy complicado, llamado el modelo de lenguaje, 401 00:22:48,780 --> 00:22:52,950 pero en realidad es el más simple de los tres debido a que estos operan 402 00:22:52,950 --> 00:22:56,041 en lo que se llaman modelos de n-gram. 403 00:22:56,041 --> 00:23:02,270 Y en este caso, te estoy mostrando un modelo de n-gramas de dos partes, una bigrama. 404 00:23:02,270 --> 00:23:08,910 Vamos a hacer física la idea que a veces, ciertas palabras son 405 00:23:08,910 --> 00:23:14,680 más propensos a seguir una dada palabra que otros. 406 00:23:14,680 --> 00:23:25,210 Si acabo de decir "el pronóstico del tiempo" la siguiente palabra probablemente podría ser "hoy" 407 00:23:25,210 --> 00:23:31,510 o podría ser "el clima la predicción para mañana ". 408 00:23:31,510 --> 00:23:38,870 Pero es poco probable que sea "la previsión meteorológica de la alcachofa ". 409 00:23:38,870 --> 00:23:42,980 >> Lo que un modelo de lenguaje hace es que captura los estadísticamente 410 00:23:42,980 --> 00:23:47,450 contando, desde algunas muy grandes corpus, todas las instancias 411 00:23:47,450 --> 00:23:50,890 en el que una palabra sigue a otro. 412 00:23:50,890 --> 00:23:54,300 Así que si me tomo un gran corpus-- como cada Wall Street Journal 413 00:23:54,300 --> 00:24:00,750 que se ha producido desde 1930, que es uno de los corpuses-- estándar 414 00:24:00,750 --> 00:24:03,910 y miro a través de todo ese texto, y cuento 415 00:24:03,910 --> 00:24:09,770 hasta cuántas veces después "pronóstico" qué veo "hoy" 416 00:24:09,770 --> 00:24:17,454 y cuántas veces lo hago veo "previsión", seguido de "alcachofa" 417 00:24:17,454 --> 00:24:19,370 el primero va a ser mucho más probable. 418 00:24:19,370 --> 00:24:21,540 Va a aparecer con mucha más frecuencia. 419 00:24:21,540 --> 00:24:24,610 Y por lo que tendrá un mayor probabilidad asociada a ella. 420 00:24:24,610 --> 00:24:27,340 >> Si quiero averiguar la probabilidad de todo un enunciado, 421 00:24:27,340 --> 00:24:29,940 entonces, yo sólo romperlo. 422 00:24:29,940 --> 00:24:35,990 Por lo tanto la probabilidad de audiencia la frase "la rata se comió el queso" 423 00:24:35,990 --> 00:24:39,110 es la probabilidad de la palabra "el" a partir de una frase, 424 00:24:39,110 --> 00:24:42,540 y entonces la probabilidad de que el palabra "rata" sigue a la palabra "the" 425 00:24:42,540 --> 00:24:44,910 y la probabilidad de que la palabra "comió" siguiente "rata" 426 00:24:44,910 --> 00:24:51,120 y la probabilidad de que "queso" sigue "comió". 427 00:24:51,120 --> 00:24:55,160 >> Esto suena como una gran cantidad de estadísticas, una gran cantidad de probabilidades. 428 00:24:55,160 --> 00:24:57,510 Y eso es todo lo que es. 429 00:24:57,510 --> 00:25:02,920 Pero lo sorprendente es que si usted hace esto con una muestra suficientemente grande de datos, 430 00:25:02,920 --> 00:25:03,670 funciona. 431 00:25:03,670 --> 00:25:05,250 Y funciona tremendamente bien. 432 00:25:05,250 --> 00:25:07,810 433 00:25:07,810 --> 00:25:11,420 Todos sabemos que estas tecnologías. 434 00:25:11,420 --> 00:25:16,500 La mayoría de los sistemas operativos vienen con reconocimiento de voz en este punto. 435 00:25:16,500 --> 00:25:20,940 Utilizamos Siri y Cortana y Echo. 436 00:25:20,940 --> 00:25:25,070 Y estas cosas se basan en este tipo de de tres capas model-- 437 00:25:25,070 --> 00:25:30,620 un modelo fonética en la parte inferior, una modelo de pronunciación en el medio, 438 00:25:30,620 --> 00:25:33,690 y un modelo de lenguaje en la parte superior de ellos. 439 00:25:33,690 --> 00:25:37,630 >> Ahora, tienen que hacer un poco más que con el fin de responder a las preguntas. 440 00:25:37,630 --> 00:25:43,000 Pero el reconocimiento de lo que eres dicho depende exactamente en eso. 441 00:25:43,000 --> 00:25:45,700 Así que echemos un ejemplo aquí. 442 00:25:45,700 --> 00:25:52,020 Así que tengo mi teléfono sentado aquí por debajo de la cámara de documentos. 443 00:25:52,020 --> 00:25:56,110 Y vamos a pide Siri algunas preguntas. 444 00:25:56,110 --> 00:25:57,150 ¿Correcto? 445 00:25:57,150 --> 00:25:59,940 >> Así que vamos a despertar a mi teléfono aquí. 446 00:25:59,940 --> 00:26:02,710 447 00:26:02,710 --> 00:26:05,000 Siri, ¿cuál es el clima como en New Haven hoy? 448 00:26:05,000 --> 00:26:07,670 449 00:26:07,670 --> 00:26:10,780 >> SIRI: Aquí está el clima para New Haven, Connecticut hoy. 450 00:26:10,780 --> 00:26:11,890 >> BRIAN Scassellati: OK. 451 00:26:11,890 --> 00:26:16,720 Así que primero que vio que Siri reconocido cada una de las palabras individuales 452 00:26:16,720 --> 00:26:19,050 y luego producido una respuesta. 453 00:26:19,050 --> 00:26:22,277 Hablaremos de cómo esa respuesta viene alrededor de un poco. 454 00:26:22,277 --> 00:26:24,110 Pero ahora que sabemos que esto se basa simplemente 455 00:26:24,110 --> 00:26:28,880 en las estadísticas de primas y este patrón de tipo coincidencia de enfoque, 456 00:26:28,880 --> 00:26:31,120 podemos jugar algunos juegos con Siri. 457 00:26:31,120 --> 00:26:34,560 >> Así que puedo intentarlo de nuevo. 458 00:26:34,560 --> 00:26:38,864 Siri, ¿cuál es el clima hipopótamo New Haven, hoy? 459 00:26:38,864 --> 00:26:39,810 >> SIRI: OK. 460 00:26:39,810 --> 00:26:44,245 Aquí está el tiempo en New Haven, Connecticut para hoy. 461 00:26:44,245 --> 00:26:46,120 BRIAN Scassellati: Siri No intimidado por que 462 00:26:46,120 --> 00:26:50,980 porque se encontró la pattern-- "tiempo", "hoy", "New Haven". 463 00:26:50,980 --> 00:26:54,420 Eso es lo que está respondiendo que, al igual que ELIZA. 464 00:26:54,420 --> 00:26:54,920 Correcto. 465 00:26:54,920 --> 00:26:59,390 Vamos a darle una más aun ejemplo más ridículo. 466 00:26:59,390 --> 00:27:03,075 Siri, alcachofa tiempo armadillo hipopótamo New Haven? 467 00:27:03,075 --> 00:27:06,806 468 00:27:06,806 --> 00:27:08,400 >> SIRI: Déjame ver cómo está eso. 469 00:27:08,400 --> 00:27:11,280 Esto es lo que encontré en la web para lo que son las alcachofas armadillo 470 00:27:11,280 --> 00:27:13,780 hipopótamo New Haven. 471 00:27:13,780 --> 00:27:14,760 >> BRIAN Scassellati: OK. 472 00:27:14,760 --> 00:27:20,400 Así que si me voy lo suficientemente lejos de este modelo, 473 00:27:20,400 --> 00:27:24,365 Soy capaz de confundir porque hay ya coincide con el patrón que tiene. 474 00:27:24,365 --> 00:27:27,370 475 00:27:27,370 --> 00:27:29,390 Y esa estadística motor que está diciendo, 476 00:27:29,390 --> 00:27:32,850 ¿cuál es la probabilidad de que tienes las palabras de hipopótamo y alcachofa 477 00:27:32,850 --> 00:27:34,440 juntos, y armadillo? 478 00:27:34,440 --> 00:27:36,050 Eso tiene que ser algo nuevo. 479 00:27:36,050 --> 00:27:38,840 480 00:27:38,840 --> 00:27:40,610 >> Así que estas tecnologías que usamos todos los días. 481 00:27:40,610 --> 00:27:43,670 482 00:27:43,670 --> 00:27:47,800 Si queremos llevarlos un paso Además, sin embargo, si en realidad 483 00:27:47,800 --> 00:27:53,930 quiero ser capaz de hablar de lo que es que estos sistemas están respondiendo a, 484 00:27:53,930 --> 00:28:00,630 tenemos que hablar, de nuevo, sobre un conjunto más fundamental de preguntas. 485 00:28:00,630 --> 00:28:05,370 Y eso es un tema de la comunicación que denominamos pregunta de respuesta. 486 00:28:05,370 --> 00:28:07,028 Es decir, queremos ser capaces a-- ¿sí? 487 00:28:07,028 --> 00:28:07,944 AUDIENCIA: [inaudible]. 488 00:28:07,944 --> 00:28:10,789 489 00:28:10,789 --> 00:28:13,330 BRIAN Scassellati: ¿Conseguimos en el procesamiento semántico latente? 490 00:28:13,330 --> 00:28:14,070 Entonces sí. 491 00:28:14,070 --> 00:28:17,820 Hay un montón de cosas que son pasando por debajo de la superficie con Siri 492 00:28:17,820 --> 00:28:20,210 y en algunos de los ejemplos Voy a mostrarle al lado 493 00:28:20,210 --> 00:28:22,610 donde hay un poco en términos de la estructura 494 00:28:22,610 --> 00:28:25,260 de lo que estás diciendo que eso es importante. 495 00:28:25,260 --> 00:28:31,890 Y, de hecho, eso es un gran precursor para la siguiente diapositiva para mí. 496 00:28:31,890 --> 00:28:35,110 >> Así que de la misma manera que nuestro reconocimiento de voz se construyó 497 00:28:35,110 --> 00:28:39,620 de múltiples capas, si queremos entender qué es lo que en realidad es 498 00:28:39,620 --> 00:28:44,620 Dicho esto, vamos a volver basarse en un análisis multi-capa de 499 00:28:44,620 --> 00:28:47,020 del texto que está siendo reconocido. 500 00:28:47,020 --> 00:28:52,560 Así que cuando Siri es realmente capaz de por ejemplo, veo que encontré estas palabras. 501 00:28:52,560 --> 00:28:55,230 Ahora, ¿qué hago con ellos? 502 00:28:55,230 --> 00:28:59,110 El primer componente es a menudo pasar y tratar de analizar 503 00:28:59,110 --> 00:29:03,010 la estructura de la frase. 504 00:29:03,010 --> 00:29:05,410 Y en lo que hemos visto en la escuela primaria, a menudo, 505 00:29:05,410 --> 00:29:08,920 como una especie de diagramación frases, vamos 506 00:29:08,920 --> 00:29:12,774 reconocer que cierta las palabras tienen ciertos roles. 507 00:29:12,774 --> 00:29:13,440 Estos son los nombres. 508 00:29:13,440 --> 00:29:14,231 Estos son los pronombres. 509 00:29:14,231 --> 00:29:16,200 Estos son los verbos. 510 00:29:16,200 --> 00:29:19,460 Y vamos a reconocer que para una gramática particular 511 00:29:19,460 --> 00:29:24,700 en este caso Inglés gramática, hay formas válidas en el que puedo combinarlos 512 00:29:24,700 --> 00:29:26,280 y otras formas que no son válidos. 513 00:29:26,280 --> 00:29:29,920 514 00:29:29,920 --> 00:29:33,870 >> Ese reconocimiento, que la estructura, podría ser suficiente para ayudar a guiarnos 515 00:29:33,870 --> 00:29:36,720 Un poco. 516 00:29:36,720 --> 00:29:39,820 Pero no es suficiente para que seamos capaces de dar 517 00:29:39,820 --> 00:29:43,290 cualquier sentido a lo que se dice aquí. 518 00:29:43,290 --> 00:29:46,615 Para hacer eso, vamos a tener que depender de una cierta cantidad de procesamiento semántico. 519 00:29:46,615 --> 00:29:49,590 520 00:29:49,590 --> 00:29:55,080 Es decir, que vamos a tener que mirar en debajo de lo que cada una de estas palabras 521 00:29:55,080 --> 00:29:57,400 en realidad lleva como significado. 522 00:29:57,400 --> 00:30:01,150 Y en la forma más sencilla de hacer esto, vamos a asociar con cada palabra 523 00:30:01,150 --> 00:30:06,930 que sabemos que una determinada función, una cierta transformación que 524 00:30:06,930 --> 00:30:09,300 permite que suceda. 525 00:30:09,300 --> 00:30:14,470 >> En este caso, podríamos etiquetar el palabra "Juan" como un nombre propio, 526 00:30:14,470 --> 00:30:18,160 que lleva consigo una identidad. 527 00:30:18,160 --> 00:30:21,530 Y podríamos etiquetar "María", como de la misma manera. 528 00:30:21,530 --> 00:30:27,900 Mientras que un verbo como "amores", que constituye una relación particular 529 00:30:27,900 --> 00:30:31,582 que somos capaces de representar. 530 00:30:31,582 --> 00:30:33,290 Ahora, eso no quiere decir que entendemos 531 00:30:33,290 --> 00:30:37,680 qué es el amor, sino sólo que entendemos en la forma de un sistema simbólico. 532 00:30:37,680 --> 00:30:40,480 Es decir, podemos etiquetar y manipularlo. 533 00:30:40,480 --> 00:30:44,230 534 00:30:44,230 --> 00:30:49,120 >> Con cada uno de estos tipos de enfoques, cualquier tipo de procesamiento semántico 535 00:30:49,120 --> 00:30:57,060 aquí va a requerir un poco poco de conocimiento y un montón de trabajo 536 00:30:57,060 --> 00:30:59,020 De nuestra parte. 537 00:30:59,020 --> 00:31:03,590 Ya no estamos en el reino donde las estadísticas apenas llano 538 00:31:03,590 --> 00:31:07,320 van a ser suficiente para nosotros. 539 00:31:07,320 --> 00:31:11,330 Ahora, con el fin de ir desde este punto de ser 540 00:31:11,330 --> 00:31:15,520 capaz de hablar sobre el interior de lo que en realidad está pasando aquí, 541 00:31:15,520 --> 00:31:19,640 para ser capaz de manipular este estructurar y entender una pregunta 542 00:31:19,640 --> 00:31:23,160 y luego poder para salir a buscar, 543 00:31:23,160 --> 00:31:27,290 que requiere un mayor modelo cognitivo complejo. 544 00:31:27,290 --> 00:31:34,880 >> La forma en que se construyen estos sistemas es en su mayor parte muy, muy laboral 545 00:31:34,880 --> 00:31:36,350 intensivo. 546 00:31:36,350 --> 00:31:39,490 Implican humanos gastar una gran cantidad 547 00:31:39,490 --> 00:31:44,100 de tiempo estructurar las formas en que este tipo de sentencias 548 00:31:44,100 --> 00:31:47,270 se puede representar en cierta lógica. 549 00:31:47,270 --> 00:31:51,639 550 00:31:51,639 --> 00:31:53,430 Se hace aún un poco más complejo, sin embargo. 551 00:31:53,430 --> 00:31:56,400 552 00:31:56,400 --> 00:31:59,660 >> Incluso una vez que hemos tratado con la semántica, vamos a 553 00:31:59,660 --> 00:32:03,860 todavía tiene que mirar el pragmática de lo que se dice. 554 00:32:03,860 --> 00:32:08,620 Es decir, ¿cómo me relaciono las palabras que tengo que algo físicamente 555 00:32:08,620 --> 00:32:12,054 hay en el mundo, o al menos algunos fuente de información 556 00:32:12,054 --> 00:32:12,970 que puedo manipular? 557 00:32:12,970 --> 00:32:15,780 558 00:32:15,780 --> 00:32:20,790 >> A veces, estos conducen a maravillosos trozos de ambigüedad. 559 00:32:20,790 --> 00:32:24,470 "Al rojo vivo estrella para casó astrónomo." 560 00:32:24,470 --> 00:32:25,630 OK. 561 00:32:25,630 --> 00:32:28,540 Ahora, leemos que como el Tipo divertida del título 562 00:32:28,540 --> 00:32:34,690 que íbamos a ver en la noche de TV porque nosotros no interpretamos "estrella" 563 00:32:34,690 --> 00:32:38,630 tener su significado cuerpo celeste. 564 00:32:38,630 --> 00:32:43,390 Sabemos que esto significa más el actor o actriz habitual 565 00:32:43,390 --> 00:32:45,240 con altas cantidades de visibilidad. 566 00:32:45,240 --> 00:32:47,770 567 00:32:47,770 --> 00:32:51,950 >> "Escuadrón de ayuda a las víctimas de mordedura de perro." 568 00:32:51,950 --> 00:32:55,550 ¿Es que el equipo es en realidad por ahí ayudando a un perro 569 00:32:55,550 --> 00:32:59,620 en dar la vuelta y morder las víctimas? 570 00:32:59,620 --> 00:33:02,380 ¿O es que no había un individuo que era 571 00:33:02,380 --> 00:33:04,625 mordido por un perro que necesita un poco de ayuda? 572 00:33:04,625 --> 00:33:07,650 573 00:33:07,650 --> 00:33:11,480 Sólo de mirar a la sintaxis y la semántica de las sentencias, 574 00:33:11,480 --> 00:33:14,660 no podemos determinar eso. 575 00:33:14,660 --> 00:33:22,000 >> "Helicóptero accionado por moscas humanos." 576 00:33:22,000 --> 00:33:27,330 ¿Hay, de hecho, real pequeñas cosas volando alrededor 577 00:33:27,330 --> 00:33:34,510 son personas con alas alimentación helicópteros para el bien de la humanidad? 578 00:33:34,510 --> 00:33:38,960 ¿O hay un dispositivo mecánico que deriva su energía de una persona? 579 00:33:38,960 --> 00:33:41,600 580 00:33:41,600 --> 00:33:46,500 >> Cuando nos fijamos en cuestión sistemas contestadores, 581 00:33:46,500 --> 00:33:51,110 éstas son las capas que tenemos que tratar. 582 00:33:51,110 --> 00:33:54,890 Ahora, los mejores y los más suerte de prevalente de estos sistemas 583 00:33:54,890 --> 00:34:00,640 hoy en día son capaces de hacer las cosas a un nivel que son 584 00:34:00,640 --> 00:34:05,050 mucho más allá de lo que teníamos hace 10 años. 585 00:34:05,050 --> 00:34:08,210 Aquí está uno de los mejores sistemas eso es por ahí hoy en día. 586 00:34:08,210 --> 00:34:10,519 Y este es un sistema de IBM llamado Watson. 587 00:34:10,519 --> 00:34:13,040 588 00:34:13,040 --> 00:34:15,500 Esto es de nuestros amigos de IBM. 589 00:34:15,500 --> 00:34:19,810 Se trata de los bancos Katherine, Jia Chen, y Priscila Moraes dándonos 590 00:34:19,810 --> 00:34:26,323 una demostración de Watson ayer en IBM en Yorktown. 591 00:34:26,323 --> 00:34:26,989 [REPRODUCCIÓN DE VÍDEO] 592 00:34:26,989 --> 00:34:27,690 -¿Como estas? 593 00:34:27,690 --> 00:34:30,600 594 00:34:30,600 --> 00:34:31,980 >> -Yo soy así. 595 00:34:31,980 --> 00:34:35,429 Siempre estoy feliz cuando estoy pensando, sobre todo cuando me 596 00:34:35,429 --> 00:34:38,920 puede mantenerse fresco en estas salas de servidores. 597 00:34:38,920 --> 00:34:40,170 -¿Quién Es tu actriz favorita? 598 00:34:40,170 --> 00:34:43,870 599 00:34:43,870 --> 00:34:47,555 >> -Mi Actriz favorita Angelina Jolie como Lara Croft 600 00:34:47,555 --> 00:34:54,800 en Tomb Raider porque su original, forma era como un personaje virtual como yo. 601 00:34:54,800 --> 00:34:56,760 >> -¿Cómo Puede Watson ayudar a los pacientes? 602 00:34:56,760 --> 00:34:59,700 603 00:34:59,700 --> 00:35:03,755 >> -Es El plan para los pacientes a tener acceso a Watson directamente? 604 00:35:03,755 --> 00:35:08,050 El acceso a Watson de asesoramiento aplicaciones varían según el caso de uso. 605 00:35:08,050 --> 00:35:12,630 Pero en la actualidad, Watson sólo proporcionará posible diagnóstico y tratamiento 606 00:35:12,630 --> 00:35:14,725 opciones al profesional de la medicina. 607 00:35:14,725 --> 00:35:17,680 En su caso, los pacientes puede proporcionar información 608 00:35:17,680 --> 00:35:21,210 a Watson, tal vez a través de una interfaz de portal web, tableta, 609 00:35:21,210 --> 00:35:23,500 o incluso un teléfono móvil. 610 00:35:23,500 --> 00:35:27,180 Por ejemplo, un paciente puede estar les pidió que describieran sus síntomas 611 00:35:27,180 --> 00:35:30,460 en lenguaje natural directamente en una solución Watson, 612 00:35:30,460 --> 00:35:34,050 permitiendo que el médico se centre en recopilación de datos y no diagnóstico. 613 00:35:34,050 --> 00:35:38,379 614 00:35:38,379 --> 00:35:42,716 >> -¿Quién Asesinado Abraham Lincoln? 615 00:35:42,716 --> 00:35:46,153 >> -John Wilkes Booth. 616 00:35:46,153 --> 00:35:52,373 >> -¿En Qué año hizo el Arizona Diamondbacks ganan la Serie Mundial? 617 00:35:52,373 --> 00:35:55,295 >> -2001. 618 00:35:55,295 --> 00:35:58,710 >> [FIN DE REPRODUCCIÓN] 619 00:35:58,710 --> 00:36:01,610 >> BRIAN Scassellati: Así este tipo de sistemas 620 00:36:01,610 --> 00:36:07,430 tiene que confiar en primer lugar el reconocimiento de la voz; segundo, 621 00:36:07,430 --> 00:36:12,200 convirtiéndola en una interna significativa representación; y luego, tercero, 622 00:36:12,200 --> 00:36:17,090 ser capaz de salir y encontrar la fuente de información que 623 00:36:17,090 --> 00:36:21,140 les permite responder a esa pregunta. 624 00:36:21,140 --> 00:36:27,320 Este nivel de complejidad implica los mismos tipos de cosas programáticas 625 00:36:27,320 --> 00:36:31,790 que ha sido haciendo en los boletines de problemas. 626 00:36:31,790 --> 00:36:38,000 >> Somos capaces de analizar las peticiones HTTP en el mismo tipo de patrón de bajo nivel 627 00:36:38,000 --> 00:36:40,810 coincidente que ELIZA puede hacer. 628 00:36:40,810 --> 00:36:45,070 Somos capaces de convertir los en una representación interna, 629 00:36:45,070 --> 00:36:50,360 y luego usarlos para consultar alguna base de datos externa, posiblemente utilizando SQL. 630 00:36:50,360 --> 00:36:53,530 631 00:36:53,530 --> 00:36:56,260 Todos los sistemas que se están construyendo hoy 632 00:36:56,260 --> 00:37:00,520 para hacer este tipo de recursos naturales comunicación lingüística 633 00:37:00,520 --> 00:37:04,100 se están construyendo en estos mismos principios. 634 00:37:04,100 --> 00:37:09,530 >> Ahora, incluso un sistema como Watson no es lo suficientemente compleja 635 00:37:09,530 --> 00:37:14,820 ser capaz de responder arbitrario preguntas acerca de cualquier tema. 636 00:37:14,820 --> 00:37:20,060 Y de hecho, tienen que estar estructurado dentro de un dominio dado. 637 00:37:20,060 --> 00:37:24,440 Así que usted puede ir en línea y usted puede encontrar versiones de Watson que operan bien 638 00:37:24,440 --> 00:37:27,700 dentro de la informática médica. 639 00:37:27,700 --> 00:37:31,490 O hay una línea que solo se ocupa de la forma 640 00:37:31,490 --> 00:37:34,540 para hacer buenas recomendaciones sobre qué cerveza irá con el cual los alimentos. 641 00:37:34,540 --> 00:37:37,060 642 00:37:37,060 --> 00:37:41,870 Y dentro de esos dominios, que puede responder a las preguntas, 643 00:37:41,870 --> 00:37:46,130 encontrar la información que necesita. 644 00:37:46,130 --> 00:37:48,270 >> Pero no se puede mezclar y combinar. 645 00:37:48,270 --> 00:37:53,150 El sistema que se ha entrenado con la base de datos de la comida y la cerveza 646 00:37:53,150 --> 00:37:56,830 no funciona bien cuando de repente lo puso en la informática médica 647 00:37:56,830 --> 00:37:59,770 base de datos. 648 00:37:59,770 --> 00:38:05,680 Así que incluso nuestros mejores sistemas actuales confiar en un nivel de procesamiento 649 00:38:05,680 --> 00:38:11,570 en el que estamos codificación manual y la construcción de la infraestructura con el fin 650 00:38:11,570 --> 00:38:13,275 para que este sistema funcione. 651 00:38:13,275 --> 00:38:16,360 652 00:38:16,360 --> 00:38:20,710 >> Ahora, el último tema que quiero para poder llegar a la actualidad 653 00:38:20,710 --> 00:38:23,960 es acerca de la comunicación no verbal. 654 00:38:23,960 --> 00:38:29,290 Una gran masa de información que nos comunicamos con los demás 655 00:38:29,290 --> 00:38:35,490 no se produce a través de la palabras individuales que estamos solicitando. 656 00:38:35,490 --> 00:38:40,290 Tiene que ver con cosas como proximidad, la mirada, el tono de su voz, 657 00:38:40,290 --> 00:38:42,270 su inflexión. 658 00:38:42,270 --> 00:38:46,620 Y que la comunicación es también algo que muchas interfaces diferentes 659 00:38:46,620 --> 00:38:49,960 cuidar mucho sobre. 660 00:38:49,960 --> 00:38:51,500 No es lo que Siri le importa. 661 00:38:51,500 --> 00:38:56,250 Puedo pedir a Siri algo en una sola voz o en un tono de voz diferente, 662 00:38:56,250 --> 00:38:59,840 y Siri va a dame la misma respuesta. 663 00:38:59,840 --> 00:39:05,260 Pero eso no es lo que construimos para muchos otros tipos de interfaces. 664 00:39:05,260 --> 00:39:09,120 >> Quiero presentarles ahora a uno de los robots. 665 00:39:09,120 --> 00:39:12,720 Este fue construido por mi desde hace mucho tiempo amigo y colega Cynthia 666 00:39:12,720 --> 00:39:16,010 Breazeal y su compañía Jibo. 667 00:39:16,010 --> 00:39:20,090 Y esto robot-- vamos tener un par de voluntarios 668 00:39:20,090 --> 00:39:22,520 llegar a interactuar con este. 669 00:39:22,520 --> 00:39:26,200 Así que puedo tener dos personas dispuestas jugar con el robot para mí? 670 00:39:26,200 --> 00:39:29,936 ¿Por qué no vienes en un máximo, y ¿por qué no vienes en adelante. 671 00:39:29,936 --> 00:39:31,310 Si desea unirse a mí aquí, por favor. 672 00:39:31,310 --> 00:39:36,520 673 00:39:36,520 --> 00:39:39,670 >> Y si pudiera tenerte venir por aquí. 674 00:39:39,670 --> 00:39:40,170 Gracias. 675 00:39:40,170 --> 00:39:40,480 Hola. 676 00:39:40,480 --> 00:39:41,400 >> ALFREDO: Encantado de conocerte. 677 00:39:41,400 --> 00:39:42,010 Alfredo. 678 00:39:42,010 --> 00:39:42,520 >> BRIAN Scassellati: Alfredo. 679 00:39:42,520 --> 00:39:43,146 >> Raquel: Raquel. 680 00:39:43,146 --> 00:39:44,228 BRIAN Scassellati: Rachel. 681 00:39:44,228 --> 00:39:45,154 Encantado de conocerte ambos. 682 00:39:45,154 --> 00:39:46,820 Alfredo, yo voy a tener que ir primero. 683 00:39:46,820 --> 00:39:47,990 Ven hasta aquí. 684 00:39:47,990 --> 00:39:51,870 Voy a introducir usted-- si puedo conseguir esto de 685 00:39:51,870 --> 00:39:58,450 sin llamar la microphone-- a un pequeño robot llamado Jibo. 686 00:39:58,450 --> 00:40:00,140 ¿De acuerdo? 687 00:40:00,140 --> 00:40:04,260 >> Ahora, Jibo está diseñado para ser interactivo. 688 00:40:04,260 --> 00:40:09,339 Y a pesar de que le puede dar el discurso, gran parte de la interacción con el robot 689 00:40:09,339 --> 00:40:09,880 es no verbal. 690 00:40:09,880 --> 00:40:12,450 691 00:40:12,450 --> 00:40:17,070 Alfredo, te voy a pedir que decir algo agradable y conexión 692 00:40:17,070 --> 00:40:19,554 al robot, por favor. 693 00:40:19,554 --> 00:40:20,845 ALFREDO: Creo que te ves linda. 694 00:40:20,845 --> 00:40:24,114 695 00:40:24,114 --> 00:40:25,611 >> [Zumbido] 696 00:40:25,611 --> 00:40:26,192 697 00:40:26,192 --> 00:40:27,108 BRIAN Scassellati: OK. 698 00:40:27,108 --> 00:40:30,110 699 00:40:30,110 --> 00:40:33,180 Su respuesta no es verbal. 700 00:40:33,180 --> 00:40:35,180 Y sin embargo, te dio tanto un claro reconocimiento 701 00:40:35,180 --> 00:40:39,680 que había oído lo que ha dicho y también se entiende que de alguna manera. 702 00:40:39,680 --> 00:40:40,530 ¿De acuerdo? 703 00:40:40,530 --> 00:40:42,070 Paso de vuelta aquí durante un segundo. 704 00:40:42,070 --> 00:40:43,130 Gracias. 705 00:40:43,130 --> 00:40:44,090 >> Rachel, si lo haría. 706 00:40:44,090 --> 00:40:46,070 Ahora, yo voy a dar que el trabajo mucho más difícil. 707 00:40:46,070 --> 00:40:48,361 Si desea parado aquí, copia de seguridad de sólo un poco por lo que 708 00:40:48,361 --> 00:40:50,280 podemos conseguir que en la cámara y buscar de esta manera. 709 00:40:50,280 --> 00:40:56,840 Voy a pedirle que decir algo realmente significa y desagradable al robot. 710 00:40:56,840 --> 00:41:02,900 >> RACHEL: Lo que parecía que hacer era completamente absurdo. 711 00:41:02,900 --> 00:41:03,840 >> [Zumbido] 712 00:41:03,840 --> 00:41:07,610 713 00:41:07,610 --> 00:41:09,030 >> Eso fue aún más absurdo. 714 00:41:09,030 --> 00:41:10,120 ¿Qué está pasando con usted? 715 00:41:10,120 --> 00:41:13,487 716 00:41:13,487 --> 00:41:16,207 Ah, no te sientas mal. 717 00:41:16,207 --> 00:41:17,040 Te voy a dar un abrazo. 718 00:41:17,040 --> 00:41:19,882 719 00:41:19,882 --> 00:41:21,090 BRIAN Scassellati: De acuerdo. 720 00:41:21,090 --> 00:41:22,280 Gracias, Rachel. 721 00:41:22,280 --> 00:41:24,565 Alfredo, Rachel, gracias chicos mucho. 722 00:41:24,565 --> 00:41:26,840 >> [APLAUSOS] 723 00:41:26,840 --> 00:41:28,660 724 00:41:28,660 --> 00:41:34,470 >> Así que este tipo de interacción tiene en muchas maneras algunas de las mismas reglas 725 00:41:34,470 --> 00:41:36,950 y algunos de los mismos estructura como lo que 726 00:41:36,950 --> 00:41:39,950 podría tener en la interacción lingüística. 727 00:41:39,950 --> 00:41:44,530 Es a la vez comunicativo y sirve un propósito importante. 728 00:41:44,530 --> 00:41:48,590 Y esa interacción, en muchas maneras, está diseñado 729 00:41:48,590 --> 00:41:52,890 para tener un efecto particular sobre la persona que interactúa con o escuchando 730 00:41:52,890 --> 00:41:54,410 al robot. 731 00:41:54,410 --> 00:41:56,450 >> Ahora, tengo la suerte tener Jibo aquí hoy. 732 00:41:56,450 --> 00:42:00,550 Sam Spaulding está aquí para ayudar nos cabo con el robot. 733 00:42:00,550 --> 00:42:07,470 Y yo voy a pedir Sam para dar nosotros una buena demostración de la danza Jibo 734 00:42:07,470 --> 00:42:09,720 que podemos ver al final aquí. 735 00:42:09,720 --> 00:42:10,590 Así que adelante, Jibo. 736 00:42:10,590 --> 00:42:11,550 >> SAM: OK, Jibo. 737 00:42:11,550 --> 00:42:14,430 Muéstranos tus movimientos de baile. 738 00:42:14,430 --> 00:42:17,310 >> [REPRODUCCIÓN DE MÚSICA] 739 00:42:17,310 --> 00:42:43,114 740 00:42:43,114 --> 00:42:44,780 BRIAN Scassellati: Muy bien, todo el mundo. 741 00:42:44,780 --> 00:42:46,865 Gracias a nuestros amigos de Jibo. 742 00:42:46,865 --> 00:42:49,426 >> [APLAUSOS] 743 00:42:49,426 --> 00:42:50,140 744 00:42:50,140 --> 00:42:54,990 >> Y gracias a nuestros amigos de IBM para ayudar a cabo hoy. 745 00:42:54,990 --> 00:42:57,300 La comunicación es algo que vas 746 00:42:57,300 --> 00:43:02,280 para ver subiendo más y más a medida construimos las interfaces más complejas. 747 00:43:02,280 --> 00:43:05,760 La próxima semana, vamos a estar hablando acerca de cómo interactuar 748 00:43:05,760 --> 00:43:08,890 con oponentes de la computadora en los juegos. 749 00:43:08,890 --> 00:43:12,950 Pero si usted tiene preguntas acerca de esto, Voy a estar en torno a las horas de oficina esta noche. 750 00:43:12,950 --> 00:43:17,610 Estoy feliz de hablar con usted acerca de la IA temas o para entrar en más detalle. 751 00:43:17,610 --> 00:43:18,927 Ten un excelente fin de semana. 752 00:43:18,927 --> 00:43:21,409 >> [APLAUSOS] 753 00:43:21,409 --> 00:43:21,909 754 00:43:21,909 --> 00:43:26,141 [REPRODUCCIÓN DE MÚSICA] 755 00:43:26,141 --> 00:46:42,879