1 00:00:00,000 --> 00:00:02,928 >> [Música tocando] 2 00:00:02,928 --> 00:00:11,230 3 00:00:11,230 --> 00:00:12,790 >> DAVID MALAN: Este é CS50. 4 00:00:12,790 --> 00:00:14,072 Este é o fim de semana 10. 5 00:00:14,072 --> 00:00:16,030 E o menino, que temos um classe boa para você hoje. 6 00:00:16,030 --> 00:00:20,040 Estamos tão animado para convidar dois nossos amigos de Yale até nós hoje 7 00:00:20,040 --> 00:00:23,920 e a olhar para a intersecção de inteligência artificial, robótica, 8 00:00:23,920 --> 00:00:25,710 processamento de linguagem natural, e muito mais. 9 00:00:25,710 --> 00:00:27,090 >> E, de fato, sobre o últimas semanas, temos 10 00:00:27,090 --> 00:00:29,714 certamente passou muito tempo, especialmente nas Série de Exercícios anteriores, 11 00:00:29,714 --> 00:00:31,560 concentrando-se em belos detalhes de baixo nível. 12 00:00:31,560 --> 00:00:34,520 E é muito fácil perder de vista da floresta para as árvores 13 00:00:34,520 --> 00:00:38,170 e ficam penduradas sobre loops e condições e ponteiros, com certeza, e assim por diante. 14 00:00:38,170 --> 00:00:41,770 Mas a realidade é que vocês têm agora a ingredientes com os quais você pode realmente 15 00:00:41,770 --> 00:00:45,300 resolver alguns problemas interessantes, entre eles os que os nossos amigos na Yale 16 00:00:45,300 --> 00:00:48,790 trabalhar em apenas tímido de Cambridge. 17 00:00:48,790 --> 00:00:52,410 >> Assim, permitam-me primeiro a introduzir a nossa cabeça assistente de ensino de Yale, Andy. 18 00:00:52,410 --> 00:00:55,182 >> [Aplausos] 19 00:00:55,182 --> 00:00:57,030 20 00:00:57,030 --> 00:01:00,710 >> ANDY: Primeiro de tudo, apenas agradecer por permitir que um casal Yalies 21 00:01:00,710 --> 00:01:02,700 a estalar em baixo para Cambridge hoje. 22 00:01:02,700 --> 00:01:05,299 Nós realmente aprecio isso. 23 00:01:05,299 --> 00:01:07,090 Em segundo lugar, para nossos amigos volta casa-- Jason, 24 00:01:07,090 --> 00:01:09,670 Obrigado por ficar e correr palestra. 25 00:01:09,670 --> 00:01:12,970 Esperança é tudo de bom em New Haven. 26 00:01:12,970 --> 00:01:15,720 >> Então sim, eu estou super animado introduzir SCAZ hoje. 27 00:01:15,720 --> 00:01:17,020 SCAZ corre o laboratório de robótica. 28 00:01:17,020 --> 00:01:19,690 Ele é um professor de, como, cinco diferentes departamentos em Yale. 29 00:01:19,690 --> 00:01:23,159 Em seu laboratório, ele tem muitos, muitos robôs que ele gosta de jogar com. 30 00:01:23,159 --> 00:01:24,950 Ele tem, como, a mais legal emprego do mundo. 31 00:01:24,950 --> 00:01:27,116 E ele começa a tipo de confusão em torno de todo o dia com que 32 00:01:27,116 --> 00:01:29,090 longo e fazer algum trabalho, também. 33 00:01:29,090 --> 00:01:33,070 >> E assim nós, na verdade trouxe uma de-los para baixo com a gente hoje. 34 00:01:33,070 --> 00:01:36,900 Assim, sem mais delongas, é SCAZ indo para ir em frente e introduzir-nos 35 00:01:36,900 --> 00:01:38,660 ao seu amigo robô. 36 00:01:38,660 --> 00:01:41,546 >> [Aplausos] 37 00:01:41,546 --> 00:01:42,935 38 00:01:42,935 --> 00:01:44,310 BRIAN Scassellati: Obrigado, David. 39 00:01:44,310 --> 00:01:45,380 Obrigado, Andy. 40 00:01:45,380 --> 00:01:50,050 É tão maravilhoso estar aqui com todo mundo hoje. 41 00:01:50,050 --> 00:01:56,490 Quero primeiro ser muito claro que a equipe CS50 aqui em Cambridge 42 00:01:56,490 --> 00:01:59,190 tem sido incrivelmente hospitaleiro para nós. 43 00:01:59,190 --> 00:02:02,130 Nós somos tão gratos por tudo eles fizeram para nos apoiar. 44 00:02:02,130 --> 00:02:05,690 E assim nós gostaríamos de ser capaz para retribuir a gentileza. 45 00:02:05,690 --> 00:02:09,370 >> Então, hoje, nós começamos a anunciar que nós vamos ter um novo, 46 00:02:09,370 --> 00:02:15,240 one-of-a-kind evento CS50 acontecendo em New Haven na próxima semana. 47 00:02:15,240 --> 00:02:18,040 E essa é a Research Expo CS50. 48 00:02:18,040 --> 00:02:21,300 Então, nós estamos indo para ser convidativo everyone-- CS50 alunos, 49 00:02:21,300 --> 00:02:26,510 funcionários de ambos Harvard e Yale-- para descer e visitar-nos na sexta-feira. 50 00:02:26,510 --> 00:02:30,400 Nós vamos ter uma grande variedade de mais de 30 pessoas diferentes que apresentam 51 00:02:30,400 --> 00:02:34,830 e upperclassmen exhibiting-- mostrando fora alguns de seus produtos de pesquisa. 52 00:02:34,830 --> 00:02:38,480 Nós vamos ter algumas startups, mesmo, à procura para um pouco de novos talentos tecnologia, 53 00:02:38,480 --> 00:02:40,460 startups de ambos Harvard e Yale. 54 00:02:40,460 --> 00:02:44,550 E nós vamos ter alguns grupos de estudantes procurando alguma nova associação. 55 00:02:44,550 --> 00:02:46,357 >> Vai ser um momento muito emocionante. 56 00:02:46,357 --> 00:02:49,190 Esperemos que aqueles de vocês que são descendo para o jogo Harvard-Yale 57 00:02:49,190 --> 00:02:51,360 será capaz de parar por um pouco mais cedo, 58 00:02:51,360 --> 00:02:54,060 mesmo no centro de campus, Sterling Memorial Library. 59 00:02:54,060 --> 00:02:58,040 Nós vamos ter um conjunto de exposições que vão desde autónoma 60 00:02:58,040 --> 00:03:04,460 veleiros para formas de utilização de software para preservar manuscritos medievais. 61 00:03:04,460 --> 00:03:07,860 >> Nós vamos ter de anúncios networking hoc e pessoas 62 00:03:07,860 --> 00:03:11,230 ensino de codificação de software em Cape Town. 63 00:03:11,230 --> 00:03:13,730 Teremos computador manifestações musicais. 64 00:03:13,730 --> 00:03:16,020 E nós vamos, naturalmente, mais robôs. 65 00:03:16,020 --> 00:03:18,900 Então, nós esperamos que você vai se juntar a nós para este evento. 66 00:03:18,900 --> 00:03:21,350 Ele deve ser um monte de divertimento, um pouco de comida, 67 00:03:21,350 --> 00:03:24,430 e um monte de interessante coisas para falar. 68 00:03:24,430 --> 00:03:28,230 >> Então, hoje, nós estamos indo falar cerca de processamento de linguagem natural. 69 00:03:28,230 --> 00:03:32,560 E esta é a tentativa para nós para construir uma nova forma de interagir 70 00:03:32,560 --> 00:03:35,150 com nossos dispositivos, pois para as últimas semanas, 71 00:03:35,150 --> 00:03:40,800 você foi focado em como é que você pode escrever código, escrever software 72 00:03:40,800 --> 00:03:47,110 que é uma maneira de ser capaz de dizer a um máquina, é isso que eu quero que você faça. 73 00:03:47,110 --> 00:03:50,210 >> Mas não devemos precisar esperar que tudo 74 00:03:50,210 --> 00:03:53,760 que está lá fora que é usado por todos no mundo 75 00:03:53,760 --> 00:03:57,480 vai ser proficiente neste tipo de instrução. 76 00:03:57,480 --> 00:04:02,540 Assim, podemos distinguir entre o computador linguagens e languages-- naturais 77 00:04:02,540 --> 00:04:06,720 isto é, coisas que os seres humanos usam para comunicar com outros seres humanos. 78 00:04:06,720 --> 00:04:12,270 E nós tentamos construir interfaces que usam estes mecanismos naturais de comunicação. 79 00:04:12,270 --> 00:04:16,029 >> Agora, como qualquer outro tópico que nós começamos com em CS50, 80 00:04:16,029 --> 00:04:19,589 vamos começar com o mais simples bit de processamento de linguagem natural 81 00:04:19,589 --> 00:04:21,269 que podemos imaginar. 82 00:04:21,269 --> 00:04:24,940 Nós vamos começar com a parte histórica da linguagem natural. 83 00:04:24,940 --> 00:04:28,740 E então nós vamos construir até sistemas mais e mais recentes 84 00:04:28,740 --> 00:04:31,450 e tem algumas demos de diversão ao longo do caminho. 85 00:04:31,450 --> 00:04:35,900 >> Então, vamos começar com o que foi provavelmente a primeira linguagem natural 86 00:04:35,900 --> 00:04:38,210 sistema de processamento. 87 00:04:38,210 --> 00:04:45,080 Este foi um sistema de software escrito em 1966 por Joseph Weizenbaum chamado ELIZA. 88 00:04:45,080 --> 00:04:49,640 E Eliza foi concebido para replicar o tipo de interação 89 00:04:49,640 --> 00:04:53,850 você teria com um Psicoterapeuta Rogerian. 90 00:04:53,850 --> 00:04:57,210 Agora, os Rogerians, tinham uma idéia que a psicoterapia 91 00:04:57,210 --> 00:05:02,800 envolvidos serem capazes de refletir de volta a um paciente e falar com eles, 92 00:05:02,800 --> 00:05:08,100 basicamente, de apenas dando-lhes um pouquinho do terapeuta. 93 00:05:08,100 --> 00:05:09,920 Isto é, tudo que o terapeuta disse 94 00:05:09,920 --> 00:05:16,500 era suposto ser apenas um reflexo da o que o paciente estava dizendo a eles. 95 00:05:16,500 --> 00:05:18,990 >> Então, vamos tentar e demonstrar isso. 96 00:05:18,990 --> 00:05:22,820 Será que temos um voluntário que seria dispostos a compartilhar seu mais profundo, 97 00:05:22,820 --> 00:05:26,650 mais escuros, e / ou segredos falsos com ELIZA? 98 00:05:26,650 --> 00:05:29,680 Claro, por que você não vem em cima. 99 00:05:29,680 --> 00:05:30,847 Fantástico. 100 00:05:30,847 --> 00:05:31,430 E o seu nome? 101 00:05:31,430 --> 00:05:32,000 >> MILES: Miles. 102 00:05:32,000 --> 00:05:33,041 >> BRIAN Scassellati: Miles. 103 00:05:33,041 --> 00:05:34,270 Prazer em conhecê-lo, Miles. 104 00:05:34,270 --> 00:05:36,270 Se você segurar isso. 105 00:05:36,270 --> 00:05:40,840 E nós estamos indo para usar uma versão de ELIZA 106 00:05:40,840 --> 00:05:44,640 que temos replicada dentro do IDE CS50. 107 00:05:44,640 --> 00:05:47,140 E nós vamos olhar para a fonte código para isso em pouco tempo. 108 00:05:47,140 --> 00:05:49,910 Mas, por agora, nós somos apenas indo para invocá-lo digitando eliza. 109 00:05:49,910 --> 00:05:55,480 >> ELIZA e vai dar-lhe as respostas que vão estar em todas as capitais. 110 00:05:55,480 --> 00:05:57,950 E vai lhe fazer algumas perguntas. 111 00:05:57,950 --> 00:06:02,130 E nós vamos responder e digite em respostas a ELIZA. 112 00:06:02,130 --> 00:06:04,310 Então ELIZA disse: "Oi, eu sou ELIZA. 113 00:06:04,310 --> 00:06:05,462 Qual o seu problema?" 114 00:06:05,462 --> 00:06:08,092 O que você gostaria de ELIZA dizer sobre hoje? 115 00:06:08,092 --> 00:06:10,750 >> MILES: Eu só posso adormecer se eu tenho pantufas de coelhinho diante. 116 00:06:10,750 --> 00:06:12,440 >> BRIAN Scassellati: Tudo bem. 117 00:06:12,440 --> 00:06:13,360 Tudo certo. 118 00:06:13,360 --> 00:06:15,300 >> [RISO] 119 00:06:15,300 --> 00:06:22,410 >> "Eu só posso adormecer com pantufas de coelhinho sobre ". 120 00:06:22,410 --> 00:06:29,000 ELIZA e diz: "Diga, você tem problemas psicológicos? 121 00:06:29,000 --> 00:06:30,450 Talvez este seja um bom indicador. " 122 00:06:30,450 --> 00:06:30,780 >> ESTÁ BEM. 123 00:06:30,780 --> 00:06:32,245 Então, o que você gostaria de responder? 124 00:06:32,245 --> 00:06:36,110 125 00:06:36,110 --> 00:06:36,970 >> MILES: Sim. 126 00:06:36,970 --> 00:06:38,660 >> BRIAN Scassellati: Sim. 127 00:06:38,660 --> 00:06:39,570 Homem de muitas palavras. 128 00:06:39,570 --> 00:06:41,870 Eu gosto disso. 129 00:06:41,870 --> 00:06:50,200 Eliza diz: "Você parece bastante positiva." 130 00:06:50,200 --> 00:06:53,200 >> MILES: Não, eu sou, de fato, um elétron. 131 00:06:53,200 --> 00:06:55,150 >> BRIAN Scassellati: "No. 132 00:06:55,150 --> 00:07:02,240 Na verdade, eu sou um elétron. " "Você veio para me 133 00:07:02,240 --> 00:07:06,954 porque você é um elétron? " 134 00:07:06,954 --> 00:07:08,870 Agora, podemos ver alguns dos o coisas- eu vou 135 00:07:08,870 --> 00:07:10,200 para fazer uma pausa por apenas um segundo, Miles. 136 00:07:10,200 --> 00:07:11,010 Não ir a qualquer lugar. 137 00:07:11,010 --> 00:07:12,650 Nós não terminamos com você ainda. 138 00:07:12,650 --> 00:07:16,490 ELIZA é, em alguns aspectos, responder a certas coisas 139 00:07:16,490 --> 00:07:21,140 que ele está dizendo, mas sem qualquer entendimento real. 140 00:07:21,140 --> 00:07:26,090 E também está repetindo de volta alguns das partes da sua sentença. 141 00:07:26,090 --> 00:07:27,310 >> Por isso, disse, "No. 142 00:07:27,310 --> 00:07:29,090 Na verdade, eu sou um elétron. " 143 00:07:29,090 --> 00:07:34,190 Eliza respondeu de volta, "Você veio para mim, porque você é um elétron? " 144 00:07:34,190 --> 00:07:34,690 Tudo certo. 145 00:07:34,690 --> 00:07:36,050 Vamos dar mais uma resposta aqui. 146 00:07:36,050 --> 00:07:37,140 Dê-lhe uma boa, Miles. 147 00:07:37,140 --> 00:07:37,806 >> MILES: Good one? 148 00:07:37,806 --> 00:07:48,400 149 00:07:48,400 --> 00:07:49,570 >> Sim, por favor me ajude. 150 00:07:49,570 --> 00:07:50,570 BRIAN Scassellati: "Sim. 151 00:07:50,570 --> 00:07:58,010 Por favor, me ajude. "" Você tem certeza? " 152 00:07:58,010 --> 00:07:58,510 MILES: Não. 153 00:07:58,510 --> 00:08:00,860 BRIAN Scassellati: Não. 154 00:08:00,860 --> 00:08:03,562 "O que isso sugere a você?" 155 00:08:03,562 --> 00:08:06,760 >> MILES: Eu não posso ser um elétron. 156 00:08:06,760 --> 00:08:11,170 >> BRIAN Scassellati: "Eu pode não ser um elétron. " 157 00:08:11,170 --> 00:08:13,790 "Você está dizendo que não apenas a ser negativo?" 158 00:08:13,790 --> 00:08:14,390 >> Tudo certo. 159 00:08:14,390 --> 00:08:16,030 Então, Miles, muito obrigado. 160 00:08:16,030 --> 00:08:16,860 >> MILES: Obrigado. 161 00:08:16,860 --> 00:08:18,360 >> BRIAN Scassellati: Muito obrigado. 162 00:08:18,360 --> 00:08:20,230 [Aplausos] 163 00:08:20,230 --> 00:08:21,230 164 00:08:21,230 --> 00:08:26,700 >> Portanto, este programa ELIZA, de muitas maneiras, responde apenas às peças 165 00:08:26,700 --> 00:08:32,730 que estamos oferecendo, sem qualquer profundidade compreensão do que está acontecendo aqui. 166 00:08:32,730 --> 00:08:36,640 Este é um tipo de sistema chamado de correspondência de padrões, onde 167 00:08:36,640 --> 00:08:40,490 estamos à procura de certa pedaços de texto que estamos em seguida, 168 00:08:40,490 --> 00:08:44,860 vai levar para fora do que foi fornecida como entrada, 169 00:08:44,860 --> 00:08:52,580 convertê-lo, potencialmente, de alguma forma, e depois devolvê-lo para o usuário. 170 00:08:52,580 --> 00:08:55,150 >> Algum de vocês pensam ELIZA que é realmente 171 00:08:55,150 --> 00:08:58,230 realizando psicanálise válido aqui? 172 00:08:58,230 --> 00:08:59,250 Uma pessoa, talvez. 173 00:08:59,250 --> 00:09:00,166 >> AUDIÊNCIA: [inaudível]. 174 00:09:00,166 --> 00:09:03,315 175 00:09:03,315 --> 00:09:05,440 BRIAN Scassellati: E como isso faz você se sentir? 176 00:09:05,440 --> 00:09:06,530 Sim, de fato, ele faz. 177 00:09:06,530 --> 00:09:10,890 E vamos ver, na verdade, a código-fonte para ele em apenas um momento. 178 00:09:10,890 --> 00:09:13,580 E assim você vai ser capaz de fazer exatamente isso. 179 00:09:13,580 --> 00:09:17,420 >> Agora, Eliza é uma forma daquilo que chamaríamos hoje de um bot de bate-papo. 180 00:09:17,420 --> 00:09:19,950 Ele só vai através do texto que você está fornecendo, 181 00:09:19,950 --> 00:09:24,030 fornece a quantidade mínimo de compreensão ou de transformação, 182 00:09:24,030 --> 00:09:26,790 e, em seguida, papagaios-lo de volta para você. 183 00:09:26,790 --> 00:09:31,830 Então, vamos dar uma olhada, conceitualmente, e falar sobre o que 184 00:09:31,830 --> 00:09:34,690 é que ELIZA está realmente fazendo. 185 00:09:34,690 --> 00:09:42,000 >> ELIZA está tomando um let sentence-- dizer: "Eu quero impressionar o meu chefe." 186 00:09:42,000 --> 00:09:45,130 E ELIZA está olhando através de que a sentença 187 00:09:45,130 --> 00:09:48,730 e tentando encontrar e coincidir com certos padrões. 188 00:09:48,730 --> 00:09:52,850 Assim, por exemplo, um dos padrões ELIZA que está procurando são as palavras 189 00:09:52,850 --> 00:09:55,110 "Eu quero." 190 00:09:55,110 --> 00:09:59,330 E a qualquer momento se vê algo que tem "eu quero" nele, 191 00:09:59,330 --> 00:10:01,770 formula uma resposta. 192 00:10:01,770 --> 00:10:05,040 E essa resposta é uma string fixa. 193 00:10:05,040 --> 00:10:07,915 Neste caso, é "por que você quer?" 194 00:10:07,915 --> 00:10:11,330 E eu coloquei uma pequena estrela na o fim, porque isso é apenas 195 00:10:11,330 --> 00:10:13,310 o início da nossa resposta. 196 00:10:13,310 --> 00:10:16,310 E o asterisco indica que vamos levar o resto 197 00:10:16,310 --> 00:10:19,850 de utterance-- do usuário "para impressionar o meu patrão" - 198 00:10:19,850 --> 00:10:24,500 e nós estamos indo para acrescentar que para o final dessa seqüência. 199 00:10:24,500 --> 00:10:28,990 >> Então, agora, ao invés de dizer, "por você quer impressionar o meu chefe ", 200 00:10:28,990 --> 00:10:31,800 há um pouco de adicional processamento que nós vamos fazer. 201 00:10:31,800 --> 00:10:34,440 Ou seja, nós vamos ter que converter alguns dos pronomes 202 00:10:34,440 --> 00:10:38,670 aqui a partir de "meu chefe" para "seu chefe." 203 00:10:38,670 --> 00:10:41,300 E pode haver alguns outros mudanças que precisamos fazer. 204 00:10:41,300 --> 00:10:44,990 Então, ao invés de apenas furando- diretamente para o final, o que vamos fazer 205 00:10:44,990 --> 00:10:49,160 é que vamos levar o resto do utterance-- do usuário em branco aqui-- 206 00:10:49,160 --> 00:10:54,090 e nós vamos levá-lo uma peça de um tempo e converter cada seqüência 207 00:10:54,090 --> 00:10:58,180 forma, cada palavra, na sentença. 208 00:10:58,180 --> 00:10:59,580 >> Então, vamos tomar a palavra "para". 209 00:10:59,580 --> 00:11:01,650 Não há nenhuma conversão que temos de fazer isso. 210 00:11:01,650 --> 00:11:02,340 "Impressionar." 211 00:11:02,340 --> 00:11:04,140 Não há nenhuma conversão o que precisamos fazer lá. 212 00:11:04,140 --> 00:11:06,670 "Meu" irá converter para "seu". 213 00:11:06,670 --> 00:11:10,070 E "chefe" vamos deixar como "chefe". 214 00:11:10,070 --> 00:11:12,740 E, em seguida, finalmente, nada que termina com um período, 215 00:11:12,740 --> 00:11:16,640 vamos convertê-lo em uma pergunta. 216 00:11:16,640 --> 00:11:22,600 >> Este padrão de correspondência muito simples é realmente muito bem sucedido. 217 00:11:22,600 --> 00:11:27,260 E quando este foi introduzido em 1966-- Joseph Weizenbaum 218 00:11:27,260 --> 00:11:28,986 programado isso em um computador. 219 00:11:28,986 --> 00:11:31,110 Agora, os computadores naquela época não eram modelos desktop. 220 00:11:31,110 --> 00:11:33,950 Eles estavam de recursos compartilhados. 221 00:11:33,950 --> 00:11:39,090 E seus alunos seria ir e conversar com ELIZA. 222 00:11:39,090 --> 00:11:41,570 Eventualmente, ele teve que restringir o acesso a ele 223 00:11:41,570 --> 00:11:43,890 porque seus alunos não eram recebendo todo o trabalho feito. 224 00:11:43,890 --> 00:11:46,190 Eles estavam apenas conversando com ELIZA. 225 00:11:46,190 --> 00:11:48,850 E, de fato, ele teve que disparar sua assistente, que 226 00:11:48,850 --> 00:11:55,840 gastou todo o seu tempo conversando com ELIZA sobre seus problemas profundos e preocupantes. 227 00:11:55,840 --> 00:12:00,350 >> Todos os que usaram estes sistemas começou a antropomorfizar-los. 228 00:12:00,350 --> 00:12:04,490 Eles começaram a pensar neles como sendo animado e pessoas reais. 229 00:12:04,490 --> 00:12:07,969 Eles começaram a reconhecer alguns dos as coisas que eles estavam dizendo 230 00:12:07,969 --> 00:12:09,010 estavam voltando para eles. 231 00:12:09,010 --> 00:12:12,120 E eles foram descobrindo coisas sobre si mesmos. 232 00:12:12,120 --> 00:12:17,290 E, na verdade, até mesmo os especialistas, mesmo os psicoterapeutas, 233 00:12:17,290 --> 00:12:22,930 começou a se preocupar que, de fato, talvez ELIZA seria substituí-los. 234 00:12:22,930 --> 00:12:25,640 E até mesmo o computador cientistas preocupados que estávamos 235 00:12:25,640 --> 00:12:30,040 tão perto de resolver linguagem natural. 236 00:12:30,040 --> 00:12:33,520 >> Agora, isso não foi em qualquer lugar perto de verdade. 237 00:12:33,520 --> 00:12:37,280 Mas isso é como impressionante estes sistemas podem parecer. 238 00:12:37,280 --> 00:12:40,080 Então, vamos começar a olhar por baixo e tentar 239 00:12:40,080 --> 00:12:46,190 para obter um pouco de uma pergunta de onde esse código realmente acontece. 240 00:12:46,190 --> 00:12:48,170 Então, vamos fazer este código disponível depois. 241 00:12:48,170 --> 00:12:50,880 E este é um muito porta simples e direta 242 00:12:50,880 --> 00:12:53,240 da implementação original ELIZA. 243 00:12:53,240 --> 00:12:56,350 >> Assim, alguns destes estilística coisas que você verá aqui 244 00:12:56,350 --> 00:12:59,360 não são o que estilisticamente nós queremos que você faça 245 00:12:59,360 --> 00:13:01,480 ou o que estamos ensinando-lhe para fazer. 246 00:13:01,480 --> 00:13:04,770 Mas nós tentamos mantê-los o mesmo em muitos portos 247 00:13:04,770 --> 00:13:08,087 que este teve de modo que ele tem o sabor do original. 248 00:13:08,087 --> 00:13:09,920 Então, nós estamos indo para incluir um monte de coisas, 249 00:13:09,920 --> 00:13:12,920 e então nós vamos ter um conjunto de palavras-chave, as coisas 250 00:13:12,920 --> 00:13:16,460 ELIZA que irá reconhecer e responder aos diretamente. 251 00:13:16,460 --> 00:13:20,780 Então se você tem palavras como "pode ​​você" ou "eu não" ou "não" 252 00:13:20,780 --> 00:13:24,680 ou "sim" ou "sonho" ou "Olá", então ELIZA 253 00:13:24,680 --> 00:13:27,920 irá responder selectivamente para aqueles. 254 00:13:27,920 --> 00:13:30,010 Também vamos ter um certo número de coisas 255 00:13:30,010 --> 00:13:34,940 que vamos trocar, como converter "meu" para "seu". 256 00:13:34,940 --> 00:13:39,920 >> E então nós vamos ter um conjunto de respostas que, para cada uma dessas palavras-chave, 257 00:13:39,920 --> 00:13:42,580 nós vamos girar através estas diferentes respostas. 258 00:13:42,580 --> 00:13:45,350 Então, se eu dizer "sim" três vezes consecutivas, I 259 00:13:45,350 --> 00:13:50,429 pode ter três diferentes respostas de ELIZA. 260 00:13:50,429 --> 00:13:52,345 Nosso código, então, é na verdade, extremamente simples. 261 00:13:52,345 --> 00:13:59,490 Se eu rolar para baixo após todos estes respostas que temos programados em 262 00:13:59,490 --> 00:14:02,920 e nós chegar até a página, nós estamos indo para inicializar 263 00:14:02,920 --> 00:14:06,540 um par de variáveis ​​diferentes e fazer um pouco de arrumação 264 00:14:06,540 --> 00:14:08,480 no começo. 265 00:14:08,480 --> 00:14:11,760 Mas então não há absolutamente um conjunto de código que você pode entender. 266 00:14:11,760 --> 00:14:15,820 Um loop while grande que diz que eu sou vai repetir isso mais e mais. 267 00:14:15,820 --> 00:14:20,420 Vou ler em uma linha, e eu vou armazenar isso em uma seqüência de entrada. 268 00:14:20,420 --> 00:14:23,880 Vou verificar e ver se é o palavra-chave especial "bye", que 269 00:14:23,880 --> 00:14:26,199 significa sair do programa. 270 00:14:26,199 --> 00:14:29,240 E então eu vou verificar e ver se alguém está apenas repetindo-se 271 00:14:29,240 --> 00:14:29,800 de novo e de novo. 272 00:14:29,800 --> 00:14:31,174 E eu vou gritar com eles se eles fazem. 273 00:14:31,174 --> 00:14:34,820 Eu vou dizer "não repetir-se." 274 00:14:34,820 --> 00:14:40,500 >> Enquanto nenhum desses acontecer, vamos em seguida, a varredura através de e loop através, 275 00:14:40,500 --> 00:14:45,330 em linhas 308 a 313 aqui, e verificar e ver 276 00:14:45,330 --> 00:14:49,090 são aqueles de qualquer palavra-chave frases contidas na entrada 277 00:14:49,090 --> 00:14:50,620 que eu estava acabado de dar? 278 00:14:50,620 --> 00:14:54,845 Se houver uma correspondência para eles, bem então, eu vou lembrar desse local. 279 00:14:54,845 --> 00:14:57,050 Vou me lembrar dessa palavra-chave. 280 00:14:57,050 --> 00:14:58,620 E eu vou ser capaz de construir uma resposta. 281 00:14:58,620 --> 00:15:03,150 >> Se eu não encontrar um, bem, então, a última coisa na minha matriz palavra-chave 282 00:15:03,150 --> 00:15:08,070 sereis minhas respostas padrão, quando nada mais jogos. 283 00:15:08,070 --> 00:15:14,160 Eu vou fazer perguntas como "Por que você fez vir aqui? "ou" Como posso ajudá-lo? " 284 00:15:14,160 --> 00:15:19,710 que são apenas parcialmente adequado não importa o que a entrada é. 285 00:15:19,710 --> 00:15:22,580 >> Vamos, então, construir-se a resposta de ELIZA. 286 00:15:22,580 --> 00:15:26,040 Nós vamos ser capazes de tomar que a resposta de base, 287 00:15:26,040 --> 00:15:28,370 assim como fizemos em que exemplo "meu chefe". 288 00:15:28,370 --> 00:15:30,970 289 00:15:30,970 --> 00:15:33,990 Se isso é tudo o que há é-- se é apenas um 290 00:15:33,990 --> 00:15:36,860 string que eu deveria respond-- Eu só posso enviá-lo de volta para fora. 291 00:15:36,860 --> 00:15:40,610 Se ele tem um asterisco no o fim de tudo, então eu vou 292 00:15:40,610 --> 00:15:45,710 processar cada símbolo individual na o resto da resposta do utilizador 293 00:15:45,710 --> 00:15:51,590 e adicionar aqueles que, trocando para fora palavra por palavra como eu preciso. 294 00:15:51,590 --> 00:15:56,100 >> Tudo isto é absolutamente algo que você pode construir. 295 00:15:56,100 --> 00:15:59,230 E, de fato, as maneiras pelas quais nós ter argumentos de linha de comando processados, 296 00:15:59,230 --> 00:16:03,570 a maneira em que você tem processadas através de solicitações HTTP 297 00:16:03,570 --> 00:16:05,510 siga os mesmos tipos de regras. 298 00:16:05,510 --> 00:16:08,220 Eles são a correspondência de padrão. 299 00:16:08,220 --> 00:16:15,170 >> Assim ELIZA tinha um relativamente importante impacto sobre a linguagem natural 300 00:16:15,170 --> 00:16:21,620 porque ele fez parecer como se fosse um meta muito atingível, como de alguma forma estaríamos 301 00:16:21,620 --> 00:16:25,550 ser capaz de resolver este problema diretamente. 302 00:16:25,550 --> 00:16:30,670 Agora, isso não quer dizer que faz ELIZA tudo o que gostaria de fazer. 303 00:16:30,670 --> 00:16:33,710 Certamente não. 304 00:16:33,710 --> 00:16:35,660 Mas devemos ser capazes para fazer algo mais. 305 00:16:35,660 --> 00:16:38,280 306 00:16:38,280 --> 00:16:41,490 >> Nosso primeiro passo para ir além ELIZA vai 307 00:16:41,490 --> 00:16:44,840 para ser capaz de olhar não o texto inserido 308 00:16:44,840 --> 00:16:53,750 no teclado, mas discurso, real discurso gravado em um microfone. 309 00:16:53,750 --> 00:16:56,880 Assim, quando olhamos para estes peças diferentes, nós somos 310 00:16:56,880 --> 00:17:00,304 vai ter que construir um conjunto de modelos. 311 00:17:00,304 --> 00:17:02,970 Nós vamos ter que ser capaz para ir do baixo nível acústico 312 00:17:02,970 --> 00:17:07,180 arremesso information--, amplitude, frequency-- 313 00:17:07,180 --> 00:17:09,530 e convertê-lo em algumas unidades que estamos 314 00:17:09,530 --> 00:17:14,619 capaz de manipular mais facilmente e, finalmente, manipulá-los 315 00:17:14,619 --> 00:17:18,609 em palavras e frases. 316 00:17:18,609 --> 00:17:22,880 >> Assim, a maioria de reconhecimento de fala sistemas que estão lá fora hoje 317 00:17:22,880 --> 00:17:26,069 siga uma estatística modelo no qual nós construímos 318 00:17:26,069 --> 00:17:35,090 três representações separadas de que que o sinal de áudio contem na realidade. 319 00:17:35,090 --> 00:17:38,640 Começamos com um modelo de fonética que fala sobre apenas a base 320 00:17:38,640 --> 00:17:41,250 Parece que eu estou produzindo. 321 00:17:41,250 --> 00:17:46,900 Estou produzindo algo que é um B como no menino ou uma D como no cão? 322 00:17:46,900 --> 00:17:53,220 Como posso reconhecer os dois diferentes telefones como separada e distinta? 323 00:17:53,220 --> 00:17:56,600 >> Em cima disso, nós vamos, então, construir uma pronúncia modelo palavra, 324 00:17:56,600 --> 00:18:01,350 algo que une os telefones individuais 325 00:18:01,350 --> 00:18:04,724 e as combina em uma palavra. 326 00:18:04,724 --> 00:18:07,890 E depois disso, vamos dar as palavras e nós vamos montá-las com uma linguagem 327 00:18:07,890 --> 00:18:13,010 modelar em uma frase completa. 328 00:18:13,010 --> 00:18:17,230 >> Agora, vamos falar sobre cada destes independentemente e separadamente. 329 00:18:17,230 --> 00:18:21,580 Mas estes três modelos são todos só vai ser estatísticas. 330 00:18:21,580 --> 00:18:23,502 E isso significa que quando nós trabalhar com eles, vamos 331 00:18:23,502 --> 00:18:25,376 ser capaz de trabalhar com todas elas ao mesmo tempo. 332 00:18:25,376 --> 00:18:28,100 333 00:18:28,100 --> 00:18:28,600 Tudo certo. 334 00:18:28,600 --> 00:18:30,890 Vamos começar com o nosso modelo de fonética. 335 00:18:30,890 --> 00:18:34,470 Assim, modelos fonéticos dependem uma técnica computacional 336 00:18:34,470 --> 00:18:37,320 chamados de modelos ocultos de Markov. 337 00:18:37,320 --> 00:18:43,050 Estes são modelos gráficos em que eu ter e reconhecer um estado do mundo 338 00:18:43,050 --> 00:18:46,500 como sendo caracterizada por um conjunto de características. 339 00:18:46,500 --> 00:18:51,960 E esse estado descreve uma parte de uma ação que eu estou envolvido em. 340 00:18:51,960 --> 00:19:00,190 >> Então, se eu pensar em fazer o som de "ma" como mãe, 341 00:19:00,190 --> 00:19:03,970 existem diferentes componentes para que o som. 342 00:19:03,970 --> 00:19:07,230 Há uma parte onde eu desenhar no ar. 343 00:19:07,230 --> 00:19:09,560 E então eu franzir os lábios. 344 00:19:09,560 --> 00:19:13,710 E eu rolo meus lábios um pouco para trás pouco para fazer aquele som "ma". 345 00:19:13,710 --> 00:19:15,340 E depois há uma liberação. 346 00:19:15,340 --> 00:19:17,020 Meus lábios se separam. 347 00:19:17,020 --> 00:19:19,030 O ar é expelido. 348 00:19:19,030 --> 00:19:22,650 "Ma". 349 00:19:22,650 --> 00:19:29,250 >> Estas três partes diferentes seria representado por estados neste graph-- 350 00:19:29,250 --> 00:19:33,420 o início, o meio eo fim. 351 00:19:33,420 --> 00:19:38,060 E eu teria transições que me permitiu viajar de um estado 352 00:19:38,060 --> 00:19:42,260 para o próximo, com uma certa probabilidade. 353 00:19:42,260 --> 00:19:47,250 Assim, por exemplo, que a M som pode ter um muito, 354 00:19:47,250 --> 00:19:51,850 ingestão de muito curto no beginning-- "mm" - e, em seguida, uma mais longa, 355 00:19:51,850 --> 00:19:55,640 fase vibratória onde eu estou segurando a minha lábios e quase humming-- 356 00:19:55,640 --> 00:20:05,090 "mmmm" - e depois de um curto Plosive onde eu expulsar breath-- "ma". 357 00:20:05,090 --> 00:20:09,370 >> O modelo oculto de Markov é concebido para capturar o facto 358 00:20:09,370 --> 00:20:13,340 que a maneira que eu faço que o som de "ma" vai 359 00:20:13,340 --> 00:20:17,350 para ser ligeiramente diferente em o seu calendário, é a freqüência, 360 00:20:17,350 --> 00:20:21,030 e seus recursos do que a maneira que você faz 361 00:20:21,030 --> 00:20:23,300 ou a maneira que eu poderia torná-lo quando estou falando 362 00:20:23,300 --> 00:20:26,030 sobre os diferentes usos da carta. 363 00:20:26,030 --> 00:20:33,240 "Mãe" e "may I" vontade soar um pouco diferente. 364 00:20:33,240 --> 00:20:36,800 >> Assim, para reconhecer um em particular som, faríamos 365 00:20:36,800 --> 00:20:42,020 construir modelos de Markov, estes Markov oculto modelos, de cada telefone possível que eu 366 00:20:42,020 --> 00:20:45,840 pode querer reconhecer, cada som possível, 367 00:20:45,840 --> 00:20:49,750 e depois olhar para o dados acústicos que eu tenho 368 00:20:49,750 --> 00:20:54,430 e determinar estatisticamente qual é o mais provável 369 00:20:54,430 --> 00:20:58,110 ter produzido esse som. 370 00:20:58,110 --> 00:20:58,610 ESTÁ BEM. 371 00:20:58,610 --> 00:21:01,540 372 00:21:01,540 --> 00:21:06,750 Com esse modelo, em seguida, começar a construir em cima dela. 373 00:21:06,750 --> 00:21:09,330 Tomamos um modelo de pronúncia. 374 00:21:09,330 --> 00:21:11,790 Agora, às vezes pronúncia modelos são simples e fáceis 375 00:21:11,790 --> 00:21:14,440 porque só há uma maneira de pronunciar algo. 376 00:21:14,440 --> 00:21:17,990 Outras vezes, eles são um pouco mais complicado. 377 00:21:17,990 --> 00:21:21,340 Aqui está um guia de pronúncia para essa coisa que é vermelho 378 00:21:21,340 --> 00:21:25,210 uma fruta que você faz fora de ketchup. 379 00:21:25,210 --> 00:21:27,360 As pessoas não acho que é uma fruta. 380 00:21:27,360 --> 00:21:27,860 Certo? 381 00:21:27,860 --> 00:21:30,880 382 00:21:30,880 --> 00:21:35,300 >> Agora, há muitas maneiras diferentes que as pessoas vão pronunciar esta palavra. 383 00:21:35,300 --> 00:21:37,780 Alguns dirão "toe-may-dedo do pé." 384 00:21:37,780 --> 00:21:40,880 Alguns dirão "toe-mah-dedo do pé." 385 00:21:40,880 --> 00:21:44,800 E nós podemos capturar essa com um destes modelos gráficos 386 00:21:44,800 --> 00:21:48,305 onde, novamente, nós representam transições como tendo uma certa probabilidade 387 00:21:48,305 --> 00:21:51,360 e a probabilidade associada com eles. 388 00:21:51,360 --> 00:21:58,290 >> Portanto, neste caso, se eu fosse para seguir topo rota através deste gráfico inteiro, 389 00:21:58,290 --> 00:22:03,330 Eu estaria começando na carta na extrema esquerda, a "ta" som. 390 00:22:03,330 --> 00:22:07,570 Gostaria de ter a metade superior, o "oh," e, em seguida, um "ma" 391 00:22:07,570 --> 00:22:14,530 e, em seguida, um "a", e, em seguida, um "ta", e um "oh". "Toe-may-dedo do pé." 392 00:22:14,530 --> 00:22:19,610 Se eu pegasse o caminho através do fundo este, vou conseguir "ta-mah-dedo do pé." 393 00:22:19,610 --> 00:22:26,810 E se eu fui para baixo e, em seguida, acima, gostaria de obter "ta-may-dedo do pé." 394 00:22:26,810 --> 00:22:29,950 >> Estes modelos capturar estes diferenças porque sempre 395 00:22:29,950 --> 00:22:32,410 que implantar um destes sistemas de reconhecimento, 396 00:22:32,410 --> 00:22:35,340 ele vai ter que trabalhar com lotes de diferentes tipos de pessoas, 397 00:22:35,340 --> 00:22:39,295 lotes de diferentes sotaques, e mesmo diferentes usos das mesmas palavras. 398 00:22:39,295 --> 00:22:42,204 399 00:22:42,204 --> 00:22:44,120 Finalmente, em cima disso, vamos construir algo 400 00:22:44,120 --> 00:22:48,780 que parece muito complicado, chamado o modelo de linguagem, 401 00:22:48,780 --> 00:22:52,950 mas, de facto, é o mais simples de a três porque estes operam 402 00:22:52,950 --> 00:22:56,041 sobre o que são chamados de modelos n-gram. 403 00:22:56,041 --> 00:23:02,270 E, neste caso, eu estou mostrando-lhe um modelo de n-grama de duas partes, uma bigram. 404 00:23:02,270 --> 00:23:08,910 Nós vamos fazer física a idéia que, por vezes, certas palavras são 405 00:23:08,910 --> 00:23:14,680 mais propensos a seguir um determinada palavra do que outros. 406 00:23:14,680 --> 00:23:25,210 Se eu apenas disse: "previsão do tempo", a próxima palavra poderia provavelmente ser "hoje" 407 00:23:25,210 --> 00:23:31,510 ou poderia ser "o tempo Previsão do amanhã. " 408 00:23:31,510 --> 00:23:38,870 Mas é pouco provável que seja "o previsão do tempo alcachofra. " 409 00:23:38,870 --> 00:23:42,980 >> O que um modelo de linguagem faz é que capta os estatisticamente 410 00:23:42,980 --> 00:23:47,450 por contagem, de algum muito grande corpus, todas as instâncias 411 00:23:47,450 --> 00:23:50,890 em que uma palavra se segue a outra. 412 00:23:50,890 --> 00:23:54,300 Então, se eu tomar uma grande corpus-- como cada Wall Street Journal 413 00:23:54,300 --> 00:24:00,750 que foi produzido desde 1930, que é um dos corpuses-- padrão 414 00:24:00,750 --> 00:24:03,910 e eu olhar através de todos esse texto, e eu conto 415 00:24:03,910 --> 00:24:09,770 -se quantas vezes depois "previsão" eu vejo "hoje" 416 00:24:09,770 --> 00:24:17,454 e quantas vezes eu vejo "previsão" seguido de "alcachofra", 417 00:24:17,454 --> 00:24:19,370 o primeiro vai ser muito mais provável. 418 00:24:19,370 --> 00:24:21,540 Vai aparecer com muito mais freqüência. 419 00:24:21,540 --> 00:24:24,610 E por isso vai ter uma maior probabilidade associada com ele. 420 00:24:24,610 --> 00:24:27,340 >> Se eu quiser descobrir a probabilidade de um enunciado inteiro, 421 00:24:27,340 --> 00:24:29,940 então, eu só quebrá-lo. 422 00:24:29,940 --> 00:24:35,990 Assim, a probabilidade de audição a frase "o rato comeu queijo" 423 00:24:35,990 --> 00:24:39,110 é a probabilidade de a palavra "a" iniciar uma frase, 424 00:24:39,110 --> 00:24:42,540 e, em seguida, a probabilidade de que o palavra "rato" segue a palavra "a", 425 00:24:42,540 --> 00:24:44,910 e a probabilidade de que o palavra "comeu" segue "rato" 426 00:24:44,910 --> 00:24:51,120 e a probabilidade de que "queijo" segue "comeu". 427 00:24:51,120 --> 00:24:55,160 >> Isso soa como um monte de estatísticas, um monte de probabilidades. 428 00:24:55,160 --> 00:24:57,510 E isso é tudo que ele é. 429 00:24:57,510 --> 00:25:02,920 Mas o mais incrível é se você fizer isso com uma amostra suficientemente grande de dados, 430 00:25:02,920 --> 00:25:03,670 Isso funciona. 431 00:25:03,670 --> 00:25:05,250 E funciona tremendamente bem. 432 00:25:05,250 --> 00:25:07,810 433 00:25:07,810 --> 00:25:11,420 Nós todos sabemos que essas tecnologias. 434 00:25:11,420 --> 00:25:16,500 A maioria dos sistemas operacionais vêm com reconhecimento de voz neste momento. 435 00:25:16,500 --> 00:25:20,940 Nós usamos Siri e Cortana e Echo. 436 00:25:20,940 --> 00:25:25,070 E estas coisas são baseadas em este tipo de três camadas model-- 437 00:25:25,070 --> 00:25:30,620 um modelo fonética na parte inferior, uma modelo de pronúncia no meio, 438 00:25:30,620 --> 00:25:33,690 e um modelo de linguagem em cima deles. 439 00:25:33,690 --> 00:25:37,630 >> Agora, eles têm que fazer um pouco mais do que isso, a fim de responder a perguntas. 440 00:25:37,630 --> 00:25:43,000 Mas o reconhecimento do que você é provérbio depende exatamente sobre isso. 441 00:25:43,000 --> 00:25:45,700 Então, vamos dar um exemplo aqui. 442 00:25:45,700 --> 00:25:52,020 Então, eu tenho o meu telefone que senta-se aqui debaixo da câmera de documentos. 443 00:25:52,020 --> 00:25:56,110 E nós vamos pede Siri algumas perguntas. 444 00:25:56,110 --> 00:25:57,150 Tudo certo? 445 00:25:57,150 --> 00:25:59,940 >> Então, vamos acordar meu telefone aqui. 446 00:25:59,940 --> 00:26:02,710 447 00:26:02,710 --> 00:26:05,000 Siri, que é o tempo como em New Haven hoje? 448 00:26:05,000 --> 00:26:07,670 449 00:26:07,670 --> 00:26:10,780 >> SIRI: Aqui está o tempo para New Haven, Connecticut hoje. 450 00:26:10,780 --> 00:26:11,890 >> BRIAN Scassellati: OK. 451 00:26:11,890 --> 00:26:16,720 Então, primeiro você viu que Siri reconhecido cada uma das palavras individuais 452 00:26:16,720 --> 00:26:19,050 e, em seguida, produziu uma resposta. 453 00:26:19,050 --> 00:26:22,277 Vamos falar sobre como essa resposta acontece em um pouco. 454 00:26:22,277 --> 00:26:24,110 Mas agora que sabemos que este é apenas baseado 455 00:26:24,110 --> 00:26:28,880 sobre as estatísticas crus e esta Tipo de correspondência padrão de abordagem, 456 00:26:28,880 --> 00:26:31,120 podemos jogar alguns jogos com Siri. 457 00:26:31,120 --> 00:26:34,560 >> Então, eu posso tentar novamente. 458 00:26:34,560 --> 00:26:38,864 Siri, que é o tempo hipopótamo New Haven, hoje? 459 00:26:38,864 --> 00:26:39,810 >> SIRI: OK. 460 00:26:39,810 --> 00:26:44,245 Aqui está o tempo para New Haven, Connecticut para hoje. 461 00:26:44,245 --> 00:26:46,120 BRIAN Scassellati: Siri da não intimide com que 462 00:26:46,120 --> 00:26:50,980 porque ele é encontrado o pattern-- "clima", "Hoje", "New Haven." 463 00:26:50,980 --> 00:26:54,420 Isso é o que ele está respondendo para, assim como ELIZA. 464 00:26:54,420 --> 00:26:54,920 Tudo certo. 465 00:26:54,920 --> 00:26:59,390 Vamos dar-lhe mais um mesmo exemplo mais ridículo. 466 00:26:59,390 --> 00:27:03,075 Siri, tempo de alcachofra tatu hipopótamo New Haven? 467 00:27:03,075 --> 00:27:06,806 468 00:27:06,806 --> 00:27:08,400 >> SIRI: Deixe-me verificar. 469 00:27:08,400 --> 00:27:11,280 Aqui está o que eu encontrei na web para o que são alcachofras tatu 470 00:27:11,280 --> 00:27:13,780 hipopótamo New Haven. 471 00:27:13,780 --> 00:27:14,760 >> BRIAN Scassellati: OK. 472 00:27:14,760 --> 00:27:20,400 Então, se eu ir longe o suficiente distância a partir deste modelo, 473 00:27:20,400 --> 00:27:24,365 Eu sou capaz de confundi-lo porque ele não já não corresponde ao padrão que ele tem. 474 00:27:24,365 --> 00:27:27,370 475 00:27:27,370 --> 00:27:29,390 E essa estatística motor que está dizendo, 476 00:27:29,390 --> 00:27:32,850 qual é a probabilidade de que você tem o Hippopotamus das palavras e alcachofra 477 00:27:32,850 --> 00:27:34,440 juntos, e tatu? 478 00:27:34,440 --> 00:27:36,050 Isso tem que ser algo novo. 479 00:27:36,050 --> 00:27:38,840 480 00:27:38,840 --> 00:27:40,610 >> Assim, estas tecnologias que usamos todos os dias. 481 00:27:40,610 --> 00:27:43,670 482 00:27:43,670 --> 00:27:47,800 Se queremos levá-los um passo Além disso, porém, se nós realmente 483 00:27:47,800 --> 00:27:53,930 quero ser capaz de falar sobre o que é que estes sistemas estão a responder a, 484 00:27:53,930 --> 00:28:00,630 temos de falar, novamente, sobre um conjunto mais fundamental das perguntas. 485 00:28:00,630 --> 00:28:05,370 E isso é um tópico em comunicação que chamamos questão de atendimento. 486 00:28:05,370 --> 00:28:07,028 Isto é, nós queremos ser capazes a-- sim? 487 00:28:07,028 --> 00:28:07,944 AUDIÊNCIA: [inaudível]. 488 00:28:07,944 --> 00:28:10,789 489 00:28:10,789 --> 00:28:13,330 BRIAN Scassellati: Obtemos em processamento de semântica latente? 490 00:28:13,330 --> 00:28:14,070 Então sim. 491 00:28:14,070 --> 00:28:17,820 Há um monte de coisas que são acontecendo abaixo da superfície com Siri 492 00:28:17,820 --> 00:28:20,210 e em alguns dos exemplos Eu vou mostrar para você próximo 493 00:28:20,210 --> 00:28:22,610 onde há um pouco em termos da estrutura 494 00:28:22,610 --> 00:28:25,260 do que você está dizendo isso é importante. 495 00:28:25,260 --> 00:28:31,890 E, de fato, isso é um grande precursor para o próximo slide para mim. 496 00:28:31,890 --> 00:28:35,110 >> Assim, da mesma maneira que o nosso reconhecimento de fala foi construído 497 00:28:35,110 --> 00:28:39,620 de múltiplas camadas, se quisermos compreender o que é que, na verdade, 498 00:28:39,620 --> 00:28:44,620 Dito isto, vamos novamente depender de uma análise multi-camada 499 00:28:44,620 --> 00:28:47,020 do texto que está sendo reconhecido. 500 00:28:47,020 --> 00:28:52,560 Assim, quando Siri é realmente capaz de digamos, olha eu encontrei estas palavras. 501 00:28:52,560 --> 00:28:55,230 Agora o que eu faço com eles? 502 00:28:55,230 --> 00:28:59,110 O primeiro componente é muitas vezes a passar e tentar analisar 503 00:28:59,110 --> 00:29:03,010 a estrutura da frase. 504 00:29:03,010 --> 00:29:05,410 E no que temos visto na escola, muitas vezes, 505 00:29:05,410 --> 00:29:08,920 como uma espécie de diagramação frases, vamos 506 00:29:08,920 --> 00:29:12,774 de reconhecer que certos palavras têm certos papéis. 507 00:29:12,774 --> 00:29:13,440 Estes são substantivos. 508 00:29:13,440 --> 00:29:14,231 Estes são pronomes. 509 00:29:14,231 --> 00:29:16,200 Estes são verbos. 510 00:29:16,200 --> 00:29:19,460 E nós estamos indo para reconhecer que, para uma gramática particular, 511 00:29:19,460 --> 00:29:24,700 neste caso Inglês gramática, existem formas válidas em que eu posso combiná-los 512 00:29:24,700 --> 00:29:26,280 e outras formas que não são válidos. 513 00:29:26,280 --> 00:29:29,920 514 00:29:29,920 --> 00:29:33,870 >> Este reconhecimento, essa estrutura, pode ser suficiente para ajudar a guiar-nos 515 00:29:33,870 --> 00:29:36,720 um pouco. 516 00:29:36,720 --> 00:29:39,820 Mas não é o bastante para que sejamos capazes de dar 517 00:29:39,820 --> 00:29:43,290 qualquer significado para o que está sendo dito aqui. 518 00:29:43,290 --> 00:29:46,615 Para fazer isso, nós vamos ter que confiar em uma certa quantidade de processamento semântico. 519 00:29:46,615 --> 00:29:49,590 520 00:29:49,590 --> 00:29:55,080 Ou seja, nós vamos ter que olhar em baixo o que cada uma dessas palavras 521 00:29:55,080 --> 00:29:57,400 realmente carrega como um significado. 522 00:29:57,400 --> 00:30:01,150 E da forma mais simples de fazer isso, nós estamos indo para associar com cada palavra 523 00:30:01,150 --> 00:30:06,930 que sabemos que uma determinada função, uma certa transformação que ele 524 00:30:06,930 --> 00:30:09,300 permite que isso aconteça. 525 00:30:09,300 --> 00:30:14,470 >> Neste caso, poderíamos rotular o palavra "John", como sendo um nome próprio, 526 00:30:14,470 --> 00:30:18,160 que traz consigo uma identidade. 527 00:30:18,160 --> 00:30:21,530 E poderíamos rotular "Mary" como o mesmo caminho. 528 00:30:21,530 --> 00:30:27,900 Considerando um verbo como "ama", que constitui uma relação particular 529 00:30:27,900 --> 00:30:31,582 que somos capazes de representar. 530 00:30:31,582 --> 00:30:33,290 Agora, isso não significa que que entendemos 531 00:30:33,290 --> 00:30:37,680 que é o amor, mas apenas que nós compreendemos -lo na forma de um sistema simbólico. 532 00:30:37,680 --> 00:30:40,480 Ou seja, podemos rotular lo e manipulá-lo. 533 00:30:40,480 --> 00:30:44,230 534 00:30:44,230 --> 00:30:49,120 >> Com cada um destes tipos de abordagens, qualquer tipo de processamento semântico 535 00:30:49,120 --> 00:30:57,060 aqui vai exigir um pouco pouco de conhecimento e um monte de trabalho 536 00:30:57,060 --> 00:30:59,020 da nossa parte. 537 00:30:59,020 --> 00:31:03,590 Não estamos mais no reino onde as estatísticas apenas simples 538 00:31:03,590 --> 00:31:07,320 vai ser o suficiente para nós. 539 00:31:07,320 --> 00:31:11,330 Agora, a fim de ir a partir deste ponto para ser 540 00:31:11,330 --> 00:31:15,520 capaz de falar sobre o interior o que está realmente acontecendo aqui, 541 00:31:15,520 --> 00:31:19,640 para ser capaz de manipular este estruturar e compreender uma pergunta 542 00:31:19,640 --> 00:31:23,160 e, em seguida, ser capaz para sair e procurar, 543 00:31:23,160 --> 00:31:27,290 que requer um mais modelo cognitivo complexo. 544 00:31:27,290 --> 00:31:34,880 >> A forma em que estes sistemas são construídos é, na maior parte muito, muito trabalho 545 00:31:34,880 --> 00:31:36,350 intensiva. 546 00:31:36,350 --> 00:31:39,490 Elas envolvem seres humanos gastar uma grande quantidade 547 00:31:39,490 --> 00:31:44,100 tempo de estruturar as formas de que esses tipos de frases 548 00:31:44,100 --> 00:31:47,270 pode ser representada em alguns lógica. 549 00:31:47,270 --> 00:31:51,639 550 00:31:51,639 --> 00:31:53,430 Ele fica ainda um pouco mais complexo, no entanto. 551 00:31:53,430 --> 00:31:56,400 552 00:31:56,400 --> 00:31:59,660 >> Mesmo uma vez que lidei com a semântica, vamos 553 00:31:59,660 --> 00:32:03,860 ainda tem que olhar para o pragmática do que está sendo dito. 554 00:32:03,860 --> 00:32:08,620 Isto é, como faço para relacionar as palavras que eu tenho que algo fisicamente para fora 555 00:32:08,620 --> 00:32:12,054 há no mundo, ou pelo menos alguma fonte de informação 556 00:32:12,054 --> 00:32:12,970 que eu possa manipular? 557 00:32:12,970 --> 00:32:15,780 558 00:32:15,780 --> 00:32:20,790 >> Às vezes, estes levar a pedaços maravilhosas de ambiguidade. 559 00:32:20,790 --> 00:32:24,470 "Red-quente estrela de casar astrônomo." 560 00:32:24,470 --> 00:32:25,630 ESTÁ BEM. 561 00:32:25,630 --> 00:32:28,540 Agora, lemos que, como o Tipo engraçado de headline 562 00:32:28,540 --> 00:32:34,690 que gostaríamos de ver em TV tarde da noite porque nós não interpretar "estrela" 563 00:32:34,690 --> 00:32:38,630 para ter o seu significado corpo celeste. 564 00:32:38,630 --> 00:32:43,390 Sabemos que isso significa que a mais ator ou atriz comum 565 00:32:43,390 --> 00:32:45,240 com quantidades elevadas de visibilidade. 566 00:32:45,240 --> 00:32:47,770 567 00:32:47,770 --> 00:32:51,950 >> "Tropa de ajuda mordida de cão vítima." 568 00:32:51,950 --> 00:32:55,550 Será que o plantel é realmente lá fora, assistindo um cão 569 00:32:55,550 --> 00:32:59,620 em ir ao redor e mordendo vítimas? 570 00:32:59,620 --> 00:33:02,380 Ou será que não havia um indivíduo que era 571 00:33:02,380 --> 00:33:04,625 mordido por um cão que precisava de alguma ajuda? 572 00:33:04,625 --> 00:33:07,650 573 00:33:07,650 --> 00:33:11,480 Só de olhar para a sintaxe e a semântica das sentenças, 574 00:33:11,480 --> 00:33:14,660 não podemos determinar isso. 575 00:33:14,660 --> 00:33:22,000 >> "Helicóptero alimentado por moscas humanos." 576 00:33:22,000 --> 00:33:27,330 Há, de fato, real pequenas coisas que voam ao redor 577 00:33:27,330 --> 00:33:34,510 são pessoas com asas alimentar helicópteros para o bem da humanidade? 578 00:33:34,510 --> 00:33:38,960 Ou há um dispositivo mecânico que deriva sua energia de uma pessoa? 579 00:33:38,960 --> 00:33:41,600 580 00:33:41,600 --> 00:33:46,500 >> Quando olhamos para a questão sistemas de atendimento, 581 00:33:46,500 --> 00:33:51,110 estes são as camadas que temos de lidar com eles. 582 00:33:51,110 --> 00:33:54,890 Agora, o melhor eo mais sorte de prevalente destes sistemas 583 00:33:54,890 --> 00:34:00,640 hoje são capazes de fazer as coisas a um nível que são 584 00:34:00,640 --> 00:34:05,050 muito além do que tínhamos há 10 anos. 585 00:34:05,050 --> 00:34:08,210 Aqui está um dos melhores sistemas que está lá fora hoje. 586 00:34:08,210 --> 00:34:10,519 E este é um sistema da IBM chamado Watson. 587 00:34:10,519 --> 00:34:13,040 588 00:34:13,040 --> 00:34:15,500 Esta é a partir de nossos amigos da IBM. 589 00:34:15,500 --> 00:34:19,810 Esta é Katherine bancos, Jia Chen, e Priscila Moraes dando-nos 590 00:34:19,810 --> 00:34:26,323 uma demonstração de Watson ontem, em Yorktown IBM. 591 00:34:26,323 --> 00:34:26,989 [REPRODUÇÃO DE VÍDEO] 592 00:34:26,989 --> 00:34:27,690 -Como você está? 593 00:34:27,690 --> 00:34:30,600 594 00:34:30,600 --> 00:34:31,980 >> -Estou bem. 595 00:34:31,980 --> 00:34:35,429 Eu estou sempre feliz quando estou pensar, especialmente quando eu 596 00:34:35,429 --> 00:34:38,920 pode ficar legal nessas salas de servidores. 597 00:34:38,920 --> 00:34:40,170 -Quem É sua atriz favorita? 598 00:34:40,170 --> 00:34:43,870 599 00:34:43,870 --> 00:34:47,555 >> -Meu Atriz favorita Angelina Jolie como Lara Croft 600 00:34:47,555 --> 00:34:54,800 em Tomb Raider porque sua origem forma era como um personagem virtual como eu. 601 00:34:54,800 --> 00:34:56,760 >> -Como Pode Watson ajudar os pacientes? 602 00:34:56,760 --> 00:34:59,700 603 00:34:59,700 --> 00:35:03,755 >> -É O plano para os pacientes para têm acesso a Watson diretamente? 604 00:35:03,755 --> 00:35:08,050 O acesso a Watson consultivo aplicações variam de acordo com caso de uso. 605 00:35:08,050 --> 00:35:12,630 Mas actualmente, Watson só fornecerá possível diagnóstico e tratamento 606 00:35:12,630 --> 00:35:14,725 opções para profissional médico. 607 00:35:14,725 --> 00:35:17,680 Se for caso disso, os pacientes pode fornecer informações 608 00:35:17,680 --> 00:35:21,210 a Watson, talvez através de um interface web portal, tablet, 609 00:35:21,210 --> 00:35:23,500 ou mesmo um telefone celular. 610 00:35:23,500 --> 00:35:27,180 Por exemplo, um paciente pode ser solicitados a descrever seus sintomas 611 00:35:27,180 --> 00:35:30,460 em linguagem natural directamente numa solução Watson, 612 00:35:30,460 --> 00:35:34,050 permitindo ao médico focar diagnóstico e não a coleta de dados. 613 00:35:34,050 --> 00:35:38,379 614 00:35:38,379 --> 00:35:42,716 >> -Quem Assassinado Abraham Lincoln? 615 00:35:42,716 --> 00:35:46,153 >> -João Wilkes Booth. 616 00:35:46,153 --> 00:35:52,373 >> -Em Que ano fez o Arizona Diamondbacks vencer a World Series? 617 00:35:52,373 --> 00:35:55,295 >> -2001. 618 00:35:55,295 --> 00:35:58,710 >> [FIM DE REPRODUÇÃO] 619 00:35:58,710 --> 00:36:01,610 >> BRIAN Scassellati: Então, estes tipos de sistemas 620 00:36:01,610 --> 00:36:07,430 tem que confiar em primeiro lugar reconhecer o discurso; segundo, 621 00:36:07,430 --> 00:36:12,200 convertendo-a em uma interna significativa representação; e, em seguida, em terceiro lugar, 622 00:36:12,200 --> 00:36:17,090 ser capaz de sair e encontrar a fonte de informação que 623 00:36:17,090 --> 00:36:21,140 lhes permite responder a essa pergunta. 624 00:36:21,140 --> 00:36:27,320 Este nível de complexidade envolve os mesmos tipos de coisas programáticas 625 00:36:27,320 --> 00:36:31,790 que você tem sido fazendo em conjuntos de problemas. 626 00:36:31,790 --> 00:36:38,000 >> Somos capazes de analisar as solicitações HTTP em o mesmo tipo de padrão de baixo nível 627 00:36:38,000 --> 00:36:40,810 ELIZA correspondente que pode fazer. 628 00:36:40,810 --> 00:36:45,070 Somos capazes de converter os em uma representação interna, 629 00:36:45,070 --> 00:36:50,360 e então usá-los para consultar alguns banco de dados externo, possivelmente usando SQL. 630 00:36:50,360 --> 00:36:53,530 631 00:36:53,530 --> 00:36:56,260 Todos os sistemas que estão sendo construídas hoje 632 00:36:56,260 --> 00:37:00,520 para fazer este tipo de catástrofes naturais comunicação língua 633 00:37:00,520 --> 00:37:04,100 estão sendo construídas em cima esses mesmos princípios. 634 00:37:04,100 --> 00:37:09,530 >> Agora, até mesmo um sistema como Watson não é suficiente complexo 635 00:37:09,530 --> 00:37:14,820 para ser capaz de responder arbitrária perguntas sobre qualquer assunto. 636 00:37:14,820 --> 00:37:20,060 E, de fato, eles têm que ser estruturada dentro de um determinado domínio. 637 00:37:20,060 --> 00:37:24,440 Então você pode ir online e você pode encontrar versões de Watson que operam bem 638 00:37:24,440 --> 00:37:27,700 dentro de informática médica. 639 00:37:27,700 --> 00:37:31,490 Ou há uma linha que apenas trata de como 640 00:37:31,490 --> 00:37:34,540 fazer boas recomendações sobre o que a cerveja vai com que o alimento. 641 00:37:34,540 --> 00:37:37,060 642 00:37:37,060 --> 00:37:41,870 E dentro desses domínios, ele pode responder a perguntas, 643 00:37:41,870 --> 00:37:46,130 encontrar a informação de que necessita. 644 00:37:46,130 --> 00:37:48,270 >> Mas você não pode misturar e combinar-los. 645 00:37:48,270 --> 00:37:53,150 O sistema que foi treinado com o banco de dados de alimentos e cerveja 646 00:37:53,150 --> 00:37:56,830 não funciona bem quando você de repente colocá-lo em com a informática médica 647 00:37:56,830 --> 00:37:59,770 banco de dados. 648 00:37:59,770 --> 00:38:05,680 Assim, mesmo os nossos melhores sistemas de hoje dependem de um nível de processamento 649 00:38:05,680 --> 00:38:11,570 em que estamos codificação manual e construção da infra-estrutura, a fim 650 00:38:11,570 --> 00:38:13,275 para fazer este sistema funcionar. 651 00:38:13,275 --> 00:38:16,360 652 00:38:16,360 --> 00:38:20,710 >> Agora, o último tópico que eu quero para ser capaz de obter a hoje 653 00:38:20,710 --> 00:38:23,960 é sobre comunicação não-verbal. 654 00:38:23,960 --> 00:38:29,290 Uma grande massa de informações que nós nos comunicamos uns com os outros 655 00:38:29,290 --> 00:38:35,490 não acontece através do palavras individuais que estamos aplicando. 656 00:38:35,490 --> 00:38:40,290 Tem a ver com coisas como proximidade, olhar, seu tom de voz, 657 00:38:40,290 --> 00:38:42,270 sua inflexão. 658 00:38:42,270 --> 00:38:46,620 E que a comunicação é também algo que muitas interfaces diferentes 659 00:38:46,620 --> 00:38:49,960 importam muito sobre. 660 00:38:49,960 --> 00:38:51,500 Não é o que se preocupa com Siri. 661 00:38:51,500 --> 00:38:56,250 Eu posso pedir Siri algo em uma só voz ou em um tom de voz diferente, 662 00:38:56,250 --> 00:38:59,840 e Siri vai me dar a mesma resposta. 663 00:38:59,840 --> 00:39:05,260 Mas não é isso que nós construímos para muitos outros tipos de interfaces. 664 00:39:05,260 --> 00:39:09,120 >> Eu quero apresentar-lhe Agora, a um dos robôs. 665 00:39:09,120 --> 00:39:12,720 Este foi construído pelo meu de longa data amigo e colega Cynthia 666 00:39:12,720 --> 00:39:16,010 Breazeal e sua empresa Jibo. 667 00:39:16,010 --> 00:39:20,090 E este robot-- vamos para ter um par de voluntários 668 00:39:20,090 --> 00:39:22,520 chegar a interagir com isso. 669 00:39:22,520 --> 00:39:26,200 Então eu posso ter duas pessoas dispostas jogar com o robô para mim? 670 00:39:26,200 --> 00:39:29,936 Por que você não vem para cima, e por que você não vem em cima. 671 00:39:29,936 --> 00:39:31,310 Se você quiser se juntar a mim aqui em cima, por favor. 672 00:39:31,310 --> 00:39:36,520 673 00:39:36,520 --> 00:39:39,670 >> E se eu pudesse ter você vir bem aqui. 674 00:39:39,670 --> 00:39:40,170 Obrigado. 675 00:39:40,170 --> 00:39:40,480 Oi. 676 00:39:40,480 --> 00:39:41,400 >> ALFREDO: Prazer em conhecê-lo. 677 00:39:41,400 --> 00:39:42,010 Alfredo. 678 00:39:42,010 --> 00:39:42,520 >> BRIAN Scassellati: Alfredo. 679 00:39:42,520 --> 00:39:43,146 >> RACHEL: Rachel. 680 00:39:43,146 --> 00:39:44,228 BRIAN Scassellati: Rachel. 681 00:39:44,228 --> 00:39:45,154 Prazer em conhecê-los. 682 00:39:45,154 --> 00:39:46,820 Alfredo, eu vou ter de ir primeiro. 683 00:39:46,820 --> 00:39:47,990 Venha até aqui. 684 00:39:47,990 --> 00:39:51,870 Eu estou indo para introduzir você-- se eu posso tirar isso 685 00:39:51,870 --> 00:39:58,450 sem bater o microphone-- para um pequeno robô chamado Jibo. 686 00:39:58,450 --> 00:40:00,140 ok? 687 00:40:00,140 --> 00:40:04,260 >> Agora, Jibo é projetado para ser interativo. 688 00:40:04,260 --> 00:40:09,339 E embora possa dar-lhe a fala, tanto da interacção com o robô 689 00:40:09,339 --> 00:40:09,880 é não-verbal. 690 00:40:09,880 --> 00:40:12,450 691 00:40:12,450 --> 00:40:17,070 Alfredo, eu vou pedir para você dizer algo agradável e cortesia 692 00:40:17,070 --> 00:40:19,554 para o robô, por favor. 693 00:40:19,554 --> 00:40:20,845 ALFREDO: Eu acho que você olhar bonito. 694 00:40:20,845 --> 00:40:24,114 695 00:40:24,114 --> 00:40:25,611 >> [Zumbido] 696 00:40:25,611 --> 00:40:26,192 697 00:40:26,192 --> 00:40:27,108 BRIAN Scassellati: OK. 698 00:40:27,108 --> 00:40:30,110 699 00:40:30,110 --> 00:40:33,180 Sua resposta não é verbal. 700 00:40:33,180 --> 00:40:35,180 E ainda lhe deu tanto um claro reconhecimento 701 00:40:35,180 --> 00:40:39,680 que ele tinha ouvido falar que você disse e também entendeu que de alguma forma. 702 00:40:39,680 --> 00:40:40,530 ok? 703 00:40:40,530 --> 00:40:42,070 Passo para a direita de volta aqui por um segundo. 704 00:40:42,070 --> 00:40:43,130 Obrigado. 705 00:40:43,130 --> 00:40:44,090 >> Rachel, se você faria. 706 00:40:44,090 --> 00:40:46,070 Agora, eu vou dar- lhe o trabalho muito mais difícil. 707 00:40:46,070 --> 00:40:48,361 Se você ficar aqui, backup de apenas um pouco assim 708 00:40:48,361 --> 00:40:50,280 que você pode obter na câmera e olhe para este lado. 709 00:40:50,280 --> 00:40:56,840 Vou pedir-lhe para dizer alguma coisa realmente significa e desagradável para o robô. 710 00:40:56,840 --> 00:41:02,900 >> RACHEL: O que você apenas parecia a fazer era completamente absurda. 711 00:41:02,900 --> 00:41:03,840 >> [ZUMBIDO SOUND] 712 00:41:03,840 --> 00:41:07,610 713 00:41:07,610 --> 00:41:09,030 >> Isso era ainda mais absurdo. 714 00:41:09,030 --> 00:41:10,120 O que está acontecendo com você? 715 00:41:10,120 --> 00:41:13,487 716 00:41:13,487 --> 00:41:16,207 Ah, não se sinta mal. 717 00:41:16,207 --> 00:41:17,040 Vou te dar um abraço. 718 00:41:17,040 --> 00:41:19,882 719 00:41:19,882 --> 00:41:21,090 BRIAN Scassellati: Tudo bem. 720 00:41:21,090 --> 00:41:22,280 Obrigado, Rachel. 721 00:41:22,280 --> 00:41:24,565 Alfredo, Rachel, graças eles muito. 722 00:41:24,565 --> 00:41:26,840 >> [Aplausos] 723 00:41:26,840 --> 00:41:28,660 724 00:41:28,660 --> 00:41:34,470 >> Portanto, este tipo de interação tem em muitas maneiras algumas das mesmas regras 725 00:41:34,470 --> 00:41:36,950 e alguns dos mesmos estrutura como o que nós 726 00:41:36,950 --> 00:41:39,950 pode ter na interação lingüística. 727 00:41:39,950 --> 00:41:44,530 É tanto comunicativa e serve a um propósito importante. 728 00:41:44,530 --> 00:41:48,590 E que a interação, em muitas maneiras, é concebido 729 00:41:48,590 --> 00:41:52,890 ter um efeito particular sobre a pessoa interagindo com ou escuta 730 00:41:52,890 --> 00:41:54,410 para o robô. 731 00:41:54,410 --> 00:41:56,450 >> Agora, eu tenho a sorte ter Jibo aqui hoje. 732 00:41:56,450 --> 00:42:00,550 Sam Spaulding está aqui ajudando nos com o robô. 733 00:42:00,550 --> 00:42:07,470 E eu vou perguntar a Sam para dar nos um bom demo de Jibo dança 734 00:42:07,470 --> 00:42:09,720 que podemos ver no final aqui. 735 00:42:09,720 --> 00:42:10,590 Então vá em frente, Jibo. 736 00:42:10,590 --> 00:42:11,550 >> SAM: OK, Jibo. 737 00:42:11,550 --> 00:42:14,430 Mostre-nos seus movimentos de dança. 738 00:42:14,430 --> 00:42:17,310 >> [Música tocando] 739 00:42:17,310 --> 00:42:43,114 740 00:42:43,114 --> 00:42:44,780 BRIAN Scassellati: Tudo bem, todo mundo. 741 00:42:44,780 --> 00:42:46,865 Graças aos nossos amigos em Jibo. 742 00:42:46,865 --> 00:42:49,426 >> [Aplausos] 743 00:42:49,426 --> 00:42:50,140 744 00:42:50,140 --> 00:42:54,990 >> E graças aos nossos amigos na IBM para ajudar para fora hoje. 745 00:42:54,990 --> 00:42:57,300 A comunicação é algo que você está indo 746 00:42:57,300 --> 00:43:02,280 para ver chegando cada vez mais como nós construir interfaces mais complexas. 747 00:43:02,280 --> 00:43:05,760 Na próxima semana, vamos estar falando sobre como fazer a interface 748 00:43:05,760 --> 00:43:08,890 com adversários controlados pelo computador em jogos. 749 00:43:08,890 --> 00:43:12,950 Mas se você tiver dúvidas sobre isso, Eu vou estar em torno de hoje à noite o horário de expediente. 750 00:43:12,950 --> 00:43:17,610 Estou feliz em falar com você sobre AI tópicos ou para entrar em mais detalhes. 751 00:43:17,610 --> 00:43:18,927 Tenha um bom final de semana. 752 00:43:18,927 --> 00:43:21,409 >> [Aplausos] 753 00:43:21,409 --> 00:43:21,909 754 00:43:21,909 --> 00:43:26,141 [Música tocando] 755 00:43:26,141 --> 00:46:42,879