1 00:00:00,000 --> 00:00:02,928 >> [Jouer de la musique] 2 00:00:02,928 --> 00:00:11,230 3 00:00:11,230 --> 00:00:12,790 >> DAVID MALAN: Ceci est CS50. 4 00:00:12,790 --> 00:00:14,072 Ceci est la fin de la semaine 10. 5 00:00:14,072 --> 00:00:16,030 Et le garçon, avons-nous un bonne classe pour vous aujourd'hui. 6 00:00:16,030 --> 00:00:20,040 Nous sommes très heureux d'inviter deux des nos amis de Yale jusqu'à nous aujourd'hui 7 00:00:20,040 --> 00:00:23,920 et à comparer à l'intersection de l'intelligence artificielle, la robotique, 8 00:00:23,920 --> 00:00:25,710 traitement du langage naturel, et plus encore. 9 00:00:25,710 --> 00:00:27,090 >> Et en effet, au cours de la dernières semaines, nous avons 10 00:00:27,090 --> 00:00:29,714 certainement passé beaucoup de temps, en particulier dans les psets précédentes, 11 00:00:29,714 --> 00:00:31,560 concentrant sur jolis détails de bas niveau. 12 00:00:31,560 --> 00:00:34,520 Et il est très facile de perdre de vue de la forêt pour les arbres 13 00:00:34,520 --> 00:00:38,170 et vous attardez sur les boucles et conditions et des pointeurs, certes, et analogues. 14 00:00:38,170 --> 00:00:41,770 Mais la réalité est que vous avez maintenant les gars ingrédients avec lesquels vous pouvez vraiment 15 00:00:41,770 --> 00:00:45,300 résoudre des problèmes intéressants, parmi les eux ces que nos amis de Yale 16 00:00:45,300 --> 00:00:48,790 travailler sur un peu moins de Cambridge. 17 00:00:48,790 --> 00:00:52,410 >> Alors, permettez-moi d'abord de vous présenter notre tête assistant d'enseignement de l'Université Yale, Andy. 18 00:00:52,410 --> 00:00:55,182 >> [APPLAUDISSEMENTS] 19 00:00:55,182 --> 00:00:57,030 20 00:00:57,030 --> 00:01:00,710 >> ANDY: Tout d'abord, tout simplement remercier vous pour permettre à un couple Yalies 21 00:01:00,710 --> 00:01:02,700 de la pop sur le bas à Cambridge aujourd'hui. 22 00:01:02,700 --> 00:01:05,299 Nous l'apprécions vraiment. 23 00:01:05,299 --> 00:01:07,090 Deuxièmement, à nos amis Retour home-- Jason, 24 00:01:07,090 --> 00:01:09,670 Merci de rester opérationnel conférence. 25 00:01:09,670 --> 00:01:12,970 Espérons que tout va bien à New Haven. 26 00:01:12,970 --> 00:01:15,720 >> Donc oui, je suis super excité d'introduire Scaz aujourd'hui. 27 00:01:15,720 --> 00:01:17,020 Scaz dirige le laboratoire de robotique. 28 00:01:17,020 --> 00:01:19,690 Il est un professeur de, comme, cinq différents départements à Yale. 29 00:01:19,690 --> 00:01:23,159 Dans son laboratoire, il a beaucoup, beaucoup robots qui il aime jouer avec. 30 00:01:23,159 --> 00:01:24,950 Il a, comme, le cool emplois dans le monde. 31 00:01:24,950 --> 00:01:27,116 Et il arrive à type de désordre autour de toute la journée que 32 00:01:27,116 --> 00:01:29,090 long et faire un peu de travail, aussi bien. 33 00:01:29,090 --> 00:01:33,070 >> Et donc nous avons effectivement apporté un d'entre eux avec nous aujourd'hui. 34 00:01:33,070 --> 00:01:36,900 Alors sans plus tarder, est Scaz aller de l'avant et de nous présenter 35 00:01:36,900 --> 00:01:38,660 à son ami robot. 36 00:01:38,660 --> 00:01:41,546 >> [APPLAUDISSEMENTS] 37 00:01:41,546 --> 00:01:42,935 38 00:01:42,935 --> 00:01:44,310 BRIAN Scassellati: Merci, David. 39 00:01:44,310 --> 00:01:45,380 Merci, Andy. 40 00:01:45,380 --> 00:01:50,050 Il est si merveilleux d'être ici avec tout le monde aujourd'hui. 41 00:01:50,050 --> 00:01:56,490 Je veux d'abord être très clair que le personnel de la CS50 ici à Cambridge 42 00:01:56,490 --> 00:01:59,190 a été incroyablement accueillant pour nous. 43 00:01:59,190 --> 00:02:02,130 Nous sommes tellement reconnaissants pour tout qu'ils ont fait pour nous soutenir. 44 00:02:02,130 --> 00:02:05,690 Et donc nous aimerions être en mesure pour retourner la gentillesse. 45 00:02:05,690 --> 00:02:09,370 >> Donc, aujourd'hui, nous obtenons d'annoncer que nous allons avoir un nouveau, 46 00:02:09,370 --> 00:02:15,240 one-of-a-kind d'événement CS50 passe à New Haven la semaine prochaine. 47 00:02:15,240 --> 00:02:18,040 Et cela est l'Expo recherche CS50. 48 00:02:18,040 --> 00:02:21,300 Donc, nous allons être invitant everyone-- CS50 étudiants, 49 00:02:21,300 --> 00:02:26,510 le personnel de Harvard et à Yale-- descendre et visiter avec nous le vendredi. 50 00:02:26,510 --> 00:02:30,400 Nous avons une grande variété de cours 30 personnes présentant différents 51 00:02:30,400 --> 00:02:34,830 et upperclassmen exhibiting-- montrant une partie de leurs produits de recherche. 52 00:02:34,830 --> 00:02:38,480 Nous aurons quelques startups, même, à la recherche pour un peu de nouveaux talents de la technologie, 53 00:02:38,480 --> 00:02:40,460 startups de Harvard et Yale. 54 00:02:40,460 --> 00:02:44,550 Et nous aurons des groupes d'étudiants la recherche d'une nouvelle adhésion. 55 00:02:44,550 --> 00:02:46,357 >> Ça va être un moment très excitant. 56 00:02:46,357 --> 00:02:49,190 Espérons que ceux d'entre vous qui sont descendre pour le jeu Harvard-Yale 57 00:02:49,190 --> 00:02:51,360 sera en mesure d'arrêter par un peu plus tôt, 58 00:02:51,360 --> 00:02:54,060 en plein centre du campus, Sterling Memorial Library. 59 00:02:54,060 --> 00:02:58,040 Nous allons avoir un ensemble de expositions qui vont de la autonome 60 00:02:58,040 --> 00:03:04,460 voiliers à des moyens d'utiliser le logiciel pour préserver les manuscrits médiévaux. 61 00:03:04,460 --> 00:03:07,860 >> Nous allons devoir annonce réseau hoc et les gens 62 00:03:07,860 --> 00:03:11,230 enseignement codage logiciel à Cape Town. 63 00:03:11,230 --> 00:03:13,730 Nous aurons ordinateur démonstrations de musique. 64 00:03:13,730 --> 00:03:16,020 Et nous avons bien sûr plusieurs robots. 65 00:03:16,020 --> 00:03:18,900 Donc, nous espérons que vous aurez ne joindre à nous pour cet événement. 66 00:03:18,900 --> 00:03:21,350 Il devrait y avoir beaucoup de amusant, un peu de nourriture, 67 00:03:21,350 --> 00:03:24,430 et beaucoup d'intéressant choses à raconter. 68 00:03:24,430 --> 00:03:28,230 >> Donc, aujourd'hui, nous allons parler sur le traitement du langage naturel. 69 00:03:28,230 --> 00:03:32,560 Et cela est une tentative pour nous de construire une nouvelle façon d'interfaçage 70 00:03:32,560 --> 00:03:35,150 avec nos appareils parce que pour les quelques dernières semaines, 71 00:03:35,150 --> 00:03:40,800 vous avez été porté sur la façon dont il est que vous pouvez écrire du code, écrire des logiciels 72 00:03:40,800 --> 00:03:47,110 qui est une façon d'être en mesure de dire à un linge, voici ce que je veux que vous fassiez. 73 00:03:47,110 --> 00:03:50,210 >> Mais nous ne devrions pas besoin de attendre que tout 74 00:03:50,210 --> 00:03:53,760 qui est là qui est utilisé par tous dans le monde 75 00:03:53,760 --> 00:03:57,480 va être compétent dans ce type d'enseignement. 76 00:03:57,480 --> 00:04:02,540 Donc, nous distinguons entre l'ordinateur langues et languages-- naturelle 77 00:04:02,540 --> 00:04:06,720 qui est, les choses que les humains utilisent pour communiquer avec d'autres humains. 78 00:04:06,720 --> 00:04:12,270 Et nous essayons de construire des interfaces qui utilisent ces mécanismes de communication naturelles. 79 00:04:12,270 --> 00:04:16,029 >> Maintenant, comme tout autre sujet que nous avons commencé avec en CS50, 80 00:04:16,029 --> 00:04:19,589 Nous allons commencer par le plus simple peu de traitement du langage naturel 81 00:04:19,589 --> 00:04:21,269 que nous pouvons imaginer. 82 00:04:21,269 --> 00:04:24,940 Nous allons commencer avec le partie historique de la langue naturelle. 83 00:04:24,940 --> 00:04:28,740 Et puis nous allons construire jusqu'à des systèmes de plus en plus récents 84 00:04:28,740 --> 00:04:31,450 et ont quelques démos plaisir à le faire. 85 00:04:31,450 --> 00:04:35,900 >> Nous allons donc commencer avec ce qui était probablement le premier langage naturel 86 00:04:35,900 --> 00:04:38,210 Système de traitement. 87 00:04:38,210 --> 00:04:45,080 Ceci est un système logiciel écrit en 1966 par Joseph Weizenbaum appelé ELIZA. 88 00:04:45,080 --> 00:04:49,640 Et Eliza a été conçu pour reproduire le genre d'interaction 89 00:04:49,640 --> 00:04:53,850 vous auriez avec un Psychothérapeute rogérienne. 90 00:04:53,850 --> 00:04:57,210 Maintenant, les Rogerians, ils avaient une idée que la psychothérapie 91 00:04:57,210 --> 00:05:02,800 impliqué être en mesure de refléter de retour à un patient et de leur parler, 92 00:05:02,800 --> 00:05:08,100 essentiellement, en ne leur donnant une petit peu du thérapeute. 93 00:05:08,100 --> 00:05:09,920 Voilà, tout que le thérapeute ladite 94 00:05:09,920 --> 00:05:16,500 était censé être juste un reflet de ce que le patient a été dit d'eux. 95 00:05:16,500 --> 00:05:18,990 >> Donc, nous allons essayer de DEMO. 96 00:05:18,990 --> 00:05:22,820 Avons-nous un bénévole qui serait prêts à partager leur plus profonde, 97 00:05:22,820 --> 00:05:26,650 les plus sombres, et / ou secrets faux Eliza? 98 00:05:26,650 --> 00:05:29,680 Bien sûr, pourquoi ne venez-vous pas sur place. 99 00:05:29,680 --> 00:05:30,847 Fantastique. 100 00:05:30,847 --> 00:05:31,430 Et votre nom? 101 00:05:31,430 --> 00:05:32,000 >> Miles: Miles. 102 00:05:32,000 --> 00:05:33,041 >> BRIAN Scassellati: Miles. 103 00:05:33,041 --> 00:05:34,270 Ravi de vous rencontrer, Miles. 104 00:05:34,270 --> 00:05:36,270 Si vous souhaitez conserver cela. 105 00:05:36,270 --> 00:05:40,840 Et nous allons utiliser une version d'Eliza 106 00:05:40,840 --> 00:05:44,640 que nous avons répliqué au sein de l'IDE CS50. 107 00:05:44,640 --> 00:05:47,140 Et nous allons regarder à la source code pour cela dans un peu de temps. 108 00:05:47,140 --> 00:05:49,910 Mais pour l'instant, nous sommes juste aller de l'invoquer en tapant Eliza. 109 00:05:49,910 --> 00:05:55,480 >> Et Eliza va vous donner des réponses qui vont être dans toutes les capitales. 110 00:05:55,480 --> 00:05:57,950 Et vais vous poser quelques questions. 111 00:05:57,950 --> 00:06:02,130 Et nous allons réagir et tapons dans les réponses à Eliza. 112 00:06:02,130 --> 00:06:04,310 Donc ELIZA a dit, "Salut, je suis ELIZA. 113 00:06:04,310 --> 00:06:05,462 Quel est ton problème?" 114 00:06:05,462 --> 00:06:08,092 Que voudriez-vous ELIZA dire aujourd'hui? 115 00:06:08,092 --> 00:06:10,750 >> MILES: Je peux seulement endormir si je dois pantoufles de lapin sur. 116 00:06:10,750 --> 00:06:12,440 >> BRIAN Scassellati: Très bien. 117 00:06:12,440 --> 00:06:13,360 Bien. 118 00:06:13,360 --> 00:06:15,300 >> [RIRE] 119 00:06:15,300 --> 00:06:22,410 >> "Je peux seulement endormir avec pantoufles de lapin sur ". 120 00:06:22,410 --> 00:06:29,000 Et Eliza dit: «Dis, avez-vous avoir des problèmes psychologiques? 121 00:06:29,000 --> 00:06:30,450 Peut-être que cela est un bon indicateur. " 122 00:06:30,450 --> 00:06:30,780 >> D'ACCORD. 123 00:06:30,780 --> 00:06:32,245 Alors, que voulez-vous répondre? 124 00:06:32,245 --> 00:06:36,110 125 00:06:36,110 --> 00:06:36,970 >> MILES: Oui. 126 00:06:36,970 --> 00:06:38,660 >> BRIAN Scassellati: Oui. 127 00:06:38,660 --> 00:06:39,570 L'homme de beaucoup de mots. 128 00:06:39,570 --> 00:06:41,870 Je apprécie cela. 129 00:06:41,870 --> 00:06:50,200 Eliza dit, "Vous semblez très positive." 130 00:06:50,200 --> 00:06:53,200 >> MILES: Non, je suis, en fait, un électron. 131 00:06:53,200 --> 00:06:55,150 >> BRIAN Scassellati: "No. 132 00:06:55,150 --> 00:07:02,240 En fait, je suis un électron. " "Avez-vous venez à moi 133 00:07:02,240 --> 00:07:06,954 parce que vous êtes un électron? " 134 00:07:06,954 --> 00:07:08,870 Maintenant, nous pouvons voir quelques-uns des l'things-- je vais 135 00:07:08,870 --> 00:07:10,200 vous une pause pendant une seconde, Miles. 136 00:07:10,200 --> 00:07:11,010 Ne pas aller n'importe où. 137 00:07:11,010 --> 00:07:12,650 Nous ne sommes pas encore fini avec vous. 138 00:07:12,650 --> 00:07:16,490 ELIZA est, à certains égards, répondre à certaines choses 139 00:07:16,490 --> 00:07:21,140 qu'il a dit, mais sans une réelle compréhension. 140 00:07:21,140 --> 00:07:26,090 Et il est également parroting récupérer une partie des parties de sa peine. 141 00:07:26,090 --> 00:07:27,310 >> Alors nous avons dit: «Non, 142 00:07:27,310 --> 00:07:29,090 En fait, je suis un électron. " 143 00:07:29,090 --> 00:07:34,190 Eliza a répondu en arrière, "Es-tu venu pour moi parce que vous êtes un électron? " 144 00:07:34,190 --> 00:07:34,690 Bien. 145 00:07:34,690 --> 00:07:36,050 Donnons-lui encore une réponse ici. 146 00:07:36,050 --> 00:07:37,140 Donnez-lui un bon, Miles. 147 00:07:37,140 --> 00:07:37,806 >> MILES: Good one? 148 00:07:37,806 --> 00:07:48,400 149 00:07:48,400 --> 00:07:49,570 >> Oui, s'il vous plaît aider moi. 150 00:07:49,570 --> 00:07:50,570 BRIAN Scassellati: "Oui. 151 00:07:50,570 --> 00:07:58,010 S'il vous plaît aidez-moi "." Etes-vous sûr? " 152 00:07:58,010 --> 00:07:58,510 MILES: Non 153 00:07:58,510 --> 00:08:00,860 BRIAN Scassellati: Non 154 00:08:00,860 --> 00:08:03,562 "Qu'est-ce que vous suggérer?" 155 00:08:03,562 --> 00:08:06,760 >> MILES: Je ne peut pas être un électron. 156 00:08:06,760 --> 00:08:11,170 >> BRIAN Scassellati: «Je peut ne pas être un électron. " 157 00:08:11,170 --> 00:08:13,790 "Dites-vous pas juste pour être négatif?" 158 00:08:13,790 --> 00:08:14,390 >> Bien. 159 00:08:14,390 --> 00:08:16,030 Donc Miles, je vous remercie beaucoup. 160 00:08:16,030 --> 00:08:16,860 >> MILES: Je vous remercie. 161 00:08:16,860 --> 00:08:18,360 >> BRIAN Scassellati: Merci beaucoup. 162 00:08:18,360 --> 00:08:20,230 [APPLAUDISSEMENTS] 163 00:08:20,230 --> 00:08:21,230 164 00:08:21,230 --> 00:08:26,700 >> Donc, ce programme ELIZA, à bien des égards, est de répondre juste pour les pièces 165 00:08:26,700 --> 00:08:32,730 que nous mettons à la disposition sans aucune profondeur compréhension de ce qui se passe ici. 166 00:08:32,730 --> 00:08:36,640 Ceci est une sorte de système appelé correspondance de modèles, où 167 00:08:36,640 --> 00:08:40,490 nous sommes à la recherche pour certains des morceaux de texte que nous sommes alors 168 00:08:40,490 --> 00:08:44,860 va sortir de ce a été fournie en entrée, 169 00:08:44,860 --> 00:08:52,580 convertir, potentiellement, d'une certaine façon, et puis le donner à l'utilisateur. 170 00:08:52,580 --> 00:08:55,150 >> Effectuez l'une d'entre vous pensent qui est en fait ELIZA 171 00:08:55,150 --> 00:08:58,230 effectuer la psychanalyse valable ici? 172 00:08:58,230 --> 00:08:59,250 Une personne, peut-être. 173 00:08:59,250 --> 00:09:00,166 >> AUDIENCE: [inaudible]. 174 00:09:00,166 --> 00:09:03,315 175 00:09:03,315 --> 00:09:05,440 BRIAN Scassellati: Et comment est-ce que ressentez-vous? 176 00:09:05,440 --> 00:09:06,530 Oui, en fait, il le fait. 177 00:09:06,530 --> 00:09:10,890 Et nous allons voir, en fait, la code source pour cela dans un instant. 178 00:09:10,890 --> 00:09:13,580 Et si vous allez être capable de faire exactement cela. 179 00:09:13,580 --> 00:09:17,420 >> Maintenant, ELIZA est une forme de ce nous appellerions aujourd'hui un bot de chat. 180 00:09:17,420 --> 00:09:19,950 Il va juste à travers la texte que vous êtes fournissant, 181 00:09:19,950 --> 00:09:24,030 fournit le strict minimum de la compréhension ou le traitement, 182 00:09:24,030 --> 00:09:26,790 et des perroquets, puis de nouveau à vous. 183 00:09:26,790 --> 00:09:31,830 Donc, nous allons jeter un coup d'oeil, conceptuellement, et parler de ce 184 00:09:31,830 --> 00:09:34,690 il est qu'Eliza est en train de faire. 185 00:09:34,690 --> 00:09:42,000 >> ELIZA prend de un let sentence-- dis, "Je veux impressionner mon patron." 186 00:09:42,000 --> 00:09:45,130 Et Eliza est à la recherche grâce à cette phrase 187 00:09:45,130 --> 00:09:48,730 et essayer de trouver et de correspondre à certains modèles. 188 00:09:48,730 --> 00:09:52,850 Ainsi, par exemple, l'un des motifs qu'Eliza recherche sont les mots 189 00:09:52,850 --> 00:09:55,110 "Je veux." 190 00:09:55,110 --> 00:09:59,330 Et chaque fois qu'il voit quelque chose qui a «je veux» en elle, 191 00:09:59,330 --> 00:10:01,770 il formule une réponse. 192 00:10:01,770 --> 00:10:05,040 Et cette réponse est une chaîne fixe. 193 00:10:05,040 --> 00:10:07,915 Dans ce cas, il est «pourquoi voulez-vous?" 194 00:10:07,915 --> 00:10:11,330 Et je mets une petite étoile au la fin est juste parce que ce 195 00:10:11,330 --> 00:10:13,310 le début de notre réponse. 196 00:10:13,310 --> 00:10:16,310 Et l'étoile indique que nous allons prendre le reste 197 00:10:16,310 --> 00:10:19,850 de utterance-- de l'utilisateur "pour impressionner mon patron" - 198 00:10:19,850 --> 00:10:24,500 et nous allons ajouter que sur l'extrémité de cette chaîne. 199 00:10:24,500 --> 00:10:28,990 >> Alors maintenant, plutôt que de dire «pourquoi voulez-vous impressionner mon patron, " 200 00:10:28,990 --> 00:10:31,800 il ya un peu de plus le traitement que nous ferons. 201 00:10:31,800 --> 00:10:34,440 Autrement dit, nous devrons convertir une partie des pronoms 202 00:10:34,440 --> 00:10:38,670 ici de «mon patron" à "votre patron." 203 00:10:38,670 --> 00:10:41,300 Et il pourrait y avoir quelques autres les changements que nous devons faire. 204 00:10:41,300 --> 00:10:44,990 Donc, plutôt que de simplement coller directement sur la fin, ce que nous ferons 205 00:10:44,990 --> 00:10:49,160 est nous allons prendre le reste de la la utterance-- de l'utilisateur dans ici-- blanc 206 00:10:49,160 --> 00:10:54,090 et nous allons prendre un morceau à un temps et de convertir chaque chaîne 207 00:10:54,090 --> 00:10:58,180 jeton, chaque mot, dans la phrase. 208 00:10:58,180 --> 00:10:59,580 >> Nous allons donc le mot «à». 209 00:10:59,580 --> 00:11:01,650 Il n'y a pas de conversion que nous devons faire. 210 00:11:01,650 --> 00:11:02,340 "Impressionner." 211 00:11:02,340 --> 00:11:04,140 Il n'y a pas de conversion nous devons y faire. 212 00:11:04,140 --> 00:11:06,670 "Mon" vous permet de convertir à «votre». 213 00:11:06,670 --> 00:11:10,070 Et «patron», nous allons laisser comme «patron». 214 00:11:10,070 --> 00:11:12,740 Et puis finalement, rien qui se termine par une période, 215 00:11:12,740 --> 00:11:16,640 nous allons convertir en une question. 216 00:11:16,640 --> 00:11:22,600 >> Cette très simple correspondance de modèles est en fait tout à fait réussie. 217 00:11:22,600 --> 00:11:27,260 Et quand cela a été introduit en 1966-- Joseph Weizenbaum 218 00:11:27,260 --> 00:11:28,986 cette programmé sur un ordinateur. 219 00:11:28,986 --> 00:11:31,110 Maintenant, les ordinateurs de l'époque étaient pas des modèles de bureau. 220 00:11:31,110 --> 00:11:33,950 Ils ont été des ressources partagées. 221 00:11:33,950 --> 00:11:39,090 Et Ses élèves aller discuter avec ELIZA. 222 00:11:39,090 --> 00:11:41,570 Finalement, il a dû restreindre l'accès à ce 223 00:11:41,570 --> 00:11:43,890 parce que ses étudiants étaient pas obtenir un travail fait. 224 00:11:43,890 --> 00:11:46,190 Ils étaient tout simplement bavarder avec ELIZA. 225 00:11:46,190 --> 00:11:48,850 Et, en fait, il a dû tirer son assistant, qui 226 00:11:48,850 --> 00:11:55,840 passé tout son temps à parler à Eliza de ses problèmes profonds et inquiétants. 227 00:11:55,840 --> 00:12:00,350 >> Tout le monde qui a utilisé ces systèmes commencé à les anthropomorphisme. 228 00:12:00,350 --> 00:12:04,490 Ils ont commencé à penser à eux comme étant animés et des personnes réelles. 229 00:12:04,490 --> 00:12:07,969 Ils ont commencé à reconnaître certains des les choses qu'ils disaient 230 00:12:07,969 --> 00:12:09,010 revenaient à eux. 231 00:12:09,010 --> 00:12:12,120 Et ils découvraient des choses sur eux-mêmes. 232 00:12:12,120 --> 00:12:17,290 Et, de fait, même les experts, même les psychothérapeutes, 233 00:12:17,290 --> 00:12:22,930 commencé à craindre que, en fait, peut-être ELIZA serait de les remplacer. 234 00:12:22,930 --> 00:12:25,640 Et même l'ordinateur les scientifiques craignent que nous étions 235 00:12:25,640 --> 00:12:30,040 si proche de résoudre langage naturel. 236 00:12:30,040 --> 00:12:33,520 >> Maintenant, qui était nulle part près de vrai. 237 00:12:33,520 --> 00:12:37,280 Mais voilà comment impressionnante ces systèmes peuvent sembler. 238 00:12:37,280 --> 00:12:40,080 Donc, nous allons commencer à regarder dessous et essayez 239 00:12:40,080 --> 00:12:46,190 pour obtenir un peu d'une question d'où ce code qui se passe réellement. 240 00:12:46,190 --> 00:12:48,170 Donc, nous allons rendre ce code disponible par la suite. 241 00:12:48,170 --> 00:12:50,880 Et cela est une très le port simple et direct 242 00:12:50,880 --> 00:12:53,240 de la mise en œuvre originale ELIZA. 243 00:12:53,240 --> 00:12:56,350 >> Donc, certains de ces stylistique choses que vous verrez ici 244 00:12:56,350 --> 00:12:59,360 ce ne sont pas stylistiquement nous voudrions que vous fassiez 245 00:12:59,360 --> 00:13:01,480 ou ce que nous avons été enseigner que vous fassiez. 246 00:13:01,480 --> 00:13:04,770 Mais nous avons essayé de les garder même à travers les nombreux ports 247 00:13:04,770 --> 00:13:08,087 que cela a eu pour qu'il a la saveur de l'original. 248 00:13:08,087 --> 00:13:09,920 Donc, nous allons inclure un tas de choses, 249 00:13:09,920 --> 00:13:12,920 puis nous aurons une ensemble de mots clés, les choses 250 00:13:12,920 --> 00:13:16,460 qu'Eliza reconnaîtra et de répondre directement. 251 00:13:16,460 --> 00:13:20,780 Donc si vous avez des mots comme "pouvez-vous" ou "je ne fais pas" ou "non" 252 00:13:20,780 --> 00:13:24,680 ou "oui" ou "rêve" ou "bonjour", puis ELIZA 253 00:13:24,680 --> 00:13:27,920 répondra sélectivement à ceux-ci. 254 00:13:27,920 --> 00:13:30,010 Nous aurons aussi un certain nombre de choses 255 00:13:30,010 --> 00:13:34,940 que nous allons échanger, comme conversion de «mon» à «votre». 256 00:13:34,940 --> 00:13:39,920 >> Et puis nous aurons un ensemble de réponses que pour chacun de ces mots-clés, 257 00:13:39,920 --> 00:13:42,580 nous allons tourner de ces différentes réponses. 258 00:13:42,580 --> 00:13:45,350 Donc, si je dis "oui" trois fois de suite, je 259 00:13:45,350 --> 00:13:50,429 pourrait obtenir trois différentes des réponses d'ELIZA. 260 00:13:50,429 --> 00:13:52,345 Notre code, puis, est en fait remarquablement simple. 261 00:13:52,345 --> 00:13:59,490 Si je défiler vers le bas après toutes ces les réponses que nous avons programmées dans 262 00:13:59,490 --> 00:14:02,920 et nous nous attelons à notre principale, nous allons initialiser 263 00:14:02,920 --> 00:14:06,540 un couple de différentes variables et faire un peu de l'entretien ménager 264 00:14:06,540 --> 00:14:08,480 au début. 265 00:14:08,480 --> 00:14:11,760 Mais alors, il n'y a absolument un ensemble de code que vous pouvez comprendre. 266 00:14:11,760 --> 00:14:15,820 Une grande boucle while qui dit que je suis vais répéter encore et encore. 267 00:14:15,820 --> 00:14:20,420 Je vais le lire en ligne, et je vais stocker que dans une chaîne d'entrée. 268 00:14:20,420 --> 00:14:23,880 Je vais vérifier et voir si elle est la mot-clé spécial "bye", qui 269 00:14:23,880 --> 00:14:26,199 signifie quitter le programme. 270 00:14:26,199 --> 00:14:29,240 Et puis, je vais vérifier et voir si quelqu'un vient à se répéter 271 00:14:29,240 --> 00:14:29,800 encore et encore. 272 00:14:29,800 --> 00:14:31,174 Et je vais crier à eux si ils le font. 273 00:14:31,174 --> 00:14:34,820 Je vais dire "ne pas répéter vous-même." 274 00:14:34,820 --> 00:14:40,500 >> Tant qu'aucun de ceux arriver, nous allons puis parcourir par boucle, 275 00:14:40,500 --> 00:14:45,330 sur les lignes 308 à 313 ici, et vérifier et voir 276 00:14:45,330 --> 00:14:49,090 sont l'un de ceux mot-clé phrases contenues dans l'entrée 277 00:14:49,090 --> 00:14:50,620 que je viens de recevoir? 278 00:14:50,620 --> 00:14:54,845 Si il ya un match pour eux, bien alors, je vais me souviens de cet emplacement. 279 00:14:54,845 --> 00:14:57,050 Je me souviendrai de ce mot clé. 280 00:14:57,050 --> 00:14:58,620 Et je serai en mesure de construire une réponse. 281 00:14:58,620 --> 00:15:03,150 >> Si je ne trouve pas un, eh bien, la dernière chose dans mon tableau mot-clé 282 00:15:03,150 --> 00:15:08,070 seront mes réponses par défaut, quand rien ne correspond à autre. 283 00:15:08,070 --> 00:15:14,160 Je vais poser des questions comme «Pourquoi avez-vous viens ici? »ou« Comment puis-je vous aider? " 284 00:15:14,160 --> 00:15:19,710 qui sont tout partiellement appropriée peu importe ce que l'entrée est. 285 00:15:19,710 --> 00:15:22,580 >> Nous construisons ensuite jusqu'à la réponse d'Eliza. 286 00:15:22,580 --> 00:15:26,040 Nous serons en mesure de prendre que la réponse de base, 287 00:15:26,040 --> 00:15:28,370 tout comme nous l'avons fait dans ce par exemple "mon patron". 288 00:15:28,370 --> 00:15:30,970 289 00:15:30,970 --> 00:15:33,990 Si cela est tout ce qu'il ya est-- si elle est juste un 290 00:15:33,990 --> 00:15:36,860 chaîne que je suis censé respond-- Je peux juste le renvoyer sur. 291 00:15:36,860 --> 00:15:40,610 Si elle a un astérisque à la fin de celui-ci, alors je vais 292 00:15:40,610 --> 00:15:45,710 traiter chaque jeton en particulier le reste de la réponse de l'utilisateur 293 00:15:45,710 --> 00:15:51,590 et d'ajouter ceux, échangeant mot pour mot, comme je l'ai besoin. 294 00:15:51,590 --> 00:15:56,100 >> Tout cela est absolument quelque chose que vous pourriez construire. 295 00:15:56,100 --> 00:15:59,230 Et en fait, les façons dont nous avoir des arguments de ligne de commande transformés, 296 00:15:59,230 --> 00:16:03,570 la façon dont vous avez traitées par des requêtes HTTP 297 00:16:03,570 --> 00:16:05,510 suivez les mêmes types de règles. 298 00:16:05,510 --> 00:16:08,220 Ils sont pattern matching. 299 00:16:08,220 --> 00:16:15,170 >> Donc ELIZA était relativement importante l'impact sur le langage naturel 300 00:16:15,170 --> 00:16:21,620 car il donnait l'impression qu'il était un objectif très réalisable, comme nous serions en quelque sorte 301 00:16:21,620 --> 00:16:25,550 être en mesure de résoudre ce problème directement. 302 00:16:25,550 --> 00:16:30,670 Maintenant, cela ne veut pas dire que le fait ELIZA tout ce que nous voudrions faire. 303 00:16:30,670 --> 00:16:33,710 Certainement pas. 304 00:16:33,710 --> 00:16:35,660 Mais nous devrions être en mesure à faire quelque chose de plus. 305 00:16:35,660 --> 00:16:38,280 306 00:16:38,280 --> 00:16:41,490 >> Notre première étape pour aller ELIZA va au-delà 307 00:16:41,490 --> 00:16:44,840 pour être en mesure de regarder pas le texte étant entré 308 00:16:44,840 --> 00:16:53,750 dans le clavier, mais la parole, réelle discours enregistré dans un microphone. 309 00:16:53,750 --> 00:16:56,880 Alors que nous regardons ces différentes pièces, nous sommes 310 00:16:56,880 --> 00:17:00,304 allez avoir à construire un ensemble de modèles. 311 00:17:00,304 --> 00:17:02,970 Nous allons avoir de pouvoir pour aller de l'acoustique de bas niveau 312 00:17:02,970 --> 00:17:07,180 information-- terrain, amplitude, frequency-- 313 00:17:07,180 --> 00:17:09,530 et convertir en certaines unités que nous sommes 314 00:17:09,530 --> 00:17:14,619 capable de manipuler plus facilement et, enfin, les manipuler 315 00:17:14,619 --> 00:17:18,609 en mots et en phrases. 316 00:17:18,609 --> 00:17:22,880 >> Donc plus la reconnaissance vocale systèmes qui sont là aujourd'hui 317 00:17:22,880 --> 00:17:26,069 suivre une statistique modèle dans lequel nous construisons 318 00:17:26,069 --> 00:17:35,090 trois représentations séparées de ce que ce signal audio contient réellement. 319 00:17:35,090 --> 00:17:38,640 Nous commençons avec un modèle phonétique qui parle juste de la base 320 00:17:38,640 --> 00:17:41,250 sons que je vais produire. 321 00:17:41,250 --> 00:17:46,900 Suis-je produis quelque chose qui est B comme dans garçon ou une D comme chien? 322 00:17:46,900 --> 00:17:53,220 Comment puis-je reconnaître ces deux différents téléphones comme séparé et distinct? 323 00:17:53,220 --> 00:17:56,600 >> En plus de cela, nous allons alors construisons un modèle de prononciation d'un mot, 324 00:17:56,600 --> 00:18:01,350 quelque chose qui relie ces téléphones individuels 325 00:18:01,350 --> 00:18:04,724 et les combine en un mot. 326 00:18:04,724 --> 00:18:07,890 Et après cela, nous allons prendre les mots et nous les assemblons avec une langue 327 00:18:07,890 --> 00:18:13,010 modéliser dans une phrase complète. 328 00:18:13,010 --> 00:18:17,230 >> Maintenant, nous allons parler de chacun de ceux-ci de façon indépendante et séparée. 329 00:18:17,230 --> 00:18:21,580 Mais ces trois modèles sont tous tout va être statistiques. 330 00:18:21,580 --> 00:18:23,502 Et cela signifie que lorsque nous travailler avec eux, nous allons 331 00:18:23,502 --> 00:18:25,376 être capable de travailler avec tous simultanément. 332 00:18:25,376 --> 00:18:28,100 333 00:18:28,100 --> 00:18:28,600 Bien. 334 00:18:28,600 --> 00:18:30,890 Commençons avec notre modèle phonétique. 335 00:18:30,890 --> 00:18:34,470 Donc modèles phonétiques reposent sur une technique de calcul 336 00:18:34,470 --> 00:18:37,320 appelé modèles de Markov cachés. 337 00:18:37,320 --> 00:18:43,050 Ce sont des modèles graphiques dans lequel je avoir et reconnaître un état du monde 338 00:18:43,050 --> 00:18:46,500 caractérisé comme étant par un ensemble de caractéristiques. 339 00:18:46,500 --> 00:18:51,960 Et cet état décrit une partie d'une action que je suis engagé dans. 340 00:18:51,960 --> 00:19:00,190 >> Donc, si je pense à faire le son «ma» comme la mère, 341 00:19:00,190 --> 00:19:03,970 Ils sont différents composants à ce son. 342 00:19:03,970 --> 00:19:07,230 Il ya une partie où je dessine en haleine. 343 00:19:07,230 --> 00:19:09,560 Et puis je Purse mes lèvres. 344 00:19:09,560 --> 00:19:13,710 Et je roule mes lèvres un peu en arrière peu à faire que le son "ma". 345 00:19:13,710 --> 00:19:15,340 Et puis il ya une libération. 346 00:19:15,340 --> 00:19:17,020 Mes lèvres se séparent. 347 00:19:17,020 --> 00:19:19,030 De l'air est expulsé. 348 00:19:19,030 --> 00:19:22,650 «Ma." 349 00:19:22,650 --> 00:19:29,250 >> Ces trois différentes parties seraient représenté par les Etats dans ce graph-- 350 00:19:29,250 --> 00:19:33,420 le début, le milieu et la fin. 351 00:19:33,420 --> 00:19:38,060 Et je voudrais avoir des transitions m'a permis de voyager d'un État 352 00:19:38,060 --> 00:19:42,260 à l'autre avec une certaine probabilité. 353 00:19:42,260 --> 00:19:47,250 Ainsi, par exemple, que M son pourrait avoir une très, 354 00:19:47,250 --> 00:19:51,850 apport très court à l'beginning-- "mm" - et puis un plus, 355 00:19:51,850 --> 00:19:55,640 la phase vibratoire où je me tenant les lèvres et presque humming-- 356 00:19:55,640 --> 00:20:05,090 "mmmm" - et puis un très court Plosive où je expulse breath-- "ma". 357 00:20:05,090 --> 00:20:09,370 >> Le modèle de Markov caché est conçu pour capter le fait 358 00:20:09,370 --> 00:20:13,340 que la façon dont je fais que le son «ma» va 359 00:20:13,340 --> 00:20:17,350 pour être légèrement différente en son calendrier, est la fréquence, 360 00:20:17,350 --> 00:20:21,030 et ses fonctionnalités que la façon dont vous le faites 361 00:20:21,030 --> 00:20:23,300 ou la façon dont je pourrais faire quand je parle 362 00:20:23,300 --> 00:20:26,030 au sujet des utilisations différentes de la lettre. 363 00:20:26,030 --> 00:20:33,240 «Mère» et «may I" un son légèrement différemment. 364 00:20:33,240 --> 00:20:36,800 >> Donc, pour reconnaître un notamment son, nous le ferions 365 00:20:36,800 --> 00:20:42,020 construire des modèles de Markov, Markov caché ces modèles, de chaque téléphone possible que je 366 00:20:42,020 --> 00:20:45,840 peut-être envie de reconnaître, tous les sons possibles, 367 00:20:45,840 --> 00:20:49,750 et puis regardez la données acoustiques que je dois 368 00:20:49,750 --> 00:20:54,430 et de déterminer statistiquement lequel est le plus probable 369 00:20:54,430 --> 00:20:58,110 avoir produit ce son. 370 00:20:58,110 --> 00:20:58,610 D'ACCORD. 371 00:20:58,610 --> 00:21:01,540 372 00:21:01,540 --> 00:21:06,750 Avec ce modèle, nous avons ensuite commencer à construire au-dessus de celui-ci. 373 00:21:06,750 --> 00:21:09,330 Nous prenons un modèle de prononciation. 374 00:21:09,330 --> 00:21:11,790 Maintenant, parfois Prononciation modèles sont simples et faciles 375 00:21:11,790 --> 00:21:14,440 parce qu'il ya un seul façon dont quelque chose à prononcer. 376 00:21:14,440 --> 00:21:17,990 D'autres fois, ils sont un peu plus compliqué. 377 00:21:17,990 --> 00:21:21,340 Voici un guide de prononciation pour que cette chose rouge qui est 378 00:21:21,340 --> 00:21:25,210 un fruit que vous faites du ketchup sur. 379 00:21:25,210 --> 00:21:27,360 Les gens ne pensent pas que ce soit un fruit. 380 00:21:27,360 --> 00:21:27,860 Droit? 381 00:21:27,860 --> 00:21:30,880 382 00:21:30,880 --> 00:21:35,300 >> Maintenant, il ya beaucoup de façons différentes que les gens vont prononcer ce mot. 383 00:21:35,300 --> 00:21:37,780 Certains diront "toe-mai-orteil." 384 00:21:37,780 --> 00:21:40,880 Certains diront "toe-mah-toe." 385 00:21:40,880 --> 00:21:44,800 Et nous pouvons capturer qu'avec l'un de ces modèles graphiques 386 00:21:44,800 --> 00:21:48,305 où, encore une fois, nous représentons transitions comme ayant une certaine probabilité 387 00:21:48,305 --> 00:21:51,360 et la probabilité associée. 388 00:21:51,360 --> 00:21:58,290 >> Donc dans ce cas, si je devais suivre la route haut à travers l'ensemble de ce graphique, 389 00:21:58,290 --> 00:22:03,330 Je serais à partir de la lettre À l'extrême gauche, le "ta" sonore. 390 00:22:03,330 --> 00:22:07,570 Je voudrais prendre la moitié supérieure, le «oh», puis un «MA», 391 00:22:07,570 --> 00:22:14,530 puis un «a», puis une "ta" et un "oh." «Toe-mai-orteil." 392 00:22:14,530 --> 00:22:19,610 Si je prenais le chemin bas à travers cela, je vais obtenir "ta-mah-toe." 393 00:22:19,610 --> 00:22:26,810 Et si je suis descendu et ensuite , je voudrais obtenir "ta-mai-orteil." 394 00:22:26,810 --> 00:22:29,950 >> Ces modèles capturer ces différences parce que chaque fois 395 00:22:29,950 --> 00:22:32,410 nous déployons un de ces systèmes de reconnaissance, 396 00:22:32,410 --> 00:22:35,340 il va avoir à travailler avec beaucoup de différents types de personnes, 397 00:22:35,340 --> 00:22:39,295 beaucoup d'accents différents, et même différentes utilisations des mêmes mots. 398 00:22:39,295 --> 00:22:42,204 399 00:22:42,204 --> 00:22:44,120 Enfin, en plus de cela, nous allons construire quelque chose 400 00:22:44,120 --> 00:22:48,780 qui ressemble vraiment compliquée, appelé le modèle de langage, 401 00:22:48,780 --> 00:22:52,950 mais, en fait, est le plus simple des les trois parce que ces derniers agissent 402 00:22:52,950 --> 00:22:56,041 sur ce qu'on appelle des modèles n-grammes. 403 00:22:56,041 --> 00:23:02,270 Et dans ce cas, je vous montre un modèle n-gramme en deux parties, une bigram. 404 00:23:02,270 --> 00:23:08,910 Nous allons faire l'idée physique que, parfois, certains mots sont 405 00:23:08,910 --> 00:23:14,680 plus susceptibles de suivre une étant donné que d'autres mots. 406 00:23:14,680 --> 00:23:25,210 Si je viens de dire "Prévisions météo" le mot suivant pourrait probablement "aujourd'hui" 407 00:23:25,210 --> 00:23:31,510 ou pourrait être "le temps prévoir demain ". 408 00:23:31,510 --> 00:23:38,870 Mais il est peu probable d'être «le météo artichaut ". 409 00:23:38,870 --> 00:23:42,980 >> Quel modèle de langage est fait il capture ceux statistiquement 410 00:23:42,980 --> 00:23:47,450 en comptant, à partir de très grand corpus, toutes les instances 411 00:23:47,450 --> 00:23:50,890 dans lequel un mot suit une autre. 412 00:23:50,890 --> 00:23:54,300 Donc, si je prends un grand corpus-- comme chaque Wall Street Journal 413 00:23:54,300 --> 00:24:00,750 qui a été produite depuis 1930, qui est une norme de la corpuses-- 414 00:24:00,750 --> 00:24:03,910 et je regarde à travers tous ce texte, et je compte 415 00:24:03,910 --> 00:24:09,770 combien de fois après "prévisions" je ne vois "aujourd'hui" 416 00:24:09,770 --> 00:24:17,454 et combien de fois je ne vois «prévision» suivi de «artichaut» 417 00:24:17,454 --> 00:24:19,370 le premier va à être beaucoup plus probable. 418 00:24:19,370 --> 00:24:21,540 Il va apparaître beaucoup plus fréquemment. 419 00:24:21,540 --> 00:24:24,610 Et donc il va avoir une meilleure probabilité associée. 420 00:24:24,610 --> 00:24:27,340 >> Si je veux comprendre la la probabilité de tout un énoncé, 421 00:24:27,340 --> 00:24:29,940 alors, je casse tout en place. 422 00:24:29,940 --> 00:24:35,990 Donc, la probabilité d'audience la phrase «le rat a mangé le fromage" 423 00:24:35,990 --> 00:24:39,110 est la probabilité du mot "la" à partir d'une phrase, 424 00:24:39,110 --> 00:24:42,540 et ensuite la probabilité que l' mot «rat» suit le mot «le», 425 00:24:42,540 --> 00:24:44,910 et la probabilité que l' mot "mangé" suit "rat" 426 00:24:44,910 --> 00:24:51,120 et la probabilité que "fromage" suit "mangé." 427 00:24:51,120 --> 00:24:55,160 >> Cela ressemble à un grand nombre de statistiques, beaucoup de probabilités. 428 00:24:55,160 --> 00:24:57,510 Et voilà tout ce qu'il est. 429 00:24:57,510 --> 00:25:02,920 Mais le plus étonnant est que si vous faites cela, avec un échantillon suffisamment grand de données, 430 00:25:02,920 --> 00:25:03,670 Ça marche. 431 00:25:03,670 --> 00:25:05,250 Et cela fonctionne extrêmement bien. 432 00:25:05,250 --> 00:25:07,810 433 00:25:07,810 --> 00:25:11,420 Nous savons tous que ces technologies. 434 00:25:11,420 --> 00:25:16,500 La plupart des systèmes d'exploitation sont livrés avec la reconnaissance vocale à ce point. 435 00:25:16,500 --> 00:25:20,940 Nous utilisons Siri et Cortana et Echo. 436 00:25:20,940 --> 00:25:25,070 Et ces choses sont basées sur ce type de trois couches modèle-- 437 00:25:25,070 --> 00:25:30,620 un modèle phonétique en bas, un modèle de prononciation dans le milieu, 438 00:25:30,620 --> 00:25:33,690 et un modèle de langage sur le dessus d'eux. 439 00:25:33,690 --> 00:25:37,630 >> Maintenant, ils ont à faire un peu plus que dans le but de répondre aux questions. 440 00:25:37,630 --> 00:25:43,000 Mais la reconnaissance de ce que vous êtes dicton dépend exactement sur cela. 441 00:25:43,000 --> 00:25:45,700 Prenons donc un exemple ici. 442 00:25:45,700 --> 00:25:52,020 Donc je dois mon téléphone assis ici sous la caméra de documents. 443 00:25:52,020 --> 00:25:56,110 Et nous allons demande Siri quelques questions. 444 00:25:56,110 --> 00:25:57,150 Bien? 445 00:25:57,150 --> 00:25:59,940 >> Donc, nous allons réveiller mon téléphone ici. 446 00:25:59,940 --> 00:26:02,710 447 00:26:02,710 --> 00:26:05,000 Siri, quelle est la météo comme à New Haven aujourd'hui? 448 00:26:05,000 --> 00:26:07,670 449 00:26:07,670 --> 00:26:10,780 >> SIRI: Voici la météo de New Haven, Connecticut aujourd'hui. 450 00:26:10,780 --> 00:26:11,890 >> BRIAN Scassellati: OK. 451 00:26:11,890 --> 00:26:16,720 Donc tout d'abord que vous avez vu que Siri reconnu chacun des mots individuels 452 00:26:16,720 --> 00:26:19,050 puis produit une réponse. 453 00:26:19,050 --> 00:26:22,277 Nous allons parler de la façon dont cette réponse vient à propos dans un peu. 454 00:26:22,277 --> 00:26:24,110 Mais maintenant que nous savons que ceci est basé juste 455 00:26:24,110 --> 00:26:28,880 sur les statistiques brutes et ce modèle type de correspondance d'approche, 456 00:26:28,880 --> 00:26:31,120 nous pouvons jouer à des jeux avec Siri. 457 00:26:31,120 --> 00:26:34,560 >> Donc, je peux essayer à nouveau. 458 00:26:34,560 --> 00:26:38,864 Siri, quelle est la météo hippopotame New Haven, aujourd'hui? 459 00:26:38,864 --> 00:26:39,810 >> SIRI: OK. 460 00:26:39,810 --> 00:26:44,245 Voici la météo de New Haven, Connecticut pour aujourd'hui. 461 00:26:44,245 --> 00:26:46,120 BRIAN Scassellati: Siri pas intimidé par ce 462 00:26:46,120 --> 00:26:50,980 parce qu'il a trouvé l'pattern-- "météo", "aujourd'hui", "New Haven." 463 00:26:50,980 --> 00:26:54,420 Voilà ce que ça répond à, tout comme ELIZA. 464 00:26:54,420 --> 00:26:54,920 Bien. 465 00:26:54,920 --> 00:26:59,390 Donnons-lui un plus même exemple de plus ridicule. 466 00:26:59,390 --> 00:27:03,075 Siri, la météo artichaut tatou hippopotame New Haven? 467 00:27:03,075 --> 00:27:06,806 468 00:27:06,806 --> 00:27:08,400 >> SIRI: Permettez-moi de vérifier. 469 00:27:08,400 --> 00:27:11,280 Voici ce que je trouvais sur le web pour ce que sont les artichauts tatou 470 00:27:11,280 --> 00:27:13,780 hippopotame New Haven. 471 00:27:13,780 --> 00:27:14,760 >> BRIAN Scassellati: OK. 472 00:27:14,760 --> 00:27:20,400 Donc, si je vais assez loin l'écart de ce modèle, 473 00:27:20,400 --> 00:27:24,365 Je suis en mesure de le confondre, car il ne correspond plus le motif qu'il a. 474 00:27:24,365 --> 00:27:27,370 475 00:27:27,370 --> 00:27:29,390 Et que statistique moteur qui est dit, 476 00:27:29,390 --> 00:27:32,850 quelle est la probabilité que vous avez mots hippopotame et d'artichaut 477 00:27:32,850 --> 00:27:34,440 ensemble, et le tatou? 478 00:27:34,440 --> 00:27:36,050 Ça doit être quelque chose de nouveau. 479 00:27:36,050 --> 00:27:38,840 480 00:27:38,840 --> 00:27:40,610 >> Donc, ces technologies que nous utilisons tous les jours. 481 00:27:40,610 --> 00:27:43,670 482 00:27:43,670 --> 00:27:47,800 Si nous voulons leur faire un pas plus loin, cependant, si l'on fait 483 00:27:47,800 --> 00:27:53,930 veulent être en mesure de parler de ce qu'il est que ces systèmes réagissent à, 484 00:27:53,930 --> 00:28:00,630 nous devons parler, encore une fois, sur une ensemble plus fondamental de questions. 485 00:28:00,630 --> 00:28:05,370 Et cela est un sujet en communication que nous appelons de question-réponse. 486 00:28:05,370 --> 00:28:07,028 Autrement dit, nous voulons être en mesure to-- ouais? 487 00:28:07,028 --> 00:28:07,944 AUDIENCE: [inaudible]. 488 00:28:07,944 --> 00:28:10,789 489 00:28:10,789 --> 00:28:13,330 BRIAN Scassellati: Obtenons-nous dans le traitement sémantique latente? 490 00:28:13,330 --> 00:28:14,070 Donc oui. 491 00:28:14,070 --> 00:28:17,820 Il ya beaucoup de choses qui sont passe en dessous de la surface avec Siri 492 00:28:17,820 --> 00:28:20,210 et dans certains des exemples Je vais vous montrer prochaine 493 00:28:20,210 --> 00:28:22,610 où il ya un peu en termes de la structure 494 00:28:22,610 --> 00:28:25,260 de ce que vous dites qui est important. 495 00:28:25,260 --> 00:28:31,890 Et, en fait, que ya une grande précurseur de la diapositive suivante pour moi. 496 00:28:31,890 --> 00:28:35,110 >> Ainsi, de la même façon que notre reconnaissance de la parole a été construit 497 00:28:35,110 --> 00:28:39,620 de plusieurs couches, si nous voulons comprendre ce qu'il est que est effectivement 498 00:28:39,620 --> 00:28:44,620 étant dit, nous allons à nouveau compter sur une analyse multi-couche 499 00:28:44,620 --> 00:28:47,020 du texte qui est reconnu. 500 00:28:47,020 --> 00:28:52,560 Alors, quand Siri est réellement en mesure de disons, regarde, je trouve ces mots. 501 00:28:52,560 --> 00:28:55,230 Maintenant, je fais quoi avec eux? 502 00:28:55,230 --> 00:28:59,110 Le premier composant est souvent passer et essayer d'analyser 503 00:28:59,110 --> 00:29:03,010 la structure de la phrase. 504 00:29:03,010 --> 00:29:05,410 Et dans ce que nous avons vu à l'école primaire, souvent, 505 00:29:05,410 --> 00:29:08,920 comme une sorte de diagrammes phrases, nous allons 506 00:29:08,920 --> 00:29:12,774 de reconnaître que certains les mots ont certains rôles. 507 00:29:12,774 --> 00:29:13,440 Ce sont des noms. 508 00:29:13,440 --> 00:29:14,231 Ce sont des pronoms. 509 00:29:14,231 --> 00:29:16,200 Ce sont des verbes. 510 00:29:16,200 --> 00:29:19,460 Et nous allons à reconnaître que, pour une grammaire particulière, 511 00:29:19,460 --> 00:29:24,700 dans ce cas, la grammaire anglaise, il ya façons valables dans lequel je peux les combiner 512 00:29:24,700 --> 00:29:26,280 et d'autres moyens qui ne sont pas valides. 513 00:29:26,280 --> 00:29:29,920 514 00:29:29,920 --> 00:29:33,870 >> Cette reconnaissance, que la structure, pourrait être suffisant pour nous aider à guider 515 00:29:33,870 --> 00:29:36,720 un petit peu. 516 00:29:36,720 --> 00:29:39,820 Mais il est pas assez pour que nous soyons en mesure de donner 517 00:29:39,820 --> 00:29:43,290 un sens à ce qui est dit ici. 518 00:29:43,290 --> 00:29:46,615 Pour ce faire, nous devrons compter sur une certaine quantité de traitement sémantique. 519 00:29:46,615 --> 00:29:49,590 520 00:29:49,590 --> 00:29:55,080 Autrement dit, nous allons avoir à regarder au-dessous de ce que chacun de ces mots 521 00:29:55,080 --> 00:29:57,400 exerce effectivement un sens. 522 00:29:57,400 --> 00:30:01,150 Et de la façon la plus simple de le faire, nous allons associer à chaque mot 523 00:30:01,150 --> 00:30:06,930 que nous connaissons une certaine fonction, un certain transformation qu'il 524 00:30:06,930 --> 00:30:09,300 permet de se produire. 525 00:30:09,300 --> 00:30:14,470 >> Dans ce cas, nous pourrions appeler le mot "John" comme un nom propre, 526 00:30:14,470 --> 00:30:18,160 qu'elle porte avec elle une identité. 527 00:30:18,160 --> 00:30:21,530 Et nous pourrions étiqueter "Mary" que de la même façon. 528 00:30:21,530 --> 00:30:27,900 Alors qu'un verbe comme «amours», ce constitue une relation particulière 529 00:30:27,900 --> 00:30:31,582 que nous sommes en mesure de représenter. 530 00:30:31,582 --> 00:30:33,290 Maintenant, cela ne signifie pas que nous comprenons 531 00:30:33,290 --> 00:30:37,680 ce qu'est l'amour, mais seulement que nous comprenons de la manière d'un système symbolique. 532 00:30:37,680 --> 00:30:40,480 Autrement dit, nous pouvons étiqueter et le manipuler. 533 00:30:40,480 --> 00:30:44,230 534 00:30:44,230 --> 00:30:49,120 >> Avec chacun de ces types d'approches, tout type de traitement sémantique 535 00:30:49,120 --> 00:30:57,060 ici il va falloir faire un peu peu de connaissances et beaucoup de travail 536 00:30:57,060 --> 00:30:59,020 de notre part. 537 00:30:59,020 --> 00:31:03,590 Nous ne sommes plus dans le domaine où les statistiques tout simples 538 00:31:03,590 --> 00:31:07,320 vont être assez pour nous. 539 00:31:07,320 --> 00:31:11,330 Maintenant, pour aller de ce point d'être 540 00:31:11,330 --> 00:31:15,520 capable de parler de l'intérieur de ce qui se passe réellement ici, 541 00:31:15,520 --> 00:31:19,640 d'être capable de manipuler cette structurer et comprendre une question 542 00:31:19,640 --> 00:31:23,160 et ensuite être capable de sortir et de recherche, 543 00:31:23,160 --> 00:31:27,290 qui nécessite une plus modèle cognitif complexe. 544 00:31:27,290 --> 00:31:34,880 >> La manière dont ces systèmes sont construits est la plupart du temps très, beaucoup de main- 545 00:31:34,880 --> 00:31:36,350 intensif. 546 00:31:36,350 --> 00:31:39,490 Ils impliquent l'homme dépenser beaucoup 547 00:31:39,490 --> 00:31:44,100 de temps de structurer les moyens à qui ces types de phrases 548 00:31:44,100 --> 00:31:47,270 peut être représenté dans une certaine logique. 549 00:31:47,270 --> 00:31:51,639 550 00:31:51,639 --> 00:31:53,430 Il obtient même un peu plus complexe, cependant. 551 00:31:53,430 --> 00:31:56,400 552 00:31:56,400 --> 00:31:59,660 >> Même une fois que nous avons traité avec la sémantique, nous allons 553 00:31:59,660 --> 00:32:03,860 ont encore à regarder le pragmatique de ce qui se dit. 554 00:32:03,860 --> 00:32:08,620 Autrement dit, comment puis-je raconte les mots que je dois quelque chose de physiquement 555 00:32:08,620 --> 00:32:12,054 là dans le monde ou au moins certains source d'information 556 00:32:12,054 --> 00:32:12,970 que je peux manipuler? 557 00:32:12,970 --> 00:32:15,780 558 00:32:15,780 --> 00:32:20,790 >> Parfois, ceux-ci conduisent à merveilleux morceaux de l'ambiguïté. 559 00:32:20,790 --> 00:32:24,470 "Rouge-chaud étoile à wed astronome." 560 00:32:24,470 --> 00:32:25,630 D'ACCORD. 561 00:32:25,630 --> 00:32:28,540 Maintenant, nous lisons que le Type drôle de titre 562 00:32:28,540 --> 00:32:34,690 que nous verrions sur télévision tard le soir parce que nous ne l'interprétons pas "star" 563 00:32:34,690 --> 00:32:38,630 avoir son sens de corps céleste. 564 00:32:38,630 --> 00:32:43,390 Nous savons que cela signifie plus acteur ou une actrice banale 565 00:32:43,390 --> 00:32:45,240 avec des quantités élevées de visibilité. 566 00:32:45,240 --> 00:32:47,770 567 00:32:47,770 --> 00:32:51,950 >> "Squad aide morsure de chien victime." 568 00:32:51,950 --> 00:32:55,550 Est-ce que l'équipe est en fait là-bas aider un chien 569 00:32:55,550 --> 00:32:59,620 en faisant le tour et mordant victimes? 570 00:32:59,620 --> 00:33:02,380 Ou est-ce qu'il y avait un individu qui était 571 00:33:02,380 --> 00:33:04,625 mordu par un chien qui avait besoin d'un peu d'aide? 572 00:33:04,625 --> 00:33:07,650 573 00:33:07,650 --> 00:33:11,480 Juste en regardant la syntaxe et la sémantique des phrases, 574 00:33:11,480 --> 00:33:14,660 nous ne pouvons pas déterminer. 575 00:33:14,660 --> 00:33:22,000 >> "Hélicoptère alimenté par les mouches humaines." 576 00:33:22,000 --> 00:33:27,330 Y at-il, en fait, réelle petites choses qui volent autour 577 00:33:27,330 --> 00:33:34,510 sont des gens avec des ailes alimenter hélicoptères pour le bien de l'humanité? 578 00:33:34,510 --> 00:33:38,960 Ou est-il un dispositif mécanique qui tire sa puissance d'une personne? 579 00:33:38,960 --> 00:33:41,600 580 00:33:41,600 --> 00:33:46,500 >> Quand nous regardons à la question systèmes de réponse, 581 00:33:46,500 --> 00:33:51,110 ce ne sont que les couches nous devons traiter. 582 00:33:51,110 --> 00:33:54,890 Maintenant, le meilleur et le plus tri de répandue de ces systèmes 583 00:33:54,890 --> 00:34:00,640 sont aujourd'hui en mesure de le faire les choses à un niveau qui sont 584 00:34:00,640 --> 00:34:05,050 bien au-delà ce que nous avions il ya 10 ans. 585 00:34:05,050 --> 00:34:08,210 Voici l'un des meilleurs systèmes qui est là-bas aujourd'hui. 586 00:34:08,210 --> 00:34:10,519 Et ceci est un système d'IBM appelé Watson. 587 00:34:10,519 --> 00:34:13,040 588 00:34:13,040 --> 00:34:15,500 Ceci est de nos amis chez IBM. 589 00:34:15,500 --> 00:34:19,810 Ce sont les banques Katherine, Jia Chen, et Priscilla Moraes nous donner 590 00:34:19,810 --> 00:34:26,323 une démonstration de Watson hier à IBM Yorktown. 591 00:34:26,323 --> 00:34:26,989 [LECTURE VIDÉO] 592 00:34:26,989 --> 00:34:27,690 -Comment allez-vous? 593 00:34:27,690 --> 00:34:30,600 594 00:34:30,600 --> 00:34:31,980 >> -Je vais bien. 595 00:34:31,980 --> 00:34:35,429 Je suis toujours heureux quand je suis penser, surtout quand je 596 00:34:35,429 --> 00:34:38,920 peut rester cool dans ces salles de serveurs. 597 00:34:38,920 --> 00:34:40,170 -Qui Est votre actrice préférée? 598 00:34:40,170 --> 00:34:43,870 599 00:34:43,870 --> 00:34:47,555 >> -Mon Actrice préférée Angelina Jolie comme Lara Croft 600 00:34:47,555 --> 00:34:54,800 dans Tomb Raider parce que son origine forme était aussi un personnage virtuel comme moi. 601 00:34:54,800 --> 00:34:56,760 >> -Comment Watson peut aider les patients? 602 00:34:56,760 --> 00:34:59,700 603 00:34:59,700 --> 00:35:03,755 >> -Le Plan de patients à avoir accès à Watson directement? 604 00:35:03,755 --> 00:35:08,050 Accès à Watson consultatif applications varient par cas d'utilisation. 605 00:35:08,050 --> 00:35:12,630 Mais actuellement, Watson ne fournira diagnostic et le traitement possible 606 00:35:12,630 --> 00:35:14,725 options aux professionnel de la santé. 607 00:35:14,725 --> 00:35:17,680 Le cas échéant, les patients peut fournir des informations 608 00:35:17,680 --> 00:35:21,210 à Watson, peut-être à travers un interface de portail web, tablette, 609 00:35:21,210 --> 00:35:23,500 ou même un téléphone mobile. 610 00:35:23,500 --> 00:35:27,180 Par exemple, un patient peut être a demandé de décrire leurs symptômes 611 00:35:27,180 --> 00:35:30,460 en langage naturel directement dans une solution Watson, 612 00:35:30,460 --> 00:35:34,050 permettant au médecin de se concentrer sur la collecte des données de diagnostic et non. 613 00:35:34,050 --> 00:35:38,379 614 00:35:38,379 --> 00:35:42,716 >> -Qui Assassiné Abraham Lincoln? 615 00:35:42,716 --> 00:35:46,153 >> -John Wilkes Booth. 616 00:35:46,153 --> 00:35:52,373 >> -En Quelle année l'Arizona Diamondbacks gagner la Série mondiale? 617 00:35:52,373 --> 00:35:55,295 >> -2001. 618 00:35:55,295 --> 00:35:58,710 >> [FIN LECTURE] 619 00:35:58,710 --> 00:36:01,610 >> BRIAN Scassellati: Donc, ces types de systèmes 620 00:36:01,610 --> 00:36:07,430 avoir à compter sur d'abord la reconnaissance de la parole; deuxième, 621 00:36:07,430 --> 00:36:12,200 à le transformer en un sens interne représentation; puis, troisième, 622 00:36:12,200 --> 00:36:17,090 être en mesure de sortir et de trouver la source d'informations que 623 00:36:17,090 --> 00:36:21,140 leur permet de répondre à cette question. 624 00:36:21,140 --> 00:36:27,320 Ce niveau de complexité implique les mêmes types de choses programmatiques 625 00:36:27,320 --> 00:36:31,790 que vous avez été faire dans des ensembles de problèmes. 626 00:36:31,790 --> 00:36:38,000 >> Nous sommes en mesure d'analyser les requêtes HTTP dans le même type de modèle de bas niveau 627 00:36:38,000 --> 00:36:40,810 appariement qui ELIZA peut faire. 628 00:36:40,810 --> 00:36:45,070 Nous sommes en mesure de convertir ceux en une représentation interne, 629 00:36:45,070 --> 00:36:50,360 et les utiliser ensuite pour interroger certains base de données externe, éventuellement en utilisant SQL. 630 00:36:50,360 --> 00:36:53,530 631 00:36:53,530 --> 00:36:56,260 Tous les systèmes que sont en cours de construction aujourd'hui 632 00:36:56,260 --> 00:37:00,520 à faire ce type de naturel la communication de la langue 633 00:37:00,520 --> 00:37:04,100 sont en cours de construction sur ces mêmes principes. 634 00:37:04,100 --> 00:37:09,530 >> Maintenant, même un tel système Watson est pas assez complexe 635 00:37:09,530 --> 00:37:14,820 pour être en mesure de répondre arbitraire des questions sur tout sujet. 636 00:37:14,820 --> 00:37:20,060 Et en fait, ils doivent être structurée dans un domaine donné. 637 00:37:20,060 --> 00:37:24,440 Ainsi, vous pouvez aller en ligne et vous pouvez trouver versions de Watson qui fonctionnent bien 638 00:37:24,440 --> 00:37:27,700 au sein de l'informatique médicale. 639 00:37:27,700 --> 00:37:31,490 Ou il ya une ligne qui vient de traite de la manière 640 00:37:31,490 --> 00:37:34,540 pour faire de bonnes recommandations sur ce que la bière ira avec laquelle la nourriture. 641 00:37:34,540 --> 00:37:37,060 642 00:37:37,060 --> 00:37:41,870 Et dans ces domaines, il peut répondre à des questions, 643 00:37:41,870 --> 00:37:46,130 trouver l'information dont il a besoin. 644 00:37:46,130 --> 00:37:48,270 >> Mais vous ne pouvez pas mélanger et assortir. 645 00:37:48,270 --> 00:37:53,150 Le système qui a été formé avec la base de données de nourriture et la bière 646 00:37:53,150 --> 00:37:56,830 ne fonctionne pas bien quand vous avez soudain mettre dans le informatique médicale 647 00:37:56,830 --> 00:37:59,770 base de données. 648 00:37:59,770 --> 00:38:05,680 Ainsi, même nos meilleurs systèmes aujourd'hui compter sur un niveau de traitement 649 00:38:05,680 --> 00:38:11,570 dans lequel nous sommes codage à la main et la construction de l'infrastructure en vue 650 00:38:11,570 --> 00:38:13,275 pour faire de ce système d'exécution. 651 00:38:13,275 --> 00:38:16,360 652 00:38:16,360 --> 00:38:20,710 >> Maintenant, le dernier sujet que je veux pour être en mesure d'obtenir à aujourd'hui 653 00:38:20,710 --> 00:38:23,960 est sur la communication non verbale. 654 00:38:23,960 --> 00:38:29,290 Une grande masse d'informations qui nous communiquons les uns avec les autres 655 00:38:29,290 --> 00:38:35,490 ne se fait pas par la mots individuels qui nous appliquons. 656 00:38:35,490 --> 00:38:40,290 Il a à voir avec des choses comme proximité, regard, ton de votre voix, 657 00:38:40,290 --> 00:38:42,270 votre inflexion. 658 00:38:42,270 --> 00:38:46,620 Et que la communication est également quelque chose que de nombreuses interfaces différentes 659 00:38:46,620 --> 00:38:49,960 soins beaucoup sur. 660 00:38:49,960 --> 00:38:51,500 Il est pas ce que Siri se soucie. 661 00:38:51,500 --> 00:38:56,250 Je peux demander à Siri quelque chose d'une seule voix ou dans un ton différent, 662 00:38:56,250 --> 00:38:59,840 et Siri va me donner la même réponse. 663 00:38:59,840 --> 00:39:05,260 Mais que ce pas ce que nous construisons pour beaucoup d'autres types d'interfaces. 664 00:39:05,260 --> 00:39:09,120 >> Je tiens à vous présenter maintenant à l'un des robots. 665 00:39:09,120 --> 00:39:12,720 Elle a été construite par mon longue date ami et collègue Cynthia 666 00:39:12,720 --> 00:39:16,010 Breazeal et sa compagnie Jibo. 667 00:39:16,010 --> 00:39:20,090 Et ce robot-- nous allons d'avoir un couple de bénévoles 668 00:39:20,090 --> 00:39:22,520 venir à interagir avec ce. 669 00:39:22,520 --> 00:39:26,200 Donc, je peux avoir deux personnes prêtes à jouer avec le robot pour moi? 670 00:39:26,200 --> 00:39:29,936 Pourquoi ne venez-vous pas sur place, et pourquoi ne pas vous venez sur place. 671 00:39:29,936 --> 00:39:31,310 Si vous souhaitez vous joindre à moi ici, s'il vous plaît. 672 00:39:31,310 --> 00:39:36,520 673 00:39:36,520 --> 00:39:39,670 >> Et si je pouvais vous avez viennent juste ici. 674 00:39:39,670 --> 00:39:40,170 Merci. 675 00:39:40,170 --> 00:39:40,480 Salut. 676 00:39:40,480 --> 00:39:41,400 >> ALFREDO: Ravi de vous rencontrer. 677 00:39:41,400 --> 00:39:42,010 Alfredo. 678 00:39:42,010 --> 00:39:42,520 >> BRIAN Scassellati: Alfredo. 679 00:39:42,520 --> 00:39:43,146 >> RACHEL: Rachel. 680 00:39:43,146 --> 00:39:44,228 BRIAN Scassellati: Rachel. 681 00:39:44,228 --> 00:39:45,154 Ravi de vous rencontrer à la fois. 682 00:39:45,154 --> 00:39:46,820 Alfredo, je vais devoir vous allez d'abord. 683 00:39:46,820 --> 00:39:47,990 Venez juste ici. 684 00:39:47,990 --> 00:39:51,870 Je vais vous présenter vous-- si je peux obtenir ce hors 685 00:39:51,870 --> 00:39:58,450 sans frapper l'microphone-- à un petit robot nommé Jibo. 686 00:39:58,450 --> 00:40:00,140 D'accord? 687 00:40:00,140 --> 00:40:04,260 >> Maintenant, Jibo est conçu pour être interactif. 688 00:40:04,260 --> 00:40:09,339 Et même si elle peut vous donner la parole, une grande partie de l'interaction avec le robot 689 00:40:09,339 --> 00:40:09,880 est non verbale. 690 00:40:09,880 --> 00:40:12,450 691 00:40:12,450 --> 00:40:17,070 Alfredo, je vais vous demander de dire quelque chose de gentil et gratuit 692 00:40:17,070 --> 00:40:19,554 au robot, s'il vous plaît. 693 00:40:19,554 --> 00:40:20,845 ALFREDO: Je pense que vous regardez mignon. 694 00:40:20,845 --> 00:40:24,114 695 00:40:24,114 --> 00:40:25,611 >> [Vrombissement] 696 00:40:25,611 --> 00:40:26,192 697 00:40:26,192 --> 00:40:27,108 BRIAN Scassellati: OK. 698 00:40:27,108 --> 00:40:30,110 699 00:40:30,110 --> 00:40:33,180 Sa réponse est non verbale. 700 00:40:33,180 --> 00:40:35,180 Et pourtant, il vous a donné à la fois une reconnaissance claire 701 00:40:35,180 --> 00:40:39,680 qu'il avait entendu ce que vous avez dit et également entendu que d'une certaine manière. 702 00:40:39,680 --> 00:40:40,530 D'accord? 703 00:40:40,530 --> 00:40:42,070 PD revenir ici pour une seconde. 704 00:40:42,070 --> 00:40:43,130 Merci. 705 00:40:43,130 --> 00:40:44,090 >> Rachel, si vous le voulez. 706 00:40:44,090 --> 00:40:46,070 Maintenant, je vais donner vous la tâche beaucoup plus difficile. 707 00:40:46,070 --> 00:40:48,361 Si vous souhaitez tenez ici, sauvegarder un peu de sorte 708 00:40:48,361 --> 00:40:50,280 nous pouvons vous mettre sur la caméra et de regarder de cette façon. 709 00:40:50,280 --> 00:40:56,840 Je vais vous demander de dire quelque chose cela signifie vraiment et méchant au robot. 710 00:40:56,840 --> 00:41:02,900 >> RACHEL: Ce que vous venez sembliez à faire était complètement absurde. 711 00:41:02,900 --> 00:41:03,840 >> [Bourdonnement] 712 00:41:03,840 --> 00:41:07,610 713 00:41:07,610 --> 00:41:09,030 >> Ce fut encore plus absurde. 714 00:41:09,030 --> 00:41:10,120 Qu'est ce qui se passe avec toi? 715 00:41:10,120 --> 00:41:13,487 716 00:41:13,487 --> 00:41:16,207 Aw, ne se sentent pas mauvais. 717 00:41:16,207 --> 00:41:17,040 Je vais vous donner un câlin. 718 00:41:17,040 --> 00:41:19,882 719 00:41:19,882 --> 00:41:21,090 BRIAN Scassellati: Très bien. 720 00:41:21,090 --> 00:41:22,280 Merci, Rachel. 721 00:41:22,280 --> 00:41:24,565 Alfredo, Rachel, merci les gars beaucoup. 722 00:41:24,565 --> 00:41:26,840 >> [APPLAUDISSEMENTS] 723 00:41:26,840 --> 00:41:28,660 724 00:41:28,660 --> 00:41:34,470 >> Donc, ce type d'interaction a en de nombreuses façons quelques-uns des mêmes règles 725 00:41:34,470 --> 00:41:36,950 et une partie de la même Structure selon ce que l'on 726 00:41:36,950 --> 00:41:39,950 a peut-être en interaction linguistique. 727 00:41:39,950 --> 00:41:44,530 Il est à la fois communicative et sert un objectif important. 728 00:41:44,530 --> 00:41:48,590 Et cette interaction, dans bien des égards, est conçu 729 00:41:48,590 --> 00:41:52,890 d'avoir un effet particulier sur la ou personne interagissant avec écoute 730 00:41:52,890 --> 00:41:54,410 au robot. 731 00:41:54,410 --> 00:41:56,450 >> Maintenant, je suis assez chanceux d'avoir Jibo ici aujourd'hui. 732 00:41:56,450 --> 00:42:00,550 Sam Spaulding est ici d'aider nous avec le robot. 733 00:42:00,550 --> 00:42:07,470 Et je vais demander à Sam pour donner nous un belle démonstration de la danse Jibo 734 00:42:07,470 --> 00:42:09,720 que nous pouvons regarder à la fin ici. 735 00:42:09,720 --> 00:42:10,590 Alors allez-y, Jibo. 736 00:42:10,590 --> 00:42:11,550 >> SAM: OK, Jibo. 737 00:42:11,550 --> 00:42:14,430 Montrez-nous vos mouvements de danse. 738 00:42:14,430 --> 00:42:17,310 >> [Jouer de la musique] 739 00:42:17,310 --> 00:42:43,114 740 00:42:43,114 --> 00:42:44,780 BRIAN Scassellati: Très bien, tout le monde. 741 00:42:44,780 --> 00:42:46,865 Merci à nos amis de Jibo. 742 00:42:46,865 --> 00:42:49,426 >> [APPLAUDISSEMENTS] 743 00:42:49,426 --> 00:42:50,140 744 00:42:50,140 --> 00:42:54,990 >> Et merci à nos amis de IBM pour aider aujourd'hui. 745 00:42:54,990 --> 00:42:57,300 La communication est quelque chose que vous allez 746 00:42:57,300 --> 00:43:02,280 de voir venir de plus en plus comme nous construisons des interfaces plus complexes. 747 00:43:02,280 --> 00:43:05,760 La semaine prochaine, nous allons parler sur la façon d'interfacer 748 00:43:05,760 --> 00:43:08,890 avec des adversaires informatiques dans les jeux. 749 00:43:08,890 --> 00:43:12,950 Mais si vous avez des questions à ce sujet, Je serai dans les heures de bureau au soir. 750 00:43:12,950 --> 00:43:17,610 Je suis heureux de vous parler de l'IA sujets ou d'entrer dans plus de détails. 751 00:43:17,610 --> 00:43:18,927 Passe un bon week-end. 752 00:43:18,927 --> 00:43:21,409 >> [APPLAUDISSEMENTS] 753 00:43:21,409 --> 00:43:21,909 754 00:43:21,909 --> 00:43:26,141 [Jouer de la musique] 755 00:43:26,141 --> 00:46:42,879