1 00:00:00,000 --> 00:00:02,928 >> [Musikwiedergabe] 2 00:00:02,928 --> 00:00:11,230 3 00:00:11,230 --> 00:00:12,790 >> DAVID MALAN: Dies ist CS50. 4 00:00:12,790 --> 00:00:14,072 Dies ist das Ende der 10. Woche. 5 00:00:14,072 --> 00:00:16,030 Und Junge, haben wir ein gute Klasse für Sie heute. 6 00:00:16,030 --> 00:00:20,040 Wir sind so aufgeregt, um zwei einladen unsere Freunde aus Yale bis zu uns heute 7 00:00:20,040 --> 00:00:23,920 und an der Kreuzung der aussehen künstliche Intelligenz, Robotik, 8 00:00:23,920 --> 00:00:25,710 Verarbeitung natürlicher Sprache und vieles mehr. 9 00:00:25,710 --> 00:00:27,090 >> Und in der Tat, über die letzten Wochen, haben wir 10 00:00:27,090 --> 00:00:29,714 sicherlich verbrachten viel Zeit, vor allem in den früheren psets, 11 00:00:29,714 --> 00:00:31,560 Schwerpunkt auf ziemlich Low-Level-Details. 12 00:00:31,560 --> 00:00:34,520 Und es ist sehr einfach, aus den Augen verlieren der Wald vor lauter Bäumen 13 00:00:34,520 --> 00:00:38,170 und erhalten Sie bis zu Schleifen und Bedingungen aufgehängt und Zeiger, sicher, und dergleichen. 14 00:00:38,170 --> 00:00:41,770 Aber die Realität ist euch nun die Zutaten mit denen Sie wirklich 15 00:00:41,770 --> 00:00:45,300 lösen einige interessante Probleme, unter sie diejenigen, die unsere Freunde an der Yale 16 00:00:45,300 --> 00:00:48,790 arbeiten nur schüchtern von Cambridge. 17 00:00:48,790 --> 00:00:52,410 >> So gestatten Sie mir zunächst, um unserem Kopf vorstellen Lehrassistent an der Yale, Andy. 18 00:00:52,410 --> 00:00:55,182 >> [BEIFALL] 19 00:00:55,182 --> 00:00:57,030 20 00:00:57,030 --> 00:01:00,710 >> ANDY: Zunächst einmal, nur danken, Ihnen dafür, dass Sie ein paar Yalies 21 00:01:00,710 --> 00:01:02,700 Pop auf bis zu Cambridge heute. 22 00:01:02,700 --> 00:01:05,299 Wir schätzen es wirklich. 23 00:01:05,299 --> 00:01:07,090 Zweitens, unsere Freunde zurück home-- Jason, 24 00:01:07,090 --> 00:01:09,670 Dank für den Aufenthalt und Lauf Vortrag. 25 00:01:09,670 --> 00:01:12,970 Hoffe, es ist alles gut in New Haven. 26 00:01:12,970 --> 00:01:15,720 >> Also ja, ich bin super aufgeregt einzuführen Scaz heute. 27 00:01:15,720 --> 00:01:17,020 Scaz läuft die Robotik-Labor. 28 00:01:17,020 --> 00:01:19,690 Er ist Professor für, wie, fünf verschiedenen Abteilungen in Yale. 29 00:01:19,690 --> 00:01:23,159 In seinem Labor hat er viele, viele Roboter, die er mag, mit zu spielen. 30 00:01:23,159 --> 00:01:24,950 Er hat, wie die coolsten Job der Welt. 31 00:01:24,950 --> 00:01:27,116 Und er bekommt, um Art von Chaos herum mit, dass den ganzen Tag 32 00:01:27,116 --> 00:01:29,090 lang und einige Arbeit, wie gut. 33 00:01:29,090 --> 00:01:33,070 >> Und so haben wir eigentlich eine gebracht von ihnen sich mit uns heute. 34 00:01:33,070 --> 00:01:36,900 So ohne weiteres ist Scaz werde weitermachen und führen uns 35 00:01:36,900 --> 00:01:38,660 um seinen Roboter Freund. 36 00:01:38,660 --> 00:01:41,546 >> [BEIFALL] 37 00:01:41,546 --> 00:01:42,935 38 00:01:42,935 --> 00:01:44,310 BRIAN Scassellati: Danke, David. 39 00:01:44,310 --> 00:01:45,380 Danke, Andy. 40 00:01:45,380 --> 00:01:50,050 Es ist so schön zu sein hier mit jeder heute. 41 00:01:50,050 --> 00:01:56,490 Ich möchte zunächst ganz klar, dass sein Die CS50 Personal hier in Cambridge 42 00:01:56,490 --> 00:01:59,190 hat unglaublich gastfreundlich zu uns gewesen. 43 00:01:59,190 --> 00:02:02,130 Wir sind so dankbar für alles, was sie getan haben, um uns zu unterstützen. 44 00:02:02,130 --> 00:02:05,690 Und so möchten wir zu können um die Güte zurückzugeben. 45 00:02:05,690 --> 00:02:09,370 >> Also heute, bekommen wir zu verkünden, dass wir gehen, ein neues zu haben, 46 00:02:09,370 --> 00:02:15,240 one-of-a-kind-CS50 Ereignis geschieht in New Haven nächste Woche. 47 00:02:15,240 --> 00:02:18,040 Und dies ist der CS50 Forschung Expo. 48 00:02:18,040 --> 00:02:21,300 So werden wir einladen everyone-- CS50 Studenten, 49 00:02:21,300 --> 00:02:26,510 Mitarbeiter aus beiden Harvard und Yale-- zu komm herab und besuchen Sie mit uns am Freitag. 50 00:02:26,510 --> 00:02:30,400 Wir werden eine große Auswahl von über haben 30 verschiedene Menschen präsentieren 51 00:02:30,400 --> 00:02:34,830 und exhibiting-- upperclassmen zeigen einige ihrer Forschungsprodukte. 52 00:02:34,830 --> 00:02:38,480 Wir werden einige Start-ups haben, auch, auf der Suche für ein wenig von neuen Tech-Talent, 53 00:02:38,480 --> 00:02:40,460 Startups aus sowohl Harvard und Yale. 54 00:02:40,460 --> 00:02:44,550 Und wir werden einige Schülergruppen haben Suche nach einigen neuen Mitglieds. 55 00:02:44,550 --> 00:02:46,357 >> Es wird eine sehr aufregende Zeit sein. 56 00:02:46,357 --> 00:02:49,190 Hoffentlich diejenigen von euch, sind herab für die Harvard-Yale-Spiel 57 00:02:49,190 --> 00:02:51,360 in der Lage zu stoppen durch ein kleines bisschen zu früh, 58 00:02:51,360 --> 00:02:54,060 direkt im Zentrum von Campus, Sterling Memorial Library. 59 00:02:54,060 --> 00:02:58,040 Wir werden eine Reihe von haben Exponate, die vom autonomen Bereich 60 00:02:58,040 --> 00:03:04,460 Segelboote, um Möglichkeiten der Verwendung von Software- In den mittelalterlichen Handschriften zu erhalten. 61 00:03:04,460 --> 00:03:07,860 >> Wir werden Anzeiger hoc-Vernetzung und die Menschen 62 00:03:07,860 --> 00:03:11,230 Lernsoftware Codierung in Kapstadt. 63 00:03:11,230 --> 00:03:13,730 Wir werden Computer haben Musikvorführungen. 64 00:03:13,730 --> 00:03:16,020 Und wir haben natürlich mehr Roboter. 65 00:03:16,020 --> 00:03:18,900 So dass wir hoffen, dass Sie besuchen Sie uns für diese Veranstaltung. 66 00:03:18,900 --> 00:03:21,350 Es sollte eine Menge sein, Spaß, ein bisschen von Lebensmitteln, 67 00:03:21,350 --> 00:03:24,430 und eine Menge interessanter Dinge zu reden. 68 00:03:24,430 --> 00:03:28,230 >> Also heute werden wir zu sprechen über die Verarbeitung natürlicher Sprache. 69 00:03:28,230 --> 00:03:32,560 Und das ist der Versuch für uns um ein neues Verfahren zur Verknüpfung bauen 70 00:03:32,560 --> 00:03:35,150 mit unseren Geräten, weil für den letzten Wochen, 71 00:03:35,150 --> 00:03:40,800 Sie, wie es ist, dass konzentriert haben können Sie Code schreiben, schreiben Software 72 00:03:40,800 --> 00:03:47,110 das ist eine Art des Seins in der Lage, ein Mitsprache Maschine, das ist, was ich will, was Sie tun. 73 00:03:47,110 --> 00:03:50,210 >> Aber wir sollten nicht zu erwarten, dass alles, was 74 00:03:50,210 --> 00:03:53,760 das ist, gibt, wird verwendet, von jeder in der Welt 75 00:03:53,760 --> 00:03:57,480 wird tüchtig zu sein in dieser Art von Unterricht. 76 00:03:57,480 --> 00:04:02,540 So unterscheiden wir zwischen Computer Sprachen und Natur languages-- 77 00:04:02,540 --> 00:04:06,720 das heißt, Dinge, die Nutzung der Mensch mit anderen Menschen kommunizieren. 78 00:04:06,720 --> 00:04:12,270 Und wir versuchen, Schnittstellen, verwenden zu bauen diese natürlichen Kommunikationsmechanismen. 79 00:04:12,270 --> 00:04:16,029 >> Jetzt, nur jede zweite Thema wünschen dass wir mit in CS50 begonnen, 80 00:04:16,029 --> 00:04:19,589 werden wir mit dem einfachsten starten Bit Verarbeitung natürlicher Sprache 81 00:04:19,589 --> 00:04:21,269 dass wir uns vorstellen können. 82 00:04:21,269 --> 00:04:24,940 Wir werden mit dem Start historischen Teil der natürlichen Sprache. 83 00:04:24,940 --> 00:04:28,740 Und dann werden wir aufbauen mehr neueren Systemen 84 00:04:28,740 --> 00:04:31,450 und Spaß haben Demos auf dem Weg. 85 00:04:31,450 --> 00:04:35,900 >> So werden wir mit dem, was war, zu starten wahrscheinlich das erste natürliche Sprache 86 00:04:35,900 --> 00:04:38,210 Verarbeitungssystem. 87 00:04:38,210 --> 00:04:45,080 Dies war ein Software-System in schriftlicher 1966 von Joseph Weizenbaum namens ELIZA. 88 00:04:45,080 --> 00:04:49,640 Und ELIZA wurde entwickelt replizieren die Art der Interaktion 89 00:04:49,640 --> 00:04:53,850 Sie mit einer hätte Rogers Psychotherapeut. 90 00:04:53,850 --> 00:04:57,210 Nun werden die Rogerians hatten sie eine Idee, die Psychotherapie 91 00:04:57,210 --> 00:05:02,800 beteiligt in der Lage, wieder zu spiegeln zu einem Patienten und mit ihnen sprechen, 92 00:05:02,800 --> 00:05:08,100 im Grunde nur um ihnen eine kleines bisschen des Therapeuten. 93 00:05:08,100 --> 00:05:09,920 Das heißt, alles, was dass der Therapeut sagte, 94 00:05:09,920 --> 00:05:16,500 sollte nur ein Spiegelbild sein was der Patient erzählte sie. 95 00:05:16,500 --> 00:05:18,990 >> Also lassen Sie uns versuchen, diese Demo. 96 00:05:18,990 --> 00:05:22,820 Haben wir einen Freiwilligen, der sein würde bereit sind, ihre tiefsten teilen, 97 00:05:22,820 --> 00:05:26,650 dunkelsten, und / oder gefälschten Geheimnisse mit ELIZA? 98 00:05:26,650 --> 00:05:29,680 Sicher, warum gehst du nicht zu kommen. 99 00:05:29,680 --> 00:05:30,847 Fantastisch. 100 00:05:30,847 --> 00:05:31,430 Und dein Name? 101 00:05:31,430 --> 00:05:32,000 >> MILES: Miles. 102 00:05:32,000 --> 00:05:33,041 >> BRIAN Scassellati: Miles. 103 00:05:33,041 --> 00:05:34,270 Freut mich, Miles. 104 00:05:34,270 --> 00:05:36,270 Wenn Sie auf, dass zu halten. 105 00:05:36,270 --> 00:05:40,840 Und wir sind zu gehen verwenden Sie eine Version von ELIZA 106 00:05:40,840 --> 00:05:44,640 dass wir repliziert haben innerhalb des CS50 IDE. 107 00:05:44,640 --> 00:05:47,140 Und wir werden an der Quelle zu suchen Code, um diese in eine kleine Weile. 108 00:05:47,140 --> 00:05:49,910 Aber für jetzt, nur wir sind werde es durch Eingabe von eliza aufzurufen. 109 00:05:49,910 --> 00:05:55,480 >> Und Eliza wird Ihnen Antworten zu geben, die gehen, um in allen Hauptstädten ist. 110 00:05:55,480 --> 00:05:57,950 Und werde Ihnen ein paar Fragen stellen. 111 00:05:57,950 --> 00:06:02,130 Und wir werden reagieren, und geben Sie in Reaktion auf ELIZA. 112 00:06:02,130 --> 00:06:04,310 So ELIZA hat gesagt: "Hallo, ich bin ELIZA. 113 00:06:04,310 --> 00:06:05,462 Was ist dein Problem?" 114 00:06:05,462 --> 00:06:08,092 Was würdest du gerne sagen ELIZA heute? 115 00:06:08,092 --> 00:06:10,750 >> MILES: Ich kann nur einschlafen wenn ich Häschenpantoffeln auf. 116 00:06:10,750 --> 00:06:12,440 >> BRIAN Scassellati: Alles klar. 117 00:06:12,440 --> 00:06:13,360 Gut. 118 00:06:13,360 --> 00:06:15,300 >> [LACHEN] 119 00:06:15,300 --> 00:06:22,410 >> "Ich kann nur einschlafen mit Häschenpantoffeln auf. " 120 00:06:22,410 --> 00:06:29,000 ELIZA und sagt: "Sag mal, hast du keine psychische Probleme? 121 00:06:29,000 --> 00:06:30,450 Vielleicht ist das ein guter Indikator. " 122 00:06:30,450 --> 00:06:30,780 >> OK. 123 00:06:30,780 --> 00:06:32,245 Also, was wollen Sie darauf reagieren? 124 00:06:32,245 --> 00:06:36,110 125 00:06:36,110 --> 00:06:36,970 >> MILES: Ja. 126 00:06:36,970 --> 00:06:38,660 >> BRIAN Scassellati: Ja. 127 00:06:38,660 --> 00:06:39,570 Mann vieler Worte. 128 00:06:39,570 --> 00:06:41,870 Das macht mir viel Spaß. 129 00:06:41,870 --> 00:06:50,200 Eliza sagt: "Sie scheinen sehr positiv." 130 00:06:50,200 --> 00:06:53,200 >> MILES: Nein, ich bin in der Tat, ein Elektron. 131 00:06:53,200 --> 00:06:55,150 >> BRIAN Scassellati: "No. 132 00:06:55,150 --> 00:07:02,240 In der Tat, ich bin ein Elektron. " "Hast du zu mir kommen 133 00:07:02,240 --> 00:07:06,954 weil Sie eine Elektronen sind? " 134 00:07:06,954 --> 00:07:08,870 Jetzt können wir einige zu sehen die things-- Ich werde 135 00:07:08,870 --> 00:07:10,200 , Sie nur für eine Sekunde Pause, Miles. 136 00:07:10,200 --> 00:07:11,010 Überall Gehen Sie nicht. 137 00:07:11,010 --> 00:07:12,650 Wir sind noch nicht mit dir geschehen. 138 00:07:12,650 --> 00:07:16,490 ELIZA ist, in gewisser Weise, Reaktion auf bestimmte Dinge, 139 00:07:16,490 --> 00:07:21,140 , dass er sagt, aber ohne eine wirkliche Verständnis. 140 00:07:21,140 --> 00:07:26,090 Und es ist auch wieder einige parroting der Teile seiner Strafe. 141 00:07:26,090 --> 00:07:27,310 >> Also sagten wir: "Nein, 142 00:07:27,310 --> 00:07:29,090 In der Tat, ich bin ein Elektron. " 143 00:07:29,090 --> 00:07:34,190 Eliza reagierte zurück, "Bist du gekommen, für mich, denn du bist ein Elektron? " 144 00:07:34,190 --> 00:07:34,690 Gut. 145 00:07:34,690 --> 00:07:36,050 Geben wir es noch Antwort hier. 146 00:07:36,050 --> 00:07:37,140 Geben Sie ihm ein gutes, Miles. 147 00:07:37,140 --> 00:07:37,806 >> MILES: Good one? 148 00:07:37,806 --> 00:07:48,400 149 00:07:48,400 --> 00:07:49,570 >> Ja, bitte hilf mir. 150 00:07:49,570 --> 00:07:50,570 BRIAN Scassellati: "Ja. 151 00:07:50,570 --> 00:07:58,010 Bitte helfen Sie mir. "" Bist du sicher? " 152 00:07:58,010 --> 00:07:58,510 MILES: Nein 153 00:07:58,510 --> 00:08:00,860 BRIAN Scassellati: Nein 154 00:08:00,860 --> 00:08:03,562 "Was bedeutet das für Sie vor?" 155 00:08:03,562 --> 00:08:06,760 >> MILES: Ich kann nicht ein Elektron ist. 156 00:08:06,760 --> 00:08:11,170 >> BRIAN Scassellati: "Ich kann nicht ein Elektron zu sein. " 157 00:08:11,170 --> 00:08:13,790 "Wollen Sie damit sagen nicht nur negativ zu sein?" 158 00:08:13,790 --> 00:08:14,390 >> Gut. 159 00:08:14,390 --> 00:08:16,030 So Miles, ich danke Ihnen so sehr. 160 00:08:16,030 --> 00:08:16,860 >> MILES: Ich danke Ihnen. 161 00:08:16,860 --> 00:08:18,360 >> BRIAN Scassellati: Vielen Dank. 162 00:08:18,360 --> 00:08:20,230 [BEIFALL] 163 00:08:20,230 --> 00:08:21,230 164 00:08:21,230 --> 00:08:26,700 >> So dass diese ELIZA Programms in vielerlei Hinsicht, wird nur die Reaktion auf den Stücken 165 00:08:26,700 --> 00:08:32,730 dass wir ohne tiefe Bereitstellung zu verstehen, was hier passiert. 166 00:08:32,730 --> 00:08:36,640 Dies ist eine Art von System genannt Pattern-Matching, wo 167 00:08:36,640 --> 00:08:40,490 wir sind für bestimmte suchen Bits der Text, den wir dann 168 00:08:40,490 --> 00:08:44,860 gehen, um von zu nehmen, was als Eingabe bereitgestellt, 169 00:08:44,860 --> 00:08:52,580 umwandeln, was möglicherweise in irgendeiner Weise, und dann geben wir es zurück an den Benutzer. 170 00:08:52,580 --> 00:08:55,150 >> Hat jemand von euch denken, dass ELIZA ist eigentlich 171 00:08:55,150 --> 00:08:58,230 Durchführung gültig Psychoanalyse hier? 172 00:08:58,230 --> 00:08:59,250 Eine Person, vielleicht. 173 00:08:59,250 --> 00:09:00,166 >> ZIELGRUPPE: [unverständlich]. 174 00:09:00,166 --> 00:09:03,315 175 00:09:03,315 --> 00:09:05,440 BRIAN Scassellati: Und wie Heißt das, fühlen Sie sich? 176 00:09:05,440 --> 00:09:06,530 Ja, in der Tat, es tut. 177 00:09:06,530 --> 00:09:10,890 Und wir werden sehen, die tatsächlich die Quellcode für sie in nur einem Augenblick. 178 00:09:10,890 --> 00:09:13,580 Und so wirst du sein wirst Lage, genau dies zu tun. 179 00:09:13,580 --> 00:09:17,420 >> Nun, das ist eine Form von ELIZA, was wir heute ein Chat-Bot nennen würde. 180 00:09:17,420 --> 00:09:19,950 Es geht nur über die Text, den Sie bieten bist, 181 00:09:19,950 --> 00:09:24,030 bietet das Nötigste Menge Verständnis oder Verarbeitung, 182 00:09:24,030 --> 00:09:26,790 und dann plappert sie zurück zu Ihnen. 183 00:09:26,790 --> 00:09:31,830 Werfen wir also einen Blick, konzeptionell und darüber zu sprechen, was 184 00:09:31,830 --> 00:09:34,690 es ist, dass ELIZA tatsächlich tut. 185 00:09:34,690 --> 00:09:42,000 >> ELIZA nimmt ein sentence-- Lassen Sie uns sagen: "Ich will mein Chef zu beeindrucken." 186 00:09:42,000 --> 00:09:45,130 Und Eliza suchen durch diesen Satz 187 00:09:45,130 --> 00:09:48,730 und versuchen zu finden und entsprechen bestimmte Muster. 188 00:09:48,730 --> 00:09:52,850 So, zum Beispiel, eines der Muster dass ELIZA ist auf der Suche sind die Worte 189 00:09:52,850 --> 00:09:55,110 "Ich will." 190 00:09:55,110 --> 00:09:59,330 Und jedes Mal, es war etwas sieht, das hat "Ich will" in ihm, 191 00:09:59,330 --> 00:10:01,770 es formuliert eine Antwort. 192 00:10:01,770 --> 00:10:05,040 Und diese Antwort ist ein fester String. 193 00:10:05,040 --> 00:10:07,915 In diesem Fall ist es, "warum willst du?" 194 00:10:07,915 --> 00:10:11,330 Und ich einen kleinen Stern auf das Ende, denn das ist nur 195 00:10:11,330 --> 00:10:13,310 der Anfang unserer Antwort. 196 00:10:13,310 --> 00:10:16,310 Und der Stern zeigt an, dass wir werden den Rest 197 00:10:16,310 --> 00:10:19,850 von utterance-- des Benutzers "Zu meinen Chef zu beeindrucken" - 198 00:10:19,850 --> 00:10:24,500 und wir werden, dass anhängen auf das Ende dieser Zeichenfolge. 199 00:10:24,500 --> 00:10:28,990 >> So, jetzt, anstatt zu sagen, "warum Sie zu meinem Chef zu beeindrucken wollen " 200 00:10:28,990 --> 00:10:31,800 es ist ein bisschen von zusätzlichen Verarbeitung, die wir tun. 201 00:10:31,800 --> 00:10:34,440 Das heißt, wir werden zu müssen konvertieren einige der Pronomina 202 00:10:34,440 --> 00:10:38,670 hier von "mein Chef" bis "Ihrem Chef." 203 00:10:38,670 --> 00:10:41,300 Und es könnte ein paar andere sein Änderungen, die wir brauchen, um zu machen. 204 00:10:41,300 --> 00:10:44,990 Also nicht nur Aufkleben direkt auf das Ende, was wir tun 205 00:10:44,990 --> 00:10:49,160 wird wir erledigen den Rest des nehmen utterance-- Benutzers in weißen hier-- 206 00:10:49,160 --> 00:10:54,090 und wir werden es ein Stück zu nehmen eine Zeit, und wandeln jede Saite 207 00:10:54,090 --> 00:10:58,180 Token, jedes Wort, in den Satz. 208 00:10:58,180 --> 00:10:59,580 >> Also werden wir das Wort "bis". Nehmen 209 00:10:59,580 --> 00:11:01,650 Es gibt keine Umrechnungs dass wir das tun. 210 00:11:01,650 --> 00:11:02,340 "Beeindrucken." 211 00:11:02,340 --> 00:11:04,140 Es gibt keine Umrechnungs wir brauchen, um es zu tun. 212 00:11:04,140 --> 00:11:06,670 "Mein" konvertiert, um "Ihre". 213 00:11:06,670 --> 00:11:10,070 Und "Chef" wir lassen Sie einfach als "Chef". 214 00:11:10,070 --> 00:11:12,740 Und dann schließlich alles dass endet mit einem Punkt, 215 00:11:12,740 --> 00:11:16,640 wir werden es in eine Frage zu konvertieren. 216 00:11:16,640 --> 00:11:22,600 >> Diese sehr einfache Mustererkennung ist eigentlich recht erfolgreich. 217 00:11:22,600 --> 00:11:27,260 Und wenn diese eingeführt wurde in 1966-- Joseph Weizenbaum 218 00:11:27,260 --> 00:11:28,986 programmiert diese auf einem Computer. 219 00:11:28,986 --> 00:11:31,110 Nun, Computer zu diesem Zeitpunkt waren nicht Desktop-Modelle. 220 00:11:31,110 --> 00:11:33,950 Sie wurden gemeinsam genutzten Ressourcen. 221 00:11:33,950 --> 00:11:39,090 Und seine Schüler würden gehen und sich mit ELIZA. 222 00:11:39,090 --> 00:11:41,570 Schließlich hatte er den den Zugriff auf sie 223 00:11:41,570 --> 00:11:43,890 weil seine Schüler waren nicht immer alle Arbeit getan. 224 00:11:43,890 --> 00:11:46,190 Sie wurden gerade im Chat mit ELIZA. 225 00:11:46,190 --> 00:11:48,850 Und, in der Tat, hatte er Feuer seine Assistentin, die 226 00:11:48,850 --> 00:11:55,840 verbrachte ihre ganze Zeit im Gespräch mit ELIZA über ihre tiefen und beunruhigenden Problemen. 227 00:11:55,840 --> 00:12:00,350 >> Jeder, der diese Systeme verwendet werden, begann, sie zu vermenschlichen. 228 00:12:00,350 --> 00:12:04,490 Sie fingen an, von ihnen als zu denken wobei belebten und echten Menschen. 229 00:12:04,490 --> 00:12:07,969 Sie fingen an, einige erkennen, die Dinge, die sie sagten 230 00:12:07,969 --> 00:12:09,010 wurden wieder zu ihnen kommen. 231 00:12:09,010 --> 00:12:12,120 Und sie wurden herausfinden, Dinge über sich selbst. 232 00:12:12,120 --> 00:12:17,290 Und in der Tat auch die Experten, selbst die Psychotherapeuten, 233 00:12:17,290 --> 00:12:22,930 begann sich Sorgen zu machen, dass in der Tat, vielleicht ELIZA wäre zu ersetzen. 234 00:12:22,930 --> 00:12:25,640 Und selbst der Computer Wissenschaftler befürchten, dass wir 235 00:12:25,640 --> 00:12:30,040 so nah an der Lösung der natürlichen Sprache. 236 00:12:30,040 --> 00:12:33,520 >> Nun, das war nicht annähernd so wahr. 237 00:12:33,520 --> 00:12:37,280 Aber das ist, wie beeindruckend diese Systeme scheinen. 238 00:12:37,280 --> 00:12:40,080 Lassen Sie uns also beginnen zu schauen unterhalb und versuchen 239 00:12:40,080 --> 00:12:46,190 um ein wenig von einer Frage zu erhalten von denen dieser Code tatsächlich passiert. 240 00:12:46,190 --> 00:12:48,170 Also werden wir diesen Code machen verfügbar danach. 241 00:12:48,170 --> 00:12:50,880 Und das ist eine sehr einfachen und direkten Port- 242 00:12:50,880 --> 00:12:53,240 des ursprünglichen ELIZA Umsetzung. 243 00:12:53,240 --> 00:12:56,350 >> So einige dieser stilistischen Dinge, die Sie hier sehen, 244 00:12:56,350 --> 00:12:59,360 nicht stilistisch, was wir möchten Sie tun 245 00:12:59,360 --> 00:13:01,480 oder was wir unterrichtet, was Sie tun. 246 00:13:01,480 --> 00:13:04,770 Aber wir haben versucht, sie zu halten das gleiche für die vielen Häfen 247 00:13:04,770 --> 00:13:08,087 daß dies so, daß sie zu hat den Geschmack des ursprünglichen. 248 00:13:08,087 --> 00:13:09,920 So werden wir schließen eine Reihe von Dingen, 249 00:13:09,920 --> 00:13:12,920 und dann werden wir eine haben, Satz von Schlüsselwörtern, die Dinge 250 00:13:12,920 --> 00:13:16,460 dass ELIZA erkennen und darauf zu reagieren direkt. 251 00:13:16,460 --> 00:13:20,780 Also, wenn Sie Wörter wie haben "Sie" oder "Ich weiß nicht" oder "nein" 252 00:13:20,780 --> 00:13:24,680 oder "Ja" oder "Traum" oder "Hallo", dann ELIZA 253 00:13:24,680 --> 00:13:27,920 wird selektiv an denjenigen zu reagieren. 254 00:13:27,920 --> 00:13:30,010 Wir haben auch ein bestimmte Anzahl von Dingen 255 00:13:30,010 --> 00:13:34,940 dass wir uns wie zu tauschen Umwandlung von "mein" zu "Ihrem". 256 00:13:34,940 --> 00:13:39,920 >> Und dann werden wir eine Reihe von Reaktionen haben , dass für jedes dieser Stichworte, 257 00:13:39,920 --> 00:13:42,580 wir werden durch Drehen diese unterschiedlichen Reaktionen. 258 00:13:42,580 --> 00:13:45,350 Also, wenn ich sage, "Ja" drei Mal in Folge, I 259 00:13:45,350 --> 00:13:50,429 vielleicht bekommen drei verschiedene Antworten von ELIZA. 260 00:13:50,429 --> 00:13:52,345 Unser Code ist also tatsächlich bemerkenswert einfach. 261 00:13:52,345 --> 00:13:59,490 Wenn ich nach unten scrollen Vergangenheit alle diese Antworten, die wir in programmiert haben 262 00:13:59,490 --> 00:14:02,920 und wir uns an die unsere, wir werden initialisiert 263 00:14:02,920 --> 00:14:06,540 ein paar verschiedene Variablen und tun, ein wenig von der Hauswirtschaft 264 00:14:06,540 --> 00:14:08,480 am Anfang. 265 00:14:08,480 --> 00:14:11,760 Aber dann gibt es absolut ein Satz der Code, den Sie verstehen können. 266 00:14:11,760 --> 00:14:15,820 Ein großer while-Schleife, die sagt, ich bin werde dies immer und immer zu wiederholen. 267 00:14:15,820 --> 00:14:20,420 Ich werde in einer Zeile zu lesen, und ich werde zu speichern, die in einer Eingabezeichenfolge. 268 00:14:20,420 --> 00:14:23,880 Ich werde zu überprüfen und sehen, ob es die spezielle Schlüsselwort "Auf Wiedersehen", die 269 00:14:23,880 --> 00:14:26,199 bedeutet, das Programm zu beenden. 270 00:14:26,199 --> 00:14:29,240 Und dann werde ich überprüfen und sehen, ob jemand gerade sich zu wiederholen 271 00:14:29,240 --> 00:14:29,800 über und über. 272 00:14:29,800 --> 00:14:31,174 Und ich werde sie an zu schreien, wenn sie es tun. 273 00:14:31,174 --> 00:14:34,820 Ich werde sagen, "Sie sich nicht wiederholen." 274 00:14:34,820 --> 00:14:40,500 >> Solange keiner von denen geschehen, werden wir dann durch und Schleife durch Scannen, 275 00:14:40,500 --> 00:14:45,330 auf den Leitungen 308-313 hier und überprüfen und sehen, 276 00:14:45,330 --> 00:14:49,090 sind irgendwelche von denen Schlüsselwort Sätze in der Eingabe enthalten 277 00:14:49,090 --> 00:14:50,620 dass ich gerade gegeben? 278 00:14:50,620 --> 00:14:54,845 Wenn es eine Übereinstimmung für sie, gut dann werde ich diesen Ort erinnern. 279 00:14:54,845 --> 00:14:57,050 Ich werde dieses Schlüsselwort zu erinnern. 280 00:14:57,050 --> 00:14:58,620 Und ich werde in der Lage, eine Antwort zu bauen. 281 00:14:58,620 --> 00:15:03,150 >> Wenn ich nicht finden ein, auch dann, das Letzte, was in meinem Keyword-Array 282 00:15:03,150 --> 00:15:08,070 meine Standardantworten zu sein, wenn sonst nichts passt. 283 00:15:08,070 --> 00:15:14,160 Ich werde Fragen wie: "Warum hast du hierher zu kommen? "oder" Wie kann ich Ihnen helfen? " 284 00:15:14,160 --> 00:15:19,710 dass sind nur teilweise entsprechende egal, was die Eingabe ist. 285 00:15:19,710 --> 00:15:22,580 >> Wir werden dann aufzubauen ELIZA Antwort. 286 00:15:22,580 --> 00:15:26,040 Wir werden in der Lage, zu nehmen daß Basisantwort, 287 00:15:26,040 --> 00:15:28,370 so wie wir das gemacht haben, dass "mein Chef" Beispiel. 288 00:15:28,370 --> 00:15:30,970 289 00:15:30,970 --> 00:15:33,990 Wenn das alles ist, dass es ist-- wenn es nur einen 290 00:15:33,990 --> 00:15:36,860 Zeichenfolge, die ich soll respond-- Ich kann senden Sie ihn wieder heraus. 291 00:15:36,860 --> 00:15:40,610 Wenn sie einen Stern in hat das Ende vom Lied, dann werde ich 292 00:15:40,610 --> 00:15:45,710 verarbeiten jedes einzelne Zeichen in der Rest der Antwort des Benutzers 293 00:15:45,710 --> 00:15:51,590 und fügen Sie den in, Auslagern Wort für Wort, wie es sein muss. 294 00:15:51,590 --> 00:15:56,100 >> All dies absolut etwas, das Sie bauen können. 295 00:15:56,100 --> 00:15:59,230 Und in der Tat die Art und Weise, in der wir müssen verarbeitet Befehlszeilenargumente, 296 00:15:59,230 --> 00:16:03,570 die Art, wie Sie über HTTP-Anfragen bearbeitet 297 00:16:03,570 --> 00:16:05,510 befolgen Sie die gleichen Arten von Regeln. 298 00:16:05,510 --> 00:16:08,220 Sie sind Mustererkennung. 299 00:16:08,220 --> 00:16:15,170 >> Also musste ELIZA eine relativ wichtige Auswirkungen auf die natürliche Sprache 300 00:16:15,170 --> 00:16:21,620 denn es machte es scheinen, wie es war sehr erreichbares Ziel, wie irgendwie würden wir 301 00:16:21,620 --> 00:16:25,550 in der Lage, dieses Problem unmittelbar zu lösen. 302 00:16:25,550 --> 00:16:30,670 Nun, das ist nicht zu sagen, dass ELIZA tut alles, was wir tun wollen. 303 00:16:30,670 --> 00:16:33,710 Sicher nicht. 304 00:16:33,710 --> 00:16:35,660 Aber wir sollten in der Lage sein, , etwas mehr zu tun. 305 00:16:35,660 --> 00:16:38,280 306 00:16:38,280 --> 00:16:41,490 >> Unser erster Schritt zu gehen über ELIZA wird 307 00:16:41,490 --> 00:16:44,840 in der Lage sein, zu betrachten nicht Text eingegeben 308 00:16:44,840 --> 00:16:53,750 in die Tastatur, sondern rede, tatsächliche Sprach aufgezeichnet in ein Mikrofon. 309 00:16:53,750 --> 00:16:56,880 So, wie wir diese verschiedenen Stücken, wir sind 310 00:16:56,880 --> 00:17:00,304 zu haben, um eine Reihe von Modellen zu bauen. 311 00:17:00,304 --> 00:17:02,970 Wir werden in der Lage sein, von der Low-Level-akustische gehen 312 00:17:02,970 --> 00:17:07,180 information-- Tonhöhe, Amplitude, frequency-- 313 00:17:07,180 --> 00:17:09,530 und konvertieren, dass in einige Einheiten, die wir sind 314 00:17:09,530 --> 00:17:14,619 in der Lage, leichter zu manipulieren und schließlich manipulieren 315 00:17:14,619 --> 00:17:18,609 zu Wörtern und Sätzen. 316 00:17:18,609 --> 00:17:22,880 >> So sind die meisten Spracherkennungs Systeme, die es gibt heute 317 00:17:22,880 --> 00:17:26,069 folgen eine statistische Modell, in dem wir bauen 318 00:17:26,069 --> 00:17:35,090 drei separate Darstellungen dessen, was dass Audiosignal tatsächlich enthält. 319 00:17:35,090 --> 00:17:38,640 Wir beginnen mit einem Lautmodell dass etwa nur die Basis spricht 320 00:17:38,640 --> 00:17:41,250 Sounds, die ich produziere. 321 00:17:41,250 --> 00:17:46,900 Bin ich etwas, das ist die Herstellung a B wie in Junge oder ein D wie in Hund? 322 00:17:46,900 --> 00:17:53,220 Wie erkenne ich die beiden unterschiedlichen Telefonen als getrennt und verschieden? 323 00:17:53,220 --> 00:17:56,600 >> Hinzu kommt, dass, werden wir dann bauen ein Wort Aussprachemodell, 324 00:17:56,600 --> 00:18:01,350 etwas, das miteinander verbindet diese einzelnen Telefone 325 00:18:01,350 --> 00:18:04,724 und kombiniert sie zu einem Wort. 326 00:18:04,724 --> 00:18:07,890 Und danach werden wir die Worte zu nehmen und wir werden sie mit einer Sprache zu montieren 327 00:18:07,890 --> 00:18:13,010 Modell in ein vollständiger Satz. 328 00:18:13,010 --> 00:18:17,230 >> Nun, wir werden zu jedem sprechen von diesen unabhängig und getrennt. 329 00:18:17,230 --> 00:18:21,580 Aber diese drei Modelle sind alle nur gehen, um Statistiken zu sein. 330 00:18:21,580 --> 00:18:23,502 Und das bedeutet, wenn wir mit ihnen arbeiten, werden wir 331 00:18:23,502 --> 00:18:25,376 in der Lage zu arbeiten sie alle gleichzeitig. 332 00:18:25,376 --> 00:18:28,100 333 00:18:28,100 --> 00:18:28,600 Gut. 334 00:18:28,600 --> 00:18:30,890 Lassen Sie uns mit unserem phonetischen Modells starten. 335 00:18:30,890 --> 00:18:34,470 So phonetische Modelle stützen sich auf eine Rechentechnik 336 00:18:34,470 --> 00:18:37,320 genannte Hidden-Markov-Modellen. 337 00:18:37,320 --> 00:18:43,050 Sind graphische Modelle, in denen I haben und erkennen, ein Zustand der Welt 338 00:18:43,050 --> 00:18:46,500 wie gekennzeichnet durch eine Reihe von Funktionen. 339 00:18:46,500 --> 00:18:51,960 Und dieser Zustand beschreibt ein Teil einer Aktion, die ich in Eingriff. 340 00:18:51,960 --> 00:19:00,190 >> Also, wenn ich darum, denken der Klang "ma" wie die Mutter, 341 00:19:00,190 --> 00:19:03,970 es gibt verschiedene Komponenten in diesem Ton. 342 00:19:03,970 --> 00:19:07,230 Es gibt einen Teil, wo ich ziehen in Atem. 343 00:19:07,230 --> 00:19:09,560 Und dann Geldbeutel Ich meine Lippen. 344 00:19:09,560 --> 00:19:13,710 Und ich rolle meinen Lippen ein wenig zurück Bit auf, dass "ma" Ton. 345 00:19:13,710 --> 00:19:15,340 Und dann gibt es eine Freigabe. 346 00:19:15,340 --> 00:19:17,020 Meine Lippen kommen auseinander. 347 00:19:17,020 --> 00:19:19,030 Luft ausgestoßen. 348 00:19:19,030 --> 00:19:22,650 "Ma". 349 00:19:22,650 --> 00:19:29,250 >> Diese drei verschiedenen Teilen wäre von den Staaten in diesem graph-- vertreten 350 00:19:29,250 --> 00:19:33,420 der Beginn, die Mitte und das Ende. 351 00:19:33,420 --> 00:19:38,060 Und ich möchte, dass Übergänge mir erlaubt, von einem Zustand zu reisen 352 00:19:38,060 --> 00:19:42,260 auf die nächste mit einer gewissen Wahrscheinlichkeit. 353 00:19:42,260 --> 00:19:47,250 So, zum Beispiel, dass M klingen mag eine sehr haben, 354 00:19:47,250 --> 00:19:51,850 sehr kurze Aufnahme am beginning-- "mm" - und dann einen längeren, 355 00:19:51,850 --> 00:19:55,640 Vibrations Phase, wo ich hielt meine die Lippen zusammen und fast humming-- 356 00:19:55,640 --> 00:20:05,090 "mmmm" - und dann eine sehr kurze plosive wo ich zu vertreiben breath-- "ma". 357 00:20:05,090 --> 00:20:09,370 >> Die Hidden-Markov-Modell entworfen, um die Tatsache zu erfassen 358 00:20:09,370 --> 00:20:13,340 dass der Weg, den ich machen dass eine solide "ma" geht 359 00:20:13,340 --> 00:20:17,350 in etwas anders deren Zeitpunkt ist die Frequenz, 360 00:20:17,350 --> 00:20:21,030 und seine Funktionen als die Art, wie Sie es machen 361 00:20:21,030 --> 00:20:23,300 oder die Art und Weise, dass ich vielleicht machen es, wenn ich im Gespräch 362 00:20:23,300 --> 00:20:26,030 über die verschiedenen Verwendungen des Briefes. 363 00:20:26,030 --> 00:20:33,240 "Mutter" und "Darf ich" werden klingt etwas anders. 364 00:20:33,240 --> 00:20:36,800 >> So, um eine zu erkennen insbesondere Ton, würden wir 365 00:20:36,800 --> 00:20:42,020 Markov-Modelle zu bauen, diese Hidden-Markov- Modelle, von jedem möglichen Telefon, dass ich 366 00:20:42,020 --> 00:20:45,840 Vielleicht möchten Sie zu erkennen, jeden möglichen Ton, 367 00:20:45,840 --> 00:20:49,750 und dann bei der Suche akustischen Daten, die ich habe 368 00:20:49,750 --> 00:20:54,430 und festzustellen, statistisch eine davon ist die wahrscheinlichste 369 00:20:54,430 --> 00:20:58,110 um diesen Sound produziert haben. 370 00:20:58,110 --> 00:20:58,610 OK. 371 00:20:58,610 --> 00:21:01,540 372 00:21:01,540 --> 00:21:06,750 Mit diesem Modell haben wir dann starten, um auf es zu bauen. 373 00:21:06,750 --> 00:21:09,330 Wir nehmen ein Aussprachemodell. 374 00:21:09,330 --> 00:21:11,790 Nun, manchmal Aussprache Modelle sind einfach und leicht 375 00:21:11,790 --> 00:21:14,440 denn es gibt nur einen Möglichkeit, etwas auszusprechen. 376 00:21:14,440 --> 00:21:17,990 Andere Zeiten, sie sind ein wenig komplizierter. 377 00:21:17,990 --> 00:21:21,340 Hier ist eine Ausspracheführer für die rote Sache, die ist 378 00:21:21,340 --> 00:21:25,210 eine Frucht, die Sie Ketchup aus zu machen. 379 00:21:25,210 --> 00:21:27,360 Die Leute wissen nicht, dass es eine Frucht ist. 380 00:21:27,360 --> 00:21:27,860 Recht? 381 00:21:27,860 --> 00:21:30,880 382 00:21:30,880 --> 00:21:35,300 >> Nun gibt es viele verschiedene Möglichkeiten, dass die Menschen dieses Wort auszusprechen. 383 00:21:35,300 --> 00:21:37,780 Einige werden sagen, "toe-May-Zehe." 384 00:21:37,780 --> 00:21:40,880 Einige werden sagen, "toe-mah-toe." 385 00:21:40,880 --> 00:21:44,800 Und wir können das mit erfassen eine dieser graphischen Modellen 386 00:21:44,800 --> 00:21:48,305 wo wiederum vertreten wir Übergänge als mit einer bestimmten Wahrscheinlichkeit 387 00:21:48,305 --> 00:21:51,360 und zugehörige Wahrscheinlichkeit mit ihnen. 388 00:21:51,360 --> 00:21:58,290 >> Also in diesem Fall, wenn ich folge der obere Weg durch dieses gesamte Grafik, 389 00:21:58,290 --> 00:22:03,330 Ich würde auf den Brief ab werden ganz links, die "ta" Sound. 390 00:22:03,330 --> 00:22:07,570 Ich würde die obere Hälfte zu nehmen, die "Oh", und dann ein "ma" 391 00:22:07,570 --> 00:22:14,530 und dann wird ein "a", und dann wird ein "TA", und ein "Oh." "Toe-May-Zehe." 392 00:22:14,530 --> 00:22:19,610 Wenn ich nahm den unteren Pfad durch Dazu werde ich bekommen "ta-mah-toe." 393 00:22:19,610 --> 00:22:26,810 Und wenn ich ging hinunter und dann up, ich bekommen würde "ta-May-Zehe." 394 00:22:26,810 --> 00:22:29,950 >> Diese Modelle erfassen diese Unterschiede, weil, wenn 395 00:22:29,950 --> 00:22:32,410 wir eins von diesen bereitstellen Erkennungssysteme, 396 00:22:32,410 --> 00:22:35,340 es wird mit arbeiten müssen viele verschiedene Arten von Menschen, 397 00:22:35,340 --> 00:22:39,295 viele verschiedene Akzente und sogar verschiedenen Verwendungen von den gleichen Worten. 398 00:22:39,295 --> 00:22:42,204 399 00:22:42,204 --> 00:22:44,120 Schließlich oben auf, dass, wir etwas aufbauen 400 00:22:44,120 --> 00:22:48,780 das sieht wirklich kompliziert, nannte das Sprachmodell, 401 00:22:48,780 --> 00:22:52,950 aber in der Tat ist die einfachste drei, da diese zu betreiben 402 00:22:52,950 --> 00:22:56,041 was sind n-Gramm-Modelle genannt. 403 00:22:56,041 --> 00:23:02,270 Und in diesem Fall, ich zeige Ihnen eine zweiteilige n-Gramm-Modell, ein Bigramm. 404 00:23:02,270 --> 00:23:08,910 Wir werden physikalische den Gedanken zu machen dass manchmal sind bestimmte Worte 405 00:23:08,910 --> 00:23:14,680 eher ein Follow- gegebene Wort als andere. 406 00:23:14,680 --> 00:23:25,210 Wenn ich sagte nur "Wettervorhersage" das nächste Wort könnte "heute" wahrscheinlich 407 00:23:25,210 --> 00:23:31,510 oder "das Wetter sein könnte Vorhersage morgen. " 408 00:23:31,510 --> 00:23:38,870 Aber es ist unwahrscheinlich, dass "sein, die Wettervorhersage Artischocke. " 409 00:23:38,870 --> 00:23:42,980 >> Was für ein Sprachmodell tut, ist, es erfasst denen statistisch 410 00:23:42,980 --> 00:23:47,450 durch Zählen, von einigen sehr großen Korpus alle Instanzen 411 00:23:47,450 --> 00:23:50,890 in dem ein Wort anderen folgt. 412 00:23:50,890 --> 00:23:54,300 Also, wenn ich eine große corpus-- nehmen wie jedes Wall Street Journal 413 00:23:54,300 --> 00:24:00,750 das hat seit 1930 produziert worden, Das ist einer der Standard corpuses-- 414 00:24:00,750 --> 00:24:03,910 und ich über alle sehen dass der Text, und ich zähle 415 00:24:03,910 --> 00:24:09,770 up wie oft nach "Vorhersagen", sehe ich "heute" 416 00:24:09,770 --> 00:24:17,454 und wie oft muss ich sehen "Vorhersagen", gefolgt von "Artischocke" 417 00:24:17,454 --> 00:24:19,370 die erste wird zu viel eher. 418 00:24:19,370 --> 00:24:21,540 Es wird angezeigt weitaus häufiger. 419 00:24:21,540 --> 00:24:24,610 Und so wird es eine höhere haben Wahrscheinlichkeit zugeordnet. 420 00:24:24,610 --> 00:24:27,340 >> Wenn ich will, um herauszufinden, die Wahrscheinlichkeit eines gesamte Äußerung, 421 00:24:27,340 --> 00:24:29,940 dann, ich brechen sie auf. 422 00:24:29,940 --> 00:24:35,990 So dass die Wahrscheinlichkeit des Hörens der Satz "die Ratte aß Käse" 423 00:24:35,990 --> 00:24:39,110 ist die Wahrscheinlichkeit der Wort ", die" Gründung eines Satzes, 424 00:24:39,110 --> 00:24:42,540 und dann wird die Wahrscheinlichkeit, dass das Wort "Ratte" folgt das Wort "das" 425 00:24:42,540 --> 00:24:44,910 und die Wahrscheinlichkeit, dass das Wort "gegessen" folgt "Ratte" 426 00:24:44,910 --> 00:24:51,120 und die Wahrscheinlichkeit, dass "Käse" folgt "gegessen." 427 00:24:51,120 --> 00:24:55,160 >> Das klingt wie eine Menge Statistiken, eine Menge von Wahrscheinlichkeiten. 428 00:24:55,160 --> 00:24:57,510 Und das ist alles, was es ist. 429 00:24:57,510 --> 00:25:02,920 Aber das Erstaunliche ist, wenn Sie dies tun mit einer ausreichend großen Probe von Daten, 430 00:25:02,920 --> 00:25:03,670 es funktioniert. 431 00:25:03,670 --> 00:25:05,250 Und es funktioniert unglaublich gut. 432 00:25:05,250 --> 00:25:07,810 433 00:25:07,810 --> 00:25:11,420 Wir alle wissen, diese Technologien. 434 00:25:11,420 --> 00:25:16,500 Die meisten Betriebssysteme verfügen über Spracherkennung an dieser Stelle. 435 00:25:16,500 --> 00:25:20,940 Wir verwenden Siri und Cortana und Echo. 436 00:25:20,940 --> 00:25:25,070 Und diese Dinge sind, auf der Grundlage Diese Art der dreischichtigen model-- 437 00:25:25,070 --> 00:25:30,620 eine phonetische Modell am Boden, ein Aussprache-Modell in der Mitte, 438 00:25:30,620 --> 00:25:33,690 und eine Sprachmodell auf ihnen. 439 00:25:33,690 --> 00:25:37,630 >> Nun, ein wenig mehr zu tun, müssen sie als dass, um Fragen zu beantworten. 440 00:25:37,630 --> 00:25:43,000 Aber die Anerkennung dessen, was du bist Spruch hängt genau darauf. 441 00:25:43,000 --> 00:25:45,700 Werfen wir also ein Beispiel hier. 442 00:25:45,700 --> 00:25:52,020 So habe ich mein Handy sitzen hier unter der Dokumentenkamera. 443 00:25:52,020 --> 00:25:56,110 Und wir werden ersucht Siri ein paar Fragen. 444 00:25:56,110 --> 00:25:57,150 Gut? 445 00:25:57,150 --> 00:25:59,940 >> Lassen Sie uns also aufwachen mein Handy hier. 446 00:25:59,940 --> 00:26:02,710 447 00:26:02,710 --> 00:26:05,000 Siri, was ist das Wetter wie in New Haven heute? 448 00:26:05,000 --> 00:26:07,670 449 00:26:07,670 --> 00:26:10,780 >> SIRI: Hier ist das Wetter für New Haven, Connecticut heute. 450 00:26:10,780 --> 00:26:11,890 >> BRIAN Scassellati: OK. 451 00:26:11,890 --> 00:26:16,720 Also zuerst Sie sah, dass Siri erkannt jede der einzelnen Wörter 452 00:26:16,720 --> 00:26:19,050 und dann erzeugt eine Antwort. 453 00:26:19,050 --> 00:26:22,277 Wir werden, wie diese Antwort sprechen kommt in ein wenig. 454 00:26:22,277 --> 00:26:24,110 Aber jetzt, da wir wissen, dass dies nur auf der Basis 455 00:26:24,110 --> 00:26:28,880 auf den rohen Statistiken und dies Pattern-Matching Art von Ansatz, 456 00:26:28,880 --> 00:26:31,120 wir können einige Spiele mit Siri zu spielen. 457 00:26:31,120 --> 00:26:34,560 >> So kann ich noch einmal zu versuchen. 458 00:26:34,560 --> 00:26:38,864 Siri, was ist das Wetter Nilpferd New Haven, heute? 459 00:26:38,864 --> 00:26:39,810 >> SIRI: OK. 460 00:26:39,810 --> 00:26:44,245 Hier ist das Wetter für New Haven, Connecticut für heute. 461 00:26:44,245 --> 00:26:46,120 BRIAN Scassellati: Siris nicht, dass eingeschüchtert 462 00:26:46,120 --> 00:26:50,980 weil es die pattern-- gefunden "wetter", "heute", "New Haven". 463 00:26:50,980 --> 00:26:54,420 Das ist, was es reagiert zu, genau wie ELIZA. 464 00:26:54,420 --> 00:26:54,920 Gut. 465 00:26:54,920 --> 00:26:59,390 Geben wir es noch einmal lächerlicher Beispiel. 466 00:26:59,390 --> 00:27:03,075 Siri, Wetter Artischocke Gürteltier Nilpferd New Haven? 467 00:27:03,075 --> 00:27:06,806 468 00:27:06,806 --> 00:27:08,400 >> SIRI: Lassen Sie mich auf, dass zu prüfen. 469 00:27:08,400 --> 00:27:11,280 Hier ist, was ich im Netz gefunden für was sind Artischocken Gürteltier 470 00:27:11,280 --> 00:27:13,780 Nilpferd New Haven. 471 00:27:13,780 --> 00:27:14,760 >> BRIAN Scassellati: OK. 472 00:27:14,760 --> 00:27:20,400 Also, wenn ich weit genug weg von diesem Modell, 473 00:27:20,400 --> 00:27:24,365 Ich bin in der Lage, weil es nicht zu verwechseln das Muster, das es mehr übereinstimmt. 474 00:27:24,365 --> 00:27:27,370 475 00:27:27,370 --> 00:27:29,390 Und das statistische Motor, der sagt, 476 00:27:29,390 --> 00:27:32,850 was ist die Wahrscheinlichkeit, dass Sie haben die Worte Nilpferd und Artischocken 477 00:27:32,850 --> 00:27:34,440 zusammen und Gürteltier? 478 00:27:34,440 --> 00:27:36,050 Das muss etwas Neues sein. 479 00:27:36,050 --> 00:27:38,840 480 00:27:38,840 --> 00:27:40,610 >> Also diese Technologien nutzen wir jeden Tag. 481 00:27:40,610 --> 00:27:43,670 482 00:27:43,670 --> 00:27:47,800 Wenn wir sie einen Schritt machen wollen Weiterhin kann, obwohl, wenn wir tatsächlich 483 00:27:47,800 --> 00:27:53,930 wollen in der Lage, über das, was sie sprechen ist, dass diese Systeme reagieren auf, 484 00:27:53,930 --> 00:28:00,630 Wir müssen reden, wieder über eine grund Reihe von Fragen. 485 00:28:00,630 --> 00:28:05,370 Und das ist ein Thema in der Kommunikation dass wir als Frage-Antwort. 486 00:28:05,370 --> 00:28:07,028 Das heißt, dass wir in der Lage zu-- ja sein? 487 00:28:07,028 --> 00:28:07,944 ZIELGRUPPE: [unverständlich]. 488 00:28:07,944 --> 00:28:10,789 489 00:28:10,789 --> 00:28:13,330 BRIAN Scassellati: Bekommen wir in latente semantische Verarbeitung? 490 00:28:13,330 --> 00:28:14,070 Also ja. 491 00:28:14,070 --> 00:28:17,820 Es gibt eine Menge Dinge, die sind geschieht unter der Oberfläche mit Siri 492 00:28:17,820 --> 00:28:20,210 und in einigen der Beispiele Ich werde Ihnen zeigen, nächste 493 00:28:20,210 --> 00:28:22,610 wo gibt es ein ganzes Stück in Bezug auf die Struktur 494 00:28:22,610 --> 00:28:25,260 von dem, was Sie sagen, das ist wichtig. 495 00:28:25,260 --> 00:28:31,890 Und in der Tat, das ist ein großes Vorläufer für die nächste Folie für mich. 496 00:28:31,890 --> 00:28:35,110 >> So in der gleichen Weise, dass unsere Spracherkennungs aufgebaut wurde 497 00:28:35,110 --> 00:28:39,620 aus mehreren Schichten, wenn wir wollen verstehen, was es ist, dass ist eigentlich 498 00:28:39,620 --> 00:28:44,620 Davon abgesehen, sind wir wieder in Gang zu stützen sich auf eine mehrschichtige Analyse 499 00:28:44,620 --> 00:28:47,020 der Text, der erkannt hat. 500 00:28:47,020 --> 00:28:52,560 Also, wenn Siri ist eigentlich in der Lage, sagen wir, schauen Ich fand diese Worte. 501 00:28:52,560 --> 00:28:55,230 Nun, was soll ich tun mit ihnen? 502 00:28:55,230 --> 00:28:59,110 Die erste Komponente ist oft gehen Sie durch und versuchen zu analysieren, 503 00:28:59,110 --> 00:29:03,010 die Struktur des Satzes. 504 00:29:03,010 --> 00:29:05,410 Und in dem, was wir gesehen haben, in der Grundschule, die oft, 505 00:29:05,410 --> 00:29:08,920 als eine Art Diagramm- Sätze, wir gehen 506 00:29:08,920 --> 00:29:12,774 dass bestimmte, zu erkennen, Worte haben bestimmte Rollen. 507 00:29:12,774 --> 00:29:13,440 Dies sind Substantive. 508 00:29:13,440 --> 00:29:14,231 Dies sind Pronomen. 509 00:29:14,231 --> 00:29:16,200 Dies sind Verben. 510 00:29:16,200 --> 00:29:19,460 Und wir erkennen, dass für ein bestimmtes Grammatik, 511 00:29:19,460 --> 00:29:24,700 in diesem Fall der englischen Grammatik gibt es gültig Möglichkeiten, in denen ich sie kombinieren 512 00:29:24,700 --> 00:29:26,280 und andere Wege, die nicht gültig sind. 513 00:29:26,280 --> 00:29:29,920 514 00:29:29,920 --> 00:29:33,870 >> Dass die Anerkennung, dass Struktur, könnte ausreichen, um zu helfen, uns zu sein 515 00:29:33,870 --> 00:29:36,720 ein bisschen. 516 00:29:36,720 --> 00:29:39,820 Aber es ist nicht genug Für uns in der Lage zu geben, zu sein 517 00:29:39,820 --> 00:29:43,290 einen Sinn zu dem, was hier gesagt wird. 518 00:29:43,290 --> 00:29:46,615 Um dies zu erreichen, müssen wir vertrauen eine gewisse Menge von semantischen Verarbeitung. 519 00:29:46,615 --> 00:29:49,590 520 00:29:49,590 --> 00:29:55,080 Das heißt, wir werden schauen zu müssen bei unter, was jedes dieser Wörter 521 00:29:55,080 --> 00:29:57,400 tatsächlich ausübt als eine Bedeutung hat. 522 00:29:57,400 --> 00:30:01,150 Und auf die einfachste Weise, dies zu tun, wir werden mit jedem Wort zu assoziieren 523 00:30:01,150 --> 00:30:06,930 da wir wissen, eine bestimmte Funktion, eine gewisse Transformation, dass es 524 00:30:06,930 --> 00:30:09,300 können passieren. 525 00:30:09,300 --> 00:30:14,470 >> In diesem Fall könnte man die kenn Wort "John" als ein Eigenname, 526 00:30:14,470 --> 00:30:18,160 sie birgt es eine Identität. 527 00:30:18,160 --> 00:30:21,530 Und wir könnten beschriften "Mary", wie dieselbe Weise. 528 00:30:21,530 --> 00:30:27,900 Während ein Verb wie "Liebe", dass stellt eine besondere Beziehung 529 00:30:27,900 --> 00:30:31,582 dass wir in der Lage, zu vertreten. 530 00:30:31,582 --> 00:30:33,290 Nun, das bedeutet nicht, dass wir verstehen, 531 00:30:33,290 --> 00:30:37,680 was Liebe ist, sondern nur, dass wir verstehen, es in der Art eines Symbolsystems. 532 00:30:37,680 --> 00:30:40,480 Das heißt, wir Etikett Sie und manipulieren. 533 00:30:40,480 --> 00:30:44,230 534 00:30:44,230 --> 00:30:49,120 >> Mit jedem dieser Typen von Ansätzen jede Art von semantische Verarbeitung 535 00:30:49,120 --> 00:30:57,060 Hier wird sich ein wenig erforderlich wenig Wissen und viel Arbeit 536 00:30:57,060 --> 00:30:59,020 von unserer Seite. 537 00:30:59,020 --> 00:31:03,590 Wir sind nicht mehr in das Reich wo einfach nur Statistiken 538 00:31:03,590 --> 00:31:07,320 gehen, um genug für uns sein. 539 00:31:07,320 --> 00:31:11,330 Nun, um zu gehen, von diesem Punkt zu sein 540 00:31:11,330 --> 00:31:15,520 in der Lage, über das Innere sprechen was hier wirklich passiert, 541 00:31:15,520 --> 00:31:19,640 zu der Möglichkeit, diese zu manipulieren strukturieren und zu verstehen, eine Frage 542 00:31:19,640 --> 00:31:23,160 und dann in der Lage zu gehen und suchen, 543 00:31:23,160 --> 00:31:27,290 dass eine weitere benötigt komplexe kognitive Modell. 544 00:31:27,290 --> 00:31:34,880 >> Die Art, in der diese Systeme integriert sind ist in den meisten Fällen sehr, sehr arbeits 545 00:31:34,880 --> 00:31:36,350 intensiv. 546 00:31:36,350 --> 00:31:39,490 Sie beinhalten Menschen verbringen viel 547 00:31:39,490 --> 00:31:44,100 Zeit Strukturierung der Möglichkeiten die diese Art von Sätzen 548 00:31:44,100 --> 00:31:47,270 kann in einigen Logik vertreten sein. 549 00:31:47,270 --> 00:31:51,639 550 00:31:51,639 --> 00:31:53,430 Es wird noch ein wenig komplexer, though. 551 00:31:53,430 --> 00:31:56,400 552 00:31:56,400 --> 00:31:59,660 >> Selbst wenn wir behandelt haben mit Semantik, werden wir 553 00:31:59,660 --> 00:32:03,860 immer noch auf der Suche Pragmatik, was gesagt wird. 554 00:32:03,860 --> 00:32:08,620 Das heißt, wie kann ich beziehen sich die Worte dass ich etwas physisch heraus 555 00:32:08,620 --> 00:32:12,054 dort in der Welt oder zumin dest einige Informationsquelle 556 00:32:12,054 --> 00:32:12,970 dass ich zu manipulieren? 557 00:32:12,970 --> 00:32:15,780 558 00:32:15,780 --> 00:32:20,790 >> Manchmal führen diese zu wunderbare Bits der Mehrdeutigkeit. 559 00:32:20,790 --> 00:32:24,470 "Red-Hot Stern, um Astronomen heiraten." 560 00:32:24,470 --> 00:32:25,630 OK. 561 00:32:25,630 --> 00:32:28,540 Jetzt lesen wir, dass die lustige Art von headline 562 00:32:28,540 --> 00:32:34,690 dass wir am späten Abend TV zu sehen weil wir nicht interpretieren "Stern" 563 00:32:34,690 --> 00:32:38,630 seiner Himmelskörper Bedeutung haben. 564 00:32:38,630 --> 00:32:43,390 Wir wissen, daß es die weitere Mittel Gemein Schauspieler oder Schauspielerin 565 00:32:43,390 --> 00:32:45,240 mit hohen Mengen an Sichtbarkeit. 566 00:32:45,240 --> 00:32:47,770 567 00:32:47,770 --> 00:32:51,950 >> "Squad hilft Hundebiss Opfer." 568 00:32:51,950 --> 00:32:55,550 Ist es, dass der Kader ist eigentlich da draußen helfen, einen Hund 569 00:32:55,550 --> 00:32:59,620 in gehen um und beißt die Opfer? 570 00:32:59,620 --> 00:33:02,380 Oder ist es, dass es eine Person, die war 571 00:33:02,380 --> 00:33:04,625 von einem Hund, der etwas Hilfe brauchte gebissen? 572 00:33:04,625 --> 00:33:07,650 573 00:33:07,650 --> 00:33:11,480 Nur vom Blick auf die Syntax, und die Semantik der Sätze, 574 00:33:11,480 --> 00:33:14,660 können wir nicht feststellen, dass. 575 00:33:14,660 --> 00:33:22,000 >> "Hubschrauber angetrieben durch menschliche Fliegen." 576 00:33:22,000 --> 00:33:27,330 Gibt es in der Tat tatsächlich Kleinigkeiten herumfliegen, 577 00:33:27,330 --> 00:33:34,510 sind Menschen mit Flügeln Versorgung Hubschrauber für das Wohl der Menschheit? 578 00:33:34,510 --> 00:33:38,960 Oder gibt es eine mechanische Vorrichtung dass schöpft ihre Kraft von einer Person? 579 00:33:38,960 --> 00:33:41,600 580 00:33:41,600 --> 00:33:46,500 >> Wenn wir auf Frage Antwort-Systemen, 581 00:33:46,500 --> 00:33:51,110 das sind die Schichten, wir brauchen, zu beschäftigen. 582 00:33:51,110 --> 00:33:54,890 Nun, die beste und Sortier der vorherrschenden dieser Systeme 583 00:33:54,890 --> 00:34:00,640 Heute sind in der Lage zu tun, Dinge, auf einem Niveau, sind 584 00:34:00,640 --> 00:34:05,050 weit darüber hinaus, was wir hatten vor 10 Jahren. 585 00:34:05,050 --> 00:34:08,210 Hier ist eines der besten Systeme das ist, gibt heute. 586 00:34:08,210 --> 00:34:10,519 Und dies ist ein System von IBM namens Watson. 587 00:34:10,519 --> 00:34:13,040 588 00:34:13,040 --> 00:34:15,500 Dies ist von unseren Freunden bei IBM. 589 00:34:15,500 --> 00:34:19,810 Dies ist Katherine Banken, Jia Chen, und Priscilla Moraes geben uns 590 00:34:19,810 --> 00:34:26,323 eine Demonstration der Watson gestern in IBM Yorktown. 591 00:34:26,323 --> 00:34:26,989 [VIDEO-WIEDERGABE] 592 00:34:26,989 --> 00:34:27,690 -Wie geht es dir? 593 00:34:27,690 --> 00:34:30,600 594 00:34:30,600 --> 00:34:31,980 >> -Mir geht es gut. 595 00:34:31,980 --> 00:34:35,429 Ich bin immer glücklich, wenn ich denken, vor allem, wenn ich 596 00:34:35,429 --> 00:34:38,920 kann cool in dieser Serverräume bleiben. 597 00:34:38,920 --> 00:34:40,170 -Wer Ist Ihre Lieblings-Schauspielerin? 598 00:34:40,170 --> 00:34:43,870 599 00:34:43,870 --> 00:34:47,555 >> -Mein Lieblingsschauspielerin Angelina Jolie als Lara Croft 600 00:34:47,555 --> 00:34:54,800 in Tomb Raider, weil ihr ursprünglicher Form war als virtueller Charakter wie ich. 601 00:34:54,800 --> 00:34:56,760 >> -Wie Kann Watson Patienten helfen? 602 00:34:56,760 --> 00:34:59,700 603 00:34:59,700 --> 00:35:03,755 >> -Ist Der Plan für die Patienten, Zugang zu Watson direkt? 604 00:35:03,755 --> 00:35:08,050 Zugang zu Watson Beratungs Anwendungen werden von Anwendungsfall variieren. 605 00:35:08,050 --> 00:35:12,630 Aber derzeit wird Watson nur liefern mögliche Diagnose und Behandlung 606 00:35:12,630 --> 00:35:14,725 Optionen zum Arzt. 607 00:35:14,725 --> 00:35:17,680 Gegebenenfalls Patienten kann Informationen liefern 608 00:35:17,680 --> 00:35:21,210 Watson, vielleicht durch eine Portal Web-Interface, einer Tablette, 609 00:35:21,210 --> 00:35:23,500 oder sogar ein Handy. 610 00:35:23,500 --> 00:35:27,180 Zum Beispiel kann ein Patient sein aufgefordert, ihre Symptome zu beschreiben 611 00:35:27,180 --> 00:35:30,460 in natürlicher Sprache direkt in eine Watson-Lösung, 612 00:35:30,460 --> 00:35:34,050 ermöglicht es dem Arzt, den Schwerpunkt auf die Diagnose und nicht die Datenerfassung. 613 00:35:34,050 --> 00:35:38,379 614 00:35:38,379 --> 00:35:42,716 >> -Wer Abraham Lincoln ermordet? 615 00:35:42,716 --> 00:35:46,153 >> -John Wilkes Booth. 616 00:35:46,153 --> 00:35:52,373 >> -In Welchem ​​Jahr die Arizona Diamondbacks gewinnen die World Series? 617 00:35:52,373 --> 00:35:55,295 >> -2001. 618 00:35:55,295 --> 00:35:58,710 >> [END PLAYBACK] 619 00:35:58,710 --> 00:36:01,610 >> BRIAN Scassellati: So Diese Arten von Systemen 620 00:36:01,610 --> 00:36:07,430 müssen auf zunächst verlassen Erkennen der Sprache; zweite, 621 00:36:07,430 --> 00:36:12,200 Umwandlung in einen sinnvollen internen Darstellung; und dann, dritten 622 00:36:12,200 --> 00:36:17,090 in der Lage zu gehen und finden die Informationsquelle, 623 00:36:17,090 --> 00:36:21,140 ermöglicht es ihnen, diese Frage zu beantworten. 624 00:36:21,140 --> 00:36:27,320 Diese Komplexität beinhaltet die gleichen Arten von program Dinge 625 00:36:27,320 --> 00:36:31,790 dass Sie gewesen sein tut in Problem-Sets. 626 00:36:31,790 --> 00:36:38,000 >> Wir sind in der Lage, HTTP-Anforderungen in parsen die gleiche Art von Low-Level-Muster 627 00:36:38,000 --> 00:36:40,810 Matching, die ELIZA tun können. 628 00:36:40,810 --> 00:36:45,070 Wir sind in der Lage, diejenigen zu konvertieren in eine interne Darstellung, 629 00:36:45,070 --> 00:36:50,360 und dann nutzen sie, um einige abfragen externen Datenbank, gegebenenfalls unter Verwendung von SQL. 630 00:36:50,360 --> 00:36:53,530 631 00:36:53,530 --> 00:36:56,260 Alle Systeme, werden heute gebaut 632 00:36:56,260 --> 00:37:00,520 um diese Art von natürlichen zu tun Sprachkommunikation 633 00:37:00,520 --> 00:37:04,100 werden ausgebaut diese gleichen Prinzipien. 634 00:37:04,100 --> 00:37:09,530 >> Nun, auch ein System wie Watson ist nicht komplex genug, 635 00:37:09,530 --> 00:37:14,820 zu beantworten willkürlich Fragen zu jedem Thema. 636 00:37:14,820 --> 00:37:20,060 Und in der Tat, müssen sie sein in einer bestimmten Domäne strukturiert. 637 00:37:20,060 --> 00:37:24,440 So können Sie online gehen und finden Sie Versionen von Watson, die gut arbeiten 638 00:37:24,440 --> 00:37:27,700 in der medizinischen Informatik. 639 00:37:27,700 --> 00:37:31,490 Oder es gibt einen Online- dass nur befasst sich mit, wie 640 00:37:31,490 --> 00:37:34,540 gute Empfehlungen zu machen was Bier mit dem Essen gehen. 641 00:37:34,540 --> 00:37:37,060 642 00:37:37,060 --> 00:37:41,870 Und innerhalb dieser Domänen, kann Fragen beantworten, 643 00:37:41,870 --> 00:37:46,130 finden Sie die Informationen, die er braucht. 644 00:37:46,130 --> 00:37:48,270 >> Aber man kann nicht zu mischen und Spiel ihnen. 645 00:37:48,270 --> 00:37:53,150 Das System, das geschult ist mit der Datenbank von Essen und Bier 646 00:37:53,150 --> 00:37:56,830 funktioniert nicht gut, wenn Sie plötzlich legen Sie sie in der medizinischen Informatik 647 00:37:56,830 --> 00:37:59,770 Datenbank. 648 00:37:59,770 --> 00:38:05,680 Also selbst unsere besten Systeme heute verlassen sich auf einem Niveau von Verarbeitungs 649 00:38:05,680 --> 00:38:11,570 in dem wir Hand-Codierung und Aufbau der Infrastruktur, um 650 00:38:11,570 --> 00:38:13,275 dieses System zum Laufen zu bringen. 651 00:38:13,275 --> 00:38:16,360 652 00:38:16,360 --> 00:38:20,710 >> Nun, das letzte Thema, das ich will in der Lage sein, um heute zu bekommen 653 00:38:20,710 --> 00:38:23,960 ist etwa nonverbale Kommunikation. 654 00:38:23,960 --> 00:38:29,290 Eine große Masse von Informationen, wir miteinander kommunizieren, 655 00:38:29,290 --> 00:38:35,490 nicht etwa durch die gekommen einzelne Wörter, die wir die Anwendung. 656 00:38:35,490 --> 00:38:40,290 Es geht um Dinge wie Nähe, Blick, Ihre Stimme, 657 00:38:40,290 --> 00:38:42,270 Ihre Einbiegung. 658 00:38:42,270 --> 00:38:46,620 Und dass eine Kommunikation auch etwas, das viele verschiedene Schnittstellen 659 00:38:46,620 --> 00:38:49,960 Pflege viel über. 660 00:38:49,960 --> 00:38:51,500 Es ist nicht das, was Siri kümmert. 661 00:38:51,500 --> 00:38:56,250 Ich kann Siri etwas in einer Stimme fragen oder in einem anderen Tonfall, 662 00:38:56,250 --> 00:38:59,840 und Siris zu gehen geben Sie mir die gleiche Antwort. 663 00:38:59,840 --> 00:39:05,260 Aber das ist nicht das, was wir zu bauen für viele andere Arten von Schnittstellen. 664 00:39:05,260 --> 00:39:09,120 >> Ich möchte Ihnen vorstellen nun auf einen der Roboter. 665 00:39:09,120 --> 00:39:12,720 Dies wurde von meinem langjährigen gebaut Freund und Kollege Cynthia 666 00:39:12,720 --> 00:39:16,010 Breazeal und ihre Firma Jibo. 667 00:39:16,010 --> 00:39:20,090 Und dies robot-- wir gehen um ein paar Freiwillige haben 668 00:39:20,090 --> 00:39:22,520 kommen, um mit diesem zu interagieren. 669 00:39:22,520 --> 00:39:26,200 So kann ich zwei Menschen, die bereit um mit dem Roboter für mich zu spielen? 670 00:39:26,200 --> 00:39:29,936 Warum gehst du nicht zu kommen, und warum gehst du nicht auf kommen. 671 00:39:29,936 --> 00:39:31,310 Wenn Sie möchten mich hier verbinden sich, bitte. 672 00:39:31,310 --> 00:39:36,520 673 00:39:36,520 --> 00:39:39,670 >> Und wenn ich Sie kommen direkt hier. 674 00:39:39,670 --> 00:39:40,170 Vielen Dank. 675 00:39:40,170 --> 00:39:40,480 Hallo. 676 00:39:40,480 --> 00:39:41,400 >> ALFREDO: Nice to meet you. 677 00:39:41,400 --> 00:39:42,010 Alfredo. 678 00:39:42,010 --> 00:39:42,520 >> BRIAN Scassellati: Alfredo. 679 00:39:42,520 --> 00:39:43,146 >> RACHEL: Rachel. 680 00:39:43,146 --> 00:39:44,228 BRIAN Scassellati: Rachel. 681 00:39:44,228 --> 00:39:45,154 Schön, dass Sie beide zu erfüllen. 682 00:39:45,154 --> 00:39:46,820 Alfredo, ich werde müssen Sie zuerst gehen. 683 00:39:46,820 --> 00:39:47,990 Kommen Sie hier. 684 00:39:47,990 --> 00:39:51,870 Ich werde einzuführen Sie-- ob ich das aussteigen 685 00:39:51,870 --> 00:39:58,450 ohne an die microphone-- zu einem kleinen Roboter namens Jibo. 686 00:39:58,450 --> 00:40:00,140 OK? 687 00:40:00,140 --> 00:40:04,260 >> Nun Jibo wird interaktiv angelegt. 688 00:40:04,260 --> 00:40:09,339 Und obwohl es kann Ihnen Rede zu halten, viel von der Wechselwirkung mit dem Roboter 689 00:40:09,339 --> 00:40:09,880 ist nonverbal. 690 00:40:09,880 --> 00:40:12,450 691 00:40:12,450 --> 00:40:17,070 Alfredo, werde ich Sie bitten, sagen, etwas nettes und kostenlose 692 00:40:17,070 --> 00:40:19,554 an den Roboter, bitte. 693 00:40:19,554 --> 00:40:20,845 ALFREDO: Ich glaube, Sie sehen niedlich. 694 00:40:20,845 --> 00:40:24,114 695 00:40:24,114 --> 00:40:25,611 >> [Surren] 696 00:40:25,611 --> 00:40:26,192 697 00:40:26,192 --> 00:40:27,108 BRIAN Scassellati: OK. 698 00:40:27,108 --> 00:40:30,110 699 00:40:30,110 --> 00:40:33,180 Seine Antwort ist nicht verbal. 700 00:40:33,180 --> 00:40:35,180 Und doch ist es ihr habt sowohl ein klares Bekenntnis 701 00:40:35,180 --> 00:40:39,680 dass er gehört hatte, was Sie gesagt haben und auch irgendwie verstehen, dass. 702 00:40:39,680 --> 00:40:40,530 OK? 703 00:40:40,530 --> 00:40:42,070 Schritt zurück mit rechts hier für eine Sekunde. 704 00:40:42,070 --> 00:40:43,130 Danke. 705 00:40:43,130 --> 00:40:44,090 >> Rachel, wenn Sie möchten. 706 00:40:44,090 --> 00:40:46,070 Nun, ich werde geben, Sie das viel schwieriger Job. 707 00:40:46,070 --> 00:40:48,361 Wenn Sie gleich hier stehen würde, Sichern nur ein bisschen so 708 00:40:48,361 --> 00:40:50,280 können wir Sie mit der Kamera bekommen und suchen Sie auf diese Weise. 709 00:40:50,280 --> 00:40:56,840 Ich werde Sie bitten, etwas zu sagen wirklich bedeuten und böse an den Roboter. 710 00:40:56,840 --> 00:41:02,900 >> Rachel: Was Sie gerade schien, zu tun, war völlig absurd. 711 00:41:02,900 --> 00:41:03,840 >> [Brummton] 712 00:41:03,840 --> 00:41:07,610 713 00:41:07,610 --> 00:41:09,030 >> Das war noch absurder. 714 00:41:09,030 --> 00:41:10,120 Was ist los mit dir? 715 00:41:10,120 --> 00:41:13,487 716 00:41:13,487 --> 00:41:16,207 Aw, fühlen sich nicht schlecht. 717 00:41:16,207 --> 00:41:17,040 Ich gebe Ihnen eine Umarmung. 718 00:41:17,040 --> 00:41:19,882 719 00:41:19,882 --> 00:41:21,090 BRIAN Scassellati: Alles klar. 720 00:41:21,090 --> 00:41:22,280 Vielen Dank, Rachel. 721 00:41:22,280 --> 00:41:24,565 Alfredo, Rachel, Danke Jungs sehr viel. 722 00:41:24,565 --> 00:41:26,840 >> [BEIFALL] 723 00:41:26,840 --> 00:41:28,660 724 00:41:28,660 --> 00:41:34,470 >> So dass diese Art der Interaktion hat bei viele Möglichkeiten, einige der gleichen Regeln 725 00:41:34,470 --> 00:41:36,950 und einige der gleichen Struktur, wie das, was wir 726 00:41:36,950 --> 00:41:39,950 vielleicht in der sprachlichen Interaktion haben. 727 00:41:39,950 --> 00:41:44,530 Es ist sowohl kommunikativ und dient einem wichtigen Zweck. 728 00:41:44,530 --> 00:41:48,590 Und die Wechselwirkung, vielerlei Hinsicht ist entworfen 729 00:41:48,590 --> 00:41:52,890 um eine bestimmte Wirkung auf die haben Person, die Interaktion mit oder Hören 730 00:41:52,890 --> 00:41:54,410 an den Roboter. 731 00:41:54,410 --> 00:41:56,450 >> Nun, ich bin das Glück, um Jibo hier heute haben. 732 00:41:56,450 --> 00:42:00,550 Sam Spaulding ist hier helfen uns mit dem Roboter. 733 00:42:00,550 --> 00:42:07,470 Und ich werde Sam fragen zu geben uns eine schöne Demo von Jibo Tanz 734 00:42:07,470 --> 00:42:09,720 dass wir hier am Ende sehen. 735 00:42:09,720 --> 00:42:10,590 Also zögern Sie nicht, Jibo. 736 00:42:10,590 --> 00:42:11,550 >> SAM: OK, Jibo. 737 00:42:11,550 --> 00:42:14,430 Zeigen Sie uns Ihre Tanzschritte. 738 00:42:14,430 --> 00:42:17,310 >> [Musikwiedergabe] 739 00:42:17,310 --> 00:42:43,114 740 00:42:43,114 --> 00:42:44,780 BRIAN Scassellati: Okay, alle. 741 00:42:44,780 --> 00:42:46,865 Dank unseren Freunden bei Jibo. 742 00:42:46,865 --> 00:42:49,426 >> [BEIFALL] 743 00:42:49,426 --> 00:42:50,140 744 00:42:50,140 --> 00:42:54,990 >> Und dank unserer Freunde bei IBM für die Unterstützung aus heute. 745 00:42:54,990 --> 00:42:57,300 Kommunikation ist etwas, dass du gehst 746 00:42:57,300 --> 00:43:02,280 um zu sehen, kommen mehr und mehr als wir bauen komplexere Schnittstellen. 747 00:43:02,280 --> 00:43:05,760 Nächste Woche werden wir im Gespräch darüber, wie Sie eine Schnittstelle 748 00:43:05,760 --> 00:43:08,890 mit Computer-Gegner in den Spielen. 749 00:43:08,890 --> 00:43:12,950 Aber wenn Sie Fragen haben, Ich werde in der Umgebung zu Bürozeiten heute Abend. 750 00:43:12,950 --> 00:43:17,610 Ich bin glücklich, mit Ihnen über AI sprechen Themen oder mehr ins Detail zu erhalten. 751 00:43:17,610 --> 00:43:18,927 Habe ein schönes Wochenende. 752 00:43:18,927 --> 00:43:21,409 >> [BEIFALL] 753 00:43:21,409 --> 00:43:21,909 754 00:43:21,909 --> 00:43:26,141 [Musikwiedergabe] 755 00:43:26,141 --> 00:46:42,879