1 00:00:00,000 --> 00:00:02,928 >> [RIPRODUZIONE DI BRANI MUSICALI] 2 00:00:02,928 --> 00:00:11,230 3 00:00:11,230 --> 00:00:12,790 >> DAVID MALAN: Questo è CS50. 4 00:00:12,790 --> 00:00:14,072 Questa è la fine della settimana 10. 5 00:00:14,072 --> 00:00:16,030 E il ragazzo, abbiamo un buona classe per voi oggi. 6 00:00:16,030 --> 00:00:20,040 Siamo così eccitati di invitare due i nostri amici di Yale fino a noi oggi 7 00:00:20,040 --> 00:00:23,920 e di guardare all'incrocio tra l'intelligenza artificiale, la robotica, 8 00:00:23,920 --> 00:00:25,710 elaborazione del linguaggio naturale, e altro ancora. 9 00:00:25,710 --> 00:00:27,090 >> E infatti, il Nelle ultime settimane, abbiamo 10 00:00:27,090 --> 00:00:29,714 certamente speso un sacco di tempo, specialmente nei pset precedenti, 11 00:00:29,714 --> 00:00:31,560 concentrandosi su graziosi dettagli di basso livello. 12 00:00:31,560 --> 00:00:34,520 Ed è molto facile perdere di vista della foresta per gli alberi 13 00:00:34,520 --> 00:00:38,170 e ottenere appeso sui cicli e condizioni e puntatori, certamente, e simili. 14 00:00:38,170 --> 00:00:41,770 Ma la realtà è che voi ragazzi hanno ora la gli ingredienti con i quali si può veramente 15 00:00:41,770 --> 00:00:45,300 risolvere alcuni problemi interessanti, tra loro quei che i nostri amici a Yale 16 00:00:45,300 --> 00:00:48,790 lavorare solo timido di Cambridge. 17 00:00:48,790 --> 00:00:52,410 >> Quindi permettetemi prima di introdurre la nostra testa esercitatore presso la Yale, Andy. 18 00:00:52,410 --> 00:00:55,182 >> [APPLAUSI] 19 00:00:55,182 --> 00:00:57,030 20 00:00:57,030 --> 00:01:00,710 >> ANDY: Prima di tutto, proprio grazie a voi per aver permesso un paio Yalies 21 00:01:00,710 --> 00:01:02,700 pop in giù a Cambridge oggi. 22 00:01:02,700 --> 00:01:05,299 Siamo davvero grati. 23 00:01:05,299 --> 00:01:07,090 In secondo luogo, ai nostri amici indietro home-- Jason, 24 00:01:07,090 --> 00:01:09,670 grazie per stare e l'esecuzione di lezione. 25 00:01:09,670 --> 00:01:12,970 Spero che tutto bene a New Haven. 26 00:01:12,970 --> 00:01:15,720 >> Quindi sì, io sono super eccitato introdurre SCAZ oggi. 27 00:01:15,720 --> 00:01:17,020 SCAZ gestisce il laboratorio di robotica. 28 00:01:17,020 --> 00:01:19,690 Lui è un professore di, come, cinque diversi dipartimenti a Yale. 29 00:01:19,690 --> 00:01:23,159 Nel suo laboratorio, ha molti, molti robot che gli piace giocare con. 30 00:01:23,159 --> 00:01:24,950 Ha, come, il cool lavoro nel mondo. 31 00:01:24,950 --> 00:01:27,116 E si arriva a tipo di disordine in giro con quel tutto il giorno 32 00:01:27,116 --> 00:01:29,090 lungo e fare un certo lavoro, pure. 33 00:01:29,090 --> 00:01:33,070 >> E così abbiamo portato uno di giù con noi oggi. 34 00:01:33,070 --> 00:01:36,900 Quindi, senza ulteriori indugi, è SCAZ intenzione di andare avanti e di presentarci 35 00:01:36,900 --> 00:01:38,660 al suo amico robot. 36 00:01:38,660 --> 00:01:41,546 >> [APPLAUSI] 37 00:01:41,546 --> 00:01:42,935 38 00:01:42,935 --> 00:01:44,310 BRIAN Scassellati: Grazie, David. 39 00:01:44,310 --> 00:01:45,380 Grazie, Andy. 40 00:01:45,380 --> 00:01:50,050 E 'così meraviglioso essere qui con tutti oggi. 41 00:01:50,050 --> 00:01:56,490 Voglio essere molto chiaro che prima il personale CS50 qui a Cambridge 42 00:01:56,490 --> 00:01:59,190 è stato incredibilmente ospitale a noi. 43 00:01:59,190 --> 00:02:02,130 Siamo così grati per tutto hanno fatto per sostenerci. 44 00:02:02,130 --> 00:02:05,690 E così ci piacerebbe essere in grado per restituire la gentilezza. 45 00:02:05,690 --> 00:02:09,370 >> Così oggi, si arriva a annunciare che stiamo per avere un nuovo, 46 00:02:09,370 --> 00:02:15,240 uno-di-un-tipo evento CS50 succedendo a New Haven la prossima settimana. 47 00:02:15,240 --> 00:02:18,040 E questo è il CS50 Research Expo. 48 00:02:18,040 --> 00:02:21,300 Quindi stiamo andando a essere invitante everyone-- CS50 studenti, 49 00:02:21,300 --> 00:02:26,510 personale sia da Harvard e Yale-- a scendere e visitare con noi il Venerdì. 50 00:02:26,510 --> 00:02:30,400 Avremo una vasta gamma di sopra 30 persone diverse che presentano 51 00:02:30,400 --> 00:02:34,830 e upperclassmen exhibiting-- mostrando fuori alcuni dei loro prodotti di ricerca. 52 00:02:34,830 --> 00:02:38,480 Avremo alcune start-up, anche, guardando per un po 'di nuovi talenti tecnologia, 53 00:02:38,480 --> 00:02:40,460 start-up sia da Harvard e Yale. 54 00:02:40,460 --> 00:02:44,550 E avremo alcuni gruppi di studenti alla ricerca di qualche nuova adesione. 55 00:02:44,550 --> 00:02:46,357 >> Sta andando essere un momento molto emozionante. 56 00:02:46,357 --> 00:02:49,190 Speriamo che quelli di voi che sono scendendo per il gioco di Harvard-Yale 57 00:02:49,190 --> 00:02:51,360 sarà in grado di fermare da un po 'presto, 58 00:02:51,360 --> 00:02:54,060 proprio nel centro della città universitaria, Sterling Memorial Library. 59 00:02:54,060 --> 00:02:58,040 Stiamo per avere una serie di mostre che vanno da autonoma 60 00:02:58,040 --> 00:03:04,460 barche a vela alle modalità di utilizzo del software per preservare manoscritti medievali. 61 00:03:04,460 --> 00:03:07,860 >> Stiamo per avere annuncio networking hoc e persone 62 00:03:07,860 --> 00:03:11,230 l'insegnamento di codifica software a Città del Capo. 63 00:03:11,230 --> 00:03:13,730 Avremo di computer manifestazioni musicali. 64 00:03:13,730 --> 00:03:16,020 E noi, naturalmente, abbiamo più robot. 65 00:03:16,020 --> 00:03:18,900 Quindi noi ti auguriamo ll unirsi a noi per questo evento. 66 00:03:18,900 --> 00:03:21,350 Dovrebbe essere un sacco di divertente, un po 'di cibo, 67 00:03:21,350 --> 00:03:24,430 e un sacco di interessanti cose di cui parlare. 68 00:03:24,430 --> 00:03:28,230 >> Così oggi, stiamo andando a parlare su elaborazione del linguaggio naturale. 69 00:03:28,230 --> 00:03:32,560 E questo è il tentativo per noi per costruire un nuovo modo di interfacciamento 70 00:03:32,560 --> 00:03:35,150 con i nostri dispositivi perchè per le ultime settimane, 71 00:03:35,150 --> 00:03:40,800 siete stati concentrati su come sia possibile che è possibile scrivere codice, scrivere software 72 00:03:40,800 --> 00:03:47,110 che è un modo di poter dire ad un la macchina, questo è quello che voglio che tu faccia. 73 00:03:47,110 --> 00:03:50,210 >> Ma non dovremmo bisogno di si aspettano che tutto 74 00:03:50,210 --> 00:03:53,760 che è là fuori che viene utilizzato da tutti nel mondo 75 00:03:53,760 --> 00:03:57,480 sta per essere competenti in questo tipo di istruzione. 76 00:03:57,480 --> 00:04:02,540 Così distinguiamo tra il computer lingue e languages-- naturali 77 00:04:02,540 --> 00:04:06,720 cioè, le cose che gli esseri umani usano per comunicare con altri esseri umani. 78 00:04:06,720 --> 00:04:12,270 E noi cerchiamo di costruire interfacce che utilizzano questi meccanismi di comunicazione naturali. 79 00:04:12,270 --> 00:04:16,029 >> Ora, proprio come ogni altro argomento che abbiamo iniziato con in CS50, 80 00:04:16,029 --> 00:04:19,589 stiamo per iniziare con la più semplice po 'di elaborazione del linguaggio naturale 81 00:04:19,589 --> 00:04:21,269 che possiamo immaginare. 82 00:04:21,269 --> 00:04:24,940 Stiamo per iniziare con la parte storica del linguaggio naturale. 83 00:04:24,940 --> 00:04:28,740 E poi ci costruiremo fino a sistemi sempre più recenti 84 00:04:28,740 --> 00:04:31,450 e hanno alcune demo divertimento lungo la strada. 85 00:04:31,450 --> 00:04:35,900 >> Quindi stiamo andando a iniziare con quello che era probabilmente il primo linguaggio naturale 86 00:04:35,900 --> 00:04:38,210 sistema di elaborazione. 87 00:04:38,210 --> 00:04:45,080 Questo era un sistema software scritto in 1966 da Joseph Weizenbaum chiama ELIZA. 88 00:04:45,080 --> 00:04:49,640 E ELIZA è stato progettato per replicare il tipo di interazione 89 00:04:49,640 --> 00:04:53,850 si avrebbe con un Psicoterapeuta rogersiana. 90 00:04:53,850 --> 00:04:57,210 Ora, i Rogerians, avevano un'idea che la psicoterapia 91 00:04:57,210 --> 00:05:02,800 coinvolto in grado di rispecchiare indietro ad un paziente e parlare con loro, 92 00:05:02,800 --> 00:05:08,100 sostanzialmente, da solo dando loro una pochino del terapeuta. 93 00:05:08,100 --> 00:05:09,920 Cioè, tutto che il terapeuta ha detto 94 00:05:09,920 --> 00:05:16,500 che doveva essere solo un riflesso di ciò che il paziente stava dicendo a loro. 95 00:05:16,500 --> 00:05:18,990 >> Quindi cerchiamo di demo questo. 96 00:05:18,990 --> 00:05:22,820 Abbiamo un volontario che sarei disposti a condividere la loro più profonda, 97 00:05:22,820 --> 00:05:26,650 più oscuri, e / o segreti falsi con ELIZA? 98 00:05:26,650 --> 00:05:29,680 Certo, perché non vieni su. 99 00:05:29,680 --> 00:05:30,847 Fantastico. 100 00:05:30,847 --> 00:05:31,430 E il tuo nome? 101 00:05:31,430 --> 00:05:32,000 >> MILES: Miles. 102 00:05:32,000 --> 00:05:33,041 >> BRIAN Scassellati: Miles. 103 00:05:33,041 --> 00:05:34,270 Piacere di conoscerti, Miles. 104 00:05:34,270 --> 00:05:36,270 Se volete tenere su quello. 105 00:05:36,270 --> 00:05:40,840 E stiamo andando a utilizzare una versione di ELIZA 106 00:05:40,840 --> 00:05:44,640 che abbiamo replicato all'interno dell'IDE CS50. 107 00:05:44,640 --> 00:05:47,140 E vedremo alla fonte codice a questo in un po '. 108 00:05:47,140 --> 00:05:49,910 Ma per ora, siamo solo andando a richiamare digitando eliza. 109 00:05:49,910 --> 00:05:55,480 >> E ELIZA sta per dare le risposte che stanno per essere in tutte le capitali. 110 00:05:55,480 --> 00:05:57,950 E andando a farle alcune domande. 111 00:05:57,950 --> 00:06:02,130 E noi risponderemo e tipo nelle risposte a Eliza. 112 00:06:02,130 --> 00:06:04,310 Così ELIZA ha detto: "Ciao, sono ELIZA. 113 00:06:04,310 --> 00:06:05,462 Qual'è il tuo problema?" 114 00:06:05,462 --> 00:06:08,092 Cosa ti piacerebbe ELIZA dire di oggi? 115 00:06:08,092 --> 00:06:10,750 >> MILES: Io può cadere solo addormentato se ho le pantofole coniglietto su. 116 00:06:10,750 --> 00:06:12,440 >> BRIAN Scassellati: Va bene. 117 00:06:12,440 --> 00:06:13,360 Tutto ok. 118 00:06:13,360 --> 00:06:15,300 >> [Risata] 119 00:06:15,300 --> 00:06:22,410 >> "Posso solo cadere addormentato con le pantofole coniglietto via. " 120 00:06:22,410 --> 00:06:29,000 E ELIZA dice: "Dire, fare voi avere problemi psicologici? 121 00:06:29,000 --> 00:06:30,450 Forse questo è un buon indicatore. " 122 00:06:30,450 --> 00:06:30,780 >> OK. 123 00:06:30,780 --> 00:06:32,245 Allora, cosa ti piacerebbe rispondere? 124 00:06:32,245 --> 00:06:36,110 125 00:06:36,110 --> 00:06:36,970 >> MILES: Sì. 126 00:06:36,970 --> 00:06:38,660 >> BRIAN Scassellati: Sì. 127 00:06:38,660 --> 00:06:39,570 Uomo di molte parole. 128 00:06:39,570 --> 00:06:41,870 Mi piace che. 129 00:06:41,870 --> 00:06:50,200 Eliza dice: "Sembri abbastanza positivo." 130 00:06:50,200 --> 00:06:53,200 >> MILES: No, sono, infatti, un elettrone. 131 00:06:53,200 --> 00:06:55,150 >> BRIAN Scassellati: "No. 132 00:06:55,150 --> 00:07:02,240 In realtà, io sono un elettrone. " "Sei venuto da me 133 00:07:02,240 --> 00:07:06,954 perché sei un elettrone? " 134 00:07:06,954 --> 00:07:08,870 Ora, possiamo vedere alcuni dei il things-- Vado 135 00:07:08,870 --> 00:07:10,200 per mettere in pausa voi solo per un secondo, Miles. 136 00:07:10,200 --> 00:07:11,010 Non andare da nessuna parte. 137 00:07:11,010 --> 00:07:12,650 Non abbiamo ancora finito con te. 138 00:07:12,650 --> 00:07:16,490 ELIZA è, per certi versi, rispondendo a certe cose 139 00:07:16,490 --> 00:07:21,140 che sta dicendo, ma senza una reale comprensione. 140 00:07:21,140 --> 00:07:26,090 Ed è anche un po 'di ripetere a pappagallo indietro delle parti della sua frase. 141 00:07:26,090 --> 00:07:27,310 >> Così abbiamo detto: "No. 142 00:07:27,310 --> 00:07:29,090 In realtà, io sono un elettrone. " 143 00:07:29,090 --> 00:07:34,190 Eliza ha risposto indietro, "Sei venuto perché sei un elettrone? " 144 00:07:34,190 --> 00:07:34,690 Tutto ok. 145 00:07:34,690 --> 00:07:36,050 Diamogli un'altra risposta qui. 146 00:07:36,050 --> 00:07:37,140 Dategli una buona, Miles. 147 00:07:37,140 --> 00:07:37,806 >> MILES: Good one? 148 00:07:37,806 --> 00:07:48,400 149 00:07:48,400 --> 00:07:49,570 >> Sì, ti prego, aiutami. 150 00:07:49,570 --> 00:07:50,570 BRIAN Scassellati: "Sì. 151 00:07:50,570 --> 00:07:58,010 Ti prego, aiutami. "" Sei sicuro? " 152 00:07:58,010 --> 00:07:58,510 MILES: No. 153 00:07:58,510 --> 00:08:00,860 BRIAN Scassellati: No. 154 00:08:00,860 --> 00:08:03,562 «Che cosa suggerisce a voi?" 155 00:08:03,562 --> 00:08:06,760 >> MILES: Io non può essere un elettrone. 156 00:08:06,760 --> 00:08:11,170 >> BRIAN Scassellati: "Io non può essere un elettrone. " 157 00:08:11,170 --> 00:08:13,790 "Stai dicendo non solo per essere negativo?" 158 00:08:13,790 --> 00:08:14,390 >> Tutto ok. 159 00:08:14,390 --> 00:08:16,030 Così Miles, grazie mille. 160 00:08:16,030 --> 00:08:16,860 >> MILES: Grazie. 161 00:08:16,860 --> 00:08:18,360 >> BRIAN Scassellati: Grazie mille. 162 00:08:18,360 --> 00:08:20,230 [APPLAUSI] 163 00:08:20,230 --> 00:08:21,230 164 00:08:21,230 --> 00:08:26,700 >> Quindi questo programma ELIZA, per molti versi, sta rispondendo solo per i pezzi 165 00:08:26,700 --> 00:08:32,730 che stiamo fornendo senza alcuna profondità comprensione di ciò che sta accadendo qui. 166 00:08:32,730 --> 00:08:36,640 Questo è un tipo di sistema chiamato pattern matching, dove 167 00:08:36,640 --> 00:08:40,490 stiamo cercando certo parti di testo che siamo poi 168 00:08:40,490 --> 00:08:44,860 andando a prendere da ciò è stato fornito come input, 169 00:08:44,860 --> 00:08:52,580 convertirlo, potenzialmente, in qualche modo, e poi restituirlo all'utente. 170 00:08:52,580 --> 00:08:55,150 >> Qualcuno di voi pensa ELIZA che è in realtà 171 00:08:55,150 --> 00:08:58,230 l'esecuzione di psicoanalisi validi qui? 172 00:08:58,230 --> 00:08:59,250 Una persona, forse. 173 00:08:59,250 --> 00:09:00,166 >> PUBBLICO: [incomprensibile]. 174 00:09:00,166 --> 00:09:03,315 175 00:09:03,315 --> 00:09:05,440 BRIAN Scassellati: E come fa che ti fanno sentire? 176 00:09:05,440 --> 00:09:06,530 Sì, in effetti, lo fa. 177 00:09:06,530 --> 00:09:10,890 E stiamo andando a vedere, in realtà, il codice sorgente in un attimo. 178 00:09:10,890 --> 00:09:13,580 E così si sta andando ad essere grado di fare esattamente questo. 179 00:09:13,580 --> 00:09:17,420 >> Ora, ELIZA è una forma di ciò che che oggi chiameremmo una chat bot. 180 00:09:17,420 --> 00:09:19,950 Si va solo attraverso il il testo che si sta fornendo, 181 00:09:19,950 --> 00:09:24,030 fornisce l'importo minimo indispensabile di comprensione o di trasformazione, 182 00:09:24,030 --> 00:09:26,790 e poi pappagalli di nuovo a voi. 183 00:09:26,790 --> 00:09:31,830 Quindi, diamo uno sguardo, concettualmente, e parlare di ciò che 184 00:09:31,830 --> 00:09:34,690 è che ELIZA sta effettivamente facendo. 185 00:09:34,690 --> 00:09:42,000 >> ELIZA sta prendendo di un let sentence-- Dico, "Voglio impressionare il mio capo." 186 00:09:42,000 --> 00:09:45,130 E ELIZA è alla ricerca attraverso quella frase 187 00:09:45,130 --> 00:09:48,730 e cercando di trovare e abbinare certi schemi. 188 00:09:48,730 --> 00:09:52,850 Così, per esempio, uno dei modelli ELIZA che sta cercando le parole 189 00:09:52,850 --> 00:09:55,110 "Io voglio." 190 00:09:55,110 --> 00:09:59,330 E ogni volta che vede qualcosa che ha "Voglio" in esso, 191 00:09:59,330 --> 00:10:01,770 essa formula una risposta. 192 00:10:01,770 --> 00:10:05,040 E che la risposta è una stringa fissa. 193 00:10:05,040 --> 00:10:07,915 In questo caso, si tratta di "perché vuoi?" 194 00:10:07,915 --> 00:10:11,330 E ho messo un po 'a stella alla fine, perché questo è solo 195 00:10:11,330 --> 00:10:13,310 All'inizio della nostra risposta. 196 00:10:13,310 --> 00:10:16,310 E la stella indica che stiamo andando a prendere il resto 197 00:10:16,310 --> 00:10:19,850 di utterance-- dell'utente "per impressionare il mio capo" - 198 00:10:19,850 --> 00:10:24,500 e abbiamo intenzione di aggiungere che sull'estremità di questa stringa. 199 00:10:24,500 --> 00:10:28,990 >> Quindi, adesso, piuttosto che dire, "perché vuoi impressionare il mio capo, " 200 00:10:28,990 --> 00:10:31,800 c'è un po 'di ulteriore elaborazione che faremo. 201 00:10:31,800 --> 00:10:34,440 Cioè, dovremo convertire alcuni dei pronomi 202 00:10:34,440 --> 00:10:38,670 qui dal "mio capo" a "il tuo capo." 203 00:10:38,670 --> 00:10:41,300 E ci potrebbe essere qualche altro cambiamenti che dobbiamo fare. 204 00:10:41,300 --> 00:10:44,990 Quindi, piuttosto che attaccare direttamente sul fine, quello che faremo 205 00:10:44,990 --> 00:10:49,160 è prenderemo il resto del utterance-- dell'utente in qui-- bianco 206 00:10:49,160 --> 00:10:54,090 e noi lo prenderemo un pezzo alla un tempo e convertire ogni stringa 207 00:10:54,090 --> 00:10:58,180 segno, ogni parola, nella frase. 208 00:10:58,180 --> 00:10:59,580 >> Quindi prendiamo la parola "a". 209 00:10:59,580 --> 00:11:01,650 Non c'è alcuna conversione che dobbiamo farlo. 210 00:11:01,650 --> 00:11:02,340 "Impressionare." 211 00:11:02,340 --> 00:11:04,140 Non c'è alcuna conversione abbiamo bisogno di fare lì. 212 00:11:04,140 --> 00:11:06,670 Il "mio" si convertirà al "vostro". 213 00:11:06,670 --> 00:11:10,070 E "boss" ci lasciamo come "boss". 214 00:11:10,070 --> 00:11:12,740 E poi finalmente, qualsiasi cosa che termina con un punto, 215 00:11:12,740 --> 00:11:16,640 convertiremo in una domanda. 216 00:11:16,640 --> 00:11:22,600 >> Questo molto semplice pattern matching in realtà è un discreto successo. 217 00:11:22,600 --> 00:11:27,260 E quando questo è stato introdotto in 1966-- Joseph Weizenbaum 218 00:11:27,260 --> 00:11:28,986 programmato questo su un computer. 219 00:11:28,986 --> 00:11:31,110 Ora, i computer in quel momento non erano modelli desktop. 220 00:11:31,110 --> 00:11:33,950 Erano le risorse condivise. 221 00:11:33,950 --> 00:11:39,090 E i suoi studenti avrebbero andare a chiacchierare con ELIZA. 222 00:11:39,090 --> 00:11:41,570 Alla fine, ha dovuto limitare l'accesso ad esso 223 00:11:41,570 --> 00:11:43,890 perché i suoi studenti non erano ottenere qualsiasi lavoro fatto. 224 00:11:43,890 --> 00:11:46,190 Stavano chiacchierando con ELIZA. 225 00:11:46,190 --> 00:11:48,850 E, infatti, ha dovuto sparare il suo assistente, che 226 00:11:48,850 --> 00:11:55,840 trascorso tutto il suo tempo a parlare con ELIZA dei suoi problemi profondi e preoccupanti. 227 00:11:55,840 --> 00:12:00,350 >> Chiunque utilizzato questi sistemi ha iniziato ad antropomorfizzare loro. 228 00:12:00,350 --> 00:12:04,490 Hanno cominciato a pensare a loro come essendo animate e persone reali. 229 00:12:04,490 --> 00:12:07,969 Hanno cominciato a riconoscere alcuni dei le cose che dicevi 230 00:12:07,969 --> 00:12:09,010 stavano tornando a loro. 231 00:12:09,010 --> 00:12:12,120 E sono stati scoprendo cose su se stessi. 232 00:12:12,120 --> 00:12:17,290 E, infatti, anche gli esperti, anche gli psicoterapeuti, 233 00:12:17,290 --> 00:12:22,930 iniziato a preoccuparsi che, di fatto, forse ELIZA sarebbe la loro sostituzione. 234 00:12:22,930 --> 00:12:25,640 E anche il computer scienziati preoccupati che eravamo 235 00:12:25,640 --> 00:12:30,040 così vicino alla soluzione del linguaggio naturale. 236 00:12:30,040 --> 00:12:33,520 >> Ora, che non era da nessuna parte vicino a true. 237 00:12:33,520 --> 00:12:37,280 Ma è così che impressionante questi sistemi possono sembrare. 238 00:12:37,280 --> 00:12:40,080 Quindi cominciamo a guardare sotto e provare 239 00:12:40,080 --> 00:12:46,190 per ottenere un po 'di una domanda di cui questo codice effettivamente accade. 240 00:12:46,190 --> 00:12:48,170 Così faremo questo codice disponibile in seguito. 241 00:12:48,170 --> 00:12:50,880 E questo è molto porto semplice e diretto 242 00:12:50,880 --> 00:12:53,240 della implementazione originale ELIZA. 243 00:12:53,240 --> 00:12:56,350 >> Così alcuni di questi stilistica cose che vedrete qui 244 00:12:56,350 --> 00:12:59,360 non sono stilisticamente cosa vorremmo che tu faccia 245 00:12:59,360 --> 00:13:01,480 o quello che noi abbiamo insegnato a fare. 246 00:13:01,480 --> 00:13:04,770 Ma abbiamo cercato di tenerli la stessa per tutti i numerosi porti 247 00:13:04,770 --> 00:13:08,087 che ha avuto modo che ha il sapore dell'originale. 248 00:13:08,087 --> 00:13:09,920 Quindi stiamo andando a includere un sacco di cose, 249 00:13:09,920 --> 00:13:12,920 e poi avremo un set di parole chiave, le cose 250 00:13:12,920 --> 00:13:16,460 che ELIZA riconoscerà e rispondere direttamente a. 251 00:13:16,460 --> 00:13:20,780 Quindi, se avete parole come "può" o "non fare" o "no" 252 00:13:20,780 --> 00:13:24,680 o "sì" o "sogno" o "ciao", allora ELIZA 253 00:13:24,680 --> 00:13:27,920 risponderà in modo selettivo a quelle. 254 00:13:27,920 --> 00:13:30,010 Avremo anche un certo numero di cose 255 00:13:30,010 --> 00:13:34,940 che ci scambieremo, come convertendo "il mio" a "la vostra." 256 00:13:34,940 --> 00:13:39,920 >> E poi avremo una serie di risposte che per ciascuna di queste parole chiave, 257 00:13:39,920 --> 00:13:42,580 faremo ruotare attraverso queste diverse risposte. 258 00:13:42,580 --> 00:13:45,350 Quindi, se io dico "sì" tre volte di fila, io 259 00:13:45,350 --> 00:13:50,429 potrebbe ottenere tre differenti risposte da ELIZA. 260 00:13:50,429 --> 00:13:52,345 Il nostro codice, dunque, è in realtà molto semplice. 261 00:13:52,345 --> 00:13:59,490 Se ho scorrere verso il basso oltre tutti questi risposte che abbiamo programmato a 262 00:13:59,490 --> 00:14:02,920 e ci mettiamo a nostro principale, stiamo andando a inizializzare 263 00:14:02,920 --> 00:14:06,540 un paio di diverse variabili e fare un po 'di pulizia 264 00:14:06,540 --> 00:14:08,480 all'inizio. 265 00:14:08,480 --> 00:14:11,760 Ma poi c'è assolutamente un set di codice che si può capire. 266 00:14:11,760 --> 00:14:15,820 Un grande ciclo while che dice che sono intenzione di ripetere più e più. 267 00:14:15,820 --> 00:14:20,420 Leggo in una linea, e io memorizzare che in una stringa di input. 268 00:14:20,420 --> 00:14:23,880 Vado a controllare e vedere se è il parola chiave speciale "bye", che 269 00:14:23,880 --> 00:14:26,199 significa uscire dal programma. 270 00:14:26,199 --> 00:14:29,240 E poi vado a controllare e vedere se qualcuno sta solo ripetendo se stessi 271 00:14:29,240 --> 00:14:29,800 ancora ed ancora. 272 00:14:29,800 --> 00:14:31,174 E io ti urlare contro di loro se lo fanno. 273 00:14:31,174 --> 00:14:34,820 Dirò "non ripetere te stesso". 274 00:14:34,820 --> 00:14:40,500 >> Fino a quando nessuno di coloro che accade, lo quindi eseguire la scansione attraverso e loop through, 275 00:14:40,500 --> 00:14:45,330 sulle linee 308 a 313 qui, e controllare e vedere 276 00:14:45,330 --> 00:14:49,090 sono una di queste parole chiave frasi contenute in ingresso 277 00:14:49,090 --> 00:14:50,620 che mi è stato appena dato? 278 00:14:50,620 --> 00:14:54,845 Se c'è una corrispondenza per loro, ben poi, mi ricordo quella posizione. 279 00:14:54,845 --> 00:14:57,050 Me ne ricorderò parola chiave. 280 00:14:57,050 --> 00:14:58,620 E sarò in grado di costruire una risposta. 281 00:14:58,620 --> 00:15:03,150 >> Se non trovo una, beh, allora, l'ultima cosa nella mia matrice parola chiave 282 00:15:03,150 --> 00:15:08,070 sarà mie risposte predefinite, quando niente partite. 283 00:15:08,070 --> 00:15:14,160 Chiederò domande come "Perché l'hai fatto Vengo qui? "o" Come posso aiutarla? " 284 00:15:14,160 --> 00:15:19,710 che sono solo parzialmente adeguate non importa quale l'ingresso è. 285 00:15:19,710 --> 00:15:22,580 >> Provvederemo quindi costruiamo la risposta di ELIZA. 286 00:15:22,580 --> 00:15:26,040 Saremo in grado di prendere che la risposta di base, 287 00:15:26,040 --> 00:15:28,370 proprio come abbiamo fatto in quella esempio "il mio capo". 288 00:15:28,370 --> 00:15:30,970 289 00:15:30,970 --> 00:15:33,990 Se questo è tutto quello che c'è è-- se è solo un 290 00:15:33,990 --> 00:15:36,860 stringa che dovrei respond-- Posso solo trasmettere di nuovo fuori. 291 00:15:36,860 --> 00:15:40,610 Se ha un asterisco alla fine di esso, allora io 292 00:15:40,610 --> 00:15:45,710 elaborare ogni singolo token il resto della risposta dell'utente 293 00:15:45,710 --> 00:15:51,590 e aggiungere quelli, sostituendo parola per parola, come ho bisogno di. 294 00:15:51,590 --> 00:15:56,100 >> Tutto questo è assolutamente qualcosa che si potrebbe costruire. 295 00:15:56,100 --> 00:15:59,230 Ed infatti, i modi in cui avere argomenti della riga di comando elaborati, 296 00:15:59,230 --> 00:16:03,570 il modo in cui si dispone elaborati attraverso richieste HTTP 297 00:16:03,570 --> 00:16:05,510 seguire lo stesso tipo di regole. 298 00:16:05,510 --> 00:16:08,220 Sono pattern matching. 299 00:16:08,220 --> 00:16:15,170 >> Così ELIZA aveva una relativamente importante impatto sul linguaggio naturale 300 00:16:15,170 --> 00:16:21,620 perché sembrava che si trattava di un obiettivo molto raggiungibile, come in qualche modo saremmo 301 00:16:21,620 --> 00:16:25,550 essere in grado di risolvere il problema direttamente. 302 00:16:25,550 --> 00:16:30,670 Ora, questo non vuol dire che ELIZA fa tutto quello che vorremmo fare. 303 00:16:30,670 --> 00:16:33,710 Certamente no. 304 00:16:33,710 --> 00:16:35,660 Ma dovremmo essere in grado fare qualcosa di più. 305 00:16:35,660 --> 00:16:38,280 306 00:16:38,280 --> 00:16:41,490 >> Il nostro primo passo per andare al di là di ELIZA sta andando 307 00:16:41,490 --> 00:16:44,840 per essere in grado di guardare non essere iscritti testo 308 00:16:44,840 --> 00:16:53,750 nella tastiera ma il discorso, reale discorso registrato in un microfono. 309 00:16:53,750 --> 00:16:56,880 Così come si guarda questi diversi pezzi, siamo 310 00:16:56,880 --> 00:17:00,304 andando a costruire una serie di modelli. 311 00:17:00,304 --> 00:17:02,970 Stiamo andando ad avere per essere in grado per passare dal basso livello acustico 312 00:17:02,970 --> 00:17:07,180 passo informazioni inclusi, ampiezza, frequency-- 313 00:17:07,180 --> 00:17:09,530 e convertire in alcune unità che siamo 314 00:17:09,530 --> 00:17:14,619 in grado di manipolare facilmente e, infine, manipolarle 315 00:17:14,619 --> 00:17:18,609 in parole e frasi. 316 00:17:18,609 --> 00:17:22,880 >> Così la maggior parte di riconoscimento vocale sistemi che sono là fuori oggi 317 00:17:22,880 --> 00:17:26,069 seguire una statistica modello in cui si costruisce 318 00:17:26,069 --> 00:17:35,090 tre rappresentazioni separate di ciò che che il segnale audio contiene in realtà. 319 00:17:35,090 --> 00:17:38,640 Si comincia con un modello fonetica che parla di solo la base 320 00:17:38,640 --> 00:17:41,250 suoni che sto producendo. 321 00:17:41,250 --> 00:17:46,900 Sto producendo qualcosa che è un B come in ragazzo o una D come nel cane? 322 00:17:46,900 --> 00:17:53,220 Come posso riconoscere i due diversi cellulari come separato e distinto? 323 00:17:53,220 --> 00:17:56,600 >> In cima a quello, ci poi costruire una pronuncia modello di parola, 324 00:17:56,600 --> 00:18:01,350 qualcosa che lega insieme quei singoli telefoni 325 00:18:01,350 --> 00:18:04,724 e li combina in una sola parola. 326 00:18:04,724 --> 00:18:07,890 E dopo che, prenderemo le parole e noi li faremo assembliamo con un linguaggio 327 00:18:07,890 --> 00:18:13,010 modellare in una frase completa. 328 00:18:13,010 --> 00:18:17,230 >> Ora, stiamo andando a parlare di ogni di questi indipendentemente e separatamente. 329 00:18:17,230 --> 00:18:21,580 Ma questi tre modelli sono tutti solo andando a essere le statistiche. 330 00:18:21,580 --> 00:18:23,502 E questo significa che quando ci lavorare con loro, ce la faremo 331 00:18:23,502 --> 00:18:25,376 essere in grado di lavorare con tutti contemporaneamente. 332 00:18:25,376 --> 00:18:28,100 333 00:18:28,100 --> 00:18:28,600 Tutto ok. 334 00:18:28,600 --> 00:18:30,890 Cominciamo con il nostro modello di fonetica. 335 00:18:30,890 --> 00:18:34,470 Così modelli fonetici si basano su una tecnica computazionale 336 00:18:34,470 --> 00:18:37,320 chiamato modelli di Markov nascosti. 337 00:18:37,320 --> 00:18:43,050 Si tratta di modelli grafici in cui mi avere e riconoscere uno stato del mondo 338 00:18:43,050 --> 00:18:46,500 come caratterizzato da una serie di funzioni. 339 00:18:46,500 --> 00:18:51,960 E questo stato descrive una parte di un'azione che sono fidanzata in. 340 00:18:51,960 --> 00:19:00,190 >> Quindi, se penso a fare il suono "ma" come la madre, 341 00:19:00,190 --> 00:19:03,970 ci sono diversi componenti di quel suono. 342 00:19:03,970 --> 00:19:07,230 C'è una parte dove attiro a fiato. 343 00:19:07,230 --> 00:19:09,560 E poi ho borsa mie labbra. 344 00:19:09,560 --> 00:19:13,710 E Alzo le labbra un po 'indietro bit per rendere quel suono "ma". 345 00:19:13,710 --> 00:19:15,340 E poi c'è un rilascio. 346 00:19:15,340 --> 00:19:17,020 Le mie labbra si disfano. 347 00:19:17,020 --> 00:19:19,030 L'aria viene espulsa. 348 00:19:19,030 --> 00:19:22,650 "Ma". 349 00:19:22,650 --> 00:19:29,250 >> Questi tre parti differenti sarebbero rappresentata dagli stati in questo graph-- 350 00:19:29,250 --> 00:19:33,420 l'inizio, la metà e la fine. 351 00:19:33,420 --> 00:19:38,060 E vorrei avere transizioni che mi ha permesso di viaggiare da uno stato 352 00:19:38,060 --> 00:19:42,260 all'altro con una certa probabilità. 353 00:19:42,260 --> 00:19:47,250 Così, per esempio, che M suono potrebbe avere un molto, 354 00:19:47,250 --> 00:19:51,850 molto breve l'assunzione al beginning-- "mm" - e quindi una più lunga, 355 00:19:51,850 --> 00:19:55,640 fase vibratoria dove sto tenendo il mio labbra e quasi humming-- 356 00:19:55,640 --> 00:20:05,090 "mmmm" - e quindi un brevissimo esplosiva dove ho espello breath-- "ma". 357 00:20:05,090 --> 00:20:09,370 >> Il modello di Markov è nascosta progettato per catturare il fatto 358 00:20:09,370 --> 00:20:13,340 che il modo in cui faccio quel suono "ma" sta andando 359 00:20:13,340 --> 00:20:17,350 essere leggermente diversa i suoi tempi, è la frequenza, 360 00:20:17,350 --> 00:20:21,030 e le sue caratteristiche che il modo in cui si rendono 361 00:20:21,030 --> 00:20:23,300 o il modo in cui potrei farlo quando parlo 362 00:20:23,300 --> 00:20:26,030 sui diversi usi della lettera. 363 00:20:26,030 --> 00:20:33,240 "Madre" e "può io" sarà suono leggermente diverso. 364 00:20:33,240 --> 00:20:36,800 >> Quindi, per riconoscere un suono particolare, avremmo 365 00:20:36,800 --> 00:20:42,020 costruire modelli di Markov, questi nascosto di Markov modelli, di ogni telefono possibile che io 366 00:20:42,020 --> 00:20:45,840 potrebbe voler riconoscere, ogni suono possibile, 367 00:20:45,840 --> 00:20:49,750 e poi guardare il dati acustici che ho 368 00:20:49,750 --> 00:20:54,430 e determinare statisticamente qual è il più probabile 369 00:20:54,430 --> 00:20:58,110 aver prodotto questo suono. 370 00:20:58,110 --> 00:20:58,610 OK. 371 00:20:58,610 --> 00:21:01,540 372 00:21:01,540 --> 00:21:06,750 Con questo modello, abbiamo poi iniziare a costruire su di esso. 373 00:21:06,750 --> 00:21:09,330 Prendiamo un modello di pronuncia. 374 00:21:09,330 --> 00:21:11,790 Ora, a volte pronuncia modelli sono semplici e facili 375 00:21:11,790 --> 00:21:14,440 perché c'è un solo modo di pronunciare qualcosa. 376 00:21:14,440 --> 00:21:17,990 Altre volte, sono un po 'più complicato. 377 00:21:17,990 --> 00:21:21,340 Ecco una guida alla pronuncia per quella cosa rossa che è 378 00:21:21,340 --> 00:21:25,210 un frutto che si fanno ketchup fuori. 379 00:21:25,210 --> 00:21:27,360 La gente non pensa che sia un frutto. 380 00:21:27,360 --> 00:21:27,860 Destra? 381 00:21:27,860 --> 00:21:30,880 382 00:21:30,880 --> 00:21:35,300 >> Ora, ci sono molti modi diversi che la gente pronunciare questa parola. 383 00:21:35,300 --> 00:21:37,780 Alcuni diranno "in punta di piedi maggio." 384 00:21:37,780 --> 00:21:40,880 Alcuni diranno "in punta di piedi mah." 385 00:21:40,880 --> 00:21:44,800 E possiamo catturare quella con uno di questi modelli grafici 386 00:21:44,800 --> 00:21:48,305 dove, ancora una volta, noi rappresentiamo transizioni come avente una certa probabilità 387 00:21:48,305 --> 00:21:51,360 e associati probabilità con loro. 388 00:21:51,360 --> 00:21:58,290 >> Quindi, in questo caso, se dovessi seguire il percorso superiore attraverso l'intero grafico, 389 00:21:58,290 --> 00:22:03,330 Sarei a partire dalla lettera in fondo a sinistra, il suono "ta". 390 00:22:03,330 --> 00:22:07,570 Vorrei prendere la metà superiore, il "oh" e quindi un "ma" 391 00:22:07,570 --> 00:22:14,530 e quindi una "a" e quindi un "ta", e un "oh". "Toe-may-toe." 392 00:22:14,530 --> 00:22:19,610 Se ho preso il sentiero in basso attraverso questo, otterrà "ta-mah-toe." 393 00:22:19,610 --> 00:22:26,810 E se sono andato giù e poi up, vorrei avere "ta-may-toe." 394 00:22:26,810 --> 00:22:29,950 >> Questi modelli catturano questi differenze perché ogni volta 395 00:22:29,950 --> 00:22:32,410 schieriamo uno di questi sistemi di riconoscimento, 396 00:22:32,410 --> 00:22:35,340 sta andando a lavorare con un sacco di diversi tipi di persone, 397 00:22:35,340 --> 00:22:39,295 un sacco di accenti diversi, e anche diversi usi delle stesse parole. 398 00:22:39,295 --> 00:22:42,204 399 00:22:42,204 --> 00:22:44,120 Infine, per di più, costruiremo qualcosa 400 00:22:44,120 --> 00:22:48,780 che sembra davvero complicato, chiamato il modello di linguaggio, 401 00:22:48,780 --> 00:22:52,950 ma in realtà è il più semplice di il tre perché questi operano 402 00:22:52,950 --> 00:22:56,041 su quelli che vengono chiamati modelli n-gram. 403 00:22:56,041 --> 00:23:02,270 E in questo caso, ti sto mostrando un modello n-gram in due parti, una bigram. 404 00:23:02,270 --> 00:23:08,910 Stiamo andando a rendere fisica l'idea che a volte, certe parole sono 405 00:23:08,910 --> 00:23:14,680 più probabilità di seguire un parola data rispetto ad altri. 406 00:23:14,680 --> 00:23:25,210 Se ho appena detto "previsioni del tempo" la parola successiva potrebbe probabilmente "oggi" 407 00:23:25,210 --> 00:23:31,510 o potrebbe essere "il tempo previsioni di domani. " 408 00:23:31,510 --> 00:23:38,870 Ma è improbabile che sia "il Previsioni meteo carciofo. " 409 00:23:38,870 --> 00:23:42,980 >> Che modello di linguaggio fa è cattura quelli statisticamente 410 00:23:42,980 --> 00:23:47,450 contando, da alcuni molto grande corpus, tutte le istanze 411 00:23:47,450 --> 00:23:50,890 in cui una parola segue un altro. 412 00:23:50,890 --> 00:23:54,300 Quindi, se prendo una grande corpus-- come ogni Wall Street Journal 413 00:23:54,300 --> 00:24:00,750 che è stato prodotto dal 1930, che è uno dei corpuses-- norma 414 00:24:00,750 --> 00:24:03,910 e non vedo tutta quel testo, e io conto 415 00:24:03,910 --> 00:24:09,770 up quante volte dopo "oggi" "previsione" faccio io vedo 416 00:24:09,770 --> 00:24:17,454 e quante volte io vedo "previsione" seguito da "carciofi" 417 00:24:17,454 --> 00:24:19,370 il primo è andare di essere molto più probabile. 418 00:24:19,370 --> 00:24:21,540 Sta andando a comparire molto più spesso. 419 00:24:21,540 --> 00:24:24,610 E così si avrà un più alto probabilità associata. 420 00:24:24,610 --> 00:24:27,340 >> Se voglio capire il probabilità di un intero enunciato, 421 00:24:27,340 --> 00:24:29,940 poi, ho appena disgregare. 422 00:24:29,940 --> 00:24:35,990 Quindi la probabilità dell'udito la frase "il topo ha mangiato formaggio" 423 00:24:35,990 --> 00:24:39,110 è la probabilità della parola "la" a partire una frase, 424 00:24:39,110 --> 00:24:42,540 e quindi la probabilità che il parola "topo" segue la parola "il", 425 00:24:42,540 --> 00:24:44,910 e la probabilità che il parola "ate" segue "ratto" 426 00:24:44,910 --> 00:24:51,120 e la probabilità che "formaggio" segue "mangiato". 427 00:24:51,120 --> 00:24:55,160 >> Questo suona come un sacco di le statistiche, un sacco di probabilità. 428 00:24:55,160 --> 00:24:57,510 E questo è tutto quello che è. 429 00:24:57,510 --> 00:25:02,920 Ma la cosa sorprendente è che se si esegue questa operazione con un ampio campione sufficiente di dati, 430 00:25:02,920 --> 00:25:03,670 Funziona. 431 00:25:03,670 --> 00:25:05,250 E funziona tremendamente bene. 432 00:25:05,250 --> 00:25:07,810 433 00:25:07,810 --> 00:25:11,420 Sappiamo tutti che queste tecnologie. 434 00:25:11,420 --> 00:25:16,500 La maggior parte dei sistemi operativi sono dotati di riconoscimento vocale a questo punto. 435 00:25:16,500 --> 00:25:20,940 Usiamo Siri e Cortana e Echo. 436 00:25:20,940 --> 00:25:25,070 E queste cose sono basate su questo tipo di tre strati modello-- 437 00:25:25,070 --> 00:25:30,620 un modello fonetica in basso, un pronuncia modello nel mezzo, 438 00:25:30,620 --> 00:25:33,690 e un modello di linguaggio su di essi. 439 00:25:33,690 --> 00:25:37,630 >> Ora, quello che devono fare un po 'di più oltre che per rispondere alle domande. 440 00:25:37,630 --> 00:25:43,000 Ma il riconoscimento di ciò che sei detto dipende esattamente su questo. 441 00:25:43,000 --> 00:25:45,700 Quindi cerchiamo di prendere un esempio qui. 442 00:25:45,700 --> 00:25:52,020 Così ho il mio telefono seduto qui sotto la telecamera documenti. 443 00:25:52,020 --> 00:25:56,110 E stiamo andando a CHIEDE SIRI alcune domande. 444 00:25:56,110 --> 00:25:57,150 Tutto ok? 445 00:25:57,150 --> 00:25:59,940 >> Quindi cerchiamo di svegliarsi il mio telefono qui. 446 00:25:59,940 --> 00:26:02,710 447 00:26:02,710 --> 00:26:05,000 Siri, che cosa è il tempo come a New Haven oggi? 448 00:26:05,000 --> 00:26:07,670 449 00:26:07,670 --> 00:26:10,780 >> SIRI: Ecco il meteo New Haven, Connecticut oggi. 450 00:26:10,780 --> 00:26:11,890 >> BRIAN Scassellati: OK. 451 00:26:11,890 --> 00:26:16,720 Quindi, prima si è visto che Siri riconosciuto ciascuna delle singole parole 452 00:26:16,720 --> 00:26:19,050 e poi prodotto una risposta. 453 00:26:19,050 --> 00:26:22,277 Parleremo di come questa risposta avviene in un po '. 454 00:26:22,277 --> 00:26:24,110 Ma ora che sappiamo che questo è basato solo 455 00:26:24,110 --> 00:26:28,880 sulle statistiche prime e questo modello tipo di corrispondenza di approccio, 456 00:26:28,880 --> 00:26:31,120 siamo in grado di giocare alcuni giochi con Siri. 457 00:26:31,120 --> 00:26:34,560 >> Così posso riprovare. 458 00:26:34,560 --> 00:26:38,864 Siri, che cosa è il tempo ippopotamo New Haven, oggi? 459 00:26:38,864 --> 00:26:39,810 >> SIRI: OK. 460 00:26:39,810 --> 00:26:44,245 Ecco il meteo per New Haven, Connecticut per oggi. 461 00:26:44,245 --> 00:26:46,120 BRIAN Scassellati: Siri non scoraggiare da che 462 00:26:46,120 --> 00:26:50,980 perché ha trovato il pattern-- "tempo", "oggi", "New Haven". 463 00:26:50,980 --> 00:26:54,420 Questo è quello che sta rispondendo a, proprio come ELIZA. 464 00:26:54,420 --> 00:26:54,920 Tutto ok. 465 00:26:54,920 --> 00:26:59,390 Diamogli un altro ancora altro esempio ridicolo. 466 00:26:59,390 --> 00:27:03,075 Siri, tempo di carciofi armadillo ippopotamo New Haven? 467 00:27:03,075 --> 00:27:06,806 468 00:27:06,806 --> 00:27:08,400 >> SIRI: fammi controllare su questo. 469 00:27:08,400 --> 00:27:11,280 Ecco cosa ho trovato sul web per quello che sono i carciofi armadillo 470 00:27:11,280 --> 00:27:13,780 ippopotamo New Haven. 471 00:27:13,780 --> 00:27:14,760 >> BRIAN Scassellati: OK. 472 00:27:14,760 --> 00:27:20,400 Quindi, se vado abbastanza lontano lontano da questo modello, 473 00:27:20,400 --> 00:27:24,365 Sono in grado di confondere perché non corrisponde più il modello che ha. 474 00:27:24,365 --> 00:27:27,370 475 00:27:27,370 --> 00:27:29,390 E quello statistico motore che sta dicendo, 476 00:27:29,390 --> 00:27:32,850 qual è la probabilità che hai la parole ippopotamo e carciofi 477 00:27:32,850 --> 00:27:34,440 insieme, e armadillo? 478 00:27:34,440 --> 00:27:36,050 Questo è avuto modo di essere qualcosa di nuovo. 479 00:27:36,050 --> 00:27:38,840 480 00:27:38,840 --> 00:27:40,610 >> Così queste tecnologie che usiamo ogni giorno. 481 00:27:40,610 --> 00:27:43,670 482 00:27:43,670 --> 00:27:47,800 Se vogliamo fare loro un passo inoltre, anche se, se effettivamente 483 00:27:47,800 --> 00:27:53,930 vogliono essere in grado di parlare di ciò che è che questi sistemi stanno rispondendo, 484 00:27:53,930 --> 00:28:00,630 dobbiamo parlare, ancora una volta, su un insieme più fondamentale di domande. 485 00:28:00,630 --> 00:28:05,370 E questo è un argomento in comunicazione che chiamiamo question answering. 486 00:28:05,370 --> 00:28:07,028 Cioè, noi vogliamo essere in grado a-- sì? 487 00:28:07,028 --> 00:28:07,944 PUBBLICO: [incomprensibile]. 488 00:28:07,944 --> 00:28:10,789 489 00:28:10,789 --> 00:28:13,330 BRIAN Scassellati: Otteniamo in elaborazione semantica latente? 490 00:28:13,330 --> 00:28:14,070 Allora sì. 491 00:28:14,070 --> 00:28:17,820 Ci sono un sacco di cose che sono accadendo sotto la superficie con Siri 492 00:28:17,820 --> 00:28:20,210 e in alcuni degli esempi Io vado a mostrarvi prossimo 493 00:28:20,210 --> 00:28:22,610 dove c'è un bel po ' in termini di struttura 494 00:28:22,610 --> 00:28:25,260 di quello che stai dicendo che è importante. 495 00:28:25,260 --> 00:28:31,890 E, infatti, che è un grande precursore per la prossima diapositiva per me. 496 00:28:31,890 --> 00:28:35,110 >> Così nello stesso modo che la nostra il riconoscimento vocale è stato costruito 497 00:28:35,110 --> 00:28:39,620 di più livelli, se vogliamo capire che cosa è che in realtà 498 00:28:39,620 --> 00:28:44,620 Detto questo, stiamo andando a nuovo contare su un'analisi multistrato 499 00:28:44,620 --> 00:28:47,020 del testo che viene riconosciuto. 500 00:28:47,020 --> 00:28:52,560 Così, quando Siri è effettivamente in grado di per esempio, guardo ho trovato queste parole. 501 00:28:52,560 --> 00:28:55,230 Ora cosa devo fare con loro? 502 00:28:55,230 --> 00:28:59,110 Il primo componente è spesso passare il turno e cercare di analizzare 503 00:28:59,110 --> 00:29:03,010 la struttura della frase. 504 00:29:03,010 --> 00:29:05,410 E in quello che abbiamo visto in grado di scuola, spesso, 505 00:29:05,410 --> 00:29:08,920 come una sorta di diagrammi frasi, stiamo andando 506 00:29:08,920 --> 00:29:12,774 riconoscere che alcuni parole hanno certi ruoli. 507 00:29:12,774 --> 00:29:13,440 Questi sono sostantivi. 508 00:29:13,440 --> 00:29:14,231 Questi sono pronomi. 509 00:29:14,231 --> 00:29:16,200 Questi sono verbi. 510 00:29:16,200 --> 00:29:19,460 E stiamo andando a riconoscere che per un particolare grammatica, 511 00:29:19,460 --> 00:29:24,700 in questo caso grammatica, ci sono modi validi in cui io possa combinare 512 00:29:24,700 --> 00:29:26,280 e altri modi che non sono validi. 513 00:29:26,280 --> 00:29:29,920 514 00:29:29,920 --> 00:29:33,870 >> Tale riconoscimento, che la struttura, potrebbe essere sufficiente per aiutarci guidare 515 00:29:33,870 --> 00:29:36,720 un po. 516 00:29:36,720 --> 00:29:39,820 Ma non è abbastanza per noi essere in grado di dare 517 00:29:39,820 --> 00:29:43,290 qualsiasi senso a quello che viene detto qui. 518 00:29:43,290 --> 00:29:46,615 Per fare questo, dovremo fare affidamento su una certa quantità di elaborazione semantica. 519 00:29:46,615 --> 00:29:49,590 520 00:29:49,590 --> 00:29:55,080 Cioè, stiamo andando a guardare al di sotto quello che ognuna di queste parole 521 00:29:55,080 --> 00:29:57,400 in realtà porta come significato. 522 00:29:57,400 --> 00:30:01,150 E nel modo più semplice di fare questo, stiamo andando da associare a ogni parola 523 00:30:01,150 --> 00:30:06,930 che sappiamo una certa funzione, una certa trasformazione che 524 00:30:06,930 --> 00:30:09,300 permette di accadere. 525 00:30:09,300 --> 00:30:14,470 >> In questo caso, potremmo etichettare il parola "John" come un nome proprio, 526 00:30:14,470 --> 00:30:18,160 che porta con sé una identità. 527 00:30:18,160 --> 00:30:21,530 E potremmo etichettare "Maria", come allo stesso modo. 528 00:30:21,530 --> 00:30:27,900 Considerando che un verbo come "amori", che costituisce un particolare rapporto 529 00:30:27,900 --> 00:30:31,582 che siamo in grado di rappresentare. 530 00:30:31,582 --> 00:30:33,290 Ora, questo non significa che che abbiamo capito 531 00:30:33,290 --> 00:30:37,680 cos'è l'amore, ma solo che abbiamo capito nel modo di un sistema simbolico. 532 00:30:37,680 --> 00:30:40,480 Cioè, siamo in grado di etichettare e manipolarla. 533 00:30:40,480 --> 00:30:44,230 534 00:30:44,230 --> 00:30:49,120 >> Con ciascuno di questi tipi di approcci, qualsiasi tipo di elaborazione semantica 535 00:30:49,120 --> 00:30:57,060 qui sta per richiedere un po ' po 'di conoscenza e di un sacco di lavoro 536 00:30:57,060 --> 00:30:59,020 da parte nostra. 537 00:30:59,020 --> 00:31:03,590 Non siamo più nel regno dove le statistiche appena pianura 538 00:31:03,590 --> 00:31:07,320 stanno per essere abbastanza per noi. 539 00:31:07,320 --> 00:31:11,330 Ora, al fine di andare da questo punto di essere 540 00:31:11,330 --> 00:31:15,520 in grado di parlare l'interno cosa sta realmente accadendo qui, 541 00:31:15,520 --> 00:31:19,640 ad essere in grado di manipolare questo strutturare e capire una domanda 542 00:31:19,640 --> 00:31:23,160 e quindi poter per uscire e cercare, 543 00:31:23,160 --> 00:31:27,290 che richiede una maggiore modello cognitivo complesso. 544 00:31:27,290 --> 00:31:34,880 >> Il modo in cui questi sistemi sono costruiti è per la maggior parte molto, molto lavoro 545 00:31:34,880 --> 00:31:36,350 intensiva. 546 00:31:36,350 --> 00:31:39,490 Essi coinvolgono esseri umani spendere una grande quantità 547 00:31:39,490 --> 00:31:44,100 di tempo strutturare modi in che questi tipi di frasi 548 00:31:44,100 --> 00:31:47,270 può essere rappresentato in una logica. 549 00:31:47,270 --> 00:31:51,639 550 00:31:51,639 --> 00:31:53,430 Diventa ancora un po ' più complesso, però. 551 00:31:53,430 --> 00:31:56,400 552 00:31:56,400 --> 00:31:59,660 >> Anche una volta che abbiamo affrontato con la semantica, faremo 553 00:31:59,660 --> 00:32:03,860 devono ancora guardare il pragmatica di quello che viene detto. 554 00:32:03,860 --> 00:32:08,620 Cioè, come faccio mi relaziono le parole che devo qualcosa fisicamente 555 00:32:08,620 --> 00:32:12,054 là nel mondo o in almeno una fonte di informazione 556 00:32:12,054 --> 00:32:12,970 che posso manipolare? 557 00:32:12,970 --> 00:32:15,780 558 00:32:15,780 --> 00:32:20,790 >> A volte, queste portano a meravigliosi pezzi di ambiguità. 559 00:32:20,790 --> 00:32:24,470 "Red-hot stella a sposare astronomo." 560 00:32:24,470 --> 00:32:25,630 OK. 561 00:32:25,630 --> 00:32:28,540 Ora, si legge che il divertente tipo di titolo 562 00:32:28,540 --> 00:32:34,690 che avremmo visto in TV a tarda notte perché noi non interpretiamo "stella" 563 00:32:34,690 --> 00:32:38,630 per avere il suo significato corpo celeste. 564 00:32:38,630 --> 00:32:43,390 Sappiamo che significa che il più attore o attrice banale 565 00:32:43,390 --> 00:32:45,240 con elevate quantità di visibilità. 566 00:32:45,240 --> 00:32:47,770 567 00:32:47,770 --> 00:32:51,950 >> "Squad aiuta morso di cane vittima". 568 00:32:51,950 --> 00:32:55,550 E 'che la squadra è in realtà là fuori che assiste un cane 569 00:32:55,550 --> 00:32:59,620 ad andare in giro e mordere le vittime? 570 00:32:59,620 --> 00:33:02,380 O è che non c'era un individuo che era 571 00:33:02,380 --> 00:33:04,625 morso da un cane che aveva bisogno di aiuto? 572 00:33:04,625 --> 00:33:07,650 573 00:33:07,650 --> 00:33:11,480 Ma guardando la sintassi e la semantica delle frasi, 574 00:33:11,480 --> 00:33:14,660 non possiamo determinare che. 575 00:33:14,660 --> 00:33:22,000 >> "Elicottero alimentato da mosche umane." 576 00:33:22,000 --> 00:33:27,330 Vi sono, infatti, effettivo piccole cose che volano intorno 577 00:33:27,330 --> 00:33:34,510 sono persone con le ali alimentare elicotteri per il bene dell'umanità? 578 00:33:34,510 --> 00:33:38,960 O c'è un dispositivo meccanico che deriva il suo potere da una persona? 579 00:33:38,960 --> 00:33:41,600 580 00:33:41,600 --> 00:33:46,500 >> Quando guardiamo domanda sistemi di risposta, 581 00:33:46,500 --> 00:33:51,110 questi sono gli strati che dobbiamo affrontare. 582 00:33:51,110 --> 00:33:54,890 Ora, la migliore e la più specie di prevalente di questi sistemi 583 00:33:54,890 --> 00:34:00,640 oggi sono in grado di fare cose a un livello che sono 584 00:34:00,640 --> 00:34:05,050 ben oltre quello che avevamo 10 anni fa. 585 00:34:05,050 --> 00:34:08,210 Ecco uno dei migliori sistemi di che è là fuori oggi. 586 00:34:08,210 --> 00:34:10,519 E questo è un sistema IBM chiamato Watson. 587 00:34:10,519 --> 00:34:13,040 588 00:34:13,040 --> 00:34:15,500 Questo è da parte dei nostri amici a IBM. 589 00:34:15,500 --> 00:34:19,810 Si tratta di banche Katherine, Jia Chen, e Priscilla Moraes dandoci 590 00:34:19,810 --> 00:34:26,323 una dimostrazione di Watson ieri a IBM di Yorktown. 591 00:34:26,323 --> 00:34:26,989 [RIPRODUZIONE VIDEO] 592 00:34:26,989 --> 00:34:27,690 -Come stai? 593 00:34:27,690 --> 00:34:30,600 594 00:34:30,600 --> 00:34:31,980 >> -Sto bene. 595 00:34:31,980 --> 00:34:35,429 Sono sempre felice quando sono pensiero, soprattutto quando ho 596 00:34:35,429 --> 00:34:38,920 può mantenere il sangue freddo in queste sale server. 597 00:34:38,920 --> 00:34:40,170 -Chi È la tua attrice preferita? 598 00:34:40,170 --> 00:34:43,870 599 00:34:43,870 --> 00:34:47,555 >> -La Mia attrice preferita Angelina Jolie come Lara Croft 600 00:34:47,555 --> 00:34:54,800 in Tomb Raider, perché la sua originale forma era come un personaggio virtuale come me. 601 00:34:54,800 --> 00:34:56,760 >> -Come Può Watson aiutare i pazienti? 602 00:34:56,760 --> 00:34:59,700 603 00:34:59,700 --> 00:35:03,755 >> -È Il piano per i pazienti a avere accesso a Watson direttamente? 604 00:35:03,755 --> 00:35:08,050 L'accesso a Watson di consulenza applicazioni variano dai casi d'uso. 605 00:35:08,050 --> 00:35:12,630 Ma attualmente, Watson fornirà solo possibile diagnosi e trattamento 606 00:35:12,630 --> 00:35:14,725 opzioni per professionista medico. 607 00:35:14,725 --> 00:35:17,680 Se del caso, i pazienti possono fornire informazioni 608 00:35:17,680 --> 00:35:21,210 Watson, magari attraverso un interfaccia portale, tablet, 609 00:35:21,210 --> 00:35:23,500 o anche un telefono cellulare. 610 00:35:23,500 --> 00:35:27,180 Per esempio, un paziente può essere chiesto di descrivere i loro sintomi 611 00:35:27,180 --> 00:35:30,460 in linguaggio naturale direttamente in una soluzione Watson, 612 00:35:30,460 --> 00:35:34,050 permettendo al medico di concentrarsi su diagnosi e non raccolta dati. 613 00:35:34,050 --> 00:35:38,379 614 00:35:38,379 --> 00:35:42,716 >> -Chi Assassinato Abraham Lincoln? 615 00:35:42,716 --> 00:35:46,153 >> -John Wilkes Booth. 616 00:35:46,153 --> 00:35:52,373 >> -In Che anno ha fatto il Arizona Diamondbacks vincono le World Series? 617 00:35:52,373 --> 00:35:55,295 >> -2001. 618 00:35:55,295 --> 00:35:58,710 >> [FINE RIPRODUZIONE] 619 00:35:58,710 --> 00:36:01,610 >> BRIAN Scassellati: So questi tipi di sistemi 620 00:36:01,610 --> 00:36:07,430 contare su anzitutto riconoscendo il discorso; secondo, 621 00:36:07,430 --> 00:36:12,200 convertendolo in un interno significativo rappresentazione; e poi, terzo, 622 00:36:12,200 --> 00:36:17,090 essere in grado di uscire e trovare la fonte di informazioni che 623 00:36:17,090 --> 00:36:21,140 permette loro di rispondere a questa domanda. 624 00:36:21,140 --> 00:36:27,320 Questo livello di complessità comporta lo stesso tipo di cose programmatiche 625 00:36:27,320 --> 00:36:31,790 che sei stato facendo in insiemi di problemi. 626 00:36:31,790 --> 00:36:38,000 >> Siamo in grado di analizzare le richieste HTTP in lo stesso tipo di modello di basso livello 627 00:36:38,000 --> 00:36:40,810 corrispondenza che ELIZA può fare. 628 00:36:40,810 --> 00:36:45,070 Siamo in grado di convertire quelli in una rappresentazione interna, 629 00:36:45,070 --> 00:36:50,360 e poi usarli per interrogare alcuni database esterno, possibilmente utilizzando SQL. 630 00:36:50,360 --> 00:36:53,530 631 00:36:53,530 --> 00:36:56,260 Tutti i sistemi che sono in costruzione oggi 632 00:36:56,260 --> 00:37:00,520 per fare questo tipo di naturale comunicazione linguistica 633 00:37:00,520 --> 00:37:04,100 sono in costruzione su questi stessi principi. 634 00:37:04,100 --> 00:37:09,530 >> Ora, anche un sistema come Watson non è abbastanza complessa 635 00:37:09,530 --> 00:37:14,820 essere in grado di rispondere arbitraria domande su qualsiasi argomento. 636 00:37:14,820 --> 00:37:20,060 Ed infatti, devono essere strutturato all'interno di un determinato dominio. 637 00:37:20,060 --> 00:37:24,440 Così si può andare on-line e si può trovare versioni di Watson che operano bene 638 00:37:24,440 --> 00:37:27,700 all'interno informatica medica. 639 00:37:27,700 --> 00:37:31,490 Oppure c'è una linea che si occupa solo di come 640 00:37:31,490 --> 00:37:34,540 di fare buone raccomandazioni circa cosa birra andrà con cui il cibo. 641 00:37:34,540 --> 00:37:37,060 642 00:37:37,060 --> 00:37:41,870 E all'interno di tali domini, può rispondere alle domande, 643 00:37:41,870 --> 00:37:46,130 trovare le informazioni di cui ha bisogno. 644 00:37:46,130 --> 00:37:48,270 >> Ma non si può mescolare e abbinarli. 645 00:37:48,270 --> 00:37:53,150 Il sistema che è stato addestrato con il database di cibo e birra 646 00:37:53,150 --> 00:37:56,830 non funziona bene quando improvvisamente metterlo in con il medico informatico 647 00:37:56,830 --> 00:37:59,770 Database. 648 00:37:59,770 --> 00:38:05,680 Così anche i nostri migliori sistemi di oggi contare su un livello di elaborazione 649 00:38:05,680 --> 00:38:11,570 in cui ci troviamo codifica manuale e la costruzione nelle infrastrutture, al fine 650 00:38:11,570 --> 00:38:13,275 per far correre questo sistema. 651 00:38:13,275 --> 00:38:16,360 652 00:38:16,360 --> 00:38:20,710 >> Ora, l'ultimo argomento voglio per poter arrivare a oggi 653 00:38:20,710 --> 00:38:23,960 è sulla comunicazione non verbale. 654 00:38:23,960 --> 00:38:29,290 Una grande massa di informazioni che comunichiamo con l'altro 655 00:38:29,290 --> 00:38:35,490 non avvenire attraverso il singole parole che stiamo applicando. 656 00:38:35,490 --> 00:38:40,290 Ha a che fare con cose come vicinanza, lo sguardo, il tono di voce, 657 00:38:40,290 --> 00:38:42,270 la tua inflessione. 658 00:38:42,270 --> 00:38:46,620 E che la comunicazione è anche qualcosa che molte interfacce differenti 659 00:38:46,620 --> 00:38:49,960 cura molto su. 660 00:38:49,960 --> 00:38:51,500 Non è quello che Siri si preoccupa. 661 00:38:51,500 --> 00:38:56,250 Posso chiedere Siri qualcosa in una sola voce o in un altro tono, 662 00:38:56,250 --> 00:38:59,840 e Siri sta per mi danno la stessa risposta. 663 00:38:59,840 --> 00:39:05,260 Ma questo non è ciò che costruiamo per molti altri tipi di interfacce. 664 00:39:05,260 --> 00:39:09,120 >> Voglio presentarvi ora uno dei robot. 665 00:39:09,120 --> 00:39:12,720 Questo è stato costruito da mia lunga data amico e collega Cynthia 666 00:39:12,720 --> 00:39:16,010 Breazeal e la sua compagnia Jibo. 667 00:39:16,010 --> 00:39:20,090 E questo robot-- stiamo andando di avere un paio di volontari 668 00:39:20,090 --> 00:39:22,520 venire a interagire con questo. 669 00:39:22,520 --> 00:39:26,200 Così posso avere due persone disposte per giocare con il robot per me? 670 00:39:26,200 --> 00:39:29,936 Perché non vieni su, e perché non si arriva su un massimo. 671 00:39:29,936 --> 00:39:31,310 Se desideri unirsi a me qui, per favore. 672 00:39:31,310 --> 00:39:36,520 673 00:39:36,520 --> 00:39:39,670 >> E se potessi averti venire proprio qui. 674 00:39:39,670 --> 00:39:40,170 Grazie. 675 00:39:40,170 --> 00:39:40,480 Salve. 676 00:39:40,480 --> 00:39:41,400 >> ALFREDO: Piacere di conoscerti. 677 00:39:41,400 --> 00:39:42,010 Alfredo. 678 00:39:42,010 --> 00:39:42,520 >> BRIAN Scassellati: Alfredo. 679 00:39:42,520 --> 00:39:43,146 >> RACHEL: Rachel. 680 00:39:43,146 --> 00:39:44,228 BRIAN Scassellati: Rachel. 681 00:39:44,228 --> 00:39:45,154 Piacere di conoscerti entrambi. 682 00:39:45,154 --> 00:39:46,820 Alfredo, ho intenzione di avere di andare prima. 683 00:39:46,820 --> 00:39:47,990 Vieni a destra qui. 684 00:39:47,990 --> 00:39:51,870 Ho intenzione di presentare you-- se posso ottenere questo fuori 685 00:39:51,870 --> 00:39:58,450 senza bussare la microphone-- di un piccolo robot di nome Jibo. 686 00:39:58,450 --> 00:40:00,140 ok? 687 00:40:00,140 --> 00:40:04,260 >> Ora, Jibo è progettato per essere interattivo. 688 00:40:04,260 --> 00:40:09,339 E anche se può dare la parola, molto dell'interazione con il robot 689 00:40:09,339 --> 00:40:09,880 è non verbale. 690 00:40:09,880 --> 00:40:12,450 691 00:40:12,450 --> 00:40:17,070 Alfredo, ho intenzione di chiedere di dire qualcosa di bello e gratuito 692 00:40:17,070 --> 00:40:19,554 al robot, per favore. 693 00:40:19,554 --> 00:40:20,845 ALFREDO: Penso che si guarda carino. 694 00:40:20,845 --> 00:40:24,114 695 00:40:24,114 --> 00:40:25,611 >> [Ronzio] 696 00:40:25,611 --> 00:40:26,192 697 00:40:26,192 --> 00:40:27,108 BRIAN Scassellati: OK. 698 00:40:27,108 --> 00:40:30,110 699 00:40:30,110 --> 00:40:33,180 La sua risposta non è verbale. 700 00:40:33,180 --> 00:40:35,180 Eppure ti ha dato tanto un chiaro riconoscimento 701 00:40:35,180 --> 00:40:39,680 che aveva sentito quello che hai detto e anche in qualche modo capito che. 702 00:40:39,680 --> 00:40:40,530 ok? 703 00:40:40,530 --> 00:40:42,070 Passo terzino destro qui per un secondo. 704 00:40:42,070 --> 00:40:43,130 Grazie. 705 00:40:43,130 --> 00:40:44,090 >> Rachel, se si farebbe. 706 00:40:44,090 --> 00:40:46,070 Ora, ho intenzione di dare il lavoro molto più difficile. 707 00:40:46,070 --> 00:40:48,361 Se desideri stare proprio qui, eseguire il backup solo un po 'così 708 00:40:48,361 --> 00:40:50,280 siamo in grado di ottenere sulla fotocamera e guardare in questo modo. 709 00:40:50,280 --> 00:40:56,840 Sto per chiederle di dire qualcosa significa veramente brutto e al robot. 710 00:40:56,840 --> 00:41:02,900 >> RACHEL: Quello che hai appena sembravi fare era completamente assurdo. 711 00:41:02,900 --> 00:41:03,840 >> [Ronzio] 712 00:41:03,840 --> 00:41:07,610 713 00:41:07,610 --> 00:41:09,030 >> Questo era ancora più assurdo. 714 00:41:09,030 --> 00:41:10,120 Che ti succede? 715 00:41:10,120 --> 00:41:13,487 716 00:41:13,487 --> 00:41:16,207 Oh, non mi sento male. 717 00:41:16,207 --> 00:41:17,040 Ti darò un abbraccio. 718 00:41:17,040 --> 00:41:19,882 719 00:41:19,882 --> 00:41:21,090 BRIAN Scassellati: Va bene. 720 00:41:21,090 --> 00:41:22,280 Grazie, Rachel. 721 00:41:22,280 --> 00:41:24,565 Alfredo, Rachel, grazie ragazzi molto. 722 00:41:24,565 --> 00:41:26,840 >> [APPLAUSI] 723 00:41:26,840 --> 00:41:28,660 724 00:41:28,660 --> 00:41:34,470 >> Quindi questo tipo di interazione ha in molti modi alcune delle stesse regole 725 00:41:34,470 --> 00:41:36,950 e alcuni degli stessi struttura come quello che abbiamo 726 00:41:36,950 --> 00:41:39,950 potrebbe avere in interazione linguistica. 727 00:41:39,950 --> 00:41:44,530 E 'sia comunicativo e serve uno scopo importante. 728 00:41:44,530 --> 00:41:48,590 E che l'interazione, in per molti versi, è stato progettato 729 00:41:48,590 --> 00:41:52,890 per avere un effetto particolare sulla persona che interagisce con o ascoltare 730 00:41:52,890 --> 00:41:54,410 al robot. 731 00:41:54,410 --> 00:41:56,450 >> Ora, io sono abbastanza fortunato avere Jibo qui oggi. 732 00:41:56,450 --> 00:42:00,550 Sam Spaulding è qui per aiutare noi con il robot. 733 00:42:00,550 --> 00:42:07,470 E ho intenzione di chiedere a Sam di dare noi uno bella demo di Jibo danza 734 00:42:07,470 --> 00:42:09,720 che possiamo guardare alla fine qui. 735 00:42:09,720 --> 00:42:10,590 Quindi, andare avanti, Jibo. 736 00:42:10,590 --> 00:42:11,550 >> SAM: OK, Jibo. 737 00:42:11,550 --> 00:42:14,430 Mostraci i tuoi passi di danza. 738 00:42:14,430 --> 00:42:17,310 >> [RIPRODUZIONE DI BRANI MUSICALI] 739 00:42:17,310 --> 00:42:43,114 740 00:42:43,114 --> 00:42:44,780 BRIAN Scassellati: Va bene, tutti. 741 00:42:44,780 --> 00:42:46,865 Grazie ai nostri amici di Jibo. 742 00:42:46,865 --> 00:42:49,426 >> [APPLAUSI] 743 00:42:49,426 --> 00:42:50,140 744 00:42:50,140 --> 00:42:54,990 >> E grazie ai nostri amici a IBM per aiutare fuori oggi. 745 00:42:54,990 --> 00:42:57,300 La comunicazione è qualcosa che si sta andando 746 00:42:57,300 --> 00:43:02,280 per vedere fino a venire sempre più come costruiamo interfacce più complesse. 747 00:43:02,280 --> 00:43:05,760 La prossima settimana, parleremo su come interfacciare 748 00:43:05,760 --> 00:43:08,890 con avversari controllati dal computer nei giochi. 749 00:43:08,890 --> 00:43:12,950 Ma se avete domande su questo, Sarò in giro a orario d'ufficio stasera. 750 00:43:12,950 --> 00:43:17,610 Sono felice di parlare con te di AI argomenti o per entrare in modo più dettagliato. 751 00:43:17,610 --> 00:43:18,927 Buon fine settimana. 752 00:43:18,927 --> 00:43:21,409 >> [APPLAUSI] 753 00:43:21,409 --> 00:43:21,909 754 00:43:21,909 --> 00:43:26,141 [RIPRODUZIONE DI BRANI MUSICALI] 755 00:43:26,141 --> 00:46:42,879