1
00:00:00,000 --> 00:00:02,928
>> [Música tocando]

2
00:00:02,928 --> 00:00:11,230

3
00:00:11,230 --> 00:00:12,790
>> DAVID MALAN: Este é CS50.

4
00:00:12,790 --> 00:00:14,072
Este é o fim de semana 10.

5
00:00:14,072 --> 00:00:16,030
E o menino, que temos um
classe boa para você hoje.

6
00:00:16,030 --> 00:00:20,040
Estamos tão animado para convidar dois
nossos amigos de Yale até nós hoje

7
00:00:20,040 --> 00:00:23,920
e a olhar para a intersecção de
inteligência artificial, robótica,

8
00:00:23,920 --> 00:00:25,710
processamento de linguagem natural, e muito mais.

9
00:00:25,710 --> 00:00:27,090
>> E, de fato, sobre o
últimas semanas, temos

10
00:00:27,090 --> 00:00:29,714
certamente passou muito tempo,
especialmente nas Série de Exercícios anteriores,

11
00:00:29,714 --> 00:00:31,560
concentrando-se em belos detalhes de baixo nível.

12
00:00:31,560 --> 00:00:34,520
E é muito fácil perder de vista
da floresta para as árvores

13
00:00:34,520 --> 00:00:38,170
e ficam penduradas sobre loops e condições
e ponteiros, com certeza, e assim por diante.

14
00:00:38,170 --> 00:00:41,770
Mas a realidade é que vocês têm agora a
ingredientes com os quais você pode realmente

15
00:00:41,770 --> 00:00:45,300
resolver alguns problemas interessantes, entre
eles os que os nossos amigos na Yale

16
00:00:45,300 --> 00:00:48,790
trabalhar em apenas tímido de Cambridge.

17
00:00:48,790 --> 00:00:52,410
>> Assim, permitam-me primeiro a introduzir a nossa cabeça
assistente de ensino de Yale, Andy.

18
00:00:52,410 --> 00:00:55,182
>> [Aplausos]

19
00:00:55,182 --> 00:00:57,030

20
00:00:57,030 --> 00:01:00,710
>> ANDY: Primeiro de tudo, apenas agradecer
por permitir que um casal Yalies

21
00:01:00,710 --> 00:01:02,700
a estalar em baixo para Cambridge hoje.

22
00:01:02,700 --> 00:01:05,299
Nós realmente aprecio isso.

23
00:01:05,299 --> 00:01:07,090
Em segundo lugar, para nossos amigos
volta casa-- Jason,

24
00:01:07,090 --> 00:01:09,670
Obrigado por ficar e correr palestra.

25
00:01:09,670 --> 00:01:12,970
Esperança é tudo de bom em New Haven.

26
00:01:12,970 --> 00:01:15,720
>> Então sim, eu estou super animado
introduzir SCAZ hoje.

27
00:01:15,720 --> 00:01:17,020
SCAZ corre o laboratório de robótica.

28
00:01:17,020 --> 00:01:19,690
Ele é um professor de, como, cinco
diferentes departamentos em Yale.

29
00:01:19,690 --> 00:01:23,159
Em seu laboratório, ele tem muitos, muitos
robôs que ele gosta de jogar com.

30
00:01:23,159 --> 00:01:24,950
Ele tem, como, a
mais legal emprego do mundo.

31
00:01:24,950 --> 00:01:27,116
E ele começa a tipo de confusão
em torno de todo o dia com que

32
00:01:27,116 --> 00:01:29,090
longo e fazer algum trabalho, também.

33
00:01:29,090 --> 00:01:33,070
>> E assim nós, na verdade trouxe uma
de-los para baixo com a gente hoje.

34
00:01:33,070 --> 00:01:36,900
Assim, sem mais delongas, é SCAZ
indo para ir em frente e introduzir-nos

35
00:01:36,900 --> 00:01:38,660
ao seu amigo robô.

36
00:01:38,660 --> 00:01:41,546
>> [Aplausos]

37
00:01:41,546 --> 00:01:42,935

38
00:01:42,935 --> 00:01:44,310
BRIAN Scassellati: Obrigado, David.

39
00:01:44,310 --> 00:01:45,380
Obrigado, Andy.

40
00:01:45,380 --> 00:01:50,050
É tão maravilhoso estar
aqui com todo mundo hoje.

41
00:01:50,050 --> 00:01:56,490
Quero primeiro ser muito claro que
a equipe CS50 aqui em Cambridge

42
00:01:56,490 --> 00:01:59,190
tem sido incrivelmente hospitaleiro para nós.

43
00:01:59,190 --> 00:02:02,130
Nós somos tão gratos por tudo
eles fizeram para nos apoiar.

44
00:02:02,130 --> 00:02:05,690
E assim nós gostaríamos de ser capaz
para retribuir a gentileza.

45
00:02:05,690 --> 00:02:09,370
>> Então, hoje, nós começamos a anunciar
que nós vamos ter um novo,

46
00:02:09,370 --> 00:02:15,240
one-of-a-kind evento CS50
acontecendo em New Haven na próxima semana.

47
00:02:15,240 --> 00:02:18,040
E essa é a Research Expo CS50.

48
00:02:18,040 --> 00:02:21,300
Então, nós estamos indo para ser convidativo
everyone-- CS50 alunos,

49
00:02:21,300 --> 00:02:26,510
funcionários de ambos Harvard e Yale-- para
descer e visitar-nos na sexta-feira.

50
00:02:26,510 --> 00:02:30,400
Nós vamos ter uma grande variedade de mais de
30 pessoas diferentes que apresentam

51
00:02:30,400 --> 00:02:34,830
e upperclassmen exhibiting-- mostrando
fora alguns de seus produtos de pesquisa.

52
00:02:34,830 --> 00:02:38,480
Nós vamos ter algumas startups, mesmo, à procura
para um pouco de novos talentos tecnologia,

53
00:02:38,480 --> 00:02:40,460
startups de ambos Harvard e Yale.

54
00:02:40,460 --> 00:02:44,550
E nós vamos ter alguns grupos de estudantes
procurando alguma nova associação.

55
00:02:44,550 --> 00:02:46,357
>> Vai ser um momento muito emocionante.

56
00:02:46,357 --> 00:02:49,190
Esperemos que aqueles de vocês que são
descendo para o jogo Harvard-Yale

57
00:02:49,190 --> 00:02:51,360
será capaz de parar
por um pouco mais cedo,

58
00:02:51,360 --> 00:02:54,060
mesmo no centro de campus,
Sterling Memorial Library.

59
00:02:54,060 --> 00:02:58,040
Nós vamos ter um conjunto de
exposições que vão desde autónoma

60
00:02:58,040 --> 00:03:04,460
veleiros para formas de utilização de software
para preservar manuscritos medievais.

61
00:03:04,460 --> 00:03:07,860
>> Nós vamos ter de anúncios
networking hoc e pessoas

62
00:03:07,860 --> 00:03:11,230
ensino de codificação de software em Cape Town.

63
00:03:11,230 --> 00:03:13,730
Teremos computador
manifestações musicais.

64
00:03:13,730 --> 00:03:16,020
E nós vamos, naturalmente, mais robôs.

65
00:03:16,020 --> 00:03:18,900
Então, nós esperamos que você vai
se juntar a nós para este evento.

66
00:03:18,900 --> 00:03:21,350
Ele deve ser um monte de
divertimento, um pouco de comida,

67
00:03:21,350 --> 00:03:24,430
e um monte de interessante
coisas para falar.

68
00:03:24,430 --> 00:03:28,230
>> Então, hoje, nós estamos indo falar
cerca de processamento de linguagem natural.

69
00:03:28,230 --> 00:03:32,560
E esta é a tentativa para nós
para construir uma nova forma de interagir

70
00:03:32,560 --> 00:03:35,150
com nossos dispositivos, pois
para as últimas semanas,

71
00:03:35,150 --> 00:03:40,800
você foi focado em como é que
você pode escrever código, escrever software

72
00:03:40,800 --> 00:03:47,110
que é uma maneira de ser capaz de dizer a um
máquina, é isso que eu quero que você faça.

73
00:03:47,110 --> 00:03:50,210
>> Mas não devemos precisar
esperar que tudo

74
00:03:50,210 --> 00:03:53,760
que está lá fora que é usado
por todos no mundo

75
00:03:53,760 --> 00:03:57,480
vai ser proficiente
neste tipo de instrução.

76
00:03:57,480 --> 00:04:02,540
Assim, podemos distinguir entre o computador
linguagens e languages-- naturais

77
00:04:02,540 --> 00:04:06,720
isto é, coisas que os seres humanos usam
para comunicar com outros seres humanos.

78
00:04:06,720 --> 00:04:12,270
E nós tentamos construir interfaces que usam
estes mecanismos naturais de comunicação.

79
00:04:12,270 --> 00:04:16,029
>> Agora, como qualquer outro tópico
que nós começamos com em CS50,

80
00:04:16,029 --> 00:04:19,589
vamos começar com o mais simples
bit de processamento de linguagem natural

81
00:04:19,589 --> 00:04:21,269
que podemos imaginar.

82
00:04:21,269 --> 00:04:24,940
Nós vamos começar com a
parte histórica da linguagem natural.

83
00:04:24,940 --> 00:04:28,740
E então nós vamos construir até
sistemas mais e mais recentes

84
00:04:28,740 --> 00:04:31,450
e tem algumas demos de diversão ao longo do caminho.

85
00:04:31,450 --> 00:04:35,900
>> Então, vamos começar com o que foi
provavelmente a primeira linguagem natural

86
00:04:35,900 --> 00:04:38,210
sistema de processamento.

87
00:04:38,210 --> 00:04:45,080
Este foi um sistema de software escrito em
1966 por Joseph Weizenbaum chamado ELIZA.

88
00:04:45,080 --> 00:04:49,640
E Eliza foi concebido para
replicar o tipo de interação

89
00:04:49,640 --> 00:04:53,850
você teria com um
Psicoterapeuta Rogerian.

90
00:04:53,850 --> 00:04:57,210
Agora, os Rogerians, tinham
uma idéia que a psicoterapia

91
00:04:57,210 --> 00:05:02,800
envolvidos serem capazes de refletir de volta
a um paciente e falar com eles,

92
00:05:02,800 --> 00:05:08,100
basicamente, de apenas dando-lhes um
pouquinho do terapeuta.

93
00:05:08,100 --> 00:05:09,920
Isto é, tudo
que o terapeuta disse

94
00:05:09,920 --> 00:05:16,500
era suposto ser apenas um reflexo da
o que o paciente estava dizendo a eles.

95
00:05:16,500 --> 00:05:18,990
>> Então, vamos tentar e demonstrar isso.

96
00:05:18,990 --> 00:05:22,820
Será que temos um voluntário que seria
dispostos a compartilhar seu mais profundo,

97
00:05:22,820 --> 00:05:26,650
mais escuros, e / ou segredos falsos com ELIZA?

98
00:05:26,650 --> 00:05:29,680
Claro, por que você não vem em cima.

99
00:05:29,680 --> 00:05:30,847
Fantástico.

100
00:05:30,847 --> 00:05:31,430
E o seu nome?

101
00:05:31,430 --> 00:05:32,000
>> MILES: Miles.

102
00:05:32,000 --> 00:05:33,041
>> BRIAN Scassellati: Miles.

103
00:05:33,041 --> 00:05:34,270
Prazer em conhecê-lo, Miles.

104
00:05:34,270 --> 00:05:36,270
Se você segurar isso.

105
00:05:36,270 --> 00:05:40,840
E nós estamos indo para
usar uma versão de ELIZA

106
00:05:40,840 --> 00:05:44,640
que temos replicada
dentro do IDE CS50.

107
00:05:44,640 --> 00:05:47,140
E nós vamos olhar para a fonte
código para isso em pouco tempo.

108
00:05:47,140 --> 00:05:49,910
Mas, por agora, nós somos apenas
indo para invocá-lo digitando eliza.

109
00:05:49,910 --> 00:05:55,480
>> ELIZA e vai dar-lhe as respostas
que vão estar em todas as capitais.

110
00:05:55,480 --> 00:05:57,950
E vai lhe fazer algumas perguntas.

111
00:05:57,950 --> 00:06:02,130
E nós vamos responder e digite
em respostas a ELIZA.

112
00:06:02,130 --> 00:06:04,310
Então ELIZA disse: "Oi, eu sou ELIZA.

113
00:06:04,310 --> 00:06:05,462
Qual o seu problema?"

114
00:06:05,462 --> 00:06:08,092
O que você gostaria de
ELIZA dizer sobre hoje?

115
00:06:08,092 --> 00:06:10,750
>> MILES: Eu só posso adormecer
se eu tenho pantufas de coelhinho diante.

116
00:06:10,750 --> 00:06:12,440
>> BRIAN Scassellati: Tudo bem.

117
00:06:12,440 --> 00:06:13,360
Tudo certo.

118
00:06:13,360 --> 00:06:15,300
>> [RISO]

119
00:06:15,300 --> 00:06:22,410
>> "Eu só posso adormecer
com pantufas de coelhinho sobre ".

120
00:06:22,410 --> 00:06:29,000
ELIZA e diz: "Diga, você
tem problemas psicológicos?

121
00:06:29,000 --> 00:06:30,450
Talvez este seja um bom indicador. "

122
00:06:30,450 --> 00:06:30,780
>> ESTÁ BEM.

123
00:06:30,780 --> 00:06:32,245
Então, o que você gostaria de responder?

124
00:06:32,245 --> 00:06:36,110

125
00:06:36,110 --> 00:06:36,970
>> MILES: Sim.

126
00:06:36,970 --> 00:06:38,660
>> BRIAN Scassellati: Sim.

127
00:06:38,660 --> 00:06:39,570
Homem de muitas palavras.

128
00:06:39,570 --> 00:06:41,870
Eu gosto disso.

129
00:06:41,870 --> 00:06:50,200
Eliza diz: "Você parece bastante positiva."

130
00:06:50,200 --> 00:06:53,200
>> MILES: Não, eu sou, de fato, um elétron.

131
00:06:53,200 --> 00:06:55,150
>> BRIAN Scassellati: "No.

132
00:06:55,150 --> 00:07:02,240
Na verdade, eu sou um elétron. "
"Você veio para me

133
00:07:02,240 --> 00:07:06,954
porque você é um elétron? "

134
00:07:06,954 --> 00:07:08,870
Agora, podemos ver alguns dos
o coisas- eu vou

135
00:07:08,870 --> 00:07:10,200
para fazer uma pausa por apenas um segundo, Miles.

136
00:07:10,200 --> 00:07:11,010
Não ir a qualquer lugar.

137
00:07:11,010 --> 00:07:12,650
Nós não terminamos com você ainda.

138
00:07:12,650 --> 00:07:16,490
ELIZA é, em alguns aspectos,
responder a certas coisas

139
00:07:16,490 --> 00:07:21,140
que ele está dizendo, mas sem
qualquer entendimento real.

140
00:07:21,140 --> 00:07:26,090
E também está repetindo de volta alguns
das partes da sua sentença.

141
00:07:26,090 --> 00:07:27,310
>> Por isso, disse, "No.

142
00:07:27,310 --> 00:07:29,090
Na verdade, eu sou um elétron. "

143
00:07:29,090 --> 00:07:34,190
Eliza respondeu de volta, "Você veio
para mim, porque você é um elétron? "

144
00:07:34,190 --> 00:07:34,690
Tudo certo.

145
00:07:34,690 --> 00:07:36,050
Vamos dar mais uma resposta aqui.

146
00:07:36,050 --> 00:07:37,140
Dê-lhe uma boa, Miles.

147
00:07:37,140 --> 00:07:37,806
>> MILES: Good one?

148
00:07:37,806 --> 00:07:48,400

149
00:07:48,400 --> 00:07:49,570
>> Sim, por favor me ajude.

150
00:07:49,570 --> 00:07:50,570
BRIAN Scassellati: "Sim.

151
00:07:50,570 --> 00:07:58,010
Por favor, me ajude. "" Você tem certeza? "

152
00:07:58,010 --> 00:07:58,510
MILES: Não.

153
00:07:58,510 --> 00:08:00,860
BRIAN Scassellati: Não.

154
00:08:00,860 --> 00:08:03,562
"O que isso sugere a você?"

155
00:08:03,562 --> 00:08:06,760
>> MILES: Eu não posso ser um elétron.

156
00:08:06,760 --> 00:08:11,170
>> BRIAN Scassellati: "Eu
pode não ser um elétron. "

157
00:08:11,170 --> 00:08:13,790
"Você está dizendo que não apenas a ser negativo?"

158
00:08:13,790 --> 00:08:14,390
>> Tudo certo.

159
00:08:14,390 --> 00:08:16,030
Então, Miles, muito obrigado.

160
00:08:16,030 --> 00:08:16,860
>> MILES: Obrigado.

161
00:08:16,860 --> 00:08:18,360
>> BRIAN Scassellati: Muito obrigado.

162
00:08:18,360 --> 00:08:20,230
[Aplausos]

163
00:08:20,230 --> 00:08:21,230

164
00:08:21,230 --> 00:08:26,700
>> Portanto, este programa ELIZA, de muitas maneiras,
responde apenas às peças

165
00:08:26,700 --> 00:08:32,730
que estamos oferecendo, sem qualquer profundidade
compreensão do que está acontecendo aqui.

166
00:08:32,730 --> 00:08:36,640
Este é um tipo de sistema
chamado de correspondência de padrões, onde

167
00:08:36,640 --> 00:08:40,490
estamos à procura de certa
pedaços de texto que estamos em seguida,

168
00:08:40,490 --> 00:08:44,860
vai levar para fora do que
foi fornecida como entrada,

169
00:08:44,860 --> 00:08:52,580
convertê-lo, potencialmente, de alguma forma,
e depois devolvê-lo para o usuário.

170
00:08:52,580 --> 00:08:55,150
>> Algum de vocês pensam
ELIZA que é realmente

171
00:08:55,150 --> 00:08:58,230
realizando psicanálise válido aqui?

172
00:08:58,230 --> 00:08:59,250
Uma pessoa, talvez.

173
00:08:59,250 --> 00:09:00,166
>> AUDIÊNCIA: [inaudível].

174
00:09:00,166 --> 00:09:03,315

175
00:09:03,315 --> 00:09:05,440
BRIAN Scassellati: E como
isso faz você se sentir?

176
00:09:05,440 --> 00:09:06,530
Sim, de fato, ele faz.

177
00:09:06,530 --> 00:09:10,890
E vamos ver, na verdade, a
código-fonte para ele em apenas um momento.

178
00:09:10,890 --> 00:09:13,580
E assim você vai ser
capaz de fazer exatamente isso.

179
00:09:13,580 --> 00:09:17,420
>> Agora, Eliza é uma forma daquilo
que chamaríamos hoje de um bot de bate-papo.

180
00:09:17,420 --> 00:09:19,950
Ele só vai através do
texto que você está fornecendo,

181
00:09:19,950 --> 00:09:24,030
fornece a quantidade mínimo
de compreensão ou de transformação,

182
00:09:24,030 --> 00:09:26,790
e, em seguida, papagaios-lo de volta para você.

183
00:09:26,790 --> 00:09:31,830
Então, vamos dar uma olhada,
conceitualmente, e falar sobre o que

184
00:09:31,830 --> 00:09:34,690
é que ELIZA está realmente fazendo.

185
00:09:34,690 --> 00:09:42,000
>> ELIZA está tomando um let sentence--
dizer: "Eu quero impressionar o meu chefe."

186
00:09:42,000 --> 00:09:45,130
E ELIZA está olhando
através de que a sentença

187
00:09:45,130 --> 00:09:48,730
e tentando encontrar e
coincidir com certos padrões.

188
00:09:48,730 --> 00:09:52,850
Assim, por exemplo, um dos padrões
ELIZA que está procurando são as palavras

189
00:09:52,850 --> 00:09:55,110
"Eu quero."

190
00:09:55,110 --> 00:09:59,330
E a qualquer momento se vê algo
que tem "eu quero" nele,

191
00:09:59,330 --> 00:10:01,770
formula uma resposta.

192
00:10:01,770 --> 00:10:05,040
E essa resposta é uma string fixa.

193
00:10:05,040 --> 00:10:07,915
Neste caso, é "por que você quer?"

194
00:10:07,915 --> 00:10:11,330
E eu coloquei uma pequena estrela na
o fim, porque isso é apenas

195
00:10:11,330 --> 00:10:13,310
o início da nossa resposta.

196
00:10:13,310 --> 00:10:16,310
E o asterisco indica que
vamos levar o resto

197
00:10:16,310 --> 00:10:19,850
de utterance-- do usuário
"para impressionar o meu patrão" -

198
00:10:19,850 --> 00:10:24,500
e nós estamos indo para acrescentar que
para o final dessa seqüência.

199
00:10:24,500 --> 00:10:28,990
>> Então, agora, ao invés de dizer, "por
você quer impressionar o meu chefe ",

200
00:10:28,990 --> 00:10:31,800
há um pouco de adicional
processamento que nós vamos fazer.

201
00:10:31,800 --> 00:10:34,440
Ou seja, nós vamos ter que
converter alguns dos pronomes

202
00:10:34,440 --> 00:10:38,670
aqui a partir de "meu chefe" para "seu chefe."

203
00:10:38,670 --> 00:10:41,300
E pode haver alguns outros
mudanças que precisamos fazer.

204
00:10:41,300 --> 00:10:44,990
Então, ao invés de apenas furando-
diretamente para o final, o que vamos fazer

205
00:10:44,990 --> 00:10:49,160
é que vamos levar o resto do
utterance-- do usuário em branco aqui--

206
00:10:49,160 --> 00:10:54,090
e nós vamos levá-lo uma peça de
um tempo e converter cada seqüência

207
00:10:54,090 --> 00:10:58,180
forma, cada palavra, na sentença.

208
00:10:58,180 --> 00:10:59,580
>> Então, vamos tomar a palavra "para".

209
00:10:59,580 --> 00:11:01,650
Não há nenhuma conversão
que temos de fazer isso.

210
00:11:01,650 --> 00:11:02,340
"Impressionar."

211
00:11:02,340 --> 00:11:04,140
Não há nenhuma conversão
o que precisamos fazer lá.

212
00:11:04,140 --> 00:11:06,670
"Meu" irá converter para "seu".

213
00:11:06,670 --> 00:11:10,070
E "chefe" vamos deixar como "chefe".

214
00:11:10,070 --> 00:11:12,740
E, em seguida, finalmente, nada
que termina com um período,

215
00:11:12,740 --> 00:11:16,640
vamos convertê-lo em uma pergunta.

216
00:11:16,640 --> 00:11:22,600
>> Este padrão de correspondência muito simples
é realmente muito bem sucedido.

217
00:11:22,600 --> 00:11:27,260
E quando este foi introduzido
em 1966-- Joseph Weizenbaum

218
00:11:27,260 --> 00:11:28,986
programado isso em um computador.

219
00:11:28,986 --> 00:11:31,110
Agora, os computadores naquela época
não eram modelos desktop.

220
00:11:31,110 --> 00:11:33,950
Eles estavam de recursos compartilhados.

221
00:11:33,950 --> 00:11:39,090
E seus alunos seria
ir e conversar com ELIZA.

222
00:11:39,090 --> 00:11:41,570
Eventualmente, ele teve que
restringir o acesso a ele

223
00:11:41,570 --> 00:11:43,890
porque seus alunos não eram
recebendo todo o trabalho feito.

224
00:11:43,890 --> 00:11:46,190
Eles estavam apenas conversando com ELIZA.

225
00:11:46,190 --> 00:11:48,850
E, de fato, ele teve que
disparar sua assistente, que

226
00:11:48,850 --> 00:11:55,840
gastou todo o seu tempo conversando com ELIZA
sobre seus problemas profundos e preocupantes.

227
00:11:55,840 --> 00:12:00,350
>> Todos os que usaram estes sistemas
começou a antropomorfizar-los.

228
00:12:00,350 --> 00:12:04,490
Eles começaram a pensar neles como
sendo animado e pessoas reais.

229
00:12:04,490 --> 00:12:07,969
Eles começaram a reconhecer alguns dos
as coisas que eles estavam dizendo

230
00:12:07,969 --> 00:12:09,010
estavam voltando para eles.

231
00:12:09,010 --> 00:12:12,120
E eles foram descobrindo
coisas sobre si mesmos.

232
00:12:12,120 --> 00:12:17,290
E, na verdade, até mesmo os especialistas,
mesmo os psicoterapeutas,

233
00:12:17,290 --> 00:12:22,930
começou a se preocupar que, de fato,
talvez ELIZA seria substituí-los.

234
00:12:22,930 --> 00:12:25,640
E até mesmo o computador
cientistas preocupados que estávamos

235
00:12:25,640 --> 00:12:30,040
tão perto de resolver linguagem natural.

236
00:12:30,040 --> 00:12:33,520
>> Agora, isso não foi em qualquer lugar perto de verdade.

237
00:12:33,520 --> 00:12:37,280
Mas isso é como impressionante
estes sistemas podem parecer.

238
00:12:37,280 --> 00:12:40,080
Então, vamos começar a olhar
por baixo e tentar

239
00:12:40,080 --> 00:12:46,190
para obter um pouco de uma pergunta
de onde esse código realmente acontece.

240
00:12:46,190 --> 00:12:48,170
Então, vamos fazer este código
disponível depois.

241
00:12:48,170 --> 00:12:50,880
E este é um muito
porta simples e direta

242
00:12:50,880 --> 00:12:53,240
da implementação original ELIZA.

243
00:12:53,240 --> 00:12:56,350
>> Assim, alguns destes estilística
coisas que você verá aqui

244
00:12:56,350 --> 00:12:59,360
não são o que estilisticamente
nós queremos que você faça

245
00:12:59,360 --> 00:13:01,480
ou o que estamos ensinando-lhe para fazer.

246
00:13:01,480 --> 00:13:04,770
Mas nós tentamos mantê-los
o mesmo em muitos portos

247
00:13:04,770 --> 00:13:08,087
que este teve de modo que ele
tem o sabor do original.

248
00:13:08,087 --> 00:13:09,920
Então, nós estamos indo para incluir
um monte de coisas,

249
00:13:09,920 --> 00:13:12,920
e então nós vamos ter um
conjunto de palavras-chave, as coisas

250
00:13:12,920 --> 00:13:16,460
ELIZA que irá reconhecer
e responder aos diretamente.

251
00:13:16,460 --> 00:13:20,780
Então se você tem palavras como
"pode ​​você" ou "eu não" ou "não"

252
00:13:20,780 --> 00:13:24,680
ou "sim" ou "sonho"
ou "Olá", então ELIZA

253
00:13:24,680 --> 00:13:27,920
irá responder selectivamente para aqueles.

254
00:13:27,920 --> 00:13:30,010
Também vamos ter um
certo número de coisas

255
00:13:30,010 --> 00:13:34,940
que vamos trocar, como
converter "meu" para "seu".

256
00:13:34,940 --> 00:13:39,920
>> E então nós vamos ter um conjunto de respostas
que, para cada uma dessas palavras-chave,

257
00:13:39,920 --> 00:13:42,580
nós vamos girar através
estas diferentes respostas.

258
00:13:42,580 --> 00:13:45,350
Então, se eu dizer "sim"
três vezes consecutivas, I

259
00:13:45,350 --> 00:13:50,429
pode ter três diferentes
respostas de ELIZA.

260
00:13:50,429 --> 00:13:52,345
Nosso código, então, é
na verdade, extremamente simples.

261
00:13:52,345 --> 00:13:59,490
Se eu rolar para baixo após todos estes
respostas que temos programados em

262
00:13:59,490 --> 00:14:02,920
e nós chegar até a página,
nós estamos indo para inicializar

263
00:14:02,920 --> 00:14:06,540
um par de variáveis ​​diferentes
e fazer um pouco de arrumação

264
00:14:06,540 --> 00:14:08,480
no começo.

265
00:14:08,480 --> 00:14:11,760
Mas então não há absolutamente um conjunto
de código que você pode entender.

266
00:14:11,760 --> 00:14:15,820
Um loop while grande que diz que eu sou
vai repetir isso mais e mais.

267
00:14:15,820 --> 00:14:20,420
Vou ler em uma linha, e eu vou
armazenar isso em uma seqüência de entrada.

268
00:14:20,420 --> 00:14:23,880
Vou verificar e ver se é o
palavra-chave especial "bye", que

269
00:14:23,880 --> 00:14:26,199
significa sair do programa.

270
00:14:26,199 --> 00:14:29,240
E então eu vou verificar e ver se
alguém está apenas repetindo-se

271
00:14:29,240 --> 00:14:29,800
de novo e de novo.

272
00:14:29,800 --> 00:14:31,174
E eu vou gritar com eles se eles fazem.

273
00:14:31,174 --> 00:14:34,820
Eu vou dizer "não repetir-se."

274
00:14:34,820 --> 00:14:40,500
>> Enquanto nenhum desses acontecer, vamos
em seguida, a varredura através de e loop através,

275
00:14:40,500 --> 00:14:45,330
em linhas 308 a 313
aqui, e verificar e ver

276
00:14:45,330 --> 00:14:49,090
são aqueles de qualquer palavra-chave
frases contidas na entrada

277
00:14:49,090 --> 00:14:50,620
que eu estava acabado de dar?

278
00:14:50,620 --> 00:14:54,845
Se houver uma correspondência para eles, bem
então, eu vou lembrar desse local.

279
00:14:54,845 --> 00:14:57,050
Vou me lembrar dessa palavra-chave.

280
00:14:57,050 --> 00:14:58,620
E eu vou ser capaz de construir uma resposta.

281
00:14:58,620 --> 00:15:03,150
>> Se eu não encontrar um, bem, então,
a última coisa na minha matriz palavra-chave

282
00:15:03,150 --> 00:15:08,070
sereis minhas respostas padrão,
quando nada mais jogos.

283
00:15:08,070 --> 00:15:14,160
Eu vou fazer perguntas como "Por que você fez
vir aqui? "ou" Como posso ajudá-lo? "

284
00:15:14,160 --> 00:15:19,710
que são apenas parcialmente adequado
não importa o que a entrada é.

285
00:15:19,710 --> 00:15:22,580
>> Vamos, então, construir-se a resposta de ELIZA.

286
00:15:22,580 --> 00:15:26,040
Nós vamos ser capazes de tomar
que a resposta de base,

287
00:15:26,040 --> 00:15:28,370
assim como fizemos em que
exemplo "meu chefe".

288
00:15:28,370 --> 00:15:30,970

289
00:15:30,970 --> 00:15:33,990
Se isso é tudo o que há
é-- se é apenas um

290
00:15:33,990 --> 00:15:36,860
string que eu deveria respond--
Eu só posso enviá-lo de volta para fora.

291
00:15:36,860 --> 00:15:40,610
Se ele tem um asterisco no
o fim de tudo, então eu vou

292
00:15:40,610 --> 00:15:45,710
processar cada símbolo individual na
o resto da resposta do utilizador

293
00:15:45,710 --> 00:15:51,590
e adicionar aqueles que, trocando para fora
palavra por palavra como eu preciso.

294
00:15:51,590 --> 00:15:56,100
>> Tudo isto é absolutamente
algo que você pode construir.

295
00:15:56,100 --> 00:15:59,230
E, de fato, as maneiras pelas quais nós
ter argumentos de linha de comando processados,

296
00:15:59,230 --> 00:16:03,570
a maneira em que você tem
processadas através de solicitações HTTP

297
00:16:03,570 --> 00:16:05,510
siga os mesmos tipos de regras.

298
00:16:05,510 --> 00:16:08,220
Eles são a correspondência de padrão.

299
00:16:08,220 --> 00:16:15,170
>> Assim ELIZA tinha um relativamente importante
impacto sobre a linguagem natural

300
00:16:15,170 --> 00:16:21,620
porque ele fez parecer como se fosse um
meta muito atingível, como de alguma forma estaríamos

301
00:16:21,620 --> 00:16:25,550
ser capaz de resolver este problema diretamente.

302
00:16:25,550 --> 00:16:30,670
Agora, isso não quer dizer que faz ELIZA
tudo o que gostaria de fazer.

303
00:16:30,670 --> 00:16:33,710
Certamente não.

304
00:16:33,710 --> 00:16:35,660
Mas devemos ser capazes
para fazer algo mais.

305
00:16:35,660 --> 00:16:38,280

306
00:16:38,280 --> 00:16:41,490
>> Nosso primeiro passo para ir
além ELIZA vai

307
00:16:41,490 --> 00:16:44,840
para ser capaz de olhar
não o texto inserido

308
00:16:44,840 --> 00:16:53,750
no teclado, mas discurso, real
discurso gravado em um microfone.

309
00:16:53,750 --> 00:16:56,880
Assim, quando olhamos para estes
peças diferentes, nós somos

310
00:16:56,880 --> 00:17:00,304
vai ter que construir um conjunto de modelos.

311
00:17:00,304 --> 00:17:02,970
Nós vamos ter que ser capaz
para ir do baixo nível acústico

312
00:17:02,970 --> 00:17:07,180
arremesso information--,
amplitude, frequency--

313
00:17:07,180 --> 00:17:09,530
e convertê-lo em
algumas unidades que estamos

314
00:17:09,530 --> 00:17:14,619
capaz de manipular mais facilmente
e, finalmente, manipulá-los

315
00:17:14,619 --> 00:17:18,609
em palavras e frases.

316
00:17:18,609 --> 00:17:22,880
>> Assim, a maioria de reconhecimento de fala
sistemas que estão lá fora hoje

317
00:17:22,880 --> 00:17:26,069
siga uma estatística
modelo no qual nós construímos

318
00:17:26,069 --> 00:17:35,090
três representações separadas de que
que o sinal de áudio contem na realidade.

319
00:17:35,090 --> 00:17:38,640
Começamos com um modelo de fonética
que fala sobre apenas a base

320
00:17:38,640 --> 00:17:41,250
Parece que eu estou produzindo.

321
00:17:41,250 --> 00:17:46,900
Estou produzindo algo que é
um B como no menino ou uma D como no cão?

322
00:17:46,900 --> 00:17:53,220
Como posso reconhecer os dois diferentes
telefones como separada e distinta?

323
00:17:53,220 --> 00:17:56,600
>> Em cima disso, nós vamos, então, construir
uma pronúncia modelo palavra,

324
00:17:56,600 --> 00:18:01,350
algo que une
os telefones individuais

325
00:18:01,350 --> 00:18:04,724
e as combina em uma palavra.

326
00:18:04,724 --> 00:18:07,890
E depois disso, vamos dar as palavras
e nós vamos montá-las com uma linguagem

327
00:18:07,890 --> 00:18:13,010
modelar em uma frase completa.

328
00:18:13,010 --> 00:18:17,230
>> Agora, vamos falar sobre cada
destes independentemente e separadamente.

329
00:18:17,230 --> 00:18:21,580
Mas estes três modelos são todos
só vai ser estatísticas.

330
00:18:21,580 --> 00:18:23,502
E isso significa que quando nós
trabalhar com eles, vamos

331
00:18:23,502 --> 00:18:25,376
ser capaz de trabalhar com
todas elas ao mesmo tempo.

332
00:18:25,376 --> 00:18:28,100

333
00:18:28,100 --> 00:18:28,600
Tudo certo.

334
00:18:28,600 --> 00:18:30,890
Vamos começar com o nosso modelo de fonética.

335
00:18:30,890 --> 00:18:34,470
Assim, modelos fonéticos dependem
uma técnica computacional

336
00:18:34,470 --> 00:18:37,320
chamados de modelos ocultos de Markov.

337
00:18:37,320 --> 00:18:43,050
Estes são modelos gráficos em que eu
ter e reconhecer um estado do mundo

338
00:18:43,050 --> 00:18:46,500
como sendo caracterizada
por um conjunto de características.

339
00:18:46,500 --> 00:18:51,960
E esse estado descreve uma parte
de uma ação que eu estou envolvido em.

340
00:18:51,960 --> 00:19:00,190
>> Então, se eu pensar em fazer
o som de "ma" como mãe,

341
00:19:00,190 --> 00:19:03,970
existem diferentes
componentes para que o som.

342
00:19:03,970 --> 00:19:07,230
Há uma parte onde eu desenhar no ar.

343
00:19:07,230 --> 00:19:09,560
E então eu franzir os lábios.

344
00:19:09,560 --> 00:19:13,710
E eu rolo meus lábios um pouco para trás
pouco para fazer aquele som "ma".

345
00:19:13,710 --> 00:19:15,340
E depois há uma liberação.

346
00:19:15,340 --> 00:19:17,020
Meus lábios se separam.

347
00:19:17,020 --> 00:19:19,030
O ar é expelido.

348
00:19:19,030 --> 00:19:22,650
"Ma".

349
00:19:22,650 --> 00:19:29,250
>> Estas três partes diferentes seria
representado por estados neste graph--

350
00:19:29,250 --> 00:19:33,420
o início, o meio eo fim.

351
00:19:33,420 --> 00:19:38,060
E eu teria transições que
me permitiu viajar de um estado

352
00:19:38,060 --> 00:19:42,260
para o próximo, com uma certa probabilidade.

353
00:19:42,260 --> 00:19:47,250
Assim, por exemplo, que a M
som pode ter um muito,

354
00:19:47,250 --> 00:19:51,850
ingestão de muito curto no beginning--
"mm" - e, em seguida, uma mais longa,

355
00:19:51,850 --> 00:19:55,640
fase vibratória onde eu estou segurando a minha
lábios e quase humming--

356
00:19:55,640 --> 00:20:05,090
"mmmm" - e depois de um curto
Plosive onde eu expulsar breath-- "ma".

357
00:20:05,090 --> 00:20:09,370
>> O modelo oculto de Markov é
concebido para capturar o facto

358
00:20:09,370 --> 00:20:13,340
que a maneira que eu faço
que o som de "ma" vai

359
00:20:13,340 --> 00:20:17,350
para ser ligeiramente diferente em
o seu calendário, é a freqüência,

360
00:20:17,350 --> 00:20:21,030
e seus recursos do que
a maneira que você faz

361
00:20:21,030 --> 00:20:23,300
ou a maneira que eu poderia
torná-lo quando estou falando

362
00:20:23,300 --> 00:20:26,030
sobre os diferentes usos da carta.

363
00:20:26,030 --> 00:20:33,240
"Mãe" e "may I" vontade
soar um pouco diferente.

364
00:20:33,240 --> 00:20:36,800
>> Assim, para reconhecer um
em particular som, faríamos

365
00:20:36,800 --> 00:20:42,020
construir modelos de Markov, estes Markov oculto
modelos, de cada telefone possível que eu

366
00:20:42,020 --> 00:20:45,840
pode querer reconhecer,
cada som possível,

367
00:20:45,840 --> 00:20:49,750
e depois olhar para o
dados acústicos que eu tenho

368
00:20:49,750 --> 00:20:54,430
e determinar estatisticamente
qual é o mais provável

369
00:20:54,430 --> 00:20:58,110
ter produzido esse som.

370
00:20:58,110 --> 00:20:58,610
ESTÁ BEM.

371
00:20:58,610 --> 00:21:01,540

372
00:21:01,540 --> 00:21:06,750
Com esse modelo, em seguida,
começar a construir em cima dela.

373
00:21:06,750 --> 00:21:09,330
Tomamos um modelo de pronúncia.

374
00:21:09,330 --> 00:21:11,790
Agora, às vezes pronúncia
modelos são simples e fáceis

375
00:21:11,790 --> 00:21:14,440
porque só há uma
maneira de pronunciar algo.

376
00:21:14,440 --> 00:21:17,990
Outras vezes, eles são um
pouco mais complicado.

377
00:21:17,990 --> 00:21:21,340
Aqui está um guia de pronúncia
para essa coisa que é vermelho

378
00:21:21,340 --> 00:21:25,210
uma fruta que você faz fora de ketchup.

379
00:21:25,210 --> 00:21:27,360
As pessoas não acho que é uma fruta.

380
00:21:27,360 --> 00:21:27,860
Certo?

381
00:21:27,860 --> 00:21:30,880

382
00:21:30,880 --> 00:21:35,300
>> Agora, há muitas maneiras diferentes
que as pessoas vão pronunciar esta palavra.

383
00:21:35,300 --> 00:21:37,780
Alguns dirão "toe-may-dedo do pé."

384
00:21:37,780 --> 00:21:40,880
Alguns dirão "toe-mah-dedo do pé."

385
00:21:40,880 --> 00:21:44,800
E nós podemos capturar essa com
um destes modelos gráficos

386
00:21:44,800 --> 00:21:48,305
onde, novamente, nós representam transições
como tendo uma certa probabilidade

387
00:21:48,305 --> 00:21:51,360
e a probabilidade associada com eles.

388
00:21:51,360 --> 00:21:58,290
>> Portanto, neste caso, se eu fosse para seguir
topo rota através deste gráfico inteiro,

389
00:21:58,290 --> 00:22:03,330
Eu estaria começando na carta
na extrema esquerda, a "ta" som.

390
00:22:03,330 --> 00:22:07,570
Gostaria de ter a metade superior,
o "oh," e, em seguida, um "ma"

391
00:22:07,570 --> 00:22:14,530
e, em seguida, um "a", e, em seguida, um
"ta", e um "oh". "Toe-may-dedo do pé."

392
00:22:14,530 --> 00:22:19,610
Se eu pegasse o caminho através do fundo
este, vou conseguir "ta-mah-dedo do pé."

393
00:22:19,610 --> 00:22:26,810
E se eu fui para baixo e, em seguida,
acima, gostaria de obter "ta-may-dedo do pé."

394
00:22:26,810 --> 00:22:29,950
>> Estes modelos capturar estes
diferenças porque sempre

395
00:22:29,950 --> 00:22:32,410
que implantar um destes
sistemas de reconhecimento,

396
00:22:32,410 --> 00:22:35,340
ele vai ter que trabalhar com
lotes de diferentes tipos de pessoas,

397
00:22:35,340 --> 00:22:39,295
lotes de diferentes sotaques, e mesmo
diferentes usos das mesmas palavras.

398
00:22:39,295 --> 00:22:42,204

399
00:22:42,204 --> 00:22:44,120
Finalmente, em cima disso,
vamos construir algo

400
00:22:44,120 --> 00:22:48,780
que parece muito complicado,
chamado o modelo de linguagem,

401
00:22:48,780 --> 00:22:52,950
mas, de facto, é o mais simples de
a três porque estes operam

402
00:22:52,950 --> 00:22:56,041
sobre o que são chamados de modelos n-gram.

403
00:22:56,041 --> 00:23:02,270
E, neste caso, eu estou mostrando-lhe
um modelo de n-grama de duas partes, uma bigram.

404
00:23:02,270 --> 00:23:08,910
Nós vamos fazer física a idéia
que, por vezes, certas palavras são

405
00:23:08,910 --> 00:23:14,680
mais propensos a seguir um
determinada palavra do que outros.

406
00:23:14,680 --> 00:23:25,210
Se eu apenas disse: "previsão do tempo",
a próxima palavra poderia provavelmente ser "hoje"

407
00:23:25,210 --> 00:23:31,510
ou poderia ser "o tempo
Previsão do amanhã. "

408
00:23:31,510 --> 00:23:38,870
Mas é pouco provável que seja "o
previsão do tempo alcachofra. "

409
00:23:38,870 --> 00:23:42,980
>> O que um modelo de linguagem faz é
que capta os estatisticamente

410
00:23:42,980 --> 00:23:47,450
por contagem, de algum muito grande
corpus, todas as instâncias

411
00:23:47,450 --> 00:23:50,890
em que uma palavra se segue a outra.

412
00:23:50,890 --> 00:23:54,300
Então, se eu tomar uma grande corpus--
como cada Wall Street Journal

413
00:23:54,300 --> 00:24:00,750
que foi produzido desde 1930,
que é um dos corpuses-- padrão

414
00:24:00,750 --> 00:24:03,910
e eu olhar através de todos
esse texto, e eu conto

415
00:24:03,910 --> 00:24:09,770
-se quantas vezes depois
"previsão" eu vejo "hoje"

416
00:24:09,770 --> 00:24:17,454
e quantas vezes eu vejo
"previsão" seguido de "alcachofra",

417
00:24:17,454 --> 00:24:19,370
o primeiro vai
ser muito mais provável.

418
00:24:19,370 --> 00:24:21,540
Vai aparecer
com muito mais freqüência.

419
00:24:21,540 --> 00:24:24,610
E por isso vai ter uma maior
probabilidade associada com ele.

420
00:24:24,610 --> 00:24:27,340
>> Se eu quiser descobrir a
probabilidade de um enunciado inteiro,

421
00:24:27,340 --> 00:24:29,940
então, eu só quebrá-lo.

422
00:24:29,940 --> 00:24:35,990
Assim, a probabilidade de audição
a frase "o rato comeu queijo"

423
00:24:35,990 --> 00:24:39,110
é a probabilidade de a palavra
"a" iniciar uma frase,

424
00:24:39,110 --> 00:24:42,540
e, em seguida, a probabilidade de que o
palavra "rato" segue a palavra "a",

425
00:24:42,540 --> 00:24:44,910
e a probabilidade de que o
palavra "comeu" segue "rato"

426
00:24:44,910 --> 00:24:51,120
e a probabilidade de que
"queijo" segue "comeu".

427
00:24:51,120 --> 00:24:55,160
>> Isso soa como um monte de
estatísticas, um monte de probabilidades.

428
00:24:55,160 --> 00:24:57,510
E isso é tudo que ele é.

429
00:24:57,510 --> 00:25:02,920
Mas o mais incrível é se você fizer isso
com uma amostra suficientemente grande de dados,

430
00:25:02,920 --> 00:25:03,670
Isso funciona.

431
00:25:03,670 --> 00:25:05,250
E funciona tremendamente bem.

432
00:25:05,250 --> 00:25:07,810

433
00:25:07,810 --> 00:25:11,420
Nós todos sabemos que essas tecnologias.

434
00:25:11,420 --> 00:25:16,500
A maioria dos sistemas operacionais vêm com
reconhecimento de voz neste momento.

435
00:25:16,500 --> 00:25:20,940
Nós usamos Siri e Cortana e Echo.

436
00:25:20,940 --> 00:25:25,070
E estas coisas são baseadas em
este tipo de três camadas model--

437
00:25:25,070 --> 00:25:30,620
um modelo fonética na parte inferior, uma
modelo de pronúncia no meio,

438
00:25:30,620 --> 00:25:33,690
e um modelo de linguagem em cima deles.

439
00:25:33,690 --> 00:25:37,630
>> Agora, eles têm que fazer um pouco mais
do que isso, a fim de responder a perguntas.

440
00:25:37,630 --> 00:25:43,000
Mas o reconhecimento do que você é
provérbio depende exatamente sobre isso.

441
00:25:43,000 --> 00:25:45,700
Então, vamos dar um exemplo aqui.

442
00:25:45,700 --> 00:25:52,020
Então, eu tenho o meu telefone que senta-se aqui
debaixo da câmera de documentos.

443
00:25:52,020 --> 00:25:56,110
E nós vamos pede
Siri algumas perguntas.

444
00:25:56,110 --> 00:25:57,150
Tudo certo?

445
00:25:57,150 --> 00:25:59,940
>> Então, vamos acordar meu telefone aqui.

446
00:25:59,940 --> 00:26:02,710

447
00:26:02,710 --> 00:26:05,000
Siri, que é o tempo
como em New Haven hoje?

448
00:26:05,000 --> 00:26:07,670

449
00:26:07,670 --> 00:26:10,780
>> SIRI: Aqui está o tempo para
New Haven, Connecticut hoje.

450
00:26:10,780 --> 00:26:11,890
>> BRIAN Scassellati: OK.

451
00:26:11,890 --> 00:26:16,720
Então, primeiro você viu que Siri reconhecido
cada uma das palavras individuais

452
00:26:16,720 --> 00:26:19,050
e, em seguida, produziu uma resposta.

453
00:26:19,050 --> 00:26:22,277
Vamos falar sobre como essa resposta
acontece em um pouco.

454
00:26:22,277 --> 00:26:24,110
Mas agora que sabemos
que este é apenas baseado

455
00:26:24,110 --> 00:26:28,880
sobre as estatísticas crus e esta
Tipo de correspondência padrão de abordagem,

456
00:26:28,880 --> 00:26:31,120
podemos jogar alguns jogos com Siri.

457
00:26:31,120 --> 00:26:34,560
>> Então, eu posso tentar novamente.

458
00:26:34,560 --> 00:26:38,864
Siri, que é o tempo
hipopótamo New Haven, hoje?

459
00:26:38,864 --> 00:26:39,810
>> SIRI: OK.

460
00:26:39,810 --> 00:26:44,245
Aqui está o tempo para New
Haven, Connecticut para hoje.

461
00:26:44,245 --> 00:26:46,120
BRIAN Scassellati: Siri da
não intimide com que

462
00:26:46,120 --> 00:26:50,980
porque ele é encontrado o pattern--
"clima", "Hoje", "New Haven."

463
00:26:50,980 --> 00:26:54,420
Isso é o que ele está respondendo
para, assim como ELIZA.

464
00:26:54,420 --> 00:26:54,920
Tudo certo.

465
00:26:54,920 --> 00:26:59,390
Vamos dar-lhe mais um mesmo
exemplo mais ridículo.

466
00:26:59,390 --> 00:27:03,075
Siri, tempo de alcachofra
tatu hipopótamo New Haven?

467
00:27:03,075 --> 00:27:06,806

468
00:27:06,806 --> 00:27:08,400
>> SIRI: Deixe-me verificar.

469
00:27:08,400 --> 00:27:11,280
Aqui está o que eu encontrei na web
para o que são alcachofras tatu

470
00:27:11,280 --> 00:27:13,780
hipopótamo New Haven.

471
00:27:13,780 --> 00:27:14,760
>> BRIAN Scassellati: OK.

472
00:27:14,760 --> 00:27:20,400
Então, se eu ir longe o suficiente
distância a partir deste modelo,

473
00:27:20,400 --> 00:27:24,365
Eu sou capaz de confundi-lo porque ele não
já não corresponde ao padrão que ele tem.

474
00:27:24,365 --> 00:27:27,370

475
00:27:27,370 --> 00:27:29,390
E essa estatística
motor que está dizendo,

476
00:27:29,390 --> 00:27:32,850
qual é a probabilidade de que você tem
o Hippopotamus das palavras e alcachofra

477
00:27:32,850 --> 00:27:34,440
juntos, e tatu?

478
00:27:34,440 --> 00:27:36,050
Isso tem que ser algo novo.

479
00:27:36,050 --> 00:27:38,840

480
00:27:38,840 --> 00:27:40,610
>> Assim, estas tecnologias que usamos todos os dias.

481
00:27:40,610 --> 00:27:43,670

482
00:27:43,670 --> 00:27:47,800
Se queremos levá-los um passo
Além disso, porém, se nós realmente

483
00:27:47,800 --> 00:27:53,930
quero ser capaz de falar sobre o que
é que estes sistemas estão a responder a,

484
00:27:53,930 --> 00:28:00,630
temos de falar, novamente, sobre um
conjunto mais fundamental das perguntas.

485
00:28:00,630 --> 00:28:05,370
E isso é um tópico em comunicação
que chamamos questão de atendimento.

486
00:28:05,370 --> 00:28:07,028
Isto é, nós queremos ser capazes a-- sim?

487
00:28:07,028 --> 00:28:07,944
AUDIÊNCIA: [inaudível].

488
00:28:07,944 --> 00:28:10,789

489
00:28:10,789 --> 00:28:13,330
BRIAN Scassellati: Obtemos
em processamento de semântica latente?

490
00:28:13,330 --> 00:28:14,070
Então sim.

491
00:28:14,070 --> 00:28:17,820
Há um monte de coisas que são
acontecendo abaixo da superfície com Siri

492
00:28:17,820 --> 00:28:20,210
e em alguns dos exemplos
Eu vou mostrar para você próximo

493
00:28:20,210 --> 00:28:22,610
onde há um pouco
em termos da estrutura

494
00:28:22,610 --> 00:28:25,260
do que você está dizendo isso é importante.

495
00:28:25,260 --> 00:28:31,890
E, de fato, isso é um grande
precursor para o próximo slide para mim.

496
00:28:31,890 --> 00:28:35,110
>> Assim, da mesma maneira que o nosso
reconhecimento de fala foi construído

497
00:28:35,110 --> 00:28:39,620
de múltiplas camadas, se quisermos
compreender o que é que, na verdade,

498
00:28:39,620 --> 00:28:44,620
Dito isto, vamos novamente
depender de uma análise multi-camada

499
00:28:44,620 --> 00:28:47,020
do texto que está sendo reconhecido.

500
00:28:47,020 --> 00:28:52,560
Assim, quando Siri é realmente capaz de
digamos, olha eu encontrei estas palavras.

501
00:28:52,560 --> 00:28:55,230
Agora o que eu faço com eles?

502
00:28:55,230 --> 00:28:59,110
O primeiro componente é muitas vezes a
passar e tentar analisar

503
00:28:59,110 --> 00:29:03,010
a estrutura da frase.

504
00:29:03,010 --> 00:29:05,410
E no que temos visto
na escola, muitas vezes,

505
00:29:05,410 --> 00:29:08,920
como uma espécie de diagramação
frases, vamos

506
00:29:08,920 --> 00:29:12,774
de reconhecer que certos
palavras têm certos papéis.

507
00:29:12,774 --> 00:29:13,440
Estes são substantivos.

508
00:29:13,440 --> 00:29:14,231
Estes são pronomes.

509
00:29:14,231 --> 00:29:16,200
Estes são verbos.

510
00:29:16,200 --> 00:29:19,460
E nós estamos indo para reconhecer
que, para uma gramática particular,

511
00:29:19,460 --> 00:29:24,700
neste caso Inglês gramática, existem
formas válidas em que eu posso combiná-los

512
00:29:24,700 --> 00:29:26,280
e outras formas que não são válidos.

513
00:29:26,280 --> 00:29:29,920

514
00:29:29,920 --> 00:29:33,870
>> Este reconhecimento, essa estrutura,
pode ser suficiente para ajudar a guiar-nos

515
00:29:33,870 --> 00:29:36,720
um pouco.

516
00:29:36,720 --> 00:29:39,820
Mas não é o bastante
para que sejamos capazes de dar

517
00:29:39,820 --> 00:29:43,290
qualquer significado para o que está sendo dito aqui.

518
00:29:43,290 --> 00:29:46,615
Para fazer isso, nós vamos ter que confiar em
uma certa quantidade de processamento semântico.

519
00:29:46,615 --> 00:29:49,590

520
00:29:49,590 --> 00:29:55,080
Ou seja, nós vamos ter que olhar
em baixo o que cada uma dessas palavras

521
00:29:55,080 --> 00:29:57,400
realmente carrega como um significado.

522
00:29:57,400 --> 00:30:01,150
E da forma mais simples de fazer isso,
nós estamos indo para associar com cada palavra

523
00:30:01,150 --> 00:30:06,930
que sabemos que uma determinada função,
uma certa transformação que ele

524
00:30:06,930 --> 00:30:09,300
permite que isso aconteça.

525
00:30:09,300 --> 00:30:14,470
>> Neste caso, poderíamos rotular o
palavra "John", como sendo um nome próprio,

526
00:30:14,470 --> 00:30:18,160
que traz consigo uma identidade.

527
00:30:18,160 --> 00:30:21,530
E poderíamos rotular
"Mary" como o mesmo caminho.

528
00:30:21,530 --> 00:30:27,900
Considerando um verbo como "ama", que
constitui uma relação particular

529
00:30:27,900 --> 00:30:31,582
que somos capazes de representar.

530
00:30:31,582 --> 00:30:33,290
Agora, isso não significa que
que entendemos

531
00:30:33,290 --> 00:30:37,680
que é o amor, mas apenas que nós compreendemos
-lo na forma de um sistema simbólico.

532
00:30:37,680 --> 00:30:40,480
Ou seja, podemos rotular
lo e manipulá-lo.

533
00:30:40,480 --> 00:30:44,230

534
00:30:44,230 --> 00:30:49,120
>> Com cada um destes tipos de abordagens,
qualquer tipo de processamento semântico

535
00:30:49,120 --> 00:30:57,060
aqui vai exigir um pouco
pouco de conhecimento e um monte de trabalho

536
00:30:57,060 --> 00:30:59,020
da nossa parte.

537
00:30:59,020 --> 00:31:03,590
Não estamos mais no reino
onde as estatísticas apenas simples

538
00:31:03,590 --> 00:31:07,320
vai ser o suficiente para nós.

539
00:31:07,320 --> 00:31:11,330
Agora, a fim de ir
a partir deste ponto para ser

540
00:31:11,330 --> 00:31:15,520
capaz de falar sobre o interior
o que está realmente acontecendo aqui,

541
00:31:15,520 --> 00:31:19,640
para ser capaz de manipular este
estruturar e compreender uma pergunta

542
00:31:19,640 --> 00:31:23,160
e, em seguida, ser capaz
para sair e procurar,

543
00:31:23,160 --> 00:31:27,290
que requer um mais
modelo cognitivo complexo.

544
00:31:27,290 --> 00:31:34,880
>> A forma em que estes sistemas são construídos
é, na maior parte muito, muito trabalho

545
00:31:34,880 --> 00:31:36,350
intensiva.

546
00:31:36,350 --> 00:31:39,490
Elas envolvem seres humanos
gastar uma grande quantidade

547
00:31:39,490 --> 00:31:44,100
tempo de estruturar as formas de
que esses tipos de frases

548
00:31:44,100 --> 00:31:47,270
pode ser representada em alguns lógica.

549
00:31:47,270 --> 00:31:51,639

550
00:31:51,639 --> 00:31:53,430
Ele fica ainda um pouco
mais complexo, no entanto.

551
00:31:53,430 --> 00:31:56,400

552
00:31:56,400 --> 00:31:59,660
>> Mesmo uma vez que lidei
com a semântica, vamos

553
00:31:59,660 --> 00:32:03,860
ainda tem que olhar para o
pragmática do que está sendo dito.

554
00:32:03,860 --> 00:32:08,620
Isto é, como faço para relacionar as palavras
que eu tenho que algo fisicamente para fora

555
00:32:08,620 --> 00:32:12,054
há no mundo, ou pelo
menos alguma fonte de informação

556
00:32:12,054 --> 00:32:12,970
que eu possa manipular?

557
00:32:12,970 --> 00:32:15,780

558
00:32:15,780 --> 00:32:20,790
>> Às vezes, estes levar a
pedaços maravilhosas de ambiguidade.

559
00:32:20,790 --> 00:32:24,470
"Red-quente estrela de casar astrônomo."

560
00:32:24,470 --> 00:32:25,630
ESTÁ BEM.

561
00:32:25,630 --> 00:32:28,540
Agora, lemos que, como o
Tipo engraçado de headline

562
00:32:28,540 --> 00:32:34,690
que gostaríamos de ver em TV tarde da noite
porque nós não interpretar "estrela"

563
00:32:34,690 --> 00:32:38,630
para ter o seu significado corpo celeste.

564
00:32:38,630 --> 00:32:43,390
Sabemos que isso significa que a mais
ator ou atriz comum

565
00:32:43,390 --> 00:32:45,240
com quantidades elevadas de visibilidade.

566
00:32:45,240 --> 00:32:47,770

567
00:32:47,770 --> 00:32:51,950
>> "Tropa de ajuda mordida de cão vítima."

568
00:32:51,950 --> 00:32:55,550
Será que o plantel é realmente
lá fora, assistindo um cão

569
00:32:55,550 --> 00:32:59,620
em ir ao redor e mordendo vítimas?

570
00:32:59,620 --> 00:33:02,380
Ou será que não havia
um indivíduo que era

571
00:33:02,380 --> 00:33:04,625
mordido por um cão que precisava de alguma ajuda?

572
00:33:04,625 --> 00:33:07,650

573
00:33:07,650 --> 00:33:11,480
Só de olhar para a sintaxe
e a semântica das sentenças,

574
00:33:11,480 --> 00:33:14,660
não podemos determinar isso.

575
00:33:14,660 --> 00:33:22,000
>> "Helicóptero alimentado por moscas humanos."

576
00:33:22,000 --> 00:33:27,330
Há, de fato, real
pequenas coisas que voam ao redor

577
00:33:27,330 --> 00:33:34,510
são pessoas com asas alimentar
helicópteros para o bem da humanidade?

578
00:33:34,510 --> 00:33:38,960
Ou há um dispositivo mecânico
que deriva sua energia de uma pessoa?

579
00:33:38,960 --> 00:33:41,600

580
00:33:41,600 --> 00:33:46,500
>> Quando olhamos para a questão
sistemas de atendimento,

581
00:33:46,500 --> 00:33:51,110
estes são as camadas que
temos de lidar com eles.

582
00:33:51,110 --> 00:33:54,890
Agora, o melhor eo mais sorte
de prevalente destes sistemas

583
00:33:54,890 --> 00:34:00,640
hoje são capazes de fazer
as coisas a um nível que são

584
00:34:00,640 --> 00:34:05,050
muito além do que tínhamos há 10 anos.

585
00:34:05,050 --> 00:34:08,210
Aqui está um dos melhores sistemas
que está lá fora hoje.

586
00:34:08,210 --> 00:34:10,519
E este é um sistema
da IBM chamado Watson.

587
00:34:10,519 --> 00:34:13,040

588
00:34:13,040 --> 00:34:15,500
Esta é a partir de nossos amigos da IBM.

589
00:34:15,500 --> 00:34:19,810
Esta é Katherine bancos, Jia Chen,
e Priscila Moraes dando-nos

590
00:34:19,810 --> 00:34:26,323
uma demonstração de Watson
ontem, em Yorktown IBM.

591
00:34:26,323 --> 00:34:26,989
[REPRODUÇÃO DE VÍDEO]

592
00:34:26,989 --> 00:34:27,690
-Como você está?

593
00:34:27,690 --> 00:34:30,600

594
00:34:30,600 --> 00:34:31,980
>> -Estou bem.

595
00:34:31,980 --> 00:34:35,429
Eu estou sempre feliz quando estou
pensar, especialmente quando eu

596
00:34:35,429 --> 00:34:38,920
pode ficar legal nessas salas de servidores.

597
00:34:38,920 --> 00:34:40,170
-Quem É sua atriz favorita?

598
00:34:40,170 --> 00:34:43,870

599
00:34:43,870 --> 00:34:47,555
>> -Meu Atriz favorita
Angelina Jolie como Lara Croft

600
00:34:47,555 --> 00:34:54,800
em Tomb Raider porque sua origem
forma era como um personagem virtual como eu.

601
00:34:54,800 --> 00:34:56,760
>> -Como Pode Watson ajudar os pacientes?

602
00:34:56,760 --> 00:34:59,700

603
00:34:59,700 --> 00:35:03,755
>> -É O plano para os pacientes para
têm acesso a Watson diretamente?

604
00:35:03,755 --> 00:35:08,050
O acesso a Watson consultivo
aplicações variam de acordo com caso de uso.

605
00:35:08,050 --> 00:35:12,630
Mas actualmente, Watson só fornecerá
possível diagnóstico e tratamento

606
00:35:12,630 --> 00:35:14,725
opções para profissional médico.

607
00:35:14,725 --> 00:35:17,680
Se for caso disso, os pacientes
pode fornecer informações

608
00:35:17,680 --> 00:35:21,210
a Watson, talvez através de um
interface web portal, tablet,

609
00:35:21,210 --> 00:35:23,500
ou mesmo um telefone celular.

610
00:35:23,500 --> 00:35:27,180
Por exemplo, um paciente pode ser
solicitados a descrever seus sintomas

611
00:35:27,180 --> 00:35:30,460
em linguagem natural directamente
numa solução Watson,

612
00:35:30,460 --> 00:35:34,050
permitindo ao médico focar
diagnóstico e não a coleta de dados.

613
00:35:34,050 --> 00:35:38,379

614
00:35:38,379 --> 00:35:42,716
>> -Quem Assassinado Abraham Lincoln?

615
00:35:42,716 --> 00:35:46,153
>> -João Wilkes Booth.

616
00:35:46,153 --> 00:35:52,373
>> -Em Que ano fez o Arizona
Diamondbacks vencer a World Series?

617
00:35:52,373 --> 00:35:55,295
>> -2001.

618
00:35:55,295 --> 00:35:58,710
>> [FIM DE REPRODUÇÃO]

619
00:35:58,710 --> 00:36:01,610
>> BRIAN Scassellati: Então,
estes tipos de sistemas

620
00:36:01,610 --> 00:36:07,430
tem que confiar em primeiro lugar
reconhecer o discurso; segundo,

621
00:36:07,430 --> 00:36:12,200
convertendo-a em uma interna significativa
representação; e, em seguida, em terceiro lugar,

622
00:36:12,200 --> 00:36:17,090
ser capaz de sair e encontrar
a fonte de informação que

623
00:36:17,090 --> 00:36:21,140
lhes permite responder a essa pergunta.

624
00:36:21,140 --> 00:36:27,320
Este nível de complexidade envolve
os mesmos tipos de coisas programáticas

625
00:36:27,320 --> 00:36:31,790
que você tem sido
fazendo em conjuntos de problemas.

626
00:36:31,790 --> 00:36:38,000
>> Somos capazes de analisar as solicitações HTTP em
o mesmo tipo de padrão de baixo nível

627
00:36:38,000 --> 00:36:40,810
ELIZA correspondente que pode fazer.

628
00:36:40,810 --> 00:36:45,070
Somos capazes de converter os
em uma representação interna,

629
00:36:45,070 --> 00:36:50,360
e então usá-los para consultar alguns
banco de dados externo, possivelmente usando SQL.

630
00:36:50,360 --> 00:36:53,530

631
00:36:53,530 --> 00:36:56,260
Todos os sistemas que
estão sendo construídas hoje

632
00:36:56,260 --> 00:37:00,520
para fazer este tipo de catástrofes naturais
comunicação língua

633
00:37:00,520 --> 00:37:04,100
estão sendo construídas em cima
esses mesmos princípios.

634
00:37:04,100 --> 00:37:09,530
>> Agora, até mesmo um sistema como
Watson não é suficiente complexo

635
00:37:09,530 --> 00:37:14,820
para ser capaz de responder arbitrária
perguntas sobre qualquer assunto.

636
00:37:14,820 --> 00:37:20,060
E, de fato, eles têm que ser
estruturada dentro de um determinado domínio.

637
00:37:20,060 --> 00:37:24,440
Então você pode ir online e você pode encontrar
versões de Watson que operam bem

638
00:37:24,440 --> 00:37:27,700
dentro de informática médica.

639
00:37:27,700 --> 00:37:31,490
Ou há uma linha
que apenas trata de como

640
00:37:31,490 --> 00:37:34,540
fazer boas recomendações sobre
o que a cerveja vai com que o alimento.

641
00:37:34,540 --> 00:37:37,060

642
00:37:37,060 --> 00:37:41,870
E dentro desses domínios,
ele pode responder a perguntas,

643
00:37:41,870 --> 00:37:46,130
encontrar a informação de que necessita.

644
00:37:46,130 --> 00:37:48,270
>> Mas você não pode misturar e combinar-los.

645
00:37:48,270 --> 00:37:53,150
O sistema que foi treinado
com o banco de dados de alimentos e cerveja

646
00:37:53,150 --> 00:37:56,830
não funciona bem quando você de repente
colocá-lo em com a informática médica

647
00:37:56,830 --> 00:37:59,770
banco de dados.

648
00:37:59,770 --> 00:38:05,680
Assim, mesmo os nossos melhores sistemas de hoje
dependem de um nível de processamento

649
00:38:05,680 --> 00:38:11,570
em que estamos codificação manual e
construção da infra-estrutura, a fim

650
00:38:11,570 --> 00:38:13,275
para fazer este sistema funcionar.

651
00:38:13,275 --> 00:38:16,360

652
00:38:16,360 --> 00:38:20,710
>> Agora, o último tópico que eu quero
para ser capaz de obter a hoje

653
00:38:20,710 --> 00:38:23,960
é sobre comunicação não-verbal.

654
00:38:23,960 --> 00:38:29,290
Uma grande massa de informações que
nós nos comunicamos uns com os outros

655
00:38:29,290 --> 00:38:35,490
não acontece através do
palavras individuais que estamos aplicando.

656
00:38:35,490 --> 00:38:40,290
Tem a ver com coisas como
proximidade, olhar, seu tom de voz,

657
00:38:40,290 --> 00:38:42,270
sua inflexão.

658
00:38:42,270 --> 00:38:46,620
E que a comunicação é também
algo que muitas interfaces diferentes

659
00:38:46,620 --> 00:38:49,960
importam muito sobre.

660
00:38:49,960 --> 00:38:51,500
Não é o que se preocupa com Siri.

661
00:38:51,500 --> 00:38:56,250
Eu posso pedir Siri algo em uma só voz
ou em um tom de voz diferente,

662
00:38:56,250 --> 00:38:59,840
e Siri vai
me dar a mesma resposta.

663
00:38:59,840 --> 00:39:05,260
Mas não é isso que nós construímos para
muitos outros tipos de interfaces.

664
00:39:05,260 --> 00:39:09,120
>> Eu quero apresentar-lhe
Agora, a um dos robôs.

665
00:39:09,120 --> 00:39:12,720
Este foi construído pelo meu de longa data
amigo e colega Cynthia

666
00:39:12,720 --> 00:39:16,010
Breazeal e sua empresa Jibo.

667
00:39:16,010 --> 00:39:20,090
E este robot-- vamos
para ter um par de voluntários

668
00:39:20,090 --> 00:39:22,520
chegar a interagir com isso.

669
00:39:22,520 --> 00:39:26,200
Então eu posso ter duas pessoas dispostas
jogar com o robô para mim?

670
00:39:26,200 --> 00:39:29,936
Por que você não vem para cima,
e por que você não vem em cima.

671
00:39:29,936 --> 00:39:31,310
Se você quiser se juntar a mim aqui em cima, por favor.

672
00:39:31,310 --> 00:39:36,520

673
00:39:36,520 --> 00:39:39,670
>> E se eu pudesse ter você
vir bem aqui.

674
00:39:39,670 --> 00:39:40,170
Obrigado.

675
00:39:40,170 --> 00:39:40,480
Oi.

676
00:39:40,480 --> 00:39:41,400
>> ALFREDO: Prazer em conhecê-lo.

677
00:39:41,400 --> 00:39:42,010
Alfredo.

678
00:39:42,010 --> 00:39:42,520
>> BRIAN Scassellati: Alfredo.

679
00:39:42,520 --> 00:39:43,146
>> RACHEL: Rachel.

680
00:39:43,146 --> 00:39:44,228
BRIAN Scassellati: Rachel.

681
00:39:44,228 --> 00:39:45,154
Prazer em conhecê-los.

682
00:39:45,154 --> 00:39:46,820
Alfredo, eu vou ter de ir primeiro.

683
00:39:46,820 --> 00:39:47,990
Venha até aqui.

684
00:39:47,990 --> 00:39:51,870
Eu estou indo para introduzir
você-- se eu posso tirar isso

685
00:39:51,870 --> 00:39:58,450
sem bater o microphone--
para um pequeno robô chamado Jibo.

686
00:39:58,450 --> 00:40:00,140
ok?

687
00:40:00,140 --> 00:40:04,260
>> Agora, Jibo é projetado para ser interativo.

688
00:40:04,260 --> 00:40:09,339
E embora possa dar-lhe a fala,
tanto da interacção com o robô

689
00:40:09,339 --> 00:40:09,880
é não-verbal.

690
00:40:09,880 --> 00:40:12,450

691
00:40:12,450 --> 00:40:17,070
Alfredo, eu vou pedir para você
dizer algo agradável e cortesia

692
00:40:17,070 --> 00:40:19,554
para o robô, por favor.

693
00:40:19,554 --> 00:40:20,845
ALFREDO: Eu acho que você olhar bonito.

694
00:40:20,845 --> 00:40:24,114

695
00:40:24,114 --> 00:40:25,611
>> [Zumbido]

696
00:40:25,611 --> 00:40:26,192

697
00:40:26,192 --> 00:40:27,108
BRIAN Scassellati: OK.

698
00:40:27,108 --> 00:40:30,110

699
00:40:30,110 --> 00:40:33,180
Sua resposta não é verbal.

700
00:40:33,180 --> 00:40:35,180
E ainda lhe deu tanto
um claro reconhecimento

701
00:40:35,180 --> 00:40:39,680
que ele tinha ouvido falar que você disse
e também entendeu que de alguma forma.

702
00:40:39,680 --> 00:40:40,530
ok?

703
00:40:40,530 --> 00:40:42,070
Passo para a direita de volta aqui por um segundo.

704
00:40:42,070 --> 00:40:43,130
Obrigado.

705
00:40:43,130 --> 00:40:44,090
>> Rachel, se você faria.

706
00:40:44,090 --> 00:40:46,070
Agora, eu vou dar-
lhe o trabalho muito mais difícil.

707
00:40:46,070 --> 00:40:48,361
Se você ficar aqui,
backup de apenas um pouco assim

708
00:40:48,361 --> 00:40:50,280
que você pode obter na câmera
e olhe para este lado.

709
00:40:50,280 --> 00:40:56,840
Vou pedir-lhe para dizer alguma coisa
realmente significa e desagradável para o robô.

710
00:40:56,840 --> 00:41:02,900
>> RACHEL: O que você apenas parecia
a fazer era completamente absurda.

711
00:41:02,900 --> 00:41:03,840
>> [ZUMBIDO SOUND]

712
00:41:03,840 --> 00:41:07,610

713
00:41:07,610 --> 00:41:09,030
>> Isso era ainda mais absurdo.

714
00:41:09,030 --> 00:41:10,120
O que está acontecendo com você?

715
00:41:10,120 --> 00:41:13,487

716
00:41:13,487 --> 00:41:16,207
Ah, não se sinta mal.

717
00:41:16,207 --> 00:41:17,040
Vou te dar um abraço.

718
00:41:17,040 --> 00:41:19,882

719
00:41:19,882 --> 00:41:21,090
BRIAN Scassellati: Tudo bem.

720
00:41:21,090 --> 00:41:22,280
Obrigado, Rachel.

721
00:41:22,280 --> 00:41:24,565
Alfredo, Rachel, graças eles muito.

722
00:41:24,565 --> 00:41:26,840
>> [Aplausos]

723
00:41:26,840 --> 00:41:28,660

724
00:41:28,660 --> 00:41:34,470
>> Portanto, este tipo de interação tem em
muitas maneiras algumas das mesmas regras

725
00:41:34,470 --> 00:41:36,950
e alguns dos mesmos
estrutura como o que nós

726
00:41:36,950 --> 00:41:39,950
pode ter na interação lingüística.

727
00:41:39,950 --> 00:41:44,530
É tanto comunicativa e
serve a um propósito importante.

728
00:41:44,530 --> 00:41:48,590
E que a interação, em
muitas maneiras, é concebido

729
00:41:48,590 --> 00:41:52,890
ter um efeito particular sobre a
pessoa interagindo com ou escuta

730
00:41:52,890 --> 00:41:54,410
para o robô.

731
00:41:54,410 --> 00:41:56,450
>> Agora, eu tenho a sorte
ter Jibo aqui hoje.

732
00:41:56,450 --> 00:42:00,550
Sam Spaulding está aqui ajudando
nos com o robô.

733
00:42:00,550 --> 00:42:07,470
E eu vou perguntar a Sam para dar
nos um bom demo de Jibo dança

734
00:42:07,470 --> 00:42:09,720
que podemos ver no final aqui.

735
00:42:09,720 --> 00:42:10,590
Então vá em frente, Jibo.

736
00:42:10,590 --> 00:42:11,550
>> SAM: OK, Jibo.

737
00:42:11,550 --> 00:42:14,430
Mostre-nos seus movimentos de dança.

738
00:42:14,430 --> 00:42:17,310
>> [Música tocando]

739
00:42:17,310 --> 00:42:43,114

740
00:42:43,114 --> 00:42:44,780
BRIAN Scassellati: Tudo bem, todo mundo.

741
00:42:44,780 --> 00:42:46,865
Graças aos nossos amigos em Jibo.

742
00:42:46,865 --> 00:42:49,426
>> [Aplausos]

743
00:42:49,426 --> 00:42:50,140

744
00:42:50,140 --> 00:42:54,990
>> E graças aos nossos amigos na
IBM para ajudar para fora hoje.

745
00:42:54,990 --> 00:42:57,300
A comunicação é algo
que você está indo

746
00:42:57,300 --> 00:43:02,280
para ver chegando cada vez mais como
nós construir interfaces mais complexas.

747
00:43:02,280 --> 00:43:05,760
Na próxima semana, vamos estar falando
sobre como fazer a interface

748
00:43:05,760 --> 00:43:08,890
com adversários controlados pelo computador em jogos.

749
00:43:08,890 --> 00:43:12,950
Mas se você tiver dúvidas sobre isso,
Eu vou estar em torno de hoje à noite o horário de expediente.

750
00:43:12,950 --> 00:43:17,610
Estou feliz em falar com você sobre AI
tópicos ou para entrar em mais detalhes.

751
00:43:17,610 --> 00:43:18,927
Tenha um bom final de semana.

752
00:43:18,927 --> 00:43:21,409
>> [Aplausos]

753
00:43:21,409 --> 00:43:21,909

754
00:43:21,909 --> 00:43:26,141
[Música tocando]

755
00:43:26,141 --> 00:46:42,879