1
00:00:00,000 --> 00:00:02,928
>> [音乐播放]

2
00:00:02,928 --> 00:00:11,230

3
00:00:11,230 --> 00:00:12,790
>> DAVID马兰：这是CS50。

4
00:00:12,790 --> 00:00:14,072
这为10周结束时。

5
00:00:14,072 --> 00:00:16,030
和男孩，我们有一个
良好的班为你今天。

6
00:00:16,030 --> 00:00:20,040
我们很高兴地邀请两
我们从耶鲁的朋友赶快到我们今天

7
00:00:20,040 --> 00:00:23,920
并且看的交集
人工智能，机器人技术，

8
00:00:23,920 --> 00:00:25,710
自然语言处理，以及更多。

9
00:00:25,710 --> 00:00:27,090
>> 事实上，在
过去几周，我们已经

10
00:00:27,090 --> 00:00:29,714
肯定花了很多时间，
特别是在较早的pset，

11
00:00:29,714 --> 00:00:31,560
专注于相当低级别的细节。

12
00:00:31,560 --> 00:00:34,520
它很容易忽视
森林的树木

13
00:00:34,520 --> 00:00:38,170
并获得挂在循环和条件
和指针，当然，和类似物。

14
00:00:38,170 --> 00:00:41,770
但现实情况是，你们现在有
配料与你可真

15
00:00:41,770 --> 00:00:45,300
解决了一些有趣的问题，其中
他们那些我们的朋友在耶鲁

16
00:00:45,300 --> 00:00:48,790
工作只是害羞剑桥。

17
00:00:48,790 --> 00:00:52,410
>> 所以，首先请允许我介绍一下我们的头
教学耶鲁大学，安迪的助手。

18
00:00:52,410 --> 00:00:55,182
>> [掌声]

19
00:00:55,182 --> 00:00:57,030

20
00:00:57,030 --> 00:01:00,710
>> 安迪：首先，只是感谢
你让一对夫妇Yalies

21
00:01:00,710 --> 00:01:02,700
今天流行下到剑桥。

22
00:01:02,700 --> 00:01:05,299
我们真的很感激。

23
00:01:05,299 --> 00:01:07,090
其次，我们的朋友
回home--杰森，

24
00:01:07,090 --> 00:01:09,670
感谢保持和运行讲座。

25
00:01:09,670 --> 00:01:12,970
希望它在纽黑文都​​好。

26
00:01:12,970 --> 00:01:15,720
>> 所以呀，我超级兴奋
今天给大家介绍Scaz。

27
00:01:15,720 --> 00:01:17,020
Scaz运行的机器人实验室。

28
00:01:17,020 --> 00:01:19,690
他是一个教授，像五
不同的部门在耶鲁大学。

29
00:01:19,690 --> 00:01:23,159
在他的实验室，他有很多很多
机器人，他喜欢玩。

30
00:01:23,159 --> 00:01:24,950
他有一样的
最酷的工作在世界上。

31
00:01:24,950 --> 00:01:27,116
而他得到一种混乱
与整天各地

32
00:01:27,116 --> 00:01:29,090
长，做了一些工作，以及。

33
00:01:29,090 --> 00:01:33,070
>> 因此，我们实际上增添了一颗
与我们今天的人下来。

34
00:01:33,070 --> 00:01:36,900
因此，事不宜迟，Scaz是
要继续前进，并为我们介绍一下

35
00:01:36,900 --> 00:01:38,660
以他的机器人朋友。

36
00:01:38,660 --> 00:01:41,546
>> [掌声]

37
00:01:41,546 --> 00:01:42,935

38
00:01:42,935 --> 00:01:44,310
BRIAN SCASSELLATI：谢谢你，大卫。

39
00:01:44,310 --> 00:01:45,380
谢谢你，安迪。

40
00:01:45,380 --> 00:01:50,050
它是如此美妙的是
这里与大家今天。

41
00:01:50,050 --> 00:01:56,490
我想首先要非常清楚，
这里的CS50工作人员在剑桥

42
00:01:56,490 --> 00:01:59,190
一直令人难以置信的热情好客给我们。

43
00:01:59,190 --> 00:02:02,130
我们非常感谢所有
他们所做的支持我们。

44
00:02:02,130 --> 00:02:05,690
因此，我们希望能
返回的恩情。

45
00:02:05,690 --> 00:02:09,370
>> 所以今天，我们得到的宣布
那我们将有一个新的，

46
00:02:09,370 --> 00:02:15,240
CS50的事件之一的一类
下周在纽黑文的发生。

47
00:02:15,240 --> 00:02:18,040
这是CS50研究世博会。

48
00:02:18,040 --> 00:02:21,300
因此，我们将要邀请
everyone-- CS50学生，

49
00:02:21,300 --> 00:02:26,510
工作人员来自美国哈佛大学和Yale--到
下来和我们一起参观上周五。

50
00:02:26,510 --> 00:02:30,400
我们将有各种各样的超过
30个不同的人提出

51
00:02:30,400 --> 00:02:34,830
和exhibiting--年级学生展示
了一些他们的研究产品。

52
00:02:34,830 --> 00:02:38,480
我们将有一些创业公司，甚至，看
对于新的高科技人才一点点，

53
00:02:38,480 --> 00:02:40,460
初创公司来自哈佛和耶鲁。

54
00:02:40,460 --> 00:02:44,550
而且，我们还会有一些学生团体
寻找一些新的成员。

55
00:02:44,550 --> 00:02:46,357
>> 这将是一个非常激动人心的时刻。

56
00:02:46,357 --> 00:02:49,190
希望你们谁是
下来的哈佛，耶鲁游戏

57
00:02:49,190 --> 00:02:51,360
将能够停止
年初由一点点，

58
00:02:51,360 --> 00:02:54,060
就在校园中心，
斯特林纪念图书馆。

59
00:02:54,060 --> 00:02:58,040
我们要有一套
展品范围从自主

60
00:02:58,040 --> 00:03:04,460
帆船使用软件的方式
保存中世纪手稿。

61
00:03:04,460 --> 00:03:07,860
>> 我们将有广告
组织网络和人员

62
00:03:07,860 --> 00:03:11,230
教学软件编码在开普敦。

63
00:03:11,230 --> 00:03:13,730
我们将有电脑
音乐表演。

64
00:03:13,730 --> 00:03:16,020
我们会的过程中有更多的机器人。

65
00:03:16,020 --> 00:03:18,900
因此，我们希望你会
参加我们这个活动。

66
00:03:18,900 --> 00:03:21,350
这应该是一个很大的
乐趣，食物一点点，

67
00:03:21,350 --> 00:03:24,430
和很多有趣的
事情要谈。

68
00:03:24,430 --> 00:03:28,230
>> 所以我们今天要谈
关于自然语言处理。

69
00:03:28,230 --> 00:03:32,560
这是对我们的尝试
建立接口的新途径

70
00:03:32,560 --> 00:03:35,150
与我们的设备，因为
在过去的几个星期，

71
00:03:35,150 --> 00:03:40,800
你一直专注于它是如何说
您可以编写代码，编写软件

72
00:03:40,800 --> 00:03:47,110
那就是能说一个办法
机，这就是我要你做的。

73
00:03:47,110 --> 00:03:50,210
>> 但是，我们不应该需要
预计一切

74
00:03:50,210 --> 00:03:53,760
这是在那里这是我们用来
每个人都在世界

75
00:03:53,760 --> 00:03:57,480
将是精通
在这样的结构。

76
00:03:57,480 --> 00:04:02,540
因此，我们区分计算机之间
语言和自然languages​​--

77
00:04:02,540 --> 00:04:06,720
也就是说，事情人类使用
与其他人进行通信。

78
00:04:06,720 --> 00:04:12,270
我们试图构建一个使用界面
这些自然的沟通机制。

79
00:04:12,270 --> 00:04:16,029
>> 现在，就像所有其他的话题
我们已经开始在CS50，

80
00:04:16,029 --> 00:04:19,589
我们将先从最简单的
自然语言处理的位

81
00:04:19,589 --> 00:04:21,269
我们可以想像。

82
00:04:21,269 --> 00:04:24,940
我们将开始与
自然语言的历史的一部分。

83
00:04:24,940 --> 00:04:28,740
然后，我们将建立以
越来越多的最近的系统

84
00:04:28,740 --> 00:04:31,450
并有一些有趣的演示沿途。

85
00:04:31,450 --> 00:04:35,900
>> 因此，我们要开始什么
可能是第一个自然语言

86
00:04:35,900 --> 00:04:38,210
处理系统。

87
00:04:38,210 --> 00:04:45,080
这是写在一个软件系统
1966年由约瑟夫·魏泽鲍姆叫做ELIZA。

88
00:04:45,080 --> 00:04:49,640
伊莱扎被设计成
复制类型的相互作用

89
00:04:49,640 --> 00:04:53,850
你将有一个
罗吉瑞恩心理治疗师。

90
00:04:53,850 --> 00:04:57,210
现在，Rogerians，他们有
一个想法，心理治疗

91
00:04:57,210 --> 00:05:02,800
参与能够反映回
给患者和他们交谈，

92
00:05:02,800 --> 00:05:08,100
基本上，只给他们一个
治疗师的微小点点。

93
00:05:08,100 --> 00:05:09,920
也就是说，一切
治疗师说：

94
00:05:09,920 --> 00:05:16,500
被认为是仅仅反映
什么样的病人告诉他们。

95
00:05:16,500 --> 00:05:18,990
>> 因此，让我们尝试演示这一点。

96
00:05:18,990 --> 00:05:22,820
我们有一个志愿者谁愿意成为
愿意分享他们的最深的，

97
00:05:22,820 --> 00:05:26,650
最黑暗的，和/或假的秘密与伊莉莎？

98
00:05:26,650 --> 00:05:29,680
当然，你为什么不来就到了。

99
00:05:29,680 --> 00:05:30,847
太棒了。

100
00:05:30,847 --> 00:05:31,430
你的名字？

101
00:05:31,430 --> 00:05:32,000
>> 迈尔斯：万里。

102
00:05:32,000 --> 00:05:33,041
>> BRIAN SCASSELLATI：万里。

103
00:05:33,041 --> 00:05:34,270
很高兴见到你，万里。

104
00:05:34,270 --> 00:05:36,270
如果你想抓住这一点。

105
00:05:36,270 --> 00:05:40,840
而且我们要
使用版本ELIZA的

106
00:05:40,840 --> 00:05:44,640
我们已经复制
内CS50 IDE。

107
00:05:44,640 --> 00:05:47,140
并且我们将看看源
在一小会儿代码这一点。

108
00:05:47,140 --> 00:05:49,910
但现在，我们只是
要通过键入伊莉莎来调用它。

109
00:05:49,910 --> 00:05:55,480
>> 伊莱扎将会给您回应
这将是在所有的首都。

110
00:05:55,480 --> 00:05:57,950
而要问你几个问题。

111
00:05:57,950 --> 00:06:02,130
我们会作出回应，并键入
在应对ELIZA。

112
00:06:02,130 --> 00:06:04,310
所以伊莉莎说，“嗨，我是伊莉莎。

113
00:06:04,310 --> 00:06:05,462
你怎么了？”

114
00:06:05,462 --> 00:06:08,092
你会想
告诉ELIZA今天呢？

115
00:06:08,092 --> 00:06:10,750
>> 迈尔斯：我只能入睡
如果我有兔子拖鞋上。

116
00:06:10,750 --> 00:06:12,440
>> BRIAN SCASSELLATI：好吧。

117
00:06:12,440 --> 00:06:13,360
好吧。

118
00:06:13,360 --> 00:06:15,300
>> [笑声]

119
00:06:15,300 --> 00:06:22,410
>> “我只能入睡
与兔宝宝拖鞋上“。

120
00:06:22,410 --> 00:06:29,000
伊莱扎说，“喂，你
有什么心理问题？

121
00:06:29,000 --> 00:06:30,450
也许这是一个很好的指标。“

122
00:06:30,450 --> 00:06:30,780
>> 好。

123
00:06:30,780 --> 00:06:32,245
所以，你想回应？

124
00:06:32,245 --> 00:06:36,110

125
00:06:36,110 --> 00:06:36,970
>> 迈尔斯：是的。

126
00:06:36,970 --> 00:06:38,660
>> 布赖恩SCASSELLATI：是的。

127
00:06:38,660 --> 00:06:39,570
人的许多话。

128
00:06:39,570 --> 00:06:41,870
我喜欢这一点。

129
00:06:41,870 --> 00:06:50,200
伊莉莎说，“你似乎相当积极。”

130
00:06:50,200 --> 00:06:53,200
>> MILES：不，我，其实，一个电子。

131
00:06:53,200 --> 00:06:55,150
>> BRIAN SCASSELLATI：“没有。

132
00:06:55,150 --> 00:07:02,240
其实，我是一个电子。“
“你来我往

133
00:07:02,240 --> 00:07:06,954
因为你是一个电子？“

134
00:07:06,954 --> 00:07:08,870
现在，我们可以看到一些
在things--我要去

135
00:07:08,870 --> 00:07:10,200
暂停你只是一秒钟，万里。

136
00:07:10,200 --> 00:07:11,010
不要去任何地方。

137
00:07:11,010 --> 00:07:12,650
我们不跟你做呢。

138
00:07:12,650 --> 00:07:16,490
伊莉莎是，在某些方面，
回应一些事情

139
00:07:16,490 --> 00:07:21,140
那他的说法，但没有
任何真正的理解。

140
00:07:21,140 --> 00:07:26,090
而且它也学舌距今约
他的句子成分。

141
00:07:26,090 --> 00:07:27,310
>> 所以我们说，“没有。

142
00:07:27,310 --> 00:07:29,090
其实，我是一个电子。“

143
00:07:29,090 --> 00:07:34,190
伊丽莎也回应道：“你来
我，因为你是一个电子？“

144
00:07:34,190 --> 00:07:34,690
好吧。

145
00:07:34,690 --> 00:07:36,050
让我们给它在这里多了一个回应。

146
00:07:36,050 --> 00:07:37,140
给它一个很好的，万里。

147
00:07:37,140 --> 00:07:37,806
>> 迈尔斯：好一个？

148
00:07:37,806 --> 00:07:48,400

149
00:07:48,400 --> 00:07:49,570
>> 是的，请帮助我。

150
00:07:49,570 --> 00:07:50,570
BRIAN SCASSELLATI：“是的。

151
00:07:50,570 --> 00:07:58,010
请帮帮我。“”你确定吗？“

152
00:07:58,010 --> 00:07:58,510
MILES：第

153
00:07:58,510 --> 00:08:00,860
BRIAN SCASSELLATI：没有。

154
00:08:00,860 --> 00:08:03,562
“这是什么建议吗？”

155
00:08:03,562 --> 00:08:06,760
>> 迈尔斯：我可能不是一个电子。

156
00:08:06,760 --> 00:08:11,170
>> BRIAN SCASSELLATI：“我
可能不是一个电子。“

157
00:08:11,170 --> 00:08:13,790
“你是说没有刚需负？”

158
00:08:13,790 --> 00:08:14,390
>> 好吧。

159
00:08:14,390 --> 00:08:16,030
所以万里，太感谢你了。

160
00:08:16,030 --> 00:08:16,860
>> MILES：谢谢。

161
00:08:16,860 --> 00:08:18,360
>> BRIAN SCASSELLATI：非常感谢。

162
00:08:18,360 --> 00:08:20,230
[掌声]

163
00:08:20,230 --> 00:08:21,230

164
00:08:21,230 --> 00:08:26,700
>> 因此，这伊莉莎项目，在许多方面，
正在响应只是件

165
00:08:26,700 --> 00:08:32,730
我们正在提供，没有任何深
了解这里发生了什么。

166
00:08:32,730 --> 00:08:36,640
这是一种制度
被称为模式匹配，其中，

167
00:08:36,640 --> 00:08:40,490
我们正在寻找某些
文本位，我们是那么

168
00:08:40,490 --> 00:08:44,860
要带出什么
作为输入提供，

169
00:08:44,860 --> 00:08:52,580
转换，潜在地，以某种方式，
然后给它返回给用户。

170
00:08:52,580 --> 00:08:55,150
>> 做任何你认为
伊丽莎实际上是

171
00:08:55,150 --> 00:08:58,230
在这里进行有效的心理？

172
00:08:58,230 --> 00:08:59,250
一个人，也许。

173
00:08:59,250 --> 00:09:00,166
>> 听众：[听不清]。

174
00:09:00,166 --> 00:09:03,315

175
00:09:03,315 --> 00:09:05,440
BRIAN SCASSELLATI：怎么
这是否让你有什么感觉？

176
00:09:05,440 --> 00:09:06,530
是的，事实上，它的作用。

177
00:09:06,530 --> 00:09:10,890
我们将看到，实际上，
它一会儿就好了源代码。

178
00:09:10,890 --> 00:09:13,580
所以，你要成为
能够做到正是这一点。

179
00:09:13,580 --> 00:09:17,420
>> 现在，伊莉莎是一种形式是什么
我们称之为今天的聊天机器人。

180
00:09:17,420 --> 00:09:19,950
它只是通过
文本你提供，

181
00:09:19,950 --> 00:09:24,030
提供了最低限度的金额
理解或处理，

182
00:09:24,030 --> 00:09:26,790
然后鹦鹉回给你。

183
00:09:26,790 --> 00:09:31,830
因此，让我们来看看，
概念上，并谈什么

184
00:09:31,830 --> 00:09:34,690
这是伊莉莎实际上是做什么。

185
00:09:34,690 --> 00:09:42,000
>> 伊莉莎走的是一条sentence--让我们
说，“我想打动我的老板。”

186
00:09:42,000 --> 00:09:45,130
而伊莉莎期待
通过那句话

187
00:09:45,130 --> 00:09:48,730
并试图找到与
与特定模式匹配。

188
00:09:48,730 --> 00:09:52,850
因此，例如，有一种格式
伊丽莎正在寻找的话

189
00:09:52,850 --> 00:09:55,110
“我要。”

190
00:09:55,110 --> 00:09:59,330
而且任何时候它看到的东西
有“我要”的话，

191
00:09:59,330 --> 00:10:01,770
它制定的响应。

192
00:10:01,770 --> 00:10:05,040
并且响应是固定字符串。

193
00:10:05,040 --> 00:10:07,915
在这种情况下，它是“为什么你要干什么？”

194
00:10:07,915 --> 00:10:11,330
我把一个小明星
到底是因为这只是

195
00:10:11,330 --> 00:10:13,310
我们的反应的开始。

196
00:10:13,310 --> 00:10:16,310
而星指出，
我们要采取休息

197
00:10:16,310 --> 00:10:19,850
用户的utterance--的
“打动我的老板” - 

198
00:10:19,850 --> 00:10:24,500
而且我们要追加的
到该字符串的结尾。

199
00:10:24,500 --> 00:10:28,990
>> 所以，现在，而不是说，“为什么
你想打动我的老板。“

200
00:10:28,990 --> 00:10:31,800
有额外的一点点
处理，我们将尽。

201
00:10:31,800 --> 00:10:34,440
也就是说，我们必须
转换某些代词

202
00:10:34,440 --> 00:10:38,670
在这里，从“我的老板”到“你的老板。”

203
00:10:38,670 --> 00:10:41,300
还有可能是一些其他
我们需要做出改变。

204
00:10:41,300 --> 00:10:44,990
因此，而不是仅仅坚持到底
直接到年底，我们将做什么

205
00:10:44,990 --> 00:10:49,160
是我们将采取的其他地方
白这里 - 用户utterance--

206
00:10:49,160 --> 00:10:54,090
我们会把它一件一件
时间和转换每串

207
00:10:54,090 --> 00:10:58,180
的道理，每一个字，变成了一句。

208
00:10:58,180 --> 00:10:59,580
>> 因此，我们将取词“来。”

209
00:10:59,580 --> 00:11:01,650
有没有转换
我们需要做的。

210
00:11:01,650 --> 00:11:02,340
“没话说了。”

211
00:11:02,340 --> 00:11:04,140
有没有转换
我们需要做的还有。

212
00:11:04,140 --> 00:11:06,670
“我的”将转换为“你的。”

213
00:11:06,670 --> 00:11:10,070
而“老板”，我们就离开的“老大”。

214
00:11:10,070 --> 00:11:12,740
然后最后，什么
与一期结束，

215
00:11:12,740 --> 00:11:16,640
我们将它转​​换成一个问题。

216
00:11:16,640 --> 00:11:22,600
>> 这个非常简单的模式匹配
其实是相当成功的。

217
00:11:22,600 --> 00:11:27,260
当这个被介绍
在1966--约瑟夫·魏泽鲍姆

218
00:11:27,260 --> 00:11:28,986
在计算机上编程这一点。

219
00:11:28,986 --> 00:11:31,110
现在，电脑在当时
不是台式机机型。

220
00:11:31,110 --> 00:11:33,950
它们共享资源。

221
00:11:33,950 --> 00:11:39,090
而他的学生们
去和伊莉莎聊天。

222
00:11:39,090 --> 00:11:41,570
最终，他不得不
限制对它的访问

223
00:11:41,570 --> 00:11:43,890
由于他的学生不
让做任何工作。

224
00:11:43,890 --> 00:11:46,190
他们只是聊天ELIZA。

225
00:11:46,190 --> 00:11:48,850
而且，事实上，他不得不
火他的助手，谁

226
00:11:48,850 --> 00:11:55,840
花光了所有她的时间交谈ELIZA
关于她的深，令人担忧的问题。

227
00:11:55,840 --> 00:12:00,350
>> 大家谁使用这些系统
开始人格化他们。

228
00:12:00,350 --> 00:12:04,490
他们开始认为他们是
是动画和真实的人。

229
00:12:04,490 --> 00:12:07,969
他们开始认识到一些
的事情，他们说

230
00:12:07,969 --> 00:12:09,010
人回来给他们。

231
00:12:09,010 --> 00:12:12,120
他们就查不到
事他们自己。

232
00:12:12,120 --> 00:12:17,290
而且，事实上，即使是专家，
即使是心理咨询师，

233
00:12:17,290 --> 00:12:22,930
开始担心，事实上，
也许ELIZA将取而代之。

234
00:12:22,930 --> 00:12:25,640
即使电脑
科学家们担心，我们

235
00:12:25,640 --> 00:12:30,040
如此接近解决自然语言。

236
00:12:30,040 --> 00:12:33,520
>> 现在，这不是任何地方接近真实。

237
00:12:33,520 --> 00:12:37,280
但是，这是多么令人印象深刻
这些系统似乎可以。

238
00:12:37,280 --> 00:12:40,080
因此，让我们先来了解一下
下面，并尝试

239
00:12:40,080 --> 00:12:46,190
得到的问题一点点
在哪里这段代码实际上发生。

240
00:12:46,190 --> 00:12:48,170
所以我们会让这个代码
可之后。

241
00:12:48,170 --> 00:12:50,880
而这是一个非常
简单而直接端口

242
00:12:50,880 --> 00:12:53,240
的原始ELIZA实施。

243
00:12:53,240 --> 00:12:56,350
>> 因此，一些文体的
的事情，你会看到这里

244
00:12:56,350 --> 00:12:59,360
不文体什么
我们希望你做

245
00:12:59,360 --> 00:13:01,480
或者是我们一直教你做。

246
00:13:01,480 --> 00:13:04,770
但是，我们一直试图让他们
跨越许多港口一样

247
00:13:04,770 --> 00:13:08,087
这已使得它
具有原始的味道。

248
00:13:08,087 --> 00:13:09,920
所以，我们要包括
一堆东​​西，

249
00:13:09,920 --> 00:13:12,920
然后我们将有一个
设置关键字，东西

250
00:13:12,920 --> 00:13:16,460
伊丽莎将识别
并响应直接。

251
00:13:16,460 --> 00:13:20,780
所以，如果你有这样的话
“可你”或“我不知道”或“否”

252
00:13:20,780 --> 00:13:24,680
或“是”或“梦想”
或“你好”，然后ELIZA

253
00:13:24,680 --> 00:13:27,920
将选择性响应那些。

254
00:13:27,920 --> 00:13:30,010
我们也有一个
一定数量的东西

255
00:13:30,010 --> 00:13:34,940
我们会掉，像
将“我”到“你的。”

256
00:13:34,940 --> 00:13:39,920
>> 然后，我们将有一系列的反应
对于每个这些关键字，

257
00:13:39,920 --> 00:13:42,580
我们将通过旋转
这些不同的响应。

258
00:13:42,580 --> 00:13:45,350
所以，如果我说“是”
在连续三次，我

259
00:13:45,350 --> 00:13:50,429
可能会得到三个不同的
从ELIZA回应。

260
00:13:50,429 --> 00:13:52,345
我们的代码，那么，
其实非常简单。

261
00:13:52,345 --> 00:13:59,490
如果我向下滚动过去所有这些
我们已经编程响应

262
00:13:59,490 --> 00:14:02,920
我们踏踏实实地我们主要的，
我们要初始化

263
00:14:02,920 --> 00:14:06,540
几个不同的变量
做家政的一点点

264
00:14:06,540 --> 00:14:08,480
在一开始的时候。

265
00:14:08,480 --> 00:14:11,760
但后来有绝对的一组
，你可以理解的代码。

266
00:14:11,760 --> 00:14:15,820
一个大while循环，说我
一遍又一遍地重复这一点。

267
00:14:15,820 --> 00:14:20,420
我会读成一排，我会
存储在一个输入字符串。

268
00:14:20,420 --> 00:14:23,880
我查一下，看看它的
特殊的关键字“再见”，这

269
00:14:23,880 --> 00:14:26,199
意味着退出程序。

270
00:14:26,199 --> 00:14:29,240
然后我会检查，看看是否
有人只是在重复自己

271
00:14:29,240 --> 00:14:29,800
一遍又一遍。

272
00:14:29,800 --> 00:14:31,174
我会骂他们，如果他们这样做。

273
00:14:31,174 --> 00:14:34,820
我会说“不要重复自己。”

274
00:14:34,820 --> 00:14:40,500
>> 只要这些都不发生，我们将
然后通过与环通扫描，

275
00:14:40,500 --> 00:14:45,330
上线308至313
在这里，检查，看看

276
00:14:45,330 --> 00:14:49,090
是任何这些关键字
包含在输入短语

277
00:14:49,090 --> 00:14:50,620
我刚才是？

278
00:14:50,620 --> 00:14:54,845
如果有匹配对于他们来说，好
然后，我会记住的位置。

279
00:14:54,845 --> 00:14:57,050
我会记住的关键词。

280
00:14:57,050 --> 00:14:58,620
而我就可以建立一个响应。

281
00:14:58,620 --> 00:15:03,150
>> 如果我没有找到一个，那么，
在我的关键字数组中的最后一件事

282
00:15:03,150 --> 00:15:08,070
将我的默认响应，
在没有其他匹配。

283
00:15:08,070 --> 00:15:14,160
我会问这样的问题：“你为什么要
到这里来？“或者”我怎么帮你呢？“

284
00:15:14,160 --> 00:15:19,710
这只是部分适当
不管输入是什么。

285
00:15:19,710 --> 00:15:22,580
>> 然后，我们将建立艾丽莎的回应。

286
00:15:22,580 --> 00:15:26,040
我们就可以采取
该基地的响应，

287
00:15:26,040 --> 00:15:28,370
就像我们做的是
“我的老板”的例子。

288
00:15:28,370 --> 00:15:30,970

289
00:15:30,970 --> 00:15:33,990
如果这是所有有
is--如果它只有一个

290
00:15:33,990 --> 00:15:36,860
那我应该respond--字符串
我可以将它发送回来。

291
00:15:36,860 --> 00:15:40,610
如果它有一个星号，在
它的结束，然后我会

292
00:15:40,610 --> 00:15:45,710
在处理每个令牌
用户的响应的其余部分

293
00:15:45,710 --> 00:15:51,590
并添加那些，换出
一个字一个字，因为我需要。

294
00:15:51,590 --> 00:15:56,100
>> 所有这一切都是绝对
东西，你可以建立。

295
00:15:56,100 --> 00:15:59,230
而事实上，该方法，使我们
已经处理的命令行参数，

296
00:15:59,230 --> 00:16:03,570
在你的方式
通过HTTP请求处理

297
00:16:03,570 --> 00:16:05,510
遵循相同的种的规则。

298
00:16:05,510 --> 00:16:08,220
他们是模式匹配。

299
00:16:08,220 --> 00:16:15,170
>> 所以伊莉莎有一个比较重要的
对自然语言的影响

300
00:16:15,170 --> 00:16:21,620
因为它使人们看起来这是一个
很实现的目标，比如在某种程度上我们最好

301
00:16:21,620 --> 00:16:25,550
能够直接解决这个问题。

302
00:16:25,550 --> 00:16:30,670
现在，这并不是说，ELIZA做
一切，我们愿意这样做。

303
00:16:30,670 --> 00:16:33,710
当然不是。

304
00:16:33,710 --> 00:16:35,660
但是，我们应该能
做更多的东西。

305
00:16:35,660 --> 00:16:38,280

306
00:16:38,280 --> 00:16:41,490
>> 我们的第一个步骤去
超越伊莉莎是怎么回事

307
00:16:41,490 --> 00:16:44,840
要能看
没有文字被输入

308
00:16:44,840 --> 00:16:53,750
进键盘，但讲话，实际
语音记录到麦克风。

309
00:16:53,750 --> 00:16:56,880
因此，当我们看这些
不同的部分，我们

310
00:16:56,880 --> 00:17:00,304
将要建立一组模型。

311
00:17:00,304 --> 00:17:02,970
我们将必须能
从低级别的声去

312
00:17:02,970 --> 00:17:07,180
information--间距，
振幅，frequency--

313
00:17:07,180 --> 00:17:09,530
并转换到这
一些单位，我们是

314
00:17:09,530 --> 00:17:14,619
能够更容易地操纵
并且，最后，操控起来

315
00:17:14,619 --> 00:17:18,609
成单词和句子。

316
00:17:18,609 --> 00:17:22,880
>> 因此，大多数语音识别
今天是在那里系统

317
00:17:22,880 --> 00:17:26,069
按照统计
模型中，我们建立

318
00:17:26,069 --> 00:17:35,090
三个独立的东西表示
该音频信号实际上包含。

319
00:17:35,090 --> 00:17:38,640
我们先从一个语音模型
，讨论刚刚基地

320
00:17:38,640 --> 00:17:41,250
声音，我生产。

321
00:17:41,250 --> 00:17:46,900
我是不是生产的东西是
一个B为男孩或D-如狗？

322
00:17:46,900 --> 00:17:53,220
我如何识别这些两个不同
手机作为单独的独特？

323
00:17:53,220 --> 00:17:56,600
>> 最重要的是，我们会再建
一个字的发音模式，

324
00:17:56,600 --> 00:18:01,350
东西连接在一起
这些个人手机

325
00:18:01,350 --> 00:18:04,724
并把它们组合成一个字。

326
00:18:04,724 --> 00:18:07,890
在这之后，我们将采取的话
我们将它们组装用语言

327
00:18:07,890 --> 00:18:13,010
模拟成一个完整的句子。

328
00:18:13,010 --> 00:18:17,230
>> 现在，我们要谈谈每个
这些独立和分开。

329
00:18:17,230 --> 00:18:21,580
但是，这三款车型都是
只是要统计。

330
00:18:21,580 --> 00:18:23,502
这意味着，当我们
与他们合作，我们将

331
00:18:23,502 --> 00:18:25,376
能够一起工作
他们都同时进行。

332
00:18:25,376 --> 00:18:28,100

333
00:18:28,100 --> 00:18:28,600
好吧。

334
00:18:28,600 --> 00:18:30,890
让我们先从我们的语音模型。

335
00:18:30,890 --> 00:18:34,470
因此，语音模型依赖于
一个计算技术

336
00:18:34,470 --> 00:18:37,320
叫隐马尔可夫模型。

337
00:18:37,320 --> 00:18:43,050
这些都是图形化的模型中，我
已经和认识世界的一个状态

338
00:18:43,050 --> 00:18:46,500
作为其特征
由一组特征。

339
00:18:46,500 --> 00:18:51,960
而这种状态描述一个组成部分
那我从事的行动。

340
00:18:51,960 --> 00:19:00,190
>> 所以，如果我想制作
声音“马”像妈妈，

341
00:19:00,190 --> 00:19:03,970
有不同
组件的声音。

342
00:19:03,970 --> 00:19:07,230
还有就是我画的气息的一部分。

343
00:19:07,230 --> 00:19:09,560
然后，我的钱包我的嘴唇。

344
00:19:09,560 --> 00:19:13,710
而我摇我的嘴唇退后一点
位，以使这一“马”的声音。

345
00:19:13,710 --> 00:19:15,340
然后还有一个版本。

346
00:19:15,340 --> 00:19:17,020
我的嘴唇裂开。

347
00:19:17,020 --> 00:19:19,030
空气被排出。

348
00:19:19,030 --> 00:19:22,650
“嘛。”

349
00:19:22,650 --> 00:19:29,250
>> 这三个不同的部分会
各国在这个graph--代表

350
00:19:29,250 --> 00:19:33,420
开始时，中间和结束。

351
00:19:33,420 --> 00:19:38,060
我将有过渡的
让我从一个国家旅行

352
00:19:38,060 --> 00:19:42,260
到下一个与一定的概率。

353
00:19:42,260 --> 00:19:47,250
因此，举例来说，是m
听起来可能有一个非常，

354
00:19:47,250 --> 00:19:51,850
很短的摄入量在beginning--
“毫米” - 然后较长，

355
00:19:51,850 --> 00:19:55,640
振动阶段时，我抱着我
双唇几乎humming--

356
00:19:55,640 --> 00:20:05,090
“MMMM” - 然后在很短的
爆破音，我驱逐breath--“马”。

357
00:20:05,090 --> 00:20:09,370
>> 的隐马尔可夫模型是
用来捕捉的事实

358
00:20:09,370 --> 00:20:13,340
这是我做的方式
声音“马”是怎么回事

359
00:20:13,340 --> 00:20:17,350
是在略微不同的
其定时，是频率，

360
00:20:17,350 --> 00:20:21,030
其功能比
您所做的方式

361
00:20:21,030 --> 00:20:23,300
或办法，我可能
让我说话的时候

362
00:20:23,300 --> 00:20:26,030
对不同用途的信。

363
00:20:26,030 --> 00:20:33,240
“母亲”和“我可以”将
声音略有不同。

364
00:20:33,240 --> 00:20:36,800
>> 因此，为了识别
特定的声音，我们会

365
00:20:36,800 --> 00:20:42,020
建立马尔可夫模型，这些隐马尔可夫
每一个可能的手机型号，我

366
00:20:42,020 --> 00:20:45,840
可能要承认，
每一个可能的声音，

367
00:20:45,840 --> 00:20:49,750
再看看
声学数据，我有

368
00:20:49,750 --> 00:20:54,430
并确定统计学
哪一个是最有可能的

369
00:20:54,430 --> 00:20:58,110
已经产生这种声音。

370
00:20:58,110 --> 00:20:58,610
好。

371
00:20:58,610 --> 00:21:01,540

372
00:21:01,540 --> 00:21:06,750
通过这种模式，我们再
开始建立在它之上。

373
00:21:06,750 --> 00:21:09,330
我们采取的发音模式。

374
00:21:09,330 --> 00:21:11,790
现在，有时发音
模型既简单又容易

375
00:21:11,790 --> 00:21:14,440
因为只有一个
这样发音的东西。

376
00:21:14,440 --> 00:21:17,990
其他时候，他们是一个
稍微复杂一些。

377
00:21:17,990 --> 00:21:21,340
这里有一个发音指南
对于红色的东西就是

378
00:21:21,340 --> 00:21:25,210
您所做的番茄酱出来的水果。

379
00:21:25,210 --> 00:21:27,360
人们不认为这是一个水果。

380
00:21:27,360 --> 00:21:27,860
对？

381
00:21:27,860 --> 00:21:30,880

382
00:21:30,880 --> 00:21:35,300
>> 现在，有许多不同的方式
人们会念这个字。

383
00:21:35,300 --> 00:21:37,780
有些人会说“脚趾5脚趾。”

384
00:21:37,780 --> 00:21:40,880
有些人会说“脚趾麻将脚趾。”

385
00:21:40,880 --> 00:21:44,800
我们可以捕捉与
这些图形化的车型之一

386
00:21:44,800 --> 00:21:48,305
在这里，我们再次表示过渡
作为具有一定概率

387
00:21:48,305 --> 00:21:51,360
和相关的概率他们。

388
00:21:51,360 --> 00:21:58,290
>> 所以在这种情况下，如果我是跟随
通过这整个图上的路线，

389
00:21:58,290 --> 00:22:03,330
我将开始在信
在最左边的“TA”的声音。

390
00:22:03,330 --> 00:22:07,570
我想借此上半部分，
的“哦”，然后是“马”

391
00:22:07,570 --> 00:22:14,530
然后一个“a”，然后一个
“TA”和“哦。” “脚趾可能脚趾。”

392
00:22:14,530 --> 00:22:19,610
如果我通过了底部路径
这一点，我会得到“TA-MAH-脚趾。”

393
00:22:19,610 --> 00:22:26,810
如果我去了，然后
起来，我会得到“TA-MAY-脚趾。”

394
00:22:26,810 --> 00:22:29,950
>> 这些模型捕捉这些
差异，因为每当

395
00:22:29,950 --> 00:22:32,410
我们部署的其中之一
识别系统，

396
00:22:32,410 --> 00:22:35,340
这将有工作
许多不同类型的人，

397
00:22:35,340 --> 00:22:39,295
许多不同的口音，甚至
不同用途的同样的话。

398
00:22:39,295 --> 00:22:42,204

399
00:22:42,204 --> 00:22:44,120
最后，最重要的是，
我们要建立的东西

400
00:22:44,120 --> 00:22:48,780
看起来非常复杂，
称为语言模型，

401
00:22:48,780 --> 00:22:52,950
但实际上是最简单的
三，因为这些操作

402
00:22:52,950 --> 00:22:56,041
关于所谓的正克模型。

403
00:22:56,041 --> 00:23:02,270
在这种情况下，我向你展示
一个两部分的正克模型，一个两字组。

404
00:23:02,270 --> 00:23:08,910
我们将做出实际的想法
有时，某些词

405
00:23:08,910 --> 00:23:14,680
更可能跟随一个
给定的字比其他人。

406
00:23:14,680 --> 00:23:25,210
如果我刚才说的“天气预报”
下一个字可以“今天”很可能是

407
00:23:25,210 --> 00:23:31,510
或可以是“天气
预计明天。“

408
00:23:31,510 --> 00:23:38,870
但它不太可能是“
天气预报朝鲜蓟。“

409
00:23:38,870 --> 00:23:42,980
>> 什么是语言模型所做的是
它捕捉那些统计学

410
00:23:42,980 --> 00:23:47,450
通过计算，从一些非常大的
文集，所有实例的

411
00:23:47,450 --> 00:23:50,890
其中一个词接踵而来。

412
00:23:50,890 --> 00:23:54,300
所以，如果我把一个大corpus--
像每一个华尔街日报

413
00:23:54,300 --> 00:24:00,750
自1930年以来，已产生的
这是标准的corpuses--之一

414
00:24:00,750 --> 00:24:03,910
我期待通过所有
该文本，和我算

415
00:24:03,910 --> 00:24:09,770
经过长达多少次
“预测”我看“今日”

416
00:24:09,770 --> 00:24:17,454
多少次我看到
“预测”，其次是“朝鲜蓟”

417
00:24:17,454 --> 00:24:19,370
第一个是将
要更容易。

418
00:24:19,370 --> 00:24:21,540
这将出现
更为频繁。

419
00:24:21,540 --> 00:24:24,610
因此，这将有一个更高的
与它的概率有关。

420
00:24:24,610 --> 00:24:27,340
>> 如果我想弄清楚的
概率整个话语的，

421
00:24:27,340 --> 00:24:29,940
然后，我就打破它。

422
00:24:29,940 --> 00:24:35,990
所以，听证会的可能性
该句中的“老鼠吃奶酪”

423
00:24:35,990 --> 00:24:39,110
是这个词的概率
“中的”开始一个句子，

424
00:24:39,110 --> 00:24:42,540
然后将概率的
词“鼠”后面的单词“the”

425
00:24:42,540 --> 00:24:44,910
的概率与所述
词“吃”跟随“老鼠”

426
00:24:44,910 --> 00:24:51,120
的概率与
“奶酪”跟随“吃了。”

427
00:24:51,120 --> 00:24:55,160
>> 这听起来像一个不少
统计，很多概率。

428
00:24:55,160 --> 00:24:57,510
而这一切，它是。

429
00:24:57,510 --> 00:25:02,920
但令人惊奇的是，如果你这样做
与数据的一个足够大的样品，

430
00:25:02,920 --> 00:25:03,670
有用。

431
00:25:03,670 --> 00:25:05,250
和它的作品极其良好。

432
00:25:05,250 --> 00:25:07,810

433
00:25:07,810 --> 00:25:11,420
我们都知道这些技术。

434
00:25:11,420 --> 00:25:16,500
大多数操作系统附带
语音识别在这一点上。

435
00:25:16,500 --> 00:25:20,940
我们使用的Siri和柯塔娜和回声。

436
00:25:20,940 --> 00:25:25,070
而这些东西都是基于
这种类型的三层的型号 - 

437
00:25:25,070 --> 00:25:30,620
在底部，一个一个语音模型
发音模型在中间，

438
00:25:30,620 --> 00:25:33,690
并在它们的顶部一个语言模型。

439
00:25:33,690 --> 00:25:37,630
>> 现在，他们需要做一点点
比，为了回答问题。

440
00:25:37,630 --> 00:25:43,000
但是，承认你在做什么
确切地说取决于这一点。

441
00:25:43,000 --> 00:25:45,700
因此，让我们举一个例子在这里。

442
00:25:45,700 --> 00:25:52,020
所以，我有我的手机坐在这儿
文件摄像机下方。

443
00:25:52,020 --> 00:25:56,110
而我们要问
SIRI几个问题。

444
00:25:56,110 --> 00:25:57,150
好吧？

445
00:25:57,150 --> 00:25:59,940
>> 因此，让我们在这里醒来我的电话。

446
00:25:59,940 --> 00:26:02,710

447
00:26:02,710 --> 00:26:05,000
Siri的，什么是天气
像在纽黑文今天？

448
00:26:05,000 --> 00:26:07,670

449
00:26:07,670 --> 00:26:10,780
>> SIRI：这里的天气
纽黑文，今天康涅狄格。

450
00:26:10,780 --> 00:26:11,890
>> BRIAN SCASSELLATI：OK。

451
00:26:11,890 --> 00:26:16,720
所以，首先你看到Siri的识别
每个单独字

452
00:26:16,720 --> 00:26:19,050
然后产生的响应。

453
00:26:19,050 --> 00:26:22,277
我们将讨论如何这种反应
来约在一点点。

454
00:26:22,277 --> 00:26:24,110
但是现在我们知道
这仅仅是基础

455
00:26:24,110 --> 00:26:28,880
对原始数据和这
模式匹配类型的方法，

456
00:26:28,880 --> 00:26:31,120
我们可以玩一些游戏的Siri。

457
00:26:31,120 --> 00:26:34,560
>> 因此，我可以再试一次。

458
00:26:34,560 --> 00:26:38,864
Siri的，什么是天气
河马纽黑文，今天？

459
00:26:38,864 --> 00:26:39,810
>> SIRI：OK。

460
00:26:39,810 --> 00:26:44,245
这里的天气新
纽黑文，康涅狄格今天。

461
00:26:44,245 --> 00:26:46,120
BRIAN SCASSELLATI：Siri的
不是由该气馁

462
00:26:46,120 --> 00:26:50,980
因为它找到了pattern--
“天气”，“今天”，“纽黑文。”

463
00:26:50,980 --> 00:26:54,420
这就是它的响应
到，就像伊莉莎。

464
00:26:54,420 --> 00:26:54,920
好吧。

465
00:26:54,920 --> 00:26:59,390
让我们给它一次甚至
更可笑的例子。

466
00:26:59,390 --> 00:27:03,075
Siri的，天气朝鲜蓟
犰狳河马纽黑文？

467
00:27:03,075 --> 00:27:06,806

468
00:27:06,806 --> 00:27:08,400
>> SIRI：让我看看这一点。

469
00:27:08,400 --> 00:27:11,280
下面是我在网上找到
什么是朝鲜蓟犰狳

470
00:27:11,280 --> 00:27:13,780
河马纽黑文。

471
00:27:13,780 --> 00:27:14,760
>> BRIAN SCASSELLATI：OK。

472
00:27:14,760 --> 00:27:20,400
所以，如果我走的不够远
远离该模型中，

473
00:27:20,400 --> 00:27:24,365
我可以，因为它混淆了没有
长匹配它有图案。

474
00:27:24,365 --> 00:27:27,370

475
00:27:27,370 --> 00:27:29,390
这统计
引擎在说，

476
00:27:29,390 --> 00:27:32,850
那是什么，你已经得到了可能性
的话河马和朝鲜蓟

477
00:27:32,850 --> 00:27:34,440
在一起，犰狳？

478
00:27:34,440 --> 00:27:36,050
那一定是新的东西。

479
00:27:36,050 --> 00:27:38,840

480
00:27:38,840 --> 00:27:40,610
>> 因此，这些技术，我们每天都在使用。

481
00:27:40,610 --> 00:27:43,670

482
00:27:43,670 --> 00:27:47,800
如果我们想带他们一步
进一步的，不过，如果我们真的

483
00:27:47,800 --> 00:27:53,930
希望能够谈论什么
的是，这些系统作出反应，进行

484
00:27:53,930 --> 00:28:00,630
我们要谈谈，再次，关于
更根本的一系列问题。

485
00:28:00,630 --> 00:28:05,370
这就是在沟通的话题
我们称之为问答。

486
00:28:05,370 --> 00:28:07,028
也就是说，我们希望能够用于：是吗？

487
00:28:07,028 --> 00:28:07,944
听众：[听不清]。

488
00:28:07,944 --> 00:28:10,789

489
00:28:10,789 --> 00:28:13,330
BRIAN SCASSELLATI：我们得到
到潜在语义处理？

490
00:28:13,330 --> 00:28:14,070
所以，是的。

491
00:28:14,070 --> 00:28:17,820
有很多东西都是
发生与Siri的表面下

492
00:28:17,820 --> 00:28:20,210
并且在一些例子
我要告诉你下一个

493
00:28:20,210 --> 00:28:22,610
其中，有相当多的
在结构方面

494
00:28:22,610 --> 00:28:25,260
你在说什么这很重要。

495
00:28:25,260 --> 00:28:31,890
而且，事实上，这是一个伟大
前体下一张幻灯片我。

496
00:28:31,890 --> 00:28:35,110
>> 因此，在同样的方式，我们的
语音识别就建立起来了

497
00:28:35,110 --> 00:28:39,620
多层，如果我们想
了解它是什么，实际上

498
00:28:39,620 --> 00:28:44,620
虽这么说，我们要再次
依靠多层分析

499
00:28:44,620 --> 00:28:47,020
这正在被识别的文本。

500
00:28:47,020 --> 00:28:52,560
因此，当Siri的其实是能
说，看，我发现这句话。

501
00:28:52,560 --> 00:28:55,230
现在我该怎么处理它们呢？

502
00:28:55,230 --> 00:28:59,110
第一组分往往是
经历并尝试分析

503
00:28:59,110 --> 00:29:03,010
句子的结构。

504
00:29:03,010 --> 00:29:05,410
而在我们所看到的
上小学的时候，往往，

505
00:29:05,410 --> 00:29:08,920
作为排序图表的
句子，我们要

506
00:29:08,920 --> 00:29:12,774
要认识到某些
词有一定的作用。

507
00:29:12,774 --> 00:29:13,440
这些都是名词。

508
00:29:13,440 --> 00:29:14,231
这些都是代词。

509
00:29:14,231 --> 00:29:16,200
这些都是动词。

510
00:29:16,200 --> 00:29:19,460
而且我们要承认
对于特定的语法，

511
00:29:19,460 --> 00:29:24,700
在这种情况下英语语法，有
，我可以将它们结合起来的有效途径

512
00:29:24,700 --> 00:29:26,280
和无效的其他方式。

513
00:29:26,280 --> 00:29:29,920

514
00:29:29,920 --> 00:29:33,870
>> 这一认识，即结构，
可能足以帮助指导我们

515
00:29:33,870 --> 00:29:36,720
一点点。

516
00:29:36,720 --> 00:29:39,820
但是，这还远远不够
为我们能够给

517
00:29:39,820 --> 00:29:43,290
任何意义，什么正在这里说。

518
00:29:43,290 --> 00:29:46,615
为了做到这一点，我们必须依靠
一定量的语义处理。

519
00:29:46,615 --> 00:29:49,590

520
00:29:49,590 --> 00:29:55,080
也就是说，我们要来看看
在下方各有什么这些词

521
00:29:55,080 --> 00:29:57,400
实际上承载的意义。

522
00:29:57,400 --> 00:30:01,150
并且在这样做的简单的方法，
我们将每个单词联系起来

523
00:30:01,150 --> 00:30:06,930
我们知道一个特定的功能，
一定改造，它

524
00:30:06,930 --> 00:30:09,300
允许发生。

525
00:30:09,300 --> 00:30:14,470
>> 在这种情况下，我们可能会标记
单词“约翰”作为一个专有名词，

526
00:30:14,470 --> 00:30:18,160
它承载着一个身份。

527
00:30:18,160 --> 00:30:21,530
我们可能标识
“玛丽”为相同的方式。

528
00:30:21,530 --> 00:30:27,900
而像“爱”，一个动词，
构成了一个特殊的关系

529
00:30:27,900 --> 00:30:31,582
我们能够代表。

530
00:30:31,582 --> 00:30:33,290
现在，这并不意味着
我们明白

531
00:30:33,290 --> 00:30:37,680
什么是爱，但只有我们明白
它在一个象征性的系统的方法。

532
00:30:37,680 --> 00:30:40,480
也就是说，我们可以标记
它和操作它。

533
00:30:40,480 --> 00:30:44,230

534
00:30:44,230 --> 00:30:49,120
>> 与这些类型的方法的，
任何类型的语义处理

535
00:30:49,120 --> 00:30:57,060
这里将需要一点点
知识位和大量的工作

536
00:30:57,060 --> 00:30:59,020
我们的一部分。

537
00:30:59,020 --> 00:31:03,590
我们不再领域
在这里只是简单的统计数据

538
00:31:03,590 --> 00:31:07,320
将要足够我们。

539
00:31:07,320 --> 00:31:11,330
现在，为了去
从这个角度来被

540
00:31:11,330 --> 00:31:15,520
能够谈论的内
什么实际发生在这里，

541
00:31:15,520 --> 00:31:19,640
以能够操纵这个
构建和理解的问题

542
00:31:19,640 --> 00:31:23,160
然后能够
走出去，寻找，

543
00:31:23,160 --> 00:31:27,290
这需要更
复杂的认知模式。

544
00:31:27,290 --> 00:31:34,880
>> 在这些系统的构建方式
是在大多数情况下非常非常劳动

545
00:31:34,880 --> 00:31:36,350
密集的。

546
00:31:36,350 --> 00:31:39,490
它们涉及人类
花费了大量

547
00:31:39,490 --> 00:31:44,100
时间构建的方式
这些类型的句子

548
00:31:44,100 --> 00:31:47,270
可以在一些逻辑表示。

549
00:31:47,270 --> 00:31:51,639

550
00:31:51,639 --> 00:31:53,430
它会变得有点
更复杂的，虽然。

551
00:31:53,430 --> 00:31:56,400

552
00:31:56,400 --> 00:31:59,660
>> 甚至有一次，我们已经处理
与语义，我们将

553
00:31:59,660 --> 00:32:03,860
还是得看
对什么东西被说语。

554
00:32:03,860 --> 00:32:08,620
也就是说，我该如何关联的话
我有一些身体上出

555
00:32:08,620 --> 00:32:12,054
在全球或有
至少一些信息源

556
00:32:12,054 --> 00:32:12,970
我可以操纵？

557
00:32:12,970 --> 00:32:15,780

558
00:32:15,780 --> 00:32:20,790
>> 有时，这些导致
精彩的比特模糊性。

559
00:32:20,790 --> 00:32:24,470
“红得发紫的明星结婚天文学家。”

560
00:32:24,470 --> 00:32:25,630
好。

561
00:32:25,630 --> 00:32:28,540
现在，我们看到的
搞笑类型的标题的

562
00:32:28,540 --> 00:32:34,690
我们会在深夜的电视看
因为我们不理解的“明星”

563
00:32:34,690 --> 00:32:38,630
有它的天体的含义。

564
00:32:38,630 --> 00:32:43,390
我们知道，这意味着更多的
司空见惯的演员或女演员

565
00:32:43,390 --> 00:32:45,240
有大量的知名度。

566
00:32:45,240 --> 00:32:47,770

567
00:32:47,770 --> 00:32:51,950
>> “队帮助狗咬伤的受害者。”

568
00:32:51,950 --> 00:32:55,550
难道球队实际上是
在那里协助狗

569
00:32:55,550 --> 00:32:59,620
在绕来绕去又咬受害者？

570
00:32:59,620 --> 00:33:02,380
抑或是有
个人谁是

571
00:33:02,380 --> 00:33:04,625
咬伤谁需要一些帮助一只狗？

572
00:33:04,625 --> 00:33:07,650

573
00:33:07,650 --> 00:33:11,480
单从看语法
和句子的语义，

574
00:33:11,480 --> 00:33:14,660
我们无法确定。

575
00:33:14,660 --> 00:33:22,000
>> “直升机人类苍蝇供电。”

576
00:33:22,000 --> 00:33:27,330
在那里，事实上，实际
周围飞小事

577
00:33:27,330 --> 00:33:34,510
是人的翅膀供电
直升机为人类的好？

578
00:33:34,510 --> 00:33:38,960
或者是有一个机械装置
从一个人获得它的权力？

579
00:33:38,960 --> 00:33:41,600

580
00:33:41,600 --> 00:33:46,500
>> 当我们在看问题
应答系统，

581
00:33:46,500 --> 00:33:51,110
这些是图层
我们需要处理。

582
00:33:51,110 --> 00:33:54,890
现在，最好的和最排序
的普遍的这些系统的

583
00:33:54,890 --> 00:34:00,640
今天都能够做到
事情在一个水平，是

584
00:34:00,640 --> 00:34:05,050
远远超出了我们有10年前。

585
00:34:05,050 --> 00:34:08,210
这里是最好的系统之一
这是有今天。

586
00:34:08,210 --> 00:34:10,519
而这是一个系统
来自IBM称为沃森。

587
00:34:10,519 --> 00:34:13,040

588
00:34:13,040 --> 00:34:15,500
这是我们的朋友在IBM。

589
00:34:15,500 --> 00:34:19,810
这是凯瑟琳银行，甲辰，
和百基拉赖斯给我们

590
00:34:19,810 --> 00:34:26,323
沃森的演示
昨天在IBM约克。

591
00:34:26,323 --> 00:34:26,989
[视频回放]

592
00:34:26,989 --> 00:34:27,690
-你好吗？

593
00:34:27,690 --> 00:34:30,600

594
00:34:30,600 --> 00:34:31,980
>> -我很好。

595
00:34:31,980 --> 00:34:35,429
我的时候，我总是很高兴
想，特别是当我

596
00:34:35,429 --> 00:34:38,920
可以保持冷静在这些服务器机房。

597
00:34:38,920 --> 00:34:40,170
 - 谁是你最喜欢的女演员？

598
00:34:40,170 --> 00:34:43,870

599
00:34:43,870 --> 00:34:47,555
>>  - 我最喜爱的女主角
安吉丽娜·朱莉的劳拉·克劳馥

600
00:34:47,555 --> 00:34:54,800
在古墓丽影因为她的原
形式是为像我这样的一个虚拟人物。

601
00:34:54,800 --> 00:34:56,760
>>  - 如何能沃森帮助患者？

602
00:34:56,760 --> 00:34:59,700

603
00:34:59,700 --> 00:35:03,755
>> -is计划为病人
有机会获得直接沃森？

604
00:35:03,755 --> 00:35:08,050
访问沃森咨询
应用程序将通过使用情况而有所不同。

605
00:35:08,050 --> 00:35:12,630
但目前，屈臣氏将只提供
可能的诊断和治疗

606
00:35:12,630 --> 00:35:14,725
选择医学专业。

607
00:35:14,725 --> 00:35:17,680
在适当情况下，患者
可以提供信息

608
00:35:17,680 --> 00:35:21,210
华生，也许是通过一个
门户网站界面，平板电脑，

609
00:35:21,210 --> 00:35:23,500
甚至移动电话。

610
00:35:23,500 --> 00:35:27,180
例如，一个患者可能
要求描述自己的症状

611
00:35:27,180 --> 00:35:30,460
在自然语言直接
到沃森的解决方案，

612
00:35:30,460 --> 00:35:34,050
允许医师将重点放在
诊断和不采集数据。

613
00:35:34,050 --> 00:35:38,379

614
00:35:38,379 --> 00:35:42,716
>>  - 谁暗杀了林肯？

615
00:35:42,716 --> 00:35:46,153
>> 约翰威尔克斯布斯。

616
00:35:46,153 --> 00:35:52,373
>>  - 在哪一年做了亚利桑那州
响尾蛇赢得世界大赛？

617
00:35:52,373 --> 00:35:55,295
>> -2001。

618
00:35:55,295 --> 00:35:58,710
>> [结束播放]

619
00:35:58,710 --> 00:36:01,610
>> BRIAN SCASSELLATI：所以
这些类型的系统

620
00:36:01,610 --> 00:36:07,430
必须依靠首先
认识到讲话;第二，

621
00:36:07,430 --> 00:36:12,200
将其转换成有意义的内部
表示;然后，第三，

622
00:36:12,200 --> 00:36:17,090
能够走出去，找到
信息源

623
00:36:17,090 --> 00:36:21,140
使他们能够回答这个问题。

624
00:36:21,140 --> 00:36:27,320
这种复杂程度涉及
同类型的编程事

625
00:36:27,320 --> 00:36:31,790
你一直
在做习题集。

626
00:36:31,790 --> 00:36:38,000
>> 我们能够解析HTTP请求，
相同类型的低级别的图案的

627
00:36:38,000 --> 00:36:40,810
匹配伊丽莎可以做。

628
00:36:40,810 --> 00:36:45,070
我们能够将这些
为内部表示，

629
00:36:45,070 --> 00:36:50,360
然后用它们来查询一些
外部数据库，可能使用SQL。

630
00:36:50,360 --> 00:36:53,530

631
00:36:53,530 --> 00:36:56,260
所有系统的那
今天正在建造

632
00:36:56,260 --> 00:37:00,520
做这种类型的天然
语言交流

633
00:37:00,520 --> 00:37:04,100
在正在兴建
这些相同的原则。

634
00:37:04,100 --> 00:37:09,530
>> 现在，即使是像系统
沃森是不是很复杂

635
00:37:09,530 --> 00:37:14,820
到能够回答任意
任何主题的问题。

636
00:37:14,820 --> 00:37:20,060
而事实上，他们必须
给定域中的结构。

637
00:37:20,060 --> 00:37:24,440
所以，你可以到网上，你可以找到
该操作好沃森版本

638
00:37:24,440 --> 00:37:27,700
中医学信息。

639
00:37:27,700 --> 00:37:31,490
或者有一个在线
只是涉及如何

640
00:37:31,490 --> 00:37:34,540
要做出好的建议
什么样的啤酒将与哪些食物去了。

641
00:37:34,540 --> 00:37:37,060

642
00:37:37,060 --> 00:37:41,870
而这些领域内，
它可以回答问题，

643
00:37:41,870 --> 00:37:46,130
发现它所需要的信息。

644
00:37:46,130 --> 00:37:48,270
>> 但你不能混用和匹配。

645
00:37:48,270 --> 00:37:53,150
这就是被训练的系统
食品和啤酒的数据库

646
00:37:53,150 --> 00:37:56,830
不突然，当你工作得很好
把它与医学信息

647
00:37:56,830 --> 00:37:59,770
数据库。

648
00:37:59,770 --> 00:38:05,680
因此，即使我们今天的最佳系统
依靠处理的水平

649
00:38:05,680 --> 00:38:11,570
在我们的手编
为了建设中的基础设施建设

650
00:38:11,570 --> 00:38:13,275
使这个系统的运行。

651
00:38:13,275 --> 00:38:16,360

652
00:38:16,360 --> 00:38:20,710
>> 现在，最后一个话题我想
到能够得到今天

653
00:38:20,710 --> 00:38:23,960
是关于非语言沟通。

654
00:38:23,960 --> 00:38:29,290
一个伟大的信息质量的
我们彼此通信

655
00:38:29,290 --> 00:38:35,490
通过不来约
我们正在申请个别单词。

656
00:38:35,490 --> 00:38:40,290
它做了这些东西，
接近，目光，你的语气，

657
00:38:40,290 --> 00:38:42,270
您的拐点。

658
00:38:42,270 --> 00:38:46,620
而沟通也
这是很多不同的接口

659
00:38:46,620 --> 00:38:49,960
关心一个伟大的交易。

660
00:38:49,960 --> 00:38:51,500
这不是什么Siri的关心。

661
00:38:51,500 --> 00:38:56,250
我可以问Siri的东西用一个声音
或语音不同的音调，

662
00:38:56,250 --> 00:38:59,840
和Siri的打算
给我相同的答案。

663
00:38:59,840 --> 00:39:05,260
但是，这不是我们构建
许多其他类型的接口。

664
00:39:05,260 --> 00:39:09,120
>> 我想向您介绍
现在到机器人中的一个。

665
00:39:09,120 --> 00:39:12,720
这是我的长期建
朋友和同事辛西娅

666
00:39:12,720 --> 00:39:16,010
Breazeal和她的公司基博。

667
00:39:16,010 --> 00:39:20,090
这robot--我们要去
有一对夫妇的志愿者

668
00:39:20,090 --> 00:39:22,520
拿出与此交互。

669
00:39:22,520 --> 00:39:26,200
所以我可以有两个人愿意
与机器人给我玩吗？

670
00:39:26,200 --> 00:39:29,936
你为什么不上来吧，
为什么你不来就到了。

671
00:39:29,936 --> 00:39:31,310
如果你想和我一起在这里，请。

672
00:39:31,310 --> 00:39:36,520

673
00:39:36,520 --> 00:39:39,670
>> 如果我能有你
来的权利在这里。

674
00:39:39,670 --> 00:39:40,170
谢谢。

675
00:39:40,170 --> 00:39:40,480
你好。

676
00:39:40,480 --> 00:39:41,400
>> ALFREDO：很高兴见到你。

677
00:39:41,400 --> 00:39:42,010
阿尔弗雷多。

678
00:39:42,010 --> 00:39:42,520
>> BRIAN SCASSELLATI：阿尔弗雷多。

679
00:39:42,520 --> 00:39:43,146
>> 瑞秋：瑞秋。

680
00:39:43,146 --> 00:39:44,228
BRIAN SCASSELLATI：雷切尔。

681
00:39:44,228 --> 00:39:45,154
很高兴见到你们俩。

682
00:39:45,154 --> 00:39:46,820
阿尔弗雷多，我要你先走。

683
00:39:46,820 --> 00:39:47,990
快来权在这里。

684
00:39:47,990 --> 00:39:51,870
我要介绍
你 - 如果我能得到这一关

685
00:39:51,870 --> 00:39:58,450
不敲门的microphone--
一个叫基博的小机器人。

686
00:39:58,450 --> 00:40:00,140
好不好？

687
00:40:00,140 --> 00:40:04,260
>> 现在，基博被设计为互动。

688
00:40:04,260 --> 00:40:09,339
虽然它可以给你讲话，
多与机器人的相互作用的

689
00:40:09,339 --> 00:40:09,880
就是非语言。

690
00:40:09,880 --> 00:40:12,450

691
00:40:12,450 --> 00:40:17,070
阿尔弗雷多，我要问你
好好说话和免费

692
00:40:17,070 --> 00:40:19,554
给机器人，请。

693
00:40:19,554 --> 00:40:20,845
ALFREDO：我觉得你看起来很可爱。

694
00:40:20,845 --> 00:40:24,114

695
00:40:24,114 --> 00:40:25,611
>> [呼呼的声音]

696
00:40:25,611 --> 00:40:26,192

697
00:40:26,192 --> 00:40:27,108
BRIAN SCASSELLATI：OK。

698
00:40:27,108 --> 00:40:30,110

699
00:40:30,110 --> 00:40:33,180
它的反应并不言语。

700
00:40:33,180 --> 00:40:35,180
然而，它给了你们两个
明确承认

701
00:40:35,180 --> 00:40:39,680
它听到你说的话
也不知怎么理解。

702
00:40:39,680 --> 00:40:40,530
好不好？

703
00:40:40,530 --> 00:40:42,070
步骤右后卫位置一秒钟。

704
00:40:42,070 --> 00:40:43,130
谢谢。

705
00:40:43,130 --> 00:40:44,090
>> 瑞秋，如果你会的。

706
00:40:44,090 --> 00:40:46,070
现在，我想给
你更难就业。

707
00:40:46,070 --> 00:40:48,361
如果你站在这里，
备份只是有那么一点点

708
00:40:48,361 --> 00:40:50,280
我们可以帮你的相机
看看这种方式。

709
00:40:50,280 --> 00:40:56,840
我要问你说些什么
真的是和讨厌的机器人。

710
00:40:56,840 --> 00:41:02,900
>> 你才似乎什么
做的是完全荒谬的。

711
00:41:02,900 --> 00:41:03,840
>> [嗡嗡声]

712
00:41:03,840 --> 00:41:07,610

713
00:41:07,610 --> 00:41:09,030
>> 这更是荒谬。

714
00:41:09,030 --> 00:41:10,120
你怎么了？

715
00:41:10,120 --> 00:41:13,487

716
00:41:13,487 --> 00:41:16,207
噢，不心疼。

717
00:41:16,207 --> 00:41:17,040
我给你一个拥抱。

718
00:41:17,040 --> 00:41:19,882

719
00:41:19,882 --> 00:41:21,090
BRIAN SCASSELLATI：好吧。

720
00:41:21,090 --> 00:41:22,280
谢谢，雷切尔。

721
00:41:22,280 --> 00:41:24,565
阿尔弗雷多，雷切尔，谢谢你们非常多。

722
00:41:24,565 --> 00:41:26,840
>> [掌声]

723
00:41:26,840 --> 00:41:28,660

724
00:41:28,660 --> 00:41:34,470
>> 因此，这种互动在
许多方面的一些相同的规则

725
00:41:34,470 --> 00:41:36,950
和一些相同
结构我们

726
00:41:36,950 --> 00:41:39,950
可能有语言交流。

727
00:41:39,950 --> 00:41:44,530
它既是交际和
提供一个重要目的。

728
00:41:44,530 --> 00:41:48,590
而这种互动，在
方法很多，设计

729
00:41:48,590 --> 00:41:52,890
有对特定的效果
与人交互或听

730
00:41:52,890 --> 00:41:54,410
到机器人。

731
00:41:54,410 --> 00:41:56,450
>> 现在，我很幸运
有吉波今天在这里。

732
00:41:56,450 --> 00:42:00,550
萨姆·斯波尔丁是在这里帮助
我们用机器人。

733
00:42:00,550 --> 00:42:07,470
而我要问萨姆给
吉波跳舞我们一个很好的演示

734
00:42:07,470 --> 00:42:09,720
我们可以在年底看这里。

735
00:42:09,720 --> 00:42:10,590
因此，继续前进，基博。

736
00:42:10,590 --> 00:42:11,550
>> SAM：OK，基博。

737
00:42:11,550 --> 00:42:14,430
向我们展示你的舞蹈动作。

738
00:42:14,430 --> 00:42:17,310
>> [音乐播放]

739
00:42:17,310 --> 00:42:43,114

740
00:42:43,114 --> 00:42:44,780
BRIAN SCASSELLATI：好，大家好。

741
00:42:44,780 --> 00:42:46,865
感谢我们的朋友在基博。

742
00:42:46,865 --> 00:42:49,426
>> [掌声]

743
00:42:49,426 --> 00:42:50,140

744
00:42:50,140 --> 00:42:54,990
>> 并感谢我们的朋友
IBM今天帮忙。

745
00:42:54,990 --> 00:42:57,300
沟通是什么
你要去

746
00:42:57,300 --> 00:43:02,280
看到来了越来越多的作为
我们构建更复杂的界面。

747
00:43:02,280 --> 00:43:05,760
下周，我们会继续讨论
有关如何对接

748
00:43:05,760 --> 00:43:08,890
与电脑对手的游戏。

749
00:43:08,890 --> 00:43:12,950
但是，如果你有关于这个问题，
我就在附近的办公时间今晚。

750
00:43:12,950 --> 00:43:17,610
我很高兴能和你谈AI
主题或进入更多的细节。

751
00:43:17,610 --> 00:43:18,927
周末愉快。

752
00:43:18,927 --> 00:43:21,409
>> [掌声]

753
00:43:21,409 --> 00:43:21,909

754
00:43:21,909 --> 00:43:26,141
[音乐播放]

755
00:43:26,141 --> 00:46:42,879