1
00:00:00,000 --> 00:00:02,928
>> [音樂播放]

2
00:00:02,928 --> 00:00:11,230

3
00:00:11,230 --> 00:00:12,790
>> DAVID馬蘭：這是CS50。

4
00:00:12,790 --> 00:00:14,072
這為10週結束時。

5
00:00:14,072 --> 00:00:16,030
和男孩，我們有一個
良好的班為你今天。

6
00:00:16,030 --> 00:00:20,040
我們很高興地邀請兩
我們從耶魯的朋友趕快到我們今天

7
00:00:20,040 --> 00:00:23,920
並且看的交集
人工智能，機器人技術，

8
00:00:23,920 --> 00:00:25,710
自然語言處理，以及更多。

9
00:00:25,710 --> 00:00:27,090
>> 事實上，在
過去幾週，我們已經

10
00:00:27,090 --> 00:00:29,714
肯定花了很多時間，
特別是在較早的pset，

11
00:00:29,714 --> 00:00:31,560
專注於相當低級別的細節。

12
00:00:31,560 --> 00:00:34,520
它很容易忽視
森林的樹木

13
00:00:34,520 --> 00:00:38,170
並獲得掛在循環和條件
和指針，當然，和類似物。

14
00:00:38,170 --> 00:00:41,770
但現實情況是，你們現在有
配料與你可真

15
00:00:41,770 --> 00:00:45,300
解決了一些有趣的問題，其中
他們那些我們的朋友在耶魯

16
00:00:45,300 --> 00:00:48,790
工作只是害羞劍橋。

17
00:00:48,790 --> 00:00:52,410
>> 所以，首先請允許我介紹一下我們的頭
教學耶魯大學，安迪的助手。

18
00:00:52,410 --> 00:00:55,182
>> [掌聲]

19
00:00:55,182 --> 00:00:57,030

20
00:00:57,030 --> 00:01:00,710
>> 安迪：首先，只是感謝
你讓一對夫婦Yalies

21
00:01:00,710 --> 00:01:02,700
今天流行下到劍橋。

22
00:01:02,700 --> 00:01:05,299
我們真的很感激。

23
00:01:05,299 --> 00:01:07,090
其次，我們的朋友
回home--傑森，

24
00:01:07,090 --> 00:01:09,670
感謝保持和運行講座。

25
00:01:09,670 --> 00:01:12,970
希望它在紐黑文都好。

26
00:01:12,970 --> 00:01:15,720
>> 所以呀，我超級興奮
今天給大家介紹Scaz。

27
00:01:15,720 --> 00:01:17,020
Scaz運行的機器人實驗室。

28
00:01:17,020 --> 00:01:19,690
他是一個教授，像五
不同的部門在耶魯大學。

29
00:01:19,690 --> 00:01:23,159
在他的實驗室，他有很多很多
機器人，他喜歡玩。

30
00:01:23,159 --> 00:01:24,950
他有一樣的
最酷的工作在世界上。

31
00:01:24,950 --> 00:01:27,116
而他得到一種混亂
與整天各地

32
00:01:27,116 --> 00:01:29,090
長，做了一些工作，以及。

33
00:01:29,090 --> 00:01:33,070
>> 因此，我們實際上增添了一顆
與我們今天的人下來。

34
00:01:33,070 --> 00:01:36,900
因此，事不宜遲，Scaz是
要繼續前進，並為我們介紹一下

35
00:01:36,900 --> 00:01:38,660
以他的機器人朋友。

36
00:01:38,660 --> 00:01:41,546
>> [掌聲]

37
00:01:41,546 --> 00:01:42,935

38
00:01:42,935 --> 00:01:44,310
BRIAN SCASSELLATI：謝謝你，大衛。

39
00:01:44,310 --> 00:01:45,380
謝謝你，安迪。

40
00:01:45,380 --> 00:01:50,050
它是如此美妙的是
這裡與大家今天。

41
00:01:50,050 --> 00:01:56,490
我想首先要非常清楚，
這裡的CS50工作人員在劍橋

42
00:01:56,490 --> 00:01:59,190
一直令人難以置信的熱情好客給我們。

43
00:01:59,190 --> 00:02:02,130
我們非常感謝所有
他們所做的支持我們。

44
00:02:02,130 --> 00:02:05,690
因此，我們希望能
返回的恩情。

45
00:02:05,690 --> 00:02:09,370
>> 所以今天，我們得到的宣布
那我們將有一個新的，

46
00:02:09,370 --> 00:02:15,240
CS50的事件之一的一類
下週在紐黑文的發生。

47
00:02:15,240 --> 00:02:18,040
這是CS50研究世博會。

48
00:02:18,040 --> 00:02:21,300
因此，我們將要邀請
everyone-- CS50學生，

49
00:02:21,300 --> 00:02:26,510
工作人員來自美國哈佛大學和Yale--到
下來和我們一起參觀上週五。

50
00:02:26,510 --> 00:02:30,400
我們將有各種各樣的超過
30個不同的人提出

51
00:02:30,400 --> 00:02:34,830
和exhibiting--年級學生展示
了一些他們的研究產品。

52
00:02:34,830 --> 00:02:38,480
我們將有一些創業公司，甚至，看
對於新的高科技人才一點點，

53
00:02:38,480 --> 00:02:40,460
初創公司來自哈佛和耶魯。

54
00:02:40,460 --> 00:02:44,550
而且，我們還會有一些學生團體
尋找一些新的成員。

55
00:02:44,550 --> 00:02:46,357
>> 這將是一個非常激動人心的時刻。

56
00:02:46,357 --> 00:02:49,190
希望你們誰是
下來的哈佛，耶魯遊戲

57
00:02:49,190 --> 00:02:51,360
將能夠停止
年初由一點點，

58
00:02:51,360 --> 00:02:54,060
就在校園中心，
斯特林紀念圖書館。

59
00:02:54,060 --> 00:02:58,040
我們要有一套
展品範圍從自主

60
00:02:58,040 --> 00:03:04,460
帆船使用軟件的方式
保存中世紀手稿。

61
00:03:04,460 --> 00:03:07,860
>> 我們將有廣告
組織網絡和人員

62
00:03:07,860 --> 00:03:11,230
教學軟件編碼在開普敦。

63
00:03:11,230 --> 00:03:13,730
我們將有電腦
音樂表演。

64
00:03:13,730 --> 00:03:16,020
我們會的過程中有更多的機器人。

65
00:03:16,020 --> 00:03:18,900
因此，我們希望你會
參加我們這個活動。

66
00:03:18,900 --> 00:03:21,350
這應該是一個很大的
樂趣，食物一點點，

67
00:03:21,350 --> 00:03:24,430
和很多有趣的
事情要談。

68
00:03:24,430 --> 00:03:28,230
>> 所以我們今天要談
關於自然語言處理。

69
00:03:28,230 --> 00:03:32,560
這是對我們的嘗試
建立接口的新途徑

70
00:03:32,560 --> 00:03:35,150
與我們的設備，因為
在過去的幾個星期，

71
00:03:35,150 --> 00:03:40,800
你一直專注於它是如何說
您可以編寫代碼，編寫軟件

72
00:03:40,800 --> 00:03:47,110
那就是能說一個辦法
機，這就是我要你做的。

73
00:03:47,110 --> 00:03:50,210
>> 但是，我們不應該需要
預計一切

74
00:03:50,210 --> 00:03:53,760
這是在那裡這是我們用來
每個人都在世界

75
00:03:53,760 --> 00:03:57,480
將是精通
在這樣的結構。

76
00:03:57,480 --> 00:04:02,540
因此，我們區分計算機之間
語言和自然languages​​--

77
00:04:02,540 --> 00:04:06,720
也就是說，事情人類使用
與其他人進行通信。

78
00:04:06,720 --> 00:04:12,270
我們試圖構建一個使用界面
這些自然的溝通機制。

79
00:04:12,270 --> 00:04:16,029
>> 現在，就像所有其他的話題
我們已經開始在CS50，

80
00:04:16,029 --> 00:04:19,589
我們將先從最簡單的
自然語言處理的位

81
00:04:19,589 --> 00:04:21,269
我們可以想像。

82
00:04:21,269 --> 00:04:24,940
我們將開始與
自然語言的歷史的一部分。

83
00:04:24,940 --> 00:04:28,740
然後，我們將建立以
越來越多的最近的系統

84
00:04:28,740 --> 00:04:31,450
並有一些有趣的演示沿途。

85
00:04:31,450 --> 00:04:35,900
>> 因此，我們要開始什麼
可能是第一個自然語言

86
00:04:35,900 --> 00:04:38,210
處理系統。

87
00:04:38,210 --> 00:04:45,080
這是寫在一個軟件系統
1966年由約瑟夫·魏澤鮑姆叫做ELIZA。

88
00:04:45,080 --> 00:04:49,640
伊萊扎被設計成
複製類型的相互作用

89
00:04:49,640 --> 00:04:53,850
你將有一個
羅吉瑞恩心理治療師。

90
00:04:53,850 --> 00:04:57,210
現在，Rogerians，他們有
一個想法，心理治療

91
00:04:57,210 --> 00:05:02,800
參與能夠反映回
給患者和他們交談，

92
00:05:02,800 --> 00:05:08,100
基本上，只給他們一個
治療師的微小點點。

93
00:05:08,100 --> 00:05:09,920
也就是說，一切
治療師說：

94
00:05:09,920 --> 00:05:16,500
被認為是僅僅反映
什麼樣的病人告訴他們。

95
00:05:16,500 --> 00:05:18,990
>> 因此，讓我們嘗試演示這一點。

96
00:05:18,990 --> 00:05:22,820
我們有一個志願者誰願意成為
願意分享他們的最深的，

97
00:05:22,820 --> 00:05:26,650
最黑暗的，和/或假的秘密與伊莉莎？

98
00:05:26,650 --> 00:05:29,680
當然，你為什麼不來就到了。

99
00:05:29,680 --> 00:05:30,847
太棒了。

100
00:05:30,847 --> 00:05:31,430
你的名字？

101
00:05:31,430 --> 00:05:32,000
>> 邁爾斯：萬里。

102
00:05:32,000 --> 00:05:33,041
>> BRIAN SCASSELLATI：萬里。

103
00:05:33,041 --> 00:05:34,270
很高興見到你，萬里。

104
00:05:34,270 --> 00:05:36,270
如果你想抓住這一點。

105
00:05:36,270 --> 00:05:40,840
而且我們要
使用版本ELIZA的

106
00:05:40,840 --> 00:05:44,640
我們已經複製
內CS50 IDE。

107
00:05:44,640 --> 00:05:47,140
並且我們將看看源
在一小會兒代碼這一點。

108
00:05:47,140 --> 00:05:49,910
但現在，我們只是
要通過鍵入伊莉莎來調用它。

109
00:05:49,910 --> 00:05:55,480
>> 伊萊扎將會給您回應
這將是在所有的首都。

110
00:05:55,480 --> 00:05:57,950
而要問你幾個問題。

111
00:05:57,950 --> 00:06:02,130
我們會作出回應，並鍵入
在應對ELIZA。

112
00:06:02,130 --> 00:06:04,310
所以伊莉莎說，“嗨，我是伊莉莎。

113
00:06:04,310 --> 00:06:05,462
什麼是你的問題嗎？“

114
00:06:05,462 --> 00:06:08,092
你會想
告訴ELIZA今天呢？

115
00:06:08,092 --> 00:06:10,750
>> 邁爾斯：我只能入睡
如果我有兔子拖鞋上。

116
00:06:10,750 --> 00:06:12,440
>> BRIAN SCASSELLATI：好吧。

117
00:06:12,440 --> 00:06:13,360
好的。

118
00:06:13,360 --> 00:06:15,300
>> [笑]

119
00:06:15,300 --> 00:06:22,410
>> “我只能入睡
與兔寶寶拖鞋上“。

120
00:06:22,410 --> 00:06:29,000
伊萊扎說，“餵，你
有什麼心理問題？

121
00:06:29,000 --> 00:06:30,450
也許這是一個很好的指標。“

122
00:06:30,450 --> 00:06:30,780
>> 確定。

123
00:06:30,780 --> 00:06:32,245
所以，你想回應？

124
00:06:32,245 --> 00:06:36,110

125
00:06:36,110 --> 00:06:36,970
>> 邁爾斯：是的。

126
00:06:36,970 --> 00:06:38,660
>> 布賴恩SCASSELLATI：是的。

127
00:06:38,660 --> 00:06:39,570
人的許多話。

128
00:06:39,570 --> 00:06:41,870
我喜歡這一點。

129
00:06:41,870 --> 00:06:50,200
伊莉莎說，“你似乎相當積極。”

130
00:06:50,200 --> 00:06:53,200
>> MILES：不，我，其實，一個電子。

131
00:06:53,200 --> 00:06:55,150
>> BRIAN SCASSELLATI：“沒有。

132
00:06:55,150 --> 00:07:02,240
其實，我是一個電子。“
“你來我往

133
00:07:02,240 --> 00:07:06,954
因為你是一個電子？“

134
00:07:06,954 --> 00:07:08,870
現在，我們可以看到一些
在things--我要去

135
00:07:08,870 --> 00:07:10,200
暫停你只是一秒鐘，萬里。

136
00:07:10,200 --> 00:07:11,010
不要去任何地方。

137
00:07:11,010 --> 00:07:12,650
我們不跟你做呢。

138
00:07:12,650 --> 00:07:16,490
伊莉莎是，在某些方面，
回應一些事情

139
00:07:16,490 --> 00:07:21,140
那他的說法，但沒有
任何真正的理解。

140
00:07:21,140 --> 00:07:26,090
而且它也學舌距今約
他的句子成分。

141
00:07:26,090 --> 00:07:27,310
>> 所以我們說，“沒有。

142
00:07:27,310 --> 00:07:29,090
其實，我是一個電子。“

143
00:07:29,090 --> 00:07:34,190
伊麗莎也回應道：“你來
我，因為你是一個電子？“

144
00:07:34,190 --> 00:07:34,690
好的。

145
00:07:34,690 --> 00:07:36,050
讓我們給它在這裡多了一個回應。

146
00:07:36,050 --> 00:07:37,140
給它一個很好的，萬里。

147
00:07:37,140 --> 00:07:37,806
>> 邁爾斯：好一個？

148
00:07:37,806 --> 00:07:48,400

149
00:07:48,400 --> 00:07:49,570
>> 是的，請幫助我。

150
00:07:49,570 --> 00:07:50,570
BRIAN SCASSELLATI：“是的。

151
00:07:50,570 --> 00:07:58,010
請幫幫我。“”你確定嗎？“

152
00:07:58,010 --> 00:07:58,510
MILES：第

153
00:07:58,510 --> 00:08:00,860
BRIAN SCASSELLATI：沒有。

154
00:08:00,860 --> 00:08:03,562
“這是什麼建議嗎？”

155
00:08:03,562 --> 00:08:06,760
>> 邁爾斯：我可能不是一個電子。

156
00:08:06,760 --> 00:08:11,170
>> BRIAN SCASSELLATI：“我
可能不是一個電子。“

157
00:08:11,170 --> 00:08:13,790
“你是說沒有剛需負？”

158
00:08:13,790 --> 00:08:14,390
>> 好的。

159
00:08:14,390 --> 00:08:16,030
所以萬里，太感謝你了。

160
00:08:16,030 --> 00:08:16,860
>> MILES：謝謝。

161
00:08:16,860 --> 00:08:18,360
>> BRIAN SCASSELLATI：非常感謝。

162
00:08:18,360 --> 00:08:20,230
[掌聲]

163
00:08:20,230 --> 00:08:21,230

164
00:08:21,230 --> 00:08:26,700
>> 因此，這伊莉莎項目，在許多方面，
正在響應只是件

165
00:08:26,700 --> 00:08:32,730
我們正在提供，沒有任何深
了解這裡發生了什麼。

166
00:08:32,730 --> 00:08:36,640
這是一種制度
被稱為模式匹配，其中，

167
00:08:36,640 --> 00:08:40,490
我們正在尋找某些
文本位，我們是那麼

168
00:08:40,490 --> 00:08:44,860
要帶出什麼
作為輸入提供，

169
00:08:44,860 --> 00:08:52,580
轉換，潛在地，以某種方式，
然後給它返回給用戶。

170
00:08:52,580 --> 00:08:55,150
>> 做任何你認為
伊麗莎實際上是

171
00:08:55,150 --> 00:08:58,230
在這裡進行有效的心理？

172
00:08:58,230 --> 00:08:59,250
一個人，也許。

173
00:08:59,250 --> 00:09:00,166
>> 聽眾：[聽不清]。

174
00:09:00,166 --> 00:09:03,315

175
00:09:03,315 --> 00:09:05,440
BRIAN SCASSELLATI：怎麼
這是否讓你有什麼感覺？

176
00:09:05,440 --> 00:09:06,530
是的，事實上，它的作用。

177
00:09:06,530 --> 00:09:10,890
我們將看到，實際上，
它一會兒就好了源代碼。

178
00:09:10,890 --> 00:09:13,580
所以，你要成為
能夠做到正是這一點。

179
00:09:13,580 --> 00:09:17,420
>> 現在，伊莉莎是一種形式是什麼
我們稱之為今天的聊天機器人。

180
00:09:17,420 --> 00:09:19,950
它只是通過
文本你提供，

181
00:09:19,950 --> 00:09:24,030
提供了最低限度的金額
理解或處理，

182
00:09:24,030 --> 00:09:26,790
然後鸚鵡回給你。

183
00:09:26,790 --> 00:09:31,830
因此，讓我們來看看，
概念上，並談什麼

184
00:09:31,830 --> 00:09:34,690
這是伊莉莎實際上是做什麼。

185
00:09:34,690 --> 00:09:42,000
>> 伊莉莎走的是一條sentence--讓我們
說，“我想打動我的老闆。”

186
00:09:42,000 --> 00:09:45,130
而伊莉莎期待
通過那句話

187
00:09:45,130 --> 00:09:48,730
並試圖找到與
與特定模式匹配。

188
00:09:48,730 --> 00:09:52,850
因此，例如，有一種格式
伊麗莎正在尋找的話

189
00:09:52,850 --> 00:09:55,110
“我想要的。”

190
00:09:55,110 --> 00:09:59,330
而且任何時候它看到的東西
有“我要”的話，

191
00:09:59,330 --> 00:10:01,770
它制定的響應。

192
00:10:01,770 --> 00:10:05,040
並且響應是固定字符串。

193
00:10:05,040 --> 00:10:07,915
在這種情況下，它是“為什麼你要幹什麼？”

194
00:10:07,915 --> 00:10:11,330
我把一個小明星
到底是因為這只是

195
00:10:11,330 --> 00:10:13,310
我們的反應的開始。

196
00:10:13,310 --> 00:10:16,310
而星指出，
我們要採取休息

197
00:10:16,310 --> 00:10:19,850
用戶的utterance--的
“打動我的老闆” - 

198
00:10:19,850 --> 00:10:24,500
而且我們要追加的
到該字符串的結尾。

199
00:10:24,500 --> 00:10:28,990
>> 所以，現在，而不是說，“為什麼
你想打動我的老闆。“

200
00:10:28,990 --> 00:10:31,800
有額外的一點點
處理，我們將盡。

201
00:10:31,800 --> 00:10:34,440
也就是說，我們必須
轉換某些代詞

202
00:10:34,440 --> 00:10:38,670
在這裡，從“我的老闆”到“你的老闆。”

203
00:10:38,670 --> 00:10:41,300
還有可能是一些其他
我們需要做出改變。

204
00:10:41,300 --> 00:10:44,990
因此，而不是僅僅堅持到底
直接到年底，我們將做什麼

205
00:10:44,990 --> 00:10:49,160
是我們將採取的其他地方
白這裡 - 用戶utterance--

206
00:10:49,160 --> 00:10:54,090
我們會把它一件一件
時間和轉換每串

207
00:10:54,090 --> 00:10:58,180
的道理，每一個字，變成了一句。

208
00:10:58,180 --> 00:10:59,580
>> 因此，我們將取詞“來。”

209
00:10:59,580 --> 00:11:01,650
有沒有轉換
我們需要做的。

210
00:11:01,650 --> 00:11:02,340
“沒話說了。”

211
00:11:02,340 --> 00:11:04,140
有沒有轉換
我們需要做的還有。

212
00:11:04,140 --> 00:11:06,670
“我的”將轉換為“你的。”

213
00:11:06,670 --> 00:11:10,070
而“老闆”，我們就離開的“老大”。

214
00:11:10,070 --> 00:11:12,740
然後最後，什麼
與一期結束，

215
00:11:12,740 --> 00:11:16,640
我們將它轉換成一個問題。

216
00:11:16,640 --> 00:11:22,600
>> 這個非常簡單的模式匹配
其實是相當成功的。

217
00:11:22,600 --> 00:11:27,260
當這個被介紹
在1966--約瑟夫·魏澤鮑姆

218
00:11:27,260 --> 00:11:28,986
在計算機上編程這一點。

219
00:11:28,986 --> 00:11:31,110
現在，電腦在當時
不是台式機機型。

220
00:11:31,110 --> 00:11:33,950
它們共享資源。

221
00:11:33,950 --> 00:11:39,090
而他的學生們
去和伊莉莎聊天。

222
00:11:39,090 --> 00:11:41,570
最終，他不得不
限制對它的訪問

223
00:11:41,570 --> 00:11:43,890
由於他的學生不
讓做任何工作。

224
00:11:43,890 --> 00:11:46,190
他們只是聊天ELIZA。

225
00:11:46,190 --> 00:11:48,850
而且，事實上，他不得不
火他的助手，誰

226
00:11:48,850 --> 00:11:55,840
花光了所有她的時間交談ELIZA
關於她的深，令人擔憂的問題。

227
00:11:55,840 --> 00:12:00,350
>> 大家誰使用這些系統
開始人格化他們。

228
00:12:00,350 --> 00:12:04,490
他們開始認為他們是
是動畫和真實的人。

229
00:12:04,490 --> 00:12:07,969
他們開始認識到一些
的事情，他們說

230
00:12:07,969 --> 00:12:09,010
人回來給他們。

231
00:12:09,010 --> 00:12:12,120
他們就查不到
事他們自己。

232
00:12:12,120 --> 00:12:17,290
而且，事實上，即使是專家，
即使是心理諮詢師，

233
00:12:17,290 --> 00:12:22,930
開始擔心，事實上，
也許ELIZA將取而代之。

234
00:12:22,930 --> 00:12:25,640
即使電腦
科學家們擔心，我們

235
00:12:25,640 --> 00:12:30,040
如此接近解決自然語言。

236
00:12:30,040 --> 00:12:33,520
>> 現在，這不是任何地方接近真實。

237
00:12:33,520 --> 00:12:37,280
但是，這是多麼令人印象深刻
這些系統似乎可以。

238
00:12:37,280 --> 00:12:40,080
因此，讓我們先來了解一下
下面，並嘗試

239
00:12:40,080 --> 00:12:46,190
得到的問題一點點
在哪裡這段代碼實際上發生。

240
00:12:46,190 --> 00:12:48,170
所以我們會讓這個代碼
可之後。

241
00:12:48,170 --> 00:12:50,880
而這是一個非常
簡單而直接端口

242
00:12:50,880 --> 00:12:53,240
的原始ELIZA實施。

243
00:12:53,240 --> 00:12:56,350
>> 因此，一些文體的
的事情，你會看到這裡

244
00:12:56,350 --> 00:12:59,360
不文體什麼
我們希望你做

245
00:12:59,360 --> 00:13:01,480
或者是我們一直教你做。

246
00:13:01,480 --> 00:13:04,770
但是，我們一直試圖讓他們
跨越許多港口一樣

247
00:13:04,770 --> 00:13:08,087
這已使得它
具有原始的味道。

248
00:13:08,087 --> 00:13:09,920
所以，我們要包括
一堆東西，

249
00:13:09,920 --> 00:13:12,920
然後我們將有一個
設置關鍵字，東西

250
00:13:12,920 --> 00:13:16,460
伊麗莎將識別
並響應直接。

251
00:13:16,460 --> 00:13:20,780
所以，如果你有這樣的話
“可你”或“我不知道”或“否”

252
00:13:20,780 --> 00:13:24,680
或“是”或“夢想”
或“你好”，然後ELIZA

253
00:13:24,680 --> 00:13:27,920
將選擇性響應那些。

254
00:13:27,920 --> 00:13:30,010
我們也有一個
一定數量的東西

255
00:13:30,010 --> 00:13:34,940
我們會掉，像
將“我”到“你的。”

256
00:13:34,940 --> 00:13:39,920
>> 然後，我們將有一系列的反應
對於每個這些關鍵字，

257
00:13:39,920 --> 00:13:42,580
我們將通過旋轉
這些不同的響應。

258
00:13:42,580 --> 00:13:45,350
所以，如果我說“是”
在連續三次，我

259
00:13:45,350 --> 00:13:50,429
可能會得到三個不同的
從ELIZA回應。

260
00:13:50,429 --> 00:13:52,345
我們的代碼，那麼，
其實非常簡單。

261
00:13:52,345 --> 00:13:59,490
如果我向下滾動過去所有這些
我們已經編程響應

262
00:13:59,490 --> 00:14:02,920
我們踏踏實實地我們主要的，
我們要初始化

263
00:14:02,920 --> 00:14:06,540
幾個不同的變量
做家政的一點點

264
00:14:06,540 --> 00:14:08,480
在開始。

265
00:14:08,480 --> 00:14:11,760
但後​​來有絕對的一組
，你可以理解的代碼。

266
00:14:11,760 --> 00:14:15,820
一個大while循環，說我
一遍又一遍地重複這一點。

267
00:14:15,820 --> 00:14:20,420
我會讀成一排，我會
存儲在一個輸入字符串。

268
00:14:20,420 --> 00:14:23,880
我查一下，看看它的
特殊的關鍵字“再見”，這

269
00:14:23,880 --> 00:14:26,199
意味著退出程序。

270
00:14:26,199 --> 00:14:29,240
然後我會檢查，看看是否
有人只是在重複自己

271
00:14:29,240 --> 00:14:29,800
一遍又一遍。

272
00:14:29,800 --> 00:14:31,174
我會罵他們，如果他們這樣做。

273
00:14:31,174 --> 00:14:34,820
我會說“不要重複自己。”

274
00:14:34,820 --> 00:14:40,500
>> 只要這些都不發生，我們將
然後通過與環通掃描，

275
00:14:40,500 --> 00:14:45,330
上線308至313
在這裡，檢查，看看

276
00:14:45,330 --> 00:14:49,090
是任何這些關鍵字
包含在輸入短語

277
00:14:49,090 --> 00:14:50,620
我剛才是？

278
00:14:50,620 --> 00:14:54,845
如果有匹配對於他們來說，好
然後，我會記住的位置。

279
00:14:54,845 --> 00:14:57,050
我會記住的關鍵詞。

280
00:14:57,050 --> 00:14:58,620
而我就可以建立一個響應。

281
00:14:58,620 --> 00:15:03,150
>> 如果我沒有找到一個，那麼，
在我的關鍵字數組中的最後一件事

282
00:15:03,150 --> 00:15:08,070
將我的默認響應，
在沒有其他匹配。

283
00:15:08,070 --> 00:15:14,160
我會問這樣的問題：“你為什麼要
到這裡來？“或者”我怎麼幫你呢？“

284
00:15:14,160 --> 00:15:19,710
這只是部分適當
不管輸入是什麼。

285
00:15:19,710 --> 00:15:22,580
>> 然後，我們將建立艾麗莎的回應。

286
00:15:22,580 --> 00:15:26,040
我們就可以採取
該基地的響應，

287
00:15:26,040 --> 00:15:28,370
就像我們做的是
“我的老闆”的例子。

288
00:15:28,370 --> 00:15:30,970

289
00:15:30,970 --> 00:15:33,990
如果這是所有有
is--如果它只有一個

290
00:15:33,990 --> 00:15:36,860
那我應該respond--字符串
我可以將它發送回來。

291
00:15:36,860 --> 00:15:40,610
如果它有一個星號，在
它的結束，然後我會

292
00:15:40,610 --> 00:15:45,710
在處理每個令牌
用戶的響應的其餘部分

293
00:15:45,710 --> 00:15:51,590
並添加那些，換出
一個字一個字，因為我需要。

294
00:15:51,590 --> 00:15:56,100
>> 所有這一切都是絕對
東西，你可以建立。

295
00:15:56,100 --> 00:15:59,230
而事實上，該方法，使我們
已經處理的命令行參數，

296
00:15:59,230 --> 00:16:03,570
在你的方式
通過HTTP請求處理

297
00:16:03,570 --> 00:16:05,510
遵循相同的種的規則。

298
00:16:05,510 --> 00:16:08,220
他們是模式匹配。

299
00:16:08,220 --> 00:16:15,170
>> 所以伊莉莎有一個比較重要的
對自然語言的影響

300
00:16:15,170 --> 00:16:21,620
因為它使人們看起來這是一個
很實現的目標，比如在某種程度上我們最好

301
00:16:21,620 --> 00:16:25,550
能夠直接解決這個問題。

302
00:16:25,550 --> 00:16:30,670
現在，這並不是說，ELIZA做
一切，我們願意這樣做。

303
00:16:30,670 --> 00:16:33,710
當然不是。

304
00:16:33,710 --> 00:16:35,660
但是，我們應該能
做更多的東西。

305
00:16:35,660 --> 00:16:38,280

306
00:16:38,280 --> 00:16:41,490
>> 我們的第一個步驟去
超越伊莉莎是怎麼回事

307
00:16:41,490 --> 00:16:44,840
要能看
沒有文字被輸入

308
00:16:44,840 --> 00:16:53,750
進鍵盤，但講話，實際
語音記錄到麥克風。

309
00:16:53,750 --> 00:16:56,880
因此，當我們看這些
不同的部分，我們

310
00:16:56,880 --> 00:17:00,304
將要建立一組模型。

311
00:17:00,304 --> 00:17:02,970
我們將必須能
從低級別的聲去

312
00:17:02,970 --> 00:17:07,180
information--間距，
振幅，frequency--

313
00:17:07,180 --> 00:17:09,530
並轉換到這
一些單位，我們是

314
00:17:09,530 --> 00:17:14,619
能夠更容易地操縱
並且，最後，操控起來

315
00:17:14,619 --> 00:17:18,609
成單詞和句子。

316
00:17:18,609 --> 00:17:22,880
>> 因此，大多數語音識別
今天是在那裡系統

317
00:17:22,880 --> 00:17:26,069
按照統計
模型中，我們建立

318
00:17:26,069 --> 00:17:35,090
三個獨立的東西表示
該音頻信號實際上包含。

319
00:17:35,090 --> 00:17:38,640
我們先從一個語音模型
，討論剛剛基地

320
00:17:38,640 --> 00:17:41,250
聲音，我生產。

321
00:17:41,250 --> 00:17:46,900
我是不是生產的東西是
一個B為男孩或D-如狗？

322
00:17:46,900 --> 00:17:53,220
我如何識別這些兩個不同
手機作為單獨的獨特？

323
00:17:53,220 --> 00:17:56,600
>> 最重要的是，我們會再建
一個字的發音模式，

324
00:17:56,600 --> 00:18:01,350
東西連接在一起
這些個人手機

325
00:18:01,350 --> 00:18:04,724
並把它們組合成一個字。

326
00:18:04,724 --> 00:18:07,890
在這之後，我們將採取的話
我們將它們組裝用語言

327
00:18:07,890 --> 00:18:13,010
模擬成一個完整的句子。

328
00:18:13,010 --> 00:18:17,230
>> 現在，我們要談談每個
這些獨立和分開。

329
00:18:17,230 --> 00:18:21,580
但是，這三款車型都是
只是要統計。

330
00:18:21,580 --> 00:18:23,502
這意味著，當我們
與他們合作，我們將

331
00:18:23,502 --> 00:18:25,376
能夠一起工作
他們都同時進行。

332
00:18:25,376 --> 00:18:28,100

333
00:18:28,100 --> 00:18:28,600
好的。

334
00:18:28,600 --> 00:18:30,890
讓我們先從我們的語音模型。

335
00:18:30,890 --> 00:18:34,470
因此，語音模型依賴於
一個計算技術

336
00:18:34,470 --> 00:18:37,320
叫隱馬爾可夫模型。

337
00:18:37,320 --> 00:18:43,050
這些都是圖形化的模型中，我
已經和認識世界的一個狀態

338
00:18:43,050 --> 00:18:46,500
作為其特徵
由一組特徵。

339
00:18:46,500 --> 00:18:51,960
而這種狀態描述一個組成部分
那我從事的行動。

340
00:18:51,960 --> 00:19:00,190
>> 所以，如果我想製作
聲音“馬”像媽媽，

341
00:19:00,190 --> 00:19:03,970
有不同
組件的聲音。

342
00:19:03,970 --> 00:19:07,230
還有就是我畫的氣息的一部分。

343
00:19:07,230 --> 00:19:09,560
然後，我的錢包我的嘴唇。

344
00:19:09,560 --> 00:19:13,710
而我搖我的嘴唇退後一點
位，以使這一“馬”的聲音。

345
00:19:13,710 --> 00:19:15,340
然後還有一個版本。

346
00:19:15,340 --> 00:19:17,020
我的嘴唇裂開。

347
00:19:17,020 --> 00:19:19,030
空氣被排出。

348
00:19:19,030 --> 00:19:22,650
“馬”。

349
00:19:22,650 --> 00:19:29,250
>> 這三個不同的部分會
各國在這個graph--代表

350
00:19:29,250 --> 00:19:33,420
開始時，中間和結束。

351
00:19:33,420 --> 00:19:38,060
我將有過渡的
讓我從一個國家旅行

352
00:19:38,060 --> 00:19:42,260
到下一個與一定的概率。

353
00:19:42,260 --> 00:19:47,250
因此，舉例來說，是m
聽起來可能有一個非常，

354
00:19:47,250 --> 00:19:51,850
很短的攝入量​​在beginning--
“毫米” - 然後較長，

355
00:19:51,850 --> 00:19:55,640
振動階段時，我抱著我
雙唇幾乎humming--

356
00:19:55,640 --> 00:20:05,090
“MMMM” - 然後在很短的
爆破音，我驅逐breath--“馬”。

357
00:20:05,090 --> 00:20:09,370
>> 的隱馬爾可夫模型是
用來捕捉的事實

358
00:20:09,370 --> 00:20:13,340
這是我做的方式
聲音“馬”是怎麼回事

359
00:20:13,340 --> 00:20:17,350
是在略微不同的
其定時，是頻率，

360
00:20:17,350 --> 00:20:21,030
其功能比
您所做的方式

361
00:20:21,030 --> 00:20:23,300
或辦法，我可能
讓我說話的時候

362
00:20:23,300 --> 00:20:26,030
對不同用途的信。

363
00:20:26,030 --> 00:20:33,240
“母親”和“我可以”將
聲音略有不同。

364
00:20:33,240 --> 00:20:36,800
>> 因此，為了識別
特定的聲音，我們會

365
00:20:36,800 --> 00:20:42,020
建立馬爾可夫模型，這些隱馬爾可夫
每一個可能的手機型號，我

366
00:20:42,020 --> 00:20:45,840
可能要承認，
每一個可能的聲音，

367
00:20:45,840 --> 00:20:49,750
再看看
聲學數據，我有

368
00:20:49,750 --> 00:20:54,430
並確定統計學
哪一個是最有可能的

369
00:20:54,430 --> 00:20:58,110
已經產生這種聲音。

370
00:20:58,110 --> 00:20:58,610
確定。

371
00:20:58,610 --> 00:21:01,540

372
00:21:01,540 --> 00:21:06,750
通過這種模式，我們再
開始建立在它之上。

373
00:21:06,750 --> 00:21:09,330
我們採取的發音模式。

374
00:21:09,330 --> 00:21:11,790
現在，有時發音
模型既簡單又容易

375
00:21:11,790 --> 00:21:14,440
因為只有一個
這樣發音的東西。

376
00:21:14,440 --> 00:21:17,990
其他時候，他們是一個
稍微複雜一些。

377
00:21:17,990 --> 00:21:21,340
這裡有一個發音指南
對於紅色的東西就是

378
00:21:21,340 --> 00:21:25,210
您所做的番茄醬出來的水果。

379
00:21:25,210 --> 00:21:27,360
人們不認為這是一個水果。

380
00:21:27,360 --> 00:21:27,860
對嗎？

381
00:21:27,860 --> 00:21:30,880

382
00:21:30,880 --> 00:21:35,300
>> 現在，有許多不同的方式
人們會念這個字。

383
00:21:35,300 --> 00:21:37,780
有些人會說“腳趾5腳趾。”

384
00:21:37,780 --> 00:21:40,880
有些人會說“腳趾麻將腳趾。”

385
00:21:40,880 --> 00:21:44,800
我們可以捕捉與
這些圖形化的車型之一

386
00:21:44,800 --> 00:21:48,305
在這裡，我們再次表示過渡
作為具有一定概率

387
00:21:48,305 --> 00:21:51,360
和相關的概率他們。

388
00:21:51,360 --> 00:21:58,290
>> 所以在這種情況下，如果我是跟隨
通過這整個圖上的路線，

389
00:21:58,290 --> 00:22:03,330
我將開始在信
在最左邊的“TA”的聲音。

390
00:22:03,330 --> 00:22:07,570
我想藉此上半部分，
的“哦”，然後是“馬”

391
00:22:07,570 --> 00:22:14,530
然後一個“a”，然後一個
“TA”和“哦。” “腳趾可能腳趾。”

392
00:22:14,530 --> 00:22:19,610
如果我通過了底部路徑
這一點，我會得到“TA-MAH-腳趾。”

393
00:22:19,610 --> 00:22:26,810
如果我去了，然後
起來，我會得到“TA-MAY-腳趾。”

394
00:22:26,810 --> 00:22:29,950
>> 這些模型捕捉這些
差異，因為每當

395
00:22:29,950 --> 00:22:32,410
我們部署的其中之一
識別系統，

396
00:22:32,410 --> 00:22:35,340
這將有工作
許多不同類型的人，

397
00:22:35,340 --> 00:22:39,295
許多不同的口音，甚至
不同用途的同樣的話。

398
00:22:39,295 --> 00:22:42,204

399
00:22:42,204 --> 00:22:44,120
最後，最重要的是，
我們要建立的東西

400
00:22:44,120 --> 00:22:48,780
看起來非常複雜，
稱為語言模型，

401
00:22:48,780 --> 00:22:52,950
但實際上是最簡單的
三，因為這些操作

402
00:22:52,950 --> 00:22:56,041
關於所謂的正克模型。

403
00:22:56,041 --> 00:23:02,270
在這種情況下，我向你展示
一個兩部分的正克模型，一個兩字組。

404
00:23:02,270 --> 00:23:08,910
我們將做出實際的想法
有時，某些詞

405
00:23:08,910 --> 00:23:14,680
更可能跟隨一個
給定的字比其他人。

406
00:23:14,680 --> 00:23:25,210
如果我剛才說的“天氣預報”
下一個字可以“今天”很可能是

407
00:23:25,210 --> 00:23:31,510
或可以是“天氣
預計明天。“

408
00:23:31,510 --> 00:23:38,870
但它不太可能是“
天氣預報朝鮮薊。“

409
00:23:38,870 --> 00:23:42,980
>> 什麼是語言模型所做的是
它捕捉那些統計學

410
00:23:42,980 --> 00:23:47,450
通過計算，從一些非常大的
文集，所有實例的

411
00:23:47,450 --> 00:23:50,890
其中一個詞接踵而來。

412
00:23:50,890 --> 00:23:54,300
所以，如果我把一個大corpus--
像每一個華爾街日報

413
00:23:54,300 --> 00:24:00,750
自1930年以來，已產生的
這是標準的corpuses--之一

414
00:24:00,750 --> 00:24:03,910
我期待通過所有
該文本，和我算

415
00:24:03,910 --> 00:24:09,770
經過長達多少次
“預測”我看“今日”

416
00:24:09,770 --> 00:24:17,454
多少次我看到
“預測”，其次是“朝鮮薊”

417
00:24:17,454 --> 00:24:19,370
第一個是將
要更容易。

418
00:24:19,370 --> 00:24:21,540
這將出現
更為頻繁。

419
00:24:21,540 --> 00:24:24,610
因此，這將有一個更高的
與它的概率有關。

420
00:24:24,610 --> 00:24:27,340
>> 如果我想弄清楚的
概率整個話語的，

421
00:24:27,340 --> 00:24:29,940
然後，我就打破它。

422
00:24:29,940 --> 00:24:35,990
所以，聽證會的可能性
該句中的“老鼠吃奶酪”

423
00:24:35,990 --> 00:24:39,110
是這個詞的概率
“中的”開始一個句子，

424
00:24:39,110 --> 00:24:42,540
然後將概率的
詞“鼠”後面的單詞“the”

425
00:24:42,540 --> 00:24:44,910
的概率與所述
詞“吃”跟隨“老鼠”

426
00:24:44,910 --> 00:24:51,120
的概率與
“奶酪”跟隨“吃了。”

427
00:24:51,120 --> 00:24:55,160
>> 這聽起來像一個不少
統計，很多概率。

428
00:24:55,160 --> 00:24:57,510
而這一切，它是。

429
00:24:57,510 --> 00:25:02,920
但令人驚奇的是，如果你這樣做
與數據的一個足夠大的樣品，

430
00:25:02,920 --> 00:25:03,670
它的工作原理。

431
00:25:03,670 --> 00:25:05,250
和它的作品極其良好。

432
00:25:05,250 --> 00:25:07,810

433
00:25:07,810 --> 00:25:11,420
我們都知道這些技術。

434
00:25:11,420 --> 00:25:16,500
大多數操作系統附帶
語音識別在這一點上。

435
00:25:16,500 --> 00:25:20,940
我們使用的Siri和柯塔娜和迴聲。

436
00:25:20,940 --> 00:25:25,070
而這些東西都是基於
這種類型的三層的型號 - 

437
00:25:25,070 --> 00:25:30,620
在底部，一個一個語音模型
發音模型在中間，

438
00:25:30,620 --> 00:25:33,690
並在它們的頂部一個語言模型。

439
00:25:33,690 --> 00:25:37,630
>> 現在，他們需要做一點點
比，為了回答問題。

440
00:25:37,630 --> 00:25:43,000
但是，承認你在做什麼
確切地說取決於這一點。

441
00:25:43,000 --> 00:25:45,700
因此，讓我們舉一個例子在這裡。

442
00:25:45,700 --> 00:25:52,020
所以，我有我的手機坐在這兒
文件攝像機下方。

443
00:25:52,020 --> 00:25:56,110
而我們要問
SIRI幾個問題。

444
00:25:56,110 --> 00:25:57,150
好嗎？

445
00:25:57,150 --> 00:25:59,940
>> 因此，讓我們在這裡醒來我的電話。

446
00:25:59,940 --> 00:26:02,710

447
00:26:02,710 --> 00:26:05,000
Siri的，什麼是天氣
像在紐黑文今天？

448
00:26:05,000 --> 00:26:07,670

449
00:26:07,670 --> 00:26:10,780
>> SIRI：這裡的天氣
紐黑文，今天康涅狄格。

450
00:26:10,780 --> 00:26:11,890
>> BRIAN SCASSELLATI：OK。

451
00:26:11,890 --> 00:26:16,720
所以，首先你看到Siri的識別
每個單獨字

452
00:26:16,720 --> 00:26:19,050
然後產生的響應。

453
00:26:19,050 --> 00:26:22,277
我們將討論如何這種反應
來約在一點點。

454
00:26:22,277 --> 00:26:24,110
但是現在我們知道
這僅僅是基礎

455
00:26:24,110 --> 00:26:28,880
對原始數據和這
模式匹配類型的方法，

456
00:26:28,880 --> 00:26:31,120
我們可以玩一些遊戲的Siri。

457
00:26:31,120 --> 00:26:34,560
>> 因此，我可以再試一次。

458
00:26:34,560 --> 00:26:38,864
Siri的，什麼是天氣
河馬紐黑文，今天？

459
00:26:38,864 --> 00:26:39,810
>> SIRI：OK。

460
00:26:39,810 --> 00:26:44,245
這裡的天氣新
紐黑文，康涅狄格今天。

461
00:26:44,245 --> 00:26:46,120
BRIAN SCASSELLATI：Siri的
不是由該氣餒

462
00:26:46,120 --> 00:26:50,980
因為它找到了pattern--
“天氣”，“今天”，“紐黑文。”

463
00:26:50,980 --> 00:26:54,420
這就是它的響應
到，就像伊莉莎。

464
00:26:54,420 --> 00:26:54,920
好的。

465
00:26:54,920 --> 00:26:59,390
讓我們給它一次甚至
更可笑的例子。

466
00:26:59,390 --> 00:27:03,075
Siri的，天氣朝鮮薊
犰狳河馬紐黑文？

467
00:27:03,075 --> 00:27:06,806

468
00:27:06,806 --> 00:27:08,400
>> SIRI：讓我看看這一點。

469
00:27:08,400 --> 00:27:11,280
下面是我在網上找到
什麼是朝鮮薊犰狳

470
00:27:11,280 --> 00:27:13,780
河馬紐黑文。

471
00:27:13,780 --> 00:27:14,760
>> BRIAN SCASSELLATI：OK。

472
00:27:14,760 --> 00:27:20,400
所以，如果我走的不夠遠
遠離該模型中，

473
00:27:20,400 --> 00:27:24,365
我可以，因為它混淆了沒有
長匹配它有圖案。

474
00:27:24,365 --> 00:27:27,370

475
00:27:27,370 --> 00:27:29,390
這統計
引擎在說，

476
00:27:29,390 --> 00:27:32,850
那是什麼，你已經得到了可能性
的話河馬和朝鮮薊

477
00:27:32,850 --> 00:27:34,440
在一起，犰狳？

478
00:27:34,440 --> 00:27:36,050
那一定是新的東西。

479
00:27:36,050 --> 00:27:38,840

480
00:27:38,840 --> 00:27:40,610
>> 因此，這些技術，我們每天都在使用。

481
00:27:40,610 --> 00:27:43,670

482
00:27:43,670 --> 00:27:47,800
如果我們想帶他們一步
進一步的，不過，如果我們真的

483
00:27:47,800 --> 00:27:53,930
希望能夠談論什麼
的是，這些系統作出反應，進行

484
00:27:53,930 --> 00:28:00,630
我們要談談，再次，關於
更根本的一系列問題。

485
00:28:00,630 --> 00:28:05,370
這就是在溝通的話題
我們稱之為問答。

486
00:28:05,370 --> 00:28:07,028
也就是說，我們希望能夠用於：是嗎？

487
00:28:07,028 --> 00:28:07,944
聽眾：[聽不清]。

488
00:28:07,944 --> 00:28:10,789

489
00:28:10,789 --> 00:28:13,330
BRIAN SCASSELLATI：我們得到
到潛在語義處理？

490
00:28:13,330 --> 00:28:14,070
所以，是的。

491
00:28:14,070 --> 00:28:17,820
有很多東西都是
發生與Siri的表面下

492
00:28:17,820 --> 00:28:20,210
並且在一些例子
我要告訴你下一個

493
00:28:20,210 --> 00:28:22,610
其中，有相當多的
在結構方面

494
00:28:22,610 --> 00:28:25,260
你在說什麼這很重要。

495
00:28:25,260 --> 00:28:31,890
而且，事實上，這是一個偉大
前體下一張幻燈片我。

496
00:28:31,890 --> 00:28:35,110
>> 因此，在同樣的方式，我們的
語音識別就建立起來了

497
00:28:35,110 --> 00:28:39,620
多層，如果我們想
了解它是什麼，實際上

498
00:28:39,620 --> 00:28:44,620
雖這麼說，我們要再次
依靠多層分析

499
00:28:44,620 --> 00:28:47,020
這正在被識別的文本。

500
00:28:47,020 --> 00:28:52,560
因此，當Siri的其實是能
說，看，我發現這句話。

501
00:28:52,560 --> 00:28:55,230
現在我該怎麼處理它們呢？

502
00:28:55,230 --> 00:28:59,110
第一組分往往是
經歷並嘗試分析

503
00:28:59,110 --> 00:29:03,010
句子的結構。

504
00:29:03,010 --> 00:29:05,410
而在我們所看到的
上小學的時候，往往，

505
00:29:05,410 --> 00:29:08,920
作為排序圖表的
句子，我們要

506
00:29:08,920 --> 00:29:12,774
要認識到某些
詞有一定的作用。

507
00:29:12,774 --> 00:29:13,440
這些都是名詞。

508
00:29:13,440 --> 00:29:14,231
這些都是代詞。

509
00:29:14,231 --> 00:29:16,200
這些都是動詞。

510
00:29:16,200 --> 00:29:19,460
而且我們要承認
對於特定的語法，

511
00:29:19,460 --> 00:29:24,700
在這種情況下英語語法，有
，我可以將它們結合起來的有效途徑

512
00:29:24,700 --> 00:29:26,280
和無效的其他方式。

513
00:29:26,280 --> 00:29:29,920

514
00:29:29,920 --> 00:29:33,870
>> 這一認識，即結構，
可能足以幫助指導我們

515
00:29:33,870 --> 00:29:36,720
一點點。

516
00:29:36,720 --> 00:29:39,820
但是，這還遠遠不夠
為我們能夠給

517
00:29:39,820 --> 00:29:43,290
任何意義，什麼正在這裡說。

518
00:29:43,290 --> 00:29:46,615
為了做到這一點，我們必須依靠
一定量的語義處理。

519
00:29:46,615 --> 00:29:49,590

520
00:29:49,590 --> 00:29:55,080
也就是說，我們要來看看
在下方各有什麼這些詞

521
00:29:55,080 --> 00:29:57,400
實際上承載的意義。

522
00:29:57,400 --> 00:30:01,150
並且在這樣做的簡單的方法，
我們將每個單詞聯繫起來

523
00:30:01,150 --> 00:30:06,930
我們知道一個特定的功能，
一定改造，它

524
00:30:06,930 --> 00:30:09,300
允許發生。

525
00:30:09,300 --> 00:30:14,470
>> 在這種情況下，我們可能會標記
單詞“約翰”作為一個專有名詞，

526
00:30:14,470 --> 00:30:18,160
它承載著一個身份。

527
00:30:18,160 --> 00:30:21,530
我們可能標識
“瑪麗”為相同的方式。

528
00:30:21,530 --> 00:30:27,900
而像“愛”，一個動詞，
構成了一個特殊的關係

529
00:30:27,900 --> 00:30:31,582
我們能夠代表。

530
00:30:31,582 --> 00:30:33,290
現在，這並不意味著
我們明白

531
00:30:33,290 --> 00:30:37,680
什麼是愛，但只有我們明白
它在一個象徵性的系統的方法。

532
00:30:37,680 --> 00:30:40,480
也就是說，我們可以標記
它和操作它。

533
00:30:40,480 --> 00:30:44,230

534
00:30:44,230 --> 00:30:49,120
>> 與這些類型的方法的，
任何類型的語義處理

535
00:30:49,120 --> 00:30:57,060
這裡將需要一點點
知識位和大量的工作

536
00:30:57,060 --> 00:30:59,020
我們的一部分。

537
00:30:59,020 --> 00:31:03,590
我們不再領域
在這裡只是簡單的統計數據

538
00:31:03,590 --> 00:31:07,320
將要足夠我們。

539
00:31:07,320 --> 00:31:11,330
現在，為了去
從這個角度來被

540
00:31:11,330 --> 00:31:15,520
能夠談論的內
什麼實際發生在這裡，

541
00:31:15,520 --> 00:31:19,640
以能夠操縱這個
構建和理解的問題

542
00:31:19,640 --> 00:31:23,160
然後能夠
走出去，尋找，

543
00:31:23,160 --> 00:31:27,290
這需要更
複雜的認知模式。

544
00:31:27,290 --> 00:31:34,880
>> 在這些系統的構建方式
是在大多數情況下非常非常勞動

545
00:31:34,880 --> 00:31:36,350
密集的。

546
00:31:36,350 --> 00:31:39,490
它們涉及人類
花費了大量

547
00:31:39,490 --> 00:31:44,100
時間構建的方式
這些類型的句子

548
00:31:44,100 --> 00:31:47,270
可以在一些邏輯表示。

549
00:31:47,270 --> 00:31:51,639

550
00:31:51,639 --> 00:31:53,430
它會變得有點
更複雜的，雖然。

551
00:31:53,430 --> 00:31:56,400

552
00:31:56,400 --> 00:31:59,660
>> 甚至有一次，我們已經處理
與語義，我們將

553
00:31:59,660 --> 00:32:03,860
還是得看
對什麼東西被說語。

554
00:32:03,860 --> 00:32:08,620
也就是說，我該如何關聯的話
我有一些身體上出

555
00:32:08,620 --> 00:32:12,054
在全球或有
至少一些信息源

556
00:32:12,054 --> 00:32:12,970
我可以操縱？

557
00:32:12,970 --> 00:32:15,780

558
00:32:15,780 --> 00:32:20,790
>> 有時，這些導致
精彩的比特模糊性。

559
00:32:20,790 --> 00:32:24,470
“紅得發紫的明星結婚天文學家。”

560
00:32:24,470 --> 00:32:25,630
確定。

561
00:32:25,630 --> 00:32:28,540
現在，我們看到的
搞笑類型的標題的

562
00:32:28,540 --> 00:32:34,690
我們會在深夜的電視看
因為我們不理解的“明星”

563
00:32:34,690 --> 00:32:38,630
有它的天體的含義。

564
00:32:38,630 --> 00:32:43,390
我們知道，這意味著更多的
司空見慣的演員或女演員

565
00:32:43,390 --> 00:32:45,240
有大量的知名度。

566
00:32:45,240 --> 00:32:47,770

567
00:32:47,770 --> 00:32:51,950
>> “隊幫助狗咬傷的受害者。”

568
00:32:51,950 --> 00:32:55,550
難道球隊實際上是
在那裡協助狗

569
00:32:55,550 --> 00:32:59,620
在繞來繞去又咬受害者？

570
00:32:59,620 --> 00:33:02,380
抑或是有
個人誰是

571
00:33:02,380 --> 00:33:04,625
咬傷誰需要一些幫助一隻狗？

572
00:33:04,625 --> 00:33:07,650

573
00:33:07,650 --> 00:33:11,480
單從看語法
和句子的語義，

574
00:33:11,480 --> 00:33:14,660
我們無法確定。

575
00:33:14,660 --> 00:33:22,000
>> “直升機人類蒼蠅供電。”

576
00:33:22,000 --> 00:33:27,330
在那裡，事實上，實際
周圍飛小事

577
00:33:27,330 --> 00:33:34,510
是人的翅膀供電
直升機為人類的好？

578
00:33:34,510 --> 00:33:38,960
或者是有一個機械裝置
從一個人獲得它的權力？

579
00:33:38,960 --> 00:33:41,600

580
00:33:41,600 --> 00:33:46,500
>> 當我們在看問題
應答系統，

581
00:33:46,500 --> 00:33:51,110
這些是圖層
我們需要處理。

582
00:33:51,110 --> 00:33:54,890
現在，最好的和最排序
的普遍的這些系統的

583
00:33:54,890 --> 00:34:00,640
今天都能夠做到
事情在一個水平，是

584
00:34:00,640 --> 00:34:05,050
遠遠超出了我們有10年前。

585
00:34:05,050 --> 00:34:08,210
這裡是最好的系統之一
這是有今天。

586
00:34:08,210 --> 00:34:10,519
而這是一個系統
來自IBM稱為沃森。

587
00:34:10,519 --> 00:34:13,040

588
00:34:13,040 --> 00:34:15,500
這是我們的朋友在IBM。

589
00:34:15,500 --> 00:34:19,810
這是凱瑟琳銀行，甲辰，
和百基拉賴斯給我們

590
00:34:19,810 --> 00:34:26,323
沃森的演示
昨天在IBM約克。

591
00:34:26,323 --> 00:34:26,989
[視頻回放]

592
00:34:26,989 --> 00:34:27,690
 - 如何是你？

593
00:34:27,690 --> 00:34:30,600

594
00:34:30,600 --> 00:34:31,980
>>  - 我是很好。

595
00:34:31,980 --> 00:34:35,429
我的時候，我總是很高興
想，特別是當我

596
00:34:35,429 --> 00:34:38,920
可以保持冷靜在這些服務器機房。

597
00:34:38,920 --> 00:34:40,170
 - 誰是你最喜歡的女演員？

598
00:34:40,170 --> 00:34:43,870

599
00:34:43,870 --> 00:34:47,555
>>  - 我最喜愛的女主角
安吉麗娜·朱莉的勞拉·克勞馥

600
00:34:47,555 --> 00:34:54,800
在古墓麗影因為她的原
形式是為像我這樣的一個虛擬人物。

601
00:34:54,800 --> 00:34:56,760
>>  - 如何能沃森幫助患者？

602
00:34:56,760 --> 00:34:59,700

603
00:34:59,700 --> 00:35:03,755
>> -is計劃為病人
有機會獲得直接沃森？

604
00:35:03,755 --> 00:35:08,050
訪問沃森諮詢
應用程序將通過使用情況而有所不同。

605
00:35:08,050 --> 00:35:12,630
但目前，屈臣氏將只提供
可能的診斷和治療

606
00:35:12,630 --> 00:35:14,725
選擇醫學專業。

607
00:35:14,725 --> 00:35:17,680
在適當情況下，患者
可以提供信息

608
00:35:17,680 --> 00:35:21,210
華生，也許是通過一個
門戶網站界面，平板電腦，

609
00:35:21,210 --> 00:35:23,500
甚至移動電話。

610
00:35:23,500 --> 00:35:27,180
例如，一個患者可能
要求描述自己的症狀

611
00:35:27,180 --> 00:35:30,460
在自然語言直接
到沃森的解決方案，

612
00:35:30,460 --> 00:35:34,050
允許醫師將重點放在
診斷和不採集數據。

613
00:35:34,050 --> 00:35:38,379

614
00:35:38,379 --> 00:35:42,716
>>  - 誰暗殺了林肯？

615
00:35:42,716 --> 00:35:46,153
>> 約翰威爾克斯布斯。

616
00:35:46,153 --> 00:35:52,373
>>  - 在哪一年做了亞利桑那州
響尾蛇贏得世界大賽？

617
00:35:52,373 --> 00:35:55,295
>> -2001。

618
00:35:55,295 --> 00:35:58,710
>> [結束播放]

619
00:35:58,710 --> 00:36:01,610
>> BRIAN SCASSELLATI：所以
這些類型的系統

620
00:36:01,610 --> 00:36:07,430
必須依靠首先
認識到講話;第二，

621
00:36:07,430 --> 00:36:12,200
將其轉換成有意義的內部
表示;然後，第三，

622
00:36:12,200 --> 00:36:17,090
能夠走出去，找到
信息源

623
00:36:17,090 --> 00:36:21,140
使他們能夠回答這個問題。

624
00:36:21,140 --> 00:36:27,320
這種複雜程度涉及
同類型的編程事

625
00:36:27,320 --> 00:36:31,790
你一直
在做習題集。

626
00:36:31,790 --> 00:36:38,000
>> 我們能夠解析HTTP請求，
相同類型的低級別的圖案的

627
00:36:38,000 --> 00:36:40,810
匹配伊麗莎可以做。

628
00:36:40,810 --> 00:36:45,070
我們能夠將這些
為內部表示，

629
00:36:45,070 --> 00:36:50,360
然後用它們來查詢一些
外部數據庫，可能使用SQL。

630
00:36:50,360 --> 00:36:53,530

631
00:36:53,530 --> 00:36:56,260
所有系統的那
今天正在建造

632
00:36:56,260 --> 00:37:00,520
做這種類型的天然
語言交流

633
00:37:00,520 --> 00:37:04,100
在正在興建
這些相同的原則。

634
00:37:04,100 --> 00:37:09,530
>> 現在，即使是像系統
沃森是不是很複雜

635
00:37:09,530 --> 00:37:14,820
到能夠回答任意
任何主題的問題。

636
00:37:14,820 --> 00:37:20,060
而事實上，他們必須
給定域中的結構。

637
00:37:20,060 --> 00:37:24,440
所以，你可以到網上，你可以找到
該操作好沃森版本

638
00:37:24,440 --> 00:37:27,700
中醫學信息。

639
00:37:27,700 --> 00:37:31,490
或者有一個在線
只是涉及如何

640
00:37:31,490 --> 00:37:34,540
要做出好的建議
什麼樣的啤酒將與哪些食物去了。

641
00:37:34,540 --> 00:37:37,060

642
00:37:37,060 --> 00:37:41,870
而這些領域內，
它可以回答問題，

643
00:37:41,870 --> 00:37:46,130
發現它所需要的信息。

644
00:37:46,130 --> 00:37:48,270
>> 但你不能混用和匹配。

645
00:37:48,270 --> 00:37:53,150
這就是被訓練的系統
食品和啤酒的數據庫

646
00:37:53,150 --> 00:37:56,830
不突然，當你工作得很好
把它與醫學信息

647
00:37:56,830 --> 00:37:59,770
數據庫。

648
00:37:59,770 --> 00:38:05,680
因此，即使我們今天的最佳系統
依靠處理的水平

649
00:38:05,680 --> 00:38:11,570
在我們的手編
為了建設中的基礎設施建設

650
00:38:11,570 --> 00:38:13,275
使這個系統的運行。

651
00:38:13,275 --> 00:38:16,360

652
00:38:16,360 --> 00:38:20,710
>> 現在，最後一個話題我想
到能夠得到今天

653
00:38:20,710 --> 00:38:23,960
是關於非語言溝通。

654
00:38:23,960 --> 00:38:29,290
一個偉大的信息質量的
我們彼此通信

655
00:38:29,290 --> 00:38:35,490
通過不來約
我們正在申請個別單詞。

656
00:38:35,490 --> 00:38:40,290
它做了這些東西，
接近，目光，你的語氣，

657
00:38:40,290 --> 00:38:42,270
您的拐點。

658
00:38:42,270 --> 00:38:46,620
而溝通也
這是很多不同的接口

659
00:38:46,620 --> 00:38:49,960
關心一個偉大的交易。

660
00:38:49,960 --> 00:38:51,500
這不是什麼Siri的關心。

661
00:38:51,500 --> 00:38:56,250
我可以問Siri的東西用一個聲音
或語音不同的音調，

662
00:38:56,250 --> 00:38:59,840
和Siri的打算
給我相同的答案。

663
00:38:59,840 --> 00:39:05,260
但是，這不是我們構建
許多其他類型的接口。

664
00:39:05,260 --> 00:39:09,120
>> 我想向您介紹
現在到機器人中的一個。

665
00:39:09,120 --> 00:39:12,720
這是我的長期建
朋友和同事辛西婭

666
00:39:12,720 --> 00:39:16,010
Breazeal和她的公司基博。

667
00:39:16,010 --> 00:39:20,090
這robot--我們要去
有一對夫婦的志願者

668
00:39:20,090 --> 00:39:22,520
拿出與此交互。

669
00:39:22,520 --> 00:39:26,200
所以我可以有兩個人願意
與機器人給我玩嗎？

670
00:39:26,200 --> 00:39:29,936
你為什麼不上來吧，
為什麼你不來就到了。

671
00:39:29,936 --> 00:39:31,310
如果你想和我一起在這裡，請。

672
00:39:31,310 --> 00:39:36,520

673
00:39:36,520 --> 00:39:39,670
>> 如果我能有你
來的權利在這裡。

674
00:39:39,670 --> 00:39:40,170
謝謝。

675
00:39:40,170 --> 00:39:40,480
你好。

676
00:39:40,480 --> 00:39:41,400
>> ALFREDO：很高興見到你。

677
00:39:41,400 --> 00:39:42,010
阿爾弗雷多。

678
00:39:42,010 --> 00:39:42,520
>> BRIAN SCASSELLATI：阿爾弗雷多。

679
00:39:42,520 --> 00:39:43,146
>> 瑞秋：瑞秋。

680
00:39:43,146 --> 00:39:44,228
BRIAN SCASSELLATI：雷切爾。

681
00:39:44,228 --> 00:39:45,154
很高興見到你們倆。

682
00:39:45,154 --> 00:39:46,820
阿爾弗雷多，我要你先走。

683
00:39:46,820 --> 00:39:47,990
快來權在這裡。

684
00:39:47,990 --> 00:39:51,870
我要介紹
你 - 如果我能得到這一關

685
00:39:51,870 --> 00:39:58,450
不敲門的microphone--
一個叫基博的小機器人。

686
00:39:58,450 --> 00:40:00,140
OK？

687
00:40:00,140 --> 00:40:04,260
>> 現在，基博被設計為互動。

688
00:40:04,260 --> 00:40:09,339
雖然它可以給你講話，
多與機器人的相互作用的

689
00:40:09,339 --> 00:40:09,880
就是非語言。

690
00:40:09,880 --> 00:40:12,450

691
00:40:12,450 --> 00:40:17,070
阿爾弗雷多，我要問你
好好說話和免費

692
00:40:17,070 --> 00:40:19,554
給機器人，請。

693
00:40:19,554 --> 00:40:20,845
ALFREDO：我覺得你看起來很可愛。

694
00:40:20,845 --> 00:40:24,114

695
00:40:24,114 --> 00:40:25,611
>> [呼呼的聲音]

696
00:40:25,611 --> 00:40:26,192

697
00:40:26,192 --> 00:40:27,108
BRIAN SCASSELLATI：OK。

698
00:40:27,108 --> 00:40:30,110

699
00:40:30,110 --> 00:40:33,180
它的反應並不言語。

700
00:40:33,180 --> 00:40:35,180
然而，它給了你們兩個
明確承認

701
00:40:35,180 --> 00:40:39,680
它聽到你說的話
也不知怎麼理解。

702
00:40:39,680 --> 00:40:40,530
OK？

703
00:40:40,530 --> 00:40:42,070
步驟右後衛位置一秒鐘。

704
00:40:42,070 --> 00:40:43,130
謝謝。

705
00:40:43,130 --> 00:40:44,090
>> 瑞秋，如果你會的。

706
00:40:44,090 --> 00:40:46,070
現在，我想給
你更難就業。

707
00:40:46,070 --> 00:40:48,361
如果你站在這裡，
備份只是有那麼一點點

708
00:40:48,361 --> 00:40:50,280
我們可以幫你的相機
看看這種方式。

709
00:40:50,280 --> 00:40:56,840
我要問你說些什麼
真的是和討厭的機器人。

710
00:40:56,840 --> 00:41:02,900
>> 你才似乎什麼
做的是完全荒謬的。

711
00:41:02,900 --> 00:41:03,840
>> [嗡嗡聲]

712
00:41:03,840 --> 00:41:07,610

713
00:41:07,610 --> 00:41:09,030
>> 這更是荒謬。

714
00:41:09,030 --> 00:41:10,120
這是怎麼回事呀？

715
00:41:10,120 --> 00:41:13,487

716
00:41:13,487 --> 00:41:16,207
噢，不心疼。

717
00:41:16,207 --> 00:41:17,040
我給你一個擁抱。

718
00:41:17,040 --> 00:41:19,882

719
00:41:19,882 --> 00:41:21,090
BRIAN SCASSELLATI：好吧。

720
00:41:21,090 --> 00:41:22,280
謝謝，雷切爾。

721
00:41:22,280 --> 00:41:24,565
阿爾弗雷多，雷切爾，謝謝你們非常多。

722
00:41:24,565 --> 00:41:26,840
>> [掌聲]

723
00:41:26,840 --> 00:41:28,660

724
00:41:28,660 --> 00:41:34,470
>> 因此，這種互動在
許多方面的一些相同的規則

725
00:41:34,470 --> 00:41:36,950
和一些相同
結構我們

726
00:41:36,950 --> 00:41:39,950
可能有語言交流。

727
00:41:39,950 --> 00:41:44,530
它既是交際和
提供一個重要目的。

728
00:41:44,530 --> 00:41:48,590
而這種互動，在
方法很多，設計

729
00:41:48,590 --> 00:41:52,890
有對特定的效果
與人交互或聽

730
00:41:52,890 --> 00:41:54,410
到機器人。

731
00:41:54,410 --> 00:41:56,450
>> 現在，我很幸運
有吉波今天在這裡。

732
00:41:56,450 --> 00:42:00,550
薩姆·斯波爾丁是在這裡幫助
我們用機器人。

733
00:42:00,550 --> 00:42:07,470
而我要問薩姆給
吉波跳舞我們一個很好的演示

734
00:42:07,470 --> 00:42:09,720
我們可以在年底看這裡。

735
00:42:09,720 --> 00:42:10,590
因此，繼續前進，基博。

736
00:42:10,590 --> 00:42:11,550
>> SAM：OK，基博。

737
00:42:11,550 --> 00:42:14,430
向我們展示你的舞蹈動作。

738
00:42:14,430 --> 00:42:17,310
>> [音樂播放]

739
00:42:17,310 --> 00:42:43,114

740
00:42:43,114 --> 00:42:44,780
BRIAN SCASSELLATI：好，大家好。

741
00:42:44,780 --> 00:42:46,865
感謝我們的朋友在基博。

742
00:42:46,865 --> 00:42:49,426
>> [掌聲]

743
00:42:49,426 --> 00:42:50,140

744
00:42:50,140 --> 00:42:54,990
>> 並感謝我們的朋友
IBM今天幫忙。

745
00:42:54,990 --> 00:42:57,300
溝通是什麼
你要去

746
00:42:57,300 --> 00:43:02,280
看到來了越來越多的作為
我們構建更複雜的界面。

747
00:43:02,280 --> 00:43:05,760
下週，我們會繼續討論
有關如何對接

748
00:43:05,760 --> 00:43:08,890
與電腦對手的遊戲。

749
00:43:08,890 --> 00:43:12,950
但是，如果你有關於這個問題，
我就在附近的辦公時間今晚。

750
00:43:12,950 --> 00:43:17,610
我很高興能和你談AI
主題或進入更多的細節。

751
00:43:17,610 --> 00:43:18,927
有一個偉大的週末​​。

752
00:43:18,927 --> 00:43:21,409
>> [掌聲]

753
00:43:21,409 --> 00:43:21,909

754
00:43:21,909 --> 00:43:26,141
[音樂播放]

755
00:43:26,141 --> 00:46:42,879