1 00:00:00,000 --> 00:00:02,928 >> [音樂播放] 2 00:00:02,928 --> 00:00:11,230 3 00:00:11,230 --> 00:00:12,790 >> DAVID馬蘭:這是CS50。 4 00:00:12,790 --> 00:00:14,072 這為10週結束時。 5 00:00:14,072 --> 00:00:16,030 和男孩,我們有一個 良好的班為你今天。 6 00:00:16,030 --> 00:00:20,040 我們很高興地邀請兩 我們從耶魯的朋友趕快到我們今天 7 00:00:20,040 --> 00:00:23,920 並且看的交集 人工智能,機器人技術, 8 00:00:23,920 --> 00:00:25,710 自然語言處理,以及更多。 9 00:00:25,710 --> 00:00:27,090 >> 事實上,在 過去幾週,我們已經 10 00:00:27,090 --> 00:00:29,714 肯定花了很多時間, 特別是在較早的pset, 11 00:00:29,714 --> 00:00:31,560 專注於相當低級別的細節。 12 00:00:31,560 --> 00:00:34,520 它很容易忽視 森林的樹木 13 00:00:34,520 --> 00:00:38,170 並獲得掛在循環和條件 和指針,當然,和類似物。 14 00:00:38,170 --> 00:00:41,770 但現實情況是,你們現在有 配料與你可真 15 00:00:41,770 --> 00:00:45,300 解決了一些有趣的問題,其中 他們那些我們的朋友在耶魯 16 00:00:45,300 --> 00:00:48,790 工作只是害羞劍橋。 17 00:00:48,790 --> 00:00:52,410 >> 所以,首先請允許我介紹一下我們的頭 教學耶魯大學,安迪的助手。 18 00:00:52,410 --> 00:00:55,182 >> [掌聲] 19 00:00:55,182 --> 00:00:57,030 20 00:00:57,030 --> 00:01:00,710 >> 安迪:首先,只是感謝 你讓一對夫婦Yalies 21 00:01:00,710 --> 00:01:02,700 今天流行下到劍橋。 22 00:01:02,700 --> 00:01:05,299 我們真的很感激。 23 00:01:05,299 --> 00:01:07,090 其次,我們的朋友 回home--傑森, 24 00:01:07,090 --> 00:01:09,670 感謝保持和運行講座。 25 00:01:09,670 --> 00:01:12,970 希望它在紐黑文都好。 26 00:01:12,970 --> 00:01:15,720 >> 所以呀,我超級興奮 今天給大家介紹Scaz。 27 00:01:15,720 --> 00:01:17,020 Scaz運行的機器人實驗室。 28 00:01:17,020 --> 00:01:19,690 他是一個教授,像五 不同的部門在耶魯大學。 29 00:01:19,690 --> 00:01:23,159 在他的實驗室,他有很多很多 機器人,他喜歡玩。 30 00:01:23,159 --> 00:01:24,950 他有一樣的 最酷的工作在世界上。 31 00:01:24,950 --> 00:01:27,116 而他得到一種混亂 與整天各地 32 00:01:27,116 --> 00:01:29,090 長,做了一些工作,以及。 33 00:01:29,090 --> 00:01:33,070 >> 因此,我們實際上增添了一顆 與我們今天的人下來。 34 00:01:33,070 --> 00:01:36,900 因此,事不宜遲,Scaz是 要繼續前進,並為我們介紹一下 35 00:01:36,900 --> 00:01:38,660 以他的機器人朋友。 36 00:01:38,660 --> 00:01:41,546 >> [掌聲] 37 00:01:41,546 --> 00:01:42,935 38 00:01:42,935 --> 00:01:44,310 BRIAN SCASSELLATI:謝謝你,大衛。 39 00:01:44,310 --> 00:01:45,380 謝謝你,安迪。 40 00:01:45,380 --> 00:01:50,050 它是如此美妙的是 這裡與大家今天。 41 00:01:50,050 --> 00:01:56,490 我想首先要非常清楚, 這裡的CS50工作人員在劍橋 42 00:01:56,490 --> 00:01:59,190 一直令人難以置信的熱情好客給我們。 43 00:01:59,190 --> 00:02:02,130 我們非常感謝所有 他們所做的支持我們。 44 00:02:02,130 --> 00:02:05,690 因此,我們希望能 返回的恩情。 45 00:02:05,690 --> 00:02:09,370 >> 所以今天,我們得到的宣布 那我們將有一個新的, 46 00:02:09,370 --> 00:02:15,240 CS50的事件之一的一類 下週在紐黑文的發生。 47 00:02:15,240 --> 00:02:18,040 這是CS50研究世博會。 48 00:02:18,040 --> 00:02:21,300 因此,我們將要邀請 everyone-- CS50學生, 49 00:02:21,300 --> 00:02:26,510 工作人員來自美國哈佛大學和Yale--到 下來和我們一起參觀上週五。 50 00:02:26,510 --> 00:02:30,400 我們將有各種各樣的超過 30個不同的人提出 51 00:02:30,400 --> 00:02:34,830 和exhibiting--年級學生展示 了一些他們的研究產品。 52 00:02:34,830 --> 00:02:38,480 我們將有一些創業公司,甚至,看 對於新的高科技人才一點點, 53 00:02:38,480 --> 00:02:40,460 初創公司來自哈佛和耶魯。 54 00:02:40,460 --> 00:02:44,550 而且,我們還會有一些學生團體 尋找一些新的成員。 55 00:02:44,550 --> 00:02:46,357 >> 這將是一個非常激動人心的時刻。 56 00:02:46,357 --> 00:02:49,190 希望你們誰是 下來的哈佛,耶魯遊戲 57 00:02:49,190 --> 00:02:51,360 將能夠停止 年初由一點點, 58 00:02:51,360 --> 00:02:54,060 就在校園中心, 斯特林紀念圖書館。 59 00:02:54,060 --> 00:02:58,040 我們要有一套 展品範圍從自主 60 00:02:58,040 --> 00:03:04,460 帆船使用軟件的方式 保存中世紀手稿。 61 00:03:04,460 --> 00:03:07,860 >> 我們將有廣告 組織網絡和人員 62 00:03:07,860 --> 00:03:11,230 教學軟件編碼在開普敦。 63 00:03:11,230 --> 00:03:13,730 我們將有電腦 音樂表演。 64 00:03:13,730 --> 00:03:16,020 我們會的過程中有更多的機器人。 65 00:03:16,020 --> 00:03:18,900 因此,我們希望你會 參加我們這個活動。 66 00:03:18,900 --> 00:03:21,350 這應該是一個很大的 樂趣,食物一點點, 67 00:03:21,350 --> 00:03:24,430 和很多有趣的 事情要談。 68 00:03:24,430 --> 00:03:28,230 >> 所以我們今天要談 關於自然語言處理。 69 00:03:28,230 --> 00:03:32,560 這是對我們的嘗試 建立接口的新途徑 70 00:03:32,560 --> 00:03:35,150 與我們的設備,因為 在過去的幾個星期, 71 00:03:35,150 --> 00:03:40,800 你一直專注於它是如何說 您可以編寫代碼,編寫軟件 72 00:03:40,800 --> 00:03:47,110 那就是能說一個辦法 機,這就是我要你做的。 73 00:03:47,110 --> 00:03:50,210 >> 但是,我們不應該需要 預計一切 74 00:03:50,210 --> 00:03:53,760 這是在那裡這是我們用來 每個人都在世界 75 00:03:53,760 --> 00:03:57,480 將是精通 在這樣的結構。 76 00:03:57,480 --> 00:04:02,540 因此,我們區分計算機之間 語言和自然languages​​-- 77 00:04:02,540 --> 00:04:06,720 也就是說,事情人類使用 與其他人進行通信。 78 00:04:06,720 --> 00:04:12,270 我們試圖構建一個使用界面 這些自然的溝通機制。 79 00:04:12,270 --> 00:04:16,029 >> 現在,就像所有其他的話題 我們已經開始在CS50, 80 00:04:16,029 --> 00:04:19,589 我們將先從最簡單的 自然語言處理的位 81 00:04:19,589 --> 00:04:21,269 我們可以想像。 82 00:04:21,269 --> 00:04:24,940 我們將開始與 自然語言的歷史的一部分。 83 00:04:24,940 --> 00:04:28,740 然後,我們將建立以 越來越多的最近的系統 84 00:04:28,740 --> 00:04:31,450 並有一些有趣的演示沿途。 85 00:04:31,450 --> 00:04:35,900 >> 因此,我們要開始什麼 可能是第一個自然語言 86 00:04:35,900 --> 00:04:38,210 處理系統。 87 00:04:38,210 --> 00:04:45,080 這是寫在一個軟件系統 1966年由約瑟夫·魏澤鮑姆叫做ELIZA。 88 00:04:45,080 --> 00:04:49,640 伊萊扎被設計成 複製類型的相互作用 89 00:04:49,640 --> 00:04:53,850 你將有一個 羅吉瑞恩心理治療師。 90 00:04:53,850 --> 00:04:57,210 現在,Rogerians,他們有 一個想法,心理治療 91 00:04:57,210 --> 00:05:02,800 參與能夠反映回 給患者和他們交談, 92 00:05:02,800 --> 00:05:08,100 基本上,只給他們一個 治療師的微小點點。 93 00:05:08,100 --> 00:05:09,920 也就是說,一切 治療師說: 94 00:05:09,920 --> 00:05:16,500 被認為是僅僅反映 什麼樣的病人告訴他們。 95 00:05:16,500 --> 00:05:18,990 >> 因此,讓我們嘗試演示這一點。 96 00:05:18,990 --> 00:05:22,820 我們有一個志願者誰願意成為 願意分享他們的最深的, 97 00:05:22,820 --> 00:05:26,650 最黑暗的,和/或假的秘密與伊莉莎? 98 00:05:26,650 --> 00:05:29,680 當然,你為什麼不來就到了。 99 00:05:29,680 --> 00:05:30,847 太棒了。 100 00:05:30,847 --> 00:05:31,430 你的名字? 101 00:05:31,430 --> 00:05:32,000 >> 邁爾斯:萬里。 102 00:05:32,000 --> 00:05:33,041 >> BRIAN SCASSELLATI:萬里。 103 00:05:33,041 --> 00:05:34,270 很高興見到你,萬里。 104 00:05:34,270 --> 00:05:36,270 如果你想抓住這一點。 105 00:05:36,270 --> 00:05:40,840 而且我們要 使用版本ELIZA的 106 00:05:40,840 --> 00:05:44,640 我們已經複製 內CS50 IDE。 107 00:05:44,640 --> 00:05:47,140 並且我們將看看源 在一小會兒代碼這一點。 108 00:05:47,140 --> 00:05:49,910 但現在,我們只是 要通過鍵入伊莉莎來調用它。 109 00:05:49,910 --> 00:05:55,480 >> 伊萊扎將會給您回應 這將是在所有的首都。 110 00:05:55,480 --> 00:05:57,950 而要問你幾個問題。 111 00:05:57,950 --> 00:06:02,130 我們會作出回應,並鍵入 在應對ELIZA。 112 00:06:02,130 --> 00:06:04,310 所以伊莉莎說,“嗨,我是伊莉莎。 113 00:06:04,310 --> 00:06:05,462 什麼是你的問題嗎?“ 114 00:06:05,462 --> 00:06:08,092 你會想 告訴ELIZA今天呢? 115 00:06:08,092 --> 00:06:10,750 >> 邁爾斯:我只能入睡 如果我有兔子拖鞋上。 116 00:06:10,750 --> 00:06:12,440 >> BRIAN SCASSELLATI:好吧。 117 00:06:12,440 --> 00:06:13,360 好的。 118 00:06:13,360 --> 00:06:15,300 >> [笑] 119 00:06:15,300 --> 00:06:22,410 >> “我只能入睡 與兔寶寶拖鞋上“。 120 00:06:22,410 --> 00:06:29,000 伊萊扎說,“餵,你 有什麼心理問題? 121 00:06:29,000 --> 00:06:30,450 也許這是一個很好的指標。“ 122 00:06:30,450 --> 00:06:30,780 >> 確定。 123 00:06:30,780 --> 00:06:32,245 所以,你想回應? 124 00:06:32,245 --> 00:06:36,110 125 00:06:36,110 --> 00:06:36,970 >> 邁爾斯:是的。 126 00:06:36,970 --> 00:06:38,660 >> 布賴恩SCASSELLATI:是的。 127 00:06:38,660 --> 00:06:39,570 人的許多話。 128 00:06:39,570 --> 00:06:41,870 我喜歡這一點。 129 00:06:41,870 --> 00:06:50,200 伊莉莎說,“你似乎相當積極。” 130 00:06:50,200 --> 00:06:53,200 >> MILES:不,我,其實,一個電子。 131 00:06:53,200 --> 00:06:55,150 >> BRIAN SCASSELLATI:“沒有。 132 00:06:55,150 --> 00:07:02,240 其實,我是一個電子。“ “你來我往 133 00:07:02,240 --> 00:07:06,954 因為你是一個電子?“ 134 00:07:06,954 --> 00:07:08,870 現在,我們可以看到一些 在things--我要去 135 00:07:08,870 --> 00:07:10,200 暫停你只是一秒鐘,萬里。 136 00:07:10,200 --> 00:07:11,010 不要去任何地方。 137 00:07:11,010 --> 00:07:12,650 我們不跟你做呢。 138 00:07:12,650 --> 00:07:16,490 伊莉莎是,在某些方面, 回應一些事情 139 00:07:16,490 --> 00:07:21,140 那他的說法,但沒有 任何真正的理解。 140 00:07:21,140 --> 00:07:26,090 而且它也學舌距今約 他的句子成分。 141 00:07:26,090 --> 00:07:27,310 >> 所以我們說,“沒有。 142 00:07:27,310 --> 00:07:29,090 其實,我是一個電子。“ 143 00:07:29,090 --> 00:07:34,190 伊麗莎也回應道:“你來 我,因為你是一個電子?“ 144 00:07:34,190 --> 00:07:34,690 好的。 145 00:07:34,690 --> 00:07:36,050 讓我們給它在這裡多了一個回應。 146 00:07:36,050 --> 00:07:37,140 給它一個很好的,萬里。 147 00:07:37,140 --> 00:07:37,806 >> 邁爾斯:好一個? 148 00:07:37,806 --> 00:07:48,400 149 00:07:48,400 --> 00:07:49,570 >> 是的,請幫助我。 150 00:07:49,570 --> 00:07:50,570 BRIAN SCASSELLATI:“是的。 151 00:07:50,570 --> 00:07:58,010 請幫幫我。“”你確定嗎?“ 152 00:07:58,010 --> 00:07:58,510 MILES:第 153 00:07:58,510 --> 00:08:00,860 BRIAN SCASSELLATI:沒有。 154 00:08:00,860 --> 00:08:03,562 “這是什麼建議嗎?” 155 00:08:03,562 --> 00:08:06,760 >> 邁爾斯:我可能不是一個電子。 156 00:08:06,760 --> 00:08:11,170 >> BRIAN SCASSELLATI:“我 可能不是一個電子。“ 157 00:08:11,170 --> 00:08:13,790 “你是說沒有剛需負?” 158 00:08:13,790 --> 00:08:14,390 >> 好的。 159 00:08:14,390 --> 00:08:16,030 所以萬里,太感謝你了。 160 00:08:16,030 --> 00:08:16,860 >> MILES:謝謝。 161 00:08:16,860 --> 00:08:18,360 >> BRIAN SCASSELLATI:非常感謝。 162 00:08:18,360 --> 00:08:20,230 [掌聲] 163 00:08:20,230 --> 00:08:21,230 164 00:08:21,230 --> 00:08:26,700 >> 因此,這伊莉莎項目,在許多方面, 正在響應只是件 165 00:08:26,700 --> 00:08:32,730 我們正在提供,沒有任何深 了解這裡發生了什麼。 166 00:08:32,730 --> 00:08:36,640 這是一種制度 被稱為模式匹配,其中, 167 00:08:36,640 --> 00:08:40,490 我們正在尋找某些 文本位,我們是那麼 168 00:08:40,490 --> 00:08:44,860 要帶出什麼 作為輸入提供, 169 00:08:44,860 --> 00:08:52,580 轉換,潛在地,以某種方式, 然後給它返回給用戶。 170 00:08:52,580 --> 00:08:55,150 >> 做任何你認為 伊麗莎實際上是 171 00:08:55,150 --> 00:08:58,230 在這裡進行有效的心理? 172 00:08:58,230 --> 00:08:59,250 一個人,也許。 173 00:08:59,250 --> 00:09:00,166 >> 聽眾:[聽不清]。 174 00:09:00,166 --> 00:09:03,315 175 00:09:03,315 --> 00:09:05,440 BRIAN SCASSELLATI:怎麼 這是否讓你有什麼感覺? 176 00:09:05,440 --> 00:09:06,530 是的,事實上,它的作用。 177 00:09:06,530 --> 00:09:10,890 我們將看到,實際上, 它一會兒就好了源代碼。 178 00:09:10,890 --> 00:09:13,580 所以,你要成為 能夠做到正是這一點。 179 00:09:13,580 --> 00:09:17,420 >> 現在,伊莉莎是一種形式是什麼 我們稱之為今天的聊天機器人。 180 00:09:17,420 --> 00:09:19,950 它只是通過 文本你提供, 181 00:09:19,950 --> 00:09:24,030 提供了最低限度的金額 理解或處理, 182 00:09:24,030 --> 00:09:26,790 然後鸚鵡回給你。 183 00:09:26,790 --> 00:09:31,830 因此,讓我們來看看, 概念上,並談什麼 184 00:09:31,830 --> 00:09:34,690 這是伊莉莎實際上是做什麼。 185 00:09:34,690 --> 00:09:42,000 >> 伊莉莎走的是一條sentence--讓我們 說,“我想打動我的老闆。” 186 00:09:42,000 --> 00:09:45,130 而伊莉莎期待 通過那句話 187 00:09:45,130 --> 00:09:48,730 並試圖找到與 與特定模式匹配。 188 00:09:48,730 --> 00:09:52,850 因此,例如,有一種格式 伊麗莎正在尋找的話 189 00:09:52,850 --> 00:09:55,110 “我想要的。” 190 00:09:55,110 --> 00:09:59,330 而且任何時候它看到的東西 有“我要”的話, 191 00:09:59,330 --> 00:10:01,770 它制定的響應。 192 00:10:01,770 --> 00:10:05,040 並且響應是固定字符串。 193 00:10:05,040 --> 00:10:07,915 在這種情況下,它是“為什麼你要幹什麼?” 194 00:10:07,915 --> 00:10:11,330 我把一個小明星 到底是因為這只是 195 00:10:11,330 --> 00:10:13,310 我們的反應的開始。 196 00:10:13,310 --> 00:10:16,310 而星指出, 我們要採取休息 197 00:10:16,310 --> 00:10:19,850 用戶的utterance--的 “打動我的老闆” - 198 00:10:19,850 --> 00:10:24,500 而且我們要追加的 到該字符串的結尾。 199 00:10:24,500 --> 00:10:28,990 >> 所以,現在,而不是說,“為什麼 你想打動我的老闆。“ 200 00:10:28,990 --> 00:10:31,800 有額外的一點點 處理,我們將盡。 201 00:10:31,800 --> 00:10:34,440 也就是說,我們必須 轉換某些代詞 202 00:10:34,440 --> 00:10:38,670 在這裡,從“我的老闆”到“你的老闆。” 203 00:10:38,670 --> 00:10:41,300 還有可能是一些其他 我們需要做出改變。 204 00:10:41,300 --> 00:10:44,990 因此,而不是僅僅堅持到底 直接到年底,我們將做什麼 205 00:10:44,990 --> 00:10:49,160 是我們將採取的其他地方 白這裡 - 用戶utterance-- 206 00:10:49,160 --> 00:10:54,090 我們會把它一件一件 時間和轉換每串 207 00:10:54,090 --> 00:10:58,180 的道理,每一個字,變成了一句。 208 00:10:58,180 --> 00:10:59,580 >> 因此,我們將取詞“來。” 209 00:10:59,580 --> 00:11:01,650 有沒有轉換 我們需要做的。 210 00:11:01,650 --> 00:11:02,340 “沒話說了。” 211 00:11:02,340 --> 00:11:04,140 有沒有轉換 我們需要做的還有。 212 00:11:04,140 --> 00:11:06,670 “我的”將轉換為“你的。” 213 00:11:06,670 --> 00:11:10,070 而“老闆”,我們就離開的“老大”。 214 00:11:10,070 --> 00:11:12,740 然後最後,什麼 與一期結束, 215 00:11:12,740 --> 00:11:16,640 我們將它轉換成一個問題。 216 00:11:16,640 --> 00:11:22,600 >> 這個非常簡單的模式匹配 其實是相當成功的。 217 00:11:22,600 --> 00:11:27,260 當這個被介紹 在1966--約瑟夫·魏澤鮑姆 218 00:11:27,260 --> 00:11:28,986 在計算機上編程這一點。 219 00:11:28,986 --> 00:11:31,110 現在,電腦在當時 不是台式機機型。 220 00:11:31,110 --> 00:11:33,950 它們共享資源。 221 00:11:33,950 --> 00:11:39,090 而他的學生們 去和伊莉莎聊天。 222 00:11:39,090 --> 00:11:41,570 最終,他不得不 限制對它的訪問 223 00:11:41,570 --> 00:11:43,890 由於他的學生不 讓做任何工作。 224 00:11:43,890 --> 00:11:46,190 他們只是聊天ELIZA。 225 00:11:46,190 --> 00:11:48,850 而且,事實上,他不得不 火他的助手,誰 226 00:11:48,850 --> 00:11:55,840 花光了所有她的時間交談ELIZA 關於她的深,令人擔憂的問題。 227 00:11:55,840 --> 00:12:00,350 >> 大家誰使用這些系統 開始人格化他們。 228 00:12:00,350 --> 00:12:04,490 他們開始認為他們是 是動畫和真實的人。 229 00:12:04,490 --> 00:12:07,969 他們開始認識到一些 的事情,他們說 230 00:12:07,969 --> 00:12:09,010 人回來給他們。 231 00:12:09,010 --> 00:12:12,120 他們就查不到 事他們自己。 232 00:12:12,120 --> 00:12:17,290 而且,事實上,即使是專家, 即使是心理諮詢師, 233 00:12:17,290 --> 00:12:22,930 開始擔心,事實上, 也許ELIZA將取而代之。 234 00:12:22,930 --> 00:12:25,640 即使電腦 科學家們擔心,我們 235 00:12:25,640 --> 00:12:30,040 如此接近解決自然語言。 236 00:12:30,040 --> 00:12:33,520 >> 現在,這不是任何地方接近真實。 237 00:12:33,520 --> 00:12:37,280 但是,這是多麼令人印象深刻 這些系統似乎可以。 238 00:12:37,280 --> 00:12:40,080 因此,讓我們先來了解一下 下面,並嘗試 239 00:12:40,080 --> 00:12:46,190 得到的問題一點點 在哪裡這段代碼實際上發生。 240 00:12:46,190 --> 00:12:48,170 所以我們會讓這個代碼 可之後。 241 00:12:48,170 --> 00:12:50,880 而這是一個非常 簡單而直接端口 242 00:12:50,880 --> 00:12:53,240 的原始ELIZA實施。 243 00:12:53,240 --> 00:12:56,350 >> 因此,一些文體的 的事情,你會看到這裡 244 00:12:56,350 --> 00:12:59,360 不文體什麼 我們希望你做 245 00:12:59,360 --> 00:13:01,480 或者是我們一直教你做。 246 00:13:01,480 --> 00:13:04,770 但是,我們一直試圖讓他們 跨越許多港口一樣 247 00:13:04,770 --> 00:13:08,087 這已使得它 具有原始的味道。 248 00:13:08,087 --> 00:13:09,920 所以,我們要包括 一堆東西, 249 00:13:09,920 --> 00:13:12,920 然後我們將有一個 設置關鍵字,東西 250 00:13:12,920 --> 00:13:16,460 伊麗莎將識別 並響應直接。 251 00:13:16,460 --> 00:13:20,780 所以,如果你有這樣的話 “可你”或“我不知道”或“否” 252 00:13:20,780 --> 00:13:24,680 或“是”或“夢想” 或“你好”,然後ELIZA 253 00:13:24,680 --> 00:13:27,920 將選擇性響應那些。 254 00:13:27,920 --> 00:13:30,010 我們也有一個 一定數量的東西 255 00:13:30,010 --> 00:13:34,940 我們會掉,像 將“我”到“你的。” 256 00:13:34,940 --> 00:13:39,920 >> 然後,我們將有一系列的反應 對於每個這些關鍵字, 257 00:13:39,920 --> 00:13:42,580 我們將通過旋轉 這些不同的響應。 258 00:13:42,580 --> 00:13:45,350 所以,如果我說“是” 在連續三次,我 259 00:13:45,350 --> 00:13:50,429 可能會得到三個不同的 從ELIZA回應。 260 00:13:50,429 --> 00:13:52,345 我們的代碼,那麼, 其實非常簡單。 261 00:13:52,345 --> 00:13:59,490 如果我向下滾動過去所有這些 我們已經編程響應 262 00:13:59,490 --> 00:14:02,920 我們踏踏實實地我們主要的, 我們要初始化 263 00:14:02,920 --> 00:14:06,540 幾個不同的變量 做家政的一點點 264 00:14:06,540 --> 00:14:08,480 在開始。 265 00:14:08,480 --> 00:14:11,760 但後​​來有絕對的一組 ,你可以理解的代碼。 266 00:14:11,760 --> 00:14:15,820 一個大while循環,說我 一遍又一遍地重複這一點。 267 00:14:15,820 --> 00:14:20,420 我會讀成一排,我會 存儲在一個輸入字符串。 268 00:14:20,420 --> 00:14:23,880 我查一下,看看它的 特殊的關鍵字“再見”,這 269 00:14:23,880 --> 00:14:26,199 意味著退出程序。 270 00:14:26,199 --> 00:14:29,240 然後我會檢查,看看是否 有人只是在重複自己 271 00:14:29,240 --> 00:14:29,800 一遍又一遍。 272 00:14:29,800 --> 00:14:31,174 我會罵他們,如果他們這樣做。 273 00:14:31,174 --> 00:14:34,820 我會說“不要重複自己。” 274 00:14:34,820 --> 00:14:40,500 >> 只要這些都不發生,我們將 然後通過與環通掃描, 275 00:14:40,500 --> 00:14:45,330 上線308至313 在這裡,檢查,看看 276 00:14:45,330 --> 00:14:49,090 是任何這些關鍵字 包含在輸入短語 277 00:14:49,090 --> 00:14:50,620 我剛才是? 278 00:14:50,620 --> 00:14:54,845 如果有匹配對於他們來說,好 然後,我會記住的位置。 279 00:14:54,845 --> 00:14:57,050 我會記住的關鍵詞。 280 00:14:57,050 --> 00:14:58,620 而我就可以建立一個響應。 281 00:14:58,620 --> 00:15:03,150 >> 如果我沒有找到一個,那麼, 在我的關鍵字數組中的最後一件事 282 00:15:03,150 --> 00:15:08,070 將我的默認響應, 在沒有其他匹配。 283 00:15:08,070 --> 00:15:14,160 我會問這樣的問題:“你為什麼要 到這裡來?“或者”我怎麼幫你呢?“ 284 00:15:14,160 --> 00:15:19,710 這只是部分適當 不管輸入是什麼。 285 00:15:19,710 --> 00:15:22,580 >> 然後,我們將建立艾麗莎的回應。 286 00:15:22,580 --> 00:15:26,040 我們就可以採取 該基地的響應, 287 00:15:26,040 --> 00:15:28,370 就像我們做的是 “我的老闆”的例子。 288 00:15:28,370 --> 00:15:30,970 289 00:15:30,970 --> 00:15:33,990 如果這是所有有 is--如果它只有一個 290 00:15:33,990 --> 00:15:36,860 那我應該respond--字符串 我可以將它發送回來。 291 00:15:36,860 --> 00:15:40,610 如果它有一個星號,在 它的結束,然後我會 292 00:15:40,610 --> 00:15:45,710 在處理每個令牌 用戶的響應的其餘部分 293 00:15:45,710 --> 00:15:51,590 並添加那些,換出 一個字一個字,因為我需要。 294 00:15:51,590 --> 00:15:56,100 >> 所有這一切都是絕對 東西,你可以建立。 295 00:15:56,100 --> 00:15:59,230 而事實上,該方法,使我們 已經處理的命令行參數, 296 00:15:59,230 --> 00:16:03,570 在你的方式 通過HTTP請求處理 297 00:16:03,570 --> 00:16:05,510 遵循相同的種的規則。 298 00:16:05,510 --> 00:16:08,220 他們是模式匹配。 299 00:16:08,220 --> 00:16:15,170 >> 所以伊莉莎有一個比較重要的 對自然語言的影響 300 00:16:15,170 --> 00:16:21,620 因為它使人們看起來這是一個 很實現的目標,比如在某種程度上我們最好 301 00:16:21,620 --> 00:16:25,550 能夠直接解決這個問題。 302 00:16:25,550 --> 00:16:30,670 現在,這並不是說,ELIZA做 一切,我們願意這樣做。 303 00:16:30,670 --> 00:16:33,710 當然不是。 304 00:16:33,710 --> 00:16:35,660 但是,我們應該能 做更多的東西。 305 00:16:35,660 --> 00:16:38,280 306 00:16:38,280 --> 00:16:41,490 >> 我們的第一個步驟去 超越伊莉莎是怎麼回事 307 00:16:41,490 --> 00:16:44,840 要能看 沒有文字被輸入 308 00:16:44,840 --> 00:16:53,750 進鍵盤,但講話,實際 語音記錄到麥克風。 309 00:16:53,750 --> 00:16:56,880 因此,當我們看這些 不同的部分,我們 310 00:16:56,880 --> 00:17:00,304 將要建立一組模型。 311 00:17:00,304 --> 00:17:02,970 我們將必須能 從低級別的聲去 312 00:17:02,970 --> 00:17:07,180 information--間距, 振幅,frequency-- 313 00:17:07,180 --> 00:17:09,530 並轉換到這 一些單位,我們是 314 00:17:09,530 --> 00:17:14,619 能夠更容易地操縱 並且,最後,操控起來 315 00:17:14,619 --> 00:17:18,609 成單詞和句子。 316 00:17:18,609 --> 00:17:22,880 >> 因此,大多數語音識別 今天是在那裡系統 317 00:17:22,880 --> 00:17:26,069 按照統計 模型中,我們建立 318 00:17:26,069 --> 00:17:35,090 三個獨立的東西表示 該音頻信號實際上包含。 319 00:17:35,090 --> 00:17:38,640 我們先從一個語音模型 ,討論剛剛基地 320 00:17:38,640 --> 00:17:41,250 聲音,我生產。 321 00:17:41,250 --> 00:17:46,900 我是不是生產的東西是 一個B為男孩或D-如狗? 322 00:17:46,900 --> 00:17:53,220 我如何識別這些兩個不同 手機作為單獨的獨特? 323 00:17:53,220 --> 00:17:56,600 >> 最重要的是,我們會再建 一個字的發音模式, 324 00:17:56,600 --> 00:18:01,350 東西連接在一起 這些個人手機 325 00:18:01,350 --> 00:18:04,724 並把它們組合成一個字。 326 00:18:04,724 --> 00:18:07,890 在這之後,我們將採取的話 我們將它們組裝用語言 327 00:18:07,890 --> 00:18:13,010 模擬成一個完整的句子。 328 00:18:13,010 --> 00:18:17,230 >> 現在,我們要談談每個 這些獨立和分開。 329 00:18:17,230 --> 00:18:21,580 但是,這三款車型都是 只是要統計。 330 00:18:21,580 --> 00:18:23,502 這意味著,當我們 與他們合作,我們將 331 00:18:23,502 --> 00:18:25,376 能夠一起工作 他們都同時進行。 332 00:18:25,376 --> 00:18:28,100 333 00:18:28,100 --> 00:18:28,600 好的。 334 00:18:28,600 --> 00:18:30,890 讓我們先從我們的語音模型。 335 00:18:30,890 --> 00:18:34,470 因此,語音模型依賴於 一個計算技術 336 00:18:34,470 --> 00:18:37,320 叫隱馬爾可夫模型。 337 00:18:37,320 --> 00:18:43,050 這些都是圖形化的模型中,我 已經和認識世界的一個狀態 338 00:18:43,050 --> 00:18:46,500 作為其特徵 由一組特徵。 339 00:18:46,500 --> 00:18:51,960 而這種狀態描述一個組成部分 那我從事的行動。 340 00:18:51,960 --> 00:19:00,190 >> 所以,如果我想製作 聲音“馬”像媽媽, 341 00:19:00,190 --> 00:19:03,970 有不同 組件的聲音。 342 00:19:03,970 --> 00:19:07,230 還有就是我畫的氣息的一部分。 343 00:19:07,230 --> 00:19:09,560 然後,我的錢包我的嘴唇。 344 00:19:09,560 --> 00:19:13,710 而我搖我的嘴唇退後一點 位,以使這一“馬”的聲音。 345 00:19:13,710 --> 00:19:15,340 然後還有一個版本。 346 00:19:15,340 --> 00:19:17,020 我的嘴唇裂開。 347 00:19:17,020 --> 00:19:19,030 空氣被排出。 348 00:19:19,030 --> 00:19:22,650 “馬”。 349 00:19:22,650 --> 00:19:29,250 >> 這三個不同的部分會 各國在這個graph--代表 350 00:19:29,250 --> 00:19:33,420 開始時,中間和結束。 351 00:19:33,420 --> 00:19:38,060 我將有過渡的 讓我從一個國家旅行 352 00:19:38,060 --> 00:19:42,260 到下一個與一定的概率。 353 00:19:42,260 --> 00:19:47,250 因此,舉例來說,是m 聽起來可能有一個非常, 354 00:19:47,250 --> 00:19:51,850 很短的攝入量​​在beginning-- “毫米” - 然後較長, 355 00:19:51,850 --> 00:19:55,640 振動階段時,我抱著我 雙唇幾乎humming-- 356 00:19:55,640 --> 00:20:05,090 “MMMM” - 然後在很短的 爆破音,我驅逐breath--“馬”。 357 00:20:05,090 --> 00:20:09,370 >> 的隱馬爾可夫模型是 用來捕捉的事實 358 00:20:09,370 --> 00:20:13,340 這是我做的方式 聲音“馬”是怎麼回事 359 00:20:13,340 --> 00:20:17,350 是在略微不同的 其定時,是頻率, 360 00:20:17,350 --> 00:20:21,030 其功能比 您所做的方式 361 00:20:21,030 --> 00:20:23,300 或辦法,我可能 讓我說話的時候 362 00:20:23,300 --> 00:20:26,030 對不同用途的信。 363 00:20:26,030 --> 00:20:33,240 “母親”和“我可以”將 聲音略有不同。 364 00:20:33,240 --> 00:20:36,800 >> 因此,為了識別 特定的聲音,我們會 365 00:20:36,800 --> 00:20:42,020 建立馬爾可夫模型,這些隱馬爾可夫 每一個可能的手機型號,我 366 00:20:42,020 --> 00:20:45,840 可能要承認, 每一個可能的聲音, 367 00:20:45,840 --> 00:20:49,750 再看看 聲學數據,我有 368 00:20:49,750 --> 00:20:54,430 並確定統計學 哪一個是最有可能的 369 00:20:54,430 --> 00:20:58,110 已經產生這種聲音。 370 00:20:58,110 --> 00:20:58,610 確定。 371 00:20:58,610 --> 00:21:01,540 372 00:21:01,540 --> 00:21:06,750 通過這種模式,我們再 開始建立在它之上。 373 00:21:06,750 --> 00:21:09,330 我們採取的發音模式。 374 00:21:09,330 --> 00:21:11,790 現在,有時發音 模型既簡單又容易 375 00:21:11,790 --> 00:21:14,440 因為只有一個 這樣發音的東西。 376 00:21:14,440 --> 00:21:17,990 其他時候,他們是一個 稍微複雜一些。 377 00:21:17,990 --> 00:21:21,340 這裡有一個發音指南 對於紅色的東西就是 378 00:21:21,340 --> 00:21:25,210 您所做的番茄醬出來的水果。 379 00:21:25,210 --> 00:21:27,360 人們不認為這是一個水果。 380 00:21:27,360 --> 00:21:27,860 對嗎? 381 00:21:27,860 --> 00:21:30,880 382 00:21:30,880 --> 00:21:35,300 >> 現在,有許多不同的方式 人們會念這個字。 383 00:21:35,300 --> 00:21:37,780 有些人會說“腳趾5腳趾。” 384 00:21:37,780 --> 00:21:40,880 有些人會說“腳趾麻將腳趾。” 385 00:21:40,880 --> 00:21:44,800 我們可以捕捉與 這些圖形化的車型之一 386 00:21:44,800 --> 00:21:48,305 在這裡,我們再次表示過渡 作為具有一定概率 387 00:21:48,305 --> 00:21:51,360 和相關的概率他們。 388 00:21:51,360 --> 00:21:58,290 >> 所以在這種情況下,如果我是跟隨 通過這整個圖上的路線, 389 00:21:58,290 --> 00:22:03,330 我將開始在信 在最左邊的“TA”的聲音。 390 00:22:03,330 --> 00:22:07,570 我想藉此上半部分, 的“哦”,然後是“馬” 391 00:22:07,570 --> 00:22:14,530 然後一個“a”,然後一個 “TA”和“哦。” “腳趾可能腳趾。” 392 00:22:14,530 --> 00:22:19,610 如果我通過了底部路徑 這一點,我會得到“TA-MAH-腳趾。” 393 00:22:19,610 --> 00:22:26,810 如果我去了,然後 起來,我會得到“TA-MAY-腳趾。” 394 00:22:26,810 --> 00:22:29,950 >> 這些模型捕捉這些 差異,因為每當 395 00:22:29,950 --> 00:22:32,410 我們部署的其中之一 識別系統, 396 00:22:32,410 --> 00:22:35,340 這將有工作 許多不同類型的人, 397 00:22:35,340 --> 00:22:39,295 許多不同的口音,甚至 不同用途的同樣的話。 398 00:22:39,295 --> 00:22:42,204 399 00:22:42,204 --> 00:22:44,120 最後,最重要的是, 我們要建立的東西 400 00:22:44,120 --> 00:22:48,780 看起來非常複雜, 稱為語言模型, 401 00:22:48,780 --> 00:22:52,950 但實際上是最簡單的 三,因為這些操作 402 00:22:52,950 --> 00:22:56,041 關於所謂的正克模型。 403 00:22:56,041 --> 00:23:02,270 在這種情況下,我向你展示 一個兩部分的正克模型,一個兩字組。 404 00:23:02,270 --> 00:23:08,910 我們將做出實際的想法 有時,某些詞 405 00:23:08,910 --> 00:23:14,680 更可能跟隨一個 給定的字比其他人。 406 00:23:14,680 --> 00:23:25,210 如果我剛才說的“天氣預報” 下一個字可以“今天”很可能是 407 00:23:25,210 --> 00:23:31,510 或可以是“天氣 預計明天。“ 408 00:23:31,510 --> 00:23:38,870 但它不太可能是“ 天氣預報朝鮮薊。“ 409 00:23:38,870 --> 00:23:42,980 >> 什麼是語言模型所做的是 它捕捉那些統計學 410 00:23:42,980 --> 00:23:47,450 通過計算,從一些非常大的 文集,所有實例的 411 00:23:47,450 --> 00:23:50,890 其中一個詞接踵而來。 412 00:23:50,890 --> 00:23:54,300 所以,如果我把一個大corpus-- 像每一個華爾街日報 413 00:23:54,300 --> 00:24:00,750 自1930年以來,已產生的 這是標準的corpuses--之一 414 00:24:00,750 --> 00:24:03,910 我期待通過所有 該文本,和我算 415 00:24:03,910 --> 00:24:09,770 經過長達多少次 “預測”我看“今日” 416 00:24:09,770 --> 00:24:17,454 多少次我看到 “預測”,其次是“朝鮮薊” 417 00:24:17,454 --> 00:24:19,370 第一個是將 要更容易。 418 00:24:19,370 --> 00:24:21,540 這將出現 更為頻繁。 419 00:24:21,540 --> 00:24:24,610 因此,這將有一個更高的 與它的概率有關。 420 00:24:24,610 --> 00:24:27,340 >> 如果我想弄清楚的 概率整個話語的, 421 00:24:27,340 --> 00:24:29,940 然後,我就打破它。 422 00:24:29,940 --> 00:24:35,990 所以,聽證會的可能性 該句中的“老鼠吃奶酪” 423 00:24:35,990 --> 00:24:39,110 是這個詞的概率 “中的”開始一個句子, 424 00:24:39,110 --> 00:24:42,540 然後將概率的 詞“鼠”後面的單詞“the” 425 00:24:42,540 --> 00:24:44,910 的概率與所述 詞“吃”跟隨“老鼠” 426 00:24:44,910 --> 00:24:51,120 的概率與 “奶酪”跟隨“吃了。” 427 00:24:51,120 --> 00:24:55,160 >> 這聽起來像一個不少 統計,很多概率。 428 00:24:55,160 --> 00:24:57,510 而這一切,它是。 429 00:24:57,510 --> 00:25:02,920 但令人驚奇的是,如果你這樣做 與數據的一個足夠大的樣品, 430 00:25:02,920 --> 00:25:03,670 它的工作原理。 431 00:25:03,670 --> 00:25:05,250 和它的作品極其良好。 432 00:25:05,250 --> 00:25:07,810 433 00:25:07,810 --> 00:25:11,420 我們都知道這些技術。 434 00:25:11,420 --> 00:25:16,500 大多數操作系統附帶 語音識別在這一點上。 435 00:25:16,500 --> 00:25:20,940 我們使用的Siri和柯塔娜和迴聲。 436 00:25:20,940 --> 00:25:25,070 而這些東西都是基於 這種類型的三層的型號 - 437 00:25:25,070 --> 00:25:30,620 在底部,一個一個語音模型 發音模型在中間, 438 00:25:30,620 --> 00:25:33,690 並在它們的頂部一個語言模型。 439 00:25:33,690 --> 00:25:37,630 >> 現在,他們需要做一點點 比,為了回答問題。 440 00:25:37,630 --> 00:25:43,000 但是,承認你在做什麼 確切地說取決於這一點。 441 00:25:43,000 --> 00:25:45,700 因此,讓我們舉一個例子在這裡。 442 00:25:45,700 --> 00:25:52,020 所以,我有我的手機坐在這兒 文件攝像機下方。 443 00:25:52,020 --> 00:25:56,110 而我們要問 SIRI幾個問題。 444 00:25:56,110 --> 00:25:57,150 好嗎? 445 00:25:57,150 --> 00:25:59,940 >> 因此,讓我們在這裡醒來我的電話。 446 00:25:59,940 --> 00:26:02,710 447 00:26:02,710 --> 00:26:05,000 Siri的,什麼是天氣 像在紐黑文今天? 448 00:26:05,000 --> 00:26:07,670 449 00:26:07,670 --> 00:26:10,780 >> SIRI:這裡的天氣 紐黑文,今天康涅狄格。 450 00:26:10,780 --> 00:26:11,890 >> BRIAN SCASSELLATI:OK。 451 00:26:11,890 --> 00:26:16,720 所以,首先你看到Siri的識別 每個單獨字 452 00:26:16,720 --> 00:26:19,050 然後產生的響應。 453 00:26:19,050 --> 00:26:22,277 我們將討論如何這種反應 來約在一點點。 454 00:26:22,277 --> 00:26:24,110 但是現在我們知道 這僅僅是基礎 455 00:26:24,110 --> 00:26:28,880 對原始數據和這 模式匹配類型的方法, 456 00:26:28,880 --> 00:26:31,120 我們可以玩一些遊戲的Siri。 457 00:26:31,120 --> 00:26:34,560 >> 因此,我可以再試一次。 458 00:26:34,560 --> 00:26:38,864 Siri的,什麼是天氣 河馬紐黑文,今天? 459 00:26:38,864 --> 00:26:39,810 >> SIRI:OK。 460 00:26:39,810 --> 00:26:44,245 這裡的天氣新 紐黑文,康涅狄格今天。 461 00:26:44,245 --> 00:26:46,120 BRIAN SCASSELLATI:Siri的 不是由該氣餒 462 00:26:46,120 --> 00:26:50,980 因為它找到了pattern-- “天氣”,“今天”,“紐黑文。” 463 00:26:50,980 --> 00:26:54,420 這就是它的響應 到,就像伊莉莎。 464 00:26:54,420 --> 00:26:54,920 好的。 465 00:26:54,920 --> 00:26:59,390 讓我們給它一次甚至 更可笑的例子。 466 00:26:59,390 --> 00:27:03,075 Siri的,天氣朝鮮薊 犰狳河馬紐黑文? 467 00:27:03,075 --> 00:27:06,806 468 00:27:06,806 --> 00:27:08,400 >> SIRI:讓我看看這一點。 469 00:27:08,400 --> 00:27:11,280 下面是我在網上找到 什麼是朝鮮薊犰狳 470 00:27:11,280 --> 00:27:13,780 河馬紐黑文。 471 00:27:13,780 --> 00:27:14,760 >> BRIAN SCASSELLATI:OK。 472 00:27:14,760 --> 00:27:20,400 所以,如果我走的不夠遠 遠離該模型中, 473 00:27:20,400 --> 00:27:24,365 我可以,因為它混淆了沒有 長匹配它有圖案。 474 00:27:24,365 --> 00:27:27,370 475 00:27:27,370 --> 00:27:29,390 這統計 引擎在說, 476 00:27:29,390 --> 00:27:32,850 那是什麼,你已經得到了可能性 的話河馬和朝鮮薊 477 00:27:32,850 --> 00:27:34,440 在一起,犰狳? 478 00:27:34,440 --> 00:27:36,050 那一定是新的東西。 479 00:27:36,050 --> 00:27:38,840 480 00:27:38,840 --> 00:27:40,610 >> 因此,這些技術,我們每天都在使用。 481 00:27:40,610 --> 00:27:43,670 482 00:27:43,670 --> 00:27:47,800 如果我們想帶他們一步 進一步的,不過,如果我們真的 483 00:27:47,800 --> 00:27:53,930 希望能夠談論什麼 的是,這些系統作出反應,進行 484 00:27:53,930 --> 00:28:00,630 我們要談談,再次,關於 更根本的一系列問題。 485 00:28:00,630 --> 00:28:05,370 這就是在溝通的話題 我們稱之為問答。 486 00:28:05,370 --> 00:28:07,028 也就是說,我們希望能夠用於:是嗎? 487 00:28:07,028 --> 00:28:07,944 聽眾:[聽不清]。 488 00:28:07,944 --> 00:28:10,789 489 00:28:10,789 --> 00:28:13,330 BRIAN SCASSELLATI:我們得到 到潛在語義處理? 490 00:28:13,330 --> 00:28:14,070 所以,是的。 491 00:28:14,070 --> 00:28:17,820 有很多東西都是 發生與Siri的表面下 492 00:28:17,820 --> 00:28:20,210 並且在一些例子 我要告訴你下一個 493 00:28:20,210 --> 00:28:22,610 其中,有相當多的 在結構方面 494 00:28:22,610 --> 00:28:25,260 你在說什麼這很重要。 495 00:28:25,260 --> 00:28:31,890 而且,事實上,這是一個偉大 前體下一張幻燈片我。 496 00:28:31,890 --> 00:28:35,110 >> 因此,在同樣的方式,我們的 語音識別就建立起來了 497 00:28:35,110 --> 00:28:39,620 多層,如果我們想 了解它是什麼,實際上 498 00:28:39,620 --> 00:28:44,620 雖這麼說,我們要再次 依靠多層分析 499 00:28:44,620 --> 00:28:47,020 這正在被識別的文本。 500 00:28:47,020 --> 00:28:52,560 因此,當Siri的其實是能 說,看,我發現這句話。 501 00:28:52,560 --> 00:28:55,230 現在我該怎麼處理它們呢? 502 00:28:55,230 --> 00:28:59,110 第一組分往往是 經歷並嘗試分析 503 00:28:59,110 --> 00:29:03,010 句子的結構。 504 00:29:03,010 --> 00:29:05,410 而在我們所看到的 上小學的時候,往往, 505 00:29:05,410 --> 00:29:08,920 作為排序圖表的 句子,我們要 506 00:29:08,920 --> 00:29:12,774 要認識到某些 詞有一定的作用。 507 00:29:12,774 --> 00:29:13,440 這些都是名詞。 508 00:29:13,440 --> 00:29:14,231 這些都是代詞。 509 00:29:14,231 --> 00:29:16,200 這些都是動詞。 510 00:29:16,200 --> 00:29:19,460 而且我們要承認 對於特定的語法, 511 00:29:19,460 --> 00:29:24,700 在這種情況下英語語法,有 ,我可以將它們結合起來的有效途徑 512 00:29:24,700 --> 00:29:26,280 和無效的其他方式。 513 00:29:26,280 --> 00:29:29,920 514 00:29:29,920 --> 00:29:33,870 >> 這一認識,即結構, 可能足以幫助指導我們 515 00:29:33,870 --> 00:29:36,720 一點點。 516 00:29:36,720 --> 00:29:39,820 但是,這還遠遠不夠 為我們能夠給 517 00:29:39,820 --> 00:29:43,290 任何意義,什麼正在這裡說。 518 00:29:43,290 --> 00:29:46,615 為了做到這一點,我們必須依靠 一定量的語義處理。 519 00:29:46,615 --> 00:29:49,590 520 00:29:49,590 --> 00:29:55,080 也就是說,我們要來看看 在下方各有什麼這些詞 521 00:29:55,080 --> 00:29:57,400 實際上承載的意義。 522 00:29:57,400 --> 00:30:01,150 並且在這樣做的簡單的方法, 我們將每個單詞聯繫起來 523 00:30:01,150 --> 00:30:06,930 我們知道一個特定的功能, 一定改造,它 524 00:30:06,930 --> 00:30:09,300 允許發生。 525 00:30:09,300 --> 00:30:14,470 >> 在這種情況下,我們可能會標記 單詞“約翰”作為一個專有名詞, 526 00:30:14,470 --> 00:30:18,160 它承載著一個身份。 527 00:30:18,160 --> 00:30:21,530 我們可能標識 “瑪麗”為相同的方式。 528 00:30:21,530 --> 00:30:27,900 而像“愛”,一個動詞, 構成了一個特殊的關係 529 00:30:27,900 --> 00:30:31,582 我們能夠代表。 530 00:30:31,582 --> 00:30:33,290 現在,這並不意味著 我們明白 531 00:30:33,290 --> 00:30:37,680 什麼是愛,但只有我們明白 它在一個象徵性的系統的方法。 532 00:30:37,680 --> 00:30:40,480 也就是說,我們可以標記 它和操作它。 533 00:30:40,480 --> 00:30:44,230 534 00:30:44,230 --> 00:30:49,120 >> 與這些類型的方法的, 任何類型的語義處理 535 00:30:49,120 --> 00:30:57,060 這裡將需要一點點 知識位和大量的工作 536 00:30:57,060 --> 00:30:59,020 我們的一部分。 537 00:30:59,020 --> 00:31:03,590 我們不再領域 在這裡只是簡單的統計數據 538 00:31:03,590 --> 00:31:07,320 將要足夠我們。 539 00:31:07,320 --> 00:31:11,330 現在,為了去 從這個角度來被 540 00:31:11,330 --> 00:31:15,520 能夠談論的內 什麼實際發生在這裡, 541 00:31:15,520 --> 00:31:19,640 以能夠操縱這個 構建和理解的問題 542 00:31:19,640 --> 00:31:23,160 然後能夠 走出去,尋找, 543 00:31:23,160 --> 00:31:27,290 這需要更 複雜的認知模式。 544 00:31:27,290 --> 00:31:34,880 >> 在這些系統的構建方式 是在大多數情況下非常非常勞動 545 00:31:34,880 --> 00:31:36,350 密集的。 546 00:31:36,350 --> 00:31:39,490 它們涉及人類 花費了大量 547 00:31:39,490 --> 00:31:44,100 時間構建的方式 這些類型的句子 548 00:31:44,100 --> 00:31:47,270 可以在一些邏輯表示。 549 00:31:47,270 --> 00:31:51,639 550 00:31:51,639 --> 00:31:53,430 它會變得有點 更複雜的,雖然。 551 00:31:53,430 --> 00:31:56,400 552 00:31:56,400 --> 00:31:59,660 >> 甚至有一次,我們已經處理 與語義,我們將 553 00:31:59,660 --> 00:32:03,860 還是得看 對什麼東西被說語。 554 00:32:03,860 --> 00:32:08,620 也就是說,我該如何關聯的話 我有一些身體上出 555 00:32:08,620 --> 00:32:12,054 在全球或有 至少一些信息源 556 00:32:12,054 --> 00:32:12,970 我可以操縱? 557 00:32:12,970 --> 00:32:15,780 558 00:32:15,780 --> 00:32:20,790 >> 有時,這些導致 精彩的比特模糊性。 559 00:32:20,790 --> 00:32:24,470 “紅得發紫的明星結婚天文學家。” 560 00:32:24,470 --> 00:32:25,630 確定。 561 00:32:25,630 --> 00:32:28,540 現在,我們看到的 搞笑類型的標題的 562 00:32:28,540 --> 00:32:34,690 我們會在深夜的電視看 因為我們不理解的“明星” 563 00:32:34,690 --> 00:32:38,630 有它的天體的含義。 564 00:32:38,630 --> 00:32:43,390 我們知道,這意味著更多的 司空見慣的演員或女演員 565 00:32:43,390 --> 00:32:45,240 有大量的知名度。 566 00:32:45,240 --> 00:32:47,770 567 00:32:47,770 --> 00:32:51,950 >> “隊幫助狗咬傷的受害者。” 568 00:32:51,950 --> 00:32:55,550 難道球隊實際上是 在那裡協助狗 569 00:32:55,550 --> 00:32:59,620 在繞來繞去又咬受害者? 570 00:32:59,620 --> 00:33:02,380 抑或是有 個人誰是 571 00:33:02,380 --> 00:33:04,625 咬傷誰需要一些幫助一隻狗? 572 00:33:04,625 --> 00:33:07,650 573 00:33:07,650 --> 00:33:11,480 單從看語法 和句子的語義, 574 00:33:11,480 --> 00:33:14,660 我們無法確定。 575 00:33:14,660 --> 00:33:22,000 >> “直升機人類蒼蠅供電。” 576 00:33:22,000 --> 00:33:27,330 在那裡,事實上,實際 周圍飛小事 577 00:33:27,330 --> 00:33:34,510 是人的翅膀供電 直升機為人類的好? 578 00:33:34,510 --> 00:33:38,960 或者是有一個機械裝置 從一個人獲得它的權力? 579 00:33:38,960 --> 00:33:41,600 580 00:33:41,600 --> 00:33:46,500 >> 當我們在看問題 應答系統, 581 00:33:46,500 --> 00:33:51,110 這些是圖層 我們需要處理。 582 00:33:51,110 --> 00:33:54,890 現在,最好的和最排序 的普遍的這些系統的 583 00:33:54,890 --> 00:34:00,640 今天都能夠做到 事情在一個水平,是 584 00:34:00,640 --> 00:34:05,050 遠遠超出了我們有10年前。 585 00:34:05,050 --> 00:34:08,210 這裡是最好的系統之一 這是有今天。 586 00:34:08,210 --> 00:34:10,519 而這是一個系統 來自IBM稱為沃森。 587 00:34:10,519 --> 00:34:13,040 588 00:34:13,040 --> 00:34:15,500 這是我們的朋友在IBM。 589 00:34:15,500 --> 00:34:19,810 這是凱瑟琳銀行,甲辰, 和百基拉賴斯給我們 590 00:34:19,810 --> 00:34:26,323 沃森的演示 昨天在IBM約克。 591 00:34:26,323 --> 00:34:26,989 [視頻回放] 592 00:34:26,989 --> 00:34:27,690 - 如何是你? 593 00:34:27,690 --> 00:34:30,600 594 00:34:30,600 --> 00:34:31,980 >> - 我是很好。 595 00:34:31,980 --> 00:34:35,429 我的時候,我總是很高興 想,特別是當我 596 00:34:35,429 --> 00:34:38,920 可以保持冷靜在這些服務器機房。 597 00:34:38,920 --> 00:34:40,170 - 誰是你最喜歡的女演員? 598 00:34:40,170 --> 00:34:43,870 599 00:34:43,870 --> 00:34:47,555 >> - 我最喜愛的女主角 安吉麗娜·朱莉的勞拉·克勞馥 600 00:34:47,555 --> 00:34:54,800 在古墓麗影因為她的原 形式是為像我這樣的一個虛擬人物。 601 00:34:54,800 --> 00:34:56,760 >> - 如何能沃森幫助患者? 602 00:34:56,760 --> 00:34:59,700 603 00:34:59,700 --> 00:35:03,755 >> -is計劃為病人 有機會獲得直接沃森? 604 00:35:03,755 --> 00:35:08,050 訪問沃森諮詢 應用程序將通過使用情況而有所不同。 605 00:35:08,050 --> 00:35:12,630 但目前,屈臣氏將只提供 可能的診斷和治療 606 00:35:12,630 --> 00:35:14,725 選擇醫學專業。 607 00:35:14,725 --> 00:35:17,680 在適當情況下,患者 可以提供信息 608 00:35:17,680 --> 00:35:21,210 華生,也許是通過一個 門戶網站界面,平板電腦, 609 00:35:21,210 --> 00:35:23,500 甚至移動電話。 610 00:35:23,500 --> 00:35:27,180 例如,一個患者可能 要求描述自己的症狀 611 00:35:27,180 --> 00:35:30,460 在自然語言直接 到沃森的解決方案, 612 00:35:30,460 --> 00:35:34,050 允許醫師將重點放在 診斷和不採集數據。 613 00:35:34,050 --> 00:35:38,379 614 00:35:38,379 --> 00:35:42,716 >> - 誰暗殺了林肯? 615 00:35:42,716 --> 00:35:46,153 >> 約翰威爾克斯布斯。 616 00:35:46,153 --> 00:35:52,373 >> - 在哪一年做了亞利桑那州 響尾蛇贏得世界大賽? 617 00:35:52,373 --> 00:35:55,295 >> -2001。 618 00:35:55,295 --> 00:35:58,710 >> [結束播放] 619 00:35:58,710 --> 00:36:01,610 >> BRIAN SCASSELLATI:所以 這些類型的系統 620 00:36:01,610 --> 00:36:07,430 必須依靠首先 認識到講話;第二, 621 00:36:07,430 --> 00:36:12,200 將其轉換成有意義的內部 表示;然後,第三, 622 00:36:12,200 --> 00:36:17,090 能夠走出去,找到 信息源 623 00:36:17,090 --> 00:36:21,140 使他們能夠回答這個問題。 624 00:36:21,140 --> 00:36:27,320 這種複雜程度涉及 同類型的編程事 625 00:36:27,320 --> 00:36:31,790 你一直 在做習題集。 626 00:36:31,790 --> 00:36:38,000 >> 我們能夠解析HTTP請求, 相同類型的低級別的圖案的 627 00:36:38,000 --> 00:36:40,810 匹配伊麗莎可以做。 628 00:36:40,810 --> 00:36:45,070 我們能夠將這些 為內部表示, 629 00:36:45,070 --> 00:36:50,360 然後用它們來查詢一些 外部數據庫,可能使用SQL。 630 00:36:50,360 --> 00:36:53,530 631 00:36:53,530 --> 00:36:56,260 所有系統的那 今天正在建造 632 00:36:56,260 --> 00:37:00,520 做這種類型的天然 語言交流 633 00:37:00,520 --> 00:37:04,100 在正在興建 這些相同的原則。 634 00:37:04,100 --> 00:37:09,530 >> 現在,即使是像系統 沃森是不是很複雜 635 00:37:09,530 --> 00:37:14,820 到能夠回答任意 任何主題的問題。 636 00:37:14,820 --> 00:37:20,060 而事實上,他們必須 給定域中的結構。 637 00:37:20,060 --> 00:37:24,440 所以,你可以到網上,你可以找到 該操作好沃森版本 638 00:37:24,440 --> 00:37:27,700 中醫學信息。 639 00:37:27,700 --> 00:37:31,490 或者有一個在線 只是涉及如何 640 00:37:31,490 --> 00:37:34,540 要做出好的建議 什麼樣的啤酒將與哪些食物去了。 641 00:37:34,540 --> 00:37:37,060 642 00:37:37,060 --> 00:37:41,870 而這些領域內, 它可以回答問題, 643 00:37:41,870 --> 00:37:46,130 發現它所需要的信息。 644 00:37:46,130 --> 00:37:48,270 >> 但你不能混用和匹配。 645 00:37:48,270 --> 00:37:53,150 這就是被訓練的系統 食品和啤酒的數據庫 646 00:37:53,150 --> 00:37:56,830 不突然,當你工作得很好 把它與醫學信息 647 00:37:56,830 --> 00:37:59,770 數據庫。 648 00:37:59,770 --> 00:38:05,680 因此,即使我們今天的最佳系統 依靠處理的水平 649 00:38:05,680 --> 00:38:11,570 在我們的手編 為了建設中的基礎設施建設 650 00:38:11,570 --> 00:38:13,275 使這個系統的運行。 651 00:38:13,275 --> 00:38:16,360 652 00:38:16,360 --> 00:38:20,710 >> 現在,最後一個話題我想 到能夠得到今天 653 00:38:20,710 --> 00:38:23,960 是關於非語言溝通。 654 00:38:23,960 --> 00:38:29,290 一個偉大的信息質量的 我們彼此通信 655 00:38:29,290 --> 00:38:35,490 通過不來約 我們正在申請個別單詞。 656 00:38:35,490 --> 00:38:40,290 它做了這些東西, 接近,目光,你的語氣, 657 00:38:40,290 --> 00:38:42,270 您的拐點。 658 00:38:42,270 --> 00:38:46,620 而溝通也 這是很多不同的接口 659 00:38:46,620 --> 00:38:49,960 關心一個偉大的交易。 660 00:38:49,960 --> 00:38:51,500 這不是什麼Siri的關心。 661 00:38:51,500 --> 00:38:56,250 我可以問Siri的東西用一個聲音 或語音不同的音調, 662 00:38:56,250 --> 00:38:59,840 和Siri的打算 給我相同的答案。 663 00:38:59,840 --> 00:39:05,260 但是,這不是我們構建 許多其他類型的接口。 664 00:39:05,260 --> 00:39:09,120 >> 我想向您介紹 現在到機器人中的一個。 665 00:39:09,120 --> 00:39:12,720 這是我的長期建 朋友和同事辛西婭 666 00:39:12,720 --> 00:39:16,010 Breazeal和她的公司基博。 667 00:39:16,010 --> 00:39:20,090 這robot--我們要去 有一對夫婦的志願者 668 00:39:20,090 --> 00:39:22,520 拿出與此交互。 669 00:39:22,520 --> 00:39:26,200 所以我可以有兩個人願意 與機器人給我玩嗎? 670 00:39:26,200 --> 00:39:29,936 你為什麼不上來吧, 為什麼你不來就到了。 671 00:39:29,936 --> 00:39:31,310 如果你想和我一起在這裡,請。 672 00:39:31,310 --> 00:39:36,520 673 00:39:36,520 --> 00:39:39,670 >> 如果我能有你 來的權利在這裡。 674 00:39:39,670 --> 00:39:40,170 謝謝。 675 00:39:40,170 --> 00:39:40,480 你好。 676 00:39:40,480 --> 00:39:41,400 >> ALFREDO:很高興見到你。 677 00:39:41,400 --> 00:39:42,010 阿爾弗雷多。 678 00:39:42,010 --> 00:39:42,520 >> BRIAN SCASSELLATI:阿爾弗雷多。 679 00:39:42,520 --> 00:39:43,146 >> 瑞秋:瑞秋。 680 00:39:43,146 --> 00:39:44,228 BRIAN SCASSELLATI:雷切爾。 681 00:39:44,228 --> 00:39:45,154 很高興見到你們倆。 682 00:39:45,154 --> 00:39:46,820 阿爾弗雷多,我要你先走。 683 00:39:46,820 --> 00:39:47,990 快來權在這裡。 684 00:39:47,990 --> 00:39:51,870 我要介紹 你 - 如果我能得到這一關 685 00:39:51,870 --> 00:39:58,450 不敲門的microphone-- 一個叫基博的小機器人。 686 00:39:58,450 --> 00:40:00,140 OK? 687 00:40:00,140 --> 00:40:04,260 >> 現在,基博被設計為互動。 688 00:40:04,260 --> 00:40:09,339 雖然它可以給你講話, 多與機器人的相互作用的 689 00:40:09,339 --> 00:40:09,880 就是非語言。 690 00:40:09,880 --> 00:40:12,450 691 00:40:12,450 --> 00:40:17,070 阿爾弗雷多,我要問你 好好說話和免費 692 00:40:17,070 --> 00:40:19,554 給機器人,請。 693 00:40:19,554 --> 00:40:20,845 ALFREDO:我覺得你看起來很可愛。 694 00:40:20,845 --> 00:40:24,114 695 00:40:24,114 --> 00:40:25,611 >> [呼呼的聲音] 696 00:40:25,611 --> 00:40:26,192 697 00:40:26,192 --> 00:40:27,108 BRIAN SCASSELLATI:OK。 698 00:40:27,108 --> 00:40:30,110 699 00:40:30,110 --> 00:40:33,180 它的反應並不言語。 700 00:40:33,180 --> 00:40:35,180 然而,它給了你們兩個 明確承認 701 00:40:35,180 --> 00:40:39,680 它聽到你說的話 也不知怎麼理解。 702 00:40:39,680 --> 00:40:40,530 OK? 703 00:40:40,530 --> 00:40:42,070 步驟右後衛位置一秒鐘。 704 00:40:42,070 --> 00:40:43,130 謝謝。 705 00:40:43,130 --> 00:40:44,090 >> 瑞秋,如果你會的。 706 00:40:44,090 --> 00:40:46,070 現在,我想給 你更難就業。 707 00:40:46,070 --> 00:40:48,361 如果你站在這裡, 備份只是有那麼一點點 708 00:40:48,361 --> 00:40:50,280 我們可以幫你的相機 看看這種方式。 709 00:40:50,280 --> 00:40:56,840 我要問你說些什麼 真的是和討厭的機器人。 710 00:40:56,840 --> 00:41:02,900 >> 你才似乎什麼 做的是完全荒謬的。 711 00:41:02,900 --> 00:41:03,840 >> [嗡嗡聲] 712 00:41:03,840 --> 00:41:07,610 713 00:41:07,610 --> 00:41:09,030 >> 這更是荒謬。 714 00:41:09,030 --> 00:41:10,120 這是怎麼回事呀? 715 00:41:10,120 --> 00:41:13,487 716 00:41:13,487 --> 00:41:16,207 噢,不心疼。 717 00:41:16,207 --> 00:41:17,040 我給你一個擁抱。 718 00:41:17,040 --> 00:41:19,882 719 00:41:19,882 --> 00:41:21,090 BRIAN SCASSELLATI:好吧。 720 00:41:21,090 --> 00:41:22,280 謝謝,雷切爾。 721 00:41:22,280 --> 00:41:24,565 阿爾弗雷多,雷切爾,謝謝你們非常多。 722 00:41:24,565 --> 00:41:26,840 >> [掌聲] 723 00:41:26,840 --> 00:41:28,660 724 00:41:28,660 --> 00:41:34,470 >> 因此,這種互動在 許多方面的一些相同的規則 725 00:41:34,470 --> 00:41:36,950 和一些相同 結構我們 726 00:41:36,950 --> 00:41:39,950 可能有語言交流。 727 00:41:39,950 --> 00:41:44,530 它既是交際和 提供一個重要目的。 728 00:41:44,530 --> 00:41:48,590 而這種互動,在 方法很多,設計 729 00:41:48,590 --> 00:41:52,890 有對特定的效果 與人交互或聽 730 00:41:52,890 --> 00:41:54,410 到機器人。 731 00:41:54,410 --> 00:41:56,450 >> 現在,我很幸運 有吉波今天在這裡。 732 00:41:56,450 --> 00:42:00,550 薩姆·斯波爾丁是在這裡幫助 我們用機器人。 733 00:42:00,550 --> 00:42:07,470 而我要問薩姆給 吉波跳舞我們一個很好的演示 734 00:42:07,470 --> 00:42:09,720 我們可以在年底看這裡。 735 00:42:09,720 --> 00:42:10,590 因此,繼續前進,基博。 736 00:42:10,590 --> 00:42:11,550 >> SAM:OK,基博。 737 00:42:11,550 --> 00:42:14,430 向我們展示你的舞蹈動作。 738 00:42:14,430 --> 00:42:17,310 >> [音樂播放] 739 00:42:17,310 --> 00:42:43,114 740 00:42:43,114 --> 00:42:44,780 BRIAN SCASSELLATI:好,大家好。 741 00:42:44,780 --> 00:42:46,865 感謝我們的朋友在基博。 742 00:42:46,865 --> 00:42:49,426 >> [掌聲] 743 00:42:49,426 --> 00:42:50,140 744 00:42:50,140 --> 00:42:54,990 >> 並感謝我們的朋友 IBM今天幫忙。 745 00:42:54,990 --> 00:42:57,300 溝通是什麼 你要去 746 00:42:57,300 --> 00:43:02,280 看到來了越來越多的作為 我們構建更複雜的界面。 747 00:43:02,280 --> 00:43:05,760 下週,我們會繼續討論 有關如何對接 748 00:43:05,760 --> 00:43:08,890 與電腦對手的遊戲。 749 00:43:08,890 --> 00:43:12,950 但是,如果你有關於這個問題, 我就在附近的辦公時間今晚。 750 00:43:12,950 --> 00:43:17,610 我很高興能和你談AI 主題或進入更多的細節。 751 00:43:17,610 --> 00:43:18,927 有一個偉大的週末​​。 752 00:43:18,927 --> 00:43:21,409 >> [掌聲] 753 00:43:21,409 --> 00:43:21,909 754 00:43:21,909 --> 00:43:26,141 [音樂播放] 755 00:43:26,141 --> 00:46:42,879