1 00:00:00,000 --> 00:00:02,928 >> [音乐播放] 2 00:00:02,928 --> 00:00:11,230 3 00:00:11,230 --> 00:00:12,790 >> DAVID马兰:这是CS50。 4 00:00:12,790 --> 00:00:14,072 这为10周结束时。 5 00:00:14,072 --> 00:00:16,030 和男孩,我们有一个 良好的班为你今天。 6 00:00:16,030 --> 00:00:20,040 我们很高兴地邀请两 我们从耶鲁的朋友赶快到我们今天 7 00:00:20,040 --> 00:00:23,920 并且看的交集 人工智能,机器人技术, 8 00:00:23,920 --> 00:00:25,710 自然语言处理,以及更多。 9 00:00:25,710 --> 00:00:27,090 >> 事实上,在 过去几周,我们已经 10 00:00:27,090 --> 00:00:29,714 肯定花了很多时间, 特别是在较早的pset, 11 00:00:29,714 --> 00:00:31,560 专注于相当低级别的细节。 12 00:00:31,560 --> 00:00:34,520 它很容易忽视 森林的树木 13 00:00:34,520 --> 00:00:38,170 并获得挂在循环和条件 和指针,当然,和类似物。 14 00:00:38,170 --> 00:00:41,770 但现实情况是,你们现在有 配料与你可真 15 00:00:41,770 --> 00:00:45,300 解决了一些有趣的问题,其中 他们那些我们的朋友在耶鲁 16 00:00:45,300 --> 00:00:48,790 工作只是害羞剑桥。 17 00:00:48,790 --> 00:00:52,410 >> 所以,首先请允许我介绍一下我们的头 教学耶鲁大学,安迪的助手。 18 00:00:52,410 --> 00:00:55,182 >> [掌声] 19 00:00:55,182 --> 00:00:57,030 20 00:00:57,030 --> 00:01:00,710 >> 安迪:首先,只是感谢 你让一对夫妇Yalies 21 00:01:00,710 --> 00:01:02,700 今天流行下到剑桥。 22 00:01:02,700 --> 00:01:05,299 我们真的很感激。 23 00:01:05,299 --> 00:01:07,090 其次,我们的朋友 回home--杰森, 24 00:01:07,090 --> 00:01:09,670 感谢保持和运行讲座。 25 00:01:09,670 --> 00:01:12,970 希望它在纽黑文都​​好。 26 00:01:12,970 --> 00:01:15,720 >> 所以呀,我超级兴奋 今天给大家介绍Scaz。 27 00:01:15,720 --> 00:01:17,020 Scaz运行的机器人实验室。 28 00:01:17,020 --> 00:01:19,690 他是一个教授,像五 不同的部门在耶鲁大学。 29 00:01:19,690 --> 00:01:23,159 在他的实验室,他有很多很多 机器人,他喜欢玩。 30 00:01:23,159 --> 00:01:24,950 他有一样的 最酷的工作在世界上。 31 00:01:24,950 --> 00:01:27,116 而他得到一种混乱 与整天各地 32 00:01:27,116 --> 00:01:29,090 长,做了一些工作,以及。 33 00:01:29,090 --> 00:01:33,070 >> 因此,我们实际上增添了一颗 与我们今天的人下来。 34 00:01:33,070 --> 00:01:36,900 因此,事不宜迟,Scaz是 要继续前进,并为我们介绍一下 35 00:01:36,900 --> 00:01:38,660 以他的机器人朋友。 36 00:01:38,660 --> 00:01:41,546 >> [掌声] 37 00:01:41,546 --> 00:01:42,935 38 00:01:42,935 --> 00:01:44,310 BRIAN SCASSELLATI:谢谢你,大卫。 39 00:01:44,310 --> 00:01:45,380 谢谢你,安迪。 40 00:01:45,380 --> 00:01:50,050 它是如此美妙的是 这里与大家今天。 41 00:01:50,050 --> 00:01:56,490 我想首先要非常清楚, 这里的CS50工作人员在剑桥 42 00:01:56,490 --> 00:01:59,190 一直令人难以置信的热情好客给我们。 43 00:01:59,190 --> 00:02:02,130 我们非常感谢所有 他们所做的支持我们。 44 00:02:02,130 --> 00:02:05,690 因此,我们希望能 返回的恩情。 45 00:02:05,690 --> 00:02:09,370 >> 所以今天,我们得到的宣布 那我们将有一个新的, 46 00:02:09,370 --> 00:02:15,240 CS50的事件之一的一类 下周在纽黑文的发生。 47 00:02:15,240 --> 00:02:18,040 这是CS50研究世博会。 48 00:02:18,040 --> 00:02:21,300 因此,我们将要邀请 everyone-- CS50学生, 49 00:02:21,300 --> 00:02:26,510 工作人员来自美国哈佛大学和Yale--到 下来和我们一起参观上周五。 50 00:02:26,510 --> 00:02:30,400 我们将有各种各样的超过 30个不同的人提出 51 00:02:30,400 --> 00:02:34,830 和exhibiting--年级学生展示 了一些他们的研究产品。 52 00:02:34,830 --> 00:02:38,480 我们将有一些创业公司,甚至,看 对于新的高科技人才一点点, 53 00:02:38,480 --> 00:02:40,460 初创公司来自哈佛和耶鲁。 54 00:02:40,460 --> 00:02:44,550 而且,我们还会有一些学生团体 寻找一些新的成员。 55 00:02:44,550 --> 00:02:46,357 >> 这将是一个非常激动人心的时刻。 56 00:02:46,357 --> 00:02:49,190 希望你们谁是 下来的哈佛,耶鲁游戏 57 00:02:49,190 --> 00:02:51,360 将能够停止 年初由一点点, 58 00:02:51,360 --> 00:02:54,060 就在校园中心, 斯特林纪念图书馆。 59 00:02:54,060 --> 00:02:58,040 我们要有一套 展品范围从自主 60 00:02:58,040 --> 00:03:04,460 帆船使用软件的方式 保存中世纪手稿。 61 00:03:04,460 --> 00:03:07,860 >> 我们将有广告 组织网络和人员 62 00:03:07,860 --> 00:03:11,230 教学软件编码在开普敦。 63 00:03:11,230 --> 00:03:13,730 我们将有电脑 音乐表演。 64 00:03:13,730 --> 00:03:16,020 我们会的过程中有更多的机器人。 65 00:03:16,020 --> 00:03:18,900 因此,我们希望你会 参加我们这个活动。 66 00:03:18,900 --> 00:03:21,350 这应该是一个很大的 乐趣,食物一点点, 67 00:03:21,350 --> 00:03:24,430 和很多有趣的 事情要谈。 68 00:03:24,430 --> 00:03:28,230 >> 所以我们今天要谈 关于自然语言处理。 69 00:03:28,230 --> 00:03:32,560 这是对我们的尝试 建立接口的新途径 70 00:03:32,560 --> 00:03:35,150 与我们的设备,因为 在过去的几个星期, 71 00:03:35,150 --> 00:03:40,800 你一直专注于它是如何说 您可以编写代码,编写软件 72 00:03:40,800 --> 00:03:47,110 那就是能说一个办法 机,这就是我要你做的。 73 00:03:47,110 --> 00:03:50,210 >> 但是,我们不应该需要 预计一切 74 00:03:50,210 --> 00:03:53,760 这是在那里这是我们用来 每个人都在世界 75 00:03:53,760 --> 00:03:57,480 将是精通 在这样的结构。 76 00:03:57,480 --> 00:04:02,540 因此,我们区分计算机之间 语言和自然languages​​-- 77 00:04:02,540 --> 00:04:06,720 也就是说,事情人类使用 与其他人进行通信。 78 00:04:06,720 --> 00:04:12,270 我们试图构建一个使用界面 这些自然的沟通机制。 79 00:04:12,270 --> 00:04:16,029 >> 现在,就像所有其他的话题 我们已经开始在CS50, 80 00:04:16,029 --> 00:04:19,589 我们将先从最简单的 自然语言处理的位 81 00:04:19,589 --> 00:04:21,269 我们可以想像。 82 00:04:21,269 --> 00:04:24,940 我们将开始与 自然语言的历史的一部分。 83 00:04:24,940 --> 00:04:28,740 然后,我们将建立以 越来越多的最近的系统 84 00:04:28,740 --> 00:04:31,450 并有一些有趣的演示沿途。 85 00:04:31,450 --> 00:04:35,900 >> 因此,我们要开始什么 可能是第一个自然语言 86 00:04:35,900 --> 00:04:38,210 处理系统。 87 00:04:38,210 --> 00:04:45,080 这是写在一个软件系统 1966年由约瑟夫·魏泽鲍姆叫做ELIZA。 88 00:04:45,080 --> 00:04:49,640 伊莱扎被设计成 复制类型的相互作用 89 00:04:49,640 --> 00:04:53,850 你将有一个 罗吉瑞恩心理治疗师。 90 00:04:53,850 --> 00:04:57,210 现在,Rogerians,他们有 一个想法,心理治疗 91 00:04:57,210 --> 00:05:02,800 参与能够反映回 给患者和他们交谈, 92 00:05:02,800 --> 00:05:08,100 基本上,只给他们一个 治疗师的微小点点。 93 00:05:08,100 --> 00:05:09,920 也就是说,一切 治疗师说: 94 00:05:09,920 --> 00:05:16,500 被认为是仅仅反映 什么样的病人告诉他们。 95 00:05:16,500 --> 00:05:18,990 >> 因此,让我们尝试演示这一点。 96 00:05:18,990 --> 00:05:22,820 我们有一个志愿者谁愿意成为 愿意分享他们的最深的, 97 00:05:22,820 --> 00:05:26,650 最黑暗的,和/或假的秘密与伊莉莎? 98 00:05:26,650 --> 00:05:29,680 当然,你为什么不来就到了。 99 00:05:29,680 --> 00:05:30,847 太棒了。 100 00:05:30,847 --> 00:05:31,430 你的名字? 101 00:05:31,430 --> 00:05:32,000 >> 迈尔斯:万里。 102 00:05:32,000 --> 00:05:33,041 >> BRIAN SCASSELLATI:万里。 103 00:05:33,041 --> 00:05:34,270 很高兴见到你,万里。 104 00:05:34,270 --> 00:05:36,270 如果你想抓住这一点。 105 00:05:36,270 --> 00:05:40,840 而且我们要 使用版本ELIZA的 106 00:05:40,840 --> 00:05:44,640 我们已经复制 内CS50 IDE。 107 00:05:44,640 --> 00:05:47,140 并且我们将看看源 在一小会儿代码这一点。 108 00:05:47,140 --> 00:05:49,910 但现在,我们只是 要通过键入伊莉莎来调用它。 109 00:05:49,910 --> 00:05:55,480 >> 伊莱扎将会给您回应 这将是在所有的首都。 110 00:05:55,480 --> 00:05:57,950 而要问你几个问题。 111 00:05:57,950 --> 00:06:02,130 我们会作出回应,并键入 在应对ELIZA。 112 00:06:02,130 --> 00:06:04,310 所以伊莉莎说,“嗨,我是伊莉莎。 113 00:06:04,310 --> 00:06:05,462 你怎么了?” 114 00:06:05,462 --> 00:06:08,092 你会想 告诉ELIZA今天呢? 115 00:06:08,092 --> 00:06:10,750 >> 迈尔斯:我只能入睡 如果我有兔子拖鞋上。 116 00:06:10,750 --> 00:06:12,440 >> BRIAN SCASSELLATI:好吧。 117 00:06:12,440 --> 00:06:13,360 好吧。 118 00:06:13,360 --> 00:06:15,300 >> [笑声] 119 00:06:15,300 --> 00:06:22,410 >> “我只能入睡 与兔宝宝拖鞋上“。 120 00:06:22,410 --> 00:06:29,000 伊莱扎说,“喂,你 有什么心理问题? 121 00:06:29,000 --> 00:06:30,450 也许这是一个很好的指标。“ 122 00:06:30,450 --> 00:06:30,780 >> 好。 123 00:06:30,780 --> 00:06:32,245 所以,你想回应? 124 00:06:32,245 --> 00:06:36,110 125 00:06:36,110 --> 00:06:36,970 >> 迈尔斯:是的。 126 00:06:36,970 --> 00:06:38,660 >> 布赖恩SCASSELLATI:是的。 127 00:06:38,660 --> 00:06:39,570 人的许多话。 128 00:06:39,570 --> 00:06:41,870 我喜欢这一点。 129 00:06:41,870 --> 00:06:50,200 伊莉莎说,“你似乎相当积极。” 130 00:06:50,200 --> 00:06:53,200 >> MILES:不,我,其实,一个电子。 131 00:06:53,200 --> 00:06:55,150 >> BRIAN SCASSELLATI:“没有。 132 00:06:55,150 --> 00:07:02,240 其实,我是一个电子。“ “你来我往 133 00:07:02,240 --> 00:07:06,954 因为你是一个电子?“ 134 00:07:06,954 --> 00:07:08,870 现在,我们可以看到一些 在things--我要去 135 00:07:08,870 --> 00:07:10,200 暂停你只是一秒钟,万里。 136 00:07:10,200 --> 00:07:11,010 不要去任何地方。 137 00:07:11,010 --> 00:07:12,650 我们不跟你做呢。 138 00:07:12,650 --> 00:07:16,490 伊莉莎是,在某些方面, 回应一些事情 139 00:07:16,490 --> 00:07:21,140 那他的说法,但没有 任何真正的理解。 140 00:07:21,140 --> 00:07:26,090 而且它也学舌距今约 他的句子成分。 141 00:07:26,090 --> 00:07:27,310 >> 所以我们说,“没有。 142 00:07:27,310 --> 00:07:29,090 其实,我是一个电子。“ 143 00:07:29,090 --> 00:07:34,190 伊丽莎也回应道:“你来 我,因为你是一个电子?“ 144 00:07:34,190 --> 00:07:34,690 好吧。 145 00:07:34,690 --> 00:07:36,050 让我们给它在这里多了一个回应。 146 00:07:36,050 --> 00:07:37,140 给它一个很好的,万里。 147 00:07:37,140 --> 00:07:37,806 >> 迈尔斯:好一个? 148 00:07:37,806 --> 00:07:48,400 149 00:07:48,400 --> 00:07:49,570 >> 是的,请帮助我。 150 00:07:49,570 --> 00:07:50,570 BRIAN SCASSELLATI:“是的。 151 00:07:50,570 --> 00:07:58,010 请帮帮我。“”你确定吗?“ 152 00:07:58,010 --> 00:07:58,510 MILES:第 153 00:07:58,510 --> 00:08:00,860 BRIAN SCASSELLATI:没有。 154 00:08:00,860 --> 00:08:03,562 “这是什么建议吗?” 155 00:08:03,562 --> 00:08:06,760 >> 迈尔斯:我可能不是一个电子。 156 00:08:06,760 --> 00:08:11,170 >> BRIAN SCASSELLATI:“我 可能不是一个电子。“ 157 00:08:11,170 --> 00:08:13,790 “你是说没有刚需负?” 158 00:08:13,790 --> 00:08:14,390 >> 好吧。 159 00:08:14,390 --> 00:08:16,030 所以万里,太感谢你了。 160 00:08:16,030 --> 00:08:16,860 >> MILES:谢谢。 161 00:08:16,860 --> 00:08:18,360 >> BRIAN SCASSELLATI:非常感谢。 162 00:08:18,360 --> 00:08:20,230 [掌声] 163 00:08:20,230 --> 00:08:21,230 164 00:08:21,230 --> 00:08:26,700 >> 因此,这伊莉莎项目,在许多方面, 正在响应只是件 165 00:08:26,700 --> 00:08:32,730 我们正在提供,没有任何深 了解这里发生了什么。 166 00:08:32,730 --> 00:08:36,640 这是一种制度 被称为模式匹配,其中, 167 00:08:36,640 --> 00:08:40,490 我们正在寻找某些 文本位,我们是那么 168 00:08:40,490 --> 00:08:44,860 要带出什么 作为输入提供, 169 00:08:44,860 --> 00:08:52,580 转换,潜在地,以某种方式, 然后给它返回给用户。 170 00:08:52,580 --> 00:08:55,150 >> 做任何你认为 伊丽莎实际上是 171 00:08:55,150 --> 00:08:58,230 在这里进行有效的心理? 172 00:08:58,230 --> 00:08:59,250 一个人,也许。 173 00:08:59,250 --> 00:09:00,166 >> 听众:[听不清]。 174 00:09:00,166 --> 00:09:03,315 175 00:09:03,315 --> 00:09:05,440 BRIAN SCASSELLATI:怎么 这是否让你有什么感觉? 176 00:09:05,440 --> 00:09:06,530 是的,事实上,它的作用。 177 00:09:06,530 --> 00:09:10,890 我们将看到,实际上, 它一会儿就好了源代码。 178 00:09:10,890 --> 00:09:13,580 所以,你要成为 能够做到正是这一点。 179 00:09:13,580 --> 00:09:17,420 >> 现在,伊莉莎是一种形式是什么 我们称之为今天的聊天机器人。 180 00:09:17,420 --> 00:09:19,950 它只是通过 文本你提供, 181 00:09:19,950 --> 00:09:24,030 提供了最低限度的金额 理解或处理, 182 00:09:24,030 --> 00:09:26,790 然后鹦鹉回给你。 183 00:09:26,790 --> 00:09:31,830 因此,让我们来看看, 概念上,并谈什么 184 00:09:31,830 --> 00:09:34,690 这是伊莉莎实际上是做什么。 185 00:09:34,690 --> 00:09:42,000 >> 伊莉莎走的是一条sentence--让我们 说,“我想打动我的老板。” 186 00:09:42,000 --> 00:09:45,130 而伊莉莎期待 通过那句话 187 00:09:45,130 --> 00:09:48,730 并试图找到与 与特定模式匹配。 188 00:09:48,730 --> 00:09:52,850 因此,例如,有一种格式 伊丽莎正在寻找的话 189 00:09:52,850 --> 00:09:55,110 “我要。” 190 00:09:55,110 --> 00:09:59,330 而且任何时候它看到的东西 有“我要”的话, 191 00:09:59,330 --> 00:10:01,770 它制定的响应。 192 00:10:01,770 --> 00:10:05,040 并且响应是固定字符串。 193 00:10:05,040 --> 00:10:07,915 在这种情况下,它是“为什么你要干什么?” 194 00:10:07,915 --> 00:10:11,330 我把一个小明星 到底是因为这只是 195 00:10:11,330 --> 00:10:13,310 我们的反应的开始。 196 00:10:13,310 --> 00:10:16,310 而星指出, 我们要采取休息 197 00:10:16,310 --> 00:10:19,850 用户的utterance--的 “打动我的老板” - 198 00:10:19,850 --> 00:10:24,500 而且我们要追加的 到该字符串的结尾。 199 00:10:24,500 --> 00:10:28,990 >> 所以,现在,而不是说,“为什么 你想打动我的老板。“ 200 00:10:28,990 --> 00:10:31,800 有额外的一点点 处理,我们将尽。 201 00:10:31,800 --> 00:10:34,440 也就是说,我们必须 转换某些代词 202 00:10:34,440 --> 00:10:38,670 在这里,从“我的老板”到“你的老板。” 203 00:10:38,670 --> 00:10:41,300 还有可能是一些其他 我们需要做出改变。 204 00:10:41,300 --> 00:10:44,990 因此,而不是仅仅坚持到底 直接到年底,我们将做什么 205 00:10:44,990 --> 00:10:49,160 是我们将采取的其他地方 白这里 - 用户utterance-- 206 00:10:49,160 --> 00:10:54,090 我们会把它一件一件 时间和转换每串 207 00:10:54,090 --> 00:10:58,180 的道理,每一个字,变成了一句。 208 00:10:58,180 --> 00:10:59,580 >> 因此,我们将取词“来。” 209 00:10:59,580 --> 00:11:01,650 有没有转换 我们需要做的。 210 00:11:01,650 --> 00:11:02,340 “没话说了。” 211 00:11:02,340 --> 00:11:04,140 有没有转换 我们需要做的还有。 212 00:11:04,140 --> 00:11:06,670 “我的”将转换为“你的。” 213 00:11:06,670 --> 00:11:10,070 而“老板”,我们就离开的“老大”。 214 00:11:10,070 --> 00:11:12,740 然后最后,什么 与一期结束, 215 00:11:12,740 --> 00:11:16,640 我们将它转​​换成一个问题。 216 00:11:16,640 --> 00:11:22,600 >> 这个非常简单的模式匹配 其实是相当成功的。 217 00:11:22,600 --> 00:11:27,260 当这个被介绍 在1966--约瑟夫·魏泽鲍姆 218 00:11:27,260 --> 00:11:28,986 在计算机上编程这一点。 219 00:11:28,986 --> 00:11:31,110 现在,电脑在当时 不是台式机机型。 220 00:11:31,110 --> 00:11:33,950 它们共享资源。 221 00:11:33,950 --> 00:11:39,090 而他的学生们 去和伊莉莎聊天。 222 00:11:39,090 --> 00:11:41,570 最终,他不得不 限制对它的访问 223 00:11:41,570 --> 00:11:43,890 由于他的学生不 让做任何工作。 224 00:11:43,890 --> 00:11:46,190 他们只是聊天ELIZA。 225 00:11:46,190 --> 00:11:48,850 而且,事实上,他不得不 火他的助手,谁 226 00:11:48,850 --> 00:11:55,840 花光了所有她的时间交谈ELIZA 关于她的深,令人担忧的问题。 227 00:11:55,840 --> 00:12:00,350 >> 大家谁使用这些系统 开始人格化他们。 228 00:12:00,350 --> 00:12:04,490 他们开始认为他们是 是动画和真实的人。 229 00:12:04,490 --> 00:12:07,969 他们开始认识到一些 的事情,他们说 230 00:12:07,969 --> 00:12:09,010 人回来给他们。 231 00:12:09,010 --> 00:12:12,120 他们就查不到 事他们自己。 232 00:12:12,120 --> 00:12:17,290 而且,事实上,即使是专家, 即使是心理咨询师, 233 00:12:17,290 --> 00:12:22,930 开始担心,事实上, 也许ELIZA将取而代之。 234 00:12:22,930 --> 00:12:25,640 即使电脑 科学家们担心,我们 235 00:12:25,640 --> 00:12:30,040 如此接近解决自然语言。 236 00:12:30,040 --> 00:12:33,520 >> 现在,这不是任何地方接近真实。 237 00:12:33,520 --> 00:12:37,280 但是,这是多么令人印象深刻 这些系统似乎可以。 238 00:12:37,280 --> 00:12:40,080 因此,让我们先来了解一下 下面,并尝试 239 00:12:40,080 --> 00:12:46,190 得到的问题一点点 在哪里这段代码实际上发生。 240 00:12:46,190 --> 00:12:48,170 所以我们会让这个代码 可之后。 241 00:12:48,170 --> 00:12:50,880 而这是一个非常 简单而直接端口 242 00:12:50,880 --> 00:12:53,240 的原始ELIZA实施。 243 00:12:53,240 --> 00:12:56,350 >> 因此,一些文体的 的事情,你会看到这里 244 00:12:56,350 --> 00:12:59,360 不文体什么 我们希望你做 245 00:12:59,360 --> 00:13:01,480 或者是我们一直教你做。 246 00:13:01,480 --> 00:13:04,770 但是,我们一直试图让他们 跨越许多港口一样 247 00:13:04,770 --> 00:13:08,087 这已使得它 具有原始的味道。 248 00:13:08,087 --> 00:13:09,920 所以,我们要包括 一堆东​​西, 249 00:13:09,920 --> 00:13:12,920 然后我们将有一个 设置关键字,东西 250 00:13:12,920 --> 00:13:16,460 伊丽莎将识别 并响应直接。 251 00:13:16,460 --> 00:13:20,780 所以,如果你有这样的话 “可你”或“我不知道”或“否” 252 00:13:20,780 --> 00:13:24,680 或“是”或“梦想” 或“你好”,然后ELIZA 253 00:13:24,680 --> 00:13:27,920 将选择性响应那些。 254 00:13:27,920 --> 00:13:30,010 我们也有一个 一定数量的东西 255 00:13:30,010 --> 00:13:34,940 我们会掉,像 将“我”到“你的。” 256 00:13:34,940 --> 00:13:39,920 >> 然后,我们将有一系列的反应 对于每个这些关键字, 257 00:13:39,920 --> 00:13:42,580 我们将通过旋转 这些不同的响应。 258 00:13:42,580 --> 00:13:45,350 所以,如果我说“是” 在连续三次,我 259 00:13:45,350 --> 00:13:50,429 可能会得到三个不同的 从ELIZA回应。 260 00:13:50,429 --> 00:13:52,345 我们的代码,那么, 其实非常简单。 261 00:13:52,345 --> 00:13:59,490 如果我向下滚动过去所有这些 我们已经编程响应 262 00:13:59,490 --> 00:14:02,920 我们踏踏实实地我们主要的, 我们要初始化 263 00:14:02,920 --> 00:14:06,540 几个不同的变量 做家政的一点点 264 00:14:06,540 --> 00:14:08,480 在一开始的时候。 265 00:14:08,480 --> 00:14:11,760 但后来有绝对的一组 ,你可以理解的代码。 266 00:14:11,760 --> 00:14:15,820 一个大while循环,说我 一遍又一遍地重复这一点。 267 00:14:15,820 --> 00:14:20,420 我会读成一排,我会 存储在一个输入字符串。 268 00:14:20,420 --> 00:14:23,880 我查一下,看看它的 特殊的关键字“再见”,这 269 00:14:23,880 --> 00:14:26,199 意味着退出程序。 270 00:14:26,199 --> 00:14:29,240 然后我会检查,看看是否 有人只是在重复自己 271 00:14:29,240 --> 00:14:29,800 一遍又一遍。 272 00:14:29,800 --> 00:14:31,174 我会骂他们,如果他们这样做。 273 00:14:31,174 --> 00:14:34,820 我会说“不要重复自己。” 274 00:14:34,820 --> 00:14:40,500 >> 只要这些都不发生,我们将 然后通过与环通扫描, 275 00:14:40,500 --> 00:14:45,330 上线308至313 在这里,检查,看看 276 00:14:45,330 --> 00:14:49,090 是任何这些关键字 包含在输入短语 277 00:14:49,090 --> 00:14:50,620 我刚才是? 278 00:14:50,620 --> 00:14:54,845 如果有匹配对于他们来说,好 然后,我会记住的位置。 279 00:14:54,845 --> 00:14:57,050 我会记住的关键词。 280 00:14:57,050 --> 00:14:58,620 而我就可以建立一个响应。 281 00:14:58,620 --> 00:15:03,150 >> 如果我没有找到一个,那么, 在我的关键字数组中的最后一件事 282 00:15:03,150 --> 00:15:08,070 将我的默认响应, 在没有其他匹配。 283 00:15:08,070 --> 00:15:14,160 我会问这样的问题:“你为什么要 到这里来?“或者”我怎么帮你呢?“ 284 00:15:14,160 --> 00:15:19,710 这只是部分适当 不管输入是什么。 285 00:15:19,710 --> 00:15:22,580 >> 然后,我们将建立艾丽莎的回应。 286 00:15:22,580 --> 00:15:26,040 我们就可以采取 该基地的响应, 287 00:15:26,040 --> 00:15:28,370 就像我们做的是 “我的老板”的例子。 288 00:15:28,370 --> 00:15:30,970 289 00:15:30,970 --> 00:15:33,990 如果这是所有有 is--如果它只有一个 290 00:15:33,990 --> 00:15:36,860 那我应该respond--字符串 我可以将它发送回来。 291 00:15:36,860 --> 00:15:40,610 如果它有一个星号,在 它的结束,然后我会 292 00:15:40,610 --> 00:15:45,710 在处理每个令牌 用户的响应的其余部分 293 00:15:45,710 --> 00:15:51,590 并添加那些,换出 一个字一个字,因为我需要。 294 00:15:51,590 --> 00:15:56,100 >> 所有这一切都是绝对 东西,你可以建立。 295 00:15:56,100 --> 00:15:59,230 而事实上,该方法,使我们 已经处理的命令行参数, 296 00:15:59,230 --> 00:16:03,570 在你的方式 通过HTTP请求处理 297 00:16:03,570 --> 00:16:05,510 遵循相同的种的规则。 298 00:16:05,510 --> 00:16:08,220 他们是模式匹配。 299 00:16:08,220 --> 00:16:15,170 >> 所以伊莉莎有一个比较重要的 对自然语言的影响 300 00:16:15,170 --> 00:16:21,620 因为它使人们看起来这是一个 很实现的目标,比如在某种程度上我们最好 301 00:16:21,620 --> 00:16:25,550 能够直接解决这个问题。 302 00:16:25,550 --> 00:16:30,670 现在,这并不是说,ELIZA做 一切,我们愿意这样做。 303 00:16:30,670 --> 00:16:33,710 当然不是。 304 00:16:33,710 --> 00:16:35,660 但是,我们应该能 做更多的东西。 305 00:16:35,660 --> 00:16:38,280 306 00:16:38,280 --> 00:16:41,490 >> 我们的第一个步骤去 超越伊莉莎是怎么回事 307 00:16:41,490 --> 00:16:44,840 要能看 没有文字被输入 308 00:16:44,840 --> 00:16:53,750 进键盘,但讲话,实际 语音记录到麦克风。 309 00:16:53,750 --> 00:16:56,880 因此,当我们看这些 不同的部分,我们 310 00:16:56,880 --> 00:17:00,304 将要建立一组模型。 311 00:17:00,304 --> 00:17:02,970 我们将必须能 从低级别的声去 312 00:17:02,970 --> 00:17:07,180 information--间距, 振幅,frequency-- 313 00:17:07,180 --> 00:17:09,530 并转换到这 一些单位,我们是 314 00:17:09,530 --> 00:17:14,619 能够更容易地操纵 并且,最后,操控起来 315 00:17:14,619 --> 00:17:18,609 成单词和句子。 316 00:17:18,609 --> 00:17:22,880 >> 因此,大多数语音识别 今天是在那里系统 317 00:17:22,880 --> 00:17:26,069 按照统计 模型中,我们建立 318 00:17:26,069 --> 00:17:35,090 三个独立的东西表示 该音频信号实际上包含。 319 00:17:35,090 --> 00:17:38,640 我们先从一个语音模型 ,讨论刚刚基地 320 00:17:38,640 --> 00:17:41,250 声音,我生产。 321 00:17:41,250 --> 00:17:46,900 我是不是生产的东西是 一个B为男孩或D-如狗? 322 00:17:46,900 --> 00:17:53,220 我如何识别这些两个不同 手机作为单独的独特? 323 00:17:53,220 --> 00:17:56,600 >> 最重要的是,我们会再建 一个字的发音模式, 324 00:17:56,600 --> 00:18:01,350 东西连接在一起 这些个人手机 325 00:18:01,350 --> 00:18:04,724 并把它们组合成一个字。 326 00:18:04,724 --> 00:18:07,890 在这之后,我们将采取的话 我们将它们组装用语言 327 00:18:07,890 --> 00:18:13,010 模拟成一个完整的句子。 328 00:18:13,010 --> 00:18:17,230 >> 现在,我们要谈谈每个 这些独立和分开。 329 00:18:17,230 --> 00:18:21,580 但是,这三款车型都是 只是要统计。 330 00:18:21,580 --> 00:18:23,502 这意味着,当我们 与他们合作,我们将 331 00:18:23,502 --> 00:18:25,376 能够一起工作 他们都同时进行。 332 00:18:25,376 --> 00:18:28,100 333 00:18:28,100 --> 00:18:28,600 好吧。 334 00:18:28,600 --> 00:18:30,890 让我们先从我们的语音模型。 335 00:18:30,890 --> 00:18:34,470 因此,语音模型依赖于 一个计算技术 336 00:18:34,470 --> 00:18:37,320 叫隐马尔可夫模型。 337 00:18:37,320 --> 00:18:43,050 这些都是图形化的模型中,我 已经和认识世界的一个状态 338 00:18:43,050 --> 00:18:46,500 作为其特征 由一组特征。 339 00:18:46,500 --> 00:18:51,960 而这种状态描述一个组成部分 那我从事的行动。 340 00:18:51,960 --> 00:19:00,190 >> 所以,如果我想制作 声音“马”像妈妈, 341 00:19:00,190 --> 00:19:03,970 有不同 组件的声音。 342 00:19:03,970 --> 00:19:07,230 还有就是我画的气息的一部分。 343 00:19:07,230 --> 00:19:09,560 然后,我的钱包我的嘴唇。 344 00:19:09,560 --> 00:19:13,710 而我摇我的嘴唇退后一点 位,以使这一“马”的声音。 345 00:19:13,710 --> 00:19:15,340 然后还有一个版本。 346 00:19:15,340 --> 00:19:17,020 我的嘴唇裂开。 347 00:19:17,020 --> 00:19:19,030 空气被排出。 348 00:19:19,030 --> 00:19:22,650 “嘛。” 349 00:19:22,650 --> 00:19:29,250 >> 这三个不同的部分会 各国在这个graph--代表 350 00:19:29,250 --> 00:19:33,420 开始时,中间和结束。 351 00:19:33,420 --> 00:19:38,060 我将有过渡的 让我从一个国家旅行 352 00:19:38,060 --> 00:19:42,260 到下一个与一定的概率。 353 00:19:42,260 --> 00:19:47,250 因此,举例来说,是m 听起来可能有一个非常, 354 00:19:47,250 --> 00:19:51,850 很短的摄入量在beginning-- “毫米” - 然后较长, 355 00:19:51,850 --> 00:19:55,640 振动阶段时,我抱着我 双唇几乎humming-- 356 00:19:55,640 --> 00:20:05,090 “MMMM” - 然后在很短的 爆破音,我驱逐breath--“马”。 357 00:20:05,090 --> 00:20:09,370 >> 的隐马尔可夫模型是 用来捕捉的事实 358 00:20:09,370 --> 00:20:13,340 这是我做的方式 声音“马”是怎么回事 359 00:20:13,340 --> 00:20:17,350 是在略微不同的 其定时,是频率, 360 00:20:17,350 --> 00:20:21,030 其功能比 您所做的方式 361 00:20:21,030 --> 00:20:23,300 或办法,我可能 让我说话的时候 362 00:20:23,300 --> 00:20:26,030 对不同用途的信。 363 00:20:26,030 --> 00:20:33,240 “母亲”和“我可以”将 声音略有不同。 364 00:20:33,240 --> 00:20:36,800 >> 因此,为了识别 特定的声音,我们会 365 00:20:36,800 --> 00:20:42,020 建立马尔可夫模型,这些隐马尔可夫 每一个可能的手机型号,我 366 00:20:42,020 --> 00:20:45,840 可能要承认, 每一个可能的声音, 367 00:20:45,840 --> 00:20:49,750 再看看 声学数据,我有 368 00:20:49,750 --> 00:20:54,430 并确定统计学 哪一个是最有可能的 369 00:20:54,430 --> 00:20:58,110 已经产生这种声音。 370 00:20:58,110 --> 00:20:58,610 好。 371 00:20:58,610 --> 00:21:01,540 372 00:21:01,540 --> 00:21:06,750 通过这种模式,我们再 开始建立在它之上。 373 00:21:06,750 --> 00:21:09,330 我们采取的发音模式。 374 00:21:09,330 --> 00:21:11,790 现在,有时发音 模型既简单又容易 375 00:21:11,790 --> 00:21:14,440 因为只有一个 这样发音的东西。 376 00:21:14,440 --> 00:21:17,990 其他时候,他们是一个 稍微复杂一些。 377 00:21:17,990 --> 00:21:21,340 这里有一个发音指南 对于红色的东西就是 378 00:21:21,340 --> 00:21:25,210 您所做的番茄酱出来的水果。 379 00:21:25,210 --> 00:21:27,360 人们不认为这是一个水果。 380 00:21:27,360 --> 00:21:27,860 对? 381 00:21:27,860 --> 00:21:30,880 382 00:21:30,880 --> 00:21:35,300 >> 现在,有许多不同的方式 人们会念这个字。 383 00:21:35,300 --> 00:21:37,780 有些人会说“脚趾5脚趾。” 384 00:21:37,780 --> 00:21:40,880 有些人会说“脚趾麻将脚趾。” 385 00:21:40,880 --> 00:21:44,800 我们可以捕捉与 这些图形化的车型之一 386 00:21:44,800 --> 00:21:48,305 在这里,我们再次表示过渡 作为具有一定概率 387 00:21:48,305 --> 00:21:51,360 和相关的概率他们。 388 00:21:51,360 --> 00:21:58,290 >> 所以在这种情况下,如果我是跟随 通过这整个图上的路线, 389 00:21:58,290 --> 00:22:03,330 我将开始在信 在最左边的“TA”的声音。 390 00:22:03,330 --> 00:22:07,570 我想借此上半部分, 的“哦”,然后是“马” 391 00:22:07,570 --> 00:22:14,530 然后一个“a”,然后一个 “TA”和“哦。” “脚趾可能脚趾。” 392 00:22:14,530 --> 00:22:19,610 如果我通过了底部路径 这一点,我会得到“TA-MAH-脚趾。” 393 00:22:19,610 --> 00:22:26,810 如果我去了,然后 起来,我会得到“TA-MAY-脚趾。” 394 00:22:26,810 --> 00:22:29,950 >> 这些模型捕捉这些 差异,因为每当 395 00:22:29,950 --> 00:22:32,410 我们部署的其中之一 识别系统, 396 00:22:32,410 --> 00:22:35,340 这将有工作 许多不同类型的人, 397 00:22:35,340 --> 00:22:39,295 许多不同的口音,甚至 不同用途的同样的话。 398 00:22:39,295 --> 00:22:42,204 399 00:22:42,204 --> 00:22:44,120 最后,最重要的是, 我们要建立的东西 400 00:22:44,120 --> 00:22:48,780 看起来非常复杂, 称为语言模型, 401 00:22:48,780 --> 00:22:52,950 但实际上是最简单的 三,因为这些操作 402 00:22:52,950 --> 00:22:56,041 关于所谓的正克模型。 403 00:22:56,041 --> 00:23:02,270 在这种情况下,我向你展示 一个两部分的正克模型,一个两字组。 404 00:23:02,270 --> 00:23:08,910 我们将做出实际的想法 有时,某些词 405 00:23:08,910 --> 00:23:14,680 更可能跟随一个 给定的字比其他人。 406 00:23:14,680 --> 00:23:25,210 如果我刚才说的“天气预报” 下一个字可以“今天”很可能是 407 00:23:25,210 --> 00:23:31,510 或可以是“天气 预计明天。“ 408 00:23:31,510 --> 00:23:38,870 但它不太可能是“ 天气预报朝鲜蓟。“ 409 00:23:38,870 --> 00:23:42,980 >> 什么是语言模型所做的是 它捕捉那些统计学 410 00:23:42,980 --> 00:23:47,450 通过计算,从一些非常大的 文集,所有实例的 411 00:23:47,450 --> 00:23:50,890 其中一个词接踵而来。 412 00:23:50,890 --> 00:23:54,300 所以,如果我把一个大corpus-- 像每一个华尔街日报 413 00:23:54,300 --> 00:24:00,750 自1930年以来,已产生的 这是标准的corpuses--之一 414 00:24:00,750 --> 00:24:03,910 我期待通过所有 该文本,和我算 415 00:24:03,910 --> 00:24:09,770 经过长达多少次 “预测”我看“今日” 416 00:24:09,770 --> 00:24:17,454 多少次我看到 “预测”,其次是“朝鲜蓟” 417 00:24:17,454 --> 00:24:19,370 第一个是将 要更容易。 418 00:24:19,370 --> 00:24:21,540 这将出现 更为频繁。 419 00:24:21,540 --> 00:24:24,610 因此,这将有一个更高的 与它的概率有关。 420 00:24:24,610 --> 00:24:27,340 >> 如果我想弄清楚的 概率整个话语的, 421 00:24:27,340 --> 00:24:29,940 然后,我就打破它。 422 00:24:29,940 --> 00:24:35,990 所以,听证会的可能性 该句中的“老鼠吃奶酪” 423 00:24:35,990 --> 00:24:39,110 是这个词的概率 “中的”开始一个句子, 424 00:24:39,110 --> 00:24:42,540 然后将概率的 词“鼠”后面的单词“the” 425 00:24:42,540 --> 00:24:44,910 的概率与所述 词“吃”跟随“老鼠” 426 00:24:44,910 --> 00:24:51,120 的概率与 “奶酪”跟随“吃了。” 427 00:24:51,120 --> 00:24:55,160 >> 这听起来像一个不少 统计,很多概率。 428 00:24:55,160 --> 00:24:57,510 而这一切,它是。 429 00:24:57,510 --> 00:25:02,920 但令人惊奇的是,如果你这样做 与数据的一个足够大的样品, 430 00:25:02,920 --> 00:25:03,670 有用。 431 00:25:03,670 --> 00:25:05,250 和它的作品极其良好。 432 00:25:05,250 --> 00:25:07,810 433 00:25:07,810 --> 00:25:11,420 我们都知道这些技术。 434 00:25:11,420 --> 00:25:16,500 大多数操作系统附带 语音识别在这一点上。 435 00:25:16,500 --> 00:25:20,940 我们使用的Siri和柯塔娜和回声。 436 00:25:20,940 --> 00:25:25,070 而这些东西都是基于 这种类型的三层的型号 - 437 00:25:25,070 --> 00:25:30,620 在底部,一个一个语音模型 发音模型在中间, 438 00:25:30,620 --> 00:25:33,690 并在它们的顶部一个语言模型。 439 00:25:33,690 --> 00:25:37,630 >> 现在,他们需要做一点点 比,为了回答问题。 440 00:25:37,630 --> 00:25:43,000 但是,承认你在做什么 确切地说取决于这一点。 441 00:25:43,000 --> 00:25:45,700 因此,让我们举一个例子在这里。 442 00:25:45,700 --> 00:25:52,020 所以,我有我的手机坐在这儿 文件摄像机下方。 443 00:25:52,020 --> 00:25:56,110 而我们要问 SIRI几个问题。 444 00:25:56,110 --> 00:25:57,150 好吧? 445 00:25:57,150 --> 00:25:59,940 >> 因此,让我们在这里醒来我的电话。 446 00:25:59,940 --> 00:26:02,710 447 00:26:02,710 --> 00:26:05,000 Siri的,什么是天气 像在纽黑文今天? 448 00:26:05,000 --> 00:26:07,670 449 00:26:07,670 --> 00:26:10,780 >> SIRI:这里的天气 纽黑文,今天康涅狄格。 450 00:26:10,780 --> 00:26:11,890 >> BRIAN SCASSELLATI:OK。 451 00:26:11,890 --> 00:26:16,720 所以,首先你看到Siri的识别 每个单独字 452 00:26:16,720 --> 00:26:19,050 然后产生的响应。 453 00:26:19,050 --> 00:26:22,277 我们将讨论如何这种反应 来约在一点点。 454 00:26:22,277 --> 00:26:24,110 但是现在我们知道 这仅仅是基础 455 00:26:24,110 --> 00:26:28,880 对原始数据和这 模式匹配类型的方法, 456 00:26:28,880 --> 00:26:31,120 我们可以玩一些游戏的Siri。 457 00:26:31,120 --> 00:26:34,560 >> 因此,我可以再试一次。 458 00:26:34,560 --> 00:26:38,864 Siri的,什么是天气 河马纽黑文,今天? 459 00:26:38,864 --> 00:26:39,810 >> SIRI:OK。 460 00:26:39,810 --> 00:26:44,245 这里的天气新 纽黑文,康涅狄格今天。 461 00:26:44,245 --> 00:26:46,120 BRIAN SCASSELLATI:Siri的 不是由该气馁 462 00:26:46,120 --> 00:26:50,980 因为它找到了pattern-- “天气”,“今天”,“纽黑文。” 463 00:26:50,980 --> 00:26:54,420 这就是它的响应 到,就像伊莉莎。 464 00:26:54,420 --> 00:26:54,920 好吧。 465 00:26:54,920 --> 00:26:59,390 让我们给它一次甚至 更可笑的例子。 466 00:26:59,390 --> 00:27:03,075 Siri的,天气朝鲜蓟 犰狳河马纽黑文? 467 00:27:03,075 --> 00:27:06,806 468 00:27:06,806 --> 00:27:08,400 >> SIRI:让我看看这一点。 469 00:27:08,400 --> 00:27:11,280 下面是我在网上找到 什么是朝鲜蓟犰狳 470 00:27:11,280 --> 00:27:13,780 河马纽黑文。 471 00:27:13,780 --> 00:27:14,760 >> BRIAN SCASSELLATI:OK。 472 00:27:14,760 --> 00:27:20,400 所以,如果我走的不够远 远离该模型中, 473 00:27:20,400 --> 00:27:24,365 我可以,因为它混淆了没有 长匹配它有图案。 474 00:27:24,365 --> 00:27:27,370 475 00:27:27,370 --> 00:27:29,390 这统计 引擎在说, 476 00:27:29,390 --> 00:27:32,850 那是什么,你已经得到了可能性 的话河马和朝鲜蓟 477 00:27:32,850 --> 00:27:34,440 在一起,犰狳? 478 00:27:34,440 --> 00:27:36,050 那一定是新的东西。 479 00:27:36,050 --> 00:27:38,840 480 00:27:38,840 --> 00:27:40,610 >> 因此,这些技术,我们每天都在使用。 481 00:27:40,610 --> 00:27:43,670 482 00:27:43,670 --> 00:27:47,800 如果我们想带他们一步 进一步的,不过,如果我们真的 483 00:27:47,800 --> 00:27:53,930 希望能够谈论什么 的是,这些系统作出反应,进行 484 00:27:53,930 --> 00:28:00,630 我们要谈谈,再次,关于 更根本的一系列问题。 485 00:28:00,630 --> 00:28:05,370 这就是在沟通的话题 我们称之为问答。 486 00:28:05,370 --> 00:28:07,028 也就是说,我们希望能够用于:是吗? 487 00:28:07,028 --> 00:28:07,944 听众:[听不清]。 488 00:28:07,944 --> 00:28:10,789 489 00:28:10,789 --> 00:28:13,330 BRIAN SCASSELLATI:我们得到 到潜在语义处理? 490 00:28:13,330 --> 00:28:14,070 所以,是的。 491 00:28:14,070 --> 00:28:17,820 有很多东西都是 发生与Siri的表面下 492 00:28:17,820 --> 00:28:20,210 并且在一些例子 我要告诉你下一个 493 00:28:20,210 --> 00:28:22,610 其中,有相当多的 在结构方面 494 00:28:22,610 --> 00:28:25,260 你在说什么这很重要。 495 00:28:25,260 --> 00:28:31,890 而且,事实上,这是一个伟大 前体下一张幻灯片我。 496 00:28:31,890 --> 00:28:35,110 >> 因此,在同样的方式,我们的 语音识别就建立起来了 497 00:28:35,110 --> 00:28:39,620 多层,如果我们想 了解它是什么,实际上 498 00:28:39,620 --> 00:28:44,620 虽这么说,我们要再次 依靠多层分析 499 00:28:44,620 --> 00:28:47,020 这正在被识别的文本。 500 00:28:47,020 --> 00:28:52,560 因此,当Siri的其实是能 说,看,我发现这句话。 501 00:28:52,560 --> 00:28:55,230 现在我该怎么处理它们呢? 502 00:28:55,230 --> 00:28:59,110 第一组分往往是 经历并尝试分析 503 00:28:59,110 --> 00:29:03,010 句子的结构。 504 00:29:03,010 --> 00:29:05,410 而在我们所看到的 上小学的时候,往往, 505 00:29:05,410 --> 00:29:08,920 作为排序图表的 句子,我们要 506 00:29:08,920 --> 00:29:12,774 要认识到某些 词有一定的作用。 507 00:29:12,774 --> 00:29:13,440 这些都是名词。 508 00:29:13,440 --> 00:29:14,231 这些都是代词。 509 00:29:14,231 --> 00:29:16,200 这些都是动词。 510 00:29:16,200 --> 00:29:19,460 而且我们要承认 对于特定的语法, 511 00:29:19,460 --> 00:29:24,700 在这种情况下英语语法,有 ,我可以将它们结合起来的有效途径 512 00:29:24,700 --> 00:29:26,280 和无效的其他方式。 513 00:29:26,280 --> 00:29:29,920 514 00:29:29,920 --> 00:29:33,870 >> 这一认识,即结构, 可能足以帮助指导我们 515 00:29:33,870 --> 00:29:36,720 一点点。 516 00:29:36,720 --> 00:29:39,820 但是,这还远远不够 为我们能够给 517 00:29:39,820 --> 00:29:43,290 任何意义,什么正在这里说。 518 00:29:43,290 --> 00:29:46,615 为了做到这一点,我们必须依靠 一定量的语义处理。 519 00:29:46,615 --> 00:29:49,590 520 00:29:49,590 --> 00:29:55,080 也就是说,我们要来看看 在下方各有什么这些词 521 00:29:55,080 --> 00:29:57,400 实际上承载的意义。 522 00:29:57,400 --> 00:30:01,150 并且在这样做的简单的方法, 我们将每个单词联系起来 523 00:30:01,150 --> 00:30:06,930 我们知道一个特定的功能, 一定改造,它 524 00:30:06,930 --> 00:30:09,300 允许发生。 525 00:30:09,300 --> 00:30:14,470 >> 在这种情况下,我们可能会标记 单词“约翰”作为一个专有名词, 526 00:30:14,470 --> 00:30:18,160 它承载着一个身份。 527 00:30:18,160 --> 00:30:21,530 我们可能标识 “玛丽”为相同的方式。 528 00:30:21,530 --> 00:30:27,900 而像“爱”,一个动词, 构成了一个特殊的关系 529 00:30:27,900 --> 00:30:31,582 我们能够代表。 530 00:30:31,582 --> 00:30:33,290 现在,这并不意味着 我们明白 531 00:30:33,290 --> 00:30:37,680 什么是爱,但只有我们明白 它在一个象征性的系统的方法。 532 00:30:37,680 --> 00:30:40,480 也就是说,我们可以标记 它和操作它。 533 00:30:40,480 --> 00:30:44,230 534 00:30:44,230 --> 00:30:49,120 >> 与这些类型的方法的, 任何类型的语义处理 535 00:30:49,120 --> 00:30:57,060 这里将需要一点点 知识位和大量的工作 536 00:30:57,060 --> 00:30:59,020 我们的一部分。 537 00:30:59,020 --> 00:31:03,590 我们不再领域 在这里只是简单的统计数据 538 00:31:03,590 --> 00:31:07,320 将要足够我们。 539 00:31:07,320 --> 00:31:11,330 现在,为了去 从这个角度来被 540 00:31:11,330 --> 00:31:15,520 能够谈论的内 什么实际发生在这里, 541 00:31:15,520 --> 00:31:19,640 以能够操纵这个 构建和理解的问题 542 00:31:19,640 --> 00:31:23,160 然后能够 走出去,寻找, 543 00:31:23,160 --> 00:31:27,290 这需要更 复杂的认知模式。 544 00:31:27,290 --> 00:31:34,880 >> 在这些系统的构建方式 是在大多数情况下非常非常劳动 545 00:31:34,880 --> 00:31:36,350 密集的。 546 00:31:36,350 --> 00:31:39,490 它们涉及人类 花费了大量 547 00:31:39,490 --> 00:31:44,100 时间构建的方式 这些类型的句子 548 00:31:44,100 --> 00:31:47,270 可以在一些逻辑表示。 549 00:31:47,270 --> 00:31:51,639 550 00:31:51,639 --> 00:31:53,430 它会变得有点 更复杂的,虽然。 551 00:31:53,430 --> 00:31:56,400 552 00:31:56,400 --> 00:31:59,660 >> 甚至有一次,我们已经处理 与语义,我们将 553 00:31:59,660 --> 00:32:03,860 还是得看 对什么东西被说语。 554 00:32:03,860 --> 00:32:08,620 也就是说,我该如何关联的话 我有一些身体上出 555 00:32:08,620 --> 00:32:12,054 在全球或有 至少一些信息源 556 00:32:12,054 --> 00:32:12,970 我可以操纵? 557 00:32:12,970 --> 00:32:15,780 558 00:32:15,780 --> 00:32:20,790 >> 有时,这些导致 精彩的比特模糊性。 559 00:32:20,790 --> 00:32:24,470 “红得发紫的明星结婚天文学家。” 560 00:32:24,470 --> 00:32:25,630 好。 561 00:32:25,630 --> 00:32:28,540 现在,我们看到的 搞笑类型的标题的 562 00:32:28,540 --> 00:32:34,690 我们会在深夜的电视看 因为我们不理解的“明星” 563 00:32:34,690 --> 00:32:38,630 有它的天体的含义。 564 00:32:38,630 --> 00:32:43,390 我们知道,这意味着更多的 司空见惯的演员或女演员 565 00:32:43,390 --> 00:32:45,240 有大量的知名度。 566 00:32:45,240 --> 00:32:47,770 567 00:32:47,770 --> 00:32:51,950 >> “队帮助狗咬伤的受害者。” 568 00:32:51,950 --> 00:32:55,550 难道球队实际上是 在那里协助狗 569 00:32:55,550 --> 00:32:59,620 在绕来绕去又咬受害者? 570 00:32:59,620 --> 00:33:02,380 抑或是有 个人谁是 571 00:33:02,380 --> 00:33:04,625 咬伤谁需要一些帮助一只狗? 572 00:33:04,625 --> 00:33:07,650 573 00:33:07,650 --> 00:33:11,480 单从看语法 和句子的语义, 574 00:33:11,480 --> 00:33:14,660 我们无法确定。 575 00:33:14,660 --> 00:33:22,000 >> “直升机人类苍蝇供电。” 576 00:33:22,000 --> 00:33:27,330 在那里,事实上,实际 周围飞小事 577 00:33:27,330 --> 00:33:34,510 是人的翅膀供电 直升机为人类的好? 578 00:33:34,510 --> 00:33:38,960 或者是有一个机械装置 从一个人获得它的权力? 579 00:33:38,960 --> 00:33:41,600 580 00:33:41,600 --> 00:33:46,500 >> 当我们在看问题 应答系统, 581 00:33:46,500 --> 00:33:51,110 这些是图层 我们需要处理。 582 00:33:51,110 --> 00:33:54,890 现在,最好的和最排序 的普遍的这些系统的 583 00:33:54,890 --> 00:34:00,640 今天都能够做到 事情在一个水平,是 584 00:34:00,640 --> 00:34:05,050 远远超出了我们有10年前。 585 00:34:05,050 --> 00:34:08,210 这里是最好的系统之一 这是有今天。 586 00:34:08,210 --> 00:34:10,519 而这是一个系统 来自IBM称为沃森。 587 00:34:10,519 --> 00:34:13,040 588 00:34:13,040 --> 00:34:15,500 这是我们的朋友在IBM。 589 00:34:15,500 --> 00:34:19,810 这是凯瑟琳银行,甲辰, 和百基拉赖斯给我们 590 00:34:19,810 --> 00:34:26,323 沃森的演示 昨天在IBM约克。 591 00:34:26,323 --> 00:34:26,989 [视频回放] 592 00:34:26,989 --> 00:34:27,690 -你好吗? 593 00:34:27,690 --> 00:34:30,600 594 00:34:30,600 --> 00:34:31,980 >> -我很好。 595 00:34:31,980 --> 00:34:35,429 我的时候,我总是很高兴 想,特别是当我 596 00:34:35,429 --> 00:34:38,920 可以保持冷静在这些服务器机房。 597 00:34:38,920 --> 00:34:40,170 - 谁是你最喜欢的女演员? 598 00:34:40,170 --> 00:34:43,870 599 00:34:43,870 --> 00:34:47,555 >> - 我最喜爱的女主角 安吉丽娜·朱莉的劳拉·克劳馥 600 00:34:47,555 --> 00:34:54,800 在古墓丽影因为她的原 形式是为像我这样的一个虚拟人物。 601 00:34:54,800 --> 00:34:56,760 >> - 如何能沃森帮助患者? 602 00:34:56,760 --> 00:34:59,700 603 00:34:59,700 --> 00:35:03,755 >> -is计划为病人 有机会获得直接沃森? 604 00:35:03,755 --> 00:35:08,050 访问沃森咨询 应用程序将通过使用情况而有所不同。 605 00:35:08,050 --> 00:35:12,630 但目前,屈臣氏将只提供 可能的诊断和治疗 606 00:35:12,630 --> 00:35:14,725 选择医学专业。 607 00:35:14,725 --> 00:35:17,680 在适当情况下,患者 可以提供信息 608 00:35:17,680 --> 00:35:21,210 华生,也许是通过一个 门户网站界面,平板电脑, 609 00:35:21,210 --> 00:35:23,500 甚至移动电话。 610 00:35:23,500 --> 00:35:27,180 例如,一个患者可能 要求描述自己的症状 611 00:35:27,180 --> 00:35:30,460 在自然语言直接 到沃森的解决方案, 612 00:35:30,460 --> 00:35:34,050 允许医师将重点放在 诊断和不采集数据。 613 00:35:34,050 --> 00:35:38,379 614 00:35:38,379 --> 00:35:42,716 >> - 谁暗杀了林肯? 615 00:35:42,716 --> 00:35:46,153 >> 约翰威尔克斯布斯。 616 00:35:46,153 --> 00:35:52,373 >> - 在哪一年做了亚利桑那州 响尾蛇赢得世界大赛? 617 00:35:52,373 --> 00:35:55,295 >> -2001。 618 00:35:55,295 --> 00:35:58,710 >> [结束播放] 619 00:35:58,710 --> 00:36:01,610 >> BRIAN SCASSELLATI:所以 这些类型的系统 620 00:36:01,610 --> 00:36:07,430 必须依靠首先 认识到讲话;第二, 621 00:36:07,430 --> 00:36:12,200 将其转换成有意义的内部 表示;然后,第三, 622 00:36:12,200 --> 00:36:17,090 能够走出去,找到 信息源 623 00:36:17,090 --> 00:36:21,140 使他们能够回答这个问题。 624 00:36:21,140 --> 00:36:27,320 这种复杂程度涉及 同类型的编程事 625 00:36:27,320 --> 00:36:31,790 你一直 在做习题集。 626 00:36:31,790 --> 00:36:38,000 >> 我们能够解析HTTP请求, 相同类型的低级别的图案的 627 00:36:38,000 --> 00:36:40,810 匹配伊丽莎可以做。 628 00:36:40,810 --> 00:36:45,070 我们能够将这些 为内部表示, 629 00:36:45,070 --> 00:36:50,360 然后用它们来查询一些 外部数据库,可能使用SQL。 630 00:36:50,360 --> 00:36:53,530 631 00:36:53,530 --> 00:36:56,260 所有系统的那 今天正在建造 632 00:36:56,260 --> 00:37:00,520 做这种类型的天然 语言交流 633 00:37:00,520 --> 00:37:04,100 在正在兴建 这些相同的原则。 634 00:37:04,100 --> 00:37:09,530 >> 现在,即使是像系统 沃森是不是很复杂 635 00:37:09,530 --> 00:37:14,820 到能够回答任意 任何主题的问题。 636 00:37:14,820 --> 00:37:20,060 而事实上,他们必须 给定域中的结构。 637 00:37:20,060 --> 00:37:24,440 所以,你可以到网上,你可以找到 该操作好沃森版本 638 00:37:24,440 --> 00:37:27,700 中医学信息。 639 00:37:27,700 --> 00:37:31,490 或者有一个在线 只是涉及如何 640 00:37:31,490 --> 00:37:34,540 要做出好的建议 什么样的啤酒将与哪些食物去了。 641 00:37:34,540 --> 00:37:37,060 642 00:37:37,060 --> 00:37:41,870 而这些领域内, 它可以回答问题, 643 00:37:41,870 --> 00:37:46,130 发现它所需要的信息。 644 00:37:46,130 --> 00:37:48,270 >> 但你不能混用和匹配。 645 00:37:48,270 --> 00:37:53,150 这就是被训练的系统 食品和啤酒的数据库 646 00:37:53,150 --> 00:37:56,830 不突然,当你工作得很好 把它与医学信息 647 00:37:56,830 --> 00:37:59,770 数据库。 648 00:37:59,770 --> 00:38:05,680 因此,即使我们今天的最佳系统 依靠处理的水平 649 00:38:05,680 --> 00:38:11,570 在我们的手编 为了建设中的基础设施建设 650 00:38:11,570 --> 00:38:13,275 使这个系统的运行。 651 00:38:13,275 --> 00:38:16,360 652 00:38:16,360 --> 00:38:20,710 >> 现在,最后一个话题我想 到能够得到今天 653 00:38:20,710 --> 00:38:23,960 是关于非语言沟通。 654 00:38:23,960 --> 00:38:29,290 一个伟大的信息质量的 我们彼此通信 655 00:38:29,290 --> 00:38:35,490 通过不来约 我们正在申请个别单词。 656 00:38:35,490 --> 00:38:40,290 它做了这些东西, 接近,目光,你的语气, 657 00:38:40,290 --> 00:38:42,270 您的拐点。 658 00:38:42,270 --> 00:38:46,620 而沟通也 这是很多不同的接口 659 00:38:46,620 --> 00:38:49,960 关心一个伟大的交易。 660 00:38:49,960 --> 00:38:51,500 这不是什么Siri的关心。 661 00:38:51,500 --> 00:38:56,250 我可以问Siri的东西用一个声音 或语音不同的音调, 662 00:38:56,250 --> 00:38:59,840 和Siri的打算 给我相同的答案。 663 00:38:59,840 --> 00:39:05,260 但是,这不是我们构建 许多其他类型的接口。 664 00:39:05,260 --> 00:39:09,120 >> 我想向您介绍 现在到机器人中的一个。 665 00:39:09,120 --> 00:39:12,720 这是我的长期建 朋友和同事辛西娅 666 00:39:12,720 --> 00:39:16,010 Breazeal和她的公司基博。 667 00:39:16,010 --> 00:39:20,090 这robot--我们要去 有一对夫妇的志愿者 668 00:39:20,090 --> 00:39:22,520 拿出与此交互。 669 00:39:22,520 --> 00:39:26,200 所以我可以有两个人愿意 与机器人给我玩吗? 670 00:39:26,200 --> 00:39:29,936 你为什么不上来吧, 为什么你不来就到了。 671 00:39:29,936 --> 00:39:31,310 如果你想和我一起在这里,请。 672 00:39:31,310 --> 00:39:36,520 673 00:39:36,520 --> 00:39:39,670 >> 如果我能有你 来的权利在这里。 674 00:39:39,670 --> 00:39:40,170 谢谢。 675 00:39:40,170 --> 00:39:40,480 你好。 676 00:39:40,480 --> 00:39:41,400 >> ALFREDO:很高兴见到你。 677 00:39:41,400 --> 00:39:42,010 阿尔弗雷多。 678 00:39:42,010 --> 00:39:42,520 >> BRIAN SCASSELLATI:阿尔弗雷多。 679 00:39:42,520 --> 00:39:43,146 >> 瑞秋:瑞秋。 680 00:39:43,146 --> 00:39:44,228 BRIAN SCASSELLATI:雷切尔。 681 00:39:44,228 --> 00:39:45,154 很高兴见到你们俩。 682 00:39:45,154 --> 00:39:46,820 阿尔弗雷多,我要你先走。 683 00:39:46,820 --> 00:39:47,990 快来权在这里。 684 00:39:47,990 --> 00:39:51,870 我要介绍 你 - 如果我能得到这一关 685 00:39:51,870 --> 00:39:58,450 不敲门的microphone-- 一个叫基博的小机器人。 686 00:39:58,450 --> 00:40:00,140 好不好? 687 00:40:00,140 --> 00:40:04,260 >> 现在,基博被设计为互动。 688 00:40:04,260 --> 00:40:09,339 虽然它可以给你讲话, 多与机器人的相互作用的 689 00:40:09,339 --> 00:40:09,880 就是非语言。 690 00:40:09,880 --> 00:40:12,450 691 00:40:12,450 --> 00:40:17,070 阿尔弗雷多,我要问你 好好说话和免费 692 00:40:17,070 --> 00:40:19,554 给机器人,请。 693 00:40:19,554 --> 00:40:20,845 ALFREDO:我觉得你看起来很可爱。 694 00:40:20,845 --> 00:40:24,114 695 00:40:24,114 --> 00:40:25,611 >> [呼呼的声音] 696 00:40:25,611 --> 00:40:26,192 697 00:40:26,192 --> 00:40:27,108 BRIAN SCASSELLATI:OK。 698 00:40:27,108 --> 00:40:30,110 699 00:40:30,110 --> 00:40:33,180 它的反应并不言语。 700 00:40:33,180 --> 00:40:35,180 然而,它给了你们两个 明确承认 701 00:40:35,180 --> 00:40:39,680 它听到你说的话 也不知怎么理解。 702 00:40:39,680 --> 00:40:40,530 好不好? 703 00:40:40,530 --> 00:40:42,070 步骤右后卫位置一秒钟。 704 00:40:42,070 --> 00:40:43,130 谢谢。 705 00:40:43,130 --> 00:40:44,090 >> 瑞秋,如果你会的。 706 00:40:44,090 --> 00:40:46,070 现在,我想给 你更难就业。 707 00:40:46,070 --> 00:40:48,361 如果你站在这里, 备份只是有那么一点点 708 00:40:48,361 --> 00:40:50,280 我们可以帮你的相机 看看这种方式。 709 00:40:50,280 --> 00:40:56,840 我要问你说些什么 真的是和讨厌的机器人。 710 00:40:56,840 --> 00:41:02,900 >> 你才似乎什么 做的是完全荒谬的。 711 00:41:02,900 --> 00:41:03,840 >> [嗡嗡声] 712 00:41:03,840 --> 00:41:07,610 713 00:41:07,610 --> 00:41:09,030 >> 这更是荒谬。 714 00:41:09,030 --> 00:41:10,120 你怎么了? 715 00:41:10,120 --> 00:41:13,487 716 00:41:13,487 --> 00:41:16,207 噢,不心疼。 717 00:41:16,207 --> 00:41:17,040 我给你一个拥抱。 718 00:41:17,040 --> 00:41:19,882 719 00:41:19,882 --> 00:41:21,090 BRIAN SCASSELLATI:好吧。 720 00:41:21,090 --> 00:41:22,280 谢谢,雷切尔。 721 00:41:22,280 --> 00:41:24,565 阿尔弗雷多,雷切尔,谢谢你们非常多。 722 00:41:24,565 --> 00:41:26,840 >> [掌声] 723 00:41:26,840 --> 00:41:28,660 724 00:41:28,660 --> 00:41:34,470 >> 因此,这种互动在 许多方面的一些相同的规则 725 00:41:34,470 --> 00:41:36,950 和一些相同 结构我们 726 00:41:36,950 --> 00:41:39,950 可能有语言交流。 727 00:41:39,950 --> 00:41:44,530 它既是交际和 提供一个重要目的。 728 00:41:44,530 --> 00:41:48,590 而这种互动,在 方法很多,设计 729 00:41:48,590 --> 00:41:52,890 有对特定的效果 与人交互或听 730 00:41:52,890 --> 00:41:54,410 到机器人。 731 00:41:54,410 --> 00:41:56,450 >> 现在,我很幸运 有吉波今天在这里。 732 00:41:56,450 --> 00:42:00,550 萨姆·斯波尔丁是在这里帮助 我们用机器人。 733 00:42:00,550 --> 00:42:07,470 而我要问萨姆给 吉波跳舞我们一个很好的演示 734 00:42:07,470 --> 00:42:09,720 我们可以在年底看这里。 735 00:42:09,720 --> 00:42:10,590 因此,继续前进,基博。 736 00:42:10,590 --> 00:42:11,550 >> SAM:OK,基博。 737 00:42:11,550 --> 00:42:14,430 向我们展示你的舞蹈动作。 738 00:42:14,430 --> 00:42:17,310 >> [音乐播放] 739 00:42:17,310 --> 00:42:43,114 740 00:42:43,114 --> 00:42:44,780 BRIAN SCASSELLATI:好,大家好。 741 00:42:44,780 --> 00:42:46,865 感谢我们的朋友在基博。 742 00:42:46,865 --> 00:42:49,426 >> [掌声] 743 00:42:49,426 --> 00:42:50,140 744 00:42:50,140 --> 00:42:54,990 >> 并感谢我们的朋友 IBM今天帮忙。 745 00:42:54,990 --> 00:42:57,300 沟通是什么 你要去 746 00:42:57,300 --> 00:43:02,280 看到来了越来越多的作为 我们构建更复杂的界面。 747 00:43:02,280 --> 00:43:05,760 下周,我们会继续讨论 有关如何对接 748 00:43:05,760 --> 00:43:08,890 与电脑对手的游戏。 749 00:43:08,890 --> 00:43:12,950 但是,如果你有关于这个问题, 我就在附近的办公时间今晚。 750 00:43:12,950 --> 00:43:17,610 我很高兴能和你谈AI 主题或进入更多的细节。 751 00:43:17,610 --> 00:43:18,927 周末愉快。 752 00:43:18,927 --> 00:43:21,409 >> [掌声] 753 00:43:21,409 --> 00:43:21,909 754 00:43:21,909 --> 00:43:26,141 [音乐播放] 755 00:43:26,141 --> 00:46:42,879