1 00:00:00,000 --> 00:00:12,080 2 00:00:12,080 --> 00:00:13,799 >> JAMES袖口:嗨,不错 下午好。 3 00:00:13,799 --> 00:00:14,715 我的名字是詹姆斯袖口。 4 00:00:14,715 --> 00:00:18,970 我的助理院长研究 这里计算哈佛大学。 5 00:00:18,970 --> 00:00:24,540 今天我要和你谈谈 为什么向外扩展的计算是至关重要的。 6 00:00:24,540 --> 00:00:26,810 >> 所以我想,先上去,这家伙是谁? 7 00:00:26,810 --> 00:00:27,750 我为什么在这里? 8 00:00:27,750 --> 00:00:29,200 为什么我跟你说话? 9 00:00:29,200 --> 00:00:33,730 我有科学背景 计算和研究计算, 10 00:00:33,730 --> 00:00:38,530 可以追溯到美国 Kingdom--威康信托基金会桑格 11 00:00:38,530 --> 00:00:43,270 研究所人类genome--和 然后,最近在美国 12 00:00:43,270 --> 00:00:50,170 在广泛等受人尊敬的工作 学习的地方,比如哈佛大学。 13 00:00:50,170 --> 00:00:53,930 >> 我猜这是什么真正的意思是 我是一个恢复的分子生物 14 00:00:53,930 --> 00:00:55,740 物理学家。 15 00:00:55,740 --> 00:01:01,250 所以,有什么权利我必须告诉 你对横向扩展计算? 16 00:01:01,250 --> 00:01:03,570 有一个但是。 17 00:01:03,570 --> 00:01:09,530 18岁的让我刚刚见过的最 大幅增加的规模复杂 18 00:01:09,530 --> 00:01:13,570 和整体效率 的计算系统。 19 00:01:13,570 --> 00:01:18,890 >> 当我在做我的博士在牛津,我 是相当兴奋的一个200兆赫 20 00:01:18,890 --> 00:01:23,830 Silicon Graphics公司机18 千兆字节的存储和单个CPU。 21 00:01:23,830 --> 00:01:24,910 时代已经变了。 22 00:01:24,910 --> 00:01:29,860 如果你现在快进,我们纺 超过60,000这里的CPU在哈佛。 23 00:01:29,860 --> 00:01:32,810 许多其他组织 有纺等等。 24 00:01:32,810 --> 00:01:37,740 >> 从这个最重要的是外卖 这种规模是现在不仅不可避免, 25 00:01:37,740 --> 00:01:41,910 它的发生,这是 将继续发生。 26 00:01:41,910 --> 00:01:44,760 因此,让我们,一会儿,善良 对快退和说话非常快 27 00:01:44,760 --> 00:01:50,530 关于科学,我最喜欢的 主题,科学的方法。 28 00:01:50,530 --> 00:01:53,180 >> 如果你要成为一名科学家, 你必须做一些关键的东西。 29 00:01:53,180 --> 00:01:56,140 如果你不这样做,这些事情你可以 不认为自己是一个科学家 30 00:01:56,140 --> 00:02:03,250 你将很难能够 了解你的学科领域。 31 00:02:03,250 --> 00:02:07,290 >> 所以,首先,你会制定 您的问题,产生的假设, 32 00:02:07,290 --> 00:02:09,289 但更重要的是,你 预测你results-- 33 00:02:09,289 --> 00:02:13,090 你有一个猜测, 什么样的结果会如何。 34 00:02:13,090 --> 00:02:19,560 然后最后,您测试 假设和分析结果。 35 00:02:19,560 --> 00:02:25,460 >> 所以这个科学的方法是 在计算非常重要。 36 00:02:25,460 --> 00:02:28,450 两者的预测计算 并能够测试结果 37 00:02:28,450 --> 00:02:33,660 是我们所需要的一个重要组成部分 做科学的方法。 38 00:02:33,660 --> 00:02:37,310 这些预测和化验 是真正的两大基石 39 00:02:37,310 --> 00:02:42,350 科学的方法,并且每个 所需要的最显著进展 40 00:02:42,350 --> 00:02:45,240 在现代计算。 41 00:02:45,240 --> 00:02:51,210 >> 科学的两大支柱是 理论和实验。 42 00:02:51,210 --> 00:02:54,300 而最近, 计算经常被提及 43 00:02:54,300 --> 00:02:58,090 作为是科学的第三大支柱。 44 00:02:58,090 --> 00:03:01,440 所以,如果你的学生看这个, 你绝对没有压力。 45 00:03:01,440 --> 00:03:03,960 46 00:03:03,960 --> 00:03:08,720 science--没有什么大的第三大支柱 deal--计算,种重要的。 47 00:03:08,720 --> 00:03:14,000 很高兴,这是在计算部 计算机科学课程50。 48 00:03:14,000 --> 00:03:16,220 >> 所以足够的背景。 49 00:03:16,220 --> 00:03:20,226 我想告诉大家的是什么计划 我们要谈谈今天。 50 00:03:20,226 --> 00:03:22,870 我会去对一些历史。 51 00:03:22,870 --> 00:03:25,250 我要解释为什么我们来到这里。 52 00:03:25,250 --> 00:03:27,750 我要谈一些 该计算的历史 53 00:03:27,750 --> 00:03:33,890 你们是哈佛,一些 围绕社会媒体活动, 54 00:03:33,890 --> 00:03:36,200 绿色things--很 热爱一切事物 55 00:03:36,200 --> 00:03:43,640 green-- storage--计算机storage-- 如何混乱影响向外扩展了系统, 56 00:03:43,640 --> 00:03:45,640 和分配系统中尤其如此。 57 00:03:45,640 --> 00:03:48,473 >> 然后我会触及一些 向外扩展的硬件应该是的 58 00:03:48,473 --> 00:03:51,370 要能需要 做计算的规模。 59 00:03:51,370 --> 00:03:55,830 然后最后,我们要 包装了一些真棒科学。 60 00:03:55,830 --> 00:04:00,894 >> 那么,让我们一分钟 看看我们的实际历史。 61 00:04:00,894 --> 00:04:01,810 计算已演变。 62 00:04:01,810 --> 00:04:07,370 如此以来,上世纪60年代,所有的 客场到今天, 63 00:04:07,370 --> 00:04:11,260 我们已经看到,基本上的改变 从集中式计算范围 64 00:04:11,260 --> 00:04:14,679 下放计算,以 协作然后独立 65 00:04:14,679 --> 00:04:15,970 计算和右后卫了。 66 00:04:15,970 --> 00:04:17,709 >> 让我的注释一点点。 67 00:04:17,709 --> 00:04:20,370 当我们第一次开始了与 电脑,我们有大型机。 68 00:04:20,370 --> 00:04:22,824 他们是不相称 昂贵的设备。 69 00:04:22,824 --> 00:04:23,990 一切都应该被共享。 70 00:04:23,990 --> 00:04:25,556 计算很复杂。 71 00:04:25,556 --> 00:04:29,060 你可以看到,它填补室和 有运营商和磁带 72 00:04:29,060 --> 00:04:32,780 和各种whirry的, clicky,spinny设备。 73 00:04:32,780 --> 00:04:39,930 >> 围绕“70年代80年代初,你开始 看传真机的影响。 74 00:04:39,930 --> 00:04:43,620 所以,你开始看到的计算 开始出现回实验室 75 00:04:43,620 --> 00:04:45,880 并成为更接近你。 76 00:04:45,880 --> 00:04:49,800 个人的兴起 计算机,当然 77 00:04:49,800 --> 00:04:57,460 在80年代,早期的一部分 十年来,真的改变了计算。 78 00:04:57,460 --> 00:04:59,570 >> 并有一个线索 标题,因为它 79 00:04:59,570 --> 00:05:04,080 被称为个人计算机, 这意味着它是属于你的。 80 00:05:04,080 --> 00:05:07,630 从而演变 计算继续, 81 00:05:07,630 --> 00:05:10,530 人们意识到,他们的个人 电脑是不是真的够大 82 00:05:10,530 --> 00:05:15,020 要能够做任何好处的话, 或显著优点,在科学。 83 00:05:15,020 --> 00:05:17,790 >> 所以人们开始 开发网络设备 84 00:05:17,790 --> 00:05:21,920 司机能够连接电脑 在一起,以便能够建立集群。 85 00:05:21,920 --> 00:05:26,430 因此这个生时代 在Beowulf集群的。 86 00:05:26,430 --> 00:05:32,470 Linux的分解,以响应 专有操作系统,两者的成本 87 00:05:32,470 --> 00:05:33,650 和复杂性。 88 00:05:33,650 --> 00:05:36,530 >> 然后,在这里,我们有今天, 在那里,再次,我们 89 00:05:36,530 --> 00:05:40,610 面对满房间的电脑 设备和能力 90 00:05:40,610 --> 00:05:44,570 刷卡人的信用卡,并得到 获得这些计算设备, 91 00:05:44,570 --> 00:05:45,290 远程。 92 00:05:45,290 --> 00:05:49,680 >> 所以你可以再看看,在 历史冲击方面 93 00:05:49,680 --> 00:05:52,180 我们如何做计算 今天,它肯定 94 00:05:52,180 --> 00:05:56,090 从机演变 房间全电脑 95 00:05:56,090 --> 00:05:59,160 通过一些个人计算 一路右后卫再次 96 00:05:59,160 --> 00:06:02,400 到机房全电脑。 97 00:06:02,400 --> 00:06:06,620 >> 所以这是我的第一个集群。 98 00:06:06,620 --> 00:06:10,170 所以2000年,我们建立了一个 在欧洲的计算机系统 99 00:06:10,170 --> 00:06:13,900 有效注释 人类基因组。 100 00:06:13,900 --> 00:06:16,521 有很多技术 在右手侧列 101 00:06:16,521 --> 00:06:18,520 还有,不幸的是, 不再和我们在一起。 102 00:06:18,520 --> 00:06:23,460 它传递给了 伟大的技术在天空中。 103 00:06:23,460 --> 00:06:26,610 >> 机器本身可能是 几个像样的笔记本电脑相当于 104 00:06:26,610 --> 00:06:29,020 今天,和那种只是说明你。 105 00:06:29,020 --> 00:06:36,260 但是,我们也仔细标注 人类基因组与这两个保护它 106 00:06:36,260 --> 00:06:43,190 在这个特殊的纸 从关注数据的性质 107 00:06:43,190 --> 00:06:45,380 是公共或私人。 108 00:06:45,380 --> 00:06:48,610 >> 因此,这是真棒,对不对? 109 00:06:48,610 --> 00:06:50,280 所以,我们已经有了一个人类基因组。 110 00:06:50,280 --> 00:06:51,510 我们已经做了计算。 111 00:06:51,510 --> 00:06:53,400 我感觉很高兴自己。 112 00:06:53,400 --> 00:06:59,090 我卷起哈佛大学在2006年, 感觉少了很多高兴的自己。 113 00:06:59,090 --> 00:07:00,210 >> 这是我继承。 114 00:07:00,210 --> 00:07:03,575 这是一个部门 电子邮件和文件服务器。 115 00:07:03,575 --> 00:07:05,450 你可以在这里看到有 磁带一点点 116 00:07:05,450 --> 00:07:07,710 这是用来装系统在一起。 117 00:07:07,710 --> 00:07:09,890 这是我们的许可证和打印服务器。 118 00:07:09,890 --> 00:07:13,990 我敢肯定有可能的密码 对一些中报事贴注。 119 00:07:13,990 --> 00:07:16,560 120 00:07:16,560 --> 00:07:17,360 >> 不真棒。 121 00:07:17,360 --> 00:07:18,530 漂亮远离真棒。 122 00:07:18,530 --> 00:07:22,060 所以,我意识到这一点图 我向您展示在开始 123 00:07:22,060 --> 00:07:25,350 从共享所有权 回到共享, 124 00:07:25,350 --> 00:07:27,930 我们需要改变比赛。 125 00:07:27,930 --> 00:07:31,330 因此,我们改变了比赛 通过提供奖励。 126 00:07:31,330 --> 00:07:34,250 等人,因为这 小百科文章 127 00:07:34,250 --> 00:07:35,990 在这里说,我们的目的的生物。 128 00:07:35,990 --> 00:07:39,250 和激励的研究 结构是必要的,以研究 129 00:07:39,250 --> 00:07:41,100 经济活动。 130 00:07:41,100 --> 00:07:44,580 >> 于是我们开始激励 我们的教师和我们的研究人员。 131 00:07:44,580 --> 00:07:47,720 因此,我们诱因他们 一个真正的大的计算机系统。 132 00:07:47,720 --> 00:07:52,720 因此,在2008年,我们建立了一个4096 处理器机 - 10架, 133 00:07:52,720 --> 00:07:54,470 几百千瓦的功率。 134 00:07:54,470 --> 00:07:56,178 >> 我认为是 有趣的是,它不 135 00:07:56,178 --> 00:07:58,300 无论您身在何处的恶性循环。 136 00:07:58,300 --> 00:08:03,510 同样的电量和 计算时,功率是恒定的。 137 00:08:03,510 --> 00:08:06,270 这是200千瓦我们 正在建造的系统在欧洲。 138 00:08:06,270 --> 00:08:09,770 这是200千瓦 在2008年,而 139 00:08:09,770 --> 00:08:15,820 似乎是[? quanter小?] 大学为基础的计算系统。 140 00:08:15,820 --> 00:08:20,540 >> 所以,哈佛today--快进,我不是 再伤心大熊猫,相当幸福的熊猫。 141 00:08:20,540 --> 00:08:25,860 我们已经60多万人的负载平衡 CPU和爬坡显着。 142 00:08:25,860 --> 00:08:28,780 我们有15个PB的 存储,也节节攀升。 143 00:08:28,780 --> 00:08:30,720 同样,这200千瓦 增量,我们似乎 144 00:08:30,720 --> 00:08:33,000 要补充说, 每6个月左右。 145 00:08:33,000 --> 00:08:35,480 很多很多的虚拟机。 146 00:08:35,480 --> 00:08:37,620 更重要的是, 约1.8兆瓦 147 00:08:37,620 --> 00:08:39,669 研究计算设备。 148 00:08:39,669 --> 00:08:41,820 >> 而且我要来 回到这个以后, 149 00:08:41,820 --> 00:08:46,913 为什么我现在不再是必然 算上我们有多少CPU有, 150 00:08:46,913 --> 00:08:48,980 但有多大的电费。 151 00:08:48,980 --> 00:08:52,690 其他20个这样的专用 研究人员计算。 152 00:08:52,690 --> 00:08:57,250 更重要的是,我们 开始发展我们的GPGPUs。 153 00:08:57,250 --> 00:09:05,030 我是错开多少本 被添加在某一天到一天的基础。 154 00:09:05,030 --> 00:09:07,310 所以,历史课结束了,对不对? 155 00:09:07,310 --> 00:09:11,280 >> 那么,我们如何从这里到达那里? 156 00:09:11,280 --> 00:09:14,560 让我们来看看一些现代 横向扩展计算的例子。 157 00:09:14,560 --> 00:09:18,290 158 00:09:18,290 --> 00:09:23,230 我有点痴迷 大小和社交媒体的比例。 159 00:09:23,230 --> 00:09:30,850 有很多的非常 成功的大规模计算 160 00:09:30,850 --> 00:09:34,820 企业现在在这个星球上, 提供支持和服务 161 00:09:34,820 --> 00:09:36,810 我们大家。 162 00:09:36,810 --> 00:09:39,340 所以这是免责条款。 163 00:09:39,340 --> 00:09:42,990 >> 我想开始一个 在一个Instagram的盎司数。 164 00:09:42,990 --> 00:09:48,336 这实际上不是一个 铅在一个笑话,这是 165 00:09:48,336 --> 00:09:50,460 甚至不是搞笑, 其实,想起来了。 166 00:09:50,460 --> 00:09:52,751 但无论如何,我们要 看看Instagram的盎司。 167 00:09:52,751 --> 00:09:55,260 我们要开始 与“我的蜜蜂和花。” 168 00:09:55,260 --> 00:09:57,600 我在[听不清]村 我花了一点图片 169 00:09:57,600 --> 00:10:00,460 蜜蜂的坐在花。 170 00:10:00,460 --> 00:10:03,270 然后我开始思考 什么,这实际上意味着。 171 00:10:03,270 --> 00:10:07,013 我拍下了这张照片把我的手机 并计算有多少字节在里面, 172 00:10:07,013 --> 00:10:09,070 它是关于256千字节。 173 00:10:09,070 --> 00:10:13,550 这时候我开始,基本上会 填补了5和1/4英寸软盘。 174 00:10:13,550 --> 00:10:15,340 开始想,好吧,这很酷。 175 00:10:15,340 --> 00:10:18,630 >> 我开始看,做 一些研究在网络上。 176 00:10:18,630 --> 00:10:22,490 而且我发现,Instagram的 拥有2亿莫斯。 177 00:10:22,490 --> 00:10:25,105 我本来就不是那 知道什么是MAU了。 178 00:10:25,105 --> 00:10:28,960 和MAU,到这里,是 每月活跃用户。 179 00:10:28,960 --> 00:10:34,270 >> 因此,2亿MAUs--很酷。 180 00:10:34,270 --> 00:10:38,190 20十亿photographs--等 相当多的照片。 181 00:10:38,190 --> 00:10:42,300 6000万新照片 每一天 182 00:10:42,300 --> 00:10:46,990 现身在每张照片约0.002演出。 183 00:10:46,990 --> 00:10:51,290 这是约5千兆字节 磁盘恰到好处那里。 184 00:10:51,290 --> 00:10:55,480 那真的不是中部 什么我们要谈论的话题。 185 00:10:55,480 --> 00:10:57,830 这是小土豆。 186 00:10:57,830 --> 00:11:00,710 或者就像我们说在英国,微小的土豆。 187 00:11:00,710 --> 00:11:05,050 >> 所以,让我们来看看真正的大象 在room--独特的面孔。 188 00:11:05,050 --> 00:11:09,170 再次,让我们衡量 这种新的量子叫MAU。 189 00:11:09,170 --> 00:11:13,260 Facebook上有13十亿毛斯。 190 00:11:13,260 --> 00:11:17,510 WhatsApp的,我已经连 听说直到最近,它的 191 00:11:17,510 --> 00:11:23,260 某种短信服务, 是500万莫斯。 192 00:11:23,260 --> 00:11:26,620 Instagram的,这是我们刚 讲了,2亿毛斯。 193 00:11:26,620 --> 00:11:29,370 和Messenger,这是 另一消息服务, 194 00:11:29,370 --> 00:11:31,120 也是2亿莫斯。 195 00:11:31,120 --> 00:11:35,920 >> 所以总认为,那是关于 2.2十亿用户总量。 196 00:11:35,920 --> 00:11:39,880 显然,有一些重叠,但是这 相当于行星的三分之一。 197 00:11:39,880 --> 00:11:44,270 他们送东西的 一个每天12十亿的消息的区域。 198 00:11:44,270 --> 00:11:46,680 再次,有7只 十亿人在这个星球上。 199 00:11:46,680 --> 00:11:48,550 不是每个人都有的智能手机。 200 00:11:48,550 --> 00:11:53,960 因此,这是疯狂的数字。 201 00:11:53,960 --> 00:12:02,050 >> 而且我会认为这不是 即使有关存储或计算。 202 00:12:02,050 --> 00:12:05,610 并引用这首歌, 它是所有关于那个图。 203 00:12:05,610 --> 00:12:09,045 下面是我们可爱的梅根特雷纳下来 在这里,唱所有的低音。 204 00:12:09,045 --> 00:12:12,570 注意,她也有相当 低音位herself-- 207, 205 00:12:12,570 --> 00:12:16,460 还有2.18亿人都看到了 这位小姐唱她的歌。 206 00:12:16,460 --> 00:12:19,910 >> 所以,我的观点是 它的所有有关的图形。 207 00:12:19,910 --> 00:12:23,480 因此,我们采取了一些开源软件 并开始看一个图表。 208 00:12:23,480 --> 00:12:27,740 这就是LinkedIn,所以这 是Facebook的老人。 209 00:12:27,740 --> 00:12:29,910 所以,这是我的LinkedIn图。 210 00:12:29,910 --> 00:12:34,080 我有1200左右的节点, 所谓的“朋友”。 211 00:12:34,080 --> 00:12:36,360 这里就是我在上面。 212 00:12:36,360 --> 00:12:38,140 而这里的所有的互连。 213 00:12:38,140 --> 00:12:40,570 >> 现在,回想起了Instagram的故事。 214 00:12:40,570 --> 00:12:42,815 其中每一个都是 不仅仅是照片,它 215 00:12:42,815 --> 00:12:46,860 有连接的整个过多 这个特殊的个人之间 216 00:12:46,860 --> 00:12:48,220 和其他许多人。 217 00:12:48,220 --> 00:12:52,190 这是中央一块或者是一个 在图形绘制算法的错误, 218 00:12:52,190 --> 00:12:55,982 或这也许大卫· 马兰,我不知道呢。 219 00:12:55,982 --> 00:12:57,690 所以,你可以重绘 在各种图表 220 00:12:57,690 --> 00:13:02,510 的ways-- gephi.gihub.io就是 你可以拉从该软件。 221 00:13:02,510 --> 00:13:05,410 这真的很酷的是 能够组织社区。 222 00:13:05,410 --> 00:13:08,640 你可以在这里看到,这是哈佛和 其他地方,我已经工作, 223 00:13:08,640 --> 00:13:12,160 因为这是我的工作有关的数据。 224 00:13:12,160 --> 00:13:15,080 >> 所以只是想想复杂 图形和所有数据的 225 00:13:15,080 --> 00:13:17,070 你拉一起。 226 00:13:17,070 --> 00:13:20,870 那么同时,在FriendFace,对不对? 227 00:13:20,870 --> 00:13:24,360 我们看了看Instagram的数据 是五个千兆兆字节的顺序。 228 00:13:24,360 --> 00:13:25,300 没什么大不了的。 229 00:13:25,300 --> 00:13:28,830 还是相当大量的数据,但没有大的 在处理事物的更大的计划。 230 00:13:28,830 --> 00:13:33,850 >> 从这篇文章的老互联网上, “缩放Facebook的数据仓库 231 00:13:33,850 --> 00:13:36,250 300 PB的。“ 232 00:13:36,250 --> 00:13:38,110 这是一个完全不同的 现在改变游戏规则, 233 00:13:38,110 --> 00:13:40,234 你开始的时候 认为数据和图形的 234 00:13:40,234 --> 00:13:41,690 和你有携带。 235 00:13:41,690 --> 00:13:47,480 而他们的高数据增长的 600的顺序T字节一天。 236 00:13:47,480 --> 00:13:52,980 >> 现在,你知道的,好了,then-- 我的意思是,每天600 T字节, 237 00:13:52,980 --> 00:13:55,670 300 petabytes--他们 现在也开始 238 00:13:55,670 --> 00:13:58,550 让很在意 如何保持这种东西 239 00:13:58,550 --> 00:14:01,160 并确保这些数据保持周围。 240 00:14:01,160 --> 00:14:04,630 这位先生在这里, 周杰伦帕瑞克,正在寻找 241 00:14:04,630 --> 00:14:08,250 在如何存储数据的艾字节。 242 00:14:08,250 --> 00:14:10,180 >> 只是对于那些你 谁是一起观看 243 00:14:10,180 --> 00:14:13,940 在家里,一个exabyte-- 10到18。 244 00:14:13,940 --> 00:14:18,210 它有自己的维基百科 页面,这是一个数量那么大。 245 00:14:18,210 --> 00:14:23,120 这是一个什么我们的规模和范围 看,能够存储数据。 246 00:14:23,120 --> 00:14:27,090 和这些家伙不碴周围, 他们正在存储数据的量。 247 00:14:27,090 --> 00:14:29,550 因此,线索一个 他们正在寻找在这里 248 00:14:29,550 --> 00:14:32,185 对于数据中心 所谓冷藏。 249 00:14:32,185 --> 00:14:35,020 250 00:14:35,020 --> 00:14:36,470 >> 这使我是绿色。 251 00:14:36,470 --> 00:14:38,340 这里是克米特。 252 00:14:38,340 --> 00:14:43,050 他和我同意 - 这是非常 很难做到绿色, 253 00:14:43,050 --> 00:14:44,920 但我们给它我们最好的尝试。 254 00:14:44,920 --> 00:14:47,430 克米特不能帮助它,他有 是绿色的时候, 255 00:14:47,430 --> 00:14:49,945 不能把他的绿色岬关闭的。 256 00:14:49,945 --> 00:14:55,410 >> 所以,作为一个concepts-- 一些种核心概念 257 00:14:55,410 --> 00:14:59,510 绿色的,当它 涉及到的计算。 258 00:14:59,510 --> 00:15:05,510 的一个是最重要的 是在产品的寿命。 259 00:15:05,510 --> 00:15:09,405 如果你的产品具有短的寿命, 你不能,顾名思义,是绿色的。 260 00:15:09,405 --> 00:15:13,280 能量带到制造 磁盘驱动器,一个主板,计算机 261 00:15:13,280 --> 00:15:17,890 系统,片剂,不管它可 是,你的系统寿命 262 00:15:17,890 --> 00:15:21,700 是的,你可以如何绿色是一个重要组成部分。 263 00:15:21,700 --> 00:15:27,960 >> 最重要的部分,因为大家 正在建设的软件algorithms-- 264 00:15:27,960 --> 00:15:30,455 算法的部分 单词软件,对不对? 265 00:15:30,455 --> 00:15:34,000 所以,你的算法设计 无论从绝对关键 266 00:15:34,000 --> 00:15:43,080 如何你要能够使 快速而准确的计算,以使用 267 00:15:43,080 --> 00:15:44,710 量最少的能量成为可能。 268 00:15:44,710 --> 00:15:47,280 我会得到这一点。 269 00:15:47,280 --> 00:15:51,270 >> 数据中心设计 - 你见过 我们已经有数千 270 00:15:51,270 --> 00:15:54,870 在数千台机器,坐在 悄悄地在小的,黑暗的角落 271 00:15:54,870 --> 00:15:57,760 世界上运算。 272 00:15:57,760 --> 00:16:01,670 资源allocation--怎么弄 向计算,到存储, 273 00:16:01,670 --> 00:16:03,840 通过网络。 274 00:16:03,840 --> 00:16:08,530 操作系统是一个关键部分 此,很多虚拟化 275 00:16:08,530 --> 00:16:12,080 能够将更多和 多个计算成一个小的空间。 276 00:16:12,080 --> 00:16:15,530 >> 我给你一个小例子 从研究的计算。 277 00:16:15,530 --> 00:16:18,220 我们需要更多的平安,更 动力,和多个管道。 278 00:16:18,220 --> 00:16:21,030 我们需要更多更大, 更好,更快的计算机, 279 00:16:21,030 --> 00:16:23,390 并且需要使用更少的果汁。 280 00:16:23,390 --> 00:16:26,856 我们不能工作了如何做到这一点。 281 00:16:26,856 --> 00:16:29,980 我不知道是否包括hashtag gowest作为 可能使用过的卡戴珊, 282 00:16:29,980 --> 00:16:32,560 但无论如何,gowest。 283 00:16:32,560 --> 00:16:33,220 而我们做到了。 284 00:16:33,220 --> 00:16:36,610 >> 我们拿起我们的操作 我们再搬出来 285 00:16:36,610 --> 00:16:39,660 西方马萨诸塞 在一个小磨房镇 286 00:16:39,660 --> 00:16:45,000 所谓的霍利奥克,北部 的Chikopee和斯普林菲尔德。 287 00:16:45,000 --> 00:16:49,280 我们这样做了几个原因。 288 00:16:49,280 --> 00:16:55,150 最主要的是,我们 有一个非常,非常大的水坝。 289 00:16:55,150 --> 00:17:00,080 这非常大的水坝能 把精力了30多万千瓦, 290 00:17:00,080 --> 00:17:02,980 并且它没有得到充分利用的时间。 291 00:17:02,980 --> 00:17:06,170 >> 更重要的是,我们也有 一个非常复杂的网络 292 00:17:06,170 --> 00:17:07,254 这是已经到位。 293 00:17:07,254 --> 00:17:09,711 如果你看一下去哪儿网 去美国, 294 00:17:09,711 --> 00:17:11,230 它遵循所有的火车轨道。 295 00:17:11,230 --> 00:17:14,290 这件特殊的网络是 我们的同事和朋友资 296 00:17:14,290 --> 00:17:16,480 在美国马萨诸塞州 技术研究所, 297 00:17:16,480 --> 00:17:19,720 它是基本建成 所有的出路路线90。 298 00:17:19,720 --> 00:17:24,760 >> 所以我们有一个大的河流打勾,90路 滴答,我们有100英里短路径, 299 00:17:24,760 --> 00:17:26,960 及约1000英里长的路径。 300 00:17:26,960 --> 00:17:29,890 我们也要做一个非常大的 网络接头,你可以在这里看到, 301 00:17:29,890 --> 00:17:32,990 基本上放在一个环节, 能够连接到霍利奥克, 302 00:17:32,990 --> 00:17:36,390 但我们有所有必要的 infrastructure--平,电力,管道。 303 00:17:36,390 --> 00:17:37,280 生活是不错的。 304 00:17:37,280 --> 00:17:38,980 再次,大水坝。 305 00:17:38,980 --> 00:17:42,120 >> 因此,我们基本上建立了马萨诸塞 绿色高性能计算 306 00:17:42,120 --> 00:17:42,850 中心。 307 00:17:42,850 --> 00:17:46,580 这是一个热爱劳动通过五 universities--麻省理工学院,哈佛大学,麻省大学, 308 00:17:46,580 --> 00:17:47,870 东北和BU。 309 00:17:47,870 --> 00:17:49,554 5兆瓦一天一个连接的负载。 310 00:17:49,554 --> 00:17:51,845 我们做了各种聪明 与禁区省煤器 311 00:17:51,845 --> 00:17:53,585 让事情变得绿色环保。 312 00:17:53,585 --> 00:18:03,330 我们内置了640多架, 专门用于研究计算。 313 00:18:03,330 --> 00:18:08,770 >> 这是一个古老的棕地,所以我们 有一些回收和一些整洁行动 314 00:18:08,770 --> 00:18:10,500 和一些清理的部位。 315 00:18:10,500 --> 00:18:13,590 然后我们开始 建工厂 316 00:18:13,590 --> 00:18:19,710 并且,boom--可爱的设施与 能够运行沙盒计算, 317 00:18:19,710 --> 00:18:24,430 有会议和研讨会, 也是一个庞大的数据中心地板。 318 00:18:24,430 --> 00:18:26,007 >> 这是我良好的自我。 319 00:18:26,007 --> 00:18:27,590 我明明穿着同样的外套。 320 00:18:27,590 --> 00:18:29,423 我也许只有一个 外套,但有我 321 00:18:29,423 --> 00:18:34,030 和约翰Goodhue--他是 在Center--执行董事 322 00:18:34,030 --> 00:18:36,740 站立在机器室 地板,正如你所看到的, 323 00:18:36,740 --> 00:18:40,560 是非常戏剧性的,而且它 源远流长,很长的路要走。 324 00:18:40,560 --> 00:18:44,830 >> 我经常玩游戏驾驶 从波士顿出来霍利奥克, 325 00:18:44,830 --> 00:18:47,260 假装我是一个TCP / IP数据包。 326 00:18:47,260 --> 00:18:54,290 我也担心我的延时 在我的车开车过来。 327 00:18:54,290 --> 00:18:56,690 所以这是一块绿地。 328 00:18:56,690 --> 00:19:00,070 所以让我们只花一分钟 想想栈。 329 00:19:00,070 --> 00:19:04,060 所以,我们正在努力非常认真地 有效地建立数据中心, 330 00:19:04,060 --> 00:19:08,770 计算效率,做好 选择为计算设备 331 00:19:08,770 --> 00:19:12,060 并提供更多 重要的是,我们的应用程序, 332 00:19:12,060 --> 00:19:17,860 是它的消息服务 或科学应用。 333 00:19:17,860 --> 00:19:19,110 >> 因此,这里的堆栈。 334 00:19:19,110 --> 00:19:22,762 这样的物理层中,所有的 一路经过application-- 335 00:19:22,762 --> 00:19:25,220 希望这是要 是你的,当然很大一部分。 336 00:19:25,220 --> 00:19:31,450 OSI七层模型基本上是, 你会生活,吃饭,呼吸 337 00:19:31,450 --> 00:19:35,270 这在整个职业生涯计算。 338 00:19:35,270 --> 00:19:37,800 这整个的物理概念 infrastructure--电线, 339 00:19:37,800 --> 00:19:40,080 电缆,数据中心,链接。 340 00:19:40,080 --> 00:19:42,190 而这仅仅是描述网络。 341 00:19:42,190 --> 00:19:44,780 >> 在这里,没错,是很明显, 这是一个古老的幻灯片, 342 00:19:44,780 --> 00:19:49,342 因为这应该说是HTTP,因为 无人问津简单的邮件 343 00:19:49,342 --> 00:19:50,550 传输协议了。 344 00:19:50,550 --> 00:19:53,960 这一切都发生在HTTP的空间。 345 00:19:53,960 --> 00:19:55,850 所以这是堆栈的一层。 346 00:19:55,850 --> 00:19:59,460 >> 这里是另一套书库,在这里你的 有一个服务器,主机,虚拟机管理程序, 347 00:19:59,460 --> 00:20:02,470 一个客人,二进制库, 然后您的应用程序。 348 00:20:02,470 --> 00:20:06,070 或者,在这种情况下,该装置 驱动程序,Linux内核,本机C, 349 00:20:06,070 --> 00:20:08,080 Java虚拟机 Java的API,那么Java 350 00:20:08,080 --> 00:20:11,220 的应用程序,等等,等等。 351 00:20:11,220 --> 00:20:14,090 这是一个描述 的一个虚拟机。 352 00:20:14,090 --> 00:20:15,450 >> 圣栈,蝙蝠侠! 353 00:20:15,450 --> 00:20:18,260 想想这 多少计算方面 354 00:20:18,260 --> 00:20:20,850 你需要从获得 这里发生了什么, 355 00:20:20,850 --> 00:20:23,110 一路到顶部 该堆栈,以再 356 00:20:23,110 --> 00:20:26,840 可以做您的实际 交付的应用程序。 357 00:20:26,840 --> 00:20:29,130 >> 如果你种 倒带并开始思考 358 00:20:29,130 --> 00:20:33,450 关于如何才能提供 浮点运算, 359 00:20:33,450 --> 00:20:37,650 您的浮点运算是总和 芯的插座,数 360 00:20:37,650 --> 00:20:44,490 在插座,一个时钟,这是 能多快的时钟turnover-- 361 00:20:44,490 --> 00:20:47,490 4千兆赫,2 gigahertz--然后数 362 00:20:47,490 --> 00:20:50,890 操作即可 做在一个给定的赫兹。 363 00:20:50,890 --> 00:20:54,350 >> 所以今天的微处理器 四到6 FLOPS做 364 00:20:54,350 --> 00:20:55,400 每个时钟周期。 365 00:20:55,400 --> 00:20:59,810 所以单核2.5演出时钟 有一个理论性能 366 00:20:59,810 --> 00:21:03,490 约一万FLOP,给予或采取。 367 00:21:03,490 --> 00:21:05,940 >> 但是,正如一切, 我们有选择。 368 00:21:05,940 --> 00:21:12,280 所以和英特尔酷睿2,Nehalem处理器 Sandy Bridge的,Haswell的,AMD, 369 00:21:12,280 --> 00:21:13,920 把你的choices--的英特尔Atom。 370 00:21:13,920 --> 00:21:17,670 所有这些处理器架构 都具有略微不同的方式 371 00:21:17,670 --> 00:21:19,650 是能够加 两个数字在一起, 372 00:21:19,650 --> 00:21:23,520 这基本上是 他们的生活目的。 373 00:21:23,520 --> 00:21:24,535 一定很辛苦。 374 00:21:24,535 --> 00:21:27,100 还有数以百万计人坐 在数据中心,现在虽然。 375 00:21:27,100 --> 00:21:30,410 >> 索尔,触发器每watt-- 这是一件大事。 376 00:21:30,410 --> 00:21:37,780 所以,如果我想获得更多的这种 打通这个堆栈,更快, 377 00:21:37,780 --> 00:21:41,800 我得对工作有多少 浮点运算的第二 378 00:21:41,800 --> 00:21:43,770 我能做的,然后给他们瓦。 379 00:21:43,770 --> 00:21:46,160 幸运的是,乡亲 已经想到这个问题。 380 00:21:46,160 --> 00:21:49,140 >> 所以这是一个大的 大赛每年都看 381 00:21:49,140 --> 00:21:52,310 谁可以建立最快的计算机 可对角化的矩阵。 382 00:21:52,310 --> 00:21:53,980 这就是所谓的500强。 383 00:21:53,980 --> 00:21:56,420 他们选择从顶部 最好的500台电脑 384 00:21:56,420 --> 00:21:58,610 在这个星球上,能 矩阵对角化。 385 00:21:58,610 --> 00:22:00,760 你会得到一些惊人的结果。 386 00:22:00,760 --> 00:22:04,660 >> 很多这些机器都是 在10和20兆瓦。 387 00:22:04,660 --> 00:22:09,380 他们可以对角化矩阵 相称快。 388 00:22:09,380 --> 00:22:13,550 它们不一定角化 他们尽可能高效的每瓦, 389 00:22:13,550 --> 00:22:18,060 所以有这个大推一下 什么是绿色500强名单会是什么样子。 390 00:22:18,060 --> 00:22:20,360 这里是从6月的列表。 391 00:22:20,360 --> 00:22:22,410 应该有一个新的很快。 392 00:22:22,410 --> 00:22:26,590 >> 并呼吁out--我带你去 这个特定列表的顶部。 393 00:22:26,590 --> 00:22:32,187 有两个具体machines-- 1 从东京技术研究所 394 00:22:32,187 --> 00:22:34,520 ,一名来自剑桥 大学在英国。 395 00:22:34,520 --> 00:22:37,700 而这些有相当惊人 每瓦比大型无人问津。 396 00:22:37,700 --> 00:22:42,620 这其中的4389,以及 下一个下来就是3631。 397 00:22:42,620 --> 00:22:47,660 >> 我将解释之间的差异 这两个,在接下来的幻灯片。 398 00:22:47,660 --> 00:22:51,320 但这些都是这些 中等规模测试集群。 399 00:22:51,320 --> 00:22:54,732 这些只是34 千瓦或52千瓦。 400 00:22:54,732 --> 00:22:56,940 还有一些较大的 这里 - 这个特殊的 401 00:22:56,940 --> 00:22:58,860 在瑞士国家 超级计算机中心。 402 00:22:58,860 --> 00:23:00,693 该带回家的消息 这是我们 403 00:23:00,693 --> 00:23:04,270 试图找到电脑 可以有效地工作。 404 00:23:04,270 --> 00:23:09,860 >> 所以,让我们来看看这上面 1,所谓讨人喜欢地的肯德基。 405 00:23:09,860 --> 00:23:12,960 和广告在这里一点点。 406 00:23:12,960 --> 00:23:15,730 这种特殊的食品公司 没有任何与此有关。 407 00:23:15,730 --> 00:23:18,240 这是一个事实,即 这个特殊的系统 408 00:23:18,240 --> 00:23:23,830 浸泡在一个非常 聪明油基化合物。 409 00:23:23,830 --> 00:23:27,590 所以他们得到了他们的 鸡油炸绰号 410 00:23:27,590 --> 00:23:30,040 当他们第一次开始 建立这些类型的系统。 411 00:23:30,040 --> 00:23:32,740 >> 但基本上,他们已经采取了什么 这里是一个数量的叶片, 412 00:23:32,740 --> 00:23:37,560 把他们在这 复杂的矿物油, 413 00:23:37,560 --> 00:23:40,979 然后制定出如何让所有 网络进出的。 414 00:23:40,979 --> 00:23:42,895 然后,不仅如此, 他们已经把它放在外面等 415 00:23:42,895 --> 00:23:46,095 它可以利用外部空气冷却。 416 00:23:46,095 --> 00:23:47,520 这是相当令人印象深刻。 417 00:23:47,520 --> 00:23:49,630 所以,你所要做的一切 这种有心计 418 00:23:49,630 --> 00:23:53,280 要能得到这个数额 计算交付的小功率。 419 00:23:53,280 --> 00:23:57,360 >> 而且你可以看到这是形状 那里的东西都往。 420 00:23:57,360 --> 00:24:01,240 目前的挑战是,经常风 冷却经济规模 421 00:24:01,240 --> 00:24:08,459 并推动了很多 双方定期计算的发展, 422 00:24:08,459 --> 00:24:09,750 和高性能计算。 423 00:24:09,750 --> 00:24:11,080 所以,这是非常具有破坏性。 424 00:24:11,080 --> 00:24:13,280 我认为这是令人着迷的。 425 00:24:13,280 --> 00:24:15,530 这是一个有点乱,当你 尝试交换的磁盘驱动器, 426 00:24:15,530 --> 00:24:18,090 但它是一个很酷的想法。 427 00:24:18,090 --> 00:24:22,200 >> 所以,不仅如此,还有 一大堆工作 428 00:24:22,200 --> 00:24:25,450 正在围绕我们是 调用Open计算项目。 429 00:24:25,450 --> 00:24:29,400 因此,更多的是 一点点后。 430 00:24:29,400 --> 00:24:32,740 不过,业内开始 认识到每瓦FLOPS 431 00:24:32,740 --> 00:24:33,670 正在变得越来越重要。 432 00:24:33,670 --> 00:24:39,256 而你,作为人在这里,因为 您设计的算法 433 00:24:39,256 --> 00:24:41,130 你设计你的 代码中,你应该知道 434 00:24:41,130 --> 00:24:43,620 你的代码可以 有一个连锁效应。 435 00:24:43,620 --> 00:24:48,380 >> 当马克坐在这里他 宿舍里写的Facebook 1.0, 436 00:24:48,380 --> 00:24:51,050 我敢肯定他有一个观点 这将是巨大的。 437 00:24:51,050 --> 00:24:54,945 不过,这将是多么巨大的是在 环境是一个大dealio。 438 00:24:54,945 --> 00:24:58,340 所以你们大家都可以的 拿出算法 439 00:24:58,340 --> 00:25:01,370 这可能是下一个挑战性 乡亲像我这样的事情, 440 00:25:01,370 --> 00:25:02,700 尝试运行系统。 441 00:25:02,700 --> 00:25:07,360 >> 因此,让我们只是想想 真正的世界大国的限制。 442 00:25:07,360 --> 00:25:09,930 本文由Landauer-- 是不是一个新事物。 443 00:25:09,930 --> 00:25:12,480 1961年该出版 在IBM杂志。 444 00:25:12,480 --> 00:25:15,590 这是典型 “不可逆性与热 445 00:25:15,590 --> 00:25:17,630 新一代的计算过程。“ 446 00:25:17,630 --> 00:25:22,050 因此,他认为, 机器难免 447 00:25:22,050 --> 00:25:25,070 执行逻辑功能 不具有单值的倒数。 448 00:25:25,070 --> 00:25:29,130 >> 这样的整体的一部分 这是早在上世纪60年代, 449 00:25:29,130 --> 00:25:31,890 乡亲们知道,这是 会成为一个问题。 450 00:25:31,890 --> 00:25:37,080 等限制的法律说25 ℃,一种典型的房间 451 00:25:37,080 --> 00:25:41,120 温度时,限制 代表0.1电子伏特。 452 00:25:41,120 --> 00:25:44,920 但在理论上,这是 理论,计算机存储器, 453 00:25:44,920 --> 00:25:51,410 在这个极限操作可能 在同一十亿位的第二个改变。 454 00:25:51,410 --> 00:25:54,620 >> 我不知道你,但不 遇到一对多十亿位 455 00:25:54,620 --> 00:25:57,190 第二数据速率交换。 456 00:25:57,190 --> 00:26:01,360 这个论点有只 2.8万亿功率的瓦 457 00:26:01,360 --> 00:26:03,180 应该永远被扩大。 458 00:26:03,180 --> 00:26:08,160 >> 好吧,现实世界example-- 这是我的电费。 459 00:26:08,160 --> 00:26:10,347 我百分之65% 那个可爱的数据中心 460 00:26:10,347 --> 00:26:11,930 我发现你,在这个特定的时间。 461 00:26:11,930 --> 00:26:15,520 这是早在去年六月。 462 00:26:15,520 --> 00:26:21,300 我已经采取的是旧版本,让我们 那种能和匿名一点。 463 00:26:21,300 --> 00:26:25,470 我是耗资45,000 一个月能有。 464 00:26:25,470 --> 00:26:34,990 >> 所以在那里的原因是,我们 有超过50,000流程的房间。 465 00:26:34,990 --> 00:26:38,110 所以,你能想象你自己 住宅电费 466 00:26:38,110 --> 00:26:39,540 是高? 467 00:26:39,540 --> 00:26:46,180 但它是一个1.99亿 瓦特小时不超过一个月。 468 00:26:46,180 --> 00:26:51,670 >> 所以,我提出的问题是,你能 想象扎克伯格的电费? 469 00:26:51,670 --> 00:26:54,730 煤矿是相当大的,而且我奋斗。 470 00:26:54,730 --> 00:26:56,600 而且我不是一个人在这。 471 00:26:56,600 --> 00:26:59,450 有很多人 与大型数据中心。 472 00:26:59,450 --> 00:27:04,800 所以,我想,全disclosure-- 我的Facebook好友一点点奇怪。 473 00:27:04,800 --> 00:27:07,900 >> 所以,我的Facebook好友是 所述的Prineville数据中心, 474 00:27:07,900 --> 00:27:14,030 这是Facebook的最大的之一, 最新的,能量最低的数据中心。 475 00:27:14,030 --> 00:27:19,360 他们张贴到我,这样的事情 用电效能, 476 00:27:19,360 --> 00:27:24,020 在如何有效的数据 中心与你多少精力是 477 00:27:24,020 --> 00:27:26,370 投入是多少 水是他们用,有什么 478 00:27:26,370 --> 00:27:27,810 的湿度和温度。 479 00:27:27,810 --> 00:27:29,980 >> 他们有这些 可爱的,可爱的地块。 480 00:27:29,980 --> 00:27:32,600 我认为这是一个 真棒的Facebook页面, 481 00:27:32,600 --> 00:27:35,400 但我想我是有点怪异。 482 00:27:35,400 --> 00:27:39,930 >> 因此,人们更省电的事情, 研究计算,我做 483 00:27:39,930 --> 00:27:44,060 是显著不同 什么Facebook和雅虎和谷歌 484 00:27:44,060 --> 00:27:50,020 和其它点播,充分, 始终可用的服务。 485 00:27:50,020 --> 00:27:53,530 所以,我的优势在于,当 ISO新England--和ISO新英格兰 486 00:27:53,530 --> 00:27:58,910 有助于建立能源 率的区域。 487 00:27:58,910 --> 00:28:01,110 >> 它说,它的扩展 一个请求给消费者 488 00:28:01,110 --> 00:28:05,870 自愿节约能量高, 因为高的温度和湿度。 489 00:28:05,870 --> 00:28:08,680 这又回到了七月的第18位。 490 00:28:08,680 --> 00:28:12,600 所以,我愉快地鸣叫回来,嘿, ISO新英格兰,绿色哈佛大学。 491 00:28:12,600 --> 00:28:14,880 我们正在做我们的一部分了 在这里研究计算。 492 00:28:14,880 --> 00:28:16,760 这是因为我们正在做的科学。 493 00:28:16,760 --> 00:28:20,380 >> 并不亚于人说科学 不夜城,科学可以等待。 494 00:28:20,380 --> 00:28:25,030 所以我们能够停顿我们 系统,利用分级费率 495 00:28:25,030 --> 00:28:30,550 我们的能源法案,并 帮助整个新英格兰 496 00:28:30,550 --> 00:28:35,910 按地区脱落 负载很多兆瓦。 497 00:28:35,910 --> 00:28:40,020 所以这是唯一的事情, 关于不同科学计算数据 498 00:28:40,020 --> 00:28:48,890 中心和那些 全面投产24/7。 499 00:28:48,890 --> 00:28:51,670 >> 因此,让我们只是把另一个齿轮在这里。 500 00:28:51,670 --> 00:28:55,170 所以,我想讨论 乱象一点点。 501 00:28:55,170 --> 00:28:59,900 我希望把它放在 存储的赞助。 502 00:28:59,900 --> 00:29:03,150 因此,对于那些那种 被挣扎 503 00:29:03,150 --> 00:29:08,680 让他们的周围有什么高数量的头 存储的模样,这样的一个例子。 504 00:29:08,680 --> 00:29:11,660 这是东西排序 我处理所有的时间。 505 00:29:11,660 --> 00:29:15,550 >> 这些小家伙的每一个 是四TB的硬盘驱动器, 506 00:29:15,550 --> 00:29:17,420 这样你就可以种数起来。 507 00:29:17,420 --> 00:29:21,370 现在我们正在之间 1至1和1/2 PB的 508 00:29:21,370 --> 00:29:22,970 在一个标准的行业机架。 509 00:29:22,970 --> 00:29:26,430 我们有房和客房,为你 在早期的画面,约翰看见 510 00:29:26,430 --> 00:29:31,230 而我,充满这些设备的机架。 511 00:29:31,230 --> 00:29:40,400 因此,它变得非常,非常容易 建立海量存储阵列 512 00:29:40,400 --> 00:29:44,140 >> 它主要是容易的Unix里面 种计数事情是如何。 513 00:29:44,140 --> 00:29:48,270 因此,这是计算有多少 MAU点都有我到了那里。 514 00:29:48,270 --> 00:29:50,880 所以这是423拦截点。 515 00:29:50,880 --> 00:29:55,660 然后,如果我跑了一些粗略的awk,我 可以加起来,在这种特定的系统, 516 00:29:55,660 --> 00:29:59,080 有7.3千兆字节 的可用存储器。 517 00:29:59,080 --> 00:30:01,350 >> 所以这是一个很大的东西。 518 00:30:01,350 --> 00:30:03,030 和存储真的很难。 519 00:30:03,030 --> 00:30:06,850 然而,由于某种原因, 这是一个行业的发展趋势。 520 00:30:06,850 --> 00:30:11,500 每当我跟我们的研究人员 而我们的教师说, 521 00:30:11,500 --> 00:30:14,180 哎,我可以为你运行的存储。 522 00:30:14,180 --> 00:30:17,690 不幸的是,我要 恢复所述存储的成本。 523 00:30:17,690 --> 00:30:19,430 我得到这个业务。 524 00:30:19,430 --> 00:30:23,300 人们引用新蛋 或者它们引用斯台普斯 525 00:30:23,300 --> 00:30:27,040 或者他们可以买多少一 单TB的磁盘驱动器。 526 00:30:27,040 --> 00:30:29,390 >> 所以,你会注意到 在这里,有一个线索。 527 00:30:29,390 --> 00:30:31,310 有在这里一个磁盘驱动器。 528 00:30:31,310 --> 00:30:33,290 如果我们回去,我有很多。 529 00:30:33,290 --> 00:30:36,130 不仅我有很多,我有 复杂的互连 530 00:30:36,130 --> 00:30:38,750 要能够缝合 这些东西放在一起。 531 00:30:38,750 --> 00:30:44,080 因此,与这些大的风险 存储阵列是不小的。 532 00:30:44,080 --> 00:30:46,370 >> 事实上,我们走上 互联网和我们写 533 00:30:46,370 --> 00:30:51,670 约一个善意的一个小故事, 研究温和的导演 534 00:30:51,670 --> 00:30:54,640 computing--恰好有一个 奇怪的英语accent--尝试 535 00:30:54,640 --> 00:30:59,930 解释给研究者什么 实际上没有下划线备份文件夹 536 00:30:59,930 --> 00:31:01,070 意思。 537 00:31:01,070 --> 00:31:05,690 这是相当长的,小故事, 一个好的4分钟发现。 538 00:31:05,690 --> 00:31:09,380 >> 而且请注意,我有一个可怕的 很多比小姐少空间 539 00:31:09,380 --> 00:31:11,800 那唱所有的低音。 540 00:31:11,800 --> 00:31:13,910 我们相当多的帐户下。 541 00:31:13,910 --> 00:31:16,160 但无论如何,这是一个 思考重要的事情, 542 00:31:16,160 --> 00:31:18,532 在什么可能出问题条款。 543 00:31:18,532 --> 00:31:20,990 所以,如果我得到一个磁盘驱动器, 我把它扔在Unix机器, 544 00:31:20,990 --> 00:31:24,300 我开始写东西出来, 有一块磁铁,有一个驱动器磁头, 545 00:31:24,300 --> 00:31:30,150 有表面上,一个或一个零 被写在给该设备。 546 00:31:30,150 --> 00:31:32,180 >> Motors-- spinny,惊慌 事情总是打破。 547 00:31:32,180 --> 00:31:33,490 想想事情打破。 548 00:31:33,490 --> 00:31:35,170 这一直是spinny,惊慌的事情。 549 00:31:35,170 --> 00:31:38,560 打印机,磁盘驱动器, 机动车辆等。 550 00:31:38,560 --> 00:31:40,590 任何移动很可能会打破。 551 00:31:40,590 --> 00:31:42,575 >> 所以,你需要电机,你 需要驱动器固件, 552 00:31:42,575 --> 00:31:47,110 需要的SAS / SATA控制器,电线, 固件上的SAS / SATA控制器, 553 00:31:47,110 --> 00:31:48,530 低水平块。 554 00:31:48,530 --> 00:31:54,580 选择你的存储控制器的文件 系统的代码,哪一个可能是, 555 00:31:54,580 --> 00:31:56,780 你怎么缝的东西放在一起。 556 00:31:56,780 --> 00:32:00,956 和您的虚拟内存管理器 页面,DRAM获取并存储。 557 00:32:00,956 --> 00:32:02,705 然后,你再弄 堆栈,这是一种 558 00:32:02,705 --> 00:32:05,440 倒在这个名单 1,算法用户。 559 00:32:05,440 --> 00:32:09,050 >> 如果你乘这一点, 了,我不知道有多少, 560 00:32:09,050 --> 00:32:11,640 有很多的地方 那里的东西可以横着走。 561 00:32:11,640 --> 00:32:14,430 我的意思是,这是有关数学的一个例子。 562 00:32:14,430 --> 00:32:18,070 但它是一种乐趣,想想 有多少种事情会出错, 563 00:32:18,070 --> 00:32:21,650 只是为一个磁盘驱动器。 564 00:32:21,650 --> 00:32:25,440 我们已经在300千兆兆字节,所以 想象的磁盘驱动器的数量 565 00:32:25,440 --> 00:32:27,741 你需要在300千兆字节 可能出错。 566 00:32:27,741 --> 00:32:28,240 567 00:32:28,240 --> 00:32:30,390 不仅that--,这样的存储。 568 00:32:30,390 --> 00:32:34,220 并且暗示了 人,我倒要看看 569 00:32:34,220 --> 00:32:38,780 进入舞台左侧,这 是混沌猴子。 570 00:32:38,780 --> 00:32:43,140 因此,在某一点,它会变得 大于刚在磁盘驱动器 571 00:32:43,140 --> 00:32:43,920 问题。 572 00:32:43,920 --> 00:32:50,610 >> 等等,这些优良的女士和绅士 运行流媒体视频服务 573 00:32:50,610 --> 00:32:55,430 意识到自己的电脑是 也巨大,也很复杂 574 00:32:55,430 --> 00:33:00,010 并且也提供服务 一个可怕的人很多。 575 00:33:00,010 --> 00:33:05,180 他们有3700万members--和 这张幻灯片的,也许一年半载old-- 576 00:33:05,180 --> 00:33:07,350 成千上万的设备。 577 00:33:07,350 --> 00:33:10,810 还有数十亿小时的视频。 578 00:33:10,810 --> 00:33:13,600 他们每天记录数十亿的事件。 579 00:33:13,600 --> 00:33:17,330 >> 你可以看到,大多数人看 后来在电视上在晚上, 580 00:33:17,330 --> 00:33:19,429 它远远超过了一切。 581 00:33:19,429 --> 00:33:21,220 因此,他们希望 能够确保 582 00:33:21,220 --> 00:33:24,854 该服务是和 可靠并为他们工作。 583 00:33:24,854 --> 00:33:27,020 于是,他们想出了这个 所谓混沌猴子的事。 584 00:33:27,020 --> 00:33:29,000 这是一个软件 其中,当你觉得 585 00:33:29,000 --> 00:33:34,190 关于谈论称号 这整个介绍, 586 00:33:34,190 --> 00:33:36,530 向外扩展意味着你 要测试这个东西。 587 00:33:36,530 --> 00:33:38,585 这已经不是什么好仅仅有 一万台机器。 588 00:33:38,585 --> 00:33:40,460 因此,对好的事 这是,混沌猴 589 00:33:40,460 --> 00:33:43,090 是一种服务,它 标识系统组 590 00:33:43,090 --> 00:33:47,220 并随机终止1 该系统中的一组。 591 00:33:47,220 --> 00:33:48,429 真棒。 592 00:33:48,429 --> 00:33:50,220 所以我不知道 你,但是如果我有生以来 593 00:33:50,220 --> 00:33:52,990 建,它依赖于其他的系统 系统互相交谈, 594 00:33:52,990 --> 00:33:55,865 你把其中一人出去, 整个事情的工作的可能性, 595 00:33:55,865 --> 00:33:57,130 迅速减小。 596 00:33:57,130 --> 00:34:00,475 >> 所以这一块的软件运行 围绕Netflix的基础设施。 597 00:34:00,475 --> 00:34:03,100 幸运的是,它说,它只能运行在 营业时间的意图 598 00:34:03,100 --> 00:34:05,810 工程师会 警惕并能够作出回应。 599 00:34:05,810 --> 00:34:08,020 所以这些都是类型 的事情,我们现在是 600 00:34:08,020 --> 00:34:13,360 不必做扰乱我们的计算 环境,引进混乱 601 00:34:13,360 --> 00:34:15,739 并引入了复杂性。 602 00:34:15,739 --> 00:34:19,139 >> 那么,谁在自己的权利 心态,会心甘情愿选择 603 00:34:19,139 --> 00:34:22,540 用混沌猴子的工作? 604 00:34:22,540 --> 00:34:24,150 死守,他似乎指向了我。 605 00:34:24,150 --> 00:34:28,719 嗯,我想我should--可爱。 606 00:34:28,719 --> 00:34:32,909 但问题是,你 不要选择。 607 00:34:32,909 --> 00:34:37,440 混沌猴子,你 可以看到,选择你。 608 00:34:37,440 --> 00:34:42,650 >> 这与计算问题 在规模,你不能避免这种情况。 609 00:34:42,650 --> 00:34:49,989 这是复杂的必然性 我们的发展规模和, 610 00:34:49,989 --> 00:34:53,280 在某些方面的专业知识计​​算。 611 00:34:53,280 --> 00:34:55,510 请记住,这是 有一点要记住, 612 00:34:55,510 --> 00:35:00,030 混沌猴子爱 snowflakes--爱雪花。 613 00:35:00,030 --> 00:35:03,470 一个snowflake--我们已经解释了 混沌Monkey--但雪花 614 00:35:03,470 --> 00:35:09,630 是一个服务器,它是唯一的,并 特别细腻和个人 615 00:35:09,630 --> 00:35:11,770 并且永远不会被再现。 616 00:35:11,770 --> 00:35:14,790 >> 我们经常会发现雪花 服务于我们的环境。 617 00:35:14,790 --> 00:35:16,700 我们总是尝试 雪花融化的服务。 618 00:35:16,700 --> 00:35:18,880 但是,如果你找到一个服务器 在您的环境 619 00:35:18,880 --> 00:35:23,240 即长寿临界 你的组织,它融化, 620 00:35:23,240 --> 00:35:25,300 你不能把它重新结合在一起。 621 00:35:25,300 --> 00:35:28,071 因此,混沌猴子的工作是 去终止实例。 622 00:35:28,071 --> 00:35:30,820 如果混沌猴子融化 雪花,你过来,你就大功告成了。 623 00:35:30,820 --> 00:35:34,390 624 00:35:34,390 --> 00:35:37,950 我想谈谈 有些硬件我们 625 00:35:37,950 --> 00:35:40,415 看到在排序方面 向外扩展的活动了。 626 00:35:40,415 --> 00:35:43,810 和一些独特的东西,是在 和周围的科学活性。 627 00:35:43,810 --> 00:35:46,990 我们现在开始看到,记住 这个单位的问题,这架? 628 00:35:46,990 --> 00:35:51,780 所以这是GPGPUs--所以一般的机架 目的图形处理单元。 629 00:35:51,780 --> 00:35:55,790 >> 我们这些位于我们的数据 中心,100个左右英里远。 630 00:35:55,790 --> 00:35:59,780 这种特殊的架 大约是96万亿FLOPS 631 00:35:59,780 --> 00:36:04,090 单精度运算能力 提供出它的背面。 632 00:36:04,090 --> 00:36:10,530 而我们为了130多元 在一个实例卡 633 00:36:10,530 --> 00:36:16,620 这we--多 这种情况下的机架。 634 00:36:16,620 --> 00:36:22,730 >> 因此,这是在这个意义上有趣的是 通用图形处理 635 00:36:22,730 --> 00:36:27,880 能够极其做数学 迅速对于非常低的能量。 636 00:36:27,880 --> 00:36:32,060 所以这是一个大的上扬 在科学计算领域, 637 00:36:32,060 --> 00:36:36,400 看着图形 处理单元的一大途径。 638 00:36:36,400 --> 00:36:41,990 >> 所以我跑了一些Mcollective 通过我们的基础架构的傀儡 639 00:36:41,990 --> 00:36:45,330 昨日,非常兴奋。 640 00:36:45,330 --> 00:36:48,260 只是短期千万亿次的 的单精度。 641 00:36:48,260 --> 00:36:52,440 只是到了这里,这是明确的 小乘数是3.95。 642 00:36:52,440 --> 00:36:54,820 双精度算术 将是约1.2, 643 00:36:54,820 --> 00:36:57,010 但我的Twitter的饲料 看着这样更好,如果我 644 00:36:57,010 --> 00:37:02,670 说我们有近千万亿次 的单精度GPGPUs。 645 00:37:02,670 --> 00:37:04,220 >> 但它到达那里。 646 00:37:04,220 --> 00:37:06,280 它越来越成为 非常,非常令人印象深刻。 647 00:37:06,280 --> 00:37:08,550 为什么我们要这么做? 648 00:37:08,550 --> 00:37:11,570 由于量子化学, 除其他事项外, 649 00:37:11,570 --> 00:37:15,300 但我们开始设计 一些新的光伏技术。 650 00:37:15,300 --> 00:37:20,210 >> 所以阿兰Aspuru-Guzik,谁的 在chemistry--我的合作伙伴的教授 651 00:37:20,210 --> 00:37:22,390 在crime--为过去几年。 652 00:37:22,390 --> 00:37:25,660 我们一直在力推 信封上的计算。 653 00:37:25,660 --> 00:37:30,250 而GPGPU是理想 技术,以便能够做到 654 00:37:30,250 --> 00:37:34,760 一个可怕的很多复杂 数学,非常,非常快。 655 00:37:34,760 --> 00:37:36,750 >> 因此,与规模,带来了新的挑战。 656 00:37:36,750 --> 00:37:41,070 如此巨大scale--你必须要 小心你如何连线这个东西。 657 00:37:41,070 --> 00:37:45,300 和我们有一定的水平 强迫症。 658 00:37:45,300 --> 00:37:49,530 这些照片可能 驾驶人很多坚果。 659 00:37:49,530 --> 00:37:53,390 和橱柜都不是 有线特别好 660 00:37:53,390 --> 00:37:56,050 推动我们的网络和 设施工程师坚果。 661 00:37:56,050 --> 00:37:58,620 再加上另外还有气流 你必须包含的问题。 662 00:37:58,620 --> 00:38:01,430 >> 所以这些事情我 绝不会想到的。 663 00:38:01,430 --> 00:38:03,480 有了规模,带来复杂性。 664 00:38:03,480 --> 00:38:05,869 这是一种新的类型的文件系统。 665 00:38:05,869 --> 00:38:06,410 它的真棒。 666 00:38:06,410 --> 00:38:07,660 这是一个PB级。 667 00:38:07,660 --> 00:38:09,905 它可以存储1.1十亿文件。 668 00:38:09,905 --> 00:38:15,940 它可以读取和写入到13千兆字节 和20千兆字节second--千兆字节 669 00:38:15,940 --> 00:38:17,150 一秒钟。 670 00:38:17,150 --> 00:38:20,900 因此它可以卸载TB的 在任何时间都没有。 671 00:38:20,900 --> 00:38:22,070 >> 和它的高可用性。 672 00:38:22,070 --> 00:38:26,989 而且它有惊人的查找 rates-- 220000查找第二。 673 00:38:26,989 --> 00:38:29,780 而且有很多不同的人 建设这些类型的系统。 674 00:38:29,780 --> 00:38:32,830 你可以看到在这里图形。 675 00:38:32,830 --> 00:38:35,800 这是我们的文件系统之一 这是在负载下,相当 676 00:38:35,800 --> 00:38:41,250 愉快的阅读只是短暂 的22千兆字节的第二。 677 00:38:41,250 --> 00:38:42,790 所以这是cool--这么复杂。 678 00:38:42,790 --> 00:38:47,230 >> 因此,与复杂性和规模, 谈到更多的复杂性,对不对? 679 00:38:47,230 --> 00:38:51,830 这是我们的其中之一, 许多网络图, 680 00:38:51,830 --> 00:38:54,970 在这里你有很多不同 机箱中的所有支持高达 681 00:38:54,970 --> 00:38:57,730 进入主核心交换机, 连接到存储, 682 00:38:57,730 --> 00:39:00,731 连接到低延迟互连。 683 00:39:00,731 --> 00:39:03,605 然后将所有的这一面 房子,只是所有的管理 684 00:39:03,605 --> 00:39:09,740 您需要能够解决 这些系统从远程位置。 685 00:39:09,740 --> 00:39:12,070 所以规模有很多 复杂性与它。 686 00:39:12,070 --> 00:39:14,910 687 00:39:14,910 --> 00:39:17,785 >> 再换档,让我们回到 并有科学的小点。 688 00:39:17,785 --> 00:39:21,450 所以,请记住,调研 计算和这个小shim-- 689 00:39:21,450 --> 00:39:25,310 间粉红色的小垫片 教师和他们所有的算法 690 00:39:25,310 --> 00:39:30,650 和所有的凉爽科学和所有的 该电源和冷却和数据中心 691 00:39:30,650 --> 00:39:35,330 地板与网络和大型计算机 和服务台和帮助台 692 00:39:35,330 --> 00:39:39,330 所以forth--等等,我们只是 他们之间的这种小垫片。 693 00:39:39,330 --> 00:39:42,820 >> 我们已经开始 看到的是,世界上 694 00:39:42,820 --> 00:39:45,730 能够建立 这些大型数据中心 695 00:39:45,730 --> 00:39:48,020 并且能够建立 这些大型计算机。 696 00:39:48,020 --> 00:39:49,420 我们已经得到了它相当不错。 697 00:39:49,420 --> 00:39:53,600 我们不是很擅长这 研究之间的小垫片 698 00:39:53,600 --> 00:39:56,670 而裸机和技术。 699 00:39:56,670 --> 00:39:58,600 而且很难。 700 00:39:58,600 --> 00:40:03,330 >> 因此,我们已经能够聘请 人活在这个世界上。 701 00:40:03,330 --> 00:40:07,590 而最近,我们采访到了 美国国家科学基金会说, 702 00:40:07,590 --> 00:40:11,440 这种横向扩展的东西是伟大的, 但我们不能让我们的科学家 703 00:40:11,440 --> 00:40:13,690 在这些大的复杂的机器。 704 00:40:13,690 --> 00:40:16,040 因此,出现了 不同的节目数量 705 00:40:16,040 --> 00:40:20,100 我们真的大多 关心尝试 706 00:40:20,100 --> 00:40:22,800 看看我们是否可以改变 校园基础设施。 707 00:40:22,800 --> 00:40:25,850 >> 有很多的程序 围绕国家的中心。 708 00:40:25,850 --> 00:40:28,300 所以,我们自己,我们的 朋友在克莱姆森, 709 00:40:28,300 --> 00:40:32,620 威斯康星大学麦迪逊分校, 南加州,犹他州和夏威夷 710 00:40:32,620 --> 00:40:35,780 种了一起 看待这个问题。 711 00:40:35,780 --> 00:40:39,340 在这里,这个小图 是科学的长尾巴。 712 00:40:39,340 --> 00:40:41,602 >> 所以这个is--它不 不管是在该轴, 713 00:40:41,602 --> 00:40:45,485 但该轴实际上是数 职位经历集群。 714 00:40:45,485 --> 00:40:48,940 因此,有35万以上 任何时间段。 715 00:40:48,940 --> 00:40:51,730 这些都是我们通常的嫌疑人 沿此底部。 716 00:40:51,730 --> 00:40:55,992 事实上,还有阿兰Aspuru-Guzik, 谁,我们只是谈论about--吨 717 00:40:55,992 --> 00:40:58,700 和吨计算,真 有效的,知道自己在做什么。 718 00:40:58,700 --> 00:41:02,840 >> 这里的另一个实验室,我将讨论 有关在moment--约翰·科瓦奇的实验室。 719 00:41:02,840 --> 00:41:03,610 他们已经得到了它。 720 00:41:03,610 --> 00:41:04,210 他们是很好的。 721 00:41:04,210 --> 00:41:04,830 他们很高兴。 722 00:41:04,830 --> 00:41:05,960 他们的计算。 723 00:41:05,960 --> 00:41:07,664 重大科学成果是得到完成。 724 00:41:07,664 --> 00:41:09,580 然后,你那种 对来这里,有 725 00:41:09,580 --> 00:41:12,110 是其它基团即 没有运行大量的就业机会。 726 00:41:12,110 --> 00:41:13,410 >> 为什么呢? 727 00:41:13,410 --> 00:41:15,080 是不是因为计算是太辛苦? 728 00:41:15,080 --> 00:41:19,580 是不是因为他们不知道怎么样? 729 00:41:19,580 --> 00:41:22,880 我们不知道,因为 我们已经走了,看着。 730 00:41:22,880 --> 00:41:25,620 所以这就是这个 项目是一回事, 731 00:41:25,620 --> 00:41:27,830 是局部内 每个这些区域, 732 00:41:27,830 --> 00:41:32,660 寻找到途径,我们可以搞 与教师和研究人员 733 00:41:32,660 --> 00:41:36,400 实际上在尾部的底端, 并了解他们在做什么。 734 00:41:36,400 --> 00:41:37,920 >> 所以这件事情,我们 实际上热爱。 735 00:41:37,920 --> 00:41:39,920 而这件事情, 科学将无法继续 736 00:41:39,920 --> 00:41:44,260 向前走,直到我们解决 其中的一些边缘情况。 737 00:41:44,260 --> 00:41:46,590 科学的其它位 这是怎么回事up--大家 738 00:41:46,590 --> 00:41:48,260 看到了大型强子对撞机。 739 00:41:48,260 --> 00:41:49,540 真棒,对不对? 740 00:41:49,540 --> 00:41:52,960 这东西都跑了出来,在霍利奥克。 741 00:41:52,960 --> 00:41:56,510 我们built--的第一 科学发生在霍利奥克 742 00:41:56,510 --> 00:41:59,130 是之间的合作 我们和波士顿大学。 743 00:41:59,130 --> 00:42:01,510 所以这是真的,真的很酷。 744 00:42:01,510 --> 00:42:04,410 >> 这是一个有趣的一块 科学的规模。 745 00:42:04,410 --> 00:42:07,650 这是一个数字的访问 天空世纪的哈佛大学。 746 00:42:07,650 --> 00:42:09,170 基本上,这是一盘存档。 747 00:42:09,170 --> 00:42:13,350 如果你去了Oxford-- 花园街,对不起, 748 00:42:13,350 --> 00:42:16,560 你会发现天文台之一 建筑基本上是满 749 00:42:16,560 --> 00:42:19,480 的大约50万片。 750 00:42:19,480 --> 00:42:24,410 >> 和这些的图片 夜空,超过100年。 751 00:42:24,410 --> 00:42:28,760 所以这是一个全台成立 这里的数字化板, 752 00:42:28,760 --> 00:42:32,100 把他们的照片,注册 他们,把他们的计算机上。 753 00:42:32,100 --> 00:42:36,410 而这是一个PB级半, 正好那里 - 一个小小的项目。 754 00:42:36,410 --> 00:42:37,530 >> 这些都是其他项目。 755 00:42:37,530 --> 00:42:42,800 这种泛-STARRS项目正在做 全宽全景调查, 756 00:42:42,800 --> 00:42:47,390 寻找近地小行星 和瞬态天体事件。 757 00:42:47,390 --> 00:42:52,100 作为分子生物物理学家,我爱 这个词瞬间天上的事件。 758 00:42:52,100 --> 00:42:55,050 我不太知道它是什么,但 反正,我们正在寻找他们。 759 00:42:55,050 --> 00:43:00,372 >> 我们正在产生30兆兆字节 一个晚上的望远镜。 760 00:43:00,372 --> 00:43:03,330 而这还不是一个真正的带宽 问题,那就像一个联邦快递的问题。 761 00:43:03,330 --> 00:43:08,420 所以你把存储在面包车 你把它不管它是什么。 762 00:43:08,420 --> 00:43:10,570 >> BICEP真的interesting-- 这样的背景影像 763 00:43:10,570 --> 00:43:13,850 宇宙银河系外两极分化。 764 00:43:13,850 --> 00:43:16,880 当我第一次开始工作 在哈佛7左右, 765 00:43:16,880 --> 00:43:21,440 八年前,我记得 工作在这个项目上 766 00:43:21,440 --> 00:43:26,010 它并没有真正下沉 家,为什么偏光 767 00:43:26,010 --> 00:43:29,770 从宇宙微波 背景是很重要的, 768 00:43:29,770 --> 00:43:30,800 直到这件事发生。 769 00:43:30,800 --> 00:43:34,580 >> 这是约翰·科瓦奇, 谁我跟前, 770 00:43:34,580 --> 00:43:42,030 使用亿万CPU的 小时,在我们的设备和其他人, 771 00:43:42,030 --> 00:43:46,600 基本直视内 宇宙的第一时刻 772 00:43:46,600 --> 00:43:49,150 在大爆炸之后,和 试图了解 773 00:43:49,150 --> 00:43:51,290 爱因斯坦的广义相对论。 774 00:43:51,290 --> 00:43:56,040 这是令人兴奋的,我们的电脑 帮助我们解开顾盼 775 00:43:56,040 --> 00:43:59,280 到为什么我们在这里非常的起源。 776 00:43:59,280 --> 00:44:03,450 >> 所以,当你谈论规模, 这是一些严重的规模。 777 00:44:03,450 --> 00:44:09,260 天平的另一件事是, 具体项目打这些家伙。 778 00:44:09,260 --> 00:44:15,320 而这是BICEP响应曲线 [听不清]这是我们的小调查。 779 00:44:15,320 --> 00:44:19,220 >> 你可以在这里看到,生活 好,直到这里, 780 00:44:19,220 --> 00:44:21,200 这是当 公告一出。 781 00:44:21,200 --> 00:44:24,120 和你有字面上 秒响应 782 00:44:24,120 --> 00:44:29,020 在缩放的盛事, 对应于这个小圆点在这里, 783 00:44:29,020 --> 00:44:32,200 这结束了转移 四,所以TB的数据 784 00:44:32,200 --> 00:44:36,370 通过Web服务器 这day--晦涩。 785 00:44:36,370 --> 00:44:38,210 >> 等,这些都是 类型的东西, 786 00:44:38,210 --> 00:44:43,040 可以发生在你的基础设施 如果你不为设计规模。 787 00:44:43,040 --> 00:44:45,630 我们有一个有点 抢的那一天,是 788 00:44:45,630 --> 00:44:50,440 能够跨越出足够的web服务 保持网站启动并运行。 789 00:44:50,440 --> 00:44:53,399 我们取得了成功。 790 00:44:53,399 --> 00:44:55,190 这是一个小的电子邮件 这是种可爱。 791 00:44:55,190 --> 00:45:00,245 这是一个邮件马克Vogelsberger, 和Lars Hernquist,谁的 792 00:45:00,245 --> 00:45:02,650 一名教师在这里哈佛。 793 00:45:02,650 --> 00:45:03,570 更多关于马后。 794 00:45:03,570 --> 00:45:05,990 但我认为这是其一 排序总结了样 795 00:45:05,990 --> 00:45:09,920 的,其中所述计算 在研究计算。 796 00:45:09,920 --> 00:45:12,070 嘿,团队,自去年 周二,你们折磨了 797 00:45:12,070 --> 00:45:15,470 在新的28% 集群相结合 798 00:45:15,470 --> 00:45:20,040 是达78年 CPU在短短的三天。 799 00:45:20,040 --> 00:45:22,502 我说,它仍然 才刚刚周五上午。 800 00:45:22,502 --> 00:45:23,460 这是相当真棒! 801 00:45:23,460 --> 00:45:24,740 周五快乐! 802 00:45:24,740 --> 00:45:27,450 >> 然后我给他们的数据点。 803 00:45:27,450 --> 00:45:30,260 所以这是一种有趣的。 804 00:45:30,260 --> 00:45:34,840 所以,记得马克,他会来 背入画面一点点。 805 00:45:34,840 --> 00:45:36,935 因此,向外扩展的计算是无处不在。 806 00:45:36,935 --> 00:45:41,080 >> 我们甚至帮助人们寻找 在NBA如何运作, 807 00:45:41,080 --> 00:45:43,140 人们都在那里 从扔球。 808 00:45:43,140 --> 00:45:47,580 我真的不明白这个游戏太 好了,不过貌似,这是一个大问题。 809 00:45:47,580 --> 00:45:50,610 还有篮球和碗和金钱。 810 00:45:50,610 --> 00:45:55,300 >> 因此,我们的数据库里 建一个小500听不清] 811 00:45:55,300 --> 00:45:58,170 并行处理器集群, 几个TB的RAM中, 812 00:45:58,170 --> 00:46:03,590 要能够建立这个 柯克和他的团队。 813 00:46:03,590 --> 00:46:08,524 他们正在做的计算 在一个整体的其他方式。 814 00:46:08,524 --> 00:46:10,440 现在,这是项目我们 参与这 815 00:46:10,440 --> 00:46:14,880 绝对迷人,周围神经 可塑性connectomics和基因组 816 00:46:14,880 --> 00:46:20,960 imprinting--三个非常重 研究领域击球 817 00:46:20,960 --> 00:46:24,650 我们对拼 一天到一天的基础。 818 00:46:24,650 --> 00:46:30,670 我们的大脑正在想法 当我们年轻的塑性应力。 819 00:46:30,670 --> 00:46:34,980 而我们很多成年人的行为是 在婴儿时期的经验雕刻。 820 00:46:34,980 --> 00:46:37,040 所以这是一个很大的dealio。 821 00:46:37,040 --> 00:46:41,360 >> 所以这是的资助工作 国立精神卫生研究所。 822 00:46:41,360 --> 00:46:46,860 我们正试图从根本上, 通过大量的大数据 823 00:46:46,860 --> 00:46:51,970 和大数据分析,善良 同行到我们人类的大脑 824 00:46:51,970 --> 00:46:54,870 通过各种 不同的技术。 825 00:46:54,870 --> 00:47:00,360 >> 所以我想种停下来 只是暂停了一小片刻。 826 00:47:00,360 --> 00:47:04,160 用遥控器挑战 数据中心是它的遥远。 827 00:47:04,160 --> 00:47:05,520 它不可能工作。 828 00:47:05,520 --> 00:47:07,590 我需要我的数据附近。 829 00:47:07,590 --> 00:47:10,730 我需要做我的研究,我的实验室。 830 00:47:10,730 --> 00:47:18,620 >> 所以,我种了一个例子 功能性磁共振成像 831 00:47:18,620 --> 00:47:22,260 从我们的数据的数据集 中心的西部大。 832 00:47:22,260 --> 00:47:24,660 并把它连接到我的 台式机在剑桥。 833 00:47:24,660 --> 00:47:27,440 我会玩这个小视频。 834 00:47:27,440 --> 00:47:29,750 希望这将种工作。 835 00:47:29,750 --> 00:47:33,480 >> 因此,这是我的经历 检查我的GPU工作。 836 00:47:33,480 --> 00:47:35,430 而且我检查VNC的了。 837 00:47:35,430 --> 00:47:36,810 这是一个聪明的VNC。 838 00:47:36,810 --> 00:47:38,970 这是3D片一个VNC。 839 00:47:38,970 --> 00:47:41,975 所以,你可以看到在短期内,这 就是我这个纺纱大脑周围。 840 00:47:41,975 --> 00:47:44,460 我试着种得到它导向。 841 00:47:44,460 --> 00:47:49,574 然后我可以移动通过多种 不同的片MRI的数据。 842 00:47:49,574 --> 00:47:51,490 而唯一的事情,就是 这个不同 843 00:47:51,490 --> 00:47:55,160 是,它的未来在电线 从西方的质量。在我的桌面。 844 00:47:55,160 --> 00:47:57,300 而其渲染 比我的台式机快, 845 00:47:57,300 --> 00:48:02,840 因为我没有4000美元 显卡在我的桌面,这 846 00:48:02,840 --> 00:48:04,262 我们拥有了西方大众。 847 00:48:04,262 --> 00:48:05,720 当然,我想聪明。 848 00:48:05,720 --> 00:48:08,859 我跑了GLX齿轮 背景,而做这一切, 849 00:48:08,859 --> 00:48:10,900 以确保我能 强调显卡, 850 00:48:10,900 --> 00:48:14,140 而且,这一切都种 工作和其他一切。 851 00:48:14,140 --> 00:48:16,700 但重要的是, 这是100英里远。 852 00:48:16,700 --> 00:48:20,460 你可以从这个看出, 没有明显的延迟。 853 00:48:20,460 --> 00:48:24,600 东西维系得相当好。 854 00:48:24,600 --> 00:48:28,907 >> 因此,在其本身, 是一个例子,一些见解 855 00:48:28,907 --> 00:48:31,490 到如何计算和横向扩展 计算将要发生。 856 00:48:31,490 --> 00:48:35,330 我们所有的努力 瘦设备。 857 00:48:35,330 --> 00:48:36,870 我们使用平板电脑的越来越多。 858 00:48:36,870 --> 00:48:39,160 >> 所以因此,我的碳 占用基本 859 00:48:39,160 --> 00:48:42,060 从什么用移动 要做到这一点就已经 860 00:48:42,060 --> 00:48:46,060 是一个庞大的机器 在我的办公桌,要什么 861 00:48:46,060 --> 00:48:49,550 现在是一个facility--可以在任何地方。 862 00:48:49,550 --> 00:48:50,800 它可以在任何地方都没有。 863 00:48:50,800 --> 00:48:54,790 然而,它仍然能够带来 回到高性能显卡 864 00:48:54,790 --> 00:48:56,630 在我的桌面。 865 00:48:56,630 --> 00:49:00,900 >> 因此,越来越近了 end--记得马克? 866 00:49:00,900 --> 00:49:04,480 那么,聪明的小伙子是马克。 867 00:49:04,480 --> 00:49:09,360 他决定,他要 建立一个逼真的虚拟世界。 868 00:49:09,360 --> 00:49:12,820 这是相当一个项目,当你 想你已经有了这个球场。 869 00:49:12,820 --> 00:49:14,740 我将使用 计算机,我要去 870 00:49:14,740 --> 00:49:21,040 模拟后,1200万年 宇宙大爆炸,代表了一天。 871 00:49:21,040 --> 00:49:27,080 然后我会做的13.8 十亿年宇宙演化。 872 00:49:27,080 --> 00:49:28,270 行。 873 00:49:28,270 --> 00:49:30,970 >> 这实际上使用计算机 的是大于我们的电脑, 874 00:49:30,970 --> 00:49:35,040 并蔓延到全国 资源,我们的朋友下来在得克萨斯州。 875 00:49:35,040 --> 00:49:38,820 而到了国家设施, 这是一个很大的计算中。 876 00:49:38,820 --> 00:49:40,750 但是,我们做了很多 模拟本地 877 00:49:40,750 --> 00:49:44,820 以确保该软件 工作和系统的工作。 878 00:49:44,820 --> 00:49:47,790 >> 它是这样的日子,你 意识到你支持科学 879 00:49:47,790 --> 00:49:51,090 在这个水平的规模,即 人们现在可以说的东西 880 00:49:51,090 --> 00:49:52,840 就像,我去一个模型的宇宙。 881 00:49:52,840 --> 00:49:54,145 这是他的第一款车型。 882 00:49:54,145 --> 00:49:56,422 这是他的球队的第一款车型。 883 00:49:56,422 --> 00:49:58,130 还有许多其他 乡亲会 884 00:49:58,130 --> 00:50:01,520 来到后面的马克,谁是要 想与高分辨率模型, 885 00:50:01,520 --> 00:50:04,652 更多的特异性, 以更高的精度。 886 00:50:04,652 --> 00:50:09,105 >> 因此,在最后两分钟, 我只是想告诉你这个视频 887 00:50:09,105 --> 00:50:15,270 马克和Lars的对我,再次, 作为一个科学家的生活,是那种可爱。 888 00:50:15,270 --> 00:50:17,890 889 00:50:17,890 --> 00:50:20,970 这样一来,在底部 在这里,给你定位, 890 00:50:20,970 --> 00:50:23,640 这是告诉你 时间以来的大爆炸。 891 00:50:23,640 --> 00:50:26,570 所以我们是在约0.7十亿年。 892 00:50:26,570 --> 00:50:28,740 这是示出了当前的更新。 893 00:50:28,740 --> 00:50:33,450 所以,你看到的那一刻, 暗物质和演变 894 00:50:33,450 --> 00:50:39,910 精细结构和早期的 结构在我们已知的宇宙。 895 00:50:39,910 --> 00:50:45,690 >> 并与此问题是,这 在所有的电脑内部完成。 896 00:50:45,690 --> 00:50:48,530 这是一组参数 和一组物理 897 00:50:48,530 --> 00:50:52,840 和一组数学 和一组模型 898 00:50:52,840 --> 00:50:59,284 这都是经过精心挑选,然后 仔细彼此连接 899 00:50:59,284 --> 00:51:00,825 能够建模的相互作用。 900 00:51:00,825 --> 00:51:04,850 >> 所以你可以看到一些开始 一些气体爆炸在这里。 901 00:51:04,850 --> 00:51:06,880 和气体的温度变化。 902 00:51:06,880 --> 00:51:13,720 你可以开始看到结构 可见宇宙的变化。 903 00:51:13,720 --> 00:51:18,130 而与此的重要组成部分 是,每个小很小,很小,小点 904 00:51:18,130 --> 00:51:21,070 是一块物理的,并具有 一组数学左右, 905 00:51:21,070 --> 00:51:23,030 通知其朋友和邻居。 906 00:51:23,030 --> 00:51:27,245 >> 所以从比例的角度来看,这些 电脑要在演唱会的所有工作 907 00:51:27,245 --> 00:51:29,470 并互相交谈效率。 908 00:51:29,470 --> 00:51:31,060 因此,他们不能太健谈。 909 00:51:31,060 --> 00:51:33,520 他们必须保存他们的结果。 910 00:51:33,520 --> 00:51:37,902 他们要继续 通知所有的朋友。 911 00:51:37,902 --> 00:51:40,860 事实上,你现在看到的,这款机型的 越来越复杂。 912 00:51:40,860 --> 00:51:42,590 还有越来越多的东西怎么回事。 913 00:51:42,590 --> 00:51:45,210 还有越来越多的 围绕材料飞。 914 00:51:45,210 --> 00:51:48,410 >> 而这也正是早期 宇宙会一直样子。 915 00:51:48,410 --> 00:51:49,770 这是一个非常有毛的地方。 916 00:51:49,770 --> 00:51:55,140 有爆炸各地 的地方,功能强大的碰撞。 917 00:51:55,140 --> 00:51:58,620 和形成重 金属和元素。 918 00:51:58,620 --> 00:52:03,910 而这些大云砸入 对方的极端力量。 919 00:52:03,910 --> 00:52:08,530 >> 所以现在我们是9.6十亿 几年从这个最初的爆炸。 920 00:52:08,530 --> 00:52:12,310 你开始看到的东西是 那种平静下来一点点,只是 921 00:52:12,310 --> 00:52:15,660 一点点,因为 能源已开始放松。 922 00:52:15,660 --> 00:52:19,420 所以数学 模型已经得到了到位。 923 00:52:19,420 --> 00:52:22,510 而你开始看到 合并不同的元素。 924 00:52:22,510 --> 00:52:26,220 并开始看到这个东西种 走到一起,慢慢地冷静。 925 00:52:26,220 --> 00:52:32,260 >> 它的开始看起来有点 更像夜空,一点点。 926 00:52:32,260 --> 00:52:37,870 和它的[? QSing。 ?]我们现在30.2 十亿年,我们种完成。 927 00:52:37,870 --> 00:52:41,130 然后他们做了什么了 他们利用这种模式, 928 00:52:41,130 --> 00:52:44,580 然后看着可见宇宙。 929 00:52:44,580 --> 00:52:48,560 基本上然后,分别 能够采取和覆盖 930 00:52:48,560 --> 00:52:50,580 它你可以看到什么。 931 00:52:50,580 --> 00:52:56,160 和保真度是惊人的,以 计算机模型如何准确的。 932 00:52:56,160 --> 00:52:58,760 >> 当然,天体物理学家 和研究小组 933 00:52:58,760 --> 00:53:02,780 需要更好的保真度 甚至更高的分辨率。 934 00:53:02,780 --> 00:53:06,230 但如果你认为是什么 我一直在今天跟你说话 935 00:53:06,230 --> 00:53:11,850 通过双方通过这个小远航 存储和结构和网络 936 00:53:11,850 --> 00:53:18,000 和堆栈,最重要的是, 是向外扩展的计算必不可少的? 937 00:53:18,000 --> 00:53:22,050 这是我原来的hypothesis-- 回到我们的科学方法。 938 00:53:22,050 --> 00:53:24,810 >> 我希望在早期 这部分我会 939 00:53:24,810 --> 00:53:29,400 预测,我就可以解释 给大家介绍横向扩展计算。 940 00:53:29,400 --> 00:53:32,870 种和我们测试 其中的一些假设。 941 00:53:32,870 --> 00:53:34,585 我们通过这次谈话去了。 942 00:53:34,585 --> 00:53:38,920 而我只是想说向外扩展 计算是essential--哦, 943 00:53:38,920 --> 00:53:42,480 是的,很不错。 944 00:53:42,480 --> 00:53:44,790 >> 所以,当你想 关于你的代码,当 945 00:53:44,790 --> 00:53:49,230 你正在做的CS50最后的项目, 当你想你的遗产 946 00:53:49,230 --> 00:53:52,990 人类和资源,我们 需要能够运行这些计算机 947 00:53:52,990 --> 00:53:56,650 系统,觉得很细心 大约每瓦FLOPS, 948 00:53:56,650 --> 00:53:58,560 想想混沌猴子。 949 00:53:58,560 --> 00:54:02,240 >> 想想你的雪花,不 做一取舍,再利用图书馆, 950 00:54:02,240 --> 00:54:06,453 构建可重用codes--所有的东西 该教师已教你 951 00:54:06,453 --> 00:54:08,630 在这个类。 952 00:54:08,630 --> 00:54:11,942 这些都是基本方面。 953 00:54:11,942 --> 00:54:13,150 他们不只是信口开河。 954 00:54:13,150 --> 00:54:15,660 这些都是实实在在的事情。 955 00:54:15,660 --> 00:54:20,680 >> 如果任何一个你想跟着我, 我迷恋与Twitter的东西。 956 00:54:20,680 --> 00:54:22,770 我得莫名其妙地放弃了起来。 957 00:54:22,770 --> 00:54:24,960 但很多的 背景资料 958 00:54:24,960 --> 00:54:29,260 在我们的研究计算 网站rc.fas.harvard.edu。 959 00:54:29,260 --> 00:54:34,010 >> 我尽量保持一个博客达 日期与现代技术 960 00:54:34,010 --> 00:54:38,390 以及我们如何做分配 计算等。 961 00:54:38,390 --> 00:54:43,600 然后我们的工作人员总是 可通过odybot.org。 962 00:54:43,600 --> 00:54:46,270 和odybot是我们的小帮手。 963 00:54:46,270 --> 00:54:49,280 他经常有一点 在他的网站上争奇斗艳 964 00:54:49,280 --> 00:54:51,630 同样,在那里你可以尝试 发现他在校园里。 965 00:54:51,630 --> 00:54:55,200 他是友好的小 脸上的研究计算。 966 00:54:55,200 --> 00:54:59,730 >> 种,我会包有 并感谢大家的时间。 967 00:54:59,730 --> 00:55:05,660 我希望你记住, 横向扩展计算是一个真实的东西。 968 00:55:05,660 --> 00:55:08,162 而且有很多人 谁已经得到了很多现有技术 969 00:55:08,162 --> 00:55:09,370 谁就能帮助你。 970 00:55:09,370 --> 00:55:14,330 和所有的好运与 你的未来作出努力 971 00:55:14,330 --> 00:55:18,280 相信我们的计算均 秤,是高性能, 972 00:55:18,280 --> 00:55:20,370 并帮助更多的人性化 比什么都重要。 973 00:55:20,370 --> 00:55:22,850 所以,感谢您的时间。 974 00:55:22,850 --> 00:55:23,947