JAMES袖口:嗨,不错 下午好。 我的名字是詹姆斯袖口。 我的助理院长研究 这里计算哈佛大学。 今天我要和你谈谈 为什么向外扩展的计算是至关重要的。 所以我想,先上去,这家伙是谁? 我为什么在这里? 为什么我跟你说话? 我有科学背景 计算和研究计算, 可以追溯到美国 Kingdom--威康信托基金会桑格 研究所人类genome--和 然后,最近在美国 在广泛等受人尊敬的工作 学习的地方,比如哈佛大学。 我猜这是什么真正的意思是 我是一个恢复的分子生物 物理学家。 所以,有什么权利我必须告诉 你对横向扩展计算? 有一个但是。 18岁的让我刚刚见过的最 大幅增加的规模复杂 和整体效率 的计算系统。 当我在做我的博士在牛津,我 是相当兴奋的一个200兆赫 Silicon Graphics公司机18 千兆字节的存储和单个CPU。 时代已经变了。 如果你现在快进,我们纺 超过60,000这里的CPU在哈佛。 许多其他组织 有纺等等。 从这个最重要的是外卖 这种规模是现在不仅不可避免, 它的发生,这是 将继续发生。 因此,让我们,一会儿,善良 对快退和说话非常快 关于科学,我最喜欢的 主题,科学的方法。 如果你要成为一名科学家, 你必须做一些关键的东西。 如果你不这样做,这些事情你可以 不认为自己是一个科学家 你将很难能够 了解你的学科领域。 所以,首先,你会制定 您的问题,产生的假设, 但更重要的是,你 预测你results-- 你有一个猜测, 什么样的结果会如何。 然后最后,您测试 假设和分析结果。 所以这个科学的方法是 在计算非常重要。 两者的预测计算 并能够测试结果 是我们所需要的一个重要组成部分 做科学的方法。 这些预测和化验 是真正的两大基石 科学的方法,并且每个 所需要的最显著进展 在现代计算。 科学的两大支柱是 理论和实验。 而最近, 计算经常被提及 作为是科学的第三大支柱。 所以,如果你的学生看这个, 你绝对没有压力。 science--没有什么大的第三大支柱 deal--计算,种重要的。 很高兴,这是在计算部 计算机科学课程50。 所以足够的背景。 我想告诉大家的是什么计划 我们要谈谈今天。 我会去对一些历史。 我要解释为什么我们来到这里。 我要谈一些 该计算的历史 你们是哈佛,一些 围绕社会媒体活动, 绿色things--很 热爱一切事物 green-- storage--计算机storage-- 如何混乱影响向外扩展了系统, 和分配系统中尤其如此。 然后我会触及一些 向外扩展的硬件应该是的 要能需要 做计算的规模。 然后最后,我们要 包装了一些真棒科学。 那么,让我们一分钟 看看我们的实际历史。 计算已演变。 如此以来,上世纪60年代,所有的 客场到今天, 我们已经看到,基本上的改变 从集中式计算范围 下放计算,以 协作然后独立 计算和右后卫了。 让我的注释一点点。 当我们第一次开始了与 电脑,我们有大型机。 他们是不相称 昂贵的设备。 一切都应该被共享。 计算很复杂。 你可以看到,它填补室和 有运营商和磁带 和各种whirry的, clicky,spinny设备。 围绕“70年代80年代初,你开始 看传真机的影响。 所以,你开始看到的计算 开始出现回实验室 并成为更接近你。 个人的兴起 计算机,当然 在80年代,早期的一部分 十年来,真的改变了计算。 并有一个线索 标题,因为它 被称为个人计算机, 这意味着它是属于你的。 从而演变 计算继续, 人们意识到,他们的个人 电脑是不是真的够大 要能够做任何好处的话, 或显著优点,在科学。 所以人们开始 开发网络设备 司机能够连接电脑 在一起,以便能够建立集群。 因此这个生时代 在Beowulf集群的。 Linux的分解,以响应 专有操作系统,两者的成本 和复杂性。 然后,在这里,我们有今天, 在那里,再次,我们 面对满房间的电脑 设备和能力 刷卡人的信用卡,并得到 获得这些计算设备, 远程。 所以你可以再看看,在 历史冲击方面 我们如何做计算 今天,它肯定 从机演变 房间全电脑 通过一些个人计算 一路右后卫再次 到机房全电脑。 所以这是我的第一个集群。 所以2000年,我们建立了一个 在欧洲的计算机系统 有效注释 人类基因组。 有很多技术 在右手侧列 还有,不幸的是, 不再和我们在一起。 它传递给了 伟大的技术在天空中。 机器本身可能是 几个像样的笔记本电脑相当于 今天,和那种只是说明你。 但是,我们也仔细标注 人类基因组与这两个保护它 在这个特殊的纸 从关注数据的性质 是公共或私人。 因此,这是真棒,对不对? 所以,我们已经有了一个人类基因组。 我们已经做了计算。 我感觉很高兴自己。 我卷起哈佛大学在2006年, 感觉少了很多高兴的自己。 这是我继承。 这是一个部门 电子邮件和文件服务器。 你可以在这里看到有 磁带一点点 这是用来装系统在一起。 这是我们的许可证和打印服务器。 我敢肯定有可能的密码 对一些中报事贴注。 不真棒。 漂亮远离真棒。 所以,我意识到这一点图 我向您展示在开始 从共享所有权 回到共享, 我们需要改变比赛。 因此,我们改变了比赛 通过提供奖励。 等人,因为这 小百科文章 在这里说,我们的目的的生物。 和激励的研究 结构是必要的,以研究 经济活动。 于是我们开始激励 我们的教师和我们的研究人员。 因此,我们诱因他们 一个真正的大的计算机系统。 因此,在2008年,我们建立了一个4096 处理器机 - 10架, 几百千瓦的功率。 我认为是 有趣的是,它不 无论您身在何处的恶性循环。 同样的电量和 计算时,功率是恒定的。 这是200千瓦我们 正在建造的系统在欧洲。 这是200千瓦 在2008年,而 似乎是[? quanter小?] 大学为基础的计算系统。 所以,哈佛today--快进,我不是 再伤心大熊猫,相当幸福的熊猫。 我们已经60多万人的负载平衡 CPU和爬坡显着。 我们有15个PB的 存储,也节节攀升。 同样,这200千瓦 增量,我们似乎 要补充说, 每6个月左右。 很多很多的虚拟机。 更重要的是, 约1.8兆瓦 研究计算设备。 而且我要来 回到这个以后, 为什么我现在不再是必然 算上我们有多少CPU有, 但有多大的电费。 其他20个这样的专用 研究人员计算。 更重要的是,我们 开始发展我们的GPGPUs。 我是错开多少本 被添加在某一天到一天的基础。 所以,历史课结束了,对不对? 那么,我们如何从这里到达那里? 让我们来看看一些现代 横向扩展计算的例子。 我有点痴迷 大小和社交媒体的比例。 有很多的非常 成功的大规模计算 企业现在在这个星球上, 提供支持和服务 我们大家。 所以这是免责条款。 我想开始一个 在一个Instagram的盎司数。 这实际上不是一个 铅在一个笑话,这是 甚至不是搞笑, 其实,想起来了。 但无论如何,我们要 看看Instagram的盎司。 我们要开始 与“我的蜜蜂和花。” 我在[听不清]村 我花了一点图片 蜜蜂的坐在花。 然后我开始思考 什么,这实际上意味着。 我拍下了这张照片把我的手机 并计算有多少字节在里面, 它是关于256千字节。 这时候我开始,基本上会 填补了5和1/4英寸软盘。 开始想,好吧,这很酷。 我开始看,做 一些研究在网络上。 而且我发现,Instagram的 拥有2亿莫斯。 我本来就不是那 知道什么是MAU了。 和MAU,到这里,是 每月活跃用户。 因此,2亿MAUs--很酷。 20十亿photographs--等 相当多的照片。 6000万新照片 每一天 现身在每张照片约0.002演出。 这是约5千兆字节 磁盘恰到好处那里。 那真的不是中部 什么我们要谈论的话题。 这是小土豆。 或者就像我们说在英国,微小的土豆。 所以,让我们来看看真正的大象 在room--独特的面孔。 再次,让我们衡量 这种新的量子叫MAU。 Facebook上有13十亿毛斯。 WhatsApp的,我已经连 听说直到最近,它的 某种短信服务, 是500万莫斯。 Instagram的,这是我们刚 讲了,2亿毛斯。 和Messenger,这是 另一消息服务, 也是2亿莫斯。 所以总认为,那是关于 2.2十亿用户总量。 显然,有一些重叠,但是这 相当于行星的三分之一。 他们送东西的 一个每天12十亿的消息的区域。 再次,有7只 十亿人在这个星球上。 不是每个人都有的智能手机。 因此,这是疯狂的数字。 而且我会认为这不是 即使有关存储或计算。 并引用这首歌, 它是所有关于那个图。 下面是我们可爱的梅根特雷纳下来 在这里,唱所有的低音。 注意,她也有相当 低音位herself-- 207, 还有2.18亿人都看到了 这位小姐唱她的歌。 所以,我的观点是 它的所有有关的图形。 因此,我们采取了一些开源软件 并开始看一个图表。 这就是LinkedIn,所以这 是Facebook的老人。 所以,这是我的LinkedIn图。 我有1200左右的节点, 所谓的“朋友”。 这里就是我在上面。 而这里的所有的互连。 现在,回想起了Instagram的故事。 其中每一个都是 不仅仅是照片,它 有连接的整个过多 这个特殊的个人之间 和其他许多人。 这是中央一块或者是一个 在图形绘制算法的错误, 或这也许大卫· 马兰,我不知道呢。 所以,你可以重绘 在各种图表 的ways-- gephi.gihub.io就是 你可以拉从该软件。 这真的很酷的是 能够组织社区。 你可以在这里看到,这是哈佛和 其他地方,我已经工作, 因为这是我的工作有关的数据。 所以只是想想复杂 图形和所有数据的 你拉一起。 那么同时,在FriendFace,对不对? 我们看了看Instagram的数据 是五个千兆兆字节的顺序。 没什么大不了的。 还是相当大量的数据,但没有大的 在处理事物的更大的计划。 从这篇文章的老互联网上, “缩放Facebook的数据仓库 300 PB的。“ 这是一个完全不同的 现在改变游戏规则, 你开始的时候 认为数据和图形的 和你有携带。 而他们的高数据增长的 600的顺序T字节一天。 现在,你知道的,好了,then-- 我的意思是,每天600 T字节, 300 petabytes--他们 现在也开始 让很在意 如何保持这种东西 并确保这些数据保持周围。 这位先生在这里, 周杰伦帕瑞克,正在寻找 在如何存储数据的艾字节。 只是对于那些你 谁是一起观看 在家里,一个exabyte-- 10到18。 它有自己的维基百科 页面,这是一个数量那么大。 这是一个什么我们的规模和范围 看,能够存储数据。 和这些家伙不碴周围, 他们正在存储数据的量。 因此,线索一个 他们正在寻找在这里 对于数据中心 所谓冷藏。 这使我是绿色。 这里是克米特。 他和我同意 - 这是非常 很难做到绿色, 但我们给它我们最好的尝试。 克米特不能帮助它,他有 是绿色的时候, 不能把他的绿色岬关闭的。 所以,作为一个concepts-- 一些种核心概念 绿色的,当它 涉及到的计算。 的一个是最重要的 是在产品的寿命。 如果你的产品具有短的寿命, 你不能,顾名思义,是绿色的。 能量带到制造 磁盘驱动器,一个主板,计算机 系统,片剂,不管它可 是,你的系统寿命 是的,你可以如何绿色是一个重要组成部分。 最重要的部分,因为大家 正在建设的软件algorithms-- 算法的部分 单词软件,对不对? 所以,你的算法设计 无论从绝对关键 如何你要能够使 快速而准确的计算,以使用 量最少的能量成为可能。 我会得到这一点。 数据中心设计 - 你见过 我们已经有数千 在数千台机器,坐在 悄悄地在小的,黑暗的角落 世界上运算。 资源allocation--怎么弄 向计算,到存储, 通过网络。 操作系统是一个关键部分 此,很多虚拟化 能够将更多和 多个计算成一个小的空间。 我给你一个小例子 从研究的计算。 我们需要更多的平安,更 动力,和多个管道。 我们需要更多更大, 更好,更快的计算机, 并且需要使用更少的果汁。 我们不能工作了如何做到这一点。 我不知道是否包括hashtag gowest作为 可能使用过的卡戴珊, 但无论如何,gowest。 而我们做到了。 我们拿起我们的操作 我们再搬出来 西方马萨诸塞 在一个小磨房镇 所谓的霍利奥克,北部 的Chikopee和斯普林菲尔德。 我们这样做了几个原因。 最主要的是,我们 有一个非常,非常大的水坝。 这非常大的水坝能 把精力了30多万千瓦, 并且它没有得到充分利用的时间。 更重要的是,我们也有 一个非常复杂的网络 这是已经到位。 如果你看一下去哪儿网 去美国, 它遵循所有的火车轨道。 这件特殊的网络是 我们的同事和朋友资 在美国马萨诸塞州 技术研究所, 它是基本建成 所有的出路路线90。 所以我们有一个大的河流打勾,90路 滴答,我们有100英里短路径, 及约1000英里长的路径。 我们也要做一个非常大的 网络接头,你可以在这里看到, 基本上放在一个环节, 能够连接到霍利奥克, 但我们有所有必要的 infrastructure--平,电力,管道。 生活是不错的。 再次,大水坝。 因此,我们基本上建立了马萨诸塞 绿色高性能计算 中心。 这是一个热爱劳动通过五 universities--麻省理工学院,哈佛大学,麻省大学, 东北和BU。 5兆瓦一天一个连接的负载。 我们做了各种聪明 与禁区省煤器 让事情变得绿色环保。 我们内置了640多架, 专门用于研究计算。 这是一个古老的棕地,所以我们 有一些回收和一些整洁行动 和一些清理的部位。 然后我们开始 建工厂 并且,boom--可爱的设施与 能够运行沙盒计算, 有会议和研讨会, 也是一个庞大的数据中心地板。 这是我良好的自我。 我明明穿着同样的外套。 我也许只有一个 外套,但有我 和约翰Goodhue--他是 在Center--执行董事 站立在机器室 地板,正如你所看到的, 是非常戏剧性的,而且它 源远流长,很长的路要走。 我经常玩游戏驾驶 从波士顿出来霍利奥克, 假装我是一个TCP / IP数据包。 我也担心我的延时 在我的车开车过来。 所以这是一块绿地。 所以让我们只花一分钟 想想栈。 所以,我们正在努力非常认真地 有效地建立数据中心, 计算效率,做好 选择为计算设备 并提供更多 重要的是,我们的应用程序, 是它的消息服务 或科学应用。 因此,这里的堆栈。 这样的物理层中,所有的 一路经过application-- 希望这是要 是你的,当然很大一部分。 OSI七层模型基本上是, 你会生活,吃饭,呼吸 这在整个职业生涯计算。 这整个的物理概念 infrastructure--电线, 电缆,数据中心,链接。 而这仅仅是描述网络。 在这里,没错,是很明显, 这是一个古老的幻灯片, 因为这应该说是HTTP,因为 无人问津简单的邮件 传输协议了。 这一切都发生在HTTP的空间。 所以这是堆栈的一层。 这里是另一套书库,在这里你的 有一个服务器,主机,虚拟机管理程序, 一个客人,二进制库, 然后您的应用程序。 或者,在这种情况下,该装置 驱动程序,Linux内核,本机C, Java虚拟机 Java的API,那么Java 的应用程序,等等,等等。 这是一个描述 的一个虚拟机。 圣栈,蝙蝠侠! 想想这 多少计算方面 你需要从获得 这里发生了什么, 一路到顶部 该堆栈,以再 可以做您的实际 交付的应用程序。 如果你种 倒带并开始思考 关于如何才能提供 浮点运算, 您的浮点运算是总和 芯的插座,数 在插座,一个时钟,这是 能多快的时钟turnover-- 4千兆赫,2 gigahertz--然后数 操作即可 做在一个给定的赫兹。 所以今天的微处理器 四到6 FLOPS做 每个时钟周期。 所以单核2.5演出时钟 有一个理论性能 约一万FLOP,给予或采取。 但是,正如一切, 我们有选择。 所以和英特尔酷睿2,Nehalem处理器 Sandy Bridge的,Haswell的,AMD, 把你的choices--的英特尔Atom。 所有这些处理器架构 都具有略微不同的方式 是能够加 两个数字在一起, 这基本上是 他们的生活目的。 一定很辛苦。 还有数以百万计人坐 在数据中心,现在虽然。 索尔,触发器每watt-- 这是一件大事。 所以,如果我想获得更多的这种 打通这个堆栈,更快, 我得对工作有多少 浮点运算的第二 我能做的,然后给他们瓦。 幸运的是,乡亲 已经想到这个问题。 所以这是一个大的 大赛每年都看 谁可以建立最快的计算机 可对角化的矩阵。 这就是所谓的500强。 他们选择从顶部 最好的500台电脑 在这个星球上,能 矩阵对角化。 你会得到一些惊人的结果。 很多这些机器都是 在10和20兆瓦。 他们可以对角化矩阵 相称快。 它们不一定角化 他们尽可能高效的每瓦, 所以有这个大推一下 什么是绿色500强名单会是什么样子。 这里是从6月的列表。 应该有一个新的很快。 并呼吁out--我带你去 这个特定列表的顶部。 有两个具体machines-- 1 从东京技术研究所 ,一名来自剑桥 大学在英国。 而这些有相当惊人 每瓦比大型无人问津。 这其中的4389,以及 下一个下来就是3631。 我将解释之间的差异 这两个,在接下来的幻灯片。 但这些都是这些 中等规模测试集群。 这些只是34 千瓦或52千瓦。 还有一些较大的 这里 - 这个特殊的 在瑞士国家 超级计算机中心。 该带回家的消息 这是我们 试图找到电脑 可以有效地工作。 所以,让我们来看看这上面 1,所谓讨人喜欢地的肯德基。 和广告在这里一点点。 这种特殊的食品公司 没有任何与此有关。 这是一个事实,即 这个特殊的系统 浸泡在一个非常 聪明油基化合物。 所以他们得到了他们的 鸡油炸绰号 当他们第一次开始 建立这些类型的系统。 但基本上,他们已经采取了什么 这里是一个数量的叶片, 把他们在这 复杂的矿物油, 然后制定出如何让所有 网络进出的。 然后,不仅如此, 他们已经把它放在外面等 它可以利用外部空气冷却。 这是相当令人印象深刻。 所以,你所要做的一切 这种有心计 要能得到这个数额 计算交付的小功率。 而且你可以看到这是形状 那里的东西都往。 目前的挑战是,经常风 冷却经济规模 并推动了很多 双方定期计算的发展, 和高性能计算。 所以,这是非常具有破坏性。 我认为这是令人着迷的。 这是一个有点乱,当你 尝试交换的磁盘驱动器, 但它是一个很酷的想法。 所以,不仅如此,还有 一大堆工作 正在围绕我们是 调用Open计算项目。 因此,更多的是 一点点后。 不过,业内开始 认识到每瓦FLOPS 正在变得越来越重要。 而你,作为人在这里,因为 您设计的算法 你设计你的 代码中,你应该知道 你的代码可以 有一个连锁效应。 当马克坐在这里他 宿舍里写的Facebook 1.0, 我敢肯定他有一个观点 这将是巨大的。 不过,这将是多么巨大的是在 环境是一个大dealio。 所以你们大家都可以的 拿出算法 这可能是下一个挑战性 乡亲像我这样的事情, 尝试运行系统。 因此,让我们只是想想 真正的世界大国的限制。 本文由Landauer-- 是不是一个新事物。 1961年该出版 在IBM杂志。 这是典型 “不可逆性与热 新一代的计算过程。“ 因此,他认为, 机器难免 执行逻辑功能 不具有单值的倒数。 这样的整体的一部分 这是早在上世纪60年代, 乡亲们知道,这是 会成为一个问题。 等限制的法律说25 ℃,一种典型的房间 温度时,限制 代表0.1电子伏特。 但在理论上,这是 理论,计算机存储器, 在这个极限操作可能 在同一十亿位的第二个改变。 我不知道你,但不 遇到一对多十亿位 第二数据速率交换。 这个论点有只 2.8万亿功率的瓦 应该永远被扩大。 好吧,现实世界example-- 这是我的电费。 我百分之65% 那个可爱的数据中心 我发现你,在这个特定的时间。 这是早在去年六月。 我已经采取的是旧版本,让我们 那种能和匿名一点。 我是耗资45,000 一个月能有。 所以在那里的原因是,我们 有超过50,000流程的房间。 所以,你能想象你自己 住宅电费 是高? 但它是一个1.99亿 瓦特小时不超过一个月。 所以,我提出的问题是,你能 想象扎克伯格的电费? 煤矿是相当大的,而且我奋斗。 而且我不是一个人在这。 有很多人 与大型数据中心。 所以,我想,全disclosure-- 我的Facebook好友一点点奇怪。 所以,我的Facebook好友是 所述的Prineville数据中心, 这是Facebook的最大的之一, 最新的,能量最低的数据中心。 他们张贴到我,这样的事情 用电效能, 在如何有效的数据 中心与你多少精力是 投入是多少 水是他们用,有什么 的湿度和温度。 他们有这些 可爱的,可爱的地块。 我认为这是一个 真棒的Facebook页面, 但我想我是有点怪异。 因此,人们更省电的事情, 研究计算,我做 是显著不同 什么Facebook和雅虎和谷歌 和其它点播,充分, 始终可用的服务。 所以,我的优势在于,当 ISO新England--和ISO新英格兰 有助于建立能源 率的区域。 它说,它的扩展 一个请求给消费者 自愿节约能量高, 因为高的温度和湿度。 这又回到了七月的第18位。 所以,我愉快地鸣叫回来,嘿, ISO新英格兰,绿色哈佛大学。 我们正在做我们的一部分了 在这里研究计算。 这是因为我们正在做的科学。 并不亚于人说科学 不夜城,科学可以等待。 所以我们能够停顿我们 系统,利用分级费率 我们的能源法案,并 帮助整个新英格兰 按地区脱落 负载很多兆瓦。 所以这是唯一的事情, 关于不同科学计算数据 中心和那些 全面投产24/7。 因此,让我们只是把另一个齿轮在这里。 所以,我想讨论 乱象一点点。 我希望把它放在 存储的赞助。 因此,对于那些那种 被挣扎 让他们的周围有什么高数量的头 存储的模样,这样的一个例子。 这是东西排序 我处理所有的时间。 这些小家伙的每一个 是四TB的硬盘驱动器, 这样你就可以种数起来。 现在我们正在之间 1至1和1/2 PB的 在一个标准的行业机架。 我们有房和客房,为你 在早期的画面,约翰看见 而我,充满这些设备的机架。 因此,它变得非常,非常容易 建立海量存储阵列 它主要是容易的Unix里面 种计数事情是如何。 因此,这是计算有多少 MAU点都有我到了那里。 所以这是423拦截点。 然后,如果我跑了一些粗略的awk,我 可以加起来,在这种特定的系统, 有7.3千兆字节 的可用存储器。 所以这是一个很大的东西。 和存储真的很难。 然而,由于某种原因, 这是一个行业的发展趋势。 每当我跟我们的研究人员 而我们的教师说, 哎,我可以为你运行的存储。 不幸的是,我要 恢复所述存储的成本。 我得到这个业务。 人们引用新蛋 或者它们引用斯台普斯 或者他们可以买多少一 单TB的磁盘驱动器。 所以,你会注意到 在这里,有一个线索。 有在这里一个磁盘驱动器。 如果我们回去,我有很多。 不仅我有很多,我有 复杂的互连 要能够缝合 这些东西放在一起。 因此,与这些大的风险 存储阵列是不小的。 事实上,我们走上 互联网和我们写 约一个善意的一个小故事, 研究温和的导演 computing--恰好有一个 奇怪的英语accent--尝试 解释给研究者什么 实际上没有下划线备份文件夹 意思。 这是相当长的,小故事, 一个好的4分钟发现。 而且请注意,我有一个可怕的 很多比小姐少空间 那唱所有的低音。 我们相当多的帐户下。 但无论如何,这是一个 思考重要的事情, 在什么可能出问题条款。 所以,如果我得到一个磁盘驱动器, 我把它扔在Unix机器, 我开始写东西出来, 有一块磁铁,有一个驱动器磁头, 有表面上,一个或一个零 被写在给该设备。 Motors-- spinny,惊慌 事情总是打破。 想想事情打破。 这一直是spinny,惊慌的事情。 打印机,磁盘驱动器, 机动车辆等。 任何移动很可能会打破。 所以,你需要电机,你 需要驱动器固件, 需要的SAS / SATA控制器,电线, 固件上的SAS / SATA控制器, 低水平块。 选择你的存储控制器的文件 系统的代码,哪一个可能是, 你怎么缝的东西放在一起。 和您的虚拟内存管理器 页面,DRAM获取并存储。 然后,你再弄 堆栈,这是一种 倒在这个名单 1,算法用户。 如果你乘这一点, 了,我不知道有多少, 有很多的地方 那里的东西可以横着走。 我的意思是,这是有关数学的一个例子。 但它是一种乐趣,想想 有多少种事情会出错, 只是为一个磁盘驱动器。 我们已经在300千兆兆字节,所以 想象的磁盘驱动器的数量 你需要在300千兆字节 可能出错。 不仅that--,这样的存储。 并且暗示了 人,我倒要看看 进入舞台左侧,这 是混沌猴子。 因此,在某一点,它会变得 大于刚在磁盘驱动器 问题。 等等,这些优良的女士和绅士 运行流媒体视频服务 意识到自己的电脑是 也巨大,也很复杂 并且也提供服务 一个可怕的人很多。 他们有3700万members--和 这张幻灯片的,也许一年半载old-- 成千上万的设备。 还有数十亿小时的视频。 他们每天记录数十亿的事件。 你可以看到,大多数人看 后来在电视上在晚上, 它远远超过了一切。 因此,他们希望 能够确保 该服务是和 可靠并为他们工作。 于是,他们想出了这个 所谓混沌猴子的事。 这是一个软件 其中,当你觉得 关于谈论称号 这整个介绍, 向外扩展意味着你 要测试这个东西。 这已经不是什么好仅仅有 一万台机器。 因此,对好的事 这是,混沌猴 是一种服务,它 标识系统组 并随机终止1 该系统中的一组。 真棒。 所以我不知道 你,但是如果我有生以来 建,它依赖于其他的系统 系统互相交谈, 你把其中一人出去, 整个事情的工作的可能性, 迅速减小。 所以这一块的软件运行 围绕Netflix的基础设施。 幸运的是,它说,它只能运行在 营业时间的意图 工程师会 警惕并能够作出回应。 所以这些都是类型 的事情,我们现在是 不必做扰乱我们的计算 环境,引进混乱 并引入了复杂性。 那么,谁在自己的权利 心态,会心甘情愿选择 用混沌猴子的工作? 死守,他似乎指向了我。 嗯,我想我should--可爱。 但问题是,你 不要选择。 混沌猴子,你 可以看到,选择你。 这与计算问题 在规模,你不能避免这种情况。 这是复杂的必然性 我们的发展规模和, 在某些方面的专业知识计​​算。 请记住,这是 有一点要记住, 混沌猴子爱 snowflakes--爱雪花。 一个snowflake--我们已经解释了 混沌Monkey--但雪花 是一个服务器,它是唯一的,并 特别细腻和个人 并且永远不会被再现。 我们经常会发现雪花 服务于我们的环境。 我们总是尝试 雪花融化的服务。 但是,如果你找到一个服务器 在您的环境 即长寿临界 你的组织,它融化, 你不能把它重新结合在一起。 因此,混沌猴子的工作是 去终止实例。 如果混沌猴子融化 雪花,你过来,你就大功告成了。 我想谈谈 有些硬件我们 看到在排序方面 向外扩展的活动了。 和一些独特的东西,是在 和周围的科学活性。 我们现在开始看到,记住 这个单位的问题,这架? 所以这是GPGPUs--所以一般的机架 目的图形处理单元。 我们这些位于我们的数据 中心,100个左右英里远。 这种特殊的架 大约是96万亿FLOPS 单精度运算能力 提供出它的背面。 而我们为了130多元 在一个实例卡 这we--多 这种情况下的机架。 因此,这是在这个意义上有趣的是 通用图形处理 能够极其做数学 迅速对于非常低的能量。 所以这是一个大的上扬 在科学计算领域, 看着图形 处理单元的一大途径。 所以我跑了一些Mcollective 通过我们的基础架构的傀儡 昨日,非常兴奋。 只是短期千万亿次的 的单精度。 只是到了这里,这是明确的 小乘数是3.95。 双精度算术 将是约1.2, 但我的Twitter的饲料 看着这样更好,如果我 说我们有近千万亿次 的单精度GPGPUs。 但它到达那里。 它越来越成为 非常,非常令人印象深刻。 为什么我们要这么做? 由于量子化学, 除其他事项外, 但我们开始设计 一些新的光伏技术。 所以阿兰Aspuru-Guzik,谁的 在chemistry--我的合作伙伴的教授 在crime--为过去几年。 我们一直在力推 信封上的计算。 而GPGPU是理想 技术,以便能够做到 一个可怕的很多复杂 数学,非常,非常快。 因此,与规模,带来了新的挑战。 如此巨大scale--你必须要 小心你如何连线这个东西。 和我们有一定的水平 强迫症。 这些照片可能 驾驶人很多坚果。 和橱柜都不是 有线特别好 推动我们的网络和 设施工程师坚果。 再加上另外还有气流 你必须包含的问题。 所以这些事情我 绝不会想到的。 有了规模,带来复杂性。 这是一种新的类型的文件系统。 它的真棒。 这是一个PB级。 它可以存储1.1十亿文件。 它可以读取和写入到13千兆字节 和20千兆字节second--千兆字节 一秒钟。 因此它可以卸载TB的 在任何时间都没有。 和它的高可用性。 而且它有惊人的查找 rates-- 220000查找第二。 而且有很多不同的人 建设这些类型的系统。 你可以看到在这里图形。 这是我们的文件系统之一 这是在负载下,相当 愉快的阅读只是短暂 的22千兆字节的第二。 所以这是cool--这么复杂。 因此,与复杂性和规模, 谈到更多的复杂性,对不对? 这是我们的其中之一, 许多网络图, 在这里你有很多不同 机箱中的所有支持高达 进入主核心交换机, 连接到存储, 连接到低延迟互连。 然后将所有的这一面 房子,只是所有的管理 您需要能够解决 这些系统从远程位置。 所以规模有很多 复杂性与它。 再换档,让我们回到 并有科学的小点。 所以,请记住,调研 计算和这个小shim-- 间粉红色的小垫片 教师和他们所有的算法 和所有的凉爽科学和所有的 该电源和冷却和数据中心 地板与网络和大型计算机 和服务台和帮助台 所以forth--等等,我们只是 他们之间的这种小垫片。 我们已经开始 看到的是,世界上 能够建立 这些大型数据中心 并且能够建立 这些大型计算机。 我们已经得到了它相当不错。 我们不是很擅长这 研究之间的小垫片 而裸机和技术。 而且很难。 因此,我们已经能够聘请 人活在这个世界上。 而最近,我们采访到了 美国国家科学基金会说, 这种横向扩展的东西是伟大的, 但我们不能让我们的科学家 在这些大的复杂的机器。 因此,出现了 不同的节目数量 我们真的大多 关心尝试 看看我们是否可以改变 校园基础设施。 有很多的程序 围绕国家的中心。 所以,我们自己,我们的 朋友在克莱姆森, 威斯康星大学麦迪逊分校, 南加州,犹他州和夏威夷 种了一起 看待这个问题。 在这里,这个小图 是科学的长尾巴。 所以这个is--它不 不管是在该轴, 但该轴实际上是数 职位经历集群。 因此,有35万以上 任何时间段。 这些都是我们通常的嫌疑人 沿此底部。 事实上,还有阿兰Aspuru-Guzik, 谁,我们只是谈论about--吨 和吨计算,真 有效的,知道自己在做什么。 这里的另一个实验室,我将讨论 有关在moment--约翰·科瓦奇的实验室。 他们已经得到了它。 他们是很好的。 他们很高兴。 他们的计算。 重大科学成果是得到完成。 然后,你那种 对来这里,有 是其它基团即 没有运行大量的就业机会。 为什么呢? 是不是因为计算是太辛苦? 是不是因为他们不知道怎么样? 我们不知道,因为 我们已经走了,看着。 所以这就是这个 项目是一回事, 是局部内 每个这些区域, 寻找到途径,我们可以搞 与教师和研究人员 实际上在尾部的底端, 并了解他们在做什么。 所以这件事情,我们 实际上热爱。 而这件事情, 科学将无法继续 向前走,直到我们解决 其中的一些边缘情况。 科学的其它位 这是怎么回事up--大家 看到了大型强子对撞机。 真棒,对不对? 这东西都跑了出来,在霍利奥克。 我们built--的第一 科学发生在霍利奥克 是之间的合作 我们和波士顿大学。 所以这是真的,真的很酷。 这是一个有趣的一块 科学的规模。 这是一个数字的访问 天空世纪的哈佛大学。 基本上,这是一盘存档。 如果你去了Oxford-- 花园街,对不起, 你会发现天文台之一 建筑基本上是满 的大约50万片。 和这些的图片 夜空,超过100年。 所以这是一个全台成立 这里的数字化板, 把他们的照片,注册 他们,把他们的计算机上。 而这是一个PB级半, 正好那里 - 一个小小的项目。 这些都是其他项目。 这种泛-STARRS项目正在做 全宽全景调查, 寻找近地小行星 和瞬态天体事件。 作为分子生物物理学家,我爱 这个词瞬间天上的事件。 我不太知道它是什么,但 反正,我们正在寻找他们。 我们正在产生30兆兆字节 一个晚上的望远镜。 而这还不是一个真正的带宽 问题,那就像一个联邦快递的问题。 所以你把存储在面包车 你把它不管它是什么。 BICEP真的interesting-- 这样的背景影像 宇宙银河系外两极分化。 当我第一次开始工作 在哈佛7左右, 八年前,我记得 工作在这个项目上 它并没有真正下沉 家,为什么偏光 从宇宙微波 背景是很重要的, 直到这件事发生。 这是约翰·科瓦奇, 谁我跟前, 使用亿万CPU的 小时,在我们的设备和其他人, 基本直视内 宇宙的第一时刻 在大爆炸之后,和 试图了解 爱因斯坦的广义相对论。 这是令人兴奋的,我们的电脑 帮助我们解开顾盼 到为什么我们在这里非常的起源。 所以,当你谈论规模, 这是一些严重的规模。 天平的另一件事是, 具体项目打这些家伙。 而这是BICEP响应曲线 [听不清]这是我们的小调查。 你可以在这里看到,生活 好,直到这里, 这是当 公告一出。 和你有字面上 秒响应 在缩放的盛事, 对应于这个小圆点在这里, 这结束了转移 四,所以TB的数据 通过Web服务器 这day--晦涩。 等,这些都是 类型的东西, 可以发生在你的基础设施 如果你不为设计规模。 我们有一个有点 抢的那一天,是 能够跨越出足够的web服务 保持网站启动并运行。 我们取得了成功。 这是一个小的电子邮件 这是种可爱。 这是一个邮件马克Vogelsberger, 和Lars Hernquist,谁的 一名教师在这里哈佛。 更多关于马后。 但我认为这是其一 排序总结了样 的,其中所述计算 在研究计算。 嘿,团队,自去年 周二,你们折磨了 在新的28% 集群相结合 是达78年 CPU在短短的三天。 我说,它仍然 才刚刚周五上午。 这是相当真棒! 周五快乐! 然后我给他们的数据点。 所以这是一种有趣的。 所以,记得马克,他会来 背入画面一点点。 因此,向外扩展的计算是无处不在。 我们甚至帮助人们寻找 在NBA如何运作, 人们都在那里 从扔球。 我真的不明白这个游戏太 好了,不过貌似,这是一个大问题。 还有篮球和碗和金钱。 因此,我们的数据库里 建一个小500听不清] 并行处理器集群, 几个TB的RAM中, 要能够建立这个 柯克和他的团队。 他们正在做的计算 在一个整体的其他方式。 现在,这是项目我们 参与这 绝对迷人,周围神经 可塑性connectomics和基因组 imprinting--三个非常重 研究领域击球 我们对拼 一天到一天的基础。 我们的大脑正在想法 当我们年轻的塑性应力。 而我们很多成年人的行为是 在婴儿时期的经验雕刻。 所以这是一个很大的dealio。 所以这是的资助工作 国立精神卫生研究所。 我们正试图从根本上, 通过大量的大数据 和大数据分析,善良 同行到我们人类的大脑 通过各种 不同的技术。 所以我想种停下来 只是暂停了一小片刻。 用遥控器挑战 数据中心是它的遥远。 它不可能工作。 我需要我的数据附近。 我需要做我的研究,我的实验室。 所以,我种了一个例子 功能性磁共振成像 从我们的数据的数据集 中心的西部大。 并把它连接到我的 台式机在剑桥。 我会玩这个小视频。 希望这将种工作。 因此,这是我的经历 检查我的GPU工作。 而且我检查VNC的了。 这是一个聪明的VNC。 这是3D片一个VNC。 所以,你可以看到在短期内,这 就是我这个纺纱大脑周围。 我试着种得到它导向。 然后我可以移动通过多种 不同的片MRI的数据。 而唯一的事情,就是 这个不同 是,它的未来在电线 从西方的质量。在我的桌面。 而其渲染 比我的台式机快, 因为我没有4000美元 显卡在我的桌面,这 我们拥有了西方大众。 当然,我想聪明。 我跑了GLX齿轮 背景,而做这一切, 以确保我能 强调显卡, 而且,这一切都种 工作和其他一切。 但重要的是, 这是100英里远。 你可以从这个看出, 没有明显的延迟。 东西维系得相当好。 因此,在其本身, 是一个例子,一些见解 到如何计算和横向扩展 计算将要发生。 我们所有的努力 瘦设备。 我们使用平板电脑的越来越多。 所以因此,我的碳 占用基本 从什么用移动 要做到这一点就已经 是一个庞大的机器 在我的办公桌,要什么 现在是一个facility--可以在任何地方。 它可以在任何地方都没有。 然而,它仍然能够带来 回到高性能显卡 在我的桌面。 因此,越来越近了 end--记得马克? 那么,聪明的小伙子是马克。 他决定,他要 建立一个逼真的虚拟世界。 这是相当一个项目,当你 想你已经有了这个球场。 我将使用 计算机,我要去 模拟后,1200万年 宇宙大爆炸,代表了一天。 然后我会做的13.8 十亿年宇宙演化。 行。 这实际上使用计算机 的是大于我们的电脑, 并蔓延到全国 资源,我们的朋友下来在得克萨斯州。 而到了国家设施, 这是一个很大的计算中。 但是,我们做了很多 模拟本地 以确保该软件 工作和系统的工作。 它是这样的日子,你 意识到你支持科学 在这个水平的规模,即 人们现在可以说的东西 就像,我去一个模型的宇宙。 这是他的第一款车型。 这是他的球队的第一款车型。 还有许多其他 乡亲会 来到后面的马克,谁是要 想与高分辨率模型, 更多的特异性, 以更高的精度。 因此,在最后两分钟, 我只是想告诉你这个视频 马克和Lars的对我,再次, 作为一个科学家的生活,是那种可爱。 这样一来,在底部 在这里,给你定位, 这是告诉你 时间以来的大爆炸。 所以我们是在约0.7十亿年。 这是示出了当前的更新。 所以,你看到的那一刻, 暗物质和演变 精细结构和早期的 结构在我们已知的宇宙。 并与此问题是,这 在所有的电脑内部完成。 这是一组参数 和一组物理 和一组数学 和一组模型 这都是经过精心挑选,然后 仔细彼此连接 能够建模的相互作用。 所以你可以看到一些开始 一些气体爆炸在这里。 和气体的温度变化。 你可以开始看到结构 可见宇宙的变化。 而与此的重要组成部分 是,每个小很小,很小,小点 是一块物理的,并具有 一组数学左右, 通知其朋友和邻居。 所以从比例的角度来看,这些 电脑要在演唱会的所有工作 并互相交谈效率。 因此,他们不能太健谈。 他们必须保存他们的结果。 他们要继续 通知所有的朋友。 事实上,你现在看到的,这款机型的 越来越复杂。 还有越来越多的东西怎么回事。 还有越来越多的 围绕材料飞。 而这也正是早期 宇宙会一直样子。 这是一个非常有毛的地方。 有爆炸各地 的地方,功能强大的碰撞。 和形成重 金属和元素。 而这些大云砸入 对方的极端力量。 所以现在我们是9.6十亿 几年从这个最初的爆炸。 你开始看到的东西是 那种平静下来一点点,只是 一点点,因为 能源已开始放松。 所以数学 模型已经得到了到位。 而你开始看到 合并不同的元素。 并开始看到这个东西种 走到一起,慢慢地冷静。 它的开始看起来有点 更像夜空,一点点。 和它的[? QSing。 ?]我们现在30.2 十亿年,我们种完成。 然后他们做了什么了 他们利用这种模式, 然后看着可见宇宙。 基本上然后,分别 能够采取和覆盖 它你可以看到什么。 和保真度是惊人的,以 计算机模型如何准确的。 当然,天体物理学家 和研究小组 需要更好的保真度 甚至更高的分辨率。 但如果你认为是什么 我一直在今天跟你说话 通过双方通过这个小远航 存储和结构和网络 和堆栈,最重要的是, 是向外扩展的计算必不可少的? 这是我原来的hypothesis-- 回到我们的科学方法。 我希望在早期 这部分我会 预测,我就可以解释 给大家介绍横向扩展计算。 种和我们测试 其中的一些假设。 我们通过这次谈话去了。 而我只是想说向外扩展 计算是essential--哦, 是的,很不错。 所以,当你想 关于你的代码,当 你正在做的CS50最后的项目, 当你想你的遗产 人类和资源,我们 需要能够运行这些计算机 系统,觉得很细心 大约每瓦FLOPS, 想想混沌猴子。 想想你的雪花,不 做一取舍,再利用图书馆, 构建可重用codes--所有的东西 该教师已教你 在这个类。 这些都是基本方面。 他们不只是信口开河。 这些都是实实在在的事情。 如果任何一个你想跟着我, 我迷恋与Twitter的东西。 我得莫名其妙地放弃了起来。 但很多的 背景资料 在我们的研究计算 网站rc.fas.harvard.edu。 我尽量保持一个博客达 日期与现代技术 以及我们如何做分配 计算等。 然后我们的工作人员总是 可通过odybot.org。 和odybot是我们的小帮手。 他经常有一点 在他的网站上争奇斗艳 同样,在那里你可以尝试 发现他在校园里。 他是友好的小 脸上的研究计算。 种,我会包有 并感谢大家的时间。 我希望你记住, 横向扩展计算是一个真实的东西。 而且有很多人 谁已经得到了很多现有技术 谁就能帮助你。 和所有的好运与 你的未来作出努力 相信我们的计算均 秤,是高性能, 并帮助更多的人性化 比什么都重要。 所以,感谢您的时间。