1 00:00:00,000 --> 00:00:12,080 2 00:00:12,080 --> 00:00:13,799 >> JAMES袖口:嗨,不錯 下午好。 3 00:00:13,799 --> 00:00:14,715 我的名字是詹姆斯袖口。 4 00:00:14,715 --> 00:00:18,970 我的助理院長研究 這裡計算哈佛大學。 5 00:00:18,970 --> 00:00:24,540 今天我要和你談談 為什麼向外擴展的計算是至關重要的。 6 00:00:24,540 --> 00:00:26,810 >> 所以我想,先上去,這傢伙是誰? 7 00:00:26,810 --> 00:00:27,750 我為什麼在這裡? 8 00:00:27,750 --> 00:00:29,200 為什麼我跟你說話? 9 00:00:29,200 --> 00:00:33,730 我有科學背景 計算和研究計算, 10 00:00:33,730 --> 00:00:38,530 可以追溯到美國 Kingdom--威康信託基金會桑格 11 00:00:38,530 --> 00:00:43,270 研究所人類genome--和 然後,最近在美國 12 00:00:43,270 --> 00:00:50,170 在廣泛等受人尊敬的工作 學習的地方,比如哈佛大學。 13 00:00:50,170 --> 00:00:53,930 >> 我猜這是什麼真正的意思是 我是一個恢復的分子生物 14 00:00:53,930 --> 00:00:55,740 物理學家。 15 00:00:55,740 --> 00:01:01,250 所以,有什麼權利我必須告訴 你對橫向擴展計算? 16 00:01:01,250 --> 00:01:03,570 有一個但是。 17 00:01:03,570 --> 00:01:09,530 18歲的讓我剛剛見過的最 大幅增加的規模複雜 18 00:01:09,530 --> 00:01:13,570 和整體效率 的計算系統。 19 00:01:13,570 --> 00:01:18,890 >> 當我在做我的博士在牛津,我 是相當興奮的一個200兆赫 20 00:01:18,890 --> 00:01:23,830 Silicon Graphics公司機18 千兆字節的存儲和單個CPU。 21 00:01:23,830 --> 00:01:24,910 時代已經變了。 22 00:01:24,910 --> 00:01:29,860 如果你現在快進,我們紡 超過60,000這裡的CPU在哈佛。 23 00:01:29,860 --> 00:01:32,810 許多其他組織 有紡等等。 24 00:01:32,810 --> 00:01:37,740 >> 從這個最重要的是外賣 這種規模是現在不僅不可避免, 25 00:01:37,740 --> 00:01:41,910 它的發生,這是 將繼續發生。 26 00:01:41,910 --> 00:01:44,760 因此,讓我們,一會兒,善良 對快退和說話非常快 27 00:01:44,760 --> 00:01:50,530 關於科學,我最喜歡的 主題,科學的方法。 28 00:01:50,530 --> 00:01:53,180 >> 如果你要成為一名科學家, 你必須做一些關鍵的東西。 29 00:01:53,180 --> 00:01:56,140 如果你不這樣做,這些事情你可以 不認為自己是一個科學家 30 00:01:56,140 --> 00:02:03,250 你將很難能夠 了解你的學科領域。 31 00:02:03,250 --> 00:02:07,290 >> 所以,首先,你會制定 您的問題,產生的假設, 32 00:02:07,290 --> 00:02:09,289 但更重要的是,你 預測你results-- 33 00:02:09,289 --> 00:02:13,090 你有一個猜測, 什麼樣的結果會如何。 34 00:02:13,090 --> 00:02:19,560 然後最後,您測試 假設和分析結果。 35 00:02:19,560 --> 00:02:25,460 >> 所以這個科學的方法是 在計算非常重要。 36 00:02:25,460 --> 00:02:28,450 兩者的預測計算 並能夠測試結果 37 00:02:28,450 --> 00:02:33,660 是我們所需要的一個重要組成部分 做科學的方法。 38 00:02:33,660 --> 00:02:37,310 這些預測和化驗 是真正的兩大基石 39 00:02:37,310 --> 00:02:42,350 科學的方法,並且每個 所需要的最顯著進展 40 00:02:42,350 --> 00:02:45,240 在現代計算。 41 00:02:45,240 --> 00:02:51,210 >> 科學的兩大支柱是 理論和實驗。 42 00:02:51,210 --> 00:02:54,300 而最近, 計算經常被提及 43 00:02:54,300 --> 00:02:58,090 作為是科學的第三大支柱。 44 00:02:58,090 --> 00:03:01,440 所以,如果你的學生看這個, 你絕對沒有壓力。 45 00:03:01,440 --> 00:03:03,960 46 00:03:03,960 --> 00:03:08,720 science--沒有什麼大的第三大支柱 deal--計算,種重要的。 47 00:03:08,720 --> 00:03:14,000 很高興,這是在計算部 計算機科學課程50。 48 00:03:14,000 --> 00:03:16,220 >> 所以足夠的背景。 49 00:03:16,220 --> 00:03:20,226 我想告訴大家的是什麼計劃 我們要談談今天。 50 00:03:20,226 --> 00:03:22,870 我會去對一些歷史。 51 00:03:22,870 --> 00:03:25,250 我要解釋為什麼我們來到這裡。 52 00:03:25,250 --> 00:03:27,750 我要談一些 該計算的歷史 53 00:03:27,750 --> 00:03:33,890 你們是哈佛,一些 圍繞社會媒體活動, 54 00:03:33,890 --> 00:03:36,200 綠色things--很 熱愛一切事物 55 00:03:36,200 --> 00:03:43,640 green-- storage--計算機storage-- 如何混亂影響向外擴展了系統, 56 00:03:43,640 --> 00:03:45,640 和分配系統中尤其如此。 57 00:03:45,640 --> 00:03:48,473 >> 然後我會觸及一些 向外擴展的硬件應該是的 58 00:03:48,473 --> 00:03:51,370 要能需要 做計算的規模。 59 00:03:51,370 --> 00:03:55,830 然後最後,我們要 包裝了一些真棒科學。 60 00:03:55,830 --> 00:04:00,894 >> 那麼,讓我們一分鐘 看看我們的實際歷史。 61 00:04:00,894 --> 00:04:01,810 計算已演變。 62 00:04:01,810 --> 00:04:07,370 如此以來,上世紀60年代,所有的 客場到今天, 63 00:04:07,370 --> 00:04:11,260 我們已經看到,基本上的改變 從集中式計算範圍 64 00:04:11,260 --> 00:04:14,679 下放計算,以 協作然後獨立 65 00:04:14,679 --> 00:04:15,970 計算和右後衛了。 66 00:04:15,970 --> 00:04:17,709 >> 讓我的註釋一點點。 67 00:04:17,709 --> 00:04:20,370 當我們第一次開始了與 電腦,我們有大型機。 68 00:04:20,370 --> 00:04:22,824 他們是不相稱 昂貴的設備。 69 00:04:22,824 --> 00:04:23,990 一切都應該被共享。 70 00:04:23,990 --> 00:04:25,556 計算很複雜。 71 00:04:25,556 --> 00:04:29,060 你可以看到,它填補室和 有運營商和磁帶 72 00:04:29,060 --> 00:04:32,780 和各種whirry的, clicky,spinny設備。 73 00:04:32,780 --> 00:04:39,930 >> 圍繞“70年代80年代初,你開始 看傳真機的影響。 74 00:04:39,930 --> 00:04:43,620 所以,你開始看到的計算 開始出現回實驗室 75 00:04:43,620 --> 00:04:45,880 並成為更接近你。 76 00:04:45,880 --> 00:04:49,800 個人的興起 計算機,當然 77 00:04:49,800 --> 00:04:57,460 在80年代,早期的一部分 十年來,真的改變了計算。 78 00:04:57,460 --> 00:04:59,570 >> 並有一個線索 標題,因為它 79 00:04:59,570 --> 00:05:04,080 被稱為個人計算機, 這意味著它是屬於你的。 80 00:05:04,080 --> 00:05:07,630 從而演變 計算繼續, 81 00:05:07,630 --> 00:05:10,530 人們意識到,他們的個人 電腦是不是真的夠大 82 00:05:10,530 --> 00:05:15,020 要能夠做任何好處的話, 或顯著優點,在科學。 83 00:05:15,020 --> 00:05:17,790 >> 所以人們開始 開發網絡設備 84 00:05:17,790 --> 00:05:21,920 司機能夠連接電腦 在一起,以便能夠建立集群。 85 00:05:21,920 --> 00:05:26,430 因此這個生時代 在Beowulf集群的。 86 00:05:26,430 --> 00:05:32,470 Linux的分解,以響應 專有操作系統,兩者的成本 87 00:05:32,470 --> 00:05:33,650 和複雜性。 88 00:05:33,650 --> 00:05:36,530 >> 然後,在這裡,我們有今天, 在那裡,再次,我們 89 00:05:36,530 --> 00:05:40,610 面對滿房間的電腦 設備和能力 90 00:05:40,610 --> 00:05:44,570 刷卡人的信用卡,並得到 獲得這些計算設備, 91 00:05:44,570 --> 00:05:45,290 遠程。 92 00:05:45,290 --> 00:05:49,680 >> 所以你可以再看看,在 歷史衝擊方面 93 00:05:49,680 --> 00:05:52,180 我們如何做計算 今天,它肯定 94 00:05:52,180 --> 00:05:56,090 從機演變 房間全電腦 95 00:05:56,090 --> 00:05:59,160 通過一些個人計算 一路右後衛再次 96 00:05:59,160 --> 00:06:02,400 到機房全電腦。 97 00:06:02,400 --> 00:06:06,620 >> 所以這是我的第一個集群。 98 00:06:06,620 --> 00:06:10,170 所以2000年,我們建立了一個 在歐洲的計算機系統 99 00:06:10,170 --> 00:06:13,900 有效註釋 人類基因組。 100 00:06:13,900 --> 00:06:16,521 有很多技術 在右手側列 101 00:06:16,521 --> 00:06:18,520 還有,不幸的是, 不再和我們在一起。 102 00:06:18,520 --> 00:06:23,460 它傳遞給了 偉大的技術在天空中。 103 00:06:23,460 --> 00:06:26,610 >> 機器本身可能是 幾個像樣的筆記本電腦相當於 104 00:06:26,610 --> 00:06:29,020 今天,和那種只是說明你。 105 00:06:29,020 --> 00:06:36,260 但是,我們也仔細標註 人類基因組與這兩個保護它 106 00:06:36,260 --> 00:06:43,190 在這個特殊的紙 從關注數據的性質 107 00:06:43,190 --> 00:06:45,380 是公共或私人。 108 00:06:45,380 --> 00:06:48,610 >> 因此,這是真棒,對不對? 109 00:06:48,610 --> 00:06:50,280 所以,我們已經有了一個人類基因組。 110 00:06:50,280 --> 00:06:51,510 我們已經做了計算。 111 00:06:51,510 --> 00:06:53,400 我感覺很高興自己。 112 00:06:53,400 --> 00:06:59,090 我捲起哈佛大學在2006年, 感覺少了很多高興的自己。 113 00:06:59,090 --> 00:07:00,210 >> 這是我繼承。 114 00:07:00,210 --> 00:07:03,575 這是一個部門 電子郵件和文件服務器。 115 00:07:03,575 --> 00:07:05,450 你可以在這裡看到有 磁帶一點點 116 00:07:05,450 --> 00:07:07,710 這是用來裝系統在一起。 117 00:07:07,710 --> 00:07:09,890 這是我們的許可證和打印服務器。 118 00:07:09,890 --> 00:07:13,990 我敢肯定有可能的密碼 對一些中報事貼注。 119 00:07:13,990 --> 00:07:16,560 120 00:07:16,560 --> 00:07:17,360 >> 不真棒。 121 00:07:17,360 --> 00:07:18,530 漂亮遠離真棒。 122 00:07:18,530 --> 00:07:22,060 所以,我意識到這一點圖 我向您展示在開始 123 00:07:22,060 --> 00:07:25,350 從共享所有權 回到共享, 124 00:07:25,350 --> 00:07:27,930 我們需要改變比賽。 125 00:07:27,930 --> 00:07:31,330 因此,我們改變了比賽 通過提供獎勵。 126 00:07:31,330 --> 00:07:34,250 等人,因為這 小百科文章 127 00:07:34,250 --> 00:07:35,990 在這裡說,我們的目的的生物。 128 00:07:35,990 --> 00:07:39,250 和激勵的研究 結構是必要的,以研究 129 00:07:39,250 --> 00:07:41,100 經濟活動。 130 00:07:41,100 --> 00:07:44,580 >> 於是我們開始激勵 我們的教師和我們的研究人員。 131 00:07:44,580 --> 00:07:47,720 因此,我們誘因他們 一個真正的大的計算機系統。 132 00:07:47,720 --> 00:07:52,720 因此,在2008年,我們建立了一個4096 處理器機 - 10架, 133 00:07:52,720 --> 00:07:54,470 幾百千瓦的功率。 134 00:07:54,470 --> 00:07:56,178 >> 我認為是 有趣的是,它不 135 00:07:56,178 --> 00:07:58,300 無論您身在何處的惡性循環。 136 00:07:58,300 --> 00:08:03,510 同樣的電量和 計算時,功率是恆定的。 137 00:08:03,510 --> 00:08:06,270 這是200千瓦我們 正在建造的系統在歐洲。 138 00:08:06,270 --> 00:08:09,770 這是200千瓦 在2008年,而 139 00:08:09,770 --> 00:08:15,820 似乎是[? quanter小?] 大學為基礎的計算系統。 140 00:08:15,820 --> 00:08:20,540 >> 所以,哈佛today--快進,我不是 再傷心大熊貓,相當幸福的熊貓。 141 00:08:20,540 --> 00:08:25,860 我們已經60多萬人的負載平衡 CPU和爬坡顯著。 142 00:08:25,860 --> 00:08:28,780 我們有15個PB的 存儲,也節節攀升。 143 00:08:28,780 --> 00:08:30,720 同樣,這200千瓦 增量,我們似乎 144 00:08:30,720 --> 00:08:33,000 要補充說, 每6個月左右。 145 00:08:33,000 --> 00:08:35,480 很多很多的虛擬機。 146 00:08:35,480 --> 00:08:37,620 更重要的是, 約1.8兆瓦 147 00:08:37,620 --> 00:08:39,669 研究計算設備。 148 00:08:39,669 --> 00:08:41,820 >> 而且我要來 回到這個以後, 149 00:08:41,820 --> 00:08:46,913 為什麼我現在不再是必然 算上我們有多少CPU有, 150 00:08:46,913 --> 00:08:48,980 但有多大的電費。 151 00:08:48,980 --> 00:08:52,690 其他20個這樣的專用 研究人員計算。 152 00:08:52,690 --> 00:08:57,250 更重要的是,我們 開始發展我們的GPGPUs。 153 00:08:57,250 --> 00:09:05,030 我是錯開多少本 被添加在某一天到一天的基礎。 154 00:09:05,030 --> 00:09:07,310 所以,歷史課結束了,對不對? 155 00:09:07,310 --> 00:09:11,280 >> 那麼,我們如何從這裡到達那裡? 156 00:09:11,280 --> 00:09:14,560 讓我們來看看一些現代 橫向擴展計算的例子。 157 00:09:14,560 --> 00:09:18,290 158 00:09:18,290 --> 00:09:23,230 我有點痴迷 大小和社交媒體的比例。 159 00:09:23,230 --> 00:09:30,850 有很多的非常 成功的大規模計算 160 00:09:30,850 --> 00:09:34,820 企業現在在這個星球上, 提供支持和服務 161 00:09:34,820 --> 00:09:36,810 我們大家。 162 00:09:36,810 --> 00:09:39,340 所以這是免責條款。 163 00:09:39,340 --> 00:09:42,990 >> 我想開始一個 在一個Instagram的盎司數。 164 00:09:42,990 --> 00:09:48,336 這實際上不是一個 鉛在一個笑話,這是 165 00:09:48,336 --> 00:09:50,460 甚至不是搞笑, 其實,想起來了。 166 00:09:50,460 --> 00:09:52,751 但無論如何,我們要 看看Instagram的盎司。 167 00:09:52,751 --> 00:09:55,260 我們要開始 與“我的蜜蜂和花。” 168 00:09:55,260 --> 00:09:57,600 我在[聽不清]村 我花了一點圖片 169 00:09:57,600 --> 00:10:00,460 蜜蜂的坐在花。 170 00:10:00,460 --> 00:10:03,270 然後我開始思考 什麼,這實際上意味著。 171 00:10:03,270 --> 00:10:07,013 我拍下了這張照片把我的手機 並計算有多少字節在裡面, 172 00:10:07,013 --> 00:10:09,070 它是關於256千字節。 173 00:10:09,070 --> 00:10:13,550 這時候我開始,基本上會 填補了5和1/4英寸軟盤。 174 00:10:13,550 --> 00:10:15,340 開始想,好吧,這很酷。 175 00:10:15,340 --> 00:10:18,630 >> 我開始看,做 一些研究在網絡上。 176 00:10:18,630 --> 00:10:22,490 而且我發現,Instagram的 擁有2億莫斯。 177 00:10:22,490 --> 00:10:25,105 我本來就不是那 知道什麼是MAU了。 178 00:10:25,105 --> 00:10:28,960 和MAU,到這裡,是 每月活躍用戶。 179 00:10:28,960 --> 00:10:34,270 >> 因此,2億MAUs--很酷。 180 00:10:34,270 --> 00:10:38,190 20十億photographs--等 相當多的照片。 181 00:10:38,190 --> 00:10:42,300 6000萬新照片 每一天 182 00:10:42,300 --> 00:10:46,990 現身在每張照片約0.002演出。 183 00:10:46,990 --> 00:10:51,290 這是約5千兆字節 磁盤恰到好處那裡。 184 00:10:51,290 --> 00:10:55,480 那真的不是中部 什麼我們要談論的話題。 185 00:10:55,480 --> 00:10:57,830 這是小土豆。 186 00:10:57,830 --> 00:11:00,710 或者就像我們說在英國,微小的土豆。 187 00:11:00,710 --> 00:11:05,050 >> 所以,讓我們來看看真正的大象 在room--獨特的面孔。 188 00:11:05,050 --> 00:11:09,170 再次,讓我們衡量 這種新的量子叫MAU。 189 00:11:09,170 --> 00:11:13,260 Facebook上有13十億毛斯。 190 00:11:13,260 --> 00:11:17,510 WhatsApp的,我已經連 聽說直到最近,它的 191 00:11:17,510 --> 00:11:23,260 某種短信服務, 是500萬莫斯。 192 00:11:23,260 --> 00:11:26,620 Instagram的,這是我們剛 講了,2億毛斯。 193 00:11:26,620 --> 00:11:29,370 和Messenger,這是 另一消息服務, 194 00:11:29,370 --> 00:11:31,120 也是2億莫斯。 195 00:11:31,120 --> 00:11:35,920 >> 所以總認為,那是關於 2.2十億用戶總量。 196 00:11:35,920 --> 00:11:39,880 顯然,有一些重疊,但是這 相當於行星的三分之一。 197 00:11:39,880 --> 00:11:44,270 他們送東西的 一個每天12十億的消息的區域。 198 00:11:44,270 --> 00:11:46,680 再次,有7只 十億人在這個星球上。 199 00:11:46,680 --> 00:11:48,550 不是每個人都有的智能手機。 200 00:11:48,550 --> 00:11:53,960 因此,這是瘋狂的數字。 201 00:11:53,960 --> 00:12:02,050 >> 而且我會認為這不是 即使有關存儲或計算。 202 00:12:02,050 --> 00:12:05,610 並引用這首歌, 它是所有關於那個圖。 203 00:12:05,610 --> 00:12:09,045 下面是我們可愛的梅根特雷納下來 在這裡,唱所有的低音。 204 00:12:09,045 --> 00:12:12,570 注意,她也有相當 低音位herself-- 207, 205 00:12:12,570 --> 00:12:16,460 還有2.18億人都看到了 這位小姐唱她的歌。 206 00:12:16,460 --> 00:12:19,910 >> 所以,我的觀點是 它的所有有關的圖形。 207 00:12:19,910 --> 00:12:23,480 因此,我們採取了一些開源軟件 並開始看一個圖表。 208 00:12:23,480 --> 00:12:27,740 這就是LinkedIn,所以這 是Facebook的老人。 209 00:12:27,740 --> 00:12:29,910 所以,這是我的LinkedIn圖。 210 00:12:29,910 --> 00:12:34,080 我有1200左右的節點, 所謂的“朋友”。 211 00:12:34,080 --> 00:12:36,360 這裡就是我在上面。 212 00:12:36,360 --> 00:12:38,140 而這裡的所有的互連。 213 00:12:38,140 --> 00:12:40,570 >> 現在,回想起了Instagram的故事。 214 00:12:40,570 --> 00:12:42,815 其中每一個都是 不僅僅是照片,它 215 00:12:42,815 --> 00:12:46,860 有連接的整個過多 這個特殊的個人之間 216 00:12:46,860 --> 00:12:48,220 和其他許多人。 217 00:12:48,220 --> 00:12:52,190 這是中央一塊或者是一個 在圖形繪製算法的錯誤, 218 00:12:52,190 --> 00:12:55,982 或這也許大衛· 馬蘭,我不知道呢。 219 00:12:55,982 --> 00:12:57,690 所以,你可以重繪 在各種圖表 220 00:12:57,690 --> 00:13:02,510 的ways-- gephi.gihub.io就是 你可以拉從該軟件。 221 00:13:02,510 --> 00:13:05,410 這真的很酷的是 能夠組織社區。 222 00:13:05,410 --> 00:13:08,640 你可以在這裡看到,這是哈佛和 其他地方,我已經工作, 223 00:13:08,640 --> 00:13:12,160 因為這是我的工作有關的數據。 224 00:13:12,160 --> 00:13:15,080 >> 所以只是想想複雜 圖形和所有數據的 225 00:13:15,080 --> 00:13:17,070 你拉一起。 226 00:13:17,070 --> 00:13:20,870 那麼同時,在FriendFace,對不對? 227 00:13:20,870 --> 00:13:24,360 我們看了看Instagram的數據 是五個千兆兆字節的順序。 228 00:13:24,360 --> 00:13:25,300 沒什麼大不了的。 229 00:13:25,300 --> 00:13:28,830 還是相當大量的數據,但沒有大的 在處理事物的更大的計劃。 230 00:13:28,830 --> 00:13:33,850 >> 從這篇文章的老互聯網上, “縮放Facebook的數據倉庫 231 00:13:33,850 --> 00:13:36,250 300 PB的。“ 232 00:13:36,250 --> 00:13:38,110 這是一個完全不同的 現在改變遊戲規則, 233 00:13:38,110 --> 00:13:40,234 你開始的時候 認為數據和圖形的 234 00:13:40,234 --> 00:13:41,690 和你有攜帶。 235 00:13:41,690 --> 00:13:47,480 而他們的高數據增長的 600的順序T字節一天。 236 00:13:47,480 --> 00:13:52,980 >> 現在,你知道的,好了,then-- 我的意思是,每天600 T字節, 237 00:13:52,980 --> 00:13:55,670 300 petabytes--他們 現在也開始 238 00:13:55,670 --> 00:13:58,550 讓很在意 如何保持這種東西 239 00:13:58,550 --> 00:14:01,160 並確保這些數據保持周圍。 240 00:14:01,160 --> 00:14:04,630 這位先生在這裡, 周杰倫帕瑞克,正在尋找 241 00:14:04,630 --> 00:14:08,250 在如何存儲數據的艾字節。 242 00:14:08,250 --> 00:14:10,180 >> 只是對於那些你 誰是一起觀看 243 00:14:10,180 --> 00:14:13,940 在家裡,一個exabyte-- 10到18。 244 00:14:13,940 --> 00:14:18,210 它有自己的維基百科 頁面,這是一個數量那麼大。 245 00:14:18,210 --> 00:14:23,120 這是一個什麼我們的規模和範圍 看,能夠存儲數據。 246 00:14:23,120 --> 00:14:27,090 和這些傢伙不碴周圍, 他們正在存儲數據的量。 247 00:14:27,090 --> 00:14:29,550 因此,線索一個 他們正在尋找在這裡 248 00:14:29,550 --> 00:14:32,185 對於數據中心 所謂冷藏。 249 00:14:32,185 --> 00:14:35,020 250 00:14:35,020 --> 00:14:36,470 >> 這使我是綠色。 251 00:14:36,470 --> 00:14:38,340 這裡是克米特。 252 00:14:38,340 --> 00:14:43,050 他和我同意 - 這是非常 很難做到綠色, 253 00:14:43,050 --> 00:14:44,920 但我們給它我們最好的嘗試。 254 00:14:44,920 --> 00:14:47,430 克米特不能幫助它,他有 是綠色的時候, 255 00:14:47,430 --> 00:14:49,945 不能把他的綠色岬關閉的。 256 00:14:49,945 --> 00:14:55,410 >> 所以,作為一個concepts-- 一些種核心概念 257 00:14:55,410 --> 00:14:59,510 綠色的,當它 涉及到的計算。 258 00:14:59,510 --> 00:15:05,510 的一個是最重要的 是在產品的壽命。 259 00:15:05,510 --> 00:15:09,405 如果你的產品具有短的壽命, 你不能,顧名思義,是綠色的。 260 00:15:09,405 --> 00:15:13,280 能量帶到製造 磁盤驅動器,一個主板,計算機 261 00:15:13,280 --> 00:15:17,890 系統,片劑,不管它可 是,你的系統壽命 262 00:15:17,890 --> 00:15:21,700 是的,你可以如何綠色是一個重要組成部分。 263 00:15:21,700 --> 00:15:27,960 >> 最重要的部分,因為大家 正在建設的軟件algorithms-- 264 00:15:27,960 --> 00:15:30,455 算法的部分 單詞軟件,對不對? 265 00:15:30,455 --> 00:15:34,000 所以,你的算法設計 無論從絕對關鍵 266 00:15:34,000 --> 00:15:43,080 如何你要能夠使 快速而準確的計算,以使用 267 00:15:43,080 --> 00:15:44,710 量最少的能量成為可能。 268 00:15:44,710 --> 00:15:47,280 我會得到這一點。 269 00:15:47,280 --> 00:15:51,270 >> 數據中心設計 - 你見過 我們已經有數千 270 00:15:51,270 --> 00:15:54,870 在數千台機器,坐在 悄悄地在小的,黑暗的角落 271 00:15:54,870 --> 00:15:57,760 世界上運算。 272 00:15:57,760 --> 00:16:01,670 資源allocation--怎麼弄 向計算,到存儲, 273 00:16:01,670 --> 00:16:03,840 通過網絡。 274 00:16:03,840 --> 00:16:08,530 操作系統是一個關鍵部分 此,很多虛擬化 275 00:16:08,530 --> 00:16:12,080 能夠將更多和 多個計算成一個小的空間。 276 00:16:12,080 --> 00:16:15,530 >> 我給你一個小例子 從研究的計算。 277 00:16:15,530 --> 00:16:18,220 我們需要更多的平安,更 動力,和多個管道。 278 00:16:18,220 --> 00:16:21,030 我們需要更多更大, 更好,更快的計算機, 279 00:16:21,030 --> 00:16:23,390 並且需要使用更少的果汁。 280 00:16:23,390 --> 00:16:26,856 我們不能工作了如何做到這一點。 281 00:16:26,856 --> 00:16:29,980 我不知道是否包括hashtag gowest作為 可能使用過的卡戴珊, 282 00:16:29,980 --> 00:16:32,560 但無論如何,gowest。 283 00:16:32,560 --> 00:16:33,220 而我們做到了。 284 00:16:33,220 --> 00:16:36,610 >> 我們拿起我們的操作 我們再搬出來 285 00:16:36,610 --> 00:16:39,660 西方馬薩諸塞 在一個小磨房鎮 286 00:16:39,660 --> 00:16:45,000 所謂的霍利奧克,北部 的Chikopee和斯普林菲爾德。 287 00:16:45,000 --> 00:16:49,280 我們這樣做了幾個原因。 288 00:16:49,280 --> 00:16:55,150 最主要的是,我們 有一個非常,非常大的水壩。 289 00:16:55,150 --> 00:17:00,080 這非常大的水壩能 把精力了30多萬千瓦, 290 00:17:00,080 --> 00:17:02,980 並且它沒有得到充分利用的時間。 291 00:17:02,980 --> 00:17:06,170 >> 更重要的是,我們也有 一個非常複雜的網絡 292 00:17:06,170 --> 00:17:07,254 這是已經到位。 293 00:17:07,254 --> 00:17:09,711 如果你看一下去哪兒網 去美國, 294 00:17:09,711 --> 00:17:11,230 它遵循所有的火車軌道。 295 00:17:11,230 --> 00:17:14,290 這件特殊的網絡是 我們的同事和朋友資 296 00:17:14,290 --> 00:17:16,480 在美國馬薩諸塞州 技術研究所, 297 00:17:16,480 --> 00:17:19,720 它是基本建成 所有的出路路線90。 298 00:17:19,720 --> 00:17:24,760 >> 所以我們有一個大的河流打勾,90路 滴答,我們有100英里短路徑, 299 00:17:24,760 --> 00:17:26,960 及約1000英里長的路徑。 300 00:17:26,960 --> 00:17:29,890 我們也要做一個非常大的 網絡接頭,你可以在這裡看到, 301 00:17:29,890 --> 00:17:32,990 基本上放在一個環節, 能夠連接到霍利奧克, 302 00:17:32,990 --> 00:17:36,390 但我們有所有必要的 infrastructure--平,電力,管道。 303 00:17:36,390 --> 00:17:37,280 生活是不錯的。 304 00:17:37,280 --> 00:17:38,980 再次,大水壩。 305 00:17:38,980 --> 00:17:42,120 >> 因此,我們基本上建立了馬薩諸塞 綠色高性能計算 306 00:17:42,120 --> 00:17:42,850 中心。 307 00:17:42,850 --> 00:17:46,580 這是一個熱愛勞動通過五 universities--麻省理工學院,哈佛大學,麻省大學, 308 00:17:46,580 --> 00:17:47,870 東北和BU。 309 00:17:47,870 --> 00:17:49,554 5兆瓦一天一個連接的負載。 310 00:17:49,554 --> 00:17:51,845 我們做了各種聰明 與禁區省煤器 311 00:17:51,845 --> 00:17:53,585 讓事情變得綠色環保。 312 00:17:53,585 --> 00:18:03,330 我們內置了640多架, 專門用於研究計算。 313 00:18:03,330 --> 00:18:08,770 >> 這是一個古老的棕地,所以我們 有一些回收和一些整潔行動 314 00:18:08,770 --> 00:18:10,500 和一些清理的部位。 315 00:18:10,500 --> 00:18:13,590 然後我們開始 建工廠 316 00:18:13,590 --> 00:18:19,710 並且,boom--可愛的設施與 能夠運行沙盒計算, 317 00:18:19,710 --> 00:18:24,430 有會議和研討會, 也是一個龐大的數據中心地板。 318 00:18:24,430 --> 00:18:26,007 >> 這是我良好的自我。 319 00:18:26,007 --> 00:18:27,590 我明明穿著同樣的外套。 320 00:18:27,590 --> 00:18:29,423 我也許只有一個 外套,但有我 321 00:18:29,423 --> 00:18:34,030 和約翰Goodhue--他是 在Center--執行董事 322 00:18:34,030 --> 00:18:36,740 站立在機器室 地板,正如你所看到的, 323 00:18:36,740 --> 00:18:40,560 是非常戲劇性的,而且它 源遠流長,很長的路要走。 324 00:18:40,560 --> 00:18:44,830 >> 我經常玩遊戲駕駛 從波士頓出來霍利奧克, 325 00:18:44,830 --> 00:18:47,260 假裝我是一個TCP / IP數據包。 326 00:18:47,260 --> 00:18:54,290 我也擔心我的延時 在我的車開車過來。 327 00:18:54,290 --> 00:18:56,690 所以這是一塊綠地。 328 00:18:56,690 --> 00:19:00,070 所以讓我們只花一分鐘 想想棧。 329 00:19:00,070 --> 00:19:04,060 所以,我們正在努力非常認真地 有效地建立數據中心, 330 00:19:04,060 --> 00:19:08,770 計算效率,做好 選擇為計算設備 331 00:19:08,770 --> 00:19:12,060 並提供更多 重要的是,我們的應用程序, 332 00:19:12,060 --> 00:19:17,860 是它的消息服務 或科學應用。 333 00:19:17,860 --> 00:19:19,110 >> 因此,這裡的堆棧。 334 00:19:19,110 --> 00:19:22,762 這樣的物理層中,所有的 一路經過application-- 335 00:19:22,762 --> 00:19:25,220 希望這是要 是你的,當然很大一部分。 336 00:19:25,220 --> 00:19:31,450 OSI七層模型基本上是, 你會生活,吃飯,呼吸 337 00:19:31,450 --> 00:19:35,270 這在整個職業生涯計算。 338 00:19:35,270 --> 00:19:37,800 這整個的物理概念 infrastructure--電線, 339 00:19:37,800 --> 00:19:40,080 電纜,數據中心,鏈接。 340 00:19:40,080 --> 00:19:42,190 而這僅僅是描述網絡。 341 00:19:42,190 --> 00:19:44,780 >> 在這裡,沒錯,是很明顯, 這是一個古老的幻燈片, 342 00:19:44,780 --> 00:19:49,342 因為這應該說是HTTP,因為 無人問津簡單的郵件 343 00:19:49,342 --> 00:19:50,550 傳輸協議了。 344 00:19:50,550 --> 00:19:53,960 這一切都發生在HTTP的空間。 345 00:19:53,960 --> 00:19:55,850 所以這是堆棧的一層。 346 00:19:55,850 --> 00:19:59,460 >> 這裡是另一套書庫,在這裡你的 有一個服務器,主機,虛擬機管理程序, 347 00:19:59,460 --> 00:20:02,470 一個客人,二進制庫, 然後您的應用程序。 348 00:20:02,470 --> 00:20:06,070 或者,在這種情況下,該裝置 驅動程序,Linux內核,本機C, 349 00:20:06,070 --> 00:20:08,080 Java虛擬機 Java的API,那麼Java 350 00:20:08,080 --> 00:20:11,220 的應用程序,等等,等等。 351 00:20:11,220 --> 00:20:14,090 這是一個描述 的一個虛擬機。 352 00:20:14,090 --> 00:20:15,450 >> 聖棧,蝙蝠俠! 353 00:20:15,450 --> 00:20:18,260 想想這 多少計算方面 354 00:20:18,260 --> 00:20:20,850 你需要從獲得 這裡發生了什麼, 355 00:20:20,850 --> 00:20:23,110 一路到頂部 該堆棧,以再 356 00:20:23,110 --> 00:20:26,840 可以做您的實際 交付的應用程序。 357 00:20:26,840 --> 00:20:29,130 >> 如果你種 倒帶並開始思考 358 00:20:29,130 --> 00:20:33,450 關於如何才能提供 浮點運算, 359 00:20:33,450 --> 00:20:37,650 您的浮點運算是總和 芯的插座,數 360 00:20:37,650 --> 00:20:44,490 在插座,一個時鐘,這是 能多快的時鐘turnover-- 361 00:20:44,490 --> 00:20:47,490 4千兆赫,2 gigahertz--然後數 362 00:20:47,490 --> 00:20:50,890 操作即可 做在一個給定的赫茲。 363 00:20:50,890 --> 00:20:54,350 >> 所以今天的微處理器 四到6 FLOPS做 364 00:20:54,350 --> 00:20:55,400 每個時鐘週期。 365 00:20:55,400 --> 00:20:59,810 所以單核2.5演出時鐘 有一個理論性能 366 00:20:59,810 --> 00:21:03,490 約一萬FLOP,給予或採取。 367 00:21:03,490 --> 00:21:05,940 >> 但是,正如一切, 我們有選擇。 368 00:21:05,940 --> 00:21:12,280 所以和英特爾酷睿2,Nehalem處理器 Sandy Bridge的,Haswell的,AMD, 369 00:21:12,280 --> 00:21:13,920 把你的choices--的英特爾Atom。 370 00:21:13,920 --> 00:21:17,670 所有這些處理器架構 都具有略微不同的方式 371 00:21:17,670 --> 00:21:19,650 是能夠加 兩個數字在一起, 372 00:21:19,650 --> 00:21:23,520 這基本上是 他們的生活目的。 373 00:21:23,520 --> 00:21:24,535 一定很辛苦。 374 00:21:24,535 --> 00:21:27,100 還有數以百萬計人坐 在數據中心,現在雖然。 375 00:21:27,100 --> 00:21:30,410 >> 索爾,觸發器每watt-- 這是一件大事。 376 00:21:30,410 --> 00:21:37,780 所以,如果我想獲得更多的這種 打通這個堆棧,更快, 377 00:21:37,780 --> 00:21:41,800 我得對工作有多少 浮點運算的第二 378 00:21:41,800 --> 00:21:43,770 我能做的,然後給他們瓦。 379 00:21:43,770 --> 00:21:46,160 幸運的是,鄉親 已經想到這個問題。 380 00:21:46,160 --> 00:21:49,140 >> 所以這是一個大的 大賽每年都看 381 00:21:49,140 --> 00:21:52,310 誰可以建立最快的計算機 可對角化的矩陣。 382 00:21:52,310 --> 00:21:53,980 這就是所謂的500強。 383 00:21:53,980 --> 00:21:56,420 他們選擇從頂部 最好的500台電腦 384 00:21:56,420 --> 00:21:58,610 在這個星球上,能 矩陣對角化。 385 00:21:58,610 --> 00:22:00,760 你會得到一些驚人的結果。 386 00:22:00,760 --> 00:22:04,660 >> 很多這些機器都是 在10和20兆瓦。 387 00:22:04,660 --> 00:22:09,380 他們可以對角化矩陣 相稱快。 388 00:22:09,380 --> 00:22:13,550 它們不一定角化 他們盡可能高效的每瓦, 389 00:22:13,550 --> 00:22:18,060 所以有這個大推一下 什麼是綠色500強名單會是什麼樣子。 390 00:22:18,060 --> 00:22:20,360 這裡是從6月的列表。 391 00:22:20,360 --> 00:22:22,410 應該有一個新的很快。 392 00:22:22,410 --> 00:22:26,590 >> 並呼籲out--我帶你去 這個特定列表的頂部。 393 00:22:26,590 --> 00:22:32,187 有兩個具體machines-- 1 從東京技術研究所 394 00:22:32,187 --> 00:22:34,520 ,一名來自劍橋 大學在英國。 395 00:22:34,520 --> 00:22:37,700 而這些有相當驚人 每瓦比大型無人問津。 396 00:22:37,700 --> 00:22:42,620 這其中的4389,以及 下一個下來就是3631。 397 00:22:42,620 --> 00:22:47,660 >> 我將解釋之間的差異 這兩個,在接下來的幻燈片。 398 00:22:47,660 --> 00:22:51,320 但這些都是這些 中等規模測試集群。 399 00:22:51,320 --> 00:22:54,732 這些只是34 千瓦或52千瓦。 400 00:22:54,732 --> 00:22:56,940 還有一些較大的 這裡 - 這個特殊的 401 00:22:56,940 --> 00:22:58,860 在瑞士國家 超級計算機中心。 402 00:22:58,860 --> 00:23:00,693 該帶回家的消息 這是我們 403 00:23:00,693 --> 00:23:04,270 試圖找到電腦 可以有效地工作。 404 00:23:04,270 --> 00:23:09,860 >> 所以,讓我們來看看這上面 1,所謂討人喜歡地的肯德基。 405 00:23:09,860 --> 00:23:12,960 和廣告在這裡一點點。 406 00:23:12,960 --> 00:23:15,730 這種特殊的食品公司 沒有任何與此有關。 407 00:23:15,730 --> 00:23:18,240 這是一個事實,即 這個特殊的系統 408 00:23:18,240 --> 00:23:23,830 浸泡在一個非常 聰明油基化合物。 409 00:23:23,830 --> 00:23:27,590 所以他們得到了他們的 雞油炸綽號 410 00:23:27,590 --> 00:23:30,040 當他們第一次開始 建立這些類型的系統。 411 00:23:30,040 --> 00:23:32,740 >> 但基本上,他們已經採取了什麼 這裡是一個數量的葉片, 412 00:23:32,740 --> 00:23:37,560 把他們在這 複雜的礦物油, 413 00:23:37,560 --> 00:23:40,979 然後制定出如何讓所有 網絡進出的。 414 00:23:40,979 --> 00:23:42,895 然後,不僅如此, 他們已經把它放在外面等 415 00:23:42,895 --> 00:23:46,095 它可以利用外部空氣冷卻。 416 00:23:46,095 --> 00:23:47,520 這是相當令人印象深刻。 417 00:23:47,520 --> 00:23:49,630 所以,你所要做的一切 這種有心計 418 00:23:49,630 --> 00:23:53,280 要能得到這個數額 計算交付的小功率。 419 00:23:53,280 --> 00:23:57,360 >> 而且你可以看到這是形狀 那裡的東西都往。 420 00:23:57,360 --> 00:24:01,240 目前的挑戰是,經常風 冷卻經濟規模 421 00:24:01,240 --> 00:24:08,459 並推動了很多 雙方定期計算的發展, 422 00:24:08,459 --> 00:24:09,750 和高性能計算。 423 00:24:09,750 --> 00:24:11,080 所以,這是非常具有破壞性。 424 00:24:11,080 --> 00:24:13,280 我認為這是令人著迷的。 425 00:24:13,280 --> 00:24:15,530 這是一個有點亂,當你 嘗試交換的磁盤驅動器, 426 00:24:15,530 --> 00:24:18,090 但它是一個很酷的想法。 427 00:24:18,090 --> 00:24:22,200 >> 所以,不僅如此,還有 一大堆工作 428 00:24:22,200 --> 00:24:25,450 正在圍繞我們是 調用Open計算項目。 429 00:24:25,450 --> 00:24:29,400 因此,更多的是 一點點後。 430 00:24:29,400 --> 00:24:32,740 不過,業內開始 認識到每瓦FLOPS 431 00:24:32,740 --> 00:24:33,670 正在變得越來越重要。 432 00:24:33,670 --> 00:24:39,256 而你,作為人在這裡,因為 您設計的算法 433 00:24:39,256 --> 00:24:41,130 你設計你的 代碼中,你應該知道 434 00:24:41,130 --> 00:24:43,620 你的代碼可以 有一個連鎖效應。 435 00:24:43,620 --> 00:24:48,380 >> 當馬克坐在這裡他 宿舍裡寫的Facebook 1.0, 436 00:24:48,380 --> 00:24:51,050 我敢肯定他有一個觀點 這將是巨大的。 437 00:24:51,050 --> 00:24:54,945 不過,這將是多麼巨大的是在 環境是一個大dealio。 438 00:24:54,945 --> 00:24:58,340 所以你們大家都可以的 拿出算法 439 00:24:58,340 --> 00:25:01,370 這可能是下一個挑戰性 鄉親像我這樣的事情, 440 00:25:01,370 --> 00:25:02,700 嘗試運行系統。 441 00:25:02,700 --> 00:25:07,360 >> 因此,讓我們只是想想 真正的世界大國的限制。 442 00:25:07,360 --> 00:25:09,930 本文由Landauer-- 是不是一個新事物。 443 00:25:09,930 --> 00:25:12,480 1961年該出版 在IBM雜誌。 444 00:25:12,480 --> 00:25:15,590 這是典型 “不可逆性與熱 445 00:25:15,590 --> 00:25:17,630 新一代的計算過程。“ 446 00:25:17,630 --> 00:25:22,050 因此,他認為, 機器難免 447 00:25:22,050 --> 00:25:25,070 執行邏輯功能 不具有單值的倒數。 448 00:25:25,070 --> 00:25:29,130 >> 這樣的整體的一部分 這是早在上世紀60年代, 449 00:25:29,130 --> 00:25:31,890 鄉親們知道,這是 會成為一個問題。 450 00:25:31,890 --> 00:25:37,080 等限制的法律說25 ℃,一種典型的房間 451 00:25:37,080 --> 00:25:41,120 溫度時,限制 代表0.1電子伏特。 452 00:25:41,120 --> 00:25:44,920 但在理論上,這是 理論,計算機存儲器, 453 00:25:44,920 --> 00:25:51,410 在這個極限操作可能 在同一十億位的第二個改變。 454 00:25:51,410 --> 00:25:54,620 >> 我不知道你,但不 遇到一對多十億位 455 00:25:54,620 --> 00:25:57,190 第二數據速率交換。 456 00:25:57,190 --> 00:26:01,360 這個論點有只 2.8萬億功率的瓦 457 00:26:01,360 --> 00:26:03,180 應該永遠被擴大。 458 00:26:03,180 --> 00:26:08,160 >> 好吧,現實世界example-- 這是我的電費。 459 00:26:08,160 --> 00:26:10,347 我百分之65% 那個可愛的數據中心 460 00:26:10,347 --> 00:26:11,930 我發現你,在這個特定的時間。 461 00:26:11,930 --> 00:26:15,520 這是早在去年六月。 462 00:26:15,520 --> 00:26:21,300 我已經採取的是舊版本,讓我們 那種能和匿名一點。 463 00:26:21,300 --> 00:26:25,470 我是耗資45,000 一個月能有。 464 00:26:25,470 --> 00:26:34,990 >> 所以在那裡的原因是,我們 有超過50,000流程的房間。 465 00:26:34,990 --> 00:26:38,110 所以,你能想像你自己 住宅電費 466 00:26:38,110 --> 00:26:39,540 是高? 467 00:26:39,540 --> 00:26:46,180 但它是一個1.99億 瓦特小時不超過一個月。 468 00:26:46,180 --> 00:26:51,670 >> 所以,我提出的問題是,你能 想像扎克伯格的電費? 469 00:26:51,670 --> 00:26:54,730 煤礦是相當大的,而且我奮鬥。 470 00:26:54,730 --> 00:26:56,600 而且我不是一個人在這。 471 00:26:56,600 --> 00:26:59,450 有很多人 與大型數據中心。 472 00:26:59,450 --> 00:27:04,800 所以,我想,全disclosure-- 我的Facebook好友一點點奇怪。 473 00:27:04,800 --> 00:27:07,900 >> 所以,我的Facebook好友是 所述的Prineville數據中心, 474 00:27:07,900 --> 00:27:14,030 這是Facebook的最大的之一, 最新的,能量最低的數據中心。 475 00:27:14,030 --> 00:27:19,360 他們張貼到我,這樣的事情 用電效能, 476 00:27:19,360 --> 00:27:24,020 在如何有效的數據 中心與你多少精力是 477 00:27:24,020 --> 00:27:26,370 投入是多少 水是他們用,有什麼 478 00:27:26,370 --> 00:27:27,810 的濕度和溫度。 479 00:27:27,810 --> 00:27:29,980 >> 他們有這些 可愛的,可愛的地塊。 480 00:27:29,980 --> 00:27:32,600 我認為這是一個 真棒的Facebook頁面, 481 00:27:32,600 --> 00:27:35,400 但我想我是有點怪異。 482 00:27:35,400 --> 00:27:39,930 >> 因此,人們更省電的事情, 研究計算,我做 483 00:27:39,930 --> 00:27:44,060 是顯著不同 什麼Facebook和雅虎和谷歌 484 00:27:44,060 --> 00:27:50,020 和其它點播,充分, 始終可用的服務。 485 00:27:50,020 --> 00:27:53,530 所以,我的優勢在於,當 ISO新England--和ISO新英格蘭 486 00:27:53,530 --> 00:27:58,910 有助於建立能源 率的區域。 487 00:27:58,910 --> 00:28:01,110 >> 它說,它的擴展 一個請求給消費者 488 00:28:01,110 --> 00:28:05,870 自願節約能量高, 因為高的溫度和濕度。 489 00:28:05,870 --> 00:28:08,680 這又回到了七月的第18位。 490 00:28:08,680 --> 00:28:12,600 所以,我愉快地鳴叫回來,嘿, ISO新英格蘭,綠色哈佛大學。 491 00:28:12,600 --> 00:28:14,880 我們正在做我們的一部分了 在這裡研究計算。 492 00:28:14,880 --> 00:28:16,760 這是因為我們正在做的科學。 493 00:28:16,760 --> 00:28:20,380 >> 並不亞於人說科學 不夜城,科學可以等待。 494 00:28:20,380 --> 00:28:25,030 所以我們能夠停頓我們 系統,利用分級費率 495 00:28:25,030 --> 00:28:30,550 我們的能源法案,並 幫助整個新英格蘭 496 00:28:30,550 --> 00:28:35,910 按地區脫落 負載很多兆瓦。 497 00:28:35,910 --> 00:28:40,020 所以這是唯一的事情, 關於不同科學計算數據 498 00:28:40,020 --> 00:28:48,890 中心和那些 全面投產24/7。 499 00:28:48,890 --> 00:28:51,670 >> 因此,讓我們只是把另一個齒輪在這裡。 500 00:28:51,670 --> 00:28:55,170 所以,我想討論 亂象一點點。 501 00:28:55,170 --> 00:28:59,900 我希望把它放在 存儲的贊助。 502 00:28:59,900 --> 00:29:03,150 因此,對於那些那種 被掙扎 503 00:29:03,150 --> 00:29:08,680 讓他們的周圍有什麼高數量的頭 存儲的模樣,這樣的一個例子。 504 00:29:08,680 --> 00:29:11,660 這是東西排序 我處理所有的時間。 505 00:29:11,660 --> 00:29:15,550 >> 這些小傢伙的每一個 是四TB的硬盤驅動器, 506 00:29:15,550 --> 00:29:17,420 這樣你就可以種數起來。 507 00:29:17,420 --> 00:29:21,370 現在我們正在之間 1至1和1/2 PB的 508 00:29:21,370 --> 00:29:22,970 在一個標準的行業機架。 509 00:29:22,970 --> 00:29:26,430 我們有房和客房,為你 在早期的畫面,約翰看見 510 00:29:26,430 --> 00:29:31,230 而我,充滿這些設備的機架。 511 00:29:31,230 --> 00:29:40,400 因此,它變得非常,非常容易 建立海量存儲陣列 512 00:29:40,400 --> 00:29:44,140 >> 它主要是容易的Unix裡面 種計數事情是如何。 513 00:29:44,140 --> 00:29:48,270 因此,這是計算有多少 MAU點都有我到了那裡。 514 00:29:48,270 --> 00:29:50,880 所以這是423攔截點。 515 00:29:50,880 --> 00:29:55,660 然後,如果我跑了一些粗略的awk,我 可以加起來,在這種特定的系統, 516 00:29:55,660 --> 00:29:59,080 有7.3千兆字節 的可用存儲器。 517 00:29:59,080 --> 00:30:01,350 >> 所以這是一個很大的東西。 518 00:30:01,350 --> 00:30:03,030 和存儲真的很難。 519 00:30:03,030 --> 00:30:06,850 然而,由於某種原因, 這是一個行業的發展趨勢。 520 00:30:06,850 --> 00:30:11,500 每當我跟我們的研究人員 而我們的教師說, 521 00:30:11,500 --> 00:30:14,180 哎,我可以為你運行的存儲。 522 00:30:14,180 --> 00:30:17,690 不幸的是,我要 恢復所述存儲的成本。 523 00:30:17,690 --> 00:30:19,430 我得到這個業務。 524 00:30:19,430 --> 00:30:23,300 人們引用新蛋 或者它們引用斯台普斯 525 00:30:23,300 --> 00:30:27,040 或者他們可以買多少一 單TB的磁盤驅動器。 526 00:30:27,040 --> 00:30:29,390 >> 所以,你會注意到 在這裡,有一個線索。 527 00:30:29,390 --> 00:30:31,310 有在這裡一個磁盤驅動器。 528 00:30:31,310 --> 00:30:33,290 如果我們回去,我有很多。 529 00:30:33,290 --> 00:30:36,130 不僅我有很多,我有 複雜的互連 530 00:30:36,130 --> 00:30:38,750 要能夠縫合 這些東西放在一起。 531 00:30:38,750 --> 00:30:44,080 因此,與這些大的風險 存儲陣列是不小的。 532 00:30:44,080 --> 00:30:46,370 >> 事實上,我們走上 互聯網和我們寫 533 00:30:46,370 --> 00:30:51,670 約一個善意的一個小故事, 研究溫和的導演 534 00:30:51,670 --> 00:30:54,640 computing--恰好有一個 奇怪的英語accent--嘗試 535 00:30:54,640 --> 00:30:59,930 解釋給研究者什麼 實際上沒有下劃線備份文件夾 536 00:30:59,930 --> 00:31:01,070 意思。 537 00:31:01,070 --> 00:31:05,690 這是相當長的,小故事, 一個好的4分鐘發現。 538 00:31:05,690 --> 00:31:09,380 >> 而且請注意,我有一個可怕的 很多比小姐少空間 539 00:31:09,380 --> 00:31:11,800 那唱所有的低音。 540 00:31:11,800 --> 00:31:13,910 我們相當多的帳戶下。 541 00:31:13,910 --> 00:31:16,160 但無論如何,這是一個 思考重要的事情, 542 00:31:16,160 --> 00:31:18,532 在什麼可能出問題條款。 543 00:31:18,532 --> 00:31:20,990 所以,如果我得到一個磁盤驅動器, 我把它扔在Unix機器, 544 00:31:20,990 --> 00:31:24,300 我開始寫東西出來, 有一塊磁鐵,有一個驅動器磁頭, 545 00:31:24,300 --> 00:31:30,150 有表面上,一個或一個零 被寫在給該設備。 546 00:31:30,150 --> 00:31:32,180 >> Motors-- spinny,驚慌 事情總是打破。 547 00:31:32,180 --> 00:31:33,490 想想事情打破。 548 00:31:33,490 --> 00:31:35,170 這一直是spinny,驚慌的事情。 549 00:31:35,170 --> 00:31:38,560 打印機,磁盤驅動器, 機動車輛等。 550 00:31:38,560 --> 00:31:40,590 任何移動很可能會打破。 551 00:31:40,590 --> 00:31:42,575 >> 所以,你需要電機,你 需要驅動器固件, 552 00:31:42,575 --> 00:31:47,110 需要的SAS / SATA控制器,電線, 固件上的SAS / SATA控制器, 553 00:31:47,110 --> 00:31:48,530 低水平塊。 554 00:31:48,530 --> 00:31:54,580 選擇你的存儲控制器的文件 系統的代碼,哪一個可能是, 555 00:31:54,580 --> 00:31:56,780 你怎麼縫的東西放在一起。 556 00:31:56,780 --> 00:32:00,956 和您的虛擬內存管理器 頁面,DRAM獲取並存儲。 557 00:32:00,956 --> 00:32:02,705 然後,你再弄 堆棧,這是一種 558 00:32:02,705 --> 00:32:05,440 倒在這個名單 1,算法用戶。 559 00:32:05,440 --> 00:32:09,050 >> 如果你乘這一點, 了,我不知道有多少, 560 00:32:09,050 --> 00:32:11,640 有很多的地方 那裡的東西可以橫著走。 561 00:32:11,640 --> 00:32:14,430 我的意思是,這是有關數學的一個例子。 562 00:32:14,430 --> 00:32:18,070 但它是一種樂趣,想想 有多少種事情會出錯, 563 00:32:18,070 --> 00:32:21,650 只是為一個磁盤驅動器。 564 00:32:21,650 --> 00:32:25,440 我們已經在300千兆兆字節,所以 想像的磁盤驅動器的數量 565 00:32:25,440 --> 00:32:27,741 你需要在300千兆字節 可能出錯。 566 00:32:27,741 --> 00:32:28,240 567 00:32:28,240 --> 00:32:30,390 不僅that--,這樣的存儲。 568 00:32:30,390 --> 00:32:34,220 並且暗示了 人,我倒要看看 569 00:32:34,220 --> 00:32:38,780 進入舞台左側,這 是混沌猴子。 570 00:32:38,780 --> 00:32:43,140 因此,在某一點,它會變得 大於剛在磁盤驅動器 571 00:32:43,140 --> 00:32:43,920 問題。 572 00:32:43,920 --> 00:32:50,610 >> 等等,這些優良的女士和紳士 運行流媒體視頻服務 573 00:32:50,610 --> 00:32:55,430 意識到自己的電腦是 也巨大,也很複雜 574 00:32:55,430 --> 00:33:00,010 並且也提供服務 一個可怕的人很多。 575 00:33:00,010 --> 00:33:05,180 他們有3700萬members--和 這張幻燈片的,也許一年半載old-- 576 00:33:05,180 --> 00:33:07,350 成千上萬的設備。 577 00:33:07,350 --> 00:33:10,810 還有數十億小時的視頻。 578 00:33:10,810 --> 00:33:13,600 他們每天記錄數十億的事件。 579 00:33:13,600 --> 00:33:17,330 >> 你可以看到,大多數人看 後來在電視上在晚上, 580 00:33:17,330 --> 00:33:19,429 它遠遠超過了一切。 581 00:33:19,429 --> 00:33:21,220 因此,他們希望 能夠確保 582 00:33:21,220 --> 00:33:24,854 該服務是和 可靠並為他們工作。 583 00:33:24,854 --> 00:33:27,020 於是,他們想出了這個 所謂混沌猴子的事。 584 00:33:27,020 --> 00:33:29,000 這是一個軟件 其中,當你覺得 585 00:33:29,000 --> 00:33:34,190 關於談論稱號 這整個介紹, 586 00:33:34,190 --> 00:33:36,530 向外擴展意味著你 要測試這個東西。 587 00:33:36,530 --> 00:33:38,585 這已經不是什麼好僅僅有 一萬台機器。 588 00:33:38,585 --> 00:33:40,460 因此,對好的事 這是,混沌猴 589 00:33:40,460 --> 00:33:43,090 是一種服務,它 標識系統組 590 00:33:43,090 --> 00:33:47,220 並隨機終止1 該系統中的一組。 591 00:33:47,220 --> 00:33:48,429 真棒。 592 00:33:48,429 --> 00:33:50,220 所以我不知道 你,但是如果我有生以來 593 00:33:50,220 --> 00:33:52,990 建,它依賴於其他的系統 系統互相交談, 594 00:33:52,990 --> 00:33:55,865 你把其中一人出去, 整個事情的工作的可能性, 595 00:33:55,865 --> 00:33:57,130 迅速減小。 596 00:33:57,130 --> 00:34:00,475 >> 所以這一塊的軟件運行 圍繞Netflix的基礎設施。 597 00:34:00,475 --> 00:34:03,100 幸運的是,它說,它只能運行在 營業時間的意圖 598 00:34:03,100 --> 00:34:05,810 工程師會 警惕並能夠作出回應。 599 00:34:05,810 --> 00:34:08,020 所以這些都是類型 的事情,我們現在是 600 00:34:08,020 --> 00:34:13,360 不必做擾亂我們的計算 環境,引進混亂 601 00:34:13,360 --> 00:34:15,739 並引入了複雜性。 602 00:34:15,739 --> 00:34:19,139 >> 那麼,誰在自己的權利 心態,會心甘情願選擇 603 00:34:19,139 --> 00:34:22,540 用混沌猴子的工作? 604 00:34:22,540 --> 00:34:24,150 死守,他似乎指向了我。 605 00:34:24,150 --> 00:34:28,719 嗯,我想我should--可愛。 606 00:34:28,719 --> 00:34:32,909 但問題是,你 不要選擇。 607 00:34:32,909 --> 00:34:37,440 混沌猴子,你 可以看到,選擇你。 608 00:34:37,440 --> 00:34:42,650 >> 這與計算問題 在規模,你不能避免這種情況。 609 00:34:42,650 --> 00:34:49,989 這是複雜的必然性 我們的發展規模和, 610 00:34:49,989 --> 00:34:53,280 在某些方面的專業知識計算。 611 00:34:53,280 --> 00:34:55,510 請記住,這是 有一點要記住, 612 00:34:55,510 --> 00:35:00,030 混沌猴子愛 snowflakes--愛雪花。 613 00:35:00,030 --> 00:35:03,470 一個snowflake--我們已經解釋了 混沌Monkey--但雪花 614 00:35:03,470 --> 00:35:09,630 是一個服務器,它是唯一的,並 特別細膩和個人 615 00:35:09,630 --> 00:35:11,770 並且永遠不會被再現。 616 00:35:11,770 --> 00:35:14,790 >> 我們經常會發現雪花 服務於我們的環境。 617 00:35:14,790 --> 00:35:16,700 我們總是嘗試 雪花融化的服務。 618 00:35:16,700 --> 00:35:18,880 但是,如果你找到一個服務器 在您的環境 619 00:35:18,880 --> 00:35:23,240 即長壽臨界 你的組織,它融化, 620 00:35:23,240 --> 00:35:25,300 你不能把它重新結合在一起。 621 00:35:25,300 --> 00:35:28,071 因此,混沌猴子的工作是 去終止實例。 622 00:35:28,071 --> 00:35:30,820 如果混沌猴子融化 雪花,你過來,你就大功告成了。 623 00:35:30,820 --> 00:35:34,390 624 00:35:34,390 --> 00:35:37,950 我想談談 有些硬件我們 625 00:35:37,950 --> 00:35:40,415 看到在排序方面 向外擴展的活動了。 626 00:35:40,415 --> 00:35:43,810 和一些獨特的東西,是在 和周圍的科學活性。 627 00:35:43,810 --> 00:35:46,990 我們現在開始看到,記住 這個單位的問題,這架? 628 00:35:46,990 --> 00:35:51,780 所以這是GPGPUs--所以一般的機架 目的圖形處理單元。 629 00:35:51,780 --> 00:35:55,790 >> 我們這些位於我們的數據 中心,100個左右英里遠。 630 00:35:55,790 --> 00:35:59,780 這種特殊的架 大約是96萬億FLOPS 631 00:35:59,780 --> 00:36:04,090 單精度運算能力 提供出它的背面。 632 00:36:04,090 --> 00:36:10,530 而我們為了130多元 在一個實例卡 633 00:36:10,530 --> 00:36:16,620 這we--多 這種情況下的機架。 634 00:36:16,620 --> 00:36:22,730 >> 因此,這是在這個意義上有趣的是 通用圖形處理 635 00:36:22,730 --> 00:36:27,880 能夠極其做數學 迅速對於非常低的能量。 636 00:36:27,880 --> 00:36:32,060 所以這是一個大的上揚 在科學計算領域, 637 00:36:32,060 --> 00:36:36,400 看著圖形 處理單元的一大途徑。 638 00:36:36,400 --> 00:36:41,990 >> 所以我跑了一些Mcollective 通過我們的基礎架構的傀儡 639 00:36:41,990 --> 00:36:45,330 昨日,非常興奮。 640 00:36:45,330 --> 00:36:48,260 只是短期千萬億次的 的單精度。 641 00:36:48,260 --> 00:36:52,440 只是到了這裡,這是明確的 小乘數是3.95。 642 00:36:52,440 --> 00:36:54,820 雙精度算術 將是約1.2, 643 00:36:54,820 --> 00:36:57,010 但我的Twitter的飼料 看著這樣更好,如果我 644 00:36:57,010 --> 00:37:02,670 說我們有近千萬億次 的單精度GPGPUs。 645 00:37:02,670 --> 00:37:04,220 >> 但它到達那裡。 646 00:37:04,220 --> 00:37:06,280 它越來越成為 非常,非常令人印象深刻。 647 00:37:06,280 --> 00:37:08,550 為什麼我們要這麼做? 648 00:37:08,550 --> 00:37:11,570 由於量子化學, 除其他事項外, 649 00:37:11,570 --> 00:37:15,300 但我們開始設計 一些新的光伏技術。 650 00:37:15,300 --> 00:37:20,210 >> 所以阿蘭Aspuru-Guzik,誰的 在chemistry--我的合作夥伴的教授 651 00:37:20,210 --> 00:37:22,390 在crime--為過去幾年。 652 00:37:22,390 --> 00:37:25,660 我們一直在力推 信封上的計算。 653 00:37:25,660 --> 00:37:30,250 而GPGPU是理想 技術,以便能夠做到 654 00:37:30,250 --> 00:37:34,760 一個可怕的很多複雜 數學,非常,非常快。 655 00:37:34,760 --> 00:37:36,750 >> 因此,與規模,帶來了新的挑戰。 656 00:37:36,750 --> 00:37:41,070 如此巨大scale--你必須要 小心你如何連線這個東西。 657 00:37:41,070 --> 00:37:45,300 和我們有一定的水平 強迫症。 658 00:37:45,300 --> 00:37:49,530 這些照片可能 駕駛人很多堅果。 659 00:37:49,530 --> 00:37:53,390 和櫥櫃都不是 有線特別好 660 00:37:53,390 --> 00:37:56,050 推動我們的網絡和 設施工程師堅果。 661 00:37:56,050 --> 00:37:58,620 再加上另外還有氣流 你必須包含的問題。 662 00:37:58,620 --> 00:38:01,430 >> 所以這些事情我 絕不會想到的。 663 00:38:01,430 --> 00:38:03,480 有了規模,帶來複雜性。 664 00:38:03,480 --> 00:38:05,869 這是一種新的類型的文件系統。 665 00:38:05,869 --> 00:38:06,410 它的真棒。 666 00:38:06,410 --> 00:38:07,660 這是一個PB級。 667 00:38:07,660 --> 00:38:09,905 它可以存儲1.1十億文件。 668 00:38:09,905 --> 00:38:15,940 它可以讀取和寫入到13千兆字節 和20千兆字節second--千兆字節 669 00:38:15,940 --> 00:38:17,150 一秒鐘。 670 00:38:17,150 --> 00:38:20,900 因此它可以卸載TB的 在任何時間都沒有。 671 00:38:20,900 --> 00:38:22,070 >> 和它的高可用性。 672 00:38:22,070 --> 00:38:26,989 而且它有驚人的查找 rates-- 220000查找第二。 673 00:38:26,989 --> 00:38:29,780 而且有很多不同的人 建設這些類型的系統。 674 00:38:29,780 --> 00:38:32,830 你可以看到在這裡圖形。 675 00:38:32,830 --> 00:38:35,800 這是我們的文件系統之一 這是在負載下,相當 676 00:38:35,800 --> 00:38:41,250 愉快的閱讀只是短暫 的22千兆字節的第二。 677 00:38:41,250 --> 00:38:42,790 所以這是cool--這麼複雜。 678 00:38:42,790 --> 00:38:47,230 >> 因此,與複雜性和規模, 談到更多的複雜性,對不對? 679 00:38:47,230 --> 00:38:51,830 這是我們的其中之一, 許多網絡圖, 680 00:38:51,830 --> 00:38:54,970 在這裡你有很多不同 機箱中的所有支持高達 681 00:38:54,970 --> 00:38:57,730 進入主核心交換機, 連接到存儲, 682 00:38:57,730 --> 00:39:00,731 連接到低延遲互連。 683 00:39:00,731 --> 00:39:03,605 然後將所有的這一面 房子,只是所有的管理 684 00:39:03,605 --> 00:39:09,740 您需要能夠解決 這些系統從遠程位置。 685 00:39:09,740 --> 00:39:12,070 所以規模有很多 複雜性與它。 686 00:39:12,070 --> 00:39:14,910 687 00:39:14,910 --> 00:39:17,785 >> 再換檔,讓我們回到 並有科學的小點。 688 00:39:17,785 --> 00:39:21,450 所以,請記住,調研 計算和這個小shim-- 689 00:39:21,450 --> 00:39:25,310 間粉紅色的小墊片 教師和他們所有的算法 690 00:39:25,310 --> 00:39:30,650 和所有的涼爽科學和所有的 該電源和冷卻和數據中心 691 00:39:30,650 --> 00:39:35,330 地板與網絡和大型計算機 和服務台和幫助台 692 00:39:35,330 --> 00:39:39,330 所以forth--等等,我們只是 他們之間的這種小墊片。 693 00:39:39,330 --> 00:39:42,820 >> 我們已經開始 看到的是,世界上 694 00:39:42,820 --> 00:39:45,730 能夠建立 這些大型數據中心 695 00:39:45,730 --> 00:39:48,020 並且能夠建立 這些大型計算機。 696 00:39:48,020 --> 00:39:49,420 我們已經得到了它相當不錯。 697 00:39:49,420 --> 00:39:53,600 我們不是很擅長這 研究之間的小墊片 698 00:39:53,600 --> 00:39:56,670 而裸機和技術。 699 00:39:56,670 --> 00:39:58,600 而且很難。 700 00:39:58,600 --> 00:40:03,330 >> 因此,我們已經能夠聘請 人活在這個世界上。 701 00:40:03,330 --> 00:40:07,590 而最近,我們採訪到了 美國國家科學基金會說, 702 00:40:07,590 --> 00:40:11,440 這種橫向擴展的東西是偉大的, 但我們不能讓我們的科學家 703 00:40:11,440 --> 00:40:13,690 在這些大的複雜的機器。 704 00:40:13,690 --> 00:40:16,040 因此,出現了 不同的節目數量 705 00:40:16,040 --> 00:40:20,100 我們真的大多 關心嘗試 706 00:40:20,100 --> 00:40:22,800 看看我們是否可以改變 校園基礎設施。 707 00:40:22,800 --> 00:40:25,850 >> 有很多的程序 圍繞國家的中心。 708 00:40:25,850 --> 00:40:28,300 所以,我們自己,我們的 朋友在克萊姆森, 709 00:40:28,300 --> 00:40:32,620 威斯康星大學麥迪遜分校, 南加州,猶他州和夏威夷 710 00:40:32,620 --> 00:40:35,780 種了一起 看待這個問題。 711 00:40:35,780 --> 00:40:39,340 在這裡,這個小圖 是科學的長尾巴。 712 00:40:39,340 --> 00:40:41,602 >> 所以這個is--它不 不管是在該軸, 713 00:40:41,602 --> 00:40:45,485 但該軸實際上是數 職位經歷集群。 714 00:40:45,485 --> 00:40:48,940 因此,有35萬以上 任何時間段。 715 00:40:48,940 --> 00:40:51,730 這些都是我們通常的嫌疑人 沿此底部。 716 00:40:51,730 --> 00:40:55,992 事實上,還有阿蘭Aspuru-Guzik, 誰,我們只是談論about--噸 717 00:40:55,992 --> 00:40:58,700 和噸計算,真 有效的,知道自己在做什麼。 718 00:40:58,700 --> 00:41:02,840 >> 這裡的另一個實驗室,我將討論 有關在moment--約翰·科瓦奇的實驗室。 719 00:41:02,840 --> 00:41:03,610 他們已經得到了它。 720 00:41:03,610 --> 00:41:04,210 他們是很好的。 721 00:41:04,210 --> 00:41:04,830 他們很高興。 722 00:41:04,830 --> 00:41:05,960 他們的計算。 723 00:41:05,960 --> 00:41:07,664 重大科學成果是得到完成。 724 00:41:07,664 --> 00:41:09,580 然後,你那種 對來這裡,有 725 00:41:09,580 --> 00:41:12,110 是其它基團即 沒有運行大量的就業機會。 726 00:41:12,110 --> 00:41:13,410 >> 為什麼呢? 727 00:41:13,410 --> 00:41:15,080 是不是因為計算是太辛苦? 728 00:41:15,080 --> 00:41:19,580 是不是因為他們不知道怎麼樣? 729 00:41:19,580 --> 00:41:22,880 我們不知道,因為 我們已經走了,看著。 730 00:41:22,880 --> 00:41:25,620 所以這就是這個 項目是一回事, 731 00:41:25,620 --> 00:41:27,830 是局部內 每個這些區域, 732 00:41:27,830 --> 00:41:32,660 尋找到途徑,我們可以搞 與教師和研究人員 733 00:41:32,660 --> 00:41:36,400 實際上在尾部的底端, 並了解他們在做什麼。 734 00:41:36,400 --> 00:41:37,920 >> 所以這件事情,我們 實際上熱愛。 735 00:41:37,920 --> 00:41:39,920 而這件事情, 科學將無法繼續 736 00:41:39,920 --> 00:41:44,260 向前走,直到我們解決 其中的一些邊緣情況。 737 00:41:44,260 --> 00:41:46,590 科學的其它位 這是怎麼回事up--大家 738 00:41:46,590 --> 00:41:48,260 看到了大型強子對撞機。 739 00:41:48,260 --> 00:41:49,540 真棒,對不對? 740 00:41:49,540 --> 00:41:52,960 這東西都跑了出來,在霍利奧克。 741 00:41:52,960 --> 00:41:56,510 我們built--的第一 科學發生在霍利奧克 742 00:41:56,510 --> 00:41:59,130 是之間的合作 我們和波士頓大學。 743 00:41:59,130 --> 00:42:01,510 所以這是真的,真的很酷。 744 00:42:01,510 --> 00:42:04,410 >> 這是一個有趣的一塊 科學的規模。 745 00:42:04,410 --> 00:42:07,650 這是一個數字的訪問 天空世紀的哈佛大學。 746 00:42:07,650 --> 00:42:09,170 基本上,這是一盤存檔。 747 00:42:09,170 --> 00:42:13,350 如果你去了Oxford-- 花園街,對不起, 748 00:42:13,350 --> 00:42:16,560 你會發現天文台之一 建築基本上是滿 749 00:42:16,560 --> 00:42:19,480 的大約50萬片。 750 00:42:19,480 --> 00:42:24,410 >> 和這些的圖片 夜空,超過100年。 751 00:42:24,410 --> 00:42:28,760 所以這是一個全台成立 這裡的數字化板, 752 00:42:28,760 --> 00:42:32,100 把他們的照片,註冊 他們,把他們的計算機上。 753 00:42:32,100 --> 00:42:36,410 而這是一個PB級半, 正好那裡 - 一個小小的項目。 754 00:42:36,410 --> 00:42:37,530 >> 這些都是其他項目。 755 00:42:37,530 --> 00:42:42,800 這種泛-STARRS項目正在做 全寬全景調查, 756 00:42:42,800 --> 00:42:47,390 尋找近地小行星 和瞬態天體事件。 757 00:42:47,390 --> 00:42:52,100 作為分子生物物理學家,我愛 這個詞瞬間天上的事件。 758 00:42:52,100 --> 00:42:55,050 我不太知道它是什麼,但 反正,我們正在尋找他們。 759 00:42:55,050 --> 00:43:00,372 >> 我們正在產生30兆兆字節 一個晚上的望遠鏡。 760 00:43:00,372 --> 00:43:03,330 而這還不是一個真正的帶寬 問題,那就像一個聯邦快遞的問題。 761 00:43:03,330 --> 00:43:08,420 所以你把存儲在麵包車 你把它不管它是什麼。 762 00:43:08,420 --> 00:43:10,570 >> BICEP真的interesting-- 這樣的背景影像 763 00:43:10,570 --> 00:43:13,850 宇宙銀河系外兩極分化。 764 00:43:13,850 --> 00:43:16,880 當我第一次開始工作 在哈佛7左右, 765 00:43:16,880 --> 00:43:21,440 八年前,我記得 工作在這個項目上 766 00:43:21,440 --> 00:43:26,010 它並沒有真正下沉 家,為什麼偏光 767 00:43:26,010 --> 00:43:29,770 從宇宙微波 背景是很重要的, 768 00:43:29,770 --> 00:43:30,800 直到這件事發生。 769 00:43:30,800 --> 00:43:34,580 >> 這是約翰·科瓦奇, 誰我跟前, 770 00:43:34,580 --> 00:43:42,030 使用億萬CPU的 小時,在我們的設備和其他人, 771 00:43:42,030 --> 00:43:46,600 基本直視內 宇宙的第一時刻 772 00:43:46,600 --> 00:43:49,150 在大爆炸之後,和 試圖了解 773 00:43:49,150 --> 00:43:51,290 愛因斯坦的廣義相對論。 774 00:43:51,290 --> 00:43:56,040 這是令人興奮的,我們的電腦 幫助我們解開顧盼 775 00:43:56,040 --> 00:43:59,280 到為什麼我們在這裡非常的起源。 776 00:43:59,280 --> 00:44:03,450 >> 所以,當你談論規模, 這是一些嚴重的規模。 777 00:44:03,450 --> 00:44:09,260 天平的另一件事是, 具體項目打這些傢伙。 778 00:44:09,260 --> 00:44:15,320 而這是BICEP響應曲線 [聽不清]這是我們的小調查。 779 00:44:15,320 --> 00:44:19,220 >> 你可以在這裡看到,生活 好,直到這裡, 780 00:44:19,220 --> 00:44:21,200 這是當 公告一出。 781 00:44:21,200 --> 00:44:24,120 和你有字面上 秒響應 782 00:44:24,120 --> 00:44:29,020 在縮放的盛事, 對應於這個小圓點在這裡, 783 00:44:29,020 --> 00:44:32,200 這結束了轉移 四,所以TB的數據 784 00:44:32,200 --> 00:44:36,370 通過Web服務器 這day--晦澀。 785 00:44:36,370 --> 00:44:38,210 >> 等,這些都是 類型的東西, 786 00:44:38,210 --> 00:44:43,040 可以發生在你的基礎設施 如果你不為設計規模。 787 00:44:43,040 --> 00:44:45,630 我們有一個有點 搶的那一天,是 788 00:44:45,630 --> 00:44:50,440 能夠跨越出足夠的web服務 保持網站啟動並運行。 789 00:44:50,440 --> 00:44:53,399 我們取得了成功。 790 00:44:53,399 --> 00:44:55,190 這是一個小的電子郵件 這是種可愛。 791 00:44:55,190 --> 00:45:00,245 這是一個郵件馬克Vogelsberger, 和Lars Hernquist,誰的 792 00:45:00,245 --> 00:45:02,650 一名教師在這裡哈佛。 793 00:45:02,650 --> 00:45:03,570 更多關於馬後。 794 00:45:03,570 --> 00:45:05,990 但我認為這是其一 排序總結了樣 795 00:45:05,990 --> 00:45:09,920 的,其中所述計算 在研究計算。 796 00:45:09,920 --> 00:45:12,070 嘿,團隊,自去年 週二,你們折磨了 797 00:45:12,070 --> 00:45:15,470 在新的28% 集群相結合 798 00:45:15,470 --> 00:45:20,040 是達78年 CPU在短短的三天。 799 00:45:20,040 --> 00:45:22,502 我說,它仍然 才剛剛週五上午。 800 00:45:22,502 --> 00:45:23,460 這是相當真棒! 801 00:45:23,460 --> 00:45:24,740 週五快樂! 802 00:45:24,740 --> 00:45:27,450 >> 然後我給他們的數據點。 803 00:45:27,450 --> 00:45:30,260 所以這是一種有趣的。 804 00:45:30,260 --> 00:45:34,840 所以,記得馬克,他會來 背入畫面一點點。 805 00:45:34,840 --> 00:45:36,935 因此,向外擴展的計算是無處不在。 806 00:45:36,935 --> 00:45:41,080 >> 我們甚至幫助人們尋找 在NBA如何運作, 807 00:45:41,080 --> 00:45:43,140 人們都在那裡 從扔球。 808 00:45:43,140 --> 00:45:47,580 我真的不明白這個遊戲太 好了,不過貌似,這是一個大問題。 809 00:45:47,580 --> 00:45:50,610 還有籃球和碗和金錢。 810 00:45:50,610 --> 00:45:55,300 >> 因此,我們的數據庫裡 建一個小500聽不清] 811 00:45:55,300 --> 00:45:58,170 並行處理器集群, 幾個TB的RAM中, 812 00:45:58,170 --> 00:46:03,590 要能夠建立這個 柯克和他的團隊。 813 00:46:03,590 --> 00:46:08,524 他們正在做的計算 在一個整體的其他方式。 814 00:46:08,524 --> 00:46:10,440 現在,這是項目我們 參與這 815 00:46:10,440 --> 00:46:14,880 絕對迷人,周圍神經 可塑性connectomics和基因組 816 00:46:14,880 --> 00:46:20,960 imprinting--三個非常重 研究領域擊球 817 00:46:20,960 --> 00:46:24,650 我們對拼 一天到一天的基礎。 818 00:46:24,650 --> 00:46:30,670 我們的大腦正在想法 當我們年輕的塑性應力。 819 00:46:30,670 --> 00:46:34,980 而我們很多成年人的行為是 在嬰兒時期的經驗雕刻。 820 00:46:34,980 --> 00:46:37,040 所以這是一個很大的dealio。 821 00:46:37,040 --> 00:46:41,360 >> 所以這是的資助工作 國立精神衛生研究所。 822 00:46:41,360 --> 00:46:46,860 我們正試圖從根本上, 通過大量的大數據 823 00:46:46,860 --> 00:46:51,970 和大數據分析,善良 同行到我們人類的大腦 824 00:46:51,970 --> 00:46:54,870 通過各種 不同的技術。 825 00:46:54,870 --> 00:47:00,360 >> 所以我想種停下來 只是暫停了一小片刻。 826 00:47:00,360 --> 00:47:04,160 用遙控器挑戰 數據中心是它的遙遠。 827 00:47:04,160 --> 00:47:05,520 它不可能工作。 828 00:47:05,520 --> 00:47:07,590 我需要我的數據附近。 829 00:47:07,590 --> 00:47:10,730 我需要做我的研究,我的實驗室。 830 00:47:10,730 --> 00:47:18,620 >> 所以,我種了一個例子 功能性磁共振成像 831 00:47:18,620 --> 00:47:22,260 從我們的數據的數據集 中心的西部大。 832 00:47:22,260 --> 00:47:24,660 並把它連接到我的 台式機在劍橋。 833 00:47:24,660 --> 00:47:27,440 我會玩這個小視頻。 834 00:47:27,440 --> 00:47:29,750 希望這將種工作。 835 00:47:29,750 --> 00:47:33,480 >> 因此,這是我的經歷 檢查我的GPU工作。 836 00:47:33,480 --> 00:47:35,430 而且我檢查VNC的了。 837 00:47:35,430 --> 00:47:36,810 這是一個聰明的VNC。 838 00:47:36,810 --> 00:47:38,970 這是3D片一個VNC。 839 00:47:38,970 --> 00:47:41,975 所以,你可以看到在短期內,這 就是我這個紡紗大腦周圍。 840 00:47:41,975 --> 00:47:44,460 我試著種得到它導向。 841 00:47:44,460 --> 00:47:49,574 然後我可以移動通過多種 不同的片MRI的數據。 842 00:47:49,574 --> 00:47:51,490 而唯一的事情,就是 這個不同 843 00:47:51,490 --> 00:47:55,160 是,它的未來在電線 從西方的質量。在我的桌面。 844 00:47:55,160 --> 00:47:57,300 而其渲染 比我的台式機快, 845 00:47:57,300 --> 00:48:02,840 因為我沒有4000美元 顯卡在我的桌面,這 846 00:48:02,840 --> 00:48:04,262 我們擁有了西方大眾。 847 00:48:04,262 --> 00:48:05,720 當然,我想聰明。 848 00:48:05,720 --> 00:48:08,859 我跑了GLX齒輪 背景,而做這一切, 849 00:48:08,859 --> 00:48:10,900 以確保我能 強調顯卡, 850 00:48:10,900 --> 00:48:14,140 而且,這一切都種 工作和其他一切。 851 00:48:14,140 --> 00:48:16,700 但重要的是, 這是100英里遠。 852 00:48:16,700 --> 00:48:20,460 你可以從這個看出, 沒有明顯的延遲。 853 00:48:20,460 --> 00:48:24,600 東西維繫得相當好。 854 00:48:24,600 --> 00:48:28,907 >> 因此,在其本身, 是一個例子,一些見解 855 00:48:28,907 --> 00:48:31,490 到如何計算和橫向擴展 計算將要發生。 856 00:48:31,490 --> 00:48:35,330 我們所有的努力 瘦設備。 857 00:48:35,330 --> 00:48:36,870 我們使用平板電腦的越來越多。 858 00:48:36,870 --> 00:48:39,160 >> 所以因此,我的碳 佔用基本 859 00:48:39,160 --> 00:48:42,060 從什麼用移動 要做到這一點就已經 860 00:48:42,060 --> 00:48:46,060 是一個龐大的機器 在我的辦公桌,要什麼 861 00:48:46,060 --> 00:48:49,550 現在是一個facility--可以在任何地方。 862 00:48:49,550 --> 00:48:50,800 它可以在任何地方都沒有。 863 00:48:50,800 --> 00:48:54,790 然而,它仍然能夠帶來 回到高性能顯卡 864 00:48:54,790 --> 00:48:56,630 在我的桌面。 865 00:48:56,630 --> 00:49:00,900 >> 因此,越來越近了 end--記得馬克? 866 00:49:00,900 --> 00:49:04,480 那麼,聰明的小伙子是馬克。 867 00:49:04,480 --> 00:49:09,360 他決定,他要 建立一個逼真的虛擬世界。 868 00:49:09,360 --> 00:49:12,820 這是相當一個項目,當你 想你已經有了這個球場。 869 00:49:12,820 --> 00:49:14,740 我將使用 計算機,我要去 870 00:49:14,740 --> 00:49:21,040 模擬後,1200萬年 宇宙大爆炸,代表了一天。 871 00:49:21,040 --> 00:49:27,080 然後我會做的13.8 十億年宇宙演化。 872 00:49:27,080 --> 00:49:28,270 行。 873 00:49:28,270 --> 00:49:30,970 >> 這實際上使用計算機 的是大於我們的電腦, 874 00:49:30,970 --> 00:49:35,040 並蔓延到全國 資源,我們的朋友下來在得克薩斯州。 875 00:49:35,040 --> 00:49:38,820 而到了國家設施, 這是一個很大的計算中。 876 00:49:38,820 --> 00:49:40,750 但是,我們做了很多 模擬本地 877 00:49:40,750 --> 00:49:44,820 以確保該軟件 工作和系統的工作。 878 00:49:44,820 --> 00:49:47,790 >> 它是這樣的日子,你 意識到你支持科學 879 00:49:47,790 --> 00:49:51,090 在這個水平的規模,即 人們現在可以說的東西 880 00:49:51,090 --> 00:49:52,840 就像,我去一個模型的宇宙。 881 00:49:52,840 --> 00:49:54,145 這是他的第一款車型。 882 00:49:54,145 --> 00:49:56,422 這是他的球隊的第一款車型。 883 00:49:56,422 --> 00:49:58,130 還有許多其他 鄉親會 884 00:49:58,130 --> 00:50:01,520 來到後面的馬克,誰是要 想與高分辨率模型, 885 00:50:01,520 --> 00:50:04,652 更多的特異性, 以更高的精度。 886 00:50:04,652 --> 00:50:09,105 >> 因此,在最後兩分鐘, 我只是想告訴你這個視頻 887 00:50:09,105 --> 00:50:15,270 馬克和Lars的對我,再次, 作為一個科學家的生活,是那種可愛。 888 00:50:15,270 --> 00:50:17,890 889 00:50:17,890 --> 00:50:20,970 這樣一來,在底部 在這裡,給你定位, 890 00:50:20,970 --> 00:50:23,640 這是告訴你 時間以來的大爆炸。 891 00:50:23,640 --> 00:50:26,570 所以我們是在約0.7十億年。 892 00:50:26,570 --> 00:50:28,740 這是示出了當前的更新。 893 00:50:28,740 --> 00:50:33,450 所以,你看到的那一刻, 暗物質和演變 894 00:50:33,450 --> 00:50:39,910 精細結構和早期的 結構在我們已知的宇宙。 895 00:50:39,910 --> 00:50:45,690 >> 並與此問題是,這 在所有的電腦內部完成。 896 00:50:45,690 --> 00:50:48,530 這是一組參數 和一組物理 897 00:50:48,530 --> 00:50:52,840 和一組數學 和一組模型 898 00:50:52,840 --> 00:50:59,284 這都是經過精心挑選,然後 仔細彼此連接 899 00:50:59,284 --> 00:51:00,825 能夠建模的相互作用。 900 00:51:00,825 --> 00:51:04,850 >> 所以你可以看到一些開始 一些氣體爆炸在這裡。 901 00:51:04,850 --> 00:51:06,880 和氣體的溫度變​​化。 902 00:51:06,880 --> 00:51:13,720 你可以開始看到結構 可見宇宙的變化。 903 00:51:13,720 --> 00:51:18,130 而與此的重要組成部分 是,每個小很小,很小,小點 904 00:51:18,130 --> 00:51:21,070 是一塊物理的,並具有 一組數學左右, 905 00:51:21,070 --> 00:51:23,030 通知其朋友和鄰居。 906 00:51:23,030 --> 00:51:27,245 >> 所以從比例的角度來看,這些 電腦要在演唱會的所有工作 907 00:51:27,245 --> 00:51:29,470 並互相交談效率。 908 00:51:29,470 --> 00:51:31,060 因此,他們不能太健談。 909 00:51:31,060 --> 00:51:33,520 他們必須保存他們的結果。 910 00:51:33,520 --> 00:51:37,902 他們要繼續 通知所有的朋友。 911 00:51:37,902 --> 00:51:40,860 事實上,你現在看到的,這款機型的 越來越複雜。 912 00:51:40,860 --> 00:51:42,590 還有越來越多的東西怎麼回事。 913 00:51:42,590 --> 00:51:45,210 還有越來越多的 圍繞材料飛。 914 00:51:45,210 --> 00:51:48,410 >> 而這也正是早期 宇宙會一直樣子。 915 00:51:48,410 --> 00:51:49,770 這是一個非常有毛的地方。 916 00:51:49,770 --> 00:51:55,140 有爆炸各地 的地方,功能強大的碰撞。 917 00:51:55,140 --> 00:51:58,620 和形成重 金屬和元素。 918 00:51:58,620 --> 00:52:03,910 而這些大雲砸入 對方的極端力量。 919 00:52:03,910 --> 00:52:08,530 >> 所以現在我們是9.6十億 幾年從這個最初的爆炸。 920 00:52:08,530 --> 00:52:12,310 你開始看到的東西是 那種平靜下來一點點,只是 921 00:52:12,310 --> 00:52:15,660 一點點,因為 能源已開始放鬆。 922 00:52:15,660 --> 00:52:19,420 所以數學 模型已經得到了到位。 923 00:52:19,420 --> 00:52:22,510 而你開始看到 合併不同的元素。 924 00:52:22,510 --> 00:52:26,220 並開始看到這個東西種 走到一起,慢慢地冷靜。 925 00:52:26,220 --> 00:52:32,260 >> 它的開始看起來有點 更像夜空,一點點。 926 00:52:32,260 --> 00:52:37,870 和它的[? QSing。 ?]我們現在30.2 十億年,我們種完成。 927 00:52:37,870 --> 00:52:41,130 然後他們做了什麼了 他們利用這種模式, 928 00:52:41,130 --> 00:52:44,580 然後看著可見宇宙。 929 00:52:44,580 --> 00:52:48,560 基本上然後,分別 能夠採取和覆蓋 930 00:52:48,560 --> 00:52:50,580 它你可以看到什麼。 931 00:52:50,580 --> 00:52:56,160 和保真度是驚人的,以 計算機模型如何準確的。 932 00:52:56,160 --> 00:52:58,760 >> 當然,天體物理學家 和研究小組 933 00:52:58,760 --> 00:53:02,780 需要更好的保真度 甚至更高的分辨率。 934 00:53:02,780 --> 00:53:06,230 但如果你認為是什麼 我一直在今天跟你說話 935 00:53:06,230 --> 00:53:11,850 通過雙方通過這個小遠航 存儲和結構和網絡 936 00:53:11,850 --> 00:53:18,000 和堆棧,最重要的是, 是向外擴展的計算必不可少的? 937 00:53:18,000 --> 00:53:22,050 這是我原來的hypothesis-- 回到我們的科學方法。 938 00:53:22,050 --> 00:53:24,810 >> 我希望在早期 這部分我會 939 00:53:24,810 --> 00:53:29,400 預測,我就可以解釋 給大家介紹橫向擴展計算。 940 00:53:29,400 --> 00:53:32,870 種和我們測試 其中的一些假設。 941 00:53:32,870 --> 00:53:34,585 我們通過這次談話去了。 942 00:53:34,585 --> 00:53:38,920 而我只是想說向外擴展 計算是essential--哦, 943 00:53:38,920 --> 00:53:42,480 是的,很不錯。 944 00:53:42,480 --> 00:53:44,790 >> 所以,當你想 關於你的代碼,當 945 00:53:44,790 --> 00:53:49,230 你正在做的CS50最後的項目, 當你想你的遺產 946 00:53:49,230 --> 00:53:52,990 人類和資源,我們 需要能夠運行這些計算機 947 00:53:52,990 --> 00:53:56,650 系統,覺得很細心 大約每瓦FLOPS, 948 00:53:56,650 --> 00:53:58,560 想想混沌猴子。 949 00:53:58,560 --> 00:54:02,240 >> 想想你的雪花,不 做一取捨,再利用圖書館, 950 00:54:02,240 --> 00:54:06,453 構建可重用codes--所有的東​​西 該教師已教你 951 00:54:06,453 --> 00:54:08,630 在這個類。 952 00:54:08,630 --> 00:54:11,942 這些都是基本方面。 953 00:54:11,942 --> 00:54:13,150 他們不只是信口開河。 954 00:54:13,150 --> 00:54:15,660 這些都是實實在在的事情。 955 00:54:15,660 --> 00:54:20,680 >> 如果任何一個你想跟著我, 我迷戀與Twitter的東西。 956 00:54:20,680 --> 00:54:22,770 我得莫名其妙地放棄了起來。 957 00:54:22,770 --> 00:54:24,960 但很多的 背景資料 958 00:54:24,960 --> 00:54:29,260 在我們的研究計算 網站rc.fas.harvard.edu。 959 00:54:29,260 --> 00:54:34,010 >> 我盡量保持一個博客達 日期與現代技術 960 00:54:34,010 --> 00:54:38,390 以及我們如何做分配 計算等。 961 00:54:38,390 --> 00:54:43,600 然後我們的工作人員總是 可通過odybot.org。 962 00:54:43,600 --> 00:54:46,270 和odybot是我們的小幫手。 963 00:54:46,270 --> 00:54:49,280 他經常有一點 在他的網站上爭奇鬥艷 964 00:54:49,280 --> 00:54:51,630 同樣,在那裡你可以嘗試 發現他在校園裡。 965 00:54:51,630 --> 00:54:55,200 他是友好的小 臉上的研究計算。 966 00:54:55,200 --> 00:54:59,730 >> 種,我會包有 並感謝大家的時間。 967 00:54:59,730 --> 00:55:05,660 我希望你記住, 橫向擴展計算是一個真實的東西。 968 00:55:05,660 --> 00:55:08,162 而且有很多人 誰已經得到了很多現有技術 969 00:55:08,162 --> 00:55:09,370 誰就能幫助你。 970 00:55:09,370 --> 00:55:14,330 和所有的好運與 你的未來作出努力 971 00:55:14,330 --> 00:55:18,280 相信我們的計算均 秤,是高性能, 972 00:55:18,280 --> 00:55:20,370 並幫助更多的人性化 比什麼都重要。 973 00:55:20,370 --> 00:55:22,850 所以,感謝您的時間。 974 00:55:22,850 --> 00:55:23,947