1 00:00:00,000 --> 00:00:12,080 2 00:00:12,080 --> 00:00:13,799 >> JAMES CUFF: Hej, bra eftermiddag, alla. 3 00:00:13,799 --> 00:00:14,715 Mitt namn är James Cuff. 4 00:00:14,715 --> 00:00:18,970 Jag är prodekanus för forskning Computing här på Harvard University. 5 00:00:18,970 --> 00:00:24,540 Och idag ska jag prata med dig om varför scale-out computing är viktigt. 6 00:00:24,540 --> 00:00:26,810 >> Så jag antar att, först upp, vem är den här killen? 7 00:00:26,810 --> 00:00:27,750 Varför är jag här? 8 00:00:27,750 --> 00:00:29,200 Varför pratar jag med dig? 9 00:00:29,200 --> 00:00:33,730 Jag har en bakgrund inom vetenskaplig datorer och forskning computing, 10 00:00:33,730 --> 00:00:38,530 sträcker sig tillbaka till Förenta Kingdom-- The Wellcome Trust Sanger 11 00:00:38,530 --> 00:00:43,270 Institutet för mänskliga genome-- och då mer nyligen i USA 12 00:00:43,270 --> 00:00:50,170 arbetar vid Broad och andra aktad platser för lärande, som Harvard. 13 00:00:50,170 --> 00:00:53,930 >> Jag gissa vad det egentligen betyder är att jag är en tillfrisknande molekylär bio 14 00:00:53,930 --> 00:00:55,740 fysiker. 15 00:00:55,740 --> 00:01:01,250 Så vad rätt jag har fått berätta dig om scale-out computing? 16 00:01:01,250 --> 00:01:03,570 Det finns en dock. 17 00:01:03,570 --> 00:01:09,530 18 år eller så jag har bara sett det mesta dramatiska ökningar i skal komplexitet 18 00:01:09,530 --> 00:01:13,570 och totala effektiviteten av datasystem. 19 00:01:13,570 --> 00:01:18,890 >> När jag gjorde min doktorsexamen vid Oxford, jag var ganska glada med en 200 megahertz 20 00:01:18,890 --> 00:01:23,830 Silicon Graphics maskin med 18 gigabyte lagringsutrymme och en enda processor. 21 00:01:23,830 --> 00:01:24,910 Tiderna har förändrats. 22 00:01:24,910 --> 00:01:29,860 Om du snabbt framåt nu, vi snurrar över 60.000 processorer här på Harvard. 23 00:01:29,860 --> 00:01:32,810 Många andra organisationer snurrar många fler. 24 00:01:32,810 --> 00:01:37,740 >> Det viktiga takeaway från detta är den skalan är nu inte bara oundvikligt, 25 00:01:37,740 --> 00:01:41,910 det har hänt och det är kommer att fortsätta att hända. 26 00:01:41,910 --> 00:01:44,760 Så låt oss för ett ögonblick, snäll av spola tillbaka och prata mycket snabbt 27 00:01:44,760 --> 00:01:50,530 om vetenskap, min favorit ämne, den vetenskapliga metoden. 28 00:01:50,530 --> 00:01:53,180 >> Om du ska vara en vetenskapsman, du behöver göra några viktiga saker. 29 00:01:53,180 --> 00:01:56,140 Om du inte gör dessa saker som du kan inte anser dig själv en vetenskapsman 30 00:01:56,140 --> 00:02:03,250 och du kommer att kämpa att kunna förstår ditt område av disciplin. 31 00:02:03,250 --> 00:02:07,290 >> Så först av allt, skulle du formulera din fråga, generera dig hypoteser, 32 00:02:07,290 --> 00:02:09,289 men ännu viktigare, du förutspå din results-- 33 00:02:09,289 --> 00:02:13,090 du har en gissning om vad resultatet kommer att bli. 34 00:02:13,090 --> 00:02:19,560 Och slutligen, du testa din hypotes och analysera dina resultat. 35 00:02:19,560 --> 00:02:25,460 >> Så denna vetenskapliga metod är oerhört viktigt i datoranvändning. 36 00:02:25,460 --> 00:02:28,450 Computing av både förutsägelsen och att kunna testa dina resultat 37 00:02:28,450 --> 00:02:33,660 är en viktig del av vad vi behöver att göra i den vetenskapliga metoden. 38 00:02:33,660 --> 00:02:37,310 Dessa förutsägelser och provningar är de verkliga två hörnstenar 39 00:02:37,310 --> 00:02:42,350 av den vetenskapliga metoden, och varje kräver de mest betydande framsteg 40 00:02:42,350 --> 00:02:45,240 i modern beräkning. 41 00:02:45,240 --> 00:02:51,210 >> De två pelarna i vetenskapen är att av teori och experiment. 42 00:02:51,210 --> 00:02:54,300 Och på senare tid, computing nämns ofta 43 00:02:54,300 --> 00:02:58,090 som den tredje pelaren i vetenskapen. 44 00:02:58,090 --> 00:03:01,440 Så om du eleverna tittar här, du har absolut ingen press. 45 00:03:01,440 --> 00:03:03,960 46 00:03:03,960 --> 00:03:08,720 Tredje pelare science-- ingen stor Deal-- computing, typ av viktiga. 47 00:03:08,720 --> 00:03:14,000 Så glad att detta är den datordelen av datavetenskap kurs 50. 48 00:03:14,000 --> 00:03:16,220 >> Så nog av bakgrunden. 49 00:03:16,220 --> 00:03:20,226 Jag vill berätta planen för vad vi ska prata om idag. 50 00:03:20,226 --> 00:03:22,870 Jag ska gå igenom några historia. 51 00:03:22,870 --> 00:03:25,250 Jag ska förklara varför vi kom hit. 52 00:03:25,250 --> 00:03:27,750 Jag ska tala om några av historien om den dator 53 00:03:27,750 --> 00:03:33,890 här på Harvard, en del aktiviteter runt sociala medier, 54 00:03:33,890 --> 00:03:36,200 grön saker-- mycket brinner allt 55 00:03:36,200 --> 00:03:43,640 green-- storage-- dator storage-- hur kaos drabbar scale-out out system, 56 00:03:43,640 --> 00:03:45,640 och distributionssystemen i synnerhet. 57 00:03:45,640 --> 00:03:48,473 >> Och sedan ska jag beröra några av skalan ut maskinvara som är 58 00:03:48,473 --> 00:03:51,370 krävs för att kunna gör computing på skalan. 59 00:03:51,370 --> 00:03:55,830 Och sedan slutligen, ska vi avsluta med några enorma vetenskap. 60 00:03:55,830 --> 00:04:00,894 >> Så, låt oss ta en minut att titta på våra faktiska historien. 61 00:04:00,894 --> 00:04:01,810 Computing har utvecklats. 62 00:04:01,810 --> 00:04:07,370 Så eftersom 60-talet, alla borta fram till idag, 63 00:04:07,370 --> 00:04:11,260 Vi har sett i stort sett en förändring av omfattning från centraliserad databehandling 64 00:04:11,260 --> 00:04:14,679 att decentralisera computing, till samarbete och då oberoende 65 00:04:14,679 --> 00:04:15,970 computing och tillbaka igen. 66 00:04:15,970 --> 00:04:17,709 >> Och låt mig kommentera att lite. 67 00:04:17,709 --> 00:04:20,370 När vi först började med datorer, hade vi stordatorer. 68 00:04:20,370 --> 00:04:22,824 De var omåttligt dyra apparater. 69 00:04:22,824 --> 00:04:23,990 Allt måste delas. 70 00:04:23,990 --> 00:04:25,556 Beräknings var komplex. 71 00:04:25,556 --> 00:04:29,060 Du kan se, det fyllde rum och fanns operatörer och band 72 00:04:29,060 --> 00:04:32,780 och alla sorters Whirry, clicky, spinny anordningar. 73 00:04:32,780 --> 00:04:39,930 >> Runt 70-talet början av 80-talet, började man att se en effekt av de faxar. 74 00:04:39,930 --> 00:04:43,620 Så du börjar se computing börjar dyka upp i laboratorier 75 00:04:43,620 --> 00:04:45,880 och bli närmare dig. 76 00:04:45,880 --> 00:04:49,800 Ökningen av den personliga dator, förvisso 77 00:04:49,800 --> 00:04:57,460 under 80-talet, början av decennium, verkligen förändrats datoranvändning. 78 00:04:57,460 --> 00:04:59,570 >> Och det finns en ledtråd i titeln, eftersom det 79 00:04:59,570 --> 00:05:04,080 kallades den personliga datorn, vilket innebar att det tillhörde dig. 80 00:05:04,080 --> 00:05:07,630 Så som utvecklingen av computing fortsatte, 81 00:05:07,630 --> 00:05:10,530 människor insåg att deras personliga dator var inte riktigt tillräckligt stor 82 00:05:10,530 --> 00:05:15,020 för att kunna göra något för någon förtjänst, eller betydande meriter, inom vetenskapen. 83 00:05:15,020 --> 00:05:17,790 >> Och så folk började utveckla nätverksenhet 84 00:05:17,790 --> 00:05:21,920 förare att kunna ansluta datorer tillsammans för att kunna bygga kluster. 85 00:05:21,920 --> 00:05:26,430 Och så detta födde eran av Beowulf klustret. 86 00:05:26,430 --> 00:05:32,470 Linux exploderade som ett svar på proprietära operativsystem, både kostnads 87 00:05:32,470 --> 00:05:33,650 och komplexitet. 88 00:05:33,650 --> 00:05:36,530 >> Och sedan, här vi är idag, där, ännu en gång, vi är 89 00:05:36,530 --> 00:05:40,610 inför rum full av dator utrustning och förmågan 90 00:05:40,610 --> 00:05:44,570 att dra sitt kreditkort och få tillgång till dessa datoranläggningar, 91 00:05:44,570 --> 00:05:45,290 distans. 92 00:05:45,290 --> 00:05:49,680 >> Och så kan du sedan se, i gäller historia slag 93 00:05:49,680 --> 00:05:52,180 hur vi gör computing idag är det definitivt 94 00:05:52,180 --> 00:05:56,090 utvecklats från maskin rum full av datorer 95 00:05:56,090 --> 00:05:59,160 genom några persondatorer hela vägen tillbaka igen 96 00:05:59,160 --> 00:06:02,400 till maskin rum fullt av datorer. 97 00:06:02,400 --> 00:06:06,620 >> Så det här är min första klustret. 98 00:06:06,620 --> 00:06:10,170 Så 2000 byggde vi en datorsystem i Europa 99 00:06:10,170 --> 00:06:13,900 att effektivt kommentera det mänskliga genomet. 100 00:06:13,900 --> 00:06:16,521 Det finns en hel del teknik noterat på höger sida 101 00:06:16,521 --> 00:06:18,520 Det som tyvärr är inte längre med oss. 102 00:06:18,520 --> 00:06:23,460 Det har gått iväg till fantastisk teknik på himlen. 103 00:06:23,460 --> 00:06:26,610 >> Maskinen i sig är förmodligen motsvarighet till några anständigt laptops 104 00:06:26,610 --> 00:06:29,020 idag, och att bara typ av visar. 105 00:06:29,020 --> 00:06:36,260 Men vi noggrant kommentera det mänskliga genomet och båda skyddade den 106 00:06:36,260 --> 00:06:43,190 med just denna papper i Natur från den oro de uppgifter 107 00:06:43,190 --> 00:06:45,380 är offentliga eller privata. 108 00:06:45,380 --> 00:06:48,610 >> Så det här är häftigt, eller hur? 109 00:06:48,610 --> 00:06:50,280 Så vi har fått en mänskliga genomet. 110 00:06:50,280 --> 00:06:51,510 Vi har gjort computing. 111 00:06:51,510 --> 00:06:53,400 Jag känner mig väldigt nöjd själv. 112 00:06:53,400 --> 00:06:59,090 Jag rullade upp till Harvard 2006, känna mycket mindre nöjd med mig själv. 113 00:06:59,090 --> 00:07:00,210 >> Detta är vad jag ärvt. 114 00:07:00,210 --> 00:07:03,575 Detta är en institutions post och filserver. 115 00:07:03,575 --> 00:07:05,450 Du kan se här finns det lite tejp 116 00:07:05,450 --> 00:07:07,710 som används för att hålla systemet tillsammans. 117 00:07:07,710 --> 00:07:09,890 Detta är vår licens och skrivarserver. 118 00:07:09,890 --> 00:07:13,990 Jag är ganska säker på att det kanske lösenord På vissa av dessa Post-it-lappar. 119 00:07:13,990 --> 00:07:16,560 120 00:07:16,560 --> 00:07:17,360 >> Inte häftigt. 121 00:07:17,360 --> 00:07:18,530 Ganska långt från fantastisk. 122 00:07:18,530 --> 00:07:22,060 Och så inser jag den här lilla diagrammet att jag visade dig i början 123 00:07:22,060 --> 00:07:25,350 från att dela med ägandet tillbaka till delning, 124 00:07:25,350 --> 00:07:27,930 att vi behövde förändra spelet. 125 00:07:27,930 --> 00:07:31,330 Och så vi bytte spelet genom att skapa incitament. 126 00:07:31,330 --> 00:07:34,250 Och så människor, eftersom detta lilla Wikipedia artikeln 127 00:07:34,250 --> 00:07:35,990 säger här, våra målmedvetna varelser. 128 00:07:35,990 --> 00:07:39,250 Och studiet av incitament strukturer är avgörande för studien 129 00:07:39,250 --> 00:07:41,100 av den ekonomiska aktiviteten. 130 00:07:41,100 --> 00:07:44,580 >> Så vi började att uppmuntra vår fakultet och våra forskare. 131 00:07:44,580 --> 00:07:47,720 Och så vi incitament dem med en riktigt stor datorsystem. 132 00:07:47,720 --> 00:07:52,720 Så i 2008, byggde vi en 4096 processor machine-- 10 rack, 133 00:07:52,720 --> 00:07:54,470 par hundra kilowatt ström. 134 00:07:54,470 --> 00:07:56,178 >> Vad jag tycker är intressant är att det inte 135 00:07:56,178 --> 00:07:58,300 Oavsett var du befinner dig i cykeln. 136 00:07:58,300 --> 00:08:03,510 Samma mängd kraft och beräkna, är kraften konstant. 137 00:08:03,510 --> 00:08:06,270 Det var 200 kilowatt när vi byggde systemen i Europa. 138 00:08:06,270 --> 00:08:09,770 Det är två hundra kilowatt 2008, och att 139 00:08:09,770 --> 00:08:15,820 verkar vara [? quanter?] av små universitetsbaserade datorsystem. 140 00:08:15,820 --> 00:08:20,540 >> Så Harvard today-- snabbspolning framåt, jag är ingen längre ledsen panda, ganska glad panda. 141 00:08:20,540 --> 00:08:25,860 Vi har 60-udda tusen belastning balanserad Processorer, och deras klättring dramatiskt. 142 00:08:25,860 --> 00:08:28,780 Vi har 15 petabyte lagring, även klättring. 143 00:08:28,780 --> 00:08:30,720 Återigen, detta 200 kilowatt ökning, vi verkar 144 00:08:30,720 --> 00:08:33,000 vara tillade att var sjätte eller så månader. 145 00:08:33,000 --> 00:08:35,480 Partier och massor av virtuella maskiner. 146 00:08:35,480 --> 00:08:37,620 Och ännu viktigare, ca 1,8 megawatt 147 00:08:37,620 --> 00:08:39,669 forskningsdatautrustning. 148 00:08:39,669 --> 00:08:41,820 >> Och jag kommer att komma tillbaka till detta senare, 149 00:08:41,820 --> 00:08:46,913 till varför jag nu inte längre nödvändigtvis räkna hur mycket CPU vi har, 150 00:08:46,913 --> 00:08:48,980 men hur stor är elräkningen. 151 00:08:48,980 --> 00:08:52,690 20 andra så dedikerad forsknings computing personal. 152 00:08:52,690 --> 00:08:57,250 Och ännu viktigare, vi är börjar växa vår GPGPUs. 153 00:08:57,250 --> 00:09:05,030 Jag var stapplade över hur mycket av detta läggs på en dag till dag. 154 00:09:05,030 --> 00:09:07,310 Så, historielektion över, eller hur? 155 00:09:07,310 --> 00:09:11,280 >> Så hur kommer vi dit härifrån? 156 00:09:11,280 --> 00:09:14,560 Låt oss titta på några moderna skala-out beräkna exempel. 157 00:09:14,560 --> 00:09:18,290 158 00:09:18,290 --> 00:09:23,230 Jag är lite besatt av storlek och omfattning av sociala medier. 159 00:09:23,230 --> 00:09:30,850 Det finns ett antal av extremt framgångsrika storskalig computing 160 00:09:30,850 --> 00:09:34,820 organisationer nu på planeten, ge stöd och service 161 00:09:34,820 --> 00:09:36,810 för oss alla. 162 00:09:36,810 --> 00:09:39,340 Så det är ansvarsfriskrivning. 163 00:09:39,340 --> 00:09:42,990 >> Och jag vill börja med en antal uns i en Instagram. 164 00:09:42,990 --> 00:09:48,336 Det är egentligen inte en bly-in till ett skämt, det är 165 00:09:48,336 --> 00:09:50,460 inte ens det roliga, faktiskt, kom att tänka på det. 166 00:09:50,460 --> 00:09:52,751 Men hur som helst, ska vi titta på uns i Instagram. 167 00:09:52,751 --> 00:09:55,260 Och vi kommer att starta med "Min bi och en blomma." 168 00:09:55,260 --> 00:09:57,600 Jag var på [OHÖRBAR] Village och jag tog en liten bild 169 00:09:57,600 --> 00:10:00,460 av ett bi som sitter på en blomma. 170 00:10:00,460 --> 00:10:03,270 Och sedan började jag att tänka på vad betyder detta egentligen betyder. 171 00:10:03,270 --> 00:10:07,013 Och jag tog den här bilden av min telefon och räknade hur många byte är i den, 172 00:10:07,013 --> 00:10:09,070 och det är ungefär 256 kilobyte. 173 00:10:09,070 --> 00:10:13,550 Vilket när jag började, skulle i princip fylla en 5 och 1/4 tums diskett. 174 00:10:13,550 --> 00:10:15,340 Och började tänka, ja, det är coolt. 175 00:10:15,340 --> 00:10:18,630 >> Och jag började se och göra del efterforskningar på nätet. 176 00:10:18,630 --> 00:10:22,490 Och jag fick reda på att Instagram har 200 miljoner MAU. 177 00:10:22,490 --> 00:10:25,105 Jag var faktiskt inte det säker på vad en MAU var. 178 00:10:25,105 --> 00:10:28,960 Och en MAU, här nere, är en månatlig aktiv användare. 179 00:10:28,960 --> 00:10:34,270 >> Så, 200 miljoner MAUs-- ganska cool. 180 00:10:34,270 --> 00:10:38,190 20000000000 photographs-- så en hel del fotografier. 181 00:10:38,190 --> 00:10:42,300 60 miljoner nya foton varje dag 182 00:10:42,300 --> 00:10:46,990 kommer ut på ca 0,002 gig per foto. 183 00:10:46,990 --> 00:10:51,290 Det är ungefär fem petabyte disk precis rätt där. 184 00:10:51,290 --> 00:10:55,480 Och det är verkligen inte den centrala delen av vad vi ska prata om. 185 00:10:55,480 --> 00:10:57,830 Det är små potatis. 186 00:10:57,830 --> 00:11:00,710 Eller som vi säger i England, små spuds. 187 00:11:00,710 --> 00:11:05,050 >> Så låt oss titta på den verkliga elefanten i room-- unika ansikten. 188 00:11:05,050 --> 00:11:09,170 Återigen, låt oss mäta in denna nya kvanta kallar en MAU. 189 00:11:09,170 --> 00:11:13,260 Facebook har själv 1,3 miljarder MAU. 190 00:11:13,260 --> 00:11:17,510 WhatsApp, som jag hade inte ens hört talas om tills nyligen, är det 191 00:11:17,510 --> 00:11:23,260 något slags meddelandetjänst, är 500 miljoner MAU. 192 00:11:23,260 --> 00:11:26,620 Instagram, som vi just talade om, 200 miljoner MAU. 193 00:11:26,620 --> 00:11:29,370 Och Messenger, som är annan meddelandetjänst, 194 00:11:29,370 --> 00:11:31,120 är också 200000000 MAU. 195 00:11:31,120 --> 00:11:35,920 >> Så totalt upp det, det handlar om 2,2 miljarder totala användare. 196 00:11:35,920 --> 00:11:39,880 Klart det finns en viss överlappning, men det är motsvarar en tredjedel av planeten. 197 00:11:39,880 --> 00:11:44,270 Och de skickar något i region cirka 12 miljarder meddelanden per dag. 198 00:11:44,270 --> 00:11:46,680 Och återigen, det finns bara 7 miljard människor på planeten. 199 00:11:46,680 --> 00:11:48,550 Inte alla har en smartphone. 200 00:11:48,550 --> 00:11:53,960 Så det här är vansinniga siffror. 201 00:11:53,960 --> 00:12:02,050 >> Och jag kommer att argumentera för att det inte är även om lagring eller compute. 202 00:12:02,050 --> 00:12:05,610 Och för att citera låten, det handlar om att grafen. 203 00:12:05,610 --> 00:12:09,045 Här är vår härliga Meghan Trainor ner Här sjunger om hela basen. 204 00:12:09,045 --> 00:12:12,570 Observera, hon har också en ganska lite bas herself-- 207, 205 00:12:12,570 --> 00:12:16,460 väl 218 miljoner människor har sett denna unga dam sjunger sin sång. 206 00:12:16,460 --> 00:12:19,910 >> Så mitt argument är det det handlar om grafen. 207 00:12:19,910 --> 00:12:23,480 Så vi tog några program med öppen källkod och började titta på en graf. 208 00:12:23,480 --> 00:12:27,740 Och det här är Linkedin, så detta är ett Facebook för gamla människor. 209 00:12:27,740 --> 00:12:29,910 Och så, det här är min Linkedin grafen. 210 00:12:29,910 --> 00:12:34,080 Jag har 1.200 eller så noder, så kallade "Vänner". 211 00:12:34,080 --> 00:12:36,360 Och här är jag i toppen. 212 00:12:36,360 --> 00:12:38,140 Och här är alla sammankopplingar. 213 00:12:38,140 --> 00:12:40,570 >> Nu, tänker tillbaka till Instagram historien. 214 00:12:40,570 --> 00:12:42,815 Var och en av dessa är inte bara bilden, det 215 00:12:42,815 --> 00:12:46,860 har en hel uppsjö av anslutningar mellan denna individ 216 00:12:46,860 --> 00:12:48,220 och många andra. 217 00:12:48,220 --> 00:12:52,190 Detta är centralt bit är antingen en bugg i grafritning algoritmen, 218 00:12:52,190 --> 00:12:55,982 eller det kanske David Malan, jag är inte säker än. 219 00:12:55,982 --> 00:12:57,690 Så du kan rita om grafer i alla möjliga 220 00:12:57,690 --> 00:13:02,510 av ways-- gephi.gihub.io är där du kan dra den programvaran från. 221 00:13:02,510 --> 00:13:05,410 Det är riktigt coolt för att vara kunna organisera samhällen. 222 00:13:05,410 --> 00:13:08,640 Du kan se här, det här är Harvard och olika andra platser som jag har arbetat, 223 00:13:08,640 --> 00:13:12,160 eftersom detta är min arbetsrelaterade uppgifter. 224 00:13:12,160 --> 00:13:15,080 >> Så tänk om komplexiteten av grafen och alla data 225 00:13:15,080 --> 00:13:17,070 att du drar tillsammans med. 226 00:13:17,070 --> 00:13:20,870 Så under tiden, tillbaka på FriendFace, eller hur? 227 00:13:20,870 --> 00:13:24,360 Vi tittade på Instagram data som var i storleksordningen fem petabyte. 228 00:13:24,360 --> 00:13:25,300 No big deal. 229 00:13:25,300 --> 00:13:28,830 Fortfarande en hel del uppgifter, men ingen stor handlar i större tingens ordning. 230 00:13:28,830 --> 00:13:33,850 >> Från denna artikel på den gamla internet, "Skalning Facebook datalager 231 00:13:33,850 --> 00:13:36,250 till 300 petabyte. " 232 00:13:36,250 --> 00:13:38,110 Det är en helt annan game changer nu, 233 00:13:38,110 --> 00:13:40,234 när du börjar tänker på data och grafen 234 00:13:40,234 --> 00:13:41,690 och vad du ta tillsammans med. 235 00:13:41,690 --> 00:13:47,480 Och deras hög data växer av ordningen 600 terrabytes en dag. 236 00:13:47,480 --> 00:13:52,980 >> Nu vet ni, ja, then-- Jag menar, 600 terrabytes om dagen, 237 00:13:52,980 --> 00:13:55,670 300 petabytes-- de är också nu börjar 238 00:13:55,670 --> 00:13:58,550 att få mycket bekymrad hur man håller det här 239 00:13:58,550 --> 00:14:01,160 och att se till dessa data förblir runt. 240 00:14:01,160 --> 00:14:04,630 Och den här herrn här, Jay Parikh, ser 241 00:14:04,630 --> 00:14:08,250 på hur man lagrar en exabyte data. 242 00:14:08,250 --> 00:14:10,180 >> Bara för dig som tittar tillsammans 243 00:14:10,180 --> 00:14:13,940 hemma, en exabyte-- 10 till 18. 244 00:14:13,940 --> 00:14:18,210 Det har fått en egen Wikipedia sida, det är det stora en rad. 245 00:14:18,210 --> 00:14:23,120 Det är storleken och omfattningen av vad vi är titta på, för att kunna lagra data. 246 00:14:23,120 --> 00:14:27,090 Och dessa killar inte mucking runt, de är lagra detta mängd data. 247 00:14:27,090 --> 00:14:29,550 Så en av de ledtrådar som de tittar på här 248 00:14:29,550 --> 00:14:32,185 är datacenter för sk kylförvaring. 249 00:14:32,185 --> 00:14:35,020 250 00:14:35,020 --> 00:14:36,470 >> Vilket leder mig till att vara grön. 251 00:14:36,470 --> 00:14:38,340 Och här är Kermit. 252 00:14:38,340 --> 00:14:43,050 Han och jag agree-- det är extremt svårt att vara grön, 253 00:14:43,050 --> 00:14:44,920 men vi ger det vårt bästa försök. 254 00:14:44,920 --> 00:14:47,430 Kermit kan inte hjälpa det, han har att vara grön hela tiden, 255 00:14:47,430 --> 00:14:49,945 kan inte ta hans gröna-ness av alls. 256 00:14:49,945 --> 00:14:55,410 >> Så, är concepts-- en några slags centrala begrepp 257 00:14:55,410 --> 00:14:59,510 av grönhet, när det avser datoranvändning. 258 00:14:59,510 --> 00:15:05,510 Den en som är den viktigaste är livslängden av produkten. 259 00:15:05,510 --> 00:15:09,405 Om din produkt har en kort livslängd, du kan inte per definition vara grön. 260 00:15:09,405 --> 00:15:13,280 Den energi som krävs för att tillverka en diskenhet, ett moderkort, en dator 261 00:15:13,280 --> 00:15:17,890 systemet, en tablett, vad det nu kan vara, livslängden för dina system 262 00:15:17,890 --> 00:15:21,700 är en viktig del av hur grön man kan bli. 263 00:15:21,700 --> 00:15:27,960 >> Den viktigaste delen, som ni alla bygger mjukvara algorithms-- 264 00:15:27,960 --> 00:15:30,455 algoritmens en partiell ord för mjukvara, eller hur? 265 00:15:30,455 --> 00:15:34,000 Så din algoritmdesign absolut avgörande i termer 266 00:15:34,000 --> 00:15:43,080 hur du ska kunna göra snabba och korrekta beräkningar för att använda 267 00:15:43,080 --> 00:15:44,710 den minsta mängden energi möjligt. 268 00:15:44,710 --> 00:15:47,280 Och jag ska få till det här i en liten bit. 269 00:15:47,280 --> 00:15:51,270 >> Datacenter design-- du har sett att vi redan har tusentals 270 00:15:51,270 --> 00:15:54,870 åter tusentals maskiner, sittande tyst i små, mörka hörn 271 00:15:54,870 --> 00:15:57,760 av världen, datoranvändning. 272 00:15:57,760 --> 00:16:01,670 Resurs allocation-- hur man får till beräkna, förvaring, 273 00:16:01,670 --> 00:16:03,840 genom nätet. 274 00:16:03,840 --> 00:16:08,530 Operativsystem är en viktig del av detta, och en massa av virtualiserings 275 00:16:08,530 --> 00:16:12,080 att kunna packa mer och mer compute i ett litet utrymme. 276 00:16:12,080 --> 00:16:15,530 >> Jag ska ge er ett litet exempel från forskning computing. 277 00:16:15,530 --> 00:16:18,220 Vi behövde mer ping, mer makt, och mer rör. 278 00:16:18,220 --> 00:16:21,030 Vi behövde mer större, bättre, snabbare datorer, 279 00:16:21,030 --> 00:16:23,390 och behövs för att använda mindre juice. 280 00:16:23,390 --> 00:16:26,856 Och vi kunde inte räkna ut hur man gör detta. 281 00:16:26,856 --> 00:16:29,980 Jag vet inte om hashtaggen gowest som troligen använts av Kardashian, 282 00:16:29,980 --> 00:16:32,560 men ändå, gowest. 283 00:16:32,560 --> 00:16:33,220 Och det gjorde vi. 284 00:16:33,220 --> 00:16:36,610 >> Vi plockade upp vår verksamhet och vi flyttade ut 285 00:16:36,610 --> 00:16:39,660 till västra Massachusetts i en liten kvarn stad 286 00:16:39,660 --> 00:16:45,000 kallas Holyoke, strax norr av Chikopee och Springfield. 287 00:16:45,000 --> 00:16:49,280 Vi gjorde detta för ett par anledningar. 288 00:16:49,280 --> 00:16:55,150 Den viktigaste var att vi hade en mycket, mycket stor damm. 289 00:16:55,150 --> 00:17:00,080 Och detta mycket stora dammen kan släcka 30 plus megawatt energi, 290 00:17:00,080 --> 00:17:02,980 och det var underutnyttjad på tiden. 291 00:17:02,980 --> 00:17:06,170 >> Ännu viktigare, vi hade också ett mycket komplicerat nät 292 00:17:06,170 --> 00:17:07,254 det var redan på plats. 293 00:17:07,254 --> 00:17:09,711 Om man tittar på där nätverket går i USA, 294 00:17:09,711 --> 00:17:11,230 följer alla järnvägsspåren. 295 00:17:11,230 --> 00:17:14,290 Denna speciella bit av nätet var ägs av våra kollegor och vänner 296 00:17:14,290 --> 00:17:16,480 vid Massachusetts Institute of Technology, 297 00:17:16,480 --> 00:17:19,720 och det var i princip byggt hela vägen ut till Route 90. 298 00:17:19,720 --> 00:17:24,760 >> Så vi hade en stor flod fästing, Route 90 tick, hade vi en kort bana på 100 miles, 299 00:17:24,760 --> 00:17:26,960 och en lång bana av cirka 1.000 miles. 300 00:17:26,960 --> 00:17:29,890 Vi behövde göra en mycket stor nätverks skarv, som ni kan se här, 301 00:17:29,890 --> 00:17:32,990 att i princip sätta en länk i, till kunna ansluta till Holyoke, 302 00:17:32,990 --> 00:17:36,390 men vi hade alla erforderliga infrastructure-- ping, makt, röret. 303 00:17:36,390 --> 00:17:37,280 Livet var bra. 304 00:17:37,280 --> 00:17:38,980 Och återigen, stora dammen. 305 00:17:38,980 --> 00:17:42,120 >> Så vi byggde i grunden Massachusetts Grön High Performance Computing 306 00:17:42,120 --> 00:17:42,850 Center. 307 00:17:42,850 --> 00:17:46,580 Detta var ett arbete av kärlek genom fem universities-- MIT, Harvard, UMass, 308 00:17:46,580 --> 00:17:47,870 Nordöstra och BU. 309 00:17:47,870 --> 00:17:49,554 Fem megawatt dag ett anslutna lasten. 310 00:17:49,554 --> 00:17:51,845 Vi gjorde alla sorters duktighet med flygsidan economizers 311 00:17:51,845 --> 00:17:53,585 att hålla saker gröna. 312 00:17:53,585 --> 00:18:03,330 Och vi byggt ut 640-tal rack, dedikerad för forskning datoranvändning. 313 00:18:03,330 --> 00:18:08,770 >> Det var en gammal brownfield webbplats, så vi hade någon regenerering och en del snyggt upp 314 00:18:08,770 --> 00:18:10,500 och några sanering av platsen. 315 00:18:10,500 --> 00:18:13,590 Och sedan började vi att bygga anläggningen 316 00:18:13,590 --> 00:18:19,710 och, boom-- härlig anläggning med Förmågan att köra sandlåda computing, 317 00:18:19,710 --> 00:18:24,430 att ha konferenser och seminarier, och även en massiv datacenter golv. 318 00:18:24,430 --> 00:18:26,007 >> Här är min bra själv. 319 00:18:26,007 --> 00:18:27,590 Jag uppenbarligen bär samma jacka. 320 00:18:27,590 --> 00:18:29,423 Jag kanske bara har en jacka, men det är jag 321 00:18:29,423 --> 00:18:34,030 och John Goodhue-- han är verkställande direktör för de Center-- 322 00:18:34,030 --> 00:18:36,740 stående i maskinrummet våningen, som, som ni kan se, 323 00:18:36,740 --> 00:18:40,560 är ganska dramatiskt, och det har en lång, lång väg. 324 00:18:40,560 --> 00:18:44,830 >> Jag spelar ofta spel körning från Boston ut till Holyoke, 325 00:18:44,830 --> 00:18:47,260 låtsas att jag är en TCP / IP-paket. 326 00:18:47,260 --> 00:18:54,290 Och jag oroa min latency kör omkring i min bil. 327 00:18:54,290 --> 00:18:56,690 Så det är den gröna lappar. 328 00:18:56,690 --> 00:19:00,070 Så låt oss bara ta en minut och tänka på stackar. 329 00:19:00,070 --> 00:19:04,060 Så vi försöker väldigt noga på bygga datacenter effektivt, 330 00:19:04,060 --> 00:19:08,770 computing effektivt gör bra val för datautrustning 331 00:19:08,770 --> 00:19:12,060 och leverera, mer viktigare, vår ansökan, 332 00:19:12,060 --> 00:19:17,860 antingen det är en meddelandetjänst eller en vetenskaplig tillämpning. 333 00:19:17,860 --> 00:19:19,110 >> Så här är de stackarna. 334 00:19:19,110 --> 00:19:22,762 Så fysiska lagret, hela vägen upp genom application-- 335 00:19:22,762 --> 00:19:25,220 hoppas att detta kommer att vara en god del av din kurs. 336 00:19:25,220 --> 00:19:31,450 Sju skikt OSI-modellen är i grunden, du kommer att leva, äta och andas 337 00:19:31,450 --> 00:19:35,270 detta under hela din dator karriärer. 338 00:19:35,270 --> 00:19:37,800 Hela detta koncept av fysisk infrastructure-- ledningar, 339 00:19:37,800 --> 00:19:40,080 kablar, datacenter, länkar. 340 00:19:40,080 --> 00:19:42,190 Och detta är bara beskriver nätverket. 341 00:19:42,190 --> 00:19:44,780 >> Här uppe är, ja, självklart, Detta är en gammal bild, 342 00:19:44,780 --> 00:19:49,342 eftersom detta bör säga HTTP, eftersom ingen bryr sig om enkla mail 343 00:19:49,342 --> 00:19:50,550 transportprotokoll, längre. 344 00:19:50,550 --> 00:19:53,960 Nu händer i HTTP utrymmet. 345 00:19:53,960 --> 00:19:55,850 Så det är en nivå av stapeln. 346 00:19:55,850 --> 00:19:59,460 >> Här är en annan uppsättning av staplar, där du har en server, en värd, en hypervisor, 347 00:19:59,460 --> 00:20:02,470 en gäst, binärt bibliotek, och sedan din ansökan. 348 00:20:02,470 --> 00:20:06,070 Eller, i detta fall, anordningen Föraren, en Linux-kärna, infödda c, 349 00:20:06,070 --> 00:20:08,080 Java virtuell maskin, Java API, då Java 350 00:20:08,080 --> 00:20:11,220 applikationer och så vidare och så vidare. 351 00:20:11,220 --> 00:20:14,090 Detta är en beskrivning av en virtuell maskin. 352 00:20:14,090 --> 00:20:15,450 >> Heliga stackar, Batman! 353 00:20:15,450 --> 00:20:18,260 Tänk på detta i termer av hur mycket compute 354 00:20:18,260 --> 00:20:20,850 du behöver för att få från vad som händer här, 355 00:20:20,850 --> 00:20:23,110 hela vägen upp till toppen i denna stack, till dess 356 00:20:23,110 --> 00:20:26,840 kunna göra din faktiska leverans av ansökan. 357 00:20:26,840 --> 00:20:29,130 >> Och om du typ av spola tillbaka och börja tänka 358 00:20:29,130 --> 00:20:33,450 om vad som krävs för att ge en flyttalsoperation, 359 00:20:33,450 --> 00:20:37,650 din flyttalsoperation är en summa av uttagen, antalet kärnor 360 00:20:37,650 --> 00:20:44,490 i sockeln, en klocka, som är Hur snabbt kan klockan turnover-- 361 00:20:44,490 --> 00:20:47,490 fyra gigahertz, två gigahertz-- och sedan numret 362 00:20:47,490 --> 00:20:50,890 av verksamheten kan du göra i ett givet hertz. 363 00:20:50,890 --> 00:20:54,350 >> Så dessa mikroprocessorer idag gör mellan fyra och sex Flops 364 00:20:54,350 --> 00:20:55,400 per klockcykel. 365 00:20:55,400 --> 00:20:59,810 Och så en single-core 2,5 gig klocka har en teoretisk prestanda 366 00:20:59,810 --> 00:21:03,490 på cirka en mega flopp, ge eller ta. 367 00:21:03,490 --> 00:21:05,940 >> Men, som med allt, vi har val. 368 00:21:05,940 --> 00:21:12,280 Så och Intel Core 2, Nehalem Sandy Bridge, Haswell, AMD, 369 00:21:12,280 --> 00:21:13,920 ta din choices-- Intel Atom. 370 00:21:13,920 --> 00:21:17,670 Alla dessa processorarkitekturer alla har ett något annorlunda sätt 371 00:21:17,670 --> 00:21:19,650 av att kunna lägga två nummer tillsammans, 372 00:21:19,650 --> 00:21:23,520 som är i grunden deras syfte i livet. 373 00:21:23,520 --> 00:21:24,535 Måste vara tufft. 374 00:21:24,535 --> 00:21:27,100 Det finns miljoner av dem sitta i datacenter, nu dock. 375 00:21:27,100 --> 00:21:30,410 >> Sor, flops per watt-- Detta är den stora grejen. 376 00:21:30,410 --> 00:21:37,780 Så om jag vill få ut mer ur att få igenom det här stacken, snabbare, 377 00:21:37,780 --> 00:21:41,800 Jag måste jobba på hur många flyttalsoperationer en andra, 378 00:21:41,800 --> 00:21:43,770 Jag kan göra, och sedan ge dem watt. 379 00:21:43,770 --> 00:21:46,160 Och lyckligtvis folks har tänkt på detta. 380 00:21:46,160 --> 00:21:49,140 >> Så det finns en stor bestrida varje år för att se 381 00:21:49,140 --> 00:21:52,310 som kan bygga den snabbaste datorn som kan diagonaliserar en matris. 382 00:21:52,310 --> 00:21:53,980 Det kallas Top 500. 383 00:21:53,980 --> 00:21:56,420 De plockar toppen från bästa 500 datorer 384 00:21:56,420 --> 00:21:58,610 på planeten som kan diagonaliserar matriser. 385 00:21:58,610 --> 00:22:00,760 Och du får några fantastiska resultat. 386 00:22:00,760 --> 00:22:04,660 >> En hel del av dessa maskiner är mellan 10 och 20 megawatt. 387 00:22:04,660 --> 00:22:09,380 De kan diagonaliserar matriser omåttligt snabbt. 388 00:22:09,380 --> 00:22:13,550 De behöver inte nödvändigtvis diagonaliseras dem så effektivt per watt, 389 00:22:13,550 --> 00:22:18,060 så det var denna storsatsning för att titta på vad en grön 500-listan skulle se ut. 390 00:22:18,060 --> 00:22:20,360 Och här är listan från och med juni. 391 00:22:20,360 --> 00:22:22,410 Det bör finnas en ny inom kort. 392 00:22:22,410 --> 00:22:26,590 >> Och det kräver out-- Jag tar toppen av denna lista. 393 00:22:26,590 --> 00:22:32,187 Det finns två specifika machines-- en från Tokyo Institute of Technology 394 00:22:32,187 --> 00:22:34,520 och en från Cambridge University i Storbritannien. 395 00:22:34,520 --> 00:22:37,700 Och dessa har ganska häpnadsväckande mega flops per watt nyckeltal. 396 00:22:37,700 --> 00:22:42,620 Den här är 4389, och nästa ner är 3631. 397 00:22:42,620 --> 00:22:47,660 >> Jag ska förklara skillnaden mellan dessa två, i nästa bild. 398 00:22:47,660 --> 00:22:51,320 Men dessa är dessa är måttligt storlek prov kluster. 399 00:22:51,320 --> 00:22:54,732 Dessa är bara 34 kilowatt eller 52 kilowatt. 400 00:22:54,732 --> 00:22:56,940 Det finns några större här-- detta en 401 00:22:56,940 --> 00:22:58,860 vid den schweiziska national Superdator Centre. 402 00:22:58,860 --> 00:23:00,693 Den ta hem budskapet till detta är att vi är 403 00:23:00,693 --> 00:23:04,270 försöker hitta datorer som kan fungera effektivt. 404 00:23:04,270 --> 00:23:09,860 >> Och så, låt oss titta på denna top en, cutely heter, KFC. 405 00:23:09,860 --> 00:23:12,960 Och lite reklam här. 406 00:23:12,960 --> 00:23:15,730 Denna speciella livsmedelsföretag har ingenting att göra med detta. 407 00:23:15,730 --> 00:23:18,240 Det är det faktum att detta särskilda system 408 00:23:18,240 --> 00:23:23,830 blötlägges i en mycket smart oljebaserade förening. 409 00:23:23,830 --> 00:23:27,590 Och så de fick sina kyckling fritös moniker 410 00:23:27,590 --> 00:23:30,040 när de först började bygga dessa typer av system. 411 00:23:30,040 --> 00:23:32,740 >> Men i princip vad de har tagit här är ett antal blad, 412 00:23:32,740 --> 00:23:37,560 sätta dem i detta sofistikerad mineralolja, 413 00:23:37,560 --> 00:23:40,979 och sedan räknat ut hur man får alla nätverk i och ur den. 414 00:23:40,979 --> 00:23:42,895 Sedan, inte bara det, de har lagt det utanför så 415 00:23:42,895 --> 00:23:46,095 att den kan utnyttja utanför luftkylning. 416 00:23:46,095 --> 00:23:47,520 Det var ganska imponerande. 417 00:23:47,520 --> 00:23:49,630 Så du måste göra allt av denna shenanigans 418 00:23:49,630 --> 00:23:53,280 för att kunna få denna mängd compute levereras för liten effekt. 419 00:23:53,280 --> 00:23:57,360 >> Och du kan se detta är formen av var saker är på väg. 420 00:23:57,360 --> 00:24:01,240 Utmaningen är att regelbunden luft kylning är stordriftsfördelar 421 00:24:01,240 --> 00:24:08,459 och driver en hel del av utveckling av både vanliga datorer, 422 00:24:08,459 --> 00:24:09,750 och högprestandaberäkningar. 423 00:24:09,750 --> 00:24:11,080 Så detta är ganska störande. 424 00:24:11,080 --> 00:24:13,280 Jag tror att det är fascinerande. 425 00:24:13,280 --> 00:24:15,530 Det är lite rörigt när du Försök att byta hårddiskar, 426 00:24:15,530 --> 00:24:18,090 men det är en riktigt cool idé. 427 00:24:18,090 --> 00:24:22,200 >> Så inte bara det, det finns en hel massa arbete 428 00:24:22,200 --> 00:24:25,450 byggs kring vad vi är kallar Open Compute Project. 429 00:24:25,450 --> 00:24:29,400 Och så, mer om det lite senare. 430 00:24:29,400 --> 00:24:32,740 Men branschens börjar inse att de floppar per watt 431 00:24:32,740 --> 00:24:33,670 blir viktigt. 432 00:24:33,670 --> 00:24:39,256 Och du, som folk här, som du designa dina algoritmer 433 00:24:39,256 --> 00:24:41,130 och du designa din kod, bör du vara medveten om 434 00:24:41,130 --> 00:24:43,620 att din kod kan har en dominoeffekt. 435 00:24:43,620 --> 00:24:48,380 >> När Mark satt här i sin studentrum skriver Facebook 1.0, 436 00:24:48,380 --> 00:24:51,050 Jag är ganska säker på att han hade en vy att det skulle bli enorma. 437 00:24:51,050 --> 00:24:54,945 Men hur stort det skulle vara på miljön är en stor dealio. 438 00:24:54,945 --> 00:24:58,340 Och så alla ya kunde komma med algoritmer 439 00:24:58,340 --> 00:25:01,370 som skulle bli nästa utmaning sak för folk som mig, 440 00:25:01,370 --> 00:25:02,700 försöker köra systemen. 441 00:25:02,700 --> 00:25:07,360 >> Så låt oss bara tänka på verkliga effektgränser. 442 00:25:07,360 --> 00:25:09,930 Detta dokument med Landauer-- är inte en ny sak. 443 00:25:09,930 --> 00:25:12,480 1961 detta publicerades i IBM Journal. 444 00:25:12,480 --> 00:25:15,590 Detta är den kanoniska "Irreversibility och värme 445 00:25:15,590 --> 00:25:17,630 Generation i Computing processen. " 446 00:25:17,630 --> 00:25:22,050 Och så han hävdade att maskiner oundvikligen 447 00:25:22,050 --> 00:25:25,070 utföra logistikfunktioner som har inte endast ett värde invers. 448 00:25:25,070 --> 00:25:29,130 >> Så att hela delen av detta är att baksidan på 60-talet, 449 00:25:29,130 --> 00:25:31,890 folks visste att detta var kommer att bli ett problem. 450 00:25:31,890 --> 00:25:37,080 Och så lagen om gränserna sa 25 grader C, ett slags kanonisk rummet 451 00:25:37,080 --> 00:25:41,120 temperatur, gränsen representerar 0.1 elektronvolt. 452 00:25:41,120 --> 00:25:44,920 Men teoretiskt är detta teorin, datorminne, 453 00:25:44,920 --> 00:25:51,410 arbetar vid denna gräns kan vara ändras vid en miljard bitar per sekund. 454 00:25:51,410 --> 00:25:54,620 >> Jag vet inte om dig, men inte stött på många en miljard bitar 455 00:25:54,620 --> 00:25:57,190 en andra datahastighet utbyten. 456 00:25:57,190 --> 00:26:01,360 Argumentet var att endast 2.8 biljoner en watt 457 00:26:01,360 --> 00:26:03,180 borde någonsin utökas. 458 00:26:03,180 --> 00:26:08,160 >> Okej, verkliga världen example-- detta är min elräkning. 459 00:26:08,160 --> 00:26:10,347 Jag är 65% procent av det vackra datacenter 460 00:26:10,347 --> 00:26:11,930 Jag visade dig, i just denna tid. 461 00:26:11,930 --> 00:26:15,520 Detta är tillbaka i juni förra året. 462 00:26:15,520 --> 00:26:21,300 Jag har tagit en äldre version så att vi kan och typ av anonymisera lite. 463 00:26:21,300 --> 00:26:25,470 Jag spende $ 45,000 en månad för energi där. 464 00:26:25,470 --> 00:26:34,990 >> Så anledningen vara där är att vi har över 50.000 processer i rummet. 465 00:26:34,990 --> 00:26:38,110 Så kan du föreställa dig din egen bostäder elräkning 466 00:26:38,110 --> 00:26:39,540 är att hög? 467 00:26:39,540 --> 00:26:46,180 Men det var för en 199 miljoner watt timmar över en månad. 468 00:26:46,180 --> 00:26:51,670 >> Så frågan jag ställer är, kan du föreställa Mr Zuckerberg elräkning? 469 00:26:51,670 --> 00:26:54,730 Min är ganska stor, och jag kämpar. 470 00:26:54,730 --> 00:26:56,600 Och jag är inte ensam i det här är. 471 00:26:56,600 --> 00:26:59,450 Det finns en massa människor med stora datacenter. 472 00:26:59,450 --> 00:27:04,800 Och så, antar jag, fullt disclosure-- mina Facebook-vänner lite udda. 473 00:27:04,800 --> 00:27:07,900 >> Så min Facebook-vän är den Prine datacenter, 474 00:27:07,900 --> 00:27:14,030 som är en av Facebooks största, nyaste, lägsta energi datacenter. 475 00:27:14,030 --> 00:27:19,360 Och de posta till mig, saker som effektutnyttjandeeffektiviteten, 476 00:27:19,360 --> 00:27:24,020 som i hur effektiv är uppgifter centrum kontra hur mycket energi du är 477 00:27:24,020 --> 00:27:26,370 sätta in i den, hur mycket vatten de använder, vad är 478 00:27:26,370 --> 00:27:27,810 fuktigheten och temperaturen. 479 00:27:27,810 --> 00:27:29,980 >> Och de har dessa underbara, härliga tomter. 480 00:27:29,980 --> 00:27:32,600 Jag tror att detta är en häftigt Facebook-sida, 481 00:27:32,600 --> 00:27:35,400 men jag antar att jag är lite konstig. 482 00:27:35,400 --> 00:27:39,930 >> Så en mer kraft sak, forskning computing som jag gör 483 00:27:39,930 --> 00:27:44,060 är signifikant olika för vad Facebook och Yahoo och Google 484 00:27:44,060 --> 00:27:50,020 och andra on-demand, fullt, alltid tillgängliga tjänster. 485 00:27:50,020 --> 00:27:53,530 Och så jag har fördelen att när ISO New England-- och ISO New England 486 00:27:53,530 --> 00:27:58,910 hjälper ställa energin priser för den regionen. 487 00:27:58,910 --> 00:28:01,110 >> Och det säger att det är att utvidga en begäran till konsumenter 488 00:28:01,110 --> 00:28:05,870 att frivilligt bevara hög energi, på grund av den höga värme och fuktighet. 489 00:28:05,870 --> 00:28:08,680 Och detta var tillbaka på den 18: e juli. 490 00:28:08,680 --> 00:28:12,600 Och så jag glatt Tweet tillbaka, Hey, ISO New England, grön Harvard. 491 00:28:12,600 --> 00:28:14,880 Vi gör vår del över här i forsknings datoranvändning. 492 00:28:14,880 --> 00:28:16,760 Och det beror på att vi gör vetenskapen. 493 00:28:16,760 --> 00:28:20,380 >> Och så mycket som folk säger vetenskapen aldrig sover, kan vetenskapen vänta. 494 00:28:20,380 --> 00:28:25,030 Så vi kan QUIESCE vår system, dra nytta av betygspriser 495 00:28:25,030 --> 00:28:30,550 på vår elräkning, och hjälp i hela New England 496 00:28:30,550 --> 00:28:35,910 region genom att kasta många megawatt belastning. 497 00:28:35,910 --> 00:28:40,020 Så det är det unika med att skiljer om vetenskapliga beräkningar uppgifter 498 00:28:40,020 --> 00:28:48,890 centra och de som är i full produktion 24/7. 499 00:28:48,890 --> 00:28:51,670 >> Så låt oss bara ta en annan växel här. 500 00:28:51,670 --> 00:28:55,170 Så, jag vill diskutera kaos lite. 501 00:28:55,170 --> 00:28:59,900 Och jag vill lägga den i beskydd av lagring. 502 00:28:59,900 --> 00:29:03,150 Så för dem som typ av kämpade 503 00:29:03,150 --> 00:29:08,680 få huvudet runt vad petabyte lagrings ser ut, detta ett exempel. 504 00:29:08,680 --> 00:29:11,660 Och det är denna typ av saker Jag behandlar hela tiden. 505 00:29:11,660 --> 00:29:15,550 >> Var och en av dessa små grabbar är en fyra terabyte hårddisk, 506 00:29:15,550 --> 00:29:17,420 så kan du typ av räkna upp dem. 507 00:29:17,420 --> 00:29:21,370 Vi bevakar nu komma mellan en till en och halv petabyte 508 00:29:21,370 --> 00:29:22,970 i en branschstandard rack. 509 00:29:22,970 --> 00:29:26,430 Och vi har rum och rum, som du såg i det tidigare bild med John 510 00:29:26,430 --> 00:29:31,230 och jag, full av dessa rack av utrustning. 511 00:29:31,230 --> 00:29:40,400 Så det blir mycket, mycket lätt att bygga massiva lagringsmatriser 512 00:29:40,400 --> 00:29:44,140 >> Det är mestadels lätt inne i Unix till sorts räkna upp hur det går. 513 00:29:44,140 --> 00:29:48,270 Så detta räknar hur många MAU punkter har jag kom dit. 514 00:29:48,270 --> 00:29:50,880 Så det är 423 skärningspunkter. 515 00:29:50,880 --> 00:29:55,660 Och sedan om jag kör lite skissartad awk, jag kan lägga upp, i detta särskilda system, 516 00:29:55,660 --> 00:29:59,080 det fanns 7,3 petabyte ledigt lagringsutrymme. 517 00:29:59,080 --> 00:30:01,350 >> Så det är en massa saker. 518 00:30:01,350 --> 00:30:03,030 Och lagring är verkligen svårt. 519 00:30:03,030 --> 00:30:06,850 Och ändå, av någon anledning, Detta är en bransch trend. 520 00:30:06,850 --> 00:30:11,500 När jag pratar med våra forskare och vår fakultet och säger, 521 00:30:11,500 --> 00:30:14,180 hej, jag kan köra lagring för dig. 522 00:30:14,180 --> 00:30:17,690 Tyvärr, måste jag täcka kostnaderna för lagring. 523 00:30:17,690 --> 00:30:19,430 Jag får den här branschen. 524 00:30:19,430 --> 00:30:23,300 Och människor referens Newegg eller de refererar Staples 525 00:30:23,300 --> 00:30:27,040 eller hur mycket de kan köpa en enda terabyte diskenhet för. 526 00:30:27,040 --> 00:30:29,390 >> Så här kommer du notera här, att det finns en ledtråd. 527 00:30:29,390 --> 00:30:31,310 Det finns en hårddisk här. 528 00:30:31,310 --> 00:30:33,290 Och om vi går tillbaka, jag har många. 529 00:30:33,290 --> 00:30:36,130 Inte nog med att jag har många, har jag sofistikerade sammankopplingar 530 00:30:36,130 --> 00:30:38,750 för att kunna sy dessa saker tillsammans. 531 00:30:38,750 --> 00:30:44,080 Så riskerna med dessa stora lagringsmatriser inte obetydlig. 532 00:30:44,080 --> 00:30:46,370 >> I själva verket tog vi till internet och vi skrev 533 00:30:46,370 --> 00:30:51,670 en liten historia om en välmenande, blida chef för forskning 534 00:30:51,670 --> 00:30:54,640 computing-- råkar ha en konstigt engelska accent-- försöker 535 00:30:54,640 --> 00:30:59,930 att förklara för en forskare vad ingen streck mappen backup faktiskt 536 00:30:59,930 --> 00:31:01,070 betydde. 537 00:31:01,070 --> 00:31:05,690 Det var ganska lång, liten historia, drygt fyra minuter av upptäckten. 538 00:31:05,690 --> 00:31:09,380 >> Och notera, har jag en förskräcklig mycket mindre plats än damen 539 00:31:09,380 --> 00:31:11,800 som sjunger om alla bas. 540 00:31:11,800 --> 00:31:13,910 Vi är ganska många konton lägre. 541 00:31:13,910 --> 00:31:16,160 Men hur som helst är detta en viktig sak att tänka på, 542 00:31:16,160 --> 00:31:18,532 i termer av vad som kan gå fel. 543 00:31:18,532 --> 00:31:20,990 Så om jag får en hårddisk, och Jag kastar den i en Unix maskin, 544 00:31:20,990 --> 00:31:24,300 och jag börjar skriva saker till det, det finns en magnet, det finns en drivhuvud, 545 00:31:24,300 --> 00:31:30,150 det finns skenbart, en etta eller en nolla skrivs ner på den enheten. 546 00:31:30,150 --> 00:31:32,180 >> Motors-- spinny, twirly saker alltid sönder. 547 00:31:32,180 --> 00:31:33,490 Tänk på saker som bryter. 548 00:31:33,490 --> 00:31:35,170 Det har alltid varit spinny, twirly saker. 549 00:31:35,170 --> 00:31:38,560 Skrivare, hårddiskar, motorfordon osv 550 00:31:38,560 --> 00:31:40,590 Allt som rör sig sannolikt att bryta. 551 00:31:40,590 --> 00:31:42,575 >> Så du behöver motorer, du behöver köra firmware, 552 00:31:42,575 --> 00:31:47,110 du behöver SAS / SATA, trådar, firmware på SAS / SATA-styrenheter, 553 00:31:47,110 --> 00:31:48,530 låga block nivå. 554 00:31:48,530 --> 00:31:54,580 Välj din lagringsstyrenhet fil systemet kod, oavsett vilken det kan vara, 555 00:31:54,580 --> 00:31:56,780 hur du syr saker tillsammans. 556 00:31:56,780 --> 00:32:00,956 Och din virtuellt minne chef sidor, DRAM hämta och butiker. 557 00:32:00,956 --> 00:32:02,705 Då får du en annan stack, vilket är typ 558 00:32:02,705 --> 00:32:05,440 dun listan här en, algoritmer, användare. 559 00:32:05,440 --> 00:32:09,050 >> Och om du multiplicerar detta upp, jag vet inte hur många, 560 00:32:09,050 --> 00:32:11,640 det finns en hel del platser där saker kan gå i sidled. 561 00:32:11,640 --> 00:32:14,430 Jag menar, det är ett exempel om matematik. 562 00:32:14,430 --> 00:32:18,070 Men det är ganska kul att tänka på hur många sätt saker kan gå fel, 563 00:32:18,070 --> 00:32:21,650 bara för en hårddisk. 564 00:32:21,650 --> 00:32:25,440 Vi är redan på 300 petabyte, så föreställa antalet hårddiskar 565 00:32:25,440 --> 00:32:27,741 du behöver på 300 petabyte som kan gå fel. 566 00:32:27,741 --> 00:32:28,240 567 00:32:28,240 --> 00:32:30,390 Inte bara that-- så det är förvaring. 568 00:32:30,390 --> 00:32:34,220 Och det anspelar på person jag skulle vilja se 569 00:32:34,220 --> 00:32:38,780 ange skede kvar, vilket är kaos Monkey. 570 00:32:38,780 --> 00:32:43,140 Så vid en viss punkt, blir det ännu större än bara diskenheten 571 00:32:43,140 --> 00:32:43,920 problem. 572 00:32:43,920 --> 00:32:50,610 >> Och så, dessa fina damer och herrar att köra en strömmande videotjänst 573 00:32:50,610 --> 00:32:55,430 insåg att deras datorer var också enorma och också mycket komplicerad 574 00:32:55,430 --> 00:33:00,010 och även ge service till en förfärlig en massa människor. 575 00:33:00,010 --> 00:33:05,180 De har fått 37 miljoner members-- och denna slide är kanske ett år eller så old-- 576 00:33:05,180 --> 00:33:07,350 tusentals enheter. 577 00:33:07,350 --> 00:33:10,810 Det finns miljarder av timmar video. 578 00:33:10,810 --> 00:33:13,600 De loggar miljarder händelser per dag. 579 00:33:13,600 --> 00:33:17,330 >> Och du kan se, de flesta människor titta telly senare på kvällen, 580 00:33:17,330 --> 00:33:19,429 och det långt uppväger allt. 581 00:33:19,429 --> 00:33:21,220 Och så ville de kunna kontrollera att 582 00:33:21,220 --> 00:33:24,854 att tjänsten var upp och tillförlitlig och arbetar för dem. 583 00:33:24,854 --> 00:33:27,020 Så de kom med detta något som heter Chaos Monkey. 584 00:33:27,020 --> 00:33:29,000 Det är mjukvara vilket, när man tänker 585 00:33:29,000 --> 00:33:34,190 om att tala om titeln av hela den här presentationen, 586 00:33:34,190 --> 00:33:36,530 scale-out innebär att du bör testa det här. 587 00:33:36,530 --> 00:33:38,585 Det är inte bra att bara ha en miljon maskiner. 588 00:33:38,585 --> 00:33:40,460 Så fina detta är, Chaos Monkey 589 00:33:40,460 --> 00:33:43,090 är en tjänst som identifierar grupper av system 590 00:33:43,090 --> 00:33:47,220 och slumpmässigt avslutar en av systemen i en grupp. 591 00:33:47,220 --> 00:33:48,429 Grymt. 592 00:33:48,429 --> 00:33:50,220 Så jag vet inte om dig, men om jag någonsin 593 00:33:50,220 --> 00:33:52,990 byggt ett system som bygger på andra system som talar med varandra, 594 00:33:52,990 --> 00:33:55,865 du tar en av dem ut, Sannolikheten för det hela arbetsdagen, 595 00:33:55,865 --> 00:33:57,130 minskar snabbt. 596 00:33:57,130 --> 00:34:00,475 >> Och så denna mjukvara körs runt Netflix infrastruktur. 597 00:34:00,475 --> 00:34:03,100 Lyckligtvis säger det körs endast i kontorstid med avsikt 598 00:34:03,100 --> 00:34:05,810 att ingenjörer blir alert och kunna svara. 599 00:34:05,810 --> 00:34:08,020 Så dessa är de typer saker vi är nu 600 00:34:08,020 --> 00:34:13,360 behöva göra för att störa vår datoranvändning miljöer, att införa kaos 601 00:34:13,360 --> 00:34:15,739 och att införa komplexitet. 602 00:34:15,739 --> 00:34:19,139 >> Så vem, i deras rätt sinne, skulle gärna välja 603 00:34:19,139 --> 00:34:22,540 att arbeta med en Chaos apa? 604 00:34:22,540 --> 00:34:24,150 Häng på, verkar han peka mig. 605 00:34:24,150 --> 00:34:28,719 Tja, jag antar att jag should-- söt. 606 00:34:28,719 --> 00:34:32,909 Men problemet är att du får inte valet. 607 00:34:32,909 --> 00:34:37,440 The Chaos Monkey, som ni kan se, väljer du. 608 00:34:37,440 --> 00:34:42,650 >> Och det här är problemet med datorer på skalan är att du inte kan undvika detta. 609 00:34:42,650 --> 00:34:49,989 Det är en oundviklighet komplexitet och deras omfattning och vår evolution, 610 00:34:49,989 --> 00:34:53,280 på vissa sätt, av datorkompetens. 611 00:34:53,280 --> 00:34:55,510 Och kom ihåg, det här är en sak att komma ihåg, 612 00:34:55,510 --> 00:35:00,030 Chaos Monkeys kärlek snowflakes-- kärlek snöflingor. 613 00:35:00,030 --> 00:35:03,470 En snowflake-- vi förklarade Chaos Monkey-- men en snöflinga 614 00:35:03,470 --> 00:35:09,630 är en server som är unik och speciell och känslig och individuell 615 00:35:09,630 --> 00:35:11,770 och kommer aldrig att kunna reproduceras. 616 00:35:11,770 --> 00:35:14,790 >> Vi finner ofta snöflinga service i vår miljö. 617 00:35:14,790 --> 00:35:16,700 Och vi försöker alltid och smälta snöflinga tjänst. 618 00:35:16,700 --> 00:35:18,880 Men om du hittar en server i din miljö 619 00:35:18,880 --> 00:35:23,240 som är kritisk för livslängden av din organisation och den smälter, 620 00:35:23,240 --> 00:35:25,300 du kan inte sätta ihop den igen. 621 00:35:25,300 --> 00:35:28,071 Så Chaos Monkey s uppgift var att gå och avsluta instanser. 622 00:35:28,071 --> 00:35:30,820 Om Chaos Monkey smälter snowflake, du är över, du är klar. 623 00:35:30,820 --> 00:35:34,390 624 00:35:34,390 --> 00:35:37,950 Jag vill prata om vissa hårdvara som vi är 625 00:35:37,950 --> 00:35:40,415 ser i termer av sorts skala-aktiviteter också. 626 00:35:40,415 --> 00:35:43,810 Och några unika saker som är i och runt vetenskapen aktivitet. 627 00:35:43,810 --> 00:35:46,990 Vi börjar nu se, kom ihåg denna enhet för utfärdandet, detta rack? 628 00:35:46,990 --> 00:35:51,780 Så detta är ett rack av GPGPUs-- så allmänt purpose grafik förädlingsenheter. 629 00:35:51,780 --> 00:35:55,790 >> Vi har dessa finns i våra data centrum, 100 eller så miles away. 630 00:35:55,790 --> 00:35:59,780 Denna speciella rack är ca 96 tera PLUMSAR 631 00:35:59,780 --> 00:36:04,090 av enkel precision matte kunna att leverera ut på baksidan av den. 632 00:36:04,090 --> 00:36:10,530 Och vi har ordning 130-odd kort i en instans 633 00:36:10,530 --> 00:36:16,620 att we-- multipel rack av denna instans. 634 00:36:16,620 --> 00:36:22,730 >> Så detta är intressant i den meningen att de allmänna ändamål grafikprocesser 635 00:36:22,730 --> 00:36:27,880 kan göra matematiken oerhört snabbt för mycket små mängder av energi. 636 00:36:27,880 --> 00:36:32,060 Så det finns en stor uppgång i de vetenskapliga dator områden, 637 00:36:32,060 --> 00:36:36,400 tittar på grafik heter i stort sätt. 638 00:36:36,400 --> 00:36:41,990 >> Så jag sprang några Mcollective genom vår marionett infrastruktur 639 00:36:41,990 --> 00:36:45,330 igår, väldigt glada över detta. 640 00:36:45,330 --> 00:36:48,260 knappt en petaflop av enkel precision. 641 00:36:48,260 --> 00:36:52,440 Bara för att vara tydlig här, det här lite multiplikator är 3.95. 642 00:36:52,440 --> 00:36:54,820 Dubbel precision matte skulle vara ungefär 1,2, 643 00:36:54,820 --> 00:36:57,010 men min Twitter-flöde såg mycket bättre om jag 644 00:36:57,010 --> 00:37:02,670 sade vi hade nästan en petaflop av enkel precision GPGPUs. 645 00:37:02,670 --> 00:37:04,220 >> Men det börjar bli där. 646 00:37:04,220 --> 00:37:06,280 Det blir att vara mycket, mycket imponerande. 647 00:37:06,280 --> 00:37:08,550 Och varför gör vi det här? 648 00:37:08,550 --> 00:37:11,570 Eftersom kvantkemi, bl 649 00:37:11,570 --> 00:37:15,300 men vi börjar utforma några nya solceller. 650 00:37:15,300 --> 00:37:20,210 >> Och så Alan Aspuru-Guzik, som är en professor i chemistry-- min partner 651 00:37:20,210 --> 00:37:22,390 i crime-- för de senaste åren. 652 00:37:22,390 --> 00:37:25,660 Vi har drivit kuvert på datoranvändning. 653 00:37:25,660 --> 00:37:30,250 Och GPGPU är idealisk teknik för att kunna göra 654 00:37:30,250 --> 00:37:34,760 en väldig massa komplicerade matte, väldigt, väldigt snabbt. 655 00:37:34,760 --> 00:37:36,750 >> Så med skalan, kommer nya utmaningar. 656 00:37:36,750 --> 00:37:41,070 Så stor scale-- du måste vara försiktig med hur du tråd här grejer. 657 00:37:41,070 --> 00:37:45,300 Och vi har vissa nivåer av tvångssyndrom. 658 00:37:45,300 --> 00:37:49,530 Dessa bilder förmodligen köra en hel del människor nötter. 659 00:37:49,530 --> 00:37:53,390 Och skåp som inte är wired särskilt väl 660 00:37:53,390 --> 00:37:56,050 driva vårt nätverk och faciliteter ingenjörer nötter. 661 00:37:56,050 --> 00:37:58,620 Plus det finns också luftflöde frågor som du måste innehålla. 662 00:37:58,620 --> 00:38:01,430 >> Så det är saker som jag skulle aldrig ha tänkt på. 663 00:38:01,430 --> 00:38:03,480 Med skalan, kommer mer komplexitet. 664 00:38:03,480 --> 00:38:05,869 Detta är en ny typ av filsystem. 665 00:38:05,869 --> 00:38:06,410 Det är häftigt. 666 00:38:06,410 --> 00:38:07,660 Det är en petabyte. 667 00:38:07,660 --> 00:38:09,905 Den kan lagra 1,1 miljarder filer. 668 00:38:09,905 --> 00:38:15,940 Den kan läsa och skriva till 13 gigabyte och 20 gigabyte en second-- gigabyte 669 00:38:15,940 --> 00:38:17,150 en sekund. 670 00:38:17,150 --> 00:38:20,900 Så det kan lasta terabyte i ingen tid alls. 671 00:38:20,900 --> 00:38:22,070 >> Och det är hög tillgänglighet. 672 00:38:22,070 --> 00:38:26,989 Och det har fått fantastiskt lookup rates-- 220000 länkdata en sekund. 673 00:38:26,989 --> 00:38:29,780 Och det finns många olika människor bygga denna typ av system. 674 00:38:29,780 --> 00:38:32,830 Och du kan se det här grafiskt. 675 00:38:32,830 --> 00:38:35,800 Detta är en av våra filsystem det är under belastning, ganska 676 00:38:35,800 --> 00:38:41,250 glatt läser på bara kort 22 gigabyte per sekund. 677 00:38:41,250 --> 00:38:42,790 Så det är cool-- så komplexitet. 678 00:38:42,790 --> 00:38:47,230 >> Så med komplexitet och omfattning, kommer mer komplexitet, eller hur? 679 00:38:47,230 --> 00:38:51,830 Detta är en av våra många, många nätverksdiagram, 680 00:38:51,830 --> 00:38:54,970 där du har många olika chassi alla stöd för upp 681 00:38:54,970 --> 00:38:57,730 in i en huvud kärna switch, ansluten till lagring, 682 00:38:57,730 --> 00:39:00,731 ansluter till låg latens anslutningar. 683 00:39:00,731 --> 00:39:03,605 Och sedan alla av denna sida av Huset är bara alla av förvaltningen 684 00:39:03,605 --> 00:39:09,740 att du måste kunna hantera dessa system från en annan plats. 685 00:39:09,740 --> 00:39:12,070 Så skalan har en hel del komplexitet med det. 686 00:39:12,070 --> 00:39:14,910 687 00:39:14,910 --> 00:39:17,785 >> Växla igen, låt oss gå tillbaka och har en liten fläck av vetenskap. 688 00:39:17,785 --> 00:39:21,450 Så kom ihåg, forskning databehandling och denna lilla shim-- 689 00:39:21,450 --> 00:39:25,310 lite rosa mellanlägg mellan fakultet och alla deras algoritmer 690 00:39:25,310 --> 00:39:30,650 och alla av den kall vetenskap och alla denna makt och kylning och datacenter 691 00:39:30,650 --> 00:39:35,330 golv och nätverk och stora datorer och service skrivbord och hjälpcentraler 692 00:39:35,330 --> 00:39:39,330 och så forth-- och så, vi är bara denna lilla mellanlägg mellan dem. 693 00:39:39,330 --> 00:39:42,820 >> Vad vi har börjat se är att världens 694 00:39:42,820 --> 00:39:45,730 kunnat bygga dessa stora datacenter 695 00:39:45,730 --> 00:39:48,020 och kunna bygga dessa stora datorer. 696 00:39:48,020 --> 00:39:49,420 Vi har blivit ganska bra på det. 697 00:39:49,420 --> 00:39:53,600 Vad vi är inte särskilt bra på det här lite mellanlägg mellan forskningen 698 00:39:53,600 --> 00:39:56,670 och plåten och tekniken. 699 00:39:56,670 --> 00:39:58,600 Och det är svårt. 700 00:39:58,600 --> 00:40:03,330 >> Och så har vi kunnat anställa folk som lever i den här världen. 701 00:40:03,330 --> 00:40:07,590 Och på senare tid, talade vi till National Science Foundation och sa, 702 00:40:07,590 --> 00:40:11,440 denna skala ut grejer är bra, men vi kan inte få våra forskare 703 00:40:11,440 --> 00:40:13,690 på till dessa stora komplicerade maskiner. 704 00:40:13,690 --> 00:40:16,040 Och så har det funnits en antal olika program 705 00:40:16,040 --> 00:40:20,100 där vi verkligen var mestadels bekymrad försöka 706 00:40:20,100 --> 00:40:22,800 för att se om vi kunde omvandla infrastrukturen campus. 707 00:40:22,800 --> 00:40:25,850 >> Det finns en massa program runt nationella centra. 708 00:40:25,850 --> 00:40:28,300 Och så, oss själva, vår vänner på Clemson, 709 00:40:28,300 --> 00:40:32,620 University of Wisconsin Madison, Södra Kalifornien, Utah och Hawaii 710 00:40:32,620 --> 00:40:35,780 typ av fick tillsammans med titta på det här problemet. 711 00:40:35,780 --> 00:40:39,340 Och den här lilla grafen här är den långa svansen av vetenskap. 712 00:40:39,340 --> 00:40:41,602 >> Så detta är-- det inte Oavsett vad som finns på denna axel, 713 00:40:41,602 --> 00:40:45,485 men denna axel är faktiskt nummer jobb går igenom klustret. 714 00:40:45,485 --> 00:40:48,940 Så det finns 350.000 över oavsett tidsperiod. 715 00:40:48,940 --> 00:40:51,730 Dessa är våra vanliga misstänkta längs botten här. 716 00:40:51,730 --> 00:40:55,992 I själva verket finns det Alan Aspuru-Guzik, vem vi pratade about-- ton 717 00:40:55,992 --> 00:40:58,700 och massor av compute, verkligen effektiva, vet vad han gör. 718 00:40:58,700 --> 00:41:02,840 >> Här är en annan labb som jag ska prata omkring i en moment-- John Kovac labb. 719 00:41:02,840 --> 00:41:03,610 De har fått det. 720 00:41:03,610 --> 00:41:04,210 De är bra. 721 00:41:04,210 --> 00:41:04,830 De är lyckliga. 722 00:41:04,830 --> 00:41:05,960 De computing. 723 00:41:05,960 --> 00:41:07,664 Stor vetenskapen blir gjort. 724 00:41:07,664 --> 00:41:09,580 Och sedan, när du snäll av komma ner hit, det 725 00:41:09,580 --> 00:41:12,110 är andra grupper som kör inte många jobb. 726 00:41:12,110 --> 00:41:13,410 >> Och varför är det? 727 00:41:13,410 --> 00:41:15,080 Är det för att det computing är för hårt? 728 00:41:15,080 --> 00:41:19,580 Är det för att de inte vet hur man? 729 00:41:19,580 --> 00:41:22,880 Vi vet inte, eftersom vi har gått och tittat. 730 00:41:22,880 --> 00:41:25,620 Och så det är vad det här Projektet handlar om, 731 00:41:25,620 --> 00:41:27,830 är lokalt, inom var och en av dessa regioner, 732 00:41:27,830 --> 00:41:32,660 att se till vägar där vi kan engagera med lärare och forskare 733 00:41:32,660 --> 00:41:36,400 faktiskt i den nedre änden av svansen, och förstå vad de ska göra. 734 00:41:36,400 --> 00:41:37,920 >> Så det är något som vi är faktiskt brinner. 735 00:41:37,920 --> 00:41:39,920 Och det är något som vetenskapen kommer inte att fortsätta 736 00:41:39,920 --> 00:41:44,260 att gå framåt tills vi löser vissa av dessa kantfall. 737 00:41:44,260 --> 00:41:46,590 Andra bitar av vetenskapen det kommer up-- alla 738 00:41:46,590 --> 00:41:48,260 sett Large Hadron Collider. 739 00:41:48,260 --> 00:41:49,540 Grymt, eller hur? 740 00:41:49,540 --> 00:41:52,960 Det här alla sprang ut på Holyoke. 741 00:41:52,960 --> 00:41:56,510 Vi Byggd- den allra första vetenskap som hände i Holyoke 742 00:41:56,510 --> 00:41:59,130 var samarbetet mellan oss själva och Boston University. 743 00:41:59,130 --> 00:42:01,510 Så det är riktigt, riktigt coolt. 744 00:42:01,510 --> 00:42:04,410 >> Detta är en rolig pjäs vetenskap för skalan. 745 00:42:04,410 --> 00:42:07,650 Detta är en digital tillgång till en himmel talet vid Harvard. 746 00:42:07,650 --> 00:42:09,170 I grund och botten är det en platta arkiv. 747 00:42:09,170 --> 00:42:13,350 Om du går ner Oxford-- Garden Street, sorry, 748 00:42:13,350 --> 00:42:16,560 hittar du en av observatoriet byggnader är i grunden fullt 749 00:42:16,560 --> 00:42:19,480 på cirka en halv miljon plattor. 750 00:42:19,480 --> 00:42:24,410 >> Och dessa är bilder av himlen på natten, över 100 år. 751 00:42:24,410 --> 00:42:28,760 Så det finns en hel rigg inrätta här för att digitalisera dessa plattor, 752 00:42:28,760 --> 00:42:32,100 ta bilder av dem, registrera dem, lägg dem på en dator. 753 00:42:32,100 --> 00:42:36,410 Och det är en och en halv petabyte och, lagom there-- ett litet projekt. 754 00:42:36,410 --> 00:42:37,530 >> Dessa är andra projekt. 755 00:42:37,530 --> 00:42:42,800 Denna Pan-Starrs projektet gör en full bred panoramaundersökning, 756 00:42:42,800 --> 00:42:47,390 söker nära jorden asteroider och övergående himmelska händelser. 757 00:42:47,390 --> 00:42:52,100 Som en molekylär biofysiker, jag älskar ordet gående himmelska händelse. 758 00:42:52,100 --> 00:42:55,050 Jag är inte helt säker på vad det är, men hur som helst, vi letar efter dem. 759 00:42:55,050 --> 00:43:00,372 >> Och vi genererar 30 terabyte en natt av dessa teleskop. 760 00:43:00,372 --> 00:43:03,330 Och det är egentligen inte en bandbredd problem, det är som en FedEx problem. 761 00:43:03,330 --> 00:43:08,420 Så du sätter lagringen på van och du skickar det vad det är. 762 00:43:08,420 --> 00:43:10,570 >> BICEP är verkligen interesting-- så att bakgrunds avbildning 763 00:43:10,570 --> 00:43:13,850 kosmiska extra galaktiska polarisering. 764 00:43:13,850 --> 00:43:16,880 När jag först började arbeta vid Harvard sju eller så, 765 00:43:16,880 --> 00:43:21,440 åtta år sedan, jag minns arbetar med detta projekt 766 00:43:21,440 --> 00:43:26,010 och det gjorde inte riktigt sjunka hem till varför polariserat ljus 767 00:43:26,010 --> 00:43:29,770 från den kosmiska bakgrund skulle vara viktigt, 768 00:43:29,770 --> 00:43:30,800 tills detta hände. 769 00:43:30,800 --> 00:43:34,580 >> Och detta var John Kovac, vem jag pratade med innan, 770 00:43:34,580 --> 00:43:42,030 använder miljoner och åter miljoner CPU timmar, i vår anläggning och andra, 771 00:43:42,030 --> 00:43:46,600 att i princip stirra in i insidan av universums första ögonblicken 772 00:43:46,600 --> 00:43:49,150 efter Big Bang, och försöka förstå 773 00:43:49,150 --> 00:43:51,290 Einsteins allmänna relativitetsteori. 774 00:43:51,290 --> 00:43:56,040 Det är tillbaka- att våra datorer hjälper oss reda ut och stirrar 775 00:43:56,040 --> 00:43:59,280 i själva ursprunget till varför vi är här. 776 00:43:59,280 --> 00:44:03,450 >> Så när du pratar om skalan, Detta är några allvarliga skala. 777 00:44:03,450 --> 00:44:09,260 Den andra saken av skalan är, att särskilt projekt träffade killarna. 778 00:44:09,260 --> 00:44:15,320 Och detta är responskurvan för BICEP [OHÖRBAR] Detta var vår lilla enkät. 779 00:44:15,320 --> 00:44:19,220 >> Och du kan se här, livet var bra fram till om här, 780 00:44:19,220 --> 00:44:21,200 som var när tillkännagivande kom ut. 781 00:44:21,200 --> 00:44:24,120 Och du har fått bokstav sekunder för att svara 782 00:44:24,120 --> 00:44:29,020 till skalnings händelse som motsvarar denna lilla prick här, 783 00:44:29,020 --> 00:44:32,200 som hamnade växling fyra eller så terabyte data 784 00:44:32,200 --> 00:44:36,370 via webbservern som day-- ganska håriga. 785 00:44:36,370 --> 00:44:38,210 >> Och så, det är de typer av saker som 786 00:44:38,210 --> 00:44:43,040 kan hända dig i din infrastruktur om du inte designar för skalan. 787 00:44:43,040 --> 00:44:45,630 Vi hade en bit av en förvränga den dagen, för att vara 788 00:44:45,630 --> 00:44:50,440 kunna spänna ut tillräckligt webbtjänst att hålla sajten igång. 789 00:44:50,440 --> 00:44:53,399 Och vi lyckades. 790 00:44:53,399 --> 00:44:55,190 Detta är en liten e- det är rätt söt. 791 00:44:55,190 --> 00:45:00,245 Detta är ett mail till Mark Vogelsberger, och Lars Hernquist, som är 792 00:45:00,245 --> 00:45:02,650 en fakultetsmedlem här på Harvard. 793 00:45:02,650 --> 00:45:03,570 Mer om Mark senare. 794 00:45:03,570 --> 00:45:05,990 Men jag tror att detta är en sorts fattar slag 795 00:45:05,990 --> 00:45:09,920 av var computing är i forsknings datoranvändning. 796 00:45:09,920 --> 00:45:12,070 Hej, lag, sedan förra Tisdag, ni plågats upp 797 00:45:12,070 --> 00:45:15,470 över 28% av det nya kluster, vilket i kombination 798 00:45:15,470 --> 00:45:20,040 är över 78 år av CPU på bara tre dagar. 799 00:45:20,040 --> 00:45:22,502 Och jag sa, det är fortfarande bara fredag ​​morgon. 800 00:45:22,502 --> 00:45:23,460 Detta är ganska häftigt! 801 00:45:23,460 --> 00:45:24,740 Lycklig fredag! 802 00:45:24,740 --> 00:45:27,450 >> Sen ger jag dem datapunkterna. 803 00:45:27,450 --> 00:45:30,260 Och så det var typ av intressant. 804 00:45:30,260 --> 00:45:34,840 Så kom ihåg om Mark, han kommer tillbaka in i bilden i lite. 805 00:45:34,840 --> 00:45:36,935 Så scale-out computing är överallt. 806 00:45:36,935 --> 00:45:41,080 >> Vi även hjälpa folk ser på hur NBA-funktioner, 807 00:45:41,080 --> 00:45:43,140 och där människor är kasta bollar från. 808 00:45:43,140 --> 00:45:47,580 Jag förstår inte riktigt det här spelet också väl, men till synes, det är en stor sak. 809 00:45:47,580 --> 00:45:50,610 Det finns bågar och skålar och pengar. 810 00:45:50,610 --> 00:45:55,300 >> Och så, i vår databas, vi byggt en liten 500 [OHÖRBAR] 811 00:45:55,300 --> 00:45:58,170 parallellprocessor kluster, ett par terabyte RAM, 812 00:45:58,170 --> 00:46:03,590 för att kunna bygga denna för Kirk och hans team. 813 00:46:03,590 --> 00:46:08,524 Och de gör computing på ett helt annat sätt. 814 00:46:08,524 --> 00:46:10,440 Nu är det här projektet är vi involverad i det är 815 00:46:10,440 --> 00:46:14,880 helt fascinerande, runt neurala plasticitet connectomics och genomisk 816 00:46:14,880 --> 00:46:20,960 imprinting-- tre mycket tung slår forskningsområden 817 00:46:20,960 --> 00:46:24,650 att vi slåss med på en dag till dag. 818 00:46:24,650 --> 00:46:30,670 Tanken att våra hjärnor är under plast stressen när vi är unga. 819 00:46:30,670 --> 00:46:34,980 Och mycket av våra vuxna beteende är skulpterad av erfarenhet i spädbarnsåldern. 820 00:46:34,980 --> 00:46:37,040 Så detta är en stor dealio. 821 00:46:37,040 --> 00:46:41,360 >> Och så det här är ett arbete som är finansierat av National Institutes of Mental Health. 822 00:46:41,360 --> 00:46:46,860 Och vi försöker i grunden, igenom en hel del stora data 823 00:46:46,860 --> 00:46:51,970 och stora dataanalys, snäll av blicka in vår mänskliga hjärnan 824 00:46:51,970 --> 00:46:54,870 genom en rad olika olika tekniker. 825 00:46:54,870 --> 00:47:00,360 >> Så jag ville sluta och slag bara stanna upp en liten stund. 826 00:47:00,360 --> 00:47:04,160 Utmaningen med fjärrkontroll datacenter är det är långt borta. 827 00:47:04,160 --> 00:47:05,520 Det kan omöjligen fungera. 828 00:47:05,520 --> 00:47:07,590 Jag behöver mina data närheten. 829 00:47:07,590 --> 00:47:10,730 Jag måste göra min forskning i mitt labb. 830 00:47:10,730 --> 00:47:18,620 >> Och så jag slags tog ett exempel på en funktionell magnetisk resonanstomografi 831 00:47:18,620 --> 00:47:22,260 datamängd från våra data center i västra Mass. 832 00:47:22,260 --> 00:47:24,660 och anslutit den till min skrivbordet i Cambridge. 833 00:47:24,660 --> 00:47:27,440 Och jag ska spela den här lilla videon. 834 00:47:27,440 --> 00:47:29,750 Förhoppningsvis kommer det slags arbete. 835 00:47:29,750 --> 00:47:33,480 >> Så detta är mig gå igenom kontrollera min GPU arbetar. 836 00:47:33,480 --> 00:47:35,430 Och jag kontrollera att VNC är slut. 837 00:47:35,430 --> 00:47:36,810 Och det här är ett smart VNC. 838 00:47:36,810 --> 00:47:38,970 Detta är en VNC med 3D bitar. 839 00:47:38,970 --> 00:47:41,975 Och så, som ni kan se inom kort, detta är jag spinning denna hjärnan runt. 840 00:47:41,975 --> 00:47:44,460 Jag försöker slags få det orienterad. 841 00:47:44,460 --> 00:47:49,574 Och då kan jag gå genom många olika skivor MRI data. 842 00:47:49,574 --> 00:47:51,490 Och det enda som är annorlunda om detta 843 00:47:51,490 --> 00:47:55,160 är, det kommer över tråden från västra Mass. till mitt skrivbord. 844 00:47:55,160 --> 00:47:57,300 Och dess rendering snabbare än mitt skrivbord, 845 00:47:57,300 --> 00:48:02,840 eftersom jag inte har en $ 4000 grafikkort i mitt skrivbord, vilket 846 00:48:02,840 --> 00:48:04,262 vi har ute Western Mass. 847 00:48:04,262 --> 00:48:05,720 Visst, jag försöker vara smart. 848 00:48:05,720 --> 00:48:08,859 Jag kör GLX kugghjul i bakgrund, samtidigt som gör allt detta, 849 00:48:08,859 --> 00:48:10,900 att se till att jag kan betona grafikkort, 850 00:48:10,900 --> 00:48:14,140 och att det alla typer av fungerar och alla resten av det. 851 00:48:14,140 --> 00:48:16,700 Men det viktiga är, är detta är 100 miles away. 852 00:48:16,700 --> 00:48:20,460 Och du kan se från detta att det finns ingen uppenbar fördröjning. 853 00:48:20,460 --> 00:48:24,600 Saker som håller ihop ganska bra. 854 00:48:24,600 --> 00:48:28,907 >> Och så att, i och för sig, är ett exempel och lite insikt 855 00:48:28,907 --> 00:48:31,490 i hur datorer och scale-out computing kommer att hända. 856 00:48:31,490 --> 00:48:35,330 Vi är alla som arbetar på tunnare och tunnare enheter. 857 00:48:35,330 --> 00:48:36,870 Vår användning av tabletter ökar. 858 00:48:36,870 --> 00:48:39,160 >> Så därför, min kol fotavtryck är i grunden 859 00:48:39,160 --> 00:48:42,060 flyttar från vad som brukade att göra det skulle har 860 00:48:42,060 --> 00:48:46,060 varit en stor maskin enligt mitt skrivbord, vad 861 00:48:46,060 --> 00:48:49,550 är nu en facility-- kunde vara var som helst. 862 00:48:49,550 --> 00:48:50,800 Det kan vara någonstans alls. 863 00:48:50,800 --> 00:48:54,790 Och ändå är det fortfarande möjlighet att föra tillbaka högpresterande grafik 864 00:48:54,790 --> 00:48:56,630 till mitt skrivbord. 865 00:48:56,630 --> 00:49:00,900 >> Så, få nära end-- minns Mark? 866 00:49:00,900 --> 00:49:04,480 Tja, är smart lad Mark. 867 00:49:04,480 --> 00:49:09,360 Han bestämde att han skulle bygga en realistisk virtuellt universum. 868 00:49:09,360 --> 00:49:12,820 Det är ganska ett projekt, när du tror att du har att pitch här. 869 00:49:12,820 --> 00:49:14,740 Jag kommer att använda en dator, och jag kommer 870 00:49:14,740 --> 00:49:21,040 att modellera de 12 miljoner år efter Big Bang för att representera en dag. 871 00:49:21,040 --> 00:49:27,080 Och då kommer jag att göra 13,8 miljard år av kosmiska evolutionen. 872 00:49:27,080 --> 00:49:28,270 Okej. 873 00:49:28,270 --> 00:49:30,970 >> Denna använder faktiskt en dator den var större än vår dator, 874 00:49:30,970 --> 00:49:35,040 och det spillde över på den nationella resurser till våra vänner nere i Texas. 875 00:49:35,040 --> 00:49:38,820 Och till de nationella anläggningar, detta var en hel del beräkna. 876 00:49:38,820 --> 00:49:40,750 Men vi gjorde en hel del simuleringen lokalt 877 00:49:40,750 --> 00:49:44,820 att se till att mjukvaran arbetade och systemen fungerade. 878 00:49:44,820 --> 00:49:47,790 >> Och det är dagar som denna när du inse att du stödjer vetenskap 879 00:49:47,790 --> 00:49:51,090 på denna nivå av skalan, som människor kan nu säga saker 880 00:49:51,090 --> 00:49:52,840 gillar, jag ska en modell ett universum. 881 00:49:52,840 --> 00:49:54,145 Och det här är hans första modellen. 882 00:49:54,145 --> 00:49:56,422 Och detta är hans lags första modellen. 883 00:49:56,422 --> 00:49:58,130 Det finns många andra folk som går 884 00:49:58,130 --> 00:50:01,520 att komma bakom Mark, som kommer att vill modellera med hög upplösning, 885 00:50:01,520 --> 00:50:04,652 med högre specificitet, med mer precision. 886 00:50:04,652 --> 00:50:09,105 >> Och så, i den sista par minuter, Jag vill bara visa er den här videon 887 00:50:09,105 --> 00:50:15,270 Mark och Lars-talet som för mig, igen, som en livsforskare, är rätt söt. 888 00:50:15,270 --> 00:50:17,890 889 00:50:17,890 --> 00:50:20,970 Så detta, vid botten Här, för att orientera dig, 890 00:50:20,970 --> 00:50:23,640 detta är att berätta den gången sedan Big Bang. 891 00:50:23,640 --> 00:50:26,570 Så vi är på cirka 0,7 miljarder år. 892 00:50:26,570 --> 00:50:28,740 Och detta visar den aktuella uppdateringen. 893 00:50:28,740 --> 00:50:33,450 Så du ser just nu, mörk materia och evolutionen 894 00:50:33,450 --> 00:50:39,910 av den fina strukturen och tidig strukturer i vårt kända universum. 895 00:50:39,910 --> 00:50:45,690 >> Och poängen med detta är att detta är allt gjort inuti datorn. 896 00:50:45,690 --> 00:50:48,530 Detta är en uppsättning parametrar och en uppsättning av fysik 897 00:50:48,530 --> 00:50:52,840 och en uppsättning matematik och en uppsättning av modeller 898 00:50:52,840 --> 00:50:59,284 som är noggrant utvalda, och sedan noggrant anslutna till varandra 899 00:50:59,284 --> 00:51:00,825 att kunna modellera interaktionen. 900 00:51:00,825 --> 00:51:04,850 >> Så du kan se några starter av vissa gasformiga explosioner här. 901 00:51:04,850 --> 00:51:06,880 Och gastemperatur förändras. 902 00:51:06,880 --> 00:51:13,720 Och du kan börja se strukturen av det synliga universum förändringen. 903 00:51:13,720 --> 00:51:18,130 Och den viktigaste delen med detta är, varje liten liten, liten, liten prick 904 00:51:18,130 --> 00:51:21,070 är en bit av fysik och har en uppsättning av matematik runt, 905 00:51:21,070 --> 00:51:23,030 informera sin vän och granne. 906 00:51:23,030 --> 00:51:27,245 >> Så från en skalnings perspektiv dessa datorer måste alla arbeta i samförstånd 907 00:51:27,245 --> 00:51:29,470 och prata med varandra på ett effektivt sätt. 908 00:51:29,470 --> 00:51:31,060 Så de inte kan vara alltför pratsam. 909 00:51:31,060 --> 00:51:33,520 De måste lagra sina resultat. 910 00:51:33,520 --> 00:51:37,902 Och de måste fortsätta att informera alla sina vänner. 911 00:51:37,902 --> 00:51:40,860 Faktiskt, ser du nu, den här modellen blir mer och mer komplicerad. 912 00:51:40,860 --> 00:51:42,590 Det finns mer och mer saker på gång. 913 00:51:42,590 --> 00:51:45,210 Det finns mer och mer material flyger runt. 914 00:51:45,210 --> 00:51:48,410 >> Och detta är vad den tidiga kosmos skulle ha sett ut. 915 00:51:48,410 --> 00:51:49,770 Det var en ganska hårig plats. 916 00:51:49,770 --> 00:51:55,140 Det finns explosioner över platsen, mäktiga kollisioner. 917 00:51:55,140 --> 00:51:58,620 Och bildning av tunga metaller och grundämnen. 918 00:51:58,620 --> 00:52:03,910 Och dessa stora moln smashing in varandra med den extrema krafter. 919 00:52:03,910 --> 00:52:08,530 >> Och så nu är vi 9,6 miljarder år från denna inledande explosionen. 920 00:52:08,530 --> 00:52:12,310 Du börjar se saker är sorts lugnat ner lite, bara 921 00:52:12,310 --> 00:52:15,660 lite, eftersom energi börjar nu slappna av. 922 00:52:15,660 --> 00:52:19,420 Och så den matematiska modeller har fått det på plats. 923 00:52:19,420 --> 00:52:22,510 Och du börjar att se sammansmältning av olika element. 924 00:52:22,510 --> 00:52:26,220 Och börjar se denna sak typ av komma samman och långsamt svalna. 925 00:52:26,220 --> 00:52:32,260 >> Och det börjar se lite mer som natthimlen, en liten bit. 926 00:52:32,260 --> 00:52:37,870 Och det är [? QSing. ?] Vi är nu 30,2 miljard år och vi är typ av gjort. 927 00:52:37,870 --> 00:52:41,130 Och sedan vad de gjorde var att de tog den här modellen, 928 00:52:41,130 --> 00:52:44,580 och sedan tittade på det synliga universum. 929 00:52:44,580 --> 00:52:48,560 Och i grunden då, var kunna ta det och overlay 930 00:52:48,560 --> 00:52:50,580 det med vad du kan se. 931 00:52:50,580 --> 00:52:56,160 Och trohet är häpnadsväckande, att hur exakt de datormodeller är. 932 00:52:56,160 --> 00:52:58,760 >> Naturligtvis den astrofysik och forskargrupper 933 00:52:58,760 --> 00:53:02,780 behöver ännu bättre trohet och ännu högre upplösning. 934 00:53:02,780 --> 00:53:06,230 Men om man tänker på vad Jag har pratat med dig i dag 935 00:53:06,230 --> 00:53:11,850 genom denna lilla resa genom både lagring och struktur och nätverk 936 00:53:11,850 --> 00:53:18,000 och staplar, det viktiga är, är scale-out computing viktigt? 937 00:53:18,000 --> 00:53:22,050 Det var min ursprungliga hypothesis-- tillbaka till vår vetenskapliga metod. 938 00:53:22,050 --> 00:53:24,810 >> Jag hoppas att i ett tidigt del av detta skulle jag 939 00:53:24,810 --> 00:53:29,400 förutse att jag skulle kunna förklara till er om scale-out datoranvändning. 940 00:53:29,400 --> 00:53:32,870 Och vi slags testat vissa av dessa hypoteser. 941 00:53:32,870 --> 00:53:34,585 Vi gick igenom det här samtalet. 942 00:53:34,585 --> 00:53:38,920 Och jag ska bara säga scale-out computing är essential-- oh, 943 00:53:38,920 --> 00:53:42,480 Ja, väldigt mycket ja. 944 00:53:42,480 --> 00:53:44,790 >> Så när du tänker om dina koder, då 945 00:53:44,790 --> 00:53:49,230 du gör de CS50 slutprojekt, När du funderar på ditt arv 946 00:53:49,230 --> 00:53:52,990 för mänskligheten och de resurser som vi behöver kunna köra dessa dator 947 00:53:52,990 --> 00:53:56,650 system, tror mycket noggrant om FLOPS per watt, 948 00:53:56,650 --> 00:53:58,560 och tänka på Chaos Monkey. 949 00:53:58,560 --> 00:54:02,240 >> Tänk på dina snöflingor, inte gör engångs, återanvändning bibliotek, 950 00:54:02,240 --> 00:54:06,453 bygga återanvändbara codes-- alla de saker att handledarna har undervisat dig 951 00:54:06,453 --> 00:54:08,630 i denna klass. 952 00:54:08,630 --> 00:54:11,942 Dessa är grundläggande aspekter. 953 00:54:11,942 --> 00:54:13,150 De är inte bara läpparnas bekännelse. 954 00:54:13,150 --> 00:54:15,660 Dessa är verkliga saker. 955 00:54:15,660 --> 00:54:20,680 >> Och om någon av er vill följa mig, Jag är besatt med Twitter sak. 956 00:54:20,680 --> 00:54:22,770 Jag måste på något sätt ge upp det. 957 00:54:22,770 --> 00:54:24,960 Men en hel del av bakgrundsinformation är 958 00:54:24,960 --> 00:54:29,260 på vår forskning computing hemsida rc.fas.harvard.edu. 959 00:54:29,260 --> 00:54:34,010 >> Jag försöka hålla en blogg upp till date med modern teknik 960 00:54:34,010 --> 00:54:38,390 och hur vi gör distributiv computing och så vidare. 961 00:54:38,390 --> 00:54:43,600 Och sedan våra personal är alltid tillgänglig genom odybot.org. 962 00:54:43,600 --> 00:54:46,270 Och odybot är vår lilla hjälpreda. 963 00:54:46,270 --> 00:54:49,280 Han har ofta lite tävlingar på sin hemsida 964 00:54:49,280 --> 00:54:51,630 också, där du kan prova och spot honom runt campus. 965 00:54:51,630 --> 00:54:55,200 Han är den vänliga lilla ansikte forsknings datoranvändning. 966 00:54:55,200 --> 00:54:59,730 >> Och jag ska typ av linda uppe och tack alla för din tid. 967 00:54:59,730 --> 00:55:05,660 Och jag hoppas att du kommer ihåg att scale-out computing är ett äkta varan. 968 00:55:05,660 --> 00:55:08,162 Och det finns en massa människor som har fått en hel del tidigare teknik 969 00:55:08,162 --> 00:55:09,370 som kommer att kunna hjälpa dig. 970 00:55:09,370 --> 00:55:14,330 Och alla lycka med dina framtida strävanden i att göra 971 00:55:14,330 --> 00:55:18,280 till att vår beräkning både skalor, är högpresterande, 972 00:55:18,280 --> 00:55:20,370 och hjälper mänskligheten mer än något annat. 973 00:55:20,370 --> 00:55:22,850 Så, tack för din tid. 974 00:55:22,850 --> 00:55:23,947