1 00:00:00,000 --> 00:00:12,080 2 00:00:12,080 --> 00:00:13,799 >> JAMES MANCHET: Hej, god eftermiddag, alle sammen. 3 00:00:13,799 --> 00:00:14,715 Mit navn er James Cuff. 4 00:00:14,715 --> 00:00:18,970 Jeg er den assisterende dekan for forskning Computing her på Harvard University. 5 00:00:18,970 --> 00:00:24,540 Og i dag vil jeg tale med dig om hvorfor skala-out computing er afgørende. 6 00:00:24,540 --> 00:00:26,810 >> Så jeg gætte, først op, der er denne fyr? 7 00:00:26,810 --> 00:00:27,750 Hvorfor er jeg her? 8 00:00:27,750 --> 00:00:29,200 Hvorfor taler jeg med dig? 9 00:00:29,200 --> 00:00:33,730 Jeg har en baggrund i videnskabelig computing og forskning computing, 10 00:00:33,730 --> 00:00:38,530 strækker sig tilbage til De Forenede Kingdom-- The Wellcome Trust Sanger 11 00:00:38,530 --> 00:00:43,270 Institut for den menneskelige genome-- og så for nylig i USA 12 00:00:43,270 --> 00:00:50,170 arbejder på de overordnede og andre agtet steder for læring, som Harvard. 13 00:00:50,170 --> 00:00:53,930 >> Jeg gætte, hvad der virkelig betyder at jeg er en inddrive molekylær bio 14 00:00:53,930 --> 00:00:55,740 fysiker. 15 00:00:55,740 --> 00:01:01,250 Så hvad ret har jeg nødt til at fortælle dig om skala-out computing? 16 00:01:01,250 --> 00:01:03,570 Der er en dog. 17 00:01:03,570 --> 00:01:09,530 18 år, så jeg har lige set den mest dramatiske stigninger i skala kompleksitet 18 00:01:09,530 --> 00:01:13,570 og samlede effektivitet af computersystemer. 19 00:01:13,570 --> 00:01:18,890 >> Da jeg lavede min PhD på Oxford, jeg var temmelig ophidset med en 200 megahertz 20 00:01:18,890 --> 00:01:23,830 Silicon Graphics maskine med 18 gigabyte lagerplads og en enkelt CPU. 21 00:01:23,830 --> 00:01:24,910 Tiderne har ændret sig. 22 00:01:24,910 --> 00:01:29,860 Hvis du spoler frem nu, vi spinning over 60.000 CPU'er her på Harvard. 23 00:01:29,860 --> 00:01:32,810 Mange andre organisationer roterer mange flere. 24 00:01:32,810 --> 00:01:37,740 >> Det vigtige takeaway fra dette er at skalaen er nu ikke kun uundgåelig, 25 00:01:37,740 --> 00:01:41,910 det er sket, og det er vil fortsætte med at ske. 26 00:01:41,910 --> 00:01:44,760 Så lad os for et øjeblik, venlig af spole tilbage og tale meget hurtigt 27 00:01:44,760 --> 00:01:50,530 om videnskab, min favorit emne, den videnskabelige metode. 28 00:01:50,530 --> 00:01:53,180 >> Hvis du er til at være en videnskabsmand, du skal gøre et par vigtige ting. 29 00:01:53,180 --> 00:01:56,140 Hvis du ikke gør disse ting, du kan ikke anser dig selv en videnskabsmand 30 00:01:56,140 --> 00:02:03,250 og du vil kæmpe at kunne forstå dit område af disciplin. 31 00:02:03,250 --> 00:02:07,290 >> Så først og fremmest vil du formulere dit spørgsmål, du generere hypoteser, 32 00:02:07,290 --> 00:02:09,289 men endnu vigtigere, du forudsige din results-- 33 00:02:09,289 --> 00:02:13,090 du har et gæt på hvad resultaterne vil være. 34 00:02:13,090 --> 00:02:19,560 Og så endelig, du teste din hypotese og analysere dine resultater. 35 00:02:19,560 --> 00:02:25,460 >> Så denne videnskabelige metode er ekstremt vigtigt i computing. 36 00:02:25,460 --> 00:02:28,450 Computing både forudsigelsen og at kunne teste dine resultater 37 00:02:28,450 --> 00:02:33,660 er en vigtig del af det, vi har brug for at gøre i den videnskabelige metode. 38 00:02:33,660 --> 00:02:37,310 Disse forudsigelser og afprøvninger er de virkelige to hjørnestene 39 00:02:37,310 --> 00:02:42,350 af den videnskabelige metode, og hver kræver de største fremskridt 40 00:02:42,350 --> 00:02:45,240 i moderne beregning. 41 00:02:45,240 --> 00:02:51,210 >> De to søjler i videnskab er, at teori og eksperimenter. 42 00:02:51,210 --> 00:02:54,300 Og for nylig, computing nævnes ofte 43 00:02:54,300 --> 00:02:58,090 som den tredje søjle af videnskaben. 44 00:02:58,090 --> 00:03:01,440 Så hvis du studerende ser denne, du har absolut ingen pres. 45 00:03:01,440 --> 00:03:03,960 46 00:03:03,960 --> 00:03:08,720 Tredje søjle i science-- nogen big deal-- computing, slags vigtige. 47 00:03:08,720 --> 00:03:14,000 Så glad dette er computing del datalogi kursus 50. 48 00:03:14,000 --> 00:03:16,220 >> Så nok af baggrunden. 49 00:03:16,220 --> 00:03:20,226 Jeg vil gerne fortælle dig plan for, hvad vi kommer til at tale om i dag. 50 00:03:20,226 --> 00:03:22,870 Jeg har tænkt mig at gå over nogle historie. 51 00:03:22,870 --> 00:03:25,250 Jeg har tænkt mig at forklare, hvorfor vi kom her. 52 00:03:25,250 --> 00:03:27,750 Jeg har tænkt mig at tale om nogle af historien om computing 53 00:03:27,750 --> 00:03:33,890 her på Harvard, nogle aktiviteter omkring sociale medier, 54 00:03:33,890 --> 00:03:36,200 grøn things-- meget lidenskabelig om alle ting 55 00:03:36,200 --> 00:03:43,640 green-- storage-- computer storage-- hvordan kaos påvirker skala-out ud systemer, 56 00:03:43,640 --> 00:03:45,640 og distribution systemer i særdeleshed. 57 00:03:45,640 --> 00:03:48,473 >> Og så jeg har tænkt mig at komme ind på nogle af skalaen-out hardware, der er 58 00:03:48,473 --> 00:03:51,370 der kræves for at være i stand til gøre computing på skalaen. 59 00:03:51,370 --> 00:03:55,830 Og så endelig, vi vil wrap op med nogle awesome videnskab. 60 00:03:55,830 --> 00:04:00,894 >> Så lad os tage et minut til se på vores faktiske historie. 61 00:04:00,894 --> 00:04:01,810 Computing har udviklet sig. 62 00:04:01,810 --> 00:04:07,370 Så da 60'erne, alle den væk igennem til i dag, 63 00:04:07,370 --> 00:04:11,260 vi har set stort set en ændring i rækkevidde fra centraliseret computing 64 00:04:11,260 --> 00:04:14,679 at decentralisere computing, til samarbejdsorienteret og derefter uafhængig 65 00:04:14,679 --> 00:04:15,970 computing og højre back igen. 66 00:04:15,970 --> 00:04:17,709 >> Og lad mig anmærke, at en lille smule. 67 00:04:17,709 --> 00:04:20,370 Da vi først startede med computere, havde vi mainframes. 68 00:04:20,370 --> 00:04:22,824 De var overordentligt dyrt udstyr. 69 00:04:22,824 --> 00:04:23,990 Alt skulle deles. 70 00:04:23,990 --> 00:04:25,556 Den computing var kompleks. 71 00:04:25,556 --> 00:04:29,060 Du kan se, det fyldt værelser og der var operatører og bånd 72 00:04:29,060 --> 00:04:32,780 og alle former for whirry, clicky, Spinny enheder. 73 00:04:32,780 --> 00:04:39,930 >> Omkring 70'erne tidlige 80'ere, du startede at se en effekt af de faxmaskiner. 74 00:04:39,930 --> 00:04:43,620 Så du begynder at se computing begynder at dukke tilbage i laboratorier 75 00:04:43,620 --> 00:04:45,880 og komme tættere på dig. 76 00:04:45,880 --> 00:04:49,800 Fremkomsten af ​​den personlige computer, bestemt 77 00:04:49,800 --> 00:04:57,460 i 80'erne, først på årti ændret virkelig computing. 78 00:04:57,460 --> 00:04:59,570 >> Og der er en anelse i titlen, fordi det 79 00:04:59,570 --> 00:05:04,080 blev kaldt den personlige computer, som betød det tilhørte dig. 80 00:05:04,080 --> 00:05:07,630 Så som udviklingen i computing fortsatte, 81 00:05:07,630 --> 00:05:10,530 folk indså, at deres personlige computer ikke var virkelig stor nok 82 00:05:10,530 --> 00:05:15,020 at være i stand til at gøre noget for nogen fortjeneste, eller betydelig fortjeneste, i videnskaben. 83 00:05:15,020 --> 00:05:17,790 >> Og så folk begyndte at udvikle netværksenhed 84 00:05:17,790 --> 00:05:21,920 drivere for at kunne forbinde pc'er sammen for at være i stand til at opbygge klynger. 85 00:05:21,920 --> 00:05:26,430 Og så dette avlede den æra af Beowulf klynge. 86 00:05:26,430 --> 00:05:32,470 Linux eksploderede som en reaktion på proprietære styresystem, både omkostninger 87 00:05:32,470 --> 00:05:33,650 og kompleksitet. 88 00:05:33,650 --> 00:05:36,530 >> Og så er vi her i dag, hvor endnu en gang, vi er 89 00:05:36,530 --> 00:05:40,610 konfronteret med værelser fuld af computer udstyr og evnen 90 00:05:40,610 --> 00:05:44,570 at knalde ens kreditkort og få adgang til disse computerfaciliteter, 91 00:05:44,570 --> 00:05:45,290 eksternt. 92 00:05:45,290 --> 00:05:49,680 >> Og så kan du så se, i form af historie dønninger 93 00:05:49,680 --> 00:05:52,180 hvordan vi gør computing i dag, er det absolut 94 00:05:52,180 --> 00:05:56,090 udviklet sig fra maskinen værelser fuld af computere 95 00:05:56,090 --> 00:05:59,160 gennem nogle pc hele vejen tilbage igen 96 00:05:59,160 --> 00:06:02,400 til maskinen værelser fuld af computere. 97 00:06:02,400 --> 00:06:06,620 >> Så dette er min første klynge. 98 00:06:06,620 --> 00:06:10,170 Så 2000 byggede vi et computersystem i Europa 99 00:06:10,170 --> 00:06:13,900 til effektivt at kommentere det humane genom. 100 00:06:13,900 --> 00:06:16,521 Der er en masse teknologi noteret på højre side 101 00:06:16,521 --> 00:06:18,520 der, desværre er ikke længere hos os. 102 00:06:18,520 --> 00:06:23,460 Det er gået ud til store teknologi i himlen. 103 00:06:23,460 --> 00:06:26,610 >> Selve maskinen er sandsynligvis svarende til et par anstændigt laptops 104 00:06:26,610 --> 00:06:29,020 i dag, og at lige slags viser dig. 105 00:06:29,020 --> 00:06:36,260 Men vi nøje anmærke det humane genom og begge beskyttet det 106 00:06:36,260 --> 00:06:43,190 med denne særlige papir Naturen fra vedrører data 107 00:06:43,190 --> 00:06:45,380 være offentlige eller private. 108 00:06:45,380 --> 00:06:48,610 >> Så dette er awesome, ikke? 109 00:06:48,610 --> 00:06:50,280 Så vi har fået en menneskelige genom. 110 00:06:50,280 --> 00:06:51,510 Vi har gjort computing. 111 00:06:51,510 --> 00:06:53,400 Jeg føler meget glad mig. 112 00:06:53,400 --> 00:06:59,090 Jeg rullede op til Harvard i 2006, føler en masse mindre tilfreds med mig selv. 113 00:06:59,090 --> 00:07:00,210 >> Dette er hvad jeg har arvet. 114 00:07:00,210 --> 00:07:03,575 Dette er en afdelings mail og filserver. 115 00:07:03,575 --> 00:07:05,450 Du kan se her er der en lille smule af bånd 116 00:07:05,450 --> 00:07:07,710 der bruges til at holde systemet sammen. 117 00:07:07,710 --> 00:07:09,890 Dette er vores licens og printserver. 118 00:07:09,890 --> 00:07:13,990 Jeg er temmelig sikker på, der måske passwords På nogle af disse post-it sedler. 119 00:07:13,990 --> 00:07:16,560 120 00:07:16,560 --> 00:07:17,360 >> Ikke awesome. 121 00:07:17,360 --> 00:07:18,530 Temmelig langt fra awesome. 122 00:07:18,530 --> 00:07:22,060 Og så er jeg klar over denne lille diagram at jeg viste dig i starten 123 00:07:22,060 --> 00:07:25,350 at dele til ejerskab tilbage til deling, 124 00:07:25,350 --> 00:07:27,930 at vi havde brug for at ændre spillet. 125 00:07:27,930 --> 00:07:31,330 Og så vi ændret spillet ved at give incitamenter. 126 00:07:31,330 --> 00:07:34,250 Og så mennesker, som dette lille Wikipedia-artikel 127 00:07:34,250 --> 00:07:35,990 siger her, vores målbevidste skabninger. 128 00:07:35,990 --> 00:07:39,250 Og studiet af incitament strukturer er afgørende for undersøgelsen 129 00:07:39,250 --> 00:07:41,100 af den økonomiske aktivitet. 130 00:07:41,100 --> 00:07:44,580 >> Så vi begyndte at tilskynde vores fakultet og vores forskere. 131 00:07:44,580 --> 00:07:47,720 Og så vi tilskyndes dem med en rigtig stor computersystem. 132 00:07:47,720 --> 00:07:52,720 Så i 2008 byggede vi en 4.096 processor machine-- 10 stativer, 133 00:07:52,720 --> 00:07:54,470 par hundrede kilowatt strøm. 134 00:07:54,470 --> 00:07:56,178 >> Hvad jeg mener er interessant er det ikke 135 00:07:56,178 --> 00:07:58,300 Uanset hvor du er i cyklus. 136 00:07:58,300 --> 00:08:03,510 Den samme mængde strøm og computerkraft, strømmen er konstant. 137 00:08:03,510 --> 00:08:06,270 Det var 200 kW, når vi byggede i Europa. 138 00:08:06,270 --> 00:08:09,770 Det er to hundrede kilowatt i 2008, og at 139 00:08:09,770 --> 00:08:15,820 synes at være [? quanter?] af små universitetsbaseret computersystemer. 140 00:08:15,820 --> 00:08:20,540 >> Så Harvard today-- hurtigt frem, jeg er ikke længere trist panda, en ganske glad panda. 141 00:08:20,540 --> 00:08:25,860 Vi har 60-ulige tusinde belastning afbalanceret CPU'er, og deres klatring dramatisk. 142 00:08:25,860 --> 00:08:28,780 Vi har 15 petabyte af opbevaring, også klatring. 143 00:08:28,780 --> 00:08:30,720 Igen, dette 200 kilowatt tilvækst, synes vi 144 00:08:30,720 --> 00:08:33,000 at være tilføjer, at hver sjette eller så måneder. 145 00:08:33,000 --> 00:08:35,480 Partier og masser af virtuelle maskiner. 146 00:08:35,480 --> 00:08:37,620 Og endnu vigtigere, omkring 1,8 megawatt 147 00:08:37,620 --> 00:08:39,669 forskning computerudstyr. 148 00:08:39,669 --> 00:08:41,820 >> Og jeg har tænkt mig at komme tilbage til dette senere, 149 00:08:41,820 --> 00:08:46,913 på, hvorfor jeg ikke længere nødvendigvis tælle hvor meget CPU, vi har, 150 00:08:46,913 --> 00:08:48,980 men hvor stor er elregningen. 151 00:08:48,980 --> 00:08:52,690 20 andre så dedikeret forskning computing personale. 152 00:08:52,690 --> 00:08:57,250 Og endnu vigtigere, vi er begyndt at vokse vores GPGPUs. 153 00:08:57,250 --> 00:09:05,030 Jeg blev forskudt over, hvor meget af dette bliver tilføjet på en dag-til-dag basis. 154 00:09:05,030 --> 00:09:07,310 Så historietime forbi, ikke? 155 00:09:07,310 --> 00:09:11,280 >> Så hvordan kommer vi derhen herfra? 156 00:09:11,280 --> 00:09:14,560 Lad os se på nogle moderne scale-out beregne eksempler. 157 00:09:14,560 --> 00:09:18,290 158 00:09:18,290 --> 00:09:23,230 Jeg er en lille smule besat med størrelse og omfanget af sociale medier. 159 00:09:23,230 --> 00:09:30,850 Der er en række af ekstremt vellykket stor skala computing 160 00:09:30,850 --> 00:09:34,820 organisationer nu på planeten, yde støtte og service 161 00:09:34,820 --> 00:09:36,810 for os alle. 162 00:09:36,810 --> 00:09:39,340 Så det er ansvarsfraskrivelse. 163 00:09:39,340 --> 00:09:42,990 >> Og jeg ønsker at starte med en antal ounce i en Instagram. 164 00:09:42,990 --> 00:09:48,336 Det er faktisk ikke en bly-in til en joke, det er 165 00:09:48,336 --> 00:09:50,460 ikke engang at sjove, faktisk, kommer til at tænke på det. 166 00:09:50,460 --> 00:09:52,751 Men alligevel, vi vil se på ounce i Instagram. 167 00:09:52,751 --> 00:09:55,260 Og vi kommer til at starte med "min bi og en blomst." 168 00:09:55,260 --> 00:09:57,600 Jeg var på [uhørligt] Village og jeg tog lidt billede 169 00:09:57,600 --> 00:10:00,460 af en bi siddende på en blomst. 170 00:10:00,460 --> 00:10:03,270 Og så begyndte jeg at tænke på hvad betyder det egentlig betyder. 171 00:10:03,270 --> 00:10:07,013 Og jeg tog dette billede fra min telefon og tælles, hvor mange bytes er i det, 172 00:10:07,013 --> 00:10:09,070 og det er omkring 256 kilobyte. 173 00:10:09,070 --> 00:10:13,550 Hvilket da jeg startede, ville stort set fylde en 5 og 1/4 tommer floppy. 174 00:10:13,550 --> 00:10:15,340 Og begyndte at tænke, ja, det er cool. 175 00:10:15,340 --> 00:10:18,630 >> Og jeg begyndte at se og gøre nogle forskning på netværket. 176 00:10:18,630 --> 00:10:22,490 Og jeg fandt ud af, at Instagram har 200 millioner MAU'er. 177 00:10:22,490 --> 00:10:25,105 Jeg var faktisk ikke, at sikker på, hvad en MAU var. 178 00:10:25,105 --> 00:10:28,960 Og en MAU, hernede, er en månedlig aktiv bruger. 179 00:10:28,960 --> 00:10:34,270 >> Så 200 millioner MAUs-- pretty cool. 180 00:10:34,270 --> 00:10:38,190 20 milliarder photographs-- så en hel del af fotografier. 181 00:10:38,190 --> 00:10:42,300 60 millioner nye fotografier hver dag 182 00:10:42,300 --> 00:10:46,990 kommer ud på omkring 0,002 gig per foto. 183 00:10:46,990 --> 00:10:51,290 Det er omkring fem petabyte af disken bare lige der. 184 00:10:51,290 --> 00:10:55,480 Og det er virkelig ikke den centrale del af det, vi kommer til at tale om. 185 00:10:55,480 --> 00:10:57,830 Det er små kartofler. 186 00:10:57,830 --> 00:11:00,710 Eller som vi siger i England, små spuds. 187 00:11:00,710 --> 00:11:05,050 >> Så lad os se på den virkelige elefant i room-- unikke ansigter. 188 00:11:05,050 --> 00:11:09,170 Igen, lad os måle på denne nye kvanter kalder en MAU. 189 00:11:09,170 --> 00:11:13,260 Facebook selv har 1,3 mia MAU'er. 190 00:11:13,260 --> 00:11:17,510 WhatsApp, som jeg havde ikke engang hørt om indtil for nylig, er det 191 00:11:17,510 --> 00:11:23,260 en slags messaging service, er på 500 mio MAU'er. 192 00:11:23,260 --> 00:11:26,620 Instagram, som vi lige talte om, 200 millioner MAU'er. 193 00:11:26,620 --> 00:11:29,370 Og Messenger, som er en anden messaging service, 194 00:11:29,370 --> 00:11:31,120 er også 200 millioner MAU'er. 195 00:11:31,120 --> 00:11:35,920 >> Så alt det op, det handler om 2,2 milliarder samlede brugere. 196 00:11:35,920 --> 00:11:39,880 Der er tydeligvis en vis overlapning, men det er svarende til en tredjedel af planeten. 197 00:11:39,880 --> 00:11:44,270 Og de sender noget i region på 12 milliarder beskeder om dagen. 198 00:11:44,270 --> 00:11:46,680 Og igen, er der kun 7 milliard mennesker på planeten. 199 00:11:46,680 --> 00:11:48,550 Ikke alle har en smartphone. 200 00:11:48,550 --> 00:11:53,960 Så dette er vanvittige numre. 201 00:11:53,960 --> 00:12:02,050 >> Og jeg har tænkt mig at argumentere for, at det ikke er selv om opbevaring eller Compute. 202 00:12:02,050 --> 00:12:05,610 Og for at citere den sang, det handler om at grafen. 203 00:12:05,610 --> 00:12:09,045 Her er vores dejlige Meghan Trainor ned her synger om alle bassen. 204 00:12:09,045 --> 00:12:12,570 Bemærk, hun også har en ganske smule bas herself-- 207, 205 00:12:12,570 --> 00:12:16,460 godt 218 mio mennesker har set denne unge dame synger hendes sang. 206 00:12:16,460 --> 00:12:19,910 >> Så mit argument er det det handler om grafen. 207 00:12:19,910 --> 00:12:23,480 Så vi tog nogle open source-software og begyndte at se på en graf. 208 00:12:23,480 --> 00:12:27,740 Og det er LinkedIn, så dette er Facebook for gamle mennesker. 209 00:12:27,740 --> 00:12:29,910 Og så, det er min LinkedIn graf. 210 00:12:29,910 --> 00:12:34,080 Jeg har 1.200 eller deromkring knudepunkter, såkaldte "Friends". 211 00:12:34,080 --> 00:12:36,360 Og her er mig på toppen. 212 00:12:36,360 --> 00:12:38,140 Og her er alle de indbyrdes forbindelser. 213 00:12:38,140 --> 00:12:40,570 >> Nu tænker tilbage til Instagram historien. 214 00:12:40,570 --> 00:12:42,815 Hver af disse er ikke bare billedet er det 215 00:12:42,815 --> 00:12:46,860 har en hel overflod af forbindelser mellem dette særlige individuelle 216 00:12:46,860 --> 00:12:48,220 og mange andre. 217 00:12:48,220 --> 00:12:52,190 Dette er central brik er enten en bug i grafen tegning algoritme, 218 00:12:52,190 --> 00:12:55,982 eller dette måske David Malan, jeg er ikke sikker endnu. 219 00:12:55,982 --> 00:12:57,690 Så du kan gentegne grafer i alle mulige 220 00:12:57,690 --> 00:13:02,510 af ways-- gephi.gihub.io er hvor du kan trække den software fra. 221 00:13:02,510 --> 00:13:05,410 Det er virkelig cool for at være stand til at organisere fællesskaber. 222 00:13:05,410 --> 00:13:08,640 Du kan se her, det er Harvard og forskellige andre steder, jeg har arbejdet, 223 00:13:08,640 --> 00:13:12,160 fordi det er min arbejdsrelaterede data. 224 00:13:12,160 --> 00:13:15,080 >> Så bare tænke kompleksiteten af grafen og alle data 225 00:13:15,080 --> 00:13:17,070 at du trækker sammen med. 226 00:13:17,070 --> 00:13:20,870 Så i mellemtiden, tilbage på FriendFace, ikke? 227 00:13:20,870 --> 00:13:24,360 Vi kiggede på Instagram data, var i størrelsesordenen fem petabyte. 228 00:13:24,360 --> 00:13:25,300 Nogen big deal. 229 00:13:25,300 --> 00:13:28,830 Stadig en del data, men nogen big beskæftige i den større arrangement med ting. 230 00:13:28,830 --> 00:13:33,850 >> Fra denne artikel på det gamle internet, "Skalering af Facebook data warehouse 231 00:13:33,850 --> 00:13:36,250 til 300 petabyte. " 232 00:13:36,250 --> 00:13:38,110 Det er en helt anden game changer nu 233 00:13:38,110 --> 00:13:40,234 når du begynder at tænke på data og grafen 234 00:13:40,234 --> 00:13:41,690 og hvad du bringer sammen med. 235 00:13:41,690 --> 00:13:47,480 Og deres høje data vokser af størrelsesordenen 600 Terrabytes en dag. 236 00:13:47,480 --> 00:13:52,980 >> Nu ved du, ja, then-- Jeg mener, 600 Terrabytes om dagen, 237 00:13:52,980 --> 00:13:55,670 300 petabytes-- de er også nu begynder 238 00:13:55,670 --> 00:13:58,550 at få meget bekymret hvordan man holder det her 239 00:13:58,550 --> 00:14:01,160 og for at sikre disse data forbliver rundt. 240 00:14:01,160 --> 00:14:04,630 Og denne herre her, Jay Parikh, ser 241 00:14:04,630 --> 00:14:08,250 på, hvordan man opbevarer en Exabyte af data. 242 00:14:08,250 --> 00:14:10,180 >> Bare for dem af jer der ser sammen 243 00:14:10,180 --> 00:14:13,940 hjemme, en exabyte-- 10 til 18. 244 00:14:13,940 --> 00:14:18,210 Det har fået sit eget Wikipedia side, det er så stort et antal. 245 00:14:18,210 --> 00:14:23,120 Det er størrelsen og omfanget af det, vi er ser på, at være i stand til at lagre data. 246 00:14:23,120 --> 00:14:27,090 Og disse fyre ikke mucking rundt, de er opbevaring at mængden af ​​data. 247 00:14:27,090 --> 00:14:29,550 Så en af ​​de spor, de søger på her 248 00:14:29,550 --> 00:14:32,185 er datacentre for såkaldt kold opbevaring. 249 00:14:32,185 --> 00:14:35,020 250 00:14:35,020 --> 00:14:36,470 >> Hvilket bringer mig til at være grøn. 251 00:14:36,470 --> 00:14:38,340 Og her er Kermit. 252 00:14:38,340 --> 00:14:43,050 Han og jeg agree-- det ekstremt svært at være grøn, 253 00:14:43,050 --> 00:14:44,920 men vi giver det vores bedste chance. 254 00:14:44,920 --> 00:14:47,430 Kermit kan ikke gøre for det, han har være grøn hele tiden, 255 00:14:47,430 --> 00:14:49,945 kan ikke tage sin grønne-ness off på alle. 256 00:14:49,945 --> 00:14:55,410 >> Så bliver concepts-- en nogle slags kernebegreber 257 00:14:55,410 --> 00:14:59,510 af grønhed, når det vedrører computing. 258 00:14:59,510 --> 00:15:05,510 Den ene, der er den vigtigste er levetiden af ​​produktet. 259 00:15:05,510 --> 00:15:09,405 Hvis dit produkt har en kort levetid, du kan ikke per definition være grøn. 260 00:15:09,405 --> 00:15:13,280 Den energi, der til at fremstille en diskdrev, et bundkort, en computer 261 00:15:13,280 --> 00:15:17,890 systemet, en tablet, hvad det kan være, levetiden af ​​dine systemer 262 00:15:17,890 --> 00:15:21,700 er en vigtig del af, hvordan grøn du kan være. 263 00:15:21,700 --> 00:15:27,960 >> Den vigtige del, som alle jer er ved at opbygge software algorithms-- 264 00:15:27,960 --> 00:15:30,455 Algoritmen er en delvis ord for software, ikke? 265 00:15:30,455 --> 00:15:34,000 Så din algoritme design er helt afgørende i forhold 266 00:15:34,000 --> 00:15:43,080 af, hvordan du vil være i stand til at gøre hurtige og præcise beregninger til at bruge 267 00:15:43,080 --> 00:15:44,710 den mindste mængde energi muligt. 268 00:15:44,710 --> 00:15:47,280 Og jeg vil komme til dette i en lille smule. 269 00:15:47,280 --> 00:15:51,270 >> Datacenter design-- du har set at vi allerede har tusindvis 270 00:15:51,270 --> 00:15:54,870 og atter tusinder af maskiner, der sidder roligt i små, mørke hjørner 271 00:15:54,870 --> 00:15:57,760 af verden, computing. 272 00:15:57,760 --> 00:16:01,670 Resource allocation-- hvordan du får til compute, til opbevaring, 273 00:16:01,670 --> 00:16:03,840 via netværket. 274 00:16:03,840 --> 00:16:08,530 Operativsystemer er en vigtig del af dette, og en masse virtualisering 275 00:16:08,530 --> 00:16:12,080 at være i stand til at pakke mere og mere Compute ind i et lille rum. 276 00:16:12,080 --> 00:16:15,530 >> Jeg vil give dig et lille eksempel fra forskning computing. 277 00:16:15,530 --> 00:16:18,220 Vi havde brug for mere ping, mere magt, og mere rør. 278 00:16:18,220 --> 00:16:21,030 Vi havde brug for mere større, bedre, hurtigere computere, 279 00:16:21,030 --> 00:16:23,390 og havde brug for at bruge mindre juice. 280 00:16:23,390 --> 00:16:26,856 Og vi kunne ikke finde ud af, hvordan du gør dette. 281 00:16:26,856 --> 00:16:29,980 Jeg ved ikke, om det hashtag gowest som sandsynligvis blevet brugt af Kardashian, 282 00:16:29,980 --> 00:16:32,560 men alligevel, gowest. 283 00:16:32,560 --> 00:16:33,220 Og det gjorde vi. 284 00:16:33,220 --> 00:16:36,610 >> Vi plukket op vores operation og vi flyttede det ud 285 00:16:36,610 --> 00:16:39,660 til vestlige Massachusetts i en lille mølle by 286 00:16:39,660 --> 00:16:45,000 kaldet Holyoke, lige nord af Chikopee og Springfield. 287 00:16:45,000 --> 00:16:49,280 Vi gjorde det for et par grunde. 288 00:16:49,280 --> 00:16:55,150 Den vigtigste var, at vi havde en meget, meget stor dæmning. 289 00:16:55,150 --> 00:17:00,080 Og denne meget store dæmning er i stand til at sat ud 30 plus megawatt energi, 290 00:17:00,080 --> 00:17:02,980 og det blev underudnyttet på det tidspunkt. 291 00:17:02,980 --> 00:17:06,170 >> Vigtigere, havde vi også en meget kompliceret netværk 292 00:17:06,170 --> 00:17:07,254 der var allerede på plads. 293 00:17:07,254 --> 00:17:09,711 Hvis man ser på, hvor netværket går i USA, 294 00:17:09,711 --> 00:17:11,230 det følger alle toget spor. 295 00:17:11,230 --> 00:17:14,290 Denne særlige stykke net var ejet af vores kolleger og venner 296 00:17:14,290 --> 00:17:16,480 på Massachusetts Institute of Technology, 297 00:17:16,480 --> 00:17:19,720 og det var dybest set bygget hele vejen ud til rute 90. 298 00:17:19,720 --> 00:17:24,760 >> Så vi havde en stor flod kryds, Route 90 kryds, vi havde en kort sti på 100 miles, 299 00:17:24,760 --> 00:17:26,960 og en lang bane på omkring 1.000 miles. 300 00:17:26,960 --> 00:17:29,890 Vi havde at gøre en meget stor netværk splejsning, som du kan se her, 301 00:17:29,890 --> 00:17:32,990 at stort set lægge et link ind, til kunne oprette forbindelse til Holyoke, 302 00:17:32,990 --> 00:17:36,390 men vi havde alle de nødvendige infrastructure-- ping, magt, rør. 303 00:17:36,390 --> 00:17:37,280 Livet var godt. 304 00:17:37,280 --> 00:17:38,980 Og igen, stor dæmning. 305 00:17:38,980 --> 00:17:42,120 >> Så vi byggede dybest set den Massachusetts Grøn High Performance Computing 306 00:17:42,120 --> 00:17:42,850 Center. 307 00:17:42,850 --> 00:17:46,580 Dette var en arbejdskraft af kærlighed gennem fem universities-- MIT, Harvard, UMass, 308 00:17:46,580 --> 00:17:47,870 Northeastern, og BU. 309 00:17:47,870 --> 00:17:49,554 Fem megawatt dag tilsluttede belastning. 310 00:17:49,554 --> 00:17:51,845 Vi gjorde alle mulige dygtighed med airside economisere 311 00:17:51,845 --> 00:17:53,585 at holde tingene grøn. 312 00:17:53,585 --> 00:18:03,330 Og vi bygget 640-ulige stativer, dedikeret til forskning computing. 313 00:18:03,330 --> 00:18:08,770 >> Det var en gammel forladte sted, så vi havde nogle regenerering og nogle rydde op 314 00:18:08,770 --> 00:18:10,500 og nogle oprydning af webstedet. 315 00:18:10,500 --> 00:18:13,590 Og så begyndte vi at opbygge anlægget 316 00:18:13,590 --> 00:18:19,710 og, boom-- dejlige facilitet med evnen til at køre sandkasse computing, 317 00:18:19,710 --> 00:18:24,430 at have konferencer og seminarer, og også en massiv datacenter gulvet. 318 00:18:24,430 --> 00:18:26,007 >> Her er min gode selv. 319 00:18:26,007 --> 00:18:27,590 Jeg naturligvis iført den samme jakke. 320 00:18:27,590 --> 00:18:29,423 Jeg måske kun har én jakke, men der er mig 321 00:18:29,423 --> 00:18:34,030 og John Goodhue-- han er den administrerende direktør for Center-- 322 00:18:34,030 --> 00:18:36,740 stående i maskinrummet sal, der, som du kan se, 323 00:18:36,740 --> 00:18:40,560 er temmelig dramatisk, og det går tilbage en lang, lang vej. 324 00:18:40,560 --> 00:18:44,830 >> Jeg ofte spille spil kørsel fra Boston ud til Holyoke, 325 00:18:44,830 --> 00:18:47,260 foregiver, at jeg er en TCP / IP-pakke. 326 00:18:47,260 --> 00:18:54,290 Og jeg bekymre sig om min latenstid køre rundt i min bil. 327 00:18:54,290 --> 00:18:56,690 Så det er den grønne brik. 328 00:18:56,690 --> 00:19:00,070 Så lad os bare tage et minut og tænke over stakke. 329 00:19:00,070 --> 00:19:04,060 Så vi prøver meget nøje til bygge datacentre effektivt, 330 00:19:04,060 --> 00:19:08,770 computing effektivt, gøre god udvælgelse til computerudstyr 331 00:19:08,770 --> 00:19:12,060 og levere mere vigtigere, vores ansøgning, 332 00:19:12,060 --> 00:19:17,860 det være sig en beskedtjeneste eller en videnskabelig anvendelse. 333 00:19:17,860 --> 00:19:19,110 >> Så her er de stakke. 334 00:19:19,110 --> 00:19:22,762 Så fysiske lag, alt vej op gennem application-- 335 00:19:22,762 --> 00:19:25,220 håber, at dette vil være en god del af dit kursus. 336 00:19:25,220 --> 00:19:31,450 OSI syv lag modellen principielt, du vil leve, spise og trække vejret 337 00:19:31,450 --> 00:19:35,270 dette hele din computing karriere. 338 00:19:35,270 --> 00:19:37,800 Hele dette koncept for fysisk infrastructure-- ledninger, 339 00:19:37,800 --> 00:19:40,080 kabler, datacentre, links. 340 00:19:40,080 --> 00:19:42,190 Og dette er blot beskriver netværket. 341 00:19:42,190 --> 00:19:44,780 >> Heroppe er, godt, naturligvis, dette er en gammel dias, 342 00:19:44,780 --> 00:19:49,342 fordi dette skulle sige HTTP, fordi ingen bekymrer sig om simpel mail 343 00:19:49,342 --> 00:19:50,550 transportprotokoller, længere. 344 00:19:50,550 --> 00:19:53,960 Det hele sker i HTTP rummet. 345 00:19:53,960 --> 00:19:55,850 Så det er et niveau af stakken. 346 00:19:55,850 --> 00:19:59,460 >> Her er et andet sæt stakke, hvor man har en server, en vært, en hypervisor, 347 00:19:59,460 --> 00:20:02,470 en gæst, binær bibliotek, og så vil din ansøgning. 348 00:20:02,470 --> 00:20:06,070 Eller, i dette tilfælde indretningen driver, en Linux-kernen, indfødte c, 349 00:20:06,070 --> 00:20:08,080 Java virtuel maskine, Java API, så Java 350 00:20:08,080 --> 00:20:11,220 applikationer, og så videre og så videre. 351 00:20:11,220 --> 00:20:14,090 Dette er en beskrivelse af en virtuel maskine. 352 00:20:14,090 --> 00:20:15,450 >> Hellige stakke, Batman! 353 00:20:15,450 --> 00:20:18,260 Tænk over dette i Vilkår for hvor meget Compute 354 00:20:18,260 --> 00:20:20,850 du har brug for at komme fra hvad der sker her, 355 00:20:20,850 --> 00:20:23,110 hele vejen op til toppen af denne stak, derefter 356 00:20:23,110 --> 00:20:26,840 kunne gøre din faktiske levering af ansøgningen. 357 00:20:26,840 --> 00:20:29,130 >> Og hvis du slags spole tilbage og begynde at tænke 358 00:20:29,130 --> 00:20:33,450 om, hvad det kræver at give en floating point operation, 359 00:20:33,450 --> 00:20:37,650 din floating point operation er en sum af stikkene, antallet af kerner 360 00:20:37,650 --> 00:20:44,490 i soklen, et ur, der er Hvor hurtigt kan uret turnover-- 361 00:20:44,490 --> 00:20:47,490 fire gigahertz, to gigahertz-- og derefter det nummer 362 00:20:47,490 --> 00:20:50,890 af handlinger, du kan gøre i en given hertz. 363 00:20:50,890 --> 00:20:54,350 >> Så disse mikroprocessorer i dag gøre mellem fire og 6 flops 364 00:20:54,350 --> 00:20:55,400 pr taktcyklus. 365 00:20:55,400 --> 00:20:59,810 Og så en single-core 2,5 gig ur har en teoretisk ydeevne 366 00:20:59,810 --> 00:21:03,490 på omkring en mega flop, give eller tage. 367 00:21:03,490 --> 00:21:05,940 >> Men som med alt, vi har valg. 368 00:21:05,940 --> 00:21:12,280 Så og Intel Core 2, Nehalem Sandy Bridge, Haswell, AMD, 369 00:21:12,280 --> 00:21:13,920 tage din choices-- Intel Atom. 370 00:21:13,920 --> 00:21:17,670 Alle disse processorarkitekturer alle har en lidt anden måde 371 00:21:17,670 --> 00:21:19,650 for at kunne tilføje to tal sammen, 372 00:21:19,650 --> 00:21:23,520 som er dybest set deres formål i livet. 373 00:21:23,520 --> 00:21:24,535 Skal være hårde. 374 00:21:24,535 --> 00:21:27,100 Der er millioner af dem sidde i datacentre, nu selv. 375 00:21:27,100 --> 00:21:30,410 >> Sor, flops pr watt-- dette er den store ting. 376 00:21:30,410 --> 00:21:37,780 Så hvis jeg ønsker at få mere af dette at komme igennem denne stak, hurtigere, 377 00:21:37,780 --> 00:21:41,800 Jeg har fået at arbejde på, hvor mange operationer med flydende komma et sekund, 378 00:21:41,800 --> 00:21:43,770 Jeg kan gøre, og derefter give dem watt. 379 00:21:43,770 --> 00:21:46,160 Og heldigvis, folkens har tænkt over dette. 380 00:21:46,160 --> 00:21:49,140 >> Så der er en stor bestride hvert år for at se 381 00:21:49,140 --> 00:21:52,310 der kan bygge den hurtigste computer der kan diagonalize en matrix. 382 00:21:52,310 --> 00:21:53,980 Det hedder Top 500. 383 00:21:53,980 --> 00:21:56,420 De pluk toppen fra de bedste 500 computere 384 00:21:56,420 --> 00:21:58,610 på planeten, der kan diagonalize matricer. 385 00:21:58,610 --> 00:22:00,760 Og du får nogle fantastiske resultater. 386 00:22:00,760 --> 00:22:04,660 >> En masse af disse maskiner er mellem 10 og 20 megawatt. 387 00:22:04,660 --> 00:22:09,380 De kan diagonalize matricer overordentligt hurtigt. 388 00:22:09,380 --> 00:22:13,550 De behøver ikke nødvendigvis diagonalized dem så effektivt per watt, 389 00:22:13,550 --> 00:22:18,060 så der var denne store indsats for at se på hvad en grøn 500-listen ville se ud. 390 00:22:18,060 --> 00:22:20,360 Og her er en liste fra juni. 391 00:22:20,360 --> 00:22:22,410 Der bør være en ny meget snart. 392 00:22:22,410 --> 00:22:26,590 >> Og det kalder out-- Jeg tager toppen af ​​denne liste. 393 00:22:26,590 --> 00:22:32,187 Der er to specifikke machines-- én fra Tokyo Institute of Technology 394 00:22:32,187 --> 00:22:34,520 og et fra Cambridge University i Det Forenede Kongerige. 395 00:22:34,520 --> 00:22:37,700 Og disse har temmelig forbløffende mega flops per watt nøgletal. 396 00:22:37,700 --> 00:22:42,620 Denne ens 4389, og den næste ned er 3.631. 397 00:22:42,620 --> 00:22:47,660 >> Jeg vil forklare forskellen mellem disse to, i det næste dias. 398 00:22:47,660 --> 00:22:51,320 Men disse er disse er moderat størrelse test klynger. 399 00:22:51,320 --> 00:22:54,732 Disse er blot 34 kilowatt eller 52 kilowatt. 400 00:22:54,732 --> 00:22:56,940 Der er nogle større virksomheder her-- denne ene 401 00:22:56,940 --> 00:22:58,860 på den schweiziske Supercomputing Centre. 402 00:22:58,860 --> 00:23:00,693 Den take home besked for dette er, at vi er 403 00:23:00,693 --> 00:23:04,270 forsøger at finde computere der kan fungere effektivt. 404 00:23:04,270 --> 00:23:09,860 >> Og så, lad os se på denne top en, cutely kaldes, KFC. 405 00:23:09,860 --> 00:23:12,960 Og en lille smule reklame her. 406 00:23:12,960 --> 00:23:15,730 Denne særlige fødevarevirksomhed har intet at gøre med dette. 407 00:23:15,730 --> 00:23:18,240 Det er den kendsgerning, at dette system 408 00:23:18,240 --> 00:23:23,830 er gennemvædet i en meget smart olie-baseret forbindelse. 409 00:23:23,830 --> 00:23:27,590 Og så de fik deres kylling friture moniker 410 00:23:27,590 --> 00:23:30,040 når de først begyndte at bygge disse typer af systemer. 411 00:23:30,040 --> 00:23:32,740 >> Men dybest set, hvad de har taget her er et antal vinger, 412 00:23:32,740 --> 00:23:37,560 sætte dem i dette sofistikeret mineralolie, 413 00:23:37,560 --> 00:23:40,979 og arbejdede derefter ud af at få alle netværkssamarbejde ind og ud af den. 414 00:23:40,979 --> 00:23:42,895 Så ikke nok med det, de har lagt den ud så 415 00:23:42,895 --> 00:23:46,095 at den kan udnytte uden luftkøling. 416 00:23:46,095 --> 00:23:47,520 Det var temmelig imponerende. 417 00:23:47,520 --> 00:23:49,630 Så du er nødt til at gøre alt af denne narrestreger 418 00:23:49,630 --> 00:23:53,280 at være i stand til at få denne mængde af Compute leveres til små watt. 419 00:23:53,280 --> 00:23:57,360 >> Og du kan se dette er formen af, hvor tingene er på vej. 420 00:23:57,360 --> 00:24:01,240 Udfordringen er, at regelmæssig luft køling er stordriftsfordele 421 00:24:01,240 --> 00:24:08,459 og driver en masse af udvikling af både almindelige computing, 422 00:24:08,459 --> 00:24:09,750 og high performance computing. 423 00:24:09,750 --> 00:24:11,080 Så dette er temmelig forstyrrende. 424 00:24:11,080 --> 00:24:13,280 Jeg tror, ​​det er fascinerende. 425 00:24:13,280 --> 00:24:15,530 Det er lidt rodet, når du prøv at bytte de diskdrev, 426 00:24:15,530 --> 00:24:18,090 men det er en virkelig cool idé. 427 00:24:18,090 --> 00:24:22,200 >> Så ikke nok med det, der er en hel masse arbejde 428 00:24:22,200 --> 00:24:25,450 bygges omkring hvad vi er kalder Open Compute Project. 429 00:24:25,450 --> 00:24:29,400 Og ja, mere om det lidt senere. 430 00:24:29,400 --> 00:24:32,740 Men branchen er begyndt at indse, at flops per watt 431 00:24:32,740 --> 00:24:33,670 bliver vigtig. 432 00:24:33,670 --> 00:24:39,256 Og du, som folk her, som du designe dine algoritmer 433 00:24:39,256 --> 00:24:41,130 og du designe din kode, skal du være opmærksom 434 00:24:41,130 --> 00:24:43,620 at din kode kan har en afsmittende effekt. 435 00:24:43,620 --> 00:24:48,380 >> Da Mark sad her i hans kollegieværelse skriver Facebook 1.0, 436 00:24:48,380 --> 00:24:51,050 Jeg er temmelig sikker på, han havde en visning at det ville være enorme. 437 00:24:51,050 --> 00:24:54,945 Men hvordan enorme det ville være på miljø er et stort dealio. 438 00:24:54,945 --> 00:24:58,340 Og så alle ya kunne komme med algoritmer 439 00:24:58,340 --> 00:25:01,370 der kan blive den næste udfordrende ting for folk som mig, 440 00:25:01,370 --> 00:25:02,700 forsøger at køre systemer. 441 00:25:02,700 --> 00:25:07,360 >> Så lad os bare tænke effektgrænser virkelige verden. 442 00:25:07,360 --> 00:25:09,930 Dette papir ved Landauer-- er ikke en ny ting. 443 00:25:09,930 --> 00:25:12,480 1961 dette blev offentliggjort i IBM Journal. 444 00:25:12,480 --> 00:25:15,590 Dette er den kanoniske "Uigenkaldelige og Heat 445 00:25:15,590 --> 00:25:17,630 Generation i Computing-processen. " 446 00:25:17,630 --> 00:25:22,050 Og så han hævdede, at maskiner uundgåeligt 447 00:25:22,050 --> 00:25:25,070 udføre logistiske funktioner, har ikke enkelt værdi omvendt. 448 00:25:25,070 --> 00:25:29,130 >> Således at hele del af dette er, at tilbage i 60'erne, 449 00:25:29,130 --> 00:25:31,890 folk vidste, at dette var vil være et problem. 450 00:25:31,890 --> 00:25:37,080 Og så loven om grænser sagde 25 grader C, en slags kanonisk værelse 451 00:25:37,080 --> 00:25:41,120 temperatur, grænsen repræsenterer 0,1 elektronvolt. 452 00:25:41,120 --> 00:25:44,920 Men teoretisk, er det teorien, computerhukommelse 453 00:25:44,920 --> 00:25:51,410 opererer ved denne grænse kunne være ændres på en milliard bit i sekundet. 454 00:25:51,410 --> 00:25:54,620 >> Jeg ved ikke, om dig, men ikke stødt på mange en milliard bit 455 00:25:54,620 --> 00:25:57,190 en anden datahastighed udvekslinger. 456 00:25:57,190 --> 00:26:01,360 Argumentet var, at kun 2,8 billioner af en watt 457 00:26:01,360 --> 00:26:03,180 burde nogensinde udvides. 458 00:26:03,180 --> 00:26:08,160 >> Okay, virkelige verden example-- dette er min elregning. 459 00:26:08,160 --> 00:26:10,347 Jeg 65% procent af denne dejlige datacenter 460 00:26:10,347 --> 00:26:11,930 Jeg viste dig, i dette særlige tidspunkt. 461 00:26:11,930 --> 00:26:15,520 Det er tilbage i juni sidste år. 462 00:26:15,520 --> 00:26:21,300 Jeg har taget en ældre version, så vi kan og sortering af anonymisere en lille smule. 463 00:26:21,300 --> 00:26:25,470 Jeg tilbragte 45000 $ a måned for energi der. 464 00:26:25,470 --> 00:26:34,990 >> Så grunden være der, er, at vi har over 50.000 processer i værelset. 465 00:26:34,990 --> 00:26:38,110 Så kan du forestille dig dit eget boligområder elregning 466 00:26:38,110 --> 00:26:39,540 er, at høj? 467 00:26:39,540 --> 00:26:46,180 Men det var for en 199 mio watt timer over en måned. 468 00:26:46,180 --> 00:26:51,670 >> Så det spørgsmål, jeg stiller, er, kan du forestille Mr. Zuckerberg elregning? 469 00:26:51,670 --> 00:26:54,730 Mine er temmelig stor, og jeg kæmper. 470 00:26:54,730 --> 00:26:56,600 Og jeg er ikke alene i denne er. 471 00:26:56,600 --> 00:26:59,450 Der er en masse mennesker med store datacentre. 472 00:26:59,450 --> 00:27:04,800 Og så, jeg gætte, fuld disclosure-- mine Facebook-venner en smule underligt. 473 00:27:04,800 --> 00:27:07,900 >> Så min Facebook er Den Prineville datacenter, 474 00:27:07,900 --> 00:27:14,030 som er en af ​​Facebooks største, nyeste, laveste energi datacenter. 475 00:27:14,030 --> 00:27:19,360 Og de sender til mig, ting som power udnyttelse effektivitet, 476 00:27:19,360 --> 00:27:24,020 som i hvor effektiv er den data center versus hvor meget energi, du er 477 00:27:24,020 --> 00:27:26,370 sætte ind i det, hvor meget vand er de bruger, hvad er 478 00:27:26,370 --> 00:27:27,810 luftfugtighed og temperatur. 479 00:27:27,810 --> 00:27:29,980 >> Og de har disse Dejlige, dejlige grunde. 480 00:27:29,980 --> 00:27:32,600 Jeg tror, ​​det er en fantastisk Facebook-side, 481 00:27:32,600 --> 00:27:35,400 men jeg gætte, jeg er en lille smule underligt. 482 00:27:35,400 --> 00:27:39,930 >> Så en mere magt ting, forskning computing, at jeg gør 483 00:27:39,930 --> 00:27:44,060 er signifikant forskellige hvad Facebook og Yahoo og Google 484 00:27:44,060 --> 00:27:50,020 og andre on-demand, fuldt, altid tilgængelige tjenester. 485 00:27:50,020 --> 00:27:53,530 Og så har jeg den fordel, at når ISO New England-- og ISO New England 486 00:27:53,530 --> 00:27:58,910 med til at sætte den energi satser for regionen. 487 00:27:58,910 --> 00:28:01,110 >> Og det siger, det er der strækker en anmodning til forbrugerne 488 00:28:01,110 --> 00:28:05,870 til frivilligt spare høj energi, på grund af den høje luftfugtighed og varme. 489 00:28:05,870 --> 00:28:08,680 Og det var tilbage den 18. juli. 490 00:28:08,680 --> 00:28:12,600 Og så jeg heldigvis Tweet tilbage, Hey, ISO New England, Green Harvard. 491 00:28:12,600 --> 00:28:14,880 Vi gør vores del i løbet af her i forskning computing. 492 00:28:14,880 --> 00:28:16,760 Og det er fordi vi gør videnskab. 493 00:28:16,760 --> 00:28:20,380 >> Og lige så meget som folk siger videnskaben aldrig sover, kan videnskaben vente. 494 00:28:20,380 --> 00:28:25,030 Så vi er i stand til at QUIESCE vores systemer, drage fordel af kvalitet satser 495 00:28:25,030 --> 00:28:30,550 på vores energiregning, og hjælpe hele New England 496 00:28:30,550 --> 00:28:35,910 region ved at udgyde mange megawatt belastning. 497 00:28:35,910 --> 00:28:40,020 Så det er den unikke ting, adskiller om videnskabelig computing data 498 00:28:40,020 --> 00:28:48,890 centre og dem, der er i fuld produktion 24/7. 499 00:28:48,890 --> 00:28:51,670 >> Så lad os bare tage et andet gear her. 500 00:28:51,670 --> 00:28:55,170 Så jeg ønsker at diskutere kaos en lille smule. 501 00:28:55,170 --> 00:28:59,900 Og jeg ønsker at sætte det i regi af opbevaring. 502 00:28:59,900 --> 00:29:03,150 Så for dem, der slags af kæmpede 503 00:29:03,150 --> 00:29:08,680 at få deres hoved omkring hvad petabyte lagerplads ser ud, dette et eksempel. 504 00:29:08,680 --> 00:29:11,660 Og det er den slags ting Jeg behandler hele tiden. 505 00:29:11,660 --> 00:29:15,550 >> Hver af disse små gutter er en fire terabyte harddisk, 506 00:29:15,550 --> 00:29:17,420 så du kan slags tælle dem op. 507 00:29:17,420 --> 00:29:21,370 Vi får nu mellem en til 1 og 1/2 petabytes 508 00:29:21,370 --> 00:29:22,970 i en standard industri rack. 509 00:29:22,970 --> 00:29:26,430 Og vi har lokaler og værelser, som du så i det tidligere billede med John 510 00:29:26,430 --> 00:29:31,230 og jeg, fuld af disse stativer udstyr. 511 00:29:31,230 --> 00:29:40,400 Så det bliver meget, meget let at opbygge massive storagesystemer 512 00:29:40,400 --> 00:29:44,140 >> Det er for det meste let inde i Unix til slags tælle op, hvordan det går. 513 00:29:44,140 --> 00:29:48,270 Så dette er at tælle, hvor mange MAU punkter har jeg fik der. 514 00:29:48,270 --> 00:29:50,880 Så det er 423 opsnappe point. 515 00:29:50,880 --> 00:29:55,660 Og så hvis jeg køre nogle sketchy awk, jeg kan tilføje op, i dette system, 516 00:29:55,660 --> 00:29:59,080 Der var 7,3 petabyte af tilgængelige opbevaring. 517 00:29:59,080 --> 00:30:01,350 >> Så det er en masse ting. 518 00:30:01,350 --> 00:30:03,030 Og opbevaring er virkelig hårdt. 519 00:30:03,030 --> 00:30:06,850 Og dog, en eller anden grund, dette er en industri tendens. 520 00:30:06,850 --> 00:30:11,500 Når jeg taler med vores forskere og vores fakultet og sige, 521 00:30:11,500 --> 00:30:14,180 hey, jeg kan køre opbevaring for dig. 522 00:30:14,180 --> 00:30:17,690 Desværre, jeg er nødt til få omkostningerne ved opbevaring. 523 00:30:17,690 --> 00:30:19,430 Jeg får denne forretning. 524 00:30:19,430 --> 00:30:23,300 Og folk referere Newegg eller de refererer Staples 525 00:30:23,300 --> 00:30:27,040 eller hvor meget de kan købe en enkelt terabyte disk drev til. 526 00:30:27,040 --> 00:30:29,390 >> Så dette, vil du bemærke her, at der er et fingerpeg. 527 00:30:29,390 --> 00:30:31,310 Der er én disk her. 528 00:30:31,310 --> 00:30:33,290 Og hvis vi går tilbage, jeg har mange. 529 00:30:33,290 --> 00:30:36,130 Ikke alene har jeg har mange, jeg har sofistikerede interconnects 530 00:30:36,130 --> 00:30:38,750 at være i stand til at sy disse ting sammen. 531 00:30:38,750 --> 00:30:44,080 Så risikoen forbundet med disse store storagesystemer er ikke ubetydelig. 532 00:30:44,080 --> 00:30:46,370 >> Faktisk tog vi til internet og vi skrev 533 00:30:46,370 --> 00:30:51,670 en lille historie om en velmenende, blide direktør for forskning 534 00:30:51,670 --> 00:30:54,640 computing-- tilfældigvis har en mærkeligt engelsk accent-- forsøger 535 00:30:54,640 --> 00:30:59,930 at forklare en forsker hvad ingen understregning backup mappe faktisk 536 00:30:59,930 --> 00:31:01,070 betød. 537 00:31:01,070 --> 00:31:05,690 Det var en ganske lang, lille historie, godt fire minutter af Discovery. 538 00:31:05,690 --> 00:31:09,380 >> Og bemærk, jeg har en frygtelig meget mindre plads end damen 539 00:31:09,380 --> 00:31:11,800 der synger om alle bassen. 540 00:31:11,800 --> 00:31:13,910 Vi er et par konti lavere. 541 00:31:13,910 --> 00:31:16,160 Men alligevel, det er en vigtig ting at tænke på, 542 00:31:16,160 --> 00:31:18,532 i form af, hvad der kunne gå galt. 543 00:31:18,532 --> 00:31:20,990 Så hvis jeg får et diskdrev, og Jeg smider det i en Unix maskine, 544 00:31:20,990 --> 00:31:24,300 og jeg begynder at skrive ting til det, der er en magnet, der er et drev hoved, 545 00:31:24,300 --> 00:31:30,150 der er angiveligt, et ettal eller et nul bliver skrevet ned på til denne enhed. 546 00:31:30,150 --> 00:31:32,180 >> Motors-- Spinny, Twirly tingene altid bryde. 547 00:31:32,180 --> 00:31:33,490 Tænk over ting, der bryder. 548 00:31:33,490 --> 00:31:35,170 Det har altid været Spinny, Twirly ting. 549 00:31:35,170 --> 00:31:38,560 Printere, diskdrev, motorkøretøjer mv 550 00:31:38,560 --> 00:31:40,590 Alt, hvad der bevæger sig, er tilbøjelige til at bryde. 551 00:31:40,590 --> 00:31:42,575 >> Så du har brug for motorer, du brug drev firmware, 552 00:31:42,575 --> 00:31:47,110 du har brug for SAS / SATA controllere, ledninger, firmware på SAS / SATA-controllere, 553 00:31:47,110 --> 00:31:48,530 blokerer lavt niveau. 554 00:31:48,530 --> 00:31:54,580 Vælg din storage controller-fil Systemet kode, alt efter hvilken en det kan være, 555 00:31:54,580 --> 00:31:56,780 hvordan du sy ting sammen. 556 00:31:56,780 --> 00:32:00,956 Og din virtuelle hukommelse leder sider, DRAM hente og butikker. 557 00:32:00,956 --> 00:32:02,705 Derefter får du en anden stack, hvilket er lidt 558 00:32:02,705 --> 00:32:05,440 dun listen på denne én, algoritmer brugere. 559 00:32:05,440 --> 00:32:09,050 >> Og hvis du ganger dette op, jeg ved ikke hvor mange, 560 00:32:09,050 --> 00:32:11,640 der er en masse steder hvor ting kan gå sidelæns. 561 00:32:11,640 --> 00:32:14,430 Jeg mener, det er et eksempel om matematik. 562 00:32:14,430 --> 00:32:18,070 Men det er lidt sjovt at tænke på hvor mange måder tingene kunne gå galt, 563 00:32:18,070 --> 00:32:21,650 bare for et diskdrev. 564 00:32:21,650 --> 00:32:25,440 Vi er allerede ved 300 petabyte, så forestille antallet af diskdrev 565 00:32:25,440 --> 00:32:27,741 du har brug for ved 300 petabyte der kan gå galt. 566 00:32:27,741 --> 00:32:28,240 567 00:32:28,240 --> 00:32:30,390 Ikke kun at-- så det er opbevaring. 568 00:32:30,390 --> 00:32:34,220 Og der hentyder til person, jeg vil gerne se 569 00:32:34,220 --> 00:32:38,780 indtaste fase venstre, som er Chaos Monkey. 570 00:32:38,780 --> 00:32:43,140 Så på et bestemt tidspunkt, det bliver endnu større end diskdrevet 571 00:32:43,140 --> 00:32:43,920 problem. 572 00:32:43,920 --> 00:32:50,610 >> Og så disse fine damer og herre at køre en streaming video service 573 00:32:50,610 --> 00:32:55,430 indså, at deres computere var også enorme og også meget kompliceret 574 00:32:55,430 --> 00:33:00,010 og også yde service til en forfærdelig en masse mennesker. 575 00:33:00,010 --> 00:33:05,180 De har fået 37 millioner members-- og dette dias er måske et år eller så old-- 576 00:33:05,180 --> 00:33:07,350 tusinder af enheder. 577 00:33:07,350 --> 00:33:10,810 Der er milliarder af timers video. 578 00:33:10,810 --> 00:33:13,600 De logger milliarder af begivenheder om dagen. 579 00:33:13,600 --> 00:33:17,330 >> Og du kan se, de fleste mennesker ser fjernsynet senere på aftenen, 580 00:33:17,330 --> 00:33:19,429 og det langt opvejer alt. 581 00:33:19,429 --> 00:33:21,220 Og så, de ønskede at kunne sørge for 582 00:33:21,220 --> 00:33:24,854 at tjenesten var op og pålidelig og arbejder for dem. 583 00:33:24,854 --> 00:33:27,020 Så de kom op med denne ting kaldet Chaos Monkey. 584 00:33:27,020 --> 00:33:29,000 Det er stykke software der, når du tror 585 00:33:29,000 --> 00:33:34,190 om at tale om titlen af hele denne præsentation, 586 00:33:34,190 --> 00:33:36,530 skala-out betyder, at du skal teste det her. 587 00:33:36,530 --> 00:33:38,585 Det er ikke godt bare at have en million maskiner. 588 00:33:38,585 --> 00:33:40,460 Så det gode ved dette er, Chaos Monkey 589 00:33:40,460 --> 00:33:43,090 er en service, som identificerer grupper af systemer 590 00:33:43,090 --> 00:33:47,220 og tilfældigt opsiger en af systemerne i en gruppe. 591 00:33:47,220 --> 00:33:48,429 Awesome. 592 00:33:48,429 --> 00:33:50,220 Så jeg ved ikke, om dig, men hvis jeg nogensinde har 593 00:33:50,220 --> 00:33:52,990 bygget et system, der bygger på andre systemer tale med hinanden, 594 00:33:52,990 --> 00:33:55,865 du tager en af ​​dem ud, det sandsynligheden for hele ting bearbejdning, 595 00:33:55,865 --> 00:33:57,130 aftager hurtigt. 596 00:33:57,130 --> 00:34:00,475 >> Og så dette stykke software kører omkring Netflix infrastruktur. 597 00:34:00,475 --> 00:34:03,100 Heldigvis står det kører kun i åbningstid med den hensigt 598 00:34:03,100 --> 00:34:05,810 at ingeniører vil være alarm og i stand til at reagere. 599 00:34:05,810 --> 00:34:08,020 Så det er disse typer af ting, vi er nu 600 00:34:08,020 --> 00:34:13,360 at skulle gøre for at forstyrre vores computing miljøer, til at indføre kaos 601 00:34:13,360 --> 00:34:15,739 og at indføre kompleksitet. 602 00:34:15,739 --> 00:34:19,139 >> Så som i deres ret sind, ville gerne vælge 603 00:34:19,139 --> 00:34:22,540 at arbejde med en Chaos Monkey? 604 00:34:22,540 --> 00:34:24,150 Hæng på, han ser ud til at pege mig. 605 00:34:24,150 --> 00:34:28,719 Nå, jeg tror jeg should-- nuttet. 606 00:34:28,719 --> 00:34:32,909 Men problemet er, du ikke får valget. 607 00:34:32,909 --> 00:34:37,440 The Chaos Monkey, som du kan se, vælger dig. 608 00:34:37,440 --> 00:34:42,650 >> Og dette er problemet med computing på skalaen er, at du ikke kan undgå dette. 609 00:34:42,650 --> 00:34:49,989 Det er en uundgåelighed kompleksitet og af handlingens omfang og vores udvikling, 610 00:34:49,989 --> 00:34:53,280 på nogle måder, af computing ekspertise. 611 00:34:53,280 --> 00:34:55,510 Og husk, det er én ting at huske, 612 00:34:55,510 --> 00:35:00,030 Chaos Monkeys kærlighed snowflakes-- kærlighed snefnug. 613 00:35:00,030 --> 00:35:03,470 En snowflake-- vi har forklaret Chaos Monkey-- men et snefnug 614 00:35:03,470 --> 00:35:09,630 er en server, der er unik og særlige og delikat og individuelle 615 00:35:09,630 --> 00:35:11,770 og vil aldrig blive reproduceret. 616 00:35:11,770 --> 00:35:14,790 >> Vi oplever ofte snefnug service i vores miljø. 617 00:35:14,790 --> 00:35:16,700 Og vi altid forsøge at smelte snowflake service. 618 00:35:16,700 --> 00:35:18,880 Men hvis du finder en server i dit miljø 619 00:35:18,880 --> 00:35:23,240 der er afgørende for levetiden af din organisation, og det smelter, 620 00:35:23,240 --> 00:35:25,300 du kan ikke sætte det sammen igen. 621 00:35:25,300 --> 00:35:28,071 Så Chaos Monkey opgave var at gå og afslutte forekomster. 622 00:35:28,071 --> 00:35:30,820 Hvis Chaos Monkey smelter snefnug, du er over, du er færdig. 623 00:35:30,820 --> 00:35:34,390 624 00:35:34,390 --> 00:35:37,950 Jeg ønsker at tale om nogle hardware at vi er 625 00:35:37,950 --> 00:35:40,415 se i form af en slags skala-aktiviteter også. 626 00:35:40,415 --> 00:35:43,810 Og nogle unikke ting, der er i og omkring videnskab aktivitet. 627 00:35:43,810 --> 00:35:46,990 Vi begynder nu at se, huske denne enhed udstedelsesdato, dette rack? 628 00:35:46,990 --> 00:35:51,780 Så dette er et rack af GPGPUs-- så generelle purpose grafik forarbejdning enheder. 629 00:35:51,780 --> 00:35:55,790 >> Vi har disse ligger i vores data center, 100 eller så miles væk. 630 00:35:55,790 --> 00:35:59,780 Denne særlige rack er omkring 96 teraflops 631 00:35:59,780 --> 00:36:04,090 af single-præcision matematik stand at levere til bagsiden af ​​det. 632 00:36:04,090 --> 00:36:10,530 Og vi har orden 130-ulige kort i et tilfælde 633 00:36:10,530 --> 00:36:16,620 at we-- multiple racks af denne instans. 634 00:36:16,620 --> 00:36:22,730 >> Så det er interessant i den forstand, at de almindelige grafik processer 635 00:36:22,730 --> 00:36:27,880 er i stand til at gøre matematik utroligt hurtigt for meget lave mængder af energi. 636 00:36:27,880 --> 00:36:32,060 Så der er en stor uptick i de videnskabelige computing områder, 637 00:36:32,060 --> 00:36:36,400 ser på grafik behandlingsenheder i en stor måde. 638 00:36:36,400 --> 00:36:41,990 >> Så jeg løb nogle Mcollective gennem vores marionet infrastruktur 639 00:36:41,990 --> 00:36:45,330 i går, meget begejstrede for dette. 640 00:36:45,330 --> 00:36:48,260 lige kort for en petaflop af single-præcision. 641 00:36:48,260 --> 00:36:52,440 Bare for at være klar her, dette lille multiplikator er 3,95. 642 00:36:52,440 --> 00:36:54,820 Dobbelt-præcision matematik ville være omkring 1,2, 643 00:36:54,820 --> 00:36:57,010 men min Twitter-feed set måde bedre, hvis jeg 644 00:36:57,010 --> 00:37:02,670 sagde, vi havde næsten en petaflop af single-præcision GPGPUs. 645 00:37:02,670 --> 00:37:04,220 >> Men det bliver der. 646 00:37:04,220 --> 00:37:06,280 Det bliver at være meget, meget imponerende. 647 00:37:06,280 --> 00:37:08,550 Og hvorfor gør vi det? 648 00:37:08,550 --> 00:37:11,570 Fordi kvantekemi, bl.a. 649 00:37:11,570 --> 00:37:15,300 men vi er begyndt at designe nogle nye solceller. 650 00:37:15,300 --> 00:37:20,210 >> Og så Alan Aspuru-Guzik, der er en professor i chemistry-- min partner 651 00:37:20,210 --> 00:37:22,390 i crime-- for de sidste par år. 652 00:37:22,390 --> 00:37:25,660 Vi har været at skubbe kuvert på computing. 653 00:37:25,660 --> 00:37:30,250 Og GPGPU er ideel teknologi at være i stand til at gøre 654 00:37:30,250 --> 00:37:34,760 en frygtelig masse komplicerede matematik, meget, meget hurtigt. 655 00:37:34,760 --> 00:37:36,750 >> Så med skala, kommer nye udfordringer. 656 00:37:36,750 --> 00:37:41,070 Så stort scale-- du være forsigtig med, hvordan du wire det her. 657 00:37:41,070 --> 00:37:45,300 Og vi har et vist niveau af obsessiv-kompulsiv lidelse. 658 00:37:45,300 --> 00:37:49,530 Disse billeder sandsynligvis køre en masse mennesker nødder. 659 00:37:49,530 --> 00:37:53,390 Og frysere, der ikke er wired særlig godt 660 00:37:53,390 --> 00:37:56,050 drive vores netværk og Faciliteter ingeniører nødder. 661 00:37:56,050 --> 00:37:58,620 Plus der er også luftstrømmen problemer, som du er nødt til at indeholde. 662 00:37:58,620 --> 00:38:01,430 >> Så det er ting, som jeg ville aldrig have tænkt på. 663 00:38:01,430 --> 00:38:03,480 Med skala, kommer mere kompleksitet. 664 00:38:03,480 --> 00:38:05,869 Dette er en ny type filsystem. 665 00:38:05,869 --> 00:38:06,410 Det er awesome. 666 00:38:06,410 --> 00:38:07,660 Det er en petabyte. 667 00:38:07,660 --> 00:38:09,905 Det kan gemme 1,1 milliarder filer. 668 00:38:09,905 --> 00:38:15,940 Den kan læse og skrive til 13 gigabyte og 20 gigabyte en second-- gigabyte 669 00:38:15,940 --> 00:38:17,150 et sekund. 670 00:38:17,150 --> 00:38:20,900 Så det kan losse terabyte på ingen tid overhovedet. 671 00:38:20,900 --> 00:38:22,070 >> Og det er meget tilgængelig. 672 00:38:22,070 --> 00:38:26,989 Og det har fået fantastisk opslag rates-- 220.000 Opslag et sekund. 673 00:38:26,989 --> 00:38:29,780 Og der er mange forskellige mennesker opbygge den slags systemer. 674 00:38:29,780 --> 00:38:32,830 Og du kan se det her grafisk. 675 00:38:32,830 --> 00:38:35,800 Dette er en af ​​vores filsystemer det er under belastning, helt 676 00:38:35,800 --> 00:38:41,250 lykkeligt læser på lige kort 22 gigabytes i sekundet. 677 00:38:41,250 --> 00:38:42,790 Så det er cool-- så kompleksitet. 678 00:38:42,790 --> 00:38:47,230 >> Så med kompleksiteten og omfanget, kommer mere kompleksitet, ikke? 679 00:38:47,230 --> 00:38:51,830 Dette er en af ​​vores mange, mange netværk diagrammer, 680 00:38:51,830 --> 00:38:54,970 hvor du har mange forskellige chassis alle understøtter op 681 00:38:54,970 --> 00:38:57,730 ind i en vigtigste core switch, tilsluttet opbevaring, 682 00:38:57,730 --> 00:39:00,731 tilslutning til lav latency interconnects. 683 00:39:00,731 --> 00:39:03,605 Og så alt dette side af hus, er bare alt af forvaltningen 684 00:39:03,605 --> 00:39:09,740 at du skal være i stand til at løse disse systemer fra en fjernplacering. 685 00:39:09,740 --> 00:39:12,070 Så skala har en masse kompleksitet med det. 686 00:39:12,070 --> 00:39:14,910 687 00:39:14,910 --> 00:39:17,785 >> Skift gear igen, lad os gå tilbage og har en lille plet af videnskaben. 688 00:39:17,785 --> 00:39:21,450 Så husk, forskning computing og denne lille shim-- 689 00:39:21,450 --> 00:39:25,310 lille lyserød shim mellem fakulteter og alle deres algoritmer 690 00:39:25,310 --> 00:39:30,650 og alle cool videnskab og alle denne strøm og køling og datacenter 691 00:39:30,650 --> 00:39:35,330 gulv og netværk og store computere og service skriveborde og helpdeske 692 00:39:35,330 --> 00:39:39,330 og så forth-- og så er vi bare denne lille shim mellem dem. 693 00:39:39,330 --> 00:39:42,820 >> Hvad vi er begyndt at Se er, at verdens 694 00:39:42,820 --> 00:39:45,730 været i stand til at bygge disse store datacentre 695 00:39:45,730 --> 00:39:48,020 og være i stand til at bygge disse store computere. 696 00:39:48,020 --> 00:39:49,420 Vi har fået temmelig god til det. 697 00:39:49,420 --> 00:39:53,600 Hvad vi er ikke særlig god til, er dette lidt shim mellem forskning 698 00:39:53,600 --> 00:39:56,670 og pladen, og teknologien. 699 00:39:56,670 --> 00:39:58,600 Og det er svært. 700 00:39:58,600 --> 00:40:03,330 >> Og så har vi været i stand til at ansætte folk, der lever i denne verden. 701 00:40:03,330 --> 00:40:07,590 Og for nylig, vi talte til National Science Foundation og sagde: 702 00:40:07,590 --> 00:40:11,440 denne skala-out ting er stor, men vi kan ikke få vores forskere 703 00:40:11,440 --> 00:40:13,690 på disse store komplicerede maskiner. 704 00:40:13,690 --> 00:40:16,040 Og så, har der været en Antallet af forskellige programmer 705 00:40:16,040 --> 00:40:20,100 hvor vi virkelig var for det meste bekymret om at forsøge 706 00:40:20,100 --> 00:40:22,800 at se, om vi kunne transformere campus infrastruktur. 707 00:40:22,800 --> 00:40:25,850 >> Der er en masse programmer omkring nationale centre. 708 00:40:25,850 --> 00:40:28,300 Og så, os selv, vores venner på Clemson, 709 00:40:28,300 --> 00:40:32,620 University of Wisconsin, Madison, Southern California, Utah, og Hawaii 710 00:40:32,620 --> 00:40:35,780 slags fik sammen til se på dette problem. 711 00:40:35,780 --> 00:40:39,340 Og denne lille graf her er den lange hale af videnskaben. 712 00:40:39,340 --> 00:40:41,602 >> Så dette is-- det ikke Uanset hvad der er på denne akse, 713 00:40:41,602 --> 00:40:45,485 men denne akse er faktisk nummer arbejdspladser går gennem klyngen. 714 00:40:45,485 --> 00:40:48,940 Så der er 350.000 i løbet af uanset tidsperiode. 715 00:40:48,940 --> 00:40:51,730 Disse er vores sædvanlige mistænkte langs bunden her. 716 00:40:51,730 --> 00:40:55,992 Faktisk er der er Alan Aspuru-Guzik, som vi bare taler om-- tons 717 00:40:55,992 --> 00:40:58,700 og tonsvis af beregne, virkelig effektiv, ved, hvad han gør. 718 00:40:58,700 --> 00:41:02,840 >> Her er en anden lab, som jeg vil tale om i en moment-- John Kovac laboratorium. 719 00:41:02,840 --> 00:41:03,610 De har fået det. 720 00:41:03,610 --> 00:41:04,210 De er gode. 721 00:41:04,210 --> 00:41:04,830 De er glade. 722 00:41:04,830 --> 00:41:05,960 De er computing. 723 00:41:05,960 --> 00:41:07,664 Stor videnskab er at få gjort. 724 00:41:07,664 --> 00:41:09,580 Og så, som du slags af komme herned, der 725 00:41:09,580 --> 00:41:12,110 er andre grupper, kører ikke mange arbejdspladser. 726 00:41:12,110 --> 00:41:13,410 >> Og hvorfor er det? 727 00:41:13,410 --> 00:41:15,080 Er det, fordi computing er for hårdt? 728 00:41:15,080 --> 00:41:19,580 Er det fordi de ikke ved, hvordan man? 729 00:41:19,580 --> 00:41:22,880 Vi ved det ikke, fordi vi har gået og kigget. 730 00:41:22,880 --> 00:41:25,620 Og så det er hvad dette Projektet handler om, 731 00:41:25,620 --> 00:41:27,830 er lokalt, inden hver af disse regioner, 732 00:41:27,830 --> 00:41:32,660 at se til veje, hvor vi kan engagere med fakultetet og forskere 733 00:41:32,660 --> 00:41:36,400 faktisk i den nederste ende af halen, og forstå, hvad de laver. 734 00:41:36,400 --> 00:41:37,920 >> Så det er noget, som vi er faktisk brænder for. 735 00:41:37,920 --> 00:41:39,920 Og det er noget, videnskaben ikke vil fortsætte 736 00:41:39,920 --> 00:41:44,260 til at bevæge sig fremad, indtil vi løser nogle af disse kant tilfælde. 737 00:41:44,260 --> 00:41:46,590 Andre bits videnskab der kommer up-- alle 738 00:41:46,590 --> 00:41:48,260 set Large Hadron Collider. 739 00:41:48,260 --> 00:41:49,540 Awesome, ikke? 740 00:41:49,540 --> 00:41:52,960 Denne ting alle løb ud på Holyoke. 741 00:41:52,960 --> 00:41:56,510 Vi Bygget- den allerførste videnskab, der skete i Holyoke 742 00:41:56,510 --> 00:41:59,130 var samarbejdet mellem os selv og Boston University. 743 00:41:59,130 --> 00:42:01,510 Så det er virkelig, virkelig cool. 744 00:42:01,510 --> 00:42:04,410 >> Dette er en sjov stykke videnskab for skalaen. 745 00:42:04,410 --> 00:42:07,650 Dette er en digital adgang til en himmel århundrede på Harvard. 746 00:42:07,650 --> 00:42:09,170 Dybest set er det en plade arkiv. 747 00:42:09,170 --> 00:42:13,350 Hvis du går ned Oxford-- Garden Street, undskyld, 748 00:42:13,350 --> 00:42:16,560 finder du en af ​​observatoriet bygninger er dybest set fuld 749 00:42:16,560 --> 00:42:19,480 af omkring en halv million plader. 750 00:42:19,480 --> 00:42:24,410 >> Og disse er billeder af himlen om natten, over 100 år. 751 00:42:24,410 --> 00:42:28,760 Så der er en hel rig oprettet her at digitalisere disse plader, 752 00:42:28,760 --> 00:42:32,100 tage billeder af dem, registrere dem, læg dem på en computer. 753 00:42:32,100 --> 00:42:36,410 Og det er en petabyte og et halvt, lige højre there-- én lille projekt. 754 00:42:36,410 --> 00:42:37,530 >> Disse er andre projekter. 755 00:42:37,530 --> 00:42:42,800 Dette Pan-Starrs-projektet gør en fuld bred panoramisk undersøgelse 756 00:42:42,800 --> 00:42:47,390 søger tæt asteroider Earth og forbigående himmelske begivenheder. 757 00:42:47,390 --> 00:42:52,100 Som en molekylær biofysiker, jeg elsker ordet forbigående himmelsk begivenhed. 758 00:42:52,100 --> 00:42:55,050 Jeg er ikke helt sikker på, hvad det er, men alligevel, er vi på udkig efter dem. 759 00:42:55,050 --> 00:43:00,372 >> Og vi genererer 30 terabyte en nat ud af disse teleskoper. 760 00:43:00,372 --> 00:43:03,330 Og det er egentlig ikke en båndbredde problem, det er ligesom en FedEx problem. 761 00:43:03,330 --> 00:43:08,420 Så du sætte opbevaring på van og du sender det uanset hvad det er. 762 00:43:08,420 --> 00:43:10,570 >> BICEP er virkelig interesting-- så baggrund imaging 763 00:43:10,570 --> 00:43:13,850 af kosmisk ekstra galaktiske polarisering. 764 00:43:13,850 --> 00:43:16,880 Da jeg først begyndte at arbejde ved Harvard syv eller deromkring, 765 00:43:16,880 --> 00:43:21,440 otte år siden, husker jeg arbejdet på dette projekt 766 00:43:21,440 --> 00:43:26,010 og det gjorde ikke rigtig synke hjem, hvorfor polariseret lys 767 00:43:26,010 --> 00:43:29,770 fra den kosmiske mikrobølge baggrund ville være vigtigt, 768 00:43:29,770 --> 00:43:30,800 indtil dette skete. 769 00:43:30,800 --> 00:43:34,580 >> Og det var John Kovac, hvem jeg talte med før, 770 00:43:34,580 --> 00:43:42,030 hjælp millioner og atter millioner af CPU timer, i vores anlæg og andre, 771 00:43:42,030 --> 00:43:46,600 at stort set stirre ind i det indre af universets første øjeblikke 772 00:43:46,600 --> 00:43:49,150 efter Big Bang, og forsøger at forstå 773 00:43:49,150 --> 00:43:51,290 Einsteins almene relativitetsteori. 774 00:43:51,290 --> 00:43:56,040 Det er sindet blæser, at vores computere hjælper os udrede og stirre 775 00:43:56,040 --> 00:43:59,280 i selve oprindelsen af, hvorfor vi er her. 776 00:43:59,280 --> 00:44:03,450 >> Så når du taler om skala, dette er nogle alvorlige skala. 777 00:44:03,450 --> 00:44:09,260 Den anden ting af skalaen er, at bestemt projekt ramte disse fyre. 778 00:44:09,260 --> 00:44:15,320 Og det er svaret kurven for BICEP [Uhørligt] Dette var vores lille undersøgelse. 779 00:44:15,320 --> 00:44:19,220 >> Og du kan se her, livet var godt indtil omkring her, 780 00:44:19,220 --> 00:44:21,200 der var da Meddelelsen kom ud. 781 00:44:21,200 --> 00:44:24,120 Og du har fået bogstaveligt sekunder til at reagere 782 00:44:24,120 --> 00:44:29,020 til skalering begivenhed, som svarer til denne lille prik her, 783 00:44:29,020 --> 00:44:32,200 som endte skiftende fire eller så terabyte data 784 00:44:32,200 --> 00:44:36,370 gennem webserveren der day-- temmelig behåret. 785 00:44:36,370 --> 00:44:38,210 >> Og så, disse er de typer af ting, 786 00:44:38,210 --> 00:44:43,040 kan ske for dig i din infrastruktur hvis du ikke designe for skala. 787 00:44:43,040 --> 00:44:45,630 Vi havde lidt af en kryptere den dag, for at være 788 00:44:45,630 --> 00:44:50,440 i stand til at spænde sig nok web service at holde sitet oppe at køre. 789 00:44:50,440 --> 00:44:53,399 Og vi var en succes. 790 00:44:53,399 --> 00:44:55,190 Dette er en lille email der er slags søde. 791 00:44:55,190 --> 00:45:00,245 Dette er en mail til Mark Vogelsberger, og Lars Hernquist, der er 792 00:45:00,245 --> 00:45:02,650 et fakultet medlem her på Harvard. 793 00:45:02,650 --> 00:45:03,570 Mere om Mark senere. 794 00:45:03,570 --> 00:45:05,990 Men jeg tror, ​​det er en slags opsummerer slags 795 00:45:05,990 --> 00:45:09,920 hvor computing er i forskning computing. 796 00:45:09,920 --> 00:45:12,070 Hey, hold, siden sidste Tirsdag jer martret op 797 00:45:12,070 --> 00:45:15,470 over 28% af de nye klynge, der kombinerede 798 00:45:15,470 --> 00:45:20,040 er over 78 år CPU på bare tre dage. 799 00:45:20,040 --> 00:45:22,502 Og jeg sagde, er det stadig kun lige fredag ​​morgen. 800 00:45:22,502 --> 00:45:23,460 Dette er temmelig awesome! 801 00:45:23,460 --> 00:45:24,740 Glad fredag! 802 00:45:24,740 --> 00:45:27,450 >> Så jeg giver dem datapunkterne. 803 00:45:27,450 --> 00:45:30,260 Og så var slags interessant. 804 00:45:30,260 --> 00:45:34,840 Så huske om Mark, vil han komme tilbage i billedet i en lille smule. 805 00:45:34,840 --> 00:45:36,935 Så skala-out computing er overalt. 806 00:45:36,935 --> 00:45:41,080 >> Vi endda hjælpe folk ser på, hvordan NBA funktioner 807 00:45:41,080 --> 00:45:43,140 og hvor folk er kaste bolde fra. 808 00:45:43,140 --> 00:45:47,580 Jeg forstår ikke rigtig dette spil også godt, men tilsyneladende er det en big deal. 809 00:45:47,580 --> 00:45:50,610 Der er bøjler og skåle og penge. 810 00:45:50,610 --> 00:45:55,300 >> Og så, i vores database, vi bygget lidt 500 [uhørligt] 811 00:45:55,300 --> 00:45:58,170 parallel processor klynge, et par terabytes af RAM, 812 00:45:58,170 --> 00:46:03,590 at være i stand til at bygge denne for Kirk og hans team. 813 00:46:03,590 --> 00:46:08,524 Og de laver computing på en helt anden måde. 814 00:46:08,524 --> 00:46:10,440 Nu er det projekt vi er involveret med det er 815 00:46:10,440 --> 00:46:14,880 absolut fascinerende, omkring neurale plasticitet connectomics og genomisk 816 00:46:14,880 --> 00:46:20,960 imprinting-- tre meget tunge rammer forskningsområder 817 00:46:20,960 --> 00:46:24,650 at vi kæmper med på en dag-til-dag basis. 818 00:46:24,650 --> 00:46:30,670 Tanken om, at vores hjerner er under plast stress, når vi er unge. 819 00:46:30,670 --> 00:46:34,980 Og meget af vores voksne adfærd er modelleret af erfaring i barndom. 820 00:46:34,980 --> 00:46:37,040 Så dette er en stor dealio. 821 00:46:37,040 --> 00:46:41,360 >> Og så dette er arbejde, der er finansieret af National Institutes of Mental Health. 822 00:46:41,360 --> 00:46:46,860 Og vi forsøger at dybest set, gennem en masse store data 823 00:46:46,860 --> 00:46:51,970 og store dataanalyse, art af peer ind i vores menneskelige hjerne 824 00:46:51,970 --> 00:46:54,870 gennem en række forskellige teknikker. 825 00:46:54,870 --> 00:47:00,360 >> Så jeg ønskede at stoppe og art bare stoppe op et lille øjeblik. 826 00:47:00,360 --> 00:47:04,160 Udfordringen med fjernbetjening datacentre er det er langt væk. 827 00:47:04,160 --> 00:47:05,520 Det kan ikke gøre arbejdet. 828 00:47:05,520 --> 00:47:07,590 Jeg har brug for mine data nærheden. 829 00:47:07,590 --> 00:47:10,730 Jeg har brug for at gøre min forskning i mit laboratorium. 830 00:47:10,730 --> 00:47:18,620 >> Og så jeg slags tog et eksempel på en funktionel magnetisk resonans 831 00:47:18,620 --> 00:47:22,260 datasæt fra vores data center i det vestlige Mass. 832 00:47:22,260 --> 00:47:24,660 og sluttet den til min desktop i Cambridge. 833 00:47:24,660 --> 00:47:27,440 Og jeg vil spille denne lille video. 834 00:47:27,440 --> 00:47:29,750 Forhåbentlig vil det slags arbejde. 835 00:47:29,750 --> 00:47:33,480 >> Så dette er mig gå igennem kontrol min GPU'er arbejder. 836 00:47:33,480 --> 00:47:35,430 Og jeg kontrollere, at VNC er op. 837 00:47:35,430 --> 00:47:36,810 Og det er en klog VNC. 838 00:47:36,810 --> 00:47:38,970 Dette er en VNC med 3D stykker. 839 00:47:38,970 --> 00:47:41,975 Og så, som du kan se om kort tid, dette er mig spinning denne hjerne rundt. 840 00:47:41,975 --> 00:47:44,460 Jeg forsøger at slags få det rettet. 841 00:47:44,460 --> 00:47:49,574 Og så kan jeg flytte gennem mange forskellige skiver af MRI data. 842 00:47:49,574 --> 00:47:51,490 Og det eneste, der er anderledes om dette 843 00:47:51,490 --> 00:47:55,160 er, det kommer over tråden fra Western Mass. til mit skrivebord. 844 00:47:55,160 --> 00:47:57,300 Og dens rendering hurtigere end mit skrivebord, 845 00:47:57,300 --> 00:48:02,840 fordi jeg ikke har en $ 4000 grafikkort i mit skrivebord, som 846 00:48:02,840 --> 00:48:04,262 Vi har ud Western Mass. 847 00:48:04,262 --> 00:48:05,720 Selvfølgelig, jeg forsøger at være klog. 848 00:48:05,720 --> 00:48:08,859 Jeg kører GLX gear i baggrund, samtidig gør alt dette, 849 00:48:08,859 --> 00:48:10,900 at sikre, at jeg kan understrege grafikkort, 850 00:48:10,900 --> 00:48:14,140 og at det alle slags fungerer og alle resten af ​​det. 851 00:48:14,140 --> 00:48:16,700 Men det vigtige er, er det 100 miles væk. 852 00:48:16,700 --> 00:48:20,460 Og du kan se fra dette, at der er ingen indlysende ventetid. 853 00:48:20,460 --> 00:48:24,600 Ting holder sammen ganske godt. 854 00:48:24,600 --> 00:48:28,907 >> Og så, i sig selv, er et eksempel og en vis indsigt 855 00:48:28,907 --> 00:48:31,490 i, hvordan computing og skala-out computing kommer til at ske. 856 00:48:31,490 --> 00:48:35,330 Vi arbejder alle på tyndere og tyndere enheder. 857 00:48:35,330 --> 00:48:36,870 Vores anvendelse af tabletter er stigende. 858 00:48:36,870 --> 00:48:39,160 >> Så derfor, min carbon fodaftryk er dybest set 859 00:48:39,160 --> 00:48:42,060 flytter fra hvad bruges at gøre det ville har 860 00:48:42,060 --> 00:48:46,060 været en stor maskine under mit skrivebord, hvad 861 00:48:46,060 --> 00:48:49,550 er nu en facility-- kunne være overalt. 862 00:48:49,550 --> 00:48:50,800 Det kunne være hvor som helst overhovedet. 863 00:48:50,800 --> 00:48:54,790 Og alligevel er det stadig i stand til at bringe Tilbage højtydende grafik 864 00:48:54,790 --> 00:48:56,630 til mit skrivebord. 865 00:48:56,630 --> 00:49:00,900 >> Så at komme i nærheden af end-- husk Mark? 866 00:49:00,900 --> 00:49:04,480 Nå, smart dreng er Mark. 867 00:49:04,480 --> 00:49:09,360 Han besluttede, at han ville opbygge en realistisk virtuelle univers. 868 00:49:09,360 --> 00:49:12,820 Det er noget af en projekt, når du tror, ​​du bliver nødt til at pitche dette. 869 00:49:12,820 --> 00:49:14,740 Jeg har tænkt mig at bruge en computer, og jeg har tænkt mig 870 00:49:14,740 --> 00:49:21,040 at modellere de 12 millioner år efter Big Bang til at repræsentere en dag. 871 00:49:21,040 --> 00:49:27,080 Og så jeg har tænkt mig at gøre 13,8 milliard års kosmisk evolution. 872 00:49:27,080 --> 00:49:28,270 Ok. 873 00:49:28,270 --> 00:49:30,970 >> Dette faktisk anvender en computer det var større end vores computer, 874 00:49:30,970 --> 00:49:35,040 og det spildt over på den nationale ressourcer til vores venner nede i Texas. 875 00:49:35,040 --> 00:49:38,820 Og til de nationale anlæg, dette var en masse beregne. 876 00:49:38,820 --> 00:49:40,750 Men vi gjorde en masse simuleringen lokalt 877 00:49:40,750 --> 00:49:44,820 for at sikre, at softwaren arbejdede og systemerne virkede. 878 00:49:44,820 --> 00:49:47,790 >> Og det er dage som denne, når du indse, at du støtter videnskab 879 00:49:47,790 --> 00:49:51,090 på dette niveau af skalaen, at folk kan nu sige ting 880 00:49:51,090 --> 00:49:52,840 ligesom, jeg har tænkt mig at en model et univers. 881 00:49:52,840 --> 00:49:54,145 Og dette er hans første model. 882 00:49:54,145 --> 00:49:56,422 Og dette er hans holdets første model. 883 00:49:56,422 --> 00:49:58,130 Der er mange andre folk, der går 884 00:49:58,130 --> 00:50:01,520 til at komme bag Mark, der kommer til ønsker at modellere med høj opløsning, 885 00:50:01,520 --> 00:50:04,652 med mere specificitet, med større nøjagtighed. 886 00:50:04,652 --> 00:50:09,105 >> Og så, i de sidste par minutter, Jeg vil bare gerne vise dig denne video 887 00:50:09,105 --> 00:50:15,270 Mark og Lars er at for mig, igen, som et liv videnskabsmand, er slags søde. 888 00:50:15,270 --> 00:50:17,890 889 00:50:17,890 --> 00:50:20,970 Så dette nederst her, at orientere dig, 890 00:50:20,970 --> 00:50:23,640 dette er at fortælle dig det gang siden Big Bang. 891 00:50:23,640 --> 00:50:26,570 Så vi er på omkring 0,7 milliarder år. 892 00:50:26,570 --> 00:50:28,740 Og det viser den aktuelle opdatering. 893 00:50:28,740 --> 00:50:33,450 Så du ser i øjeblikket, mørkt stof og udviklingen 894 00:50:33,450 --> 00:50:39,910 af den fine struktur og tidlig strukturer i vores kendte univers. 895 00:50:39,910 --> 00:50:45,690 >> Og punktet med dette er, at denne er alle gjort inde i computeren. 896 00:50:45,690 --> 00:50:48,530 Dette er et sæt af parametre og et sæt af fysik 897 00:50:48,530 --> 00:50:52,840 og et sæt af matematik og et sæt af modeller 898 00:50:52,840 --> 00:50:59,284 der er nøje udvalgt, og derefter omhyggeligt forbundet til hinanden 899 00:50:59,284 --> 00:51:00,825 at være i stand til at modellere interaktioner. 900 00:51:00,825 --> 00:51:04,850 >> Så du kan se nogle starter på nogle gasformige eksplosioner her. 901 00:51:04,850 --> 00:51:06,880 Og gas temperatur er under forandring. 902 00:51:06,880 --> 00:51:13,720 Og du kan begynde at se strukturen af det synlige univers forandring. 903 00:51:13,720 --> 00:51:18,130 Og den vigtige del i denne er, hver lille lille, lille, lille prik 904 00:51:18,130 --> 00:51:21,070 er et stykke fysik og har et sæt af matematik rundt, 905 00:51:21,070 --> 00:51:23,030 oplyser sine ven og nabo. 906 00:51:23,030 --> 00:51:27,245 >> Så fra en skalering perspektiv disse computere har til alt arbejde i koncert 907 00:51:27,245 --> 00:51:29,470 og tale med hinanden effektivt. 908 00:51:29,470 --> 00:51:31,060 Så de kan ikke være for chatty. 909 00:51:31,060 --> 00:51:33,520 De skal opbevare deres resultater. 910 00:51:33,520 --> 00:51:37,902 Og de skal fortsætte med at informere alle deres venner. 911 00:51:37,902 --> 00:51:40,860 Faktisk vil du se nu, denne model er bliver mere og mere kompliceret. 912 00:51:40,860 --> 00:51:42,590 Der er mere og mere ting foregår. 913 00:51:42,590 --> 00:51:45,210 Der er mere og mere materiale flyver rundt. 914 00:51:45,210 --> 00:51:48,410 >> Og dette er, hvad den tidlige kosmos ville have set ud. 915 00:51:48,410 --> 00:51:49,770 Det var en temmelig behåret sted. 916 00:51:49,770 --> 00:51:55,140 Der er eksplosioner overalt stedet, kraftige kollisioner. 917 00:51:55,140 --> 00:51:58,620 Og dannelse af tunge metaller og elementer. 918 00:51:58,620 --> 00:52:03,910 Og disse store skyer smadrer ind hinanden med stor kraft. 919 00:52:03,910 --> 00:52:08,530 >> Og så nu er vi 9,6 mia år fra denne første eksplosion. 920 00:52:08,530 --> 00:52:12,310 Du begynder at se tingene er slags dulmer lidt, bare 921 00:52:12,310 --> 00:52:15,660 en lille smule, fordi energi begynder at slappe af. 922 00:52:15,660 --> 00:52:19,420 Og så den matematiske modeller har fået det i stedet. 923 00:52:19,420 --> 00:52:22,510 Og du begynder at se sammensmeltning af forskellige elementer. 924 00:52:22,510 --> 00:52:26,220 Og begynder at se denne ting slags af mødes og langsomt cool. 925 00:52:26,220 --> 00:52:32,260 >> Og det er begyndt at se en lille smule mere som nattehimlen, en lille smule. 926 00:52:32,260 --> 00:52:37,870 Og det er [? QSing. ?] Vi er nu 30,2 milliarder år, og vi er slags færdig. 927 00:52:37,870 --> 00:52:41,130 Og så det, de gjorde, var at de tog denne model, 928 00:52:41,130 --> 00:52:44,580 og så på det synlige univers. 929 00:52:44,580 --> 00:52:48,560 Og dybest set så, var i stand til at tage det og overlay 930 00:52:48,560 --> 00:52:50,580 det med det, du kan se. 931 00:52:50,580 --> 00:52:56,160 Og troskab er overvældende, som til hvordan præcis de computermodeller er. 932 00:52:56,160 --> 00:52:58,760 >> Naturligvis de astrofysikere og forskergrupperne 933 00:52:58,760 --> 00:53:02,780 brug for endnu bedre fidelity og endnu højere opløsning. 934 00:53:02,780 --> 00:53:06,230 Men hvis du tænker over det, Jeg har talt til dig 935 00:53:06,230 --> 00:53:11,850 gennem denne lille rejse gennem både opbevaring og struktur og netværk 936 00:53:11,850 --> 00:53:18,000 og stakke, det vigtige er, er skala-out computing afgørende? 937 00:53:18,000 --> 00:53:22,050 Det var min oprindelige hypothesis-- tilbage til vores videnskabelige metode. 938 00:53:22,050 --> 00:53:24,810 >> Jeg håber, at der på de tidlige en del af dette vil jeg 939 00:53:24,810 --> 00:53:29,400 forudser, at jeg ville være i stand til at forklare til dig om skala-out computing. 940 00:53:29,400 --> 00:53:32,870 Og vi slags testet nogle af disse hypoteser. 941 00:53:32,870 --> 00:53:34,585 Vi gik gennem denne samtale. 942 00:53:34,585 --> 00:53:38,920 Og jeg vil bare sige skala-out computing essential-- åh, 943 00:53:38,920 --> 00:53:42,480 ja, meget ja. 944 00:53:42,480 --> 00:53:44,790 >> Så når du tænker om dine koder, når 945 00:53:44,790 --> 00:53:49,230 du laver de CS50 endelige projekter, når du tænker på din arv 946 00:53:49,230 --> 00:53:52,990 til menneskeheden og de ressourcer, som vi skal være i stand til at køre disse computer 947 00:53:52,990 --> 00:53:56,650 systemer, tænke meget grundigt om flops per watt, 948 00:53:56,650 --> 00:53:58,560 og tænke på Chaos Monkey. 949 00:53:58,560 --> 00:54:02,240 >> Tænk over dine snefnug, gør ikke gøre engangsforanstaltninger, genbrug biblioteker, 950 00:54:02,240 --> 00:54:06,453 opbygge genanvendelige codes-- alle de ting at vejlederne har undervist dig 951 00:54:06,453 --> 00:54:08,630 i denne klasse. 952 00:54:08,630 --> 00:54:11,942 Disse er grundlæggende aspekter. 953 00:54:11,942 --> 00:54:13,150 De er ikke bare tomme ord. 954 00:54:13,150 --> 00:54:15,660 Disse er reelle ting. 955 00:54:15,660 --> 00:54:20,680 >> Og hvis nogen af ​​jer ønsker at følge mig, Jeg er neurotiske med kvidre ting. 956 00:54:20,680 --> 00:54:22,770 Jeg har fået en eller anden måde giver det op. 957 00:54:22,770 --> 00:54:24,960 Men en masse af baggrundsinformation er 958 00:54:24,960 --> 00:54:29,260 på vores forskning computing hjemmeside på rc.fas.harvard.edu. 959 00:54:29,260 --> 00:54:34,010 >> Jeg forsøge at holde en blog op til date med moderne teknologi 960 00:54:34,010 --> 00:54:38,390 og hvordan vi gør distributiv computing og så videre. 961 00:54:38,390 --> 00:54:43,600 Og så vores personale er altid tilgængelige via odybot.org. 962 00:54:43,600 --> 00:54:46,270 Og odybot er vores lille hjælper. 963 00:54:46,270 --> 00:54:49,280 Han har ofte lidt konkurrencer på hans hjemmeside 964 00:54:49,280 --> 00:54:51,630 også, hvor du kan prøve og spotte ham rundt campus. 965 00:54:51,630 --> 00:54:55,200 Han er den venlige lille ansigt forskning computing. 966 00:54:55,200 --> 00:54:59,730 >> Og jeg vil slags wrap deroppe og tak for din tid. 967 00:54:59,730 --> 00:55:05,660 Og jeg håber, du kan huske, at skala-out computing er en ægte vare. 968 00:55:05,660 --> 00:55:08,162 Og der er en masse mennesker der har fået en masse kendte teknik 969 00:55:08,162 --> 00:55:09,370 som vil være i stand til at hjælpe dig. 970 00:55:09,370 --> 00:55:14,330 Og alle held og lykke med dine fremtidige bestræbelser i at gøre 971 00:55:14,330 --> 00:55:18,280 sikker på, at vores computing både skalaer, er højtydende, 972 00:55:18,280 --> 00:55:20,370 og hjælper menneskeheden mere end noget andet. 973 00:55:20,370 --> 00:55:22,850 Så tak for din tid. 974 00:55:22,850 --> 00:55:23,947