1 00:00:00,000 --> 00:00:12,080 2 00:00:12,080 --> 00:00:13,799 >> JAMES CUFF: Hoi, goed middag, iedereen. 3 00:00:13,799 --> 00:00:14,715 Mijn naam is James manchet. 4 00:00:14,715 --> 00:00:18,970 Ik ben de assistent-decaan onderzoek Computing hier aan de Harvard University. 5 00:00:18,970 --> 00:00:24,540 En vandaag ga ik met je praten over waarom scale-out computing is van essentieel belang. 6 00:00:24,540 --> 00:00:26,810 >> Dus ik denk, eerste, wie is deze man? 7 00:00:26,810 --> 00:00:27,750 Waarom ben ik hier? 8 00:00:27,750 --> 00:00:29,200 Waarom ben ik met je praten? 9 00:00:29,200 --> 00:00:33,730 Ik heb een achtergrond in de wetenschappelijke computing en onderzoek computing, 10 00:00:33,730 --> 00:00:38,530 die teruggaat naar de Verenigde Kingdom-- De Wellcome Trust Sanger 11 00:00:38,530 --> 00:00:43,270 Instituut voor de mens genome-- en Vervolgens recentelijk in de Verenigde Staten 12 00:00:43,270 --> 00:00:50,170 werken bij de globale en andere gewaardeerde plaatsen van leren, zoals Harvard. 13 00:00:50,170 --> 00:00:53,930 >> Ik denk dat wat dat werkelijk betekent is dat ik een herstellende moleculaire bio 14 00:00:53,930 --> 00:00:55,740 natuurkundige. 15 00:00:55,740 --> 00:01:01,250 Dus welk recht heb ik te vertellen u over scale-out computergebruik? 16 00:01:01,250 --> 00:01:03,570 Er is een echter. 17 00:01:03,570 --> 00:01:09,530 18 jaar of zo heb ik net gezien het meest dramatische schaalvergroting complexiteit 18 00:01:09,530 --> 00:01:13,570 en de algehele efficiëntie van IT-systemen. 19 00:01:13,570 --> 00:01:18,890 >> Toen ik bezig was mijn promotieonderzoek in Oxford, ik was vrij opgewekt met een 200 megahertz 20 00:01:18,890 --> 00:01:23,830 Silicon Graphics machine met 18 gigabytes aan opslagruimte en een enkele CPU. 21 00:01:23,830 --> 00:01:24,910 De tijden zijn veranderd. 22 00:01:24,910 --> 00:01:29,860 Als je snel vooruit nu, we spinning meer dan 60.000 CPU's hier op Harvard. 23 00:01:29,860 --> 00:01:32,810 Vele andere organisaties spinnen veel meer. 24 00:01:32,810 --> 00:01:37,740 >> De belangrijke afhaalmaaltijd van dit die schaal is nu niet alleen onvermijdelijk, 25 00:01:37,740 --> 00:01:41,910 het is gebeurd en het is zal blijven gebeuren. 26 00:01:41,910 --> 00:01:44,760 Dus laten we, voor een moment, een soort van terugspoelen en zeer snel praten 27 00:01:44,760 --> 00:01:50,530 over wetenschap, mijn favoriet onderwerp, de wetenschappelijke methode. 28 00:01:50,530 --> 00:01:53,180 >> Als u zich bij een wetenschapper te zijn, je moet een paar belangrijke dingen te doen. 29 00:01:53,180 --> 00:01:56,140 Als je deze dingen niet doen je kan zelf een wetenschapper niet overwegen 30 00:01:56,140 --> 00:02:03,250 en je zal moeite hebben de mogelijkheid om begrijpen uw gebied van discipline. 31 00:02:03,250 --> 00:02:07,290 >> Dus in de eerste plaats, zou je formuleren uw vraag, het genereren van je hypothesen, 32 00:02:07,290 --> 00:02:09,289 maar nog belangrijker, je uw results-- voorspellen 33 00:02:09,289 --> 00:02:13,090 je hebt een gok om welke resultaten. 34 00:02:13,090 --> 00:02:19,560 En dan tot slot, je test je hypothese en analyseren van uw resultaten. 35 00:02:19,560 --> 00:02:25,460 >> Deze wetenschappelijke methode is zo uiterst belangrijk in de informatica. 36 00:02:25,460 --> 00:02:28,450 Computing van zowel de voorspelling en de mogelijkheid om uw resultaten te testen 37 00:02:28,450 --> 00:02:33,660 zijn een belangrijk onderdeel van wat we nodig hebben te doen in de wetenschappelijke methode. 38 00:02:33,660 --> 00:02:37,310 Deze voorspellingen en keuringen zijn de echte twee hoekstenen 39 00:02:37,310 --> 00:02:42,350 van de wetenschappelijke methode, en elke vereisen de meest significante vooruitgang 40 00:02:42,350 --> 00:02:45,240 in de moderne berekening. 41 00:02:45,240 --> 00:02:51,210 >> De twee pijlers van de wetenschap zijn dat theorie en voor proeven. 42 00:02:51,210 --> 00:02:54,300 En meer recent, computing is vaak genoemd 43 00:02:54,300 --> 00:02:58,090 als de derde pijler van de wetenschap. 44 00:02:58,090 --> 00:03:01,440 Dus als je leerlingen kijken naar deze, je hebt absoluut geen druk. 45 00:03:01,440 --> 00:03:03,960 46 00:03:03,960 --> 00:03:08,720 Derde pijler van science-- geen groot Deal-- computing, soort belangrijk. 47 00:03:08,720 --> 00:03:14,000 Zo blij dat dit is de computer-onderdeel van de informatica natuurlijk 50. 48 00:03:14,000 --> 00:03:16,220 >> Dus genoeg van de achtergrond. 49 00:03:16,220 --> 00:03:20,226 Ik wil je vertellen het plan van wat we gaan om te praten over vandaag. 50 00:03:20,226 --> 00:03:22,870 Ik ga om te gaan over een aantal geschiedenis. 51 00:03:22,870 --> 00:03:25,250 Ik ga uitleggen waarom we hier kwamen. 52 00:03:25,250 --> 00:03:27,750 Ik ga om te praten over een aantal de geschiedenis van de computer- 53 00:03:27,750 --> 00:03:33,890 hier bij Harvard, sommige activiteiten rond sociale media, 54 00:03:33,890 --> 00:03:36,200 groene things-- zeer over alle dingen gepassioneerd 55 00:03:36,200 --> 00:03:43,640 green-- storage-- computer storage-- hoe chaos beïnvloedt scale-out out-systemen, 56 00:03:43,640 --> 00:03:45,640 en verdelende systemen in het bijzonder. 57 00:03:45,640 --> 00:03:48,473 >> En dan ga ik aan te raken op een aantal van de scale-out hardware dat is 58 00:03:48,473 --> 00:03:51,370 nodig om te kunnen doen computergebruik op schaal. 59 00:03:51,370 --> 00:03:55,830 En dan tot slot, we gaan wrap up met een aantal geweldige wetenschap. 60 00:03:55,830 --> 00:04:00,894 >> Dus, laten we dan een minuut om kijk naar onze werkelijke geschiedenis. 61 00:04:00,894 --> 00:04:01,810 Computing is geëvolueerd. 62 00:04:01,810 --> 00:04:07,370 Dus sinds de jaren '60, alle de weg tot aan vandaag de dag, 63 00:04:07,370 --> 00:04:11,260 we hebben eigenlijk een verandering van gezien reikwijdte van gecentraliseerde computing- 64 00:04:11,260 --> 00:04:14,679 computing decentraliseren, om collaboratieve en dan onafhankelijk 65 00:04:14,679 --> 00:04:15,970 computing en rechts weer terug. 66 00:04:15,970 --> 00:04:17,709 >> En laat me annoteren dat een beetje. 67 00:04:17,709 --> 00:04:20,370 Toen we voor het eerst begonnen met computers, hadden we mainframes. 68 00:04:20,370 --> 00:04:22,824 Ze waren buitengewoon dure inrichtingen. 69 00:04:22,824 --> 00:04:23,990 Alles moest worden gedeeld. 70 00:04:23,990 --> 00:04:25,556 De computer was complex. 71 00:04:25,556 --> 00:04:29,060 U kunt zien, is gevuld kamers en er waren exploitanten en tapes 72 00:04:29,060 --> 00:04:32,780 en allerlei Whirry, clicky, spinny apparaten. 73 00:04:32,780 --> 00:04:39,930 >> Rond de jaren '70 begin jaren '80, je begon om een ​​impact van de faxapparaten zien. 74 00:04:39,930 --> 00:04:43,620 Dus je begint computing zien beginnen terug in laboratoria verschijnen 75 00:04:43,620 --> 00:04:45,880 en word dichter bij jou. 76 00:04:45,880 --> 00:04:49,800 De opkomst van de personal computer, zeker 77 00:04:49,800 --> 00:04:57,460 in de jaren '80, begin van de decennium, echt veranderd computing. 78 00:04:57,460 --> 00:04:59,570 >> En er is een aanwijzing in de titel, omdat 79 00:04:59,570 --> 00:05:04,080 werd de personal computer genoemd, wat betekende dat het toebehoorde aan u. 80 00:05:04,080 --> 00:05:07,630 Zodat de evolutie van informatica voortgezet, 81 00:05:07,630 --> 00:05:10,530 mensen beseften dat hun persoonlijke computer was niet echt groot genoeg 82 00:05:10,530 --> 00:05:15,020 in staat zijn om iets van enige verdienste te doen, of belangrijke verdienste, in de wetenschap. 83 00:05:15,020 --> 00:05:17,790 >> En zo mensen begonnen te netwerkapparaat ontwikkelen 84 00:05:17,790 --> 00:05:21,920 drivers om te kunnen pc's samen kunnen clusters bouwen. 85 00:05:21,920 --> 00:05:26,430 En dus dit gewon het tijdperk van de Beowulf cluster. 86 00:05:26,430 --> 00:05:32,470 Linux geëxplodeerd als reactie op eigen besturingssysteem, zowel de kosten 87 00:05:32,470 --> 00:05:33,650 en complexiteit. 88 00:05:33,650 --> 00:05:36,530 >> En dan, hier zijn we vandaag de dag, waar, nog maar eens, we zijn 89 00:05:36,530 --> 00:05:40,610 geconfronteerd met kamers vol met computer apparatuur en het vermogen 90 00:05:40,610 --> 00:05:44,570 om iemands credit card swipe en krijg toegang tot deze computerfaciliteiten, 91 00:05:44,570 --> 00:05:45,290 op afstand. 92 00:05:45,290 --> 00:05:49,680 >> En zo kun je dan zien, in termen van de geschiedenis beïnvloedende 93 00:05:49,680 --> 00:05:52,180 hoe we berekenen vandaag, het is zeker 94 00:05:52,180 --> 00:05:56,090 evolueerde van machine kamers vol computers 95 00:05:56,090 --> 00:05:59,160 door enkele personal computing helemaal naar rechts weer terug 96 00:05:59,160 --> 00:06:02,400 om de machine kamers vol computers. 97 00:06:02,400 --> 00:06:06,620 >> Dus dit is mijn eerste cluster. 98 00:06:06,620 --> 00:06:10,170 Dus 2000, bouwden we een computersysteem in Europa 99 00:06:10,170 --> 00:06:13,900 om effectief te annoteren het menselijk genoom. 100 00:06:13,900 --> 00:06:16,521 Er is veel van de technologie genoteerd aan de rechterzijde 101 00:06:16,521 --> 00:06:18,520 daar dat, helaas, is niet meer bij ons. 102 00:06:18,520 --> 00:06:23,460 Het is weggesluisd naar de geweldige technologie in de lucht. 103 00:06:23,460 --> 00:06:26,610 >> De machine zelf is waarschijnlijk equivalent van een paar fatsoenlijke laptops 104 00:06:26,610 --> 00:06:29,020 vandaag, en dat gewoon een soort van laat zien. 105 00:06:29,020 --> 00:06:36,260 Echter, we zorgvuldig annoteren het menselijk genoom en de beide beschermde het 106 00:06:36,260 --> 00:06:43,190 met dit papier in Aard van de zorgen van de gegevens 107 00:06:43,190 --> 00:06:45,380 het zijn publiek of privé. 108 00:06:45,380 --> 00:06:48,610 >> Dus dit is geweldig, toch? 109 00:06:48,610 --> 00:06:50,280 Dus we hebben een menselijk genoom. 110 00:06:50,280 --> 00:06:51,510 We hebben gedaan berekenen. 111 00:06:51,510 --> 00:06:53,400 Ik voel me heel blij mezelf. 112 00:06:53,400 --> 00:06:59,090 Ik rolde naar Harvard in 2006, het gevoel een stuk minder blij met mezelf. 113 00:06:59,090 --> 00:07:00,210 >> Dit is wat ik geërfd. 114 00:07:00,210 --> 00:07:03,575 Dit is een departementale mail en file server. 115 00:07:03,575 --> 00:07:05,450 U kunt hier zien dat er een beetje tape 116 00:07:05,450 --> 00:07:07,710 die wordt gebruikt om het systeem samen te houden. 117 00:07:07,710 --> 00:07:09,890 Dit is onze licentie en printserver. 118 00:07:09,890 --> 00:07:13,990 Ik ben er vrij zeker van dat er misschien wachtwoorden op sommige van deze Post-it Notes. 119 00:07:13,990 --> 00:07:16,560 120 00:07:16,560 --> 00:07:17,360 >> Niet geweldig. 121 00:07:17,360 --> 00:07:18,530 Vrij ver van geweldig. 122 00:07:18,530 --> 00:07:22,060 En ja, ik besef dit kleine grafiek dat heb ik laten zien aan het begin 123 00:07:22,060 --> 00:07:25,350 van het delen van de eigendom terug naar het delen, 124 00:07:25,350 --> 00:07:27,930 dat we nodig hadden om het spel te veranderen. 125 00:07:27,930 --> 00:07:31,330 En dus hebben we veranderd het spel door het verstrekken van incentives. 126 00:07:31,330 --> 00:07:34,250 En zo de mens, zoals deze weinig Wikipedia artikel 127 00:07:34,250 --> 00:07:35,990 zegt hier, onze doelgerichte wezens. 128 00:07:35,990 --> 00:07:39,250 En de studie van incentive structuren is essentieel voor de studie 129 00:07:39,250 --> 00:07:41,100 van de economische activiteit. 130 00:07:41,100 --> 00:07:44,580 >> Dus begonnen we te stimuleren onze faculteit en onze onderzoekers. 131 00:07:44,580 --> 00:07:47,720 En dus hebben we gestimuleerd ze met een echt grote computersysteem. 132 00:07:47,720 --> 00:07:52,720 Dus in 2008, bouwden we een 4.096 processor machine-- 10 racks, 133 00:07:52,720 --> 00:07:54,470 paar honderd kilowatt van de macht. 134 00:07:54,470 --> 00:07:56,178 >> Wat ik denk is interessant is, is het niet 135 00:07:56,178 --> 00:07:58,300 Waar je ook bent in de cyclus. 136 00:07:58,300 --> 00:08:03,510 Deze hetzelfde vermogen en computerkracht, de stroom is de constante. 137 00:08:03,510 --> 00:08:06,270 Het was 200 kilowatt toen we werden systemen bouwen in Europa. 138 00:08:06,270 --> 00:08:09,770 Het is tweehonderd kilowatt in 2008, en dat 139 00:08:09,770 --> 00:08:15,820 lijkt het [zijn? quanter?] van kleine universitaire-based computing-systemen. 140 00:08:15,820 --> 00:08:20,540 >> Dus Harvard today-- snel vooruit, ik ben geen langer trieste panda, een heel gelukkige panda. 141 00:08:20,540 --> 00:08:25,860 We hebben 60-oneven duizend load balanced CPU's, en dramatisch hun klimmen. 142 00:08:25,860 --> 00:08:28,780 We hebben 15 petabytes aan opslag, ook klimmen. 143 00:08:28,780 --> 00:08:30,720 Nogmaals, dit 200 kilowatt increment, we lijken 144 00:08:30,720 --> 00:08:33,000 te voegen dat om de zes maanden of zo. 145 00:08:33,000 --> 00:08:35,480 Veel en veel virtuele machines. 146 00:08:35,480 --> 00:08:37,620 En nog belangrijker, ongeveer 1,8 megawatt 147 00:08:37,620 --> 00:08:39,669 van het onderzoek computerapparatuur. 148 00:08:39,669 --> 00:08:41,820 >> En ik ga komen terug naar deze later, 149 00:08:41,820 --> 00:08:46,913 waarom ik nu niet meer per se tellen hoeveel CPU we hebben, 150 00:08:46,913 --> 00:08:48,980 maar hoe groot is de elektriciteitsrekening. 151 00:08:48,980 --> 00:08:52,690 20 andere zo toegewijd onderzoek computing-personeel. 152 00:08:52,690 --> 00:08:57,250 En wat nog belangrijker is, we zijn begint onze GPGPUs groeien. 153 00:08:57,250 --> 00:09:05,030 Ik was wankelde op hoeveel van deze wordt toegevoegd op een dag-tot-dag basis. 154 00:09:05,030 --> 00:09:07,310 Dus, geschiedenisles over, toch? 155 00:09:07,310 --> 00:09:11,280 >> Dus hoe komen we daar vanaf hier? 156 00:09:11,280 --> 00:09:14,560 Laten we eens kijken naar een aantal moderne scale-out compute voorbeelden. 157 00:09:14,560 --> 00:09:18,290 158 00:09:18,290 --> 00:09:23,230 Ik ben een beetje geobsedeerd door de omvang en schaal van social media. 159 00:09:23,230 --> 00:09:30,850 Er zijn een aantal zeer succesvolle grootschalige gegevensverwerking 160 00:09:30,850 --> 00:09:34,820 organisaties nu op de planeet, het bieden van ondersteuning en diensten 161 00:09:34,820 --> 00:09:36,810 voor ons allemaal. 162 00:09:36,810 --> 00:09:39,340 Dus dat is de disclaimer. 163 00:09:39,340 --> 00:09:42,990 >> En ik wil beginnen met een aantal ounces in een Instagram. 164 00:09:42,990 --> 00:09:48,336 Het is niet echt een lood-in voor een grap, het is 165 00:09:48,336 --> 00:09:50,460 zelfs dat niet grappig, eigenlijk, kom ik er over nadenk. 166 00:09:50,460 --> 00:09:52,751 Maar goed, we gaan kijk naar ounces in Instagram. 167 00:09:52,751 --> 00:09:55,260 En we gaan beginnen met "Mijn bee en een bloem." 168 00:09:55,260 --> 00:09:57,600 Ik was bij [onverstaanbaar] Village en ik nam een ​​kleine afbeelding 169 00:09:57,600 --> 00:10:00,460 van een bij de vergadering op een bloem. 170 00:10:00,460 --> 00:10:03,270 En toen begon ik na te denken over wat betekent dit eigenlijk betekent. 171 00:10:03,270 --> 00:10:07,013 En ik nam deze foto van mijn telefoon en geteld hoeveel bytes in, 172 00:10:07,013 --> 00:10:09,070 en het is ongeveer 256 kilobyte. 173 00:10:09,070 --> 00:10:13,550 Die toen ik begon, zou in principe Vul een 5 en 1/4 inch floppy. 174 00:10:13,550 --> 00:10:15,340 En begon te denken, nou, dat is cool. 175 00:10:15,340 --> 00:10:18,630 >> En ik begon te kijken en doen wat onderzoek op het netwerk. 176 00:10:18,630 --> 00:10:22,490 En ik ontdekte dat Instagram heeft 200 miljoen MAUs. 177 00:10:22,490 --> 00:10:25,105 Ik was eigenlijk niet zo zeker wat een MAU was. 178 00:10:25,105 --> 00:10:28,960 En een MAU, hier beneden, is een maandelijks actieve gebruiker. 179 00:10:28,960 --> 00:10:34,270 >> Dus, 200 miljoen MAUs-- pretty cool. 180 00:10:34,270 --> 00:10:38,190 20 miljard photographs-- zo heel veel foto's. 181 00:10:38,190 --> 00:10:42,300 60 miljoen nieuwe foto's elke dag 182 00:10:42,300 --> 00:10:46,990 komt uit op ongeveer 0,002 gig per foto. 183 00:10:46,990 --> 00:10:51,290 Dat is ongeveer vijf petabytes van de schijf precies goed daar. 184 00:10:51,290 --> 00:10:55,480 En dat is niet echt het centrale deel van wat we gaan om te praten over. 185 00:10:55,480 --> 00:10:57,830 Dat is de kleine aardappelen. 186 00:10:57,830 --> 00:11:00,710 Of zoals wij zeggen in Engeland, kleine piepers. 187 00:11:00,710 --> 00:11:05,050 >> Dus laten we eens kijken naar de echte olifant in de kamer-- unieke gezichten. 188 00:11:05,050 --> 00:11:09,170 Nogmaals, laten we meten in deze nieuwe quanta noemen een MAU. 189 00:11:09,170 --> 00:11:13,260 Facebook zelf heeft 1,3 miljard MAUs. 190 00:11:13,260 --> 00:11:17,510 WhatsApp, die had ik nog niet eens gehoord van tot voor kort, het is 191 00:11:17,510 --> 00:11:23,260 een soort messaging-dienst, is 500 miljoen MAUs. 192 00:11:23,260 --> 00:11:26,620 Instagram, die we zojuist over gesproken, 200 miljoen MAUs. 193 00:11:26,620 --> 00:11:29,370 En Messenger, dat is een andere messaging-dienst, 194 00:11:29,370 --> 00:11:31,120 is ook 200 miljoen MAUs. 195 00:11:31,120 --> 00:11:35,920 >> Zo totaal dat op, het gaat over 2,2 miljard totale gebruikers. 196 00:11:35,920 --> 00:11:39,880 Het is duidelijk dat er enige overlap, maar dat is gelijk aan een derde van de planeet. 197 00:11:39,880 --> 00:11:44,270 En ze iets te sturen in de regio van 12 miljard berichten per dag. 198 00:11:44,270 --> 00:11:46,680 En nogmaals, er is slechts 7 miljard mensen op de planeet. 199 00:11:46,680 --> 00:11:48,550 Niet iedereen heeft een smartphone. 200 00:11:48,550 --> 00:11:53,960 Dus dit is krankzinnig nummers. 201 00:11:53,960 --> 00:12:02,050 >> En ik ga om te betogen dat het niet zelfs over de opslag of de compute. 202 00:12:02,050 --> 00:12:05,610 En om het lied te citeren, het is allemaal over die grafiek. 203 00:12:05,610 --> 00:12:09,045 Hier is onze mooie Meghan Trainor neer hier, zingend over alle bas. 204 00:12:09,045 --> 00:12:12,570 Let op, ze heeft ook een heel beetje bas herself-- 207, 205 00:12:12,570 --> 00:12:16,460 en 218 miljoen mensen hebben gezien Deze jonge dame zingt haar lied. 206 00:12:16,460 --> 00:12:19,910 >> Dus mijn argument is het het is allemaal over de grafiek. 207 00:12:19,910 --> 00:12:23,480 Dus namen we een aantal open source software en begon te kijken naar een grafiek. 208 00:12:23,480 --> 00:12:27,740 En dit is LinkedIn, dus dit is een Facebook voor oude mensen. 209 00:12:27,740 --> 00:12:29,910 En ja, dit is mijn LinkedIn grafiek. 210 00:12:29,910 --> 00:12:34,080 Ik heb 1200 of zo knooppunten, zogenaamde "vriendenlijst." 211 00:12:34,080 --> 00:12:36,360 En hier ben ik aan de top. 212 00:12:36,360 --> 00:12:38,140 En hier is alles van de onderlinge verbindingen. 213 00:12:38,140 --> 00:12:40,570 >> Nu, denk terug aan de Instagram verhaal. 214 00:12:40,570 --> 00:12:42,815 Elk van deze is niet alleen de foto, het 215 00:12:42,815 --> 00:12:46,860 heeft een hele diverse aansluitmogelijkheden tussen deze bepaalde persoon 216 00:12:46,860 --> 00:12:48,220 en vele anderen. 217 00:12:48,220 --> 00:12:52,190 Dit is een centraal onderdeel is ofwel een bug in de grafiek tekening algoritme, 218 00:12:52,190 --> 00:12:55,982 of dit misschien David Malan, ik ben nog niet zeker. 219 00:12:55,982 --> 00:12:57,690 Dus je kunt opnieuw tekenen van de grafieken in allerlei 220 00:12:57,690 --> 00:13:02,510 van ways-- gephi.gihub.io is waar kun je die software uit te trekken. 221 00:13:02,510 --> 00:13:05,410 Het is echt cool voor zijn staat om gemeenschappen te organiseren. 222 00:13:05,410 --> 00:13:08,640 U kunt hier zien, is dit Harvard en diverse andere plaatsen die ik heb gewerkt, 223 00:13:08,640 --> 00:13:12,160 want dit is mijn werk-gerelateerde data. 224 00:13:12,160 --> 00:13:15,080 >> Dus denk maar aan de complexiteit van de grafiek en alle gegevens 225 00:13:15,080 --> 00:13:17,070 dat trek je samen met. 226 00:13:17,070 --> 00:13:20,870 Dus ondertussen terug op Friendface, toch? 227 00:13:20,870 --> 00:13:24,360 We keken naar de Instagram gegevens die was van de orde van vijf petabytes. 228 00:13:24,360 --> 00:13:25,300 Geen probleem. 229 00:13:25,300 --> 00:13:28,830 Nog steeds heel veel gegevens, maar geen groot handelen in het grotere geheel van de dingen. 230 00:13:28,830 --> 00:13:33,850 >> Van dit artikel op de oude internet, "Scaling de Facebook-data warehouse 231 00:13:33,850 --> 00:13:36,250 300 petabytes. " 232 00:13:36,250 --> 00:13:38,110 Dat is een heel ander game changer nu, 233 00:13:38,110 --> 00:13:40,234 wanneer je begint denk aan gegevens en de grafiek 234 00:13:40,234 --> 00:13:41,690 en wat je samen te brengen met. 235 00:13:41,690 --> 00:13:47,480 En hun hoge data groeit van de orde van 600 terrabytes per dag. 236 00:13:47,480 --> 00:13:52,980 >> Nu, je weet wel, goed, then-- Ik bedoel, 600 terrabytes per dag, 237 00:13:52,980 --> 00:13:55,670 300 petabytes-- ze Ook nu beginnen 238 00:13:55,670 --> 00:13:58,550 om zeer bezorgd over te krijgen hoe dit spul te houden 239 00:13:58,550 --> 00:14:01,160 en om ervoor te zorgen dat deze gegevens mag rond. 240 00:14:01,160 --> 00:14:04,630 En deze meneer hier, Jay Parikh, is op zoek 241 00:14:04,630 --> 00:14:08,250 op hoe je een exabyte aan gegevens op te slaan. 242 00:14:08,250 --> 00:14:10,180 >> Alleen voor degenen onder u die kijken langs 243 00:14:10,180 --> 00:14:13,940 thuis, een exabyte-- 10 naar de 18. 244 00:14:13,940 --> 00:14:18,210 Het heeft zijn eigen Wikipedia pagina, het is zo groot van een nummer. 245 00:14:18,210 --> 00:14:23,120 Dat is de omvang en schaal van wat we kijken, kunnen voor gegevensopslag. 246 00:14:23,120 --> 00:14:27,090 En deze jongens zijn niet uitmesten rond, ze zijn het opslaan van die hoeveelheid data. 247 00:14:27,090 --> 00:14:29,550 Dus een van de aanwijzingen die ze zijn op zoek naar hier 248 00:14:29,550 --> 00:14:32,185 is datacenters voor zogenaamde koude opslag. 249 00:14:32,185 --> 00:14:35,020 250 00:14:35,020 --> 00:14:36,470 >> Dat brengt mij op groen zijn. 251 00:14:36,470 --> 00:14:38,340 En hier is Kermit. 252 00:14:38,340 --> 00:14:43,050 Hij en ik agree-- het uiterst moeilijk om groen te zijn, 253 00:14:43,050 --> 00:14:44,920 maar we geven ons best proberen. 254 00:14:44,920 --> 00:14:47,430 Kermit kan het niet helpen, hij heeft groen te zijn de hele tijd, 255 00:14:47,430 --> 00:14:49,945 kan zijn groene-ness niet nemen helemaal af. 256 00:14:49,945 --> 00:14:55,410 >> Dus, als concepts-- een paar vriendelijke kernbegrippen 257 00:14:55,410 --> 00:14:59,510 van groenheid, toen het heeft betrekking op computing. 258 00:14:59,510 --> 00:15:05,510 Degene die de belangrijkste is de levensduur van het product. 259 00:15:05,510 --> 00:15:09,405 Als uw product heeft een korte levensduur, je kunt niet per definitie groen zijn. 260 00:15:09,405 --> 00:15:13,280 De energie naar een vervaardiging schijf, een moederbord, een computer 261 00:15:13,280 --> 00:15:17,890 systeem, een tablet, wat het ook mag zijn, de levensduur van uw systemen 262 00:15:17,890 --> 00:15:21,700 zijn een belangrijk onderdeel van hoe groen je kunt zijn. 263 00:15:21,700 --> 00:15:27,960 >> Het belangrijkste onderdeel, zoals jullie allemaal bouwen software algorithms-- 264 00:15:27,960 --> 00:15:30,455 algoritme een gedeeltelijke woord voor software, toch? 265 00:15:30,455 --> 00:15:34,000 Dus, je algoritme ontwerp is absoluut cruciaal in termen 266 00:15:34,000 --> 00:15:43,080 van hoe je gaat om te kunnen maken snelle en nauwkeurige berekeningen te gebruiken 267 00:15:43,080 --> 00:15:44,710 de minste hoeveelheid energie mogelijk. 268 00:15:44,710 --> 00:15:47,280 En ik zal om dit te krijgen in een beetje. 269 00:15:47,280 --> 00:15:51,270 >> Datacenter design-- je hebt gezien dat we al duizenden 270 00:15:51,270 --> 00:15:54,870 en duizenden machines, zittend rustig in kleine, donkere hoeken 271 00:15:54,870 --> 00:15:57,760 van de wereld, computing. 272 00:15:57,760 --> 00:16:01,670 Resource allocation-- hoe te krijgen het berekenen, de opslag, 273 00:16:01,670 --> 00:16:03,840 via het netwerk. 274 00:16:03,840 --> 00:16:08,530 Besturingssystemen zijn een belangrijk onderdeel van Dit, en een heleboel virtualisatie 275 00:16:08,530 --> 00:16:12,080 kunnen meer pakken en meer computerkracht in een kleine ruimte. 276 00:16:12,080 --> 00:16:15,530 >> Ik geef je een klein voorbeeld te geven uit onderzoek computing. 277 00:16:15,530 --> 00:16:18,220 We hadden behoefte aan meer ping, meer macht, en meer pijp. 278 00:16:18,220 --> 00:16:21,030 We hadden behoefte aan meer groter, betere, snellere computers, 279 00:16:21,030 --> 00:16:23,390 en moesten minder sap gebruiken. 280 00:16:23,390 --> 00:16:26,856 En we niet konden achterhalen hoe dit te doen. 281 00:16:26,856 --> 00:16:29,980 Ik weet niet of de hashtag gowest als waarschijnlijk door de Kardashian, 282 00:16:29,980 --> 00:16:32,560 maar toch, gowest. 283 00:16:32,560 --> 00:16:33,220 En we deden. 284 00:16:33,220 --> 00:16:36,610 >> We pakten onze werking en verhuisden we het uit 285 00:16:36,610 --> 00:16:39,660 naar West-Massachusetts in een kleine molen stad 286 00:16:39,660 --> 00:16:45,000 riep Holyoke, net ten noorden van Chikopee en Springfield. 287 00:16:45,000 --> 00:16:49,280 We deden dit voor een paar redenen. 288 00:16:49,280 --> 00:16:55,150 De belangrijkste daarvan was dat we had een zeer, zeer grote dam. 289 00:16:55,150 --> 00:17:00,080 En dit zeer grote dam is in staat om stak 30 plus megawatt aan energie, 290 00:17:00,080 --> 00:17:02,980 en het werd onderbenut destijds. 291 00:17:02,980 --> 00:17:06,170 >> Belangrijker, we hadden ook een zeer ingewikkeld netwerk 292 00:17:06,170 --> 00:17:07,254 dat was al op zijn plaats. 293 00:17:07,254 --> 00:17:09,711 Als je kijkt naar waar het netwerk gaat in de Verenigde Staten, 294 00:17:09,711 --> 00:17:11,230 volgt al de treinsporen. 295 00:17:11,230 --> 00:17:14,290 Dit bijzondere stukje netwerk was eigendom zijn van onze collega's en vrienden 296 00:17:14,290 --> 00:17:16,480 het Massachusetts Institute of Technology, 297 00:17:16,480 --> 00:17:19,720 en het was eigenlijk gebouwd helemaal uit naar Route 90. 298 00:17:19,720 --> 00:17:24,760 >> Dus we hadden een grote rivier teek, Route 90 tick, we hadden een kort pad van 100 mijl, 299 00:17:24,760 --> 00:17:26,960 en een lange weg van ongeveer 1.000 mijl. 300 00:17:26,960 --> 00:17:29,890 We hadden een zeer groot doen netwerk verbinding, zoals je hier kunt zien, 301 00:17:29,890 --> 00:17:32,990 om in principe een link in, om in staat zijn om verbinding te maken Holyoke, 302 00:17:32,990 --> 00:17:36,390 maar we hadden alle vereiste infrastructure-- ping, macht, pijp. 303 00:17:36,390 --> 00:17:37,280 Het leven was goed. 304 00:17:37,280 --> 00:17:38,980 En nogmaals, grote dam. 305 00:17:38,980 --> 00:17:42,120 >> Dus bouwden we in principe het Massachusetts Green High Performance Computing 306 00:17:42,120 --> 00:17:42,850 Center. 307 00:17:42,850 --> 00:17:46,580 Dit was een werk van liefde door vijf universities-- MIT, Harvard, UMass, 308 00:17:46,580 --> 00:17:47,870 Noordoostelijk, en BU. 309 00:17:47,870 --> 00:17:49,554 Vijf megawatt dag één aangesloten belasting. 310 00:17:49,554 --> 00:17:51,845 We deden allerlei slimheid met airside economizers 311 00:17:51,845 --> 00:17:53,585 om dingen groen te houden. 312 00:17:53,585 --> 00:18:03,330 En we opgebouwd uit 640-tal rekken, gewijd aan onderzoek computing. 313 00:18:03,330 --> 00:18:08,770 >> Het was een oude brownfield site, zodat we had enkele regeneratie en sommige netjes-up 314 00:18:08,770 --> 00:18:10,500 en sommige sanering van de site. 315 00:18:10,500 --> 00:18:13,590 En dan zijn we begonnen om de faciliteit te bouwen 316 00:18:13,590 --> 00:18:19,710 en, boom-- mooie faciliteit met de mogelijkheid om zandbak computergebruik draaien, 317 00:18:19,710 --> 00:18:24,430 conferenties en seminars hebben, en ook een enorme datacenter vloer. 318 00:18:24,430 --> 00:18:26,007 >> Hier is mijn goede zelf. 319 00:18:26,007 --> 00:18:27,590 Ik ben uiteraard het dragen van dezelfde jas. 320 00:18:27,590 --> 00:18:29,423 Ik misschien slechts één jas, maar er is me 321 00:18:29,423 --> 00:18:34,030 en John Goodhue-- hij is de executive director van de Center-- 322 00:18:34,030 --> 00:18:36,740 staande in de machinekamer vloer, die, zoals u kunt zien, 323 00:18:36,740 --> 00:18:40,560 is vrij dramatisch, en het gaat terug een lange, lange weg. 324 00:18:40,560 --> 00:18:44,830 >> Ik heb vaak spelletjes spelen rijden van Boston naar Holyoke, 325 00:18:44,830 --> 00:18:47,260 pretenderen dat ik een TCP / IP-pakket. 326 00:18:47,260 --> 00:18:54,290 En ik maak me wel zorgen over mijn latency rijden rond in mijn auto. 327 00:18:54,290 --> 00:18:56,690 Dus dat is het groene stuk. 328 00:18:56,690 --> 00:19:00,070 Dus laten we gewoon een minuut en denk na over stacks. 329 00:19:00,070 --> 00:19:04,060 Dus we zeer zorgvuldig te proberen bouwen datacenters efficiënt, 330 00:19:04,060 --> 00:19:08,770 efficiënt te berekenen, maken goede selectie voor de computerapparatuur 331 00:19:08,770 --> 00:19:12,060 en leveren, meer Belangrijker nog, onze applicatie, 332 00:19:12,060 --> 00:19:17,860 of het nu een messaging-dienst of een wetenschappelijke toepassing. 333 00:19:17,860 --> 00:19:19,110 >> Dus hier zijn de stacks. 334 00:19:19,110 --> 00:19:22,762 Dus fysieke laag, de weg omhoog door application-- 335 00:19:22,762 --> 00:19:25,220 in de hoop dat dit gaat om zijn een groot deel van je cursus. 336 00:19:25,220 --> 00:19:31,450 OSI zeven lagen model in wezen, je zult leven, eten en ademen 337 00:19:31,450 --> 00:19:35,270 dit in uw hele berekenen carrière. 338 00:19:35,270 --> 00:19:37,800 Dit hele concept van de fysieke infrastructure-- draden, 339 00:19:37,800 --> 00:19:40,080 kabels, datacenters, koppelingen. 340 00:19:40,080 --> 00:19:42,190 En dit is slechts een beschrijving van het netwerk. 341 00:19:42,190 --> 00:19:44,780 >> Tot hier is, nou ja, natuurlijk, Dit is een oude dia, 342 00:19:44,780 --> 00:19:49,342 want dit zou moeten zeggen HTTP, omdat niemand geeft om eenvoudige mail 343 00:19:49,342 --> 00:19:50,550 transport protocollen, meer. 344 00:19:50,550 --> 00:19:53,960 Het is allemaal gebeurt in de HTTP-ruimte. 345 00:19:53,960 --> 00:19:55,850 Dus dat is een niveau van stapel. 346 00:19:55,850 --> 00:19:59,460 >> Hier is nog een set van stapels, waar u heb een server, een gastheer, een hypervisor, 347 00:19:59,460 --> 00:20:02,470 een gast, binaire bibliotheek, en dan uw aanvraag. 348 00:20:02,470 --> 00:20:06,070 Of, in dit geval, de inrichting bestuurder, een Linux kernel, inheemse c, 349 00:20:06,070 --> 00:20:08,080 Java virtual machine, Java API, dan Java 350 00:20:08,080 --> 00:20:11,220 toepassingen, enzovoort, enzovoort. 351 00:20:11,220 --> 00:20:14,090 Dit is een beschrijving van een virtuele machine. 352 00:20:14,090 --> 00:20:15,450 >> Heilige stacks, Batman! 353 00:20:15,450 --> 00:20:18,260 Denk hier eens over in termen van hoeveel compute 354 00:20:18,260 --> 00:20:20,850 je nodig hebt om van Wat hier gebeurt, 355 00:20:20,850 --> 00:20:23,110 helemaal tot aan de top deze stapel, om dan 356 00:20:23,110 --> 00:20:26,840 in staat zijn om uw werkelijke doen oplevering van de applicatie. 357 00:20:26,840 --> 00:20:29,130 >> En als je soort terugspoelen en beginnen te denken 358 00:20:29,130 --> 00:20:33,450 over wat er nodig is om te voorzien een drijvende komma bewerking, 359 00:20:33,450 --> 00:20:37,650 je floating point operatie is een bedrag van de bussen, het aantal cores 360 00:20:37,650 --> 00:20:44,490 in de fitting, een klok, die Hoe snel kan de klok turnover-- 361 00:20:44,490 --> 00:20:47,490 vier gigahertz, twee gigahertz-- en dan het nummer 362 00:20:47,490 --> 00:20:50,890 van bewerkingen die u kunt in een bepaalde hertz. 363 00:20:50,890 --> 00:20:54,350 >> Dus die microprocessors vandaag doen tussen de vier en 6 flops 364 00:20:54,350 --> 00:20:55,400 per klokcyclus. 365 00:20:55,400 --> 00:20:59,810 En dus een single-core 2,5 gig klok heeft een theoretische prestatie 366 00:20:59,810 --> 00:21:03,490 van ongeveer een mega FLOP, geven of te nemen. 367 00:21:03,490 --> 00:21:05,940 >> Maar, zoals met alles, we hebben keuzes. 368 00:21:05,940 --> 00:21:12,280 Zo en Intel Core 2, Nehalem Sandy Bridge, Haswell, AMD, 369 00:21:12,280 --> 00:21:13,920 neem uw choices-- Intel Atom. 370 00:21:13,920 --> 00:21:17,670 Al deze processor architecturen allemaal een iets andere manier 371 00:21:17,670 --> 00:21:19,650 te kunnen toevoegen twee getallen elkaar, 372 00:21:19,650 --> 00:21:23,520 die in feite hun doel in het leven. 373 00:21:23,520 --> 00:21:24,535 Moet zijn taai. 374 00:21:24,535 --> 00:21:27,100 Er zijn miljoenen van hen zitten in datacenters, nu wel. 375 00:21:27,100 --> 00:21:30,410 >> Sor, ploffen per watt-- Dit is het grote ding. 376 00:21:30,410 --> 00:21:37,780 Dus als ik wil meer van dit te krijgen door deze stapel te krijgen, sneller, 377 00:21:37,780 --> 00:21:41,800 Ik heb om te werken aan hoeveel floating point operaties per seconde, 378 00:21:41,800 --> 00:21:43,770 Ik kan doen, en dan geven ze watt. 379 00:21:43,770 --> 00:21:46,160 En gelukkig, mensen hebben nagedacht over dit. 380 00:21:46,160 --> 00:21:49,140 >> Dus er is een grote betwisten elk jaar om te zien 381 00:21:49,140 --> 00:21:52,310 die de snelste computer kan bouwen dat kan een matrix diagonaliseren. 382 00:21:52,310 --> 00:21:53,980 Het heet de Top 500. 383 00:21:53,980 --> 00:21:56,420 Ze halen de top van de beste 500 computers 384 00:21:56,420 --> 00:21:58,610 op de planeet die kan diagonaliseren matrices. 385 00:21:58,610 --> 00:22:00,760 En je krijgt een aantal fantastische resultaten. 386 00:22:00,760 --> 00:22:04,660 >> Een heleboel van die machines zijn tussen 10 en 20 megawatt. 387 00:22:04,660 --> 00:22:09,380 Ze kunnen matrices diagonaliseren buitengewoon snel. 388 00:22:09,380 --> 00:22:13,550 Ze hoeven niet per se diagonalized ze zo efficiënt per watt, 389 00:22:13,550 --> 00:22:18,060 dus er was deze grote druk om naar te kijken wat een groene 500-lijst eruit zou zien. 390 00:22:18,060 --> 00:22:20,360 En hier is de lijst van juni. 391 00:22:20,360 --> 00:22:22,410 Er moet een nieuwe zeer binnenkort. 392 00:22:22,410 --> 00:22:26,590 >> En het roept out-- Ik neem de top van deze specifieke lijst. 393 00:22:26,590 --> 00:22:32,187 Er zijn twee specifieke machines-- één van de Tokyo Institute of Technology 394 00:22:32,187 --> 00:22:34,520 en een uit Cambridge University in het Verenigd Koninkrijk. 395 00:22:34,520 --> 00:22:37,700 En deze hebben vrij onthutsend mega flops per watt ratio's. 396 00:22:37,700 --> 00:22:42,620 Deze is 4389, en de volgende neer is 3.631. 397 00:22:42,620 --> 00:22:47,660 >> Ik zal het verschil tussen uit te leggen deze twee, in de volgende dia. 398 00:22:47,660 --> 00:22:51,320 Maar dit zijn dit zijn middelgroot-test clusters. 399 00:22:51,320 --> 00:22:54,732 Dit zijn slechts 34 kilowatts of 52 kilowatt. 400 00:22:54,732 --> 00:22:56,940 Er zijn enkele grotere hier-- deze bijzondere één 401 00:22:56,940 --> 00:22:58,860 bij de Zwitserse Nationale Supercomputing Centre. 402 00:22:58,860 --> 00:23:00,693 De take home message hiervoor is dat we 403 00:23:00,693 --> 00:23:04,270 proberen om computers te vinden die efficiënt kan werken. 404 00:23:04,270 --> 00:23:09,860 >> En ja, laten we eens kijken naar deze top één, cutely genoemd, de KFC. 405 00:23:09,860 --> 00:23:12,960 En een beetje reclame hier. 406 00:23:12,960 --> 00:23:15,730 Deze bijzondere voedingsbedrijf heeft niets te maken met dit. 407 00:23:15,730 --> 00:23:18,240 Het is het feit dat Dit specifieke systeem 408 00:23:18,240 --> 00:23:23,830 wordt gedrenkt in een zeer slimme-olie gebaseerde verbinding. 409 00:23:23,830 --> 00:23:27,590 En dus kregen ze hun kip friteuse moniker 410 00:23:27,590 --> 00:23:30,040 toen ze voor het eerst begonnen met het bouwen van dit soort systemen. 411 00:23:30,040 --> 00:23:32,740 >> Maar eigenlijk wat ze hebben genomen Hier is een aantal bladen, 412 00:23:32,740 --> 00:23:37,560 zet ze in deze geraffineerde minerale olie, 413 00:23:37,560 --> 00:23:40,979 en vervolgens uitgewerkt hoe krijgen allemaal het netwerk in en uit het. 414 00:23:40,979 --> 00:23:42,895 Dan, niet alleen dat, ze hebben het te zetten buiten, zodat 415 00:23:42,895 --> 00:23:46,095 dat het buiten luchtkoeling kunnen benutten. 416 00:23:46,095 --> 00:23:47,520 Het was behoorlijk indrukwekkend. 417 00:23:47,520 --> 00:23:49,630 Dus je moet alles doen van deze shenanigans 418 00:23:49,630 --> 00:23:53,280 in staat zijn om deze hoeveelheid te krijgen compute geleverd voor kleine wattage. 419 00:23:53,280 --> 00:23:57,360 >> En je kunt zien is dit de vorm van waar dingen zijn rubriek. 420 00:23:57,360 --> 00:24:01,240 De uitdaging is dat regelmatige lucht koeling is het schaalvoordeel 421 00:24:01,240 --> 00:24:08,459 en drijft veel van de ontwikkeling van zowel reguliere computing, 422 00:24:08,459 --> 00:24:09,750 en high performance computing. 423 00:24:09,750 --> 00:24:11,080 Dus, dit is vrij storend. 424 00:24:11,080 --> 00:24:13,280 Ik denk dat dit is fascinerend. 425 00:24:13,280 --> 00:24:15,530 Het is een beetje rommelig als je proberen om de schijven te verwisselen, 426 00:24:15,530 --> 00:24:18,090 maar het is echt een cool idee. 427 00:24:18,090 --> 00:24:22,200 >> Dus niet alleen dat, er is een hele hoop werk 428 00:24:22,200 --> 00:24:25,450 gebouwd rond wat we zijn het aanroepen van de Open Compute Project. 429 00:24:25,450 --> 00:24:29,400 En ja, over dat een beetje later. 430 00:24:29,400 --> 00:24:32,740 Maar de industrie begint te beseffen dat de flops per watt 431 00:24:32,740 --> 00:24:33,670 wordt steeds belangrijker. 432 00:24:33,670 --> 00:24:39,256 En jij, als mensen hier, als u het ontwerp van uw algoritmen 433 00:24:39,256 --> 00:24:41,130 en je ontwerp uw code, moet u zich bewust 434 00:24:41,130 --> 00:24:43,620 dat de code kan hebben een domino-effect. 435 00:24:43,620 --> 00:24:48,380 >> Toen Mark zat hier in zijn slaapzaal schrijven van Facebook 1.0, 436 00:24:48,380 --> 00:24:51,050 Ik ben er vrij zeker van dat hij het oog had dat het werd erg groot zullen zijn. 437 00:24:51,050 --> 00:24:54,945 Maar hoe groot het zou zijn op de milieu is een grote dealio. 438 00:24:54,945 --> 00:24:58,340 En zo al YA'LL kon komen met algoritmen 439 00:24:58,340 --> 00:25:01,370 dat de volgende uitdaging kan ding voor mensen zoals ik, 440 00:25:01,370 --> 00:25:02,700 proberen systemen draaien. 441 00:25:02,700 --> 00:25:07,360 >> Dus laten we gewoon na te denken over echte wereldmacht grenzen. 442 00:25:07,360 --> 00:25:09,930 Deze paper van Landauer-- is geen nieuw ding. 443 00:25:09,930 --> 00:25:12,480 1961 deze werd gepubliceerd in het IBM Journal. 444 00:25:12,480 --> 00:25:15,590 Dit is de canonieke "Irreversibiliteit en Warmte 445 00:25:15,590 --> 00:25:17,630 Generatie in de Computing proces. " 446 00:25:17,630 --> 00:25:22,050 En die betoogde machines onvermijdelijk 447 00:25:22,050 --> 00:25:25,070 logistieke functies uit te voeren dat hebben niet één waarde inverse. 448 00:25:25,070 --> 00:25:29,130 >> Zodat het gehele deel van dit is dat terug in de jaren '60, 449 00:25:29,130 --> 00:25:31,890 mensen wisten dat dit zal een probleem. 450 00:25:31,890 --> 00:25:37,080 En zo is de wet van de grenzen zei 25 graden C, een soort van canonieke kamer 451 00:25:37,080 --> 00:25:41,120 temperatuur de grenswaarde vertegenwoordigt 0,1 elektronvolt. 452 00:25:41,120 --> 00:25:44,920 Maar theoretisch is dit de theorie computergeheugen, 453 00:25:44,920 --> 00:25:51,410 werken bij deze limiet kan gewijzigd bij één miljard bits per seconde. 454 00:25:51,410 --> 00:25:54,620 >> Ik weet niet over u, maar niet komen in heel veel een miljard beetjes 455 00:25:54,620 --> 00:25:57,190 een tweede datasnelheid uitwisselingen. 456 00:25:57,190 --> 00:26:01,360 Het argument was dat alleen 2.8 triljoenen van een watt van de macht 457 00:26:01,360 --> 00:26:03,180 zou er steeds worden uitgebreid. 458 00:26:03,180 --> 00:26:08,160 >> Oké, echte wereld example-- dit is mijn elektriciteitsrekening. 459 00:26:08,160 --> 00:26:10,347 Ik ben 65% procent van de dat mooie datacenter 460 00:26:10,347 --> 00:26:11,930 Ik heb laten zien, in dit specifieke moment. 461 00:26:11,930 --> 00:26:15,520 Dit is vorig jaar in juni. 462 00:26:15,520 --> 00:26:21,300 Ik heb een oudere versie genomen, zodat we kan en soort van anonimiseren een beetje. 463 00:26:21,300 --> 00:26:25,470 Ik besteedde $ 45.000 een maand voor energie daar. 464 00:26:25,470 --> 00:26:34,990 >> Dus de reden hiervoor is dat wij hebben meer dan 50.000 processen in de kamer. 465 00:26:34,990 --> 00:26:38,110 Dus kan je je eigen voorstellen residentiële elektriciteitsrekening 466 00:26:38,110 --> 00:26:39,540 is dat hoog? 467 00:26:39,540 --> 00:26:46,180 Maar het was voor een 199 miljoen watt uren meer dan een maand. 468 00:26:46,180 --> 00:26:51,670 >> Dus de vraag die ik stel is, kunt u stel elektriciteitsrekening Mr. Zuckerberg's? 469 00:26:51,670 --> 00:26:54,730 Mijne is vrij groot, en ik worstel. 470 00:26:54,730 --> 00:26:56,600 En ik ben niet de enige die dit is. 471 00:26:56,600 --> 00:26:59,450 Er is een heleboel mensen met grote datacenters. 472 00:26:59,450 --> 00:27:04,800 En dus, denk ik, vol disclosure-- mijn Facebook-vrienden een beetje vreemd. 473 00:27:04,800 --> 00:27:07,900 >> Dus mijn Facebook-vriend is het Prineville datacenter, 474 00:27:07,900 --> 00:27:14,030 dat is een van Facebook's grootste, nieuwste, laagste energie-datacenter. 475 00:27:14,030 --> 00:27:19,360 En ze post voor mij, dat soort dingen machtsgebruik effectiviteit, 476 00:27:19,360 --> 00:27:24,020 zoals in hoe effectief de data centrum versus hoeveel energie je bent 477 00:27:24,020 --> 00:27:26,370 het in het, hoeveel water gebruiken ze, wat is 478 00:27:26,370 --> 00:27:27,810 de vochtigheid en temperatuur. 479 00:27:27,810 --> 00:27:29,980 >> En ze hebben deze mooie, mooie kavels. 480 00:27:29,980 --> 00:27:32,600 Ik denk dat dit een ontzagwekkende Facebook-pagina, 481 00:27:32,600 --> 00:27:35,400 maar ik denk dat ik een beetje raar. 482 00:27:35,400 --> 00:27:39,930 >> Dus een meer macht ding, onderzoek computergebruik dat ik doe 483 00:27:39,930 --> 00:27:44,060 significant verschillend wat Facebook en Yahoo en Google 484 00:27:44,060 --> 00:27:50,020 en andere on-demand, volledig, altijd beschikbare diensten. 485 00:27:50,020 --> 00:27:53,530 En dus heb ik het voordeel dat wanneer ISO Nieuwe England-- en ISO New England 486 00:27:53,530 --> 00:27:58,910 helpt zet de energie tarieven voor de regio. 487 00:27:58,910 --> 00:28:01,110 >> En het zegt dat het zich uitstrekt een verzoek consumenten 488 00:28:01,110 --> 00:28:05,870 om vrijwillig te besparen hoge energie, vanwege de hoge temperaturen en vochtigheid. 489 00:28:05,870 --> 00:28:08,680 En dit was terug op de 18e juli. 490 00:28:08,680 --> 00:28:12,600 En dus ik gelukkig Tweet terug, Hey, ISO New England, Green Harvard. 491 00:28:12,600 --> 00:28:14,880 We doen ons deel boven hier in onderzoek computing. 492 00:28:14,880 --> 00:28:16,760 En dit is omdat we de wetenschap doet. 493 00:28:16,760 --> 00:28:20,380 >> En zo veel als mensen zeggen wetenschap nooit slaapt, kan de wetenschap wachten. 494 00:28:20,380 --> 00:28:25,030 Dus we zijn in staat om tot stilstand brengen onze systemen, profiteren van leerjaar tarieven 495 00:28:25,030 --> 00:28:30,550 op onze energiefactuur, en help in de gehele New England 496 00:28:30,550 --> 00:28:35,910 regio door het afstoten veel megawatt aan belasting. 497 00:28:35,910 --> 00:28:40,020 Dus dat is het unieke ding dat verschilt over wetenschappelijke berekeningen gegevens 498 00:28:40,020 --> 00:28:48,890 centra en die zijn in volle productie 24/7. 499 00:28:48,890 --> 00:28:51,670 >> Dus laten we gewoon een andere versnelling hier. 500 00:28:51,670 --> 00:28:55,170 Dus, ik wil bespreken chaos een beetje. 501 00:28:55,170 --> 00:28:59,900 En ik wil het in te zetten auspiciën van de opslag. 502 00:28:59,900 --> 00:29:03,150 Dus voor degenen dergelijke van worstelden 503 00:29:03,150 --> 00:29:08,680 krijgen van hun hoofd rond wat petabytes van opslag uitzien, dit een voorbeeld. 504 00:29:08,680 --> 00:29:11,660 En dit is het soort dingen Ik omgaan met de hele tijd. 505 00:29:11,660 --> 00:29:15,550 >> Elk van deze kleine jongens is een vier terabyte harde schijf, 506 00:29:15,550 --> 00:29:17,420 dus je kunt soort tellen ze op. 507 00:29:17,420 --> 00:29:21,370 We krijgen nu tussen men 1 en 1/2 petabytes 508 00:29:21,370 --> 00:29:22,970 in een industrie standaard rack. 509 00:29:22,970 --> 00:29:26,430 En we hebben kamers en kamers, zoals u zag in dat eerdere foto met John 510 00:29:26,430 --> 00:29:31,230 en ik, vol van deze rekken van de apparatuur. 511 00:29:31,230 --> 00:29:40,400 Dus het is steeds zeer, zeer gemakkelijk tot massale storage arrays te bouwen 512 00:29:40,400 --> 00:29:44,140 >> Het is meestal eenvoudig binnenkant van Unix naar soort tellen hoe de dingen gaan. 513 00:29:44,140 --> 00:29:48,270 Dus dit is het tellen hoeveel MAU punten heb ik daar aankwam. 514 00:29:48,270 --> 00:29:50,880 Dus dat is 423 onderscheppen punten. 515 00:29:50,880 --> 00:29:55,660 En dan als ik zonder enige schetsmatig awk, I kan oplopen, in dit systeem, 516 00:29:55,660 --> 00:29:59,080 er was 7,3 petabytes van de beschikbare opslagruimte. 517 00:29:59,080 --> 00:30:01,350 >> Dus dat is een heleboel dingen. 518 00:30:01,350 --> 00:30:03,030 En opslag is echt moeilijk. 519 00:30:03,030 --> 00:30:06,850 En toch, om wat voor reden, Dit is een industrie trend. 520 00:30:06,850 --> 00:30:11,500 Wanneer ik praat met onze onderzoekers en onze faculteit en zeggen: 521 00:30:11,500 --> 00:30:14,180 hey, ik kan opslag rennen voor je. 522 00:30:14,180 --> 00:30:17,690 Helaas, ik moet de kosten van de opslag herstellen. 523 00:30:17,690 --> 00:30:19,430 Ik krijg deze business. 524 00:30:19,430 --> 00:30:23,300 En mensen verwijzen Newegg of ze verwijzen naar Staples 525 00:30:23,300 --> 00:30:27,040 of hoeveel ze een kunnen kopen enkele terabyte schijf voor. 526 00:30:27,040 --> 00:30:29,390 >> Dus dit zul je merken hier, dat er een aanwijzing. 527 00:30:29,390 --> 00:30:31,310 Er is één schijf hier. 528 00:30:31,310 --> 00:30:33,290 En als we terug gaan, ik heb veel. 529 00:30:33,290 --> 00:30:36,130 Niet alleen heb ik veel, ik heb verfijnde interconnects 530 00:30:36,130 --> 00:30:38,750 kunnen stikken deze dingen samen. 531 00:30:38,750 --> 00:30:44,080 Dus het risico in verband met deze grote storage arrays is niet onbelangrijk. 532 00:30:44,080 --> 00:30:46,370 >> In feite hebben we de internet en we schreven 533 00:30:46,370 --> 00:30:51,670 een klein verhaal over een goedbedoelende, zachtaardige directeur van het onderzoek 534 00:30:51,670 --> 00:30:54,640 computerwerk toevallig een hebben vreemd Engels accent-- proberen 535 00:30:54,640 --> 00:30:59,930 uit te leggen aan een onderzoeker wat de geen underscore backup-map eigenlijk 536 00:30:59,930 --> 00:31:01,070 betekende. 537 00:31:01,070 --> 00:31:05,690 Het was een lange, klein verhaal, een goede vier minuten van de ontdekking. 538 00:31:05,690 --> 00:31:09,380 >> En nota, ik heb een vreselijke veel minder ruimte in dan de dame 539 00:31:09,380 --> 00:31:11,800 dat zingt over alle bas. 540 00:31:11,800 --> 00:31:13,910 We zijn een flink aantal rekeningen lager. 541 00:31:13,910 --> 00:31:16,160 Maar goed, dit is een belangrijk ding om te denken, 542 00:31:16,160 --> 00:31:18,532 in termen van wat er mis zou kunnen gaan. 543 00:31:18,532 --> 00:31:20,990 Dus als ik een schijf, en Ik gooi het in een Unix machine, 544 00:31:20,990 --> 00:31:24,300 en ik begin het schrijven van dingen die er te, er is een magneet, is er een drive hoofd, 545 00:31:24,300 --> 00:31:30,150 er ogenschijnlijk, één of nul opgeschreven op dat apparaat. 546 00:31:30,150 --> 00:31:32,180 >> Motors-- spinny, warrige dingen altijd te breken. 547 00:31:32,180 --> 00:31:33,490 Denk na over de dingen die breken. 548 00:31:33,490 --> 00:31:35,170 Het is altijd spinny geweest, twirly dingen. 549 00:31:35,170 --> 00:31:38,560 Printers, harde schijven, motorvoertuigen, enz. 550 00:31:38,560 --> 00:31:40,590 Alles wat beweegt is waarschijnlijk te breken. 551 00:31:40,590 --> 00:31:42,575 >> Dus je moet motoren, je moeten rijden firmware, 552 00:31:42,575 --> 00:31:47,110 je nodig hebt SAS / SATA-controllers, draden, firmware op de SAS / SATA controllers, 553 00:31:47,110 --> 00:31:48,530 lage niveau blokken. 554 00:31:48,530 --> 00:31:54,580 Kies uw storage controller bestand systeem code, welke men het ook mag zijn, 555 00:31:54,580 --> 00:31:56,780 hoe je samen dingen te stikken. 556 00:31:56,780 --> 00:32:00,956 En virtuele geheugen manager pagina's, DRAM halen en winkels. 557 00:32:00,956 --> 00:32:02,705 Dan, een ander krijg je stack, dat is een soort 558 00:32:02,705 --> 00:32:05,440 van onderaan de lijst op deze één algoritmen gebruikers. 559 00:32:05,440 --> 00:32:09,050 >> En als je dit vermenigvuldigen up, ik weet niet hoeveel, 560 00:32:09,050 --> 00:32:11,640 er is een heleboel plaatsen waar spullen opzij kan gaan. 561 00:32:11,640 --> 00:32:14,430 Ik bedoel, dat is een voorbeeld over wiskunde. 562 00:32:14,430 --> 00:32:18,070 Maar het is wel leuk om te denken van hoeveel manieren dingen kunnen fout gaan, 563 00:32:18,070 --> 00:32:21,650 alleen voor een schijf. 564 00:32:21,650 --> 00:32:25,440 We zitten al op 300 petabytes, dus stel het aantal schijven 565 00:32:25,440 --> 00:32:27,741 je nodig hebt van 300 petabytes dat mis kan gaan. 566 00:32:27,741 --> 00:32:28,240 567 00:32:28,240 --> 00:32:30,390 Niet alleen dat-- dus dat is opslag. 568 00:32:30,390 --> 00:32:34,220 En dat zinspeelt op de persoon die ik graag zou willen zien 569 00:32:34,220 --> 00:32:38,780 Links op het podium, die is de Chaos Monkey. 570 00:32:38,780 --> 00:32:43,140 Dus op een gegeven moment, het wordt nog groter dan alleen de schijf 571 00:32:43,140 --> 00:32:43,920 probleem. 572 00:32:43,920 --> 00:32:50,610 >> En ja, deze fijne dames en heren die lopen een streaming video service 573 00:32:50,610 --> 00:32:55,430 besefte dat hun computers waren ook enorm en ook zeer ingewikkeld 574 00:32:55,430 --> 00:33:00,010 en het leveren van diensten om een ​​vreselijke veel mensen. 575 00:33:00,010 --> 00:33:05,180 Ze hebben 37 miljoen members-- en van deze dia misschien een jaar of zo old-- 576 00:33:05,180 --> 00:33:07,350 duizenden apparaten. 577 00:33:07,350 --> 00:33:10,810 Er zijn miljarden uur video. 578 00:33:10,810 --> 00:33:13,600 Ze inloggen miljarden gebeurtenissen per dag. 579 00:33:13,600 --> 00:33:17,330 >> En je kunt zien, de meeste mensen kijken de televisie later op de avond, 580 00:33:17,330 --> 00:33:19,429 en het veel zwaarder weegt dan alles. 581 00:33:19,429 --> 00:33:21,220 En ja, ze wilden in staat zijn om ervoor te zorgen 582 00:33:21,220 --> 00:33:24,854 dat de service was boven en betrouwbaar en werken voor hen. 583 00:33:24,854 --> 00:33:27,020 Dus kwamen ze met dit ding genaamd Chaos Monkey. 584 00:33:27,020 --> 00:33:29,000 Het is stukje software die, wanneer je denkt 585 00:33:29,000 --> 00:33:34,190 over praten over de titel deze gehele presentatie 586 00:33:34,190 --> 00:33:36,530 scale-out betekent dat je moet dit spul te testen. 587 00:33:36,530 --> 00:33:38,585 Het is niet goed gewoon een miljoen machines. 588 00:33:38,585 --> 00:33:40,460 Dus het leuke van dit is, Chaos Monkey 589 00:33:40,460 --> 00:33:43,090 is een dienst die nauwkeurig groepen systemen 590 00:33:43,090 --> 00:33:47,220 en één willekeurig eindigt van de systemen in een groep. 591 00:33:47,220 --> 00:33:48,429 Geweldig. 592 00:33:48,429 --> 00:33:50,220 Dus ik weet niet over u, maar als ik ooit heb 593 00:33:50,220 --> 00:33:52,990 bouwde een systeem dat berust op andere systemen met elkaar praten, 594 00:33:52,990 --> 00:33:55,865 u een van hen uit, de waarschijnlijkheid van het hele ding werken, 595 00:33:55,865 --> 00:33:57,130 snel af. 596 00:33:57,130 --> 00:34:00,475 >> En dus dit stukje software draait rond Netflix infrastructuur. 597 00:34:00,475 --> 00:34:03,100 Gelukkig, het zegt dat het draait alleen in kantooruren met de bedoeling 598 00:34:03,100 --> 00:34:05,810 dat de ingenieurs zullen zijn alert en in staat om te reageren. 599 00:34:05,810 --> 00:34:08,020 Dit zijn dus de types van de dingen die we zijn nu 600 00:34:08,020 --> 00:34:13,360 hoeft te doen om onze computers perturb omgevingen, om chaos te introduceren 601 00:34:13,360 --> 00:34:15,739 en compliceren. 602 00:34:15,739 --> 00:34:19,139 >> Dus wie, in hun recht achterhoofd, zou vrijwillig kiezen 603 00:34:19,139 --> 00:34:22,540 om te werken met een Chaos Monkey? 604 00:34:22,540 --> 00:34:24,150 Wacht even, lijkt hij te wijzen mij. 605 00:34:24,150 --> 00:34:28,719 Nou, ik denk dat ik should-- schattig. 606 00:34:28,719 --> 00:34:32,909 Maar het probleem is dat je hoeft de keuze niet te krijgen. 607 00:34:32,909 --> 00:34:37,440 De Chaos Monkey, zoals u kunt zien, kiest u. 608 00:34:37,440 --> 00:34:42,650 >> En dit is het probleem met computers op schaal is dat je dit niet kunt vermijden. 609 00:34:42,650 --> 00:34:49,989 Het is een onvermijdelijkheid van complexiteit en van de schaal en van onze evolutie, 610 00:34:49,989 --> 00:34:53,280 in sommige opzichten, van de informatica deskundigheid. 611 00:34:53,280 --> 00:34:55,510 En vergeet niet, dit is een ding om te onthouden, 612 00:34:55,510 --> 00:35:00,030 Chaos Monkeys liefde snowflakes-- liefde sneeuwvlokken. 613 00:35:00,030 --> 00:35:03,470 Een snowflake-- we hebben verklaard de Chaos Monkey-- maar een sneeuwvlok 614 00:35:03,470 --> 00:35:09,630 is een server die uniek is en bijzondere en delicate en individuele 615 00:35:09,630 --> 00:35:11,770 en zal nooit worden gereproduceerd. 616 00:35:11,770 --> 00:35:14,790 >> We sneeuwvlok vinden vaak dienst in onze omgeving. 617 00:35:14,790 --> 00:35:16,700 En we altijd proberen en smelten sneeuwvlok service. 618 00:35:16,700 --> 00:35:18,880 Maar als je een server te vinden in uw omgeving 619 00:35:18,880 --> 00:35:23,240 die kritisch is voor de levensduur van uw organisatie en het smelt, 620 00:35:23,240 --> 00:35:25,300 je kan het niet weer in elkaar. 621 00:35:25,300 --> 00:35:28,071 Dus job Chaos Monkey's was om gaan en gevallen te beëindigen. 622 00:35:28,071 --> 00:35:30,820 Als de Chaos Monkey smelt de sneeuwvlok, je bent meer dan, je bent klaar. 623 00:35:30,820 --> 00:35:34,390 624 00:35:34,390 --> 00:35:37,950 Ik wil praten over sommige hardware die we 625 00:35:37,950 --> 00:35:40,415 zien in termen van soort scale-out activiteiten ook. 626 00:35:40,415 --> 00:35:43,810 En een aantal unieke dingen die in en rond de wetenschap activiteit. 627 00:35:43,810 --> 00:35:46,990 We beginnen nu te zien, onthouden Deze eenheid van onderwerp, dit rek? 628 00:35:46,990 --> 00:35:51,780 Dus dit is een rek van GPGPUs-- zo algemeen doel graphics processing units. 629 00:35:51,780 --> 00:35:55,790 >> Wij hebben deze in onze gegevens centrum, 100 of zo mijl afstand. 630 00:35:55,790 --> 00:35:59,780 Deze bijzondere rek is ongeveer 96 tera FLOPS 631 00:35:59,780 --> 00:36:04,090 van enkele precisie wiskunde staat te bevrijden uit de achterkant van het. 632 00:36:04,090 --> 00:36:10,530 En we hebben het oog 130-tal kaarten in een geval 633 00:36:10,530 --> 00:36:16,620 dat we-- meerdere rekken van deze instantie. 634 00:36:16,620 --> 00:36:22,730 >> Dus dit is interessant in de zin dat het algemene doel grafische processen 635 00:36:22,730 --> 00:36:27,880 zijn in staat om wiskunde ongelooflijk doen snel voor zeer lage hoeveelheden energie. 636 00:36:27,880 --> 00:36:32,060 Dus er is een grote stijging in de wetenschappelijke berekeningen gebieden, 637 00:36:32,060 --> 00:36:36,400 kijken grafiek processing units in een grote weg. 638 00:36:36,400 --> 00:36:41,990 >> Dus ik liep wat Mcollective via onze marionet infrastructuur 639 00:36:41,990 --> 00:36:45,330 gisteren, erg enthousiast over deze. 640 00:36:45,330 --> 00:36:48,260 slechts kort van een petaflop van enkele precisie. 641 00:36:48,260 --> 00:36:52,440 Gewoon om hier, dit duidelijk zijn kleine multiplier is 3.95. 642 00:36:52,440 --> 00:36:54,820 Dubbele precisie wiskunde ongeveer 1,2 zou zijn, 643 00:36:54,820 --> 00:36:57,010 maar mijn Twitter-feed keek veel beter als ik 644 00:36:57,010 --> 00:37:02,670 zei dat we moesten bijna een petaflop van enkele precisie GPGPUs. 645 00:37:02,670 --> 00:37:04,220 >> Maar het wordt steeds daar. 646 00:37:04,220 --> 00:37:06,280 Het krijgen van te zijn zeer, zeer indrukwekkend. 647 00:37:06,280 --> 00:37:08,550 En waarom doen we dit? 648 00:37:08,550 --> 00:37:11,570 Omdat quantum chemie, onder andere, 649 00:37:11,570 --> 00:37:15,300 maar we beginnen te ontwerpen een aantal nieuwe zonne-energie. 650 00:37:15,300 --> 00:37:20,210 >> En zo Alan Aspuru-Guzik, wie is een professor in chemistry-- mijn partner 651 00:37:20,210 --> 00:37:22,390 in crime-- voor de laatste paar jaar. 652 00:37:22,390 --> 00:37:25,660 We zijn het indrukken van de envelop op het computergebruik. 653 00:37:25,660 --> 00:37:30,250 En de GPGPU is ideaal technologie kunnen doen 654 00:37:30,250 --> 00:37:34,760 een heleboel ingewikkelde wiskunde, zeer, zeer snel. 655 00:37:34,760 --> 00:37:36,750 >> Dus met schaal, komt nieuwe uitdagingen. 656 00:37:36,750 --> 00:37:41,070 Zo groot scale-- je moet voorzichtig hoe je dit spul draad. 657 00:37:41,070 --> 00:37:45,300 En we hebben bepaalde niveaus van obsessief-compulsieve stoornis. 658 00:37:45,300 --> 00:37:49,530 Deze foto's waarschijnlijk rijden veel mensen noten. 659 00:37:49,530 --> 00:37:53,390 En kasten die niet zijn bijzonder goed bedraad 660 00:37:53,390 --> 00:37:56,050 drijven ons netwerk en faciliteiten ingenieurs noten. 661 00:37:56,050 --> 00:37:58,620 Plus er is ook de luchtstroom kwesties die je moet bevatten. 662 00:37:58,620 --> 00:38:01,430 >> Dus dit zijn dingen die ik zou nooit hebben gedacht. 663 00:38:01,430 --> 00:38:03,480 Met schaal, komt meer complexiteit. 664 00:38:03,480 --> 00:38:05,869 Dit is een nieuw type bestandssysteem. 665 00:38:05,869 --> 00:38:06,410 Het is geweldig. 666 00:38:06,410 --> 00:38:07,660 Het is een petabyte. 667 00:38:07,660 --> 00:38:09,905 Het kan 1,1 miljard bestanden op te slaan. 668 00:38:09,905 --> 00:38:15,940 Het kan lezen en schrijven naar 13 gigabyte en 20 gigabyte een second-- gigabyte 669 00:38:15,940 --> 00:38:17,150 een tweede. 670 00:38:17,150 --> 00:38:20,900 Dus het kan terabytes lossen in geen tijd bij allen. 671 00:38:20,900 --> 00:38:22,070 >> En het is een hoge beschikbaarheid. 672 00:38:22,070 --> 00:38:26,989 En het heeft geweldige lookup rates-- 220.000 lookups een tweede. 673 00:38:26,989 --> 00:38:29,780 En er zijn veel verschillende mensen het opbouwen van dit soort systemen. 674 00:38:29,780 --> 00:38:32,830 En je kunt het hier grafisch zien. 675 00:38:32,830 --> 00:38:35,800 Dit is een van onze bestandssystemen dat onder belasting vrij 676 00:38:35,800 --> 00:38:41,250 gelukkig lezen op slechts korte van 22 gigabytes per seconde. 677 00:38:41,250 --> 00:38:42,790 Dus dat is cool-- zo complexiteit. 678 00:38:42,790 --> 00:38:47,230 >> Dus met complexiteit en schaal, komt meer complexiteit, toch? 679 00:38:47,230 --> 00:38:51,830 Dit is één van onze vele, vele netwerk diagrammen, 680 00:38:51,830 --> 00:38:54,970 waar je veel hebt chassis alle ondersteunende up 681 00:38:54,970 --> 00:38:57,730 in een van de belangrijkste core-switch, verbonden opslag, 682 00:38:57,730 --> 00:39:00,731 verbinden met lage latency interconnects. 683 00:39:00,731 --> 00:39:03,605 En dan deze zijde van de huis, is gewoon al het beheer 684 00:39:03,605 --> 00:39:09,740 die je nodig hebt om te kunnen pakken deze systemen vanaf een externe locatie. 685 00:39:09,740 --> 00:39:12,070 Dus schaal heeft veel complexiteit mee. 686 00:39:12,070 --> 00:39:14,910 687 00:39:14,910 --> 00:39:17,785 >> Veranderen versnelling weer, laten we terug gaan en hebben een plekje van de wetenschap. 688 00:39:17,785 --> 00:39:21,450 Dus vergeet niet, onderzoek computing en dit kleine shim-- 689 00:39:21,450 --> 00:39:25,310 kleine roze shim tussen de faculteit en al hun algoritmes 690 00:39:25,310 --> 00:39:30,650 en alle koele wetenschap en alle deze stroom en koeling en datacenter 691 00:39:30,650 --> 00:39:35,330 vloer en netwerken en grote computers en servicedesks en helpdesks 692 00:39:35,330 --> 00:39:39,330 en zo forth-- en ja, we zijn gewoon Deze kleine vulring tussen hen. 693 00:39:39,330 --> 00:39:42,820 >> Wat zijn we begonnen aan zien is dat de wereld 694 00:39:42,820 --> 00:39:45,730 in staat geweest om te bouwen deze grote datacenters 695 00:39:45,730 --> 00:39:48,020 en in staat zijn om te bouwen deze grote computers. 696 00:39:48,020 --> 00:39:49,420 We hebben gekregen behoorlijk goed in. 697 00:39:49,420 --> 00:39:53,600 Wat we niet erg goed in is dit weinig shim tussen het onderzoek 698 00:39:53,600 --> 00:39:56,670 en de kale metaal en de technologie. 699 00:39:56,670 --> 00:39:58,600 En het is moeilijk. 700 00:39:58,600 --> 00:40:03,330 >> En zo hebben we in staat om te huren geweest mensen die in deze wereld leeft. 701 00:40:03,330 --> 00:40:07,590 En meer recent, spraken we met de National Science Foundation en zei: 702 00:40:07,590 --> 00:40:11,440 deze schaal-out spul is geweldig, maar we kunnen niet onze wetenschappers krijgen 703 00:40:11,440 --> 00:40:13,690 Op deze grote ingewikkelde machines. 704 00:40:13,690 --> 00:40:16,040 Dus, zijn er een aantal verschillende programma's 705 00:40:16,040 --> 00:40:20,100 waar we echt meestal waren bezorgd over het proberen 706 00:40:20,100 --> 00:40:22,800 om te zien of we kunnen transformeren de campus infrastructuur. 707 00:40:22,800 --> 00:40:25,850 >> Er zijn veel programma rond nationale centra. 708 00:40:25,850 --> 00:40:28,300 En dus, onszelf, onze vrienden in Clemson, 709 00:40:28,300 --> 00:40:32,620 University of Wisconsin Madison, Zuid-Californië, Utah, en Hawaii 710 00:40:32,620 --> 00:40:35,780 soort bij elkaar om kijken naar dit probleem. 711 00:40:35,780 --> 00:40:39,340 En deze kleine grafiek hier is de lange staart van de wetenschap. 712 00:40:39,340 --> 00:40:41,602 >> Dus dit is-- het niet Ongeacht wat er op deze as, 713 00:40:41,602 --> 00:40:45,485 maar deze as is eigenlijk nummer banen gaan door de cluster. 714 00:40:45,485 --> 00:40:48,940 Dus er is 350.000 meer dan welke periode. 715 00:40:48,940 --> 00:40:51,730 Dit zijn onze gebruikelijke verdachten langs de bodem in. 716 00:40:51,730 --> 00:40:55,992 In feite is er Alan Aspuru-Guzik, wie we waren gewoon te praten about-- ton 717 00:40:55,992 --> 00:40:58,700 en ton van compute, echt effectief, weet wat hij doet. 718 00:40:58,700 --> 00:41:02,840 >> Hier is nog een lab dat ik zal praten over in een moment-- John Kovac's lab. 719 00:41:02,840 --> 00:41:03,610 Ze hebben het. 720 00:41:03,610 --> 00:41:04,210 Ze zijn goed. 721 00:41:04,210 --> 00:41:04,830 Ze zijn blij. 722 00:41:04,830 --> 00:41:05,960 Ze berekenen. 723 00:41:05,960 --> 00:41:07,664 Grote wetenschap wordt steeds gedaan. 724 00:41:07,664 --> 00:41:09,580 En dan, als je soort hier van beneden komen, er 725 00:41:09,580 --> 00:41:12,110 zijn andere groepen die lopen niet veel banen. 726 00:41:12,110 --> 00:41:13,410 >> En waarom is dat? 727 00:41:13,410 --> 00:41:15,080 Is het omdat de computing is te hard? 728 00:41:15,080 --> 00:41:19,580 Is het omdat ze niet weten hoe? 729 00:41:19,580 --> 00:41:22,880 We weten het niet, omdat we zijn gegaan en keek. 730 00:41:22,880 --> 00:41:25,620 En dus dat is wat deze project is alles over, 731 00:41:25,620 --> 00:41:27,830 is lokaal, binnen elk van deze regio's, 732 00:41:27,830 --> 00:41:32,660 om te zoeken naar wegen waar we kunnen gaan met de docenten en onderzoekers 733 00:41:32,660 --> 00:41:36,400 daadwerkelijk de onderkant van de staart, en te begrijpen wat ze doen. 734 00:41:36,400 --> 00:41:37,920 >> Dus dat is iets dat we eigenlijk gepassioneerd over. 735 00:41:37,920 --> 00:41:39,920 En dat is iets dat wetenschap zal niet doorgaan 736 00:41:39,920 --> 00:41:44,260 om vooruit te gaan totdat we lossen sommige extreme gevallen. 737 00:41:44,260 --> 00:41:46,590 Andere stukjes van de wetenschap dat gaat up-- iedereen 738 00:41:46,590 --> 00:41:48,260 gezien de Large Hadron Collider. 739 00:41:48,260 --> 00:41:49,540 Geweldig, toch? 740 00:41:49,540 --> 00:41:52,960 Dit spul liep allen in Holyoke. 741 00:41:52,960 --> 00:41:56,510 We Gebouwd- de allereerste wetenschap dat gebeurde in Holyoke 742 00:41:56,510 --> 00:41:59,130 was de samenwerking tussen onszelf en de Boston University. 743 00:41:59,130 --> 00:42:01,510 Dus het is echt, echt cool. 744 00:42:01,510 --> 00:42:04,410 >> Dit is een leuk stuk van de wetenschap voor de schaal. 745 00:42:04,410 --> 00:42:07,650 Dit is een digitale toegang tot een hemel eeuw op Harvard. 746 00:42:07,650 --> 00:42:09,170 Kortom, het is een bord archief. 747 00:42:09,170 --> 00:42:13,350 Als je naar beneden gaan Oxford-- Garden Street, sorry, 748 00:42:13,350 --> 00:42:16,560 u zult één van de sterrenwacht vinden gebouwen principe vol 749 00:42:16,560 --> 00:42:19,480 van ongeveer een half miljoen platen. 750 00:42:19,480 --> 00:42:24,410 >> En dit zijn foto's van de hemel 's nachts, meer dan 100 jaar. 751 00:42:24,410 --> 00:42:28,760 Dus er is een hele rig opgezet hier om die platen te digitaliseren, 752 00:42:28,760 --> 00:42:32,100 foto's van hen te nemen, registreren ze, leg ze op een computer. 753 00:42:32,100 --> 00:42:36,410 En dat is een petabyte en een half, gewoon recht er-- een kleinschalig project. 754 00:42:36,410 --> 00:42:37,530 >> Dit zijn andere projecten. 755 00:42:37,530 --> 00:42:42,800 Dit Pan-STARRS project aan het doen is een volledige breed panoramisch overzicht, 756 00:42:42,800 --> 00:42:47,390 op zoek naar de buurt van de aarde asteroïden en voorbijgaande hemelse gebeurtenissen. 757 00:42:47,390 --> 00:42:52,100 Als een moleculair biofysicus, ik hou het woord voorbijgaande astronomische gebeurtenis. 758 00:42:52,100 --> 00:42:55,050 Ik ben niet helemaal zeker wat het is, maar hoe dan ook, we zijn op zoek naar hen. 759 00:42:55,050 --> 00:43:00,372 >> En we zijn het genereren van 30 terabyte een avondje uit van die telescopen. 760 00:43:00,372 --> 00:43:03,330 En dat is niet echt een bandbreedte probleem, dat is als een FedEx probleem. 761 00:43:03,330 --> 00:43:08,420 Dus je zet de opslag op het busje en u deze sturen wat het ook is. 762 00:43:08,420 --> 00:43:10,570 >> BICEP is echt interesting-- dus achtergrond beeldvorming 763 00:43:10,570 --> 00:43:13,850 van kosmische extra galactische polarisatie. 764 00:43:13,850 --> 00:43:16,880 Toen ik voor het eerst begon te werken aan de Harvard zeven of zo, 765 00:43:16,880 --> 00:43:21,440 acht jaar geleden, ik herinner me werken aan dit project 766 00:43:21,440 --> 00:43:26,010 en het heeft niet echt zinken thuis waarom gepolariseerd licht 767 00:43:26,010 --> 00:43:29,770 van de kosmische microgolf achtergrond zou belangrijk zijn, 768 00:43:29,770 --> 00:43:30,800 totdat dit gebeurde. 769 00:43:30,800 --> 00:43:34,580 >> En dit was John Kovac, wie ik sprak eerder, 770 00:43:34,580 --> 00:43:42,030 met behulp van miljoenen CPU uur, in onze faciliteit en anderen, 771 00:43:42,030 --> 00:43:46,600 in principe staren binnen van de eerste momenten van het universum 772 00:43:46,600 --> 00:43:49,150 na de Big Bang, en proberen te begrijpen 773 00:43:49,150 --> 00:43:51,290 Algemene theorie van Einstein's relativiteitstheorie. 774 00:43:51,290 --> 00:43:56,040 Het is geest waait dat onze computers helpen ons te ontrafelen en staren 775 00:43:56,040 --> 00:43:59,280 in de zeer oorsprong van waarom we hier zijn. 776 00:43:59,280 --> 00:44:03,450 >> Dus als je praat over schaal, dit is een serieuze schaal. 777 00:44:03,450 --> 00:44:09,260 Het andere ding van de schaal is, dat bepaald project raakte deze jongens. 778 00:44:09,260 --> 00:44:15,320 En dit is de respons curve voor BICEP [Onverstaanbaar] Dit was onze kleine enquête. 779 00:44:15,320 --> 00:44:19,220 >> En je kunt hier zien, het leven was goed tot ongeveer hier, 780 00:44:19,220 --> 00:44:21,200 die wanneer de aankondiging kwam. 781 00:44:21,200 --> 00:44:24,120 En je hebt letterlijk gekregen seconden nodig 782 00:44:24,120 --> 00:44:29,020 te worden opgeschaald gebeurtenis die komt overeen met deze kleine stip hier, 783 00:44:29,020 --> 00:44:32,200 die eindigde verschuiven vier of zo terabytes aan gegevens 784 00:44:32,200 --> 00:44:36,370 via de webserver dat dag-- behoorlijk behaard. 785 00:44:36,370 --> 00:44:38,210 >> En, dit zijn de soorten dingen die 786 00:44:38,210 --> 00:44:43,040 je kan overkomen in uw infrastructuur als je het niet te ontwerpen voor schaal. 787 00:44:43,040 --> 00:44:45,630 We hadden een beetje een klauteren die dag te zijn 788 00:44:45,630 --> 00:44:50,440 kunnen overspannen out genoeg webservice om de site up and running te houden. 789 00:44:50,440 --> 00:44:53,399 En we waren succesvol. 790 00:44:53,399 --> 00:44:55,190 Dit is een klein e-mail dat is een soort van schattig. 791 00:44:55,190 --> 00:45:00,245 Dit is een mail te sturen naar Mark Vogelsberger, en Lars Hernquist, wie is 792 00:45:00,245 --> 00:45:02,650 een lid van de faculteit hier op Harvard. 793 00:45:02,650 --> 00:45:03,570 Meer over Mark later. 794 00:45:03,570 --> 00:45:05,990 Maar ik denk dat dit een soort van vat soort 795 00:45:05,990 --> 00:45:09,920 van waar de computer- is in onderzoek computing. 796 00:45:09,920 --> 00:45:12,070 Hey, team, sinds afgelopen Dinsdag, jullie pijnigde 797 00:45:12,070 --> 00:45:15,470 meer dan 28% van de nieuwe cluster, die in combinatie 798 00:45:15,470 --> 00:45:20,040 is meer dan 78 jaar CPU in slechts drie dagen. 799 00:45:20,040 --> 00:45:22,502 En ik zei, het is nog steeds pas vrijdagochtend. 800 00:45:22,502 --> 00:45:23,460 Dit is pretty awesome! 801 00:45:23,460 --> 00:45:24,740 Fijne Vrijdag! 802 00:45:24,740 --> 00:45:27,450 >> Dan geef ik ze de gegevens punten. 803 00:45:27,450 --> 00:45:30,260 En dus dat was min of meer interessant. 804 00:45:30,260 --> 00:45:34,840 Dus vergeet niet over Mark, komt hij terug in de foto in een klein beetje. 805 00:45:34,840 --> 00:45:36,935 Dus scale-out computing is overal. 806 00:45:36,935 --> 00:45:41,080 >> We zijn zelfs helpen mensen kijken naar hoe de NBA-functies, 807 00:45:41,080 --> 00:45:43,140 en waar mensen zijn het gooien van ballen uit. 808 00:45:43,140 --> 00:45:47,580 Ik begrijp niet echt dit spel ook goed, maar schijnbaar, het is een big deal. 809 00:45:47,580 --> 00:45:50,610 Er is hoepels en kommen en geld. 810 00:45:50,610 --> 00:45:55,300 >> En ja, onze database, wij bouwde een kleine 500 [onverstaanbaar] 811 00:45:55,300 --> 00:45:58,170 parallelle processor cluster, een paar terabytes aan RAM-geheugen, 812 00:45:58,170 --> 00:46:03,590 om dit te kunnen bouwen voor Kirk en zijn team. 813 00:46:03,590 --> 00:46:08,524 En ze informatica doen in een heel andere manier. 814 00:46:08,524 --> 00:46:10,440 Nu is dit project zijn we betrokken bij dat 815 00:46:10,440 --> 00:46:14,880 absoluut fascinerend, rond neurale plasticiteit connectomics en genomische 816 00:46:14,880 --> 00:46:20,960 imprinting-- drie zeer zware raken onderzoeksgebieden 817 00:46:20,960 --> 00:46:24,650 dat we vechten met op een dag-tot-dag basis. 818 00:46:24,650 --> 00:46:30,670 Het idee dat onze hersenen zijn onder plastische spanning als we jong zijn. 819 00:46:30,670 --> 00:46:34,980 En veel van onze volwassen gedrag is gebeeldhouwd door ervaring in de kinderschoenen. 820 00:46:34,980 --> 00:46:37,040 Dus dit is een grote dealio. 821 00:46:37,040 --> 00:46:41,360 >> En dus is dit werk dat wordt gefinancierd door de National Institutes of Mental Health. 822 00:46:41,360 --> 00:46:46,860 En we proberen om in principe, door middel van een heleboel grote data 823 00:46:46,860 --> 00:46:51,970 en big data-analyse, soort van peer in ons menselijk brein 824 00:46:51,970 --> 00:46:54,870 via verschillende verschillende technieken. 825 00:46:54,870 --> 00:47:00,360 >> Dus ik wilde stoppen en soort gewoon pauzeren voor een klein ogenblik. 826 00:47:00,360 --> 00:47:04,160 De uitdaging met afstandsbediening datacenters is het is ver weg. 827 00:47:04,160 --> 00:47:05,520 Het kan onmogelijk werken. 828 00:47:05,520 --> 00:47:07,590 Ik heb mijn gegevens in de buurt. 829 00:47:07,590 --> 00:47:10,730 Ik moet mijn onderzoek te doen in mijn lab. 830 00:47:10,730 --> 00:47:18,620 >> En dus nam ik een soort van voorbeeld van een functionele magnetische resonantie imaging 831 00:47:18,620 --> 00:47:22,260 dataset van onze data centrum in West-Mass. 832 00:47:22,260 --> 00:47:24,660 en aangesloten op mijn desktop in Cambridge. 833 00:47:24,660 --> 00:47:27,440 En ik zal deze kleine video af te spelen. 834 00:47:27,440 --> 00:47:29,750 Hopelijk zal het soort werk. 835 00:47:29,750 --> 00:47:33,480 >> Dus dit is me gaan door het controleren van mijn GPU's werken. 836 00:47:33,480 --> 00:47:35,430 En ik ben het controleren dat VNC omhoog. 837 00:47:35,430 --> 00:47:36,810 En dit is een slimme VNC. 838 00:47:36,810 --> 00:47:38,970 Dit is een VNC met 3D-stukken. 839 00:47:38,970 --> 00:47:41,975 En dus, zoals je binnenkort kunt zien, is dit is mij spinning deze hersenen rond. 840 00:47:41,975 --> 00:47:44,460 Ik ben op zoek naar soort krijgen het gericht. 841 00:47:44,460 --> 00:47:49,574 En dan kan ik door vele verhuizen verschillende segmenten van MRI gegevens. 842 00:47:49,574 --> 00:47:51,490 En het enige wat dat is verschillend over dit 843 00:47:51,490 --> 00:47:55,160 is, het komt over de draad uit West-Mass. op mijn bureaublad. 844 00:47:55,160 --> 00:47:57,300 En haar rendering sneller dan mijn desktop, 845 00:47:57,300 --> 00:48:02,840 want ik heb geen $ 4000 grafische kaart in mijn desktop, die 846 00:48:02,840 --> 00:48:04,262 We hebben uit West-Mass. 847 00:48:04,262 --> 00:48:05,720 Natuurlijk, ik probeer slim te zijn. 848 00:48:05,720 --> 00:48:08,859 Ik ben actief GLX versnellingen in de achtergrond, terwijl dit alles te doen, 849 00:48:08,859 --> 00:48:10,900 om ervoor te zorgen dat ik kan benadrukken de grafische kaart, 850 00:48:10,900 --> 00:48:14,140 en dat het allemaal soort werkt en al de rest. 851 00:48:14,140 --> 00:48:16,700 Maar het belangrijkste is, is dit is 100 mijl afstand. 852 00:48:16,700 --> 00:48:20,460 En je kunt zien in deze dat er is geen voor de hand liggende latency. 853 00:48:20,460 --> 00:48:24,600 Dingen samen te houden vrij goed. 854 00:48:24,600 --> 00:48:28,907 >> En dat, op zichzelf, is een voorbeeld en enig inzicht 855 00:48:28,907 --> 00:48:31,490 in hoe computing en scale-out computing gaat gebeuren. 856 00:48:31,490 --> 00:48:35,330 We zijn allemaal bezig dunner apparaten. 857 00:48:35,330 --> 00:48:36,870 Ons gebruik van tablets wordt steeds groter. 858 00:48:36,870 --> 00:48:39,160 >> Dus daarom, mijn carbon voetafdruk is eigenlijk 859 00:48:39,160 --> 00:48:42,060 het verplaatsen van wat vroeger om dat te doen zou hebben 860 00:48:42,060 --> 00:48:46,060 is een enorme machine onder mijn bureau, om wat 861 00:48:46,060 --> 00:48:49,550 is nu een facility-- kan overal zijn. 862 00:48:49,550 --> 00:48:50,800 Het kan overal op alle. 863 00:48:50,800 --> 00:48:54,790 En toch, het is nog steeds in staat om te brengen terug high performance grafische 864 00:48:54,790 --> 00:48:56,630 naar mijn bureaublad. 865 00:48:56,630 --> 00:49:00,900 >> Dus, het krijgen in de buurt van de end-- herinneren Mark? 866 00:49:00,900 --> 00:49:04,480 Nou, slimme jongen is Mark. 867 00:49:04,480 --> 00:49:09,360 Hij besloot dat hij zou gaan om bouwen van een realistische virtuele universum. 868 00:49:09,360 --> 00:49:12,820 Dat is nogal een project, wanneer u denk dat je hebt om dit te pitchen. 869 00:49:12,820 --> 00:49:14,740 Ik ga een gebruiken computer, en ik ga 870 00:49:14,740 --> 00:49:21,040 met model 12 miljoen jaar na de Big Bang om een ​​dag te vertegenwoordigen. 871 00:49:21,040 --> 00:49:27,080 En dan ga ik doen 13.8 miljard jaar kosmische evolutie. 872 00:49:27,080 --> 00:49:28,270 Prima. 873 00:49:28,270 --> 00:49:30,970 >> Dit gebruikt eigenlijk een computer het was groter dan onze computer, 874 00:49:30,970 --> 00:49:35,040 en het gemorste tot over de nationale middelen om onze vrienden in Texas. 875 00:49:35,040 --> 00:49:38,820 En om de landelijke voorzieningen, Dit was een veel te berekenen. 876 00:49:38,820 --> 00:49:40,750 Maar we hebben een heleboel de simulatie plaatselijk 877 00:49:40,750 --> 00:49:44,820 om ervoor te zorgen dat de software werkte en de systemen gewerkt. 878 00:49:44,820 --> 00:49:47,790 >> En het is dagen als deze wanneer je beseffen dat je ondersteunende wetenschap 879 00:49:47,790 --> 00:49:51,090 op dit schaalniveau, dat mensen kunnen nu dingen zeggen 880 00:49:51,090 --> 00:49:52,840 als, ik ga naar een model van een universum. 881 00:49:52,840 --> 00:49:54,145 En dit is zijn eerste model. 882 00:49:54,145 --> 00:49:56,422 En dit is het eerste model van zijn team. 883 00:49:56,422 --> 00:49:58,130 Er zijn vele andere mensen die gaan 884 00:49:58,130 --> 00:50:01,520 achter Mark, die gaan komen willen modelleren met een hoge resolutie, 885 00:50:01,520 --> 00:50:04,652 met meer specificiteit, nauwkeuriger. 886 00:50:04,652 --> 00:50:09,105 >> En ja, in de laatste paar minuten, Ik wil gewoon om te laten zien deze video 887 00:50:09,105 --> 00:50:15,270 van Mark en Lars's die voor mij, nogmaals, als een leven wetenschapper, is een soort van schattig. 888 00:50:15,270 --> 00:50:17,890 889 00:50:17,890 --> 00:50:20,970 Dus dit onderlossend hier om u te oriënteren, 890 00:50:20,970 --> 00:50:23,640 Dit vertelt u de keer sinds de Big Bang. 891 00:50:23,640 --> 00:50:26,570 Dus we zijn op ongeveer 0,7 miljard jaar. 892 00:50:26,570 --> 00:50:28,740 En dat is met de huidige actualisering. 893 00:50:28,740 --> 00:50:33,450 Dus je ziet op het moment, donkere materie en de evolutie 894 00:50:33,450 --> 00:50:39,910 van de fijne structuur en vroege structuren in onze bekende universum. 895 00:50:39,910 --> 00:50:45,690 >> En het station is dat deze alles gebeurt in de computer. 896 00:50:45,690 --> 00:50:48,530 Dit is een set van parameters en een set van de natuurkunde 897 00:50:48,530 --> 00:50:52,840 en een set van de wiskunde en een set van modellen 898 00:50:52,840 --> 00:50:59,284 die zorgvuldig zijn geselecteerd, en dan zorgvuldig met elkaar verbonden 899 00:50:59,284 --> 00:51:00,825 te kunnen modelleren interacties. 900 00:51:00,825 --> 00:51:04,850 >> Dus je kunt een aantal starts van zien sommige gasvormige explosies hier. 901 00:51:04,850 --> 00:51:06,880 En gas temperatuur is aan het veranderen. 902 00:51:06,880 --> 00:51:13,720 En je kunt beginnen om de structuur te zien van het zichtbare heelal verandering. 903 00:51:13,720 --> 00:51:18,130 En het belangrijkste onderdeel van deze is, elk beetje klein, klein, klein dot 904 00:51:18,130 --> 00:51:21,070 is een stukje van de natuurkunde en heeft een set van wiskunde rond, 905 00:51:21,070 --> 00:51:23,030 het informeren van haar vriend en haar buurman. 906 00:51:23,030 --> 00:51:27,245 >> Dus vanuit een scaling perspectief, deze computers hebben om alle werkzaamheden in concert 907 00:51:27,245 --> 00:51:29,470 en met elkaar praten efficiënt. 908 00:51:29,470 --> 00:51:31,060 Zo kunnen ze niet al te spraakzaam zijn. 909 00:51:31,060 --> 00:51:33,520 Ze moeten hun resultaten slaan. 910 00:51:33,520 --> 00:51:37,902 En ze moeten blijven de hoogte van al hun vrienden. 911 00:51:37,902 --> 00:51:40,860 Inderdaad, zie je nu, dit model steeds meer en ingewikkelder. 912 00:51:40,860 --> 00:51:42,590 Er is meer en meer dingen gaande. 913 00:51:42,590 --> 00:51:45,210 Er is meer en meer materiaal rond vliegen. 914 00:51:45,210 --> 00:51:48,410 >> En dit is wat de vroege kosmos zou hebben uitgezien. 915 00:51:48,410 --> 00:51:49,770 Het was een vrij harige plaats. 916 00:51:49,770 --> 00:51:55,140 Er is explosies overal de plaats, krachtige botsingen. 917 00:51:55,140 --> 00:51:58,620 En de vorming van zware metalen en elementen. 918 00:51:58,620 --> 00:52:03,910 En deze grote wolken breken in elkaar met de extreme kracht. 919 00:52:03,910 --> 00:52:08,530 >> En dus nu zijn we 9,6 miljard jaar vanaf deze eerste explosie. 920 00:52:08,530 --> 00:52:12,310 Je begint te zien dingen zijn soort kalmeerde een beetje, net 921 00:52:12,310 --> 00:52:15,660 een beetje, omdat de energie begint nu om te ontspannen. 922 00:52:15,660 --> 00:52:19,420 En dus is de wiskundige modellen hebben gekregen dat in de plaats. 923 00:52:19,420 --> 00:52:22,510 En je begint te zien samenvoeging van verschillende elementen. 924 00:52:22,510 --> 00:52:26,220 En beginnen om dit ding soort te zien van elkaar en langzaam afkoelen komen. 925 00:52:26,220 --> 00:52:32,260 >> En het begint een beetje te kijken meer als de nachtelijke hemel, een klein beetje. 926 00:52:32,260 --> 00:52:37,870 En het is [? QSing. ?] We zijn nu 30,2 miljard jaar en we zijn soort gedaan. 927 00:52:37,870 --> 00:52:41,130 En dan wat ze deden was dat zij namen dit model, 928 00:52:41,130 --> 00:52:44,580 en dan keek naar het zichtbare heelal. 929 00:52:44,580 --> 00:52:48,560 En principe waren toen kunnen nemen dat en overlay 930 00:52:48,560 --> 00:52:50,580 het met wat je kunt zien. 931 00:52:50,580 --> 00:52:56,160 En de trouw is onthutsend, zoals bedoeld hoe nauwkeurig de computermodellen zijn. 932 00:52:56,160 --> 00:52:58,760 >> Natuurlijk, de astrofysici en de onderzoeksgroepen 933 00:52:58,760 --> 00:53:02,780 moet nog beter fidelity en nog hogere resolutie. 934 00:53:02,780 --> 00:53:06,230 Maar als je nadenkt over wat Ik heb vandaag met je te praten 935 00:53:06,230 --> 00:53:11,850 door middel van deze kleine reis door zowel opslag en structuur en netwerken 936 00:53:11,850 --> 00:53:18,000 en stapels, het belangrijkste is, wordt scale-out berekenen van essentieel belang? 937 00:53:18,000 --> 00:53:22,050 Dat was mijn oorspronkelijke hypothesis-- terug naar onze wetenschappelijke methode. 938 00:53:22,050 --> 00:53:24,810 >> Ik hoop dat bij het begin van de deel van dit zou ik 939 00:53:24,810 --> 00:53:29,400 voorspellen dat ik in staat om uit te leggen zou zijn om u over scale-out computing. 940 00:53:29,400 --> 00:53:32,870 En we soort getest sommige van deze hypotheses. 941 00:53:32,870 --> 00:53:34,585 We gingen door dit gesprek. 942 00:53:34,585 --> 00:53:38,920 En ik ga gewoon scale-out zeggen computing is essential-- oh, 943 00:53:38,920 --> 00:53:42,480 ja, heel veel ja. 944 00:53:42,480 --> 00:53:44,790 >> Dus als je denkt over uw codes, wanneer 945 00:53:44,790 --> 00:53:49,230 je doet de CS50 laatste projecten, wanneer u denkt over uw nalatenschap 946 00:53:49,230 --> 00:53:52,990 om de mensheid en de middelen die we moeten in staat zijn om deze computer uitvoeren 947 00:53:52,990 --> 00:53:56,650 systemen, denk heel voorzichtig over de FLOPS per watt, 948 00:53:56,650 --> 00:53:58,560 en na te denken over de Chaos Monkey. 949 00:53:58,560 --> 00:54:02,240 >> Denk na over je sneeuwvlokken, niet doen do one-offs, hergebruik bibliotheken, 950 00:54:02,240 --> 00:54:06,453 bouwen van herbruikbare codes-- alle dingen dat de docenten zijn leer je 951 00:54:06,453 --> 00:54:08,630 in deze klasse. 952 00:54:08,630 --> 00:54:11,942 Dit zijn fundamentele aspecten. 953 00:54:11,942 --> 00:54:13,150 Ze zijn niet alleen lippendienst. 954 00:54:13,150 --> 00:54:15,660 Dit zijn echte dingen. 955 00:54:15,660 --> 00:54:20,680 >> En als iemand van jullie me willen volgen, Ik ben obsessief met de Twitter-ding. 956 00:54:20,680 --> 00:54:22,770 Ik heb om een ​​of andere manier dat opgeven. 957 00:54:22,770 --> 00:54:24,960 Maar veel van de achtergrondinformatie is 958 00:54:24,960 --> 00:54:29,260 van ons onderzoek computergebruik website op rc.fas.harvard.edu. 959 00:54:29,260 --> 00:54:34,010 >> Ik probeer en houdt een blog tot date met moderne technologieën 960 00:54:34,010 --> 00:54:38,390 en hoe we distributieve doen computergebruik, enzovoort. 961 00:54:38,390 --> 00:54:43,600 En dan onze medewerkers zijn altijd beschikbaar via odybot.org. 962 00:54:43,600 --> 00:54:46,270 En odybot is onze kleine helper. 963 00:54:46,270 --> 00:54:49,280 Hij heeft vaak weinig wedstrijden op zijn website 964 00:54:49,280 --> 00:54:51,630 Ook, waar u kunt proberen en spotten hem rond de campus. 965 00:54:51,630 --> 00:54:55,200 Hij is de vriendelijke kleine gezicht van het onderzoek computing. 966 00:54:55,200 --> 00:54:59,730 >> En ik zal soort wrap up there en dank u allen voor uw tijd. 967 00:54:59,730 --> 00:55:05,660 En ik hoop dat je niet vergeten dat scale-out computing is een echte ding. 968 00:55:05,660 --> 00:55:08,162 En er zijn een heleboel mensen die veel van de stand van de techniek hebt 969 00:55:08,162 --> 00:55:09,370 die in staat zal zijn om u te helpen. 970 00:55:09,370 --> 00:55:14,330 En al het beste van geluk met uw toekomstige inspanningen in het maken van 971 00:55:14,330 --> 00:55:18,280 zorgen dat onze berekenen zowel schalen, hoog presterende, 972 00:55:18,280 --> 00:55:20,370 en helpt de mensheid meer dan iets anders. 973 00:55:20,370 --> 00:55:22,850 Dus, ik dank u voor uw tijd. 974 00:55:22,850 --> 00:55:23,947