1 00:00:00,000 --> 00:00:12,080 2 00:00:12,080 --> 00:00:13,799 >> JAMES CUFF: Hallo, guten Nachmittag, alle zusammen. 3 00:00:13,799 --> 00:00:14,715 Mein Name ist James Cuff. 4 00:00:14,715 --> 00:00:18,970 Ich bin der Prodekan für Forschung Computer hier an der Harvard University. 5 00:00:18,970 --> 00:00:24,540 Und heute werde ich mit Ihnen sprechen warum Scale-out-Computing ist von wesentlicher Bedeutung. 6 00:00:24,540 --> 00:00:26,810 >> So denke ich, zuerst, wer ist dieser Kerl? 7 00:00:26,810 --> 00:00:27,750 Warum bin ich hier? 8 00:00:27,750 --> 00:00:29,200 Warum habe ich mit dir zu reden? 9 00:00:29,200 --> 00:00:33,730 Ich habe einen Hintergrund in der wissenschaftlichen Rechen- und Forschungs Computing, 10 00:00:33,730 --> 00:00:38,530 reicht zurück in die Vereinigten Kingdom-- Der Wellcome Trust Sanger 11 00:00:38,530 --> 00:00:43,270 Institut für Human genome-- und dann in jüngerer Zeit in den Vereinigten Staaten 12 00:00:43,270 --> 00:00:50,170 Arbeiten an der Broad und anderen angesehenen Orte des Lernens, wie Harvard. 13 00:00:50,170 --> 00:00:53,930 >> Ich denke, was das wirklich bedeutet ist dass ich eine Wiederherstellung molekularen Bio 14 00:00:53,930 --> 00:00:55,740 Physiker. 15 00:00:55,740 --> 00:01:01,250 So welches Recht habe ich zu sagen, Sie Scale-out-Computing? 16 00:01:01,250 --> 00:01:03,570 Es gibt jedoch ein. 17 00:01:03,570 --> 00:01:09,530 18 Jahre oder so habe ich nur die am häufigsten angesehenen dramatischen Anstieg der Skala Komplexität 18 00:01:09,530 --> 00:01:13,570 und die Gesamteffizienz von Computersystemen. 19 00:01:13,570 --> 00:01:18,890 >> Als ich an der Oxford tat mein PhD, I war ziemlich aufgeregt, mit einem 200 Megahertz 20 00:01:18,890 --> 00:01:23,830 Silicon Graphics Maschine mit 18 Gigabyte Speicher und eine einzelne CPU. 21 00:01:23,830 --> 00:01:24,910 Die Zeiten haben sich geändert. 22 00:01:24,910 --> 00:01:29,860 Wenn Sie schneller Vorlauf jetzt, wir spinnen über 60.000 CPUs hier in Harvard. 23 00:01:29,860 --> 00:01:32,810 Viele andere Organisationen spinnen viele mehr. 24 00:01:32,810 --> 00:01:37,740 >> Die wichtigsten Lieferservice von dies dass Skala ist jetzt nicht nur unvermeidlich, 25 00:01:37,740 --> 00:01:41,910 es passiert und es ist auch weiterhin geschehen. 26 00:01:41,910 --> 00:01:44,760 Also lassen Sie uns für einen Moment, Art der Rücklauf und sprechen sehr schnell 27 00:01:44,760 --> 00:01:50,530 über die Wissenschaft, meine Lieblings- unterliegen, die wissenschaftliche Methode. 28 00:01:50,530 --> 00:01:53,180 >> Wenn Sie ein Wissenschaftler sind, müssen Sie ein paar wichtige Dinge zu tun. 29 00:01:53,180 --> 00:01:56,140 Wenn Sie nicht diese Dinge tun können nicht der Ansicht, selbst ein Wissenschaftler 30 00:01:56,140 --> 00:02:03,250 und Sie werden kämpfen, in der Lage, verstehen Ihr Fachgebiet Disziplin. 31 00:02:03,250 --> 00:02:07,290 >> Also zunächst einmal, Sie formulieren würde Ihre Frage, erzeugen Sie Hypothesen, 32 00:02:07,290 --> 00:02:09,289 aber noch wichtiger ist, Sie vorhersagen Ihre results-- 33 00:02:09,289 --> 00:02:13,090 Sie erraten, haben was die Ergebnisse sein. 34 00:02:13,090 --> 00:02:19,560 Und dann endlich, testen Sie Ihre Hypothese und analysieren Sie Ihre Ergebnisse. 35 00:02:19,560 --> 00:02:25,460 >> Also diese wissenschaftliche Methode ist sehr wichtig in Computing. 36 00:02:25,460 --> 00:02:28,450 Computing sowohl der Vorhersage und die Möglichkeit, Ihre Ergebnisse zu testen 37 00:02:28,450 --> 00:02:33,660 sind ein wichtiger Teil dessen, was wir brauchen, in der wissenschaftlichen Methode zu tun. 38 00:02:33,660 --> 00:02:37,310 Diese Vorhersagen und Prüfungen sind die wahren beiden Eckpfeiler 39 00:02:37,310 --> 00:02:42,350 der wissenschaftlichen Methode, und jedes erfordern die bedeutendsten Fortschritte 40 00:02:42,350 --> 00:02:45,240 in der modernen Rechen. 41 00:02:45,240 --> 00:02:51,210 >> Die zwei Säulen der Wissenschaft sind, dass der Theorie und der Experimente. 42 00:02:51,210 --> 00:02:54,300 Und in jüngerer Zeit, Computing wird oft erwähnt, 43 00:02:54,300 --> 00:02:58,090 als die dritte Säule der Wissenschaft. 44 00:02:58,090 --> 00:03:01,440 Also, wenn Sie Schüler sind gerade diese, Sie haben keinerlei Druck. 45 00:03:01,440 --> 00:03:03,960 46 00:03:03,960 --> 00:03:08,720 Dritte Säule der science-- keine große Deal-- Computing, Art wichtig. 47 00:03:08,720 --> 00:03:14,000 So froh, dass dies die Rechenteil der Informatikkurs 50. 48 00:03:14,000 --> 00:03:16,220 >> So genug der Hintergrund. 49 00:03:16,220 --> 00:03:20,226 Ich möchte, dass der Plan, um zu sagen, was werden wir heute sprechen. 50 00:03:20,226 --> 00:03:22,870 Ich werde über einige Geschichte zu gehen. 51 00:03:22,870 --> 00:03:25,250 Ich werde erklären, warum wir hier haben. 52 00:03:25,250 --> 00:03:27,750 Ich werde über einige sprechen der Verlauf der Rechen 53 00:03:27,750 --> 00:03:33,890 hier in Harvard, einige Aktivitäten rund um Social Media, 54 00:03:33,890 --> 00:03:36,200 grün things-- sehr leidenschaftlich über alle Dinge 55 00:03:36,200 --> 00:03:43,640 green-- storage-- Computer storage-- wie Chaos wirkt Scale-Out-out-Systeme, 56 00:03:43,640 --> 00:03:45,640 und Verteilungssysteme im Besonderen. 57 00:03:45,640 --> 00:03:48,473 >> Und dann werde ich auf einige berühren der Scale-Out-Hardware, ist 58 00:03:48,473 --> 00:03:51,370 erforderlich ist, um in der Lage zu sein, tun Computing im Maßstab. 59 00:03:51,370 --> 00:03:55,830 Und schließlich werden wir zu gehen wrap up mit einigen fantastischen Wissenschafts. 60 00:03:55,830 --> 00:04:00,894 >> Also, lassen Sie uns eine Minute, um Blick auf unsere eigentliche Geschichte. 61 00:04:00,894 --> 00:04:01,810 Computing hat sich weiterentwickelt. 62 00:04:01,810 --> 00:04:07,370 Also seit den 60er Jahren, die alle der weg bis zur heutigen, 63 00:04:07,370 --> 00:04:11,260 wir im Grunde eine Änderung gesehen haben Rahmen von zentralisierten Computing 64 00:04:11,260 --> 00:04:14,679 Computing zu dezentralisieren, um Zusammenarbeit und unabhängige 65 00:04:14,679 --> 00:04:15,970 Computing und rechts wieder zurück. 66 00:04:15,970 --> 00:04:17,709 >> Und lassen Sie mich mit Anmerkungen zu versehen, dass ein wenig. 67 00:04:17,709 --> 00:04:20,370 Als wir anfingen, mit Computer, hatten wir Mainframes. 68 00:04:20,370 --> 00:04:22,824 Sie waren übermäßig teure Geräte. 69 00:04:22,824 --> 00:04:23,990 Alles musste geteilt werden. 70 00:04:23,990 --> 00:04:25,556 Die Rechen war komplex. 71 00:04:25,556 --> 00:04:29,060 Sie können sehen, sie durchflutete Räume und gab es Betreibern und Bänder 72 00:04:29,060 --> 00:04:32,780 und alle Arten von Whirry, clicky, spinny Geräte. 73 00:04:32,780 --> 00:04:39,930 >> Rund um die 70er Anfang der 80er Jahre begann man um zu sehen, die Auswirkungen der Klimaanlagen. 74 00:04:39,930 --> 00:04:43,620 Also Sie fangen an Rechen sehen starten, um wieder in den Labors erscheinen 75 00:04:43,620 --> 00:04:45,880 und sich näher. 76 00:04:45,880 --> 00:04:49,800 Der Aufstieg des Personal Computer, sicher 77 00:04:49,800 --> 00:04:57,460 in den 80er Jahren, zu Beginn des zehn Jahren wirklich verändert Computing. 78 00:04:57,460 --> 00:04:59,570 >> Und es gibt einen Anhaltspunkt in den Titel, weil es 79 00:04:59,570 --> 00:05:04,080 hieß der Personal Computer, was bedeutete es, Ihnen gehört. 80 00:05:04,080 --> 00:05:07,630 So wie die Entwicklung der Computing fort, 81 00:05:07,630 --> 00:05:10,530 Menschen erkannt, dass ihre persönlichen Computer war nicht wirklich groß genug, 82 00:05:10,530 --> 00:05:15,020 in der Lage sein, alles zu jeder Verdienst zu tun, oder wesentliche Verdienst, in der Wissenschaft. 83 00:05:15,020 --> 00:05:17,790 >> Und so die Leute begannen, Entwicklung Netzwerkgerät 84 00:05:17,790 --> 00:05:21,920 Treiber, um PCs zu verbinden zusammen, um in der Lage, Cluster aufzubauen. 85 00:05:21,920 --> 00:05:26,430 Und so zeugte das Zeitalter des Beowulf. 86 00:05:26,430 --> 00:05:32,470 Linux explodiert als Reaktion auf proprietären Betriebssystem, sowohl kosten 87 00:05:32,470 --> 00:05:33,650 und Komplexität. 88 00:05:33,650 --> 00:05:36,530 >> Und dann, hier sind wir heute wo wieder einmal sind wir 89 00:05:36,530 --> 00:05:40,610 Zimmer mit voller Computer konfrontiert Ausrüstung und die Fähigkeit 90 00:05:40,610 --> 00:05:44,570 , seine Kreditkarte Swipe und erhalten Zugang zu den EDV-Anlagen, 91 00:05:44,570 --> 00:05:45,290 Ferne. 92 00:05:45,290 --> 00:05:49,680 >> Und so können Sie dann sehen, in Bezug auf die Geschichte aufprall 93 00:05:49,680 --> 00:05:52,180 wie wir Rechen heute ist es auf jeden Fall 94 00:05:52,180 --> 00:05:56,090 von Maschine entwickelt Zimmer voll von Computern 95 00:05:56,090 --> 00:05:59,160 durch einige Personal Computing ganz rechts wieder zurück 96 00:05:59,160 --> 00:06:02,400 Maschinenräume voller Computer. 97 00:06:02,400 --> 00:06:06,620 >> Also das ist meine erste Cluster. 98 00:06:06,620 --> 00:06:10,170 So 2000, bauten wir ein Computersystem in Europa 99 00:06:10,170 --> 00:06:13,900 um effektiv zu kommentieren das menschliche Genom. 100 00:06:13,900 --> 00:06:16,521 Es gibt eine Menge von Technologie auf der rechten Seite aufgelistet 101 00:06:16,521 --> 00:06:18,520 gibt, die leider ist nicht mehr unter uns. 102 00:06:18,520 --> 00:06:23,460 Es ist deaktiviert auf den übergebenen großartige Technologie in den Himmel. 103 00:06:23,460 --> 00:06:26,610 >> Die Maschine selbst ist wohl Gegenwert von ein paar anständige Laptops 104 00:06:26,610 --> 00:06:29,020 heute, und dass nur eine Art zeigt Ihnen. 105 00:06:29,020 --> 00:06:36,260 Allerdings haben wir sorgfältig mit Anmerkungen versehen das menschliche Genom und beide schützen lassen 106 00:06:36,260 --> 00:06:43,190 mit diesem Papier Natur von den Sorgen der Daten 107 00:06:43,190 --> 00:06:45,380 als öffentlich oder privat. 108 00:06:45,380 --> 00:06:48,610 >> Also das ist genial, nicht wahr? 109 00:06:48,610 --> 00:06:50,280 Also haben wir einen menschlichen Genoms hat. 110 00:06:50,280 --> 00:06:51,510 Wir haben die Berechnung durchgeführt. 111 00:06:51,510 --> 00:06:53,400 Ich fühle mich sehr gefreut habe. 112 00:06:53,400 --> 00:06:59,090 Ich rollte bis zur Harvard im Jahr 2006, Gefühl viel mit mir selbst weniger zufrieden. 113 00:06:59,090 --> 00:07:00,210 >> Dies ist, was ich geerbt. 114 00:07:00,210 --> 00:07:03,575 Dies ist eine abteilungs Mail- und Dateiserver. 115 00:07:03,575 --> 00:07:05,450 Hier können Sie sehen, dass es ein bisschen Klebeband 116 00:07:05,450 --> 00:07:07,710 dass wird verwendet, um das System zusammenzuhalten. 117 00:07:07,710 --> 00:07:09,890 Dies ist unsere Lizenz- und Druckserver. 118 00:07:09,890 --> 00:07:13,990 Ich bin mir ziemlich sicher, dass es vielleicht Passwörter Auf einige dieser Post-it Notes. 119 00:07:13,990 --> 00:07:16,560 120 00:07:16,560 --> 00:07:17,360 >> Nicht großartig. 121 00:07:17,360 --> 00:07:18,530 Ziemlich weit von awesome. 122 00:07:18,530 --> 00:07:22,060 Und ja, ich dieses kleine Tabelle zu realisieren dass ich dir gezeigt habe am Anfang 123 00:07:22,060 --> 00:07:25,350 zu teilen mit dem Eigentum zurück zu teilen, 124 00:07:25,350 --> 00:07:27,930 dass wir brauchten, um das Spiel zu ändern. 125 00:07:27,930 --> 00:07:31,330 Und so das Spiel verändert wir durch Anreize. 126 00:07:31,330 --> 00:07:34,250 Und so den Menschen, da dies wenig Wikipedia-Artikel 127 00:07:34,250 --> 00:07:35,990 Hier steht, unsere ziel Kreaturen. 128 00:07:35,990 --> 00:07:39,250 Und das Studium der Anreiz Strukturen ist wesentlich für die Studie 129 00:07:39,250 --> 00:07:41,100 der wirtschaftlichen Aktivität. 130 00:07:41,100 --> 00:07:44,580 >> So haben wir begonnen, einen Anreiz unsere Dozenten und unsere Forscher. 131 00:07:44,580 --> 00:07:47,720 Und so sie Anreize wir mit ein wirklich großes Computersystem. 132 00:07:47,720 --> 00:07:52,720 So im Jahr 2008 haben wir eine 4096 Prozessor machine-- 10 Racks, 133 00:07:52,720 --> 00:07:54,470 paar hundert Kilowatt Leistung. 134 00:07:54,470 --> 00:07:56,178 >> Was ich denke, ist Interessanter ist es nicht 135 00:07:56,178 --> 00:07:58,300 Egal wo Sie sind im Zyklus. 136 00:07:58,300 --> 00:08:03,510 Die gleiche Menge Strom und Rechen-, ist die Kraft, die konstant. 137 00:08:03,510 --> 00:08:06,270 Es war 200 Kilowatt, wenn wir bauten Systemen in Europa. 138 00:08:06,270 --> 00:08:09,770 Es ist zwei hundert Kilowatt im Jahr 2008, und das 139 00:08:09,770 --> 00:08:15,820 scheint die [sein? quanter?] von kleinen universitäre Computersysteme. 140 00:08:15,820 --> 00:08:20,540 >> So Harvard today-- Vorspulen, ich bin kein mehr traurig Panda, ziemlich glücklich panda. 141 00:08:20,540 --> 00:08:25,860 Wir haben rund 60 Tausend Lastenausgleich CPUs und ihre Kletter dramatisch. 142 00:08:25,860 --> 00:08:28,780 Wir haben 15 Petabyte Lagerung, auch klettern. 143 00:08:28,780 --> 00:08:30,720 Auch dies 200 Kilowatt Schritt scheinen wir 144 00:08:30,720 --> 00:08:33,000 zu sein, fügte hinzu, dass alle sechs Monate oder so. 145 00:08:33,000 --> 00:08:35,480 Viele, viele virtuelle Maschinen. 146 00:08:35,480 --> 00:08:37,620 Und was noch wichtiger ist, etwa 1,8 Megawatt 147 00:08:37,620 --> 00:08:39,669 Forschungs Computing Equipment. 148 00:08:39,669 --> 00:08:41,820 >> Und ich werde kommen zurück, dies später, 149 00:08:41,820 --> 00:08:46,913 , warum ich jetzt nicht mehr unbedingt zu zählen, wie viel CPU die wir haben, 150 00:08:46,913 --> 00:08:48,980 aber wie groß ist die Stromrechnung. 151 00:08:48,980 --> 00:08:52,690 20 weitere so gewidmet Forschungs Computing Mitarbeiter. 152 00:08:52,690 --> 00:08:57,250 Und was noch wichtiger ist, wir sind beginnen, unsere GPGPU wachsen. 153 00:08:57,250 --> 00:09:05,030 Ich war erstaunt, wie viel von diesem gestaffelt wird von Tag zu Tag Grundlage hinzugefügt. 154 00:09:05,030 --> 00:09:07,310 Also, Geschichtsstunde über, nicht wahr? 155 00:09:07,310 --> 00:09:11,280 >> Also, wie kommen wir dorthin von hier? 156 00:09:11,280 --> 00:09:14,560 Lassen Sie uns an einigen modernen Scale-Out-Rechenbeispiele. 157 00:09:14,560 --> 00:09:18,290 158 00:09:18,290 --> 00:09:23,230 Ich bin ein bisschen besessen von der Größe und Umfang der sozialen Medien. 159 00:09:23,230 --> 00:09:30,850 Es gibt eine Reihe von extrem erfolgreiche Großrechen 160 00:09:30,850 --> 00:09:34,820 Organisationen jetzt auf dem Planeten, Unterstützung und Dienstleistungen 161 00:09:34,820 --> 00:09:36,810 für uns alle. 162 00:09:36,810 --> 00:09:39,340 Also das ist der Haftungsausschluss. 163 00:09:39,340 --> 00:09:42,990 >> Und ich möchte mit einem Start Anzahl der Unzen in einem Instagram. 164 00:09:42,990 --> 00:09:48,336 Es ist nicht wirklich ein führen, um ein Witz, es ist 165 00:09:48,336 --> 00:09:50,460 nicht einmal so lustig, tatsächlich, wenn man es sich denken. 166 00:09:50,460 --> 00:09:52,751 Aber wie auch immer, wir sind zu gehen Blick auf Unzen in Instagram. 167 00:09:52,751 --> 00:09:55,260 Und wir starten mit "My Biene und eine Blume." 168 00:09:55,260 --> 00:09:57,600 Ich [unverständlich] Gemeinde war und ich nahm ein kleines Bild 169 00:09:57,600 --> 00:10:00,460 einer Biene auf einer Blume. 170 00:10:00,460 --> 00:10:03,270 Und dann fing ich an, darüber nachzudenken, was bedeutet das eigentlich. 171 00:10:03,270 --> 00:10:07,013 Und ich machte dieses Foto von meinem Telefon und gezählt, wie viele Bytes in ihm, 172 00:10:07,013 --> 00:10:09,070 und es ist etwa 256 KB. 173 00:10:09,070 --> 00:10:13,550 Die, als ich anfing, würde im Grunde füllen eine 5 und 1/4 Zoll Diskette. 174 00:10:13,550 --> 00:10:15,340 Und begann zu denken, gut, das ist cool. 175 00:10:15,340 --> 00:10:18,630 >> Und ich begann zu sehen und zu tun einige Forschung auf dem Netzwerk. 176 00:10:18,630 --> 00:10:22,490 Und ich fand heraus, dass Instagram hat 200 Millionen MAU. 177 00:10:22,490 --> 00:10:25,105 Ich war eigentlich nicht so sicher, was für ein MAU war. 178 00:10:25,105 --> 00:10:28,960 Und ein MAU, hier unten ist ein monatlich aktive Nutzer. 179 00:10:28,960 --> 00:10:34,270 >> Also, 200 Millionen MAUs-- ziemlich cool. 180 00:10:34,270 --> 00:10:38,190 20 Milliarden photographs-- so eine ganze Reihe von Fotos. 181 00:10:38,190 --> 00:10:42,300 60 Millionen neue Fotografien jeden Tag 182 00:10:42,300 --> 00:10:46,990 kommen bei etwa 0,002 Gig pro Foto. 183 00:10:46,990 --> 00:10:51,290 Das ist etwa fünf Petabyte Platten gerade recht. 184 00:10:51,290 --> 00:10:55,480 Und das ist wirklich nicht der zentrale Teil von was wir reden. 185 00:10:55,480 --> 00:10:57,830 Das ist ein kleiner Fisch. 186 00:10:57,830 --> 00:11:00,710 Oder wie wir in England, kleine Kartoffeln sagen. 187 00:11:00,710 --> 00:11:05,050 >> Lassen Sie uns also einen Blick auf die echten Elefanten in den room-- einzigartige Gesichter. 188 00:11:05,050 --> 00:11:09,170 Auch hier wollen wir messen diese neue Quanten rufen Sie einen MAU. 189 00:11:09,170 --> 00:11:13,260 Facebook selbst hat 1,3 Milliarden MAUs. 190 00:11:13,260 --> 00:11:17,510 WhatsApp, die ich noch nicht einmal gehört bis vor kurzem, es ist 191 00:11:17,510 --> 00:11:23,260 eine Art Nachrichtendienst, 500 Mio. MAUs. 192 00:11:23,260 --> 00:11:26,620 Instagram, die wir gerade sprach von 200 Millionen MAU. 193 00:11:26,620 --> 00:11:29,370 Und Messenger, das ist ein anderer Messaging-Dienst, 194 00:11:29,370 --> 00:11:31,120 ist auch 200 Millionen MAU. 195 00:11:31,120 --> 00:11:35,920 >> Also insgesamt, dass sich, es geht darum, 2,2 Milliarden Gesamt Nutzer. 196 00:11:35,920 --> 00:11:39,880 Offensichtlich gibt es einige Überschneidungen, aber das ist entspricht einem Drittel des Planeten. 197 00:11:39,880 --> 00:11:44,270 Und sie etwas zu senden in die Region 12 Milliarden Nachrichten pro Tag. 198 00:11:44,270 --> 00:11:46,680 Und wieder gibt es nur 7 Milliarden Menschen auf dem Planeten. 199 00:11:46,680 --> 00:11:48,550 Nicht jeder hat ein Smartphone. 200 00:11:48,550 --> 00:11:53,960 Also das ist verrückt Zahlen. 201 00:11:53,960 --> 00:12:02,050 >> Und ich werde argumentieren, dass es nicht auch über die Lagerung oder die Rechen. 202 00:12:02,050 --> 00:12:05,610 Und, um das Lied zu zitieren, es ist alles über die Grafik. 203 00:12:05,610 --> 00:12:09,045 Hier ist unsere schöne Meghan Trainor unten Hier singt über alle Bass. 204 00:12:09,045 --> 00:12:12,570 Beachten Sie, sie hat auch eine ganze wenig Bass herself-- 207, 205 00:12:12,570 --> 00:12:16,460 gut 218 Millionen Menschen gesehen haben diese junge Dame zu singen ihr Lied. 206 00:12:16,460 --> 00:12:19,910 >> Also mein Argument ist es es ist alles über die Grafik. 207 00:12:19,910 --> 00:12:23,480 Also nahmen wir einige Open-Source-Software und haben zu einem Graph zu suchen. 208 00:12:23,480 --> 00:12:27,740 Und das ist LinkedIn, so dass diese ist ein Facebook für alte Leute. 209 00:12:27,740 --> 00:12:29,910 Und so, das ist meine LinkedIn Graphen. 210 00:12:29,910 --> 00:12:34,080 Ich habe rund 1.200 Teilnehmer, sogenannten "Friends". 211 00:12:34,080 --> 00:12:36,360 Und hier bin ich an der Spitze. 212 00:12:36,360 --> 00:12:38,140 Und hier ist alle Verbindungen. 213 00:12:38,140 --> 00:12:40,570 >> Nun, denken Sie zurück an die Instagram Geschichte. 214 00:12:40,570 --> 00:12:42,815 Jede von ihnen ist nicht nur das Foto, es 215 00:12:42,815 --> 00:12:46,860 hat eine ganze Fülle von Verbindungen zwischen dieser bestimmten Person 216 00:12:46,860 --> 00:12:48,220 und viele andere. 217 00:12:48,220 --> 00:12:52,190 Das ist Mittelstück ist entweder ein Fehler im Zeichnen von Graphen-Algorithmus, 218 00:12:52,190 --> 00:12:55,982 oder dies vielleicht David Malan, ich bin noch nicht sicher. 219 00:12:55,982 --> 00:12:57,690 So können Sie die neu zu zeichnen Graphen in allerlei 220 00:12:57,690 --> 00:13:02,510 von ways-- gephi.gihub.io ist, wo Sie können diese Software zu ziehen. 221 00:13:02,510 --> 00:13:05,410 Es ist wirklich cool zu sein Lage, Gemeinden zu organisieren. 222 00:13:05,410 --> 00:13:08,640 Hier können Sie sehen, das ist Harvard und verschiedene andere Orte, die ich gearbeitet habe, 223 00:13:08,640 --> 00:13:12,160 denn dies ist mein arbeitsbezogenen Daten. 224 00:13:12,160 --> 00:13:15,080 >> Also einfach über die Komplexität denken, der grafischen Darstellung und der gesamte Daten 225 00:13:15,080 --> 00:13:17,070 dass Sie entlang ziehen mit. 226 00:13:17,070 --> 00:13:20,870 So der Zwischenzeit wieder auf Friendface, nicht wahr? 227 00:13:20,870 --> 00:13:24,360 Wir haben uns die Instagram Daten, lag in der Größenordnung von fünf Petabyte. 228 00:13:24,360 --> 00:13:25,300 Keine große Sache. 229 00:13:25,300 --> 00:13:28,830 Noch eine ganze Reihe von Daten, aber keine große beschäftigen im Groß Plan der Dinge. 230 00:13:28,830 --> 00:13:33,850 >> Von diesem Artikel auf der alten Internet, "Skalieren des Facebook Data Warehouse 231 00:13:33,850 --> 00:13:36,250 zu 300 Petabyte. " 232 00:13:36,250 --> 00:13:38,110 Das ist eine ganz andere Spiel-Wechsler jetzt, 233 00:13:38,110 --> 00:13:40,234 wenn Sie fangen an denken, der Daten und der Grafik 234 00:13:40,234 --> 00:13:41,690 und was Sie mitbringen mit. 235 00:13:41,690 --> 00:13:47,480 Und ihre hohe Daten wächst von der Größenordnung von 600 Terrabyte pro Tag. 236 00:13:47,480 --> 00:13:52,980 >> Nun, wissen Sie, nun ja, dann- Ich meine, 600 Terrabyte pro Tag, 237 00:13:52,980 --> 00:13:55,670 300 petabytes-- sie auch jetzt beginnen 238 00:13:55,670 --> 00:13:58,550 zu sehr besorgt über erhalten wie man diese Sachen 239 00:13:58,550 --> 00:14:01,160 und um sicherzustellen, dass diese Daten sich im Bereich. 240 00:14:01,160 --> 00:14:04,630 Und dieser Herr hier, Jay Parikh, sucht 241 00:14:04,630 --> 00:14:08,250 an, wie man eine exabyte Daten speichern. 242 00:14:08,250 --> 00:14:10,180 >> Nur für die von Ihnen die gerade zusammen sind 243 00:14:10,180 --> 00:14:13,940 zu Hause, ein exabyte-- 10 auf die 18. 244 00:14:13,940 --> 00:14:18,210 Es hat seinen eigenen Wikipedia Seite, es ist, dass große Nummer. 245 00:14:18,210 --> 00:14:23,120 Das ist die Größe und das Ausmaß dessen, was wir sind suchen, um Daten zu speichern. 246 00:14:23,120 --> 00:14:27,090 Und diese Jungs sind nicht herumschlagen, sie speichert diese Menge an Daten. 247 00:14:27,090 --> 00:14:29,550 Damit wird eines der Hinweise, sie hier sehen 248 00:14:29,550 --> 00:14:32,185 ist für Rechenzentren sogenannte kalte Lagerung. 249 00:14:32,185 --> 00:14:35,020 250 00:14:35,020 --> 00:14:36,470 >> Das bringt mich zu, grün. 251 00:14:36,470 --> 00:14:38,340 Und hier ist Kermit. 252 00:14:38,340 --> 00:14:43,050 Er und ich agree-- es ist extrem schwierig, grün zu sein, 253 00:14:43,050 --> 00:14:44,920 aber wir geben unser Bestes. 254 00:14:44,920 --> 00:14:47,430 Kermit kann nichts dafür, er die ganze Zeit, grün zu sein, 255 00:14:47,430 --> 00:14:49,945 seine grünen Heit nicht ausziehen haupt. 256 00:14:49,945 --> 00:14:55,410 >> So, als concepts-- ein einige Arten von Kernkonzepte 257 00:14:55,410 --> 00:14:59,510 des Grüns, wenn es bezieht sich auf Computer. 258 00:14:59,510 --> 00:15:05,510 Die eine, die das wichtigste ist, ist die Langlebigkeit des Produkts. 259 00:15:05,510 --> 00:15:09,405 Wenn Ihr Gerät über eine kurze Lebensdauer, Sie können per Definition nicht, seien sie grün. 260 00:15:09,405 --> 00:15:13,280 Die Energie getroffen werden, um eine Produktion Plattenlaufwerk, ein Motherboard, ein Computer 261 00:15:13,280 --> 00:15:17,890 System, eine Tablette, was es auch sein, die Lebensdauer Ihrer Systeme 262 00:15:17,890 --> 00:15:21,700 sind ein wichtiger Teil der grünen Sie sein können. 263 00:15:21,700 --> 00:15:27,960 >> Die wichtige Rolle, da alle, bauen Software algorithms-- 264 00:15:27,960 --> 00:15:30,455 Algorithmus ein teil Wort für Software, nicht wahr? 265 00:15:30,455 --> 00:15:34,000 So ist Ihr Algorithmus Design im Hinblick auf absolut entscheidend 266 00:15:34,000 --> 00:15:43,080 wie Sie in der Lage zu machen sind schnelle und präzise Berechnungen zu verwenden 267 00:15:43,080 --> 00:15:44,710 die geringste Menge an Energie möglich. 268 00:15:44,710 --> 00:15:47,280 Und ich werde dies in einer etwas zu bekommen. 269 00:15:47,280 --> 00:15:51,270 >> Rechenzentrum design-- Sie haben gesehen, dass wir bereits Tausende 270 00:15:51,270 --> 00:15:54,870 Abertausende von Maschinen, Sitz in ruhiger Lage im kleinen, dunklen Ecken 271 00:15:54,870 --> 00:15:57,760 der Welt, Computing. 272 00:15:57,760 --> 00:16:01,670 Ressourcen allocation--, wie man an die Rechen-, der Speicherung, 273 00:16:01,670 --> 00:16:03,840 durch das Netzwerk. 274 00:16:03,840 --> 00:16:08,530 Betriebssysteme sind ein wichtiger Teil der Diese und viele Virtualisierungs 275 00:16:08,530 --> 00:16:12,080 um mehr packen und mehr Rechen in einen kleinen Raum. 276 00:16:12,080 --> 00:16:15,530 >> Ich gebe Ihnen ein kleines Beispiel geben von der Forschung Computing. 277 00:16:15,530 --> 00:16:18,220 Wir brauchten mehr ping, mehr Leistung und mehr Rohr. 278 00:16:18,220 --> 00:16:21,030 Wir brauchten mehr größer, besser, schneller Computer, 279 00:16:21,030 --> 00:16:23,390 und mussten weniger Saft verwenden. 280 00:16:23,390 --> 00:16:26,856 Und wir nicht arbeiten konnte, wie das geht. 281 00:16:26,856 --> 00:16:29,980 Ich weiß nicht, ob das Hashtag wie GoWest vermutlich durch die Kardashian verwendet wurde, 282 00:16:29,980 --> 00:16:32,560 aber trotzdem, GoWest. 283 00:16:32,560 --> 00:16:33,220 Und das taten wir. 284 00:16:33,220 --> 00:16:36,610 >> Wir holten unser Betrieb und wir zogen es heraus 285 00:16:36,610 --> 00:16:39,660 den westlichen Massachusetts in einer kleinen Mühle Stadt 286 00:16:39,660 --> 00:16:45,000 genannt Holyoke, nördlich von Chikopee und Springfield. 287 00:16:45,000 --> 00:16:49,280 Wir taten dies für eine Reihe von Gründen. 288 00:16:49,280 --> 00:16:55,150 Die wichtigste davon war, dass wir hatte einen sehr, sehr großen Staudamm. 289 00:16:55,150 --> 00:17:00,080 Und das sehr große Damm ist in der Lage, löschte 30 plus Megawatt Energie, 290 00:17:00,080 --> 00:17:02,980 und es war zu der Zeit nicht ausgelastet. 291 00:17:02,980 --> 00:17:06,170 >> Noch wichtiger ist, wir hatten auch ein sehr kompliziertes Netzwerk 292 00:17:06,170 --> 00:17:07,254 Das war bereits vorhanden. 293 00:17:07,254 --> 00:17:09,711 Wenn Sie bei dem das Netz suchen geht in den Vereinigten Staaten, 294 00:17:09,711 --> 00:17:11,230 es folgt den Bahngleisen. 295 00:17:11,230 --> 00:17:14,290 Dieses besondere Stück Netzwerk war von unseren Kollegen und Freunden im Besitz 296 00:17:14,290 --> 00:17:16,480 am Massachusetts Institute of Technology, 297 00:17:16,480 --> 00:17:19,720 und es ist im Grunde gebaut wurde ganz heraus zu Route 90. 298 00:17:19,720 --> 00:17:24,760 >> So hatten wir eine große Fluss tick, Route 90 Zecken, wir hatten eine kurzen Weg von 100 Meilen, 299 00:17:24,760 --> 00:17:26,960 und ein langer Weg von über 1000 Meilen. 300 00:17:26,960 --> 00:17:29,890 Wir haben eine sehr große zu tun Netzwerk Spleiß, wie Sie hier sehen können, 301 00:17:29,890 --> 00:17:32,990 im Grunde einen Link in, um in der Lage, zu Holyoke verbinden, 302 00:17:32,990 --> 00:17:36,390 aber wir hatten alle die erforderliche infrastructure-- ping, Macht, Rohr. 303 00:17:36,390 --> 00:17:37,280 Das Leben war gut. 304 00:17:37,280 --> 00:17:38,980 Und wieder, große Staumauer. 305 00:17:38,980 --> 00:17:42,120 >> So bauten wir im Grunde das Massachusetts Grüne Hochleistungsrechnen 306 00:17:42,120 --> 00:17:42,850 Center. 307 00:17:42,850 --> 00:17:46,580 Das war eine Arbeit der Liebe durch fünf universities-- MIT, Harvard, UMass, 308 00:17:46,580 --> 00:17:47,870 Northeastern und BU. 309 00:17:47,870 --> 00:17:49,554 Fünf-Megawatt-Tag an angeschlossene Last. 310 00:17:49,554 --> 00:17:51,845 Wir haben alle Arten von Klugheit mit luftseitigen Economizer 311 00:17:51,845 --> 00:17:53,585 die Dinge grün zu halten. 312 00:17:53,585 --> 00:18:03,330 Und wir integrierten 640-odd-Racks, Forschungsdatenverarbeitung gewidmet. 313 00:18:03,330 --> 00:18:08,770 >> Es war eine alte Brachfläche, so dass wir hatte eine Rekultivierung und einige Aufräum 314 00:18:08,770 --> 00:18:10,500 und einige Aufräum der Website. 315 00:18:10,500 --> 00:18:13,590 Und dann haben wir begonnen , die Anlage zu bauen 316 00:18:13,590 --> 00:18:19,710 und, boom-- schöne Anlage mit der Fähigkeit, Sandkasten Computing laufen, 317 00:18:19,710 --> 00:18:24,430 Konferenzen und Seminare haben, und auch eine massive Rechenzentrum Stock. 318 00:18:24,430 --> 00:18:26,007 >> Hier ist meine gute Selbst. 319 00:18:26,007 --> 00:18:27,590 Ich bin natürlich tragen die gleiche Jacke. 320 00:18:27,590 --> 00:18:29,423 Ich vielleicht nur ein Jacke, aber es gibt mir 321 00:18:29,423 --> 00:18:34,030 und John Goodhue-- er der Executive Director der Center-- 322 00:18:34,030 --> 00:18:36,740 stehen im Maschinenraum Etage, die, wie Sie sehen können, 323 00:18:36,740 --> 00:18:40,560 ist ziemlich dramatisch, und es geht ein langer, langer Weg. 324 00:18:40,560 --> 00:18:44,830 >> Ich spiele oft Spiele Fahren von Boston aus zu Holyoke, 325 00:18:44,830 --> 00:18:47,260 vorzugeben, dass ich bin ein TCP / IP-Paket. 326 00:18:47,260 --> 00:18:54,290 Und ich habe über meine Latenz sorgen Herumfahren in meinem Auto. 327 00:18:54,290 --> 00:18:56,690 Also das ist die grüne Stück. 328 00:18:56,690 --> 00:19:00,070 Werfen wir also nur eine Minute und darüber nachzudenken, Stacks. 329 00:19:00,070 --> 00:19:04,060 So dass wir sehr sorgfältig, um zu versuchen bauen Rechenzentren effizient, 330 00:19:04,060 --> 00:19:08,770 effektiv zu berechnen, machen gute Selektion für die Computerausrüstung 331 00:19:08,770 --> 00:19:12,060 und liefern mehr wichtiger ist, unsere Anwendung, 332 00:19:12,060 --> 00:19:17,860 sei es ein Messaging-Service oder eine wissenschaftliche Anwendung. 333 00:19:17,860 --> 00:19:19,110 >> Also hier sind die Stacks. 334 00:19:19,110 --> 00:19:22,762 So physikalische Schicht, die ganze Weg durch application-- 335 00:19:22,762 --> 00:19:25,220 in der Hoffnung, dass dies zu gehen ein guter Teil des Kurses. 336 00:19:25,220 --> 00:19:31,450 OSI Sieben-Schichten-Modell grundsätzlich, Sie leben, essen und atmen 337 00:19:31,450 --> 00:19:35,270 Diese gesamten Rechen Karriere. 338 00:19:35,270 --> 00:19:37,800 Das gesamte Konzept der physischen infrastructure-- Drähte, 339 00:19:37,800 --> 00:19:40,080 Kabel, Rechenzentren, Links. 340 00:19:40,080 --> 00:19:42,190 Und das ist nur der Beschreibung der Netzwerk. 341 00:19:42,190 --> 00:19:44,780 >> Hier oben ist, und, natürlich, das ist eine alte Rutsche, 342 00:19:44,780 --> 00:19:49,342 denn dies würde sagen, HTTP, weil niemand kümmert sich um einfache Mail 343 00:19:49,342 --> 00:19:50,550 Transportprotokolle, nicht mehr. 344 00:19:50,550 --> 00:19:53,960 Es ist alles passiert in der HTTP-Raum. 345 00:19:53,960 --> 00:19:55,850 Also das ist eine Ebene des Stapels. 346 00:19:55,850 --> 00:19:59,460 >> Hier ist eine weitere Reihe von Stacks, wo Sie einen Server, ein Sender, ein Hypervisor, 347 00:19:59,460 --> 00:20:02,470 Gast, binäre Bibliothek, und dann Ihre Anwendung. 348 00:20:02,470 --> 00:20:06,070 Oder, in diesem Fall das Gerät Fahrer, ein Linux-Kernel, nativen c, 349 00:20:06,070 --> 00:20:08,080 Java Virtual Machine, Java-API, dann Java 350 00:20:08,080 --> 00:20:11,220 Anwendungen und so weiter und so fort. 351 00:20:11,220 --> 00:20:14,090 Dies ist eine Beschreibung einer virtuellen Maschine. 352 00:20:14,090 --> 00:20:15,450 >> Heilige Stacks, Batman! 353 00:20:15,450 --> 00:20:18,260 Denken Sie darüber nach in Bezug auf, wie viel Rechen 354 00:20:18,260 --> 00:20:20,850 Sie brauchen, um von zu bekommen was hier geschieht, 355 00:20:20,850 --> 00:20:23,110 den ganzen Weg bis zum oberen dieses Stapels, um dann 356 00:20:23,110 --> 00:20:26,840 können Sie die aktuell zu tun Lieferung von der Anwendung. 357 00:20:26,840 --> 00:20:29,130 >> Und wenn Sie Art zurückspulen und anfangen zu denken, 358 00:20:29,130 --> 00:20:33,450 über das, was es braucht, um liefern eine Gleitkomma-Operation, 359 00:20:33,450 --> 00:20:37,650 Ihre Gleitkommaoperation ist eine Summe der Sockel, die Anzahl der Kerne 360 00:20:37,650 --> 00:20:44,490 in die Steckdose, die eine Uhr, Wie schnell kann die Uhr turnover-- 361 00:20:44,490 --> 00:20:47,490 vier Gigahertz, zwei gigahertz-- und dann die Nummer 362 00:20:47,490 --> 00:20:50,890 von Operationen möglich tun in einem bestimmten Hertz. 363 00:20:50,890 --> 00:20:54,350 >> Also jene Mikroprozessoren heute tun vier bis sechs Flops 364 00:20:54,350 --> 00:20:55,400 pro Taktzyklus. 365 00:20:55,400 --> 00:20:59,810 Und so ein Single-Core 2,5 Gig Uhr hat eine theoretische Leistung 366 00:20:59,810 --> 00:21:03,490 von etwa ein Mega-FLOP, geben oder nehmen. 367 00:21:03,490 --> 00:21:05,940 >> Aber wie bei allem, Wir haben die Wahl. 368 00:21:05,940 --> 00:21:12,280 So und Intel Core 2, Nehalem Sandy Bridge, Haswell, AMD, 369 00:21:12,280 --> 00:21:13,920 nehmen Sie Ihre choices-- Intel Atom. 370 00:21:13,920 --> 00:21:17,670 Alle diese Prozessorarchitekturen alle haben eine etwas andere Weise 371 00:21:17,670 --> 00:21:19,650 in der Lage zu fügen zwei Zahlen, 372 00:21:19,650 --> 00:21:23,520 das ist im Grunde ihren Zweck im Leben. 373 00:21:23,520 --> 00:21:24,535 Muss hart sein. 374 00:21:24,535 --> 00:21:27,100 Es gibt Millionen von ihnen sitzen in Rechenzentren, jetzt aber. 375 00:21:27,100 --> 00:21:30,410 >> Sor, Flops pro watt-- das ist die große Sache. 376 00:21:30,410 --> 00:21:37,780 Also, wenn ich will mehr davon zu bekommen durch diesen Stapel zu erhalten, schneller, 377 00:21:37,780 --> 00:21:41,800 Ich muss auf zu arbeiten, wie viele Fließkomma-Operationen ein zweites, 378 00:21:41,800 --> 00:21:43,770 Was ich tun kann, und dann geben sie Watt. 379 00:21:43,770 --> 00:21:46,160 Und zum Glück, Leute haben darüber nachgedacht. 380 00:21:46,160 --> 00:21:49,140 >> Es gibt also einen großen bestreiten jedes Jahr zu sehen, 381 00:21:49,140 --> 00:21:52,310 , der die schnellste Computer bauen können das kann eine Matrix diagonalisieren. 382 00:21:52,310 --> 00:21:53,980 Es nennt die Top 500. 383 00:21:53,980 --> 00:21:56,420 Sie nehmen die Spitze aus die besten 500 Computer 384 00:21:56,420 --> 00:21:58,610 auf dem Planeten, kann diagonalisieren Matrizen. 385 00:21:58,610 --> 00:22:00,760 Und Sie erhalten einige erstaunliche Ergebnisse. 386 00:22:00,760 --> 00:22:04,660 >> Viele dieser Maschinen sind zwischen 10 und 20 Megawatt. 387 00:22:04,660 --> 00:22:09,380 Sie können Matrizen diagonalisieren mäßig schnell. 388 00:22:09,380 --> 00:22:13,550 Sie geben nicht notwendigerweise diagonalisiert sie so effizient pro Watt, 389 00:22:13,550 --> 00:22:18,060 so gab es diese großen Schub, zu betrachten was eine grüne 500-Liste aussehen würde. 390 00:22:18,060 --> 00:22:20,360 Und hier ist die Liste von Juni. 391 00:22:20,360 --> 00:22:22,410 Es sollte eine neue sehr kurz sein. 392 00:22:22,410 --> 00:22:26,590 >> Und es ruft out-- ich nehme die Anfang der bestimmten Liste. 393 00:22:26,590 --> 00:22:32,187 Es gibt zwei spezifische machines-- ein vom Tokyo Institute of Technology 394 00:22:32,187 --> 00:22:34,520 und eine von Cambridge University in Großbritannien. 395 00:22:34,520 --> 00:22:37,700 Und diese haben ziemlich erschütternd Mega-Flops pro Watt Verhältnis. 396 00:22:37,700 --> 00:22:42,620 Dieser ist 4389 und die nächste nach unten ist 3631. 397 00:22:42,620 --> 00:22:47,660 >> Ich werde den Unterschied zwischen zu erklären diese beiden, in der nächsten Folie. 398 00:22:47,660 --> 00:22:51,320 Aber das sind diese mittelgroße Testcluster. 399 00:22:51,320 --> 00:22:54,732 Dies sind nur 34 Kilowatt oder 52 Kilowatt. 400 00:22:54,732 --> 00:22:56,940 Es gibt einige größere hier-- diesen bestimmten 401 00:22:56,940 --> 00:22:58,860 bei der Schweizerischen National Supercomputing Centre. 402 00:22:58,860 --> 00:23:00,693 Die Botschaft dafür ist, dass wir 403 00:23:00,693 --> 00:23:04,270 Versuch, Computer zu finden dass effizient arbeiten können. 404 00:23:04,270 --> 00:23:09,860 >> Und so schauen wir uns an diesem Top ein, niedlich genannt, die KFC. 405 00:23:09,860 --> 00:23:12,960 Und ein bisschen Werbung hier. 406 00:23:12,960 --> 00:23:15,730 Diese besondere Lebensmittelunternehmen hat nichts damit zu tun. 407 00:23:15,730 --> 00:23:18,240 Es ist die Tatsache, dass Dieses spezielle System 408 00:23:18,240 --> 00:23:23,830 wird in einem sehr eingeweicht clevere Ölbasis enthält. 409 00:23:23,830 --> 00:23:27,590 Und so bekamen sie ihre Huhn Friteuse Moniker 410 00:23:27,590 --> 00:23:30,040 wenn sie zuerst begonnen bauen diese Art von Systemen. 411 00:23:30,040 --> 00:23:32,740 >> Aber im Grunde, was sie genommen haben Hier ist eine Anzahl von Schaufeln, 412 00:23:32,740 --> 00:23:37,560 steckte sie in diesem anspruchsvolle Mineralöl, 413 00:23:37,560 --> 00:23:40,979 und arbeitete heraus, wie Sie alle bekommen die Vernetzung in und aus ihm heraus. 414 00:23:40,979 --> 00:23:42,895 Dann, nicht nur das, sie es draußen so gesetzt haben 415 00:23:42,895 --> 00:23:46,095 dass es außerhalb Luftkühlung zu nutzen. 416 00:23:46,095 --> 00:23:47,520 Es war ziemlich beeindruckend. 417 00:23:47,520 --> 00:23:49,630 So können Sie alle tun müssen, dieser Spielereien 418 00:23:49,630 --> 00:23:53,280 um diese Menge zu erhalten Rechen geliefert für kleine Leistung. 419 00:23:53,280 --> 00:23:57,360 >> Und Sie sehen, das ist die Form von wo die Dinge Überschrift. 420 00:23:57,360 --> 00:24:01,240 Die Herausforderung besteht darin, dass die regelmäßige Luft Kühlung ist die Skalen 421 00:24:01,240 --> 00:24:08,459 und treibt viele der Entwicklung sowohl regelmäßige Computing, 422 00:24:08,459 --> 00:24:09,750 und High Performance Computing. 423 00:24:09,750 --> 00:24:11,080 Also, das ist ziemlich störend. 424 00:24:11,080 --> 00:24:13,280 Ich denke, das ist faszinierend. 425 00:24:13,280 --> 00:24:15,530 Es ist ein bisschen chaotisch, wenn Sie versuchen, die Festplattenlaufwerke austauschen, 426 00:24:15,530 --> 00:24:18,090 aber es ist eine wirklich coole Idee. 427 00:24:18,090 --> 00:24:22,200 >> Also nicht nur das, es gibt eine ganze Reihe von Arbeiten 428 00:24:22,200 --> 00:24:25,450 die um das, was wir gebaut Aufruf der Open Compute Project. 429 00:24:25,450 --> 00:24:29,400 Und so mehr darüber ein wenig später. 430 00:24:29,400 --> 00:24:32,740 Aber die Industrie dem Start erkennen, dass die Reinfälle pro Watt 431 00:24:32,740 --> 00:24:33,670 wird immer wichtiger. 432 00:24:33,670 --> 00:24:39,256 Und Sie, wie die Leute hier, wie Sie Algorithmen zu entwerfen 433 00:24:39,256 --> 00:24:41,130 und Sie entwerfen Sie Ihre Code, sollten Sie wissen, 434 00:24:41,130 --> 00:24:43,620 dass Ihr Code kann haben einen Dominoeffekt. 435 00:24:43,620 --> 00:24:48,380 >> Als Mark saß hier in seinem Zimmer im Studentenwohnheim schreibt Facebook 1.0, 436 00:24:48,380 --> 00:24:51,050 Ich bin mir ziemlich sicher, er hatte einen Blick dass es im Begriff war riesig. 437 00:24:51,050 --> 00:24:54,945 Aber wie groß es auf die sein Umwelt ist ein großer dealio. 438 00:24:54,945 --> 00:24:58,340 Und so alle YA'LL konnte kommen mit Algorithmen 439 00:24:58,340 --> 00:25:01,370 dass die nächste Herausforderung sein könnte Sache für Leute wie mich, 440 00:25:01,370 --> 00:25:02,700 versuchen, Systemen laufen. 441 00:25:02,700 --> 00:25:07,360 >> Also lasst uns einfach darüber nachdenken, realen Leistungsgrenzen. 442 00:25:07,360 --> 00:25:09,930 Dieses Papier von Landauer-- ist keine neue Sache. 443 00:25:09,930 --> 00:25:12,480 1961 diese veröffentlicht wurde im IBM Journal. 444 00:25:12,480 --> 00:25:15,590 Dies ist die kanonische "Irreversibilität und Wärme 445 00:25:15,590 --> 00:25:17,630 Generation in der Computing-Prozess. " 446 00:25:17,630 --> 00:25:22,050 Und so argumentierte er, dass Maschinen unausweichlich 447 00:25:22,050 --> 00:25:25,070 führen logistischen Funktionen, keine eindeutige inverse. 448 00:25:25,070 --> 00:25:29,130 >> So dass der gesamte Teil ist, dass bereits in den 60er Jahren, 449 00:25:29,130 --> 00:25:31,890 Leute wussten, dass dies zu einem Problem werden. 450 00:25:31,890 --> 00:25:37,080 Und so das Gesetz der Grenzen, sagte 25 Grad C, eine Art kanonischen Raum 451 00:25:37,080 --> 00:25:41,120 Temperatur, die Grenz stellt 0,1 Elektronenvolt. 452 00:25:41,120 --> 00:25:44,920 Aber theoretisch ist diese Die Theorie, Computerspeicher, 453 00:25:44,920 --> 00:25:51,410 die bei dieser Grenze könnte auf eine Milliarde Bits ein zweites geändert. 454 00:25:51,410 --> 00:25:54,620 >> Ich weiß nicht wie es euch geht, aber nicht stoßen auf viele eine Milliarde Bits 455 00:25:54,620 --> 00:25:57,190 eine zweite Datenrate Austausch. 456 00:25:57,190 --> 00:26:01,360 Das Argument war, dass nur 2,8 Billionen von einem Watt Leistung 457 00:26:01,360 --> 00:26:03,180 sollte immer erweitert werden. 458 00:26:03,180 --> 00:26:08,160 >> In Ordnung, realen Welt example-- dies ist meine Stromrechnung. 459 00:26:08,160 --> 00:26:10,347 Ich bin 65% Prozent das schöne Rechenzentrum 460 00:26:10,347 --> 00:26:11,930 Habe ich Ihnen gezeigt, in dieser besonderen Zeit. 461 00:26:11,930 --> 00:26:15,520 Dies ist im letzten Jahr im Juni. 462 00:26:15,520 --> 00:26:21,300 Ich habe eine ältere Version genommen, damit wir kann und Art anonymisieren ein wenig. 463 00:26:21,300 --> 00:26:25,470 Ich verbrachte $ 45.000 ein Monat für Energie gibt. 464 00:26:25,470 --> 00:26:34,990 >> Also der Grund dafür ist es, dass wir haben mehr als 50.000 Vorgänge im Raum. 465 00:26:34,990 --> 00:26:38,110 So könnten Sie Ihre eigenen vorstellen Wohnstromrechnung 466 00:26:38,110 --> 00:26:39,540 ist, dass hoch? 467 00:26:39,540 --> 00:26:46,180 Aber es war für ein 199 Mio. Wattstunden mehr als einem Monat. 468 00:26:46,180 --> 00:26:51,670 >> So ist die Frage, die ich stellen ist, können Sie vorstellen, Herr Zuckerberg die Stromrechnung? 469 00:26:51,670 --> 00:26:54,730 Mine ist ziemlich groß, und ich kämpfen. 470 00:26:54,730 --> 00:26:56,600 Und ich bin nicht allein ist. 471 00:26:56,600 --> 00:26:59,450 Es gibt eine Menge Leute, mit großen Rechenzentren. 472 00:26:59,450 --> 00:27:04,800 Und so, ich denke, voll disclosure-- meine Facebook Freunde ein wenig seltsam. 473 00:27:04,800 --> 00:27:07,900 >> Also mein Facebook-Freund ist die Prineville Rechenzentrum, 474 00:27:07,900 --> 00:27:14,030 die eine der größten Facebook, neuesten, energieärmsten Rechenzentrum. 475 00:27:14,030 --> 00:27:19,360 Und sie schreiben mir, Dinge wie Energienutzung Effizienz, 476 00:27:19,360 --> 00:27:24,020 nach wie effektiv die Daten Zentrum gegenüber, wie viel Energie Sie 477 00:27:24,020 --> 00:27:26,370 Inbetriebnahme darauf, wie viel Wasser nutzen sie, was ist 478 00:27:26,370 --> 00:27:27,810 Die Feuchtigkeit und Temperatur. 479 00:27:27,810 --> 00:27:29,980 >> Und sie haben diese schöne, schöne Grundstücke. 480 00:27:29,980 --> 00:27:32,600 Ich denke, dies ist ein genial Facebook-Seite, 481 00:27:32,600 --> 00:27:35,400 aber ich denke, ich bin ein wenig seltsam. 482 00:27:35,400 --> 00:27:39,930 >> So eine Sache mehr Leistung, Forschungs Computing, die ich tue 483 00:27:39,930 --> 00:27:44,060 unterscheidet sich wesentlich was Facebook und Yahoo und Google 484 00:27:44,060 --> 00:27:50,020 und anderen On-Demand, voll, immer Angebot. 485 00:27:50,020 --> 00:27:53,530 Und so habe ich den Vorteil, dass bei ISO New England-- und ISO New England 486 00:27:53,530 --> 00:27:58,910 hilft die Energie eingestellt Raten für die Region. 487 00:27:58,910 --> 00:28:01,110 >> Und es sagt, dass es Verlängerung eine Anforderung für die Verbraucher 488 00:28:01,110 --> 00:28:05,870 freiwillig zu sparen hohe Energie, aufgrund der hohen Hitze und Feuchtigkeit. 489 00:28:05,870 --> 00:28:08,680 Und das war wieder am 18. Juli. 490 00:28:08,680 --> 00:28:12,600 Und so bin glücklich Tweet zurück, Hey, ISO New England, Grün Harvard. 491 00:28:12,600 --> 00:28:14,880 Wir tun unser Teil über hier in der Forschung Computing. 492 00:28:14,880 --> 00:28:16,760 Und das ist, weil wir die Wissenschaft zu tun. 493 00:28:16,760 --> 00:28:20,380 >> Und so sehr die Leute sagen, die Wissenschaft die niemals schläft, kann die Wissenschaft warten. 494 00:28:20,380 --> 00:28:25,030 So sind wir in der Lage, den Ruhezustand versetzen unsere Systeme, profitieren Sie von Klasse Preisen 495 00:28:25,030 --> 00:28:30,550 auf unserer Stromrechnung, und Hilfe im ganzen New England 496 00:28:30,550 --> 00:28:35,910 Region durch den Abbau von viele Megawatt Last. 497 00:28:35,910 --> 00:28:40,020 Also das ist die einzigartige Sache, unterscheidet sich von wissenschaftlichen Rechnens Daten 498 00:28:40,020 --> 00:28:48,890 Zentren und solche, die es in voller Produktion 24/7. 499 00:28:48,890 --> 00:28:51,670 >> Lassen Sie uns so nehmen Sie nur einen Gang hier. 500 00:28:51,670 --> 00:28:55,170 Also, ich möchte, um zu diskutieren Chaos ein wenig. 501 00:28:55,170 --> 00:28:59,900 Und ich möchte es in setzen die Schirmherrschaft der Lagerung. 502 00:28:59,900 --> 00:29:03,150 Also für diejenigen, die Art des Kampfes wurden 503 00:29:03,150 --> 00:29:08,680 bekommen ihre Kopf herum, was Petabyte Stau aussehen, dies ein Beispiel. 504 00:29:08,680 --> 00:29:11,660 Und das ist die Art von Sachen Ich beschäftige mich mit der ganzen Zeit. 505 00:29:11,660 --> 00:29:15,550 >> Jede dieser kleinen Jungs ist ein Vier-Terabyte-Festplatte, 506 00:29:15,550 --> 00:29:17,420 schauen Sie sich die Art von zählen sie auf. 507 00:29:17,420 --> 00:29:21,370 Wir bekommen jetzt zwischen ein bis 1 und 1/2 petabytes 508 00:29:21,370 --> 00:29:22,970 in einem Standard-Industrie-Rack. 509 00:29:22,970 --> 00:29:26,430 Und wir haben Zimmer und Zimmer, wie Sie sah in dieser früheren Bild mit John 510 00:29:26,430 --> 00:29:31,230 und ich, voll von diesen Gestellen der Ausrüstung. 511 00:29:31,230 --> 00:29:40,400 So ist es immer sehr, sehr einfach zu massiven Storage-Arrays erstellen 512 00:29:40,400 --> 00:29:44,140 >> Es ist meistens einfach innerhalb von Unix zu Art Zählen wie die Dinge laufen. 513 00:29:44,140 --> 00:29:48,270 Das ist also zählen, wie viele MAU Punkte habe ich dort ankam. 514 00:29:48,270 --> 00:29:50,880 Also das ist 423 Schnittpunkte. 515 00:29:50,880 --> 00:29:55,660 Und dann, wenn ich keine etwas skizzen awk, I summieren sich in diesem speziellen System, 516 00:29:55,660 --> 00:29:59,080 gab es 7,3 Petabyte verfügbarer Speicher. 517 00:29:59,080 --> 00:30:01,350 >> Also das ist eine Menge Zeug. 518 00:30:01,350 --> 00:30:03,030 Und Lagerung ist wirklich schwer. 519 00:30:03,030 --> 00:30:06,850 Und doch, aus irgendeinem Grund, dies ist ein Trend der Branche. 520 00:30:06,850 --> 00:30:11,500 Immer, wenn ich an unsere Forscher sprechen und unserer Fakultät und sagen: 521 00:30:11,500 --> 00:30:14,180 hey, ich kann Speicher für Sie ausführen. 522 00:30:14,180 --> 00:30:17,690 Leider habe ich zu sich die Kosten der Speicherung. 523 00:30:17,690 --> 00:30:19,430 Ich dieses Geschäft. 524 00:30:19,430 --> 00:30:23,300 Und die Leute verweisen Newegg oder sie Staples verweisen 525 00:30:23,300 --> 00:30:27,040 oder wie viel sie ein kaufen können Einzel Terabyte-Festplatte für. 526 00:30:27,040 --> 00:30:29,390 >> Also das, werden Sie feststellen, hier, dass es einen Anhaltspunkt. 527 00:30:29,390 --> 00:30:31,310 Es gibt ein Plattenlaufwerk hier. 528 00:30:31,310 --> 00:30:33,290 Und wenn wir zurückgehen, ich habe viele. 529 00:30:33,290 --> 00:30:36,130 Nicht nur, dass ich viele, ich habe anspruchsvolle Verbindungen 530 00:30:36,130 --> 00:30:38,750 in der Lage sein Stich sein diese Dinge zusammen. 531 00:30:38,750 --> 00:30:44,080 Damit ist das Risiko mit diesen großen assoziiert Speicher-Arrays ist nicht unbedeutend. 532 00:30:44,080 --> 00:30:46,370 >> In der Tat, um das nahmen wir Internet und wir schrieben 533 00:30:46,370 --> 00:30:51,670 ein wenig Geschichte über einen wohlmeinenden, sanftmütigen Direktor der Forschung 534 00:30:51,670 --> 00:30:54,640 computing-- geschieht, ein haben seltsamen Englisch accent-- versuchen 535 00:30:54,640 --> 00:30:59,930 um an einen Forscher erklären, was die kein Unterstrich Backup-Ordner tatsächlich 536 00:30:59,930 --> 00:31:01,070 gemeint. 537 00:31:01,070 --> 00:31:05,690 Es war eine lange, kleine Geschichte, gut vier Minuten nach Entdeckung. 538 00:31:05,690 --> 00:31:09,380 >> Und Hinweis, ich habe einen schrecklich viel weniger Platz als die Dame 539 00:31:09,380 --> 00:31:11,800 dass singt über die ganze Bass. 540 00:31:11,800 --> 00:31:13,910 Wir sind nicht wenige Konten niedriger. 541 00:31:13,910 --> 00:31:16,160 Aber wie auch immer, ist dies ein wichtige Sache zu denken, 542 00:31:16,160 --> 00:31:18,532 in Bezug auf das, was schief gehen könnte. 543 00:31:18,532 --> 00:31:20,990 Also, wenn ich eine Festplatte, und Ich werfe es in einer Unix-Maschine, 544 00:31:20,990 --> 00:31:24,300 und ich mit dem Schreiben beginnen Freizeitangeboten.Zum, da ist ein Magnet, da ist ein Antriebskopf, 545 00:31:24,300 --> 00:31:30,150 gibt es angeblich eine Eins oder eine Null wird sich auf diesem Gerät geschrieben. 546 00:31:30,150 --> 00:31:32,180 >> Motors-- spinny, twirly Dinge immer zu brechen. 547 00:31:32,180 --> 00:31:33,490 Denken Sie an Dinge, die zu brechen. 548 00:31:33,490 --> 00:31:35,170 Es ist immer spinny gewesen, twirly Dinge. 549 00:31:35,170 --> 00:31:38,560 Drucker, Festplatten, Motorfahrzeuge usw. 550 00:31:38,560 --> 00:31:40,590 Alles, was sich bewegt, ist wahrscheinlich zu brechen. 551 00:31:40,590 --> 00:31:42,575 >> So können Sie Motoren benötigen, müssen fahren Firmware, 552 00:31:42,575 --> 00:31:47,110 Sie brauchen SAS / SATA-Controller, Kabel, Firmware der SAS / SATA-Controller, 553 00:31:47,110 --> 00:31:48,530 niedrigen Niveau Blöcke. 554 00:31:48,530 --> 00:31:54,580 Wählen Sie Ihre Speicher-Controller-Datei System-Code, je nachdem, welcher einen kann es sein, 555 00:31:54,580 --> 00:31:56,780 wie Sie die Dinge zusammenzufügen. 556 00:31:56,780 --> 00:32:00,956 Und Ihre virtuellen Speichermanager Seiten, DRAM holen und speichert. 557 00:32:00,956 --> 00:32:02,705 Dann erhalten Sie eine andere stapeln, welche Art ist 558 00:32:02,705 --> 00:32:05,440 von unten in der Liste auf diese ein, Algorithmen, User. 559 00:32:05,440 --> 00:32:09,050 >> Und wenn Sie diese multiplizieren up, weiß ich nicht, wie viele, 560 00:32:09,050 --> 00:32:11,640 es gibt eine Menge von Orten wo Sachen seitlich gehen. 561 00:32:11,640 --> 00:32:14,430 Ich meine, das ist ein Beispiel über Mathematik. 562 00:32:14,430 --> 00:32:18,070 Aber es ist eine Art von Spaß zu denken wie viele Möglichkeiten Dinge schief gehen könnte, 563 00:32:18,070 --> 00:32:21,650 nur für ein Plattenlaufwerk. 564 00:32:21,650 --> 00:32:25,440 Wir sind schon bei 300 Petabyte, also vorstellen, die Anzahl der Festplattenlaufwerke 565 00:32:25,440 --> 00:32:27,741 Sie müssen bei 300 Petabyte dass die schief gehen können. 566 00:32:27,741 --> 00:32:28,240 567 00:32:28,240 --> 00:32:30,390 Nicht nur dass-- also ist das Speicher. 568 00:32:30,390 --> 00:32:34,220 Und das eine Anspielung auf die Person, die ich würde gerne sehen, 569 00:32:34,220 --> 00:32:38,780 Geben Bühne verlassen, die ist das Chaos Monkey. 570 00:32:38,780 --> 00:32:43,140 Also an einem bestimmten Punkt, auch wird es größer ist als nur das Diskettenlaufwerk 571 00:32:43,140 --> 00:32:43,920 Problem. 572 00:32:43,920 --> 00:32:50,610 >> Und ja, diese feinen Damen und Herren dass führen Sie einen Streaming-Video-Service 573 00:32:50,610 --> 00:32:55,430 erkannte, dass ihre Computer waren auch riesig und auch sehr kompliziert 574 00:32:55,430 --> 00:33:00,010 und auch die Bereitstellung Service zu einem schrecklichen eine Menge Leute. 575 00:33:00,010 --> 00:33:05,180 Sie haben 37 Millionen Mitglieder-- bekam und vielleicht ein Jahr dieses Dia oder so old-- 576 00:33:05,180 --> 00:33:07,350 Tausende von Geräten. 577 00:33:07,350 --> 00:33:10,810 Es gibt Milliarden von Stunden Video. 578 00:33:10,810 --> 00:33:13,600 Sie melden Sie sich Milliarden von Ereignissen pro Tag. 579 00:33:13,600 --> 00:33:17,330 >> Und Sie sehen, die meisten Leute zu beobachten die Glotze später am Abend, 580 00:33:17,330 --> 00:33:19,429 und es überwiegt bei weitem alles, was. 581 00:33:19,429 --> 00:33:21,220 Und ja, sie wollten in der Lage sein, um sicherzustellen, 582 00:33:21,220 --> 00:33:24,854 dass der Service war und zuverlässige und für sie arbeiten. 583 00:33:24,854 --> 00:33:27,020 So kamen sie auf diese Ding namens Chaos Monkey. 584 00:33:27,020 --> 00:33:29,000 Es ist Stück Software die, wenn Sie denken, 585 00:33:29,000 --> 00:33:34,190 spricht über den Titel dieser gesamte Präsentation, 586 00:33:34,190 --> 00:33:36,530 Scale-Out bedeutet, dass Sie sollte dieses Zeug zu testen. 587 00:33:36,530 --> 00:33:38,585 Es ist nicht gut nur mit eine Million Maschinen. 588 00:33:38,585 --> 00:33:40,460 Also das schöne an das ist, Chaos Affe 589 00:33:40,460 --> 00:33:43,090 ist ein Dienst, identifiziert Gruppen von Systemen 590 00:33:43,090 --> 00:33:47,220 und zufällig endet ein der Systeme in einer Gruppe. 591 00:33:47,220 --> 00:33:48,429 Ehrfürchtig. 592 00:33:48,429 --> 00:33:50,220 So dass ich nicht zu wissen, Sie, aber wenn ich je 593 00:33:50,220 --> 00:33:52,990 baute ein System, das auf andere angewiesen Systeme miteinander zu reden, 594 00:33:52,990 --> 00:33:55,865 Sie einer von ihnen nehmen, die Wahrscheinlichkeit, dass die ganze Sache arbeiten, 595 00:33:55,865 --> 00:33:57,130 rasch abnimmt. 596 00:33:57,130 --> 00:34:00,475 >> Und so dieses Stück Software läuft um Netflix Infrastruktur. 597 00:34:00,475 --> 00:34:03,100 Zum Glück, sagt, dass es nur in läuft Geschäftszeiten in der Absicht, 598 00:34:03,100 --> 00:34:05,810 dass Ingenieure beraten wach und in der Lage, zu reagieren. 599 00:34:05,810 --> 00:34:08,020 Das sind also die Typen Dinge, die wir jetzt sind 600 00:34:08,020 --> 00:34:13,360 mit zu tun, um unsere Rechen stören Umgebungen zu Chaos vorstellen 601 00:34:13,360 --> 00:34:15,739 und die Komplexität einzuführen. 602 00:34:15,739 --> 00:34:19,139 >> Also, wer in ihr Recht Geist, freiwillig wählen würde 603 00:34:19,139 --> 00:34:22,540 mit einem Chaos Affe arbeiten? 604 00:34:22,540 --> 00:34:24,150 Hang on, scheint er zu mir hin. 605 00:34:24,150 --> 00:34:28,719 Nun, ich denke, ich should-- niedlich. 606 00:34:28,719 --> 00:34:32,909 Aber das Problem ist, dass Sie nicht bekommen, die Wahl. 607 00:34:32,909 --> 00:34:37,440 Das Chaos Affe, wie Sie kann sehen, wählt man. 608 00:34:37,440 --> 00:34:42,650 >> Und das ist das Problem mit Computing im Maßstab ist, dass man nicht vermeiden. 609 00:34:42,650 --> 00:34:49,989 Es ist eine Unvermeidlichkeit der Komplexität und der Umfang und der Evolution, 610 00:34:49,989 --> 00:34:53,280 in gewisser Weise, der Rechenkompetenz. 611 00:34:53,280 --> 00:34:55,510 Und denken Sie daran, dies ist eine Sache zu erinnern, 612 00:34:55,510 --> 00:35:00,030 Chaos Monkeys Liebe snowflakes-- Liebe Schneeflocken. 613 00:35:00,030 --> 00:35:03,470 Ein snowflake-- wir erklärte der Chaos Monkey-- aber eine Schneeflocke 614 00:35:03,470 --> 00:35:09,630 ist ein Server, der einzigartig ist und Sonder und zart und individuelle 615 00:35:09,630 --> 00:35:11,770 und wird nie reproduziert werden. 616 00:35:11,770 --> 00:35:14,790 >> Oft finden wir Schneeflocke Service in unserer Umwelt. 617 00:35:14,790 --> 00:35:16,700 Und wir versuchen immer, und schmelzen Schneeflocke-Service. 618 00:35:16,700 --> 00:35:18,880 Aber wenn Sie einen Server zu finden in Ihrer Umgebung 619 00:35:18,880 --> 00:35:23,240 das ist entscheidend für die Langlebigkeit Ihrer Organisation und es schmilzt, 620 00:35:23,240 --> 00:35:25,300 Sie können nicht es wieder zusammen. 621 00:35:25,300 --> 00:35:28,071 So Chaos Monkey Aufgabe war es, gehen und beenden Instanzen. 622 00:35:28,071 --> 00:35:30,820 Wenn das Chaos Affe schmilzt das Schneeflocke, du bist über, sind Sie fertig. 623 00:35:30,820 --> 00:35:34,390 624 00:35:34,390 --> 00:35:37,950 Ich will reden einige Hardware, die wir sind 625 00:35:37,950 --> 00:35:40,415 Sehen in Bezug auf die Art Scale-out-Aktivitäten zu. 626 00:35:40,415 --> 00:35:43,810 Und einige einzigartige Dinge, die in sind und um das Wissenschafts Aktivität. 627 00:35:43,810 --> 00:35:46,990 Wir beginnen jetzt, um zu sehen, erinnern Diese Einheit der Ausgabe: Dieser Gepäckträger? 628 00:35:46,990 --> 00:35:51,780 Das ist also ein Rack von GPGPUs-- so allgemein Zweck Grafikprozessoren. 629 00:35:51,780 --> 00:35:55,790 >> Wir haben diese sich in unserer Datenbank Zentrum, etwa 100 Meilen entfernt. 630 00:35:55,790 --> 00:35:59,780 Diese besondere Rack ist etwa 96 Tera-FLOPS 631 00:35:59,780 --> 00:36:04,090 der mit einfacher Genauigkeit Mathematik in der Lage zu liefern, durch die Hintertür davon. 632 00:36:04,090 --> 00:36:10,530 Und wir haben, um 130-odd Karten in einer Instanz 633 00:36:10,530 --> 00:36:16,620 dass wir-- mehrere Racks dieser Instanz. 634 00:36:16,620 --> 00:36:22,730 >> Das ist also im Sinne interessant, dass die für allgemeine Zwecke Grafiken Prozesse 635 00:36:22,730 --> 00:36:27,880 in der Lage, Mathematik unglaublich tun schnell für sehr geringe Mengen an Energie. 636 00:36:27,880 --> 00:36:32,060 Es gibt also eine große Steigerung in die wissenschaftlichen Rechnens Bereichen, 637 00:36:32,060 --> 00:36:36,400 Blick auf Grafiken Verarbeitungseinheiten in einem großen Weg. 638 00:36:36,400 --> 00:36:41,990 >> Also lief ich einige Mcollective durch unsere Puppen Infrastruktur 639 00:36:41,990 --> 00:36:45,330 gestern, sehr aufgeregt. 640 00:36:45,330 --> 00:36:48,260 knapp einem Petaflop der mit einfacher Genauigkeit. 641 00:36:48,260 --> 00:36:52,440 Gerade hier, dies klar sein wenig Multiplikator 3,95. 642 00:36:52,440 --> 00:36:54,820 Doppel-Präzisionsberechnungen würde etwa 1,2 sein, 643 00:36:54,820 --> 00:36:57,010 aber meine Twitter-Feed sah viel besser, wenn ich 644 00:36:57,010 --> 00:37:02,670 sagte, dass wir fast ein Petaflop hatte der mit einfacher Genauigkeit GPGPUs. 645 00:37:02,670 --> 00:37:04,220 >> Aber es ist es immer. 646 00:37:04,220 --> 00:37:06,280 Es wird langsam zu sein sehr, sehr beeindruckend. 647 00:37:06,280 --> 00:37:08,550 Und warum tun wir das? 648 00:37:08,550 --> 00:37:11,570 Aufgrund der Quantenchemie, ua 649 00:37:11,570 --> 00:37:15,300 aber wir fangen an, entwerfen einige neue Photovoltaik. 650 00:37:15,300 --> 00:37:20,210 >> Und so Alan Aspuru-Guzik, der eine Professor in chemistry-- meinem Partner 651 00:37:20,210 --> 00:37:22,390 in crime-- für den letzten Jahren. 652 00:37:22,390 --> 00:37:25,660 Wir haben seither um die Umschlag auf Computing. 653 00:37:25,660 --> 00:37:30,250 Und die GPGPU ist ideal Technologie, um der Lage zu tun 654 00:37:30,250 --> 00:37:34,760 schrecklich viel komplizierter Mathematik, sehr, sehr schnell. 655 00:37:34,760 --> 00:37:36,750 >> Also mit Skala, kommt neue Herausforderungen. 656 00:37:36,750 --> 00:37:41,070 So große Umfang zur man muss Achten Sie darauf, wie Sie das Zeug zu verdrahten. 657 00:37:41,070 --> 00:37:45,300 Und wir haben ein gewisses Niveau der Zwangsstörungen. 658 00:37:45,300 --> 00:37:49,530 Diese Bilder wahrscheinlich fahren viele Leute verrückt. 659 00:37:49,530 --> 00:37:53,390 Und Schränke, die nicht besonders gut verdrahtet 660 00:37:53,390 --> 00:37:56,050 fahren unser Netzwerk und Einrichtungen Ingenieure Nüsse. 661 00:37:56,050 --> 00:37:58,620 Plus gibt es auch Luftstrom Fragen, die Sie enthalten müssen. 662 00:37:58,620 --> 00:38:01,430 >> Das sind Dinge, die ich hätte nie gedacht. 663 00:38:01,430 --> 00:38:03,480 Mit Skala, kommt mehr Komplexität. 664 00:38:03,480 --> 00:38:05,869 Dies ist ein neuer Typ von Dateisystem. 665 00:38:05,869 --> 00:38:06,410 Es ist fantastisch. 666 00:38:06,410 --> 00:38:07,660 Es ist ein Petabyte. 667 00:38:07,660 --> 00:38:09,905 Es kann 1,1 Milliarden Dateien zu speichern. 668 00:38:09,905 --> 00:38:15,940 Es kann lesen und schreiben, um 13 Gigabyte und 20 Gigabyte ein second-- Gigabyte 669 00:38:15,940 --> 00:38:17,150 eine zweite. 670 00:38:17,150 --> 00:38:20,900 So kann es Terabyte entladen in kürzester Zeit. 671 00:38:20,900 --> 00:38:22,070 >> Und es ist hoch verfügbar. 672 00:38:22,070 --> 00:38:26,989 Und es ist erstaunlich, Lookup bekam rates-- 220.000 Lookups einen zweiten. 673 00:38:26,989 --> 00:38:29,780 Und es gibt viele unterschiedliche Personen bauen diese Art von Systemen. 674 00:38:29,780 --> 00:38:32,830 Und man kann es hier zu sehen grafisch. 675 00:38:32,830 --> 00:38:35,800 Dies ist eines der Dateisysteme das ist, unter Last, ganz 676 00:38:35,800 --> 00:38:41,250 gerne liest kurz von 22 Gigabyte pro Sekunde. 677 00:38:41,250 --> 00:38:42,790 Also das ist so cool-- Komplexität. 678 00:38:42,790 --> 00:38:47,230 >> Also mit Komplexität und Größe, kommt mehr Komplexität, nicht wahr? 679 00:38:47,230 --> 00:38:51,830 Dies ist einer der vielen, Viele Netzwerkdiagramme, 680 00:38:51,830 --> 00:38:54,970 wo Sie viele verschiedene Chassis alle Unterstützung von bis 681 00:38:54,970 --> 00:38:57,730 in eine Haupt Core-Switch, zu-Speicher, 682 00:38:57,730 --> 00:39:00,731 Verbinden mit niedriger Latenzzeit verbindet. 683 00:39:00,731 --> 00:39:03,605 Und dann die gesamte Seite der Haus, befindet sich nur all die Verwaltung 684 00:39:03,605 --> 00:39:09,740 dass Sie in der Lage, anzugehen diese Systeme von einem entfernten Standort. 685 00:39:09,740 --> 00:39:12,070 So Skala hat eine Menge von Komplexität mit sich. 686 00:39:12,070 --> 00:39:14,910 687 00:39:14,910 --> 00:39:17,785 >> Gangwechsel wieder, gehen wir zurück und haben eine kleine Stelle der Wissenschaft. 688 00:39:17,785 --> 00:39:21,450 Also, denken Sie daran, Forschung Computing und dieses kleine shim-- 689 00:39:21,450 --> 00:39:25,310 kleine rosa Scheibe unter die Dozenten und alle ihre Algorithmen 690 00:39:25,310 --> 00:39:30,650 und alle von der kühlen Wissenschaft und allen Diese Stromversorgung und Kühlung und Rechenzentrum 691 00:39:30,650 --> 00:39:35,330 Boden und Vernetzung und großen Computer und Service-Desks und Helpdesks 692 00:39:35,330 --> 00:39:39,330 und so forth-- und so, nur wir sind dieser kleine Unterlegscheibe zwischen ihnen. 693 00:39:39,330 --> 00:39:42,820 >> Was wir begonnen haben sehen, ist, dass die Welt 694 00:39:42,820 --> 00:39:45,730 in der Lage, zu bauen diese großen Rechenzentren 695 00:39:45,730 --> 00:39:48,020 und in der Lage zum Aufbau Diese großen Computern. 696 00:39:48,020 --> 00:39:49,420 Wir bekommen ziemlich gut darin. 697 00:39:49,420 --> 00:39:53,600 Was wir nicht sehr gut ist dies kleine Unterlegscheibe zwischen der Forschung 698 00:39:53,600 --> 00:39:56,670 und das blanke Metall und die Technologie. 699 00:39:56,670 --> 00:39:58,600 Und es ist schwer. 700 00:39:58,600 --> 00:40:03,330 >> Und so konnten wir zu mieten Leute, die in dieser Welt leben. 701 00:40:03,330 --> 00:40:07,590 Und in jüngerer Zeit, um die Speiche wir National Science Foundation und sagte: 702 00:40:07,590 --> 00:40:11,440 Diese Scale-Out-Zeug ist großartig, aber wir können unsere Wissenschaftler nicht bekommen 703 00:40:11,440 --> 00:40:13,690 auf diese große komplizierte Maschinen. 704 00:40:13,690 --> 00:40:16,040 So gab es ein Anzahl verschiedener Programme 705 00:40:16,040 --> 00:40:20,100 wo wir wirklich waren meist besorgt über versuchen 706 00:40:20,100 --> 00:40:22,800 um zu sehen, wenn wir zu verwandeln konnte der Campus-Infrastruktur. 707 00:40:22,800 --> 00:40:25,850 >> Es gibt eine Vielzahl von Programmen, um nationale Zentren. 708 00:40:25,850 --> 00:40:28,300 Und so, uns selbst, unsere Freunde an der Clemson, 709 00:40:28,300 --> 00:40:32,620 University of Wisconsin Madison, Süd-Kalifornien, Utah und Hawaii 710 00:40:32,620 --> 00:40:35,780 Art zusammen, um Blick auf dieses Problem. 711 00:40:35,780 --> 00:40:39,340 Und dieses kleine Grafik hier ist der lange Schwanz der Wissenschaft. 712 00:40:39,340 --> 00:40:41,602 >> Also das ist-- das nicht der Fall Egal, was auf dieser Achse, 713 00:40:41,602 --> 00:40:45,485 aber diese Achse ist eigentlich Nummer Arbeitsplätze gehen durch den Cluster. 714 00:40:45,485 --> 00:40:48,940 Es gibt also mehr als 350.000 was auch immer Zeit. 715 00:40:48,940 --> 00:40:51,730 Das sind unsere üblichen Verdächtigen am unteren Rand hier. 716 00:40:51,730 --> 00:40:55,992 In der Tat, es gibt Alan Aspuru-Guzik, wer wir waren gerade im Gespräch about-- Tonnen 717 00:40:55,992 --> 00:40:58,700 und Tonnen von Rechen-, wirklich wirksam, der weiß, was er tut. 718 00:40:58,700 --> 00:41:02,840 >> Hier ist ein weiteres Labor, das werde ich reden etwa in einem moment-- John Kovac Labor. 719 00:41:02,840 --> 00:41:03,610 Sie haben es. 720 00:41:03,610 --> 00:41:04,210 Sie sind gut. 721 00:41:04,210 --> 00:41:04,830 Sie sind glücklich. 722 00:41:04,830 --> 00:41:05,960 Sie sind der Berechnung. 723 00:41:05,960 --> 00:41:07,664 Große Wissenschaft immer getan. 724 00:41:07,664 --> 00:41:09,580 Und dann, wie Sie Art von unten kommen hier gibt 725 00:41:09,580 --> 00:41:12,110 sind andere Gruppen, laufen nicht viele Arbeitsplätze. 726 00:41:12,110 --> 00:41:13,410 >> Und warum ist das so? 727 00:41:13,410 --> 00:41:15,080 Ist es, weil die Rechen zu hart? 728 00:41:15,080 --> 00:41:19,580 Ist es, weil sie nicht wissen, wie? 729 00:41:19,580 --> 00:41:22,880 Wir wissen es nicht, weil wir gegangen und sah. 730 00:41:22,880 --> 00:41:25,620 Und damit ist, was diese Projekt auf sich hat, 731 00:41:25,620 --> 00:41:27,830 lokal, innerhalb jede dieser Regionen, 732 00:41:27,830 --> 00:41:32,660 um Wege suchen, wo wir eingreifen können mit dem Dozenten und Forscher 733 00:41:32,660 --> 00:41:36,400 tatsächlich in dem unteren Ende des Schwanzes, und zu verstehen, was sie tun. 734 00:41:36,400 --> 00:41:37,920 >> Also das ist etwas, was wir sind wirklich leidenschaftlich über. 735 00:41:37,920 --> 00:41:39,920 Und das ist etwas, das Wissenschaft wird nicht fortgesetzt 736 00:41:39,920 --> 00:41:44,260 um vorwärts zu bewegen, bis wir zu lösen einige dieser Grenzfälle. 737 00:41:44,260 --> 00:41:46,590 Andere Bits von Wissenschaft das ist up-- jeder wird 738 00:41:46,590 --> 00:41:48,260 sehen die Large Hadron Collider. 739 00:41:48,260 --> 00:41:49,540 Awesome, nicht wahr? 740 00:41:49,540 --> 00:41:52,960 Dieses Zeug alles lief bei Holyoke. 741 00:41:52,960 --> 00:41:56,510 Wir Gebaut- die allererste Wissenschaft, die in Holyoke passiert 742 00:41:56,510 --> 00:41:59,130 war die Zusammenarbeit zwischen uns und Boston University. 743 00:41:59,130 --> 00:42:01,510 So ist es wirklich, wirklich cool. 744 00:42:01,510 --> 00:42:04,410 >> Das ist ein lustiges Stück der Wissenschaft für die Skala. 745 00:42:04,410 --> 00:42:07,650 Dieses ist ein digitaler Zugang zu ein Himmel Jahrhundert an der Harvard. 746 00:42:07,650 --> 00:42:09,170 Im Grunde ist es eine Platte Archiv. 747 00:42:09,170 --> 00:42:13,350 Wenn Sie unten gehen Oxford-- Garden Street, sorry, 748 00:42:13,350 --> 00:42:16,560 Sie werden eine der Sternwarte finden Gebäude ist im Grunde voll 749 00:42:16,560 --> 00:42:19,480 der etwa eine halbe Million Platten. 750 00:42:19,480 --> 00:42:24,410 >> Und das sind Bilder von der Himmel bei Nacht, über 100 Jahre. 751 00:42:24,410 --> 00:42:28,760 So gibt es eine ganze Rig einrichten Sie hier, um diese Platten zu digitalisieren, 752 00:42:28,760 --> 00:42:32,100 machen Sie Fotos von ihnen, registrieren sie, steckte sie auf einem Computer. 753 00:42:32,100 --> 00:42:36,410 Und das ist ein Petabyte und eine Hälfte, genau richtig sind-- ein kleines Projekt. 754 00:42:36,410 --> 00:42:37,530 >> Das sind andere Projekte. 755 00:42:37,530 --> 00:42:42,800 Das Pan-STARRS Projekt tut Voll weiten Panorama Umfrage 756 00:42:42,800 --> 00:42:47,390 Suche nach erdnahen Asteroiden und vorübergehend Himmelsereignisse. 757 00:42:47,390 --> 00:42:52,100 Als molekulare Biophysiker, ich liebe das Wort transiente Himmelsereignis. 758 00:42:52,100 --> 00:42:55,050 Ich bin mir nicht ganz sicher, was es ist, aber wie auch immer, wir sind für sie suchen. 759 00:42:55,050 --> 00:43:00,372 >> Und wir erzeugen 30 Terabyte eine Nacht heraus dieser Teleskope. 760 00:43:00,372 --> 00:43:03,330 Und das ist nicht wirklich eine Bandbreite Problem, das ist wie ein FedEx Problem. 761 00:43:03,330 --> 00:43:08,420 So setzen Sie den Speicherplatz auf der van und Sie es senden, was es ist. 762 00:43:08,420 --> 00:43:10,570 >> BICEP ist wirklich interesting-- so Hintergrundbild 763 00:43:10,570 --> 00:43:13,850 kosmischer zusätzliche galaktischen Polarisation. 764 00:43:13,850 --> 00:43:16,880 Als ich anfing, Arbeits an der Harvard sieben oder so, 765 00:43:16,880 --> 00:43:21,440 vor acht Jahren, ich erinnere mich Arbeit an diesem Projekt 766 00:43:21,440 --> 00:43:26,010 und es hat nicht wirklich sinken Hause, warum polarisiertem Licht 767 00:43:26,010 --> 00:43:29,770 von der kosmischen Mikrowellen- Hintergrund wäre es wichtig, 768 00:43:29,770 --> 00:43:30,800 bis dies geschehen ist. 769 00:43:30,800 --> 00:43:34,580 >> Und das war John Kovac, , die ich gesprochen habe, bevor, 770 00:43:34,580 --> 00:43:42,030 mit Millionen und Abermillionen von CPU Stunden, in unserer Anlage und andere, 771 00:43:42,030 --> 00:43:46,600 im Grunde in das Innere blicken der ersten Momente des Universums 772 00:43:46,600 --> 00:43:49,150 nach dem Urknall, und versuchen zu verstehen, 773 00:43:49,150 --> 00:43:51,290 Allgemeine Theorie Einsteins Relativitäts. 774 00:43:51,290 --> 00:43:56,040 Es ist überwältigend, dass unsere Computer helfen uns, zu entwirren und starren 775 00:43:56,040 --> 00:43:59,280 in die Ursprünge der Grund, warum wir hier sind. 776 00:43:59,280 --> 00:44:03,450 >> Also, wenn Sie über die Skala zu sprechen, dies ist eine ernste Ebene. 777 00:44:03,450 --> 00:44:09,260 Das andere, was der Maßstab ist, dass bestimmtes Projekt getroffen, diese Jungs. 778 00:44:09,260 --> 00:44:15,320 Und dies ist die Kurve für BICEP [Unverständlich] Dies war unsere kleine Umfrage. 779 00:44:15,320 --> 00:44:19,220 >> Und man hier sehen kann, das Leben war gut, bis etwa hier, 780 00:44:19,220 --> 00:44:21,200 das war, wenn der Ankündigung kam heraus. 781 00:44:21,200 --> 00:44:24,120 Und Sie buchstäblich bekommen haben Sekunden zu reagieren 782 00:44:24,120 --> 00:44:29,020 auf die Skalierung der Veranstaltung entspricht diesem kleinen Punkt hier, 783 00:44:29,020 --> 00:44:32,200 die bis Ende verschieben vier oder so Terabyte Daten 784 00:44:32,200 --> 00:44:36,370 über den Webserver dass day-- ziemlich behaart. 785 00:44:36,370 --> 00:44:38,210 >> Usw., diese sind die Arten von Dingen, 786 00:44:38,210 --> 00:44:43,040 können Sie in Ihrer Infrastruktur geschehen wenn Sie nicht Entwurf für Skala. 787 00:44:43,040 --> 00:44:45,630 Wir hatten ein bisschen ein klettern an diesem Tag, zu sein 788 00:44:45,630 --> 00:44:50,440 Lage, erstrecken sich genug Web-Service um die Website am Laufen zu halten. 789 00:44:50,440 --> 00:44:53,399 Und wir waren erfolgreich. 790 00:44:53,399 --> 00:44:55,190 Dies ist ein wenig email das ist irgendwie süß. 791 00:44:55,190 --> 00:45:00,245 Dies ist eine Nachricht an Mark Vogelsberger, und Lars Hernquist, wer ist 792 00:45:00,245 --> 00:45:02,650 ein Mitglied der Fakultät hier in Harvard. 793 00:45:02,650 --> 00:45:03,570 Mehr über Mark später. 794 00:45:03,570 --> 00:45:05,990 Aber ich denke, das ist einer Art resümiert Art 795 00:45:05,990 --> 00:45:09,920 wo die Rechen ist in der Forschung Computing. 796 00:45:09,920 --> 00:45:12,070 Hey, Team, seit dem letzten Dienstag, zerbrach euch 797 00:45:12,070 --> 00:45:15,470 mehr als 28% des neuen Cluster, die in Kombination 798 00:45:15,470 --> 00:45:20,040 ist mehr als 78 Jahre CPU in nur drei Tagen. 799 00:45:20,040 --> 00:45:22,502 Und ich sagte, es ist immer noch erst am Freitagmorgen. 800 00:45:22,502 --> 00:45:23,460 Das ist ziemlich genial! 801 00:45:23,460 --> 00:45:24,740 Glücklicher Freitag! 802 00:45:24,740 --> 00:45:27,450 >> Dann gebe ich ihnen die Datenpunkte. 803 00:45:27,450 --> 00:45:30,260 Und das war irgendwie interessant. 804 00:45:30,260 --> 00:45:34,840 Also denken Sie daran zu markieren, er wird kommen in das Bild zurück in ein wenig. 805 00:45:34,840 --> 00:45:36,935 So Scale-out-Computing ist überall. 806 00:45:36,935 --> 00:45:41,080 >> Wir sind auch zu helfen Leute schauen , wie die NBA-Funktionen, 807 00:45:41,080 --> 00:45:43,140 und wo die Menschen sind Bälle werfen aus. 808 00:45:43,140 --> 00:45:47,580 Ich weiß nicht wirklich verstehen, dieses Spiel zu gut, aber anscheinend ist es eine große Sache. 809 00:45:47,580 --> 00:45:50,610 Es gibt Reifen und Schüsseln und Geld. 810 00:45:50,610 --> 00:45:55,300 >> Und so, in unserer Datenbank, die wir errichtet ein wenig 500 [unverständlich] 811 00:45:55,300 --> 00:45:58,170 Parallel-Prozessor-Cluster, ein paar Terabyte RAM, 812 00:45:58,170 --> 00:46:03,590 der Lage sein, diese zu bauen Kirk und sein Team. 813 00:46:03,590 --> 00:46:08,524 Und sie tun Computing in einem ganz anderen Weg. 814 00:46:08,524 --> 00:46:10,440 Jetzt ist dieses Projekt sind wir mit das ist beteiligt 815 00:46:10,440 --> 00:46:14,880 absolut faszinierend, um neuronale Plastizität connectomics und genomischer 816 00:46:14,880 --> 00:46:20,960 imprinting-- drei sehr schwer Schlagen Forschungsgebiete 817 00:46:20,960 --> 00:46:24,650 dass wir kämpfen mit auf Tag-zu-Tag-Basis. 818 00:46:24,650 --> 00:46:30,670 Die Idee, dass unser Gehirn unter Kunststoff-Stress, wenn wir jung sind. 819 00:46:30,670 --> 00:46:34,980 Und ein großer Teil unserer erwachsenen Verhalten von Erfahrungen in der Kindheit geformt. 820 00:46:34,980 --> 00:46:37,040 Also das ist ein großes dealio. 821 00:46:37,040 --> 00:46:41,360 >> Und so ist die Arbeit, die von der Finanzierungs ist National Institutes of Mental Health. 822 00:46:41,360 --> 00:46:46,860 Und wir versuchen, im Grunde, durch eine Menge von großen Daten 823 00:46:46,860 --> 00:46:51,970 und große Datenanalyse, Art der Peer in unsere menschliche Gehirn 824 00:46:51,970 --> 00:46:54,870 durch eine Vielzahl von verschiedene Techniken. 825 00:46:54,870 --> 00:47:00,360 >> Also wollte ich anhalten und Art gerade Pause einen kleinen Augenblick. 826 00:47:00,360 --> 00:47:04,160 Die Herausforderung mit Fernbedienung Rechenzentren ist es weit entfernt. 827 00:47:04,160 --> 00:47:05,520 Es kann unmöglich funktionieren. 828 00:47:05,520 --> 00:47:07,590 Ich brauche meine Daten in der Nähe. 829 00:47:07,590 --> 00:47:10,730 Ich muss meine Forschung in meinem Labor zu tun. 830 00:47:10,730 --> 00:47:18,620 >> Und so habe ich Art nahm ein Beispiel für ein funktionellen Magnetresonanztomographie 831 00:47:18,620 --> 00:47:22,260 Datensatz aus unseren Daten Zentrum in Western Mass. 832 00:47:22,260 --> 00:47:24,660 und verband es mit meinem Desktop in Cambridge. 833 00:47:24,660 --> 00:47:27,440 Und ich werde dieses kleine Video abzuspielen. 834 00:47:27,440 --> 00:47:29,750 Hoffentlich wird es Art von Arbeit. 835 00:47:29,750 --> 00:47:33,480 >> Also das ist mir gehen durch Überprüfung meiner GPUs arbeiten. 836 00:47:33,480 --> 00:47:35,430 Und ich werde prüfen, ob VNC ist um. 837 00:47:35,430 --> 00:47:36,810 Und das ist eine clevere VNC. 838 00:47:36,810 --> 00:47:38,970 Dies ist ein VNC mit 3D-Stücke. 839 00:47:38,970 --> 00:47:41,975 Und so, wie Sie gleich sehen können, diese ist mir Spinnen dieses Gehirn herum. 840 00:47:41,975 --> 00:47:44,460 Ich versuche, Art es zu orientieren. 841 00:47:44,460 --> 00:47:49,574 Und dann kann ich durch viele bewegen verschiedene Scheiben MRT-Daten. 842 00:47:49,574 --> 00:47:51,490 Und das einzige, was das ist, anders darüber 843 00:47:51,490 --> 00:47:55,160 ist, wird es über die Leitung kommen von Western Mass. auf meinem Desktop. 844 00:47:55,160 --> 00:47:57,300 Und seine Rendering schneller als mein Desktop, 845 00:47:57,300 --> 00:48:02,840 weil ich nicht haben ein $ 4000 Grafikkarte in meinem Schreibtisch, die 846 00:48:02,840 --> 00:48:04,262 wir haben aus Western Mass. 847 00:48:04,262 --> 00:48:05,720 Natürlich versuche ich, schlau zu sein. 848 00:48:05,720 --> 00:48:08,859 Ich bin mit GLX Zahnräder in der Hintergrund, während all dies tun, 849 00:48:08,859 --> 00:48:10,900 um sicherzustellen, dass ich kann, betonen die Grafikkarte, 850 00:48:10,900 --> 00:48:14,140 und dass es alle Arten von arbeitet und den ganzen Rest davon. 851 00:48:14,140 --> 00:48:16,700 Aber das Wichtigste ist, ist dieses 100 Meilen entfernt. 852 00:48:16,700 --> 00:48:20,460 Und man daraus ersehen kann, dass es gibt keine offensichtlichen Latenz. 853 00:48:20,460 --> 00:48:24,600 Dinge zusammenzuhalten ziemlich gut. 854 00:48:24,600 --> 00:48:28,907 >> Und so, dass an und für sich, ist ein Beispiel und einige Einblicke 855 00:48:28,907 --> 00:48:31,490 in, wie Computer-und Scale-Out- Rechen passieren wird. 856 00:48:31,490 --> 00:48:35,330 Wir alle arbeiten an dünner Geräte. 857 00:48:35,330 --> 00:48:36,870 Unsere Verwendung von Tabletten ist steigend. 858 00:48:36,870 --> 00:48:39,160 >> So also, mein Kohlenstoff- Fußabdruck ist im Grunde 859 00:48:39,160 --> 00:48:42,060 bewegt von dem, was verwendet zu tun haben würde, 860 00:48:42,060 --> 00:48:46,060 ein großer Maschinen unter meinem Schreibtisch, um das, was 861 00:48:46,060 --> 00:48:49,550 ist jetzt ein facility-- könnte überall sein. 862 00:48:49,550 --> 00:48:50,800 Es könnte überall überhaupt. 863 00:48:50,800 --> 00:48:54,790 Und doch ist es immer noch in der Lage, zu bringen zurück Hochleistungs-Grafik 864 00:48:54,790 --> 00:48:56,630 auf meinem Desktop. 865 00:48:56,630 --> 00:49:00,900 >> Also, immer in der Nähe der end-- erinnern, Mark? 866 00:49:00,900 --> 00:49:04,480 Nun, das ist smart Lad Mark. 867 00:49:04,480 --> 00:49:09,360 Er entschied, dass er zu gehen Aufbau einer realistischen virtuellen Universum. 868 00:49:09,360 --> 00:49:12,820 Das ist schon ein Projekt, wenn Sie denken, Sie haben zu dieser Tonhöhe. 869 00:49:12,820 --> 00:49:14,740 Ich werde ein verwenden Computer, und ich werde 870 00:49:14,740 --> 00:49:21,040 zu den 12 Millionen Jahre nach Modell der Urknall, um einen Tag zu vertreten. 871 00:49:21,040 --> 00:49:27,080 Und dann werde ich tun, 13,8 Milliarden Jahre der kosmischen Evolution. 872 00:49:27,080 --> 00:49:28,270 In Ordnung. 873 00:49:28,270 --> 00:49:30,970 >> Dies nutzt tatsächlich einen Computer der war größer als unser Computer, 874 00:49:30,970 --> 00:49:35,040 und es über verschüttete auf die nationalen Ressourcen, um unsere Freunde in Texas. 875 00:49:35,040 --> 00:49:38,820 Und den nationalen Einrichtungen, dies war eine Menge Rechen. 876 00:49:38,820 --> 00:49:40,750 Aber wir haben eine Menge die Simulation vor Ort 877 00:49:40,750 --> 00:49:44,820 um sicherzustellen, dass die Software arbeitete und die Systeme gearbeitet. 878 00:49:44,820 --> 00:49:47,790 >> Und es ist Tage wie dieser, wenn Sie erkennen, dass Sie die Unterstützung von Wissenschaft 879 00:49:47,790 --> 00:49:51,090 auf dieser Ebene der Skala, dass Menschen können jetzt Dinge zu sagen 880 00:49:51,090 --> 00:49:52,840 wie, ich werde ein Modell ein Universum. 881 00:49:52,840 --> 00:49:54,145 Und dies ist sein erstes Modell. 882 00:49:54,145 --> 00:49:56,422 Und das ist erste Modell seines Teams. 883 00:49:56,422 --> 00:49:58,130 Es gibt viele andere Leute, die gehen, 884 00:49:58,130 --> 00:50:01,520 hinter Mark, der zu gehen, kommen mit hoher Auflösung modellieren möchten, 885 00:50:01,520 --> 00:50:04,652 mit mehr Spezifität, mit mehr Genauigkeit. 886 00:50:04,652 --> 00:50:09,105 >> Und so, in den letzten paar Minuten, Ich möchte nur, um zu zeigen, dieses Video 887 00:50:09,105 --> 00:50:15,270 von Mark und Lars, dass mir wieder, als Lebenswissenschaftler, ist irgendwie süß. 888 00:50:15,270 --> 00:50:17,890 889 00:50:17,890 --> 00:50:20,970 So dass diese an der Unterseite hier, um Ihnen zu orientieren, 890 00:50:20,970 --> 00:50:23,640 Dies sagt Ihnen der Zeit seit dem Urknall. 891 00:50:23,640 --> 00:50:26,570 So sind wir auf etwa 0,7 Milliarden Jahren. 892 00:50:26,570 --> 00:50:28,740 Und das ist mit der aktuellen Update. 893 00:50:28,740 --> 00:50:33,450 So können Sie im Moment sehen sind, Dunkle Materie und die Evolution 894 00:50:33,450 --> 00:50:39,910 der Feinstruktur und Anfang Strukturen in unserem bekannten Universum. 895 00:50:39,910 --> 00:50:45,690 >> Und der Punkt dabei ist, dass diese werden alle innerhalb des Computers durchgeführt. 896 00:50:45,690 --> 00:50:48,530 Dies ist ein Satz von Parametern und einen Satz von physikalischen 897 00:50:48,530 --> 00:50:52,840 und eine Reihe von Mathematik und einen Satz von Modellen 898 00:50:52,840 --> 00:50:59,284 die sorgfältig ausgewählt werden und dann sorgfältig miteinander verbunden 899 00:50:59,284 --> 00:51:00,825 in der Lage sein, um die Wechselwirkungen zu modellieren. 900 00:51:00,825 --> 00:51:04,850 >> So können Sie einige Starts sehen Einige Gasexplosionen hier. 901 00:51:04,850 --> 00:51:06,880 Und Gastemperatur ändert sich. 902 00:51:06,880 --> 00:51:13,720 Und Sie können beginnen, um die Struktur zu sehen des sichtbaren Universums zu ändern. 903 00:51:13,720 --> 00:51:18,130 Und der wichtigste Teil mit diesen heißt, jeder kleinen winzigen, winzigen, winzigen Punkt 904 00:51:18,130 --> 00:51:21,070 ist ein Stück Physik und hat ein Satz der Mathematik sich um, 905 00:51:21,070 --> 00:51:23,030 informiert seine Freundin und sein Nachbar. 906 00:51:23,030 --> 00:51:27,245 >> Also von einer Skalierung Sicht diese Computer müssen alle Arbeiten in Konzert 907 00:51:27,245 --> 00:51:29,470 und miteinander sprechen effizient. 908 00:51:29,470 --> 00:51:31,060 So können sie nicht allzu gesprächig sein. 909 00:51:31,060 --> 00:51:33,520 Sie müssen ihre Ergebnisse speichern. 910 00:51:33,520 --> 00:51:37,902 Und sie müssen auch weiterhin informieren alle ihre Freunde. 911 00:51:37,902 --> 00:51:40,860 In der Tat, werden Sie jetzt sehen, ist dieses Modell der mehr und mehr kompliziert. 912 00:51:40,860 --> 00:51:42,590 Es gibt mehr und mehr Sachen passiert. 913 00:51:42,590 --> 00:51:45,210 Es gibt mehr und mehr Material herumfliegen. 914 00:51:45,210 --> 00:51:48,410 >> Und das ist, was der Anfang Kosmos würde ausgesehen habe. 915 00:51:48,410 --> 00:51:49,770 Es war eine ziemlich haarige Stelle. 916 00:51:49,770 --> 00:51:55,140 Es gibt Explosionen überall der Ort, leistungsfähige Kollisionen. 917 00:51:55,140 --> 00:51:58,620 Und die Bildung von Schwer Metalle und Elemente. 918 00:51:58,620 --> 00:52:03,910 Und Zerschlagung diese großen Wolken in sich mit der extremen Kraft. 919 00:52:03,910 --> 00:52:08,530 >> So jetzt sind wir 9,6 Milliarden Jahren aus dieser ersten Explosion. 920 00:52:08,530 --> 00:52:12,310 Sie beginnen zu sehen, die Dinge sind Art beruhigte sich ein wenig, nur 921 00:52:12,310 --> 00:52:15,660 ein wenig, weil die Energie führt jetzt zu entspannen. 922 00:52:15,660 --> 00:52:19,420 Und so ist die mathematische Modelle, dass an Stelle bekam. 923 00:52:19,420 --> 00:52:22,510 Und Sie fangen an zu sehen Koaleszenz von verschiedenen Elementen. 924 00:52:22,510 --> 00:52:26,220 Und beginnen, diese Sache Art zu sehen zusammen und langsam abkühlen zu kommen. 925 00:52:26,220 --> 00:52:32,260 >> Und es beginnt, ein wenig suchen mehr wie der Nachthimmel, ein wenig. 926 00:52:32,260 --> 00:52:37,870 Und es ist [? QSing. ?] Wir sind nun 30,2 Milliarden Jahren und wir sind Art getan. 927 00:52:37,870 --> 00:52:41,130 Und dann, was sie tat, war, dass sie dieses Modell haben, 928 00:52:41,130 --> 00:52:44,580 und dann sah sichtbaren Universums. 929 00:52:44,580 --> 00:52:48,560 Und im Grunde dahin waren in der Lage, dass zu nehmen und zu überlagern 930 00:52:48,560 --> 00:52:50,580 es mit dem, was man sehen kann. 931 00:52:50,580 --> 00:52:56,160 Und die Treue ist atemberaubend, wie zu wie genau die Computer-Modelle sind. 932 00:52:56,160 --> 00:52:58,760 >> Selbstverständlich können die Astrophysiker und die Forschungsgruppen 933 00:52:58,760 --> 00:53:02,780 müssen noch bessere Wiedergabetreue und noch höhere Auflösung. 934 00:53:02,780 --> 00:53:06,230 Aber wenn Sie darüber nachdenken, was Ich habe heute zu Ihnen sprechen 935 00:53:06,230 --> 00:53:11,850 diese kleine Reise durch beide Lagerung und Struktur und Vernetzung 936 00:53:11,850 --> 00:53:18,000 und Stacks, ist das Wichtigste, wird Scale-out-Computing wesentlich? 937 00:53:18,000 --> 00:53:22,050 Das war meine ursprüngliche hypothesis-- zurück zu unserem wissenschaftlichen Methode. 938 00:53:22,050 --> 00:53:24,810 >> Ich hoffe, dass in der frühen Teil davon würde ich 939 00:53:24,810 --> 00:53:29,400 davon aus, dass ich in der Lage zu erklären, um Sie über Scale-out-Computing. 940 00:53:29,400 --> 00:53:32,870 Und wir Art getestet einige dieser Hypothesen. 941 00:53:32,870 --> 00:53:34,585 Wir gingen durch das Gespräch. 942 00:53:34,585 --> 00:53:38,920 Und ich werde einfach sagen, Scale-Out- Computing essential-- oh, 943 00:53:38,920 --> 00:53:42,480 ja, sehr ja. 944 00:53:42,480 --> 00:53:44,790 >> Also, wenn Sie denken, über Ihre Codes, wenn 945 00:53:44,790 --> 00:53:49,230 Sie tun die CS50 Abschlussarbeiten sind, wenn Sie Ihre Legacy denkst 946 00:53:49,230 --> 00:53:52,990 für die Menschheit und die Ressourcen, die wir müssen in der Lage, diese Computer ausgeführt werden 947 00:53:52,990 --> 00:53:56,650 Systeme, denke sehr sorgfältig über die FLOPS pro Watt, 948 00:53:56,650 --> 00:53:58,560 und denken über die Chaos Monkey. 949 00:53:58,560 --> 00:54:02,240 >> Denken Sie über Ihre Schneeflocken, nicht tun Unikate, Wiederverwendung Bibliotheken, 950 00:54:02,240 --> 00:54:06,453 bauen wiederverwendbare codes-- all die Dinge, dass die Tutoren unterrichte Sie 951 00:54:06,453 --> 00:54:08,630 in dieser Klasse. 952 00:54:08,630 --> 00:54:11,942 Dies sind grundlegende Aspekte. 953 00:54:11,942 --> 00:54:13,150 Sie sind nicht nur ein Lippenbekenntnis. 954 00:54:13,150 --> 00:54:15,660 Das sind echte Dinge. 955 00:54:15,660 --> 00:54:20,680 >> Und wenn einer von euch, mir zu folgen möchte, Ich bin zwanghaft mit dem Twitter Sache. 956 00:54:20,680 --> 00:54:22,770 Ich muss irgendwie zu geben, dass bis. 957 00:54:22,770 --> 00:54:24,960 Aber viele der Hintergrundinformationen 958 00:54:24,960 --> 00:54:29,260 auf unseren Forschungs Computing Website rc.fas.harvard.edu. 959 00:54:29,260 --> 00:54:34,010 >> I versuchen, und halten ein Blog bis zu Datum mit modernen Technologien 960 00:54:34,010 --> 00:54:38,390 und wie wir es tun distributive Rechen- und so weiter. 961 00:54:38,390 --> 00:54:43,600 Und dann unsere Mitarbeiter werden alles erhältlich durch odybot.org. 962 00:54:43,600 --> 00:54:46,270 Und odybot ist unser kleiner Helfer. 963 00:54:46,270 --> 00:54:49,280 Er hat oft wenig Wettbewerbe auf seiner Website 964 00:54:49,280 --> 00:54:51,630 Auch wenn Sie versuchen, und beschmutzen ihn auf dem Campus. 965 00:54:51,630 --> 00:54:55,200 Er ist der freundliche kleine Gesicht der Forschung Computing. 966 00:54:55,200 --> 00:54:59,730 >> Und ich werde Art wickeln oben und ich danke Ihnen allen für Ihre Zeit. 967 00:54:59,730 --> 00:55:05,660 Und ich hoffe, dass Sie sich daran erinnern, dass Scale-out-Computing ist eine reale Sache. 968 00:55:05,660 --> 00:55:08,162 Und es gibt eine Menge Leute die eine Menge von dem Stand der Technik haben 969 00:55:08,162 --> 00:55:09,370 , die in der Lage, die Ihnen helfen. 970 00:55:09,370 --> 00:55:14,330 Und das alles viel Glück mit Ihre Zukunft alles Gute bei der Herstellung 971 00:55:14,330 --> 00:55:18,280 sicher, dass unsere Berechnung sowohl Waagen, ist leistungsstark, 972 00:55:18,280 --> 00:55:20,370 und hilft, die Menschheit mehr als alles andere. 973 00:55:20,370 --> 00:55:22,850 Also, ich danke Ihnen für das Gespräch. 974 00:55:22,850 --> 00:55:23,947