JAMES CUFF: Hallo, guten Nachmittag, alle zusammen. Mein Name ist James Cuff. Ich bin der Prodekan für Forschung Computer hier an der Harvard University. Und heute werde ich mit Ihnen sprechen warum Scale-out-Computing ist von wesentlicher Bedeutung. So denke ich, zuerst, wer ist dieser Kerl? Warum bin ich hier? Warum habe ich mit dir zu reden? Ich habe einen Hintergrund in der wissenschaftlichen Rechen- und Forschungs Computing, reicht zurück in die Vereinigten Kingdom-- Der Wellcome Trust Sanger Institut für Human genome-- und dann in jüngerer Zeit in den Vereinigten Staaten Arbeiten an der Broad und anderen angesehenen Orte des Lernens, wie Harvard. Ich denke, was das wirklich bedeutet ist dass ich eine Wiederherstellung molekularen Bio Physiker. So welches Recht habe ich zu sagen, Sie Scale-out-Computing? Es gibt jedoch ein. 18 Jahre oder so habe ich nur die am häufigsten angesehenen dramatischen Anstieg der Skala Komplexität und die Gesamteffizienz von Computersystemen. Als ich an der Oxford tat mein PhD, I war ziemlich aufgeregt, mit einem 200 Megahertz Silicon Graphics Maschine mit 18 Gigabyte Speicher und eine einzelne CPU. Die Zeiten haben sich geändert. Wenn Sie schneller Vorlauf jetzt, wir spinnen über 60.000 CPUs hier in Harvard. Viele andere Organisationen spinnen viele mehr. Die wichtigsten Lieferservice von dies dass Skala ist jetzt nicht nur unvermeidlich, es passiert und es ist auch weiterhin geschehen. Also lassen Sie uns für einen Moment, Art der Rücklauf und sprechen sehr schnell über die Wissenschaft, meine Lieblings- unterliegen, die wissenschaftliche Methode. Wenn Sie ein Wissenschaftler sind, müssen Sie ein paar wichtige Dinge zu tun. Wenn Sie nicht diese Dinge tun können nicht der Ansicht, selbst ein Wissenschaftler und Sie werden kämpfen, in der Lage, verstehen Ihr Fachgebiet Disziplin. Also zunächst einmal, Sie formulieren würde Ihre Frage, erzeugen Sie Hypothesen, aber noch wichtiger ist, Sie vorhersagen Ihre results-- Sie erraten, haben was die Ergebnisse sein. Und dann endlich, testen Sie Ihre Hypothese und analysieren Sie Ihre Ergebnisse. Also diese wissenschaftliche Methode ist sehr wichtig in Computing. Computing sowohl der Vorhersage und die Möglichkeit, Ihre Ergebnisse zu testen sind ein wichtiger Teil dessen, was wir brauchen, in der wissenschaftlichen Methode zu tun. Diese Vorhersagen und Prüfungen sind die wahren beiden Eckpfeiler der wissenschaftlichen Methode, und jedes erfordern die bedeutendsten Fortschritte in der modernen Rechen. Die zwei Säulen der Wissenschaft sind, dass der Theorie und der Experimente. Und in jüngerer Zeit, Computing wird oft erwähnt, als die dritte Säule der Wissenschaft. Also, wenn Sie Schüler sind gerade diese, Sie haben keinerlei Druck. Dritte Säule der science-- keine große Deal-- Computing, Art wichtig. So froh, dass dies die Rechenteil der Informatikkurs 50. So genug der Hintergrund. Ich möchte, dass der Plan, um zu sagen, was werden wir heute sprechen. Ich werde über einige Geschichte zu gehen. Ich werde erklären, warum wir hier haben. Ich werde über einige sprechen der Verlauf der Rechen hier in Harvard, einige Aktivitäten rund um Social Media, grün things-- sehr leidenschaftlich über alle Dinge green-- storage-- Computer storage-- wie Chaos wirkt Scale-Out-out-Systeme, und Verteilungssysteme im Besonderen. Und dann werde ich auf einige berühren der Scale-Out-Hardware, ist erforderlich ist, um in der Lage zu sein, tun Computing im Maßstab. Und schließlich werden wir zu gehen wrap up mit einigen fantastischen Wissenschafts. Also, lassen Sie uns eine Minute, um Blick auf unsere eigentliche Geschichte. Computing hat sich weiterentwickelt. Also seit den 60er Jahren, die alle der weg bis zur heutigen, wir im Grunde eine Änderung gesehen haben Rahmen von zentralisierten Computing Computing zu dezentralisieren, um Zusammenarbeit und unabhängige Computing und rechts wieder zurück. Und lassen Sie mich mit Anmerkungen zu versehen, dass ein wenig. Als wir anfingen, mit Computer, hatten wir Mainframes. Sie waren übermäßig teure Geräte. Alles musste geteilt werden. Die Rechen war komplex. Sie können sehen, sie durchflutete Räume und gab es Betreibern und Bänder und alle Arten von Whirry, clicky, spinny Geräte. Rund um die 70er Anfang der 80er Jahre begann man um zu sehen, die Auswirkungen der Klimaanlagen. Also Sie fangen an Rechen sehen starten, um wieder in den Labors erscheinen und sich näher. Der Aufstieg des Personal Computer, sicher in den 80er Jahren, zu Beginn des zehn Jahren wirklich verändert Computing. Und es gibt einen Anhaltspunkt in den Titel, weil es hieß der Personal Computer, was bedeutete es, Ihnen gehört. So wie die Entwicklung der Computing fort, Menschen erkannt, dass ihre persönlichen Computer war nicht wirklich groß genug, in der Lage sein, alles zu jeder Verdienst zu tun, oder wesentliche Verdienst, in der Wissenschaft. Und so die Leute begannen, Entwicklung Netzwerkgerät Treiber, um PCs zu verbinden zusammen, um in der Lage, Cluster aufzubauen. Und so zeugte das Zeitalter des Beowulf. Linux explodiert als Reaktion auf proprietären Betriebssystem, sowohl kosten und Komplexität. Und dann, hier sind wir heute wo wieder einmal sind wir Zimmer mit voller Computer konfrontiert Ausrüstung und die Fähigkeit , seine Kreditkarte Swipe und erhalten Zugang zu den EDV-Anlagen, Ferne. Und so können Sie dann sehen, in Bezug auf die Geschichte aufprall wie wir Rechen heute ist es auf jeden Fall von Maschine entwickelt Zimmer voll von Computern durch einige Personal Computing ganz rechts wieder zurück Maschinenräume voller Computer. Also das ist meine erste Cluster. So 2000, bauten wir ein Computersystem in Europa um effektiv zu kommentieren das menschliche Genom. Es gibt eine Menge von Technologie auf der rechten Seite aufgelistet gibt, die leider ist nicht mehr unter uns. Es ist deaktiviert auf den übergebenen großartige Technologie in den Himmel. Die Maschine selbst ist wohl Gegenwert von ein paar anständige Laptops heute, und dass nur eine Art zeigt Ihnen. Allerdings haben wir sorgfältig mit Anmerkungen versehen das menschliche Genom und beide schützen lassen mit diesem Papier Natur von den Sorgen der Daten als öffentlich oder privat. Also das ist genial, nicht wahr? Also haben wir einen menschlichen Genoms hat. Wir haben die Berechnung durchgeführt. Ich fühle mich sehr gefreut habe. Ich rollte bis zur Harvard im Jahr 2006, Gefühl viel mit mir selbst weniger zufrieden. Dies ist, was ich geerbt. Dies ist eine abteilungs Mail- und Dateiserver. Hier können Sie sehen, dass es ein bisschen Klebeband dass wird verwendet, um das System zusammenzuhalten. Dies ist unsere Lizenz- und Druckserver. Ich bin mir ziemlich sicher, dass es vielleicht Passwörter Auf einige dieser Post-it Notes. Nicht großartig. Ziemlich weit von awesome. Und ja, ich dieses kleine Tabelle zu realisieren dass ich dir gezeigt habe am Anfang zu teilen mit dem Eigentum zurück zu teilen, dass wir brauchten, um das Spiel zu ändern. Und so das Spiel verändert wir durch Anreize. Und so den Menschen, da dies wenig Wikipedia-Artikel Hier steht, unsere ziel Kreaturen. Und das Studium der Anreiz Strukturen ist wesentlich für die Studie der wirtschaftlichen Aktivität. So haben wir begonnen, einen Anreiz unsere Dozenten und unsere Forscher. Und so sie Anreize wir mit ein wirklich großes Computersystem. So im Jahr 2008 haben wir eine 4096 Prozessor machine-- 10 Racks, paar hundert Kilowatt Leistung. Was ich denke, ist Interessanter ist es nicht Egal wo Sie sind im Zyklus. Die gleiche Menge Strom und Rechen-, ist die Kraft, die konstant. Es war 200 Kilowatt, wenn wir bauten Systemen in Europa. Es ist zwei hundert Kilowatt im Jahr 2008, und das scheint die [sein? quanter?] von kleinen universitäre Computersysteme. So Harvard today-- Vorspulen, ich bin kein mehr traurig Panda, ziemlich glücklich panda. Wir haben rund 60 Tausend Lastenausgleich CPUs und ihre Kletter dramatisch. Wir haben 15 Petabyte Lagerung, auch klettern. Auch dies 200 Kilowatt Schritt scheinen wir zu sein, fügte hinzu, dass alle sechs Monate oder so. Viele, viele virtuelle Maschinen. Und was noch wichtiger ist, etwa 1,8 Megawatt Forschungs Computing Equipment. Und ich werde kommen zurück, dies später, , warum ich jetzt nicht mehr unbedingt zu zählen, wie viel CPU die wir haben, aber wie groß ist die Stromrechnung. 20 weitere so gewidmet Forschungs Computing Mitarbeiter. Und was noch wichtiger ist, wir sind beginnen, unsere GPGPU wachsen. Ich war erstaunt, wie viel von diesem gestaffelt wird von Tag zu Tag Grundlage hinzugefügt. Also, Geschichtsstunde über, nicht wahr? Also, wie kommen wir dorthin von hier? Lassen Sie uns an einigen modernen Scale-Out-Rechenbeispiele. Ich bin ein bisschen besessen von der Größe und Umfang der sozialen Medien. Es gibt eine Reihe von extrem erfolgreiche Großrechen Organisationen jetzt auf dem Planeten, Unterstützung und Dienstleistungen für uns alle. Also das ist der Haftungsausschluss. Und ich möchte mit einem Start Anzahl der Unzen in einem Instagram. Es ist nicht wirklich ein führen, um ein Witz, es ist nicht einmal so lustig, tatsächlich, wenn man es sich denken. Aber wie auch immer, wir sind zu gehen Blick auf Unzen in Instagram. Und wir starten mit "My Biene und eine Blume." Ich [unverständlich] Gemeinde war und ich nahm ein kleines Bild einer Biene auf einer Blume. Und dann fing ich an, darüber nachzudenken, was bedeutet das eigentlich. Und ich machte dieses Foto von meinem Telefon und gezählt, wie viele Bytes in ihm, und es ist etwa 256 KB. Die, als ich anfing, würde im Grunde füllen eine 5 und 1/4 Zoll Diskette. Und begann zu denken, gut, das ist cool. Und ich begann zu sehen und zu tun einige Forschung auf dem Netzwerk. Und ich fand heraus, dass Instagram hat 200 Millionen MAU. Ich war eigentlich nicht so sicher, was für ein MAU war. Und ein MAU, hier unten ist ein monatlich aktive Nutzer. Also, 200 Millionen MAUs-- ziemlich cool. 20 Milliarden photographs-- so eine ganze Reihe von Fotos. 60 Millionen neue Fotografien jeden Tag kommen bei etwa 0,002 Gig pro Foto. Das ist etwa fünf Petabyte Platten gerade recht. Und das ist wirklich nicht der zentrale Teil von was wir reden. Das ist ein kleiner Fisch. Oder wie wir in England, kleine Kartoffeln sagen. Lassen Sie uns also einen Blick auf die echten Elefanten in den room-- einzigartige Gesichter. Auch hier wollen wir messen diese neue Quanten rufen Sie einen MAU. Facebook selbst hat 1,3 Milliarden MAUs. WhatsApp, die ich noch nicht einmal gehört bis vor kurzem, es ist eine Art Nachrichtendienst, 500 Mio. MAUs. Instagram, die wir gerade sprach von 200 Millionen MAU. Und Messenger, das ist ein anderer Messaging-Dienst, ist auch 200 Millionen MAU. Also insgesamt, dass sich, es geht darum, 2,2 Milliarden Gesamt Nutzer. Offensichtlich gibt es einige Überschneidungen, aber das ist entspricht einem Drittel des Planeten. Und sie etwas zu senden in die Region 12 Milliarden Nachrichten pro Tag. Und wieder gibt es nur 7 Milliarden Menschen auf dem Planeten. Nicht jeder hat ein Smartphone. Also das ist verrückt Zahlen. Und ich werde argumentieren, dass es nicht auch über die Lagerung oder die Rechen. Und, um das Lied zu zitieren, es ist alles über die Grafik. Hier ist unsere schöne Meghan Trainor unten Hier singt über alle Bass. Beachten Sie, sie hat auch eine ganze wenig Bass herself-- 207, gut 218 Millionen Menschen gesehen haben diese junge Dame zu singen ihr Lied. Also mein Argument ist es es ist alles über die Grafik. Also nahmen wir einige Open-Source-Software und haben zu einem Graph zu suchen. Und das ist LinkedIn, so dass diese ist ein Facebook für alte Leute. Und so, das ist meine LinkedIn Graphen. Ich habe rund 1.200 Teilnehmer, sogenannten "Friends". Und hier bin ich an der Spitze. Und hier ist alle Verbindungen. Nun, denken Sie zurück an die Instagram Geschichte. Jede von ihnen ist nicht nur das Foto, es hat eine ganze Fülle von Verbindungen zwischen dieser bestimmten Person und viele andere. Das ist Mittelstück ist entweder ein Fehler im Zeichnen von Graphen-Algorithmus, oder dies vielleicht David Malan, ich bin noch nicht sicher. So können Sie die neu zu zeichnen Graphen in allerlei von ways-- gephi.gihub.io ist, wo Sie können diese Software zu ziehen. Es ist wirklich cool zu sein Lage, Gemeinden zu organisieren. Hier können Sie sehen, das ist Harvard und verschiedene andere Orte, die ich gearbeitet habe, denn dies ist mein arbeitsbezogenen Daten. Also einfach über die Komplexität denken, der grafischen Darstellung und der gesamte Daten dass Sie entlang ziehen mit. So der Zwischenzeit wieder auf Friendface, nicht wahr? Wir haben uns die Instagram Daten, lag in der Größenordnung von fünf Petabyte. Keine große Sache. Noch eine ganze Reihe von Daten, aber keine große beschäftigen im Groß Plan der Dinge. Von diesem Artikel auf der alten Internet, "Skalieren des Facebook Data Warehouse zu 300 Petabyte. " Das ist eine ganz andere Spiel-Wechsler jetzt, wenn Sie fangen an denken, der Daten und der Grafik und was Sie mitbringen mit. Und ihre hohe Daten wächst von der Größenordnung von 600 Terrabyte pro Tag. Nun, wissen Sie, nun ja, dann- Ich meine, 600 Terrabyte pro Tag, 300 petabytes-- sie auch jetzt beginnen zu sehr besorgt über erhalten wie man diese Sachen und um sicherzustellen, dass diese Daten sich im Bereich. Und dieser Herr hier, Jay Parikh, sucht an, wie man eine exabyte Daten speichern. Nur für die von Ihnen die gerade zusammen sind zu Hause, ein exabyte-- 10 auf die 18. Es hat seinen eigenen Wikipedia Seite, es ist, dass große Nummer. Das ist die Größe und das Ausmaß dessen, was wir sind suchen, um Daten zu speichern. Und diese Jungs sind nicht herumschlagen, sie speichert diese Menge an Daten. Damit wird eines der Hinweise, sie hier sehen ist für Rechenzentren sogenannte kalte Lagerung. Das bringt mich zu, grün. Und hier ist Kermit. Er und ich agree-- es ist extrem schwierig, grün zu sein, aber wir geben unser Bestes. Kermit kann nichts dafür, er die ganze Zeit, grün zu sein, seine grünen Heit nicht ausziehen haupt. So, als concepts-- ein einige Arten von Kernkonzepte des Grüns, wenn es bezieht sich auf Computer. Die eine, die das wichtigste ist, ist die Langlebigkeit des Produkts. Wenn Ihr Gerät über eine kurze Lebensdauer, Sie können per Definition nicht, seien sie grün. Die Energie getroffen werden, um eine Produktion Plattenlaufwerk, ein Motherboard, ein Computer System, eine Tablette, was es auch sein, die Lebensdauer Ihrer Systeme sind ein wichtiger Teil der grünen Sie sein können. Die wichtige Rolle, da alle, bauen Software algorithms-- Algorithmus ein teil Wort für Software, nicht wahr? So ist Ihr Algorithmus Design im Hinblick auf absolut entscheidend wie Sie in der Lage zu machen sind schnelle und präzise Berechnungen zu verwenden die geringste Menge an Energie möglich. Und ich werde dies in einer etwas zu bekommen. Rechenzentrum design-- Sie haben gesehen, dass wir bereits Tausende Abertausende von Maschinen, Sitz in ruhiger Lage im kleinen, dunklen Ecken der Welt, Computing. Ressourcen allocation--, wie man an die Rechen-, der Speicherung, durch das Netzwerk. Betriebssysteme sind ein wichtiger Teil der Diese und viele Virtualisierungs um mehr packen und mehr Rechen in einen kleinen Raum. Ich gebe Ihnen ein kleines Beispiel geben von der Forschung Computing. Wir brauchten mehr ping, mehr Leistung und mehr Rohr. Wir brauchten mehr größer, besser, schneller Computer, und mussten weniger Saft verwenden. Und wir nicht arbeiten konnte, wie das geht. Ich weiß nicht, ob das Hashtag wie GoWest vermutlich durch die Kardashian verwendet wurde, aber trotzdem, GoWest. Und das taten wir. Wir holten unser Betrieb und wir zogen es heraus den westlichen Massachusetts in einer kleinen Mühle Stadt genannt Holyoke, nördlich von Chikopee und Springfield. Wir taten dies für eine Reihe von Gründen. Die wichtigste davon war, dass wir hatte einen sehr, sehr großen Staudamm. Und das sehr große Damm ist in der Lage, löschte 30 plus Megawatt Energie, und es war zu der Zeit nicht ausgelastet. Noch wichtiger ist, wir hatten auch ein sehr kompliziertes Netzwerk Das war bereits vorhanden. Wenn Sie bei dem das Netz suchen geht in den Vereinigten Staaten, es folgt den Bahngleisen. Dieses besondere Stück Netzwerk war von unseren Kollegen und Freunden im Besitz am Massachusetts Institute of Technology, und es ist im Grunde gebaut wurde ganz heraus zu Route 90. So hatten wir eine große Fluss tick, Route 90 Zecken, wir hatten eine kurzen Weg von 100 Meilen, und ein langer Weg von über 1000 Meilen. Wir haben eine sehr große zu tun Netzwerk Spleiß, wie Sie hier sehen können, im Grunde einen Link in, um in der Lage, zu Holyoke verbinden, aber wir hatten alle die erforderliche infrastructure-- ping, Macht, Rohr. Das Leben war gut. Und wieder, große Staumauer. So bauten wir im Grunde das Massachusetts Grüne Hochleistungsrechnen Center. Das war eine Arbeit der Liebe durch fünf universities-- MIT, Harvard, UMass, Northeastern und BU. Fünf-Megawatt-Tag an angeschlossene Last. Wir haben alle Arten von Klugheit mit luftseitigen Economizer die Dinge grün zu halten. Und wir integrierten 640-odd-Racks, Forschungsdatenverarbeitung gewidmet. Es war eine alte Brachfläche, so dass wir hatte eine Rekultivierung und einige Aufräum und einige Aufräum der Website. Und dann haben wir begonnen , die Anlage zu bauen und, boom-- schöne Anlage mit der Fähigkeit, Sandkasten Computing laufen, Konferenzen und Seminare haben, und auch eine massive Rechenzentrum Stock. Hier ist meine gute Selbst. Ich bin natürlich tragen die gleiche Jacke. Ich vielleicht nur ein Jacke, aber es gibt mir und John Goodhue-- er der Executive Director der Center-- stehen im Maschinenraum Etage, die, wie Sie sehen können, ist ziemlich dramatisch, und es geht ein langer, langer Weg. Ich spiele oft Spiele Fahren von Boston aus zu Holyoke, vorzugeben, dass ich bin ein TCP / IP-Paket. Und ich habe über meine Latenz sorgen Herumfahren in meinem Auto. Also das ist die grüne Stück. Werfen wir also nur eine Minute und darüber nachzudenken, Stacks. So dass wir sehr sorgfältig, um zu versuchen bauen Rechenzentren effizient, effektiv zu berechnen, machen gute Selektion für die Computerausrüstung und liefern mehr wichtiger ist, unsere Anwendung, sei es ein Messaging-Service oder eine wissenschaftliche Anwendung. Also hier sind die Stacks. So physikalische Schicht, die ganze Weg durch application-- in der Hoffnung, dass dies zu gehen ein guter Teil des Kurses. OSI Sieben-Schichten-Modell grundsätzlich, Sie leben, essen und atmen Diese gesamten Rechen Karriere. Das gesamte Konzept der physischen infrastructure-- Drähte, Kabel, Rechenzentren, Links. Und das ist nur der Beschreibung der Netzwerk. Hier oben ist, und, natürlich, das ist eine alte Rutsche, denn dies würde sagen, HTTP, weil niemand kümmert sich um einfache Mail Transportprotokolle, nicht mehr. Es ist alles passiert in der HTTP-Raum. Also das ist eine Ebene des Stapels. Hier ist eine weitere Reihe von Stacks, wo Sie einen Server, ein Sender, ein Hypervisor, Gast, binäre Bibliothek, und dann Ihre Anwendung. Oder, in diesem Fall das Gerät Fahrer, ein Linux-Kernel, nativen c, Java Virtual Machine, Java-API, dann Java Anwendungen und so weiter und so fort. Dies ist eine Beschreibung einer virtuellen Maschine. Heilige Stacks, Batman! Denken Sie darüber nach in Bezug auf, wie viel Rechen Sie brauchen, um von zu bekommen was hier geschieht, den ganzen Weg bis zum oberen dieses Stapels, um dann können Sie die aktuell zu tun Lieferung von der Anwendung. Und wenn Sie Art zurückspulen und anfangen zu denken, über das, was es braucht, um liefern eine Gleitkomma-Operation, Ihre Gleitkommaoperation ist eine Summe der Sockel, die Anzahl der Kerne in die Steckdose, die eine Uhr, Wie schnell kann die Uhr turnover-- vier Gigahertz, zwei gigahertz-- und dann die Nummer von Operationen möglich tun in einem bestimmten Hertz. Also jene Mikroprozessoren heute tun vier bis sechs Flops pro Taktzyklus. Und so ein Single-Core 2,5 Gig Uhr hat eine theoretische Leistung von etwa ein Mega-FLOP, geben oder nehmen. Aber wie bei allem, Wir haben die Wahl. So und Intel Core 2, Nehalem Sandy Bridge, Haswell, AMD, nehmen Sie Ihre choices-- Intel Atom. Alle diese Prozessorarchitekturen alle haben eine etwas andere Weise in der Lage zu fügen zwei Zahlen, das ist im Grunde ihren Zweck im Leben. Muss hart sein. Es gibt Millionen von ihnen sitzen in Rechenzentren, jetzt aber. Sor, Flops pro watt-- das ist die große Sache. Also, wenn ich will mehr davon zu bekommen durch diesen Stapel zu erhalten, schneller, Ich muss auf zu arbeiten, wie viele Fließkomma-Operationen ein zweites, Was ich tun kann, und dann geben sie Watt. Und zum Glück, Leute haben darüber nachgedacht. Es gibt also einen großen bestreiten jedes Jahr zu sehen, , der die schnellste Computer bauen können das kann eine Matrix diagonalisieren. Es nennt die Top 500. Sie nehmen die Spitze aus die besten 500 Computer auf dem Planeten, kann diagonalisieren Matrizen. Und Sie erhalten einige erstaunliche Ergebnisse. Viele dieser Maschinen sind zwischen 10 und 20 Megawatt. Sie können Matrizen diagonalisieren mäßig schnell. Sie geben nicht notwendigerweise diagonalisiert sie so effizient pro Watt, so gab es diese großen Schub, zu betrachten was eine grüne 500-Liste aussehen würde. Und hier ist die Liste von Juni. Es sollte eine neue sehr kurz sein. Und es ruft out-- ich nehme die Anfang der bestimmten Liste. Es gibt zwei spezifische machines-- ein vom Tokyo Institute of Technology und eine von Cambridge University in Großbritannien. Und diese haben ziemlich erschütternd Mega-Flops pro Watt Verhältnis. Dieser ist 4389 und die nächste nach unten ist 3631. Ich werde den Unterschied zwischen zu erklären diese beiden, in der nächsten Folie. Aber das sind diese mittelgroße Testcluster. Dies sind nur 34 Kilowatt oder 52 Kilowatt. Es gibt einige größere hier-- diesen bestimmten bei der Schweizerischen National Supercomputing Centre. Die Botschaft dafür ist, dass wir Versuch, Computer zu finden dass effizient arbeiten können. Und so schauen wir uns an diesem Top ein, niedlich genannt, die KFC. Und ein bisschen Werbung hier. Diese besondere Lebensmittelunternehmen hat nichts damit zu tun. Es ist die Tatsache, dass Dieses spezielle System wird in einem sehr eingeweicht clevere Ölbasis enthält. Und so bekamen sie ihre Huhn Friteuse Moniker wenn sie zuerst begonnen bauen diese Art von Systemen. Aber im Grunde, was sie genommen haben Hier ist eine Anzahl von Schaufeln, steckte sie in diesem anspruchsvolle Mineralöl, und arbeitete heraus, wie Sie alle bekommen die Vernetzung in und aus ihm heraus. Dann, nicht nur das, sie es draußen so gesetzt haben dass es außerhalb Luftkühlung zu nutzen. Es war ziemlich beeindruckend. So können Sie alle tun müssen, dieser Spielereien um diese Menge zu erhalten Rechen geliefert für kleine Leistung. Und Sie sehen, das ist die Form von wo die Dinge Überschrift. Die Herausforderung besteht darin, dass die regelmäßige Luft Kühlung ist die Skalen und treibt viele der Entwicklung sowohl regelmäßige Computing, und High Performance Computing. Also, das ist ziemlich störend. Ich denke, das ist faszinierend. Es ist ein bisschen chaotisch, wenn Sie versuchen, die Festplattenlaufwerke austauschen, aber es ist eine wirklich coole Idee. Also nicht nur das, es gibt eine ganze Reihe von Arbeiten die um das, was wir gebaut Aufruf der Open Compute Project. Und so mehr darüber ein wenig später. Aber die Industrie dem Start erkennen, dass die Reinfälle pro Watt wird immer wichtiger. Und Sie, wie die Leute hier, wie Sie Algorithmen zu entwerfen und Sie entwerfen Sie Ihre Code, sollten Sie wissen, dass Ihr Code kann haben einen Dominoeffekt. Als Mark saß hier in seinem Zimmer im Studentenwohnheim schreibt Facebook 1.0, Ich bin mir ziemlich sicher, er hatte einen Blick dass es im Begriff war riesig. Aber wie groß es auf die sein Umwelt ist ein großer dealio. Und so alle YA'LL konnte kommen mit Algorithmen dass die nächste Herausforderung sein könnte Sache für Leute wie mich, versuchen, Systemen laufen. Also lasst uns einfach darüber nachdenken, realen Leistungsgrenzen. Dieses Papier von Landauer-- ist keine neue Sache. 1961 diese veröffentlicht wurde im IBM Journal. Dies ist die kanonische "Irreversibilität und Wärme Generation in der Computing-Prozess. " Und so argumentierte er, dass Maschinen unausweichlich führen logistischen Funktionen, keine eindeutige inverse. So dass der gesamte Teil ist, dass bereits in den 60er Jahren, Leute wussten, dass dies zu einem Problem werden. Und so das Gesetz der Grenzen, sagte 25 Grad C, eine Art kanonischen Raum Temperatur, die Grenz stellt 0,1 Elektronenvolt. Aber theoretisch ist diese Die Theorie, Computerspeicher, die bei dieser Grenze könnte auf eine Milliarde Bits ein zweites geändert. Ich weiß nicht wie es euch geht, aber nicht stoßen auf viele eine Milliarde Bits eine zweite Datenrate Austausch. Das Argument war, dass nur 2,8 Billionen von einem Watt Leistung sollte immer erweitert werden. In Ordnung, realen Welt example-- dies ist meine Stromrechnung. Ich bin 65% Prozent das schöne Rechenzentrum Habe ich Ihnen gezeigt, in dieser besonderen Zeit. Dies ist im letzten Jahr im Juni. Ich habe eine ältere Version genommen, damit wir kann und Art anonymisieren ein wenig. Ich verbrachte $ 45.000 ein Monat für Energie gibt. Also der Grund dafür ist es, dass wir haben mehr als 50.000 Vorgänge im Raum. So könnten Sie Ihre eigenen vorstellen Wohnstromrechnung ist, dass hoch? Aber es war für ein 199 Mio. Wattstunden mehr als einem Monat. So ist die Frage, die ich stellen ist, können Sie vorstellen, Herr Zuckerberg die Stromrechnung? Mine ist ziemlich groß, und ich kämpfen. Und ich bin nicht allein ist. Es gibt eine Menge Leute, mit großen Rechenzentren. Und so, ich denke, voll disclosure-- meine Facebook Freunde ein wenig seltsam. Also mein Facebook-Freund ist die Prineville Rechenzentrum, die eine der größten Facebook, neuesten, energieärmsten Rechenzentrum. Und sie schreiben mir, Dinge wie Energienutzung Effizienz, nach wie effektiv die Daten Zentrum gegenüber, wie viel Energie Sie Inbetriebnahme darauf, wie viel Wasser nutzen sie, was ist Die Feuchtigkeit und Temperatur. Und sie haben diese schöne, schöne Grundstücke. Ich denke, dies ist ein genial Facebook-Seite, aber ich denke, ich bin ein wenig seltsam. So eine Sache mehr Leistung, Forschungs Computing, die ich tue unterscheidet sich wesentlich was Facebook und Yahoo und Google und anderen On-Demand, voll, immer Angebot. Und so habe ich den Vorteil, dass bei ISO New England-- und ISO New England hilft die Energie eingestellt Raten für die Region. Und es sagt, dass es Verlängerung eine Anforderung für die Verbraucher freiwillig zu sparen hohe Energie, aufgrund der hohen Hitze und Feuchtigkeit. Und das war wieder am 18. Juli. Und so bin glücklich Tweet zurück, Hey, ISO New England, Grün Harvard. Wir tun unser Teil über hier in der Forschung Computing. Und das ist, weil wir die Wissenschaft zu tun. Und so sehr die Leute sagen, die Wissenschaft die niemals schläft, kann die Wissenschaft warten. So sind wir in der Lage, den Ruhezustand versetzen unsere Systeme, profitieren Sie von Klasse Preisen auf unserer Stromrechnung, und Hilfe im ganzen New England Region durch den Abbau von viele Megawatt Last. Also das ist die einzigartige Sache, unterscheidet sich von wissenschaftlichen Rechnens Daten Zentren und solche, die es in voller Produktion 24/7. Lassen Sie uns so nehmen Sie nur einen Gang hier. Also, ich möchte, um zu diskutieren Chaos ein wenig. Und ich möchte es in setzen die Schirmherrschaft der Lagerung. Also für diejenigen, die Art des Kampfes wurden bekommen ihre Kopf herum, was Petabyte Stau aussehen, dies ein Beispiel. Und das ist die Art von Sachen Ich beschäftige mich mit der ganzen Zeit. Jede dieser kleinen Jungs ist ein Vier-Terabyte-Festplatte, schauen Sie sich die Art von zählen sie auf. Wir bekommen jetzt zwischen ein bis 1 und 1/2 petabytes in einem Standard-Industrie-Rack. Und wir haben Zimmer und Zimmer, wie Sie sah in dieser früheren Bild mit John und ich, voll von diesen Gestellen der Ausrüstung. So ist es immer sehr, sehr einfach zu massiven Storage-Arrays erstellen Es ist meistens einfach innerhalb von Unix zu Art Zählen wie die Dinge laufen. Das ist also zählen, wie viele MAU Punkte habe ich dort ankam. Also das ist 423 Schnittpunkte. Und dann, wenn ich keine etwas skizzen awk, I summieren sich in diesem speziellen System, gab es 7,3 Petabyte verfügbarer Speicher. Also das ist eine Menge Zeug. Und Lagerung ist wirklich schwer. Und doch, aus irgendeinem Grund, dies ist ein Trend der Branche. Immer, wenn ich an unsere Forscher sprechen und unserer Fakultät und sagen: hey, ich kann Speicher für Sie ausführen. Leider habe ich zu sich die Kosten der Speicherung. Ich dieses Geschäft. Und die Leute verweisen Newegg oder sie Staples verweisen oder wie viel sie ein kaufen können Einzel Terabyte-Festplatte für. Also das, werden Sie feststellen, hier, dass es einen Anhaltspunkt. Es gibt ein Plattenlaufwerk hier. Und wenn wir zurückgehen, ich habe viele. Nicht nur, dass ich viele, ich habe anspruchsvolle Verbindungen in der Lage sein Stich sein diese Dinge zusammen. Damit ist das Risiko mit diesen großen assoziiert Speicher-Arrays ist nicht unbedeutend. In der Tat, um das nahmen wir Internet und wir schrieben ein wenig Geschichte über einen wohlmeinenden, sanftmütigen Direktor der Forschung computing-- geschieht, ein haben seltsamen Englisch accent-- versuchen um an einen Forscher erklären, was die kein Unterstrich Backup-Ordner tatsächlich gemeint. Es war eine lange, kleine Geschichte, gut vier Minuten nach Entdeckung. Und Hinweis, ich habe einen schrecklich viel weniger Platz als die Dame dass singt über die ganze Bass. Wir sind nicht wenige Konten niedriger. Aber wie auch immer, ist dies ein wichtige Sache zu denken, in Bezug auf das, was schief gehen könnte. Also, wenn ich eine Festplatte, und Ich werfe es in einer Unix-Maschine, und ich mit dem Schreiben beginnen Freizeitangeboten.Zum, da ist ein Magnet, da ist ein Antriebskopf, gibt es angeblich eine Eins oder eine Null wird sich auf diesem Gerät geschrieben. Motors-- spinny, twirly Dinge immer zu brechen. Denken Sie an Dinge, die zu brechen. Es ist immer spinny gewesen, twirly Dinge. Drucker, Festplatten, Motorfahrzeuge usw. Alles, was sich bewegt, ist wahrscheinlich zu brechen. So können Sie Motoren benötigen, müssen fahren Firmware, Sie brauchen SAS / SATA-Controller, Kabel, Firmware der SAS / SATA-Controller, niedrigen Niveau Blöcke. Wählen Sie Ihre Speicher-Controller-Datei System-Code, je nachdem, welcher einen kann es sein, wie Sie die Dinge zusammenzufügen. Und Ihre virtuellen Speichermanager Seiten, DRAM holen und speichert. Dann erhalten Sie eine andere stapeln, welche Art ist von unten in der Liste auf diese ein, Algorithmen, User. Und wenn Sie diese multiplizieren up, weiß ich nicht, wie viele, es gibt eine Menge von Orten wo Sachen seitlich gehen. Ich meine, das ist ein Beispiel über Mathematik. Aber es ist eine Art von Spaß zu denken wie viele Möglichkeiten Dinge schief gehen könnte, nur für ein Plattenlaufwerk. Wir sind schon bei 300 Petabyte, also vorstellen, die Anzahl der Festplattenlaufwerke Sie müssen bei 300 Petabyte dass die schief gehen können. Nicht nur dass-- also ist das Speicher. Und das eine Anspielung auf die Person, die ich würde gerne sehen, Geben Bühne verlassen, die ist das Chaos Monkey. Also an einem bestimmten Punkt, auch wird es größer ist als nur das Diskettenlaufwerk Problem. Und ja, diese feinen Damen und Herren dass führen Sie einen Streaming-Video-Service erkannte, dass ihre Computer waren auch riesig und auch sehr kompliziert und auch die Bereitstellung Service zu einem schrecklichen eine Menge Leute. Sie haben 37 Millionen Mitglieder-- bekam und vielleicht ein Jahr dieses Dia oder so old-- Tausende von Geräten. Es gibt Milliarden von Stunden Video. Sie melden Sie sich Milliarden von Ereignissen pro Tag. Und Sie sehen, die meisten Leute zu beobachten die Glotze später am Abend, und es überwiegt bei weitem alles, was. Und ja, sie wollten in der Lage sein, um sicherzustellen, dass der Service war und zuverlässige und für sie arbeiten. So kamen sie auf diese Ding namens Chaos Monkey. Es ist Stück Software die, wenn Sie denken, spricht über den Titel dieser gesamte Präsentation, Scale-Out bedeutet, dass Sie sollte dieses Zeug zu testen. Es ist nicht gut nur mit eine Million Maschinen. Also das schöne an das ist, Chaos Affe ist ein Dienst, identifiziert Gruppen von Systemen und zufällig endet ein der Systeme in einer Gruppe. Ehrfürchtig. So dass ich nicht zu wissen, Sie, aber wenn ich je baute ein System, das auf andere angewiesen Systeme miteinander zu reden, Sie einer von ihnen nehmen, die Wahrscheinlichkeit, dass die ganze Sache arbeiten, rasch abnimmt. Und so dieses Stück Software läuft um Netflix Infrastruktur. Zum Glück, sagt, dass es nur in läuft Geschäftszeiten in der Absicht, dass Ingenieure beraten wach und in der Lage, zu reagieren. Das sind also die Typen Dinge, die wir jetzt sind mit zu tun, um unsere Rechen stören Umgebungen zu Chaos vorstellen und die Komplexität einzuführen. Also, wer in ihr Recht Geist, freiwillig wählen würde mit einem Chaos Affe arbeiten? Hang on, scheint er zu mir hin. Nun, ich denke, ich should-- niedlich. Aber das Problem ist, dass Sie nicht bekommen, die Wahl. Das Chaos Affe, wie Sie kann sehen, wählt man. Und das ist das Problem mit Computing im Maßstab ist, dass man nicht vermeiden. Es ist eine Unvermeidlichkeit der Komplexität und der Umfang und der Evolution, in gewisser Weise, der Rechenkompetenz. Und denken Sie daran, dies ist eine Sache zu erinnern, Chaos Monkeys Liebe snowflakes-- Liebe Schneeflocken. Ein snowflake-- wir erklärte der Chaos Monkey-- aber eine Schneeflocke ist ein Server, der einzigartig ist und Sonder und zart und individuelle und wird nie reproduziert werden. Oft finden wir Schneeflocke Service in unserer Umwelt. Und wir versuchen immer, und schmelzen Schneeflocke-Service. Aber wenn Sie einen Server zu finden in Ihrer Umgebung das ist entscheidend für die Langlebigkeit Ihrer Organisation und es schmilzt, Sie können nicht es wieder zusammen. So Chaos Monkey Aufgabe war es, gehen und beenden Instanzen. Wenn das Chaos Affe schmilzt das Schneeflocke, du bist über, sind Sie fertig. Ich will reden einige Hardware, die wir sind Sehen in Bezug auf die Art Scale-out-Aktivitäten zu. Und einige einzigartige Dinge, die in sind und um das Wissenschafts Aktivität. Wir beginnen jetzt, um zu sehen, erinnern Diese Einheit der Ausgabe: Dieser Gepäckträger? Das ist also ein Rack von GPGPUs-- so allgemein Zweck Grafikprozessoren. Wir haben diese sich in unserer Datenbank Zentrum, etwa 100 Meilen entfernt. Diese besondere Rack ist etwa 96 Tera-FLOPS der mit einfacher Genauigkeit Mathematik in der Lage zu liefern, durch die Hintertür davon. Und wir haben, um 130-odd Karten in einer Instanz dass wir-- mehrere Racks dieser Instanz. Das ist also im Sinne interessant, dass die für allgemeine Zwecke Grafiken Prozesse in der Lage, Mathematik unglaublich tun schnell für sehr geringe Mengen an Energie. Es gibt also eine große Steigerung in die wissenschaftlichen Rechnens Bereichen, Blick auf Grafiken Verarbeitungseinheiten in einem großen Weg. Also lief ich einige Mcollective durch unsere Puppen Infrastruktur gestern, sehr aufgeregt. knapp einem Petaflop der mit einfacher Genauigkeit. Gerade hier, dies klar sein wenig Multiplikator 3,95. Doppel-Präzisionsberechnungen würde etwa 1,2 sein, aber meine Twitter-Feed sah viel besser, wenn ich sagte, dass wir fast ein Petaflop hatte der mit einfacher Genauigkeit GPGPUs. Aber es ist es immer. Es wird langsam zu sein sehr, sehr beeindruckend. Und warum tun wir das? Aufgrund der Quantenchemie, ua aber wir fangen an, entwerfen einige neue Photovoltaik. Und so Alan Aspuru-Guzik, der eine Professor in chemistry-- meinem Partner in crime-- für den letzten Jahren. Wir haben seither um die Umschlag auf Computing. Und die GPGPU ist ideal Technologie, um der Lage zu tun schrecklich viel komplizierter Mathematik, sehr, sehr schnell. Also mit Skala, kommt neue Herausforderungen. So große Umfang zur man muss Achten Sie darauf, wie Sie das Zeug zu verdrahten. Und wir haben ein gewisses Niveau der Zwangsstörungen. Diese Bilder wahrscheinlich fahren viele Leute verrückt. Und Schränke, die nicht besonders gut verdrahtet fahren unser Netzwerk und Einrichtungen Ingenieure Nüsse. Plus gibt es auch Luftstrom Fragen, die Sie enthalten müssen. Das sind Dinge, die ich hätte nie gedacht. Mit Skala, kommt mehr Komplexität. Dies ist ein neuer Typ von Dateisystem. Es ist fantastisch. Es ist ein Petabyte. Es kann 1,1 Milliarden Dateien zu speichern. Es kann lesen und schreiben, um 13 Gigabyte und 20 Gigabyte ein second-- Gigabyte eine zweite. So kann es Terabyte entladen in kürzester Zeit. Und es ist hoch verfügbar. Und es ist erstaunlich, Lookup bekam rates-- 220.000 Lookups einen zweiten. Und es gibt viele unterschiedliche Personen bauen diese Art von Systemen. Und man kann es hier zu sehen grafisch. Dies ist eines der Dateisysteme das ist, unter Last, ganz gerne liest kurz von 22 Gigabyte pro Sekunde. Also das ist so cool-- Komplexität. Also mit Komplexität und Größe, kommt mehr Komplexität, nicht wahr? Dies ist einer der vielen, Viele Netzwerkdiagramme, wo Sie viele verschiedene Chassis alle Unterstützung von bis in eine Haupt Core-Switch, zu-Speicher, Verbinden mit niedriger Latenzzeit verbindet. Und dann die gesamte Seite der Haus, befindet sich nur all die Verwaltung dass Sie in der Lage, anzugehen diese Systeme von einem entfernten Standort. So Skala hat eine Menge von Komplexität mit sich. Gangwechsel wieder, gehen wir zurück und haben eine kleine Stelle der Wissenschaft. Also, denken Sie daran, Forschung Computing und dieses kleine shim-- kleine rosa Scheibe unter die Dozenten und alle ihre Algorithmen und alle von der kühlen Wissenschaft und allen Diese Stromversorgung und Kühlung und Rechenzentrum Boden und Vernetzung und großen Computer und Service-Desks und Helpdesks und so forth-- und so, nur wir sind dieser kleine Unterlegscheibe zwischen ihnen. Was wir begonnen haben sehen, ist, dass die Welt in der Lage, zu bauen diese großen Rechenzentren und in der Lage zum Aufbau Diese großen Computern. Wir bekommen ziemlich gut darin. Was wir nicht sehr gut ist dies kleine Unterlegscheibe zwischen der Forschung und das blanke Metall und die Technologie. Und es ist schwer. Und so konnten wir zu mieten Leute, die in dieser Welt leben. Und in jüngerer Zeit, um die Speiche wir National Science Foundation und sagte: Diese Scale-Out-Zeug ist großartig, aber wir können unsere Wissenschaftler nicht bekommen auf diese große komplizierte Maschinen. So gab es ein Anzahl verschiedener Programme wo wir wirklich waren meist besorgt über versuchen um zu sehen, wenn wir zu verwandeln konnte der Campus-Infrastruktur. Es gibt eine Vielzahl von Programmen, um nationale Zentren. Und so, uns selbst, unsere Freunde an der Clemson, University of Wisconsin Madison, Süd-Kalifornien, Utah und Hawaii Art zusammen, um Blick auf dieses Problem. Und dieses kleine Grafik hier ist der lange Schwanz der Wissenschaft. Also das ist-- das nicht der Fall Egal, was auf dieser Achse, aber diese Achse ist eigentlich Nummer Arbeitsplätze gehen durch den Cluster. Es gibt also mehr als 350.000 was auch immer Zeit. Das sind unsere üblichen Verdächtigen am unteren Rand hier. In der Tat, es gibt Alan Aspuru-Guzik, wer wir waren gerade im Gespräch about-- Tonnen und Tonnen von Rechen-, wirklich wirksam, der weiß, was er tut. Hier ist ein weiteres Labor, das werde ich reden etwa in einem moment-- John Kovac Labor. Sie haben es. Sie sind gut. Sie sind glücklich. Sie sind der Berechnung. Große Wissenschaft immer getan. Und dann, wie Sie Art von unten kommen hier gibt sind andere Gruppen, laufen nicht viele Arbeitsplätze. Und warum ist das so? Ist es, weil die Rechen zu hart? Ist es, weil sie nicht wissen, wie? Wir wissen es nicht, weil wir gegangen und sah. Und damit ist, was diese Projekt auf sich hat, lokal, innerhalb jede dieser Regionen, um Wege suchen, wo wir eingreifen können mit dem Dozenten und Forscher tatsächlich in dem unteren Ende des Schwanzes, und zu verstehen, was sie tun. Also das ist etwas, was wir sind wirklich leidenschaftlich über. Und das ist etwas, das Wissenschaft wird nicht fortgesetzt um vorwärts zu bewegen, bis wir zu lösen einige dieser Grenzfälle. Andere Bits von Wissenschaft das ist up-- jeder wird sehen die Large Hadron Collider. Awesome, nicht wahr? Dieses Zeug alles lief bei Holyoke. Wir Gebaut- die allererste Wissenschaft, die in Holyoke passiert war die Zusammenarbeit zwischen uns und Boston University. So ist es wirklich, wirklich cool. Das ist ein lustiges Stück der Wissenschaft für die Skala. Dieses ist ein digitaler Zugang zu ein Himmel Jahrhundert an der Harvard. Im Grunde ist es eine Platte Archiv. Wenn Sie unten gehen Oxford-- Garden Street, sorry, Sie werden eine der Sternwarte finden Gebäude ist im Grunde voll der etwa eine halbe Million Platten. Und das sind Bilder von der Himmel bei Nacht, über 100 Jahre. So gibt es eine ganze Rig einrichten Sie hier, um diese Platten zu digitalisieren, machen Sie Fotos von ihnen, registrieren sie, steckte sie auf einem Computer. Und das ist ein Petabyte und eine Hälfte, genau richtig sind-- ein kleines Projekt. Das sind andere Projekte. Das Pan-STARRS Projekt tut Voll weiten Panorama Umfrage Suche nach erdnahen Asteroiden und vorübergehend Himmelsereignisse. Als molekulare Biophysiker, ich liebe das Wort transiente Himmelsereignis. Ich bin mir nicht ganz sicher, was es ist, aber wie auch immer, wir sind für sie suchen. Und wir erzeugen 30 Terabyte eine Nacht heraus dieser Teleskope. Und das ist nicht wirklich eine Bandbreite Problem, das ist wie ein FedEx Problem. So setzen Sie den Speicherplatz auf der van und Sie es senden, was es ist. BICEP ist wirklich interesting-- so Hintergrundbild kosmischer zusätzliche galaktischen Polarisation. Als ich anfing, Arbeits an der Harvard sieben oder so, vor acht Jahren, ich erinnere mich Arbeit an diesem Projekt und es hat nicht wirklich sinken Hause, warum polarisiertem Licht von der kosmischen Mikrowellen- Hintergrund wäre es wichtig, bis dies geschehen ist. Und das war John Kovac, , die ich gesprochen habe, bevor, mit Millionen und Abermillionen von CPU Stunden, in unserer Anlage und andere, im Grunde in das Innere blicken der ersten Momente des Universums nach dem Urknall, und versuchen zu verstehen, Allgemeine Theorie Einsteins Relativitäts. Es ist überwältigend, dass unsere Computer helfen uns, zu entwirren und starren in die Ursprünge der Grund, warum wir hier sind. Also, wenn Sie über die Skala zu sprechen, dies ist eine ernste Ebene. Das andere, was der Maßstab ist, dass bestimmtes Projekt getroffen, diese Jungs. Und dies ist die Kurve für BICEP [Unverständlich] Dies war unsere kleine Umfrage. Und man hier sehen kann, das Leben war gut, bis etwa hier, das war, wenn der Ankündigung kam heraus. Und Sie buchstäblich bekommen haben Sekunden zu reagieren auf die Skalierung der Veranstaltung entspricht diesem kleinen Punkt hier, die bis Ende verschieben vier oder so Terabyte Daten über den Webserver dass day-- ziemlich behaart. Usw., diese sind die Arten von Dingen, können Sie in Ihrer Infrastruktur geschehen wenn Sie nicht Entwurf für Skala. Wir hatten ein bisschen ein klettern an diesem Tag, zu sein Lage, erstrecken sich genug Web-Service um die Website am Laufen zu halten. Und wir waren erfolgreich. Dies ist ein wenig email das ist irgendwie süß. Dies ist eine Nachricht an Mark Vogelsberger, und Lars Hernquist, wer ist ein Mitglied der Fakultät hier in Harvard. Mehr über Mark später. Aber ich denke, das ist einer Art resümiert Art wo die Rechen ist in der Forschung Computing. Hey, Team, seit dem letzten Dienstag, zerbrach euch mehr als 28% des neuen Cluster, die in Kombination ist mehr als 78 Jahre CPU in nur drei Tagen. Und ich sagte, es ist immer noch erst am Freitagmorgen. Das ist ziemlich genial! Glücklicher Freitag! Dann gebe ich ihnen die Datenpunkte. Und das war irgendwie interessant. Also denken Sie daran zu markieren, er wird kommen in das Bild zurück in ein wenig. So Scale-out-Computing ist überall. Wir sind auch zu helfen Leute schauen , wie die NBA-Funktionen, und wo die Menschen sind Bälle werfen aus. Ich weiß nicht wirklich verstehen, dieses Spiel zu gut, aber anscheinend ist es eine große Sache. Es gibt Reifen und Schüsseln und Geld. Und so, in unserer Datenbank, die wir errichtet ein wenig 500 [unverständlich] Parallel-Prozessor-Cluster, ein paar Terabyte RAM, der Lage sein, diese zu bauen Kirk und sein Team. Und sie tun Computing in einem ganz anderen Weg. Jetzt ist dieses Projekt sind wir mit das ist beteiligt absolut faszinierend, um neuronale Plastizität connectomics und genomischer imprinting-- drei sehr schwer Schlagen Forschungsgebiete dass wir kämpfen mit auf Tag-zu-Tag-Basis. Die Idee, dass unser Gehirn unter Kunststoff-Stress, wenn wir jung sind. Und ein großer Teil unserer erwachsenen Verhalten von Erfahrungen in der Kindheit geformt. Also das ist ein großes dealio. Und so ist die Arbeit, die von der Finanzierungs ist National Institutes of Mental Health. Und wir versuchen, im Grunde, durch eine Menge von großen Daten und große Datenanalyse, Art der Peer in unsere menschliche Gehirn durch eine Vielzahl von verschiedene Techniken. Also wollte ich anhalten und Art gerade Pause einen kleinen Augenblick. Die Herausforderung mit Fernbedienung Rechenzentren ist es weit entfernt. Es kann unmöglich funktionieren. Ich brauche meine Daten in der Nähe. Ich muss meine Forschung in meinem Labor zu tun. Und so habe ich Art nahm ein Beispiel für ein funktionellen Magnetresonanztomographie Datensatz aus unseren Daten Zentrum in Western Mass. und verband es mit meinem Desktop in Cambridge. Und ich werde dieses kleine Video abzuspielen. Hoffentlich wird es Art von Arbeit. Also das ist mir gehen durch Überprüfung meiner GPUs arbeiten. Und ich werde prüfen, ob VNC ist um. Und das ist eine clevere VNC. Dies ist ein VNC mit 3D-Stücke. Und so, wie Sie gleich sehen können, diese ist mir Spinnen dieses Gehirn herum. Ich versuche, Art es zu orientieren. Und dann kann ich durch viele bewegen verschiedene Scheiben MRT-Daten. Und das einzige, was das ist, anders darüber ist, wird es über die Leitung kommen von Western Mass. auf meinem Desktop. Und seine Rendering schneller als mein Desktop, weil ich nicht haben ein $ 4000 Grafikkarte in meinem Schreibtisch, die wir haben aus Western Mass. Natürlich versuche ich, schlau zu sein. Ich bin mit GLX Zahnräder in der Hintergrund, während all dies tun, um sicherzustellen, dass ich kann, betonen die Grafikkarte, und dass es alle Arten von arbeitet und den ganzen Rest davon. Aber das Wichtigste ist, ist dieses 100 Meilen entfernt. Und man daraus ersehen kann, dass es gibt keine offensichtlichen Latenz. Dinge zusammenzuhalten ziemlich gut. Und so, dass an und für sich, ist ein Beispiel und einige Einblicke in, wie Computer-und Scale-Out- Rechen passieren wird. Wir alle arbeiten an dünner Geräte. Unsere Verwendung von Tabletten ist steigend. So also, mein Kohlenstoff- Fußabdruck ist im Grunde bewegt von dem, was verwendet zu tun haben würde, ein großer Maschinen unter meinem Schreibtisch, um das, was ist jetzt ein facility-- könnte überall sein. Es könnte überall überhaupt. Und doch ist es immer noch in der Lage, zu bringen zurück Hochleistungs-Grafik auf meinem Desktop. Also, immer in der Nähe der end-- erinnern, Mark? Nun, das ist smart Lad Mark. Er entschied, dass er zu gehen Aufbau einer realistischen virtuellen Universum. Das ist schon ein Projekt, wenn Sie denken, Sie haben zu dieser Tonhöhe. Ich werde ein verwenden Computer, und ich werde zu den 12 Millionen Jahre nach Modell der Urknall, um einen Tag zu vertreten. Und dann werde ich tun, 13,8 Milliarden Jahre der kosmischen Evolution. In Ordnung. Dies nutzt tatsächlich einen Computer der war größer als unser Computer, und es über verschüttete auf die nationalen Ressourcen, um unsere Freunde in Texas. Und den nationalen Einrichtungen, dies war eine Menge Rechen. Aber wir haben eine Menge die Simulation vor Ort um sicherzustellen, dass die Software arbeitete und die Systeme gearbeitet. Und es ist Tage wie dieser, wenn Sie erkennen, dass Sie die Unterstützung von Wissenschaft auf dieser Ebene der Skala, dass Menschen können jetzt Dinge zu sagen wie, ich werde ein Modell ein Universum. Und dies ist sein erstes Modell. Und das ist erste Modell seines Teams. Es gibt viele andere Leute, die gehen, hinter Mark, der zu gehen, kommen mit hoher Auflösung modellieren möchten, mit mehr Spezifität, mit mehr Genauigkeit. Und so, in den letzten paar Minuten, Ich möchte nur, um zu zeigen, dieses Video von Mark und Lars, dass mir wieder, als Lebenswissenschaftler, ist irgendwie süß. So dass diese an der Unterseite hier, um Ihnen zu orientieren, Dies sagt Ihnen der Zeit seit dem Urknall. So sind wir auf etwa 0,7 Milliarden Jahren. Und das ist mit der aktuellen Update. So können Sie im Moment sehen sind, Dunkle Materie und die Evolution der Feinstruktur und Anfang Strukturen in unserem bekannten Universum. Und der Punkt dabei ist, dass diese werden alle innerhalb des Computers durchgeführt. Dies ist ein Satz von Parametern und einen Satz von physikalischen und eine Reihe von Mathematik und einen Satz von Modellen die sorgfältig ausgewählt werden und dann sorgfältig miteinander verbunden in der Lage sein, um die Wechselwirkungen zu modellieren. So können Sie einige Starts sehen Einige Gasexplosionen hier. Und Gastemperatur ändert sich. Und Sie können beginnen, um die Struktur zu sehen des sichtbaren Universums zu ändern. Und der wichtigste Teil mit diesen heißt, jeder kleinen winzigen, winzigen, winzigen Punkt ist ein Stück Physik und hat ein Satz der Mathematik sich um, informiert seine Freundin und sein Nachbar. Also von einer Skalierung Sicht diese Computer müssen alle Arbeiten in Konzert und miteinander sprechen effizient. So können sie nicht allzu gesprächig sein. Sie müssen ihre Ergebnisse speichern. Und sie müssen auch weiterhin informieren alle ihre Freunde. In der Tat, werden Sie jetzt sehen, ist dieses Modell der mehr und mehr kompliziert. Es gibt mehr und mehr Sachen passiert. Es gibt mehr und mehr Material herumfliegen. Und das ist, was der Anfang Kosmos würde ausgesehen habe. Es war eine ziemlich haarige Stelle. Es gibt Explosionen überall der Ort, leistungsfähige Kollisionen. Und die Bildung von Schwer Metalle und Elemente. Und Zerschlagung diese großen Wolken in sich mit der extremen Kraft. So jetzt sind wir 9,6 Milliarden Jahren aus dieser ersten Explosion. Sie beginnen zu sehen, die Dinge sind Art beruhigte sich ein wenig, nur ein wenig, weil die Energie führt jetzt zu entspannen. Und so ist die mathematische Modelle, dass an Stelle bekam. Und Sie fangen an zu sehen Koaleszenz von verschiedenen Elementen. Und beginnen, diese Sache Art zu sehen zusammen und langsam abkühlen zu kommen. Und es beginnt, ein wenig suchen mehr wie der Nachthimmel, ein wenig. Und es ist [? QSing. ?] Wir sind nun 30,2 Milliarden Jahren und wir sind Art getan. Und dann, was sie tat, war, dass sie dieses Modell haben, und dann sah sichtbaren Universums. Und im Grunde dahin waren in der Lage, dass zu nehmen und zu überlagern es mit dem, was man sehen kann. Und die Treue ist atemberaubend, wie zu wie genau die Computer-Modelle sind. Selbstverständlich können die Astrophysiker und die Forschungsgruppen müssen noch bessere Wiedergabetreue und noch höhere Auflösung. Aber wenn Sie darüber nachdenken, was Ich habe heute zu Ihnen sprechen diese kleine Reise durch beide Lagerung und Struktur und Vernetzung und Stacks, ist das Wichtigste, wird Scale-out-Computing wesentlich? Das war meine ursprüngliche hypothesis-- zurück zu unserem wissenschaftlichen Methode. Ich hoffe, dass in der frühen Teil davon würde ich davon aus, dass ich in der Lage zu erklären, um Sie über Scale-out-Computing. Und wir Art getestet einige dieser Hypothesen. Wir gingen durch das Gespräch. Und ich werde einfach sagen, Scale-Out- Computing essential-- oh, ja, sehr ja. Also, wenn Sie denken, über Ihre Codes, wenn Sie tun die CS50 Abschlussarbeiten sind, wenn Sie Ihre Legacy denkst für die Menschheit und die Ressourcen, die wir müssen in der Lage, diese Computer ausgeführt werden Systeme, denke sehr sorgfältig über die FLOPS pro Watt, und denken über die Chaos Monkey. Denken Sie über Ihre Schneeflocken, nicht tun Unikate, Wiederverwendung Bibliotheken, bauen wiederverwendbare codes-- all die Dinge, dass die Tutoren unterrichte Sie in dieser Klasse. Dies sind grundlegende Aspekte. Sie sind nicht nur ein Lippenbekenntnis. Das sind echte Dinge. Und wenn einer von euch, mir zu folgen möchte, Ich bin zwanghaft mit dem Twitter Sache. Ich muss irgendwie zu geben, dass bis. Aber viele der Hintergrundinformationen auf unseren Forschungs Computing Website rc.fas.harvard.edu. I versuchen, und halten ein Blog bis zu Datum mit modernen Technologien und wie wir es tun distributive Rechen- und so weiter. Und dann unsere Mitarbeiter werden alles erhältlich durch odybot.org. Und odybot ist unser kleiner Helfer. Er hat oft wenig Wettbewerbe auf seiner Website Auch wenn Sie versuchen, und beschmutzen ihn auf dem Campus. Er ist der freundliche kleine Gesicht der Forschung Computing. Und ich werde Art wickeln oben und ich danke Ihnen allen für Ihre Zeit. Und ich hoffe, dass Sie sich daran erinnern, dass Scale-out-Computing ist eine reale Sache. Und es gibt eine Menge Leute die eine Menge von dem Stand der Technik haben , die in der Lage, die Ihnen helfen. Und das alles viel Glück mit Ihre Zukunft alles Gute bei der Herstellung sicher, dass unsere Berechnung sowohl Waagen, ist leistungsstark, und hilft, die Menschheit mehr als alles andere. Also, ich danke Ihnen für das Gespräch.