JAMES BRASSARD: Salut, bonne après-midi, tout le monde. Mon nom est James Cuff. Je suis le doyen adjoint pour la recherche Informatique ici à l'Université Harvard. Et aujourd'hui, je vais vous parler pourquoi l'informatique scale-out est essentiel. Donc je suppose, d'abord en place, qui est ce type? Pourquoi suis-je ici? Pourquoi je vous parle de vous? Je ai un fond dans les domaines scientifique informatique et de la recherche informatique, remontant aux États- Kingdom-- Le Wellcome Trust Sanger Institut pour la genome-- humaine et puis plus récemment aux États-Unis travaillant à l'Broad et autres estimé des lieux d'apprentissage, telles que Harvard. Je suppose que ce que cela signifie vraiment, ce est que je suis un bio moléculaire récupération physicien. Alors de quel droit ai-je eu à raconter vous au sujet de l'informatique scale-out? Il ya un cependant. 18 années ou plus Je viens de voir le plus une augmentation spectaculaire de la complexité de l'échelle et l'efficacité globale des systèmes informatiques. Quand je faisais mon doctorat à Oxford, je était assez excité avec un mégahertz 200 La machine Silicon Graphics avec 18 gigaoctets de stockage et un seul processeur. Les temps ont changé. Si vous avance rapide maintenant, nous filage plus de 60 000 processeurs ici à Harvard. Beaucoup d'autres organisations tournent beaucoup plus. La livraison de cette importante est cette échelle est maintenant non seulement inévitable, ce est arrivé et ce est va continuer à se produire. Alors disons, pour un moment, genre de rembobiner et de parler très rapidement sur la science, mon préféré sujet, la méthode scientifique. Si vous êtes d'être un scientifique, vous avez à faire quelques éléments clés. Si vous ne faites pas ces choses que vous pouvez vous considérez pas comme un scientifique et vous aurez du mal pouvoir comprendre votre domaine de la discipline. Alors tout d'abord, vous souhaitez formuler des votre question, vous générer des hypothèses, mais plus important encore, vous, prédire votre results-- vous avez une proposition pour ce que les résultats seront. Et puis finalement, vous testez votre hypothèse et analyser vos résultats. Ainsi, cette méthode scientifique est extrêmement important dans l'informatique. Informatique à la fois de la prédiction et être capable de tester vos résultats sont un élément clé de ce que nous devons à faire dans la méthode scientifique. Ces prédictions et essais sont les deux pierres angulaires réels de la méthode scientifique, et chaque exiger que les avancées les plus significatives dans le calcul moderne. Les deux piliers de la science sont que de la théorie et celui de l'expérimentation. Et, plus récemment, l'informatique est souvent mentionné comme étant le troisième pilier de la science. Donc, si vous regardez ce étudiants, vous ne avez absolument aucune pression. Troisième pilier de science-- pas grand- Deal-- informatique, assez important. Je suis tellement content ce est la partie de l'informatique de l'ordinateur cours de sciences 50. Alors assez de l'arrière-plan. Je veux vous dire le plan de ce que nous allons parler aujourd'hui. Je vais aller sur une certaine histoire. Je vais expliquer pourquoi nous sommes arrivés ici. Je vais parler de certains de l'histoire de l'informatique ici à Harvard, certains activités autour de médias sociaux, vert très things-- passionné de toutes choses green-- storage-- ordinateur storage-- comment le chaos affecte scale-out sur les systèmes, et les systèmes de distribution en particulier. Et puis je vais aborder certains du matériel scale-out qui est requis pour pouvoir faire informatique à grande échelle. Et puis enfin, nous allons envelopper avec une science génial. Donc, nous allons prendre une minute pour regarder notre histoire réelle. Computing a évolué. Ainsi, depuis les années 60, tous les l'écart jusqu'à aujourd'hui, nous avons vu essentiellement un changement de champ d'application de l'informatique centralisée de décentraliser informatique, aux collaboration et alors indépendante l'informatique et le droit de retour. Et permettez-moi de annote qu'un peu. Lorsque nous avons commencé avec ordinateurs, nous avons eu des mainframes. Ils étaient excessivement dispositifs coûteux. Tout devait être partagée. Le calcul est complexe. Vous pouvez le voir, il remplit chambres il y avait les opérateurs et les bandes et toutes sortes de Whirry, clicky, dispositifs de spinny. Autour des années 80 début des années 70, vous avez commencé pour voir un impact des télécopieurs. Alors vous commencez à voir l'informatique commencer à apparaître dans les laboratoires de retour et de se rapprocher de vous. La hausse de la personnels ordinateur, certainement dans les années 80, début de la décennie, vraiment changé informatique. Et il ya un indice dans le titre, car il a été appelé l'ordinateur personnel, ce qui signifie qu'il vous appartenait. Alors que l'évolution des calcul continu, les gens ont réalisé que leur personnel ordinateur ne était pas vraiment assez grande pour être en mesure de faire quelque chose de tout mérite, ou le mérite significative, dans la science. Et pour que les gens ont commencé à développer périphérique réseau pilotes pour pouvoir connecter les PC ensemble pour être en mesure de créer des grappes. Et donc ce engendra l'ère du cluster Beowulf. Linux explose en réponse à système d'exploitation propriétaire, à la fois le coût et la complexité. Et puis, nous sommes ici aujourd'hui, où, encore une fois, nous sommes face à des chambres pleines de l'ordinateur l'équipement et la capacité de glisser sa carte de crédit et obtenir l'accès à ces installations informatiques, distance. Et vous pouvez alors voir, termes d'histoire d'impact comment nous ne calcul aujourd'hui, ce est certainement évolué à partir de la machine chambres pleines d'ordinateurs par certains ordinateurs personnels tout le chemin de retour à nouveau à la machine des chambres pleines d'ordinateurs. Donc, ce est mon premier cluster. Donc 2000, nous avons construit un Système d'ordinateur en Europe annoter efficacement le génome humain. Il ya beaucoup de technologie cotée sur le côté droit il que, malheureusement, ne est plus avec nous. Il a fait passer à la grande technologie dans le ciel. La machine elle-même est probablement équivalent d'un peu d'ordinateurs portables décent aujourd'hui, et que tout type de montre. Cependant, nous ne avons attentivement annotons le génome humain et les deux protégeaient avec ce papier particulier Nature des préoccupations l'données être public ou privé. Donc, ce est génial, non? Nous avons donc un génome humain. Nous avons fait le calcul. Je me sens très me plaisait. Je ai roulé jusqu'à Harvard en 2006, se sentir beaucoup moins content de moi. Ce est ce que je ai hérité. Ce est une départementale mail et le serveur de fichiers. Vous pouvez voir ici il ya un peu de ruban qui est utilisé pour maintenir le système en même temps. Ce est notre licence et serveur d'impression. Je suis assez sûr il peut y avoir des mots de passe sur certains de ces Post-it. Pas génial. Assez loin de impressionnant. Et donc, je sais que ce petit tableau que je vous ai montré au début de partager à la propriété Retour au partage, que nous devions changer le jeu. Et donc nous avons changé le jeu en fournissant des incitations. Et les êtres humains, de sorte que cette petit article Wikipedia dit ici, nos créatures motivantes. Et l'étude d'incitation structures est essentielle à l'étude de l'activité économique. Donc nous avons commencé à inciter nos professeurs et nos chercheurs. Et donc nous les incitatifs avec un système informatique vraiment grand. Donc, en 2008, nous avons construit un 4096 10 supports de processeurs, quelques centaines de kilowatts de puissance. Ce que je pense est intéressant, ce est qu'il n'a pas où que vous soyez dans le cycle. Cette même quantité de puissance et calcul, la puissance est la constante. Il était de 200 kilowatts lorsque nous ont été la construction de systèmes en Europe. Ce est deux cents kilowatts en 2008, et que semble être le [? quanter?] des petits universitaire basée systèmes informatiques. Donc Harvard today-- avance rapide, je ne suis pas plus triste panda, un panda très heureux. Nous avons 60 quelques mille équilibrage de charge CPU, et de leur escalade spectaculaire. Nous avons 15 pétaoctets de le stockage, l'escalade aussi. Encore une fois, cette 200 kilowatts incrément, nous semblons être ajoutant que tous les six mois ou plus. Beaucoup, beaucoup de machines virtuelles. Et plus important encore, environ 1,8 mégawatts des équipements informatiques de recherche. Et je vais venir revenir plus tard sur, les raisons pour lesquelles je ai maintenant ne est plus nécessairement compter combien de CPU que nous avons, mais quelle est la facture d'électricité. 20 autres afin dédié le personnel de recherche informatique. Et plus important encore, nous sommes commencer à développer notre GPGPU. Je ai été stupéfait de voir combien de cette qui est ajoutée sur une base de jour en jour. Donc, leçon d'histoire sur, non? Alors, comment pouvons-nous y arriver d'ici? Regardons un peu moderne exemples de calcul scale-out. Je suis un peu obsédé par la taille et l'échelle des médias sociaux. Il existe un certain nombre de très succès l'informatique de grande ampleur organisations aujourd'hui sur la planète, fournir un soutien et des services pour nous tous. Donc, ce est l'avertissement. Et je tiens à commencer par une nombre d'onces à un Instagram. Ce ne est pas en fait un plomb pour une blague, ce est même pas drôle, effectivement, à bien y penser de lui. Mais de toute façon, nous allons regarder once dans Instagram. Et nous allons commencer avec «Mon abeille et une fleur." Je étais à [inaudible] Village et je ai pris une petite image d'une abeille assis sur une fleur. Et puis je ai commencé à penser qu'est-ce que cela signifie réellement. Et je ai pris cette photo de mon téléphone et compté combien d'octets sont en elle, et ce est environ 256 kilo-octets. Quels quand je ai commencé, serait essentiellement combler une disquette 5 pouces et 1/4. Et a commencé à penser, eh bien, ce est cool. Et je ai commencé à regarder et de faire des recherches sur le réseau. Et je ai découvert que Instagram a 200 millions de MAU. Je ne étais pas en fait que que ce était un MAU. Et un MAU, ici-bas, est un utilisateur actif mensuelle. Ainsi, 200 millions de MAUs-- assez cool. 20000000000 photographs-- sorte beaucoup de photographies. 60 millions de nouvelles photos chaque jour sortir à environ 0,002 concert par photo. Ce est environ cinq pétaoctets du disque juste là. Et ce est vraiment pas la partie centrale de ce que nous allons parler. Ce est petites pommes de terre. Ou comme on dit en Angleterre, patates minuscules. Alors regardons le véritable éléphant dans les visages uniques room--. Encore une fois, nous allons mesure cette nouvelle quanta appellent un MAU. Facebook a lui-même 1,3 milliards MAU. WhatsApp, que je ne avais même pas entendu parler de jusqu'à récemment, ce est un service de tri de messagerie, est de 500 millions de MAU. Instagram, que nous venons parlé de 200 millions de MAU. Et Messenger, qui est un autre service de messagerie, est également 200 millions de MAU. Alors que jusqu'à totalisera, il se agit de 2,2 milliards d'utilisateurs au total. De toute évidence, il ya un certain chevauchement, mais ce est équivalent à un tiers de la planète. Et ils envoient quelque chose dans le région de 12 milliards de messages par jour. Et encore, il ya seulement 7 milliard de personnes sur la planète. Pas tout le monde a un smartphone. Donc, ce est le nombre d'aliénés. Et je vais faire valoir que ce ne est pas même sur le stockage ou le calcul. Et de citer la chanson, ce est tout sur ce graphique. Voici notre belle Meghan Trainor bas ici, chanter toutes les basses. Remarque, elle a aussi tout un peu de basses herself-- 207, ainsi 218 millions de personnes ont vu cette jeune femme chanter sa chanson. Donc, mon argument est qu'il ce est tout sur le graphique. Donc nous avons pris certains logiciels open source et a commencé à regarder un graphique. Et ce est LinkedIn, donc ce est un Facebook pour les personnes âgées. Et oui, ce est mon graphe LinkedIn. Je ai 1 200 noeuds ou plus, soi-disant «amis». Et ici est moi au sommet. Et voici toutes les interconnexions. Maintenant, pensez à l'histoire Instagram. Chacun d'entre eux est pas seulement la photo, il a toute une pléthore de connexions entre cette personne en particulier et beaucoup d'autres. Ce est la pièce centrale est soit un bogue dans l'algorithme de dessin graphique, ou ce peut-être David Malan, je ne suis pas encore sûr. Ainsi, vous pouvez redessiner la graphiques de toutes sortes des gephi.gihub.io ways-- est là vous pouvez tirer de ce logiciel. Ce est vraiment cool d'être capable d'organiser les communautés. Vous pouvez voir ici, ce est de Harvard et divers autres endroits que je ai travaillé, parce que ce est mes données liées au travail. Il suffit donc de penser la complexité du graphique et l'ensemble des données que vous tirez avec. Donc, en attendant, de retour à FriendFace, non? Nous avons examiné les données que Instagram était de l'ordre de cinq pétaoctets. No big deal. Encore beaucoup de données, mais pas grand- traiter dans le grand schéma des choses. De cet article sur l'ancien Internet, "Mise à l'échelle de l'entrepôt de données Facebook 300 pétaoctets. " Ce est toute une autre changeur de jeu maintenant, lorsque vous commencez à penser de données et le graphique et ce que vous apportez avec. Et leur haute des données est en croissance de l'ordre de 600 téraoctets par jour. Maintenant, vous savez, eh bien, alors-- Je veux dire, 600 téraoctets par jour, 300 petabytes-- ils sont aussi commence maintenant pour obtenir très préoccupé comment garder ce genre de choses et de veiller à ces données reste autour. Et ce monsieur ici, Jay Parikh, est à la recherche à la façon de stocker une exabyte des données. Juste pour ceux d'entre vous qui sont en regardant le long à la maison, un exabyte-- 10 à 18. Il a obtenu son propre Wikipedia la page, ce est que les grandes d'un certain nombre. Ce est la taille et l'ampleur de ce que nous sommes examiner, pour être en mesure de stocker des données. Et ces gars-là ne sont pas bidouillent, ils stocker cette quantité de données. Donc, l'un des indices qui qu'ils regardent ici est des centres de données pour dite chambre froide. Ce qui me amène à être vert. Et voici Kermit. Lui et moi agree-- il est extrêmement difficile d'être vert, mais nous lui donnons notre meilleur essai. Kermit ne peut pas l'aider, il a d'être vert tout le temps, ne peut pas prendre son vert-ness hors du tout. Donc, être un concepts-- quelques-uns type de concepts de base de verdure, lorsqu'elle se rapporte à l'informatique. Celui qui est le plus important est la longévité du produit. Si votre produit a une courte durée de vie, vous ne pouvez pas, par définition, être vert. L'énergie requise pour la fabrication d'un lecteur de disque, une carte mère, un ordinateur système, une tablette, quel qu'il soit être, la longévité de vos systèmes sont un élément clé de la façon dont vous pouvez être verte. La partie importante, comme vous tous, sont la construction de logiciels algorithms-- de un algorithme partielle mot pour le logiciel, non? Ainsi, la conception de votre algorithme est absolument essentiel en termes de la façon dont vous allez être capable de faire calculs rapides et précises à utiliser le moins d'énergie possible. Et je vais arriver à cela dans un peu. centre de données design-- vous avez vu que nous avons déjà des milliers et des milliers de machines, assis tranquillement dans de petits coins sombres du monde, de l'informatique. Ressources allocation-- comment obtenir le calcul, le stockage, par l'intermédiaire du réseau. Les systèmes d'exploitation sont un élément clé de cela, et beaucoup de la virtualisation pour être en mesure d'emballer de plus en plus de calcul dans un petit espace. Je vais vous donner un petit exemple de la recherche informatique. Nous avions besoin de plus de ping, plus puissance et plus de sections. Nous avions besoin de plus grand, mieux, des ordinateurs plus rapides, et nécessaire pour utiliser moins de jus. Et nous ne pouvions pas travailler sur la façon de le faire. Je ne sais pas si le hashtag GoWest que sans doute été utilisé par le Kardashian, mais de toute façon, Gowest. Et nous l'avons fait. Nous avons ramassé notre opération et nous avons déménagé hors Western Massachusetts dans une petite ville de l'usine appelé Holyoke, juste au nord des Chikopee et Springfield. Nous avons fait cela pour un couple de raisons. Le principal est que nous eu un très, très grand barrage. Et ce très grand barrage est en mesure de mettre hors 30 mégawatts, plus d'énergie, et il a été sous-utilisée à ce moment. Plus important encore, nous avons aussi un réseau très compliqué ce était déjà en place. Si vous regardez où le réseau va aux États-Unis, il suit toutes les pistes de train. Cette pièce était particulier de réseau détenue par nos collègues et amis au Massachusetts Institute of Technology, et il a été essentiellement construite tout le chemin jusqu'à la route 90. Donc, nous avions une grande coche de la rivière, la route 90 cocher, nous avons eu une courte distance de 100 miles, et un long chemin d'environ 1.000 miles. Nous avons dû faire un très grand épissure de réseau, comme vous pouvez le voir ici, à mettre essentiellement un lien dans, à être en mesure de se connecter à Holyoke, mais nous avions tout de la condition ping infrastructure--, puissance, tuyau. La vie était belle. Et encore une fois, grand barrage. Nous avons donc construit essentiellement le Massachusetts Vert High Performance Computing Center. Ce était un travail d'amour à cinq universities-- MIT, Harvard, UMass, Northeastern, et BU. Cinq jours une mégawatts de charge connectée. Nous avons fait toutes sortes de l'intelligence d'économiseurs côté piste de garder les choses vert. Et nous avons construit des racks 640-impairs, dédié à la recherche informatique. Ce était une vieille friche industrielle, donc nous eu une certaine remise en état et certains bien rangé-up et un certain nettoyage du site. Et puis nous avons commencé de construire l'installation et, belle installation boom-- avec le possibilité d'exécuter sandbox informatique, d'avoir des conférences et des séminaires, et aussi un immense plancher de centre de données. Voici ma bonne auto. Je suis évidemment porter la même veste. Je ai peut-être seulement une veste, mais il me est et John Goodhue-- il est le directeur exécutif des Center-- debout dans la salle des machines de-chaussée, qui, comme vous pouvez le voir, est assez dramatique, et il remonte un long, long chemin. Je joue souvent des jeux de conduite de Boston à Holyoke, prétendant que je suis un paquet / IP TCP. Et je ne me inquiète au sujet de mon temps de latence circuler dans ma voiture. Donc, ce est la pièce verte. Donc, nous allons prendre une minute et de réfléchir à piles. Nous essayons donc très attentivement construire des centres de données efficace, calcul efficacement, à faire bonne sélection de l'équipement informatique et de livrer plus surtout, notre application, qu'il se agisse d'un service de messagerie ou une application scientifique. Voici donc les piles. Donc couche physique, tout le chemin à travers Application-- en espérant que cela va une bonne partie de votre cours. Modèle OSI à sept couches est fondamentalement, vous allez vivre, manger et respirer ce tout au long de votre carrière de calcul. Ce concept de physique infrastructure-- fils, câbles, des centres de données, des liens. Et ce ne est que de décrire le réseau. Jusqu'à ici, ce est bien, évidemment, ce est un vieux toboggan, parce que ce devrait dire HTTP, parce personne ne se soucie simple mail protocoles de transport, plus. Cela se passe dans l'espace de HTTP. Donc, ce est un niveau de pile. Voici un autre jeu de piles, où vous avoir un serveur, un hôte, un hyperviseur, un invité, bibliothèque binaire, puis votre application. Ou, dans ce cas, le dispositif conducteur, un noyau Linux, c natif, Machine virtuelle Java, API Java, puis Java applications, et ainsi de suite et ainsi de suite. Ce est une description d'une machine virtuelle. Piles Saints, Batman! Pensez à ce sujet dans termes de combien de calcul vous avez besoin pour aller de ce qui se passe ici, sur toute la hauteur de la partie supérieure de cette pile, puis à être capable de faire votre réelle remise de la requête. Et si vous sorte de rembobinage et commencer à penser sur ce qu'il faut pour fournir une opération en virgule flottante, votre opération en virgule flottante est une somme des prises de courant, le nombre de cœurs dans la douille, une horloge, qui est Combien de temps pouvez l'horloge turnover-- quatre gigahertz, deux gigahertz-- puis le nombre des opérations que vous pouvez faire dans un hertz donné. Donc, ces microprocesseurs aujourd'hui faire entre quatre et six FLOPs par cycle d'horloge. Et donc un single-core 2,5 concert horloge a un rendement théorique d'environ un méga FLOP, donner ou prendre. Mais, comme pour tout, nous avons des choix. Donc, et Intel Core 2, Nehalem Sandy Bridge, Haswell, AMD, prendre votre choices-- Intel Atom. Toutes ces architectures de processeur tous ont une manière légèrement différente de pouvoir ajouter deux numéros ensemble, qui est essentiellement leur but dans la vie. Doit être difficile. Il ya des millions d'entre eux assis dans les centres de données, maintenant si. Sor, fiascos par watt-- ce est la grande chose. Donc, si je veux obtenir plus de ce pour passer à travers cette pile, plus rapide, Je ai eu à travailler sur le nombre de opérations à virgule flottante d'une seconde, Je peux le faire, et ensuite leur donner watts. Et heureusement, les gens ont pensé à ce sujet. Donc, il ya une grande contester chaque année pour voir qui peut construire l'ordinateur le plus rapide qui peut diagonaliser une matrice. On l'appelle le Top 500. Ils prennent le haut du les 500 meilleurs ordinateurs sur la planète qui peut matrices diagonaliser. Et vous obtenez des résultats étonnants. Un grand nombre de ces machines sont entre 10 et 20 mégawatts. Ils peuvent matrices diagonaliser démesurément rapidement. Ils ne ont pas nécessairement diagonalisés le plus efficacement par watt, donc il y avait cette grande poussée à regarder quelle liste verte 500 ressemblerait. Et voici la liste de Juin. Il devrait y avoir un nouveau très prochainement. Et il appelle out-- Je vais prendre en haut de cette liste particulière. Il ya deux une machines-- spécifique de l'Institut de Technologie de Tokyo et une de Cambridge Université au Royaume-Uni. Et ceux-ci ont assez stupéfiante méga flops ratios par watt. Celui-ci est 4389, et la prochaine bas est 3631. Je vais vous expliquer la différence entre ces deux, dans la diapositive suivante. Mais ce sont ceux-ci sont modérément taille des clusters de test. Ce ne sont que 34 kilowatts ou 52 kilowatts. Il ya quelques plus grands ici-- ce cas particulier à la nationale suisse Centre de superinformatique. Le message à retenir Car ce est ce que nous sommes en essayant de trouver des ordinateurs qui peut fonctionner efficacement. Et donc, regardons ce top une, affectueusement appelé, le KFC. Et un peu de la publicité ici. Cette entreprise alimentaire particulier n'a rien à voir avec cela. Ce est le fait que ce système particulier est trempé dans un très composé à base d'huile intelligent. Et ils ont obtenu leur friteuse de poulet surnom quand ils ont commencé à construire ces types de systèmes. Mais fondamentalement, ce qu'ils ont prises ici, ce est un certain nombre de pales, les mettre dans ce l'huile minérale sophistiqué, puis travaillé sur la façon d'obtenir tous la mise en réseau dans et hors de celui-ci. Alors, non seulement cela, ils ont mis à l'extérieur afin qu'elle peut exploiter le refroidissement de l'air extérieur. Ce était assez impressionnant. Donc, vous avez à faire tout de cette manigances pour être en mesure d'obtenir cette quantité de compute livré pour petite puissance. Et vous pouvez voir que ce est la forme d'où les choses se dirigent. Le défi est que l'air régulière refroidissement est l'économie d'échelle et est au volant d'une grande partie de la développement de l'informatique à la fois régulière, et l'informatique haute performance. Donc, ce est assez perturbant. Je pense que ce est fascinant. Ce est un peu brouillon lorsque vous essayer d'échanger les disques durs, mais ce est une idée vraiment cool. Ainsi, non seulement cela, il ya tout un tas de travail étant construit autour de ce que nous sommes appelant le projet Open Compute. Et donc, plus à ce sujet un peu plus tard. Mais l'industrie de commencer à se rendre compte que les FLOPs par watt devient importante. Et vous, que les gens ici, comme vous concevez vos algorithmes et vous concevez votre code, vous devez être conscient que votre code peut avoir un effet d'entraînement. Lorsque Mark était assis ici dans son dortoir salle écrit Facebook 1.0, Je suis assez sûr qu'il avait une vue qu'il allait être énorme. Mais comment énorme ce serait sur la environnement est un grand dealio. Et ainsi tous YA'LL pourrait venir avec des algorithmes qui pourrait être le prochain défi chose pour les gens comme moi, essayer d'exécuter plusieurs systèmes. Alors disons simplement penser à limites de puissance du monde réel. Ce document de Landauer-- ne est pas une chose nouvelle. 1961 a été publié ce IBM dans le Journal. Ce est le canonique "Irréversibilité et de chaleur Génération dans le processus de calcul ". Et il a fait valoir que machines inévitablement exécuter des fonctions logistiques ne ont pas inverse à valeur unique. De sorte que la partie entière de ce ne est que de retour dans les années 60, les gens savaient que ce était va être un problème. Et si la loi de limites dit 25 ° C, une sorte de chambre canonique la température, la limite représente 0,1 électronvolts. Mais en théorie, ce est la mémoire théorie, ordinateur, fonctionnant à cette limite pourrait être changé à un milliard de bits par seconde. Je ne sais pas pour vous, mais pas rencontré beaucoup de un milliard de bits un deuxième échanges de débit de données. L'argument était que seule 2,8 trillions d'un watt de puissance devrait jamais être élargi. Tous droits, monde réel example-- ce est ma facture d'électricité. Je suis 65% pour cent des ce beau centre de données Je vous ai montré, dans ce moment particulier. Ce est de retour en Juin l'année dernière. Je ai pris une ancienne version afin que nous peut et sorte d'anonymiser un peu. Je passais un $ 45,000 mois pour l'énergie là. Donc, la raison d'être là, ce est que nous avoir plus de 50 000 processus dans la chambre. Pourriez-vous imaginer votre propre résidentiel facture d'électricité étant que élevé? Mais ce était pour une 199000000 watt heure plus d'un mois. Donc, la question que je pose est, pouvez-vous imaginer facture d'électricité de M. Zuckerberg? Le mien est assez grand, et je lutte. Et je ne suis pas seul dans ce est. Il ya beaucoup de personnes avec les grands centres de données. Et donc, je suppose, disclosure-- complète mes amis Facebook un peu bizarre. Donc, mon ami Facebook est le centre de données de Prineville, qui est l'un des plus grand Facebook, plus récent, le plus bas Centre de données énergétiques. Et ils postent à moi, des choses comme puissance l'efficacité de l'utilisation, comme dans quelle est l'efficacité des données centre par rapport combien d'énergie vous êtes la mise en, combien eau utilisent-ils, ce est l'humidité et la température. Et ils ont ces belles, belles parcelles. Je pense que ce est un page Facebook génial, mais je suppose que je suis un peu bizarre. Donc, une chose plus de puissance, la recherche informatique que je fais est significativement différent de ce que Facebook et Yahoo et Google et d'autre à la demande, entièrement, services toujours disponibles. Et donc je ai l'avantage que lorsque ISO New England-- et ISO New England aide à établir l'énergie taux pour la région. Et il dit que ce est l'extension une demande pour les consommateurs à conserver volontairement haute énergie, raison de la forte chaleur et l'humidité. Et ce était de retour le 18 Juillet. Et donc je Tweet heureux retour, Hey, ISO New England, Vert Harvard. Nous faisons notre part plus ici dans la recherche informatique. Et ce est parce que nous faisons la science. Et autant que les gens disent la science ne dort jamais, la science peut attendre. Donc, nous sommes en mesure de mettre au repos notre systèmes, profiter de taux de qualité sur notre facture d'énergie, et aide dans tout le New England région en versant de nombreux mégawatts d'charge. Donc, ce est la chose unique qui diffère sur les données de calcul scientifique centres et ceux qui sont en pleine production 24/7. Donc, nous allons juste prendre un autre engrenage ici. Donc, je veux discuter chaos un peu. Et je veux le mettre dans les auspices de rangement. Donc, pour ceux de ce genre des luttaient obtenir leur tête autour de ce pétaoctets du stockage ressembler, ce un exemple. Et ce est le genre de choses Je me occupe de tout le temps. Chacun de ces petits gars est un disque dur de quatre téraoctets, de sorte que vous pouvez sorte de les compter. Nous obtenons maintenant entre une à une et 1/2 pétaoctets dans un rack standard de l'industrie. Et nous avons des chambres et des salles, comme vous vu dans cette image plus tôt avec John et moi, pleine de ces racks d'équipements. Ainsi, il devient très, très facile de construire des baies de stockage massives Ce est surtout facile à l'intérieur d'Unix type de compte jusqu'à la façon dont les choses vont. Donc, ce est compter combien de Les points ont MAU je suis arrivé. Donc, ce est 423 points d'interception. Et puis si je cours un peu sommaire awk, je peut ajouter jusqu'à, dans ce système particulier, il y avait 7,3 pétaoctets de stockage disponible. Donc, ce est beaucoup de choses. Et le stockage est vraiment difficile. Et pourtant, pour une raison quelconque, ce est une tendance de l'industrie. Chaque fois que je parle à nos chercheurs et notre corps professoral et dire, hey, je peux courir stockage pour vous. Malheureusement, je dois recouvrer le coût de l'entreposage. Je reçois cette entreprise. Et les gens de référence Newegg ou ils font référence Staples ou combien ils peuvent acheter un seul disque dur téraoctet pour. Donc, vous noterez ici, qu'il ya un indice. Il ya un lecteur de disque ici. Et si nous revenons, je en ai beaucoup. Non seulement je ai beaucoup, je ai interconnexions sophistiqués pour pouvoir piquer ces choses ensemble. Ainsi, le risque associé à ces grands Les baies de stockage ne est pas négligeable. En fait, nous avons pris la Internet et nous avons écrit une petite histoire sur un bien-sens, directeur manières douces de la recherche computing-- arrive à avoir une étrange Anglais accent-- essayer d'expliquer à un chercheur ce que le aucun dossier de sauvegarde de soulignement fait signifié. Ce était un long, très petite histoire, quatre bonnes minutes de découverte. Et note, je ai une terrible beaucoup moins d'espace que la dame qui chante à propos de toutes les basses. Nous sommes tout à fait quelques comptes inférieure. Mais de toute façon, ce est un chose importante à penser, en termes de ce qui pourrait aller mal. Donc, si je reçois un lecteur de disque, et Je le jette dans une machine Unix, et je commence à écrire des choses à elle, il ya un aimant, il ya une tête d'entraînement, il ya apparemment, un un ou un zéro étant écrit sur ce périphérique. Spinny Motors--, twirly les choses se cassent toujours. Pensez à des choses qui se brisent. Il a toujours été spinny, twirly choses. Imprimantes, disques durs, les véhicules à moteur, etc. Tout ce qui bouge est susceptible de se briser. Donc, vous devez moteurs, vous besoin de conduire firmware, vous devez SAS / SATA contrôleurs, fils, microprogramme sur les contrôleurs SAS / SATA, faible blocs de niveau. Choisissez votre fichier de contrôleur de stockage code du système, quel qu'il soit, comment vous assemblez des choses ensemble. Et votre gestionnaire de mémoire virtuelle pages, DRAM se vendent et magasins. Ensuite, vous obtenez un autre pile, qui est une sorte de la liste sur ce une, les algorithmes, les utilisateurs. Et si vous multipliez ce , je ne sais pas combien, il ya beaucoup d'endroits où des choses peuvent déraper. Je veux dire, ce est un exemple sur les mathématiques. Mais ce est assez amusant de penser combien de façons les choses pourraient aller mal, juste pour un lecteur de disque. Nous sommes déjà à 300 pétaoctets, de sorte imaginer le nombre de lecteurs de disques vous avez besoin à 300 pétaoctets qui peut aller mal. Non seulement that-- sorte que ce est le stockage. Et qui fait allusion à la personne que je aimerais voir entrer dans la phase gauche, qui est le Chaos Monkey. Donc, à un certain point, il devient encore juste plus grand que le disque problème. Et donc, ces belles dames et messieurs qui exécutent un service de vidéo en streaming réalisé que leurs ordinateurs étaient aussi énorme et aussi très compliquée et également fournir un service à une terrible beaucoup de gens. Ils ont 37 millions de Membre, à et peut-être une année de cette diapositive ou alors old-- des milliers de dispositifs. Il ya des milliards d'heures de vidéo. Ils se connectent milliards d'événements par jour. Et vous pouvez le voir, la plupart des gens regardent la télé plus tard dans la soirée, et il dépasse de loin tout. Et donc, ils voulaient être en mesure de se assurer que le service était et fiable et de travailler pour eux. Donc, ils sont venus avec cette chose appelée Chaos Monkey. Ce est morceau de logiciel qui, quand vous pensez de parler sur le titre de l'ensemble de cette présentation, scale-out signifie que vous devrait tester ce genre de choses. Il ne est pas bon d'avoir simplement un million de machines. Donc, la bonne chose à propos ce est, Chaos Monkey est un service qui identifie des groupes de systèmes et une se termine au hasard des systèmes dans un groupe. Impressionnant. Donc, je ne sais pas vous, mais si je ai jamais construit un système qui se appuie sur d'autres systèmes parler les uns aux autres, vous prenez l'un d'eux sur le la probabilité de la chose entière travail, diminue rapidement. Et donc ce morceau de logiciel fonctionne autour de l'infrastructure de Netflix. Heureusement, il dit qu'il ne fonctionne que dans heures d'affaires avec l'intention que les ingénieurs seront alerte et capable de répondre. Ce sont donc les types des choses que nous sommes maintenant avoir à faire pour perturber notre informatique environnements, pour introduire le chaos et d'introduire la complexité. Alors, qui, dans leur droit l'esprit, serait volontiers choisir de travailler avec un Chaos Monkey? Accrochez-vous, il semble me pointage. Eh bien, je suppose que je devrait: mignon. Mais le problème est que vous ne prenez pas le choix. Le Chaos Monkey, que vous peut voir, vous choisit. Et ce est le problème avec l'informatique à l'échelle, ce est que vous ne pouvez pas éviter cela. Ce est une fatalité de complexité et de l'échelle et de notre évolution, à certains égards, d'expertise informatique. Et rappelez-vous, ce est Une chose à retenir, Chaos Monkeys amour flocons de neige d'amour snowflakes--. Un snowflake-- nous avons expliqué la Chaos Monkey-- mais un flocon de neige est un serveur qui est unique et spéciale et délicate et individuel et ne sera jamais reproduit. Nous constatons souvent flocon de neige service dans notre environnement. Et nous essayons toujours et fondre service de flocon de neige. Mais si vous trouvez un serveur dans votre environnement ce est essentiel pour la longévité de votre organisation et il fond, vous ne pouvez pas le remettre à nouveau ensemble. Donc, le travail de Chaos Monkey était de aller fin instances. Si le Chaos Monkey fondre la flocon de neige, vous êtes plus, vous avez terminé. Je veux parler certains matériels que nous sommes voir en termes de genre de Scale-Out activités aussi. Et certaines choses uniques qui sont en et autour de l'activité scientifique. Nous commençons maintenant à voir, souvenons cette unité d'émission, ce rack? Donc, ce est un rack de GPGPUs-- si générale usage des unités de traitement graphique. Nous avons ces situé dans nos données centre, quelque 100 miles de là. Ce rack particulier est d'environ 96 tera FLOPS de simple précision mathématiques mesure pour offrir à l'arrière de celui-ci. Et nous avons pour 130-odd cartes dans une instance que nous-- multiples racks de cette instance. Donc, ce qui est intéressant en ce sens que les processus usage général graphiques sont en mesure de faire des mathématiques incroyablement rapidement de très faibles quantités d'énergie. Donc, il ya une grande remontée dans les domaines du calcul scientifique, regardant graphiques unités de traitement dans une grande manière. Alors je ai couru un peu mcollective Grâce à notre infrastructure de marionnettes hier, très excité à ce sujet. un peu moins d'un pétaflop de simple précision. Juste pour être clair ici, ce peu multiplicateur est 3,95. Double précision mathématiques serait d'environ 1,2, mais mon flux Twitter regardé beaucoup mieux si je dit que nous avions presque un pétaflop de simple précision GPGPU. Mais il se fait là-bas. Il est en train de devenir très, très impressionnant. Et pourquoi faisons-nous cela? Parce que la chimie quantique, entre autres, mais nous commençons à concevoir certains nouveaux photovoltaïque. Et Alan Aspuru-Guzik, qui est un professeur au chemistry-- mon partenaire dans crime-- pour les quelques dernières années. Nous avons fracassé les enveloppe sur l'informatique. Et le GPGPU optimal la technologie pour être capable de faire énormément compliqué mathématiques, très, très rapidement. Donc, avec échelle, vient de nouveaux défis. Si énorme échelle et où vous devez être attention comment vous reliez ce genre de choses. Et nous avons certains niveaux de trouble obsessionnel compulsif. Ces images probablement conduire un grand nombre de personnes écrous. Et armoires qui ne sont pas câblé particulièrement bien conduire notre réseau et ingénieurs Installations noix. Plus il ya aussi la circulation d'air questions que vous avez à contenir. Donc, ce sont des choses que je ne aurait jamais pensé. Avec échelle, vient plus de complexité. Ce est un nouveau type de système de fichiers. Ce est génial. Ce est un pétaoctet. Il peut stocker 1,1 milliards fichiers. Il peut lire et écrire à 13 gigaoctets et 20 gigaoctets un gigaoctets second-- une seconde. Ainsi, il peut décharger téraoctets en peu de temps du tout. Et il est très disponible. Et il possède recherche étonnante rates-- 220 000 recherches d'une seconde. Et il ya beaucoup de personnes différentes la construction de ce genre de systèmes. Et vous pouvez le voir ici graphiquement. Ce est l'un de nos systèmes de fichiers ce est sous charge, bien lecture joyeusement à un peu moins de 22 gigaoctets par seconde. Donc, ce est donc cool-- complexité. Donc, avec la complexité et l'échelle, vient plus de complexité, non? Ce est un de nos nombreux, de nombreux diagrammes de réseau, où vous avez beaucoup de différents châssis entièrement en charge jusqu'à dans un commutateur de noyau principal, relié à l'entreposage, la connexion à des interconnexions à faible latence. Et puis tout de ce côté de la maison, est juste tout de la gestion que vous devez être en mesure de répondre ces systèmes à partir d'un emplacement distant. Donc échelle a beaucoup de la complexité avec elle. Changez nouveau engrenage, revenons et avoir un petit coin de la science. Alors, ne oubliez pas, la recherche informatique et ce petit shim-- petite cale rose entre le les professeurs et l'ensemble de leurs algorithmes et tous les scientifiques et tous frais ce centre d'alimentation et de refroidissement et des données de-chaussée et la mise en réseau et de gros ordinateurs et un bureau de services et services d'assistance et ainsi de forth-- et ainsi, nous sommes juste cette petite cale entre eux. Ce que nous avons commencé à Voir, ce est que le monde de été en mesure de construire ces grands centres de données et être en mesure de construire ces gros ordinateurs. Nous avons obtenu assez bon. Ce que nous ne sommes pas très bon, ce est ceci petite cale entre la recherche et le métal nu et la technologie. Et ce est dur. Et donc nous avons été en mesure d'embaucher les gens qui vivent dans ce monde. Et plus récemment, nous avons parlé au National Science Foundation et a dit, ce genre de choses de scale-out est grande, mais nous ne pouvons pas obtenir nos scientifiques sur ces grosses machines compliquées. Et donc, il ya eu une nombre de programmes différents où nous ne étions la plupart du temps préoccupé essayer pour voir si nous pouvions transformer l'infrastructure du campus. Il ya beaucoup de programmes autour des centres nationaux. Et donc, nous-mêmes, notre amis à Clemson, Université du Wisconsin Madison, Californie du Sud, l'Utah et Hawaï sorte de se associent pour examiner ce problème. Et ce petit graphique ici est la longue queue de la science. Donc, ce est-- ce ne est pas importe ce qu'il ya sur cet axe, mais cet axe est en fait le numéro des emplois en passant par le cluster. Donc, il ya 350 000 plus quelle que soit la période. Ce sont nos suspects habituels le long du fond ici. En fait, il ya Alan Aspuru-Guzik, Qui sommes-nous parlions justement about-- tonnes et des tonnes de calcul, vraiment efficace, sait ce qu'il fait. Voici un autre laboratoire que je vais parler à propos dans un laboratoire de John Kovac moment--. Ils l'ont. Ils sont bons. Ils sont heureux. Ils sont calcul. Grande science se fait. Et puis, comme vous le type de venir ici, il D'autres groupes que ne sont pas en cours d'exécution de nombreux emplois. Et pourquoi est-ce? Est-ce parce que le calcul est trop dur? Est-ce parce qu'ils ne savent pas comment? Nous ne savons pas, parce que nous sommes allés et avons regardé. Et ce est ce que cette projet est tout au sujet, est localement, à l'intérieur chacune de ces régions, de se tourner vers des avenues où nous pouvons nous engager avec le corps professoral et les chercheurs en fait dans l'extrémité inférieure de la queue, et de comprendre ce qu'ils font. Donc, ce est quelque chose que nous sommes effectivement passionné. Et ce est quelque chose qui la science ne va pas continuer à avancer jusqu'à ce que nous résolvons certains de ces cas de pointe. Les autres bits de la science cela va up-- tous vu le Grand collisionneur de hadrons. Impressionnant, non? Ce truc tout manqué à Holyoke. Nous built-- la première la science qui se est passé à Holyoke était la collaboration entre nous-mêmes et l'Université de Boston. Donc, ce est vraiment, vraiment cool. Ce est un morceau d'amusement de la science pour l'échelle. Il se agit d'un accès numérique à un ciel siècle à Harvard. Fondamentalement, ce est une archive de la plaque. Si vous descendez Oxford-- Garden Street, désolé, vous trouverez une de l'observatoire bâtiments est essentiellement complète d'environ un demi-million de plaques. Et ce sont des photos de la ciel la nuit, plus de 100 ans. Il ya donc toute une plate-forme mise en place ici pour numériser ces plaques, prendre des photos d'eux, inscrivez- eux, les mettent sur un ordinateur. Et ce est un pétaoctet et demi, juste une petite there-- projet. Ce sont d'autres projets. Ce projet Pan-STARRS fait une vaste enquête panoramique complète, la recherche d'astéroïdes proches de la Terre et événements célestes transitoires. Comme un biophysicien moléculaire, je aime le mot de l'événement céleste transitoire. Je ne suis pas sûr de ce qu'il est, mais de toute façon, nous sommes à la recherche pour eux. Et nous générons 30 téraoctets une nuit de ces télescopes. Et ce ne est pas vraiment une bande passante problème, ce est comme un problème FedEx. Si vous mettez le stockage sur la fourgonnette et vous envoyer quoi que ce soit. BICEP est vraiment interesting-- de sorte fond imagerie cosmique galactique polarisation supplémentaire. Quand je ai commencé à travailler à Harvard sept ou alors, il ya huit ans, je me souviens travailler sur ce projet et il n'a pas vraiment évier la maison comme à la lumière polarisée pourquoi du micro-ondes cosmiques fond serait important, jusqu'à ce que cela se est passé. Et ce était John Kovac, qui je ai parlé à avant, en utilisant des millions et des millions de CPU heure, dans notre usine et d'autres, pour regarder essentiellement à l'intérieur des premiers instants de l'univers après le Big Bang, et essayer de comprendre La théorie générale de la relativité d'Einstein. Ce est l'esprit souffle que nos ordinateurs nous aident à démêler And Stare dans les origines mêmes de la raison pour laquelle nous sommes ici. Donc, quand vous parlez de l'échelle, ce est une échelle grave. L'autre chose que de l'échelle, ce est que projet particulier frappé ces gars-là. Et ce est la courbe de réponse pour BICEP [Inaudible] Ce était notre petite enquête. Et vous pouvez le voir ici, la vie était bon jusqu'à environ ici, qui était quand le annonce a été faite. Et vous avez littéralement secondes pour répondre à l'événement de mise à l'échelle qui correspond à ce petit point ici, qui a fini par passer quatre ou plus téraoctets de données par l'intermédiaire du serveur Web que day-- assez velu. Et donc, ce sont les types de choses qui peut vous arriver dans votre infrastructure si vous ne concevez pas échelle. Nous avons eu un peu de brouiller ce jour-là, d'être capable de se étendre hors service web assez pour maintenir le site en place et le fonctionnement. Et nous avons réussi. Ce est un petit email ce est plutôt mignon. Ce est un mail à Mark Vogelsberger, et Lars Hernquist, qui est un membre du corps professoral ici à Harvard. Plus sur Mark tard. Mais je pense que ce est une genre de résume type où le calcul de est dans la recherche informatique. Hé, équipe, depuis la dernière Mardi, vous les gars accumulé plus de 28% de la nouvelle cluster, qui combinait est plus de 78 ans CPU en seulement trois jours. Et je ai dit, ce est toujours juste vendredi matin. Ce est assez impressionnant! Vendredi heureux! Puis je leur donne les points de données. Et donc ce était assez intéressant. Alors ne oubliez pas de Mark, il viendra retour dans l'image dans un peu. Donc informatique scale-out est partout. Nous sommes même aider les gens regardent comment les fonctions de la NBA, et où les gens sont lancer des balles à partir. Je ne comprends pas vraiment ce jeu trop bien, mais apparemment, ce est une grosse affaire. Il ya des cerceaux et des bols et de l'argent. Et donc, notre base de données, nous construit un petit 500 [inaudible] grappe de processeurs parallèles, quelques téraoctets de RAM, pour être en mesure de construire cette Kirk et son équipe. Et ils le font informatique dans une toute autre manière. Maintenant, ce est un projet que nous sommes impliqué ce est absolument fascinant, autour de neurones connectomique de plasticité et génomique imprinting-- trois très lourd zones frapper de recherche que nous nous battons avec le une base de jour en jour. L'idée que nos cerveaux sont sous le stress en plastique quand nous sommes jeunes. Et une grande partie de notre comportement adulte est sculpté par l'expérience dans l'enfance. Donc, ce est un grand dealio. Et donc ce est un travail qui est financé par le Instituts nationaux de la santé mentale. Et nous essayons de fond, par beaucoup de grandes quantités de données et grande analyse des données, type de scruter notre cerveau humain à travers une variété de différentes techniques. Donc, je voulais arrêter et le type de juste une pause pour un petit moment. Le défi avec télécommande centres de données est qu'il est loin. Ça ne peut pas travailler. Je ai besoin de mes données à proximité. Je ai besoin de faire mes recherches dans mon laboratoire. Et donc je ai pris un exemple de imagerie par résonance magnétique fonctionnelle ensemble de données à partir de nos données centre de Western Mass. et connecté à mon bureau à Cambridge. Et je vais jouer cette petite vidéo. Espérons que cela sorte de travailler. Donc, ce est me traverse vérifier mon GPU travaillent. Et je vérifie que la place de VNC. Et ce est un VNC intelligent. Il se agit d'un VNC avec des pièces en 3D. Et donc, comme vous pouvez le voir, cette ce est moi tourner autour de ce cerveau. Je essaie de sorte de l'obtenir orienté. Et puis je peux me déplacer à travers de nombreux différentes tranches de données d'IRM. Et la seule chose qui est différente de cette est, il vient sur le fil de Western Mass. à mon bureau. Et son rendu plus rapide que mon bureau, parce que je ne ai pas de $ 4000 carte graphique de mon ordinateur de bureau, ce qui nous avons sur Western Mass. Bien sûr, je essaie d'être intelligent. Je fais tourner les engrenages GLX dans le fond, tout en faisant tout cela, pour se assurer que je peux insister sur la carte graphique, et que tout type de fonctionne et tout le reste. Mais la chose importante est, est que ce est à 100 miles. Et vous pouvez voir que de cette il n'y a pas de latence évident. Les choses détenant ensemble assez bien. Et de sorte que, en soi, est un exemple et un aperçu comment l'informatique et scale-out informatique qui va se passer. Nous travaillons tous sur dispositifs plus en plus minces. Notre utilisation de comprimés est en augmentation. Ainsi donc, mon carbone empreinte est essentiellement passer de ce qui était autrefois faire aurais été une énorme machine sous mon bureau, à ce est maintenant un facility-- pourrait être ne importe où. Il pourrait être ne importe où. Et pourtant, il est toujours en mesure d'apporter dos graphiques haute performance à mon bureau. Donc, pour près de la end-- souvenir Mark? Eh bien, mon garçon intelligent est Mark. Il a décidé qu'il allait construire un univers virtuel réaliste. Ce est tout un projet, lorsque vous pensez que vous avez à la hauteur de cela. Je vais utiliser un ordinateur, et je vais pour modéliser les 12 millions d'années après le Big Bang pour représenter un jour. Et puis je vais faire 13,8 milliard d'années de l'évolution cosmique. Bien. Ceci utilise en fait un ordinateur l'était plus grande que notre ordinateur, et il a débordé sur la nationale les ressources à nos amis au Texas. Et pour les installations nationales, ce était beaucoup de calcul. Mais nous avons fait beaucoup de la simulation localement pour se assurer que le logiciel travaillées et les systèmes fonctionnaient. Et ce est des jours comme ça quand vous réalisez que vous soutenez la science à ce niveau de l'échelle, ce les gens peuvent maintenant dire des choses comme, je vais à un modèle un univers. Et ce est son premier modèle. Et ce est le premier modèle de son équipe. Il ya beaucoup d'autres les gens qui vont à venir derrière Mark, qui vont vouloir modéliser avec une haute résolution, avec plus de spécificité, avec plus de précision. Et donc, dans les deux dernières minutes, Je veux juste vous montrer cette vidéo de Marc et de Lars que pour moi, encore une fois, en tant que scientifique de la vie, est plutôt mignon. Donc, ce, au fond ici, pour vous orienter, ce est vous le dit fois depuis le Big Bang. Donc, nous sommes à environ 0,7 milliards d'années. Et cela montre la mise à jour actuelle. Donc, vous voyez en ce moment, la matière noire et de l'évolution de la structure fine et au début structures dans notre univers connu. Et le point, ce est que cette Tout est fait à l'intérieur de l'ordinateur. Il se agit d'un ensemble de paramètres et un ensemble de la physique et un ensemble de mathématiques et un ensemble de modèles qui sont soigneusement sélectionnés, puis soigneusement reliés entre eux pour être en mesure de modéliser les interactions. Donc vous pouvez voir quelques mises en chantier de quelques explosions gazeuses ici. Et la température du gaz est en train de changer. Et vous pouvez commencer à voir la structure du changement de l'univers visible. Et la partie importante de cette est, chaque tout petit, minuscule, minuscule point est un morceau de la physique et a un ensemble de mathématiques autour, informe son ami et son voisin. Donc, dans une perspective de mise à l'échelle, ceux-ci ordinateurs doivent tous travailler de concert et de parler les uns aux autres de manière efficace. Donc ils ne peuvent pas être trop bavard. Ils doivent stocker leurs résultats. Et ils doivent continuer à informer tous leurs amis. En effet, vous voyez maintenant, ce modèle de de plus en plus compliqué. Il ya de plus en plus de choses se passe. Il ya de plus en plus matériau qui volent autour. Et ce est ce que le début cosmos ne ont ressemblé. Ce était un endroit assez velu. Il ya des explosions partout le lieu, les collisions puissants. Et la formation de lourde les métaux et les éléments. Et ces gros nuages ​​percuter de l'autre par la force extrême. Et maintenant nous sommes 9,6 milliards ans à partir de cette explosion initiale. Vous commencez à voir les choses sont type de calmée un peu, juste un peu, parce que la l'énergie commence maintenant à se détendre. Et donc la mathématique modèles ont obtenu cela en place. Et vous commencez à voir la coalescence des différents éléments. Et commence à voir cette chose genre de se réunir et de refroidir lentement. Et ça commence à regarder un peu plus comme le ciel de la nuit, un peu. Et ce est [? QSing. ?] Nous sommes maintenant 30,2 milliards d'années et nous sommes en quelque sorte fait. Et puis ce qu'ils ont fait était qu'ils ont pris ce modèle, puis regarda l'univers visible. Et dans le fond étaient donc capable de prendre cela et superposer avec ce que vous pouvez voir. Et la fidélité est stupéfiant, à la précision des modèles informatiques sont. Bien sûr, les astrophysiciens et les groupes de recherche besoin d'encore meilleure fidélité et la résolution encore plus élevée. Mais si vous pensez à ce que Je ai parlé à vous aujourd'hui grâce à ce petit voyage à travers à la fois le stockage et la structure et le réseautage et des piles, la chose importante est, est scale-out informatiques essentielles? Ce était mon hypothesis-- originale Retour à notre méthode scientifique. Je espère qu'au début partie de cela, je prédis que je serais en mesure d'expliquer à vous au sujet de l'informatique scale-out. Et nous sorte de testé certaines de ces hypothèses. Nous sommes passés par cette conversation. Et je vais juste dire scale-out l'informatique est essential-- oh, oui, beaucoup oui. Ainsi, lorsque vous songez à propos de vos codes, quand vous faites les projets finaux CS50, lorsque vous pensez à votre héritage à l'humanité et les ressources que nous besoin d'être en mesure d'exécuter ces ordinateur systèmes, pensent très soigneusement sur les FLOPS par watt, et de réfléchir à la Chaos Monkey. Pensez à vos flocons de neige, ne pas faire un compromis, les bibliothèques de réutilisation, construire codes-- réutilisable toutes les choses que les tuteurs ont été enseignez-vous dans cette classe. Ce sont des aspects fondamentaux. Ils ne sont pas simplement Lip Service. Ce sont des choses réelles. Et si quelqu'un d'entre vous veulent me suivre, Je suis obsessionnelle avec la chose Twitter. Je ai en quelque sorte de donner cela. Mais beaucoup de la informations de fond est sur notre recherche informatique site Web à rc.fas.harvard.edu. Je essaie de garder un blog jusqu'à jour avec les technologies modernes et comment nous le faisons distributive calcul et ainsi de suite. Et puis notre personnel sont toujours disponible par odybot.org. Et odybot est notre petit assistant. Il a souvent peu concours sur son site web aussi, où vous pouvez essayer de le repérer sur le campus. Il est le petit convivial visage de la recherche informatique. Et je vais genre d'arrêter là et merci à tous pour votre temps. Et je espère que vous vous souvenez que informatique scale-out est une chose réelle. Et il ya beaucoup de personnes ayant déjà obtenu beaucoup de l'art antérieur qui sera en mesure de vous aider. Et tout le meilleur de chance avec vos projets futurs dans la fabrication assurer que notre calcul à la fois échelles, est performant, et contribue à l'humanité plus qu'autre chose. Donc, je vous remercie pour votre temps.