1 00:00:00,000 --> 00:00:12,080 2 00:00:12,080 --> 00:00:13,799 >> JAMES BRASSARD: Salut, bonne après-midi, tout le monde. 3 00:00:13,799 --> 00:00:14,715 Mon nom est James Cuff. 4 00:00:14,715 --> 00:00:18,970 Je suis le doyen adjoint pour la recherche Informatique ici à l'Université Harvard. 5 00:00:18,970 --> 00:00:24,540 Et aujourd'hui, je vais vous parler pourquoi l'informatique scale-out est essentiel. 6 00:00:24,540 --> 00:00:26,810 >> Donc je suppose, d'abord en place, qui est ce type? 7 00:00:26,810 --> 00:00:27,750 Pourquoi suis-je ici? 8 00:00:27,750 --> 00:00:29,200 Pourquoi je vous parle de vous? 9 00:00:29,200 --> 00:00:33,730 Je ai un fond dans les domaines scientifique informatique et de la recherche informatique, 10 00:00:33,730 --> 00:00:38,530 remontant aux États- Kingdom-- Le Wellcome Trust Sanger 11 00:00:38,530 --> 00:00:43,270 Institut pour la genome-- humaine et puis plus récemment aux États-Unis 12 00:00:43,270 --> 00:00:50,170 travaillant à l'Broad et autres estimé des lieux d'apprentissage, telles que Harvard. 13 00:00:50,170 --> 00:00:53,930 >> Je suppose que ce que cela signifie vraiment, ce est que je suis un bio moléculaire récupération 14 00:00:53,930 --> 00:00:55,740 physicien. 15 00:00:55,740 --> 00:01:01,250 Alors de quel droit ai-je eu à raconter vous au sujet de l'informatique scale-out? 16 00:01:01,250 --> 00:01:03,570 Il ya un cependant. 17 00:01:03,570 --> 00:01:09,530 18 années ou plus Je viens de voir le plus une augmentation spectaculaire de la complexité de l'échelle 18 00:01:09,530 --> 00:01:13,570 et l'efficacité globale des systèmes informatiques. 19 00:01:13,570 --> 00:01:18,890 >> Quand je faisais mon doctorat à Oxford, je était assez excité avec un mégahertz 200 20 00:01:18,890 --> 00:01:23,830 La machine Silicon Graphics avec 18 gigaoctets de stockage et un seul processeur. 21 00:01:23,830 --> 00:01:24,910 Les temps ont changé. 22 00:01:24,910 --> 00:01:29,860 Si vous avance rapide maintenant, nous filage plus de 60 000 processeurs ici à Harvard. 23 00:01:29,860 --> 00:01:32,810 Beaucoup d'autres organisations tournent beaucoup plus. 24 00:01:32,810 --> 00:01:37,740 >> La livraison de cette importante est cette échelle est maintenant non seulement inévitable, 25 00:01:37,740 --> 00:01:41,910 ce est arrivé et ce est va continuer à se produire. 26 00:01:41,910 --> 00:01:44,760 Alors disons, pour un moment, genre de rembobiner et de parler très rapidement 27 00:01:44,760 --> 00:01:50,530 sur la science, mon préféré sujet, la méthode scientifique. 28 00:01:50,530 --> 00:01:53,180 >> Si vous êtes d'être un scientifique, vous avez à faire quelques éléments clés. 29 00:01:53,180 --> 00:01:56,140 Si vous ne faites pas ces choses que vous pouvez vous considérez pas comme un scientifique 30 00:01:56,140 --> 00:02:03,250 et vous aurez du mal pouvoir comprendre votre domaine de la discipline. 31 00:02:03,250 --> 00:02:07,290 >> Alors tout d'abord, vous souhaitez formuler des votre question, vous générer des hypothèses, 32 00:02:07,290 --> 00:02:09,289 mais plus important encore, vous, prédire votre results-- 33 00:02:09,289 --> 00:02:13,090 vous avez une proposition pour ce que les résultats seront. 34 00:02:13,090 --> 00:02:19,560 Et puis finalement, vous testez votre hypothèse et analyser vos résultats. 35 00:02:19,560 --> 00:02:25,460 >> Ainsi, cette méthode scientifique est extrêmement important dans l'informatique. 36 00:02:25,460 --> 00:02:28,450 Informatique à la fois de la prédiction et être capable de tester vos résultats 37 00:02:28,450 --> 00:02:33,660 sont un élément clé de ce que nous devons à faire dans la méthode scientifique. 38 00:02:33,660 --> 00:02:37,310 Ces prédictions et essais sont les deux pierres angulaires réels 39 00:02:37,310 --> 00:02:42,350 de la méthode scientifique, et chaque exiger que les avancées les plus significatives 40 00:02:42,350 --> 00:02:45,240 dans le calcul moderne. 41 00:02:45,240 --> 00:02:51,210 >> Les deux piliers de la science sont que de la théorie et celui de l'expérimentation. 42 00:02:51,210 --> 00:02:54,300 Et, plus récemment, l'informatique est souvent mentionné 43 00:02:54,300 --> 00:02:58,090 comme étant le troisième pilier de la science. 44 00:02:58,090 --> 00:03:01,440 Donc, si vous regardez ce étudiants, vous ne avez absolument aucune pression. 45 00:03:01,440 --> 00:03:03,960 46 00:03:03,960 --> 00:03:08,720 Troisième pilier de science-- pas grand- Deal-- informatique, assez important. 47 00:03:08,720 --> 00:03:14,000 Je suis tellement content ce est la partie de l'informatique de l'ordinateur cours de sciences 50. 48 00:03:14,000 --> 00:03:16,220 >> Alors assez de l'arrière-plan. 49 00:03:16,220 --> 00:03:20,226 Je veux vous dire le plan de ce que nous allons parler aujourd'hui. 50 00:03:20,226 --> 00:03:22,870 Je vais aller sur une certaine histoire. 51 00:03:22,870 --> 00:03:25,250 Je vais expliquer pourquoi nous sommes arrivés ici. 52 00:03:25,250 --> 00:03:27,750 Je vais parler de certains de l'histoire de l'informatique 53 00:03:27,750 --> 00:03:33,890 ici à Harvard, certains activités autour de médias sociaux, 54 00:03:33,890 --> 00:03:36,200 vert très things-- passionné de toutes choses 55 00:03:36,200 --> 00:03:43,640 green-- storage-- ordinateur storage-- comment le chaos affecte scale-out sur les systèmes, 56 00:03:43,640 --> 00:03:45,640 et les systèmes de distribution en particulier. 57 00:03:45,640 --> 00:03:48,473 >> Et puis je vais aborder certains du matériel scale-out qui est 58 00:03:48,473 --> 00:03:51,370 requis pour pouvoir faire informatique à grande échelle. 59 00:03:51,370 --> 00:03:55,830 Et puis enfin, nous allons envelopper avec une science génial. 60 00:03:55,830 --> 00:04:00,894 >> Donc, nous allons prendre une minute pour regarder notre histoire réelle. 61 00:04:00,894 --> 00:04:01,810 Computing a évolué. 62 00:04:01,810 --> 00:04:07,370 Ainsi, depuis les années 60, tous les l'écart jusqu'à aujourd'hui, 63 00:04:07,370 --> 00:04:11,260 nous avons vu essentiellement un changement de champ d'application de l'informatique centralisée 64 00:04:11,260 --> 00:04:14,679 de décentraliser informatique, aux collaboration et alors indépendante 65 00:04:14,679 --> 00:04:15,970 l'informatique et le droit de retour. 66 00:04:15,970 --> 00:04:17,709 >> Et permettez-moi de annote qu'un peu. 67 00:04:17,709 --> 00:04:20,370 Lorsque nous avons commencé avec ordinateurs, nous avons eu des mainframes. 68 00:04:20,370 --> 00:04:22,824 Ils étaient excessivement dispositifs coûteux. 69 00:04:22,824 --> 00:04:23,990 Tout devait être partagée. 70 00:04:23,990 --> 00:04:25,556 Le calcul est complexe. 71 00:04:25,556 --> 00:04:29,060 Vous pouvez le voir, il remplit chambres il y avait les opérateurs et les bandes 72 00:04:29,060 --> 00:04:32,780 et toutes sortes de Whirry, clicky, dispositifs de spinny. 73 00:04:32,780 --> 00:04:39,930 >> Autour des années 80 début des années 70, vous avez commencé pour voir un impact des télécopieurs. 74 00:04:39,930 --> 00:04:43,620 Alors vous commencez à voir l'informatique commencer à apparaître dans les laboratoires de retour 75 00:04:43,620 --> 00:04:45,880 et de se rapprocher de vous. 76 00:04:45,880 --> 00:04:49,800 La hausse de la personnels ordinateur, certainement 77 00:04:49,800 --> 00:04:57,460 dans les années 80, début de la décennie, vraiment changé informatique. 78 00:04:57,460 --> 00:04:59,570 >> Et il ya un indice dans le titre, car il 79 00:04:59,570 --> 00:05:04,080 a été appelé l'ordinateur personnel, ce qui signifie qu'il vous appartenait. 80 00:05:04,080 --> 00:05:07,630 Alors que l'évolution des calcul continu, 81 00:05:07,630 --> 00:05:10,530 les gens ont réalisé que leur personnel ordinateur ne était pas vraiment assez grande 82 00:05:10,530 --> 00:05:15,020 pour être en mesure de faire quelque chose de tout mérite, ou le mérite significative, dans la science. 83 00:05:15,020 --> 00:05:17,790 >> Et pour que les gens ont commencé à développer périphérique réseau 84 00:05:17,790 --> 00:05:21,920 pilotes pour pouvoir connecter les PC ensemble pour être en mesure de créer des grappes. 85 00:05:21,920 --> 00:05:26,430 Et donc ce engendra l'ère du cluster Beowulf. 86 00:05:26,430 --> 00:05:32,470 Linux explose en réponse à système d'exploitation propriétaire, à la fois le coût 87 00:05:32,470 --> 00:05:33,650 et la complexité. 88 00:05:33,650 --> 00:05:36,530 >> Et puis, nous sommes ici aujourd'hui, où, encore une fois, nous sommes 89 00:05:36,530 --> 00:05:40,610 face à des chambres pleines de l'ordinateur l'équipement et la capacité 90 00:05:40,610 --> 00:05:44,570 de glisser sa carte de crédit et obtenir l'accès à ces installations informatiques, 91 00:05:44,570 --> 00:05:45,290 distance. 92 00:05:45,290 --> 00:05:49,680 >> Et vous pouvez alors voir, termes d'histoire d'impact 93 00:05:49,680 --> 00:05:52,180 comment nous ne calcul aujourd'hui, ce est certainement 94 00:05:52,180 --> 00:05:56,090 évolué à partir de la machine chambres pleines d'ordinateurs 95 00:05:56,090 --> 00:05:59,160 par certains ordinateurs personnels tout le chemin de retour à nouveau 96 00:05:59,160 --> 00:06:02,400 à la machine des chambres pleines d'ordinateurs. 97 00:06:02,400 --> 00:06:06,620 >> Donc, ce est mon premier cluster. 98 00:06:06,620 --> 00:06:10,170 Donc 2000, nous avons construit un Système d'ordinateur en Europe 99 00:06:10,170 --> 00:06:13,900 annoter efficacement le génome humain. 100 00:06:13,900 --> 00:06:16,521 Il ya beaucoup de technologie cotée sur le côté droit 101 00:06:16,521 --> 00:06:18,520 il que, malheureusement, ne est plus avec nous. 102 00:06:18,520 --> 00:06:23,460 Il a fait passer à la grande technologie dans le ciel. 103 00:06:23,460 --> 00:06:26,610 >> La machine elle-même est probablement équivalent d'un peu d'ordinateurs portables décent 104 00:06:26,610 --> 00:06:29,020 aujourd'hui, et que tout type de montre. 105 00:06:29,020 --> 00:06:36,260 Cependant, nous ne avons attentivement annotons le génome humain et les deux protégeaient 106 00:06:36,260 --> 00:06:43,190 avec ce papier particulier Nature des préoccupations l'données 107 00:06:43,190 --> 00:06:45,380 être public ou privé. 108 00:06:45,380 --> 00:06:48,610 >> Donc, ce est génial, non? 109 00:06:48,610 --> 00:06:50,280 Nous avons donc un génome humain. 110 00:06:50,280 --> 00:06:51,510 Nous avons fait le calcul. 111 00:06:51,510 --> 00:06:53,400 Je me sens très me plaisait. 112 00:06:53,400 --> 00:06:59,090 Je ai roulé jusqu'à Harvard en 2006, se sentir beaucoup moins content de moi. 113 00:06:59,090 --> 00:07:00,210 >> Ce est ce que je ai hérité. 114 00:07:00,210 --> 00:07:03,575 Ce est une départementale mail et le serveur de fichiers. 115 00:07:03,575 --> 00:07:05,450 Vous pouvez voir ici il ya un peu de ruban 116 00:07:05,450 --> 00:07:07,710 qui est utilisé pour maintenir le système en même temps. 117 00:07:07,710 --> 00:07:09,890 Ce est notre licence et serveur d'impression. 118 00:07:09,890 --> 00:07:13,990 Je suis assez sûr il peut y avoir des mots de passe sur certains de ces Post-it. 119 00:07:13,990 --> 00:07:16,560 120 00:07:16,560 --> 00:07:17,360 >> Pas génial. 121 00:07:17,360 --> 00:07:18,530 Assez loin de impressionnant. 122 00:07:18,530 --> 00:07:22,060 Et donc, je sais que ce petit tableau que je vous ai montré au début 123 00:07:22,060 --> 00:07:25,350 de partager à la propriété Retour au partage, 124 00:07:25,350 --> 00:07:27,930 que nous devions changer le jeu. 125 00:07:27,930 --> 00:07:31,330 Et donc nous avons changé le jeu en fournissant des incitations. 126 00:07:31,330 --> 00:07:34,250 Et les êtres humains, de sorte que cette petit article Wikipedia 127 00:07:34,250 --> 00:07:35,990 dit ici, nos créatures motivantes. 128 00:07:35,990 --> 00:07:39,250 Et l'étude d'incitation structures est essentielle à l'étude 129 00:07:39,250 --> 00:07:41,100 de l'activité économique. 130 00:07:41,100 --> 00:07:44,580 >> Donc nous avons commencé à inciter nos professeurs et nos chercheurs. 131 00:07:44,580 --> 00:07:47,720 Et donc nous les incitatifs avec un système informatique vraiment grand. 132 00:07:47,720 --> 00:07:52,720 Donc, en 2008, nous avons construit un 4096 10 supports de processeurs, 133 00:07:52,720 --> 00:07:54,470 quelques centaines de kilowatts de puissance. 134 00:07:54,470 --> 00:07:56,178 >> Ce que je pense est intéressant, ce est qu'il n'a pas 135 00:07:56,178 --> 00:07:58,300 où que vous soyez dans le cycle. 136 00:07:58,300 --> 00:08:03,510 Cette même quantité de puissance et calcul, la puissance est la constante. 137 00:08:03,510 --> 00:08:06,270 Il était de 200 kilowatts lorsque nous ont été la construction de systèmes en Europe. 138 00:08:06,270 --> 00:08:09,770 Ce est deux cents kilowatts en 2008, et que 139 00:08:09,770 --> 00:08:15,820 semble être le [? quanter?] des petits universitaire basée systèmes informatiques. 140 00:08:15,820 --> 00:08:20,540 >> Donc Harvard today-- avance rapide, je ne suis pas plus triste panda, un panda très heureux. 141 00:08:20,540 --> 00:08:25,860 Nous avons 60 quelques mille équilibrage de charge CPU, et de leur escalade spectaculaire. 142 00:08:25,860 --> 00:08:28,780 Nous avons 15 pétaoctets de le stockage, l'escalade aussi. 143 00:08:28,780 --> 00:08:30,720 Encore une fois, cette 200 kilowatts incrément, nous semblons 144 00:08:30,720 --> 00:08:33,000 être ajoutant que tous les six mois ou plus. 145 00:08:33,000 --> 00:08:35,480 Beaucoup, beaucoup de machines virtuelles. 146 00:08:35,480 --> 00:08:37,620 Et plus important encore, environ 1,8 mégawatts 147 00:08:37,620 --> 00:08:39,669 des équipements informatiques de recherche. 148 00:08:39,669 --> 00:08:41,820 >> Et je vais venir revenir plus tard sur, 149 00:08:41,820 --> 00:08:46,913 les raisons pour lesquelles je ai maintenant ne est plus nécessairement compter combien de CPU que nous avons, 150 00:08:46,913 --> 00:08:48,980 mais quelle est la facture d'électricité. 151 00:08:48,980 --> 00:08:52,690 20 autres afin dédié le personnel de recherche informatique. 152 00:08:52,690 --> 00:08:57,250 Et plus important encore, nous sommes commencer à développer notre GPGPU. 153 00:08:57,250 --> 00:09:05,030 Je ai été stupéfait de voir combien de cette qui est ajoutée sur une base de jour en jour. 154 00:09:05,030 --> 00:09:07,310 Donc, leçon d'histoire sur, non? 155 00:09:07,310 --> 00:09:11,280 >> Alors, comment pouvons-nous y arriver d'ici? 156 00:09:11,280 --> 00:09:14,560 Regardons un peu moderne exemples de calcul scale-out. 157 00:09:14,560 --> 00:09:18,290 158 00:09:18,290 --> 00:09:23,230 Je suis un peu obsédé par la taille et l'échelle des médias sociaux. 159 00:09:23,230 --> 00:09:30,850 Il existe un certain nombre de très succès l'informatique de grande ampleur 160 00:09:30,850 --> 00:09:34,820 organisations aujourd'hui sur la planète, fournir un soutien et des services 161 00:09:34,820 --> 00:09:36,810 pour nous tous. 162 00:09:36,810 --> 00:09:39,340 Donc, ce est l'avertissement. 163 00:09:39,340 --> 00:09:42,990 >> Et je tiens à commencer par une nombre d'onces à un Instagram. 164 00:09:42,990 --> 00:09:48,336 Ce ne est pas en fait un plomb pour une blague, ce est 165 00:09:48,336 --> 00:09:50,460 même pas drôle, effectivement, à bien y penser de lui. 166 00:09:50,460 --> 00:09:52,751 Mais de toute façon, nous allons regarder once dans Instagram. 167 00:09:52,751 --> 00:09:55,260 Et nous allons commencer avec «Mon abeille et une fleur." 168 00:09:55,260 --> 00:09:57,600 Je étais à [inaudible] Village et je ai pris une petite image 169 00:09:57,600 --> 00:10:00,460 d'une abeille assis sur une fleur. 170 00:10:00,460 --> 00:10:03,270 Et puis je ai commencé à penser qu'est-ce que cela signifie réellement. 171 00:10:03,270 --> 00:10:07,013 Et je ai pris cette photo de mon téléphone et compté combien d'octets sont en elle, 172 00:10:07,013 --> 00:10:09,070 et ce est environ 256 kilo-octets. 173 00:10:09,070 --> 00:10:13,550 Quels quand je ai commencé, serait essentiellement combler une disquette 5 pouces et 1/4. 174 00:10:13,550 --> 00:10:15,340 Et a commencé à penser, eh bien, ce est cool. 175 00:10:15,340 --> 00:10:18,630 >> Et je ai commencé à regarder et de faire des recherches sur le réseau. 176 00:10:18,630 --> 00:10:22,490 Et je ai découvert que Instagram a 200 millions de MAU. 177 00:10:22,490 --> 00:10:25,105 Je ne étais pas en fait que que ce était un MAU. 178 00:10:25,105 --> 00:10:28,960 Et un MAU, ici-bas, est un utilisateur actif mensuelle. 179 00:10:28,960 --> 00:10:34,270 >> Ainsi, 200 millions de MAUs-- assez cool. 180 00:10:34,270 --> 00:10:38,190 20000000000 photographs-- sorte beaucoup de photographies. 181 00:10:38,190 --> 00:10:42,300 60 millions de nouvelles photos chaque jour 182 00:10:42,300 --> 00:10:46,990 sortir à environ 0,002 concert par photo. 183 00:10:46,990 --> 00:10:51,290 Ce est environ cinq pétaoctets du disque juste là. 184 00:10:51,290 --> 00:10:55,480 Et ce est vraiment pas la partie centrale de ce que nous allons parler. 185 00:10:55,480 --> 00:10:57,830 Ce est petites pommes de terre. 186 00:10:57,830 --> 00:11:00,710 Ou comme on dit en Angleterre, patates minuscules. 187 00:11:00,710 --> 00:11:05,050 >> Alors regardons le véritable éléphant dans les visages uniques room--. 188 00:11:05,050 --> 00:11:09,170 Encore une fois, nous allons mesure cette nouvelle quanta appellent un MAU. 189 00:11:09,170 --> 00:11:13,260 Facebook a lui-même 1,3 milliards MAU. 190 00:11:13,260 --> 00:11:17,510 WhatsApp, que je ne avais même pas entendu parler de jusqu'à récemment, ce est 191 00:11:17,510 --> 00:11:23,260 un service de tri de messagerie, est de 500 millions de MAU. 192 00:11:23,260 --> 00:11:26,620 Instagram, que nous venons parlé de 200 millions de MAU. 193 00:11:26,620 --> 00:11:29,370 Et Messenger, qui est un autre service de messagerie, 194 00:11:29,370 --> 00:11:31,120 est également 200 millions de MAU. 195 00:11:31,120 --> 00:11:35,920 >> Alors que jusqu'à totalisera, il se agit de 2,2 milliards d'utilisateurs au total. 196 00:11:35,920 --> 00:11:39,880 De toute évidence, il ya un certain chevauchement, mais ce est équivalent à un tiers de la planète. 197 00:11:39,880 --> 00:11:44,270 Et ils envoient quelque chose dans le région de 12 milliards de messages par jour. 198 00:11:44,270 --> 00:11:46,680 Et encore, il ya seulement 7 milliard de personnes sur la planète. 199 00:11:46,680 --> 00:11:48,550 Pas tout le monde a un smartphone. 200 00:11:48,550 --> 00:11:53,960 Donc, ce est le nombre d'aliénés. 201 00:11:53,960 --> 00:12:02,050 >> Et je vais faire valoir que ce ne est pas même sur le stockage ou le calcul. 202 00:12:02,050 --> 00:12:05,610 Et de citer la chanson, ce est tout sur ce graphique. 203 00:12:05,610 --> 00:12:09,045 Voici notre belle Meghan Trainor bas ici, chanter toutes les basses. 204 00:12:09,045 --> 00:12:12,570 Remarque, elle a aussi tout un peu de basses herself-- 207, 205 00:12:12,570 --> 00:12:16,460 ainsi 218 millions de personnes ont vu cette jeune femme chanter sa chanson. 206 00:12:16,460 --> 00:12:19,910 >> Donc, mon argument est qu'il ce est tout sur le graphique. 207 00:12:19,910 --> 00:12:23,480 Donc nous avons pris certains logiciels open source et a commencé à regarder un graphique. 208 00:12:23,480 --> 00:12:27,740 Et ce est LinkedIn, donc ce est un Facebook pour les personnes âgées. 209 00:12:27,740 --> 00:12:29,910 Et oui, ce est mon graphe LinkedIn. 210 00:12:29,910 --> 00:12:34,080 Je ai 1 200 noeuds ou plus, soi-disant «amis». 211 00:12:34,080 --> 00:12:36,360 Et ici est moi au sommet. 212 00:12:36,360 --> 00:12:38,140 Et voici toutes les interconnexions. 213 00:12:38,140 --> 00:12:40,570 >> Maintenant, pensez à l'histoire Instagram. 214 00:12:40,570 --> 00:12:42,815 Chacun d'entre eux est pas seulement la photo, il 215 00:12:42,815 --> 00:12:46,860 a toute une pléthore de connexions entre cette personne en particulier 216 00:12:46,860 --> 00:12:48,220 et beaucoup d'autres. 217 00:12:48,220 --> 00:12:52,190 Ce est la pièce centrale est soit un bogue dans l'algorithme de dessin graphique, 218 00:12:52,190 --> 00:12:55,982 ou ce peut-être David Malan, je ne suis pas encore sûr. 219 00:12:55,982 --> 00:12:57,690 Ainsi, vous pouvez redessiner la graphiques de toutes sortes 220 00:12:57,690 --> 00:13:02,510 des gephi.gihub.io ways-- est là vous pouvez tirer de ce logiciel. 221 00:13:02,510 --> 00:13:05,410 Ce est vraiment cool d'être capable d'organiser les communautés. 222 00:13:05,410 --> 00:13:08,640 Vous pouvez voir ici, ce est de Harvard et divers autres endroits que je ai travaillé, 223 00:13:08,640 --> 00:13:12,160 parce que ce est mes données liées au travail. 224 00:13:12,160 --> 00:13:15,080 >> Il suffit donc de penser la complexité du graphique et l'ensemble des données 225 00:13:15,080 --> 00:13:17,070 que vous tirez avec. 226 00:13:17,070 --> 00:13:20,870 Donc, en attendant, de retour à FriendFace, non? 227 00:13:20,870 --> 00:13:24,360 Nous avons examiné les données que Instagram était de l'ordre de cinq pétaoctets. 228 00:13:24,360 --> 00:13:25,300 No big deal. 229 00:13:25,300 --> 00:13:28,830 Encore beaucoup de données, mais pas grand- traiter dans le grand schéma des choses. 230 00:13:28,830 --> 00:13:33,850 >> De cet article sur l'ancien Internet, "Mise à l'échelle de l'entrepôt de données Facebook 231 00:13:33,850 --> 00:13:36,250 300 pétaoctets. " 232 00:13:36,250 --> 00:13:38,110 Ce est toute une autre changeur de jeu maintenant, 233 00:13:38,110 --> 00:13:40,234 lorsque vous commencez à penser de données et le graphique 234 00:13:40,234 --> 00:13:41,690 et ce que vous apportez avec. 235 00:13:41,690 --> 00:13:47,480 Et leur haute des données est en croissance de l'ordre de 600 téraoctets par jour. 236 00:13:47,480 --> 00:13:52,980 >> Maintenant, vous savez, eh bien, alors-- Je veux dire, 600 téraoctets par jour, 237 00:13:52,980 --> 00:13:55,670 300 petabytes-- ils sont aussi commence maintenant 238 00:13:55,670 --> 00:13:58,550 pour obtenir très préoccupé comment garder ce genre de choses 239 00:13:58,550 --> 00:14:01,160 et de veiller à ces données reste autour. 240 00:14:01,160 --> 00:14:04,630 Et ce monsieur ici, Jay Parikh, est à la recherche 241 00:14:04,630 --> 00:14:08,250 à la façon de stocker une exabyte des données. 242 00:14:08,250 --> 00:14:10,180 >> Juste pour ceux d'entre vous qui sont en regardant le long 243 00:14:10,180 --> 00:14:13,940 à la maison, un exabyte-- 10 à 18. 244 00:14:13,940 --> 00:14:18,210 Il a obtenu son propre Wikipedia la page, ce est que les grandes d'un certain nombre. 245 00:14:18,210 --> 00:14:23,120 Ce est la taille et l'ampleur de ce que nous sommes examiner, pour être en mesure de stocker des données. 246 00:14:23,120 --> 00:14:27,090 Et ces gars-là ne sont pas bidouillent, ils stocker cette quantité de données. 247 00:14:27,090 --> 00:14:29,550 Donc, l'un des indices qui qu'ils regardent ici 248 00:14:29,550 --> 00:14:32,185 est des centres de données pour dite chambre froide. 249 00:14:32,185 --> 00:14:35,020 250 00:14:35,020 --> 00:14:36,470 >> Ce qui me amène à être vert. 251 00:14:36,470 --> 00:14:38,340 Et voici Kermit. 252 00:14:38,340 --> 00:14:43,050 Lui et moi agree-- il est extrêmement difficile d'être vert, 253 00:14:43,050 --> 00:14:44,920 mais nous lui donnons notre meilleur essai. 254 00:14:44,920 --> 00:14:47,430 Kermit ne peut pas l'aider, il a d'être vert tout le temps, 255 00:14:47,430 --> 00:14:49,945 ne peut pas prendre son vert-ness hors du tout. 256 00:14:49,945 --> 00:14:55,410 >> Donc, être un concepts-- quelques-uns type de concepts de base 257 00:14:55,410 --> 00:14:59,510 de verdure, lorsqu'elle se rapporte à l'informatique. 258 00:14:59,510 --> 00:15:05,510 Celui qui est le plus important est la longévité du produit. 259 00:15:05,510 --> 00:15:09,405 Si votre produit a une courte durée de vie, vous ne pouvez pas, par définition, être vert. 260 00:15:09,405 --> 00:15:13,280 L'énergie requise pour la fabrication d'un lecteur de disque, une carte mère, un ordinateur 261 00:15:13,280 --> 00:15:17,890 système, une tablette, quel qu'il soit être, la longévité de vos systèmes 262 00:15:17,890 --> 00:15:21,700 sont un élément clé de la façon dont vous pouvez être verte. 263 00:15:21,700 --> 00:15:27,960 >> La partie importante, comme vous tous, sont la construction de logiciels algorithms-- 264 00:15:27,960 --> 00:15:30,455 de un algorithme partielle mot pour le logiciel, non? 265 00:15:30,455 --> 00:15:34,000 Ainsi, la conception de votre algorithme est absolument essentiel en termes 266 00:15:34,000 --> 00:15:43,080 de la façon dont vous allez être capable de faire calculs rapides et précises à utiliser 267 00:15:43,080 --> 00:15:44,710 le moins d'énergie possible. 268 00:15:44,710 --> 00:15:47,280 Et je vais arriver à cela dans un peu. 269 00:15:47,280 --> 00:15:51,270 >> centre de données design-- vous avez vu que nous avons déjà des milliers 270 00:15:51,270 --> 00:15:54,870 et des milliers de machines, assis tranquillement dans de petits coins sombres 271 00:15:54,870 --> 00:15:57,760 du monde, de l'informatique. 272 00:15:57,760 --> 00:16:01,670 Ressources allocation-- comment obtenir le calcul, le stockage, 273 00:16:01,670 --> 00:16:03,840 par l'intermédiaire du réseau. 274 00:16:03,840 --> 00:16:08,530 Les systèmes d'exploitation sont un élément clé de cela, et beaucoup de la virtualisation 275 00:16:08,530 --> 00:16:12,080 pour être en mesure d'emballer de plus en plus de calcul dans un petit espace. 276 00:16:12,080 --> 00:16:15,530 >> Je vais vous donner un petit exemple de la recherche informatique. 277 00:16:15,530 --> 00:16:18,220 Nous avions besoin de plus de ping, plus puissance et plus de sections. 278 00:16:18,220 --> 00:16:21,030 Nous avions besoin de plus grand, mieux, des ordinateurs plus rapides, 279 00:16:21,030 --> 00:16:23,390 et nécessaire pour utiliser moins de jus. 280 00:16:23,390 --> 00:16:26,856 Et nous ne pouvions pas travailler sur la façon de le faire. 281 00:16:26,856 --> 00:16:29,980 Je ne sais pas si le hashtag GoWest que sans doute été utilisé par le Kardashian, 282 00:16:29,980 --> 00:16:32,560 mais de toute façon, Gowest. 283 00:16:32,560 --> 00:16:33,220 Et nous l'avons fait. 284 00:16:33,220 --> 00:16:36,610 >> Nous avons ramassé notre opération et nous avons déménagé hors 285 00:16:36,610 --> 00:16:39,660 Western Massachusetts dans une petite ville de l'usine 286 00:16:39,660 --> 00:16:45,000 appelé Holyoke, juste au nord des Chikopee et Springfield. 287 00:16:45,000 --> 00:16:49,280 Nous avons fait cela pour un couple de raisons. 288 00:16:49,280 --> 00:16:55,150 Le principal est que nous eu un très, très grand barrage. 289 00:16:55,150 --> 00:17:00,080 Et ce très grand barrage est en mesure de mettre hors 30 mégawatts, plus d'énergie, 290 00:17:00,080 --> 00:17:02,980 et il a été sous-utilisée à ce moment. 291 00:17:02,980 --> 00:17:06,170 >> Plus important encore, nous avons aussi un réseau très compliqué 292 00:17:06,170 --> 00:17:07,254 ce était déjà en place. 293 00:17:07,254 --> 00:17:09,711 Si vous regardez où le réseau va aux États-Unis, 294 00:17:09,711 --> 00:17:11,230 il suit toutes les pistes de train. 295 00:17:11,230 --> 00:17:14,290 Cette pièce était particulier de réseau détenue par nos collègues et amis 296 00:17:14,290 --> 00:17:16,480 au Massachusetts Institute of Technology, 297 00:17:16,480 --> 00:17:19,720 et il a été essentiellement construite tout le chemin jusqu'à la route 90. 298 00:17:19,720 --> 00:17:24,760 >> Donc, nous avions une grande coche de la rivière, la route 90 cocher, nous avons eu une courte distance de 100 miles, 299 00:17:24,760 --> 00:17:26,960 et un long chemin d'environ 1.000 miles. 300 00:17:26,960 --> 00:17:29,890 Nous avons dû faire un très grand épissure de réseau, comme vous pouvez le voir ici, 301 00:17:29,890 --> 00:17:32,990 à mettre essentiellement un lien dans, à être en mesure de se connecter à Holyoke, 302 00:17:32,990 --> 00:17:36,390 mais nous avions tout de la condition ping infrastructure--, puissance, tuyau. 303 00:17:36,390 --> 00:17:37,280 La vie était belle. 304 00:17:37,280 --> 00:17:38,980 Et encore une fois, grand barrage. 305 00:17:38,980 --> 00:17:42,120 >> Nous avons donc construit essentiellement le Massachusetts Vert High Performance Computing 306 00:17:42,120 --> 00:17:42,850 Center. 307 00:17:42,850 --> 00:17:46,580 Ce était un travail d'amour à cinq universities-- MIT, Harvard, UMass, 308 00:17:46,580 --> 00:17:47,870 Northeastern, et BU. 309 00:17:47,870 --> 00:17:49,554 Cinq jours une mégawatts de charge connectée. 310 00:17:49,554 --> 00:17:51,845 Nous avons fait toutes sortes de l'intelligence d'économiseurs côté piste 311 00:17:51,845 --> 00:17:53,585 de garder les choses vert. 312 00:17:53,585 --> 00:18:03,330 Et nous avons construit des racks 640-impairs, dédié à la recherche informatique. 313 00:18:03,330 --> 00:18:08,770 >> Ce était une vieille friche industrielle, donc nous eu une certaine remise en état et certains bien rangé-up 314 00:18:08,770 --> 00:18:10,500 et un certain nettoyage du site. 315 00:18:10,500 --> 00:18:13,590 Et puis nous avons commencé de construire l'installation 316 00:18:13,590 --> 00:18:19,710 et, belle installation boom-- avec le possibilité d'exécuter sandbox informatique, 317 00:18:19,710 --> 00:18:24,430 d'avoir des conférences et des séminaires, et aussi un immense plancher de centre de données. 318 00:18:24,430 --> 00:18:26,007 >> Voici ma bonne auto. 319 00:18:26,007 --> 00:18:27,590 Je suis évidemment porter la même veste. 320 00:18:27,590 --> 00:18:29,423 Je ai peut-être seulement une veste, mais il me est 321 00:18:29,423 --> 00:18:34,030 et John Goodhue-- il est le directeur exécutif des Center-- 322 00:18:34,030 --> 00:18:36,740 debout dans la salle des machines de-chaussée, qui, comme vous pouvez le voir, 323 00:18:36,740 --> 00:18:40,560 est assez dramatique, et il remonte un long, long chemin. 324 00:18:40,560 --> 00:18:44,830 >> Je joue souvent des jeux de conduite de Boston à Holyoke, 325 00:18:44,830 --> 00:18:47,260 prétendant que je suis un paquet / IP TCP. 326 00:18:47,260 --> 00:18:54,290 Et je ne me inquiète au sujet de mon temps de latence circuler dans ma voiture. 327 00:18:54,290 --> 00:18:56,690 Donc, ce est la pièce verte. 328 00:18:56,690 --> 00:19:00,070 Donc, nous allons prendre une minute et de réfléchir à piles. 329 00:19:00,070 --> 00:19:04,060 Nous essayons donc très attentivement construire des centres de données efficace, 330 00:19:04,060 --> 00:19:08,770 calcul efficacement, à faire bonne sélection de l'équipement informatique 331 00:19:08,770 --> 00:19:12,060 et de livrer plus surtout, notre application, 332 00:19:12,060 --> 00:19:17,860 qu'il se agisse d'un service de messagerie ou une application scientifique. 333 00:19:17,860 --> 00:19:19,110 >> Voici donc les piles. 334 00:19:19,110 --> 00:19:22,762 Donc couche physique, tout le chemin à travers Application-- 335 00:19:22,762 --> 00:19:25,220 en espérant que cela va une bonne partie de votre cours. 336 00:19:25,220 --> 00:19:31,450 Modèle OSI à sept couches est fondamentalement, vous allez vivre, manger et respirer 337 00:19:31,450 --> 00:19:35,270 ce tout au long de votre carrière de calcul. 338 00:19:35,270 --> 00:19:37,800 Ce concept de physique infrastructure-- fils, 339 00:19:37,800 --> 00:19:40,080 câbles, des centres de données, des liens. 340 00:19:40,080 --> 00:19:42,190 Et ce ne est que de décrire le réseau. 341 00:19:42,190 --> 00:19:44,780 >> Jusqu'à ici, ce est bien, évidemment, ce est un vieux toboggan, 342 00:19:44,780 --> 00:19:49,342 parce que ce devrait dire HTTP, parce personne ne se soucie simple mail 343 00:19:49,342 --> 00:19:50,550 protocoles de transport, plus. 344 00:19:50,550 --> 00:19:53,960 Cela se passe dans l'espace de HTTP. 345 00:19:53,960 --> 00:19:55,850 Donc, ce est un niveau de pile. 346 00:19:55,850 --> 00:19:59,460 >> Voici un autre jeu de piles, où vous avoir un serveur, un hôte, un hyperviseur, 347 00:19:59,460 --> 00:20:02,470 un invité, bibliothèque binaire, puis votre application. 348 00:20:02,470 --> 00:20:06,070 Ou, dans ce cas, le dispositif conducteur, un noyau Linux, c natif, 349 00:20:06,070 --> 00:20:08,080 Machine virtuelle Java, API Java, puis Java 350 00:20:08,080 --> 00:20:11,220 applications, et ainsi de suite et ainsi de suite. 351 00:20:11,220 --> 00:20:14,090 Ce est une description d'une machine virtuelle. 352 00:20:14,090 --> 00:20:15,450 >> Piles Saints, Batman! 353 00:20:15,450 --> 00:20:18,260 Pensez à ce sujet dans termes de combien de calcul 354 00:20:18,260 --> 00:20:20,850 vous avez besoin pour aller de ce qui se passe ici, 355 00:20:20,850 --> 00:20:23,110 sur toute la hauteur de la partie supérieure de cette pile, puis à 356 00:20:23,110 --> 00:20:26,840 être capable de faire votre réelle remise de la requête. 357 00:20:26,840 --> 00:20:29,130 >> Et si vous sorte de rembobinage et commencer à penser 358 00:20:29,130 --> 00:20:33,450 sur ce qu'il faut pour fournir une opération en virgule flottante, 359 00:20:33,450 --> 00:20:37,650 votre opération en virgule flottante est une somme des prises de courant, le nombre de cœurs 360 00:20:37,650 --> 00:20:44,490 dans la douille, une horloge, qui est Combien de temps pouvez l'horloge turnover-- 361 00:20:44,490 --> 00:20:47,490 quatre gigahertz, deux gigahertz-- puis le nombre 362 00:20:47,490 --> 00:20:50,890 des opérations que vous pouvez faire dans un hertz donné. 363 00:20:50,890 --> 00:20:54,350 >> Donc, ces microprocesseurs aujourd'hui faire entre quatre et six FLOPs 364 00:20:54,350 --> 00:20:55,400 par cycle d'horloge. 365 00:20:55,400 --> 00:20:59,810 Et donc un single-core 2,5 concert horloge a un rendement théorique 366 00:20:59,810 --> 00:21:03,490 d'environ un méga FLOP, donner ou prendre. 367 00:21:03,490 --> 00:21:05,940 >> Mais, comme pour tout, nous avons des choix. 368 00:21:05,940 --> 00:21:12,280 Donc, et Intel Core 2, Nehalem Sandy Bridge, Haswell, AMD, 369 00:21:12,280 --> 00:21:13,920 prendre votre choices-- Intel Atom. 370 00:21:13,920 --> 00:21:17,670 Toutes ces architectures de processeur tous ont une manière légèrement différente 371 00:21:17,670 --> 00:21:19,650 de pouvoir ajouter deux numéros ensemble, 372 00:21:19,650 --> 00:21:23,520 qui est essentiellement leur but dans la vie. 373 00:21:23,520 --> 00:21:24,535 Doit être difficile. 374 00:21:24,535 --> 00:21:27,100 Il ya des millions d'entre eux assis dans les centres de données, maintenant si. 375 00:21:27,100 --> 00:21:30,410 >> Sor, fiascos par watt-- ce est la grande chose. 376 00:21:30,410 --> 00:21:37,780 Donc, si je veux obtenir plus de ce pour passer à travers cette pile, plus rapide, 377 00:21:37,780 --> 00:21:41,800 Je ai eu à travailler sur le nombre de opérations à virgule flottante d'une seconde, 378 00:21:41,800 --> 00:21:43,770 Je peux le faire, et ensuite leur donner watts. 379 00:21:43,770 --> 00:21:46,160 Et heureusement, les gens ont pensé à ce sujet. 380 00:21:46,160 --> 00:21:49,140 >> Donc, il ya une grande contester chaque année pour voir 381 00:21:49,140 --> 00:21:52,310 qui peut construire l'ordinateur le plus rapide qui peut diagonaliser une matrice. 382 00:21:52,310 --> 00:21:53,980 On l'appelle le Top 500. 383 00:21:53,980 --> 00:21:56,420 Ils prennent le haut du les 500 meilleurs ordinateurs 384 00:21:56,420 --> 00:21:58,610 sur la planète qui peut matrices diagonaliser. 385 00:21:58,610 --> 00:22:00,760 Et vous obtenez des résultats étonnants. 386 00:22:00,760 --> 00:22:04,660 >> Un grand nombre de ces machines sont entre 10 et 20 mégawatts. 387 00:22:04,660 --> 00:22:09,380 Ils peuvent matrices diagonaliser démesurément rapidement. 388 00:22:09,380 --> 00:22:13,550 Ils ne ont pas nécessairement diagonalisés le plus efficacement par watt, 389 00:22:13,550 --> 00:22:18,060 donc il y avait cette grande poussée à regarder quelle liste verte 500 ressemblerait. 390 00:22:18,060 --> 00:22:20,360 Et voici la liste de Juin. 391 00:22:20,360 --> 00:22:22,410 Il devrait y avoir un nouveau très prochainement. 392 00:22:22,410 --> 00:22:26,590 >> Et il appelle out-- Je vais prendre en haut de cette liste particulière. 393 00:22:26,590 --> 00:22:32,187 Il ya deux une machines-- spécifique de l'Institut de Technologie de Tokyo 394 00:22:32,187 --> 00:22:34,520 et une de Cambridge Université au Royaume-Uni. 395 00:22:34,520 --> 00:22:37,700 Et ceux-ci ont assez stupéfiante méga flops ratios par watt. 396 00:22:37,700 --> 00:22:42,620 Celui-ci est 4389, et la prochaine bas est 3631. 397 00:22:42,620 --> 00:22:47,660 >> Je vais vous expliquer la différence entre ces deux, dans la diapositive suivante. 398 00:22:47,660 --> 00:22:51,320 Mais ce sont ceux-ci sont modérément taille des clusters de test. 399 00:22:51,320 --> 00:22:54,732 Ce ne sont que 34 kilowatts ou 52 kilowatts. 400 00:22:54,732 --> 00:22:56,940 Il ya quelques plus grands ici-- ce cas particulier 401 00:22:56,940 --> 00:22:58,860 à la nationale suisse Centre de superinformatique. 402 00:22:58,860 --> 00:23:00,693 Le message à retenir Car ce est ce que nous sommes 403 00:23:00,693 --> 00:23:04,270 en essayant de trouver des ordinateurs qui peut fonctionner efficacement. 404 00:23:04,270 --> 00:23:09,860 >> Et donc, regardons ce top une, affectueusement appelé, le KFC. 405 00:23:09,860 --> 00:23:12,960 Et un peu de la publicité ici. 406 00:23:12,960 --> 00:23:15,730 Cette entreprise alimentaire particulier n'a rien à voir avec cela. 407 00:23:15,730 --> 00:23:18,240 Ce est le fait que ce système particulier 408 00:23:18,240 --> 00:23:23,830 est trempé dans un très composé à base d'huile intelligent. 409 00:23:23,830 --> 00:23:27,590 Et ils ont obtenu leur friteuse de poulet surnom 410 00:23:27,590 --> 00:23:30,040 quand ils ont commencé à construire ces types de systèmes. 411 00:23:30,040 --> 00:23:32,740 >> Mais fondamentalement, ce qu'ils ont prises ici, ce est un certain nombre de pales, 412 00:23:32,740 --> 00:23:37,560 les mettre dans ce l'huile minérale sophistiqué, 413 00:23:37,560 --> 00:23:40,979 puis travaillé sur la façon d'obtenir tous la mise en réseau dans et hors de celui-ci. 414 00:23:40,979 --> 00:23:42,895 Alors, non seulement cela, ils ont mis à l'extérieur afin 415 00:23:42,895 --> 00:23:46,095 qu'elle peut exploiter le refroidissement de l'air extérieur. 416 00:23:46,095 --> 00:23:47,520 Ce était assez impressionnant. 417 00:23:47,520 --> 00:23:49,630 Donc, vous avez à faire tout de cette manigances 418 00:23:49,630 --> 00:23:53,280 pour être en mesure d'obtenir cette quantité de compute livré pour petite puissance. 419 00:23:53,280 --> 00:23:57,360 >> Et vous pouvez voir que ce est la forme d'où les choses se dirigent. 420 00:23:57,360 --> 00:24:01,240 Le défi est que l'air régulière refroidissement est l'économie d'échelle 421 00:24:01,240 --> 00:24:08,459 et est au volant d'une grande partie de la développement de l'informatique à la fois régulière, 422 00:24:08,459 --> 00:24:09,750 et l'informatique haute performance. 423 00:24:09,750 --> 00:24:11,080 Donc, ce est assez perturbant. 424 00:24:11,080 --> 00:24:13,280 Je pense que ce est fascinant. 425 00:24:13,280 --> 00:24:15,530 Ce est un peu brouillon lorsque vous essayer d'échanger les disques durs, 426 00:24:15,530 --> 00:24:18,090 mais ce est une idée vraiment cool. 427 00:24:18,090 --> 00:24:22,200 >> Ainsi, non seulement cela, il ya tout un tas de travail 428 00:24:22,200 --> 00:24:25,450 étant construit autour de ce que nous sommes appelant le projet Open Compute. 429 00:24:25,450 --> 00:24:29,400 Et donc, plus à ce sujet un peu plus tard. 430 00:24:29,400 --> 00:24:32,740 Mais l'industrie de commencer à se rendre compte que les FLOPs par watt 431 00:24:32,740 --> 00:24:33,670 devient importante. 432 00:24:33,670 --> 00:24:39,256 Et vous, que les gens ici, comme vous concevez vos algorithmes 433 00:24:39,256 --> 00:24:41,130 et vous concevez votre code, vous devez être conscient 434 00:24:41,130 --> 00:24:43,620 que votre code peut avoir un effet d'entraînement. 435 00:24:43,620 --> 00:24:48,380 >> Lorsque Mark était assis ici dans son dortoir salle écrit Facebook 1.0, 436 00:24:48,380 --> 00:24:51,050 Je suis assez sûr qu'il avait une vue qu'il allait être énorme. 437 00:24:51,050 --> 00:24:54,945 Mais comment énorme ce serait sur la environnement est un grand dealio. 438 00:24:54,945 --> 00:24:58,340 Et ainsi tous YA'LL pourrait venir avec des algorithmes 439 00:24:58,340 --> 00:25:01,370 qui pourrait être le prochain défi chose pour les gens comme moi, 440 00:25:01,370 --> 00:25:02,700 essayer d'exécuter plusieurs systèmes. 441 00:25:02,700 --> 00:25:07,360 >> Alors disons simplement penser à limites de puissance du monde réel. 442 00:25:07,360 --> 00:25:09,930 Ce document de Landauer-- ne est pas une chose nouvelle. 443 00:25:09,930 --> 00:25:12,480 1961 a été publié ce IBM dans le Journal. 444 00:25:12,480 --> 00:25:15,590 Ce est le canonique "Irréversibilité et de chaleur 445 00:25:15,590 --> 00:25:17,630 Génération dans le processus de calcul ". 446 00:25:17,630 --> 00:25:22,050 Et il a fait valoir que machines inévitablement 447 00:25:22,050 --> 00:25:25,070 exécuter des fonctions logistiques ne ont pas inverse à valeur unique. 448 00:25:25,070 --> 00:25:29,130 >> De sorte que la partie entière de ce ne est que de retour dans les années 60, 449 00:25:29,130 --> 00:25:31,890 les gens savaient que ce était va être un problème. 450 00:25:31,890 --> 00:25:37,080 Et si la loi de limites dit 25 ° C, une sorte de chambre canonique 451 00:25:37,080 --> 00:25:41,120 la température, la limite représente 0,1 électronvolts. 452 00:25:41,120 --> 00:25:44,920 Mais en théorie, ce est la mémoire théorie, ordinateur, 453 00:25:44,920 --> 00:25:51,410 fonctionnant à cette limite pourrait être changé à un milliard de bits par seconde. 454 00:25:51,410 --> 00:25:54,620 >> Je ne sais pas pour vous, mais pas rencontré beaucoup de un milliard de bits 455 00:25:54,620 --> 00:25:57,190 un deuxième échanges de débit de données. 456 00:25:57,190 --> 00:26:01,360 L'argument était que seule 2,8 trillions d'un watt de puissance 457 00:26:01,360 --> 00:26:03,180 devrait jamais être élargi. 458 00:26:03,180 --> 00:26:08,160 >> Tous droits, monde réel example-- ce est ma facture d'électricité. 459 00:26:08,160 --> 00:26:10,347 Je suis 65% pour cent des ce beau centre de données 460 00:26:10,347 --> 00:26:11,930 Je vous ai montré, dans ce moment particulier. 461 00:26:11,930 --> 00:26:15,520 Ce est de retour en Juin l'année dernière. 462 00:26:15,520 --> 00:26:21,300 Je ai pris une ancienne version afin que nous peut et sorte d'anonymiser un peu. 463 00:26:21,300 --> 00:26:25,470 Je passais un $ 45,000 mois pour l'énergie là. 464 00:26:25,470 --> 00:26:34,990 >> Donc, la raison d'être là, ce est que nous avoir plus de 50 000 processus dans la chambre. 465 00:26:34,990 --> 00:26:38,110 Pourriez-vous imaginer votre propre résidentiel facture d'électricité 466 00:26:38,110 --> 00:26:39,540 étant que élevé? 467 00:26:39,540 --> 00:26:46,180 Mais ce était pour une 199000000 watt heure plus d'un mois. 468 00:26:46,180 --> 00:26:51,670 >> Donc, la question que je pose est, pouvez-vous imaginer facture d'électricité de M. Zuckerberg? 469 00:26:51,670 --> 00:26:54,730 Le mien est assez grand, et je lutte. 470 00:26:54,730 --> 00:26:56,600 Et je ne suis pas seul dans ce est. 471 00:26:56,600 --> 00:26:59,450 Il ya beaucoup de personnes avec les grands centres de données. 472 00:26:59,450 --> 00:27:04,800 Et donc, je suppose, disclosure-- complète mes amis Facebook un peu bizarre. 473 00:27:04,800 --> 00:27:07,900 >> Donc, mon ami Facebook est le centre de données de Prineville, 474 00:27:07,900 --> 00:27:14,030 qui est l'un des plus grand Facebook, plus récent, le plus bas Centre de données énergétiques. 475 00:27:14,030 --> 00:27:19,360 Et ils postent à moi, des choses comme puissance l'efficacité de l'utilisation, 476 00:27:19,360 --> 00:27:24,020 comme dans quelle est l'efficacité des données centre par rapport combien d'énergie vous êtes 477 00:27:24,020 --> 00:27:26,370 la mise en, combien eau utilisent-ils, ce est 478 00:27:26,370 --> 00:27:27,810 l'humidité et la température. 479 00:27:27,810 --> 00:27:29,980 >> Et ils ont ces belles, belles parcelles. 480 00:27:29,980 --> 00:27:32,600 Je pense que ce est un page Facebook génial, 481 00:27:32,600 --> 00:27:35,400 mais je suppose que je suis un peu bizarre. 482 00:27:35,400 --> 00:27:39,930 >> Donc, une chose plus de puissance, la recherche informatique que je fais 483 00:27:39,930 --> 00:27:44,060 est significativement différent de ce que Facebook et Yahoo et Google 484 00:27:44,060 --> 00:27:50,020 et d'autre à la demande, entièrement, services toujours disponibles. 485 00:27:50,020 --> 00:27:53,530 Et donc je ai l'avantage que lorsque ISO New England-- et ISO New England 486 00:27:53,530 --> 00:27:58,910 aide à établir l'énergie taux pour la région. 487 00:27:58,910 --> 00:28:01,110 >> Et il dit que ce est l'extension une demande pour les consommateurs 488 00:28:01,110 --> 00:28:05,870 à conserver volontairement haute énergie, raison de la forte chaleur et l'humidité. 489 00:28:05,870 --> 00:28:08,680 Et ce était de retour le 18 Juillet. 490 00:28:08,680 --> 00:28:12,600 Et donc je Tweet heureux retour, Hey, ISO New England, Vert Harvard. 491 00:28:12,600 --> 00:28:14,880 Nous faisons notre part plus ici dans la recherche informatique. 492 00:28:14,880 --> 00:28:16,760 Et ce est parce que nous faisons la science. 493 00:28:16,760 --> 00:28:20,380 >> Et autant que les gens disent la science ne dort jamais, la science peut attendre. 494 00:28:20,380 --> 00:28:25,030 Donc, nous sommes en mesure de mettre au repos notre systèmes, profiter de taux de qualité 495 00:28:25,030 --> 00:28:30,550 sur notre facture d'énergie, et aide dans tout le New England 496 00:28:30,550 --> 00:28:35,910 région en versant de nombreux mégawatts d'charge. 497 00:28:35,910 --> 00:28:40,020 Donc, ce est la chose unique qui diffère sur les données de calcul scientifique 498 00:28:40,020 --> 00:28:48,890 centres et ceux qui sont en pleine production 24/7. 499 00:28:48,890 --> 00:28:51,670 >> Donc, nous allons juste prendre un autre engrenage ici. 500 00:28:51,670 --> 00:28:55,170 Donc, je veux discuter chaos un peu. 501 00:28:55,170 --> 00:28:59,900 Et je veux le mettre dans les auspices de rangement. 502 00:28:59,900 --> 00:29:03,150 Donc, pour ceux de ce genre des luttaient 503 00:29:03,150 --> 00:29:08,680 obtenir leur tête autour de ce pétaoctets du stockage ressembler, ce un exemple. 504 00:29:08,680 --> 00:29:11,660 Et ce est le genre de choses Je me occupe de tout le temps. 505 00:29:11,660 --> 00:29:15,550 >> Chacun de ces petits gars est un disque dur de quatre téraoctets, 506 00:29:15,550 --> 00:29:17,420 de sorte que vous pouvez sorte de les compter. 507 00:29:17,420 --> 00:29:21,370 Nous obtenons maintenant entre une à une et 1/2 pétaoctets 508 00:29:21,370 --> 00:29:22,970 dans un rack standard de l'industrie. 509 00:29:22,970 --> 00:29:26,430 Et nous avons des chambres et des salles, comme vous vu dans cette image plus tôt avec John 510 00:29:26,430 --> 00:29:31,230 et moi, pleine de ces racks d'équipements. 511 00:29:31,230 --> 00:29:40,400 Ainsi, il devient très, très facile de construire des baies de stockage massives 512 00:29:40,400 --> 00:29:44,140 >> Ce est surtout facile à l'intérieur d'Unix type de compte jusqu'à la façon dont les choses vont. 513 00:29:44,140 --> 00:29:48,270 Donc, ce est compter combien de Les points ont MAU je suis arrivé. 514 00:29:48,270 --> 00:29:50,880 Donc, ce est 423 points d'interception. 515 00:29:50,880 --> 00:29:55,660 Et puis si je cours un peu sommaire awk, je peut ajouter jusqu'à, dans ce système particulier, 516 00:29:55,660 --> 00:29:59,080 il y avait 7,3 pétaoctets de stockage disponible. 517 00:29:59,080 --> 00:30:01,350 >> Donc, ce est beaucoup de choses. 518 00:30:01,350 --> 00:30:03,030 Et le stockage est vraiment difficile. 519 00:30:03,030 --> 00:30:06,850 Et pourtant, pour une raison quelconque, ce est une tendance de l'industrie. 520 00:30:06,850 --> 00:30:11,500 Chaque fois que je parle à nos chercheurs et notre corps professoral et dire, 521 00:30:11,500 --> 00:30:14,180 hey, je peux courir stockage pour vous. 522 00:30:14,180 --> 00:30:17,690 Malheureusement, je dois recouvrer le coût de l'entreposage. 523 00:30:17,690 --> 00:30:19,430 Je reçois cette entreprise. 524 00:30:19,430 --> 00:30:23,300 Et les gens de référence Newegg ou ils font référence Staples 525 00:30:23,300 --> 00:30:27,040 ou combien ils peuvent acheter un seul disque dur téraoctet pour. 526 00:30:27,040 --> 00:30:29,390 >> Donc, vous noterez ici, qu'il ya un indice. 527 00:30:29,390 --> 00:30:31,310 Il ya un lecteur de disque ici. 528 00:30:31,310 --> 00:30:33,290 Et si nous revenons, je en ai beaucoup. 529 00:30:33,290 --> 00:30:36,130 Non seulement je ai beaucoup, je ai interconnexions sophistiqués 530 00:30:36,130 --> 00:30:38,750 pour pouvoir piquer ces choses ensemble. 531 00:30:38,750 --> 00:30:44,080 Ainsi, le risque associé à ces grands Les baies de stockage ne est pas négligeable. 532 00:30:44,080 --> 00:30:46,370 >> En fait, nous avons pris la Internet et nous avons écrit 533 00:30:46,370 --> 00:30:51,670 une petite histoire sur un bien-sens, directeur manières douces de la recherche 534 00:30:51,670 --> 00:30:54,640 computing-- arrive à avoir une étrange Anglais accent-- essayer 535 00:30:54,640 --> 00:30:59,930 d'expliquer à un chercheur ce que le aucun dossier de sauvegarde de soulignement fait 536 00:30:59,930 --> 00:31:01,070 signifié. 537 00:31:01,070 --> 00:31:05,690 Ce était un long, très petite histoire, quatre bonnes minutes de découverte. 538 00:31:05,690 --> 00:31:09,380 >> Et note, je ai une terrible beaucoup moins d'espace que la dame 539 00:31:09,380 --> 00:31:11,800 qui chante à propos de toutes les basses. 540 00:31:11,800 --> 00:31:13,910 Nous sommes tout à fait quelques comptes inférieure. 541 00:31:13,910 --> 00:31:16,160 Mais de toute façon, ce est un chose importante à penser, 542 00:31:16,160 --> 00:31:18,532 en termes de ce qui pourrait aller mal. 543 00:31:18,532 --> 00:31:20,990 Donc, si je reçois un lecteur de disque, et Je le jette dans une machine Unix, 544 00:31:20,990 --> 00:31:24,300 et je commence à écrire des choses à elle, il ya un aimant, il ya une tête d'entraînement, 545 00:31:24,300 --> 00:31:30,150 il ya apparemment, un un ou un zéro étant écrit sur ce périphérique. 546 00:31:30,150 --> 00:31:32,180 >> Spinny Motors--, twirly les choses se cassent toujours. 547 00:31:32,180 --> 00:31:33,490 Pensez à des choses qui se brisent. 548 00:31:33,490 --> 00:31:35,170 Il a toujours été spinny, twirly choses. 549 00:31:35,170 --> 00:31:38,560 Imprimantes, disques durs, les véhicules à moteur, etc. 550 00:31:38,560 --> 00:31:40,590 Tout ce qui bouge est susceptible de se briser. 551 00:31:40,590 --> 00:31:42,575 >> Donc, vous devez moteurs, vous besoin de conduire firmware, 552 00:31:42,575 --> 00:31:47,110 vous devez SAS / SATA contrôleurs, fils, microprogramme sur les contrôleurs SAS / SATA, 553 00:31:47,110 --> 00:31:48,530 faible blocs de niveau. 554 00:31:48,530 --> 00:31:54,580 Choisissez votre fichier de contrôleur de stockage code du système, quel qu'il soit, 555 00:31:54,580 --> 00:31:56,780 comment vous assemblez des choses ensemble. 556 00:31:56,780 --> 00:32:00,956 Et votre gestionnaire de mémoire virtuelle pages, DRAM se vendent et magasins. 557 00:32:00,956 --> 00:32:02,705 Ensuite, vous obtenez un autre pile, qui est une sorte 558 00:32:02,705 --> 00:32:05,440 de la liste sur ce une, les algorithmes, les utilisateurs. 559 00:32:05,440 --> 00:32:09,050 >> Et si vous multipliez ce , je ne sais pas combien, 560 00:32:09,050 --> 00:32:11,640 il ya beaucoup d'endroits où des choses peuvent déraper. 561 00:32:11,640 --> 00:32:14,430 Je veux dire, ce est un exemple sur les mathématiques. 562 00:32:14,430 --> 00:32:18,070 Mais ce est assez amusant de penser combien de façons les choses pourraient aller mal, 563 00:32:18,070 --> 00:32:21,650 juste pour un lecteur de disque. 564 00:32:21,650 --> 00:32:25,440 Nous sommes déjà à 300 pétaoctets, de sorte imaginer le nombre de lecteurs de disques 565 00:32:25,440 --> 00:32:27,741 vous avez besoin à 300 pétaoctets qui peut aller mal. 566 00:32:27,741 --> 00:32:28,240 567 00:32:28,240 --> 00:32:30,390 Non seulement that-- sorte que ce est le stockage. 568 00:32:30,390 --> 00:32:34,220 Et qui fait allusion à la personne que je aimerais voir 569 00:32:34,220 --> 00:32:38,780 entrer dans la phase gauche, qui est le Chaos Monkey. 570 00:32:38,780 --> 00:32:43,140 Donc, à un certain point, il devient encore juste plus grand que le disque 571 00:32:43,140 --> 00:32:43,920 problème. 572 00:32:43,920 --> 00:32:50,610 >> Et donc, ces belles dames et messieurs qui exécutent un service de vidéo en streaming 573 00:32:50,610 --> 00:32:55,430 réalisé que leurs ordinateurs étaient aussi énorme et aussi très compliquée 574 00:32:55,430 --> 00:33:00,010 et également fournir un service à une terrible beaucoup de gens. 575 00:33:00,010 --> 00:33:05,180 Ils ont 37 millions de Membre, à et peut-être une année de cette diapositive ou alors old-- 576 00:33:05,180 --> 00:33:07,350 des milliers de dispositifs. 577 00:33:07,350 --> 00:33:10,810 Il ya des milliards d'heures de vidéo. 578 00:33:10,810 --> 00:33:13,600 Ils se connectent milliards d'événements par jour. 579 00:33:13,600 --> 00:33:17,330 >> Et vous pouvez le voir, la plupart des gens regardent la télé plus tard dans la soirée, 580 00:33:17,330 --> 00:33:19,429 et il dépasse de loin tout. 581 00:33:19,429 --> 00:33:21,220 Et donc, ils voulaient être en mesure de se assurer 582 00:33:21,220 --> 00:33:24,854 que le service était et fiable et de travailler pour eux. 583 00:33:24,854 --> 00:33:27,020 Donc, ils sont venus avec cette chose appelée Chaos Monkey. 584 00:33:27,020 --> 00:33:29,000 Ce est morceau de logiciel qui, quand vous pensez 585 00:33:29,000 --> 00:33:34,190 de parler sur le titre de l'ensemble de cette présentation, 586 00:33:34,190 --> 00:33:36,530 scale-out signifie que vous devrait tester ce genre de choses. 587 00:33:36,530 --> 00:33:38,585 Il ne est pas bon d'avoir simplement un million de machines. 588 00:33:38,585 --> 00:33:40,460 Donc, la bonne chose à propos ce est, Chaos Monkey 589 00:33:40,460 --> 00:33:43,090 est un service qui identifie des groupes de systèmes 590 00:33:43,090 --> 00:33:47,220 et une se termine au hasard des systèmes dans un groupe. 591 00:33:47,220 --> 00:33:48,429 Impressionnant. 592 00:33:48,429 --> 00:33:50,220 Donc, je ne sais pas vous, mais si je ai jamais 593 00:33:50,220 --> 00:33:52,990 construit un système qui se appuie sur d'autres systèmes parler les uns aux autres, 594 00:33:52,990 --> 00:33:55,865 vous prenez l'un d'eux sur le la probabilité de la chose entière travail, 595 00:33:55,865 --> 00:33:57,130 diminue rapidement. 596 00:33:57,130 --> 00:34:00,475 >> Et donc ce morceau de logiciel fonctionne autour de l'infrastructure de Netflix. 597 00:34:00,475 --> 00:34:03,100 Heureusement, il dit qu'il ne fonctionne que dans heures d'affaires avec l'intention 598 00:34:03,100 --> 00:34:05,810 que les ingénieurs seront alerte et capable de répondre. 599 00:34:05,810 --> 00:34:08,020 Ce sont donc les types des choses que nous sommes maintenant 600 00:34:08,020 --> 00:34:13,360 avoir à faire pour perturber notre informatique environnements, pour introduire le chaos 601 00:34:13,360 --> 00:34:15,739 et d'introduire la complexité. 602 00:34:15,739 --> 00:34:19,139 >> Alors, qui, dans leur droit l'esprit, serait volontiers choisir 603 00:34:19,139 --> 00:34:22,540 de travailler avec un Chaos Monkey? 604 00:34:22,540 --> 00:34:24,150 Accrochez-vous, il semble me pointage. 605 00:34:24,150 --> 00:34:28,719 Eh bien, je suppose que je devrait: mignon. 606 00:34:28,719 --> 00:34:32,909 Mais le problème est que vous ne prenez pas le choix. 607 00:34:32,909 --> 00:34:37,440 Le Chaos Monkey, que vous peut voir, vous choisit. 608 00:34:37,440 --> 00:34:42,650 >> Et ce est le problème avec l'informatique à l'échelle, ce est que vous ne pouvez pas éviter cela. 609 00:34:42,650 --> 00:34:49,989 Ce est une fatalité de complexité et de l'échelle et de notre évolution, 610 00:34:49,989 --> 00:34:53,280 à certains égards, d'expertise informatique. 611 00:34:53,280 --> 00:34:55,510 Et rappelez-vous, ce est Une chose à retenir, 612 00:34:55,510 --> 00:35:00,030 Chaos Monkeys amour flocons de neige d'amour snowflakes--. 613 00:35:00,030 --> 00:35:03,470 Un snowflake-- nous avons expliqué la Chaos Monkey-- mais un flocon de neige 614 00:35:03,470 --> 00:35:09,630 est un serveur qui est unique et spéciale et délicate et individuel 615 00:35:09,630 --> 00:35:11,770 et ne sera jamais reproduit. 616 00:35:11,770 --> 00:35:14,790 >> Nous constatons souvent flocon de neige service dans notre environnement. 617 00:35:14,790 --> 00:35:16,700 Et nous essayons toujours et fondre service de flocon de neige. 618 00:35:16,700 --> 00:35:18,880 Mais si vous trouvez un serveur dans votre environnement 619 00:35:18,880 --> 00:35:23,240 ce est essentiel pour la longévité de votre organisation et il fond, 620 00:35:23,240 --> 00:35:25,300 vous ne pouvez pas le remettre à nouveau ensemble. 621 00:35:25,300 --> 00:35:28,071 Donc, le travail de Chaos Monkey était de aller fin instances. 622 00:35:28,071 --> 00:35:30,820 Si le Chaos Monkey fondre la flocon de neige, vous êtes plus, vous avez terminé. 623 00:35:30,820 --> 00:35:34,390 624 00:35:34,390 --> 00:35:37,950 Je veux parler certains matériels que nous sommes 625 00:35:37,950 --> 00:35:40,415 voir en termes de genre de Scale-Out activités aussi. 626 00:35:40,415 --> 00:35:43,810 Et certaines choses uniques qui sont en et autour de l'activité scientifique. 627 00:35:43,810 --> 00:35:46,990 Nous commençons maintenant à voir, souvenons cette unité d'émission, ce rack? 628 00:35:46,990 --> 00:35:51,780 Donc, ce est un rack de GPGPUs-- si générale usage des unités de traitement graphique. 629 00:35:51,780 --> 00:35:55,790 >> Nous avons ces situé dans nos données centre, quelque 100 miles de là. 630 00:35:55,790 --> 00:35:59,780 Ce rack particulier est d'environ 96 tera FLOPS 631 00:35:59,780 --> 00:36:04,090 de simple précision mathématiques mesure pour offrir à l'arrière de celui-ci. 632 00:36:04,090 --> 00:36:10,530 Et nous avons pour 130-odd cartes dans une instance 633 00:36:10,530 --> 00:36:16,620 que nous-- multiples racks de cette instance. 634 00:36:16,620 --> 00:36:22,730 >> Donc, ce qui est intéressant en ce sens que les processus usage général graphiques 635 00:36:22,730 --> 00:36:27,880 sont en mesure de faire des mathématiques incroyablement rapidement de très faibles quantités d'énergie. 636 00:36:27,880 --> 00:36:32,060 Donc, il ya une grande remontée dans les domaines du calcul scientifique, 637 00:36:32,060 --> 00:36:36,400 regardant graphiques unités de traitement dans une grande manière. 638 00:36:36,400 --> 00:36:41,990 >> Alors je ai couru un peu mcollective Grâce à notre infrastructure de marionnettes 639 00:36:41,990 --> 00:36:45,330 hier, très excité à ce sujet. 640 00:36:45,330 --> 00:36:48,260 un peu moins d'un pétaflop de simple précision. 641 00:36:48,260 --> 00:36:52,440 Juste pour être clair ici, ce peu multiplicateur est 3,95. 642 00:36:52,440 --> 00:36:54,820 Double précision mathématiques serait d'environ 1,2, 643 00:36:54,820 --> 00:36:57,010 mais mon flux Twitter regardé beaucoup mieux si je 644 00:36:57,010 --> 00:37:02,670 dit que nous avions presque un pétaflop de simple précision GPGPU. 645 00:37:02,670 --> 00:37:04,220 >> Mais il se fait là-bas. 646 00:37:04,220 --> 00:37:06,280 Il est en train de devenir très, très impressionnant. 647 00:37:06,280 --> 00:37:08,550 Et pourquoi faisons-nous cela? 648 00:37:08,550 --> 00:37:11,570 Parce que la chimie quantique, entre autres, 649 00:37:11,570 --> 00:37:15,300 mais nous commençons à concevoir certains nouveaux photovoltaïque. 650 00:37:15,300 --> 00:37:20,210 >> Et Alan Aspuru-Guzik, qui est un professeur au chemistry-- mon partenaire 651 00:37:20,210 --> 00:37:22,390 dans crime-- pour les quelques dernières années. 652 00:37:22,390 --> 00:37:25,660 Nous avons fracassé les enveloppe sur l'informatique. 653 00:37:25,660 --> 00:37:30,250 Et le GPGPU optimal la technologie pour être capable de faire 654 00:37:30,250 --> 00:37:34,760 énormément compliqué mathématiques, très, très rapidement. 655 00:37:34,760 --> 00:37:36,750 >> Donc, avec échelle, vient de nouveaux défis. 656 00:37:36,750 --> 00:37:41,070 Si énorme échelle et où vous devez être attention comment vous reliez ce genre de choses. 657 00:37:41,070 --> 00:37:45,300 Et nous avons certains niveaux de trouble obsessionnel compulsif. 658 00:37:45,300 --> 00:37:49,530 Ces images probablement conduire un grand nombre de personnes écrous. 659 00:37:49,530 --> 00:37:53,390 Et armoires qui ne sont pas câblé particulièrement bien 660 00:37:53,390 --> 00:37:56,050 conduire notre réseau et ingénieurs Installations noix. 661 00:37:56,050 --> 00:37:58,620 Plus il ya aussi la circulation d'air questions que vous avez à contenir. 662 00:37:58,620 --> 00:38:01,430 >> Donc, ce sont des choses que je ne aurait jamais pensé. 663 00:38:01,430 --> 00:38:03,480 Avec échelle, vient plus de complexité. 664 00:38:03,480 --> 00:38:05,869 Ce est un nouveau type de système de fichiers. 665 00:38:05,869 --> 00:38:06,410 Ce est génial. 666 00:38:06,410 --> 00:38:07,660 Ce est un pétaoctet. 667 00:38:07,660 --> 00:38:09,905 Il peut stocker 1,1 milliards fichiers. 668 00:38:09,905 --> 00:38:15,940 Il peut lire et écrire à 13 gigaoctets et 20 gigaoctets un gigaoctets second-- 669 00:38:15,940 --> 00:38:17,150 une seconde. 670 00:38:17,150 --> 00:38:20,900 Ainsi, il peut décharger téraoctets en peu de temps du tout. 671 00:38:20,900 --> 00:38:22,070 >> Et il est très disponible. 672 00:38:22,070 --> 00:38:26,989 Et il possède recherche étonnante rates-- 220 000 recherches d'une seconde. 673 00:38:26,989 --> 00:38:29,780 Et il ya beaucoup de personnes différentes la construction de ce genre de systèmes. 674 00:38:29,780 --> 00:38:32,830 Et vous pouvez le voir ici graphiquement. 675 00:38:32,830 --> 00:38:35,800 Ce est l'un de nos systèmes de fichiers ce est sous charge, bien 676 00:38:35,800 --> 00:38:41,250 lecture joyeusement à un peu moins de 22 gigaoctets par seconde. 677 00:38:41,250 --> 00:38:42,790 Donc, ce est donc cool-- complexité. 678 00:38:42,790 --> 00:38:47,230 >> Donc, avec la complexité et l'échelle, vient plus de complexité, non? 679 00:38:47,230 --> 00:38:51,830 Ce est un de nos nombreux, de nombreux diagrammes de réseau, 680 00:38:51,830 --> 00:38:54,970 où vous avez beaucoup de différents châssis entièrement en charge jusqu'à 681 00:38:54,970 --> 00:38:57,730 dans un commutateur de noyau principal, relié à l'entreposage, 682 00:38:57,730 --> 00:39:00,731 la connexion à des interconnexions à faible latence. 683 00:39:00,731 --> 00:39:03,605 Et puis tout de ce côté de la maison, est juste tout de la gestion 684 00:39:03,605 --> 00:39:09,740 que vous devez être en mesure de répondre ces systèmes à partir d'un emplacement distant. 685 00:39:09,740 --> 00:39:12,070 Donc échelle a beaucoup de la complexité avec elle. 686 00:39:12,070 --> 00:39:14,910 687 00:39:14,910 --> 00:39:17,785 >> Changez nouveau engrenage, revenons et avoir un petit coin de la science. 688 00:39:17,785 --> 00:39:21,450 Alors, ne oubliez pas, la recherche informatique et ce petit shim-- 689 00:39:21,450 --> 00:39:25,310 petite cale rose entre le les professeurs et l'ensemble de leurs algorithmes 690 00:39:25,310 --> 00:39:30,650 et tous les scientifiques et tous frais ce centre d'alimentation et de refroidissement et des données 691 00:39:30,650 --> 00:39:35,330 de-chaussée et la mise en réseau et de gros ordinateurs et un bureau de services et services d'assistance 692 00:39:35,330 --> 00:39:39,330 et ainsi de forth-- et ainsi, nous sommes juste cette petite cale entre eux. 693 00:39:39,330 --> 00:39:42,820 >> Ce que nous avons commencé à Voir, ce est que le monde de 694 00:39:42,820 --> 00:39:45,730 été en mesure de construire ces grands centres de données 695 00:39:45,730 --> 00:39:48,020 et être en mesure de construire ces gros ordinateurs. 696 00:39:48,020 --> 00:39:49,420 Nous avons obtenu assez bon. 697 00:39:49,420 --> 00:39:53,600 Ce que nous ne sommes pas très bon, ce est ceci petite cale entre la recherche 698 00:39:53,600 --> 00:39:56,670 et le métal nu et la technologie. 699 00:39:56,670 --> 00:39:58,600 Et ce est dur. 700 00:39:58,600 --> 00:40:03,330 >> Et donc nous avons été en mesure d'embaucher les gens qui vivent dans ce monde. 701 00:40:03,330 --> 00:40:07,590 Et plus récemment, nous avons parlé au National Science Foundation et a dit, 702 00:40:07,590 --> 00:40:11,440 ce genre de choses de scale-out est grande, mais nous ne pouvons pas obtenir nos scientifiques 703 00:40:11,440 --> 00:40:13,690 sur ces grosses machines compliquées. 704 00:40:13,690 --> 00:40:16,040 Et donc, il ya eu une nombre de programmes différents 705 00:40:16,040 --> 00:40:20,100 où nous ne étions la plupart du temps préoccupé essayer 706 00:40:20,100 --> 00:40:22,800 pour voir si nous pouvions transformer l'infrastructure du campus. 707 00:40:22,800 --> 00:40:25,850 >> Il ya beaucoup de programmes autour des centres nationaux. 708 00:40:25,850 --> 00:40:28,300 Et donc, nous-mêmes, notre amis à Clemson, 709 00:40:28,300 --> 00:40:32,620 Université du Wisconsin Madison, Californie du Sud, l'Utah et Hawaï 710 00:40:32,620 --> 00:40:35,780 sorte de se associent pour examiner ce problème. 711 00:40:35,780 --> 00:40:39,340 Et ce petit graphique ici est la longue queue de la science. 712 00:40:39,340 --> 00:40:41,602 >> Donc, ce est-- ce ne est pas importe ce qu'il ya sur cet axe, 713 00:40:41,602 --> 00:40:45,485 mais cet axe est en fait le numéro des emplois en passant par le cluster. 714 00:40:45,485 --> 00:40:48,940 Donc, il ya 350 000 plus quelle que soit la période. 715 00:40:48,940 --> 00:40:51,730 Ce sont nos suspects habituels le long du fond ici. 716 00:40:51,730 --> 00:40:55,992 En fait, il ya Alan Aspuru-Guzik, Qui sommes-nous parlions justement about-- tonnes 717 00:40:55,992 --> 00:40:58,700 et des tonnes de calcul, vraiment efficace, sait ce qu'il fait. 718 00:40:58,700 --> 00:41:02,840 >> Voici un autre laboratoire que je vais parler à propos dans un laboratoire de John Kovac moment--. 719 00:41:02,840 --> 00:41:03,610 Ils l'ont. 720 00:41:03,610 --> 00:41:04,210 Ils sont bons. 721 00:41:04,210 --> 00:41:04,830 Ils sont heureux. 722 00:41:04,830 --> 00:41:05,960 Ils sont calcul. 723 00:41:05,960 --> 00:41:07,664 Grande science se fait. 724 00:41:07,664 --> 00:41:09,580 Et puis, comme vous le type de venir ici, il 725 00:41:09,580 --> 00:41:12,110 D'autres groupes que ne sont pas en cours d'exécution de nombreux emplois. 726 00:41:12,110 --> 00:41:13,410 >> Et pourquoi est-ce? 727 00:41:13,410 --> 00:41:15,080 Est-ce parce que le calcul est trop dur? 728 00:41:15,080 --> 00:41:19,580 Est-ce parce qu'ils ne savent pas comment? 729 00:41:19,580 --> 00:41:22,880 Nous ne savons pas, parce que nous sommes allés et avons regardé. 730 00:41:22,880 --> 00:41:25,620 Et ce est ce que cette projet est tout au sujet, 731 00:41:25,620 --> 00:41:27,830 est localement, à l'intérieur chacune de ces régions, 732 00:41:27,830 --> 00:41:32,660 de se tourner vers des avenues où nous pouvons nous engager avec le corps professoral et les chercheurs 733 00:41:32,660 --> 00:41:36,400 en fait dans l'extrémité inférieure de la queue, et de comprendre ce qu'ils font. 734 00:41:36,400 --> 00:41:37,920 >> Donc, ce est quelque chose que nous sommes effectivement passionné. 735 00:41:37,920 --> 00:41:39,920 Et ce est quelque chose qui la science ne va pas continuer 736 00:41:39,920 --> 00:41:44,260 à avancer jusqu'à ce que nous résolvons certains de ces cas de pointe. 737 00:41:44,260 --> 00:41:46,590 Les autres bits de la science cela va up-- tous 738 00:41:46,590 --> 00:41:48,260 vu le Grand collisionneur de hadrons. 739 00:41:48,260 --> 00:41:49,540 Impressionnant, non? 740 00:41:49,540 --> 00:41:52,960 Ce truc tout manqué à Holyoke. 741 00:41:52,960 --> 00:41:56,510 Nous built-- la première la science qui se est passé à Holyoke 742 00:41:56,510 --> 00:41:59,130 était la collaboration entre nous-mêmes et l'Université de Boston. 743 00:41:59,130 --> 00:42:01,510 Donc, ce est vraiment, vraiment cool. 744 00:42:01,510 --> 00:42:04,410 >> Ce est un morceau d'amusement de la science pour l'échelle. 745 00:42:04,410 --> 00:42:07,650 Il se agit d'un accès numérique à un ciel siècle à Harvard. 746 00:42:07,650 --> 00:42:09,170 Fondamentalement, ce est une archive de la plaque. 747 00:42:09,170 --> 00:42:13,350 Si vous descendez Oxford-- Garden Street, désolé, 748 00:42:13,350 --> 00:42:16,560 vous trouverez une de l'observatoire bâtiments est essentiellement complète 749 00:42:16,560 --> 00:42:19,480 d'environ un demi-million de plaques. 750 00:42:19,480 --> 00:42:24,410 >> Et ce sont des photos de la ciel la nuit, plus de 100 ans. 751 00:42:24,410 --> 00:42:28,760 Il ya donc toute une plate-forme mise en place ici pour numériser ces plaques, 752 00:42:28,760 --> 00:42:32,100 prendre des photos d'eux, inscrivez- eux, les mettent sur un ordinateur. 753 00:42:32,100 --> 00:42:36,410 Et ce est un pétaoctet et demi, juste une petite there-- projet. 754 00:42:36,410 --> 00:42:37,530 >> Ce sont d'autres projets. 755 00:42:37,530 --> 00:42:42,800 Ce projet Pan-STARRS fait une vaste enquête panoramique complète, 756 00:42:42,800 --> 00:42:47,390 la recherche d'astéroïdes proches de la Terre et événements célestes transitoires. 757 00:42:47,390 --> 00:42:52,100 Comme un biophysicien moléculaire, je aime le mot de l'événement céleste transitoire. 758 00:42:52,100 --> 00:42:55,050 Je ne suis pas sûr de ce qu'il est, mais de toute façon, nous sommes à la recherche pour eux. 759 00:42:55,050 --> 00:43:00,372 >> Et nous générons 30 téraoctets une nuit de ces télescopes. 760 00:43:00,372 --> 00:43:03,330 Et ce ne est pas vraiment une bande passante problème, ce est comme un problème FedEx. 761 00:43:03,330 --> 00:43:08,420 Si vous mettez le stockage sur la fourgonnette et vous envoyer quoi que ce soit. 762 00:43:08,420 --> 00:43:10,570 >> BICEP est vraiment interesting-- de sorte fond imagerie 763 00:43:10,570 --> 00:43:13,850 cosmique galactique polarisation supplémentaire. 764 00:43:13,850 --> 00:43:16,880 Quand je ai commencé à travailler à Harvard sept ou alors, 765 00:43:16,880 --> 00:43:21,440 il ya huit ans, je me souviens travailler sur ce projet 766 00:43:21,440 --> 00:43:26,010 et il n'a pas vraiment évier la maison comme à la lumière polarisée pourquoi 767 00:43:26,010 --> 00:43:29,770 du micro-ondes cosmiques fond serait important, 768 00:43:29,770 --> 00:43:30,800 jusqu'à ce que cela se est passé. 769 00:43:30,800 --> 00:43:34,580 >> Et ce était John Kovac, qui je ai parlé à avant, 770 00:43:34,580 --> 00:43:42,030 en utilisant des millions et des millions de CPU heure, dans notre usine et d'autres, 771 00:43:42,030 --> 00:43:46,600 pour regarder essentiellement à l'intérieur des premiers instants de l'univers 772 00:43:46,600 --> 00:43:49,150 après le Big Bang, et essayer de comprendre 773 00:43:49,150 --> 00:43:51,290 La théorie générale de la relativité d'Einstein. 774 00:43:51,290 --> 00:43:56,040 Ce est l'esprit souffle que nos ordinateurs nous aident à démêler And Stare 775 00:43:56,040 --> 00:43:59,280 dans les origines mêmes de la raison pour laquelle nous sommes ici. 776 00:43:59,280 --> 00:44:03,450 >> Donc, quand vous parlez de l'échelle, ce est une échelle grave. 777 00:44:03,450 --> 00:44:09,260 L'autre chose que de l'échelle, ce est que projet particulier frappé ces gars-là. 778 00:44:09,260 --> 00:44:15,320 Et ce est la courbe de réponse pour BICEP [Inaudible] Ce était notre petite enquête. 779 00:44:15,320 --> 00:44:19,220 >> Et vous pouvez le voir ici, la vie était bon jusqu'à environ ici, 780 00:44:19,220 --> 00:44:21,200 qui était quand le annonce a été faite. 781 00:44:21,200 --> 00:44:24,120 Et vous avez littéralement secondes pour répondre 782 00:44:24,120 --> 00:44:29,020 à l'événement de mise à l'échelle qui correspond à ce petit point ici, 783 00:44:29,020 --> 00:44:32,200 qui a fini par passer quatre ou plus téraoctets de données 784 00:44:32,200 --> 00:44:36,370 par l'intermédiaire du serveur Web que day-- assez velu. 785 00:44:36,370 --> 00:44:38,210 >> Et donc, ce sont les types de choses qui 786 00:44:38,210 --> 00:44:43,040 peut vous arriver dans votre infrastructure si vous ne concevez pas échelle. 787 00:44:43,040 --> 00:44:45,630 Nous avons eu un peu de brouiller ce jour-là, d'être 788 00:44:45,630 --> 00:44:50,440 capable de se étendre hors service web assez pour maintenir le site en place et le fonctionnement. 789 00:44:50,440 --> 00:44:53,399 Et nous avons réussi. 790 00:44:53,399 --> 00:44:55,190 Ce est un petit email ce est plutôt mignon. 791 00:44:55,190 --> 00:45:00,245 Ce est un mail à Mark Vogelsberger, et Lars Hernquist, qui est 792 00:45:00,245 --> 00:45:02,650 un membre du corps professoral ici à Harvard. 793 00:45:02,650 --> 00:45:03,570 Plus sur Mark tard. 794 00:45:03,570 --> 00:45:05,990 Mais je pense que ce est une genre de résume type 795 00:45:05,990 --> 00:45:09,920 où le calcul de est dans la recherche informatique. 796 00:45:09,920 --> 00:45:12,070 Hé, équipe, depuis la dernière Mardi, vous les gars accumulé 797 00:45:12,070 --> 00:45:15,470 plus de 28% de la nouvelle cluster, qui combinait 798 00:45:15,470 --> 00:45:20,040 est plus de 78 ans CPU en seulement trois jours. 799 00:45:20,040 --> 00:45:22,502 Et je ai dit, ce est toujours juste vendredi matin. 800 00:45:22,502 --> 00:45:23,460 Ce est assez impressionnant! 801 00:45:23,460 --> 00:45:24,740 Vendredi heureux! 802 00:45:24,740 --> 00:45:27,450 >> Puis je leur donne les points de données. 803 00:45:27,450 --> 00:45:30,260 Et donc ce était assez intéressant. 804 00:45:30,260 --> 00:45:34,840 Alors ne oubliez pas de Mark, il viendra retour dans l'image dans un peu. 805 00:45:34,840 --> 00:45:36,935 Donc informatique scale-out est partout. 806 00:45:36,935 --> 00:45:41,080 >> Nous sommes même aider les gens regardent comment les fonctions de la NBA, 807 00:45:41,080 --> 00:45:43,140 et où les gens sont lancer des balles à partir. 808 00:45:43,140 --> 00:45:47,580 Je ne comprends pas vraiment ce jeu trop bien, mais apparemment, ce est une grosse affaire. 809 00:45:47,580 --> 00:45:50,610 Il ya des cerceaux et des bols et de l'argent. 810 00:45:50,610 --> 00:45:55,300 >> Et donc, notre base de données, nous construit un petit 500 [inaudible] 811 00:45:55,300 --> 00:45:58,170 grappe de processeurs parallèles, quelques téraoctets de RAM, 812 00:45:58,170 --> 00:46:03,590 pour être en mesure de construire cette Kirk et son équipe. 813 00:46:03,590 --> 00:46:08,524 Et ils le font informatique dans une toute autre manière. 814 00:46:08,524 --> 00:46:10,440 Maintenant, ce est un projet que nous sommes impliqué ce est 815 00:46:10,440 --> 00:46:14,880 absolument fascinant, autour de neurones connectomique de plasticité et génomique 816 00:46:14,880 --> 00:46:20,960 imprinting-- trois très lourd zones frapper de recherche 817 00:46:20,960 --> 00:46:24,650 que nous nous battons avec le une base de jour en jour. 818 00:46:24,650 --> 00:46:30,670 L'idée que nos cerveaux sont sous le stress en plastique quand nous sommes jeunes. 819 00:46:30,670 --> 00:46:34,980 Et une grande partie de notre comportement adulte est sculpté par l'expérience dans l'enfance. 820 00:46:34,980 --> 00:46:37,040 Donc, ce est un grand dealio. 821 00:46:37,040 --> 00:46:41,360 >> Et donc ce est un travail qui est financé par le Instituts nationaux de la santé mentale. 822 00:46:41,360 --> 00:46:46,860 Et nous essayons de fond, par beaucoup de grandes quantités de données 823 00:46:46,860 --> 00:46:51,970 et grande analyse des données, type de scruter notre cerveau humain 824 00:46:51,970 --> 00:46:54,870 à travers une variété de différentes techniques. 825 00:46:54,870 --> 00:47:00,360 >> Donc, je voulais arrêter et le type de juste une pause pour un petit moment. 826 00:47:00,360 --> 00:47:04,160 Le défi avec télécommande centres de données est qu'il est loin. 827 00:47:04,160 --> 00:47:05,520 Ça ne peut pas travailler. 828 00:47:05,520 --> 00:47:07,590 Je ai besoin de mes données à proximité. 829 00:47:07,590 --> 00:47:10,730 Je ai besoin de faire mes recherches dans mon laboratoire. 830 00:47:10,730 --> 00:47:18,620 >> Et donc je ai pris un exemple de imagerie par résonance magnétique fonctionnelle 831 00:47:18,620 --> 00:47:22,260 ensemble de données à partir de nos données centre de Western Mass. 832 00:47:22,260 --> 00:47:24,660 et connecté à mon bureau à Cambridge. 833 00:47:24,660 --> 00:47:27,440 Et je vais jouer cette petite vidéo. 834 00:47:27,440 --> 00:47:29,750 Espérons que cela sorte de travailler. 835 00:47:29,750 --> 00:47:33,480 >> Donc, ce est me traverse vérifier mon GPU travaillent. 836 00:47:33,480 --> 00:47:35,430 Et je vérifie que la place de VNC. 837 00:47:35,430 --> 00:47:36,810 Et ce est un VNC intelligent. 838 00:47:36,810 --> 00:47:38,970 Il se agit d'un VNC avec des pièces en 3D. 839 00:47:38,970 --> 00:47:41,975 Et donc, comme vous pouvez le voir, cette ce est moi tourner autour de ce cerveau. 840 00:47:41,975 --> 00:47:44,460 Je essaie de sorte de l'obtenir orienté. 841 00:47:44,460 --> 00:47:49,574 Et puis je peux me déplacer à travers de nombreux différentes tranches de données d'IRM. 842 00:47:49,574 --> 00:47:51,490 Et la seule chose qui est différente de cette 843 00:47:51,490 --> 00:47:55,160 est, il vient sur le fil de Western Mass. à mon bureau. 844 00:47:55,160 --> 00:47:57,300 Et son rendu plus rapide que mon bureau, 845 00:47:57,300 --> 00:48:02,840 parce que je ne ai pas de $ 4000 carte graphique de mon ordinateur de bureau, ce qui 846 00:48:02,840 --> 00:48:04,262 nous avons sur Western Mass. 847 00:48:04,262 --> 00:48:05,720 Bien sûr, je essaie d'être intelligent. 848 00:48:05,720 --> 00:48:08,859 Je fais tourner les engrenages GLX dans le fond, tout en faisant tout cela, 849 00:48:08,859 --> 00:48:10,900 pour se assurer que je peux insister sur la carte graphique, 850 00:48:10,900 --> 00:48:14,140 et que tout type de fonctionne et tout le reste. 851 00:48:14,140 --> 00:48:16,700 Mais la chose importante est, est que ce est à 100 miles. 852 00:48:16,700 --> 00:48:20,460 Et vous pouvez voir que de cette il n'y a pas de latence évident. 853 00:48:20,460 --> 00:48:24,600 Les choses détenant ensemble assez bien. 854 00:48:24,600 --> 00:48:28,907 >> Et de sorte que, en soi, est un exemple et un aperçu 855 00:48:28,907 --> 00:48:31,490 comment l'informatique et scale-out informatique qui va se passer. 856 00:48:31,490 --> 00:48:35,330 Nous travaillons tous sur dispositifs plus en plus minces. 857 00:48:35,330 --> 00:48:36,870 Notre utilisation de comprimés est en augmentation. 858 00:48:36,870 --> 00:48:39,160 >> Ainsi donc, mon carbone empreinte est essentiellement 859 00:48:39,160 --> 00:48:42,060 passer de ce qui était autrefois faire aurais 860 00:48:42,060 --> 00:48:46,060 été une énorme machine sous mon bureau, à ce 861 00:48:46,060 --> 00:48:49,550 est maintenant un facility-- pourrait être ne importe où. 862 00:48:49,550 --> 00:48:50,800 Il pourrait être ne importe où. 863 00:48:50,800 --> 00:48:54,790 Et pourtant, il est toujours en mesure d'apporter dos graphiques haute performance 864 00:48:54,790 --> 00:48:56,630 à mon bureau. 865 00:48:56,630 --> 00:49:00,900 >> Donc, pour près de la end-- souvenir Mark? 866 00:49:00,900 --> 00:49:04,480 Eh bien, mon garçon intelligent est Mark. 867 00:49:04,480 --> 00:49:09,360 Il a décidé qu'il allait construire un univers virtuel réaliste. 868 00:49:09,360 --> 00:49:12,820 Ce est tout un projet, lorsque vous pensez que vous avez à la hauteur de cela. 869 00:49:12,820 --> 00:49:14,740 Je vais utiliser un ordinateur, et je vais 870 00:49:14,740 --> 00:49:21,040 pour modéliser les 12 millions d'années après le Big Bang pour représenter un jour. 871 00:49:21,040 --> 00:49:27,080 Et puis je vais faire 13,8 milliard d'années de l'évolution cosmique. 872 00:49:27,080 --> 00:49:28,270 Bien. 873 00:49:28,270 --> 00:49:30,970 >> Ceci utilise en fait un ordinateur l'était plus grande que notre ordinateur, 874 00:49:30,970 --> 00:49:35,040 et il a débordé sur la nationale les ressources à nos amis au Texas. 875 00:49:35,040 --> 00:49:38,820 Et pour les installations nationales, ce était beaucoup de calcul. 876 00:49:38,820 --> 00:49:40,750 Mais nous avons fait beaucoup de la simulation localement 877 00:49:40,750 --> 00:49:44,820 pour se assurer que le logiciel travaillées et les systèmes fonctionnaient. 878 00:49:44,820 --> 00:49:47,790 >> Et ce est des jours comme ça quand vous réalisez que vous soutenez la science 879 00:49:47,790 --> 00:49:51,090 à ce niveau de l'échelle, ce les gens peuvent maintenant dire des choses 880 00:49:51,090 --> 00:49:52,840 comme, je vais à un modèle un univers. 881 00:49:52,840 --> 00:49:54,145 Et ce est son premier modèle. 882 00:49:54,145 --> 00:49:56,422 Et ce est le premier modèle de son équipe. 883 00:49:56,422 --> 00:49:58,130 Il ya beaucoup d'autres les gens qui vont 884 00:49:58,130 --> 00:50:01,520 à venir derrière Mark, qui vont vouloir modéliser avec une haute résolution, 885 00:50:01,520 --> 00:50:04,652 avec plus de spécificité, avec plus de précision. 886 00:50:04,652 --> 00:50:09,105 >> Et donc, dans les deux dernières minutes, Je veux juste vous montrer cette vidéo 887 00:50:09,105 --> 00:50:15,270 de Marc et de Lars que pour moi, encore une fois, en tant que scientifique de la vie, est plutôt mignon. 888 00:50:15,270 --> 00:50:17,890 889 00:50:17,890 --> 00:50:20,970 Donc, ce, au fond ici, pour vous orienter, 890 00:50:20,970 --> 00:50:23,640 ce est vous le dit fois depuis le Big Bang. 891 00:50:23,640 --> 00:50:26,570 Donc, nous sommes à environ 0,7 milliards d'années. 892 00:50:26,570 --> 00:50:28,740 Et cela montre la mise à jour actuelle. 893 00:50:28,740 --> 00:50:33,450 Donc, vous voyez en ce moment, la matière noire et de l'évolution 894 00:50:33,450 --> 00:50:39,910 de la structure fine et au début structures dans notre univers connu. 895 00:50:39,910 --> 00:50:45,690 >> Et le point, ce est que cette Tout est fait à l'intérieur de l'ordinateur. 896 00:50:45,690 --> 00:50:48,530 Il se agit d'un ensemble de paramètres et un ensemble de la physique 897 00:50:48,530 --> 00:50:52,840 et un ensemble de mathématiques et un ensemble de modèles 898 00:50:52,840 --> 00:50:59,284 qui sont soigneusement sélectionnés, puis soigneusement reliés entre eux 899 00:50:59,284 --> 00:51:00,825 pour être en mesure de modéliser les interactions. 900 00:51:00,825 --> 00:51:04,850 >> Donc vous pouvez voir quelques mises en chantier de quelques explosions gazeuses ici. 901 00:51:04,850 --> 00:51:06,880 Et la température du gaz est en train de changer. 902 00:51:06,880 --> 00:51:13,720 Et vous pouvez commencer à voir la structure du changement de l'univers visible. 903 00:51:13,720 --> 00:51:18,130 Et la partie importante de cette est, chaque tout petit, minuscule, minuscule point 904 00:51:18,130 --> 00:51:21,070 est un morceau de la physique et a un ensemble de mathématiques autour, 905 00:51:21,070 --> 00:51:23,030 informe son ami et son voisin. 906 00:51:23,030 --> 00:51:27,245 >> Donc, dans une perspective de mise à l'échelle, ceux-ci ordinateurs doivent tous travailler de concert 907 00:51:27,245 --> 00:51:29,470 et de parler les uns aux autres de manière efficace. 908 00:51:29,470 --> 00:51:31,060 Donc ils ne peuvent pas être trop bavard. 909 00:51:31,060 --> 00:51:33,520 Ils doivent stocker leurs résultats. 910 00:51:33,520 --> 00:51:37,902 Et ils doivent continuer à informer tous leurs amis. 911 00:51:37,902 --> 00:51:40,860 En effet, vous voyez maintenant, ce modèle de de plus en plus compliqué. 912 00:51:40,860 --> 00:51:42,590 Il ya de plus en plus de choses se passe. 913 00:51:42,590 --> 00:51:45,210 Il ya de plus en plus matériau qui volent autour. 914 00:51:45,210 --> 00:51:48,410 >> Et ce est ce que le début cosmos ne ont ressemblé. 915 00:51:48,410 --> 00:51:49,770 Ce était un endroit assez velu. 916 00:51:49,770 --> 00:51:55,140 Il ya des explosions partout le lieu, les collisions puissants. 917 00:51:55,140 --> 00:51:58,620 Et la formation de lourde les métaux et les éléments. 918 00:51:58,620 --> 00:52:03,910 Et ces gros nuages ​​percuter de l'autre par la force extrême. 919 00:52:03,910 --> 00:52:08,530 >> Et maintenant nous sommes 9,6 milliards ans à partir de cette explosion initiale. 920 00:52:08,530 --> 00:52:12,310 Vous commencez à voir les choses sont type de calmée un peu, juste 921 00:52:12,310 --> 00:52:15,660 un peu, parce que la l'énergie commence maintenant à se détendre. 922 00:52:15,660 --> 00:52:19,420 Et donc la mathématique modèles ont obtenu cela en place. 923 00:52:19,420 --> 00:52:22,510 Et vous commencez à voir la coalescence des différents éléments. 924 00:52:22,510 --> 00:52:26,220 Et commence à voir cette chose genre de se réunir et de refroidir lentement. 925 00:52:26,220 --> 00:52:32,260 >> Et ça commence à regarder un peu plus comme le ciel de la nuit, un peu. 926 00:52:32,260 --> 00:52:37,870 Et ce est [? QSing. ?] Nous sommes maintenant 30,2 milliards d'années et nous sommes en quelque sorte fait. 927 00:52:37,870 --> 00:52:41,130 Et puis ce qu'ils ont fait était qu'ils ont pris ce modèle, 928 00:52:41,130 --> 00:52:44,580 puis regarda l'univers visible. 929 00:52:44,580 --> 00:52:48,560 Et dans le fond étaient donc capable de prendre cela et superposer 930 00:52:48,560 --> 00:52:50,580 avec ce que vous pouvez voir. 931 00:52:50,580 --> 00:52:56,160 Et la fidélité est stupéfiant, à la précision des modèles informatiques sont. 932 00:52:56,160 --> 00:52:58,760 >> Bien sûr, les astrophysiciens et les groupes de recherche 933 00:52:58,760 --> 00:53:02,780 besoin d'encore meilleure fidélité et la résolution encore plus élevée. 934 00:53:02,780 --> 00:53:06,230 Mais si vous pensez à ce que Je ai parlé à vous aujourd'hui 935 00:53:06,230 --> 00:53:11,850 grâce à ce petit voyage à travers à la fois le stockage et la structure et le réseautage 936 00:53:11,850 --> 00:53:18,000 et des piles, la chose importante est, est scale-out informatiques essentielles? 937 00:53:18,000 --> 00:53:22,050 Ce était mon hypothesis-- originale Retour à notre méthode scientifique. 938 00:53:22,050 --> 00:53:24,810 >> Je espère qu'au début partie de cela, je 939 00:53:24,810 --> 00:53:29,400 prédis que je serais en mesure d'expliquer à vous au sujet de l'informatique scale-out. 940 00:53:29,400 --> 00:53:32,870 Et nous sorte de testé certaines de ces hypothèses. 941 00:53:32,870 --> 00:53:34,585 Nous sommes passés par cette conversation. 942 00:53:34,585 --> 00:53:38,920 Et je vais juste dire scale-out l'informatique est essential-- oh, 943 00:53:38,920 --> 00:53:42,480 oui, beaucoup oui. 944 00:53:42,480 --> 00:53:44,790 >> Ainsi, lorsque vous songez à propos de vos codes, quand 945 00:53:44,790 --> 00:53:49,230 vous faites les projets finaux CS50, lorsque vous pensez à votre héritage 946 00:53:49,230 --> 00:53:52,990 à l'humanité et les ressources que nous besoin d'être en mesure d'exécuter ces ordinateur 947 00:53:52,990 --> 00:53:56,650 systèmes, pensent très soigneusement sur les FLOPS par watt, 948 00:53:56,650 --> 00:53:58,560 et de réfléchir à la Chaos Monkey. 949 00:53:58,560 --> 00:54:02,240 >> Pensez à vos flocons de neige, ne pas faire un compromis, les bibliothèques de réutilisation, 950 00:54:02,240 --> 00:54:06,453 construire codes-- réutilisable toutes les choses que les tuteurs ont été enseignez-vous 951 00:54:06,453 --> 00:54:08,630 dans cette classe. 952 00:54:08,630 --> 00:54:11,942 Ce sont des aspects fondamentaux. 953 00:54:11,942 --> 00:54:13,150 Ils ne sont pas simplement Lip Service. 954 00:54:13,150 --> 00:54:15,660 Ce sont des choses réelles. 955 00:54:15,660 --> 00:54:20,680 >> Et si quelqu'un d'entre vous veulent me suivre, Je suis obsessionnelle avec la chose Twitter. 956 00:54:20,680 --> 00:54:22,770 Je ai en quelque sorte de donner cela. 957 00:54:22,770 --> 00:54:24,960 Mais beaucoup de la informations de fond est 958 00:54:24,960 --> 00:54:29,260 sur notre recherche informatique site Web à rc.fas.harvard.edu. 959 00:54:29,260 --> 00:54:34,010 >> Je essaie de garder un blog jusqu'à jour avec les technologies modernes 960 00:54:34,010 --> 00:54:38,390 et comment nous le faisons distributive calcul et ainsi de suite. 961 00:54:38,390 --> 00:54:43,600 Et puis notre personnel sont toujours disponible par odybot.org. 962 00:54:43,600 --> 00:54:46,270 Et odybot est notre petit assistant. 963 00:54:46,270 --> 00:54:49,280 Il a souvent peu concours sur son site web 964 00:54:49,280 --> 00:54:51,630 aussi, où vous pouvez essayer de le repérer sur le campus. 965 00:54:51,630 --> 00:54:55,200 Il est le petit convivial visage de la recherche informatique. 966 00:54:55,200 --> 00:54:59,730 >> Et je vais genre d'arrêter là et merci à tous pour votre temps. 967 00:54:59,730 --> 00:55:05,660 Et je espère que vous vous souvenez que informatique scale-out est une chose réelle. 968 00:55:05,660 --> 00:55:08,162 Et il ya beaucoup de personnes ayant déjà obtenu beaucoup de l'art antérieur 969 00:55:08,162 --> 00:55:09,370 qui sera en mesure de vous aider. 970 00:55:09,370 --> 00:55:14,330 Et tout le meilleur de chance avec vos projets futurs dans la fabrication 971 00:55:14,330 --> 00:55:18,280 assurer que notre calcul à la fois échelles, est performant, 972 00:55:18,280 --> 00:55:20,370 et contribue à l'humanité plus qu'autre chose. 973 00:55:20,370 --> 00:55:22,850 Donc, je vous remercie pour votre temps. 974 00:55:22,850 --> 00:55:23,947