JAMES MANKIETÓW: Cześć, dobry Po południu wszyscy. Nazywam się James mankietów. Jestem Asystent Dean Badań Computing tutaj na Uniwersytecie Harvarda. A dzisiaj mam zamiar porozmawiać o Dlatego skala out computing jest niezbędna. 

Sądzę więc, że najpierw się, kim jest ten facet? Dlaczego tu jestem? Dlaczego mówię do Ciebie? Mam doświadczenie w pracy naukowej informatyka i komputerowe badania, sięga do United Kingdom-- Wellcome Trust Sanger Institute dla ludzkiego genome-- i Następnie obecnie w Stanach Zjednoczonych pracy na Broad i innych cenionych miejsc nauki, takich jak Harvard. 

Myślę, że to, co naprawdę oznacza to, że że jestem odzyskiwania bio cząsteczkowy fizyk. Więc co prawda mają Muszę powiedzieć, Ci o skalowalne w informatyce? Jest jednak. 18 lat, więc ja właśnie widziałem najbardziej Dramatyczny wzrost złożoności skalę i ogólna wydajność systemów komputerowych. 

Gdy robię doktorat w Oxfordzie, ja bardzo podekscytowany z 200 megaherców było Maszyna Silicon Graphics z 18 gigabajty pamięci i pojedynczy procesor. Czasy się zmieniły. Jeśli do przodu teraz kręcimy ponad 60.000 procesorów tutaj na Harvardzie. Wiele innych organizacji wirują wiele więcej. 

Ważne na wynos z tego jest że skala jest teraz nie tylko nieuniknione, to się stało i to jest będzie nadal się zdarzają. Więc, na chwilę, rodzaj z tyłu i mówić bardzo szybko o nauce, mój ulubiony Temat, metoda naukowa. 

Jeśli mają być naukowcem, co musisz zrobić kilka kluczowych rzeczy. Jeśli nie robić te rzeczy można Nie uważają się naukowcem i będzie walczył, będąc w stanie zrozumieć obszar dyscypliny. 

Więc przede wszystkim, należy sformułować Twoje pytanie, generowanie hipotez, ale co ważniejsze ci, przewidzieć swoją results-- masz przypuszczenia co do jakie wyniki będą. I w końcu, przetestować Hipoteza i analizować wyniki. 

Więc ta metoda naukowa jest niezwykle ważne w informatyce. Komputer zarówno przewidywania i jest w stanie sprawdzić swoje wyniki są kluczowym elementem, czego potrzebujemy zrobić w metodzie naukowej. Próby te przewidywania i są prawdziwymi dwa filary metody naukowej, a każda wymagają najbardziej znaczące postępy w nowoczesnych obliczeń. 

Dwa filary nauki jest to, że teorii i prowadzenia doświadczeń. A ostatnio, computing jest często wymieniany jako trzeci filar nauki. Jeśli więc wy, studenci obserwują to, masz absolutnie żadnej presji. Trzeci filar science-- nie jest duży deal-- computing, rodzaj ważne. Tak się cieszę, jest to część computing Informatyki oczywiście 50. 

Na tyle, na tle. Chcę ci powiedzieć, co plan będziemy dziś mówić. Mam zamiar iść na jakąś historię. Mam zamiar wyjaśnić, dlaczego my tu mamy. Mam zamiar porozmawiać o niektórych z historii informatyki tutaj na Harvardzie, niektóre Działania wokół mediów społecznościowych, Bardzo zielone things-- pasjonatem wszystkiego green-- storage-- komputer storage-- jak chaos wpływa skalowanie z systemów, i systemy rozdzielcze w szczególności. 

A potem mam zamiar poruszyć niektóre okuć skala-out, który jest muszą być w stanie w skali nie computing. I w końcu, będziemy wrap z jakimś niesamowitym nauki. 

Tak, niech bierze minutę spojrzeć na naszej rzeczywistej historii. Komputer ewoluował. Tak od lat 60-tych, wszystkie się aż do dzisiaj, widzieliśmy w zasadzie zmiana Zakres od scentralizowanego computing decentralizacji computing, aby współpracy i niezależna informatyka i prawo z powrotem. 

I pozwól mi opisywanie, że trochę. Kiedy po raz pierwszy rozpoczęła mecz komputery, mieliśmy duże systemy komputerowe. Byli nadmiernie drogie urządzenia. Wszystko musiało być udostępniane. Obliczeniowa była skomplikowana. Widać, że pokoje i wypełnione było operatorzy i taśmy i wszelkiego rodzaju whirry, clicky, urządzenia spinny. 

Około lat 80-tych "wczesnych lat 70., początek aby zobaczyć wpływ faksów. Więc zaczynamy dostrzegać computing pojawiają się w laboratoriach i stać się bliżej Ciebie. Wzrost osobiste komputer, na pewno w latach 80-tych, na początku część Dziesięć lat, naprawdę się zmieniło computing. 

I nie ma pojęcia, w tytuł, bo to nazwano komputer osobisty, co oznaczało, że należał do Ciebie. Tak jak ewolucja computing nadal, ludzie zdali sobie sprawę, że ich osobiste Komputer nie był na tyle naprawdę duży aby być w stanie nic zrobić z żadnej zasługi, lub znaczące zasługi w dziedzinie nauki. 

I tak ludzie zaczęli opracować urządzenie sieciowe sterowniki, aby móc podłączyć komputery ze sobą, aby móc zbudować klastry. A więc to był ojcem erę klastra Beowulf. Linux rozłożonym w odpowiedzi własny system operacyjny, zarówno koszty i złożoność. 

A potem, jesteśmy tu dzisiaj, w którym, po raz kolejny, że jesteśmy w obliczu pokoje z pełnym komputerem sprzęt i umiejętności trzepnąć własnej karty kredytowej i inne dostęp do tych urządzeń komputerowych, zdalnie. 

I tak, można wtedy zobaczyć, w Warunki historii Wpływ na działanie jak mamy computing dzisiaj, to na pewno ewoluowały od maszyny pokoje pełne komputerów przez jakiś komputerów osobistych całą drogę w prawo z powrotem do maszyny, pokoje pełne komputerów. 

Więc to jest mój pierwszy klaster. Więc 2000 roku, zbudowany System komputerowy w Europie skutecznie opisywanie Ludzki genom. Istnieje wiele technologii wymienione na prawej tam, że, niestety, nie jest już z nami. To przebiegła do świetna technologia w niebo. 

Sama maszyna jest chyba równowartość kilku przyzwoite laptopy dzisiaj, i to po prostu rodzaj pokazuje. Jednak, nie dokładnie opisywać ludzki genom i obie je chronić z papieru, w tym konkretnym Natura z obawy danych być publiczne lub prywatne. 

Więc to jest niesamowite, prawda? Więc mamy ludzkiego genomu. Zrobiliśmy computing. Czuję się bardzo podobało się. I przewrócił się na Harvard w 2006 roku, czuje się o wiele mniej zadowolony z siebie. 

To jest to, co odziedziczył. To resortowych poczty i serwer plików. Można zobaczyć tutaj nie ma Trochę taśmy który jest używany do przechowywania systemu razem. To jest nasz licencji i serwer druku. Jestem prawie pewien, że być może haseł na niektóre z tych post-it. 

Nie niesamowite. Dość daleko od niesamowite. I tak, zdaję sobie sprawę, ten mały wykres które pokazałem na początku od dzielenia własności z powrotem do podziału, że trzeba zmienić grę. A więc zmieniliśmy grę poprzez tworzenie zachęt. A ludzie tak jak tego człowieka, Trochę artykuł w Wikipedii Pisze tu, nasze celowe stworzeń. A badanie motywacji Struktury istotne jest badanie działalności gospodarczej. 

Więc zaczęliśmy zachęcać Nasz wydział i nasi naukowcy. A więc zachęcać je naprawdę duży system komputerowy. Tak więc w 2008 roku, zbudowaliśmy 4096 Procesor machine-- 10 stojaki, kilkaset kilowatów mocy. 

Co myślę, że jest ciekawe jest to nie względu na to, gdzie jesteś w cyklu. Ta sama ilość energii i obliczyć moc jest stała. To było 200 kilowatów, kiedy zostały systemy budowy w Europie. To dwieście kilowatów w 2008 roku, i że Wydaje się, że [? quanter?] małych Uczelnia systemów komputerowych opartych. 

Więc szybko do przodu Harvard today--, ja nie jestem już smutna panda, panda bardzo zadowolony. Mamy wynosi 60 nieparzyste tys obciążenia CPU, a ich wspinaczki dramatycznie. Mamy 15 petabajtów przechowywania, także wspinaczka. Ponownie, 200 kilowatów Przyrost, zdajemy być dodając, że co sześć miesięcy. lub tak Wiele, wiele maszyn wirtualnych. I co ważniejsze, około 1,8 MW sprzętu badawczego obliczeniowej. 

I mam zamiar przyjść z powrotem do tego później, dlaczego teraz już nie muszą policzyć, ile CPU mamy, ale jak duży jest rachunek za prąd. 20 inne tak dedykowana Pracownicy computing badania. I co ważniejsze, jesteśmy zaczyna rozwijać naszą GPGPUs. I był oszołomiony, jak wiele z tego jest dodawana na zasadzie z dnia na dzień. Tak, lekcja historii na, prawda? 

Więc jak tam dotrzemy stąd? Spójrzmy na niektóre nowoczesne przykłady obliczeniowe skali out. Jestem trochę obsesję rozmiar i skala social media. Istnieje szereg ekstremalnie sukces na dużą skalę computing Organizacje teraz na naszej planecie, wsparcie i usługi dla nas wszystkich. Więc to zastrzeżenie. 

I chcę zacząć liczba uncji w Instagram. To nie jest w rzeczywistości prowadzić w celu żart, to nawet zabawne, rzeczywiście, jeśli pomyśleć o tym. Ale tak czy inaczej, będziemy spojrzeć na uncji w Instagram. I mamy zamiar zacząć z "Mojego Pszczoła i kwiat." Byłem na wsi [niesłyszalne] i wziąłem trochę obraz z Pszczoła siedzi na kwiat. I wtedy zacząłem myśleć o co to właściwie oznacza. A ja wziąłem to zdjęcie z mojego telefonu i zliczano liczbę bajtów w tym, i jest to około 256 kilobajtów. Która, gdy zacząłem, będzie w zasadzie wypełnić 5 i 1/4 cala dyskietkę. I zacząłem myśleć, dobrze, że jest cool. 

I zacząłem szukać i robić niektóre badania w sieci. I okazało się, że Instagram ma 200 milionów Maus. I nie był w rzeczywistości, że pewien, co MAU było. I MAU, tutaj, jest miesięcznie aktywnych użytkowników. 

Tak, 200 milionów MAUs-- całkiem fajne. 20000000000 photographs-- tak sporo zdjęć. 60 milionów nowych zdjęć każdego dnia wychodzi na około 0,002 koncertu na zdjęcie. To o pięć petabajtów tarczy tuż tuż, tuż. I to naprawdę nie jest centralną częścią z tego, co mamy zamiar rozmawiać. To jest małe ziemniaki. Albo jak mówimy w Anglii, maleńkich kartofli. 

Więc spójrzmy na prawdziwego słonia w room-- unikalne twarze. Ponownie, niech mierzą się to nowe kwanty wezwać Mau. Sam Facebook ma 1300000000 Maus. WhatsApp, który nie miał nawet słyszał do niedawna, to niektóre usługi wiadomości porządek, wynosi 500 mln Maus. Instagram, która po prostu mówił o, 200 mln Maus. I Messenger, który jest inny komunikator internetowy, jest także 200 milionów Maus. 

Więc w sumie, że się, że chodzi o 2200000000 całkowite użytkowników. Oczywiście istnieje pewna część, ale to równowartość jednej trzeciej planecie. I wysłać coś w Region 12 miliardów wiadomości dziennie. I znowu, jest tylko 7 Miliard ludzi na planecie. Nie każdy ma smartfona. Jest to więc numery szalone. 

A ja zamierzam twierdzić, że to nie jest nawet o przechowywaniu lub obliczeniowych. I zacytować piosenkę, to wszystko o tym wykresie. Oto nasz piękny Meghan Trainor dół tutaj, śpiewa o wszystkim bas. Zauważ, że ma dość nieco basu herself-- 207, oraz 218 milionów ludzi widziało ta młoda dama śpiewa jej piosenkę. 

Więc mój argument, że to wszystko o wykresu. Więc wzięliśmy jakieś oprogramowanie open source i zaczął patrzeć na wykresie. I to jest LinkedIn, więc jest Facebook dla ludzi starych. I tak, to jest mój wykres LinkedIn. Mam 1200 lub tak węzłów, tak zwane "znajomych". A tu mnie na górze. A oto wszystkie wzajemnych połączeń. 

Teraz wracam do historii Instagram. Każdy z nich jest nie tylko zdjęcia, to ma cały mnóstwo połączeń pomiędzy tą konkretną osobą i wiele innych. Jest to centralny element jest albo błąd w algorytmie wykres rysunku czy to może być David Malan, nie jestem jeszcze pewien. Więc można przerysować wykresy w różnego rodzaju z ways-- gephi.gihub.io gdzie można wyciągnąć z tego oprogramowania. To naprawdę fajne za to, że możliwość organizowania społeczności. Można tu zobaczyć, to jest Harvard i różne inne miejsca, które mam pracowali, bo to jest moje dane związane z pracą. 

Więc po prostu myśleć o złożoności wykresu oraz wszystkie dane które można wyciągnąć wraz z. Więc w międzyczasie, z powrotem w FriendFace, prawda? Patrzyliśmy na Instagram, że dane był rzędu pięciu petabajtów. Nic wielkiego. Jeszcze sporo danych, ale nie jest duży radzić sobie w większym schemacie rzeczy. 

Z tego artykułu na starym internecie, "Skalowanie Facebook hurtowni danych 300 petabajtów ". To jest zupełnie inna zmieniarka gry teraz kiedy zaczynasz się myślę danych i wykresu i co zabrać ze sobą z. A ich wysoka dane uprawy Kolejność 600 terrabytes dzień. 

Teraz wiesz, dobrze, then-- To znaczy, 600 terrabytes dni, 300 petabytes-- są również zaczynają się bardzo zaniepokojony jak zachować te rzeczy i upewnić się, że dane pozostają wokół. A ten pan tutaj, Jay Parikha, szuka w jaki sposób przechowywać eksabajtu danych. 

Tylko dla tych, kto ogląda razem w domu, exabyte-- 10 do 18. To ma swój własny Wikipedia strona, to, że duże liczby. To jest rozmiar i skalę tego, co jesteśmy patrząc, aby być w stanie przechowywać dane. A ci ludzie nie są mucking, oni przechowywanie takiej ilości danych. Więc jeden z tropów, które patrzą na tutaj jest dla centrów danych tzw chłodni. 

Co prowadzi mnie do bycia zielonym. I tu jest Kermit. On i ja agree-- to bardzo Trudno być zielony, ale dajemy mu naszą najlepszą okazję. Kermit to nie poradzę, że ma na zielony przez cały czas, nie może zająć jego zielony-ności się w ogóle. 

Tak, jest concepts-- kilka podstawowych pojęć, rodzaj wśród zieleni, kiedy go odnosi się do komputerów. Ten, który jest najważniejszym Jest trwałość produktu. Jeśli produkt ma krótki czas życia, nie można, z definicji, jest zielony. Energia potrzebna do wytwarzania twardy, płyta główna, komputer System, tabletki, cokolwiek to może być, długowieczność systemów są kluczowym elementem, jak zielone mogą być. 

Ważną częścią, jak was wszystkich są budowy oprogramowania algorithms-- Algorytm częściowy Słowo oprogramowania, prawda? Więc twój projekt algorytm jest absolutnie niezbędne w kategoriach od tego, jak masz zamiar być w stanie dokonać szybkie i dokładne obliczenia w użyciu najmniej kwota możliwej energii. A ja się do tego w trochę. 

Centrum danych zamiary ciebie widziałem że mamy już tysiące od tysięcy maszyn, siedzi cicho w małych, ciemnych zakamarkach światowego, informatyki. Zasobów allocation-- jak uzyskać do obliczeniowych, do przechowywania, przez sieć. Systemy operacyjne są kluczowym elementem Ten i wiele wirtualizacji móc pakować coraz więcej obliczeniowa w małej przestrzeni. 

Dam wam mały przykład z informatyki badań. Potrzebowaliśmy więcej ping, więcej energii, a rury. Potrzebowaliśmy więcej większe, lepsze, szybsze komputery, i potrzebne do korzystania z mniej soku. I nie mogliśmy dowiedzieć się, jak to zrobić. Nie wiem, czy tak hashtag gowest prawdopodobnie jest wykorzystywany przez Kardashian, ale i tak, gowest. I zrobiliśmy. 

Wybraliśmy naszą pracę i przenieśliśmy go Western Massachusetts w małej młyna miasta nazywa Holyoke, na północ z Chikopee i Springfield. Zrobiliśmy to na kilka powodów. Główną z nich było to, że my miał bardzo, bardzo dużą tamę. I to bardzo duża zapora jest w stanie zgasić 30 plus megawatów energii, i była w pełni wykorzystana w danej chwili. 

Co ważniejsze, mieliśmy również bardzo skomplikowane sieci , że był już na miejscu. Jeśli spojrzeć na których sieć idzie w Stanach Zjednoczonych wynika, wszystkie tory kolejowe. Ten konkretny kawałek sieci była własnością naszych kolegów i przyjaciół, w Massachusetts Institute of Technology, i jest w zasadzie zbudowany wszystkie wyjścia do Route 90. 

Więc mieliśmy duży haczyk rzeki, Route 90 zaznaczyć, mieliśmy krótką drogę 100 mil, i to długa droga, około 1000 mil. Musieliśmy zrobić bardzo duży złącze sieci, jak widać tutaj, w zasadzie umieścić link w celu być w stanie połączyć się Holyoke, ale mieliśmy cały warunek infrastructure-- ping, moc, rury. Życie było dobre. I znowu, wielkie tamy. 

Więc zbudowany w zasadzie Massachusetts Zielona Obliczenia o wysokiej wydajności Centrum. To była praca z miłości przez pięciu universities-- MIT, Harvard, UMass, Northeastern i BU. Pięć MW dnia jeden podłączone obciążenie. Zrobiliśmy wszystkie rodzaje sprytu z ekonomizerów operacyjnych lotniska do przechowywania rzeczy na zielono. A my zbudowany z 640-nieparzyste regały, dedykowany dla komputerów badawczego. 

To była stara strona terenów poprzemysłowych, więc miał jakieś rekultywacji i jakiś porządek w górę a niektóre oczyszczania terenu. A potem zaczęliśmy na budowę obiektu i boom-- piękny obiekt z możliwość uruchamiania sandbox computing, mają konferencje i seminaria, a także ogromny piętrze centrum danych. 

Oto mój dobry samo. Mam oczywiście na sobie tę samą kurtkę. I być może tylko jeden kurtki, ale nie do mnie i John Goodhue-- on Dyrektor wykonawczy Center-- stojąc w maszynowni Podłoga, która, jak widać, jest dość dramatyczna, i to sięga długą, długą drogę. 

Często gram w gry jazdy z Bostonu się Holyoke, udając, że jestem pakietów TCP / IP. A ja martwię się o mojego opóźnienia jeżdżąc w moim samochodzie. Więc to jest zielony kawałek. Więc po prostu wziąć minut i pomyśleć o stosach. Więc próbujemy bardzo uważnie budowy centrów danych skutecznie, computing skutecznie naprawia wybór rodzaju sprzętu komputerowego i dostarczyć bardziej ważniejsze, nasza aplikacja, czy to komunikator internetowy lub aplikacji naukowych. 

Więc tutaj są stosy. Warstwa tak fizyczne, wszystkie aż przez application-- mając nadzieję, że to będzie być dobrym częścią kursu. Warstwy modelu OSI, siedem jest w zasadzie, będziesz żyć, jeść i oddychać to w całym swoim komputerowych kariery. Ta cała koncepcja fizyczna przewody infrastructure--, kable, centra danych, łącza. I to jest właśnie opisywanie sieci. 

Tu jest, dobrze, oczywiście, to jest stary slajd, ponieważ powinno to powiedzieć, HTTP, ponieważ nikt nie dba o zwykłą pocztą protokoły komunikacyjne, już. To wszystko dzieje się w przestrzeni HTTP. Jest to więc jeden poziom stosu. 

Oto kolejny zestaw stosów, gdzie cię mieć serwer, gospodarz, hypervisor, gość, biblioteka binarny, a następnie aplikacja. Lub, w tym przypadku, urządzenie Kierowca, jądro Linux, pochodzi c, Wirtualna maszyna Javy, Java API, to Java aplikacje i tak dalej, i tak dalej. To opis w maszynie wirtualnej. 

Święte stosy, Batman! Pomyśl o tym w warunki, jak dużo mocy obliczeniowej trzeba uzyskać od co się tutaj dzieje, aż do góry do góry o takim składzie, aby następnie być w stanie zrobić rzeczywisty dostarczania aplikacji. 

A jeśli rodzaj do tyłu i zacząć myśleć o tym, co trzeba, aby zapewnić operacji zmiennoprzecinkowej, Twój operacji zmiennoprzecinkowej jest sumą z gniazd, liczba rdzeni w gnieździe, zegar, który jest jak szybko można zegara turnover-- cztery GHz, dwa gigahertz-- a następnie numer operacji można zrobić w danej herców. 

Więc tych mikroprocesorów dzisiaj to od czterech do sześciu japonki na cykl zegara. I tak jednordzeniowy 2,5 koncert zegar ma wydajność teoretyczną około mega FLOP, lub dać. 

Ale, tak jak wszystko, mamy wyboru. Więc i Intel Core 2, Nehalem Sandy Bridge, Haswell, AMD, zabrać choices-- Intel Atom. Wszystkie te architektury procesorów mają nieco inny sposób jest w stanie dodać dwa numery razem, która jest w zasadzie ich celem w życiu. Musi być trudne. Jest ich miliony siedzi w centrach danych, teraz jednak. 

Sor, japonki za watt-- to jest wielka rzecz. Więc jeśli chcesz uzyskać więcej tego przejść przez ten stos, szybciej, Muszę pracować na ile operacji zmiennoprzecinkowych drugie, Mogę zrobić, a następnie dać im wat. I na szczęście, ludzie myślałem o tym. 

Więc jest duża zakwestionowania każdego roku, aby zobaczyć którzy mogą zbudować najszybszy komputer które mogą diagonalize matrycę. To się nazywa Top 500. Wybierają z góry najlepsze 500 komputerów na naszej planecie, które mogą diagonalize macierze. A masz jakieś niesamowite rezultaty. 

Wiele z tych maszyn są od 10 do 20 megawatów. Mogą diagonalize macierze nadmiernie szybko. Oni nie muszą diagonalized je tak skutecznie na wat, więc nie był to duży nacisk, aby spojrzeć na co zielone 500 lista będzie wyglądać. A oto lista od czerwca. Nie powinno być nowy bardzo wkrótce. 

I to nazywa out-- Wezmę początek tej konkretnej listy. Jest dwa konkretne machines-- jednym z Tokyo Institute of Technology i jednym z Cambridge University w Wielkiej Brytanii. A te są dość zdumiewające mega japonki na stosunkach watowych. Ten jest 4389, a jedna obok dół jest 3631. 

Będę wyjaśnić różnicę między te dwa, w następnym slajdzie. Ale są to umiarkowanie wielkości klastrów badawczych. To tylko 34 kW lub 52 kilowatów. Istnieje pewna ilość większych here-- tego konkretnego jeden w szwajcarskim Narodowym Centrum Superkomputerowo. Należy zapamiętać, jest to, że jesteśmy próbuje znaleźć komputery który może pracować wydajnie. 

I tak, spójrzmy na tej górze jeden, uroczo nazywa, KFC. I trochę reklamy tutaj. Ta konkretna firma żywności nie ma nic wspólnego z tym. Jest to, że Ten szczególny system moczy się w bardzo mądry związek na bazie oleju. I tak dostali ich smażenia kurczaka pseudonim po raz pierwszy zaczęli budowę tego typu systemów. 

Ale w zasadzie to, co już podjęte o to liczba łopatek umieścić je w tym Elegancki olej mineralny, a następnie pracował w jaki sposób, aby wszystkie sieci i poza nią. Następnie, nie tylko to, oni umieścić go na zewnątrz, więc że można go wykorzystać chłodzenie powietrzem z zewnątrz. To było imponujące. Więc trzeba zrobić wszystko, z tego shenanigans aby móc uzyskać takiej ilości obliczyć dostarczone do małej mocy. 

I widać to kształt gdzie rzeczy są pozycją. Wyzwaniem jest, że regularne powietrza Chłodzenie jest ekonomia skali i jedzie dużo rozwój zarówno regularnych informatyki, i High Performance Computing. Tak, to jest dość uciążliwy. Myślę, że to jest fascynujące. To trochę bałagan, gdy ci spróbuj zamienić dyski, ale to naprawdę fajny pomysł. 

Tak więc nie tylko, że nie ma cała masa pracy buduje wokół tego, co jesteśmy wywołanie Otwórz Compute Project. I tak, więcej na ten temat trochę później. Ale w branży zaczyna sobie sprawę, że japonki na wat staje się ważne. A ty, jak ludzie tutaj, jak zaprojektować swoje algorytmy i zaprojektować Kod, należy pamiętać, że kod może mają efekt domina. 

Kiedy Mark siedział tutaj, w jego pokój w akademiku pisanie Facebook 1.0, Jestem pewien, że miał widok że to będzie ogromny. Ale jak ogromne to byłoby na środowisko jest ważną dealio. I tak wszystkie ya mógł pochodzić z algorytmów które mogłyby być trudne obok rzeczą dla ludzi takich jak ja, próby uruchomienia systemu. 

Więc po prostu myśleć o ograniczeń mocy rzeczywistym świecie. Ten artykuł od Landauer-- Nie jest to nowa rzecz. 1961 to zostało opublikowane w IBM Urzędowym. To kanoniczna "Nieodwracalność i ciepła Generacji w procesie Computing ". I tak też twierdził, że Maszyny nieuchronnie wykonywania funkcji logistycznych nie mają jedną wartość odwrotności. 

Tak, że cała część jest to, że już w latach 60., ludzie wiedzieli, że to będzie problemem. I tak prawo granicach powiedział 25 stopnie C, rodzaj kanonicznego pokoju temperatura graniczna stanowi 0,1 elektronowoltów. Ale teoretycznie, jest Pamięć teoria, komputer, działających na tej granicy może być zmienione w miliard bitów na sekundę. 

Nie wiem jak wy, ale nie natknąć wielu miliard bitów a druga wymiana przepływności. Argument nie było, że tylko 2,8 biliony wata mocy powinien w przyszłości nie będą rozszerzane. 

Dobrze, prawdziwy świat example-- to jest mój rachunek za energię elektryczną. Jestem 65% procent że piękne centrum danych Pokazałem ci, w tym szczególnym czasie. To jest z powrotem w czerwcu ubiegłego roku. Wziąłem ze starszej wersji, tak że może i rodzaj anonimowy trochę. Spędzałem 45.000 dolarów miesięcznie za energię tam. 

Tak to z faktu, że nie jest ponad 50.000 procesów w pokoju. Więc można sobie wyobrazić własne mieszkaniowy rachunek za prąd jest, że wysokie? Ale to było na 199 mln watowe godzin ponad miesiąc. 

Więc pytanie stawiam to można wyobrazić sobie rachunek za energię elektryczną pana Zuckerberga? Mój jest dość duży, i walczę. I nie jestem sam w tym jest. Jest wiele osób, z dużych centrów danych. I tak, myślę, pełne disclosure-- moi Przyjaciele Facebook trochę dziwne. 

Więc moim przyjacielem Facebook jest Centrum danych Prineville, który jest jednym z największych Facebook, Najnowszy, najniższy centrum danych energetycznych. I pisać do mnie, takie rzeczy jak Efektywność wykorzystania energii, jak w jak efektywny jest danych Centrum kontra ile energii jesteś wprowadzenie do niej, jak bardzo są one za pomocą wody, co jest wilgotności i temperatury. 

I oni mają te piękne, piękne działki. Myślę, że jest to niesamowite strona na Facebook, ale myślę, że jestem trochę dziwne. 

Więc jeszcze jedno zasilanie, computing badań, które robię różni się znacząco co Facebook i Yahoo i Google i inne na żądanie, w pełni, zawsze dostępne usługi. I tak mam przewagę, że kiedy ISO Nowy England-- i ISO New England pomaga ustawić energię Stawki dla regionu. 

I mówi, że rozszerzenie Żądanie konsumentów do dobrowolnego oszczędzania wysokiej energii, ze względu na wysokie temperatury i wilgoć. I to był z powrotem na 18 lipca. I tak się szczęśliwie Powrót, Hey, ISO New England, Zielona Harvard. Robimy nasz udział ponad tutaj w informatyce badawczego. A to dlatego, że robimy nauki. 

I jak mówią nauki nigdy nie śpi, nauka może się doczekać. Więc jesteśmy w stanie wygasić nasze Systemy, skorzystać z kursów klasy na naszym rachunku za energię, oraz pomoc w całym New England Region przelewając wielu megawatów obciążenia. Więc to unikalna rzecz, która różni się o naukowych danych komputerowych centra i te, które są w pełnej produkcji 24/7. 

Więc po prostu zrobić kolejny bieg tutaj. Tak, chcę omówić Chaos trochę. I chcę, aby umieścić go w patronatem magazynu. Więc dla tych, którzy niby z zmagali coraz głowy wokół tego, co petabajtów przechowywania wyglądać, to przykładem. I to jest coś w rodzaju rzeczy Zajmuję się cały czas. 

Każda z tych małych chłopaki jest twardy czterech terabajtów, więc można trochę liczyć je. Dostajemy teraz między jeden do 1 i 1/2 petabajtów w standardowej szafie przemysłowej. I mamy pokoje i pokoje, jak Ciebie widział w tym wcześniejszym zdjęciu z Janem a ja, pełen tych stojaków sprzętu. Więc to staje się bardzo, bardzo łatwe budować ogromne macierze dyskowe 

To w większości łatwe do wnętrza systemu Unix rodzaj liczy się jak się sprawy mają. Więc to jest liczenie, ile Punkty MAU mają tam dotarłem. Więc to jest 423 punktów przecięcia z osią. A potem, jeśli uruchomię jakiś szkicowy awk, ja można dodać, w tym konkretnym systemie, było 7,3 petabajtów dostępnej pamięci. 

Więc to jest wiele rzeczy. I przechowywanie jest naprawdę trudne. A jednak, z jakiegoś powodu, Tendencja ta jest przemysł. Ilekroć rozmawiam z naszych naukowców i nasz wydział i powiedzieć, hej, mogę uruchomić magazyn dla Ciebie. Niestety, muszę odzyskanie kosztów magazynowania. Mam ten biznes. A ludzie odwołać Newegg albo odwołać Staples i ile może kupić Pojedynczy dysk terabajt na. 

Więc to, będziesz pamiętać tutaj, że nie ma pojęcia. Jest jeden dysk tutaj. A jeśli wrócimy, mam wielu. Nie tylko ja wiele, mam wyrafinowane interkonekty móc ściegu te rzeczy razem. Tak więc ryzyko związane z ich duże macierze pamięci masowej nie jest bez znaczenia. 

W rzeczywistości, wzięliśmy się internet i pisaliśmy trochę opowieść o dobre intencje, łagodnych dyrektor badań computing-- zdarza się mieć dziwne angielskie accent-- próbuje wyjaśnić badacza, co nie Folder kopii zapasowej podkreślenia rzeczywistości Oznaczało. To było dość dawno, trochę historii, dobre cztery minuty odkrycia. 

I uwaga, mam straszne dużo mniej miejsca niż pani że śpiewa o wszystkim bas. Mamy sporo rachunki niższe. Ale tak czy inaczej, jest to Ważne jest, aby myśleć o tym, chodzi o to, co może się nie udać. Więc jeśli mam twardy i Wrzucam go w maszynie Unix, i zaczniesz pisać rzeczy dla niego, tam magnes, jest głowica dysku, tam rzekomo, jeden lub zero jest napisane na tym urządzeniu. 

Motors-- spinny, Twirly rzeczy zawsze zerwać. Pomyśl o rzeczach, które rozkładają. To zawsze było spinny, Twirly rzeczy. Drukarki, dyski, pojazdy silnikowe, itp Wszystko, co się rusza jest podatne na złamania. 

Więc trzeba silniki, ty trzeba jechać firmware, trzeba SAS / SATA, kontrolery, kable, oprogramowania na kontrolerach SAS / SATA, Bloki niskim poziomie. Wybierz plik kontrolera pamięci kod systemu, która z tych wielkości może być, jak zszyć rzeczy razem. A menedżer pamięci wirtualnej stron, DRAM pobrać i sklepy. Następnie pojawi się kolejny stos, który jest rodzajem w dół listy w tej sprawie jeden, algorytmy użytkowników. 

A jeśli pomnożyć to się, nie wiem, jak wiele, istnieje wiele miejsc, gdzie rzeczy mogą iść w bok. Mam na myśli, że to przykład o matematykę. Ale jest to rodzaj zabawy, aby myśleć Jak wiele sposobów rzeczy może pójść źle, tylko na dysku. Jesteśmy już na 300 petabajtów, więc wyobrazić liczbę dysków trzeba na 300 petabajtów że może się nie udać. Nie tylko that-- więc to składowanie. A, że nawiązuje do Osoba Chciałbym zobaczyć wprowadzić etap w lewo, które jest Chaos Monkey. Więc w pewnym momencie, to jest jeszcze większe niż tylko dysku Problem. 

I tak, te piękne panie i panowie że uruchomienie usługi transmisji strumieniowej wideo sobie sprawę, że ich komputery były również ogromny i bardzo skomplikowane a także świadczenia usługi do okropne wiele osób. Mają 37 milionów members-- i Ten slajd jest może rok lub tak old-- tysięcy urządzeń. Istnieją miliardy godzin wideo. Miliardy zdarzeń zalogować one dni. 

I widać, większość ludzi oglądać telewizja później w godzinach wieczornych, i to znacznie przewyższają wszystko. I tak, chcieli być w stanie upewnić się, że obsługa była i niezawodne i pracy dla nich. Więc wymyślili to coś o nazwie Chaos Monkey. Jest to oprogramowanie, która, gdy myślisz o mówienie o tytule całej tej prezentacji, Skala out oznacza was Należy sprawdzić te rzeczy. To nie jest dobre tylko o milion maszyn. Więc Zaletą jest to, Chaos Monkey Jest to usługa, która identyfikuje grupy systemów i losowo kończy jeden systemów w grupie. Niesamowite. Więc nie wiem o ty, ale jeśli kiedykolwiek mam wbudowany system, który opiera się na inne Systemy rozmawiają ze sobą, można przyjąć jedną z nich na zewnątrz, prawdopodobieństwo całej pracy rzeczy, szybko maleje. 

A więc ten kawałek oprogramowania działa wokół infrastruktury Netflix jest. Na szczęście, to mówi, że to działa tylko w godziny pracy z zamiarem że inżynierowie będą czujny i stanie odpowiedzieć. Więc to są typy rzeczy jesteśmy teraz konieczności zrobić, aby zaburzyć naszą computing środowiska, wprowadzenie chaosu oraz wprowadzenie złożoności. 

Więc kto w ich prawo umysł, chętnie wybrać do pracy z Chaos Monkey? Trzymaj się, wydaje się być skierowane do mnie. Cóż, myślę, że powinien: słodkie. Ale problemem jest to nie dostaniesz do wyboru. Chaos Monkey, jak ty widać, wybiera ciebie. 

I to jest problem z informatyki w skali jest to, że nie można tego uniknąć. To nieuniknione złożoności oraz skali i ewolucji, w pewnym sensie, wiedzy obliczeniowej. I pamiętaj, to jest jedną rzeczą do zapamiętania, Chaos Małpy miłość snowflakes-- miłość płatki śniegu. Snowflake-- mamy wyjaśnione Chaos Monkey-- ale śniegu Jest to serwer, który jest wyjątkowy i wyjątkowy i delikatny i indywidualne i nigdy nie będą odtwarzane. 

Często znajdujemy płatek śniegu usługi w naszym środowisku. I zawsze spróbować stopić obsługę płatek śniegu. Ale jeśli znajdziesz serwer w środowisku że ma kluczowe znaczenie dla trwałości o organizacji i topi, nie można umieścić go z powrotem. Tak więc zadaniem Chaos Monkey było przejść i zakończyć instancji. Jeśli Chaos Monkey topi płatek śniegu, jesteś nad, skończysz. Chcę mówić o jakiś sprzęt, że jesteśmy widząc w zakresie rodzaju skalować-działalność też. I kilka unikalnych rzeczy, które są w i wokół działalności naukowej. Jesteśmy teraz zaczynają dostrzegać, pamiętaj, ta jednostka wydania, ten stojak? Więc to jest stojak GPGPUs-- tak ogólnym uniwersalne procesory graficzne. 

Mamy nich znajduje się w naszej danych Centrum, 100 i więcej kilometrów. Ten szczególny stojak około 96 tera japonki pojedynczej precyzji matematyka stanie dostarczyć na tył to. I mamy 130-dziwne zamówienie Karty w instancji że we-- wielokrotnością stojaki z tego przykład. 

Więc jest interesujące w tym sensie, że procesy graficzne ogólnego przeznaczenia są w stanie zrobić matematyki niezwykle szybko, za bardzo niskie ilości energii. Więc jest duża Uptick w na naukowe obszary informatyczne, patrząc na grafikę Jednostki przetwarzania w wielkim stylu. 

Więc wpadłem niektóre Mcollective za pośrednictwem naszej infrastruktury lalek wczoraj, bardzo podekscytowany. po prostu brakuje w petaflop pojedynczej precyzji. Wystarczy być jasne, tutaj, w tym trochę mnożnik 3.95. Matematyka podwójnej precyzji będzie około 1,2, ale mój RSS Twitter wyglądała tak lepiej, gdybym powiedział, że miał prawie petaflop z pojedynczej precyzji GPGPUs. 

Ale to się tam dostać. To zaczyna być bardzo, bardzo imponujące. I dlaczego to robimy? Ponieważ chemii kwantowej, m.in. ale zaczynamy projektować niektóre nowe ogniwa fotowoltaiczne. 

I tak Alan Aspuru-Guzik, kto profesor chemistry-- mojego partnera w crime-- przez ostatnie kilka lat. Byliśmy pchania koperty na informatyce. I GPGPU jest idealny Technologia jest w stanie zrobić Bardzo dużo skomplikowane matematyka, bardzo, bardzo szybko. 

Więc w skali, przychodzi nowe wyzwania. Tak ogromna scale-- trzeba być Uważaj jak podłączyć te rzeczy. I mamy pewne poziomy zaburzenia obsesyjno-kompulsywne. Te zdjęcia prawdopodobnie jeździć dużo ludzi orzechów. I szafki, które nie są przewodowy szczególnie dobrze kierowania naszą sieć i Obiekty inżynierów orzechy. Dodatkowo istnieje również przepływ powietrza kwestie, które trzeba zawierać. 

To są rzeczy, które nigdy by nie pomyślał. Dzięki skali, jest bardziej złożony. Jest to nowy typ systemu plików. To było niesamowite. To petabajta. Może przechowywać 1,1 miliarda plików. Można go czytać i pisać do 13 GB i 20 GB a second-- gigabajtów Drugi. Więc może rozładować terabajty w ogóle czasu. 

I to jest bardzo dostępna. I nie ma to niesamowite wyszukiwanie rates-- 220000 wyszukiwań sekundę. I istnieje wiele różnych ludzi budowy tego rodzaju systemów. I można go zobaczyć tutaj graficznie. Jest to jeden z naszych systemów plików to pod obciążeniem, dość szczęśliwie czytania na tak krótki 22 gigabajtów na sekundę. Więc to cool-- więc złożoność. 

Więc z złożoności i skali, jest bardziej złożony, prawda? Jest to jeden z naszych wielu, diagramy sieciowe, wiele gdzie masz wiele różnych Podwozie wszystkim wspieranie się do wyłącznika głównego rdzenia, podłączony do przechowywania podłączenia do niskich interkonektów opóźnieniem. A potem się z treścią strony Dom tylko wszystkie zarządzania że trzeba być w stanie rozwiązać Te systemy ze zdalnej lokalizacji. Tak więc skala ma dużo Złożoność z nim. 

Ponownie zmienić bieg, wróćmy i trochę miejsce nauki. Tak, pamiętam, badania informatyka i ten mały shim-- mała różowa podkładka pomiędzy wykładowców i wszystkich swoich algorytmów i wszystkie chłodnym nauki i wszystkie tego zasilania i chłodzenia centrów danych i Podłoga i tworzenie sieci i duże komputery i biurka biurka usług i pomocy i tak forth-- i tak, jesteśmy po prostu ta mała podkładka między nimi. 

Co mamy zaczął Zobacz to, że na świecie w stanie budować te duże centra danych i być w stanie zbudować te duże komputery. Otrzymaliśmy bardzo dobry. To, czego nie jesteś bardzo dobry w tym jest mała podkładka między badaniami i czystego metalu i technologii. I trudno. 

I tak udało nam się zatrudnić Ludzie, którzy żyją w tym świecie. A ostatnio rozmawialiśmy National Science Foundation i powiedział: skala ta out rzeczy jest super, ale nie możemy dostać nasze naukowców na tych dużych skomplikowanych maszyn. I tak nie było Wiele różnych programów gdzie tak naprawdę były głównie zaniepokojony stara aby zobaczyć, czy możemy przekształcić infrastruktury kampusu. 

Istnieje wiele programów wokół ośrodków krajowych. I tak, my sami, nasze przyjaciele w Clemson, Uniwersytet Wisconsin w Madison, Południowa Kalifornia, Utah i Hawaje rodzaj zebrali się spojrzeć na ten problem. A ten mały wykres tutaj jest długi ogon nauki. 

Więc to is-- tak nie jest względu na to, co znajduje się na tej osi, ale to jest w rzeczywistości liczba osi miejsc pracy przechodzi klastra. Więc jest ponad 350.000 Bez względu na czas okresu. To są nasze Podejrzani w dolnej tutaj. W rzeczywistości, jest Alan Aspuru-Guzik, którzy byliśmy tylko mówić about-- ton i mnóstwo obliczeniowych, naprawdę skuteczne, wie, co robi. 

Oto kolejna pracownia, że ​​będę mówić o w moment-- laboratorium Johna Kovač. Mają go. Są dobrzy. Są szczęśliwi. Oni computing. Wielka nauka jest coraz zrobić. A potem, jak ciebie miły z przyjść tu, tam Inne grupy, które są nie są uruchomione wiele miejsc pracy. 

A to dlaczego? Czy dlatego, że informatyka jest zbyt trudne? Czy to dlatego, że nie wiedzą, jak? Nie wiemy, bo posunęliśmy się i spojrzał. A więc to, co to Projekt jest o, jest lokalnie, w obrębie Każdy z tych regionów patrzeć na alei, gdzie możemy zaangażować z wykładowców i badaczy w rzeczywistości w dolnym końcu ogona i zrozumieć, co robią. 

Więc to jest coś, że jesteśmy naprawdę pasjonuje. I to jest coś, co nauka nie będzie kontynuowana do przodu, dopóki nie rozwiąże niektórych z tych przypadków krawędzi. Pozostałe bity nauki że każdy będzie up-- widział Wielkiego Zderzacza Hadronów. Niesamowite, prawda? Ten materiał wszystkim zabrakło w Holyoke. Mamy built-- pierwszy nauki, które wydarzyło się w Holyoke była współpraca sami i Boston University. Więc to jest naprawdę super. 

To jest zabawne kawałek nauki dla skali. Jest dostęp do cyfrowych Niebo wieku na Harvardzie. Zasadniczo, jest to archiwum płyty. Jeśli zejść Oxford-- Garden Street, przepraszam, znajdziesz jeden z obserwatorium budynków jest w zasadzie pełne około pół miliona płyt. 

A są to zdjęcia Niebo w nocy, w ciągu 100 lat. Więc jest cała platforma skonfigurować tutaj do digitalizacji tych płyt, zrobić im zdjęcie, zarejestruj je, je na komputerze. I to petabajta i pół, tylko prawo there-- jeden mały projekt. 

Są inne projekty. Ten projekt Pan-STARRS robi pełne badania szerokiego panoramiczny, patrząc na asteroidy w pobliżu Ziemi i przemijające wydarzenia niebieskich. W biofizyk molekularnej, kocham Słowo przemijające niebiański wydarzenie. Nie jestem pewien, co to jest, ale tak, szukamy dla nich. 

A my generowania 30 terabajtów noc z tych teleskopów. I to nie jest pasmo Problem, to jak problem FedEx. Więc można umieścić na przechowywanie na vana i wysłać go cokolwiek to jest. 

Bicepsa jest naprawdę interesting-- tak tło obrazu kosmicznej dodatkową galaktycznej polaryzacji. Kiedy zaczynałem pracę na Harvardzie siedem lub tak, osiem lat temu, pamiętam, pracy nad tym projektem i to naprawdę nie tonąć domu, dlaczego światła spolaryzowanego od kosmicznego promieniowania tło byłoby ważne, dopóki to się stało. 

I to był John Kovac, którzy rozmawiałem wcześniej, stosując wiele milionów CPU godzin, w naszym zakładzie i innych, w zasadzie patrzeć do wewnątrz od pierwszych chwil wszechświata po Wielkim Wybuchu, a starając się zrozumieć, Einsteina ogólnej teorii względności. To niewiarygodny, że nasze komputery pomagają nam odkryć i stare do samych początków, dlaczego tu jesteśmy. 

Więc kiedy mówisz o skali, to jest jakiś poważny skalę. Inna sprawa skali jest, że szczególny projekt hit tych facetów. I to jest odpowiedź dla bicepsa [Niesłyszalne] była to nasza mała ankieta. 

I można zobaczyć tutaj, życie był dobry, dopóki o tutaj, co było, kiedy Ogłoszenie wyszło. I masz dosłownie sekund, aby odpowiedzieć w przypadku skalowania, który odpowiada tej małej kropki tutaj który zakończył się przesunięcie cztery lub tak terabajtów danych przez serwer WWW że day-- dość owłosione. 

I tak są one rodzaje rzeczy, które może ci się stało w infrastrukturze jeśli nie projektujemy na skali. Mieliśmy trochę wyścig tego dnia, będzie stanie rozciągać się wystarczająco usługi internetowej zachować Up strony i prowadzenie. I się udało. To jest trochę email że niby słodkie. To jest mail Mark Vogelsberger, Lars Hernquist, kto członkiem tutaj na Harvardzie wydziału. Więcej o Mark później. Ale myślę, że jest to jeden rodzaj podsumowuje rodzaju gdzie obliczeniowa jest w informatyce badawczego. Hej, zespół, od ostatniego Wtorek, chłopaki zgarnął ponad 28% nowy klaster, co w połączeniu jest niż 78 lat CPU w ciągu zaledwie trzech dni. A ja powiedziałem, to jeszcze dopiero w piątek rano. Jest to dość niesamowite! Szczęśliwy piątek! 

Potem dam im punkty danych. I tak, że było trochę ciekawe. Więc pamiętaj o Marku, że przyjdzie powrót do obrazu w trochę. Tak więc skala out computing jest wszędzie. 

Mamy nawet pomagali ludzie wyglądają co jak funkcjonuje NBA, i gdzie ludzie są rzucanie kulkami. I naprawdę nie rozumiem tej gry zbyt dobrze, ale pozornie, to wielka sprawa. Jest obręcze i miski i pieniądze. 

I tak, w naszej bazie danych, możemy zbudowany trochę 500 [niesłyszalne] równoległe klaster procesor, kilka terabajtów pamięci RAM, móc zbudować ten Kirka i jego zespołu. I robią computing w całym inny sposób. Teraz jest to projekt jesteśmy zaangażowany w to absolutnie fascynujące, wokół neuronów connectomics plastyczność i genomowego imprinting-- trzy bardzo ciężkie uderzenie obszary badań że walczymy z ON Podstawa z dnia na dzień. Pomysł, że nasze mózgi są pod Stres plastikowe, gdy jesteśmy młodzi. I wiele naszych zachowań dorosłych jest dłuta doświadczenia w dzieciństwie. Tak więc jest to duży dealio. 

A więc jest to praca, która jest finansowana przez Narodowy Instytut Zdrowia Psychicznego. I staramy się w zasadzie, przez wiele dużych ilości danych i duży analiza danych, rodzaju z zajrzeć do naszego ludzkiego mózgu poprzez szereg Różne techniki. 

Więc chciałem się zatrzymać i rodzaj po prostu zatrzymać na małą chwilę. Wyzwanie z pilotem Centra danych jest to daleko. To nie może być może pracować. Potrzebuję moich danych w pobliżu. I trzeba zrobić swoje badania w moim laboratorium. 

I tak I niby wziął przykład funkcjonalny rezonans magnetyczny zestaw danych z naszego danych Centrum we Mszy Zachodniej. i podłączeniu go do mojego stacjonarny w Cambridge. I zagram ten mały film. Mam nadzieję, że będzie to rodzaj pracy. 

Więc to jest mi przechodzi sprawdzanie moje GPU pracuje. A ja sprawdzając, up VNC jest. I to jest mądre VNC. To jest VNC z kawałkami 3D. I tak, jak widać na krótko, to to mnie kręci to mózg wokół. Próbuję trochę się to zorientowany. A potem można przejść przez wiele różne plastry danych MRI. I jedyną rzeczą, która jest różne na ten temat jest, to przychodzi na drucie od Mszy Zachodniej. na pulpicie. I jego renderowania szybciej niż mój pulpit, bo nie ma 4000 dolarów Karta graficzna w moim pulpicie, który mamy na Mszę Zachodniej. Oczywiście, staram się być sprytny. Używam GLX w przekładnie w tle, podczas gdy robi to wszystko, aby upewnić się, że mogę podkreślić, kartę graficzną, i że to wszystko rodzaj działa i cała reszta to. Ale ważne jest to, to jest o 100 km. I widać z tego, że nie ma oczywiste opóźnienia. Rzeczy posiadających łącznie dość dobrze. 

I tak, że samo w sobie, jest przykładem, a niektóre w pigułce w jaki computing i skalowalne computing będzie się działo. Wszyscy pracujemy na cieńsza urządzenia. Nasz stosowanie tabletek wzrasta. 

Tak więc, moja węgla Ślad jest w zasadzie przejście od tego, co kiedyś zrobić, że mam Maszyna była ogromna w moim biurku, w jakim jest teraz facility-- może być wszędzie. Może być w dowolnym miejscu w ogóle. A jednak, to jeszcze w stanie przynieść powrót grafiki o wysokiej wydajności na moim pulpicie. 

Tak więc, coraz pobliżu end-- pamiętać, Mark? Cóż, mądry chłopak jest Mark. Postanowił, że idzie do zbudować realistyczny wirtualny wszechświat. To dość projektu, kiedy że masz na boisku to. Mam zamiar używać komputer, a ja zamierzam model 12 milionów lat po Big Bang do reprezentowania dzień. A potem mam zamiar zrobić, 13,8 miliardów lat kosmicznej ewolucji. Dobrze. 

To rzeczywiście korzysta z komputera był większy od naszego komputera, i przeniosły się na krajowe Zasoby dla naszych przyjaciół w dół w Teksasie. I do obiektów krajowych, to było dużo mocy obliczeniowej. Ale zrobiliśmy dużo Symulacja lokalnie aby upewnić się, że oprogramowanie pracował i systemy pracował. 

I to jest takie dni jak ten, gdy ci sobie sprawę, że jesteś wspieranie nauki na tym poziomie skali, tym ludzie mogą teraz mówić rzeczy jak, mam zamiar modelu wszechświata. I to jest jego pierwszy model. I to jest jego zespołu pierwszy model. Istnieje wiele innych ludzi, które będą przyjść za Marka, który zamierzasz chcesz model o wysokiej rozdzielczości, z większą swoistością, z większą dokładnością. 

I tak, w ciągu ostatnich kilku minut, Chcę tylko pokazać ten film Marka i Lars, że do mnie znowu, jako naukowiec życia, jest rodzajem słodkie. Tak więc, na dnie tutaj, aby zorientować was, to jest informacją, w czas od Wielkiego Wybuchu. Więc jesteśmy na około 0,7 miliardów lat. I to pokazuje aktualny aktualizacji. Więc widzisz w tej chwili, ciemnej materii i ewolucji o delikatnej strukturze i na początku struktury w naszym znanym wszechświecie. 

A punkt na tym, że ta Wszystko dzieje się wewnątrz komputera. Jest to zestaw parametrów i zestaw fizyki i zestaw matematyki i zestaw modeli które są starannie wyselekcjonowane, a następnie dokładnie ze sobą połączone w stanie do modelowania oddziaływań. 

Więc można zobaczyć kilka włączeń niektóre wybuchy tutaj gazowe. I temperatury gazu zmienia się. I można rozpocząć, aby zobaczyć strukturę widocznej zmiany wszechświata. I ważna część z tego jest, każdy mały, malutki, mała kropka Jest to kawałek fizyki i ma zestaw matematyki wokół, informowanie jej przyjaciela i jego sąsiada. 

Tak więc z punktu widzenia skalowania, to komputery mają do wszelkich prac w porozumieniu i wydajnie ze sobą rozmawiać. Tak nie może być zbyt rozmowni. Mają one do przechowywania wyników. I mają nadal poinformować wszystkich swoich znajomych. Rzeczywiście, można zobaczyć teraz, ten model na staje się coraz bardziej skomplikowany. Jest coraz więcej rzeczy dzieje. Jest coraz więcej Materiał latają. 

I to jest to, co na początku Kosmos będzie już wyglądał. To było dość owłosione miejsce. Jest eksplozje całego miejsce, potężne kolizje. I tworzenie ciężkie metale i pierwiastki. I te wielkie chmury smashing siebie z dużą siłą. 

A więc teraz jesteśmy 9600000000 lat od tej początkowej eksplozji. Zaczynasz widzieć rzeczy rodzaj uspokoił się trochę, po prostu trochę, bo energia jest teraz zaczyna się zrelaksować. I tak matematyczne Modele posiadają, że w miejscu. I zaczynasz się zobaczyć koalescencję poszczególnych elementów. I zaczynają widzieć to coś rodzaju z razem i ostygnąć. 

I to zaczyna wyglądać trochę bardziej jak nocne niebo, trochę. I to [? QSing. ?] Jesteśmy teraz 30,2 miliard lat i jesteśmy rodzajem zrobić. A potem to, co zrobili było że miały one ten model, a potem spojrzał na widzialnego wszechświata. I w zasadzie to były w stanie podjąć to i nakładki to z tym, co można zobaczyć. A wierność jest oszałamiająca, jak na jak dokładne modele komputerowe są. 

Oczywiście, astrofizycy i grup badawczych trzeba jeszcze lepszą wierność a nawet w wyższej rozdzielczości. Ale jeśli myślisz o tym, co Rozmawiałem dziś z tobą dzięki tej małej podróży po obu Przechowywanie i struktura sieci i stosy, ważne jest to, jest skala out computing istotne? To był mój pierwotny hypothesis-- z powrotem do naszej metody naukowej. 

Mam nadzieję, że na początku część tego chciałbym przewidują, że byłbym w stanie wyjaśnić, do was o skalowalne w informatyce. A my niby testowane niektórych z tych hipotez. Przeszliśmy tej rozmowy. A ja po prostu powiedzieć skalowanie computing essential-- oh, tak, bardzo tak. 

Więc kiedy myślisz o swoich kodów, kiedy robisz z CS50 projektów końcowych, gdy myślisz o swoim dziedzictwie ludzkości i środków, które możemy muszą być w stanie uruchomić te komputera Systemy, bardzo dokładnie o japonki na wat, i pomyśleć o Chaos Monkey. 

Pomyśl o swoich płatki śniegu, nie robić jednorazowych, biblioteki ponownego wykorzystania, zbudować wielokrotnego użytku codes-- wszystkie rzeczy że nauczyciele zostali nauczania, w tej klasie. Są to podstawowe aspekty. Oni nie tylko słowne zapewnienia. To są prawdziwe rzeczy. 

A jeśli ktoś z was chce pójść za mną, Jestem obsesyjno z rzeczą Twitter. Muszę jakoś dać, że w górę. Ale dużo informacje tło jest na naszej informatyki badań strona w rc.fas.harvard.edu. 

Staram i prowadź bloga górę do randka z nowoczesnych technologii i jak robimy dystrybucyjnego informatyka i tak dalej. I wtedy nasi pracownicy są zawsze dostępne przez odybot.org. I odybot jest nasz mały pomocnik. On często ma niewiele konkursy na swojej stronie internetowej też, gdzie można spróbować rozpoznać go po kampusie. Jest mały przyjazny Twarz informatyki badań. 

A ja trochę owinąć nie i dziękuję za poświęcony czas. I mam nadzieję, że pamiętacie, że Skala out computing jest realne. I istnieje wiele osób, który mam wiele znanych którzy będą w stanie Ci pomóc. A wszystko powodzenia w przyszłych przedsięwzięciach w zakresie podejmowania upewnić się, że oba nasze computing Wagi, jest wysoce efektywnych, i pomaga ludzkości więcej niż cokolwiek innego. Tak, dziękuję za poświęcony czas.