JAMES Cuff: Hi, baik sore, semua orang. Nama saya adalah James Cuff. Aku Pembantu Dekan Bidang Penelitian Komputasi di sini di Harvard University. Dan hari ini aku akan berbicara dengan Anda tentang mengapa komputasi skala-out sangat penting. 

Jadi saya kira, pertama, siapa orang ini? Mengapa aku di sini? Mengapa saya berbicara dengan Anda? Saya memiliki latar belakang dalam ilmiah komputasi dan komputasi penelitian, peregangan kembali ke Amerika Kingdom-- The Wellcome Trust Sanger Institut genome-- manusia dan kemudian baru-baru ini di Amerika Serikat bekerja di Broad dan lainnya terhormat tempat belajar, seperti Harvard. 

Saya kira apa yang benar-benar berarti bahwa aku bio molekuler pulih fisika. Jadi apa yang benar harus saya harus memberitahu Anda tentang komputasi skala-out? Ada namun. 18 tahun atau jadi saya baru saja melihat yang paling peningkatan dramatis dalam kompleksitas skala dan efisiensi keseluruhan sistem komputasi. 

Ketika saya melakukan PhD saya di Oxford, saya sangat bersemangat dengan 200 megahertz Mesin Silicon Graphics dengan 18 gigabyte penyimpanan dan satu CPU. Waktu telah berubah. Jika Anda maju cepat sekarang, kita berputar lebih dari 60.000 CPU di Harvard. Banyak organisasi lainnya berputar banyak lagi. 

Takeaway penting dari ini adalah skala yang sekarang tidak hanya tak terelakkan, itu terjadi dan itu akan terus terjadi. Jadi mari kita, sejenak, baik dari mundur dan berbicara sangat cepat tentang ilmu pengetahuan, favorit saya subjek, metode ilmiah. 

Jika Anda menjadi seorang ilmuwan, Anda harus melakukan beberapa hal penting. Jika Anda tidak melakukan hal ini, Anda dapat tidak menganggap diri seorang ilmuwan dan Anda akan berjuang untuk dapat memahami daerah Anda disiplin. 

Jadi pertama-tama, Anda akan merumuskan pertanyaan Anda, Anda menghasilkan hipotesis, tetapi yang lebih penting, Anda memprediksi results-- Anda Anda memiliki menebak untuk apa hasilnya akan. Dan akhirnya, Anda menguji Anda hipotesis dan menganalisis hasil Anda. 

Jadi metode ilmiah ini adalah sangat penting dalam komputasi. Komputasi kedua prediksi dan mampu menguji hasil Anda merupakan bagian penting dari apa yang kita butuhkan yang dapat dilakukan di metode ilmiah. Prediksi dan pencobaan adalah dua pilar yang sebenarnya metode ilmiah, dan masing-masing membutuhkan kemajuan paling signifikan dalam perhitungan modern. 

Dua pilar ilmu yang yang teori dan eksperimen. Dan baru-baru ini, komputasi sering disebutkan sebagai pilar ketiga dari ilmu pengetahuan. Jadi jika Anda siswa menonton ini, Anda sama sekali tidak ada tekanan. Pilar ketiga dari science-- tidak besar komputasi deal--, jenis penting. Senang ini adalah bagian komputasi tentu saja ilmu komputer 50. 

Jadi cukup latar belakang. Saya ingin memberitahu Anda rencana apa kita akan bicarakan hari ini. Aku akan pergi ke beberapa sejarah. Aku akan menjelaskan mengapa kita sampai di sini. Aku akan berbicara tentang beberapa sejarah komputasi di sini di Harvard, beberapa kegiatan di sekitar media sosial, hijau things-- sangat bergairah tentang segala sesuatu green-- storage-- komputer storage-- bagaimana kekacauan mempengaruhi skala-out keluar sistem, dan sistem distributif pada khususnya. 

Dan kemudian aku akan menyentuh pada beberapa dari skala-out hardware yang diperlukan untuk dapat melakukan komputasi dalam skala. Dan akhirnya, kita akan membungkus dengan beberapa ilmu yang mengagumkan. 

Jadi, mari kita luangkan waktu sebentar untuk melihat sejarah kita yang sebenarnya. Computing telah berkembang. Jadi sejak tahun 60-an, semua pergi melalui hari ini, kita lihat pada dasarnya perubahan lingkup dari komputasi terpusat untuk desentralisasi komputasi, untuk kolaboratif dan kemudian independen komputasi dan segera kembali lagi. 

Dan biarkan aku membubuhi keterangan bahwa sedikit. Ketika kami pertama kali dimulai dengan komputer, kami memiliki mainframe. Mereka inordinately perangkat mahal. Semuanya harus dibagi. Komputasi adalah kompleks. Anda dapat melihat, itu diisi kamar dan ada operator dan kaset dan segala macam whirry, clicky, perangkat spinny. 

Sekitar 70-an awal '80 -an, Anda mulai untuk melihat dampak dari mesin faks. Jadi Anda mulai melihat komputasi mulai muncul kembali di laboratorium dan menjadi lebih dekat dengan Anda. Munculnya pribadi komputer, tentu di era 80-an, awal bagian dari dekade, benar-benar berubah komputasi. 

Dan ada petunjuk di judul, karena disebut komputer pribadi, yang berarti itu milik Anda. Sehingga evolusi komputasi melanjutkan, orang menyadari bahwa pribadi mereka komputer tidak cukup benar-benar besar untuk dapat melakukan apa-apa dari jasa apapun, atau jasa yang signifikan, dalam ilmu. 

Dan orang-orang mulai mengembangkan perangkat jaringan driver untuk dapat menghubungkan PC bersama-sama untuk dapat membangun cluster. Dan jadi ini beranak era dari cluster Beowulf. Linux meledak sebagai respon terhadap sistem operasi proprietary, baik biaya dan kompleksitas. 

Dan kemudian, di sini kita hari ini, di mana, lagi-lagi, kami dihadapkan dengan kamar penuh komputer peralatan dan kemampuan untuk menggesek kartu kredit seseorang dan mendapatkan akses ke fasilitas komputasi ini, jarak jauh. 

Dan sehingga Anda kemudian dapat melihat, di segi sejarah berdampak bagaimana kita komputasi hari ini, itu pasti berevolusi dari mesin kamar penuh komputer melalui beberapa komputasi personal semua jalan segera kembali lagi mesin kamar penuh komputer. 

Jadi ini adalah klaster pertama saya. Jadi tahun 2000, kami membangun sistem komputer di Eropa untuk secara efektif membubuhi keterangan genom manusia. Ada banyak teknologi terdaftar di sisi kanan ada yang, sayangnya, tidak lagi bersama kami. Ini dilewatkan ke teknologi yang besar di langit. 

Mesin itu sendiri mungkin setara dengan laptop yang layak beberapa hari ini, dan bahwa hanya jenis menunjukkan Anda. Namun, kita hati-hati membubuhi keterangan genom manusia dan keduanya dilindungi itu dengan kertas khusus ini di Sifat dari masalah data menjadi publik atau swasta. 

Jadi ini mengagumkan, kan? Jadi kita punya genom manusia. Kami telah melakukan komputasi. Aku merasa sangat senang sendiri. Aku digulung ke Harvard pada tahun 2006, merasa jauh lebih senang dengan diri saya sendiri. 

Ini adalah apa yang saya warisi. Ini adalah departemen yang mail dan server file. Anda dapat lihat di sini ada sedikit pita yang digunakan untuk menyimpan sistem bersama-sama. Ini adalah lisensi dan print server. Aku cukup yakin mungkin ada password pada beberapa ini Post-it Notes. 

Tidak mengagumkan. Cukup jauh dari mengagumkan. Maka, saya menyadari grafik kecil ini bahwa saya menunjukkan Anda di awal dari berbagi kepemilikan kembali ke berbagi, bahwa kita perlu mengubah permainan. Dan jadi kami mengubah permainan dengan memberikan insentif. Dan sehingga manusia, karena hal ini sedikit artikel Wikipedia mengatakan di sini, makhluk tujuan kami. Dan studi insentif struktur adalah penting untuk penelitian kegiatan ekonomi. 

Jadi kita mulai untuk memberikan insentif fakultas dan peneliti kita. Dan jadi kami insentif mereka dengan sistem komputer yang sangat besar. Jadi pada tahun 2008, kami membangun 4.096 prosesor machine-- 10 rak, beberapa ratus kilowatt listrik. 

Apa yang saya pikir adalah menarik adalah tidak mana pun Anda berada dalam siklus. Ini jumlah yang sama kekuasaan dan menghitung, daya yang konstan. Itu 200 kilowatt ketika kita sedang membangun sistem di Eropa. Ini dua ratus kilowatt pada tahun 2008, dan tampaknya menjadi [itu? quanter?] kecil sistem komputasi universitas berbasis. 

Jadi Harvard today-- maju cepat, aku tidak lagi sedih panda, cukup panda bahagia. Kami telah 60-aneh ribu beban seimbang CPU, dan mendaki mereka secara dramatis. Kami memiliki 15 petabyte penyimpanan, juga naik. Sekali lagi, 200 kilowatt ini increment, kita tampaknya untuk menambahkan bahwa setiap enam bulan atau lebih. Banyak dan banyak mesin virtual. Dan yang lebih penting, sekitar 1,8 megawatt peralatan komputasi penelitian. 

Dan aku akan datang kembali ke ini nanti, mengapa sekarang saya tidak lagi harus menghitung berapa banyak CPU yang kita miliki, tapi seberapa besar tagihan listrik. 20 lainnya sehingga didedikasikan Staf komputasi penelitian. Dan yang lebih penting, kami mulai tumbuh GPGPUs kami. Aku terhuyung-huyung pada berapa banyak dari ini sedang ditambahkan pada sehari-hari. Jadi, pelajaran sejarah lebih, kan? 

Jadi bagaimana kita sampai di sana dari sini? Mari kita lihat beberapa yang modern contoh menghitung skala-out. Saya sedikit terobsesi dengan ukuran dan skala media sosial. Ada beberapa yang sangat sukses komputasi skala besar organisasi sekarang di planet ini, memberikan dukungan dan layanan bagi kita semua. Jadi itulah disclaimer. 

Dan saya ingin memulai dengan jumlah ons dalam Instagram. Ini tidak benar-benar memimpin-in ke sebuah lelucon, itu bahkan tidak lucu, sebenarnya, kalau dipikir-pikir itu. Tapi bagaimanapun, kita akan melihat ons di Instagram. Dan kita akan mulai dengan "lebah saya dan bunga." Aku berada di [tidak terdengar] Village dan saya mengambil sedikit gambaran lebah duduk di bunga. Kemudian saya mulai berpikir tentang apa ini benar-benar berarti. Dan saya mengambil gambar ini dari ponsel saya dan menghitung berapa banyak byte yang di dalamnya, dan itu sekitar 256 kilobyte. Yang ketika saya mulai, pada dasarnya akan mengisi 5 dan 1/4 inch floppy. Dan mulai berpikir, baik, itu keren. 

Dan saya mulai melihat dan melakukan beberapa penelitian pada jaringan. Dan saya menemukan bahwa Instagram memiliki 200 juta MAU. Aku tidak benar-benar bahwa yakin apa itu MAU. Dan MAU, di sini, adalah pengguna aktif bulanan. 

Jadi, 200 juta MAUs-- keren. 20 miliar photographs-- sehingga cukup banyak foto. 60 juta foto baru setiap hari keluar pada sekitar 0,002 pertunjukan per foto. Itu sekitar lima petabyte disk hanya di sana. Dan itu benar-benar tidak bagian tengah dari apa yang akan kita bicarakan. Itu adalah kentang kecil. Atau seperti yang kita katakan di Inggris, kentang kecil. 

Jadi mari kita lihat gajah nyata di wajah unik room--. Sekali lagi, mari kita mengukur dalam ini kuanta baru memanggil MAU. Facebook sendiri memiliki 1,3 miliar MAU. WhatsApp, yang aku tidak bahkan mendengar sampai saat ini, itu beberapa layanan semacam pesan, adalah 500 juta MAU. Instagram, yang kita hanya berbicara tentang, 200 juta MAU. Dan Messenger, yang layanan pesan lain, juga 200 juta MAU. 

Jadi Total bahwa sampai, ini tentang 2,2 miliar total pengguna. Jelas ada beberapa tumpang tindih, tapi itu setara dengan sepertiga dari planet ini. Dan mereka mengirim sesuatu di wilayah dari 12 miliar pesan per hari. Dan lagi, hanya ada 7 miliar orang di planet ini. Tidak semua orang memiliki smartphone. Jadi ini adalah nomor gila. 

Dan aku akan berpendapat bahwa itu tidak bahkan tentang penyimpanan atau menghitung itu. Dan mengutip lagu, itu semua tentang grafik yang. Berikut kami indah Meghan Trainor turun di sini, bernyanyi tentang semua bass. Catatan, dia juga memiliki cukup sedikit bass herself-- 207, baik 218 juta orang telah melihat Wanita muda ini menyanyikan lagunya. 

Jadi argumen saya itu itu semua tentang grafik. Jadi kami mengambil beberapa perangkat lunak open source dan mulai melihat grafik. Dan ini adalah LinkedIn, jadi ini adalah Facebook untuk orang tua. Dan, ini adalah LinkedIn grafik saya. Saya memiliki 1.200 atau lebih node, disebut "Friends." Dan inilah saya di atas. Dan inilah semua interkoneksi. 

Sekarang, pikirkan kembali cerita Instagram. Masing-masing dari ini adalah bukan hanya foto, itu memiliki sejumlah seluruh koneksi antara individu tertentu dan banyak lainnya. Ini adalah bagian sentral baik bug dalam algoritma grafik gambar, atau ini mungkin David Malan, aku belum yakin. Sehingga Anda dapat redraw grafik dalam segala macam dari gephi.gihub.io ways-- mana Anda dapat menarik perangkat lunak dari. Ini sangat keren karena mampu mengatur masyarakat. Anda dapat lihat di sini, ini adalah Harvard dan berbagai tempat lain yang saya telah bekerja, karena ini adalah data yang berhubungan dengan pekerjaan saya. 

Jadi hanya berpikir tentang kompleksitas dari grafik dan semua data bahwa Anda menarik bersama. Jadi sementara itu, kembali di FriendFace, kan? Kami melihat data Instagram yang adalah dari urutan lima petabyte. Tidak ada masalah besar. Masih cukup banyak data, tapi tidak besar berurusan dengan skema yang lebih besar hal. 

Dari artikel ini di internet lama, "Scaling data warehouse Facebook 300 petabyte. " Itu seluruh berbeda game changer sekarang, ketika Anda mulai memikirkan data dan grafik dan apa yang Anda bawa bersama. Dan data yang tinggi mereka tumbuh dari urutan 600 terrabytes hari. 

Sekarang, Anda tahu, baik, then-- Maksudku, 600 terrabytes sehari, 300 petabytes-- mereka juga sekarang mulai untuk mendapatkan sangat prihatin tentang bagaimana menjaga hal-hal ini dan untuk memastikan data ini tetap sekitar. Dan pria ini di sini, Jay Parikh, mencari bagaimana untuk menyimpan exabyte data. 

Hanya bagi Anda yang menonton bersama di rumah, seorang exabyte-- 10 ke 18. Itu punya Wikipedia sendiri Halaman, itu yang besar nomor. Itu adalah ukuran dan skala apa yang kita melihat, untuk dapat menyimpan data. Dan orang-orang ini tidak penyia-nyiaan waktu, mereka menyimpan jumlah data. Jadi salah satu petunjuk yang mereka cari di sini adalah pusat data untuk disebut cold storage. 

Yang membawa saya untuk menjadi hijau. Dan di sini adalah Kermit. Dia dan saya agree-- itu sangat sulit untuk menjadi hijau, tapi kami mencoba memberikan yang terbaik. Kermit tidak bisa menahannya, ia memiliki menjadi hijau sepanjang waktu, tidak bisa mengambil hijau-ness off sama sekali. 

Jadi, menjadi seorang concepts-- beberapa jenis konsep inti kehijauan, ketika berhubungan dengan komputasi. Salah satu yang paling penting adalah umur panjang produk. Jika produk Anda memiliki hidup yang singkat, Anda tidak bisa, menurut definisi, menjadi hijau. Energi yang diambil untuk memproduksi disk drive, motherboard, komputer sistem, tablet, apa pun itu mungkin jadi, umur panjang sistem Anda merupakan bagian penting dari bagaimana hijau Anda bisa. 

Bagian penting, karena kalian semua sedang membangun perangkat lunak algorithms-- algoritma parsial kata untuk software, kan? Jadi, desain algoritma Anda sangat penting dalam hal bagaimana Anda akan dapat membuat perhitungan cepat dan akurat untuk digunakan sedikitnya jumlah energi mungkin. Dan aku akan mendapatkan ini dalam sedikit. 

Pusat data design-- Anda telah melihat bahwa kita sudah memiliki ribuan pada ribuan mesin, duduk diam-diam di kecil, sudut-sudut gelap dari dunia, komputasi. Sumber allocation-- bagaimana untuk mendapatkan untuk menghitung, untuk penyimpanan, melalui jaringan. Sistem operasi merupakan bagian penting dari ini, dan banyak virtualisasi untuk dapat pak lebih dan lebih menghitung ke dalam ruang kecil. 

Saya akan memberikan contoh kecil dari komputasi penelitian. Kami membutuhkan lebih banyak ping, lebih listrik, dan banyak lagi pipa. Kami membutuhkan lebih besar, lebih baik, komputer yang lebih cepat, dan diperlukan untuk menggunakan lebih sedikit jus. Dan kita tidak bisa bekerja keluar bagaimana untuk melakukan hal ini. Saya tidak tahu apakah hashtag gowest sebagai mungkin telah digunakan oleh Kardashian, tapi tetap, gowest. Dan kami lakukan. 

Kami mengambil operasi kami dan kami pindah keluar Western Massachusetts di kota pabrik kecil disebut Holyoke, utara dari Chikopee dan Springfield. Kami melakukan ini untuk beberapa alasan. Yang utama adalah bahwa kita memiliki sebuah bendungan yang sangat, sangat besar. Dan bendungan yang sangat besar ini mampu mengeluarkan 30 megawatt ditambah energi, dan itu kurang dimanfaatkan pada saat itu. 

Lebih penting lagi, kami juga memiliki jaringan yang sangat rumit yang sudah di tempat. Jika Anda melihat di mana jaringan berjalan di Amerika Serikat, mengikuti semua rel kereta api. Ini bagian tertentu dari jaringan itu dimiliki oleh rekan-rekan dan teman-teman di Massachusetts Institute of Technology, dan itu pada dasarnya dibangun semua jalan keluar untuk Route 90. 

Jadi kita punya centang sungai besar, Route 90 centang, kami memiliki jalan pendek dari 100 mil, dan jalan panjang sekitar 1.000 mil. Kami harus melakukan yang sangat besar jaringan sambatan, seperti yang Anda lihat di sini, pada dasarnya menempatkan link di, ke dapat terhubung ke Holyoke, tapi kami memiliki semua yang diperlukan tersebut ping infrastructure--, listrik, pipa. Hidup itu baik. Dan lagi, bendungan besar. 

Jadi kami membangun dasarnya Massachusetts High Performance Computing hijau Center. Ini adalah tenaga kerja cinta melalui lima universities-- MIT, Harvard, UMass, Northeastern, dan BU. Lima megawatt hari satu beban terhubung. Kami melakukan segala macam kepandaian dengan economizers airside untuk menjaga hal-hal yang hijau. Dan kami dibangun rak 640-aneh, didedikasikan untuk komputasi penelitian. 

Itu adalah situs brownfield tua, jadi kita memiliki beberapa reklamasi dan beberapa rapi-up dan beberapa pembersihan situs. Dan kemudian kami mulai untuk membangun fasilitas dan, boom-- fasilitas yang indah dengan kemampuan untuk menjalankan komputasi sandbox, memiliki konferensi dan seminar, dan juga lantai data center yang besar. 

Berikut ini adalah diri saya baik. Aku jelas memakai jaket yang sama. Saya mungkin hanya memiliki satu jaket, tapi ada saya dan John Goodhue-- dia adalah direktur eksekutif Center-- berdiri di ruang mesin lantai, yang, seperti yang Anda lihat, cukup dramatis, dan kembali dengan cara yang lama. 

Saya sering bermain game mengemudi dari Boston ke Holyoke, berpura-pura bahwa aku TCP / paket IP. Dan aku khawatir tentang latency saya mengemudi di dalam mobil saya. Jadi itulah potongan hijau. Jadi mari kita hanya mengambil satu menit dan berpikir tentang tumpukan. Jadi kita berusaha sangat hati-hati untuk membangun pusat data secara efisien, komputasi secara efisien, membuat baik seleksi untuk peralatan komputasi dan memberikan lebih penting, aplikasi kita, baik itu layanan pesan atau aplikasi ilmiah. 

Jadi di sini adalah tumpukan. Jadi lapisan fisik, semua cara melalui application-- berharap bahwa ini akan menjadi bagian yang baik tentu saja Anda. OSI tujuh lapisan model dasarnya, Anda akan hidup, makan, dan bernapas ini sepanjang karier Anda komputasi. Seluruh konsep fisik kabel infrastructure--, kabel, pusat data, link. Dan ini hanya menggambarkan jaringan. 

Sampai di sini adalah, baik, jelas, ini adalah slide tua, karena ini harus mengatakan HTTP, karena tak ada yang peduli tentang surat sederhana protokol transportasi, lagi. Ini semua terjadi di ruang HTTP. Jadi itulah satu tingkat dari stack. 

Berikut set tumpukan, di mana Anda memiliki server, host, hypervisor, tamu, perpustakaan biner, dan kemudian aplikasi Anda. Atau, dalam hal ini, perangkat driver, kernel Linux, asli c, Mesin virtual Java, Java API, maka Java aplikasi, dan sebagainya dan sebagainya. Ini adalah deskripsi dari mesin virtual. 

Tumpukan Kudus, Batman! Pikirkan tentang hal ini di hal berapa banyak menghitung Anda perlu untuk mendapatkan dari apa yang terjadi di sini, sepanjang jalan sampai ke atas tumpukan ini, untuk kemudian dapat melakukan yang sebenarnya Anda pengiriman aplikasi. 

Dan jika Anda jenis mundur dan mulai berpikir tentang apa yang diperlukan untuk menyediakan operasi floating point, operasi floating point Anda adalah penjumlahan soket, jumlah core dalam soket, jam, yang seberapa cepat bisa jam turnover-- empat gigahertz, dua gigahertz-- lalu nomornya operasi Anda bisa lakukan dalam hertz tertentu. 

Jadi mereka mikroprosesor saat ini lakukan antara empat dan 6 FLOPS per siklus clock. Dan jadi single-core 2,5 manggung jam memiliki kinerja teoritis dari sekitar Flop mega, memberi atau mengambil. 

Namun, seperti dengan segala sesuatu, kita memiliki pilihan. Jadi dan Intel Core 2, Nehalem Sandy Bridge, Haswell, AMD, mengambil choices-- Anda Intel Atom. Semua arsitektur prosesor ini semua memiliki cara yang sedikit berbeda untuk dapat menambah dua angka bersama-sama, yang pada dasarnya tujuan hidup mereka. Harus sulit. Ada jutaan dari mereka duduk di pusat data, sekarang meskipun. 

Sor, jepit per watt-- ini adalah hal yang besar. Jadi jika saya ingin mendapatkan lebih dari ini untuk melewati tumpukan ini, lebih cepat, Aku harus bekerja pada berapa banyak operasi floating point kedua, Aku bisa melakukannya, dan kemudian memberi mereka watt. Dan untungnya, orang-orang telah memikirkan hal ini. 

Jadi ada besar kontes setiap tahun untuk melihat yang dapat membangun komputer tercepat yang dapat diagonalize matriks. Ini disebut Top 500. Mereka memilih atas dari yang terbaik 500 komputer di planet ini yang bisa matriks diagonalize. Dan Anda mendapatkan beberapa hasil yang luar biasa. 

Banyak mesin-mesin yang antara 10 dan 20 megawatt. Mereka dapat diagonalize matriks inordinately cepat. Mereka tidak perlu didiagonalkan mereka seefisien per watt, sehingga ada dorongan besar ini untuk melihat apa 500 daftar hijau akan terlihat seperti. Dan di sini adalah daftar dari bulan Juni. Harus ada yang baru sangat lama. 

Dan panggilan out-- Aku akan mengambil bagian atas daftar tertentu. Ada dua satu machines-- tertentu dari Tokyo Institute of Technology dan satu dari Cambridge Universitas di Inggris. Dan ini memiliki cukup mengejutkan mega jepit per rasio watt. Yang satu ini 4389, dan berikutnya satu ke bawah adalah 3.631. 

Saya akan menjelaskan perbedaan antara kedua, di slide berikutnya. Tapi ini ini berukuran sedang cluster tes. Ini hanya 34 kilowatt atau 52 kilowatt. Ada beberapa yang lebih besar di sini-yang satu ini di Swiss National Supercomputing Centre. Pesan take home untuk ini adalah bahwa kita mencoba untuk menemukan komputer yang dapat beroperasi secara efisien. 

Dan, mari kita lihat di bagian ini satu, cutely disebut, KFC. Dan sedikit iklan di sini. Ini perusahaan makanan tertentu tidak ada hubungannya dengan hal ini. Ini adalah fakta bahwa sistem tertentu direndam dalam sangat pintar berbasis senyawa minyak. Dan mereka punya mereka ayam fryer moniker ketika mereka pertama kali mulai membangun jenis sistem. 

Tapi pada dasarnya apa yang mereka telah diambil di sini adalah beberapa pisau, menempatkan mereka dalam hal ini minyak mineral canggih, dan kemudian bekerja keluar bagaimana untuk mendapatkan semua jaringan masuk dan keluar dari itu. Kemudian, tidak hanya itu, mereka telah meletakkannya di luar jadi yang dapat memanfaatkan luar pendingin udara. Itu cukup mengesankan. Jadi Anda harus melakukan semua dari shenanigans ini untuk bisa mendapatkan jumlah ini menghitung disampaikan untuk watt kecil. 

Dan Anda bisa melihat ini adalah bentuk di mana hal-hal yang menuju. Tantangannya adalah bahwa udara biasa pendinginan adalah skala ekonomi dan mendorong banyak pengembangan kedua komputasi biasa, dan komputasi kinerja tinggi. Jadi, ini cukup mengganggu. Saya rasa ini adalah menarik. Ini sedikit berantakan ketika Anda mencoba untuk swap disk drive, tapi itu ide yang benar-benar keren. 

Jadi tidak hanya itu, ada sejumlah besar pekerjaan sedang dibangun di sekitar apa yang kita memanggil Open Project Compute. Dan, lebih lanjut tentang itu sedikit kemudian. Namun industri mulai menyadari bahwa FLOPS per watt menjadi penting. Dan Anda, sebagai orang-orang di sini, karena Anda merancang algoritma Anda dan Anda merancang Anda kode, Anda harus menyadari bahwa kode Anda bisa memiliki efek knock-on. 

Ketika Mark sedang duduk di sini dalam bukunya kamar asrama menulis Facebook 1.0, Aku cukup yakin dia memiliki pandangan bahwa itu akan menjadi besar. Tapi bagaimana besar itu akan berada di Lingkungan adalah dealio besar. Dan semua ya akan bisa datang dengan algoritma yang bisa menjadi menantang berikutnya hal untuk orang-orang seperti saya, mencoba untuk menjalankan sistem. 

Jadi mari kita berpikir tentang batas kekuatan dunia nyata. Makalah ini dengan Landauer-- bukan hal yang baru. 1961 ini diterbitkan dalam Journal IBM. Ini adalah kanonik yang "Ireversibilitas dan Panas Generasi dalam Proses Computing. " Dan ia berpendapat bahwa mesin pasti melakukan fungsi logistik yang tidak memiliki nilai-tunggal terbalik. 

Sehingga seluruh bagian dari ini adalah bahwa kembali di tahun 60-an, orang tahu bahwa ini adalah akan menjadi masalah. Dan hukum batas mengatakan 25 derajat C, semacam ruang kanonik suhu, batas mewakili 0,1 volt elektron. Tapi secara teoritis, ini memori teori, komputer, beroperasi pada batas ini bisa berubah pada satu milyar bit per detik. 

Aku tidak tahu tentang Anda, tapi tidak menemukan banyak satu miliar bit kedua pertukaran data rate. Argumen ada yang hanya 2,8 triliun watt kekuasaan seharusnya pernah diperluas. 

Baiklah, dunia nyata example-- ini adalah tagihan listrik saya. Saya 65% persen yang indah pusat data Saya menunjukkan, dalam waktu tertentu. Hal ini kembali pada bulan Juni tahun lalu. Saya telah mengambil versi lama sehingga kita bisa dan semacam anonim sedikit. Aku menghabiskan $ 45,000 a bulan untuk energi di sana. 

Jadi alasannya karena ada adalah bahwa kita memiliki lebih dari 50.000 proses di kamar. Jadi bisa Anda bayangkan sendiri tagihan listrik perumahan adalah bahwa tinggi? Tapi itu untuk 199 juta watt jam lebih dari satu bulan. 

Jadi pertanyaan saya mengajukan dapat adalah, Anda bayangkan tagihan listrik Mr. Zuckerberg? Tambang ini cukup besar, dan saya berjuang. Dan aku tidak sendirian dalam hal ini adalah. Ada banyak orang dengan pusat data besar. Dan, saya kira, disclosure-- penuh teman Facebook saya sedikit aneh. 

Jadi teman Facebook saya adalah data Prineville center, yang merupakan salah satu Facebook di dunia, terbaru, terendah data energi center. Dan mereka posting ke saya, hal-hal seperti daya efektivitas pemanfaatan, seperti dalam seberapa efektif adalah data pusat versus berapa banyak energi yang Anda menempatkan ke dalamnya, berapa banyak air yang mereka gunakan, apa kelembaban dan suhu. 

Dan mereka memiliki ini indah, indah plot. Saya pikir ini adalah Halaman Facebook mengagumkan, tapi kurasa aku sedikit aneh. 

Jadi satu hal lebih banyak kekuatan, komputasi penelitian yang saya lakukan berbeda secara signifikan apa Facebook dan Yahoo dan Google dan lainnya on-demand, sepenuhnya, layanan selalu tersedia. Dan jadi saya memiliki keuntungan bahwa ketika ISO England-- Baru dan ISO New England membantu mengatur energi Harga untuk daerah. 

Dan ia mengatakan itu memperluas permintaan konsumen untuk secara sukarela menghemat energi tinggi, karena panas tinggi dan kelembaban. Dan ini kembali pada 18 Juli. Dan jadi saya bahagia Tweet kembali, Hei, ISO New England, Hijau Harvard. Kami melakukan bagian kita lebih di sini dalam komputasi penelitian. Dan ini adalah karena kita melakukan ilmu pengetahuan. 

Dan sebanyak orang mengatakan ilmu tidak pernah tidur, ilmu pengetahuan bisa menunggu. Jadi kita mampu quiesce kami sistem, mengambil keuntungan dari tingkat kelas pada tagihan energi kita, dan membantu seluruh New England wilayah dengan mencurahkan banyak megawatt beban. Jadi itulah hal unik yang berbeda tentang data komputasi ilmiah pusat dan mereka yang dalam produksi penuh 24/7. 

Jadi mari kita mengambil peralatan lain di sini. Jadi, saya ingin membahas kekacauan sedikit. Dan saya ingin memasukkannya ke dalam naungan penyimpanan. Jadi bagi mereka yang seperti dari berjuang mendapatkan kepala mereka di sekitar apa yang petabyte penyimpanan terlihat seperti, ini contoh. Dan ini adalah semacam hal Saya berurusan dengan sepanjang waktu. 

Masing-masing dari ini Sobat kecil adalah empat terabyte hard drive, sehingga Anda dapat jenis menghitung mereka. Kita mulai sekarang antara satu sampai 1 dan 1/2 petabyte di rak standar industri. Dan kami memiliki kamar dan kamar, seperti yang Anda melihat dalam gambar sebelumnya dengan John dan saya, penuh rak-jenis peralatan. Jadi itu menjadi sangat, sangat mudah untuk membangun array penyimpanan yang besar 

Itu sebagian besar mudah dalam Unix untuk jenis menghitung bagaimana hal tersebut terjadi. Jadi ini adalah menghitung berapa banyak Poin MAU memiliki aku sampai di sana. Jadi itulah 423 poin mencegat. Dan kemudian jika saya menjalankan beberapa awk samar, saya dapat menambahkan, dalam sistem tertentu, ada 7,3 petabyte penyimpanan yang tersedia. 

Jadi itulah banyak hal. Dan penyimpanan sangat sulit. Namun, untuk beberapa alasan, ini merupakan tren industri. Setiap kali saya berbicara dengan para peneliti kita dan fakultas kami dan berkata, hey, saya dapat menjalankan penyimpanan untuk Anda. Sayangnya, saya harus memulihkan biaya penyimpanan. Saya mendapatkan bisnis ini. Dan orang-orang referensi Newegg atau mereka referensi Staples atau berapa banyak mereka dapat membeli satu terabyte disk drive untuk. 

Jadi ini, Anda akan dicatat di sini, bahwa ada petunjuk. Ada satu disk drive di sini. Dan jika kita kembali, saya punya banyak. Tidak hanya saya banyak, saya memiliki interkoneksi canggih untuk dapat menjahit hal-hal ini bersama-sama. Jadi risiko yang terkait dengan besar array penyimpanan tidak signifikan. 

Bahkan, kami mengambil ke internet dan kami menulis sedikit cerita tentang bermaksud baik, Direktur berwatak halus penelitian computing-- kebetulan memiliki English aneh accent-- mencoba untuk menjelaskan kepada peneliti apa tidak ada folder garis bawah cadangan sebenarnya berarti. Itu cukup, cerita agak panjang, baik empat menit penemuan. 

Dan catatan, saya memiliki mengerikan banyak ruang kurang dari wanita yang menyanyikan tentang semua bass. Kami beberapa account yang lebih rendah. Tapi bagaimanapun, ini adalah hal yang penting untuk dipikirkan, dalam hal apa yang bisa salah. Jadi jika saya mendapatkan disk drive, dan Aku membuangnya di mesin Unix, dan aku mulai menulis hal-hal itu, ada magnet, ada kepala drive, ada pura-pura, satu atau nol yang ditulis pada perangkat itu. 

Spinny Motors--, twirly hal selalu istirahat. Pikirkan tentang hal-hal yang melanggar. Ini selalu spinny, twirly hal. Printer, disk drive, kendaraan bermotor, dan lain-lain Sesuatu yang bergerak adalah mungkin untuk istirahat. 

Jadi, Anda perlu motor, Anda perlu mendorong firmware, Anda perlu SAS / SATA controller, kabel, firmware pada controller SAS / SATA, blok tingkat rendah. Pilih berkas pengontrol penyimpanan Anda sistem kode, mana yang mungkin, bagaimana Anda menjahit sesuatu bersama-sama. Dan manajer memori virtual Anda halaman, DRAM mengambil dan toko. Kemudian, Anda mendapatkan lain stack, yang merupakan jenis down daftar di ini satu, algoritma, pengguna. 

Dan jika Anda kalikan ini up, saya tidak tahu berapa banyak, ada banyak tempat di mana hal-hal dapat pergi ke samping. Maksudku, itu contoh tentang matematika. Tapi itu semacam menyenangkan untuk memikirkan berapa banyak cara hal yang bisa salah, hanya untuk disk drive. Kami sudah di 300 petabyte, sehingga bayangkan jumlah disk drive Anda butuhkan pada 300 petabyte yang bisa salah. Tidak hanya itu-- jadi itu penyimpanan. Dan yang menyinggung orang yang saya ingin melihat memasuki tahap kiri, yang adalah Chaos Monyet. Jadi pada titik tertentu, itu akan lebih lebih besar dari sekedar disk drive masalah. 

Dan, wanita-wanita yang baik dan pria yang menjalankan layanan video streaming menyadari bahwa komputer mereka juga besar dan juga sangat rumit dan juga menyediakan layanan untuk mengerikan banyak orang. Mereka punya 37 juta members-- dan ini geser yang mungkin satu tahun atau lebih old-- ribuan perangkat. Ada miliaran jam video. Mereka log miliaran peristiwa sehari. 

Dan Anda bisa lihat, kebanyakan orang menonton yang televisi nanti di malam hari, dan jauh melampaui segalanya. Dan, mereka ingin dapat memastikan bahwa layanan ini dan handal dan bekerja untuk mereka. Jadi mereka datang dengan ini hal yang disebut Chaos Monyet. Ini bagian dari perangkat lunak yang, ketika Anda berpikir tentang berbicara tentang judul dari seluruh presentasi ini, skala-out berarti Anda harus menguji hal ini. Ini tidak baik hanya memiliki satu juta mesin. Jadi hal yang baik tentang ini, Chaos Monyet adalah layanan yang mengidentifikasi kelompok sistem dan secara acak berakhir satu sistem dalam kelompok. Mengagumkan. Jadi saya tidak tahu tentang Anda, tetapi jika aku pernah membangun sebuah sistem yang bergantung pada yang lain sistem berbicara satu sama lain, Anda mengambil salah satu dari mereka keluar, kemungkinan hal seluruh kerja, berkurang dengan cepat. 

Dan software ini berjalan sekitar infrastruktur Netflix. Untungnya, ia mengatakan hal itu hanya berjalan di jam kerja dengan maksud bahwa insinyur akan waspada dan mampu merespon. Jadi ini adalah jenis hal kami sekarang harus lakukan untuk mengacaukan komputasi kami lingkungan, untuk memperkenalkan kekacauan dan untuk memperkenalkan kompleksitas. 

Jadi siapa, dalam hak mereka pikiran, rela akan memilih untuk bekerja dengan Chaos Monyet? Tunggu, dia tampaknya menunjuk saya. Nah, saya kira saya should-- lucu. Tapi masalahnya adalah Anda tidak mendapatkan pilihan. Chaos Monyet, seperti yang Anda bisa melihat, memilih Anda. 

Dan ini adalah masalah komputasi di skala adalah bahwa Anda tidak dapat menghindari hal ini. Ini adalah keniscayaan kompleksitas dan skala dan evolusi kita, dalam beberapa hal, keahlian komputasi. Dan ingat, ini adalah satu hal yang perlu diingat, Chaos Monkeys cinta cinta kepingan salju snowflakes--. Sebuah snowflake-- kami telah menjelaskan Chaos Monkey-- tapi kepingan salju adalah server yang unik dan khusus dan halus dan individu dan tidak akan pernah diperbanyak. 

Kita sering menemukan kepingan salju layanan di lingkungan kita. Dan kami selalu mencoba dan mencair layanan kepingan salju. Tetapi jika Anda menemukan server di lingkungan Anda yang sangat penting untuk umur panjang organisasi dan meleleh, Anda tidak dapat menempatkan kembali bersama-sama lagi. Jadi pekerjaan Chaos Monyet adalah untuk pergi dan mengakhiri kasus. Jika Chaos Monyet mencair snowflake, Anda berakhir, Anda sudah selesai. Saya ingin berbicara tentang beberapa hardware yang kita melihat dari segi jenis kegiatan skala-out juga. Dan beberapa hal unik yang ada di dan sekitar kegiatan ilmiah. Kami sekarang mulai melihat, ingat Unit ini masalah, rak ini? Jadi ini adalah rak GPGPUs-- begitu umum Tujuan unit pengolahan grafis. 

Kami telah ini terletak di data kami pusat, 100 atau lebih mil jauhnya. Rak khusus ini adalah sekitar 96 tera FLOPS tunggal-presisi matematika mampu untuk memberikan keluar dari belakang itu. Dan kami memiliki urutan 130-aneh kartu di sebuah contoh yang we-- beberapa rak hal ini. 

Jadi ini adalah menarik dalam arti bahwa proses tujuan umum grafis mampu melakukan matematika sangat cepat untuk jumlah yang sangat rendah energi. Jadi ada uptick besar daerah komputasi ilmiah, melihat grafik unit pengolahan di jalan besar. 

Jadi aku berlari beberapa Mcollective melalui infrastruktur boneka kami kemarin, sangat bersemangat tentang hal ini. hanya singkat petaflop sebuah dari presisi tunggal. Hanya untuk menjadi jelas di sini, ini sedikit multiplier adalah 3,95. Matematika presisi ganda akan menjadi sekitar 1,2, tapi Twitter feed saya tampak cara yang lebih baik jika saya mengatakan kami memiliki hampir petaflop sebuah tunggal-presisi GPGPUs. 

Tapi itu sampai ke sana. Sudah mulai menjadi sangat, sangat mengesankan. Dan mengapa kita melakukan ini? Karena kimia kuantum, antara lain, tapi kami mulai merancang beberapa photovoltaics baru. 

Dan Alan Aspuru-Guzik, yang adalah profesor chemistry-- pasangan saya di crime-- selama beberapa tahun terakhir. Kami telah mendorong amplop pada komputasi. Dan GPGPU ideal teknologi untuk dapat melakukan banyak sekali rumit matematika, sangat, sangat cepat. 

Jadi dengan skala, datang tantangan baru. Jadi scale-- besar Anda harus hati-hati bagaimana Anda kawat hal ini. Dan kami memiliki tingkat tertentu gangguan obsesif kompulsif. Foto-foto ini mungkin mendorong banyak orang gila. Dan lemari yang tidak kabel dengan baik mendorong jaringan dan Fasilitas insinyur kacang. Ditambah ada juga aliran udara masalah yang Anda harus mengandung. 

Jadi ini adalah hal yang saya tidak akan pernah memikirkan. Dengan skala, datang lebih kompleksitas. Ini adalah jenis baru dari sistem file. Ini mengagumkan. Ini petabyte. Hal ini dapat menyimpan 1,1 miliar file. Hal ini dapat membaca dan menulis untuk 13 gigabyte dan 20 gigabyte yang gigabyte second-- kedua. Sehingga dapat membongkar terabyte dalam waktu singkat. 

Dan itu sangat tersedia. Dan itu punya menakjubkan lookup rates-- 220.000 lookup kedua. Dan ada banyak orang yang berbeda membangun semacam ini sistem. Dan Anda bisa melihatnya di sini grafis. Ini adalah salah satu sistem file kita itu di bawah beban, cukup gembira membaca di hanya pendek dari 22 gigabyte per detik. Jadi itulah cool-- sehingga kompleksitas. 

Jadi dengan kompleksitas dan skala, datang kompleksitas, kan? Ini adalah salah satu dari banyak kami, banyak diagram jaringan, di mana Anda memiliki banyak berbeda chassis semua mendukung sampai ke saklar inti utama, terhubung ke penyimpanan, menghubungkan ke interkoneksi latency rendah. Dan kemudian semua sisi ini rumah, hanya semua manajemen Anda harus mampu untuk mengatasi sistem ini dari lokasi terpencil. Jadi skala memiliki banyak kompleksitas dengan itu. 

Mengubah gigi lagi, mari kita kembali dan memiliki sedikit tempat ilmu pengetahuan. Jadi, ingat, penelitian komputasi dan shim-- kecil ini sedikit merah muda shim antara fakultas dan semua algoritma mereka dan semua ilmu dingin dan semua daya dan pendinginan dan data center ini lantai dan jaringan dan komputer besar dan meja layanan dan bantuan meja dan forth-- dan begitu, kami hanya shim kecil di antara mereka. 

Apa yang telah kita mulai lihat adalah bahwa dunia itu mampu membangun pusat-pusat data yang besar dan mampu membangun ini komputer besar. Kita sudah cukup bagus dalam hal itu. Apa yang kita tidak pandai adalah ini sedikit shim antara penelitian dan logam telanjang dan teknologi. Dan sulit. 

Dan kami telah mampu untuk menyewa Orang-orang yang hidup di dunia ini. Dan baru-baru ini, kami berbicara kepada National Science Foundation dan berkata, hal skala-out ini sangat bagus, tapi kita tidak bisa mendapatkan ilmuwan kami pada mesin-mesin yang rumit yang besar. Dan, telah ada jumlah program yang berbeda di mana kita benar-benar sebagian besar prihatin tentang mencoba untuk melihat apakah kita bisa mengubah infrastruktur kampus. 

Ada banyak program sekitar pusat-pusat nasional. Dan, diri kita sendiri, kita teman-teman di Clemson, University of Wisconsin Madison, Southern California, Utah, dan Hawaii jenis bersama-sama untuk melihat masalah ini. Dan grafik kecil ini di sini adalah ekor panjang ilmu pengetahuan. 

Jadi ini is-- itu tidak Hal apa yang ada di sumbu ini, tapi sumbu ini sebenarnya angka pekerjaan melalui cluster. Jadi ada 350.000 lebih waktu apa pun periode. Ini adalah tersangka kami biasa di bagian bawah di sini. Bahkan, ada Alan Aspuru-Guzik, yang kami hanya berbicara about-- ton dan ton menghitung, benar-benar efektif, tahu apa yang dia lakukan. 

Berikut lab lain yang saya akan berbicara sekitar di laboratorium John Kovac yang moment--. Mereka punya itu. Mereka baik. Mereka senang. Mereka komputasi. Ilmu besar semakin dilakukan. Dan kemudian, seperti yang Anda jenis dari datang ke sini, ada kelompok lain yang tidak menjalankan banyak pekerjaan. 

Dan kenapa begitu? Apakah karena komputasi terlalu keras? Apakah karena mereka tidak tahu bagaimana? Kita tidak tahu, karena kami telah pergi dan melihat. Dan itulah yang ini Proyek adalah semua tentang, adalah lokal, dalam masing-masing daerah, untuk melihat ke jalan di mana kita bisa terlibat dengan fakultas dan peneliti benar-benar di ujung bawah ekor, dan memahami apa yang mereka lakukan. 

Jadi itu sesuatu yang kita sebenarnya bergairah. Dan itu adalah sesuatu yang ilmu tidak akan melanjutkan untuk bergerak maju sampai kita memecahkan beberapa kasus tepi tersebut. Potongan lain ilmu yang akan up-- orang melihat Large Hadron Collider. Mengagumkan, kan? Hal ini semua berlari keluar di Holyoke. Kami built-- yang pertama ilmu yang terjadi di Holyoke adalah kolaborasi antara diri kita sendiri dan Boston University. Jadi itu benar-benar, benar-benar keren. 

Ini adalah menyenangkan sepotong ilmu untuk skala. Ini adalah akses digital ke abad langit di Harvard. Pada dasarnya, ini adalah arsip piring. Jika Anda pergi ke Oxford-- Garden Street, maaf, Anda akan menemukan salah satu observatorium bangunan pada dasarnya penuh sekitar setengah juta piring. 

Dan ini adalah gambar dari langit di malam hari, lebih dari 100 tahun. Jadi ada seluruh rig mengatur di sini untuk mendigitalkan piring mereka, mengambil gambar dari mereka, daftar mereka, menempatkan mereka pada komputer. Dan itu adalah petabyte dan setengah, tepat besar-- satu proyek kecil. 

Ini adalah proyek-proyek lain. Proyek Pan-STARRS ini adalah melakukan survei panorama lebar penuh, mencari dekat asteroid Bumi dan acara langit sementara. Sebagai biofisika molekuler, aku cinta kata event langit sementara. Saya tidak yakin apa itu, tapi lagi pula, kita mencari mereka. 

Dan kami menghasilkan 30 terabyte malam dari orang-orang teleskop. Dan itu tidak benar-benar bandwidth Masalahnya, itu seperti masalah FedEx. Jadi Anda dimasukkan penyimpanan pada van dan Anda kirimkan apapun itu. 

Bisep benar-benar interesting-- sehingga pencitraan background kosmik galaksi polarisasi ekstra. Ketika saya pertama kali mulai bekerja di Harvard tujuh atau lebih, delapan tahun yang lalu, saya ingat bekerja pada proyek ini dan itu tidak benar-benar tenggelam rumah sebagai cahaya mengapa terpolarisasi dari gelombang mikro kosmik latar belakang akan menjadi penting, sampai hal ini terjadi. 

Dan ini adalah John Kovac, yang saya berbicara dengan sebelumnya, menggunakan jutaan pada jutaan CPU jam, di fasilitas kami dan lain-lain, pada dasarnya menatap ke dalam dari saat pertama alam semesta setelah Big Bang, dan mencoba memahami Teori umum relativitas Einstein. Ini pikiran bertiup bahwa komputer kita membantu kami mengungkap dan menatap ke asal-usul mengapa kita ada di sini. 

Jadi, ketika Anda berbicara tentang skala, ini adalah beberapa skala yang serius. Hal lain skala adalah, bahwa proyek tertentu memukul orang-orang ini. Dan ini adalah kurva respon untuk bisep [Tak terdengar] Ini adalah survei kecil kami. 

Dan Anda bisa lihat di sini, hidup baik sampai di sini, yang ketika Pengumuman keluar. Dan Anda sudah mendapat harfiah detik untuk merespon ke acara skala yang sesuai dengan titik kecil di sini, yang akhirnya bergeser empat atau lebih terabyte data melalui server web yang day-- cukup berbulu. 

Dan, ini adalah jenis hal-hal yang bisa terjadi pada Anda dalam infrastruktur Anda jika Anda tidak desain untuk skala. Kami memiliki sedikit berebut hari itu, menjadi mampu menjangkau keluar layanan web yang cukup untuk menjaga situs dan berjalan. Dan kami berhasil. Ini adalah email sedikit itu agak lucu. Ini adalah mail ke Mark Vogelsberger, dan Lars Hernquist, siapa anggota fakultas di Harvard. Lebih lanjut tentang Mark nanti. Tapi saya pikir ini adalah salah satu semacam meringkas jenis di mana komputasi adalah dalam komputasi penelitian. Hei, tim, sejak terakhir Selasa, kalian disiksa sampai lebih dari 28% dari baru cluster, yang dikombinasikan adalah lebih dari 78 tahun CPU hanya dalam tiga hari. Dan saya katakan, itu masih hanya Jumat pagi. Ini sangat mengagumkan! Selamat Hari Jumat! 

Lalu aku memberi mereka poin data. Dan yang agak menarik. Jadi ingat tentang Mark, dia akan datang kembali ke dalam gambar dalam sedikit. Jadi komputasi skala-out di mana-mana. 

Kami bahkan membantu orang melihat bagaimana fungsi NBA, dan di mana orang-orang melempar bola dari. Saya tidak benar-benar memahami game ini juga baik, tapi tampaknya, itu adalah masalah besar. Ada simpai dan mangkuk dan uang. 

Dan, database kami, kami dibangun sedikit 500 [tidak terdengar] klaster prosesor paralel, beberapa terabyte RAM, untuk dapat membangun ini untuk Kirk dan timnya. Dan mereka melakukan komputasi di seluruh cara lain. Sekarang ini adalah proyek kami terlibat dengan itu benar-benar menarik, di sekitar saraf connectomics plastisitas dan genomik imprinting-- tiga sangat berat daerah memukul penelitian bahwa kita berjuang dengan di sehari-hari. Gagasan bahwa otak kita berada di bawah stres plastik ketika kita masih muda. Dan banyak dari perilaku orang dewasa kita diukir oleh pengalaman pada masa bayi. Jadi ini adalah dealio besar. 

Dan ini adalah pekerjaan yang didanai oleh National Institutes of Mental Health. Dan kami berusaha untuk dasarnya, melalui banyak data yang besar dan analisis data yang besar, baik dari mengintip ke otak manusia melalui berbagai teknik yang berbeda. 

Jadi saya ingin berhenti dan jenis hanya berhenti sejenak kecil. Tantangan dengan remote pusat data itu jauh. Ini tidak mungkin bekerja. Saya perlu data saya dekat. Saya perlu melakukan penelitian di lab saya. 

Dan jadi aku agak mengambil contoh dari pencitraan resonansi magnetik fungsional kumpulan data dari data kami pusat di Western Mass. dan terhubung ke saya desktop Cambridge. Dan aku akan memutar video kecil ini. Mudah-mudahan itu akan jenis bekerja. 

Jadi ini saya akan melalui memeriksa GPU saya bekerja. Dan aku memeriksa bahwa VNC terserah. Dan ini adalah VNC pintar. Ini adalah VNC dengan potongan-potongan 3D. Dan, seperti yang Anda lihat segera, ini adalah saya berputar otak ini sekitar. Saya mencoba untuk jenis mendapatkannya berorientasi. Dan kemudian saya bisa bergerak melalui banyak irisan data yang berbeda MRI. Dan satu-satunya hal yang berbeda tentang hal ini adalah, itu datang melalui kawat dari Western Mass. untuk desktop saya. Dan rendering lebih cepat dari desktop saya, karena saya tidak memiliki $ 4.000 kartu grafis di desktop saya, yang kita telah keluar Western Mass. Tentu saja, aku berusaha untuk menjadi pintar. Aku berlari gigi GLX di latar belakang, sementara melakukan semua ini, memastikan bahwa saya bisa menekankan kartu grafis, dan bahwa semua jenis bekerja dan semua sisanya. Tapi yang penting adalah, apakah ini adalah 100 mil jauhnya. Dan Anda dapat melihat dari sini bahwa tidak ada latency yang jelas. Hal memegang bersama-sama cukup baik. 

Dan sehingga, dalam dan dari dirinya sendiri, adalah contoh dan beberapa wawasan bagaimana komputasi dan skala-out komputasi yang akan terjadi. Kita semua bekerja pada tipis dan lebih tipis perangkat. Kami menggunakan tablet meningkat. 

Jadi karena itu, karbon saya jejak pada dasarnya bergerak dari apa yang digunakan untuk melakukan itu akan sudah menjadi mesin besar di bawah meja saya, untuk apa sekarang facility-- yang bisa di mana saja. Ini bisa di mana saja sama sekali. Namun, itu masih mampu membawa kembali kinerja grafis tinggi untuk desktop saya. 

Jadi, semakin dekat end-- ingat Mark? Nah, anak pintar Mark. Dia memutuskan bahwa dia akan membangun jagad maya realistis. Itu cukup sebuah proyek, ketika Anda pikir Anda harus lapangan ini. Aku akan menggunakan komputer, dan aku akan untuk model 12 juta tahun setelah Big Bang untuk mewakili hari. Dan kemudian aku akan melakukan 13,8 miliar tahun evolusi kosmik. Baiklah. 

Ini benar-benar menggunakan komputer yang lebih besar dari komputer kita, dan tumpah ke nasional sumber daya untuk teman-teman kita turun di Texas. Dan untuk fasilitas nasional, ini banyak menghitung. Tapi kami melakukan banyak simulasi lokal untuk memastikan bahwa perangkat lunak bekerja dan sistem bekerja. 

Dan hari-hari seperti ini ketika Anda menyadari bahwa Anda mendukung ilmu pengetahuan pada tingkat skala, yang orang sekarang bisa mengatakan hal-hal seperti, aku akan model alam semesta. Dan ini adalah model pertamanya. Dan ini adalah model pertama timnya. Ada banyak lainnya Orang-orang yang akan untuk datang di belakang Mark, yang akan ingin model dengan resolusi tinggi, dengan lebih spesifisitas, dengan lebih akurat. 

Dan, dalam beberapa menit terakhir, Saya hanya ingin menunjukkan video ini Mark dan Lars itu padaku, sekali lagi, sebagai ilmuwan hidup, jenis cute. Jadi ini, di bagian bawah di sini, untuk mengarahkan Anda, ini memberitahu Anda waktu sejak Big Bang. Jadi kita sekitar 0,7 miliar tahun. Dan ini menunjukkan update saat ini. Jadi Anda lihat pada saat ini, materi gelap dan evolusi dari struktur halus dan awal struktur di alam semesta yang diketahui kami. 

Dan titik ini adalah bahwa ini semua dilakukan di dalam komputer. Ini adalah satu set parameter dan satu set fisika dan satu set matematika dan satu set model yang hati-hati dipilih, dan kemudian hati-hati terhubung satu sama lain untuk dapat memodelkan interaksi. 

Sehingga Anda dapat melihat beberapa dimulai dari beberapa ledakan gas di sini. Dan temperatur gas berubah. Dan Anda dapat mulai untuk melihat struktur perubahan alam semesta terlihat. Dan bagian penting dengan ini adalah, masing-masing sedikit kecil, kecil, kecil dot adalah bagian dari fisika dan memiliki satu set matematika sekitar, menginformasikan teman dan tetangganya. 

Jadi dari perspektif scaling, ini komputer harus semua pekerjaan dalam konser dan berbicara satu sama lain secara efisien. Jadi mereka tidak bisa terlalu cerewet. Mereka harus menyimpan hasil mereka. Dan mereka harus terus menginformasikan semua teman-teman mereka. Memang, Anda akan melihat sekarang, model ini mendapatkan lebih banyak dan lebih rumit. Ada semakin banyak hal yang terjadi. Ada lebih dan lebih Bahan terbang di sekitar. 

Dan inilah yang awal kosmos akan pernah tampak seperti. Itu adalah tempat yang cukup berbulu. Ada ledakan di seluruh tempat, tabrakan yang kuat. Dan pembentukan berat logam dan elemen. Dan ini awan besar menabrak satu sama lain dengan kekuatan ekstrim. 

Dan sekarang kita 9,6 miliar tahun dari ledakan awal ini. Anda mulai melihat hal-hal yang jenis tenang sedikit, hanya sedikit, karena energi sekarang mulai rileks. Dan sehingga matematika model sudah mendapat bahwa di tempat. Dan Anda mulai melihat perpaduan unsur yang berbeda. Dan mulai melihat hal semacam ini dari datang bersama-sama dan perlahan-lahan keren. 

Dan itu mulai terlihat sedikit lebih seperti langit malam, sedikit. Dan itu [? QSing. ?] Kita sekarang 30,2 miliar tahun dan kami agak dilakukan. Dan kemudian apa yang mereka lakukan adalah bahwa mereka mengambil model ini, dan kemudian melihat alam semesta terlihat. Dan pada dasarnya itu, yang mampu mengambil dan overlay dengan apa yang dapat Anda lihat. Dan kesetiaan yang mengejutkan, untuk seberapa akurat model komputer. 

Tentu saja, astrofisikawan dan kelompok penelitian perlu kesetiaan lebih baik dan resolusi yang lebih tinggi. Tapi jika Anda berpikir tentang apa Saya telah berbicara kepada Anda hari ini melalui perjalanan kecil ini baik melalui penyimpanan dan struktur dan jaringan dan tumpukan, yang penting adalah, adalah skala-out komputasi penting? Itu hypothesis-- asli saya kembali ke metode ilmiah kita. 

Saya berharap bahwa pada awal bagian ini saya akan memprediksi bahwa saya akan mampu menjelaskan kepada Anda tentang komputasi skala-out. Dan kita semacam diuji beberapa dari mereka hipotesis. Kami pergi melalui percakapan ini. Dan aku hanya akan mengatakan scale-out komputasi essential-- oh, ya, sangat banyak ya. 

Jadi, ketika Anda berpikir tentang kode Anda, bila Anda melakukan proyek akhir CS50, ketika Anda berpikir tentang warisan Anda kemanusiaan dan sumber daya yang kami harus mampu untuk menjalankan komputer ini sistem, berpikir sangat hati-hati tentang FLOPS per watt, dan berpikir tentang Chaos Monyet. 

Pikirkan tentang kepingan salju Anda, jangan melakukan satu-off, reuse perpustakaan, membangun codes-- reusable semua hal bahwa tutor telah mengajar Anda di kelas ini. Ini adalah aspek-aspek fundamental. Mereka bukan hanya lip service. Ini adalah hal yang nyata. 

Dan jika salah satu dari Anda ingin mengikuti saya, Saya obsesif dengan hal Twitter. Aku harus entah bagaimana merelakannya. Tapi banyak yang Informasi latar belakang pada komputasi penelitian kami website di rc.fas.harvard.edu. 

Aku mencoba dan menjaga blog sampai date dengan teknologi modern dan bagaimana kita melakukan distributif komputasi dan sebagainya. Dan kemudian staf kami selalu tersedia melalui odybot.org. Dan odybot adalah penolong kecil kami. Dia sering memiliki sedikit kontes di websitenya juga, di mana Anda dapat mencoba dan melihat dia di sekitar kampus. Dia sedikit ramah wajah komputasi penelitian. 

Dan aku akan seperti membungkus ada dan terima kasih untuk semua waktu Anda. Dan saya harap Anda ingat bahwa komputasi skala-out adalah hal yang nyata. Dan ada banyak orang yang punya banyak penemuan sebelumnya yang akan dapat membantu Anda. Dan semua yang terbaik keberuntungan dengan usaha Anda untuk membuat yakin bahwa kami komputasi baik timbangan, adalah berperforma tinggi, dan membantu manusia lebih dari apa pun. Jadi, terima kasih untuk waktu Anda.