제임스 커프 : 안녕하세요, 좋은 안녕하세요, 여러분. 내 이름은 제임스 커프입니다. 나는 연구를위한 지원 딘 해요 하버드 대학에서 여기 계산. 그리고 오늘은에 대해 얘기하는거야 왜 스케일 아웃 컴퓨팅은 필수적이다. 그래서이 사람이 누구인지, 먼저, 추측? 내가 왜 여기있는 거지? 왜 내가 당신에게 이야기하고? 나는 과학에 대한 배경 지식을 가지고 컴퓨팅 및 연구 컴퓨팅, 미국에 다시 스트레칭 웰컴 트러스트 생거을 Kingdom-- 인간의 genome-- 연구소 및 다음 최근 미국에서 존경하는 광범위한 및 기타에서 근무 하버드와 같은 학습의 장소. 나는 그 사실이 의미하는 것 같다 나는 회복 분자 생물 걸 물리학 자. 그래서 잘 내가 말할있어이 당신 스케일 아웃 (scale-out) 컴퓨팅에 대한? 그러나가있다. 18년는 또는 그래서 난 그냥 가장 봤어요 규모의 복잡성을 극적으로 증가 전반적인 효율성 컴퓨팅 시스템. 나는 옥스포드에서 박사 과정을하고 있던 때, 200 메가 헤르츠 꽤 흥분했다 (18)와 실리콘 그래픽스 기계 스토리지의 기가 바이트 단일 CPU. 시간이 변경되었습니다. 지금 빨리 감기, 우리는 회전하고 여기 하버드에서 60,000 이상의 CPU를. 많은 다른 조직 더 많은 회전된다. 이에서 중요한 테이크 아웃입니다 그 규모는 이제 피할 수없는 이 일어난 그것은이다 계속 일어날 것. 그래서 종류, 잠시 동안하자 의 되감기 및 빨리 얘기 과학에 대한, 나의 마음에 드는 대상, 과학적인 방법. 당신은 과학자가되는 경우, 당신은 몇 가지 주요 작업을 수행해야합니다. 당신이이 일을하지 않으면 당신은 할 수 자신 과학자 고려하지 당신은 할 수있는 투쟁한다 훈련의 지역을 이해합니다. 모든 그래서 일단, 당신은 공식화 것 귀하의 질문에, 당신은 가설을 생성, 하지만 더 중요한 것은, 당신에게 당신의 results--을 예측 당신은에 관해서는 추측이 결과가 될 것입니다 무엇. 그리고 마지막으로, 당신은 테스트하려면 가설과 결과를 분석 할 수 있습니다. 그래서이 과학적인 방법이다 컴퓨팅에서 매우 중요합니다. 예측 모두의 컴퓨팅 및 수있는 것은 결과를 테스트 우리가 필요로하는 무엇을하는 중요한 부분이기 과학적인 방법에해야 할 일. 이러한 예측과 testings를 실제 두 개의 초석이다 과학적인 방법, 각의 가장 중요한 진보를 필요 현대 계산한다. 과학의 두 기둥은있다 이론과 실험의의. 그리고 최근, 컴퓨팅은 종종 언급 과학의 세 번째 기둥 인 것으로. 당신 학생들이 이걸보고 있다면, 당신은 전혀 압력이 없습니다. science-- 더 큰의 세 번째 기둥 deal-- 컴퓨팅, 가지 중요. 다행이 컴퓨팅 일부인 컴퓨터 과학 과정 (50). 배경 그래서 충분히. 난 당신의 계획을 말하고 싶은 것을 우리는 오늘에 대해 이야기 할 것입니다. 나는 약간의 역사를 통해 갈거야. 나는 우리가 여기 온 이유를 설명하겠습니다. 나는 몇 가지에 대해 이야기하려고 해요 컴퓨팅의 역사 여기 하버드, 일부 소셜 미디어 관련 활동, 녹색은 매우 계속 물건 모든 일에 대한 열정 green-- storage-- 컴퓨터 storage-- 혼란 시스템을 스케일 아웃 (scale-out)을 어떻게 영향을 미치는지, 특히 및 분배 시스템. 그리고 나는 약간을 터치거야 의 스케일 아웃 (scale-out) 하드웨어 할 수있는 것이 필요 규모로 계산을한다. 그리고 마지막으로, 우리는에 갈거야 굉장한 과학으로 마무리. 그래서,에 분을 보자 우리의 실제 역사를 살펴 봅니다. 컴퓨팅은 진화하고있다. 그래서 60 년대 이후, 모든 멀리 오늘에 이르기까지, 우리는 변화의 기본적 보았다 중앙 집중식 컴퓨팅의 범위 에, 컴퓨팅을 분권화하는 협력하고 독립적 컴퓨팅 및 바로 다시 다시. 그리고 내가 조금 있다는 주석을 보자. 우리는 먼저 진형 때 컴퓨터, 우리는 메인 프레임을했다. 그들은 지나치게 있었다 비싼 장치. 모든 공유되어야했다. 컴퓨팅은 복잡했다. 당신은이 방을 가득 볼 수 있으며 사업자 및 테이프가 있었다 과 whirry 모든 종류의, 르 달아주세요, spinny 장치. 70 년대 80 년대 초반의 주위에, 당신은 시작 팩스 기계의 영향을 볼 수 있습니다. 그래서 당신은 컴퓨팅을보기 시작하고 다시 실험실에서 나타나기 시작 당신 가까이된다. 개인의 상승 컴퓨터, 확실히 의 80 년대, 초반 십 년간, 정말 컴퓨팅을 변경했습니다. 그리고에 단서가있다 제목, 그것 때문에 개인용 컴퓨터 불렀다, 이는 그것이 당신에게 속한 것을 의미했다. 진화도록 컴퓨팅 계속 사람들은 자신의 개인 실현 컴퓨터가 충분히 정말 큰 아니었다 공로의 어떤 것이 든 할 수 있어야하고, 또는 중요한 장점, 과학. 그래서 사람들은에 시작 네트워크 디바이스를 개발 드라이버는 PC를 연결할 수 있어야합니다 함께 클러스터를 구축 할 수 있습니다. 그리고이 시대를 낳았고 베오 울프의. 리눅스에 대한 응답으로 폭발 독점 운영체제에 모두 선정 및 복잡성. 그리고, 여기에 우리가, 오늘 여기서, 다시 한번, 우리가있어 컴퓨터의 전체 객실에 직면 장비 및 능력 하나의 신용 카드를 슬쩍 얻을 수 이러한 컴퓨팅 시설을 이용할 수, 원격으로. 그래서 당신은 다음에서 볼 수 있습니다 역사에 충격을 가하는 약관 우리가 어떻게 계산합니까 오늘, 확실히이다 기계에서 진화 컴퓨터의 전체 객실 일부 개인 컴퓨팅을 통해 모든 방법 바로 돌아 다시 컴퓨터의 전체 시스템으로 객실을 보유하고 있습니다. 그래서 이것은 내 첫 번째 클러스터입니다. 2000 그래서, 우리는 내장 유럽​​에서 컴퓨터 시스템 효과적으로 주석 인간 게놈. 많은 기술이있다 오른쪽에 나열된 거기에 그, 불행하게도, 우리와 함께 더 이상 없습니다. 그것은에 건네있어 하늘에서 큰 기술. 기계 자체는 아마 몇 가지 괜찮은 노트북의 동등한 오늘, 그냥 가지 방법을 보여줍니다있다. 그러나, 우리는주의 깊게 주석 않았다 인간 게놈 및 모두는 보호 이 특정 논문에서와 관심 데이터로부터 자연 공공 또는 민간 주도했습니다. 그래서이 바로, 굉장? 그래서 우리는 인간 게놈을 가지고있다. 우리는 계산 완료했습니다. 나는 아주 자신을 기쁘게 느낄 수있어. 나는 2006 년에 하버드까지 압연 나 자신 기색을 많이 느낌. 이것은 내가 상속 된 것입니다. 이 부서입니다 메일 및 파일 서버. 당신은 거기에 여기에 볼 수 있습니다 테이프 약간의 그 함께 시스템을 유지하는 데 사용. 이것은 우리의 라이센스 및 인쇄 서버입니다. 나는 거기에 아마 암호를 확신 이들 중 일부에 포스트 - 그것 노트. 굉장하지. 꽤 멀리 멋진에서. 그래서 나는이 작은 차트를 실현 나는 처음에 당신을 보여 주었다 소유권 공유에서 다시 공유에, 것을 우리는 게임을 변경했습니다. 그래서 우리는 게임을 변경 인센티브를 제공함으로써. 그리고이 그래서 인간, 작은 Wikipedia 기사 우리의 목적 생물, 여기 말했다. 그리고 인센티브의 연구 구조 연구에 필수적이다 경제 활동. 그래서 우리는 인센티브 시작 우리의 교수진과 우리 연구원. 그래서 우리는 그들을 인센티브 정말 큰 컴퓨터 시스템. 2008 년 그래서, 우리는 4,096을 구축 프로세서 machine-- 10 랙, 몇 전력 백kw. 내가 생각하는 것은 흥미가없는 것입니다 문제는주기에있는 곳. 전원이 동일한 양 계산은, 전력은 일정하다. 그것은 200kw 때 우리 유럽​​에서 시스템을 구축했다. 그것은 이백kw이다 2008 년, 그 [것 같습니다? quanter?] 작은의 컴퓨팅 시스템을 기반 대학. 했죠 - 빨리 감기 하버드 그래서, 나는 전혀 아니지만 더 이상 슬픈 팬더, 아주 행복한 팬더. 우리는 60여 만 부하가 균형했습니다 CPU 및 극적으로 자신의 등반. 우리는 15 페타 바이트가 저장, 또한 등반. 다시 말하지만,이 200kw 증가, 우리는 것 것을 추가 할 수 매 6 개월 정도. 많은 가상 머신을 많이. 그리고 더 중요한 것은, 약 1.8 메가 와트 연구 컴퓨팅 장비. 그리고 올거야 다시이에 나중에, 에 관해서는 왜 더 이상 반드시 지금 우리는 얼마나 많은 CPU 계산 그러나 얼마나 큰 것은 전기 요금입니다. (20) 다른 그래서 전용 연구 컴퓨팅 직원. 그리고 더 중요한 것은, 우리는있어 우리의 GPGPUs 성장을 시작. 나는이 얼마나 많은에 비틀 거렸다했다 일상적으로 첨가되고있다. 그래서, 역사 수업을 통해, 오른쪽? 어떻게 우리가 여기에서 거기에 도착합니까? 의 일부 현대 살펴 보자 스케일 아웃 (scale-out) 컴퓨팅 예. 나는에 약간 집착 해요 크기와 소셜 미디어의 규모. 극단적으로는 여러 가지가 있습니다 성공적인 대규모 컴퓨팅 지금 지구상에서 조직, 지원 및 서비스를 제공 우리 모두에게. 그래서 면책 조항입니다. 그리고 시작하려면 인스 타 그램에서 온스의 수입니다. 그것은 사실이 아니다 리드의 농담에, 그것의 심지어 재미가, 실제로 그것을 생각 온다. 어쨌든, 우리는에 갈거야 인스 타 그램에서 온스 봐. 그리고 우리는 시작하는거야 "내 꿀벌과 꽃."와 나는 [들림] 마을에 있었다 나는 약간의 그림을 가져 갔다 꿀벌의 꽃에 앉아. 그리고 제가 생각하기 시작 이 사실은 무엇을 의미 하는가. 그리고 내 휴대 전화 떨어져이 사진을 찍었 그리고, 그 안에 얼마나 많은 바이트 계산 그것은 약 256킬로바이트을합니다. 그게 바로 내가 시작했을 때, 기본적 것 5와 1/4 인치 플로피를 입력합니다. 그리고 물론, 그 멋진 생각하기 시작했다. 그리고 나는보고하기 시작 네트워크에 대한 몇 가지 연구. 그리고 나는 것을 발견 인스 타 그램 2 억 MAUS있다. 나는 실제로 그 아니었다 확인 MAU는 것이었다. 그리고 MAU, 여기에 아래입니다 월별 활성 사용자. 그래서, 2 억 MAUs-- 정말 멋진. 200 억 photographs-- 그래서 사진 꽤 많이. 60000000 새로운 사진 매일 사진 당 약 0.002 공연에서 나오는. 즉, 약 5 페타 바이트의 바로이 디스크. 그리고 정말 중앙 부분이 아니다 우리가 이야기 할 것 건지. 즉, 작은 감자입니다. 아니면 우리가 영국, 작은 욕구가 마구 말에. 그럼 진짜 코끼리를 살펴 보자 room-- 고유 한 얼굴에. 다시 말하지만, 이제에서 측정 할 수 이 새로운 양자는 MAU를 호출합니다. 페이스 북 자체는 13 억 MAUS있다. 심지어했으나, 싸이 월드, 미투데이, 최근까지 들어, 그건 어떤 종류의 메시징 서비스, 5 억 MAUS입니다. 인스 타 그램, 그것은 우리 단지 2 억, 약 MAUS을 이야기했다. 이며, 메신저, 다른 메시징 서비스, 또한 2 억 MAUS입니다. 그래서 약이다, 그를 총 22 억으로 총 사용자. 분명히 몇 가지 중복,하지만 그건 행성의 세 번째에 해당. 그리고 그들은 뭔가를 보내 120 억 메시지 일의 영역입니다. 그리고 또, 만 7있다 지구상 억 명. 모든 사람이 스마트 폰을 보유하고 있습니다. 그래서이 미친 숫자입니다. 그리고 나는 그것이 아니라고 주장거야 심지어 저장 또는 계산에 대한. 그리고 노래를 인용, 그것은 모든 그래프에 대해입니다. 여기에 우리의 아름다운 메간 트레이너는 아래의 여기에, 모든베이스에 대한 노래입니다. 그녀는 또한 꽤있다, 참고 저음의 비트, 207 herself-- 잘 2억1천8백만명 보았다 그녀의 노래를이 젊은 아가씨. 그래서 내 인수는이다 모든 그래프에 대해이다. 그래서 우리는 몇 가지 오픈 소스 소프트웨어를했다 와 그래프를보고 시작했다. 그리고 이것은이 링크드 인, 그래서 페이스 북은 노인을위한 것입니다. 그리고, 이쪽은 내 링크드 인 그래프이다. 나는 1200 정도 노드가 "친구."소위 그리고 여기에 상단에 저예요. 그리고 여기에 상호 연결을 모두입니다. 이제, 인스 타 그램의 이야기로 생각합니다. 이러한 각각의 하나입니다 뿐만 아니라 사진, 그것을 연결의 전체 과다가 이 특정 개인 사이 그리고 많은 다른 사람. 이것은 중앙 조각 중 하나입니다 그래프 그리기 알고리즘 버그, 또는이 어쩌면 다윗 마란은 아직 확실하지 않다. 그래서 당신은 다시 그릴 수 있습니다 모든 종류의 그래프 의면에서는 ... gephi.gihub.io 어디 당신은에서 해당 소프트웨어를 풀 수 있습니다. 그것은 것에 대해 정말 멋진 커뮤니티를 구성 할 수. 이 하버드이며, 여기에 볼 수 있습니다 내가 작업 한 다양한 장소, 이 내 업무 관련 데이터이기 때문이다. 그러니 그냥 복잡성에 대해 생각 그래프 및 데이터의 모든 당신과 함께 당기있다. 그래서 그 사이에 다시 FriendFace에서, 오른쪽? 우리는 인스 타 그램 데이터에서 본 다섯 페타 바이트의 순서이었다. 더 큰 문제가 없습니다. 여전히 매우 많은 데이터가 있지만 큰 사물의 큰 계획에 거래. 이전 인터넷에이 문서에서, "페이스 북의 데이터웨어 하우스를 확장 300 페타 바이트. " 즉, 전체 다르다 게임 체인저 지금, 시에 시작하고 데이터와 그래프의 생각 그리고 당신은 무엇을 함께 가지고. 그리고 높은 데이터의 성장 (600)의 순서는 일 terrabytes. 지금, 당신은 물론, 그러고 나서 ..., 알고 나는 600 terrabytes 일을 의미, 300 petabytes--가있어 또한 지금 시작 매우 우려 얻을 수 이 물건을 유지하는 방법 및 확인이 데이터는 그대로 남아 있습니다. 그리고 여기에이 신사, 제이 파리 크, 찾고 데이터의 엑사 바이트를 저장하는 방법에 대해. 그냥 당신의 사람들을 위해 사람을 함께 지켜보고있다 가정에서, 18 exabyte-- 10. 그것은 자신의 위키 백과있어 페이지, 그것은 숫자의 큰입니다. 그게 우리가 왜 왔는지의 크기와 규모입니다 에서 찾고 데이터를 저장할 수 있습니다. 그리고이 사람들은, 주위에 일 처리되지 않습니다 그들은 데이터의 양을 저장하고 있습니다. 단서 그래서 하나 그 그들은 여기에서 찾고 데이터 센터입니다 냉장 소위. 어떤 녹색되는 날을 제공합니다. 그리고 여기에 커미트입니다. 그와 나는 그것이 매우이다 agree-- 녹색하기 어려운, 그러나 우리는 우리의 최고의 사용해 보시기 바랍니다. 커미트 그가 가지고, 그것을 도울 수 없어요 모든 시간 그린 (Green), 모든 그의 녹색 다움을 벗을 수 없습니다. 그래서, 인 concepts-- 핵심 개념의 몇 종류 초록색의, 때를 컴퓨팅에 관한 것이다. 가장 중요한 하나 제품의 수명이다. 당신의 제품이 짧은 수명을 가지고 있다면, 당신은, 정의에 의해, 녹색이 될 수 없습니다. 에너지를 생산하는 데 걸리는 디스크 드라이브, 마더 보드, 컴퓨터 시스템, 태블릿, 그게 뭐든 할 수있다 당신의 시스템의 수명 수 당신이 얼마나 녹색의 핵심 부분이다. 중요한 부분은, 당신의 모든으로 algorithms-- 소프트웨어를 구축하고있다 알고리즘의 부분 소프트웨어에 대한 단어, 오른쪽? 그래서, 당신의 알고리즘 디자인이다 측면에서 절대적으로 중요 당신은 할 수있을거야의 방법 신속하고 정확한 계산에 사용하는 가능한 최소한의 에너지 양. 그리고 나는 조금이에 도착합니다. 당신 디자인 - 데이터 센터는 본 적이 우리는 이미 수천을 가지고 수천 대의 컴퓨터에 앉아 조용히 작은, 어두운 구석에서 세계 컴퓨팅의. 자원을 활용하는 방법 allocation-- 계산하기, 스토리지, 네트워크를 통해. 운영 시스템의 핵심 부분입니다 가상화의이, 그리고 많은 더 포장 할 수 있도록하고 작은 공간에 더 많은 계산. 나는 당신에게 작은 예를주지 연구 컴퓨팅에서. 우리는 더 핑을 필요 이상 전력, 더 파이프. 우리는 더 큰 필요 더 빠른 컴퓨터, 적은 주스를 사용하는 데 필요한. 그리고 우리는이 작업을 수행하는 방법을 해결할 수 없었다. 해시 태그는 같은 gowest 나도 몰라 아마도 칼 다시에 의해 사용되어, 어쨌든, gowest. 그리고 우리는했다. 우리는 우리의 작업을 집어 우리는 그것을 밖으로 이동 서양 매사 추세 츠 작은 밀 마을 북쪽, 홀리 요크라는 Chikopee과 스프링 필드. 우리는 몇 가지 이유로 이런 짓을. 메인 하나는 우리이었다 매우, 매우 큰 댐을했다. 그리고이 매우 큰 댐은 할 수있다 에너지의 30 플러스 메가 와트를 넣어, 그리고이 시점에서 충분히 이용 하였다. 더 중요한 것은, 우리는 또한 있었다 매우 복잡한 네트워크 그 자리에 이미 있었다. 당신은 네트워크의 어디를 보면 미국에 간다, 모든 기차 트랙을 따른다. 네트워크의이 특정 부분이었다 우리의 동료 및 친구들 소유 매사 추세 츠 기술 연구소, 그것은 기본적으로 내장 된 국도 90를 끝까지. 그래서 우리는 큰 강 틱, 경로 (90)이 있었다 우리 100 마일의 짧은 경로를했다, 틱, 그리고 약 1,000 마일의 긴 경로. 우리는 매우 큰 할 필요가 않았다 네트워크 스플 라이스, 당신이 여기에서 볼 수 있듯이, 기본적에,에 링크를 넣어 , 홀리 요크에 연결할 수 그러나 우리는 필요한 모든했다 infrastructure-- 핑, 전력, 파이프. 생활은 좋았다. 그리고 또, 큰 댐. 그래서 우리는 매사 추세 츠 기본적으로 내장 녹색 고성능 컴퓨팅 센터. 이 다섯을 통해 사랑의 노동이었다 universities-- MIT, 하버드, UMass 애, 북동부 및 BU. 다섯 메가 와트 첫날 연결된 부하. 우리는 영리의 모든 종류를했다 에어 사이드 이코노마이저와 녹색 물건을 유지합니다. 그리고 우리는 640여 랙을 구축, 연구 컴퓨팅 전용. 그것은 오래 된 재개발 사이트, 그래서 우리가 일부 매립 및 일부 깔끔한 업을했다 해당 사이트의 일부 청소. 그리고 우리는 시작 시설 구축 와, boom-- 사랑스러운 시설 샌드 박스 컴퓨팅을 실행하는 능력, 컨퍼런스 및 세미나를합니다, 또한 대용량 데이터 센터 바닥. 여기에 내 좋은 자체입니다. 난 분명히 같은 재킷을 입고 있어요. 어쩌면 하나가 재킷,하지만 나를있다 존 Goodhue--는 그가 가장 Center-- 이사 기계 방에 서 당신이 볼 수 있듯이, 바닥, 매우 극적이며 다시 멀고 먼 길을 간다. 나는 종종 게임 운전 게임 , 홀리 요크 밖으로 보스턴에서 나는 TCP / IP 패킷 해요 척. 그리고 내 대기 시간에 대해 걱정 마십시오 내 차에 주위에 운전. 그래서 녹색 부분입니다. 그럼 잠깐 보자 및 스택에 대해 생각합니다. 그래서 우리는 매우 신중에 노력하고 효율적으로 데이터 센터를 구축, 효율적으로 컴퓨팅, 좋은 만들기 컴퓨팅 장비의 선택 및 제공, 더 중요한 것은, 우리의 응용 프로그램, 그것은 메시징 서비스 수 또는 과학적인 응용 프로그램입니다. 그래서 여기에 스택입니다. 따라서, 물리 계층, 모든 길 어플리케이션 작성을 통해 이에가는 것을 희망 코스의 좋은 부분이 될. 일곱 OSI 계층 모델은 기본적 당신이 살고 먹고, 숨을 쉴 것 당신의 컴퓨팅 경력에 걸쳐이. 실제의이 모든 개념 infrastructure-- 전선, 케이블, 데이터 센터, 링크. 그리고 이것은 단지 네트워크를 설명한다. 여기까지이다, 잘, 분명히, 이것은 이전 슬라이드입니다 이 HTTP, 때문에 말을해야하기 때문에 아무도 간단한 메일에 대한 관심 없다 전송 프로토콜, 더이상. 그것은 모든 HTTP 공간에서 일어나고. 그래서 스택의 한 단계입니다. 여기에 스택, 당신의 또 다른 세트입니다 서버가 호스트, 하이퍼 바이저, 게스트 이진 도서관, 다음 응용 프로그램입니다. 아니면,이 경우, 장치 드라이버, 리눅스 커널, 네이티브 C, 자바 가상 머신, 자바 API, 다음 자바 애플리케이션, 기타 등등. 이 설명입니다 가상 머신의. 이런 스택, 배트맨! 이에 대해 생각 얼마나 많은 컴퓨팅의 관점 당신은 얻을 필요 어떻게 여기에 무슨 일이 일어나고 상단까지의 모든 방법 이 스택의 다음에 실제 작업을 수행 할 수 응용 프로그램의 전달. 그리고 만약 가지 되감기 생각하기 시작 이 제공하기 위해 무엇이 필요한지에 대한 부동 소수점 연산, 하여 부동 소수점 연산은 합인 코어의 소켓의 수 소켓, 시계는, 어느 얼마나 빨리 시계가 수 turnover-- 네 기가 헤르츠, 두 gigahertz-- 다음 수 작업을 수행 할 수 있습니다 주어진 헤르츠으로이 일을 할 수 있습니다. 그 마이크로 프로세서 오늘 그래서 네, 6 퍼 사이에 수행 클럭 사이클 당. 그리고 단일 코어 2.5 기가 시계 이론적 인 성능을 가지고 약 메가 플롭이나 걸릴 부여합니다. 그러나, 모든과 마찬가지로, 우리는 선택이있다. 그래서 인텔 코어 2, 네 할렘 (Nehalem) 샌디 브릿지, 하 스웰, AMD, 당신의 choices-- 인텔 아톰을. 이러한 프로세서 구조 모든 모두는 약간 다른 방법을 가지고 의 추가 할 수있는 두 개의 숫자, 이는 기본적으로 인생에서 자신의 목적. 힘든이어야합니다. 그 중 수백만 앉아있다 데이터 센터, 지금 생각. 소르, watt-- 당 퍼 이 큰 것입니다. 나는이의 더 많은 것을 알고 싶다면 이 스택을 통해 얻을 수 있습니다, 빠르고, 나는 얼마나 많은 작업을 할 수있어 소수점 연산을 두 번째로, 부동 내가 뭘하고 그들에게 w를 제공 할 수 있습니다. 그리고 다행히 사람들 이것에 대해 생각했다. 그래서 대형있다 볼 매년 이의를 제기 누가 가장 빠른 컴퓨터를 구축 할 수 있습니다 그 행렬을 대각선 화 할 수 있습니다. 그것은 500를 불렀다. 그들은에서 상단을 선택 최고 500 컴퓨터 그 수 행성에 대각 행렬. 그리고 당신은 몇 가지 놀라운 결과를 얻을 수 있습니다. 그 기계의 많은입니다 10, 20 메가 와트 사이. 그들은 행렬을 대각 수 있습니다 지나치게 빨리. 그들은 반드시 대각하지 않습니다 이를 효율적으로 와트 당, 그래서 보는이 큰 푸시가 있었다 무엇을 그린 500리스트는 같을 것이다. 그리고 여기에 6 월부터 목록입니다. 매우 곧 새가 있어야합니다. 내가 할게요 그리고 병원을 나온 호출 이 특정 목록의 맨. 두 가지 특정 machines-- 하나가있다 도쿄 공업 대학에서 캠브리지에서 하나 영국의 대학. 그리고이 꽤 비틀 거리고있다 메가 와트 비율 당 슬리퍼. 이 하나의 4389,과 다음 중 하나 아래는 3631입니다. I 사이의 차이를 설명 할 것이다 이 두, 다음 슬라이드에. 그러나 이러한이가 있습니다 적당히 테스트 클러스터 크기. 이 단지 34이다 킬로와트 또는 52kw. 일부 규모가 큰이 있습니다 이 특정 하나를 이곳에 스위스 국립에서 슈퍼 컴퓨팅 센터. 집에 가져 오는 메시지 이를 위해 우리가 걸이다 컴퓨터를 찾기 위해 노력 이 효율적으로 작동 할 수 있습니다. 그리고, 이제이 상단에 살펴 보자 하나는, 귀엽게 KFC,라고. 그리고 여기에 광고의 약간. 이 특정 식품 회사 이과는 아무 상관이 없습니다. 그것은 사실이이다 이 특정 시스템 매우에 배어있다 영리한 유성 화합물. 그리고 그들이 가지고 그들의 치킨 프라이 모니 커 그들은 처음에 시작했을 때 이러한 유형의 시스템을 구축 할 수 있습니다. 그러나 기본적으로 그들은 촬영 한 내용을 여기에 다수의 블레이드 (blade)는, 이에 넣어 정교한 광유, 다음 모든 방법을 알아 일 과 그것에서 네트워킹. 그리고, 그뿐만 그들은 그래서 외부로 넣었습니다 그것이 외부 공기 냉각을 악용 할 수 있습니다. 그것은 꽤 인상적이었다. 그래서 당신은 모든 것을 할 필요가 이 헛소리의 이 금액을 얻을 수있을합니다 계산은 작은 와트를 위해 전달했다. 그리고 당신이이 모양입니다 볼 수 있습니다 여기서의 일이 향하고있다. 문제는 일반 공기입니다 냉각은 규모의 경제이다 그리고 많이 운전 모두 일반 컴퓨팅의 개발, 및 고성능 컴퓨팅. 그래서,이 꽤 혼란이다. 나는이 매력이라고 생각합니다. 그것은 조금 지저분한 때를 디스크 드라이브를 교체하려고, 그러나 그것은 정말 멋진 생각이다. 그래서뿐만 아니라 그, 거기에 작업의 전체 무리 우리가 왜 왔는지 중심으로 구축되고 오픈 컴퓨 트 프로젝트를 호출. 그리고 그 약 때문에, 더 조금 이상. 그러나 업계는에 시작 실현이 와트 당 퍼 중요 해지고있다. 그리고, 같은, 여기 사람들로 당신은 당신의 알고리즘을 설계 당신은 디자인 당신의 코드, 당신은 알고 있어야합니다 코드 수 파급 효과가 있습니다. 때 마크가 여기에 앉아있는 그의 페이스 북 1.0 쓰는 기숙사, 나는 그가보기를했다 확신 그것이 거대한 될 것되었다. 그러나에 어떻게 될 것이라고 거대한 환경은 큰 하는거이다. 그리고 가주의 모든 수 알고리즘 올 그 다음 도전이 될 수 나 같은 사람을위한 것, 시스템을 운영하려고합니다. 그래서 그냥 생각하자 실제 전력 한계. Landauer--으로 본 논문 새로운 일이 아니다. 1961이 출판되었다 IBM 저널. 이 정규 인 "불가역성 및 열 컴퓨팅 프로세스의 생성. " 그래서 그는 주장 기계 불가피 물류 기능을 수행하는 단일 값 역이 없습니다. 전체 부분의 그래서 이것은 60 년대에 그 돌아왔다 사람들은이 것을 알고 있었다 가는 문제가 될 수 있습니다. 그리고 한계의 법칙은 25를 말했다 C, 표준 룸 일종의 학위 온도 한계 0.1 전자 볼트를 나타냅니다. 그러나, 이론적으로, 여긴 이론, 컴퓨터 메모리, 이 한계로 작동하는 것은있을 수 억 비트 초로 변경되었습니다. 나는 당신에 대해 알고 있지만하지 않는 많은 억 비트 건너 제 2 데이터 레이트 교류. 인수는 만 있었다 전력의 와트의 2.8 조 지금까지 확장되어야한다. 좋아, 실제 example-- 이 내 전기 요금입니다. 나는의 65 % 퍼센트 해요 그 사랑스러운 데이터 센터 나는이 특정 시간에, 당신을 보여 주었다. 이것은 다시 유월 안에 마지막 년입니다. 나는 있도록 이전 버전을 올렸습니다 우리 및 종류의 약간의 익명화 할 수 있습니다. 나는 4만5천달러을 지출했다 이 에너지 달. 그래서이되는 이유는 것입니다 우리 방에서 50,000 프로세스를 가지고있다. 그래서 당신은 당신의 자신을 상상할 수 주거용 전기 요금 그 높은되는? 그러나 199 만 달러였다 달 와트 시간. 그래서 포즈 질문은 당신이 할 수있다 씨 주커 버그의 전기 요금을 상상? 광산은 꽤 큰이며, 나는 투쟁. 그리고 나는 혼자이가에있어. 많은 사람들이있다 큰 데이터 센터와. 그래서, 내 생각, 전체 disclosure-- 내 페이스 북 친구는 조금 이상한. 그래서 내 페이스 북 친구입니다 Prineville 데이터 센터, 이는 페이스 북의 가장 큰 중 하나입니다, 최신의, 가장 에너지가 낮은 데이터 센터. 그리고 그들은 나에게 같은 일을 게시 전력 사용의 효율성, 에서와 같이 데이터가 얼마나 효과적이다 당신이있어 얼마나 많은 에너지를 대 센터 얼마나 그것으로 퍼팅 물은 무슨 일이있어, 사용 습도와 온도. 그리고 그들은 이러한이 사랑스런 플롯. 나는이 생각 멋진 페이스 북 페이지, 하지만 난 좀 이상한 것 같아. 그래서 하나 더 많은 전력 것, 내가 연구 컴퓨팅 에 유의 한 차이가있다 무엇을 페이스 북과 야후와 구글 및 주문형 다른, 완전히, 항상 이용할 수있는 서비스. 그래서 나는 장점이있다 ISO 새로운 England-- 및 ISO 뉴 잉글랜드 에너지를 설정하는 데 도움이 이 지역에 대한 요금. 그리고 그것은 확장 대요 소비자 요청 자발적으로 높은 에너지를 절약하기 위해, 때문에 고온 다습의. 그리고 다시 7 월 18 일이었다. 그래서 난 행복, 안녕, 다시하기 Tweet ISO 뉴 잉글랜드, 녹색 하버드. 우리는 우리의 역할을 통해하고있는 여기에 연구 컴퓨팅. 우리가 과학을 다하고 있기 때문에이입니다. 그리고 사람들은 과학을 말할만큼 잠들지 않는 과학은 기다릴 수 있습니다. 그래서 우리는 일시 중지 할 수있는 우리의 시스템은, 등급 비율의 활용 우리의 에너지 법안에, 그리고 전체 뉴 잉글랜드 도움 흘리기에 의해 지역 부하의 많은 메가 와트. 그래서 독특한 것입니다 그 과학 컴퓨팅 데이터에 대해 다른 센터와있는 것들 전체 생산 24에. 그래서 그냥 여기에 또 다른 기어를 보자. 그래서,상의 할 혼돈 조금. 그리고 난에 넣어 원하는 저장의 후원. 에게 그래서 그런 종류의 의 어려움을 겪고 있었다 페타 바이트 무엇 주위에 그들의 머리로 받아 냄으로써 저장 용량이 예와 같습니다. 그리고이 물건의 일종이다 나는 모든 시간을 처리합니다. 이 작은 친구들의 각각 네 테라 바이트 하드 드라이브입니다, 그래서 당신은 가지를 카운트 할 수 있습니다. 우리는 사이에 지금 있어요 1과 1/2 페타 바이트에 하나 업계 표준 랙에. 그리고 우리는 당신과 같은 객실과 객실을 가지고 존과 그 이전 그림에서 본 그리고, 장비의 이러한 랙의 전체. 그래서 그것은 매우, 매우 쉽게되어 가고 대규모 스토리지 어레이를 구축 그것은 유닉스의 내부에 주로 쉽게 가지 일을 진행하는 방법을 카운트. 그래서이 얼마나 많은 기대하고있다 MAU 포인트는 I가 가지고있다. 그래서 423 인터셉트 포인트입니다. 그리고 난, 일부 스케치 AWK를 실행하는 경우 이 특정 시스템에 추가 할 수 있습니다, 7.3 페타 바이트가 있었다 사용 가능한 스토리지의. 그래서 물건을 많이입니다. 그리고 스토리지는 정말 어렵다. 그럼에도 불구하고, 어떤 이유로, 이 업계의 추세이다. 나는 우리 연구자들에게 이야기 할 때마다 우리의 교수진과는 말 이봐, 난 당신을 위해 스토리지를 실행할 수 있습니다. 불행히도, 난에이 스토리지 비용을 회수. 나는이 사업을 얻는다. 그리고 사람들은 뉴에 그 참조 또는 그들이 스테이플 참조 또는 그들이 살 수있는 얼마나 에 대한 하나의 테라 바이트 디스크 드라이브. 이 그래서, 당신은주의 것 여기에 단서가 있다는 것을. 여기에 하나의 디스크 드라이브가있다. 우리가 돌​​아 가야한다면, 나는 많은있다. 뿐만 아니라 나는, 나는 많은이 있습니까 정교한 상호 연결 스티치 할 수 있도록 함께이 일. 따라서 위험성이 큰와 연관된 스토리지 어레이는 무의미하지 않다. 사실, 우리는에 갔다 인터넷과 우리는 썼다 잘 의미에 대해 조금 이야기, 연구의 순둥이 감독 computing--을 가지고 발생 이상한 영어 노력 accent-- 연구원에게 설명하는 것을 더 밑줄 백업 폴더 실제로 의미했다. 그것은 꽤 긴, 작은 이야기했다 발견의 좋은 사분. 그리고 참고, 나는 끔찍한를 여자보다 훨씬 적은 공간 그에 대한 모든베이스를 부릅니다. 우리는 꽤 많은 계정 낮은 것. 어쨌든,이가 에 대해 생각하는 중요한 것은, 잘못 될 수 있는지의 관점에서. 나는 디스크 드라이브 얻고, 경우에 따라서 나는, 유닉스 기계에 던져 나는 그것에 물건을 쓰기 시작 자석은 드라이브 헤드가있다,있다, , 표면 상 하나 또는 0 거기 해당 장치에 아래로 기록되는. Motors-- spinny, 돌고 물건은 항상 휴식. 휴식 것들에 대해 생각해보십시오. 그것은 항상 spinny되었습니다, 물건을 돌고. 프린터, 디스크 드라이브, 자동차 등 이동 뭐든지 깰 가능성이있다. 그래서 당신은 모터를 필요 드라이브 펌웨어가 필요, 당신은, SAS / SATA 컨트롤러, 전선이 필요 SAS / SATA 컨트롤러의 펌웨어, 낮은 수준의 블록. 스토리지 컨트롤러 파일을 선택 시스템 코드, 둘 중이 할 수있는 하나, 어떻게 함께 일을 만들기. 그리고 가상 메모리 관리자 페이지, DRAM 반입 및 저장. 그런 다음 다른를 얻을 수 종류 인 스택 이 페이지의 목록 아래로 하나, 알고리즘, 사용자. 그리고 당신은이를 곱하면 얼마나 많은까지, 나도 몰라, 많은 장소가있다 여기서 물건을 옆으로 갈 수 있습니다. 그 수학에 대한 예입니다, 의미한다. 그러나 그것은 생각하는 재미의 종류이다 몇 가지의 일이 잘못 갈 수있다, 단지 디스크 드라이브. 우리는 그렇게, 300 페타 바이트에 이미있어 디스크 드라이브의 개수를 상상할 당신은 300 페타 바이트에 필요 그 잘못 갈 수 있습니다. 뿐만 아니라 거기 있었고 그래서 저장합니다. 그리고 그것은을 암시 내가보고 싶은 사람 무대를 입력하면, 왼쪽있는 카오스 원숭이입니다. 특정 지점에서 그래서, 심지어 도착 그냥 디스크 드라이브보다 큰 문제. 그리고, 이러한 미세 신사 숙녀 여러분 즉, 스트리밍 비디오 서비스를 실행할 자신의 컴퓨터가 있다고 실현 매우 복잡도 또한 거대하고 또한 서비스 제공 많은 사람들이 끔찍합니다. 그들은 3700 만 members-- 있는데 이 슬라이드의 아마 1 년 정도 old-- 장치의 수천. 비디오의 시간 수십억이 있습니다. 그들은 하루 이벤트 수십억를 기록합니다. 그리고 당신은 대부분의 사람들이 볼, 볼 수 있습니다 저녁에 나중에 텔레비전, 그리고 지금까지 모든 것을 능가. 그래서, 그들은 원한 확인 할 수 서비스가했다 및 믿을 수 있고 그들을 위해 작동합니다. 그래서 그들은이 함께했다 카오스 원숭이라는 것. 이 소프트웨어의 조각이다 이는 당신이 생각하는 경우 제목에 대해 이야기에 대한 이 모든 프리젠 테이션, 스케일 아웃 (scale-out) 당신을 의미 이 물건을 테스트해야합니다. 그냥 가지고 좋은입니다 만 기계. 그래서 좋은 점에 대한 이 혼돈 원숭이입니다 서비스이다 시스템 그룹을 식별 무작위로 하나를 종료 그룹의 시스템. 신난다. 그래서 나는 모르는 당신,하지만 난했습니다 경우 이제까지 다른에 의존하는 시스템을 구축 서로 얘기 시스템, 당신은 그들 중 하나를 꺼내 전체 일의 작업의 가능성, 급속하게 감소한다. 그리고 소프트웨어의이 조각은 실행 넷플릭스의 인프라 주변. 다행히, 그것은 단지에서 실행 말한다 의도와 업무 시간 엔지니어가 될 것 경보 및 응답 할 수. 따라서 이러한 유형은 것들을 우리는 지금이야 우리의 컴퓨팅을 교란 할 필요 환경, 혼란을 소개합니다 과 복잡성을 소개합니다. 그래서 자신의 오른쪽 사람, 마음, 부담없이 선택할 것 카오스 원숭이와 함께 작동하는 방법? 잠깐만, 그는 나를 가리키는 것으로 보인다. 글쎄, 나는 귀여운 이러면 같아요. 그러나 문제는 당신이다 선택을하지 않습니다. 카오스 원숭이, 당신 같은 볼 수 있습니다, 당신을 선택합니다. 그리고 이것은 컴퓨팅의 문제입니다 규모로는이 문제를 방지 할 수 없다는 것입니다. 그것은 복잡성의 필연성이다 과 규모의 우리의 진화, 컴퓨팅 전문 지식의 몇 가지 방법에. 그리고 이것이 기억 한 가지 기억해야 할, 카오스 원숭이 사랑 snowflakes-- 사랑 눈송이. snowflake-- 우리가 설명했습니다 카오스 Monkey--하지만 눈송이 인 고유 한 서버와 특별하고 섬세하고 개별 및 재생되지 않습니다. 우리는 종종 눈송이를 찾을 수 우리의 환경에서 서비스를 제공합니다. 그리고 우리는 항상 노력하고 눈송이 서비스를 녹여. 하지만 서버를 찾을 경우 사용자 환경에서 그 장수에 중요 조직과 녹, 당신은 함께 다시 돌려 놓을 수 없습니다. 그래서 혼돈 원숭이의 작업에 있었다 이동 및 인스턴스를 종료합니다. 카오스 원숭이가 녹는 경우 눈송이, 당신은 이상, 당신은 완료하고 있습니다. 내가 얘기하고 싶지 우리가있어 일부 하드웨어 일종의의 관점에서 보는 스케일 아웃 활동을 너무. 그리고에 몇 가지 독특한 것들 및 과학 활동의 주위에. 우리는 지금보고 시작, 기억 문제의이 유닛이 랙? 그래서 이것은 일반적인 그래서 GPGPUs--의 랙입니다 범용 그래픽 처리 장치. 우리는 이러한 우리의 데이터에 위치해있다 센터, 100 정도 마일 떨어진. 이 특정 랙 약 96 테라 플롭이다 단 정밀도의 수학 수 그것의 뒷면을 제공합니다. 그리고 우리는 순서가 130 여개가 인스턴스 카드 여러 그 우린 ​​... 이 인스턴스의 랙. 그래서이 점에서 흥미 롭다 그 범용 그래픽 처리 엄청나게 수학을 할 수있다 빨리 에너지의 매우 낮은 금액에 대한. 그래서 큰 업틱의가있다 과학 컴퓨팅 분야, 그래픽보고 큰 방법으로 처리 장치. 그래서 일부 Mcollective 달렸다 우리의 꼭두각시 인프라를 통해 어제, 이것에 대해 매우 기쁘게 생각합니다. 페타 플롭의 단지 짧은 단 정밀도의. 바로 여기,이 명확하게 작은 승수는 3.95이다. 배정 밀도 수학 약 1.2 것, 하지만 내 트위터 피드 내가하면 더 나은 방법 보았다 우리가 거​​의 페타 플롭스가 있다고 단 정밀도 GPGPUs의. 그러나이 점점. 그것은으로 점점 매우, 매우 인상적. 그리고 우리가 왜 이러는 거죠? 양자 화학 때문에, 무엇보다도, 그러나 우리는 설계하기 시작하고 새로운 태양 전지. 그리고 앨런 Aspuru-Guzik, 누가 내 파트너를 chemistry-- 교수 지난 몇 년 동안 crime--에. 우리는 밀어 봤는데 컴퓨팅 봉투. 그리고 GPGPU 이상적입니다 기술 할 수 있어야합니다 복잡한의 엄청 많이 수학, 매우, 매우 빨리. 규모 그래서, 새로운 도전 온다. 그래서 거대한 scale-- 당신은해야 이 물건을 연결할 조심. 그리고 우리는 특정 수준이 강박 장애. 아마이 그림 사람들의 견과류를 많이 운전. 그리고 캐비닛되지 않은 특히 유선 우리의 네트워크를 구동하고 시설 엔지니어 너트. 플러스 또한 공기 흐름이있다 당신이 포함해야 할 문제. 그래서 이러한 일들은 제가 생각하지 않았을 것이다. 규모로, 더 복잡성을 온다. 이것은 파일 시스템의 새로운 유형이다. 그것은 끝내. 그것은 페타 바이트입니다. 그것은 11 억 파일을 저장할 수 있습니다. 그것은 읽고 13기가바이트 쓸 수 있습니다 및 20기가바이트 second-- 기가 바이트 두 번째. 그래서 테라 바이트를 언로드 할 수 있습니다 전혀 시간에. 그리고 그것은 매우 사용할 수 있습니다. 그리고 그것은 놀라운 조회 있어요 rates-- 22 번째를 조회. 그리고 많은 다른 사람들이있다 시스템의 이러한 종류의 건물입니다. 그리고 당신은 그래픽 여기를 볼 수 있습니다. 이것은 우리의 파일 시스템 중 하나입니다 즉, 아주, 부하의 행복하게 단지 짧은에서 읽기 22기가바이트 초. 그래서 cool-- 너무 복잡합니다. 복잡성과 규모에 따라서, 더 복잡성, 오른쪽 온다? 이것은 우리의 일부입니다 많은 네트워크 다이어그램, 당신은 다른 많은이 곳 섀시는 모든 지원하는 메인 코어 스위치로, 저장소에 연결된, 낮은 지연 시간 상호 연결에 연결. 그리고이 쪽의 모든 집은, 단지 관리의 모든 것 만약 어드레스 할 수 있어야한다는 원격 위치에서 이러한 시스템. 그래서 규모가 많이있다 그것으로 복잡성. 다시 기어를 변경의 돌아 가자 과학의 작은 반점이있다. 그래서, 기억, 연구 컴퓨팅 및이 작은 shim-- 사이에 약간의 핑크 심 교수 및 알고리즘의 모든 시원한 모든 과학 및 모든 이 전력 및 냉각 및 데이터 센터 바닥과 네트워킹 및 큰 컴퓨터 및 서비스 데스크 및 헬프 데스크 그리고 그래서 그렇게 forth--, 우리는 그저 그들 사이의이 작은 심. 우리는 무엇을 시작했습니다 참조는 세계의 것입니다 구축 할 수 있었다 이러한 대규모 데이터 센터 빌드 할 수 이러한 대형 컴퓨터. 우리는 꽤 잘 들어 왔. 우리가 아주 잘 아니에요 것은 이것입니다 연구 사이의 작은 심 베어 메탈 및 기술과. 그리고 그것은 어렵다. 그래서 우리는 고용 할 수있었습니다 이 세상에서 사는 사람들. 그리고 최근에, 우리는에게 말 국립 과학 재단 (National Science Foundation)과는 말했다 이 스케일 아웃 (scale-out) 물건은 중대하다 그러나 우리는 우리의 과학자를 얻을 수 없다 이 큰 복잡한 기계에에. 그리고,이 있었다 다른 프로그램의 수 여기서 우리가 정말 대부분이었다 노력에 대해 우려 우리가 변환 수 있는지 캠퍼스 인프라를 제공합니다. 프로그램이 많이 있습니다 국가 센터 주변. 그래서, 우리 자신, 우리의 클렘 슨에서 친구, 위스콘신 매디슨 대학, 남부 캘리포니아, 유타, 하와이 가지에 함께있어 이 문제를 봐주세요. 그리고 여기이 작은 그래프 과학의 긴 꼬리입니다. 그래서이 그렇지 않은 놈은 ... 사정이 축에 무엇을, 하지만이 축 실제로 번호 작업의 클러스터를 통과. 그래서 35 저쪽에요 어떤 시간 기간. 이들은 우리의 평소 용의자 여기 하단. 사실, 앨런 Aspuru-Guzik가있다, 누가 우리가 t하는 ​​.. 얘기했다 과 컴퓨팅의 톤, 정말 효과는, 자신이 무엇을하고 있는지 알고있다. 여기에 내가 얘기하자 다른 실험실이다 순간은 존 코바치의 실험실에서 약. 그들은 있어요. 그들은 좋은거야. 그들은 행복하다. 그들은 계산하고 있습니다. 위대한 과학은 이루어지고 있습니다. 그리고, 당신과 같은 종류 의이 여기 와서 다른 그룹은 그 많은 작업을 실행되고 있지 않습니다. 그리고 그 이유는? 그것은 컴퓨팅이 너무 어렵 기 때문에인가? 이 방법에 그들이 모르기 때문에인가? 우리가 모르는, 때문에 우리는 사라지고 보았다. 그래서 그게 무슨이있어 이 프로젝트는, 모두에 대해 내 로컬입니다 이들 영역 각각, 우리가 관여 할 수있는 길을 찾으려면 교수 및 연구원으로 실제로 꼬리의 하단에, 그들이 무슨 일을하는지 이해합니다. 그래서 우리가있어 무엇인가이다 약 실제로 열정. 그리고 그 뭔가의 그 과학 계속할 수 없습니다 우리가 해결 될 때까지 앞쪽으로 이동 이러한 가장자리의 경우 일부. 과학의 다른 비트 그 모두 주라고 말하고거야 대형 강 입자 충돌기를 본. 멋지죠? 이 물건은 모든 홀리 요크에서 다했다. 우리는 첫 번째를 built-- 홀리 요크에서 일어난 과학 협력 사이였다 자신과 보스턴 대학. 그래서 정말, 정말 멋지다. 이 재미있는 작품이다 규모에 대한 과학의. 이에 디지털 접근입니다 하버드 하늘 세기. 기본적으로, 접시 아카이브입니다. 당신이 아래로 가면 Oxford-- 가든 스트리트, 죄송합니다, 당신은 전망대 중 하나를 찾을 수 있습니다 건물은 기본적으로 가득 약 50 만 판. 그리고 이러한 사진입니다 밤 하늘, 백년 이상. 거기 그래서 전체 장비는 설정 여기, 그 판을 디지털화 이들의 사진을 촬영, 등록 그들은 컴퓨터에 넣어. 그리고는 페타 바이트 반이다, 바로 저기 하나의 작은 프로젝트. 이들은 다른 프로젝트입니다. 이 팬-STARRS 프로젝트는하고있다 전체 넓은 파노라마 설문 조사, 가까운 지구 소행성을 찾고 과도 천상의 이벤트. 분자 생물 물리학, 나는 사랑 단어 과도 천상의 이벤트입니다. 나는 그것이 무엇인지 확실히 모르겠지만, 어쨌든, 우리는 그들을 찾고 있습니다. 그리고 우리는 30 테라 바이트를 생성하고 그 망원경 중 밤. 그리고 정말 대역폭이 아니다 문제는, 그 페덱스 문제 같아요. 그래서 당신은 반에 저장을 넣어 당신은 무엇이든 보낼 수 있습니다. 이두는 정말 interesting--입니다 그래서 배경 영상 우주 여분의 은하 편광. 내가 처음 작업을 시작했을 때 하버드 일곱 정도에서, 8 년 전, 기억 이 프로젝트에 참여 그리고 그것은 정말로 침몰하지 않았다 왜 편광으로 집 우주 전자 레인지에서 배경은 중요 할 것이다 이 일 때까지. 그리고 이것은 존 코바치이었다 누가 내가 전에에 이야기 CPU의 수백만에 수백만을 사용하여 시간, 우리 시설 등의, 기본적으로 내부에 응시하기 우주 최초의 순간 빅뱅 후,과 이해하려고 노력 아인슈타인의 일반 상대성 이론. 그것은 우리의 컴퓨터 우렁찬 마음이다 우리가 해명 및 응시 돕고있다 우리가 여기있는 이유의 매우 기원에. 그래서 당신은 규모에 대해 이야기 할 때, 이 심각한 규모이다. 규모의 다른 점은,이다 특정 프로젝트에이 사람들을했다. 그리고 이것은 이두에 대한 응답 곡선 [들림] 이것은 우리의 작은 조사했다. 그리고 당신은 여기에서 볼 수, 생활 약 여기까지 좋았다 이었다 때 발표가 나왔다. 그리고 당신은 문자 그대로 가지고있다 초 응답하는 스케일링 이벤트에있는 여기이 작은 점에 해당 이동 결국하는 4 개의 데이터 정도 테라 웹 서버를 통해 그 꽤 털이 day--. 그리고, 이러한이 가지의 유형이 인프라에 당신에게 일어날 수있는 당신은 규모에 대한 설계하지 않는 경우. 우리는 약간 있었다 그 날 출격 될 수 있습니다 충분한 웹 서비스를 걸쳐 수 사이트 및 실행을 유지합니다. 그리고 우리는 성공했다. 이것은 약간의 이메일입니다 그 종류의 귀여운입니다. 이 마크 Vogelsberger에 메일입니다 그리고 라스 Hernquist는 사람이다 여기 하버드 교수. 마크 나중에에 대한 자세한. 그러나 나는이 하나의 생각 종류의 종류 요약 여기서 컴퓨팅 연구 컴퓨팅입니다. 이봐, 팀, 지난 이후 화요일, 너희들은 깨졌어 새의 28 % 이상 결합 된 클러스터, 78 년 이상이다 사흘에 CPU. 그리고 나는 여전히 말했다 단지 금요일 아침. 이 꽤 굉장하다! 행복한 금요일! 그리고 나는 그들에게 데이터 포인트를 제공합니다. 그리고 그 가지 흥미로웠다. 그래서 마크에 대한 기억, 그는 올 거 약간의 그림으로 백업합​​니다. 그래서 스케일 아웃 컴퓨팅은 어디 에나있다. 우리는 심지어 사람들이 볼 수 있도록하고 방법 NBA 기능에서, 사람들은 어디에 에서 공을 던지고. 정말 너무이 게임을 이해하지 못하는 잘하지만, 겉으로는, 그것은 큰 문제입니다. 농구와 그릇과 돈이있다. 그리고, 우리의 데이터베이스, 우리 내장 된 작은 500 INAUDIBLE] 병렬 프로세서 클러스터, RAM의 테라 바이트의 커플 이를 구축 할 수 있도록 커크와 그의 팀. 그리고 그들은 컴퓨팅을하고있는 완전히 다른 방식으로. 지금이 우리가있어 프로젝트 그건 참여 절대적으로 매혹적인, 신경 주위에 소성 connectomics 게놈 imprinting-- 세 가지 매우 무거운 연구의 타격 분야 우리는에 함께 싸울 것을 매일 매일. 우리의 두뇌는 아래에있는 아이디어 우리가 어린 플라스틱 스트레스. 그리고 우리의 성인 행동의 대부분은 유아기의 경험에 의해 조각. 그래서 이것은 큰 하는거입니다. 그리고이 자금의 작품입니다 정신 건강의 국립 연구소. 그리고 우리는, 기본적으로하려고 큰 많은 양의 데이터를 통해 및 빅 데이터 분석, 종류 우리 인간의 뇌를 들여다 다양한 통해 다른 기술. 그래서 나는 중지하고 싶었 가지 조금 잠시 동안 일시 중지합니다. 리모컨 도전 데이터 센터는 멀어이다. 그것은 가능성이 작동하지 않을 수 있습니다. 내가 가까이 내 데이터가 필요합니다. 내 실험실 내 연구를 할 필요가있다. 그래서 나는 가지의 예를했다 기능적 자기 공명 영상 우리의 데이터에서 데이터 세트 서양 질량의 중심. 과에 연결된 내 캠브리지 바탕 화면. 그리고 나는이 작은 비디오를 재생합니다. 잘하면 가지 작동합니다. 그래서이 날을 겪고있다 확인 내 GPU는 노력하고 있습니다. 그리고 VNC의 최대 있음을 확인하고 있습니다. 그리고 이것은 영리한 VNC이다. 이 3D 조각 VNC이다. 그래서, 당신은 곧 볼 수 있습니다,이 내 주변이 두뇌 회전이다. 나는 가지가 지향 얻을 위해 노력하고있어. 그리고 나는 많은 이동할 수 있습니다 MRI 데이터의 다른 조각. 그리고 유일한 그건 이것에 대해 다른 그것은 와이어를 통해오고있다 서양 미사에서. 내 바탕 화면에. 그리고 그 렌더링 내 바탕 화면보다 더 빨리, 나는이 없기 때문에 4,000 달러 내 바탕 화면에 그래픽 카드가있는 우리는 서양의 질량을 가지고있다. 물론, 내가 영리하기 위해 노력하고있어. 나는에 GLX 기어를 실행하는거야 배경,이 모든 일을하는 동안, 내가 할 수 있는지 확인 그래픽 카드를 강조 그리고 모든 종류의 그 작품과 그것의 모든 나머지. 그러나 중요한 것은,이다 이 100 마일 떨어져 있습니다. 그리고 당신이에서 볼 수 명백한 대기 시간이 없습니다. 상황이 꽤 잘 함께 들고. 그리고 그, 그 자체로, 예를 들어 어떤 통찰력이다 방법 컴퓨팅 및 스케일 아웃 (scale-out)에 컴퓨팅이 일어날 것입니다. 우리는 모든 작업중인 얇아 장치. 정제의 우리의 사용이 증가하고있다. 그래서 그러므로 내 탄소 발자국은 기본적으로 사용되는 것과 이동 즉했습니다 것입니다해야 할 일 거대한 기계이었다 내 책상 아래에 무엇 facility-- 어디 수 지금이다. 그것은 어디에서 모든 수 있습니다. 그럼에도 불구하고, 여전히 가져올 수있어 다시 고성능 그래픽 내 바탕 화면에. 그래서, 근처에 점점 end-- 마크를 기억하세요? 음, 스마트 젊은이 마크입니다. 그는가는 것을 결정 사실적인 가상 세계를 구축 할 수 있습니다. 즉, 꽤 프로젝트, 당신이야 이 피치있어 생각합니다. 나는를 사용하는거야 컴퓨터, 나는거야 12,000,000년 후 모델링하기 빅뱅 하루 나타냅니다. 그리고 나서 13.8을 할거야 우주의 진화 억 년. 좋아. 이것은 실제로 컴퓨터를 사용하는 은, 우리의 컴퓨터보다 더 크다 그리고 전국에 걸쳐 유출 우리의 친구에 자원 텍사스에서 아래로. 그리고 국가의 시설에 이 계산을 많이했다. 그러나 우리는 많이했다 로컬 시뮬레이션 소프트웨어가 있는지 확인 근무 시스템은했다. 그리고이 같은 일의 때를 당신은 과학을 지원하고 실현 규모의이 수준, 그에서 사람들은 지금 일을 말할 수있다 같은, 나는 우주는 모델에 갈거야. 그리고 그의 첫 번째 모델이다. 그리고 이것은 그의 팀의 첫 번째 모델이다. 다른 많은이 있습니다 가는 사람 에가는 마크, 뒤에 올 높은 해상도로 모델링 할, 더 특이도, 더 정확도. 그리고, 분의 마지막 몇, 난 그냥 당신이 비디오를 보여주고 싶은 마크와 라스의의 나에게, 다시, 생명 과학자로, 가지 귀엽다. 그래서, 바닥에 여기, 당신의 방향을, 이것은 당신을 말하고있다 빅뱅 이후 시간. 그래서 우리는 약 0,700,000,000년에있어. 그리고 이것은 현재 업데이트를 보이고있다. 그래서, 지금보고있는 암흑 물질과 진화 미세 구조의 초기 우리 알려진 우주의 구조. 그리고이와 지점이 있다는 것입니다 모든 컴퓨터 내부에서 이루어집니다. 이것은 파라미터 세트 인 물리학의 집합 수학의 집합 및 모델 세트 그 엄선하고 있습니다 조심스럽게 서로 접속 상호 작용을 모델링 할 수 있습니다. 그래서 당신은 어떤 시작을 볼 수 있습니다 여기에 몇 가지 가스 폭발. 그리고 가스 온도가 변화하고있다. 그리고 당신은 구조를 볼 시작할 수 있습니다 눈에 보이는 우주 변화의. 그리고이 가진 중요한 부분 각 조금 작은, 작은, 작은 점이며, 물리학 편이며 갖는다 주위에 수학의 집합, 그 친구와 이웃을 알리는. 따라서 스케일링 관점에서, 이들 컴퓨터는 콘서트에서 모든 일을해야 효율적으로 서로 대화. 그래서 그들은 너무 수다스러운 수 없습니다. 그들은 그들의 결과를 저장해야합니다. 그리고 그들은 계속해야 자신의 친구의 모든 알려줍니다. 사실,이 모델의 지금 볼 수 있습니다 점점 더 복잡해. 계속 더 많은 물건이있다. 점점 더있다 재료는 주위를 비행. 그리고 이것은 무엇 이르다 코스모스처럼 보이는 한 것입니다. 그것은 꽤 털이 장소였다. 폭발은 온통있다 장소, 강력한 충돌. 그리고 무거운의 형성 금속 및 요소. 그리고 이러한 큰 구름에 스매싱 극단적 인 힘으로 서로. 그리고 지금 우리는 96 억이야 이 초기 폭발 년. 당신은 일이보기 시작하고 가지 그냥 조금 진정 조금, 때문에 에너지는 현재 휴식을 시작합니다. 그래서 수학 모델은 장소에 그것을 가지고있다. 그리고 당신은보기 시작하고 다른 요소의 합체. 그리고 종류이 일을보기 시작 의 함께 천천히 냉각되어 있습니다. 그리고 조금 보이기 시작이야 밤 하늘, 조금 같은 더. 그리고 [입니까? QSing. ?] 우리는 지금 30.2있어 억 년 우리는 종류의 완료. 그리고 그들이 한 일은이었다 그들은이 모델을 걸렸다, 후 눈에 보이는 우주를 바라 보았다. 그리고 기본적으로 그 다음이었다 그 걸릴 오버레이 할 수 당신이 볼 수있는 것과 그것. 그리고 충실도에 대해, 비틀 거리고 얼마나 정확한 컴퓨터 모델이다. 물론, 천체 물리학 상기 연구 그룹 더 나은 충실도 필요 심지어 높은 해상도. 하지만 생각해 보면 무엇을 오늘 당신에게 얘기했습니다 모두를 통해이 작은 항해를 통해 스토리지 및 구조 및 네트워킹 와 스택, 중요한 것은,이다 스케일 아웃 (scale-out)은 필수 계산이? 즉, 내 원래 hypothesis--했다 다시 우리의 과학적인 방법에 관한 것이다. 나는 초기에 그 희망 이 부분 나는 것 내가 설명 할 수있을 것이라고 예측 당신 스케일 아웃 (scale-out) 컴퓨팅에 대한. 그리고 우리는 가지 테스트 그 가설의 일부. 우리는이 대화를 통해 갔다. 그리고 난 그냥 스케일 아웃 (scale-out)을 말하는거야 컴퓨팅, 오 essential--됩니다 네, 매우 예. 그래서 때 생각 당신의 코드에 대한 당신은 CS50 최종 프로젝트를하고있는 당신은 당신의 유산에 대해 생각 할 때 인간과 자원이 우리 이러한 컴퓨터를 작동 할 수 있어야 시스템은 매우 신중하게 생각 와트 당 FLOPS에 대한, 그리고 카오스 원숭이에 대해 생각합니다. 당신의 눈송이에 대해 생각,하지 , 일회성, 재사용 라이브러리를 할 모든 것들을 재사용 codes--을 구축 교사는 가르치는되었는지 이 클래스. 이러한 근본적인 측면이다. 그들은 단지 서비스를 입술 아닙니다. 이들은 실제 것들입니다. 그리고 너희 중에 누구든지 나를 따라하려는 경우, 나는 트위터 것으로, 강박 관념에 사로 잡힌입니다. 나는 어떻게 든 포기 있어요. 그러나 많은 배경 정보는 우리의 연구 컴퓨팅에 rc.fas.harvard.edu에서 웹 사이트. 나는 시도에 블로그까지 유지 현대 기술과 최신 우리는 어떻게 분배 할 컴퓨팅 등등. 그리고 우리의 직원은 항상 odybot.org를 통해 사용할 수 있습니다. 그리고 odybot는 우리의 작은 도우미입니다. 그는 종종 거의 없다 자신의 웹 사이트에 콘테스트 너무, 어디에 당신이 시도 할 수 있으며 캠퍼스 그를 발견. 그는 친절한 약간의 연구 컴퓨팅의 얼굴. 그리고 가지가 마무리됩니다 당신의 시간을 여러분 모두 감사합니다. 그리고 난 당신이 기억 희망 스케일 아웃 컴퓨팅은 진짜입니다. 그리고 많은 사람들이 있습니다 누가 선행 기술이 많이있어 누가 당신을 도울 수있을 것입니다. 그리고와 행운의 모든 만드는 미래의 노력 우리는 모두 계산해야 저울, 고성능이며, 더 많은 인류를하는 데 도움이 무엇보다. 그래서, 시간 내 주셔서 감사합니다.