THOMAS CARRIERO: Sono Thomas Carriero. Sono un ingegnere software presso Dropbox. ALEX ALLAIN: Sono Alex Allain. Sono un ingegnere qui a Dropbox. 

THOMAS CARRIERO: SÃ¬, ero in realtÃ  il primo TF testa per CS50 quando David Malin ha assunto la classe. Avevo giÃ  insegnato CS50 per due semestri con Mike Smith, che era il professore prima lÃ¬. 

ALEX ALLAIN: Quindi io in realtÃ  non ha prendere CS50, ma l'ho fatto TF due volte. Una volta, da TF regolare, e poi il mio ultimo anno Mi Ã¨ stato effettivamente capo TF di CS50, che Ã¨ stato molto divertente. THOMAS CARRIERO: So quando David allungÃ² a me sulla configurazione Dropbox nell'apparecchio CS50, Ero molto emozionato, perchÃ© in realtÃ  abbiamo un client Linux, quindi la maggior parte dei nostri utenti utilizzare uno Di Windows o il client Macintosh, ma Linux, Macintosh e Windows i clienti sono tutti in realtÃ  molto simili. 

Quindi quello che abbiamo fatto Ã¨ che pre-installato il client Dropbox Linux in CS50 apparecchio, e funziona proprio come tutti i nostri altri utenti Linux. 

ALEX ALLAIN: CosÃ¬ l' modo Dropbox funziona Ã¨ che corre come un client su molti diversi sistemi operativi e dispositivi. Il client desktop di Dropbox Ã¨ uno dei piÃ¹ noti, e uno dei piÃ¹ interessanti. 

THOMAS CARRIERO: CosÃ¬ Dropbox fondamentalmente prende tutti i file che si inserisce nella cartella e Chunks i file in blocchi di quattro megabyte. CosÃ¬ daremo uno da 100 megabyte File PDF e faremo chunk in 25 blocchi di quattro megabyte. Tali blocchi sono poi codificati e poi li mandiamo ai nostri server di blocco. 

ALEX ALLAIN: I server di blocco sono l'archiviazione per i blocchi stessi, e cosÃ¬ ogni blocco viene memorizzato in il server blocco con i dati e Shaw 356 hash di quel blocco. Questa Ã¨ una crittografia di base primitivo che riassume, in un certo senso, i dati in un modo molto singolare che Ã¨ unico per i dati. 

Si puÃ² caricare il intero file tutto in una volta, ma si scopre se si fa che i file, veramente grandi hanno un tempo molto lungo per caricare, e se si verifica un errore, sei fuori di fortuna e bisogna riavviarlo. 

Quello che noi facciamo Ã¨ allora diciamo un altro server nel nostro sistema, e ciÃ² che noi chiamiamo i metadati Server, che hey questo Ã¨ un file, ed Ã¨ composto dal seguente elenco di blocchi. E passiamo le hash identificare quei blocchi piuttosto che ri-caricato l'intero blocco. Il metaserver poi controlla i server di blocco, fa che i blocchi sono lÃ¬. Se lo sono, perfetto. Tutto Ã¨ buono. 

THOMAS CARRIERO: Quando abbiamo desidera scaricare in fondo il file da internet, cerchiamo di per esempio, diremo all'ultimo metaserver in primo luogo, hey mi puoi dire su dove si trova di questo file? E metaserver dirÃ , oh, questo file di in realtÃ  25 blocchi di quattro megabyte, ed eccoli qui. E poi andremo un server di blocco e effettivamente scaricare ciascuno di questi pezzi. E poi ci ricostruiamo il file da lÃ¬, e poi inizieremo il download. SÃ¬, cosÃ¬ Dropbox di offerte con scala in fondo da molto, sharding molto aggressivo. 

ALEX ALLAIN: Sharding Ã¨ quando si prendere tutti gli utenti nel vostro start up o la vostra azienda e forse utilizzato per essere in un database, e che funziona alla grande fino a quando non colpire un certo numero di utenti. E davvero quello che vuoi da fare Ã¨ trovare un modo per dividere quelli attraverso due database, o forse piÃ¹ di due. Idealmente, tanto che si puÃ² avere ogni utente nel mondo. 

E cosÃ¬ quando si Shard, quello che fate voi Ã¨ trovare il modo di decidere quale database andare a che non richiede colpendo una directory centrale. O forse Ã¨ un molto veloce, directory centrale look-up a basso costo. 

THOMAS CARRIERO: Non abbiamo mai tutto memorizzato in un database, perchÃ© Ã¨ quasi mai andare a scalare. CosÃ¬, invece, quello che faremo Ã¨ prendere tutto che le informazioni, tutti i file che memorizzate sulla metadati, coccio in centinaia o migliaia di database logici. E questo significa che quando abbiamo un richiesta di informazioni di un utente, faremo in primo luogo dire, hey quale database sono le informazioni di questo utente memorizzato in? Poi faremo fondamentalmente utilizzare tale decisione di andare trovare quel database ed Ã¨ lÃ¬ che faremo caricare tutti i file o tutti i metadati sui file. 

Quindi usiamo un sacco di sharding. Ma sharding non Ã¨ sempre sufficiente. Hai veramente bisogno di memorizzare nella cache un sacco di richieste comuni, perchÃ© anche quelli del database query possono essere costosi cosÃ¬ anche noi facciamo la cattura aggressivo strategie per assicurarsi che il piÃ¹ richieste comuni sono abbastanza facile da calcolare. E in fondo che fa un sacco veloce e fa funzionare ex scala. CosÃ¬ che Ã¨ a un prezzo molto alto livello come funziona Dropbox. 

ALEX ALLAIN: Sono Alex Allain. 

THOMAS CARRIERO: E Sono Thomas Carriero. ALEX ALLAIN: E questo Ã¨ CS50.