דזשעפרי ליכט: הי דאָרט. איך בין דזשעפרי Licht. און איך בין דאָ צו רעדן צו איר וועגן די האַרוואַרד ביבליאָטעק און בנין מאָרגן ס ביבליאָטעק הייַנט, איך טרעפן. אזוי דער הינטערגרונט דאָ, די גראַד פֿאַר דעם סעסיע איז יסענשאַלי וואָס עס איז אַ פּלאַץ פון ביבליאָגראַפיק דאַטן בנימצא אין די האַרוואַרד ליבראַריעס. און עס איז אַ געלעגנהייט, דורך עטלעכע פון ​​די מכשירים און אַ פּרויעקט אַז ס זייַענדיק דעוועלאָפּעד, צו באַקומען צוטריט צו די אינפֿאָרמאַציע און נעמען עס צו ערטער וואָס די האַרוואַרד ביבליאָטעק איז ניט טאן רעכט איצט, טאָן נייַ שטאָפּן מיט עס, עקספּערימענט און שפּילן אַרום מיט עס. אזוי די פּאָזיציע פונט אין דעם איז אַן אַפּי גערופן די האַרוואַרד-ביבליאָטעק קלאָוד, וואָס איז אַן עפענען מעטאַדאַטאַ סערווירער, וואָס איך וועט רעדן וועגן איצט. אזוי דער הינטערגרונט איז אַז עס איז אַ פּלאַץ פון שטאָפּן אין די האַרוואַרד-ביבליאָטעק. מיר האָבן איבער 13,000,000 ביבליאָגראַפיק רעקאָרדס, מיליאַנז פון בילדער, און טויזנטער פון דערגייונג AIDS, וואָס זענען יסענשאַלי דאָקומענטן דיסקרייבינג זאַמלונגען, געזאגט וואס איז אין זיי, באָקסעס פון צייטונגען און אַזוי אַרויס אַז פאָרשטעלן איבער אַ מיליאָן יחיד דאָקומענטן. און דאָרט ס אויך אַ פּלאַץ פון אינפֿאָרמאַציע אַז די ביבליאָטעק האָט וועגן ווי די צופרידן איז געניצט אַז קען זיין פון אינטערעס צו מענטשן וואס זאל וועלן צו אַרבעטן מיט עס. אזוי אַלע פון ​​די אינפֿאָרמאַציע די ביבליאָטעק האָט מעטאַדאַטאַ. אזוי מעטאַדאַטאַ איז דאַטן וועגן דאַטן. אזוי ווען מיר רעדן וועגן די אינפֿאָרמאַציע וואס ס בנימצא דורך די ביבליאָטעק וואָלקן אַז ס בנימצא, עס ס ניט דאַווקע די פאַקטיש דאָקומענטן זיך, ניט דאַווקע די גאַנץ טעקסט פון ביכער אָדער די פול בילדער, כאָטש אַז פאקטיש קען זיין דער פאַל. אבער עס ס טאַקע אינפֿאָרמאַציע וועגן דעם דאַטן. אזוי איר קענען טראַכטן פון קאַטאַלאַגינג אינפֿאָרמאַציע, רופן נומערן, סאַבדזשעקס, ווי פילע עקזעמפלארן פון די בוך עס זענען, וואָס זענען די אויסגאבעס, וואָס זענען די פֿאָרמאַטירונגען, די מחברים, און אַזוי אַרויס. אזוי עס ס אַ פּלאַץ פון אינפֿאָרמאַציע וועגן די אינפֿאָרמאַציע אין דעם זאַמלונג וואָס, אין זיך, איז מין פון ינכעראַנטלי נוצלעך. און כאָטש אויב איר 'רע טאן אין-טיפקייַט פאָרשונג, איר דאָך ווילן צו באַקומען צו די פאַקטיש צופרידן זיך און קוקן בייַ די דאַטן, די מעטאַדאַטאַ איז נוציק אין טערמינען פון ביידע אַנאַלייזינג די קאָרפּוס ווי אַ גאַנץ, ווי וואָס זאכן זענען אין די זאַמלונג. ווי טאָן זיי פאַרבינדן? עס העלפט איר טאַקע געפינען אנדערע שטאָפּן, וואָס איז טאַקע דער הויפּט ציל פון עס. די פונט פון די מעטאַדאַטאַ און די קאַטאַלאָג איז צו העלפן איר געפינען אַלע די אינפֿאָרמאַציע וואס ס בנימצא ין די זאַמלונגען. אזוי דעם איז אַ בייַשפּיל פון מעטאַדאַטאַ פֿאַר אַ בוך אין די האַרוואַרד-ביבליאָטעק. אזוי עס ס דאָרט. און איר קענען זען עס ס פאקטיש מאַדעראַטלי קאָמפּלעקס. און טייל פון די ווערט פון מעטאַדאַטאַ ין די האַרוואַרד-ביבליאָטעק סיסטעם איז אַז עס ס שוין סאָרט פון געבויט אַרויף דורך קאַטאַלאָגערס און פארזאמלט דורך מענטשן אַפּלייינג אַ פּלאַץ פון עקספּערטיז און בקיעס און געדאַנק צו עס איבער צייַט, וואָס האט אַ פּלאַץ פון ווערט. אזוי אויב איר נעמען אַ קוק אין דעם רעקאָרד פֿאַר די אַנאַטייטיד אַליס, איר קענען געפינען אויס איר ווע גאַט די טיטל, וואס געשריבן עס, די מחבר, און אַלע די פאַרשידענע סאַבדזשעקץ וואָס מענטשן האָבן קאַטאַלאָגד עס אין. און איר קענען זען עס ס אויך, אין דערצו צו אַ פּלאַץ פון גוט אינפֿאָרמאַציע דאָ, עס ס עטלעכע דיופּלאַקיישאַן. עס ס אַ פּלאַץ פון קאַמפּלעקסיטי אַז ס שפיגלט דורך די מעטאַדאַטאַ אַז איר האָבן. אזוי איינער טיטל פון דעם בוך איז אַליס ס אַדווענטורעס אין וואָנדערלאַנד. אזוי דעם איז אַ אַנאַטייטיד ווערסיע פון ​​אַז בוך. אבער עס ס אויך גערופן די אַנאַטייטיד אַליס, אַליס ס אַדווענטורעס אין וואָנדערלאַנד ווייַל עס ס עפּעס וואָס מארטין גאַרדנער געשריבן און אַנאַטייטיד די בוך. און עס ס אַ פּלאַץ פון גרויס אינפֿאָרמאַציע וועגן לאָגיק פּאַזאַלז און זאכן ין אַליס אַז איר מיסטאָמע האט ניט וויסן וועגן. אזוי איר זאָל גיין לייענען עס. אבער איר קענען זען עס ס אַ פּלאַץ פון פּרט דאָ, אַרייַנגערעכנט ידענטיפיערס, ווען עס איז באשאפן, ווו עס געקומען פון, אין טערמינען פון די האַרוואַרד סיסטעם, און אַזוי אַרויס. אזוי דעם איז אַ מוסטער פון די טיפּ פון מעטאַדאַטאַ אַז איר זאל זען פֿאַר אַ בוך אין די האַרוואַרד-ביבליאָטעק זאַמלונג. דאס איז עפּעס גאָר אַנדערש. אזוי עס איז אַ סיסטעם גערופן VIA האַרוואַרד, וואָס בייסיקלי איז קאַטאַלאַגינג בילדער און אַבדזשעקס פון קונסט און וויסואַל זאכן איבער האַרוואַרד, און אַדינג עטלעכע מעטאַדאַטאַ צו זיי, קלאַסאַפייינג זיי, און, אין עטלעכע קאַסעס, פּראַוויידינג קליין טאַמנייל בילדער אַז איר קענען נעמען אַ קוקן בייַ אויב איר אַזוי ווונטש. אזוי דעם איז אַ בייַשפּיל פון די מעטאַדאַטאַ אַז איר האָבן פֿאַר אַ טעלער פון, מאַשמאָעס, אַליס אין וואָנדערלאַנד. און איר קענען זען עס ס ווייניקער מעטאַדאַטאַ דאָ. עס ס נאָר אַ פאַרשידענע מין פון כייפעץ. און אַזוי עס ס ווייניקער אינפֿאָרמאַציע. איר מערסטנס האָבן די פאַקט אַז, אַ רופן נומער, יסענשאַלי וואס באשאפן עס, - מיר טאָן ניט וויסן ווען עס איז געווען באשאפן. --אַנד אַ טיטל. אן אנדער בייַשפּיל. דאס איז אַ דערגייונג הילף. אזוי עס ס אַ זאַמלונג פון לויס קאַראַל ס צייטונגען אין האַרוואַרד. אזוי דעם באשרייבט וואָס איז אין וואָס זאַמלונג. אזוי עמעצער האט ניטאָ דורך און געקוקט דורך אַלע די באָקסעס און קאַטאַלאָגד עס, געגעבן עטלעכע הינטערגרונט, געשריבן אַ קיצער פון וואָס ס דאָ. און אויב איר זענען צו קוקן ווייַטער אין דעם, דעם גייט אויף פֿאַר בלעטער און בלעטער און בלעטער, אָבער וועט זאָגן איר וואָס אותיות און וואָס דאַטעס פון וואָס באָקסעס עקסיסטירט איבער די זאַמלונג. אבער דעם איז עפּעס אַז, אויב איר 'רע אין האַרוואַרד, איר קענען גיין און פאקטיש פיזיקלי קוקן אַרויף און, מאַשמאָעס, נעמען אַ קוק בייַ. אזוי דעם איז אַלע גרויס. דאס מעטאַדאַטאַ ס נוציק. עס ס אין די האַרוואַרד-ביבליאָטעק סיסטעם. עס זענען מכשירים אָנליין ווו איר קענען גיין און נעמען אַ קוק אין עס, און זען עס, און זוכן עס. און איר קענען פּענעץ עס און ביינדלעך עס אין גורל פון פאַרשידענע דרכים. אבער עס ס טאַקע נאָר בנימצא אויב איר זענט אַ מענטשלעך זייַענדיק זיצן אַראָפּ בייַ דיין וועב בלעטערער אָדער עפּעס אָדער דיין טעלעפאָנירן און נאַוואַגייטינג דורך עס. עס ס ניט טאַקע בנימצא אין קיין מין פון ניצלעך שניט פֿאַר אנדערע סיסטעמס אָדער אנדערע קאָמפּיוטערס צו נוצן, ניט מיט סיסטעמען ין די האַרוואַרד-ביבליאָטעק, אָבער סיסטעמס אין די אַרויס וועלט, נאָר אנדערע מענטשן אין אַלגעמיין. אזוי די קשיא איז, ווי קענען מיר מאַכן עס בנימצא צו קאָמפּיוטערס אַזוי אַז מיר קענען טאָן מער טשיקאַווע שטאָפּן מיט עס ווי נאָר בראַוזינג עס זיך? אזוי וואָס וואָלט איר ווילן צו טאָן דעם? עס זענען אַ פּלאַץ פון פּאַסאַבילאַטיז. איינער איז איר קען בויען אַ גאָר פאַרשידענע וועג פון בראַוזינג די צופרידן אַז ס בנימצא דורך די האַרוואַרד ליבראַריעס. איך וועט ווייַזן איר איינער שפּעטער גערופן סטאַקקליפע, וואָס האט אַ גאָר אַנדערש נעמען אויף קוקן פֿאַר צופרידן. איר קען בויען אַ רעקאָמענדאַציע מאָטאָר. אזוי האַרוואַרד ביבליאָטעק איז ניט אין דער געשעפט פון געזאגט, איר ווי דעם בוך. דערנאך גיין נעמען אַ קוק אין די 17 אנדערע ספר אַז איר זאל זיין אינטערעסירט אין אָדער די 18 אנדערע בילדער. אבער אַז אוודאי קען זייַן אַ ווערטפול שטריך. און געגעבן דעם מעטאַדאַטאַ, עס קען זייַן מעגלעך צו שטעלן אַז צוזאַמען. איר זאל האָבן פאַרשידענע באדערפענישן אין טערמינען פון שאַרף די צופרידן, ווי אפֿשר טראָץ דער מכשירים אַז זענען בנימצא אַז די ביבליאָטעק מאכט בנימצא, איר זאל וועלן צו זוכן אין אַ אַנדערש וועג אָדער אַפּטאַמייז פֿאַר אַ באַזונדער נוצן פאַל, וואָס אפֿשר עס ס זייער ספּעשאַלייזד. אפֿשר עס זענען בלויז אַ ביסל מענטשן אין דער וועלט וואס ווילן צו זוכן די צופרידן אין דעם וועג, אָבער עס וואָלט זייַן גרויס אויב מיר קען לאָזן זיי טאָן אַז. עס ס אַ פּלאַץ פון אַנאַליטיקס אין נאָר ווי מענטשן נוצן די צופרידן אַז וואָלט זייַן טאַקע טשיקאַווע צו וויסן וועגן, געפינען אויס וואָס ביכער זענען זייַענדיק געניצט, וואָס זענען ניט, און אַזוי אַרויס. און דעמאָלט דאָרט ס אַ פּלאַץ פון געלעגנהייט צו ויסשטימען מיט אנדערע אינפֿאָרמאַציע אַז ס אויס דאָרט אויף די וועב. אזוי מיר האַווע-- פֿאַר בייַשפּיל, NPR האט אַ בוך באריכטן אָפּשניט, ווו זיי אינטערוויו מחברים וועגן ביכער. און אַזוי עס וואָלט זיין גרויס אויב איר זענען קוקן אַרויף אַ בוך אין די האַרוואַרד ביבליאָטעק, און איר זאָגן, גוט, עס ס שוין אַן אינטערוויו מיט דער מחבר. זאל ס גיין נעמען אַ קוק אין וואָס. אָדער עס ס אַ וויקיפּעדיע בלאַט, ווי אַן אַטאָראַטייטיוו, וויסנשאַפטלעך דערמאָנען וועגן דעם בוך אַז איר זאל וועלן צו נעמען אַ קוק בייַ. עס זענען די טייפּס פון קוואלן צעוואָרפן איבער די וועב. און ברענגען זיי צוזאַמען קען זיין אַ גרויס נוצן צו עמעצער קוקן בייַ די צופרידן, קוקן פֿאַר עפּעס. אבער עס ס אויך נישט די מין פון זאַך איר איר'ד וועלן די ביבליאָטעק צו זיין פאַראַנטוואָרטלעך פֿאַר געגאנגען אַראָפּ און גייעג אַראָפּ אַלע די פאַרשידענע קוואלן און פּלאַגינג זיי צוזאַמען ווייַל זיי ניטאָ טשאַנגינג קאַנטיניואַסלי. און וואָס זיי טראַכטן איז וויכטיק קען ניט זיין וואָס איר טראַכטן איז וויכטיק. און אפילו מער אַזוי, בייסיקלי עס ס אַ פּלאַץ פון שטאָפּן מיר האָבן ניט געדאַנק פון נאָך. אזוי אויב מיר קענען עפענען דעם אַרויף, מער מען אויסערדעם אַ האַלב טוץ אָדער אַזוי, וואס זענען איר זוכט אין דעם אויף אַ רעגולער יקער קענען טראַכטן פון געדאנקען און מאַסאַזש די דאַטן, און טאָן וואָס זיי ווילן מיט עס. אזוי מיר וועלן צו מאַכן דעם דאַטן בנימצא צו די וועלט. נו, עס זענען אַ פּאָר קאַמפּלאַקיישאַנז. איינער איז אַז דעם מעטאַדאַטאַ איז אין פאַרשידענע סיסטעמען. עס ס אין פאַרשידענע פֿאָרמאַטירונגען. אזוי עס ס עטלעכע נאָרמאַליזיישאַן וואָס דאַרף צו פּאַסירן, וואָס נאָרמאַליזיישאַן זייַענדיק דער פּראָצעס פון געבראכט זאכן פון פאַרשידענע פֿאָרמאַטירונגען און מאַפּינג זיי צו אַ איין פֿאָרמאַט אַזוי אַז די פעלדער וועט גלייַכן אַרויף. עס זענען עטלעכע דרוקרעכט ריסטריקשאַנז. אַדלי גענוג, די קאַטאַלאָג פּאָזיציע וועגן אַ בוך איז לייאַבאַל פֿאַר דרוקרעכט. אזוי אפילו כאָטש עס ס נאָר אינפֿאָרמאַציע דערייווד פון די בוך, עס ס קאָפּיריגהטאַבלע. און דיפּענדינג אויף וואָס פאקטיש באשאפן אַז מעטאַדאַטאַ, עס קען זיין ריסטריקשאַנז אויף וואס קענען פאַרשפּרייטן עס, ענלעך טאָ-- איך טאָן ניט וויסן. עס קען אָדער קען נישט זיין ענלעך צו די סיטואַציע פון ​​דער ליד ליריקס, פֿאַר בייַשפּיל. אזוי מיר אַלע וויסן ווי אַז פּאַנס אויס. אזוי איר דאַרפֿן צו באַקומען אַרום אַז אַרויסגעבן. און דעמאָלט אנדערן שטיק איז אַז עס ס אַ פּלאַץ פון דאַטן. אזוי אויב איך בין עמעצער וואס וויל צו אַרבעטן מיט די דאַטן אָדער האט אַ קיל געדאַנק, דילינג מיט 14,000,000 רעקאָרדס אויף מיין לאַפּטאַפּ קען זיין פּראָבלעמאַטיק און שווער צו פירן. אזוי מיר וועלן צו רעדוצירן די באַריערז פֿאַר מענטשן צו קענען צו אַרבעטן מיט די דאַטן. אזוי דער צוגאַנג אַז אַלעווייַ ווענדט אַלע פון ​​די קאַנסערנז איז צוויי פּאַרץ. איינער איז בנין אַ פּלאַטפאָרמע אַז נעמט דאַטן פון אַלע די דיספּעריט קוואלן און אַגראַווייץ עס, נאָרמאַלייזיז, ענריטשיז עס, און מאכט עס בנימצא אין אַ איין אָרט. און עס מאכט עס בנימצא דורך אַ ציבור אַפּי אַז מענטשן קענען רופן. אזוי אַ אַפּי איז אַ אַפּלאַקיישאַן פּראָגראַממינג צובינד. און עס בייסיקלי רעפערס צו אַ ענדפּוינט אַז אַ סיסטעם אָדער טעכנאָלאָגיע קענען רופן און באַקומען דאַטן צוריק אין אַ סטראַקטשערד פֿאָרמאַט אין אַ וועג אַז עס קענען זיין געניצט. אזוי עס ס ניט אָפענגיק אויף געגאנגען צו אַ וועבזייַטל און סקרייפּינג דאַטן אַוועק פון עס, פֿאַר בייַשפּיל. אזוי דעם איז די היים בלאַט פון די ביבליאָטעק קלאָוד יטעם אַפּי, וואָס איז יסענשאַלי זייַן ווערסיע צוויי. אזוי עס ס די רגע יטעראַטיאָן פון טריינג צו מאַכן אַלע פון ​​דעם דאַטן בנימצא צו די וועלט. אזוי עס ס http://api.lib.harvard.edu/v2/items. און נאָר צו ברעכן דעם אַראָפּ אַ ביסל ביסל, וואָס דאָס מיינט איז אַז דעם איז ווערסיע צוויי פון די אַפּי. עס ס אַ ווערסיע איינער, וואָס איך בין נישט געגאנגען צו רעדן וועגן. אבער עס איז אַ ווערסיע איינער. און אויב איר ניטאָ פאַך דעם אַפּי, איר זענט געטינג זאכן. און טייל פון דעם געדאַנק פון אַ אַפּי איז אַ אַפּי איז אַ קאָנטראַקט. עס ס עפּעס אַז איז ניט געגאנגען צו טוישן. אזוי פֿאַר בייַשפּיל, - און די סיבה איז אַז אויב איך בויען עטלעכע מין פון סיסטעם אַז איז געגאנגען צו נוצן אַ ביבליאָטעק וואָלקן אַפּי צו אַרויסווייַזן ביכער אָדער העלפן מענטשן געפינען אינפֿאָרמאַציע אין יינציק וועגן, וואָס מיר טאָן ניט וועלן צו פּאַסירן איז פֿאַר אונדז צו גיין טוישן ווי אַז אַפּי מעשים, און פּלוצלינג אַלץ ברייקס אויף די סוף באַניצער זייַט. אזוי טייל פון אויב איר ניטאָ געמאכט אַפּי בנימצא צו די וועלט, עס ס גוט פיר צו שטעלן אַ ווערסיע נומער אין עס אַזוי מענטשן וויסן וואָס ווערסיע זיי ניטאָ דילינג מיט. אזוי אויב מיר באַשליסן מיר געפינען אַ בעסער וועג פון מאכן דעם אינפֿאָרמאַציע בנימצא, מיר זאלן טוישן אַז צו רופן אַז ווערסיע דרייַ. אזוי אַלעמען וואס איז נאָך ניצן ווערסיע צוויי, אַז וועט נאָך אַרבעט. אבער ווערסיע דרייַ וואָלט האָבן אַלע די נייַ שטאָפּן. אזוי דעם איז אַן אַפּי, אָבער דעם טאַקע קוקט ווי אַ URL. און אַזוי וואָס דעם איז אַ בייַשפּיל פון איז וואָס ס גערופן אַ מנוחה אַפּי, וואָס איז בנימצא איבער נאָר אַ רעגולער וועב קשר. און איר קענען פאקטיש גיין צו אים אין אַ בלעטערער. אזוי דאָ איך ווע נאָר געעפנט אַרויף פירעפאָקס און ניטאָ צו api.lib.harvard.edu/v2/items. און אַזוי וואָס איך באַקומען דאָ איז בייסיקלי די ערשטער בלאַט פון רעזולטאַטן פון די גאנצע שטעלן פון זאכן וואָס מיר ווע גאַט. און עס ס דאָ אין קסמל פֿאָרמאַט. און עס ס אויך געווען פּרעטטיפיעד דורך פירעפאָקס. עס טוט נישט פאקטיש האָבן אַלע פון ​​די ביסל יקספּאַנדינג און קאַנטראַקטינג דאָאָהיקקייס דאָ. דאס איז סאָרט פון אַ ניסער ווערסיע וועג צו קוקן אין עס. אבער וואָס דעם איז טעלינג אונדז איז איך ווע געבעטן אַלע די זאכן. אזוי עס זענען 13,289,475 זאכן. און איך בין קוקן בייַ די ערשטער 10, סטאַרטינג בייַ שטעלע נול ווייַל אין קאָמפּיוטער וויסנשאַפֿט מיר שטענדיק אָנהייבן בייַ נול. און וואָס איך האָבן דאָ, אויב איך נאָר ייַנבראָך דעם, איר וועט זען איך ווע גאַט 10 זאכן. און אויב איך נעמען אַ קוק בייַ אַ נומער, איך קענען זען אַז איך ווע גאַט אינפֿאָרמאַציע וועגן עס. און דעם איז אין וואָס ס גערופן מאָדס פאָרעם. און אַזוי איך בין געגאנגען צו באַשטימען צוריק דאָ פֿאַר אַ מאָמענט. גוט. אזוי לאָזן ס זוכן פֿאַר עפּעס אין ספּעציפיש ווייַל די ערשטער פּאָזיציע אַז כאַפּאַנז צו קומען אַרויף ווען איר קוקן דורך די גאנצע זאַמלונג איז, דורך דעפֿיניציע, טראַפ. אזוי לאָזן ס קוקן פֿאַר עטלעכע דאָונאַץ. טאַקע. גוט. אזוי דאָונאַץ. אזוי מיר געפונען עס זענען 80 זאכן אין די זאַמלונג אַז דערמאָנען דאָונאַץ. מיר ניטאָ קוקן בייַ די ערשטער 10 פון זיי. איצט, איר קענען זען דאָ די וועג אַז איך געזאגט איך בין קוקן פֿאַר דאָונאַץ, איך נאָר מוסיף עפּעס צו די אָנפֿרעג שטריקל פון די URL. אזוי ק יקוואַלז דאָונאַץ, וואָס איר קענען זען אַ ביסל מער לייכט דאָ. און דעם בייסיקלי מיטל עס ס אַ ספּעק פֿאַר די אַפּי, וואָס דיפיינז וואָס אַלע פון די פּאַראַמעטערס מיינען. און דעם מיטל מיר רע געגאנגען צו זוכן אַלץ פֿאַר דאָונאַץ. אזוי דער ערשטער פּאָזיציע דאָ מיר האָבן איר קענען זען די טיטל איז דאָונאַץ, און עס איז אַ סאַבטייטאַל גערופן אַ אמעריקאנער פּאַססיאָן, וואָס איז, איך טרעפן, צונעמען. עס זענען אַ פּלאַץ פון דיפפערענט-- אַמאָל איר באַקומען צו די פונט פון געטינג די דאַטן, עס זענען אַ פּלאַץ פון פאַרשידענע פֿאָרמאַטירונגען אַז איר קענען באַקומען עס אין. און דאָרט זענען פאַרשידענע סטרענגקטס און וויקנאַסאַז פֿאַר אַלע פון ​​זיי. אזוי דעם איינער, איר קענען זען דאָ, דעם פאָרעם איז זייער רייַך. און עס ס סטאַנדערדייזד. אזוי עס ס אַ ספּעציפיש טיטל פעלד, אַ סאַבטייטאַל פעלד. עס ס אַ בייַטנ לויט דער ריי טיטל, אַן אמעריקאנער פּאַססיאָן. עס איז די נאָמען פארבונדן מיט עס. טיפּ פון די מיטל איז טעקסט. עס ס אַ פּלאַץ פון אינפֿאָרמאַציע דאָ אין דעם פֿאָרמאַט. אבער עס זענען אַ בינטל פון פאַרשידענע פֿאָרמאַטירונגען. אזוי וואָס מיר האבן נאָר קוקן בייַ איז אַ פֿאָרמאַט גערופן מאָדס, וואָס שטייט פֿאַר מעטאדאטע אָבדזשעקט באַשרייַבונג סערוויס, מעגליך. איך בין טאקע נישט גאַנץ זיכער וועגן די ש אבער עס ס אַ פערלי קאָמפּלעקס פֿאָרמאַט. עס ס די פעליקייַט פֿאָרמאַט. אבער עס ס די איין אַז האלט די ריטשנאַס פון אַלע די דאַטן אַז די ביבליאָטעק האָט ווייַל עס ס זייער נאָענט צו וואָס די ביבליאָטעק ניצט ינעווייניק. עס ס אַ נאָרמאַל אַז איז געניצט אַריבער די מדינה, אַריבער די וועלט אין אַקאַדעמיק ליבראַריעס. און עס ס זייער ינטעראָפּעראַבלע. אזוי אויב איר ווע גאַט אַ דאָקומענט אַז איז אין מאָדס פֿאָרמאַט, איר קענען געבן אַז צו עמעצער אַנדערש וועמענס סיסטעמס פֿאַרשטיין מאָדס, און זיי קענען אַרייַנפיר עס. אזוי עס ס אַ נאָרמאַל. עס ס זייער געזונט דיפיינד, זייער ספּעציפיש. און אַז איז וואָס מאכט עס ינטעראָפּעראַבלע ווייַל אויב עמעצער זאגט, דעם איז די בייַטנ לויט דער ריי טיטל פון אַ רעקאָרד, יעדער יינער ווייסט וואָס אַז מיטל. אויף די פליפּ זייַט, עס ס זייער קאָמפּליצירט. אזוי אויב איר נעמען אַ קוקן בייַ דעם רעקאָרד דאָ, אויב איך נאָר ווילן צו באַקומען די טיטל פון דעם דאָקומענט, פון דעם בוך, וואָס איז מיסטאָמע דאָונאַץ, אַן אמעריקאנער פּאַססיאָן, אונטערשייד עס אויס איז אַ ביסל ינוואַלווד. ווהערעאַס עס ס אנדערן פֿאָרמאַט גערופן דובלין קאָר, וואָס איז אַ פיל, פיל סימפּלער פֿאָרמאַט. און אַזוי איר זען דאָ, עס ס קיין טיטל, סאַבטייטאַל, בייַטנ לויט דער ריי טיטל. עס ס נאָר דער טיטל, דאָונאַץ, אן אמעריקאנער פּאַססיאָן, און אן אנדער טיטל, אמעריקאנער פּאַססיאָן. אזוי ווען איר ניטאָ קוקן בייַ וואָס פאָרעם איר ווילן צו באַקומען די דאַטן אויס פון, אַ פּלאַץ דעפּענדס אויף ווי איר 'רע געגאנגען צו נוצן עס. ביסט איר ניצן פֿאַר ינטעראָפּעראַביליטי אָדער טאָן איר ווילן עפּעס פּשוט אַז זאל זיין גרינגער צו אַרבעטן מיט? אויף די פליפּ זייַט, אַ פּלאַץ פון די פרטים באַקומען סאָרט פון סקווישעד אַראָפּ. איר זאל פאַרלירן די נואַנסיז פון וואָס אַ באַזונדער פעלד מיטל אויב איר ניטאָ דילינג מיט דובלין קאָר, וואָס איר וואָלט ניט באַקומען מיט מאָדס. אזוי יענע זענען צוויי פון די פֿאָרמאַטירונגען איר קענען באַקומען אויס פון די אַפּי. און בייסיקלי, מיר זענען בעכעסקעם עס הינטער די סינז אין מאָדס. אבער מיר קענען געבן איר עס אין מאָדס און דובלין קאָר און עפּעס אַנדערש ווי געזונט. די אנדערע באַטראַכטונג ווען איר 'רע איר זוכט אין די דאַטן איז איר קענען באַקומען עס ווי אָדער דזשסאָן, וואָס שטייט פֿאַר דזשאַוואַסקריפּט אָבדזשעקט נאָוטיישאַן, אָדער קסמל, וואָס שטייט פֿאַר עקסטענסיבלע מאַרקאַפּ שפּראַך. און די דאַטן רעפּראַזאַנטיישאַנז ביידע האָבן פּונקט דער זעלביקער דאַטע, פּונקט די זעלבע פעלדער. אבער זיי ניטאָ נאָר סינטאַקטיקאַללי פאַרשידענע. אזוי דעם איז אַ-- נו, לאָזן ס נאָר באַשטימען. אזוי דעם איז אונדזער אָנפֿרעג פֿאַר דאָונאַץ אין קסמל פֿאָרמאַט. אויב איך נאָר באַשטימען דעם צו זיין דזשסאָן, איך קענען זען עס קוקט פאַרשידענע. אזוי איצט דעם איז די זעלבע צופרידן, אָבער אַ פאַרשידענע סטרוקטור. עס זענען ווייניקערע ווינקל בראַקאַץ. עס ס ווייניקער ווערבאָסע. און דעם איז אַ פֿאָרמאַט וואָס, אויב איר זענען ארבעטן אין די וועב סוויווע, איר זענען רובֿ מסתּמא געגאנגען צו ווילן צו נוצן ווייַל איינער פון די פייַן זאכן וועגן דזשסאָן איז עס ס קאַמפּאַטאַבאַל מיט דזשאַוואַסקריפּט. אזוי אויב איך בין שרייבן וועב אַפּ, איך קענען ציען אין דזשסאָן און נאָר אַרבעטן מיט עס גלייַך. ווהערעאַס מיט קסמל, עס ס אַ קליין ביסל מער קאָמפּליצירט. אזוי ווידער, די זענען ביידע נוצלעך. זיי נאָר זענען פאַרשידענע נוצן קאַסעס ווו מען זאל וועלן צו נוצן זיי. גוט. אזוי צוריק צו די אַפּי. אזוי מיר קענען זוכן פאָר-- איך געבן אַ בייַשפּיל פון שאַרף פֿאַר דאָונאַץ. מיר קענען אויך זוכן נאָר אין אַ באַזונדער פעלד ין דאָ. אזוי אַנשטאָט פון שאַרף די גאנצע רעקאָרד, איך קענען נאָר זוכן דעם טיטל פעלד. און אַזוי איצט עס זענען 25 זאכן אַז האָבן דאָונאַץ אין די טיטל, איינער פון וואָס איז וועגן ריסטאָרינג וועטלאַנדס אין פאַרוואַלטונג פון די לעכער אין די פּעמפּיקל פּראָגראַם, וואָס איז מיסטאָמע ניט דאַווקע וואָס מיר 'רע איר זוכט פֿאַר ווען מיר ניטאָ שאַרף פֿאַר דאָונאַץ. איר קענען אויך, ווען איר ניטאָ דילינג מיט אַ אַפּי-- טייל פון בעת ​​אַ אַפּי איז געבן מענטשן צוטריט צו גרויס דאַטן שטעלט. און עס זענען אַ פּאָר פאַרשידענע מכשירים איר קענען נוצן צו טאָן אַז. איינער איז, זייער פשוט, איר קענען בלאַט דורך די דאַטן. אזוי נאָר ווי אויב איר טאָן אַ אָנפֿרעג דורך אַ וועב צובינד, איר קענען קוקן אין בלאַט איינער, Page צוויי, בלאַט דרייַ. איר קענען טאָן די זעלבע זאַך דורך די אַפּי. איר נאָר דאַרפֿן צו זיין יקספּליסאַט אין ווי איר טאָן עס. אזוי פֿאַר בייַשפּיל, אויב איך בין קוקן בייַ מיין ערשטער אָנפֿרעג דאָ, ווו איך בין טאן אַ זוכן פֿאַר זאכן מיט דאָונאַץ אין די טיטל, איך קענען זאָגן, און שיעור יקוואַלז 20, וואָס מיטל געבן מיר די ערשטע 20 רעקאָרדס, ניט די ערשטע 10, וואָס איז די פעליקייַט, ווייַל איך ווילן צו קוקן בייַ 20 בייַ אַ מאָל. אָדער איך קענען זאָגן, שטעלן די אָנהייב גלייַך צו 20 און שיעור גלייַך 20, וואָס וועט געבן מיר רעקאָרדס 21 דורך 40. אזוי איך טרעפן דעם זאַך צו נעמען אַוועק דאָ איז אַז מיר 'רע ניצן די אָנפֿרעג סטרינגס צו שטעלן פּאַראַמעטערס אויף די אנפראגע. און עס לעץ איר קאָנטראָל וואָס איר באַקומען צוריק. אן אנדער געצייַג אַז איר קענען נוצן, - און דעם איז טאַקע נוציק אין תּנאָים פון יקספּלאָרינג די דאַטן. --יס עפּעס גערופן פאַסעטינג. אזוי דער טערמין פאַסעטינג איז ניט דאַווקע פּראָסט. אבער איר ווע אַלע געזען עס איידער. אויב איר נעמען אַ קוק בייַ אַמאַזאָן, פֿאַר בייַשפּיל, און איר טאָן אַ זוכן פֿאַר דאָונאַץ אין די ביכער, דאָ זיי ווע גאַט אַ סעריע פון ​​ביכער, און זיי ניטאָ גרופּט דורך קאַטעגאָריע, און איר באַקומען די פאַרשידענע קאַטעגאָריעס, און ווי פילע ביכער אין יעדער קאַטעגאָריע ווייַזן אַרויף. אזוי דעם איז בייסיקלי אַ פאַסעט. איר נעמען אַלע זייער ביכער, די 1800 ספר אַז גלייַכן דאָונאַץ בייַ אַמאַזאָן. 12 פון זיי זענען אין די פרישטיק קאַטעגאָריע. 21 אין געבעקס און באַקינג, און אַזוי אויף און אַזוי אַרויס. אזוי דעם איז טאַקע אַ נוציק געצייַג פֿאַר יקספּלאָרינג די צופרידן ין די ביבליאָטעק ווי געזונט ווייַל ווען איר קוק בייַ אַ פאַסעט, עס גיט איר אַ געדאַנק פון וואָס סאַבדזשעקץ יגזיסס, ווי וואָס טיפן פון סאַבדזשעקץ זענען רובֿ פאָלקס ין דיין אָנפֿרעג שטעלן. און עס העלפט איר פירן אַוועק און ויספאָרשן. אזוי מיר קענען טאָן די זעלבע זאַך. אויב מיר ווילן צו נוצן די אַפּי און קוקן בייַ פאַסאַץ, מיר לייגן אנדערן פּאַראַמעטער צו אונדזער פרייַנד די אָנפֿרעג שטריקל. אזוי פאַסאַץ יקוואַלז אַ קאָמע אפגעשיידט רשימה פון וואָס מיר ווילן צו פאַסעט אויף. אזוי איינער פון די פאַסאַץ זאל זיין אונטער. אן אנדער זאלן זיין לשון. און אַזוי אויב מיר לויפן אַז אָנפֿרעג, מיר געט-- עס קוקט שיין פיל די זעלבע דאָ. אבער מיר 'ווע צוגעלייגט צו די סוף פון די רשימה אַ סכום פון פאַסאַץ. אזוי מיר האָבן אַ פאַסעט גערופן ונטערטעניק. אזוי דעם איז טעלינג אונדז אַז אויב איך קוק בייַ מיין 80 רעזולטאַטן פון די פּעמפּיקל אָנפֿרעג, 13 פון זיי האָבן די ונטערטעניק פאַרייניקטע שטאַטן. דריי האָבן די ונטערטעניק דאָונאַץ. דריי האָבן די ונטערטעניק פון וועטלאַנד רעסטעריישאַן, וואָס קען זייַן אונדזער לאָך אין די פּעמפּיקל. צוויי פון זיי, די סימפּסאָנס, און אַזוי אויף און אַזוי אַרויס. אזוי דעם קענען זיין נוצלעך אויב איר ווילן צו שמאָל אַראָפּ אייער זוכן. עס קענען העלפן איר טאָן אַז. ספּעציעל אויב איר האָבן מער ווי, זאָגן, 80 רעזולטאַטן. סימילאַרלי, מיר אויך געבעטן פֿאַר פאַסאַץ אויף לשון. אזוי אויב מיר קוקן אין אונדזער רעזולטאַטן, מיר זען 76 פון זיי זענען אין ענגליש, פיר אין פראנצויזיש, צוויי אין שפּאַניש, צוויי, איך טראַכטן אַז ס ונדעפינעד אָדער אומבאַקאַנט, האָלענדיש און לאַטייַן. אזוי איך טראַכטן די לאַטייַן פּעמפּיקל רעזולטאַט, ווידער, האט גאָרנישט צו טאָן מיט בייקט סכוירע. אבער עס איר גיין. אזוי דעם איז סאָרט פון ווייַזונג איר ווי איר קענען ציען די צופרידן צוריק פון די אַפּי פּונקט דורך וועב בלעטערער, ​​וואָס איז גרויס. אבער עס ס ניט טאַקע וואָס איר וואָלט נאָרמאַלי זייַן ניצן אין אַפּי פֿאַר עס. אזוי איינער בייַשפּיל פון ווי איר קען פאקטיש טאָן דעם איז איך ווע געשריבן אַ יבער קליין פּראָגראַם, וואָס, ווידער, טוט מיין פּעמפּיקל זוכן און סאַלעקץ אַ פּאָר פעלדער און דיספּלייז זיי אין אַ טיש. אזוי דעם איז זייער פיל די זעלביקער צופרידן אַז מיר נאָר געזען מיט אַ ביסל פעלדער פּולד אויס. אזוי רשימה פון טיטלען, דער אָרט פון וואָס די בוך איז וועגן, די שפּראַך, און אַזוי אויף און אַזוי אַרויס. אזוי ווי דעם פאקטיש געטראפן, זינט איך טרעפן מיר האָבן צו קוקן בייַ עטלעכע קאָד, יס-- וואָס מיר האָבן דאָ איז אַ פּשוט HTML בלאַט, וואָס דיספּלייז די טעקסט, באַגריסונג צו ביבליאָטעק וואָלקן און דעמאָלט דיספּלייז אַ טיש פון רעזולטאַטן. און עס זענען דאָך קיין רעזולטאַטן אין די טיש ווען דער בלאַט געץ לאָודיד. אבער וואָס מיר ניטאָ טאן איז, קודם פון אַלע, מיר זענען אַרייַנשטעלן אַ ביבליאָטעק גערופן דזשקווערי, וואָס איז בייסיקלי אַ דזשאַוואַסקריפּט ביבליאָטעק, וואָס מאכט עס זייער גרינג צו מאַניפּולירן דזשאַוואַסקריפּט נאַטיוועלי, HTML, און שאַפֿן וועב זייַטלעך, קליענט-זייַט לאָגיק און וועב בלעטער. אזוי וואָס מיר האָבן דאָ איז דזשקווערי האט אַ אופֿן אנגערופן באַקומען, וואָס יסענשאַלי וועט גיין צו אַ URL, וואָס, אין דעם פאַל, איז דאָס באַקאַנט קוקן URL. און וועט דעמאָלט באַקומען די צופרידן פון אַז URL און דעמאָלט לויפן אַ פונקציאָנירן אויף עס. אזוי מיר האט גיין צו אַפּי.ליב.האַרוואַרד / עדיו. זוכן פֿאַר דאָונאַץ. געבן אונדז 20 רעקאָרדס. און דעריבער לויפן דעם פונקציע, וואָס איך ווע אויסגעקליבן, גייט פארביי עס די דאַטן. און די דאַטן איז די דזשסאָן אַז גאַט אומגעקערט פון די אַפּי. און דעמאָלט מיר רע געזאגט, ין אַז דאַטן דאָרט ס אַ פעלד גערופן פּונקט. און אויב איך גיין נעמען אַ קוק צוריק בייַ איינער פון די רעזולטאַטן אַז ס דאָ, עס ס עפּעס קאַללעד-- נו, עס ס גערופן פּונקט. אזוי אַז קען זיין אַז. און וואָס עס טוט איז עס גייט דורך יעדער פּאָזיציע און דעריבער רופט אן פונקציאָנירן אויף יעדער נומער. און אַז פונקציאָנירן בייסיקלי איז גענומען די ווערט פון די פּאָזיציע, וואָס איז יסענשאַלי די יחיד רעקאָרד און אַלאַוז אונדז צו ציען אויס די טיטל, די קאַווערידזש און די שפּראַך. אזוי מיר רופן אַ פונקציאָנירן אויף יעדער פּונקט אַז מיר גאַט צוריק פון די אַפּי. און אויב איר נאָר נעמען אַ קוקן בייַ דעם שטיק רעכט דאָ, וואָס מיר ניטאָ טאן איז מיר ניטאָ קריייטינג אַ שטריקל, וואָס איז יסענשאַלי עטלעכע HTML מאַרקאַפּ אַרום אַ טיש, מיט וואַלוע.טיטלע, וואָס איז דער טיטל פון דער כייפעץ, וואַלוע.קאָוועראַגע, וואָס איז די קאַווערידזש, - און מיר ניטאָ טאן אַ טשעק דאָ צו זען ווער ס ונדעפינעד און כיידינג עס אויב עס זאגט ונדעפינעד, ווייַל מיר ניטאָ ניט טאַקע אינטערעסירט אין אַז. --אַנד דעמאָלט דער שפּראַך. און דעמאָלט וואָס מיר רע טאן איז אַפּפּענדינג אַז צו די טיש אַז איז יידענאַפייד דורך דעם שטריקל דא. און ווי דזשקווערי אַרבעט איז וואָס דאָס איז געזאגט איז קוקן פֿאַר די טיש מיט געדאַנק רעזולטאַטן און לייגן דעם טעקסט צו עס. און דעם איז די טיש מיט געדאַנק רעזולטאַטן. אזוי וואָס איר סוף אַרויף מיט איז דעם בלאַט דאָ. און אין סדר צו מיינונג סאָורסע-- נו, די מקור איז ניט אַקטשאַוואַלי דערהייַנטיקט ווען אַז געטראפן. אזוי איר קענען זען די פאַקטיש רעזולטאַטן פון די טיש דאָ כאָטש. אזוי אַז ס נאָר אַ פּשוט בייַשפּיל פון טאן אַ זייער יקערדיק אָנפֿרעג קעגן די אַפּי און ווייַזנדיק אינפֿאָרמאַציע אין עטלעכע אנדערע פאָרעם, און נישט טאן עפּעס צו פאַנטאַזיע. איצט, אן אנדער בייַשפּיל איז ווי אַ אַפּלאַקיישאַן געשריבן דורך דוד וויינבערגער ווי אַ דעמאָ פון דעם, וואָס יסענשאַלי ווייזט איר ווי איר קענען צעקוועטשן אַרויף די רעזולטאַטן איר ניטאָ געטינג פון די ביבליאָטעק וואָלקן אַפּי מיט, זאָגן, Google ספר. און די טראכטן דאָ איז אַז איך קענען לויפן אַ אָנפֿרעג קעגן Google ספר, באַקומען אַ פול טעקסט זוכן, באַקומען עטלעכע רעזולטאַטן צוריק, געפינען אויס וואָס פון די זאכן פאקטיש עקסיסטירן אין כאַליס, די ביבליאָטעק סיסטעם, און דעריבער געבן מיר לינקס צוריק צו יענע זאכן. אזוי אויב איך זוכן פֿאַר, עס איז געווען אַ טונקל און סטאָרמי נאַכט, איך באַקומען צוריק אַ בינטל פון רעזולטאַטן פון גוגל, און דעמאָלט איינער רעזולטאַט וואָס איז א וורינקלע אין צייַט. און די זענען לינקס צו ביכער אַז עקסיסטירן ין די האַרוואַרד-ביבליאָטעק סיסטעם. אזוי איך טרעפן די פונט דאָ איז נישט אַזוי פיל אַז דאָס קען אָדער קען נישט זייַן דער וועג אַז איר ווילן צו זוכן די ביבליאָטעק, אָבער עס איז אַ גאָר אַנדערש וועג אַז איז ניט בנימצא צו איר איידער, ווי איר האט קיין וועג פון טאן פול טעקסט אָנפֿרעגן אויף ביכער אַז אפילו זענען טייל פון די האַרוואַרד-ביבליאָטעק סיסטעם. אזוי איצט דעם איז אַ וועג אַז איר קענען טאָן אַז. און איר קענען אַרויסווייַזן זיי אין וועלכער פֿאָרמאַט איר ווילן. אזוי די פונט דאָ איז, בייסיקלי, מיר ניטאָ עפן אַרויף נייַ וועגן פֿאַר מענטשן צו אַרבעט מיט די דאַטן. אן אנדער שטיק פון ביבליאָטעק וואָלקן איז אַז עס העלפט ויסשטעלן עטלעכע פון ​​די באַניץ דאַטן אַז די ביבליאָטעק האָט. אזוי אויב איר גיין צו דער ביבליאָטעק, און איר ניטאָ קוקן פֿאַר ביכער, איר טאָן ניט דאַווקע פאקטיש האָבן אַ געדאַנק פון, פֿאַר אַלע די זאכן אין אַ באַזונדער ונטערטעניק, וואָס זענען מענטשן אין דער קהל, צי עס ס דיפיינד ווי האַרוואַרד אָדער די לאַנד אָדער דיין קלאַס, וואָס האָבן זיי געפונען רובֿ נוציק? און די ביבליאָטעק פאקטיש האט אַ טאָן פון אינפֿאָרמאַציע וועגן וואָס איז רובֿ נוציק ווייַל אויב אַ פּלאַץ פון מענטשן זענען קאָנטראָלירונג אויס אַ בוך, אַז דערציילט איר עפּעס. עס מוזן האָבן שוין עטלעכע סיבה זיי ווילן צו קאָנטראָלירן עס אויס. א פּלאַץ פון מענטשן שטעלן עס אויף רעזערוו. אויב עס ס אויף די רעזערוו רשימה פֿאַר אַ פּלאַץ פון קלאסן, וואָס דערציילט איר עפּעס. אויב פיייקייַט מיטגלידער זענען קאָנטראָלירונג עס אויס אַ פּלאַץ און ונדערגראַדואַטעס זענען ניט, אַז דערציילט מיר עפּעס. וויצע ווערסאַ, אַז אויך דערציילט איר עפּעס. אזוי עס וואָלט זיין טאַקע טשיקאַווע צו שטעלן אַז אינפֿאָרמאַציע אויס דאָרט און לאָזן מענטשן נוצן עס צו העלפן זיי געפינען אַרבעט ין דער ביבליאָטעק סיסטעם. די פליפּ זייַט פון דעם איז עס זענען עטלעכע ערנסט פּריוואַטקייט קאַנסערנז ווייַל איינער פון די האַרץ טענאַץ פון די ביבליאָטעק איז מיר ניטאָ ניט געגאנגען צו זייַן טעלינג מענטשן וואָס אנדערע מענטשן זענען לייענען. און אפילו אויב איר זענען געזאגט דעם בוך איז אָפּגעשטעלט אויס פיר מאל אין אַ באַזונדער חודש, אַז קען זיין געניצט צו לינק צוריק צו אַ באַזונדער מענטש דורך דע-אַנאָנימיזינג דאַטן און געפונען אויס וואָס אָפּגעשטעלט עס אויס. אזוי די וועג אַז מיר קענען אַוואָיד-- די וועג אַז מיר קענען פּרובירן צו עקסטראַקט עטלעכע סיגנאַל פון אַלע די אינפֿאָרמאַציע אָן ינפרינדזשינג אַבי ווער ס פּריוואַטקייט קאַנסערנז איז יסענשאַלי מיר קוקן אין 10 יאָרן פון באַניץ דאַטן, - אזוי עס ס איבער אַ לאַנג צייַט פון צייַט. --אַנד זאָגן, גוט, לאָזן ס זען ווי פילע מאל דעם אַרבעט איז געניצט, און דורך וואָס איבער דעם צייַט פון צייַט, און דעמאָלט בייסיקלי געבן צוריק אַ נומער, וואָס מיר רופן אַ אָנלייגן כעזשבן, וואָס בייסיקלי רעפּראַזענץ ווי פיל עס ס שוין געניצט. און אַז נומבער-- א פּלאַץ פון פאַרשידענע חשבונות גיין אין אַז נומער. --בוט עס ס אַ זייער פּראָסט מעטריק אַז גיט איר עטלעכע געדאַנק פון ווי די קהל זאל ווערט אַז ווערק. און אַזוי אנדערן סאָרט פון אפילו מער פלעשעד אויס אַפּלאַקיישאַן אַז נעמט מייַלע פון דעם איז עפּעס גערופן סטאַקקליפע, וואָס איז פאקטיש בנימצא דורך די הויפּט האַרוואַרד ביבליאָטעק טויער. אזוי איר גיין צו library.harvard.edu. איר וועט זען אַ נומער פון פאַרשידענע וועגן פון שאַרף די ביבליאָטעק. און איינער פון זיי איז גערופן סטאַקקליפע. און דעם איז אַ אַפּלאַקיישאַן אַז בראָווסעס די צופרידן פון די ביבליאָטעק, אָבער איז גאָר געבויט אויף שפּיץ פון די אַפּיס. אזוי עס ס ניט קיין ספּעציעל שטאָפּן געגאנגען אויף הינטער די סינז. עס ס ניט קיין צוטריט צו דאַטן אַז איר טאָן ניט האָבן. עס ס ניצן די אַפּיס צו צושטעלן איר מיט אַ גאָר אַנדערש בראַוזינג דערפאַרונג. אזוי אויב איך זוכן פֿאַר אַליס אין וואָנדערלאַנד אין דעם פאַל, איך באַקומען אַ רעזולטאַט אַז קוקט ווי דעם, וואָס איז שיין מוטש-- עס ס זייער ענלעך צו קיין אנדערע זוכן איר זאל טאָן, אַחוץ אין דעם פאַל מיר ניטאָ ראַנגקינג די זאכן דורך סטאַקקסקאָרע, וואָס גיט איר עטלעכע געדאַנק פון ווי פאָלקס די זאכן זענען ין דער קהל. און אַזוי קלאר, אַליס אין וואָנדערלאַנד דורך וואַלט דיסניי איז העכסט פאָלקס. אבער איר קענען אויך זען די שפּיץ פיר דאָ זענען אָנעס איר זאל ניט אַקטואַללי-- זאכן וואס זענען העכסט געניצט, אָבער איר זאלט ​​ניט מיד פאַרבינדן מיט אַליס אין וואָנדערלאַנד. אזוי אונדזער אַלט פרייַנד די אַנאַטייטיד אַליס איז דאָ. אזוי איך קענען נעמען אַ קוק בייַ אים. און איצט וואָס איך בין קוקן בייַ איז בייסיקלי אַ סכום אָפ-- איך קענען האָבן די אַנאַטייטיד אַליס רעכט דאָ. איך האָבן אינפֿאָרמאַציע וועגן עס. און איך אויך האָבן אַ סטאַקקסקאָרע פון, אין דעם פאַל, 26. און דעם דערציילט מיר סאָרט פון בעערעך ווי מיר גאַט צו דעם סטאַקקסקאָרע, ווי וואס אָפּגעשטעלט עס אויס, ווי ווי פילע מאל עס איז אָפּגעשטעלט אויס, ווי פיייקייַט אָדער ונדערגראַדס, ווי פילע עקזעמפלארן די ביבליאָטעק האט, און אַזוי אויף און אַזוי אַרויס. און איר קענען אויך, טשיקאַווע גענוג דאָ, אָפּפליקן די סטאַקס כמעט. אזוי די דאַטן דאָ, דעם איז ווייַזונג איר סאָרט פון אַ ווירטואַל פאַרטרעטונג פון וואָס די פּאָליצע זאל קוק ווי אויב איר געווען צו נעמען אַלע די ביבליאָטעק ס פאַרמעגן און שטעלן זיי צוזאַמען אויף איינער ינפאַנאַט פּאָליצע. און די פייַן זאַך איז אַז מיר קאַנ-- ערשטער פון אַלע, דער מעטאַדאַטאַ וועגן די ביכער אָפֿט דערציילט איר ווען עס איז געווען פארעפנטלעכט. עס דערציילט איר ווי פילע בלעטער עס האט. עס זאל דערציילן איר די דימענשאַנז. אזוי איר קענען זען אַז ס שפיגלט דאָ אין טערמינען פון די גרייס פון דעם ספר. און דעמאָלט מיר קענען נוצן די אָנלייגן כעזשבן צו הויכפּונקט די ביכער וואָס האָבן העכער אָנלייגן סקאָרז. אזוי אויב עס ס דאַרקער, עס מיטל אַז, מאַשמאָעס, עס איז געניצט מער אָפט. אזוי אין דעם פאַל, איך בין געגאנגען צו טרעפן אַז דעם איז די ווערסיע פון ​​אַליס אין וואָנדערלאַנד אַז איז זייער קאַמאַנלי געניצט און מערסט געליינט, די ביבליאָטעק האט די רובֿ עקזעמפלארן פון. אזוי אויב איר 'רע איר זוכט פֿאַר אַליס אין וואָנדערלאַנד, דעם זאל זיין אַ גוט פּלאַץ צו אָנהייבן. און דעריבער דאָ איר קענען אויך לינק אויס צו, זאָגן, אַמאַזאָן צו קויפן די בוך, און אַזוי אויף און אַזוי אַרויס. די פונט דאָ, ווידער, איז ניט אַזוי פיל אַז דאָס איז די בעסטער וועג צו בלעטער דער ביבליאָטעק אָדער די רעכט געצייַג פֿאַר יעדער געלעגנהייַט. אבער עס ס אנדערן וועג פון טאן עס. און דורך מאכן די דאַטן בנימצא דורך אַן אַפּי, וואָס איז געמאכט פון זייער פּשוט בנין בלאַקס, וואָס אַלאַוז איר צו זוכן די צופרידן, איר קענען בויען עפּעס ווי דעם וואָס קענען זיין יקסטראָרדאַנעראַלי ווערטפול צו עטלעכע מענטשן. אזוי אַז ס סאָרט פון, ווי פיל ווי איך ווילן צו זאָגן טאַקע וועגן וואָס די אַפּי איז און וואָס עס יקספּאָוזיז, עס ס אַ גאַנץ בינטל פון שטאָפּן הינטער די סינז, וואָס איך בין נאָר געגאנגען צו פאַרבינדן אויף בעקיצער נאָר ווייַל עס סאָרט פון קומט אין דעם פון אַ גאָר אַנדערש ווינקל אין טערמינען פון ווי טוט עפּעס ווי דעם באַקומען שטעלן אין פּלאַץ? אזוי אַ אַפּי איז אַ נאָרמאַל צובינד צו אַלע פון ​​דעם צופרידן. אבער צו באַקומען עס דאָרט, די ערשטער זאַך מיר האבן צו טאָן איז ציען צוזאַמען אינפֿאָרמאַציע פון ביכער און בילדער און די דערגייונג AIDS, די זאַמלונג דאָקומענט פון פאַרשידן האַרוואַרד סיסטעמס. אַלעף, וויאַ, און אָאַזיס זענען די נעמען פון די סיסטעמס. און זיי יסענשאַלי גיין אין אַ פּייפּליין, אַ פּראַסעסינג פּייפּליין. אזוי ערשטער פון אַלע, מיר באַקומען אַרויספירן טעקעס פון אַלע פון ​​די סיסטעמס. מיר שפּאַלטן זיי אַרויף אין יחיד זאכן. אזוי מיר האָבן אַ טעקע, וואָס איז אַ גיגאבייט, וואָס האט אַ מיליאָן רעקאָרדס אין עס. אזוי מיר שפּאַלטן עס אַרויף אין יחיד זאכן. דערנאך, פֿאַר יעדער פּאָזיציע, מיר בייַטן עס אין מאָדס, ווייַל עטלעכע פון ​​די ביסט נאַטיוועלי מאָדס, עטלעכע פון ​​זיי זענען ניט. אזוי מיר באַקומען זיי אַלע צו זיין אין די זעלבע פֿאָרמאַט. דערנאך עס זענען פאַרשידן ענריטשמענט טריט, ווו מיר לייגן מער אינפֿאָרמאַציע צו די דאַטן ווי איז בנימצא אין דער ביבליאָטעק. אזוי מיר דאַרפֿן צו לייגן, ערשטער פון אַלע מיר האָבן וואָס ליבראַריעס האַלטן עס. מיר גיין דורך אַ שריט פון קאַלקיאַלייטינג די סטאַקקסקאָרע. מיר גיין דורך אן אנדער שריט פון אַדינג מער מעטאַדאַטאַ אין טערמינען פון וואָס זאַמלונגען מענטשן זאל האָבן צוגעלייגט טהיס-- מענטשן זענען קריייטינג זאַמלונגען פון זאכן. וואָס זאַמלונגען טוט עס געהערן צו? ווי האָט מען טאַגד דעם אינהאלט אין די פאַרגאַנגענהייַט? דערנאך איר פילטער אויס, און איר באַגרענעצן די רעקאָרדס ווייַל, ווי איך דערמאנט, עס ס עטלעכע רעקאָרדס אַז, ווייַל פון דרוקרעכט סיבות, מיר קענען נישט אַרויסווייַזן. און דעמאָלט מיר מאַסע זיי אין עפּעס גערופן סאָלר, וואָס איז ניט אַ מיסספּעללינג, אָבער איז די נאָמען פון אַ שטיק פון ווייכווארג אַז טוט זוכן ינדעקסינג, וואָס דרייווז אַלע די זוכן הינטער די אַפּי. און דעמאָלט עס ווערט בנימצא צו די אַפּי, און מען קענען נוצן עס. אזוי דעם איז ווי אַ פערלי סטרייטפאָרווערד פּראָצעס. איינער פון די טשיקאַווע זאכן וועגן עס איז אַז מיר זענען דילינג מיט 13,000,000 רעקאָרדס און מיר זענען געגאנגען צו זייַן דילינג אָדער מער. און מיר ווילן צו זייַן ביכולת צו שעפּן די אין אַ לעפיערעך געשווינד שניט. עס נעמט אַ לאַנג צייַט צו פּראָצעס 13000000 רעקאָרדס. אזוי ווי דעם פּייפּליין איז שטעלן אַרויף איז אַז איר קאַנ-- איך טרעפן די מייַלע פון ​​די פּייפּליין, די פּראָבלעם אַז מיר רע טריינג צו סאָלווע דאָ, איז אַז אַלע די טראַנספערמיישאַנז, אַלע די טריט אין דעם פּייפּליין זענען סעפּאַראַבלע. עס ס קיין דעפּענדענסי. אויב איר ניטאָ פּראַסעסינג אַ רעקאָרד פון איין בוך, עס ס קיין דעפּענדענסי אין אַז צווישן אנדערן בוך. אזוי וואָס מיר קענען טאָן איז בייסיקלי, בייַ יעדער שריט אין די פּייפּליין, מיר שטעלן עס אין אַ ריי אין די וואָלקן. איך געטראפן צו זיין אויף אַמאַזאָן וועב סערוויסעס. אזוי עס ס אַ רשימה פון, זאָגן, 10,000 זאכן אַז דאַרפֿן צו זייַן נאָרמאַלייזד און קאָנווערטעד צו מאָדס פֿאָרמאַט. און מיר ומדריי אַרויף ווי פילע סערווערס ווי מיר ווילן, אפֿשר 10 סערווערס. און יעדער פון די סערווערס נאָר זיצט דארט, קוקט אין אַז ריי, זעט אַז עס ס איינער אַז באדערפענישן צו זיין פּראַסעסט, פּולז עס אַוועק די ריי, פּראַסעסאַז עס, און סטיקס עס אויף די ווייַטער ריי. און אַזוי וואָס אַז אַלאַוז אונדז צו טאָן איז צולייגן, יסענשאַלי, ווי פיל ייַזנוואַרג ווי מיר ווילן צו דעם פּראָבלעם פֿאַר אַ זייער קורץ צייַט פון צייַט צו פּראָצעס די דאַטן ווי געשווינד ווי מעגלעך, וואָס איז עפּעס אַז נאָר, איצט אין די וועלט פון וואָלקן קאַמפּיוטינג מיר קענען טנייַ סערווערס יסענשאַלי ינסטאַנטאַניאַסלי, איז אַז נוצלעך. אזוי מיר טאָן ניט האָבן צו האָבן אַ ריז סערווירער זיצן אַרום אַלע די צייַט צו טאָן די פּראַסעסינג אַז זאל פּאַסירן נאָר אַמאָל אַ וואָך. אזוי אַז איז מערסטנס עס. עס ס דאַקיומענטיישאַן בנימצא פֿאַר די ביבליאָטעק קלאָוד יטעם אַפּי בייַ דעם URL, וואָס וועט זייַן בנימצא שפּעטער. און ביטע גיין נעמען אַ קוק בייַ עס צו זען אויב עס ס עפּעס, איר האָבן קיין געדאנקען. שפּיל מיט עס. נאַר אַרום. און אַלעווייַ איר קענען קומען אַרויף מיט עפּעס גרויס. דאנק איר.