جيفري LICHT: مرحبا هناك. أنا جيفري يخت. وأنا هنا لأتحدث إليكم عن مكتبة جامعة هارفارد وبناء الغد مكتبة اليوم، وانا اعتقد. حتى الخلفية هنا، الملعب لهذه الدورة هو أساسا أن هناك الكثير من البيانات الببليوغرافية متوفر في مكتبات جامعة هارفارد. وهناك فرصة، من خلال بعض الأدوات والمشروع الذي يجري تطويره، للحصول على الوصول إلى المعلومات وأخذه إلى الأماكن التي مكتبة جامعة هارفارد لا تقوم به الآن، تفعل أشياء جديدة معها، التجربة ولعب مع حولها. حتى نقطة الدخول إلى هذا هو API دعا هارفارد مكتبة الغيمة، والتي هو خادم الفوقية المفتوحة، والتي سأتحدث عنها الآن. حتى الخلفية هي أن هناك الكثير من الاشياء في المكتبة هارفارد. لدينا أكثر من 13 مليون المراجع السجلات، والملايين من الصور، والآلاف من المساعدات الحقائق، التي هي وثائق أساسا واصفا مجموعات، ويقول ما هو في نفوسهم، وصناديق من الأوراق وهكذا دواليك التي تمثل أكثر لمليون وثيقة على حدة. وهناك أيضا الكثير من المعلومات التي المكتبة لديها حول كيفية استخدام المحتوى الذي يمكن أن تكون ذات فائدة للناس الذين قد يرغبون في العمل معها. لذلك كل من المعلومات المكتبة لديها الفوقية. لذلك الفوقية هي بيانات عن البيانات. لذلك عندما نتحدث عن المعلومات التي ل المتاحة من خلال مكتبة السحابة التي هو متاح، انها ليست بالضرورة المستندات الفعلية أنفسهم، وليس بالضرورة بالكامل نص الكتب أو الصور الكاملة، على الرغم من أن الواقع قد يكون هذا هو الحال. لكنها في الحقيقة معلومات حول البيانات. لذلك يمكن ان يخطر لك الفهرسة معلومات وأرقام الاتصال، والمواضيع، كم عدد نسخ من كتاب هناك، ما هي طبعات، ما هي الأشكال، والكتاب، وهكذا دواليك. لذلك هناك الكثير من المعلومات حول المعلومات الواردة في المجموعة التي، في حد ذاته، هو نوع من المفيد بطبيعتها. وعلى الرغم من إذا كنت ابحاثا معمقة، تريد من الواضح للوصول الى الفعلية المضمون نفسه وإلقاء نظرة على البيانات، البيانات الوصفية هو مفيد من حيث كلا تحليل الإحضار ككل، مثل ما هي الأشياء في المجموعة. وكيف تتصل؟ كما أنه يساعد وجدت حقا غيرها من الاشياء، الذي هو في الحقيقة الغرض الرئيسي منه. نقطة من الفوقية والتسويقي هو لمساعدتك على العثور على كل المعلومات التي ل متوفرة ضمن مجموعات. لذلك هذا هو مثال من البيانات الوصفية عن كتاب في مكتبة جامعة هارفارد. لذلك فمن هناك. ويمكنك ان ترى انها في الواقع مجمع باعتدال. وجزء من قيمة الفوقية في إطار منظومة مكتبة هارفارد وهذا ما كان عليه نوع من بنتها المفهرسين وتجميعها من قبل الناس تطبيق الكثير من الخبرة والمهارة ويعتقد أنه مع مرور الوقت، التي لديها الكثير من القيمة. حتى إذا كنت نلقي نظرة على هذا السجل ل والمشروح أليس، يمكنك معرفة كنت قد حصلت على اللقب، الذي كتب عليه، و المؤلف، وجميع موضوعات مختلفة الذي شخص فهرسة هو داخل. ويمكنك ان ترى هناك أيضا، في بالإضافة إلى الكثير من المعلومات الجيدة هنا، وهناك بعض الازدواجية. هناك الكثير من التعقيد هذا ينعكس من خلال البيانات الوصفية التي لديك. حتى عنوان واحد من هذا الكتاب هو أليس في بلاد العجائب. لذلك هذا هو المشروح نسخة من هذا الكتاب. لكنه دعا أيضا المشروح أليس، مغامرات أليس في بلاد في بلاد العجائب ل انه شيء الذي كتب مارتن غاردنر والمشروح الكتاب. وهناك الكثير من المعلومات العظيمة حول الألغاز المنطق والأشياء ضمن أليس أنك ربما لم يكن يعرف شيئا عن. لذلك يجب عليك ان تذهب قراءتها. لكن يمكنك أن ترى هناك الكثير من التفاصيل هنا، بما في ذلك التعريف، عندما تم إنشاء، من أين جاء، من حيث هارفارد النظام، وهكذا دواليك. لذلك هذا هو عينة من نوع من الفوقية التي قد تراها لكتاب في جمع مكتبة جامعة هارفارد. وهذا هو شيء مختلف تماما. لذلك ليس هناك نظام يسمى VIA هارفارد، والذي في الأساس وفهرسة الصور والكائنات الفن والأشياء المرئية في جميع أنحاء هارفارد، وإضافة بعض البيانات الوصفية لهم وتبويبها، و، في بعض الحالات، وتوفير الصور المصغرة صغيرة التي يمكنك اتخاذها ل ننظر إذا كنت ترغب في ذلك. لذلك هذا هو مثال لل الفوقية التي لديك لوحة من، ويفترض، أليس في بلاد العجائب. ويمكنك ان ترى هناك أقل الفوقية هنا. انها مجرد نوع مختلف من الكائن. وهكذا هناك معلومات أقل. لديك معظمهم من حقيقة أنه، مكالمة عدد، أساسا الذي خلقها، - نحن لا نعرف متى أنشئت من أجلها. --and عنوان. مثال آخر. هذا هو الاستنتاج المساعدات. لذلك هناك مجموعة من لويس أوراق كارول في جامعة هارفارد. لذلك هذا يصف ما هو في تلك المجموعة. حتى شخص قد ذهب من خلال و بدا من خلال كافة خانات وفهرستها ذلك، نظرا بعض الخلفية، كتب خلاصة ما هنا. وإذا كنت لننظر أكثر من هذا، وهذا ويمضي لصفحات وصفحات وصفحات، ولكن سوف اقول لكم ما الرسائل وما مواعيد عما صناديق موجودة في جميع أنحاء المجموعة. ولكن هذا شيء أنه إذا كنت في جامعة هارفارد، يمكنك الذهاب وفعلا تبدو جسديا صعودا و، ويفترض، نلقي نظرة على. لذلك هذا هو كل شيء عظيم. هذا التعريف ومفيدة. انها في النظام مكتبة جامعة هارفارد. هناك أدوات على الانترنت حيث كنت يمكن أن تذهب ونلقي نظرة على ذلك، ونرى ذلك، وبحث عنها. ويمكنك شريحة والزهر في الكثير من الطرق المختلفة. لكنها في الحقيقة متاح فقط إذا أنت إنسان الجلوس في متصفح الويب الخاص بك أو شيء أو الهاتف والتنقل من خلال ذلك. انها ليست متوفرة حقا في أي نوع من الموضة صالحة للاستعمال لأنظمة أخرى أو أجهزة الكمبيوتر الأخرى للاستخدام، وليس مع الأنظمة داخل مكتبة جامعة هارفارد، لكن الأنظمة في العالم الخارجي، مجرد مجموعة من الناس الآخرين بشكل عام. لذا فإن السؤال هو، كيف يمكن لنا جعلها متاحة لأجهزة الكمبيوتر بحيث يمكننا القيام به أكثر إثارة للاهتمام الاشياء معها من مجرد التصفح ذلك بأنفسنا؟ فلماذا تريد أن تفعل هذا؟ هناك الكثير من الاحتمالات. واحد هو هل يمكن بناء تماما طريقة مختلفة في التصفح المحتوى الذي هو متاح من خلال المكتبات في جامعة هارفارد. أنا سأريك واحد ودعا في وقت لاحق Stacklife، التي لديها مختلفة تماما تأخذ على البحث عن المحتوى. هل يمكن بناء محرك التوصية. لذا مكتبة هارفارد ليس في الأعمال التجارية للقول، أحببت هذا الكتاب. ثم انتقل نلقي نظرة على هذه الآخر 17 الكتب التي قد تكون مهتمة في أو هذه 18 غيرها من الصور. ولكن من المؤكد أنه يمكن تكون ميزة قيمة. وبالنظر إلى البيانات الوصفية، فإنه قد يكون من الممكن وضع هذا معا. قد يكون لديك احتياجات مختلفة في حيث البحث في المحتوى، مثل ربما على الرغم من الأدوات التي تتوفر أن يجعل مكتبة المتاحة، قد ترغب للبحث بطريقة مختلفة أو تحسين لحالة استخدام معينة، التي ربما انها متخصصة للغاية. وربما هناك عدد قليل فقط الناس في العالم الذين تريد البحث في المحتوى بهذه الطريقة، لكنه سيكون أمرا رائعا إذا كنا يمكن أن نتركهم يفعلون ذلك. هناك الكثير من التحليلات فقط في كيف يمكن للناس استخدام المحتوى من شأنه أن يكون حقا من المثير للاهتمام معرفة، ومعرفة ما هي الكتب يتم استخدامها، ما لم تكن كذلك، وهكذا دواليك. وبعد ذلك هناك الكثير من فرصة لدمج مع معلومات أخرى ان هذا الامر خارج هناك على شبكة الإنترنت. لذلك نحن have-- على سبيل المثال، لديها NPR شريحة مراجعة لكتاب، حيث مقابلة الكتاب عن الكتب. وهكذا سيكون أمرا رائعا لو كنت يبحث حتى كتاب في جامعة هارفارد مكتبة، وأقول لكم، OK، هناك كانت مقابلة مع المؤلف. دعنا نذهب نلقي نظرة على ذلك. أو هناك صفحة ويكيبيديا، باعتبارها موثوقة، إشارة علمية حول هذا الكتاب أنك قد ترغب في إلقاء نظرة على. هناك هذه الأنواع من مصادر المنتشرة في جميع أنحاء شبكة الإنترنت. ويجمعهما يمكن أن يكون فائدة كبيرة لشخص يبحث في المحتوى، وتبحث عن شيء ما. لكنه أيضا ليس نوع من شيء كنت تريد المكتبة ليكون مسؤولا للذهاب إلى أسفل ومطاردة كل هذه مصادر مختلفة ويسد عليها معا لأنهم المتغيرة باستمرار. وما اعتقد هو المهم مايو لا يكون ما هو في رأيك المهم. وحتى أكثر من ذلك، في الأساس هناك الكثير من الاشياء التي لم تكن قد فكرت من بعد. حتى اذا كنا نستطيع فتح هذا الأمر، وأكثر الناس بالإضافة إلى نصف دزينة أو نحو ذلك، الذين شاهدوا هذا على بشكل منتظم يمكن أن نفكر في الأفكار وتدليك البيانات، و تفعل ما تريد مع ذلك. لذلك نحن نريد أن نجعل هذا البيانات المتاحة إلى العالم. حسنا، هناك مضاعفات زوجين. واحد هو أن هذا التعريف في أنظمة مختلفة. انها في أشكال مختلفة. لذلك هناك بعض التطبيع الذي يجب أن يحدث، التي التطبيع يجري عملية جلب الأشياء من أشكال مختلفة ورسم خرائط لها شكل واحد ذلك أن الحقول سوف تصل المباراة. هناك بعض القيود على حق المؤلف. ومن الغريب، دخول كتالوج عن كتاب مسؤولا عن المؤلف. حتى على الرغم من انها مجرد المعلومات المستمدة من الكتاب، انها محمي بحقوق النشر. واعتمادا على من الواقع خلق أن الفوقية، قد تكون هناك قيود على الذين يمكن توزيعه، على غرار علي: لا أعرف. انها قد تكون أو لا تكون مشابهة ل وضع كلمات الأغنية، مثلا. لذلك نحن جميعا نعرف كيف أن الأحواض. لذلك كنت بحاجة للالتفاف حول هذه المسألة. ثم قطعة أخرى غير أن هناك الكثير من البيانات. حتى إذا أنا شخص يريد العمل مع البيانات أو لديه فكرة باردة، التعامل مع 14 مليون سجلات على جهاز الكمبيوتر المحمول يمكن أن يكون مشكلة ويصعب السيطرة عليها. لذلك نحن نريد للحد من الحواجز للناس لتكون قادرة على العمل مع البيانات. ذلك النهج الذي نأمل عناوين كل هذه المخاوف هو جزأين. واحد هو بناء منصة يأخذ البيانات من جميع هذه المصادر المتباينة ويفاقم ذلك، تطبيع، يثري ذلك، ويجعل هو يتوفر في مكان واحد. ويجعلها متاحة من خلال وAPI العام أن الناس يمكن استدعاء. لذلك فإن API هو تطبيق واجهة البرمجة. ويشير أساسا إلى نقطة النهاية أن وجود نظام أو التكنولوجيا يمكن استدعاء والحصول على البيانات مرة أخرى في شكل منظم بطريقة أنه يمكن استخدامها. لذلك فمن لا يتوقف على الذهاب إلى موقع على شبكة الانترنت وكشط البيانات من من ذلك، على سبيل المثال. لذلك هذا هو الصفحة الرئيسية ل مكتبة سحابة API البند، التي هي في جوهرها على الإصدار الثاني. لذلك فمن التكرار الثاني من في محاولة لجعل كل هذه البيانات متاحة للعالم. لذلك فمن http://api.lib.harvard.edu/v2/items. وفقط لكسر هذه أسفل قليلا، ما يعني هذا هو أن هذا هو الإصدار الثاني من API. هناك نسخة واحدة، والتي أنا لا أذهب للحديث عنها. ولكن هل هناك نسخة واحدة. وإذا كنت تتصل هذه API، كنت تحصل على البنود. وجزء من فكرة API هو API هو عقد. إنه شيء غير لن تتغير. هكذا على سبيل المثال، - والسبب هو أنه إذا أنا بناء نوع من نظام يجري استخدام API مكتبة سحابة لعرض الكتب أو مساعدة الناس على العثور المعلومات بطرق فريدة من نوعها، ما نحن لا نريد أن يحدث هو بالنسبة لنا للذهاب تغيير الطريقة يعمل هذا API، وفجأة كل شيء يكسر على الجانب المستخدم النهائي. ذلك جزء من إذا كنت صنع API متاحة للعالم، انها الممارسة الجيدة لوضع رقم الإصدار في ذلك حتى الناس تعرف أي إصدار انهم تتعامل معه. حتى إذا قررنا نجد طريقة أفضل من إتاحة هذه المعلومات، نحن قد تغيير ذلك ل استدعاء هذا الإصدار الثلاثة. الجميع حتى الذين لا يزال استخدام الإصدار الثاني، والتي سوف لا تزال تعمل. ولكن نسخة من شأنه ثلاثة لدينا جميع الاشياء الجديدة. لذلك هذا هو API، ولكن هذا يبدو حقا مثل URL. وماذا في ذلك وهذا هو مثال هو ما يسمى API راحة، والذي يتوفر ما يزيد قليلا على اتصال منتظم على شبكة الإنترنت. ويمكنك في الواقع الذهاب إليها في المتصفح. حتى هنا لقد فتحت للتو فايرفوكس و ذهب إلى api.lib.harvard.edu/v2/items. وهكذا ما يحصل هنا هو أساسا الصفحة الأولى النتائج من كامل مجموعة من العناصر التي لدينا. وانها هنا في شكل XML. وانها كانت أيضا prettified من قبل فايرفوكس. انها لا تملك في الواقع كل هذه يذكر توسيع والتعاقد من doohickeys هنا. هذا هو نوع من أجمل طريقة نسخة للنظر في ذلك. ولكن ما هذا يقولون لنا هو لقد طلبت من جميع البنود. لذلك هناك 13289475 البنود. وأنا أبحث في أول 10، ابتداء من الساعة موقف الصفر لأنه في علم الحاسوب نبدأ دائما من الصفر. وما لدي هنا، إذا أنا فقط تنهار هذا، سترى لقد حصلت على 10 مادة. وإذا كنت نلقي نظرة على عنصر، يمكنني نرى أن أنا عندي معلومات حول هذا الموضوع. وهذا هو ما يسمى في شكل MODS. وهكذا انا ذاهب للتبديل إلى هنا للحظة. موافق. لذلك دعونا البحث عن شيء ما في تحديدا لأن العنصر الأول الذي يحدث أن تأتي عندما تنظر من خلال جمع كامل هو، بحكم التعريف، عشوائي. لذلك دعونا ننظر لبعض الكعك. أوه. موافق. حتى الكعك. لذلك وجدنا أن هناك 80 عناصر في المجموعة التي ترجع الكعك. نحن نبحث في أول 10 منهم. الآن، يمكنك ان ترى هنا الطريقة التي قلت أنا أبحث عن الكعك، أنا فقط واضاف شيئا ل سلسلة الاستعلام من URL. لذلك ف يساوي الكعك، والتي يمكن نرى قليلا بسهولة أكثر هنا. وهذا يعني أساسا هناك والمواصفات لAPI، التي يعرف كل ما من هذه المعايير يعني. وهذا يعني أننا في طريقنا لل بحث كل شيء عن الكعك. وبالتالي فإن البند الأول هنا لدينا يمكنك ان ترى العنوان دونات، وهناك عنوان فرعي يسمى أحد العاطفة الأمريكي، الذي هو، أعتقد، مناسب. هناك الكثير من different-- وبمجرد الحصول على نقطة من الحصول على البيانات، هناك الكثير من مختلف الأشكال التي يمكنك الحصول عليه في. وهناك نقاط قوة مختلفة والضعف لكل منهم. لذلك هذا واحد، يمكنك ان ترى هنا، وهذا النموذج هو غني جدا. وانها موحدة ذلك. ولذلك لا يوجد عنوان محدد الحقل، حقل الترجمة. هناك بديل العنوان، العاطفة الأمريكي. هناك اسم المرتبطة به. نوع من الموارد هو النص. هناك الكثير من المعلومات هنا في هذا الشكل. ولكن هناك حفنة أشكال مختلفة. وذلك ما كنا فقط أبحث في هو تنسيق ودعا وزارة الدفاع، والتي تقف على الفوقية كائن وصف الخدمة، يحتمل. أنا في الواقع لست متأكدا تماما عن S. لكن من شكل معقد إلى حد ما. انها التنسيق الافتراضي. ولكن هذا لاحد ان يبقى ثراء جميع البيانات أن المكتبة لديها ل انها قريبة جدا من ما يستخدم مكتبة داخليا. انها المعيار الذي هو تستخدم في جميع أنحاء البلاد، في جميع أنحاء العالم في المكتبات الأكاديمية. وانها قابلة للتشغيل المتبادل جدا. حتى إذا كنت قد حصلت على وثيقة هذا هو في شكل MODS، يمكنك أن تعطي لشخص آخر الأنظمة التي تفهم MODS، ويمكن استيراده. لذلك هو المعيار. هو يعرف ذلك جيدا جدا ومحددة جدا. وهذا ما يجعل من قابلة للتشغيل المتبادل لأنه إذا كان شخص ما يقول، هذا هو عنوان بديل ل سجل، والجميع يعرف ماذا يعني ذلك. على الجانب الآخر، انها معقدة جدا. لذلك إذا كنت تأخذ نظرة في هذا السجل هنا، إذا أريد فقط للحصول على عنوان هذه الوثيقة، من هذا الكتاب، الذي هو على الارجح الكعك، والعاطفة الأمريكي، تحليل بها وتشارك قليلا. بينما هناك أخرى شكل يسمى دبلن كور، وهو الكثير، شكل أبسط من ذلك بكثير. وهكذا ترون هنا، وليس هناك العنوان، العنوان الفرعي، وعنوان بديل. هناك فقط العنوان، الكعك، العاطفة الأمريكي، ولقب آخر، والعاطفة الأمريكي. لذلك عندما كنت تبحث في ما شكل كنت ترغب في الحصول على البيانات من، الكثير يعتمد على كيفية وأنت تسير لاستخدامها. هل تستخدم ل قابلية التشغيل البيني أو هل تريد شيئا بسيط هو أن قد يكون من الأسهل للعمل مع؟ على الجانب الآخر، والكثير من تفاصيل الحصول على نوع من مسحوق أسفل. قد تفقد الفروق الدقيقة في ما وسيلة مجال معين إذا كنت تتعامل مع دبلن كور، وهو ما لا يحصل مع MODS. حتى تلك هي اثنين من الأشكال يمكنك الخروج من API. وأساسا، اننا نبقي وراء الكواليس في MODS. ولكن يمكن أن نقدم لك في MODS و دبلن كور وأي شيء آخر كذلك. نظر الآخرين عندما كنت تبحث في البيانات هو يمكنك الحصول عليه إما JSON، التي لتقف على جافا سكريبت تدوين كائن، أو XML، التي تقف على لغة التوصيف الموسعة. وهذه تمثيلات البيانات على حد سواء لدينا بالضبط نفس البيانات، بالضبط نفس المجالات. ولكنهم فقط تختلف نحويا. لذلك هذا هو a-- حسنا، دعونا التبديل فقط. لذلك هذا هو الاستعلام دينا ل الكعك في شكل XML. إذا أنا فقط تبديل هذا JSON، أستطيع أن أرى أنها تبدو مختلفة. وحتى الآن هذا هو نفس المضمون، ولكن بنية مختلفة. هناك عدد أقل من أقواس زاوية. هناك أقل مطول. وهذا هو الشكل الذي، إذا كنت نعمل في بيئة الويب، كنت على الأرجح سوف تريد أن تستخدم لواحد من أشياء لطيفة عن JSON هو انها متوافقة مع جافا سكريبت. حتى إذا أنا أكتب التطبيق على شبكة الإنترنت، ويمكنني أن سحب في JSON والعمل فقط معها مباشرة. بينما مع XML، انها قليلا أكثر تعقيدا. ذلك مرة أخرى، وهذه هي كلا مفيدة. أنها مجرد حالات الاستخدام المختلفة حيث قد الناس يريدون استخدامها. موافق. ويعود ذلك إلى API. حتى نتمكن من بحث for-- أعطي مثالا لل البحث عن الكعك. يمكننا أيضا البحث فقط في مجال معين داخل هنا. وذلك بدلا من البحث السجل بأكمله، يمكنني فقط البحث في حقل العنوان. وحتى الآن هناك 25 الأشياء التي لدينا الكعك في العنوان، واحدة منها هو حول استعادة الأراضي الرطبة في الإدارة من ثقب في دونات البرنامج، الذي هو على الارجح ليس بالضرورة ما نحن نبحث لأننا عندما تبحث عن الكعك. يمكنك أيضا، عندما كنت التعامل مع API-- جزء من وجود API يعطي الناس من الوصول إلى مجموعات البيانات الكبيرة. وهناك زوجين مختلفة الأدوات التي يمكن استخدامها للقيام بذلك. واحد هو، ببساطة شديدة، كنت يمكن من خلال صفحة البيانات. لذلك تماما كما لو كنت تفعل الاستعلام من خلال واجهة على شبكة الإنترنت، يمكنك أن تبحث في صفحة واحدة، الصفحة اثنين، الصفحة الثالثة. يمكنك أن تفعل الشيء نفسه شيء من خلال API. كل ما تحتاجه لتكون صريحة في كيف نفعل ذلك. هكذا على سبيل المثال، إذا أنا أبحث في أول الاستعلام وجودي هنا، حيث أقوم به في البحث عن الأشياء مع الكعك في العنوان، ويمكنني أن أقول، والحد يساوي 20، وهو ما يعني تعطيني السجلات 20 الأولى، وليس أول 10، الذي هو الافتراضي، لأنني أريد أن ننظر إلى 20 في كل مرة. أو أستطيع أن أقول، تعيين بدء يساوي 20 وحد يساوي 20، والتي سوف تعطي لي يسجل 21 خلال 40. لذا أعتقد أن الشيء أن يسلب هنا الذي نستخدمه سلاسل الاستعلام لتعيين المعلمات في الاستعلام. ويتيح لك التحكم ما تحصل عليه العودة. أداة أخرى التي يمكنك استخدامها، - وهذا مفيد حقا في حيث استكشاف البيانات. --is ما يسمى النحت. لذلك النحت المصطلح ليست شائعة بالضرورة. ولكن كنت قد رأيت كل ذلك من قبل. إذا كنت تأخذ نظرة على الأمازون، على سبيل المثال، ويمكنك القيام بالبحث عن الكعك في الكتب، هنا أنها قد حصلت على سلسلة من الكتب، وانهم مجمعة حسب الفئة، وتحصل على فئات مختلفة، وعدد الكتب في كل فئة تظهر. لذلك هذا هو في الأساس أحد الجوانب. كنت تأخذ كل كتبهم، و1،800 الكتب التي تتناسب مع الكعك في الأمازون. 12 منهم في فئة الفطور. 21 في المعجنات والخبز، وهلم جرا وهكذا دواليك. لذلك هذا هو حقا مفيد أداة لاستكشاف المحتوى داخل المكتبة وكذلك لأنه عندما ننظر إلى وجه من وجوه، أنها تعطيك فكرة عن ما هي المواضيع موجودا، مثل ما هي أنواع من المواضيع هي الأكثر شعبية ضمن مجموعة الاستعلام الخاص بك. وأنه يساعدك على ابعاد واستكشاف. حتى نتمكن من القيام بنفس الشيء. إذا كنا نريد أن استخدام API والنظر في أوجه، نضيف مقياس آخر ل صديقنا سلسلة الاستعلام. لذلك أوجه يعادل مفصولة بفواصل قائمة ما نريد أن سطيح جرا. حتى واحد من جوانب قد تكون عرضة. قد تكون لغة أخرى. وحتى إذا كان لنا أن تشغيل هذا الاستعلام، ونحن get-- يبدو الى حد كبير نفس هنا. ولكن لدينا إضافتها إلى نهاية القائمة مجموعة من الأوجه. لذلك لدينا وجه من وجوه دعا الموضوع. لذلك هذا هو قول لنا أنه إذا أتطلع في بلدي 80 النتائج من الاستعلام دونات، 13 منهم لديهم إخضاع الولايات المتحدة الأمريكية. ثلاث ديك الكعك الموضوع. ثلاثة لديهم هذا الموضوع من استعادة الأراضي الرطبة، والتي قد تكون حفرة لدينا في دونات. اثنين منهم، عائلة سمبسون، وهلم جرا وهكذا دواليك. لذلك هذا يمكن أن تكون مفيدة إذا كنت تريد تضييق بحثك. يمكن أن تساعدك على القيام بذلك. وخاصة إذا كان لديك أكثر من، ويقول، 80 النتائج. وبالمثل، طلبنا أيضا للجوانب على اللغة. حتى إذا نظرنا إلى نتائجنا، ونحن نرى 76 منهم في اللغة الإنجليزية، وأربعة في الفرنسية، اثنين باللغة الإسبانية، اثنان، أعتقد أن هذا غير معروف أو غير معروف والهولندية واللاتينية. لذلك أعتقد أن اللاتينية دونات نتيجة لذلك، مرة أخرى، له علاقة مع السلع المخبوزة شيئا. ولكن هناك تذهب. لذلك هذا هو نوع من يظهر لك كيف يمكنك سحب المحتوى إلى الوراء من API فقط من خلال متصفح الإنترنت، وهو أمر عظيم. ولكنها ليست حقا ما تفعل يكون عادة باستخدام API في لذلك. ذلك مثال واحد كيف يمكن القيام به في الواقع هذا هو عندي كتابة برنامج صغير عظمى، التي، مرة أخرى، هل بحثي دونات ويختار المجالات زوجين ويعرضها في جدول. لذلك هذا هو إلى حد كبير نفس المضمون أننا فقط رأى مع عدد قليل من المجالات انسحبت. قائمة من العناوين، وذلك موقع ما الكتاب هو حول، اللغة، وهلم جرا وهكذا دواليك. فكيف حدث هذا فعلا، منذ أعتقد أننا يجب أن ننظر إلى بعض التعليمات البرمجية، is-- ما لدينا هنا هو HTML بسيطة صفحة، والذي يعرض النص، مرحبا بكم سحابة مكتبة و ثم يعرض جدول النتائج. وهناك بالطبع أية نتائج في الطاولة عندما يحصل على تحميل الصفحة. ولكن ما نقوم به هو، أولا وقبل كل شيء، نحن تقوم بتحميل مكتبة يسمى مسج، الذي هو في الأساس مكتبة جافا سكريبت، الأمر الذي يجعل من من السهل جدا التلاعب جافا سكريبت أصلا، HTML، وإنشاء صفحات الويب، المنطق من جانب العميل وصفحات الويب. وذلك ما لدينا هنا هو مسج لديه طريقة تسمى الحصول عليها، الذي أساسا سوف تذهب إلى وURL، والتي، في هذه الحالة، هو هذا URL مألوفا. ومن ثم سوف تحصل على المحتوى من أن URL ثم قم بتشغيل وظيفة على ذلك. فقال نذهب إلى api.lib.harvard / ايدو. البحث عن الكعك. تعطينا 20 السجلات. ثم قم بتشغيل هذه الوظيفة، التي لقد المختارة، فمررها البيانات. والبيانات هي التي JSON حصلت عاد من API. ثم نقوله، خلال تلك البيانات هناك حقل يسمى البند. وإذا ذهبت نلقي نظرة إلى الوراء في واحدة من هذه النتائج أن هنا، هناك شيء called-- حسنا، انه دعا البند. بحيث قد يكون ذلك. وما تفعله هو عليه يمر كل بند ثم يدعو أخرى وظيفة على كل بند. وهذه الوظيفة أساسا يأخذ القيمة في هذا البند، الذي هو أساسا سجل فردي ويسمح لنا لسحب اللقب، التغطية واللغة. لذلك نحن استدعاء دالة على كل العنصر الذي عدنا من API. وإذا كنت تأخذ مجرد نظرة في هذه القطعة هنا، ما نقوم به هو نحن بصدد إنشاء سلسلة، التي هي في جوهرها بعض العلامات HTML حول طاولة، مع value.title، وهو عنوان الكائن، value.coverage، والذي هو التغطية، و- ونحن نفعل شيك هنا لمعرفة من هو غير معروف وإخفائه إذا تقول غير معروف، لأننا لسنا مهتمين حقا في ذلك. --and ثم اللغة. ثم ما نحن به هو إلحاق أن إلى الجدول الذي هو التي حددتها هذه السلسلة هنا. وكيف يعمل مسج ما هذا يقول وابحث عن طاولة المفاوضات مع فكرة النتائج ويضيف هذا النص على ذلك. وهذا هو الجدول مع النتائج الفكرة. وذلك ما كنت في نهاية المطاف مع غير هذه الصفحة هنا. وسعيا لعرض source-- حسنا، ومصدر ليست في الواقع تحديث عندما حدث ذلك. حتى تستطيع أن ترى الفعلية نتائج الجدول على الرغم من هنا. لذلك هذا مجرد مثال بسيط ل القيام استعلام أساسية جدا ضد API وعرض المعلومات في بعض الدول الاخرى تشكيل، وعدم القيام بأي شيء يتوهم جدا. الآن، مثال آخر هو بمثابة طلب خطي من قبل ديفيد اينبرغر كما عرض تجريبي من هذا، والذي يظهر أساسا لك كيف يمكنك الهريس حتى على النتائج التي كنت الحصول من API مكتبة سحابة مع، ويقول، كتب Google. والتفكير هنا هو أن أستطيع تشغيل استعلام مقابل كتب Google، التسجيل للبحث عن النص الكامل، والحصول على بعض النتائج مرة أخرى، ومعرفة أي من تلك البنود موجودة بالفعل في هوليس، نظام المكتبة، ثم تعطيني الروابط العودة إلى تلك العناصر. حتى لو كنت تبحث عن، وكان ليلة مظلمة وعاصفة، وأنا نعود مجموعة من النتائج من جوجل، وبعد ذلك واحدة نتيجة وهو التجاعيد في الوقت. وهذه هي الروابط للكتب الموجودة في إطار منظومة مكتبة جامعة هارفارد. لذا أعتقد النقطة هنا ليست لدرجة أن هذا قد يكون أو لا يكون بالطريقة التي تريدها للبحث في مكتبة، وإنما هو مختلف تماما الطريقة التي لم تكن متاحة لك من قبل، مثل كان لديك أي وسيلة للقيام النص الكامل بالبحث عن الكتب التي حتى كانوا جزءا من نظام مكتبة جامعة هارفارد. وحتى الآن هذا هو وسيلة أنك تستطيع أن تفعل ذلك. ويمكنك عرضها في أيا كان الشكل الذي تريد. وبالتالي فإن النقطة هنا هي، في الأساس، نحن وفتح طرق جديدة للناس للعمل مع البيانات. آخر قطعة من سحابة المكتبة هو أن أنه يساعد على فضح بعض بيانات الاستخدام أن المكتبة لديها. حتى إذا ذهبت إلى المكتبة، وكنت تبحث عن الكتب، كنت لا بالضرورة فعلا فكرة، لجميع العناصر في موضوع معين، ما الناس في المجتمع، سواء كان ذلك يعرف بأنه هارفارد أو البلد أو فصلك، ما يتعين عليهم جدت أكثر فائدة؟ والمكتبة لديها في الواقع طن من المعلومات حول ما هو أكثر فائدة لأنه إذا كان الكثير من الناس التحقق من كتاب، أن يقول لك شيئا. يجب أن يكون هناك سبب انهم يريدون التحقق من ذلك. وهناك الكثير من الناس وضعها على الاحتياط. إذا كان على القائمة الاحتياطية لكثير من الطبقات، أن يقول لك شيئا. إذا تم التحقق من ذلك أعضاء هيئة التدريس بها الكثير والطلاب الجامعيين ليست، أن يقول لي شيئا. بالعكس، التي أيضا يقول لك شيئا. لذلك سيكون من المثير للاهتمام حقا ل وضع تلك المعلومات الى هناك والسماح الناس استخدامها لمساعدتهم في العثور يعمل ضمن نظام المكتبة. الجانب الآخر من هذا هو هناك بعض الخصوصية خطيرة المخاوف لأن واحدا من المبادئ الأساسية للمكتبة ونحن لن يكون قول الناس ما الناس الآخرين هي القراءة. وحتى إذا أنت تقول هذا تم فحص كتاب من أربع مرات في شهر معين، التي يمكن استخدامها لربط عودة إلى خاص شخص من البيانات دي إخفاء الهوية ومعرفة من الذي تأكدت منه. وبالتالي فإن الطريقة التي يمكننا avoid-- الطريقة التي يمكننا محاولة استخراج بعض الإشارات من جميع المعلومات دون التعدي المخاوف المتعلقة بالخصوصية أي شخص هو في الأساس ننظر 10 عاما من بيانات الاستخدام، - لذلك فمن على مدى فترة طويلة من الزمن. --and القول، OK، دعونا نرى كيف مرات كثيرة كان يستخدم هذا العمل، والذي خلال هذه الفترة من الزمن، وبعد ذلك في الأساس الجميل عددا، والتي نسميها على درجة المكدس، التي أساسا يمثل المبلغ انها استخدمت. وأن number-- وهناك الكثير من حسابات مختلفة الخوض في هذا العدد. --but انها صعبة للغاية متري والتي تمنحك فكرة عن كيفية قد مجتمع قيمة هذا العمل. وهكذا نوع آخر من حتى أكثر بلورتها تطبيق أن يستفيد هذا هو شيء دعا Stacklife، الذي هو في الواقع المتاحة من خلال هارفارد الرئيسية البوابة المكتبات. حتى تذهب إلى library.harvard.edu. سترى عدد من مختلفة طرق البحث في المكتبة. واحد منهم يسمى Stacklife. وهذا هو أحد التطبيقات التي يتصفح محتوى المكتبة، ولكن بنيت تماما على رأس هذه واجهات برمجة التطبيقات. لذلك ليس هناك الاشياء خاص يجري وراء الكواليس. لا يوجد الوصول إلى البيانات التي لم يكن لديك. انها تستخدم واجهات برمجة التطبيقات لتوفير لكم مع التصفح مختلف تماما التجربة. حتى لو كنت ابحث عن أليس في بلاد العجائب في هذه الحالة، أحصل على النتيجة التي يبدو هذا، والذي هو much-- جدا انها تشبه الى حد بعيد أي بحث آخر كنت قد تفعل، إلا في هذه الحالة نحن ترتيب العناصر عن طريق stackscore، والتي تعطيك فكرة عن مدى شعبية هذه وكانت العناصر داخل المجتمع. وذلك بشكل واضح، أليس في بلاد العجائب والت ديزني هو بشعبية كبيرة. ولكن يمكنك أيضا رؤية الأربعة الأوائل هنا تلك التي قد لا actually-- الأشياء التي تستخدم للغاية، ولكن لا يجوز لك فورا تواصل مع أليس في بلاد العجائب. لذلك صديقنا القديم و المشروح أليس هو هنا. حتى أستطيع أن نلقي نظرة على ذلك. والآن ما أنا أبحث في هو في الأساس وضع of-- أنا يمكن أن يكون والمشروح أليس هنا. لدي معلومات حول هذا الموضوع. وأود أيضا أن يكون stackscore من، في هذه الحالة، 26. وهذا يقول لي نوع من تقريبا كيف وصلنا إلى هذا stackscore، مثل الذين تأكدت منه، مثل كيف مرات كثيرة كان سحبه، مثل أعضاء هيئة التدريس أو الطلاب الجامعيون، كيف العديد من نسخ المكتبة لديها، وهلم جرا وهكذا دواليك. ويمكنك أيضا، للاهتمام بما فيه الكفاية هنا، وتصفح مداخن تقريبا. ولذلك فإن البيانات هنا، وهذا يظهر لك نوع من التمثيل الظاهري ما جبروت الرف تبدو وكأنها لو كنت لاتخاذ جميع مقتنيات المكتبة ووضعها معا على الرف لانهائي واحد. والشيء الجميل هو أننا can-- أولا وقبل كل شيء، البيانات الوصفية عن هذه الكتب كثيرا ما يخبرك عندما نشر. فإنه يقول لك كم عدد صفحات لديه. قد أقول لك الأبعاد. حتى تستطيع أن ترى هذا ما ينعكس هنا من حيث حجم الكتب. ومن ثم يمكننا استخدام كومة النتيجة لتسليط الضوء الكتب التي لديها أعلى الدرجات المكدس. حتى لو كان أكثر قتامة، فهذا يعني أن، ويفترض، ويتم استخدامها على نحو أكثر تواترا. حتى في هذه الحالة، وأنا الذهاب الى اعتقد ان هذا هو إصدار أليس في بلاد العجائب التي عادة جدا تستخدم والأكثر الوصول، المكتبة لديه معظم نسخ. حتى إذا كنت تبحث لأليس في بلاد العجائب، هذا قد يكون مكانا جيدا للبدء. ثم هنا يمكنك أيضا ربط خارج ل، ويقول، والأمازون لشراء الكتاب، وهلم جرا وهكذا دواليك. النقطة هنا، مرة أخرى، ليس كثيرا أن هذا هو أفضل وسيلة لتصفح المكتبة أو الأداة المناسبة لكل مناسبة. ولكنها طريقة أخرى للقيام بذلك. وبجعل البيانات متوفرة من خلال API، التي مصنوع من اللبنات بسيطة جدا، والذي يسمح لك للبحث في المحتوى، يمكنك بناء شيء مثل هذه التي يمكن أن يكون غير عادي قيمة لبعض الناس. ولهذا النوع من، بقدر ما أريد القول حقا عن ما هو API وما يعرض عليه، هناك ككل حفنة من الاشياء وراء الكواليس، والذي انا فقط أن أتطرق إلى فترة وجيزة فقط لأنه نوع من يأتي في هذا من زاوية مختلفة تماما في حيث كيف شيئا من هذا القبيل الحصول على وضع في مكانه؟ لذلك فإن API هو المعيار واجهة لكل هذا المحتوى. ولكن للحصول عليه هناك، أول شيء كان علينا أن نفعل تم سحب معا المعلومات من الكتب والصور والمساعدات إيجاد، وجمع وثيقة من أنظمة هارفارد المختلفة. أليف، VIA، وOASIS هم أسماء النظم. ويذهبون أساسا إلى خط أنابيب، خط أنابيب المعالجة. لذلك أولا، نحصل على التصدير الملفات من كل هذه النظم. نحن تقسيمها إلى عناصر فردية. لذلك لدينا ملف، وهو جيجابايت، الذي لديه مليون سجل في ذلك. لذلك نحن تقسيمه إلى عناصر فردية. ثم، لكل عنصر، ونحن تحويله إلى وزارة الدفاع، لأن بعض هذه هي MODS أصلا، وبعضهم ليسوا كذلك. حتى نحصل على كل منهم ل تكون في نفس الشكل. ثم هناك العديد خطوات التخصيب، حيث نضيف المزيد من المعلومات للبيانات وكان من المتاح في المكتبة. لذلك نحن بحاجة إلى إضافة، أولا وقبل كل لدينا ما عقد مكتبات ذلك. نذهب من خلال خطوة لل حساب stackscore. نذهب من خلال خطوة أخرى من إضافة المزيد من البيانات الوصفية من حيث ما الناس المجموعات قد أضاف this-- الناس يختلقون مجموعات من العناصر. ما مجموعات أنها لا تنتمي إليها؟ كيف الناس الموسومة هذا المحتوى في الماضي؟ ثم أنت تصفية، وكنت تقييد السجلات لأنه، كما ذكرت، هناك بعض السجلات التي، بسبب أسباب حقوق التأليف والنشر، ونحن لا يمكن عرض. وبعد ذلك تحميلها في ما يسمى المؤسسة العامة، وهي ليست الخطأ الإملائي، ولكن هو اسم قطعة من البرمجيات أن يفعل البحث والفهرسة، والتي يدفع كل البحث وراء API. وبعد ذلك تصبح متوفرة ل وAPI، ويمكن للناس استخدامه. لذلك هذا هو مثل حد ما عملية مباشرة. واحدة من اهتمام أشياء عن ذلك هو أننا نتعامل مع 13 مليون سجلات ونحن نذهب إلى أن التعامل أو أكثر. ونحن نريد أن تكون قادرة على التعامل مع هذه بطريقة سريعة نسبيا. يستغرق وقتا طويلا ل معالجة 13 مليون السجلات. فكيف هذا الخط هو انشاء هو أنك can-- اعتقد ان الاستفادة من خط أنابيب، والمشكلة أننا محاولة حل هنا، هو أن كل التحولات، جميع هذه الخطوات في هذا خط أنابيب قابلة للفصل. ليس هناك التبعية. إذا كنت تجهيز سجل من كتاب واحد، ليس هناك تبعية في ما بين كتاب آخر. وذلك ما يمكننا القيام به هو في الأساس، في كل خطوة في الطريق، نحن وضعه في قائمة انتظار في السحابة. حدث لي أن يكون على الأمازون خدمات ويب. لذلك هناك قائمة، أقول، 10،000 العناصر التي تحتاج إلى أن تكون تطبيع و تحويل إلى تنسيق MODS. ونحن دوران العديد من خوادم كما نريد، ربما 10 الملقمات. ولكل من هذه الخوادم فقط يجلس هناك، ويبدو في أن قائمة الانتظار، يرى أن هناك واحد التي تحتاج إلى تتم معالجتها، تسحب تشغيله قائمة الانتظار، العمليات عليها، والعصي على قائمة انتظار القادم. وماذا في ذلك أن يسمح لنا القيام به هو تطبيق، أساسا، كما الكثير من الأجهزة كما أننا نريد أن هذا المشكلة لفترة قصيرة جدا من الزمن لمعالجة البيانات في أسرع وقت ممكن، وهو أمر ذلك فحسب، الآن في عالم الحوسبة السحابية نستطيع توفير خوادم أساسا على الفور، هو أن فائدة. لذلك نحن لا يكون لديك الخادم العملاق الجلوس حول في كل وقت للقيام تجهيز قد يحدث ذلك مرة واحدة فقط في الأسبوع. لذلك هذا هو الغالب عليه. هناك الوثائق المتاحة لمكتبة سحابة API البند في هذا URL، والتي سوف تكون متاحة في وقت لاحق. ويرجى الذهاب نلقي نظرة على لمعرفة ما إذا كان هناك أي شيء، لديك أي أفكار. لعب معها. تحامق. ونأمل يمكنك أن تأتي بشيء عظيم. شكرا.