1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 جيفري LICHT: مرحبا هناك. 3 00:00:12,370 --> 00:00:13,550 أنا جيفري يخت. 4 00:00:13,550 --> 00:00:17,890 وأنا هنا لأتحدث إليكم عن مكتبة جامعة هارفارد وبناء الغد 5 00:00:17,890 --> 00:00:20,870 مكتبة اليوم، وانا اعتقد. 6 00:00:20,870 --> 00:00:23,040 حتى الخلفية هنا، الملعب لهذه الدورة 7 00:00:23,040 --> 00:00:26,930 هو أساسا أن هناك الكثير من البيانات الببليوغرافية 8 00:00:26,930 --> 00:00:28,400 متوفر في مكتبات جامعة هارفارد. 9 00:00:28,400 --> 00:00:33,434 وهناك فرصة، من خلال بعض الأدوات 10 00:00:33,434 --> 00:00:36,350 والمشروع الذي يجري تطويره، للحصول على الوصول إلى المعلومات 11 00:00:36,350 --> 00:00:42,430 وأخذه إلى الأماكن التي مكتبة جامعة هارفارد لا تقوم به الآن، 12 00:00:42,430 --> 00:00:45,460 تفعل أشياء جديدة معها، التجربة ولعب مع حولها. 13 00:00:45,460 --> 00:00:52,413 >> حتى نقطة الدخول إلى هذا هو API دعا هارفارد مكتبة الغيمة، والتي 14 00:00:52,413 --> 00:00:57,650 هو خادم الفوقية المفتوحة، والتي سأتحدث عنها الآن. 15 00:00:57,650 --> 00:01:02,595 حتى الخلفية هي أن هناك الكثير من الاشياء في المكتبة هارفارد. 16 00:01:02,595 --> 00:01:07,150 لدينا أكثر من 13 مليون المراجع السجلات، والملايين من الصور، 17 00:01:07,150 --> 00:01:11,090 والآلاف من المساعدات الحقائق، التي هي وثائق أساسا واصفا 18 00:01:11,090 --> 00:01:15,500 مجموعات، ويقول ما هو في نفوسهم، وصناديق من الأوراق 19 00:01:15,500 --> 00:01:21,080 وهكذا دواليك التي تمثل أكثر لمليون وثيقة على حدة. 20 00:01:21,080 --> 00:01:24,290 وهناك أيضا الكثير من المعلومات التي المكتبة لديها 21 00:01:24,290 --> 00:01:28,180 حول كيفية استخدام المحتوى الذي يمكن أن تكون ذات فائدة للناس 22 00:01:28,180 --> 00:01:32,400 الذين قد يرغبون في العمل معها. 23 00:01:32,400 --> 00:01:36,150 >> لذلك كل من المعلومات المكتبة لديها الفوقية. 24 00:01:36,150 --> 00:01:39,500 لذلك الفوقية هي بيانات عن البيانات. 25 00:01:39,500 --> 00:01:42,070 لذلك عندما نتحدث عن المعلومات التي ل 26 00:01:42,070 --> 00:01:44,890 المتاحة من خلال مكتبة السحابة التي هو متاح، 27 00:01:44,890 --> 00:01:47,760 انها ليست بالضرورة المستندات الفعلية 28 00:01:47,760 --> 00:01:53,060 أنفسهم، وليس بالضرورة بالكامل نص الكتب أو الصور الكاملة، 29 00:01:53,060 --> 00:01:54,890 على الرغم من أن الواقع قد يكون هذا هو الحال. 30 00:01:54,890 --> 00:01:57,550 لكنها في الحقيقة معلومات حول البيانات. 31 00:01:57,550 --> 00:02:00,909 >> لذلك يمكن ان يخطر لك الفهرسة معلومات وأرقام الاتصال، والمواضيع، 32 00:02:00,909 --> 00:02:02,700 كم عدد نسخ من كتاب هناك، ما 33 00:02:02,700 --> 00:02:06,380 هي طبعات، ما هي الأشكال، والكتاب، وهكذا دواليك. 34 00:02:06,380 --> 00:02:12,250 لذلك هناك الكثير من المعلومات حول المعلومات الواردة في المجموعة التي، 35 00:02:12,250 --> 00:02:14,400 في حد ذاته، هو نوع من المفيد بطبيعتها. 36 00:02:14,400 --> 00:02:19,230 وعلى الرغم من إذا كنت ابحاثا معمقة، 37 00:02:19,230 --> 00:02:25,160 تريد من الواضح للوصول الى الفعلية المضمون نفسه وإلقاء نظرة على البيانات، 38 00:02:25,160 --> 00:02:30,140 البيانات الوصفية هو مفيد من حيث كلا تحليل الإحضار ككل، 39 00:02:30,140 --> 00:02:33,870 مثل ما هي الأشياء في المجموعة. 40 00:02:33,870 --> 00:02:35,520 وكيف تتصل؟ 41 00:02:35,520 --> 00:02:39,482 كما أنه يساعد وجدت حقا غيرها من الاشياء، الذي هو في الحقيقة الغرض الرئيسي منه. 42 00:02:39,482 --> 00:02:41,190 نقطة من الفوقية والتسويقي 43 00:02:41,190 --> 00:02:43,230 هو لمساعدتك على العثور على كل المعلومات التي ل 44 00:02:43,230 --> 00:02:46,590 متوفرة ضمن مجموعات. 45 00:02:46,590 --> 00:02:53,690 >> لذلك هذا هو مثال من البيانات الوصفية عن كتاب في مكتبة جامعة هارفارد. 46 00:02:53,690 --> 00:02:56,370 لذلك فمن هناك. 47 00:02:56,370 --> 00:02:59,850 ويمكنك ان ترى انها في الواقع مجمع باعتدال. 48 00:02:59,850 --> 00:03:04,610 وجزء من قيمة الفوقية في إطار منظومة مكتبة هارفارد 49 00:03:04,610 --> 00:03:09,320 وهذا ما كان عليه نوع من بنتها المفهرسين 50 00:03:09,320 --> 00:03:12,720 وتجميعها من قبل الناس تطبيق الكثير من الخبرة والمهارة 51 00:03:12,720 --> 00:03:20,030 ويعتقد أنه مع مرور الوقت، التي لديها الكثير من القيمة. 52 00:03:20,030 --> 00:03:25,450 >> حتى إذا كنت نلقي نظرة على هذا السجل ل والمشروح أليس، يمكنك معرفة 53 00:03:25,450 --> 00:03:32,590 كنت قد حصلت على اللقب، الذي كتب عليه، و المؤلف، وجميع موضوعات مختلفة 54 00:03:32,590 --> 00:03:35,380 الذي شخص فهرسة هو داخل. 55 00:03:35,380 --> 00:03:40,110 ويمكنك ان ترى هناك أيضا، في بالإضافة إلى الكثير من المعلومات الجيدة 56 00:03:40,110 --> 00:03:42,852 هنا، وهناك بعض الازدواجية. 57 00:03:42,852 --> 00:03:45,560 هناك الكثير من التعقيد هذا ينعكس من خلال البيانات الوصفية 58 00:03:45,560 --> 00:03:46,300 التي لديك. 59 00:03:46,300 --> 00:03:50,320 >> حتى عنوان واحد من هذا الكتاب هو أليس في بلاد العجائب. 60 00:03:50,320 --> 00:03:53,880 لذلك هذا هو المشروح نسخة من هذا الكتاب. 61 00:03:53,880 --> 00:03:56,380 لكنه دعا أيضا المشروح أليس، مغامرات أليس في بلاد 62 00:03:56,380 --> 00:03:58,570 في بلاد العجائب ل انه شيء الذي 63 00:03:58,570 --> 00:04:00,430 كتب مارتن غاردنر والمشروح الكتاب. 64 00:04:00,430 --> 00:04:03,369 وهناك الكثير من المعلومات العظيمة حول الألغاز المنطق والأشياء 65 00:04:03,369 --> 00:04:05,410 ضمن أليس أنك ربما لم يكن يعرف شيئا عن. 66 00:04:05,410 --> 00:04:07,000 لذلك يجب عليك ان تذهب قراءتها. 67 00:04:07,000 --> 00:04:11,940 >> لكن يمكنك أن ترى هناك الكثير من التفاصيل هنا، 68 00:04:11,940 --> 00:04:15,340 بما في ذلك التعريف، عندما تم إنشاء، من أين جاء، 69 00:04:15,340 --> 00:04:17,420 من حيث هارفارد النظام، وهكذا دواليك. 70 00:04:17,420 --> 00:04:20,350 لذلك هذا هو عينة من نوع من الفوقية 71 00:04:20,350 --> 00:04:24,340 التي قد تراها لكتاب في جمع مكتبة جامعة هارفارد. 72 00:04:24,340 --> 00:04:26,680 >> وهذا هو شيء مختلف تماما. 73 00:04:26,680 --> 00:04:32,610 لذلك ليس هناك نظام يسمى VIA هارفارد، والذي في الأساس 74 00:04:32,610 --> 00:04:39,990 وفهرسة الصور والكائنات الفن والأشياء المرئية في جميع أنحاء هارفارد، 75 00:04:39,990 --> 00:04:44,010 وإضافة بعض البيانات الوصفية لهم وتبويبها، 76 00:04:44,010 --> 00:04:49,200 و، في بعض الحالات، وتوفير الصور المصغرة صغيرة 77 00:04:49,200 --> 00:04:51,250 التي يمكنك اتخاذها ل ننظر إذا كنت ترغب في ذلك. 78 00:04:51,250 --> 00:04:54,240 >> لذلك هذا هو مثال لل الفوقية التي لديك لوحة 79 00:04:54,240 --> 00:04:57,840 من، ويفترض، أليس في بلاد العجائب. 80 00:04:57,840 --> 00:05:00,499 ويمكنك ان ترى هناك أقل الفوقية هنا. 81 00:05:00,499 --> 00:05:02,040 انها مجرد نوع مختلف من الكائن. 82 00:05:02,040 --> 00:05:03,425 وهكذا هناك معلومات أقل. 83 00:05:03,425 --> 00:05:07,790 >> لديك معظمهم من حقيقة أنه، مكالمة عدد، أساسا الذي خلقها، - 84 00:05:07,790 --> 00:05:10,410 >> نحن لا نعرف متى أنشئت من أجلها. 85 00:05:10,410 --> 00:05:13,320 >> --and عنوان. 86 00:05:13,320 --> 00:05:14,300 >> مثال آخر. 87 00:05:14,300 --> 00:05:16,380 هذا هو الاستنتاج المساعدات. 88 00:05:16,380 --> 00:05:19,030 لذلك هناك مجموعة من لويس أوراق كارول في جامعة هارفارد. 89 00:05:19,030 --> 00:05:23,601 لذلك هذا يصف ما هو في تلك المجموعة. 90 00:05:23,601 --> 00:05:26,100 حتى شخص قد ذهب من خلال و بدا من خلال كافة خانات 91 00:05:26,100 --> 00:05:32,220 وفهرستها ذلك، نظرا بعض الخلفية، كتب خلاصة ما هنا. 92 00:05:32,220 --> 00:05:35,290 وإذا كنت لننظر أكثر من هذا، وهذا 93 00:05:35,290 --> 00:05:39,620 ويمضي لصفحات وصفحات وصفحات، ولكن سوف اقول لكم 94 00:05:39,620 --> 00:05:41,860 ما الرسائل وما مواعيد عما صناديق 95 00:05:41,860 --> 00:05:44,289 موجودة في جميع أنحاء المجموعة. 96 00:05:44,289 --> 00:05:46,330 ولكن هذا شيء أنه إذا كنت في جامعة هارفارد، 97 00:05:46,330 --> 00:05:50,720 يمكنك الذهاب وفعلا تبدو جسديا صعودا و، ويفترض، نلقي نظرة على. 98 00:05:50,720 --> 00:05:53,440 >> لذلك هذا هو كل شيء عظيم. 99 00:05:53,440 --> 00:05:54,450 هذا التعريف ومفيدة. 100 00:05:54,450 --> 00:05:56,327 انها في النظام مكتبة جامعة هارفارد. 101 00:05:56,327 --> 00:05:58,910 هناك أدوات على الانترنت حيث كنت يمكن أن تذهب ونلقي نظرة على ذلك، 102 00:05:58,910 --> 00:05:59,993 ونرى ذلك، وبحث عنها. 103 00:05:59,993 --> 00:06:02,810 ويمكنك شريحة والزهر في الكثير من الطرق المختلفة. 104 00:06:02,810 --> 00:06:06,920 >> لكنها في الحقيقة متاح فقط إذا أنت إنسان الجلوس 105 00:06:06,920 --> 00:06:12,600 في متصفح الويب الخاص بك أو شيء أو الهاتف والتنقل من خلال ذلك. 106 00:06:12,600 --> 00:06:16,730 انها ليست متوفرة حقا في أي نوع من الموضة صالحة للاستعمال 107 00:06:16,730 --> 00:06:19,520 لأنظمة أخرى أو أجهزة الكمبيوتر الأخرى للاستخدام، 108 00:06:19,520 --> 00:06:21,500 وليس مع الأنظمة داخل مكتبة جامعة هارفارد، 109 00:06:21,500 --> 00:06:24,890 لكن الأنظمة في العالم الخارجي، مجرد مجموعة من الناس الآخرين بشكل عام. 110 00:06:24,890 --> 00:06:30,210 لذا فإن السؤال هو، كيف يمكن لنا جعلها متاحة لأجهزة الكمبيوتر 111 00:06:30,210 --> 00:06:33,560 بحيث يمكننا القيام به أكثر إثارة للاهتمام الاشياء معها من مجرد 112 00:06:33,560 --> 00:06:36,550 التصفح ذلك بأنفسنا؟ 113 00:06:36,550 --> 00:06:39,766 >> فلماذا تريد أن تفعل هذا؟ 114 00:06:39,766 --> 00:06:41,140 هناك الكثير من الاحتمالات. 115 00:06:41,140 --> 00:06:43,980 واحد هو هل يمكن بناء تماما طريقة مختلفة في التصفح 116 00:06:43,980 --> 00:06:46,962 المحتوى الذي هو متاح من خلال المكتبات في جامعة هارفارد. 117 00:06:46,962 --> 00:06:48,670 أنا سأريك واحد ودعا في وقت لاحق Stacklife، 118 00:06:48,670 --> 00:06:52,440 التي لديها مختلفة تماما تأخذ على البحث عن المحتوى. 119 00:06:52,440 --> 00:06:54,560 >> هل يمكن بناء محرك التوصية. 120 00:06:54,560 --> 00:06:57,955 لذا مكتبة هارفارد ليس في الأعمال التجارية للقول، أحببت هذا الكتاب. 121 00:06:57,955 --> 00:07:01,080 ثم انتقل نلقي نظرة على هذه الآخر 17 الكتب التي قد تكون مهتمة في 122 00:07:01,080 --> 00:07:03,200 أو هذه 18 غيرها من الصور. 123 00:07:03,200 --> 00:07:06,040 ولكن من المؤكد أنه يمكن تكون ميزة قيمة. 124 00:07:06,040 --> 00:07:09,272 وبالنظر إلى البيانات الوصفية، فإنه قد يكون من الممكن وضع هذا معا. 125 00:07:09,272 --> 00:07:11,980 قد يكون لديك احتياجات مختلفة في حيث البحث في المحتوى، 126 00:07:11,980 --> 00:07:16,200 مثل ربما على الرغم من الأدوات التي تتوفر أن يجعل مكتبة 127 00:07:16,200 --> 00:07:18,450 المتاحة، قد ترغب للبحث بطريقة مختلفة 128 00:07:18,450 --> 00:07:21,847 أو تحسين لحالة استخدام معينة، التي ربما انها متخصصة للغاية. 129 00:07:21,847 --> 00:07:23,930 وربما هناك عدد قليل فقط الناس في العالم الذين 130 00:07:23,930 --> 00:07:25,846 تريد البحث في المحتوى بهذه الطريقة، لكنه 131 00:07:25,846 --> 00:07:28,985 سيكون أمرا رائعا إذا كنا يمكن أن نتركهم يفعلون ذلك. 132 00:07:28,985 --> 00:07:30,860 هناك الكثير من التحليلات فقط في كيف يمكن للناس 133 00:07:30,860 --> 00:07:33,860 استخدام المحتوى من شأنه أن يكون حقا من المثير للاهتمام معرفة، ومعرفة 134 00:07:33,860 --> 00:07:37,280 ما هي الكتب يتم استخدامها، ما لم تكن كذلك، وهكذا دواليك. 135 00:07:37,280 --> 00:07:41,670 وبعد ذلك هناك الكثير من فرصة لدمج 136 00:07:41,670 --> 00:07:45,210 مع معلومات أخرى ان هذا الامر خارج هناك على شبكة الإنترنت. 137 00:07:45,210 --> 00:07:46,880 لذلك نحن have-- 138 00:07:46,880 --> 00:07:50,260 >> على سبيل المثال، لديها NPR شريحة مراجعة لكتاب، 139 00:07:50,260 --> 00:07:53,090 حيث مقابلة الكتاب عن الكتب. 140 00:07:53,090 --> 00:07:56,837 وهكذا سيكون أمرا رائعا لو كنت يبحث حتى كتاب في جامعة هارفارد 141 00:07:56,837 --> 00:07:59,670 مكتبة، وأقول لكم، OK، هناك كانت مقابلة مع المؤلف. 142 00:07:59,670 --> 00:08:00,878 دعنا نذهب نلقي نظرة على ذلك. 143 00:08:00,878 --> 00:08:05,461 أو هناك صفحة ويكيبيديا، باعتبارها موثوقة، إشارة علمية 144 00:08:05,461 --> 00:08:07,710 حول هذا الكتاب أنك قد ترغب في إلقاء نظرة على. 145 00:08:07,710 --> 00:08:12,600 >> هناك هذه الأنواع من مصادر المنتشرة في جميع أنحاء شبكة الإنترنت. 146 00:08:12,600 --> 00:08:16,555 ويجمعهما يمكن أن يكون فائدة كبيرة 147 00:08:16,555 --> 00:08:18,930 لشخص يبحث في المحتوى، وتبحث عن شيء ما. 148 00:08:18,930 --> 00:08:20,180 لكنه أيضا ليس نوع من شيء كنت 149 00:08:20,180 --> 00:08:23,205 تريد المكتبة ليكون مسؤولا للذهاب إلى أسفل ومطاردة 150 00:08:23,205 --> 00:08:25,455 كل هذه مصادر مختلفة ويسد عليها معا 151 00:08:25,455 --> 00:08:28,920 لأنهم المتغيرة باستمرار. 152 00:08:28,920 --> 00:08:33,570 وما اعتقد هو المهم مايو لا يكون ما هو في رأيك المهم. 153 00:08:33,570 --> 00:08:36,929 >> وحتى أكثر من ذلك، في الأساس هناك الكثير من الاشياء التي لم تكن قد فكرت من بعد. 154 00:08:36,929 --> 00:08:42,222 حتى اذا كنا نستطيع فتح هذا الأمر، وأكثر الناس بالإضافة إلى نصف دزينة أو نحو ذلك، 155 00:08:42,222 --> 00:08:45,174 الذين شاهدوا هذا على بشكل منتظم يمكن أن نفكر في الأفكار 156 00:08:45,174 --> 00:08:47,340 وتدليك البيانات، و تفعل ما تريد مع ذلك. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> لذلك نحن نريد أن نجعل هذا البيانات المتاحة إلى العالم. 159 00:08:54,045 --> 00:08:55,670 حسنا، هناك مضاعفات زوجين. 160 00:08:55,670 --> 00:08:58,540 واحد هو أن هذا التعريف في أنظمة مختلفة. 161 00:08:58,540 --> 00:09:01,110 انها في أشكال مختلفة. 162 00:09:01,110 --> 00:09:04,719 لذلك هناك بعض التطبيع الذي يجب أن يحدث، 163 00:09:04,719 --> 00:09:08,010 التي التطبيع يجري عملية جلب الأشياء من أشكال مختلفة 164 00:09:08,010 --> 00:09:12,940 ورسم خرائط لها شكل واحد ذلك أن الحقول سوف تصل المباراة. 165 00:09:12,940 --> 00:09:15,160 >> هناك بعض القيود على حق المؤلف. 166 00:09:15,160 --> 00:09:21,010 ومن الغريب، دخول كتالوج عن كتاب مسؤولا عن المؤلف. 167 00:09:21,010 --> 00:09:24,060 حتى على الرغم من انها مجرد المعلومات المستمدة من الكتاب، 168 00:09:24,060 --> 00:09:25,330 انها محمي بحقوق النشر. 169 00:09:25,330 --> 00:09:28,400 واعتمادا على من الواقع خلق أن الفوقية، 170 00:09:28,400 --> 00:09:32,175 قد تكون هناك قيود على الذين يمكن توزيعه، على غرار علي: 171 00:09:32,175 --> 00:09:33,402 >> لا أعرف. 172 00:09:33,402 --> 00:09:36,110 انها قد تكون أو لا تكون مشابهة ل وضع كلمات الأغنية، 173 00:09:36,110 --> 00:09:36,610 مثلا. 174 00:09:36,610 --> 00:09:38,560 لذلك نحن جميعا نعرف كيف أن الأحواض. 175 00:09:38,560 --> 00:09:40,450 لذلك كنت بحاجة للالتفاف حول هذه المسألة. 176 00:09:40,450 --> 00:09:44,910 >> ثم قطعة أخرى غير أن هناك الكثير من البيانات. 177 00:09:44,910 --> 00:09:52,420 حتى إذا أنا شخص يريد العمل مع البيانات أو لديه فكرة باردة، 178 00:09:52,420 --> 00:09:55,350 التعامل مع 14 مليون سجلات على جهاز الكمبيوتر المحمول 179 00:09:55,350 --> 00:09:57,487 يمكن أن يكون مشكلة ويصعب السيطرة عليها. 180 00:09:57,487 --> 00:09:59,320 لذلك نحن نريد للحد من الحواجز للناس 181 00:09:59,320 --> 00:10:02,130 لتكون قادرة على العمل مع البيانات. 182 00:10:02,130 --> 00:10:07,880 >> ذلك النهج الذي نأمل عناوين كل هذه المخاوف هو جزأين. 183 00:10:07,880 --> 00:10:11,770 واحد هو بناء منصة يأخذ البيانات من جميع هذه المصادر المتباينة 184 00:10:11,770 --> 00:10:14,350 ويفاقم ذلك، تطبيع، يثري ذلك، ويجعل 185 00:10:14,350 --> 00:10:16,650 هو يتوفر في مكان واحد. 186 00:10:16,650 --> 00:10:20,950 ويجعلها متاحة من خلال وAPI العام أن الناس يمكن استدعاء. 187 00:10:20,950 --> 00:10:24,430 >> لذلك فإن API هو تطبيق واجهة البرمجة. 188 00:10:24,430 --> 00:10:28,930 ويشير أساسا إلى نقطة النهاية أن وجود نظام أو التكنولوجيا 189 00:10:28,930 --> 00:10:31,720 يمكن استدعاء والحصول على البيانات مرة أخرى في شكل منظم بطريقة 190 00:10:31,720 --> 00:10:32,900 أنه يمكن استخدامها. 191 00:10:32,900 --> 00:10:36,060 لذلك فمن لا يتوقف على الذهاب إلى موقع على شبكة الانترنت 192 00:10:36,060 --> 00:10:37,970 وكشط البيانات من من ذلك، على سبيل المثال. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> لذلك هذا هو الصفحة الرئيسية ل مكتبة سحابة API البند، 195 00:10:45,010 --> 00:10:47,220 التي هي في جوهرها على الإصدار الثاني. 196 00:10:47,220 --> 00:10:50,130 لذلك فمن التكرار الثاني من في محاولة لجعل كل هذه البيانات 197 00:10:50,130 --> 00:10:53,280 متاحة للعالم. 198 00:10:53,280 --> 00:10:59,560 لذلك فمن http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 وفقط لكسر هذه أسفل قليلا، ما يعني هذا 200 00:11:03,830 --> 00:11:06,115 هو أن هذا هو الإصدار الثاني من API. 201 00:11:06,115 --> 00:11:08,490 هناك نسخة واحدة، والتي أنا لا أذهب للحديث عنها. 202 00:11:08,490 --> 00:11:09,750 ولكن هل هناك نسخة واحدة. 203 00:11:09,750 --> 00:11:14,740 >> وإذا كنت تتصل هذه API، كنت تحصل على البنود. 204 00:11:14,740 --> 00:11:20,640 وجزء من فكرة API هو API هو عقد. 205 00:11:20,640 --> 00:11:23,440 إنه شيء غير لن تتغير. 206 00:11:23,440 --> 00:11:24,850 هكذا على سبيل المثال، - 207 00:11:24,850 --> 00:11:27,410 >> والسبب هو أنه إذا أنا بناء نوع من نظام 208 00:11:27,410 --> 00:11:33,210 يجري استخدام API مكتبة سحابة لعرض الكتب أو مساعدة الناس على العثور 209 00:11:33,210 --> 00:11:36,190 المعلومات بطرق فريدة من نوعها، ما نحن لا نريد أن يحدث 210 00:11:36,190 --> 00:11:38,940 هو بالنسبة لنا للذهاب تغيير الطريقة يعمل هذا API، وفجأة 211 00:11:38,940 --> 00:11:41,340 كل شيء يكسر على الجانب المستخدم النهائي. 212 00:11:41,340 --> 00:11:46,710 ذلك جزء من إذا كنت صنع API متاحة للعالم، انها 213 00:11:46,710 --> 00:11:49,396 الممارسة الجيدة لوضع رقم الإصدار في ذلك حتى الناس 214 00:11:49,396 --> 00:11:51,020 تعرف أي إصدار انهم تتعامل معه. 215 00:11:51,020 --> 00:11:54,300 >> حتى إذا قررنا نجد طريقة أفضل من إتاحة هذه المعلومات، 216 00:11:54,300 --> 00:11:57,295 نحن قد تغيير ذلك ل استدعاء هذا الإصدار الثلاثة. 217 00:11:57,295 --> 00:11:59,920 الجميع حتى الذين لا يزال استخدام الإصدار الثاني، والتي سوف لا تزال تعمل. 218 00:11:59,920 --> 00:12:03,490 ولكن نسخة من شأنه ثلاثة لدينا جميع الاشياء الجديدة. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> لذلك هذا هو API، ولكن هذا يبدو حقا مثل URL. 221 00:12:09,210 --> 00:12:11,680 وماذا في ذلك وهذا هو مثال هو ما 222 00:12:11,680 --> 00:12:16,615 يسمى API راحة، والذي يتوفر ما يزيد قليلا على اتصال منتظم على شبكة الإنترنت. 223 00:12:16,615 --> 00:12:19,680 ويمكنك في الواقع الذهاب إليها في المتصفح. 224 00:12:19,680 --> 00:12:28,550 >> حتى هنا لقد فتحت للتو فايرفوكس و ذهب إلى api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 وهكذا ما يحصل هنا هو أساسا الصفحة الأولى 226 00:12:31,560 --> 00:12:34,740 النتائج من كامل مجموعة من العناصر التي لدينا. 227 00:12:34,740 --> 00:12:37,460 وانها هنا في شكل XML. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 وانها كانت أيضا prettified من قبل فايرفوكس. 230 00:12:42,210 --> 00:12:45,850 انها لا تملك في الواقع كل هذه يذكر توسيع والتعاقد 231 00:12:45,850 --> 00:12:47,880 من doohickeys هنا. 232 00:12:47,880 --> 00:12:52,520 هذا هو نوع من أجمل طريقة نسخة للنظر في ذلك. 233 00:12:52,520 --> 00:12:57,040 >> ولكن ما هذا يقولون لنا هو لقد طلبت من جميع البنود. 234 00:12:57,040 --> 00:13:03,120 لذلك هناك 13289475 البنود. 235 00:13:03,120 --> 00:13:06,150 وأنا أبحث في أول 10، ابتداء من الساعة موقف الصفر 236 00:13:06,150 --> 00:13:09,760 لأنه في علم الحاسوب نبدأ دائما من الصفر. 237 00:13:09,760 --> 00:13:15,150 وما لدي هنا، إذا أنا فقط تنهار هذا، سترى لقد حصلت على 10 مادة. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> وإذا كنت نلقي نظرة على عنصر، يمكنني نرى أن أنا عندي معلومات حول هذا الموضوع. 240 00:13:25,210 --> 00:13:27,400 وهذا هو ما يسمى في شكل MODS. 241 00:13:27,400 --> 00:13:30,860 وهكذا انا ذاهب للتبديل إلى هنا للحظة. 242 00:13:30,860 --> 00:13:33,750 موافق. 243 00:13:33,750 --> 00:13:37,447 >> لذلك دعونا البحث عن شيء ما في تحديدا لأن العنصر الأول الذي 244 00:13:37,447 --> 00:13:40,030 يحدث أن تأتي عندما تنظر من خلال جمع كامل 245 00:13:40,030 --> 00:13:41,750 هو، بحكم التعريف، عشوائي. 246 00:13:41,750 --> 00:13:44,550 لذلك دعونا ننظر لبعض الكعك. 247 00:13:44,550 --> 00:13:46,830 أوه. 248 00:13:46,830 --> 00:13:49,190 >> موافق. 249 00:13:49,190 --> 00:13:49,940 حتى الكعك. 250 00:13:49,940 --> 00:13:55,360 لذلك وجدنا أن هناك 80 عناصر في المجموعة التي ترجع الكعك. 251 00:13:55,360 --> 00:13:57,150 نحن نبحث في أول 10 منهم. 252 00:13:57,150 --> 00:14:01,890 الآن، يمكنك ان ترى هنا الطريقة التي قلت أنا أبحث عن الكعك، 253 00:14:01,890 --> 00:14:04,400 أنا فقط واضاف شيئا ل سلسلة الاستعلام من URL. 254 00:14:04,400 --> 00:14:09,680 لذلك ف يساوي الكعك، والتي يمكن نرى قليلا بسهولة أكثر هنا. 255 00:14:09,680 --> 00:14:12,131 >> وهذا يعني أساسا هناك والمواصفات لAPI، التي 256 00:14:12,131 --> 00:14:13,880 يعرف كل ما من هذه المعايير يعني. 257 00:14:13,880 --> 00:14:17,150 وهذا يعني أننا في طريقنا لل بحث كل شيء عن الكعك. 258 00:14:17,150 --> 00:14:24,910 >> وبالتالي فإن البند الأول هنا لدينا يمكنك ان ترى العنوان دونات، 259 00:14:24,910 --> 00:14:29,310 وهناك عنوان فرعي يسمى أحد العاطفة الأمريكي، الذي هو، أعتقد، 260 00:14:29,310 --> 00:14:31,610 مناسب. 261 00:14:31,610 --> 00:14:36,134 هناك الكثير من different-- 262 00:14:36,134 --> 00:14:38,050 وبمجرد الحصول على نقطة من الحصول على البيانات، 263 00:14:38,050 --> 00:14:41,020 هناك الكثير من مختلف الأشكال التي يمكنك الحصول عليه في. 264 00:14:41,020 --> 00:14:44,050 وهناك نقاط قوة مختلفة والضعف لكل منهم. 265 00:14:44,050 --> 00:14:49,000 لذلك هذا واحد، يمكنك ان ترى هنا، وهذا النموذج هو غني جدا. 266 00:14:49,000 --> 00:14:51,946 وانها موحدة ذلك. 267 00:14:51,946 --> 00:14:55,040 >> ولذلك لا يوجد عنوان محدد الحقل، حقل الترجمة. 268 00:14:55,040 --> 00:14:58,950 هناك بديل العنوان، العاطفة الأمريكي. 269 00:14:58,950 --> 00:15:01,650 هناك اسم المرتبطة به. 270 00:15:01,650 --> 00:15:03,120 نوع من الموارد هو النص. 271 00:15:03,120 --> 00:15:06,070 هناك الكثير من المعلومات هنا في هذا الشكل. 272 00:15:06,070 --> 00:15:09,480 >> ولكن هناك حفنة أشكال مختلفة. 273 00:15:09,480 --> 00:15:11,920 وذلك ما كنا فقط أبحث في هو تنسيق 274 00:15:11,920 --> 00:15:17,700 ودعا وزارة الدفاع، والتي تقف على الفوقية كائن وصف الخدمة، 275 00:15:17,700 --> 00:15:18,250 يحتمل. 276 00:15:18,250 --> 00:15:23,030 أنا في الواقع لست متأكدا تماما عن S. لكن من شكل معقد إلى حد ما. 277 00:15:23,030 --> 00:15:24,240 انها التنسيق الافتراضي. 278 00:15:24,240 --> 00:15:30,260 >> ولكن هذا لاحد ان يبقى ثراء جميع البيانات 279 00:15:30,260 --> 00:15:33,820 أن المكتبة لديها ل انها قريبة جدا من ما 280 00:15:33,820 --> 00:15:35,110 يستخدم مكتبة داخليا. 281 00:15:35,110 --> 00:15:39,030 انها المعيار الذي هو تستخدم في جميع أنحاء البلاد، 282 00:15:39,030 --> 00:15:40,944 في جميع أنحاء العالم في المكتبات الأكاديمية. 283 00:15:40,944 --> 00:15:42,110 وانها قابلة للتشغيل المتبادل جدا. 284 00:15:42,110 --> 00:15:44,852 حتى إذا كنت قد حصلت على وثيقة هذا هو في شكل MODS، 285 00:15:44,852 --> 00:15:47,560 يمكنك أن تعطي لشخص آخر الأنظمة التي تفهم MODS، 286 00:15:47,560 --> 00:15:48,518 ويمكن استيراده. 287 00:15:48,518 --> 00:15:50,840 لذلك هو المعيار. 288 00:15:50,840 --> 00:15:54,250 هو يعرف ذلك جيدا جدا ومحددة جدا. 289 00:15:54,250 --> 00:15:58,980 وهذا ما يجعل من قابلة للتشغيل المتبادل لأنه إذا كان شخص ما يقول، 290 00:15:58,980 --> 00:16:04,930 هذا هو عنوان بديل ل سجل، والجميع يعرف ماذا يعني ذلك. 291 00:16:04,930 --> 00:16:07,740 على الجانب الآخر، انها معقدة جدا. 292 00:16:07,740 --> 00:16:13,160 >> لذلك إذا كنت تأخذ نظرة في هذا السجل هنا، 293 00:16:13,160 --> 00:16:15,320 إذا أريد فقط للحصول على عنوان هذه الوثيقة، 294 00:16:15,320 --> 00:16:21,150 من هذا الكتاب، الذي هو على الارجح الكعك، والعاطفة الأمريكي، تحليل بها 295 00:16:21,150 --> 00:16:22,940 وتشارك قليلا. 296 00:16:22,940 --> 00:16:27,380 بينما هناك أخرى شكل يسمى دبلن كور، 297 00:16:27,380 --> 00:16:29,730 وهو الكثير، شكل أبسط من ذلك بكثير. 298 00:16:29,730 --> 00:16:33,764 >> وهكذا ترون هنا، وليس هناك العنوان، العنوان الفرعي، وعنوان بديل. 299 00:16:33,764 --> 00:16:35,930 هناك فقط العنوان، الكعك، العاطفة الأمريكي، 300 00:16:35,930 --> 00:16:38,780 ولقب آخر، والعاطفة الأمريكي. 301 00:16:38,780 --> 00:16:42,907 لذلك عندما كنت تبحث في ما شكل كنت ترغب في الحصول على البيانات من، 302 00:16:42,907 --> 00:16:44,740 الكثير يعتمد على كيفية وأنت تسير لاستخدامها. 303 00:16:44,740 --> 00:16:46,573 هل تستخدم ل قابلية التشغيل البيني أو هل 304 00:16:46,573 --> 00:16:49,970 تريد شيئا بسيط هو أن قد يكون من الأسهل للعمل مع؟ 305 00:16:49,970 --> 00:16:56,002 >> على الجانب الآخر، والكثير من تفاصيل الحصول على نوع من مسحوق أسفل. 306 00:16:56,002 --> 00:16:58,460 قد تفقد الفروق الدقيقة في ما وسيلة مجال معين 307 00:16:58,460 --> 00:17:02,960 إذا كنت تتعامل مع دبلن كور، وهو ما لا يحصل مع MODS. 308 00:17:02,960 --> 00:17:06,462 حتى تلك هي اثنين من الأشكال يمكنك الخروج من API. 309 00:17:06,462 --> 00:17:08,920 وأساسا، اننا نبقي وراء الكواليس في MODS. 310 00:17:08,920 --> 00:17:14,179 ولكن يمكن أن نقدم لك في MODS و دبلن كور وأي شيء آخر كذلك. 311 00:17:14,179 --> 00:17:16,470 نظر الآخرين عندما كنت تبحث في البيانات 312 00:17:16,470 --> 00:17:21,210 هو يمكنك الحصول عليه إما JSON، التي لتقف على جافا سكريبت تدوين كائن، 313 00:17:21,210 --> 00:17:24,720 أو XML، التي تقف على لغة التوصيف الموسعة. 314 00:17:24,720 --> 00:17:30,080 وهذه تمثيلات البيانات على حد سواء لدينا بالضبط نفس البيانات، بالضبط 315 00:17:30,080 --> 00:17:31,080 نفس المجالات. 316 00:17:31,080 --> 00:17:33,644 ولكنهم فقط تختلف نحويا. 317 00:17:33,644 --> 00:17:40,401 >> لذلك هذا هو a-- 318 00:17:40,401 --> 00:17:41,400 حسنا، دعونا التبديل فقط. 319 00:17:41,400 --> 00:17:47,490 لذلك هذا هو الاستعلام دينا ل الكعك في شكل XML. 320 00:17:47,490 --> 00:17:53,470 إذا أنا فقط تبديل هذا JSON، أستطيع أن أرى أنها تبدو مختلفة. 321 00:17:53,470 --> 00:17:58,580 وحتى الآن هذا هو نفس المضمون، ولكن بنية مختلفة. 322 00:17:58,580 --> 00:18:00,080 هناك عدد أقل من أقواس زاوية. 323 00:18:00,080 --> 00:18:02,530 هناك أقل مطول. 324 00:18:02,530 --> 00:18:06,440 >> وهذا هو الشكل الذي، إذا كنت نعمل في بيئة الويب، 325 00:18:06,440 --> 00:18:09,680 كنت على الأرجح سوف تريد أن تستخدم لواحد 326 00:18:09,680 --> 00:18:12,630 من أشياء لطيفة عن JSON هو انها متوافقة مع جافا سكريبت. 327 00:18:12,630 --> 00:18:17,680 حتى إذا أنا أكتب التطبيق على شبكة الإنترنت، ويمكنني أن سحب في JSON والعمل فقط معها مباشرة. 328 00:18:17,680 --> 00:18:20,187 بينما مع XML، انها قليلا أكثر تعقيدا. 329 00:18:20,187 --> 00:18:21,520 ذلك مرة أخرى، وهذه هي كلا مفيدة. 330 00:18:21,520 --> 00:18:26,387 أنها مجرد حالات الاستخدام المختلفة حيث قد الناس يريدون استخدامها. 331 00:18:26,387 --> 00:18:26,886 موافق. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 ويعود ذلك إلى API. 334 00:18:31,680 --> 00:18:32,900 حتى نتمكن من بحث for-- 335 00:18:32,900 --> 00:18:36,220 >> أعطي مثالا لل البحث عن الكعك. 336 00:18:36,220 --> 00:18:39,330 يمكننا أيضا البحث فقط في مجال معين داخل هنا. 337 00:18:39,330 --> 00:18:41,310 وذلك بدلا من البحث السجل بأكمله، 338 00:18:41,310 --> 00:18:43,870 يمكنني فقط البحث في حقل العنوان. 339 00:18:43,870 --> 00:18:48,810 وحتى الآن هناك 25 الأشياء التي لدينا الكعك في العنوان، واحدة منها 340 00:18:48,810 --> 00:18:52,430 هو حول استعادة الأراضي الرطبة في الإدارة 341 00:18:52,430 --> 00:18:54,990 من ثقب في دونات البرنامج، الذي هو على الارجح 342 00:18:54,990 --> 00:18:58,970 ليس بالضرورة ما نحن نبحث لأننا عندما تبحث عن الكعك. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> يمكنك أيضا، عندما كنت التعامل مع API-- 345 00:19:05,490 --> 00:19:08,827 >> جزء من وجود API يعطي الناس من الوصول إلى مجموعات البيانات الكبيرة. 346 00:19:08,827 --> 00:19:11,410 وهناك زوجين مختلفة الأدوات التي يمكن استخدامها للقيام بذلك. 347 00:19:11,410 --> 00:19:14,170 واحد هو، ببساطة شديدة، كنت يمكن من خلال صفحة البيانات. 348 00:19:14,170 --> 00:19:17,340 لذلك تماما كما لو كنت تفعل الاستعلام من خلال واجهة على شبكة الإنترنت، 349 00:19:17,340 --> 00:19:19,470 يمكنك أن تبحث في صفحة واحدة، الصفحة اثنين، الصفحة الثالثة. 350 00:19:19,470 --> 00:19:22,040 يمكنك أن تفعل الشيء نفسه شيء من خلال API. 351 00:19:22,040 --> 00:19:24,150 كل ما تحتاجه لتكون صريحة في كيف نفعل ذلك. 352 00:19:24,150 --> 00:19:29,511 >> هكذا على سبيل المثال، إذا أنا أبحث في أول الاستعلام وجودي هنا، 353 00:19:29,511 --> 00:19:32,510 حيث أقوم به في البحث عن الأشياء مع الكعك في العنوان، ويمكنني أن أقول، 354 00:19:32,510 --> 00:19:35,415 والحد يساوي 20، وهو ما يعني تعطيني السجلات 20 الأولى، وليس 355 00:19:35,415 --> 00:19:38,540 أول 10، الذي هو الافتراضي، لأنني أريد أن ننظر إلى 20 في كل مرة. 356 00:19:38,540 --> 00:19:43,435 أو أستطيع أن أقول، تعيين بدء يساوي 20 وحد 357 00:19:43,435 --> 00:19:47,150 يساوي 20، والتي سوف تعطي لي يسجل 21 خلال 40. 358 00:19:47,150 --> 00:19:52,680 >> لذا أعتقد أن الشيء أن يسلب هنا 359 00:19:52,680 --> 00:19:57,290 الذي نستخدمه سلاسل الاستعلام لتعيين المعلمات في الاستعلام. 360 00:19:57,290 --> 00:20:02,760 ويتيح لك التحكم ما تحصل عليه العودة. 361 00:20:02,760 --> 00:20:05,980 >> أداة أخرى التي يمكنك استخدامها، - 362 00:20:05,980 --> 00:20:09,250 >> وهذا مفيد حقا في حيث استكشاف البيانات. 363 00:20:09,250 --> 00:20:10,840 >> --is ما يسمى النحت. 364 00:20:10,840 --> 00:20:15,530 لذلك النحت المصطلح ليست شائعة بالضرورة. 365 00:20:15,530 --> 00:20:16,880 ولكن كنت قد رأيت كل ذلك من قبل. 366 00:20:16,880 --> 00:20:18,630 إذا كنت تأخذ نظرة على الأمازون، على سبيل المثال، 367 00:20:18,630 --> 00:20:20,870 ويمكنك القيام بالبحث عن الكعك في الكتب، 368 00:20:20,870 --> 00:20:27,080 هنا أنها قد حصلت على سلسلة من الكتب، وانهم مجمعة حسب الفئة، 369 00:20:27,080 --> 00:20:30,470 وتحصل على فئات مختلفة، وعدد الكتب في كل فئة 370 00:20:30,470 --> 00:20:31,330 تظهر. 371 00:20:31,330 --> 00:20:33,420 >> لذلك هذا هو في الأساس أحد الجوانب. 372 00:20:33,420 --> 00:20:37,570 كنت تأخذ كل كتبهم، و1،800 الكتب التي تتناسب مع الكعك في الأمازون. 373 00:20:37,570 --> 00:20:39,820 12 منهم في فئة الفطور. 374 00:20:39,820 --> 00:20:43,100 21 في المعجنات والخبز، وهلم جرا وهكذا دواليك. 375 00:20:43,100 --> 00:20:47,670 >> لذلك هذا هو حقا مفيد أداة لاستكشاف المحتوى 376 00:20:47,670 --> 00:20:53,260 داخل المكتبة وكذلك لأنه عندما ننظر إلى وجه من وجوه، 377 00:20:53,260 --> 00:20:56,520 أنها تعطيك فكرة عن ما هي المواضيع موجودا، مثل ما هي أنواع من المواضيع 378 00:20:56,520 --> 00:20:58,510 هي الأكثر شعبية ضمن مجموعة الاستعلام الخاص بك. 379 00:20:58,510 --> 00:21:00,950 وأنه يساعدك على ابعاد واستكشاف. 380 00:21:00,950 --> 00:21:02,770 حتى نتمكن من القيام بنفس الشيء. 381 00:21:02,770 --> 00:21:05,940 >> إذا كنا نريد أن استخدام API والنظر في أوجه، 382 00:21:05,940 --> 00:21:08,950 نضيف مقياس آخر ل صديقنا سلسلة الاستعلام. 383 00:21:08,950 --> 00:21:12,540 لذلك أوجه يعادل مفصولة بفواصل قائمة ما نريد أن سطيح جرا. 384 00:21:12,540 --> 00:21:14,790 حتى واحد من جوانب قد تكون عرضة. 385 00:21:14,790 --> 00:21:16,565 قد تكون لغة أخرى. 386 00:21:16,565 --> 00:21:19,665 وحتى إذا كان لنا أن تشغيل هذا الاستعلام، ونحن get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 يبدو الى حد كبير نفس هنا. 389 00:21:24,830 --> 00:21:29,010 ولكن لدينا إضافتها إلى نهاية القائمة مجموعة من الأوجه. 390 00:21:29,010 --> 00:21:34,060 لذلك لدينا وجه من وجوه دعا الموضوع. 391 00:21:34,060 --> 00:21:40,250 لذلك هذا هو قول لنا أنه إذا أتطلع في بلدي 80 النتائج من الاستعلام دونات، 392 00:21:40,250 --> 00:21:42,100 13 منهم لديهم إخضاع الولايات المتحدة الأمريكية. 393 00:21:42,100 --> 00:21:43,684 ثلاث ديك الكعك الموضوع. 394 00:21:43,684 --> 00:21:45,600 ثلاثة لديهم هذا الموضوع من استعادة الأراضي الرطبة، 395 00:21:45,600 --> 00:21:47,720 والتي قد تكون حفرة لدينا في دونات. 396 00:21:47,720 --> 00:21:51,780 اثنين منهم، عائلة سمبسون، وهلم جرا وهكذا دواليك. 397 00:21:51,780 --> 00:21:59,211 >> لذلك هذا يمكن أن تكون مفيدة إذا كنت تريد تضييق بحثك. 398 00:21:59,211 --> 00:22:00,210 يمكن أن تساعدك على القيام بذلك. 399 00:22:00,210 --> 00:22:03,580 وخاصة إذا كان لديك أكثر من، ويقول، 80 النتائج. 400 00:22:03,580 --> 00:22:05,980 >> وبالمثل، طلبنا أيضا للجوانب على اللغة. 401 00:22:05,980 --> 00:22:14,790 حتى إذا نظرنا إلى نتائجنا، ونحن نرى 76 منهم في اللغة الإنجليزية، وأربعة في الفرنسية، 402 00:22:14,790 --> 00:22:19,620 اثنين باللغة الإسبانية، اثنان، أعتقد أن هذا غير معروف أو غير معروف والهولندية واللاتينية. 403 00:22:19,620 --> 00:22:22,830 لذلك أعتقد أن اللاتينية دونات نتيجة لذلك، مرة أخرى، 404 00:22:22,830 --> 00:22:24,922 له علاقة مع السلع المخبوزة شيئا. 405 00:22:24,922 --> 00:22:25,630 ولكن هناك تذهب. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> لذلك هذا هو نوع من يظهر لك كيف يمكنك سحب المحتوى إلى الوراء 408 00:22:38,630 --> 00:22:41,270 من API فقط من خلال متصفح الإنترنت، وهو أمر عظيم. 409 00:22:41,270 --> 00:22:44,320 ولكنها ليست حقا ما تفعل يكون عادة باستخدام API في لذلك. 410 00:22:44,320 --> 00:22:48,710 ذلك مثال واحد كيف يمكن القيام به في الواقع هذا هو عندي 411 00:22:48,710 --> 00:22:54,720 كتابة برنامج صغير عظمى، التي، مرة أخرى، هل بحثي دونات 412 00:22:54,720 --> 00:22:59,010 ويختار المجالات زوجين ويعرضها في جدول. 413 00:22:59,010 --> 00:23:01,610 لذلك هذا هو إلى حد كبير نفس المضمون أننا فقط 414 00:23:01,610 --> 00:23:04,830 رأى مع عدد قليل من المجالات انسحبت. 415 00:23:04,830 --> 00:23:12,090 قائمة من العناوين، وذلك موقع ما الكتاب 416 00:23:12,090 --> 00:23:15,120 هو حول، اللغة، وهلم جرا وهكذا دواليك. 417 00:23:15,120 --> 00:23:20,480 >> فكيف حدث هذا فعلا، منذ أعتقد أننا يجب أن ننظر إلى بعض التعليمات البرمجية، 418 00:23:20,480 --> 00:23:22,420 is-- 419 00:23:22,420 --> 00:23:28,060 >> ما لدينا هنا هو HTML بسيطة صفحة، والذي يعرض النص، 420 00:23:28,060 --> 00:23:32,900 مرحبا بكم سحابة مكتبة و ثم يعرض جدول النتائج. 421 00:23:32,900 --> 00:23:37,790 وهناك بالطبع أية نتائج في الطاولة عندما يحصل على تحميل الصفحة. 422 00:23:37,790 --> 00:23:41,380 ولكن ما نقوم به هو، أولا وقبل كل شيء، نحن 423 00:23:41,380 --> 00:23:46,290 تقوم بتحميل مكتبة يسمى مسج، الذي هو في الأساس 424 00:23:46,290 --> 00:23:52,030 مكتبة جافا سكريبت، الأمر الذي يجعل من من السهل جدا التلاعب جافا سكريبت 425 00:23:52,030 --> 00:23:58,780 أصلا، HTML، وإنشاء صفحات الويب، المنطق من جانب العميل وصفحات الويب. 426 00:23:58,780 --> 00:24:01,595 >> وذلك ما لدينا هنا هو مسج لديه طريقة تسمى الحصول عليها، 427 00:24:01,595 --> 00:24:05,270 الذي أساسا سوف تذهب إلى وURL، والتي، في هذه الحالة، 428 00:24:05,270 --> 00:24:09,070 هو هذا URL مألوفا. 429 00:24:09,070 --> 00:24:14,440 ومن ثم سوف تحصل على المحتوى من أن URL ثم قم بتشغيل وظيفة على ذلك. 430 00:24:14,440 --> 00:24:19,240 فقال نذهب إلى api.lib.harvard / ايدو. 431 00:24:19,240 --> 00:24:20,060 البحث عن الكعك. 432 00:24:20,060 --> 00:24:21,300 تعطينا 20 السجلات. 433 00:24:21,300 --> 00:24:28,590 ثم قم بتشغيل هذه الوظيفة، التي لقد المختارة، فمررها البيانات. 434 00:24:28,590 --> 00:24:34,430 والبيانات هي التي JSON حصلت عاد من API. 435 00:24:34,430 --> 00:24:40,120 >> ثم نقوله، خلال تلك البيانات هناك حقل يسمى البند. 436 00:24:40,120 --> 00:24:48,117 وإذا ذهبت نلقي نظرة إلى الوراء في واحدة من هذه النتائج أن هنا، 437 00:24:48,117 --> 00:24:49,200 هناك شيء called-- 438 00:24:49,200 --> 00:24:50,220 >> حسنا، انه دعا البند. 439 00:24:50,220 --> 00:24:53,520 بحيث قد يكون ذلك. 440 00:24:53,520 --> 00:25:01,840 وما تفعله هو عليه يمر كل بند 441 00:25:01,840 --> 00:25:05,300 ثم يدعو أخرى وظيفة على كل بند. 442 00:25:05,300 --> 00:25:08,440 وهذه الوظيفة أساسا يأخذ القيمة 443 00:25:08,440 --> 00:25:12,010 في هذا البند، الذي هو أساسا سجل فردي 444 00:25:12,010 --> 00:25:18,220 ويسمح لنا لسحب اللقب، التغطية واللغة. 445 00:25:18,220 --> 00:25:21,640 >> لذلك نحن استدعاء دالة على كل العنصر الذي عدنا من API. 446 00:25:21,640 --> 00:25:25,397 وإذا كنت تأخذ مجرد نظرة في هذه القطعة هنا، 447 00:25:25,397 --> 00:25:27,230 ما نقوم به هو نحن بصدد إنشاء سلسلة، 448 00:25:27,230 --> 00:25:31,810 التي هي في جوهرها بعض العلامات HTML حول طاولة، مع value.title، 449 00:25:31,810 --> 00:25:35,790 وهو عنوان الكائن، value.coverage، 450 00:25:35,790 --> 00:25:36,790 والذي هو التغطية، و- 451 00:25:36,790 --> 00:25:38,225 >> ونحن نفعل شيك هنا لمعرفة من هو غير معروف 452 00:25:38,225 --> 00:25:40,570 وإخفائه إذا تقول غير معروف، لأننا لسنا مهتمين حقا 453 00:25:40,570 --> 00:25:41,600 في ذلك. 454 00:25:41,600 --> 00:25:42,939 >> --and ثم اللغة. 455 00:25:42,939 --> 00:25:44,730 ثم ما نحن به هو إلحاق أن 456 00:25:44,730 --> 00:25:48,510 إلى الجدول الذي هو التي حددتها هذه السلسلة هنا. 457 00:25:48,510 --> 00:25:50,790 وكيف يعمل مسج ما هذا يقول 458 00:25:50,790 --> 00:25:56,420 وابحث عن طاولة المفاوضات مع فكرة النتائج ويضيف هذا النص على ذلك. 459 00:25:56,420 --> 00:25:59,380 وهذا هو الجدول مع النتائج الفكرة. 460 00:25:59,380 --> 00:26:04,998 وذلك ما كنت في نهاية المطاف مع غير هذه الصفحة هنا. 461 00:26:04,998 --> 00:26:06,206 وسعيا لعرض source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 حسنا، ومصدر ليست في الواقع تحديث عندما حدث ذلك. 464 00:26:13,810 --> 00:26:18,740 حتى تستطيع أن ترى الفعلية نتائج الجدول على الرغم من هنا. 465 00:26:18,740 --> 00:26:24,770 >> لذلك هذا مجرد مثال بسيط ل القيام استعلام أساسية جدا ضد API 466 00:26:24,770 --> 00:26:29,020 وعرض المعلومات في بعض الدول الاخرى تشكيل، وعدم القيام بأي شيء يتوهم جدا. 467 00:26:29,020 --> 00:26:36,370 الآن، مثال آخر هو بمثابة طلب خطي من قبل ديفيد اينبرغر 468 00:26:36,370 --> 00:26:39,120 كما عرض تجريبي من هذا، والذي يظهر أساسا لك 469 00:26:39,120 --> 00:26:44,620 كيف يمكنك الهريس حتى على النتائج التي كنت الحصول من API مكتبة سحابة 470 00:26:44,620 --> 00:26:46,250 مع، ويقول، كتب Google. 471 00:26:46,250 --> 00:26:52,225 >> والتفكير هنا هو أن أستطيع تشغيل استعلام مقابل كتب Google، 472 00:26:52,225 --> 00:26:56,060 التسجيل للبحث عن النص الكامل، والحصول على بعض النتائج مرة أخرى، ومعرفة أي من تلك البنود 473 00:26:56,060 --> 00:27:01,180 موجودة بالفعل في هوليس، نظام المكتبة، 474 00:27:01,180 --> 00:27:03,200 ثم تعطيني الروابط العودة إلى تلك العناصر. 475 00:27:03,200 --> 00:27:12,730 حتى لو كنت تبحث عن، وكان ليلة مظلمة وعاصفة، وأنا 476 00:27:12,730 --> 00:27:16,210 نعود مجموعة من النتائج من جوجل، وبعد ذلك واحدة نتيجة 477 00:27:16,210 --> 00:27:19,460 وهو التجاعيد في الوقت. 478 00:27:19,460 --> 00:27:29,330 وهذه هي الروابط للكتب الموجودة في إطار منظومة مكتبة جامعة هارفارد. 479 00:27:29,330 --> 00:27:32,160 >> لذا أعتقد النقطة هنا ليست لدرجة أن هذا قد يكون أو لا 480 00:27:32,160 --> 00:27:34,118 يكون بالطريقة التي تريدها للبحث في مكتبة، 481 00:27:34,118 --> 00:27:38,310 وإنما هو مختلف تماما الطريقة التي لم تكن متاحة لك 482 00:27:38,310 --> 00:27:42,884 من قبل، مثل كان لديك أي وسيلة للقيام النص الكامل بالبحث عن الكتب التي حتى 483 00:27:42,884 --> 00:27:44,550 كانوا جزءا من نظام مكتبة جامعة هارفارد. 484 00:27:44,550 --> 00:27:46,870 وحتى الآن هذا هو وسيلة أنك تستطيع أن تفعل ذلك. 485 00:27:46,870 --> 00:27:51,930 ويمكنك عرضها في أيا كان الشكل الذي تريد. 486 00:27:51,930 --> 00:27:55,990 وبالتالي فإن النقطة هنا هي، في الأساس، نحن وفتح طرق جديدة للناس 487 00:27:55,990 --> 00:27:59,080 للعمل مع البيانات. 488 00:27:59,080 --> 00:28:07,925 >> آخر قطعة من سحابة المكتبة هو أن أنه يساعد على فضح بعض بيانات الاستخدام 489 00:28:07,925 --> 00:28:08,800 أن المكتبة لديها. 490 00:28:08,800 --> 00:28:12,630 حتى إذا ذهبت إلى المكتبة، وكنت تبحث عن الكتب، 491 00:28:12,630 --> 00:28:15,770 كنت لا بالضرورة فعلا فكرة، 492 00:28:15,770 --> 00:28:19,080 لجميع العناصر في موضوع معين، ما 493 00:28:19,080 --> 00:28:21,200 الناس في المجتمع، سواء كان ذلك 494 00:28:21,200 --> 00:28:24,890 يعرف بأنه هارفارد أو البلد أو فصلك، 495 00:28:24,890 --> 00:28:26,421 ما يتعين عليهم جدت أكثر فائدة؟ 496 00:28:26,421 --> 00:28:28,920 والمكتبة لديها في الواقع طن من المعلومات حول ما 497 00:28:28,920 --> 00:28:32,999 هو أكثر فائدة لأنه إذا كان الكثير من الناس التحقق من كتاب، 498 00:28:32,999 --> 00:28:34,040 أن يقول لك شيئا. 499 00:28:34,040 --> 00:28:36,498 يجب أن يكون هناك سبب انهم يريدون التحقق من ذلك. 500 00:28:36,498 --> 00:28:38,270 وهناك الكثير من الناس وضعها على الاحتياط. 501 00:28:38,270 --> 00:28:42,520 >> إذا كان على القائمة الاحتياطية لكثير من الطبقات، أن يقول لك شيئا. 502 00:28:42,520 --> 00:28:45,960 إذا تم التحقق من ذلك أعضاء هيئة التدريس بها الكثير والطلاب الجامعيين ليست، 503 00:28:45,960 --> 00:28:47,200 أن يقول لي شيئا. 504 00:28:47,200 --> 00:28:49,280 بالعكس، التي أيضا يقول لك شيئا. 505 00:28:49,280 --> 00:28:54,680 لذلك سيكون من المثير للاهتمام حقا ل وضع تلك المعلومات الى هناك والسماح 506 00:28:54,680 --> 00:28:59,969 الناس استخدامها لمساعدتهم في العثور يعمل ضمن نظام المكتبة. 507 00:28:59,969 --> 00:29:02,260 الجانب الآخر من هذا هو هناك بعض الخصوصية خطيرة 508 00:29:02,260 --> 00:29:07,854 المخاوف لأن واحدا من المبادئ الأساسية للمكتبة 509 00:29:07,854 --> 00:29:10,770 ونحن لن يكون قول الناس ما الناس الآخرين هي القراءة. 510 00:29:10,770 --> 00:29:17,360 وحتى إذا أنت تقول هذا تم فحص كتاب من أربع مرات 511 00:29:17,360 --> 00:29:20,070 في شهر معين، التي يمكن استخدامها 512 00:29:20,070 --> 00:29:25,252 لربط عودة إلى خاص شخص من البيانات دي إخفاء الهوية 513 00:29:25,252 --> 00:29:26,710 ومعرفة من الذي تأكدت منه. 514 00:29:26,710 --> 00:29:30,792 وبالتالي فإن الطريقة التي يمكننا avoid-- 515 00:29:30,792 --> 00:29:33,750 الطريقة التي يمكننا محاولة استخراج بعض الإشارات من جميع المعلومات 516 00:29:33,750 --> 00:29:36,740 دون التعدي المخاوف المتعلقة بالخصوصية أي شخص 517 00:29:36,740 --> 00:29:42,150 هو في الأساس ننظر 10 عاما من بيانات الاستخدام، - 518 00:29:42,150 --> 00:29:43,930 >> لذلك فمن على مدى فترة طويلة من الزمن. 519 00:29:43,930 --> 00:29:50,639 >> --and القول، OK، دعونا نرى كيف مرات كثيرة كان يستخدم هذا العمل، 520 00:29:50,639 --> 00:29:52,930 والذي خلال هذه الفترة من الزمن، وبعد ذلك في الأساس 521 00:29:52,930 --> 00:29:56,300 الجميل عددا، والتي نسميها على درجة المكدس، التي أساسا 522 00:29:56,300 --> 00:29:59,910 يمثل المبلغ انها استخدمت. 523 00:29:59,910 --> 00:30:01,084 وأن number-- 524 00:30:01,084 --> 00:30:03,250 وهناك الكثير من حسابات مختلفة الخوض في هذا العدد. 525 00:30:03,250 --> 00:30:05,150 --but انها صعبة للغاية متري والتي تمنحك 526 00:30:05,150 --> 00:30:11,300 فكرة عن كيفية قد مجتمع قيمة هذا العمل. 527 00:30:11,300 --> 00:30:16,772 >> وهكذا نوع آخر من حتى أكثر بلورتها تطبيق 528 00:30:16,772 --> 00:30:18,480 أن يستفيد هذا هو شيء 529 00:30:18,480 --> 00:30:24,000 دعا Stacklife، الذي هو في الواقع المتاحة من خلال هارفارد الرئيسية 530 00:30:24,000 --> 00:30:24,880 البوابة المكتبات. 531 00:30:24,880 --> 00:30:26,700 حتى تذهب إلى library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 سترى عدد من مختلفة طرق البحث في المكتبة. 533 00:30:29,360 --> 00:30:32,300 واحد منهم يسمى Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> وهذا هو أحد التطبيقات التي يتصفح محتوى المكتبة، 535 00:30:38,980 --> 00:30:43,490 ولكن بنيت تماما على رأس هذه واجهات برمجة التطبيقات. 536 00:30:43,490 --> 00:30:46,910 لذلك ليس هناك الاشياء خاص يجري وراء الكواليس. 537 00:30:46,910 --> 00:30:49,570 لا يوجد الوصول إلى البيانات التي لم يكن لديك. 538 00:30:49,570 --> 00:30:54,090 انها تستخدم واجهات برمجة التطبيقات لتوفير لكم مع التصفح مختلف تماما 539 00:30:54,090 --> 00:30:55,480 التجربة. 540 00:30:55,480 --> 00:30:58,570 >> حتى لو كنت ابحث عن أليس في بلاد العجائب في هذه الحالة، 541 00:30:58,570 --> 00:31:02,600 أحصل على النتيجة التي يبدو هذا، والذي هو much-- جدا 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> انها تشبه الى حد بعيد أي بحث آخر كنت قد تفعل، إلا في هذه الحالة 544 00:31:10,870 --> 00:31:15,730 نحن ترتيب العناصر عن طريق stackscore، والتي تعطيك 545 00:31:15,730 --> 00:31:19,850 فكرة عن مدى شعبية هذه وكانت العناصر داخل المجتمع. 546 00:31:19,850 --> 00:31:25,610 وذلك بشكل واضح، أليس في بلاد العجائب والت ديزني هو بشعبية كبيرة. 547 00:31:25,610 --> 00:31:36,570 ولكن يمكنك أيضا رؤية الأربعة الأوائل هنا تلك التي قد لا actually-- 548 00:31:36,570 --> 00:31:39,220 >> الأشياء التي تستخدم للغاية، ولكن لا يجوز لك فورا 549 00:31:39,220 --> 00:31:41,240 تواصل مع أليس في بلاد العجائب. 550 00:31:41,240 --> 00:31:44,650 لذلك صديقنا القديم و المشروح أليس هو هنا. 551 00:31:44,650 --> 00:31:46,350 حتى أستطيع أن نلقي نظرة على ذلك. 552 00:31:46,350 --> 00:31:52,010 والآن ما أنا أبحث في هو في الأساس وضع of-- 553 00:31:52,010 --> 00:31:53,760 أنا يمكن أن يكون والمشروح أليس هنا. 554 00:31:53,760 --> 00:31:56,700 لدي معلومات حول هذا الموضوع. 555 00:31:56,700 --> 00:32:00,230 وأود أيضا أن يكون stackscore من، في هذه الحالة، 26. 556 00:32:00,230 --> 00:32:03,169 وهذا يقول لي نوع من تقريبا كيف وصلنا إلى هذا stackscore، 557 00:32:03,169 --> 00:32:05,835 مثل الذين تأكدت منه، مثل كيف مرات كثيرة كان سحبه، 558 00:32:05,835 --> 00:32:08,440 مثل أعضاء هيئة التدريس أو الطلاب الجامعيون، كيف العديد من نسخ المكتبة لديها، 559 00:32:08,440 --> 00:32:11,300 وهلم جرا وهكذا دواليك. 560 00:32:11,300 --> 00:32:16,460 >> ويمكنك أيضا، للاهتمام بما فيه الكفاية هنا، وتصفح مداخن تقريبا. 561 00:32:16,460 --> 00:32:19,550 ولذلك فإن البيانات هنا، وهذا يظهر لك نوع 562 00:32:19,550 --> 00:32:23,547 من التمثيل الظاهري ما جبروت الرف 563 00:32:23,547 --> 00:32:25,880 تبدو وكأنها لو كنت لاتخاذ جميع مقتنيات المكتبة 564 00:32:25,880 --> 00:32:28,940 ووضعها معا على الرف لانهائي واحد. 565 00:32:28,940 --> 00:32:30,990 والشيء الجميل هو أننا can-- 566 00:32:30,990 --> 00:32:33,380 >> أولا وقبل كل شيء، البيانات الوصفية عن هذه الكتب 567 00:32:33,380 --> 00:32:35,627 كثيرا ما يخبرك عندما نشر. 568 00:32:35,627 --> 00:32:37,085 فإنه يقول لك كم عدد صفحات لديه. 569 00:32:37,085 --> 00:32:38,459 قد أقول لك الأبعاد. 570 00:32:38,459 --> 00:32:42,930 حتى تستطيع أن ترى هذا ما ينعكس هنا من حيث حجم الكتب. 571 00:32:42,930 --> 00:32:46,740 >> ومن ثم يمكننا استخدام كومة النتيجة لتسليط الضوء 572 00:32:46,740 --> 00:32:49,170 الكتب التي لديها أعلى الدرجات المكدس. 573 00:32:49,170 --> 00:32:54,930 حتى لو كان أكثر قتامة، فهذا يعني أن، ويفترض، ويتم استخدامها على نحو أكثر تواترا. 574 00:32:54,930 --> 00:32:57,040 حتى في هذه الحالة، وأنا الذهاب الى اعتقد ان هذا 575 00:32:57,040 --> 00:33:03,226 هو إصدار أليس في بلاد العجائب التي عادة جدا تستخدم والأكثر 576 00:33:03,226 --> 00:33:05,100 الوصول، المكتبة لديه معظم نسخ. 577 00:33:05,100 --> 00:33:06,975 حتى إذا كنت تبحث لأليس في بلاد العجائب، 578 00:33:06,975 --> 00:33:10,220 هذا قد يكون مكانا جيدا للبدء. 579 00:33:10,220 --> 00:33:13,500 >> ثم هنا يمكنك أيضا ربط خارج ل، ويقول، والأمازون لشراء الكتاب، 580 00:33:13,500 --> 00:33:15,182 وهلم جرا وهكذا دواليك. 581 00:33:15,182 --> 00:33:17,140 النقطة هنا، مرة أخرى، ليس كثيرا أن هذا 582 00:33:17,140 --> 00:33:25,030 هو أفضل وسيلة لتصفح المكتبة أو الأداة المناسبة لكل مناسبة. 583 00:33:25,030 --> 00:33:28,400 ولكنها طريقة أخرى للقيام بذلك. 584 00:33:28,400 --> 00:33:31,359 وبجعل البيانات متوفرة من خلال API، التي 585 00:33:31,359 --> 00:33:34,650 مصنوع من اللبنات بسيطة جدا، والذي يسمح لك للبحث في المحتوى، 586 00:33:34,650 --> 00:33:39,420 يمكنك بناء شيء مثل هذه التي يمكن أن 587 00:33:39,420 --> 00:33:41,520 يكون غير عادي قيمة لبعض الناس. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> ولهذا النوع من، بقدر ما أريد القول حقا عن ما هو API 590 00:33:51,860 --> 00:33:56,070 وما يعرض عليه، هناك ككل حفنة من الاشياء وراء الكواليس، والذي 591 00:33:56,070 --> 00:33:59,480 انا فقط أن أتطرق إلى فترة وجيزة فقط لأنه نوع من يأتي في هذا 592 00:33:59,480 --> 00:34:03,720 من زاوية مختلفة تماما في حيث كيف شيئا من هذا القبيل 593 00:34:03,720 --> 00:34:04,580 الحصول على وضع في مكانه؟ 594 00:34:04,580 --> 00:34:10,820 >> لذلك فإن API هو المعيار واجهة لكل هذا المحتوى. 595 00:34:10,820 --> 00:34:13,820 ولكن للحصول عليه هناك، أول شيء كان علينا أن نفعل 596 00:34:13,820 --> 00:34:17,260 تم سحب معا المعلومات من الكتب والصور 597 00:34:17,260 --> 00:34:21,580 والمساعدات إيجاد، وجمع وثيقة من أنظمة هارفارد المختلفة. 598 00:34:21,580 --> 00:34:23,929 أليف، VIA، وOASIS هم أسماء النظم. 599 00:34:23,929 --> 00:34:28,820 ويذهبون أساسا إلى خط أنابيب، خط أنابيب المعالجة. 600 00:34:28,820 --> 00:34:33,230 >> لذلك أولا، نحصل على التصدير الملفات من كل هذه النظم. 601 00:34:33,230 --> 00:34:35,130 نحن تقسيمها إلى عناصر فردية. 602 00:34:35,130 --> 00:34:39,360 لذلك لدينا ملف، وهو جيجابايت، الذي لديه مليون سجل في ذلك. 603 00:34:39,360 --> 00:34:42,290 لذلك نحن تقسيمه إلى عناصر فردية. 604 00:34:42,290 --> 00:34:45,374 ثم، لكل عنصر، ونحن تحويله إلى وزارة الدفاع، لأن بعض هذه 605 00:34:45,374 --> 00:34:47,040 هي MODS أصلا، وبعضهم ليسوا كذلك. 606 00:34:47,040 --> 00:34:49,204 حتى نحصل على كل منهم ل تكون في نفس الشكل. 607 00:34:49,204 --> 00:34:51,120 ثم هناك العديد خطوات التخصيب، حيث 608 00:34:51,120 --> 00:34:55,969 نضيف المزيد من المعلومات للبيانات وكان من المتاح في المكتبة. 609 00:34:55,969 --> 00:34:59,750 لذلك نحن بحاجة إلى إضافة، أولا وقبل كل لدينا ما عقد مكتبات ذلك. 610 00:34:59,750 --> 00:35:02,250 نذهب من خلال خطوة لل حساب stackscore. 611 00:35:02,250 --> 00:35:07,112 نذهب من خلال خطوة أخرى من إضافة المزيد من البيانات الوصفية من حيث 612 00:35:07,112 --> 00:35:10,730 ما الناس المجموعات قد أضاف this-- 613 00:35:10,730 --> 00:35:12,532 >> الناس يختلقون مجموعات من العناصر. 614 00:35:12,532 --> 00:35:13,990 ما مجموعات أنها لا تنتمي إليها؟ 615 00:35:13,990 --> 00:35:17,220 كيف الناس الموسومة هذا المحتوى في الماضي؟ 616 00:35:17,220 --> 00:35:20,750 ثم أنت تصفية، وكنت تقييد السجلات لأنه، كما ذكرت، 617 00:35:20,750 --> 00:35:24,120 هناك بعض السجلات التي، بسبب أسباب حقوق التأليف والنشر، ونحن لا يمكن عرض. 618 00:35:24,120 --> 00:35:26,700 وبعد ذلك تحميلها في ما يسمى 619 00:35:26,700 --> 00:35:31,680 المؤسسة العامة، وهي ليست الخطأ الإملائي، ولكن هو اسم قطعة من البرمجيات 620 00:35:31,680 --> 00:35:35,710 أن يفعل البحث والفهرسة، والتي يدفع كل البحث وراء API. 621 00:35:35,710 --> 00:35:40,110 وبعد ذلك تصبح متوفرة ل وAPI، ويمكن للناس استخدامه. 622 00:35:40,110 --> 00:35:44,640 >> لذلك هذا هو مثل حد ما عملية مباشرة. 623 00:35:44,640 --> 00:35:47,230 واحدة من اهتمام أشياء عن ذلك هو 624 00:35:47,230 --> 00:35:50,990 أننا نتعامل مع 13 مليون سجلات 625 00:35:50,990 --> 00:35:53,820 ونحن نذهب إلى أن التعامل أو أكثر. 626 00:35:53,820 --> 00:36:01,260 ونحن نريد أن تكون قادرة على التعامل مع هذه بطريقة سريعة نسبيا. 627 00:36:01,260 --> 00:36:03,630 يستغرق وقتا طويلا ل معالجة 13 مليون السجلات. 628 00:36:03,630 --> 00:36:09,529 >> فكيف هذا الخط هو انشاء هو أنك can-- 629 00:36:09,529 --> 00:36:12,070 اعتقد ان الاستفادة من خط أنابيب، والمشكلة أننا 630 00:36:12,070 --> 00:36:15,580 محاولة حل هنا، هو أن كل التحولات، جميع 631 00:36:15,580 --> 00:36:18,729 هذه الخطوات في هذا خط أنابيب قابلة للفصل. 632 00:36:18,729 --> 00:36:19,645 ليس هناك التبعية. 633 00:36:19,645 --> 00:36:22,146 إذا كنت تجهيز سجل من كتاب واحد، 634 00:36:22,146 --> 00:36:24,270 ليس هناك تبعية في ما بين كتاب آخر. 635 00:36:24,270 --> 00:36:27,760 >> وذلك ما يمكننا القيام به هو في الأساس، في كل خطوة في الطريق، 636 00:36:27,760 --> 00:36:30,470 نحن وضعه في قائمة انتظار في السحابة. 637 00:36:30,470 --> 00:36:32,250 حدث لي أن يكون على الأمازون خدمات ويب. 638 00:36:32,250 --> 00:36:35,140 لذلك هناك قائمة، أقول، 10،000 العناصر التي 639 00:36:35,140 --> 00:36:38,100 تحتاج إلى أن تكون تطبيع و تحويل إلى تنسيق MODS. 640 00:36:38,100 --> 00:36:41,620 ونحن دوران العديد من خوادم كما نريد، ربما 10 الملقمات. 641 00:36:41,620 --> 00:36:44,860 ولكل من هذه الخوادم فقط يجلس هناك، ويبدو في أن قائمة الانتظار، 642 00:36:44,860 --> 00:36:46,730 يرى أن هناك واحد التي تحتاج إلى تتم معالجتها، تسحب تشغيله قائمة الانتظار، 643 00:36:46,730 --> 00:36:48,740 العمليات عليها، والعصي على قائمة انتظار القادم. 644 00:36:48,740 --> 00:36:54,200 >> وماذا في ذلك أن يسمح لنا القيام به هو تطبيق، أساسا، 645 00:36:54,200 --> 00:36:58,110 كما الكثير من الأجهزة كما أننا نريد أن هذا المشكلة لفترة قصيرة جدا من الزمن 646 00:36:58,110 --> 00:37:02,970 لمعالجة البيانات في أسرع وقت ممكن، وهو أمر ذلك فحسب، 647 00:37:02,970 --> 00:37:08,220 الآن في عالم الحوسبة السحابية نستطيع توفير خوادم أساسا 648 00:37:08,220 --> 00:37:09,890 على الفور، هو أن فائدة. 649 00:37:09,890 --> 00:37:12,260 لذلك نحن لا يكون لديك الخادم العملاق الجلوس حول 650 00:37:12,260 --> 00:37:16,700 في كل وقت للقيام تجهيز قد يحدث ذلك مرة واحدة فقط في الأسبوع. 651 00:37:16,700 --> 00:37:21,440 >> لذلك هذا هو الغالب عليه. 652 00:37:21,440 --> 00:37:27,590 هناك الوثائق المتاحة لمكتبة سحابة API البند 653 00:37:27,590 --> 00:37:31,960 في هذا URL، والتي سوف تكون متاحة في وقت لاحق. 654 00:37:31,960 --> 00:37:36,730 ويرجى الذهاب نلقي نظرة على لمعرفة ما إذا كان هناك أي شيء، 655 00:37:36,730 --> 00:37:37,579 لديك أي أفكار. 656 00:37:37,579 --> 00:37:38,120 لعب معها. 657 00:37:38,120 --> 00:37:38,830 تحامق. 658 00:37:38,830 --> 00:37:42,800 ونأمل يمكنك أن تأتي بشيء عظيم. 659 00:37:42,800 --> 00:37:44,740 شكرا. 660 00:37:44,740 --> 00:37:45,899