1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 جفری LICHT: سلام وجود دارد. 3 00:00:12,370 --> 00:00:13,550 من جفری Licht هستم. 4 00:00:13,550 --> 00:00:17,890 و من اینجا هستم با شما صحبت کنم در مورد کتابخانه و ساختمان دانشگاه هاروارد فردا 5 00:00:17,890 --> 00:00:20,870 امروز کتابخانه، من حدس می زنم. 6 00:00:20,870 --> 00:00:23,040 بنابراین پس زمینه در اینجا، زمین برای این جلسه 7 00:00:23,040 --> 00:00:26,930 اساسا وجود دارد که بسیاری از داده های کتابشناختی 8 00:00:26,930 --> 00:00:28,400 موجود در کتابخانه های دانشگاه هاروارد. 9 00:00:28,400 --> 00:00:33,434 و فرصت وجود دارد، از طریق برخی از ابزار 10 00:00:33,434 --> 00:00:36,350 و یک پروژه که در حال توسعه، برای دسترسی به اطلاعات 11 00:00:36,350 --> 00:00:42,430 و آن را به مکان های که کتابخانه دانشگاه هاروارد انجام نمی حال حاضر، 12 00:00:42,430 --> 00:00:45,460 انجام مسائل جدید با آن، آزمایش و بازی در اطراف با آن است. 13 00:00:45,460 --> 00:00:52,413 >> بنابراین نقطه ورود به این API است به نام هاروارد کتابخانه ابر، که 14 00:00:52,413 --> 00:00:57,650 سرور ابرداده باز است، که من در مورد در حال حاضر صحبت کنید. 15 00:00:57,650 --> 00:01:02,595 بنابراین پس زمینه است این است که وجود دارد بسیاری از مسائل را در کتابخانه دانشگاه هاروارد. 16 00:01:02,595 --> 00:01:07,150 ما بیش از 13 میلیون کتابشناختی داشته سوابق، میلیون ها نفر از تصاویر، 17 00:01:07,150 --> 00:01:11,090 و هزاران یافتن ایدز، که اساسا اسناد توصیف می 18 00:01:11,090 --> 00:01:15,500 مجموعه، گفت: چه است در آنها، جعبه مقالات 19 00:01:15,500 --> 00:01:21,080 و غیره که بیش از نمایندگی یک میلیون اسناد فردی است. 20 00:01:21,080 --> 00:01:24,290 و نیز وجود دارد بسیاری از اطلاعاتی که کتابخانه 21 00:01:24,290 --> 00:01:28,180 در مورد چگونگی محتوای استفاده شده است که می تواند مورد توجه مردم است 22 00:01:28,180 --> 00:01:32,400 که در صورت تمایل به کار با آن است. 23 00:01:32,400 --> 00:01:36,150 >> بنابراین تمام اطلاعات کتابخانه ابرداده. 24 00:01:36,150 --> 00:01:39,500 بنابراین ابرداده اطلاعات در مورد داده است. 25 00:01:39,500 --> 00:01:42,070 بنابراین، هنگامی که ما در مورد صحبت اطلاعات که 26 00:01:42,070 --> 00:01:44,890 در دسترس از طریق کتابخانه ابر که در دسترس، 27 00:01:44,890 --> 00:01:47,760 آن را لزوما اسناد واقعی 28 00:01:47,760 --> 00:01:53,060 خود، نه لزوما کامل متن کتاب یا تصاویر کامل، 29 00:01:53,060 --> 00:01:54,890 هر چند که در واقع ممکن است مورد. 30 00:01:54,890 --> 00:01:57,550 اما این واقعا اطلاعات در مورد داده ها. 31 00:01:57,550 --> 00:02:00,909 >> بنابراین شما می توانید از فهرست نویسی فکر می کنم اطلاعات، شماره تماس، افراد، 32 00:02:00,909 --> 00:02:02,700 چگونه بسیاری از نسخه از کتاب وجود دارد، چه 33 00:02:02,700 --> 00:02:06,380 نسخه هستند، چه هستند فرمت، نویسندگان، و غیره. 34 00:02:06,380 --> 00:02:12,250 بنابراین در بسیاری از اطلاعات در مورد وجود دارد اطلاعات در مجموعه که، 35 00:02:12,250 --> 00:02:14,400 در خود، نوع ذاتا مفید است. 36 00:02:14,400 --> 00:02:19,230 و هر چند اگر شما انجام پژوهش در عمق، 37 00:02:19,230 --> 00:02:25,160 شما به وضوح می خواهید برای دریافت به واقعی خود محتوا و در داده نگاه کنید، 38 00:02:25,160 --> 00:02:30,140 فراداده از نظر مفید است هر دو تجزیه و تحلیل مجموعه به عنوان یک کل، 39 00:02:30,140 --> 00:02:33,870 مانند آنچه در مجموعه هستند. 40 00:02:33,870 --> 00:02:35,520 چگونه می توانم آنها مربوط؟ 41 00:02:35,520 --> 00:02:39,482 این کمک می کند که شما واقعا چیزهای دیگر پیدا کنید، که واقعا هدف اصلی از آن است. 42 00:02:39,482 --> 00:02:41,190 نقطه ابرداده و کاتولوگ 43 00:02:41,190 --> 00:02:43,230 است برای کمک به شما در پیدا کردن تمام اطلاعات که 44 00:02:43,230 --> 00:02:46,590 موجود در مجموعه. 45 00:02:46,590 --> 00:02:53,690 >> بنابراین این یک نمونه از ابرداده است برای یک کتاب در کتابخانه دانشگاه هاروارد. 46 00:02:53,690 --> 00:02:56,370 پس از آن وجود دارد. 47 00:02:56,370 --> 00:02:59,850 و شما می توانید ببینید که در واقع نسبتا پیچیده است. 48 00:02:59,850 --> 00:03:04,610 و بخشی از ارزش فراداده در سیستم کتابخانه دانشگاه هاروارد 49 00:03:04,610 --> 00:03:09,320 است که آن را مرتب سازی بر است تا توسط فهرستنویسان ساخته شده است 50 00:03:09,320 --> 00:03:12,720 و مونتاژ توسط افراد استفاده بسیاری از تخصص و مهارت 51 00:03:12,720 --> 00:03:20,030 و به آن فکر در طول زمان، که تا به بسیاری از ارزش. 52 00:03:20,030 --> 00:03:25,450 >> بنابراین اگر شما نگاهی به این رکورد برای مشروح آلیس، شما می توانید پیدا کردن 53 00:03:25,450 --> 00:03:32,590 شما رو به عنوان، که آن را نوشت، نویسنده، و تمامی موضوعات مختلف 54 00:03:32,590 --> 00:03:35,380 که مردم آن را به فهرست شده اند. 55 00:03:35,380 --> 00:03:40,110 و شما می توانید ببینید نیز وجود دارد، در علاوه بر این به بسیاری از اطلاعات خوب 56 00:03:40,110 --> 00:03:42,852 در اینجا، به برخی از تقلید وجود دارد. 57 00:03:42,852 --> 00:03:45,560 در بسیاری از پیچیدگی که وجود دارد منعکس طریق ابرداده 58 00:03:45,560 --> 00:03:46,300 که شما داشته باشد. 59 00:03:46,300 --> 00:03:50,320 >> بنابراین یک عنوان از این کتاب است آلیس در سرزمین عجایب. 60 00:03:50,320 --> 00:03:53,880 پس این است که حاشیه نویسی شده نسخه که کتاب. 61 00:03:53,880 --> 00:03:56,380 اما آن را نیز به نام مشروح آلیس، آلیس 62 00:03:56,380 --> 00:03:58,570 در سرزمین عجایب دلیل آن چیزی که 63 00:03:58,570 --> 00:04:00,430 مارتین گاردنر نوشت و مشروح کتاب. 64 00:04:00,430 --> 00:04:03,369 و در بسیاری از اطلاعات بزرگ وجود دارد درباره پازل منطق و همه چیز 65 00:04:03,369 --> 00:04:05,410 در آلیس که شما احتمالا در مورد نمی دانم. 66 00:04:05,410 --> 00:04:07,000 بنابراین شما باید آن را بخوانید بروید. 67 00:04:07,000 --> 00:04:11,940 >> اما شما می توانید ببینید وجود دارد بسیاری از جزئیات در اینجا، 68 00:04:11,940 --> 00:04:15,340 از جمله شناسه، زمانی که آن را ایجاد شده بود، که از کجا آمده، 69 00:04:15,340 --> 00:04:17,420 از نظر هاروارد سیستم، و غیره. 70 00:04:17,420 --> 00:04:20,350 بنابراین این یک نمونه از است نوع ابرداده 71 00:04:20,350 --> 00:04:24,340 که شما ممکن است برای یک کتاب در ببینید مجموعه کتابخانه دانشگاه هاروارد. 72 00:04:24,340 --> 00:04:26,680 >> این چیزی است کاملا متفاوت است. 73 00:04:26,680 --> 00:04:32,610 بنابراین یک سیستم به نام وجود دارد VIA هاروارد، که اساسا 74 00:04:32,610 --> 00:04:39,990 است فهرست تصاویر و اشیاء هنری و چیز های بصری در سراسر هاروارد، 75 00:04:39,990 --> 00:04:44,010 و اضافه کردن برخی از فراداده به آنها، طبقه بندی آنها، 76 00:04:44,010 --> 00:04:49,200 و در برخی موارد، ارائه تصاویر بند انگشتی کوچک 77 00:04:49,200 --> 00:04:51,250 که شما می توانید یک را در اگر شما تا آرزو نگاه کنید. 78 00:04:51,250 --> 00:04:54,240 >> بنابراین این یک نمونه از است ابرداده است که شما برای یک بشقاب دارند 79 00:04:54,240 --> 00:04:57,840 از، احتمالا، آلیس در سرزمین عجایب. 80 00:04:57,840 --> 00:05:00,499 و شما می توانید ببینید وجود دارد فراداده کمتر اینجا. 81 00:05:00,499 --> 00:05:02,040 این فقط یک نوع دیگری از شی است. 82 00:05:02,040 --> 00:05:03,425 و به این ترتیب اطلاعات کمتر وجود دارد. 83 00:05:03,425 --> 00:05:07,790 >> شما بیشتر از این واقعیت است که، یک تماس تعداد، اساسا که آن را ایجاد، - 84 00:05:07,790 --> 00:05:10,410 >> ما نمی دانیم که آن را ساخته شده است. 85 00:05:10,410 --> 00:05:13,320 >> --and عنوان. 86 00:05:13,320 --> 00:05:14,300 >> مثال دیگر. 87 00:05:14,300 --> 00:05:16,380 این کمک یافته است. 88 00:05:16,380 --> 00:05:19,030 بنابراین یک مجموعه ای از لوئیس وجود دارد مقالات کارول در دانشگاه هاروارد. 89 00:05:19,030 --> 00:05:23,601 بنابراین این توصیف چه در آن مجموعه است. 90 00:05:23,601 --> 00:05:26,100 بنابراین کسی را از طریق رفته و از طریق تمام جعبه نگاه 91 00:05:26,100 --> 00:05:32,220 و آن فهرست، با توجه به برخی از پس زمینه، خلاصه ای از آنچه که در اینجا نوشته شده است. 92 00:05:32,220 --> 00:05:35,290 و اگر شما به دنبال بیشتر در این، این 93 00:05:35,290 --> 00:05:39,620 در ادامه برای صفحات و صفحات و صفحات، اما به شما خواهد گفت 94 00:05:39,620 --> 00:05:41,860 چه حروف و آنچه تاریخ از آنچه جعبه 95 00:05:41,860 --> 00:05:44,289 در سراسر مجموعه وجود داشته است. 96 00:05:44,289 --> 00:05:46,330 اما این چیزی است که، اگر شما در هاروارد هستید، 97 00:05:46,330 --> 00:05:50,720 شما می توانید بروید و در واقع از لحاظ جسمی نگاه و، احتمالا، نگاهی به. 98 00:05:50,720 --> 00:05:53,440 >> پس این است که همه بزرگ است. 99 00:05:53,440 --> 00:05:54,450 این فراداده مفید. 100 00:05:54,450 --> 00:05:56,327 این در سیستم کتابخانه دانشگاه هاروارد است. 101 00:05:56,327 --> 00:05:58,910 ابزار وجود دارد آنلاین که در آن شما می توانید بروید و نگاهی به آن، 102 00:05:58,910 --> 00:05:59,993 و آن را ببینید، و جستجو در آن. 103 00:05:59,993 --> 00:06:02,810 و شما می توانید آن و تاس تکه آن را در بسیاری از روش های مختلف. 104 00:06:02,810 --> 00:06:06,920 >> اما این واقعا تنها در صورتی در دسترس شما یک انسان نشسته است 105 00:06:06,920 --> 00:06:12,600 در مرورگر خود و یا و یا چیزی تلفن و مرور از طریق آن خود را. 106 00:06:12,600 --> 00:06:16,730 این واقعا در دسترس نیست هر نوع مد قابل استفاده 107 00:06:16,730 --> 00:06:19,520 برای سیستم های دیگر و یا کامپیوتر های دیگر به استفاده از، 108 00:06:19,520 --> 00:06:21,500 نه با سیستم در کتابخانه دانشگاه هاروارد، 109 00:06:21,500 --> 00:06:24,890 اما سیستم در جهان خارج، فقط افراد دیگر به طور کلی. 110 00:06:24,890 --> 00:06:30,210 بنابراین سوال این است، چگونه می توان آن را به کامپیوتر در دسترس 111 00:06:30,210 --> 00:06:33,560 به طوری که ما می توانیم جالب تر انجام چیزهای با آن از 112 00:06:33,560 --> 00:06:36,550 مرور آن خود؟ 113 00:06:36,550 --> 00:06:39,766 >> پس چرا شما می خواهید برای انجام این کار؟ 114 00:06:39,766 --> 00:06:41,140 هستند بسیاری از فرصت وجود دارد. 115 00:06:41,140 --> 00:06:43,980 یکی است شما می توانید به طور کامل ساخت راه های مختلف از مرور 116 00:06:43,980 --> 00:06:46,962 محتوای که در دسترس از طریق کتابخانه دانشگاه هاروارد. 117 00:06:46,962 --> 00:06:48,670 من شما را یک نشان می دهد بعد به نام Stacklife، 118 00:06:48,670 --> 00:06:52,440 است که کاملا متفاوت را در به دنبال محتوا. 119 00:06:52,440 --> 00:06:54,560 >> شما می توانید یک موتور توصیه ساخت. 120 00:06:54,560 --> 00:06:57,955 بنابراین کتابخانه دانشگاه هاروارد در نمی کسب و کار گفت، شما می خواهم این کتاب است. 121 00:06:57,955 --> 00:07:01,080 سپس نگاهی به این 17 دیگر کتاب هایی که شما ممکن است در علاقه مند 122 00:07:01,080 --> 00:07:03,200 یا این 18 عکس دیگر. 123 00:07:03,200 --> 00:07:06,040 اما این قطعا می تواند یک ویژگی ارزشمند است. 124 00:07:06,040 --> 00:07:09,272 و با توجه به ابرداده، ممکن است است ممکن است برای قرار دادن که با هم. 125 00:07:09,272 --> 00:07:11,980 شما ممکن است نیازهای مختلف در داشته نظر جستجو در محتوا، 126 00:07:11,980 --> 00:07:16,200 مانند شاید با وجود ابزار است که در دسترس که کتابخانه می سازد هستند 127 00:07:16,200 --> 00:07:18,450 در دسترس، شما ممکن است بخواهید برای جستجو در راه های مختلف 128 00:07:18,450 --> 00:07:21,847 و یا بهینه سازی برای یک مورد استفاده خاص، که شاید آن را بسیار تخصصی. 129 00:07:21,847 --> 00:07:23,930 شاید تنها چند وجود دارد مردم در جهان که 130 00:07:23,930 --> 00:07:25,846 می خواهید برای جستجو در محتوا در این راه، اما آن 131 00:07:25,846 --> 00:07:28,985 بزرگ خواهد بود اگر ما می تواند به آنها اجازه انجام این کار. 132 00:07:28,985 --> 00:07:30,860 در بسیاری از تجزیه و تحلیل ترافیک وجود دارد فقط در چگونه مردم 133 00:07:30,860 --> 00:07:33,860 استفاده از محتوای که واقعا خواهد بود جالب در مورد دانید، پیدا کردن 134 00:07:33,860 --> 00:07:37,280 چه کتاب استفاده می شود، چه نیست، و غیره. 135 00:07:37,280 --> 00:07:41,670 و پس از آن در بسیاری از وجود دارد فرصت برای ادغام 136 00:07:41,670 --> 00:07:45,210 سایر اطلاعات که در خارج وجود دارد در وب. 137 00:07:45,210 --> 00:07:46,880 بنابراین ما have-- 138 00:07:46,880 --> 00:07:50,260 >> به عنوان مثال، NPR است بخش بررسی کتاب، 139 00:07:50,260 --> 00:07:53,090 جایی که آنها مصاحبه نویسندگان درباره کتاب. 140 00:07:53,090 --> 00:07:56,837 و پس از آن بزرگ خواهد بود اگر شما بودند به دنبال یک کتاب در دانشگاه هاروارد 141 00:07:56,837 --> 00:07:59,670 کتابخانه، و به شما می گویند، خوب، وجود دارد مصاحبه با نویسنده بوده است. 142 00:07:59,670 --> 00:08:00,878 برویم نگاهی به که. 143 00:08:00,878 --> 00:08:05,461 و یا یک صفحه ویکیپدیا وجود دارد، به عنوان یک معتبر، مرجع علمی 144 00:08:05,461 --> 00:08:07,710 درباره ی این کتاب است که شما در صورت تمایل به نگاهی. 145 00:08:07,710 --> 00:08:12,600 >> هستند این نوع از منابع وجود دارد پراکنده در سراسر وب. 146 00:08:12,600 --> 00:08:16,555 و آنها را گرد هم آوردن می تواند یک استفاده بزرگ 147 00:08:16,555 --> 00:08:18,930 به کسی که به دنبال در محتوا، به دنبال چیزی. 148 00:08:18,930 --> 00:08:20,180 اما آن را نیز نمی نوع از چیزی که شما می خواهم 149 00:08:20,180 --> 00:08:23,205 می خواهید کتابخانه به مسئول برای پایین رفتن و شکار کردن 150 00:08:23,205 --> 00:08:25,455 همه این منابع مختلف و آنها را متصل به هم 151 00:08:25,455 --> 00:08:28,920 چرا که آنها در حال تغییر به طور مداوم. 152 00:08:28,920 --> 00:08:33,570 و چیزی که آنها فکر می کنم مه مهم است نمی شود چه فکر می کنید مهم است. 153 00:08:33,570 --> 00:08:36,929 >> و حتی بیشتر از آن، اساسا وجود دارد بسیاری از مسائل ما از فکر نکرده است. 154 00:08:36,929 --> 00:08:42,222 بنابراین اگر ما می توانیم این تا باز، مردم علاوه بر نیم دوجین یا بیشتر، 155 00:08:42,222 --> 00:08:45,174 که به دنبال در این در به طور منظم می تواند از ایده های فکر می کنم 156 00:08:45,174 --> 00:08:47,340 و ماساژ داده، و انجام آنچه آنها با آن را می خواهم. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> بنابراین ما می خواهیم را به این اطلاعات موجود به جهان است. 159 00:08:54,045 --> 00:08:55,670 خوب، یک زن و شوهر از عوارض وجود دارد. 160 00:08:55,670 --> 00:08:58,540 یکی این است که این فراداده در سیستم های مختلف می باشد. 161 00:08:58,540 --> 00:09:01,110 این در فرمت های مختلف است. 162 00:09:01,110 --> 00:09:04,719 بنابراین برخی از عادی وجود دارد که نیاز به اتفاق می افتد، 163 00:09:04,719 --> 00:09:08,010 که عادی بودن روند آوردن چیزهایی از فرمت های مختلف 164 00:09:08,010 --> 00:09:12,940 و نقشه برداری آنها را به یک فرمت واحد به طوری که زمینه مطابقت خواهد شد. 165 00:09:12,940 --> 00:09:15,160 >> برخی از محدودیت های کپی رایت وجود دارد. 166 00:09:15,160 --> 00:09:21,010 به اندازه کافی عجیب، ورود کاتولوگ درباره کتاب مسئول کپی رایت است. 167 00:09:21,010 --> 00:09:24,060 بنابراین حتی اگر آن را فقط اطلاعات به دست آمده از کتاب، 168 00:09:24,060 --> 00:09:25,330 آن را copyrightable. 169 00:09:25,330 --> 00:09:28,400 و بسته به که در واقع ایجاد که ابرداده، 170 00:09:28,400 --> 00:09:32,175 ممکن است محدودیت در که وجود دارد می توانید آن را توزیع، to-- مشابه 171 00:09:32,175 --> 00:09:33,402 >> نمی دانم. 172 00:09:33,402 --> 00:09:36,110 این ممکن است یا نه ممکن است شبیه به وضعیت اشعار ترانه ها، 173 00:09:36,110 --> 00:09:36,610 برای مثال. 174 00:09:36,610 --> 00:09:38,560 بنابراین همه ما می دانیم که چگونه است که تابه خارج. 175 00:09:38,560 --> 00:09:40,450 بنابراین شما نیاز به اطراف که شماره را دریافت کنید. 176 00:09:40,450 --> 00:09:44,910 >> و سپس قطعه دیگری است که در بسیاری از داده ها وجود دارد. 177 00:09:44,910 --> 00:09:52,420 بنابراین اگر من کسی که می خواهد به کار هستم با داده ها و یا یک ایده سرد، 178 00:09:52,420 --> 00:09:55,350 خرید و فروش با 14 میلیون سوابق بر روی لپ تاپ من 179 00:09:55,350 --> 00:09:57,487 می تواند مشکل ساز و دشوار برای مدیریت. 180 00:09:57,487 --> 00:09:59,320 بنابراین ما می خواهیم به کاهش موانع برای مردم 181 00:09:59,320 --> 00:10:02,130 قادر به کار با داده ها. 182 00:10:02,130 --> 00:10:07,880 >> بنابراین رویکرد که امیدوارم آدرس همه از این نگرانی ها دو بخش است. 183 00:10:07,880 --> 00:10:11,770 یکی در حال ساخت یک پلت فرم است که طول می کشد داده ها از همه این منابع متفاوت 184 00:10:11,770 --> 00:10:14,350 و آن را تشدید، عادی، آن غنی، و باعث می شود 185 00:10:14,350 --> 00:10:16,650 آن را در دسترس در یک محل واحد. 186 00:10:16,650 --> 00:10:20,950 و آن را می سازد آن را از طریق در دسترس API های عمومی که مردم می توانید تماس بگیرید. 187 00:10:20,950 --> 00:10:24,430 >> بنابراین API کاربرد است برنامه نویسی رابط. 188 00:10:24,430 --> 00:10:28,930 و آن را اساسا به اشاره نقطه پایانی است که یک سیستم و یا فن آوری 189 00:10:28,930 --> 00:10:31,720 می توانید تماس بگیرید و دریافت داده ها به عقب در فرمت ساختار در راه 190 00:10:31,720 --> 00:10:32,900 که می توان آن استفاده می شود. 191 00:10:32,900 --> 00:10:36,060 پس از آن وابسته نمی در رفتن به یک وب سایت 192 00:10:36,060 --> 00:10:37,970 و خراش دادن داده فعال از آن، به عنوان مثال. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> بنابراین این صفحه خانه است API کتابخانه ابر مورد، 195 00:10:45,010 --> 00:10:47,220 که در اصل نسخه آن دو است. 196 00:10:47,220 --> 00:10:50,130 پس از آن تکرار دوم است تلاش برای ایجاد تمام این داده ها 197 00:10:50,130 --> 00:10:53,280 در دسترس جهان است. 198 00:10:53,280 --> 00:10:59,560 پس از آن http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 و فقط برای شکستن این پایین کمی، چه این بدان معنی است 200 00:11:03,830 --> 00:11:06,115 این است که این نسخه دو از API است. 201 00:11:06,115 --> 00:11:08,490 نسخه یک، وجود دارد که من قصد ندارم در مورد صحبت کنید. 202 00:11:08,490 --> 00:11:09,750 اما یک نسخه وجود دارد. 203 00:11:09,750 --> 00:11:14,740 >> و اگر شما خواستار این API، شما در حال گرفتن اقلام است. 204 00:11:14,740 --> 00:11:20,640 و بخشی از ایده API است یک API قرارداد است. 205 00:11:20,640 --> 00:11:23,440 این چیزی است که رفتن به تغییر. 206 00:11:23,440 --> 00:11:24,850 بنابراین برای مثال، - 207 00:11:24,850 --> 00:11:27,410 >> و دلیل آن این است که اگر من ساخت نوعی از سیستم که 208 00:11:27,410 --> 00:11:33,210 رفتن به استفاده از API ابر کتابخانه برای نمایش کتاب و یا کمک به مردم پیدا 209 00:11:33,210 --> 00:11:36,190 اطلاعات در راه منحصر به فرد، چه ما نمی خواهیم اتفاق می افتد 210 00:11:36,190 --> 00:11:38,940 برای ما به رفتن تغییر چگونه که API کار می کند، و به طور ناگهانی 211 00:11:38,940 --> 00:11:41,340 همه چیز در سمت کاربر نهایی می شکند. 212 00:11:41,340 --> 00:11:46,710 بنابراین بخشی از اگر شما در حال ساخت API در دسترس جهان، آن را 213 00:11:46,710 --> 00:11:49,396 تمرین خوبی برای قرار دادن یک شماره نسخه در آن تا مردم 214 00:11:49,396 --> 00:11:51,020 می دانید که چه نسخه آنها برای مقابله با. 215 00:11:51,020 --> 00:11:54,300 >> بنابراین اگر ما تصمیم ما پیدا کردن یک راه بهتر ساخت این اطلاعات در دسترس، 216 00:11:54,300 --> 00:11:57,295 ما ممکن است به تغییر که که نسخه سه تماس بگیرید. 217 00:11:57,295 --> 00:11:59,920 بنابراین هر کسی که هنوز هم با استفاده از نسخه دو، که هنوز هم کار می کنند. 218 00:11:59,920 --> 00:12:03,490 اما نسخه سه را تمام چیزهای جدید. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> بنابراین این API است، اما این واقعا مانند یک URL به نظر می رسد. 221 00:12:09,210 --> 00:12:11,680 و پس چه است این به عنوان مثال از آن چیزی است که در 222 00:12:11,680 --> 00:12:16,615 به نام API بقیه، که در دسترس است بیش از فقط یک اتصال وب به طور منظم. 223 00:12:16,615 --> 00:12:19,680 و شما در واقع می تواند رفتن به آن را در یک مرورگر. 224 00:12:19,680 --> 00:12:28,550 >> بنابراین در اینجا من فقط باز کرده ام تا فایرفاکس و رفته به api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 و به این ترتیب آنچه که من در اینجا دریافت کنید اساسا در صفحه اول 226 00:12:31,560 --> 00:12:34,740 نتایج از کل مجموعه ای از آیتم هایی که ما داریم. 227 00:12:34,740 --> 00:12:37,460 و آن را در فرمت XML. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 و آن را نیز بوده است prettified توسط فایرفاکس. 230 00:12:42,210 --> 00:12:45,850 این کار در واقع همه این گسترش کمی و قرارداد 231 00:12:45,850 --> 00:12:47,880 doohickeys اینجا. 232 00:12:47,880 --> 00:12:52,520 این نوع بهتر است نسخه راه برای آن نگاه کنید. 233 00:12:52,520 --> 00:12:57,040 >> اما آنچه این به ما می گوید است من درخواست کرده ام تمام موارد. 234 00:12:57,040 --> 00:13:03,120 بنابراین 13289475 موارد وجود دارد. 235 00:13:03,120 --> 00:13:06,150 و من به دنبال در اولین 10، با شروع در موقعیت صفر 236 00:13:06,150 --> 00:13:09,760 چرا که در علوم کامپیوتر ما همیشه در صفر شروع می شود. 237 00:13:09,760 --> 00:13:15,150 و آنچه که من در اینجا، اگر من فقط سقوط این، خواهید دید من 10 اقلام کردم. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> و اگر من نگاهی به یک آیتم، من می توانم ببینید که من اطلاعات مربوط به آن شده است. 240 00:13:25,210 --> 00:13:27,400 و این در چه فرم MODS نام است. 241 00:13:27,400 --> 00:13:30,860 و به این ترتیب من قصد دارم به سوئیچ بازگشت اینجا برای یک لحظه. 242 00:13:30,860 --> 00:13:33,750 باشه. 243 00:13:33,750 --> 00:13:37,447 >> بنابراین اجازه دهید چیزی در جستجو خاص به دلیل گزینه اول که 244 00:13:37,447 --> 00:13:40,030 اتفاق می افتد به می آیند تا زمانی که شما نگاه از طریق تمام مجموعه 245 00:13:40,030 --> 00:13:41,750 است، تعریف، تصادفی. 246 00:13:41,750 --> 00:13:44,550 بنابراین اجازه دهید برای برخی از دونات نگاه کنید. 247 00:13:44,550 --> 00:13:46,830 اوه. 248 00:13:46,830 --> 00:13:49,190 >> باشه. 249 00:13:49,190 --> 00:13:49,940 بنابراین دوناتها. 250 00:13:49,940 --> 00:13:55,360 بنابراین ما در بر داشت 80 آیتم در آن وجود دارد مجموعه که دونات مرجع. 251 00:13:55,360 --> 00:13:57,150 ما در حال نگاه کردن به 10 اولین بار از آنها. 252 00:13:57,150 --> 00:14:01,890 در حال حاضر، شما می توانید در اینجا ببینید راه که من گفتم من به دنبال دوناتها، 253 00:14:01,890 --> 00:14:04,400 من فقط چیزی برای اضافه رشته پرس و جو از URL. 254 00:14:04,400 --> 00:14:09,680 بنابراین پرسش برابر دوناتها، که شما می توانید کمی به راحتی بیشتر اینجا را ببینید. 255 00:14:09,680 --> 00:14:12,131 >> و اساسا این بدین معنی وجود دارد تنظیمات برای API، که 256 00:14:12,131 --> 00:14:13,880 تعریف چیزی است که همه از این پارامترها معنی. 257 00:14:13,880 --> 00:14:17,150 و این بدان معناست که ما در حال رفتن به همه چیز را برای دونات را جستجو کنید. 258 00:14:17,150 --> 00:14:24,910 >> بنابراین اولین مورد در اینجا ما شما می توانید ببینید که عنوان پیراشکی است، 259 00:14:24,910 --> 00:14:29,310 و یک زیرنویس به نام وجود دارد مصائب آمریکایی، است که، من حدس می زنم، 260 00:14:29,310 --> 00:14:31,610 مناسب. 261 00:14:31,610 --> 00:14:36,134 هستند بسیاری از different-- وجود دارد 262 00:14:36,134 --> 00:14:38,050 هنگامی که شما به نقطه دریافت گرفتن داده ها، 263 00:14:38,050 --> 00:14:41,020 هستند بسیاری از متفاوت وجود دارد فرمت های که شما می توانید آن را به دریافت کنید. 264 00:14:41,020 --> 00:14:44,050 و نقاط قوت های مختلف وجود دارد و نقاط ضعف برای همه آنها. 265 00:14:44,050 --> 00:14:49,000 پس این یکی، شما می توانید ببینید در اینجا، این فرم بسیار غنی است. 266 00:14:49,000 --> 00:14:51,946 و آن را استاندارد. 267 00:14:51,946 --> 00:14:55,040 >> بنابراین یک عنوان خاص وجود دارد درست است، درست زیرنویس. 268 00:14:55,040 --> 00:14:58,950 یک جایگزین وجود دارد عنوان، مصائب آمریکا. 269 00:14:58,950 --> 00:15:01,650 است به نام مرتبط با آن وجود دارد. 270 00:15:01,650 --> 00:15:03,120 نوع از منابع متن است. 271 00:15:03,120 --> 00:15:06,070 در بسیاری از اطلاعات وجود دارد در اینجا به این شکل. 272 00:15:06,070 --> 00:15:09,480 >> اما یک دسته وجود دارد فرمت های مختلف. 273 00:15:09,480 --> 00:15:11,920 بنابراین آنچه که ما فقط بود به دنبال در یک فرمت است 274 00:15:11,920 --> 00:15:17,700 نام MODS، که مخفف متاداده شی شرح خدمات، 275 00:15:17,700 --> 00:15:18,250 به طور بالقوه. 276 00:15:18,250 --> 00:15:23,030 من در واقع کاملا مطمئن مورد هستم S. اما این فرمت نسبتا پیچیده است. 277 00:15:23,030 --> 00:15:24,240 این قالب به طور پیش فرض است. 278 00:15:24,240 --> 00:15:30,260 >> اما این یکی که نگه می دارد است غنای تمام داده ها 279 00:15:30,260 --> 00:15:33,820 که کتابخانه دارد زیرا آن را بسیار نزدیک به آنچه 280 00:15:33,820 --> 00:15:35,110 کتابخانه استفاده داخلی. 281 00:15:35,110 --> 00:15:39,030 این یک استاندارد است که استفاده در سراسر کشور، 282 00:15:39,030 --> 00:15:40,944 در سراسر جهان در کتابخانه های دانشگاهی. 283 00:15:40,944 --> 00:15:42,110 و آن را بسیار سازگار. 284 00:15:42,110 --> 00:15:44,852 بنابراین اگر شما یک سند کردم است که در قالب MODS، 285 00:15:44,852 --> 00:15:47,560 شما می توانید به کسی دیگری را که سیستم های که درک MODS، 286 00:15:47,560 --> 00:15:48,518 و می تواند آن را وارد کنید. 287 00:15:48,518 --> 00:15:50,840 پس از آن یک استاندارد است. 288 00:15:50,840 --> 00:15:54,250 این خیلی خوب تعریف شده است، بسیار خاص است. 289 00:15:54,250 --> 00:15:58,980 و این چیزی است که آن را می سازد سازگار چرا که اگر کسی می گوید، 290 00:15:58,980 --> 00:16:04,930 این عنوان متناوب از است ضبط، همه می دانند که چه معناست. 291 00:16:04,930 --> 00:16:07,740 در سمت تلنگر، آن را بسیار پیچیده است. 292 00:16:07,740 --> 00:16:13,160 >> بنابراین اگر شما نگاهی در این رکورد در اینجا، 293 00:16:13,160 --> 00:16:15,320 اگر من فقط می خواهید برای دریافت عنوان این سند، 294 00:16:15,320 --> 00:16:21,150 این کتاب، که احتمالا پیراشکی، مصائب آمریکا، تجزیه آن را 295 00:16:21,150 --> 00:16:22,940 کمی درگیر. 296 00:16:22,940 --> 00:16:27,380 در حالی که یکی دیگر وجود دارد فرمت به نام هسته دوبلین، 297 00:16:27,380 --> 00:16:29,730 که زیاد است، فرمت بسیار ساده تر است. 298 00:16:29,730 --> 00:16:33,764 >> و به این ترتیب شما در اینجا ببینید، هیچ وجود دارد عنوان، زیرنویس، عنوان جایگزین. 299 00:16:33,764 --> 00:16:35,930 فقط عنوان وجود دارد، پیراشکی، مصائب آمریکا، 300 00:16:35,930 --> 00:16:38,780 و یکی دیگر از عنوان، مصائب آمریکا. 301 00:16:38,780 --> 00:16:42,907 بنابراین، هنگامی که شما به دنبال در چه فرم شما می خواهید برای دریافت اطلاعات از، 302 00:16:42,907 --> 00:16:44,740 بسیاری بستگی دارد که چگونه شما در حال رفتن به آن استفاده کنید. 303 00:16:44,740 --> 00:16:46,573 آیا شما با استفاده از برای قابلیت همکاری و یا شما انجام 304 00:16:46,573 --> 00:16:49,970 چیزی ساده است که می خواهید ممکن است راحت تر به کار با؟ 305 00:16:49,970 --> 00:16:56,002 >> در سمت تلنگر، بسیاری از جزئیات دریافت مرتب کردن بر اساس squished پایین. 306 00:16:56,002 --> 00:16:58,460 شما ممکن است تفاوت های ظریف در از دست دادن چه وسیله زمینه خاص 307 00:16:58,460 --> 00:17:02,960 اگر شما در حال خرید و فروش با هسته دوبلین، که شما نمی با MODS دریافت کنید. 308 00:17:02,960 --> 00:17:06,462 بنابراین کسانی که دو تا از فرمت های شما می توانید از API دریافت کنید. 309 00:17:06,462 --> 00:17:08,920 و در واقع، ما در حال نگه داشتن آن در پشت صحنه در MODS. 310 00:17:08,920 --> 00:17:14,179 اما ما می توانیم شما را در MODS را و هسته دوبلین و هر چیز دیگری نیز هست. 311 00:17:14,179 --> 00:17:16,470 نظر دیگر زمانی که شما دنبال آن هستید در اطلاعات 312 00:17:16,470 --> 00:17:21,210 است شما می توانید آن را به صورت JSON، دریافت که مخفف جاوا اسکریپت نشانه گذاری شی، 313 00:17:21,210 --> 00:17:24,720 و یا XML، که مخفف زبان نشانه گذاری توسعه پذیر. 314 00:17:24,720 --> 00:17:30,080 و این بازنمودها داده هر دو دقیقا همان اطلاعات، دقیقا 315 00:17:30,080 --> 00:17:31,080 زمینه همان. 316 00:17:31,080 --> 00:17:33,644 اما آنها فقط هستید نحوی متفاوت است. 317 00:17:33,644 --> 00:17:40,401 >> بنابراین این a-- است 318 00:17:40,401 --> 00:17:41,400 خوب، اجازه دهید فقط تغییر دهید. 319 00:17:41,400 --> 00:17:47,490 بنابراین این پرسش ما را برای است دونات در فرمت XML. 320 00:17:47,490 --> 00:17:53,470 اگر من فقط تغییر دهید این به JSON، من می توانم آن را متفاوت به نظر می رسد. 321 00:17:53,470 --> 00:17:58,580 بنابراین در حال حاضر این همان محتوا است، اما ساختار متفاوت است. 322 00:17:58,580 --> 00:18:00,080 می براکت زاویه کمتر وجود دارد. 323 00:18:00,080 --> 00:18:02,530 کمتر پرگو وجود دارد. 324 00:18:02,530 --> 00:18:06,440 >> و این فرمت این است که، اگر شما در حال کار در محیط وب، 325 00:18:06,440 --> 00:18:09,680 شما به احتمال زیاد رفتن به مایل به استفاده از به خاطر یکی 326 00:18:09,680 --> 00:18:12,630 از چیزهای خوب در مورد JSON است آن را سازگار با جاوا اسکریپت. 327 00:18:12,630 --> 00:18:17,680 بنابراین اگر من نوشتن برنامه وب، من می توانید بکشید در JSON و فقط با آن به طور مستقیم کار می کنند. 328 00:18:17,680 --> 00:18:20,187 در حالی که با XML، آن را کمی پیچیده تر. 329 00:18:20,187 --> 00:18:21,520 بنابراین دوباره، این هر دو مفید است. 330 00:18:21,520 --> 00:18:26,387 آنها فقط موارد استفاده متفاوت است که در آن مردم در صورت تمایل به استفاده از آنها. 331 00:18:26,387 --> 00:18:26,886 باشه. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 بنابراین بازگشت به API. 334 00:18:31,680 --> 00:18:32,900 بنابراین ما می توانیم جستجو for-- 335 00:18:32,900 --> 00:18:36,220 >> من یک مثال از را جستجو برای دوناتها. 336 00:18:36,220 --> 00:18:39,330 ما همچنین می توانیم فقط جستجو در رشته خاص در اینجا. 337 00:18:39,330 --> 00:18:41,310 بنابراین به جای جستجو کل رکورد، 338 00:18:41,310 --> 00:18:43,870 من فقط می توانید جستجو درست عنوان. 339 00:18:43,870 --> 00:18:48,810 و بنابراین در حال حاضر 25 همه چیز وجود دارد که باید دونات در عنوان، که یکی از آنها 340 00:18:48,810 --> 00:18:52,430 است در مورد بازگرداندن تالاب در مدیریت 341 00:18:52,430 --> 00:18:54,990 از سوراخ در شیرینی بی شیرینی برنامه، که احتمالا 342 00:18:54,990 --> 00:18:58,970 لزوما چه چیزی نیست ما به دنبال برای زمانی که ما در حال جستجو برای دوناتها. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> شما همچنین می توانید، هنگامی که شما هستید خرید و فروش با API-- 345 00:19:05,490 --> 00:19:08,827 >> بخشی از داشتن یک API دادن مردم امکان دسترسی به مجموعه داده های بزرگ. 346 00:19:08,827 --> 00:19:11,410 و یک زن و شوهر های مختلف وجود دارد ابزار شما می توانید استفاده کنید برای انجام این کار. 347 00:19:11,410 --> 00:19:14,170 یکی است، خیلی ساده، شما می توانید از طریق داده ها صفحه. 348 00:19:14,170 --> 00:19:17,340 پس فقط به عنوان اگر یک پرس و جو شما انجام از طریق یک رابط وب، 349 00:19:17,340 --> 00:19:19,470 شما می توانید در یک صفحه نگاه کنید، صفحه دو، صفحه سه. 350 00:19:19,470 --> 00:19:22,040 شما می توانید همین کار را چیزی که از طریق API. 351 00:19:22,040 --> 00:19:24,150 شما فقط نیاز به صریح و روشن در چگونه شما آن را انجام دهد. 352 00:19:24,150 --> 00:19:29,511 >> بنابراین برای مثال، اگر من به دنبال در ابتدا پرس و جو من در اینجا، 353 00:19:29,511 --> 00:19:32,510 که در آن من انجام یک جستجو برای همه چیز با دونات در عنوان، می توانم بگویم، 354 00:19:32,510 --> 00:19:35,415 و حد برابر 20، که به معنی من 20 رکورد اول را، نه 355 00:19:35,415 --> 00:19:38,540 10 برای اولین بار است که به طور پیش فرض، چون من می خواهم به در 20 در نگاه در یک زمان. 356 00:19:38,540 --> 00:19:43,435 و یا می توانم بگویم، مجموعه ای از شروع برابر با 20 و حد 357 00:19:43,435 --> 00:19:47,150 برابر 20، که به خواهد من ثبت 21 از طریق 40. 358 00:19:47,150 --> 00:19:52,680 >> بنابراین من حدس می زنم چیزی به دور اینجا است 359 00:19:52,680 --> 00:19:57,290 که ما با استفاده از رشته پرس و جو به پارامتر در پرس و جو. 360 00:19:57,290 --> 00:20:02,760 و آن را به شما امکان کنترل آنچه شما به عقب بر گردیم. 361 00:20:02,760 --> 00:20:05,980 >> یکی دیگر از ابزار است که شما می توانید استفاده کنید، - 362 00:20:05,980 --> 00:20:09,250 >> و این است که واقعا در مفید نظر کاوش داده ها. 363 00:20:09,250 --> 00:20:10,840 >> چیزی به نام فکتینگ --is. 364 00:20:10,840 --> 00:20:15,530 بنابراین فکتینگ مدت است نه لزوما رایج است. 365 00:20:15,530 --> 00:20:16,880 اما شما همه آن را قبل از دیده می شود. 366 00:20:16,880 --> 00:20:18,630 اگر شما نگاهی به آمازون، برای مثال، 367 00:20:18,630 --> 00:20:20,870 و شما انجام جستجو برای دونات در کتاب، 368 00:20:20,870 --> 00:20:27,080 در اینجا آنها کردم یک سری از کتاب ها، و آنها بر اساس طبقه بندی گروه بندی، 369 00:20:27,080 --> 00:20:30,470 و شما می توانید از دسته های مختلف، و چگونه بسیاری از کتاب در هر رده 370 00:20:30,470 --> 00:20:31,330 نشان می دهد تا. 371 00:20:31,330 --> 00:20:33,420 >> پس این است که اساسا یک جنبه. 372 00:20:33,420 --> 00:20:37,570 تو همه ی کتاب های آنها، 1800 کتاب هایی که دونات بازی آمازون. 373 00:20:37,570 --> 00:20:39,820 در 12 از آنها رده صبحانه. 374 00:20:39,820 --> 00:20:43,100 21 در شیرینی و پخت، و غیره و غیره. 375 00:20:43,100 --> 00:20:47,670 >> بنابراین این است که واقعا مفید ابزار برای بررسی محتوای 376 00:20:47,670 --> 00:20:53,260 در کتابخانه و همچنین زیرا زمانی که شما در یک جنبه نگاه کنید، 377 00:20:53,260 --> 00:20:56,520 آن را به شما می دهد یک ایده از آنچه افراد وجود دارد، مانند چه نوع افراد 378 00:20:56,520 --> 00:20:58,510 محبوب ترین در مجموعه ای به درخواست شما. 379 00:20:58,510 --> 00:21:00,950 و این کمک می کند تا شما درایو کردن و اکتشاف. 380 00:21:00,950 --> 00:21:02,770 بنابراین ما می توانیم همین کار را انجام دهد. 381 00:21:02,770 --> 00:21:05,940 >> اگر ما مایل به استفاده از API و در جنبه نگاه کنید، 382 00:21:05,940 --> 00:21:08,950 ما اضافه کردن پارامتر دیگری به دوستان ما رشته پرس و جو. 383 00:21:08,950 --> 00:21:12,540 بنابراین جنبه برابر کاما از هم جدا لیستی از آنچه که ما می خواهیم به جنبه در. 384 00:21:12,540 --> 00:21:14,790 بنابراین یکی از جنبه های ممکن است موضوع. 385 00:21:14,790 --> 00:21:16,565 یکی دیگر ممکن است زبان. 386 00:21:16,565 --> 00:21:19,665 و به این ترتیب اگر ما که پرس و جو اجرا، ما get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 به نظر می رسد تقریبا همان در اینجا. 389 00:21:24,830 --> 00:21:29,010 اما ما به پایان اضافه شده لیست مجموعه ای از جنبه های. 390 00:21:29,010 --> 00:21:34,060 بنابراین ما یک جنبه به نام موضوع. 391 00:21:34,060 --> 00:21:40,250 پس این به ما می گوید که اگر من نگاه در 80 نتایج من از پرس و جو شیرینی بی شیرینی، 392 00:21:40,250 --> 00:21:42,100 13 از آنها موضوع ایالات متحده است. 393 00:21:42,100 --> 00:21:43,684 سه دونات موضوع. 394 00:21:43,684 --> 00:21:45,600 سه موضوع مرمت تالاب، 395 00:21:45,600 --> 00:21:47,720 که ممکن است سوراخ های ما در شیرینی بی شیرینی. 396 00:21:47,720 --> 00:21:51,780 دو نفر از آنها، سیمپسونها، و غیره و غیره. 397 00:21:51,780 --> 00:21:59,211 >> بنابراین این می تواند اگر شما مفید می خواهید برای محدود کردن جستجوی خود استفاده کنید. 398 00:21:59,211 --> 00:22:00,210 این می تواند به شما کمک کند انجام این کار. 399 00:22:00,210 --> 00:22:03,580 به خصوص اگر شما بیش از، می گویند، 80 نتایج. 400 00:22:03,580 --> 00:22:05,980 >> به طور مشابه، ما نیز خواسته برای جنبه های بر زبان. 401 00:22:05,980 --> 00:22:14,790 بنابراین اگر ما در نتایج ما نگاه کنید، ما می بینیم 76 از آنها به زبان انگلیسی، چهار در فرانسه هستند، 402 00:22:14,790 --> 00:22:19,620 دو در اسپانیا، دو، من فکر می کنم که تعریف نشده و یا ناشناخته، هلندی و لاتین. 403 00:22:19,620 --> 00:22:22,830 بنابراین من فکر می کنم لاتین شیرینی بی شیرینی نتیجه، دوباره، 404 00:22:22,830 --> 00:22:24,922 هیچ ربطی به با محصولات پخته. 405 00:22:24,922 --> 00:22:25,630 اما وجود دارد که شما بروید. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> پس این است که مرتب سازی بر نشان دادن شما چگونه شما می توانید محتوای عقب بکشید 408 00:22:38,630 --> 00:22:41,270 از API فقط از طریق مرورگر وب است که بزرگ است. 409 00:22:41,270 --> 00:22:44,320 اما این واقعا نمی آنچه شما می به طور معمول با استفاده از در API برای آن باشد. 410 00:22:44,320 --> 00:22:48,710 به همین دلیل یک مثال از اینکه چگونه شما در واقع می تواند انجام این کار من 411 00:22:48,710 --> 00:22:54,720 نوشته شده یک برنامه فوق العاده کوچک، که، دوباره، آیا جستجو شیرینی بی شیرینی من 412 00:22:54,720 --> 00:22:59,010 و انتخاب یک زن و شوهر زمینه و آنها را نمایش می دهد در یک جدول. 413 00:22:59,010 --> 00:23:01,610 پس این است که بسیار همان محتوایی که ما فقط 414 00:23:01,610 --> 00:23:04,830 اره با چند زمینه از جیبش. 415 00:23:04,830 --> 00:23:12,090 بنابراین لیستی از عناوین، محل چه کتاب 416 00:23:12,090 --> 00:23:15,120 است در مورد، زبان، و غیره و غیره. 417 00:23:15,120 --> 00:23:20,480 >> پس چگونه این در واقع اتفاق افتاده است، از سال من حدس می زنم ما باید در برخی از کد نگاه کنید، 418 00:23:20,480 --> 00:23:22,420 is-- 419 00:23:22,420 --> 00:23:28,060 >> HTML ساده چه ما را در اینجا است صفحه، که نمایش متن، 420 00:23:28,060 --> 00:23:32,900 به ابر کتابخانه استقبال و سپس یک جدول از نتایج نشان می دهد. 421 00:23:32,900 --> 00:23:37,790 و بدیهی است که هیچ نتیجه ای در آن وجود دارد جدول زمانی که صفحه لود می شود. 422 00:23:37,790 --> 00:23:41,380 اما آنچه ما انجام می دهیم است، اول از همه، ما 423 00:23:41,380 --> 00:23:46,290 در حال بارگذاری یک کتابخانه به نام جی کوئری است که اساسا 424 00:23:46,290 --> 00:23:52,030 یک کتابخانه جاوا اسکریپت، که آن را بسیار آسان برای دستکاری جاوا اسکریپت 425 00:23:52,030 --> 00:23:58,780 بومی، HTML، و ایجاد صفحات وب، منطق های سمت سرویس گیرنده و صفحات وب است. 426 00:23:58,780 --> 00:24:01,595 >> پس چه ما را در اینجا jQuery است یک روش به نام کنید، 427 00:24:01,595 --> 00:24:05,270 که در اصل برای رفتن URL، که، در این مورد، 428 00:24:05,270 --> 00:24:09,070 این به دنبال URL آشنا است. 429 00:24:09,070 --> 00:24:14,440 و پس از آن دریافت محتوا از که URL و سپس یک تابع در آن را اجرا کنید. 430 00:24:14,440 --> 00:24:19,240 بنابراین ما گفت به api.lib.harvard / EDU. 431 00:24:19,240 --> 00:24:20,060 جستجو برای دوناتها. 432 00:24:20,060 --> 00:24:21,300 ما 20 پرونده بده. 433 00:24:21,300 --> 00:24:28,590 و سپس اجرای این تابع، که من انتخاب کرده ام، انتقال آن داده. 434 00:24:28,590 --> 00:24:34,430 و داده ها JSON است که از API بازگشت کردم. 435 00:24:34,430 --> 00:24:40,120 >> و سپس ما در حال گفت، در آن داده درست به نام آیتم وجود دارد. 436 00:24:40,120 --> 00:24:48,117 و اگر من به نگاهی به پشت در یکی از این نتایج که در اینجا، 437 00:24:48,117 --> 00:24:49,200 چیزی وجود دارد called-- 438 00:24:49,200 --> 00:24:50,220 >> خوب، آن را مورد نامیده می شود. 439 00:24:50,220 --> 00:24:53,520 به طوری که ممکن است که. 440 00:24:53,520 --> 00:25:01,840 و آنچه در آن می کند آن است می رود از طریق هر یک از آیتم 441 00:25:01,840 --> 00:25:05,300 و پس از آن دیگر خواستار تابع در هر یک از آیتم. 442 00:25:05,300 --> 00:25:08,440 و این تابع اساسا است در نظر گرفتن ارزش 443 00:25:08,440 --> 00:25:12,010 از قلم دوم از اقلام، که اساسا رکورد منحصر به فرد 444 00:25:12,010 --> 00:25:18,220 و اجازه می دهد تا ما را به بیرون بکشد عنوان، پوشش و زبان. 445 00:25:18,220 --> 00:25:21,640 >> بنابراین ما یک تابع در هر تماس قلم دوم از اقلام که ما را از API کردم. 446 00:25:21,640 --> 00:25:25,397 و اگر شما فقط نگاه در این قطعه حق در اینجا، 447 00:25:25,397 --> 00:25:27,230 آنچه که ما در حال انجام است ما در حال ایجاد یک رشته، 448 00:25:27,230 --> 00:25:31,810 که اساسا برخی از نشانه گذاری HTML غیر فعال است دور یک میز، با value.title، 449 00:25:31,810 --> 00:25:35,790 که عنوان است شی، value.coverage، 450 00:25:35,790 --> 00:25:36,790 است که در آن پوشش، - 451 00:25:36,790 --> 00:25:38,225 >> و ما در حال انجام یک بررسی اینجا ببینید که چه کسی تعریف نشده 452 00:25:38,225 --> 00:25:40,570 و پنهان کردن آن اگر آن را می گوید تعریف نشده، چون ما واقعا علاقه مند 453 00:25:40,570 --> 00:25:41,600 در آن. 454 00:25:41,600 --> 00:25:42,939 >> --and سپس زبان. 455 00:25:42,939 --> 00:25:44,730 و پس از آن چیزی است که ما انجام شده است اضافه کرد که 456 00:25:44,730 --> 00:25:48,510 به جدول این است که شناسایی شده توسط این رشته در اینجا. 457 00:25:48,510 --> 00:25:50,790 و چگونه کار می کند جی کوئری چیزی است که این می گوید 458 00:25:50,790 --> 00:25:56,420 برای جدول با ایده نگاه نتایج و اضافه کردن این متن به آن است. 459 00:25:56,420 --> 00:25:59,380 و این جدول با نتایج ایده است. 460 00:25:59,380 --> 00:26:04,998 پس چه شما را تا پایان با این صفحه در اینجا است. 461 00:26:04,998 --> 00:26:06,206 و به منظور مشاهده source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 خوب، منبع است که در واقع نه به روز وقتی که اتفاق افتاده است. 464 00:26:13,810 --> 00:26:18,740 بنابراین شما می توانید واقعی را ببینید نتایج از جدول اینجا هر چند. 465 00:26:18,740 --> 00:26:24,770 >> به طوری که فقط یک مثال ساده از این انجام یک پرس و جو بسیار اساسی در برابر API 466 00:26:24,770 --> 00:26:29,020 و نمایش اطلاعات در برخی دیگر شکل، و هر چیز بیش از حد تصور انجام نمی دهد. 467 00:26:29,020 --> 00:26:36,370 در حال حاضر، به عنوان مثال دیگری است مانند برنامه های نوشته شده توسط دیوید واینبرگر 468 00:26:36,370 --> 00:26:39,120 به عنوان یک دمو از این که اساسا شما نشان می دهد 469 00:26:39,120 --> 00:26:44,620 چگونه شما می توانید از mash تا نتایج شما گرفتن از API ابر کتابخانه 470 00:26:44,620 --> 00:26:46,250 با، می گویند، گوگل کتاب. 471 00:26:46,250 --> 00:26:52,225 >> و تفکر در اینجا این است که من می توانم یک پرس و جو بر علیه گوگل کتابها اجرا، 472 00:26:52,225 --> 00:26:56,060 دریافت جستجوی متن کامل، به نتایج بازگشت، پیدا کردن که از کسانی که در مورد 473 00:26:56,060 --> 00:27:01,180 در واقع در هولیس وجود داشته باشد، سیستم کتابخانه، 474 00:27:01,180 --> 00:27:03,200 و سپس به من لینک را بازگشت به کسانی که در مورد. 475 00:27:03,200 --> 00:27:12,730 بنابراین اگر من برای جستجو، آن بود یک شب تاریک و طوفانی، من 476 00:27:12,730 --> 00:27:16,210 بازگشت یک دسته از نتایج از گوگل، و پس از آن یک نتیجه 477 00:27:16,210 --> 00:27:19,460 که چروک در زمان است. 478 00:27:19,460 --> 00:27:29,330 و این لینک ها به کتاب هایی که وجود دارند در سیستم کتابخانه دانشگاه هاروارد. 479 00:27:29,330 --> 00:27:32,160 >> بنابراین من حدس می زنم نکته در اینجا است آنقدر که این ممکن است یا ممکن است 480 00:27:32,160 --> 00:27:34,118 است راه که می خواهید جستجو در کتابخانه، 481 00:27:34,118 --> 00:27:38,310 اما این یک کاملا متفاوت راه این بود که به شما در دسترس نیست 482 00:27:38,310 --> 00:27:42,884 قبل از، مثل شما هیچ راهی برای انجام به حال متن کامل جستجو در کتاب است که حتی 483 00:27:42,884 --> 00:27:44,550 بخشی از سیستم کتابخانه دانشگاه هاروارد بود. 484 00:27:44,550 --> 00:27:46,870 بنابراین در حال حاضر این یک راه است که شما می توانید انجام این کار. 485 00:27:46,870 --> 00:27:51,930 و شما می توانید آنها را در نمایش هر فرمت شما می خواهید. 486 00:27:51,930 --> 00:27:55,990 بنابراین نکته در اینجا است، در واقع، ما در حال باز کردن راه های جدید برای مردم 487 00:27:55,990 --> 00:27:59,080 برای کار با داده ها. 488 00:27:59,080 --> 00:28:07,925 >> قطعه دیگری از ابر کتابخانه است که آن افشای برخی از اطلاعات استفاده می کند 489 00:28:07,925 --> 00:28:08,800 که کتابخانه دارد. 490 00:28:08,800 --> 00:28:12,630 بنابراین اگر شما به کتابخانه بروید، و شما به دنبال برای کتاب، 491 00:28:12,630 --> 00:28:15,770 شما لزوما در واقع یک ایده از، 492 00:28:15,770 --> 00:28:19,080 برای همه موارد در موضوع خاص، چه 493 00:28:19,080 --> 00:28:21,200 مردم در هستند جامعه، که آیا آن را 494 00:28:21,200 --> 00:28:24,890 تعریف شده به عنوان هاروارد یا کشور یا کلاس خود را، 495 00:28:24,890 --> 00:28:26,421 چه آنها دریافتند مفید ترین؟ 496 00:28:26,421 --> 00:28:28,920 و کتابخانه در واقع تا به تن از اطلاعات در مورد آنچه 497 00:28:28,920 --> 00:28:32,999 مفید ترین است چرا که اگر تعداد زیادی از مردم چک کردن یک کتاب، 498 00:28:32,999 --> 00:28:34,040 که شما چیزی می گوید. 499 00:28:34,040 --> 00:28:36,498 باید وجود داشته باشد برخی از این دلیل بوده است آنها می خواهند آن را به اتمام. 500 00:28:36,498 --> 00:28:38,270 بسیاری از مردم آن را در ذخیره قرار داده است. 501 00:28:38,270 --> 00:28:42,520 >> اگر آن را در لیست رزرو برای بسیاری از کلاس ها، که شما چیزی می گوید. 502 00:28:42,520 --> 00:28:45,960 اگر اعضای هیات علمی در حال بررسی آن از بسیاری و دانشجویان دوره کارشناسی هستند، 503 00:28:45,960 --> 00:28:47,200 که من چیزی می گوید. 504 00:28:47,200 --> 00:28:49,280 بالعکس، که همچنین شما چیزی می گوید. 505 00:28:49,280 --> 00:28:54,680 بنابراین این امر می تواند واقعا جالب به قرار داده که اطلاعات در خارج وجود دارد و اجازه دهید 506 00:28:54,680 --> 00:28:59,969 مردم از آن استفاده کنید برای کمک به آنها را پیدا کنید با این نسخهها کار در سیستم کتابخانه. 507 00:28:59,969 --> 00:29:02,260 در سمت تلنگر از این است برخی از حریم خصوصی جدی وجود دارد 508 00:29:02,260 --> 00:29:07,854 نگرانی به خاطر یکی از اصول اصلی کتابخانه 509 00:29:07,854 --> 00:29:10,770 است که ما در حال رفتن به گفتن باشد مردم آنچه که مردم دیگر در حال خواندن. 510 00:29:10,770 --> 00:29:17,360 و حتی اگر به شما می گویند این کتاب بررسی شد چهار بار 511 00:29:17,360 --> 00:29:20,070 در یک ماه خاص، است که می تواند مورد استفاده قرار گیرد 512 00:29:20,070 --> 00:29:25,252 به پیوند بازگشت به خاص فرد توسط داده ها د-ناشناس 513 00:29:25,252 --> 00:29:26,710 و پیدا کردن که آن را بررسی کرد. 514 00:29:26,710 --> 00:29:30,792 بنابراین راه است که ما می توانیم avoid-- 515 00:29:30,792 --> 00:29:33,750 راه که ما می توانید سعی کنید برای استخراج برخی از سیگنال از تمام اطلاعات 516 00:29:33,750 --> 00:29:36,740 بدون نقض نگرانی های حریم خصوصی کسی را 517 00:29:36,740 --> 00:29:42,150 اساسا ما در نگاه 10 سال از داده استفاده، - 518 00:29:42,150 --> 00:29:43,930 >> پس از آن در طی یک دوره زمانی طولانی است. 519 00:29:43,930 --> 00:29:50,639 >> --and می گویند، خوب، بیایید ببینید که چگونه چند بار این کار مورد استفاده قرار گرفت، 520 00:29:50,639 --> 00:29:52,930 و که در این دوره از زمان، و پس از آن اساسا 521 00:29:52,930 --> 00:29:56,300 دادن تعداد، که ما تماس بگیرید نمره پشته، که اساسا 522 00:29:56,300 --> 00:29:59,910 نشان دهنده چه مقدار از آن استفاده شده است. 523 00:29:59,910 --> 00:30:01,084 و این number-- 524 00:30:01,084 --> 00:30:03,250 بسیاری از محاسبات مختلف رفتن به که تعداد. 525 00:30:03,250 --> 00:30:05,150 --but آن را بسیار خشن متریک است که به شما 526 00:30:05,150 --> 00:30:11,300 برخی از ایده چگونه جامعه ممکن است که کار ارزش. 527 00:30:11,300 --> 00:30:16,772 >> و به این ترتیب مرتب سازی بر دیگری حتی بیش گوشت از برنامه 528 00:30:16,772 --> 00:30:18,480 که مزیت طول می کشد این چیزی است 529 00:30:18,480 --> 00:30:24,000 نام Stacklife، است که در واقع در دسترس از طریق هاروارد اصلی 530 00:30:24,000 --> 00:30:24,880 پورتال کتابخانه. 531 00:30:24,880 --> 00:30:26,700 بنابراین شما به library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 شما تعدادی از متفاوت ببینید راه های جستجوی کتابخانه. 533 00:30:29,360 --> 00:30:32,300 و یکی از آنها به نام Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> و این برنامه این است که مرور محتوای کتابخانه، 535 00:30:38,980 --> 00:30:43,490 اما به طور کامل ساخته شده است در بالای این رابط های برنامه کاربردی. 536 00:30:43,490 --> 00:30:46,910 بنابراین هیچ چیز ویژه ای وجود دارد در پشت صحنه. 537 00:30:46,910 --> 00:30:49,570 هیچ دسترسی به وجود دارد داده هایی را که شما لازم نیست. 538 00:30:49,570 --> 00:30:54,090 این با استفاده از رابط های برنامه کاربردی را به شما ارائه با مرور کاملا متفاوت 539 00:30:54,090 --> 00:30:55,480 تجربه. 540 00:30:55,480 --> 00:30:58,570 >> بنابراین اگر من برای آلیس جستجو در سرزمین عجایب در این مورد، 541 00:30:58,570 --> 00:31:02,600 من گرفتن یک نتیجه است که به نظر می رسد مانند این است که بسیار much-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> این بسیار شبیه به هر جستجو دیگر شما ممکن است را انجام دهید، به جز در این مورد 544 00:31:10,870 --> 00:31:15,730 ما رتبه بندی اقلام توسط stackscore، که به شما می دهد 545 00:31:15,730 --> 00:31:19,850 برخی از ایده چگونه محبوب این اقلام در جامعه بودند. 546 00:31:19,850 --> 00:31:25,610 و به وضوح، آلیس در سرزمین عجایب توسط والت دیزنی بسیار محبوب است. 547 00:31:25,610 --> 00:31:36,570 اما شما همچنین می توانید چهار بالا ببینید در اینجا آنهایی که شما ممکن است actually-- نیست 548 00:31:36,570 --> 00:31:39,220 >> چیزهایی که بسیار استفاده می شود، اما شما ممکن است فورا نمی 549 00:31:39,220 --> 00:31:41,240 ارتباط با آلیس در سرزمین عجایب. 550 00:31:41,240 --> 00:31:44,650 بنابراین دوست قدیمی ما مشروح آلیس است که در اینجا. 551 00:31:44,650 --> 00:31:46,350 بنابراین من می توانید نگاهی به آن را. 552 00:31:46,350 --> 00:31:52,010 و در حال حاضر چه من به دنبال در اساسا مجموعه ای of-- 553 00:31:52,010 --> 00:31:53,760 من می توانم مشروح داشته آلیس در اینجا ببینید. 554 00:31:53,760 --> 00:31:56,700 من اطلاعاتی در مورد آن را دارند. 555 00:31:56,700 --> 00:32:00,230 و من نیز stackscore دارند از، در این مورد، 26. 556 00:32:00,230 --> 00:32:03,169 و این به من می گوید نوع تقریبا ما چگونه به این stackscore کردم، 557 00:32:03,169 --> 00:32:05,835 مانند که آن را بررسی می کند، مانند چگونه چند بار آن را چک شد، 558 00:32:05,835 --> 00:32:08,440 مانند دانشکده و یا دانشجویان دوره لیسانس، چگونه نسخه بسیاری از کتابخانه، 559 00:32:08,440 --> 00:32:11,300 و غیره و غیره. 560 00:32:11,300 --> 00:32:16,460 >> و شما همچنین می توانید، به اندازه کافی جالب در اینجا، فهرست پشته تقریبا. 561 00:32:16,460 --> 00:32:19,550 بنابراین داده ها در اینجا، این است به شما نشان مرتب سازی بر 562 00:32:19,550 --> 00:32:23,547 از نمایندگی های مجازی از آنچه ممکن است مفید 563 00:32:23,547 --> 00:32:25,880 مثل اگر شما را به نگاه همه منابع کتابخانه 564 00:32:25,880 --> 00:32:28,940 و آنها را با هم در یک قفسه بی نهایت. 565 00:32:28,940 --> 00:32:30,990 و چیز خوبی است که ما can-- 566 00:32:30,990 --> 00:32:33,380 >> اول از همه، ابرداده در مورد این کتاب 567 00:32:33,380 --> 00:32:35,627 اغلب شما می گوید زمانی که آن را منتشر شد. 568 00:32:35,627 --> 00:32:37,085 آن را به شما می گوید که چگونه بسیاری از صفحات آن دارد. 569 00:32:37,085 --> 00:32:38,459 این ممکن است شما را به ابعاد بگویید. 570 00:32:38,459 --> 00:32:42,930 بنابراین شما می توانید ببینید که در اینجا منعکس از نظر اندازه از کتاب. 571 00:32:42,930 --> 00:32:46,740 >> و سپس ما می توانیم استفاده پشته نمره به برجسته 572 00:32:46,740 --> 00:32:49,170 کتاب هایی که نمرات پشته بالاتر است. 573 00:32:49,170 --> 00:32:54,930 بنابراین اگر آن را تیره تر، به این معنی که، احتمالا، آن است که اغلب استفاده می شود. 574 00:32:54,930 --> 00:32:57,040 بنابراین در این مورد، من هستم رفتن به حدس می زنم که این 575 00:32:57,040 --> 00:33:03,226 نسخه آلیس در سرزمین عجایب است است که بسیار معمول استفاده می شود و بیشتر 576 00:33:03,226 --> 00:33:05,100 دیده، کتابخانه بیشترین نسخه از. 577 00:33:05,100 --> 00:33:06,975 بنابراین اگر شما به دنبال برای آلیس در سرزمین عجایب، 578 00:33:06,975 --> 00:33:10,220 این ممکن است یک جای خوب برای شروع. 579 00:33:10,220 --> 00:33:13,500 >> و سپس در اینجا شما همچنین می توانید پیوند به بیرون به، می گویند، آمازون برای خرید کتاب، 580 00:33:13,500 --> 00:33:15,182 و غیره و غیره. 581 00:33:15,182 --> 00:33:17,140 نکته در اینجا، دوباره، است به طوری که این نه 582 00:33:17,140 --> 00:33:25,030 بهترین راه به فهرست کتابخانه و یا از ابزار مناسب برای هر مناسبت. 583 00:33:25,030 --> 00:33:28,400 اما این یکی دیگر از راه انجام آن است. 584 00:33:28,400 --> 00:33:31,359 و با داده در دسترس از طریق API، که 585 00:33:31,359 --> 00:33:34,650 است از بلوک های بسیار ساده ساختمان ساخته شده، که اجازه می دهد تا شما را به جستجو در محتوا، 586 00:33:34,650 --> 00:33:39,420 شما می توانید چیزی ساخت مثل این است که می تواند 587 00:33:39,420 --> 00:33:41,520 فوق العاده بود با ارزش را به برخی از مردم. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> به طوری که مرتب سازی بر اساس، تا آنجا که من می خواهم می گویند واقعا در مورد آنچه که API است 590 00:33:51,860 --> 00:33:56,070 و آنچه در آن در معرض، را یک کل وجود دارد دسته از مسائل پشت صحنه، که 591 00:33:56,070 --> 00:33:59,480 من فقط رفتن به لمس در به طور خلاصه فقط به خاطر اینکه آن نوع در این می آید 592 00:33:59,480 --> 00:34:03,720 از زاویه کاملا متفاوت در شرایط چگونه چیزی مثل این 593 00:34:03,720 --> 00:34:04,580 دریافت به محل قرار داده؟ 594 00:34:04,580 --> 00:34:10,820 >> بنابراین API استاندارد است رابط به تمام این مطالب. 595 00:34:10,820 --> 00:34:13,820 اما به آن را دریافت وجود دارد، اولین چیزی که ما تا به حال به انجام 596 00:34:13,820 --> 00:34:17,260 جمع شد اطلاعات کتاب ها و تصاویر 597 00:34:17,260 --> 00:34:21,580 و ایدز پیدا کردن، جمع آوری سند از سیستم های مختلف دانشگاه هاروارد. 598 00:34:21,580 --> 00:34:23,929 الف، VIA، و OASIS هستند نام سیستم. 599 00:34:23,929 --> 00:34:28,820 و آنها اساسا به رفتن خط لوله، خط لوله پردازش. 600 00:34:28,820 --> 00:34:33,230 >> بنابراین اول از همه، ما صادرات فایل ها از همه از این سیستم. 601 00:34:33,230 --> 00:34:35,130 ما آنها را به موارد فردی تقسیم کردن. 602 00:34:35,130 --> 00:34:39,360 بنابراین ما باید یک فایل است، که یک گیگابایت، که دارای یک میلیون رکورد در آن است. 603 00:34:39,360 --> 00:34:42,290 بنابراین ما آن را به موارد فردی تقسیم می شود. 604 00:34:42,290 --> 00:34:45,374 سپس، برای هر مورد، ما آن را تبدیل به MODS، چرا که برخی از این 605 00:34:45,374 --> 00:34:47,040 MODS بومی هستند، برخی از آنها نیست. 606 00:34:47,040 --> 00:34:49,204 بنابراین ما همه آنها را به در قالب همان باشد. 607 00:34:49,204 --> 00:34:51,120 سپس مختلف وجود دارد مراحل غنی سازی، که در آن 608 00:34:51,120 --> 00:34:55,969 ما اطلاعات بیشتر اضافه کردن به داده از موجود در کتابخانه بود. 609 00:34:55,969 --> 00:34:59,750 بنابراین ما نیاز به اضافه کردن، اول از همه ما باید چه کتابخانه آن را نگه دارید. 610 00:34:59,750 --> 00:35:02,250 ما را از طریق یک گام از رفتن محاسبه stackscore. 611 00:35:02,250 --> 00:35:07,112 ما از طریق گام دیگری از رفتن اضافه کردن ابرداده در نظر 612 00:35:07,112 --> 00:35:10,730 از مجموعه آنچه مردم ممکن است اضافه this-- 613 00:35:10,730 --> 00:35:12,532 >> مردم در حال ایجاد مجموعه از اقلام است. 614 00:35:12,532 --> 00:35:13,990 چه مجموعه آن را متعلق؟ 615 00:35:13,990 --> 00:35:17,220 چگونه مردم برچسب این مطلب به این در گذشته؟ 616 00:35:17,220 --> 00:35:20,750 سپس شما فیلتر کردن، و شما محدود سوابق دلیل، به عنوان اشاره کردم، 617 00:35:20,750 --> 00:35:24,120 برخی از سوابق وجود دارد که، به دلیل دلایل کپی رایت، ما نمی توانیم نداشته. 618 00:35:24,120 --> 00:35:26,700 و سپس ما آنها را بارگذاری به چیزی به نام 619 00:35:26,700 --> 00:35:31,680 Solr است، که یک غلط املایی نیست، اما نام قطعه ای از نرم افزار است 620 00:35:31,680 --> 00:35:35,710 که می کند نمایه سازی جستجو، که درایوهای تمام جستجو در پشت API. 621 00:35:35,710 --> 00:35:40,110 و سپس آن را در دسترس می شود API، و مردم می توانند از آن استفاده کنید. 622 00:35:40,110 --> 00:35:44,640 >> پس این است که مانند یک نسبتا فرایند واضح و روشن. 623 00:35:44,640 --> 00:35:47,230 یکی از جالب همه چیز در مورد آن است 624 00:35:47,230 --> 00:35:50,990 که ما در حال خرید و فروش با 13 میلیون پرونده 625 00:35:50,990 --> 00:35:53,820 و ما در حال رفتن به خرید و فروش و یا بیشتر. 626 00:35:53,820 --> 00:36:01,260 و ما می خواهم که قادر به دسته این در مد نسبتا سریع. 627 00:36:01,260 --> 00:36:03,630 این مدت طولانی به طول می کشد پردازش 13 میلیون پرونده. 628 00:36:03,630 --> 00:36:09,529 >> پس چگونه این خط لوله است راه اندازی است که شما can-- 629 00:36:09,529 --> 00:36:12,070 من حدس می زنم استفاده از خط لوله، مشکل این است که ما 630 00:36:12,070 --> 00:36:15,580 تلاش برای حل در اینجا، این است که تمام تغییر و تحولات، تمام 631 00:36:15,580 --> 00:36:18,729 این مراحل در این خط لوله از هم جدا هستند. 632 00:36:18,729 --> 00:36:19,645 هیچ وابستگی وجود دارد. 633 00:36:19,645 --> 00:36:22,146 اگر شما در حال پردازش یک رکورد از یک کتاب، 634 00:36:22,146 --> 00:36:24,270 هیچ وابستگی در آن وجود دارد که بین کتاب دیگری. 635 00:36:24,270 --> 00:36:27,760 >> پس چه ما می توانیم انجام دهیم این است در واقع، در هر مرحله در خط لوله، 636 00:36:27,760 --> 00:36:30,470 ما آن را به یک صف در ابر قرار داده است. 637 00:36:30,470 --> 00:36:32,250 من رخ داده به در آمازون خدمات وب باشد. 638 00:36:32,250 --> 00:36:35,140 بنابراین یک لیست از وجود دارد، می گویند، 10،000 مواردی که 639 00:36:35,140 --> 00:36:38,100 باید نرمال و تبدیل به فرمت MODS. 640 00:36:38,100 --> 00:36:41,620 و ما چرخش به عنوان بسیاری از سرویس دهنده به عنوان ما می خواهیم، ​​شاید 10 سرور. 641 00:36:41,620 --> 00:36:44,860 و هر یک از این سرور فقط نشسته وجود دارد، به نظر می رسد که در صف، 642 00:36:44,860 --> 00:36:46,730 می بیند که یکی که نیاز به وجود دارد پردازش شود، آن را می کشد خاموش صف، 643 00:36:46,730 --> 00:36:48,740 آن را پردازش و چوب آن را در صف بعدی. 644 00:36:48,740 --> 00:36:54,200 >> و به این ترتیب آنچه که ما اجازه می دهد تا برای انجام این کار است اعمال می شود، در اصل، 645 00:36:54,200 --> 00:36:58,110 به عنوان سخت افزار آنجا که ما به این می خواهید مشکل برای یک دوره بسیار کوتاه از زمان 646 00:36:58,110 --> 00:37:02,970 برای پردازش داده ها به سرعت به عنوان ممکن است، که چیزی است که تنها، 647 00:37:02,970 --> 00:37:08,220 در حال حاضر در جهان از محاسبات ابری ما می توانیم سرور ارائه اصل 648 00:37:08,220 --> 00:37:09,890 بلافاصله، این است که مفید است. 649 00:37:09,890 --> 00:37:12,260 بنابراین ما مجبور به یک سرور غول نشسته در اطراف 650 00:37:12,260 --> 00:37:16,700 تمام زمان برای انجام پردازش که ممکن است یک هفته فقط یک بار اتفاق می افتد. 651 00:37:16,700 --> 00:37:21,440 >> به طوری که بیشتر آن است. 652 00:37:21,440 --> 00:37:27,590 این اسناد در دسترس وجود دارد برای API کتابخانه ابر مورد 653 00:37:27,590 --> 00:37:31,960 در این URL، که خواهد شد بعد در دسترس باشد. 654 00:37:31,960 --> 00:37:36,730 و لطفا به نگاهی آن را اگر هر چیزی وجود دارد، 655 00:37:36,730 --> 00:37:37,579 شما هر گونه ایده. 656 00:37:37,579 --> 00:37:38,120 بازی با آن است. 657 00:37:38,120 --> 00:37:38,830 احمق در اطراف. 658 00:37:38,830 --> 00:37:42,800 و امیدوارم شما می توانید آمده تا با چیزی بزرگ است. 659 00:37:42,800 --> 00:37:44,740 متشکرم. 660 00:37:44,740 --> 00:37:45,899