1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 JEFFREY LICHT: Hi there. 3 00:00:12,370 --> 00:00:13,550 Saya Jeffrey Licht. 4 00:00:13,550 --> 00:00:17,890 Dan saya di sini untuk bercakap dengan anda tentang Perpustakaan Harvard dan bangunan esok 5 00:00:17,890 --> 00:00:20,870 perpustakaan hari ini, saya rasa. 6 00:00:20,870 --> 00:00:23,040 Jadi latar belakang di sini, lapangan untuk sesi ini 7 00:00:23,040 --> 00:00:26,930 pada dasarnya adalah bahawa terdapat banyak data bibliografi 8 00:00:26,930 --> 00:00:28,400 yang terdapat di perpustakaan Harvard. 9 00:00:28,400 --> 00:00:33,434 Dan ada peluang, melalui beberapa alat 10 00:00:33,434 --> 00:00:36,350 dan projek yang yang sedang dibangunkan, untuk mendapatkan akses kepada maklumat yang 11 00:00:36,350 --> 00:00:42,430 dan bawa ke tempat-tempat yang yang Perpustakaan Harvard tidak lakukan sekarang, 12 00:00:42,430 --> 00:00:45,460 melakukan hal-hal baru dengan itu, eksperimen dan bermain-main dengannya. 13 00:00:45,460 --> 00:00:52,413 >> Jadi pintu masuk ke dalam ini adalah API dipanggil Harvard Perpustakaan Awan, yang 14 00:00:52,413 --> 00:00:57,650 adalah pelayan metadata terbuka, yang saya akan bercakap tentang sekarang. 15 00:00:57,650 --> 00:01:02,595 Jadi latar belakang adalah bahawa terdapat banyak perkara dalam perpustakaan Harvard. 16 00:01:02,595 --> 00:01:07,150 Kami mempunyai lebih 13 juta bibliografi rekod, berjuta-juta imej, 17 00:01:07,150 --> 00:01:11,090 dan beribu-ribu mencari bantuan, yang pada dasarnya dokumen yang menerangkan 18 00:01:11,090 --> 00:01:15,500 koleksi, berkata apa yang isinya, kotak kertas 19 00:01:15,500 --> 00:01:21,080 dan sebagainya yang mewakili lebih sejuta dokumen individu. 20 00:01:21,080 --> 00:01:24,290 Dan terdapat juga banyak maklumat bahawa perpustakaan ini mempunyai 21 00:01:24,290 --> 00:01:28,180 tentang bagaimana kandungan yang digunakan yang boleh menarik minat orang 22 00:01:28,180 --> 00:01:32,400 yang mungkin mahu bekerja dengannya. 23 00:01:32,400 --> 00:01:36,150 >> Jadi semua maklumat yang perpustakaan ini mempunyai metadata. 24 00:01:36,150 --> 00:01:39,500 Jadi metadata adalah data mengenai data. 25 00:01:39,500 --> 00:01:42,070 Oleh itu, apabila kita bercakap mengenai maklumat itu 26 00:01:42,070 --> 00:01:44,890 boleh didapati melalui perpustakaan awan yang tersedia, 27 00:01:44,890 --> 00:01:47,760 ia tidak semestinya dokumen-dokumen sebenar 28 00:01:47,760 --> 00:01:53,060 sendiri, tidak semestinya penuh teks buku atau imej yang penuh, 29 00:01:53,060 --> 00:01:54,890 walaupun yang benar-benar boleh menjadi kes itu. 30 00:01:54,890 --> 00:01:57,550 Tetapi ia adalah benar-benar maklumat mengenai data. 31 00:01:57,550 --> 00:02:00,909 >> Jadi, anda boleh memikirkan pengkatalogan maklumat, nombor panggilan, mata pelajaran, 32 00:02:00,909 --> 00:02:02,700 berapa banyak salinan buku ada, apa yang 33 00:02:02,700 --> 00:02:06,380 adalah edisi, apakah format, penulis, dan sebagainya. 34 00:02:06,380 --> 00:02:12,250 Jadi ada banyak maklumat tentang maklumat dalam koleksi itu, 35 00:02:12,250 --> 00:02:14,400 dengan sendirinya, adalah sejenis memang berguna. 36 00:02:14,400 --> 00:02:19,230 Dan walaupun jika anda melakukan kajian yang mendalam, 37 00:02:19,230 --> 00:02:25,160 anda jelas mahu mendapatkan untuk sebenar content sendiri dan melihat data, 38 00:02:25,160 --> 00:02:30,140 metadata yang berguna dari segi kedua-dua menganalisis korpus secara keseluruhannya, 39 00:02:30,140 --> 00:02:33,870 seperti apa perkara yang dalam koleksi. 40 00:02:33,870 --> 00:02:35,520 Bagaimana ia berkaitan? 41 00:02:35,520 --> 00:02:39,482 Ia benar-benar membantu anda mencari hal-hal lain, yang benar-benar tujuan utama itu. 42 00:02:39,482 --> 00:02:41,190 Titik yang metadata dan katalog 43 00:02:41,190 --> 00:02:43,230 adalah untuk membantu anda mencari semua maklumat itu 44 00:02:43,230 --> 00:02:46,590 yang terdapat di dalam koleksi. 45 00:02:46,590 --> 00:02:53,690 >> Jadi ini adalah satu contoh metadata untuk sebuah buku di Perpustakaan Harvard. 46 00:02:53,690 --> 00:02:56,370 Jadi ianya ada. 47 00:02:56,370 --> 00:02:59,850 Dan anda boleh lihat ia sebenarnya sederhana kompleks. 48 00:02:59,850 --> 00:03:04,610 Dan sebahagian daripada nilai metadata dalam sistem Perpustakaan Harvard 49 00:03:04,610 --> 00:03:09,320 adalah bahawa ia menjadi semacam dibina oleh catalogers 50 00:03:09,320 --> 00:03:12,720 dan dipasang oleh orang-orang yang memohon banyak kepakaran dan kemahiran 51 00:03:12,720 --> 00:03:20,030 dan pemikiran kepadanya dari semasa ke semasa, yang mempunyai banyak nilai. 52 00:03:20,030 --> 00:03:25,450 >> Jadi, jika anda mengambil lihat rekod ini untuk Annotated Alice, anda boleh mengetahui 53 00:03:25,450 --> 00:03:32,590 anda telah mendapat tajuk, yang menulisnya, yang pengarang, dan semua mata pelajaran yang berbeza 54 00:03:32,590 --> 00:03:35,380 yang orang telah katalog ke dalam. 55 00:03:35,380 --> 00:03:40,110 Dan anda boleh lihat ada juga, dalam Selain banyak maklumat yang baik 56 00:03:40,110 --> 00:03:42,852 di sini, ada beberapa pertindihan. 57 00:03:42,852 --> 00:03:45,560 Terdapat banyak kerumitan itu digambarkan melalui metadata 58 00:03:45,560 --> 00:03:46,300 bahawa anda mempunyai. 59 00:03:46,300 --> 00:03:50,320 >> Jadi satu tajuk buku ini adalah Adventures Alice in Wonderland. 60 00:03:50,320 --> 00:03:53,880 Jadi ini adalah beranotasi versi buku itu. 61 00:03:53,880 --> 00:03:56,380 Tetapi ia juga dipanggil Annotated Alice, Adventures Alice 62 00:03:56,380 --> 00:03:58,570 in Wonderland kerana ia sesuatu yang 63 00:03:58,570 --> 00:04:00,430 Martin Gardner menulis dan beranotasi buku. 64 00:04:00,430 --> 00:04:03,369 Dan ada banyak maklumat yang besar tentang teka-teki logik dan perkara 65 00:04:03,369 --> 00:04:05,410 dalam Alice yang anda mungkin tidak tahu tentang. 66 00:04:05,410 --> 00:04:07,000 Jadi, anda perlu pergi membacanya. 67 00:04:07,000 --> 00:04:11,940 >> Tetapi anda boleh melihat ada banyak terperinci di sini, 68 00:04:11,940 --> 00:04:15,340 termasuk pengenalan, apabila ia telah diwujudkan, di mana ia datang dari, 69 00:04:15,340 --> 00:04:17,420 dari segi Harvard sistem, dan sebagainya. 70 00:04:17,420 --> 00:04:20,350 Jadi ini adalah sampel jenis metadata 71 00:04:20,350 --> 00:04:24,340 bahawa anda mungkin melihat untuk sebuah buku dalam koleksi Perpustakaan Harvard. 72 00:04:24,340 --> 00:04:26,680 >> Ini adalah sesuatu yang sama sekali berbeza. 73 00:04:26,680 --> 00:04:32,610 Jadi ada sistem yang dipanggil VIA Harvard, yang pada asasnya 74 00:04:32,610 --> 00:04:39,990 adalah pengkatalogan imej dan objek seni dan perkara-perkara visual di seluruh Harvard, 75 00:04:39,990 --> 00:04:44,010 dan menambah beberapa metadata kepada mereka, mengklasifikasikan mereka, 76 00:04:44,010 --> 00:04:49,200 dan, dalam beberapa kes, menyediakan imej thumbnail kecil 77 00:04:49,200 --> 00:04:51,250 bahawa anda boleh mengambil melihat jika anda ingin jadi. 78 00:04:51,250 --> 00:04:54,240 >> Jadi ini adalah satu contoh yang metadata yang anda ada untuk pinggan 79 00:04:54,240 --> 00:04:57,840 dari, mungkin, Alice in Wonderland. 80 00:04:57,840 --> 00:05:00,499 Dan anda boleh lihat ada kurang metadata sini. 81 00:05:00,499 --> 00:05:02,040 Ia hanya jenis yang berbeza daripada objek. 82 00:05:02,040 --> 00:05:03,425 Dan jadi ada maklumat yang kurang. 83 00:05:03,425 --> 00:05:07,790 >> Anda kebanyakannya mempunyai fakta bahawa, panggilan nombor, pada dasarnya yang menciptakannya, - 84 00:05:07,790 --> 00:05:10,410 >> Kita tidak tahu bila ia dibuat. 85 00:05:10,410 --> 00:05:13,320 >> --and tajuk. 86 00:05:13,320 --> 00:05:14,300 >> Satu lagi contoh. 87 00:05:14,300 --> 00:05:16,380 Ini adalah bantuan dapatan. 88 00:05:16,380 --> 00:05:19,030 Jadi ada koleksi Lewis Kertas Carroll di Harvard. 89 00:05:19,030 --> 00:05:23,601 Jadi ini menerangkan apa yang adalah dalam koleksi itu. 90 00:05:23,601 --> 00:05:26,100 Jadi seseorang telah melalui dan di seluruh daerah kotak 91 00:05:26,100 --> 00:05:32,220 dan katalog itu, diberi sedikit latar belakang, menulis ringkasan apa yang di sini. 92 00:05:32,220 --> 00:05:35,290 Dan jika anda adalah untuk melihat lagi pada ini, ini 93 00:05:35,290 --> 00:05:39,620 menyala untuk laman dan halaman dan muka surat, tetapi akan memberitahu anda 94 00:05:39,620 --> 00:05:41,860 apa surat dan apa yang tarikh dari apa peti 95 00:05:41,860 --> 00:05:44,289 wujud di seluruh koleksi. 96 00:05:44,289 --> 00:05:46,330 Tetapi ini adalah sesuatu bahawa, jika anda berada di Harvard, 97 00:05:46,330 --> 00:05:50,720 anda boleh pergi dan sebenarnya melihat secara fizikal dan, mungkin, kita lihat. 98 00:05:50,720 --> 00:05:53,440 >> Jadi ini adalah semua besar. 99 00:05:53,440 --> 00:05:54,450 Ini metadata ini berguna. 100 00:05:54,450 --> 00:05:56,327 Ada dalam sistem Perpustakaan Harvard. 101 00:05:56,327 --> 00:05:58,910 Terdapat alat dalam talian di mana anda boleh pergi dan mengambil lihat pada itu, 102 00:05:58,910 --> 00:05:59,993 dan melihatnya, dan mencari ia. 103 00:05:59,993 --> 00:06:02,810 Dan anda boleh memotong dan dadu ia dalam banyak cara yang berbeza. 104 00:06:02,810 --> 00:06:06,920 >> Tetapi ia adalah benar-benar hanya tersedia jika anda adalah seorang manusia duduk 105 00:06:06,920 --> 00:06:12,600 di pelayar web anda atau sesuatu atau telefon anda dan memandu arah melaluinya. 106 00:06:12,600 --> 00:06:16,730 Ia tidak benar-benar terdapat di apa-apa jenis fesyen yang boleh digunakan 107 00:06:16,730 --> 00:06:19,520 untuk sistem lain atau komputer lain untuk menggunakan, 108 00:06:19,520 --> 00:06:21,500 tidak dengan sistem yang ada dalam Perpustakaan Harvard, 109 00:06:21,500 --> 00:06:24,890 tetapi sistem di dunia luar, hanya orang lain secara umum. 110 00:06:24,890 --> 00:06:30,210 Jadi persoalannya ialah, bagaimana boleh kita menjadikannya tersedia kepada komputer 111 00:06:30,210 --> 00:06:33,560 supaya kita boleh melakukan lebih menarik barang dengan ia daripada hanya 112 00:06:33,560 --> 00:06:36,550 melayari IT diri kita? 113 00:06:36,550 --> 00:06:39,766 >> Jadi mengapa anda mahu untuk melakukan ini? 114 00:06:39,766 --> 00:06:41,140 Terdapat banyak kemungkinan. 115 00:06:41,140 --> 00:06:43,980 Satu adalah anda boleh membina yang sama sekali cara yang berbeza melayari 116 00:06:43,980 --> 00:06:46,962 kandungan yang boleh didapati melalui Perpustakaan Harvard. 117 00:06:46,962 --> 00:06:48,670 Saya akan menunjukkan kepada anda satu kemudian dipanggil Stacklife, 118 00:06:48,670 --> 00:06:52,440 yang mempunyai yang sama sekali berbeza mengambil mencari kandungan. 119 00:06:52,440 --> 00:06:54,560 >> Anda boleh membina enjin cadangan. 120 00:06:54,560 --> 00:06:57,955 Jadi Perpustakaan Harvard tidak dalam perniagaan untuk mengatakan, anda suka buku ini. 121 00:06:57,955 --> 00:07:01,080 Kemudian pergi mengambil lihat ini 17 lain buku-buku yang mungkin anda akan berminat dalam 122 00:07:01,080 --> 00:07:03,200 atau ini 18 imej-imej lain. 123 00:07:03,200 --> 00:07:06,040 Tetapi yang pasti boleh menjadi ciri berharga. 124 00:07:06,040 --> 00:07:09,272 Dan diberikan metadata, ia boleh menjadi mungkin untuk meletakkan bahawa bersama-sama. 125 00:07:09,272 --> 00:07:11,980 Anda mungkin mempunyai keperluan yang berbeza dalam segi mencari kandungan, 126 00:07:11,980 --> 00:07:16,200 seperti mungkin walaupun alat-alat yang boleh didapati bahawa perpustakaan membuat 127 00:07:16,200 --> 00:07:18,450 yang ada, anda mungkin mahu untuk mencari cara yang berbeza 128 00:07:18,450 --> 00:07:21,847 atau mengoptimumkan untuk kes penggunaan tertentu, yang mungkin ia sangat khusus. 129 00:07:21,847 --> 00:07:23,930 Mungkin terdapat hanya beberapa orang di dunia ini yang 130 00:07:23,930 --> 00:07:25,846 ingin mencari kandungan dengan cara ini, tetapi ia 131 00:07:25,846 --> 00:07:28,985 akan menjadi besar jika kita boleh membiarkan mereka berbuat demikian. 132 00:07:28,985 --> 00:07:30,860 Terdapat banyak analisis hanya dalam bagaimana orang 133 00:07:30,860 --> 00:07:33,860 menggunakan kandungan yang akan benar-benar menarik untuk mengetahui tentang, mengetahui 134 00:07:33,860 --> 00:07:37,280 apa buku yang digunakan, apa yang tidak, dan sebagainya. 135 00:07:37,280 --> 00:07:41,670 Dan kemudian ada banyak peluang untuk mengintegrasikan 136 00:07:41,670 --> 00:07:45,210 dengan maklumat lain yang di luar sana di web. 137 00:07:45,210 --> 00:07:46,880 Oleh itu, kita have-- 138 00:07:46,880 --> 00:07:50,260 >> Sebagai contoh, NPR mempunyai segmen ulasan buku, 139 00:07:50,260 --> 00:07:53,090 di mana mereka menemubual penulis tentang buku. 140 00:07:53,090 --> 00:07:56,837 Dan supaya ia akan menjadi besar jika anda mencari sebuah buku di Harvard 141 00:07:56,837 --> 00:07:59,670 Perpustakaan, dan kamu berkata, OK, ada menjadi satu temu bual dengan penulis. 142 00:07:59,670 --> 00:08:00,878 Jom kita lihat itu. 143 00:08:00,878 --> 00:08:05,461 Atau ada halaman Wikipedia, sebagai berwibawa, rujukan ilmiah 144 00:08:05,461 --> 00:08:07,710 tentang buku ini yang anda mungkin mahu mengambil lihat. 145 00:08:07,710 --> 00:08:12,600 >> Terdapat jenis sumber tersebar di seluruh web. 146 00:08:12,600 --> 00:08:16,555 Dan membawa mereka bersama-sama boleh menjadi penggunaan yang besar 147 00:08:16,555 --> 00:08:18,930 kepada seseorang melihat kandungan, mencari sesuatu. 148 00:08:18,930 --> 00:08:20,180 Tetapi ia juga tidak jenis perkara yang anda hendak 149 00:08:20,180 --> 00:08:23,205 mahu perpustakaan untuk bertanggungjawab untuk turun dan memburu ke bawah 150 00:08:23,205 --> 00:08:25,455 semua sumber-sumber yang berbeza dan memasang mereka bersama-sama 151 00:08:25,455 --> 00:08:28,920 kerana mereka berubah secara berterusan. 152 00:08:28,920 --> 00:08:33,570 Dan apa yang mereka fikir adalah penting Mei tidak apa yang anda anggap penting. 153 00:08:33,570 --> 00:08:36,929 >> Dan lebih-lebih lagi, pada dasarnya ada banyak perkara yang kami tidak terfikir lagi. 154 00:08:36,929 --> 00:08:42,222 Jadi jika kita boleh membuka sehingga ini, lebih orang yang lain dari setengah dozen atau lebih, 155 00:08:42,222 --> 00:08:45,174 yang sedang melihat ini pada secara tetap boleh memikirkan idea-idea 156 00:08:45,174 --> 00:08:47,340 dan mengurut data, dan melakukan apa yang mereka mahu dengan ia. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> Jadi kami ingin ini data yang sedia ada kepada dunia. 159 00:08:54,045 --> 00:08:55,670 Nah, terdapat beberapa komplikasi. 160 00:08:55,670 --> 00:08:58,540 Satu adalah bahawa metadata ini adalah dalam sistem yang berbeza. 161 00:08:58,540 --> 00:09:01,110 Ada dalam format yang berbeza. 162 00:09:01,110 --> 00:09:04,719 Jadi ada beberapa normalisasi yang perlu berlaku, 163 00:09:04,719 --> 00:09:08,010 yang normal kerana proses membawa perkara-perkara dari format yang berbeza 164 00:09:08,010 --> 00:09:12,940 dan pemetaan mereka kepada format tunggal supaya bidang akan berpadanan. 165 00:09:12,940 --> 00:09:15,160 >> Terdapat beberapa sekatan hak cipta. 166 00:09:15,160 --> 00:09:21,010 Cukup aneh, kemasukan Katalog tentang buku adalah bertanggungjawab untuk hak cipta. 167 00:09:21,010 --> 00:09:24,060 Jadi, walaupun ia hanya maklumat yang diperoleh daripada buku, 168 00:09:24,060 --> 00:09:25,330 itu hak cipta. 169 00:09:25,330 --> 00:09:28,400 Dan bergantung kepada yang sebenarnya mencipta metadata yang, 170 00:09:28,400 --> 00:09:32,175 mungkin ada sekatan ke atas yang boleh mengedarkannya, supaya- sama 171 00:09:32,175 --> 00:09:33,402 >> Saya tidak tahu. 172 00:09:33,402 --> 00:09:36,110 Ia mungkin atau mungkin tidak sama dengan keadaan lirik lagunya, 173 00:09:36,110 --> 00:09:36,610 sebagai contoh. 174 00:09:36,610 --> 00:09:38,560 Oleh itu, kita semua tahu bagaimana yang kuali keluar. 175 00:09:38,560 --> 00:09:40,450 Oleh itu, anda perlu mendapatkan sekitar isu itu. 176 00:09:40,450 --> 00:09:44,910 >> Dan kemudian sekeping lain adalah bahawa terdapat banyak data. 177 00:09:44,910 --> 00:09:52,420 Jadi, jika saya seseorang yang mahu bekerja dengan data atau mempunyai idea yang sejuk, 178 00:09:52,420 --> 00:09:55,350 berurusan dengan 14 juta rekod di laptop saya 179 00:09:55,350 --> 00:09:57,487 boleh menjadi bermasalah dan sukar untuk menguruskan. 180 00:09:57,487 --> 00:09:59,320 Oleh itu, kita mahu mengurangkan halangan untuk orang 181 00:09:59,320 --> 00:10:02,130 dapat bekerja dengan data. 182 00:10:02,130 --> 00:10:07,880 >> Jadi pendekatan yang diharapkan alamat semua kebimbangan ini adalah dua bahagian. 183 00:10:07,880 --> 00:10:11,770 Satu sedang membina sebuah platform yang mengambil data daripada semua sumber-sumber yang berbeza 184 00:10:11,770 --> 00:10:14,350 dan memburukkan itu, menormalkan, memperkaya, dan jenama 185 00:10:14,350 --> 00:10:16,650 ia boleh didapati di satu lokasi. 186 00:10:16,650 --> 00:10:20,950 Dan ia menjadikan ia boleh didapatkan melalui API awam yang orang boleh memanggil. 187 00:10:20,950 --> 00:10:24,430 >> Jadi API adalah Aplikasi Programming Interface. 188 00:10:24,430 --> 00:10:28,930 Dan pada dasarnya merujuk kepada Titik akhir yang sistem atau teknologi 189 00:10:28,930 --> 00:10:31,720 boleh memanggil dan mendapatkan data kembali dalam format yang berstruktur dengan cara yang 190 00:10:31,720 --> 00:10:32,900 bahawa ia boleh digunakan. 191 00:10:32,900 --> 00:10:36,060 Jadi ia bukan bergantung berterusan ke laman web 192 00:10:36,060 --> 00:10:37,970 dan mengikis off data itu, sebagai contoh. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> Jadi ini adalah laman utama Perkara yang API Perpustakaan Awan, 195 00:10:45,010 --> 00:10:47,220 yang pada dasarnya adalah versi dua. 196 00:10:47,220 --> 00:10:50,130 Jadi ia lelaran kedua cuba untuk membuat semua data ini 197 00:10:50,130 --> 00:10:53,280 kepada dunia. 198 00:10:53,280 --> 00:10:59,560 Jadi ia http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 Dan hanya untuk memecahkan ini turun sedikit, apa ini bermakna 200 00:11:03,830 --> 00:11:06,115 adalah bahawa ini adalah versi dua API. 201 00:11:06,115 --> 00:11:08,490 Terdapat versi satu, yang Saya tidak akan bercakap tentang. 202 00:11:08,490 --> 00:11:09,750 Tetapi ada satu versi. 203 00:11:09,750 --> 00:11:14,740 >> Dan jika anda sedang gunakan ini API, anda mendapat barangan. 204 00:11:14,740 --> 00:11:20,640 Dan sebahagian daripada idea penubuhan sebuah API API adalah kontrak yang. 205 00:11:20,640 --> 00:11:23,440 Ia sesuatu yang tidak akan berubah. 206 00:11:23,440 --> 00:11:24,850 Jadi, sebagai contoh, - 207 00:11:24,850 --> 00:11:27,410 >> Dan sebab itu adalah bahawa jika saya membina beberapa jenis sistem yang 208 00:11:27,410 --> 00:11:33,210 akan menggunakan API perpustakaan awan untuk memaparkan buku-buku atau membantu orang mencari 209 00:11:33,210 --> 00:11:36,190 maklumat dengan cara yang unik, apa yang kita tidak mahu berlaku 210 00:11:36,190 --> 00:11:38,940 adalah untuk kita menukar cara API yang bekerja, dan tiba-tiba 211 00:11:38,940 --> 00:11:41,340 semua yang memecah di sebelah pengguna akhir. 212 00:11:41,340 --> 00:11:46,710 Jadi sebahagian daripada jika anda membuat API kepada dunia, ia 213 00:11:46,710 --> 00:11:49,396 amalan yang baik untuk meletakkan nombor versi di dalamnya sehingga orang 214 00:11:49,396 --> 00:11:51,020 mengetahui apakah versi mereka berurusan dengan. 215 00:11:51,020 --> 00:11:54,300 >> Jadi, jika kita membuat keputusan kita mencari cara yang lebih baik membuat maklumat ini, 216 00:11:54,300 --> 00:11:57,295 kita mungkin berubah bahawa untuk memanggil bahawa versi tiga. 217 00:11:57,295 --> 00:11:59,920 Jadi semua orang yang masih menggunakan versi dua, yang masih akan bekerja. 218 00:11:59,920 --> 00:12:03,490 Tetapi versi tiga akan mempunyai semua barangan yang baru. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> Jadi ini adalah API, tetapi ini benar-benar kelihatan seperti URL. 221 00:12:09,210 --> 00:12:11,680 Dan jadi apa ini adalah contoh adalah apa yang 222 00:12:11,680 --> 00:12:16,615 dikenali sebagai API lain, yang boleh didapati lebih hanya sambungan web biasa. 223 00:12:16,615 --> 00:12:19,680 Dan anda boleh sebenarnya pergi ke dalam penyemak imbas. 224 00:12:19,680 --> 00:12:28,550 >> Jadi di sini saya baru sahaja membuka Firefox dan pergi ke api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 Dan jadi apa yang saya dapatkan di sini adalah pada dasarnya halaman pertama 226 00:12:31,560 --> 00:12:34,740 keputusan daripada keseluruhan set item yang kami ada. 227 00:12:34,740 --> 00:12:37,460 Dan ia di sini dalam format XML. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 Dan ia juga menjadi prettified oleh Firefox. 230 00:12:42,210 --> 00:12:45,850 Ia tidak benar-benar mempunyai semua ini sedikit mengembang dan mengecut 231 00:12:45,850 --> 00:12:47,880 doohickeys sini. 232 00:12:47,880 --> 00:12:52,520 Ini adalah jenis yang lebih bagus cara versi untuk melihat ia. 233 00:12:52,520 --> 00:12:57,040 >> Tetapi apa yang ini memberitahu kita adalah Saya telah meminta semua perkara. 234 00:12:57,040 --> 00:13:03,120 Jadi terdapat 13289475 item. 235 00:13:03,120 --> 00:13:06,150 Dan saya melihat pertama 10, bermula dari kedudukan sifar 236 00:13:06,150 --> 00:13:09,760 kerana dalam sains komputer kita selalu bermula pada sifar. 237 00:13:09,760 --> 00:13:15,150 Dan apa yang saya ada di sini, kalau aku runtuh ini, anda akan melihat saya telah mendapat 10 perkara. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> Dan jika saya mengambil lihat pada item, saya boleh melihat bahawa saya telah mendapat maklumat mengenainya. 240 00:13:25,210 --> 00:13:27,400 Dan ini adalah apa yang dipanggil bentuk arena. 241 00:13:27,400 --> 00:13:30,860 Dan jadi saya akan menukar semula di sini untuk seketika. 242 00:13:30,860 --> 00:13:33,750 OK. 243 00:13:33,750 --> 00:13:37,447 >> Jadi mari kita mencari sesuatu di tertentu kerana perkara pertama yang 244 00:13:37,447 --> 00:13:40,030 berlaku untuk datang apabila anda melihat penggunaan melalui keseluruhan koleksi 245 00:13:40,030 --> 00:13:41,750 adalah, mengikut definisi, secara rawak. 246 00:13:41,750 --> 00:13:44,550 Jadi mari kita lihat beberapa donat. 247 00:13:44,550 --> 00:13:46,830 Oh. 248 00:13:46,830 --> 00:13:49,190 >> OK. 249 00:13:49,190 --> 00:13:49,940 Jadi donat. 250 00:13:49,940 --> 00:13:55,360 Oleh itu, kita mendapati terdapat 80 item dalam koleksi bahawa rujukan donat. 251 00:13:55,360 --> 00:13:57,150 Kami sedang mencari di 10 pertama mereka. 252 00:13:57,150 --> 00:14:01,890 Sekarang, anda boleh lihat di sini cara yang Saya berkata, saya sedang mencari donat, 253 00:14:01,890 --> 00:14:04,400 Saya hanya menambah sesuatu untuk rentetan pertanyaan URL. 254 00:14:04,400 --> 00:14:09,680 Jadi q sama donat, yang anda boleh melihat sedikit lebih mudah di sini. 255 00:14:09,680 --> 00:14:12,131 >> Dan ini pada dasarnya bermakna ada a spec untuk API, yang 256 00:14:12,131 --> 00:14:13,880 mentakrifkan apa semua parameter ini bermakna. 257 00:14:13,880 --> 00:14:17,150 Dan ini bermakna kita akan mencari segala-galanya untuk donat. 258 00:14:17,150 --> 00:14:24,910 >> Jadi perkara yang pertama di sini kita mempunyai anda boleh melihat tajuk adalah Donuts, 259 00:14:24,910 --> 00:14:29,310 dan terdapat sari kata bernama Suatu Passion Amerika, yang adalah, saya rasa, 260 00:14:29,310 --> 00:14:31,610 yang sesuai. 261 00:14:31,610 --> 00:14:36,134 Terdapat banyak different-- 262 00:14:36,134 --> 00:14:38,050 Setelah anda mendapatkan ke titik di mendapatkan data, 263 00:14:38,050 --> 00:14:41,020 terdapat banyak berbeza format yang anda boleh mendapatkan ke dalam. 264 00:14:41,020 --> 00:14:44,050 Dan terdapat beberapa kekuatan yang berbeza dan kelemahan untuk mereka semua. 265 00:14:44,050 --> 00:14:49,000 Jadi satu ini, anda boleh melihat di sini, borang ini adalah sangat kaya. 266 00:14:49,000 --> 00:14:51,946 Dan ia diseragamkan. 267 00:14:51,946 --> 00:14:55,040 >> Jadi ada tajuk tertentu lapangan, medan sari kata. 268 00:14:55,040 --> 00:14:58,950 Ada silih ganti tajuk, Satu Passion Amerika. 269 00:14:58,950 --> 00:15:01,650 Terdapat nama yang dikaitkan dengannya. 270 00:15:01,650 --> 00:15:03,120 Jenis sumber adalah teks. 271 00:15:03,120 --> 00:15:06,070 Ada banyak maklumat di sini dalam format ini. 272 00:15:06,070 --> 00:15:09,480 >> Tetapi ada sekumpulan format yang berbeza. 273 00:15:09,480 --> 00:15:11,920 Jadi apa yang kita hanya melihat adalah format yang 274 00:15:11,920 --> 00:15:17,700 dipanggil Mods, yang bermaksud Metadata Objek Penerangan Perkhidmatan, 275 00:15:17,700 --> 00:15:18,250 berpotensi. 276 00:15:18,250 --> 00:15:23,030 Saya sebenarnya tidak berapa pasti tentang S. Tetapi ia format yang agak kompleks. 277 00:15:23,030 --> 00:15:24,240 Ia format lalai. 278 00:15:24,240 --> 00:15:30,260 >> Tetapi ia adalah mereka yang memelihara kekayaan semua data yang 279 00:15:30,260 --> 00:15:33,820 bahawa perpustakaan mempunyai kerana ia sangat dekat dengan apa yang 280 00:15:33,820 --> 00:15:35,110 perpustakaan yang menggunakan dalaman. 281 00:15:35,110 --> 00:15:39,030 Ia adalah satu standard yang digunakan di seluruh negara, 282 00:15:39,030 --> 00:15:40,944 di seluruh dunia dalam perpustakaan akademik. 283 00:15:40,944 --> 00:15:42,110 Dan ia amat saling beroperasi. 284 00:15:42,110 --> 00:15:44,852 Jadi jika anda telah mendapat dokumen yang yang adalah dalam format arena, 285 00:15:44,852 --> 00:15:47,560 anda boleh memberikan yang kepada orang lain sistem yang memahami Mods, 286 00:15:47,560 --> 00:15:48,518 dan mereka boleh mengimportnya. 287 00:15:48,518 --> 00:15:50,840 Jadi ia satu standard. 288 00:15:50,840 --> 00:15:54,250 Ia sangat ditakrifkan dengan baik, yang sangat khusus. 289 00:15:54,250 --> 00:15:58,980 Dan itulah yang menjadikannya antara operasi kerana jika seseorang berkata, 290 00:15:58,980 --> 00:16:04,930 ini adalah tajuk silih ganti rekod, semua orang tahu apa yang bermakna. 291 00:16:04,930 --> 00:16:07,740 Pada sebelah flip, ia sangat rumit. 292 00:16:07,740 --> 00:16:13,160 >> Jadi, jika anda melihat dengan rekod ini di sini, 293 00:16:13,160 --> 00:16:15,320 jika saya hanya mahu untuk mendapatkan Tajuk dokumen ini, 294 00:16:15,320 --> 00:16:21,150 buku ini, yang mungkin Donuts, Satu Passion Amerika, menghuraikan keluar 295 00:16:21,150 --> 00:16:22,940 adalah sedikit terlibat. 296 00:16:22,940 --> 00:16:27,380 Manakala terdapat satu lagi format dipanggil Dublin Core, 297 00:16:27,380 --> 00:16:29,730 yang jauh, format yang lebih mudah. 298 00:16:29,730 --> 00:16:33,764 >> Dan supaya anda lihat di sini, tidak ada tajuk, sari kata, tajuk ganti. 299 00:16:33,764 --> 00:16:35,930 Hanya ada tajuk, Donuts, Satu Passion Amerika, 300 00:16:35,930 --> 00:16:38,780 dan satu lagi tajuk, Passion Amerika. 301 00:16:38,780 --> 00:16:42,907 Oleh itu, apabila anda melihat apa bentuk anda ingin mendapatkan data daripada, 302 00:16:42,907 --> 00:16:44,740 banyak bergantung kepada bagaimana anda akan menggunakannya. 303 00:16:44,740 --> 00:16:46,573 Adakah anda menggunakan untuk antara operasi atau adakah anda 304 00:16:46,573 --> 00:16:49,970 mahukan sesuatu yang mudah yang mungkin lebih mudah untuk bekerja dengan? 305 00:16:49,970 --> 00:16:56,002 >> Pada sebelah flip, banyak yang mendapatkan butiran semacam squished ke bawah. 306 00:16:56,002 --> 00:16:58,460 Anda mungkin kehilangan nuansa apa cara bidang tertentu 307 00:16:58,460 --> 00:17:02,960 jika anda berurusan dengan Dublin Core, yang anda tidak akan mendapat dengan arena. 308 00:17:02,960 --> 00:17:06,462 Jadi mereka adalah dua daripada format anda boleh keluar dari API. 309 00:17:06,462 --> 00:17:08,920 Dan pada dasarnya, kita menjaga di belakang tabir dalam arena. 310 00:17:08,920 --> 00:17:14,179 Tetapi kita boleh memberikan anda dalam arena dan Dublin Core dan apa-apa lagi serta. 311 00:17:14,179 --> 00:17:16,470 Pertimbangan lain apabila yang anda cari dalam data yang 312 00:17:16,470 --> 00:17:21,210 adalah anda boleh mendapatkan ia sebagai sama ada JSON, yang bermaksud JavaScript Objek Notasi, 313 00:17:21,210 --> 00:17:24,720 atau XML, yang bermaksud Extensible Markup Language. 314 00:17:24,720 --> 00:17:30,080 Dan ini perwakilan data kedua-dua mempunyai tepat data yang sama, betul-betul 315 00:17:30,080 --> 00:17:31,080 aliran yang sama. 316 00:17:31,080 --> 00:17:33,644 Tetapi mereka hanya sintaksis yang berbeza. 317 00:17:33,644 --> 00:17:40,401 >> Jadi ini adalah a-- 318 00:17:40,401 --> 00:17:41,400 Nah, mari kita menukar. 319 00:17:41,400 --> 00:17:47,490 Jadi ini adalah pertanyaan kami untuk donat dalam format XML. 320 00:17:47,490 --> 00:17:53,470 Jika saya menukar ini menjadi JSON, Saya dapat melihat ia kelihatan berbeza. 321 00:17:53,470 --> 00:17:58,580 Jadi sekarang ini adalah kandungan yang sama, tetapi struktur yang berbeza. 322 00:17:58,580 --> 00:18:00,080 Terdapat kurungan sudut yang lebih sedikit. 323 00:18:00,080 --> 00:18:02,530 Ada kurang berjela-jela. 324 00:18:02,530 --> 00:18:06,440 >> Dan ini adalah format yang, jika anda bekerja dalam persekitaran web, 325 00:18:06,440 --> 00:18:09,680 anda kemungkinan besar akan mahu menggunakan kerana satu 326 00:18:09,680 --> 00:18:12,630 satu perkara yang menarik mengenai JSON adalah ia serasi dengan JavaScript. 327 00:18:12,630 --> 00:18:17,680 Jadi, jika saya menulis aplikasi web, saya boleh tarik dalam JSON dan hanya bekerja dengannya secara langsung. 328 00:18:17,680 --> 00:18:20,187 Manakala dengan XML, ia adalah satu sedikit sedikit lebih rumit. 329 00:18:20,187 --> 00:18:21,520 Jadi sekali lagi, ini adalah kedua-dua berguna. 330 00:18:21,520 --> 00:18:26,387 Mereka hanya kes-kes penggunaan yang berbeza di mana orang mungkin mahu menggunakannya. 331 00:18:26,387 --> 00:18:26,886 OK. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 Jadi kembali kepada API. 334 00:18:31,680 --> 00:18:32,900 Oleh itu, kita boleh mencari bagi- 335 00:18:32,900 --> 00:18:36,220 >> Saya berikan satu contoh mencari donat. 336 00:18:36,220 --> 00:18:39,330 Kami juga boleh mencari hanya dalam bidang tertentu dalam sini. 337 00:18:39,330 --> 00:18:41,310 Jadi, daripada mencari rekod keseluruhan, 338 00:18:41,310 --> 00:18:43,870 Saya hanya boleh mencari bidang tajuk. 339 00:18:43,870 --> 00:18:48,810 Dan sehingga kini terdapat 25 perkara-perkara yang mempunyai donat dalam tajuk, satu daripadanya 340 00:18:48,810 --> 00:18:52,430 adalah tentang mengembalikan tanah lembap dalam pengurusan 341 00:18:52,430 --> 00:18:54,990 lubang dalam donat program, yang mungkin 342 00:18:54,990 --> 00:18:58,970 tidak semestinya apa yang kita cari apabila kita mencari donat. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> Anda juga boleh, apabila anda berurusan dengan API-- satu 345 00:19:05,490 --> 00:19:08,827 >> Sebahagian daripada mempunyai API memberi orang akses kepada set data yang besar. 346 00:19:08,827 --> 00:19:11,410 Dan terdapat beberapa yang berbeza alat yang anda boleh gunakan untuk berbuat demikian. 347 00:19:11,410 --> 00:19:14,170 Satu adalah, sangat mudah, anda boleh halaman melalui data. 348 00:19:14,170 --> 00:19:17,340 Jadi, seolah-olah anda lakukan pertanyaan melalui antara muka web, 349 00:19:17,340 --> 00:19:19,470 anda boleh melihat halaman satu, halaman dua, tiga halaman. 350 00:19:19,470 --> 00:19:22,040 Anda boleh melakukan perkara yang sama perkara melalui API. 351 00:19:22,040 --> 00:19:24,150 Anda hanya perlu menjadi jelas dalam bagaimana anda melakukannya. 352 00:19:24,150 --> 00:19:29,511 >> Sebagai contoh, jika saya sedang mencari pada pertanyaan pertama saya di sini, 353 00:19:29,511 --> 00:19:32,510 di mana saya melakukan carian untuk sesuatu dengan donat dalam tajuk, saya boleh katakan, 354 00:19:32,510 --> 00:19:35,415 dan had bersamaan 20, yang bermaksud memberi saya 20 rekod pertama, tidak 355 00:19:35,415 --> 00:19:38,540 10 pertama, yang lalai, kerana saya mahu melihat 20 pada satu masa. 356 00:19:38,540 --> 00:19:43,435 Atau saya boleh katakan, menetapkan memulakan bersamaan dengan 20 dan had 357 00:19:43,435 --> 00:19:47,150 sama dengan 20, yang akan memberi saya merekodkan 21 melalui 40. 358 00:19:47,150 --> 00:19:52,680 >> Jadi saya rasa perkara yang untuk mengambil di sini adalah 359 00:19:52,680 --> 00:19:57,290 bahawa kita menggunakan tali pertanyaan untuk menetapkan parameter pada pertanyaan itu. 360 00:19:57,290 --> 00:20:02,760 Dan ia membolehkan kawalan anda apa yang anda kembali. 361 00:20:02,760 --> 00:20:05,980 >> Satu lagi alat yang boleh anda gunakan, - 362 00:20:05,980 --> 00:20:09,250 >> Dan ini adalah benar-benar membantu dalam segi meneroka data. 363 00:20:09,250 --> 00:20:10,840 >> --is sesuatu yang dinamakan faceting. 364 00:20:10,840 --> 00:20:15,530 Jadi faceting istilah ini tidak semestinya sama. 365 00:20:15,530 --> 00:20:16,880 Tetapi anda semua telah melihat sebelum ini. 366 00:20:16,880 --> 00:20:18,630 Jika anda lihat di Amazon, sebagai contoh, 367 00:20:18,630 --> 00:20:20,870 dan anda melakukan carian untuk donat dalam buku, 368 00:20:20,870 --> 00:20:27,080 di sini mereka telah mendapat satu siri buku-buku, dan mereka dikumpulkan mengikut kategori, 369 00:20:27,080 --> 00:20:30,470 dan anda mendapat kategori yang berbeza, dan berapa banyak buku dalam setiap kategori 370 00:20:30,470 --> 00:20:31,330 muncul. 371 00:20:31,330 --> 00:20:33,420 >> Jadi ini adalah pada dasarnya satu aspek. 372 00:20:33,420 --> 00:20:37,570 Anda mengambil semua buku-buku mereka, yang 1,800 buku-buku yang sesuai dengan donat di Amazon. 373 00:20:37,570 --> 00:20:39,820 12 daripada mereka adalah dalam kategori sarapan. 374 00:20:39,820 --> 00:20:43,100 21 dalam pastri dan baking, dan sebagainya dan sebagainya. 375 00:20:43,100 --> 00:20:47,670 >> Jadi ini adalah benar-benar yang berguna alat untuk meneroka kandungan 376 00:20:47,670 --> 00:20:53,260 di perpustakaan serta kerana apabila anda melihat satu aspek, 377 00:20:53,260 --> 00:20:56,520 ia memberi anda idea tentang apa subjek wujud, seperti apa jenis mata pelajaran 378 00:20:56,520 --> 00:20:58,510 adalah yang paling popular dalam set pertanyaan anda. 379 00:20:58,510 --> 00:21:00,950 Dan ia membantu anda memandu kira dan meneroka. 380 00:21:00,950 --> 00:21:02,770 Oleh itu, kita boleh melakukan perkara yang sama. 381 00:21:02,770 --> 00:21:05,940 >> Jika kita mahu menggunakan API dan melihat aspek, 382 00:21:05,940 --> 00:21:08,950 kami menambah satu lagi parameter untuk rakan kami rentetan pertanyaan. 383 00:21:08,950 --> 00:21:12,540 Jadi aspek sama yang dipisahkan oleh koma senarai apa yang kita mahu pada aspek. 384 00:21:12,540 --> 00:21:14,790 Jadi salah satu aspek mungkin tertakluk. 385 00:21:14,790 --> 00:21:16,565 Satu lagi mungkin bahasa. 386 00:21:16,565 --> 00:21:19,665 Dan jadi jika kita berjalan pertanyaan itu, kami get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 Ia kelihatan cukup banyak yang sama di sini. 389 00:21:24,830 --> 00:21:29,010 Tetapi kami telah menambah ke akhir senarai satu set aspek. 390 00:21:29,010 --> 00:21:34,060 Oleh itu, kita mempunyai aspek yang dikenali sebagai mata pelajaran. 391 00:21:34,060 --> 00:21:40,250 Jadi ini memberitahu kita bahawa jika saya melihat pada 80 keputusan saya dari pertanyaan donat, 392 00:21:40,250 --> 00:21:42,100 13 daripada mereka mempunyai tertakluk Amerika Syarikat. 393 00:21:42,100 --> 00:21:43,684 Tiga mempunyai donat tertakluk. 394 00:21:43,684 --> 00:21:45,600 Tiga mempunyai subjek daripada pemulihan paya, 395 00:21:45,600 --> 00:21:47,720 yang mungkin kami dalam lubang donat. 396 00:21:47,720 --> 00:21:51,780 Dua daripada mereka, Simpsons, dan sebagainya dan sebagainya. 397 00:21:51,780 --> 00:21:59,211 >> Jadi ini boleh menjadi berguna jika anda mahu menyempitkan carian anda. 398 00:21:59,211 --> 00:22:00,210 Ia boleh membantu anda melakukannya. 399 00:22:00,210 --> 00:22:03,580 Terutamanya jika anda mempunyai lebih daripada, katakan, 80 keputusan. 400 00:22:03,580 --> 00:22:05,980 >> Begitu juga, kita juga meminta untuk aspek bahasa. 401 00:22:05,980 --> 00:22:14,790 Oleh itu, jika kita melihat keputusan kami, kami melihat 76 daripada mereka adalah dalam bahasa Inggeris, empat di Perancis, 402 00:22:14,790 --> 00:22:19,620 dua di Sepanyol, dua, saya rasa itulah undefined atau tidak diketahui, Belanda dan Latin. 403 00:22:19,620 --> 00:22:22,830 Jadi saya fikir Latin hasil donut, sekali lagi, 404 00:22:22,830 --> 00:22:24,922 mempunyai apa-apa kaitan dengan barang-barang bakar. 405 00:22:24,922 --> 00:22:25,630 Tetapi ada anda pergi. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> Jadi ini adalah semacam menunjukkan anda bagaimana anda boleh menarik kandungan belakang 408 00:22:38,630 --> 00:22:41,270 dari API hanya melalui pelayar web, yang besar. 409 00:22:41,270 --> 00:22:44,320 Tetapi ia tidak benar-benar apa yang anda lakukan biasanya menjadi dalam menggunakan API untuk itu. 410 00:22:44,320 --> 00:22:48,710 Jadi, satu contoh bagaimana anda sebenarnya boleh melakukan ini adalah saya telah 411 00:22:48,710 --> 00:22:54,720 menulis program super kecil, yang, sekali lagi, adakah carian donat saya 412 00:22:54,720 --> 00:22:59,010 dan memilih beberapa bidang dan memaparkannya dalam jadual. 413 00:22:59,010 --> 00:23:01,610 Jadi ini adalah sangat banyak yang kandungan yang sama kita hanya 414 00:23:01,610 --> 00:23:04,830 saw dengan bidang beberapa ditarik keluar. 415 00:23:04,830 --> 00:23:12,090 Jadi senarai tajuk, yang lokasi apa buku 416 00:23:12,090 --> 00:23:15,120 adalah kira-kira, bahasa, dan sebagainya dan sebagainya. 417 00:23:15,120 --> 00:23:20,480 >> Jadi bagaimana ini sebenarnya berlaku, sejak Saya rasa kita perlu melihat beberapa kod, 418 00:23:20,480 --> 00:23:22,420 is-- 419 00:23:22,420 --> 00:23:28,060 >> Apa yang kita ada di sini adalah mudah HTML Laman yang memaparkan teks, 420 00:23:28,060 --> 00:23:32,900 selamat datang ke awan perpustakaan dan kemudian memaparkan jadual keputusan. 421 00:23:32,900 --> 00:23:37,790 Dan ada jelas tidak keputusan dalam meja apabila halaman yang mendapat dimuatkan. 422 00:23:37,790 --> 00:23:41,380 Tetapi apa yang kita lakukan adalah, pertama sekali, kita 423 00:23:41,380 --> 00:23:46,290 yang memuatkan perpustakaan dipanggil jQuery, yang pada dasarnya 424 00:23:46,290 --> 00:23:52,030 perpustakaan JavaScript, yang menjadikannya sangat mudah untuk memanipulasi JavaScript 425 00:23:52,030 --> 00:23:58,780 Asli, HTML, dan membuat laman web, logik pihak pelanggan dan laman web. 426 00:23:58,780 --> 00:24:01,595 >> Jadi apa yang kita ada di sini adalah jQuery mempunyai kaedah yang dikenali sebagai Get, 427 00:24:01,595 --> 00:24:05,270 yang pada dasarnya akan pergi ke URL yang, yang, dalam kes ini, 428 00:24:05,270 --> 00:24:09,070 URL adalah biasa ini mencari. 429 00:24:09,070 --> 00:24:14,440 Dan kemudian akan mendapatkan kandungan daripada bahawa URL dan kemudian menjalankan fungsi di atasnya. 430 00:24:14,440 --> 00:24:19,240 Oleh itu, kita berkata pergi ke api.lib.harvard / edu. 431 00:24:19,240 --> 00:24:20,060 Cari donat. 432 00:24:20,060 --> 00:24:21,300 Beri kami 20 rekod. 433 00:24:21,300 --> 00:24:28,590 Dan kemudian jalankan fungsi ini, yang Saya telah dipilih, lulus ia data. 434 00:24:28,590 --> 00:24:34,430 Dan data adalah JSON yang mendapat kembali dari API. 435 00:24:34,430 --> 00:24:40,120 >> Dan kemudian kita katakan, dalam masa yang data ada bidang yang dipanggil item. 436 00:24:40,120 --> 00:24:48,117 Dan jika saya pergi lihat di belakang salah satu keputusan yang ada di sini, 437 00:24:48,117 --> 00:24:49,200 ada sesuatu yang called-- 438 00:24:49,200 --> 00:24:50,220 >> Nah, ia dipanggil item. 439 00:24:50,220 --> 00:24:53,520 Supaya mudahan. 440 00:24:53,520 --> 00:25:01,840 Dan apa yang ia lakukan adalah ia pergi melalui setiap item 441 00:25:01,840 --> 00:25:05,300 dan kemudian panggilan lain fungsi pada setiap perkara. 442 00:25:05,300 --> 00:25:08,440 Dan fungsi yang pada dasarnya mengambil nilai 443 00:25:08,440 --> 00:25:12,010 item tersebut, yang dasarnya rekod individu 444 00:25:12,010 --> 00:25:18,220 dan membolehkan kita untuk menarik keluar tajuk, liputan dan bahasa. 445 00:25:18,220 --> 00:25:21,640 >> Oleh itu, kita memanggil fungsi pada setiap item yang kami kembali dari API. 446 00:25:21,640 --> 00:25:25,397 Dan jika anda hanya melihat dengan di bahagian ini di sini, 447 00:25:25,397 --> 00:25:27,230 apa yang kita lakukan adalah kami mewujudkan rentetan, 448 00:25:27,230 --> 00:25:31,810 yang pada dasarnya adalah beberapa markup HTML semeja, dengan value.title, 449 00:25:31,810 --> 00:25:35,790 yang merupakan tajuk yang objek, value.coverage, 450 00:25:35,790 --> 00:25:36,790 iaitu perlindungan, - 451 00:25:36,790 --> 00:25:38,225 >> Dan kita lakukan cek di sini untuk melihat siapa yang undefined 452 00:25:38,225 --> 00:25:40,570 dan menyembunyikannya jika ia berkata undefined, kerana kita tidak benar-benar berminat 453 00:25:40,570 --> 00:25:41,600 dalam itu. 454 00:25:41,600 --> 00:25:42,939 >> --and maka bahasa. 455 00:25:42,939 --> 00:25:44,730 Dan kemudian apa yang kami lakukan adalah appending yang 456 00:25:44,730 --> 00:25:48,510 kepada meja yang ada di dikenalpasti oleh tali ini di sini. 457 00:25:48,510 --> 00:25:50,790 Dan bagaimana jQuery bekerja adalah apa ini mengatakan 458 00:25:50,790 --> 00:25:56,420 sedang mencari meja dengan idea keputusan dan menambah teks ini kepadanya. 459 00:25:56,420 --> 00:25:59,380 Dan ini adalah meja dengan hasil idea. 460 00:25:59,380 --> 00:26:04,998 Jadi apa yang anda berakhir dengan halaman ini adalah di sini. 461 00:26:04,998 --> 00:26:06,206 Dan untuk melihat source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 Nah, sumber yang tidak sebenarnya dikemaskini apabila yang berlaku. 464 00:26:13,810 --> 00:26:18,740 Jadi, anda boleh melihat sebenar keputusan jadual di sini walaupun. 465 00:26:18,740 --> 00:26:24,770 >> Jadi itu hanya satu contoh yang mudah melakukan pertanyaan yang sangat asas terhadap API 466 00:26:24,770 --> 00:26:29,020 dan memaparkan maklumat dalam beberapa lain membentuk, dan tidak melakukan apa-apa yang terlalu mewah. 467 00:26:29,020 --> 00:26:36,370 Kini, satu lagi contoh adalah seperti permohonan bertulis oleh David Weinberger 468 00:26:36,370 --> 00:26:39,120 sebagai demo ini, yang pada dasarnya menunjukkan anda 469 00:26:39,120 --> 00:26:44,620 bagaimana anda boleh mash sehingga keputusan anda mendapatkan dari API perpustakaan awan 470 00:26:44,620 --> 00:26:46,250 dengan, katakan, Buku Google. 471 00:26:46,250 --> 00:26:52,225 >> Dan pemikiran di sini ialah saya boleh menjalankan pertanyaan terhadap Buku Google, 472 00:26:52,225 --> 00:26:56,060 mendapat carian teks penuh, mendapatkan beberapa keputusan kembali, mengetahui yang mana satu item-item 473 00:26:56,060 --> 00:27:01,180 benar-benar wujud dalam Hollis, sistem perpustakaan, 474 00:27:01,180 --> 00:27:03,200 dan kemudian memberikan saya pautan kembali kepada perkara-perkara tersebut. 475 00:27:03,200 --> 00:27:12,730 Jadi, jika saya mencari, ia adalah malam yang gelap dan bergelora, saya 476 00:27:12,730 --> 00:27:16,210 kembali sekumpulan keputusan daripada Google, dan kemudian satu hasil 477 00:27:16,210 --> 00:27:19,460 iaitu A Wrinkle dalam Masa. 478 00:27:19,460 --> 00:27:29,330 Dan ini adalah pautan kepada buku-buku yang wujud dalam sistem Perpustakaan Harvard. 479 00:27:29,330 --> 00:27:32,160 >> Jadi saya rasa yang penting di sini bukan begitu banyak bahawa ini boleh atau tidak boleh 480 00:27:32,160 --> 00:27:34,118 menjadi cara yang anda mahu untuk mencari perpustakaan, 481 00:27:34,118 --> 00:27:38,310 tetapi ia adalah sama sekali berbeza cara yang tidak disediakan untuk anda 482 00:27:38,310 --> 00:27:42,884 sebelum ini, seperti anda tidak mempunyai cara untuk melakukan teks penuh mencari pada buku yang walaupun 483 00:27:42,884 --> 00:27:44,550 merupakan sebahagian daripada sistem Perpustakaan Harvard. 484 00:27:44,550 --> 00:27:46,870 Jadi sekarang ini adalah cara yang bahawa anda boleh melakukannya. 485 00:27:46,870 --> 00:27:51,930 Dan anda boleh memaparkan mereka dalam apa sahaja format yang anda mahu. 486 00:27:51,930 --> 00:27:55,990 Jadi yang penting di sini adalah, pada dasarnya, kami membuka cara baru untuk rakyat 487 00:27:55,990 --> 00:27:59,080 untuk bekerja dengan data. 488 00:27:59,080 --> 00:28:07,925 >> Satu lagi awan perpustakaan ialah ia membantu mendedahkan beberapa data penggunaan 489 00:28:07,925 --> 00:28:08,800 bahawa perpustakaan mempunyai. 490 00:28:08,800 --> 00:28:12,630 Jadi, jika anda pergi ke perpustakaan, dan yang anda cari buku, 491 00:28:12,630 --> 00:28:15,770 anda tidak semestinya sebenarnya mempunyai idea, 492 00:28:15,770 --> 00:28:19,080 untuk semua item dalam subjek tertentu, apa yang 493 00:28:19,080 --> 00:28:21,200 orang dalam masyarakat, sama ada 494 00:28:21,200 --> 00:28:24,890 ditakrifkan sebagai Harvard atau negara atau kelas anda, 495 00:28:24,890 --> 00:28:26,421 apa yang perlu mereka dapati yang paling berguna? 496 00:28:26,421 --> 00:28:28,920 Dan perpustakaan yang sebenarnya mempunyai tan maklumat mengenai apa yang 497 00:28:28,920 --> 00:28:32,999 adalah yang paling berguna kerana jika banyak daripada orang yang menyemak buku, 498 00:28:32,999 --> 00:28:34,040 yang memberitahu anda sesuatu. 499 00:28:34,040 --> 00:28:36,498 Ada sesuatu telah sebab-sebab tertentu mereka ingin website saya. 500 00:28:36,498 --> 00:28:38,270 Banyak orang meletakkannya di rizab. 501 00:28:38,270 --> 00:28:42,520 >> Jika ia dalam senarai simpanan bagi banyak kelas, yang memberitahu anda sesuatu. 502 00:28:42,520 --> 00:28:45,960 Jika ahli-ahli fakulti memeriksa ia keluar banyak dan mahasiswa tidak, 503 00:28:45,960 --> 00:28:47,200 yang memberitahu saya sesuatu. 504 00:28:47,200 --> 00:28:49,280 Sebaliknya, yang juga memberitahu anda sesuatu. 505 00:28:49,280 --> 00:28:54,680 Jadi ia akan menjadi benar-benar menarik untuk menyatakan maklumat yang di luar sana dan membiarkan 506 00:28:54,680 --> 00:28:59,969 orang menggunakannya untuk membantu mereka mencari bekerja dalam sistem perpustakaan. 507 00:28:59,969 --> 00:29:02,260 Sisi lain dari ini adalah terdapat beberapa privasi serius 508 00:29:02,260 --> 00:29:07,854 kebimbangan kerana salah satu rukun teras perpustakaan 509 00:29:07,854 --> 00:29:10,770 adalah kami tidak akan memberitahu orang apa yang orang lain baca. 510 00:29:10,770 --> 00:29:17,360 Dan jika anda katakan ini buku telah dipinjam empat kali 511 00:29:17,360 --> 00:29:20,070 dalam sesuatu bulan tertentu, yang boleh digunakan 512 00:29:20,070 --> 00:29:25,252 untuk menghubungkan kembali kepada sesuatu orang dengan data tanpa nama de- 513 00:29:25,252 --> 00:29:26,710 dan mencari siapa yang diperiksa ia keluar. 514 00:29:26,710 --> 00:29:30,792 Jadi cara yang kita boleh avoid-- 515 00:29:30,792 --> 00:29:33,750 Cara yang kita boleh cuba untuk mengeluarkan beberapa isyarat dari semua maklumat yang 516 00:29:33,750 --> 00:29:36,740 tanpa melanggar kebimbangan privasi sesiapa 517 00:29:36,740 --> 00:29:42,150 pada dasarnya kita melihat 10 tahun data penggunaan, - 518 00:29:42,150 --> 00:29:43,930 >> Jadi, dalam tempoh masa yang panjang. 519 00:29:43,930 --> 00:29:50,639 >> --and berkata, OK, mari kita lihat bagaimana banyak kali kerja ini telah digunakan, 520 00:29:50,639 --> 00:29:52,930 dan oleh yang dalam tempoh ini masa, dan kemudian pada dasarnya 521 00:29:52,930 --> 00:29:56,300 memberikan kembali nombor, yang kita panggil skor timbunan, yang pada asasnya 522 00:29:56,300 --> 00:29:59,910 mewakili berapa banyak ia telah digunakan. 523 00:29:59,910 --> 00:30:01,084 Dan number-- yang 524 00:30:01,084 --> 00:30:03,250 Banyak pengiraan yang berbeza pergi ke nombor tersebut. 525 00:30:03,250 --> 00:30:05,150 --but ia adalah sangat kasar metrik yang memberikan anda 526 00:30:05,150 --> 00:30:11,300 beberapa idea bagaimana masyarakat boleh menghargai kerja itu. 527 00:30:11,300 --> 00:30:16,772 >> Dan jadi lain semacam walaupun lebih berisi daripada permohonan 528 00:30:16,772 --> 00:30:18,480 yang mengambil kesempatan ini adalah sesuatu yang 529 00:30:18,480 --> 00:30:24,000 dipanggil Stacklife, yang sebenarnya boleh didapati melalui Harvard utama 530 00:30:24,000 --> 00:30:24,880 Portal Perpustakaan. 531 00:30:24,880 --> 00:30:26,700 Jadi, anda pergi ke library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 Anda akan melihat beberapa yang berbeza cara mencari perpustakaan. 533 00:30:29,360 --> 00:30:32,300 Dan salah seorang daripada mereka dipanggil Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> Dan ini adalah suatu permohonan yang menelusuri kandungan perpustakaan, 535 00:30:38,980 --> 00:30:43,490 tetapi benar-benar dibina di atas API ini. 536 00:30:43,490 --> 00:30:46,910 Jadi tidak ada barangan khas berlaku di belakang tabir. 537 00:30:46,910 --> 00:30:49,570 Tidak ada akses kepada data yang anda tidak mempunyai. 538 00:30:49,570 --> 00:30:54,090 Ia menggunakan API untuk menyediakan anda dengan pelayaran yang sama sekali berbeza 539 00:30:54,090 --> 00:30:55,480 pengalaman. 540 00:30:55,480 --> 00:30:58,570 >> Jadi, jika saya mencari Alice in Wonderland dalam kes ini, 541 00:30:58,570 --> 00:31:02,600 Saya mendapat hasil yang kelihatan seperti ini, yang cukup much-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> Ia hampir sama dengan apa-apa carian lain anda mungkin lakukan, kecuali dalam hal ini 544 00:31:10,870 --> 00:31:15,730 kita kedudukan barang-barang dengan stackscore, yang memberi anda 545 00:31:15,730 --> 00:31:19,850 beberapa idea bagaimana popular ini item berada dalam masyarakat. 546 00:31:19,850 --> 00:31:25,610 Dan begitu jelas, Alice in Wonderland oleh Walt Disney adalah sangat popular. 547 00:31:25,610 --> 00:31:36,570 Tetapi anda juga boleh melihat empat pasukan teratas di sini adalah yang anda mungkin tidak actually-- 548 00:31:36,570 --> 00:31:39,220 >> Perkara-perkara yang sangat digunakan, tetapi anda tidak boleh dengan serta-merta 549 00:31:39,220 --> 00:31:41,240 menyambung dengan Alice in Wonderland. 550 00:31:41,240 --> 00:31:44,650 Jadi rakan lama kami ini Annotated Alice adalah di sini. 551 00:31:44,650 --> 00:31:46,350 Jadi saya boleh mengambil lihat ia. 552 00:31:46,350 --> 00:31:52,010 Dan kini apa yang saya cari pada dasarnya yang ditetapkan daripada- 553 00:31:52,010 --> 00:31:53,760 Saya boleh mempunyai ini Annotated Alice di sini. 554 00:31:53,760 --> 00:31:56,700 Saya mempunyai maklumat mengenainya. 555 00:31:56,700 --> 00:32:00,230 Dan saya juga mempunyai sebuah stackscore daripada, dalam kes ini, 26. 556 00:32:00,230 --> 00:32:03,169 Dan ini memberitahu saya semacam kurang bagaimana kami dapat stackscore ini, 557 00:32:03,169 --> 00:32:05,835 seperti yang diperiksa ia keluar, seperti bagaimana banyak kali ia telah diperiksa, 558 00:32:05,835 --> 00:32:08,440 seperti fakulti atau undergrads, bagaimana banyak salinan perpustakaan itu telah, 559 00:32:08,440 --> 00:32:11,300 dan sebagainya dan sebagainya. 560 00:32:11,300 --> 00:32:16,460 >> Dan anda juga boleh, cukup menarik di sini, melayari susunan hampir. 561 00:32:16,460 --> 00:32:19,550 Jadi data di sini, ini menunjukkan anda semacam 562 00:32:19,550 --> 00:32:23,547 daripada perwakilan maya apa kekuatan rak 563 00:32:23,547 --> 00:32:25,880 kelihatan seperti jika anda mengambil semua pegangan perpustakaan 564 00:32:25,880 --> 00:32:28,940 dan meletakkan mereka bersama-sama pada satu rak tak terhingga. 565 00:32:28,940 --> 00:32:30,990 Dan perkara yang baik adalah bahawa kita can-- 566 00:32:30,990 --> 00:32:33,380 >> Pertama sekali, metadata mengenai buku 567 00:32:33,380 --> 00:32:35,627 sering memberitahu anda apabila ia telah diterbitkan. 568 00:32:35,627 --> 00:32:37,085 Ia memberitahu anda berapa banyak muka surat ia mempunyai. 569 00:32:37,085 --> 00:32:38,459 Ia mungkin memberitahu anda dimensi. 570 00:32:38,459 --> 00:32:42,930 Jadi, anda boleh melihat yang yang digambarkan di sini dari segi saiz buku. 571 00:32:42,930 --> 00:32:46,740 >> Dan kemudian kita boleh menggunakan stack rata untuk menyerlahkan 572 00:32:46,740 --> 00:32:49,170 buku-buku yang mempunyai markah timbunan lebih tinggi. 573 00:32:49,170 --> 00:32:54,930 Jadi, jika itu lebih gelap, ini bermakna, mungkin, ianya lebih kerap digunakan. 574 00:32:54,930 --> 00:32:57,040 Jadi dalam kes ini, saya akan meneka bahawa ini 575 00:32:57,040 --> 00:33:03,226 adalah versi Alice in Wonderland yang sangat biasa digunakan dan paling 576 00:33:03,226 --> 00:33:05,100 diakses, perpustakaan mempunyai paling salinan bagi. 577 00:33:05,100 --> 00:33:06,975 Jadi jika anda sedang mencari untuk Alice in Wonderland, 578 00:33:06,975 --> 00:33:10,220 ini mungkin menjadi tempat yang baik untuk memulakan. 579 00:33:10,220 --> 00:33:13,500 >> Dan maka di sini anda juga boleh link keluar untuk, katakan, Amazon untuk membeli buku, 580 00:33:13,500 --> 00:33:15,182 dan sebagainya dan sebagainya. 581 00:33:15,182 --> 00:33:17,140 Titik di sini, sekali lagi, tidak begitu banyak yang ini 582 00:33:17,140 --> 00:33:25,030 adalah cara terbaik untuk melayari perpustakaan atau alat yang tepat untuk setiap kesempatan. 583 00:33:25,030 --> 00:33:28,400 Tetapi ia adalah satu lagi cara untuk melakukannya. 584 00:33:28,400 --> 00:33:31,359 Dan dengan membuat data yang boleh didapati melalui API, yang 585 00:33:31,359 --> 00:33:34,650 diperbuat daripada blok bangunan yang sangat mudah, yang membolehkan anda untuk mencari kandungan, 586 00:33:34,650 --> 00:33:39,420 anda boleh membina sesuatu seperti ini yang boleh 587 00:33:39,420 --> 00:33:41,520 menjadi luar biasa berharga bagi sesetengah orang. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> Jadi itulah semacam, seberapa banyak yang saya mahu untuk mengatakan benar-benar tentang apa API adalah 590 00:33:51,860 --> 00:33:56,070 dan apa yang ia mendedahkan, ada keseluruhannya sekumpulan barangan di belakang tabir, yang 591 00:33:56,070 --> 00:33:59,480 Saya hanya akan menyentuh secara ringkas hanya kerana ia jenis datang pada ini 592 00:33:59,480 --> 00:34:03,720 dari sudut yang sama sekali berbeza dalam segi bagaimana sesuatu seperti ini 593 00:34:03,720 --> 00:34:04,580 dapat dimasukkan ke dalam tempat? 594 00:34:04,580 --> 00:34:10,820 >> Jadi API adalah standard yang antara muka untuk semua kandungan ini. 595 00:34:10,820 --> 00:34:13,820 Tetapi untuk mendapatkan ia di sana, Perkara pertama yang kita perlu buat 596 00:34:13,820 --> 00:34:17,260 telah bekerjasama maklumat buku dan imej 597 00:34:17,260 --> 00:34:21,580 dan alat bantu mencari, koleksi dokumen daripada pelbagai sistem Harvard. 598 00:34:21,580 --> 00:34:23,929 Aleph, VIA, dan OASIS adalah nama-nama sistem. 599 00:34:23,929 --> 00:34:28,820 Dan mereka pada dasarnya pergi ke talian paip, talian paip pemprosesan. 600 00:34:28,820 --> 00:34:33,230 >> Jadi pertama sekali, kita eksport fail dari semua sistem-sistem ini. 601 00:34:33,230 --> 00:34:35,130 Kami berpecah mereka ke unit barangan. 602 00:34:35,130 --> 00:34:39,360 Oleh itu, kita mempunyai fail, yang merupakan satu gigabyte, yang mempunyai satu juta rekod di dalamnya. 603 00:34:39,360 --> 00:34:42,290 Oleh itu, kita berpecah sehingga ke barangan. 604 00:34:42,290 --> 00:34:45,374 Kemudian, bagi setiap perkara, kita menukarkannya ke dalam arena, kerana sesetengah 605 00:34:45,374 --> 00:34:47,040 adalah Mods secara asal, sebahagian daripada mereka tidak. 606 00:34:47,040 --> 00:34:49,204 Oleh itu, kita mendapatkan mereka semua untuk dalam format yang sama. 607 00:34:49,204 --> 00:34:51,120 Kemudian terdapat pelbagai langkah pengayaan, di mana 608 00:34:51,120 --> 00:34:55,969 kita menambah lebih banyak maklumat kepada data yang daripada yang terdapat di perpustakaan. 609 00:34:55,969 --> 00:34:59,750 Oleh itu, kita perlu menambah, pertama sekali kita mempunyai apa perpustakaan memegangnya. 610 00:34:59,750 --> 00:35:02,250 Kita melalui satu langkah mengira stackscore itu. 611 00:35:02,250 --> 00:35:07,112 Kita melalui satu lagi langkah menambah metadata dari segi 612 00:35:07,112 --> 00:35:10,730 apa koleksi orang mungkin telah ditambah this-- 613 00:35:10,730 --> 00:35:12,532 >> Orang ramai mewujudkan koleksi barangan. 614 00:35:12,532 --> 00:35:13,990 Apa koleksi adakah ia tergolong dalam? 615 00:35:13,990 --> 00:35:17,220 Bagaimanakah orang telah menandakan nama kandungan ini pada masa lalu? 616 00:35:17,220 --> 00:35:20,750 Kemudian anda menapis, dan anda menghadkan rekod kerana, seperti yang saya nyatakan, 617 00:35:20,750 --> 00:35:24,120 ada beberapa rekod itu, kerana sebab hak cipta, kita tidak boleh dipaparkan. 618 00:35:24,120 --> 00:35:26,700 Dan kemudian kita memuatkan mereka ke dalam sesuatu yang dinamakan 619 00:35:26,700 --> 00:35:31,680 Solr, yang bukan kesalahan ejaan, tetapi adalah nama suatu perisian 620 00:35:31,680 --> 00:35:35,710 yang melakukan carian mengindeks, yang mendorong semua carian di belakang API. 621 00:35:35,710 --> 00:35:40,110 Dan kemudian ia menjadi tersedia kepada API, dan orang boleh menggunakannya. 622 00:35:40,110 --> 00:35:44,640 >> Jadi ini adalah seperti yang agak proses mudah. 623 00:35:44,640 --> 00:35:47,230 Salah satu yang menarik perkara yang mengenainya adalah 624 00:35:47,230 --> 00:35:50,990 bahawa kita berhadapan dengan 13 juta rekod 625 00:35:50,990 --> 00:35:53,820 dan kita akan berurusan atau lebih. 626 00:35:53,820 --> 00:36:01,260 Dan kita mahu menjadi mampu untuk mengendalikan ini dengan cara yang agak cepat. 627 00:36:01,260 --> 00:36:03,630 Ia mengambil masa yang lama untuk memproses 13 juta rekod. 628 00:36:03,630 --> 00:36:09,529 >> Jadi bagaimana ini adalah saluran paip ditubuhkan ialah anda can-- 629 00:36:09,529 --> 00:36:12,070 Saya rasa kelebihan yang talian paip, masalah yang kami 630 00:36:12,070 --> 00:36:15,580 cuba untuk menyelesaikan di sini, adalah bahawa semua perubahan, semua 631 00:36:15,580 --> 00:36:18,729 langkah-langkah ini dalam saluran paip adalah diasingkan. 632 00:36:18,729 --> 00:36:19,645 Tidak ada pergantungan. 633 00:36:19,645 --> 00:36:22,146 Jika anda sedang memproses rekod satu buku, 634 00:36:22,146 --> 00:36:24,270 tidak ada pergantungan pada yang antara lain buku. 635 00:36:24,270 --> 00:36:27,760 >> Jadi apa yang boleh kita lakukan pada dasarnya, pada setiap langkah dalam perancangan, 636 00:36:27,760 --> 00:36:30,470 kita letakkan ke dalam baris gilir dalam awan. 637 00:36:30,470 --> 00:36:32,250 Saya kebetulan berada di Amazon Web Services. 638 00:36:32,250 --> 00:36:35,140 Jadi ada senarai, berkata, 10,000 item yang 639 00:36:35,140 --> 00:36:38,100 perlu pulih dan ditukar kepada format arena. 640 00:36:38,100 --> 00:36:41,620 Dan kita berputar sebagai banyak pelayan seperti yang kita mahu, mungkin 10 pelayan. 641 00:36:41,620 --> 00:36:44,860 Dan setiap orang hanya pelayan duduk di sana, kelihatan dalam barisan itu, 642 00:36:44,860 --> 00:36:46,730 melihat bahawa ada satu yang perlu diproses, menarik ia di luar barisan, 643 00:36:46,730 --> 00:36:48,740 memproses, dan kayu pada barisan depan. 644 00:36:48,740 --> 00:36:54,200 >> Dan jadi apa yang membolehkan kita lakukan adalah memohon, pada dasarnya, 645 00:36:54,200 --> 00:36:58,110 perkakasan yang kita mahu ini masalah untuk jangka masa yang sangat singkat 646 00:36:58,110 --> 00:37:02,970 untuk memproses data secepat mungkin, yang merupakan sesuatu yang hanya, 647 00:37:02,970 --> 00:37:08,220 kini dalam dunia perkomputeran awan kita boleh peruntukan pelayan dasarnya 648 00:37:08,220 --> 00:37:09,890 serta-merta, adalah yang berguna. 649 00:37:09,890 --> 00:37:12,260 Oleh itu, kita tidak perlu mempunyai pelayan gergasi duduk di sekitar 650 00:37:12,260 --> 00:37:16,700 semua masa untuk melakukan pemprosesan yang mungkin berlaku hanya sekali seminggu. 651 00:37:16,700 --> 00:37:21,440 >> Jadi yang kebanyakannya ia. 652 00:37:21,440 --> 00:37:27,590 Ada dokumentasi untuk Perpustakaan Awan Perkara API 653 00:37:27,590 --> 00:37:31,960 di URL ini, yang akan boleh didapati kemudian. 654 00:37:31,960 --> 00:37:36,730 Dan sila pergi mengambil lihat itu untuk melihat jika ada apa-apa, 655 00:37:36,730 --> 00:37:37,579 anda mempunyai apa-apa idea. 656 00:37:37,579 --> 00:37:38,120 Bermain dengannya. 657 00:37:38,120 --> 00:37:38,830 Main-main. 658 00:37:38,830 --> 00:37:42,800 Dan mudah-mudahan anda boleh datang dengan sesuatu yang besar. 659 00:37:42,800 --> 00:37:44,740 Terima kasih. 660 00:37:44,740 --> 00:37:45,899