1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 JEFFREY LICHT: Hi there. 3 00:00:12,370 --> 00:00:13,550 Ja sam Jeffrey Licht. 4 00:00:13,550 --> 00:00:17,890 I ja sam ovdje s vama razgovarati o tome Harvard knjižnica i izgradnja sutra 5 00:00:17,890 --> 00:00:20,870 Danas knjižnica, valjda. 6 00:00:20,870 --> 00:00:23,040 Dakle, pozadina ovdje, Parcela za ovu sjednicu 7 00:00:23,040 --> 00:00:26,930 je u biti kako je dosta bibliografskih podataka 8 00:00:26,930 --> 00:00:28,400 dostupna u knjižnicama Harvarda. 9 00:00:28,400 --> 00:00:33,434 A tu je i prilika, kroz neke od alata 10 00:00:33,434 --> 00:00:36,350 i projekt koji se razvija, dobiti pristup informacijama 11 00:00:36,350 --> 00:00:42,430 i to na mjestima koja Harvard knjižnica ne radi upravo sada, 12 00:00:42,430 --> 00:00:45,460 napraviti nove stvari s njim, eksperiment i poigrati s njom. 13 00:00:45,460 --> 00:00:52,413 >> Dakle, polazna točka u ovo API zove Harvard knjižnica Cloud, koji 14 00:00:52,413 --> 00:00:57,650 je otvorena meta poslužitelja, što ću govoriti o tome sada. 15 00:00:57,650 --> 00:01:02,595 Dakle, pozadina je da postoji Puno stvari u Harvard knjižnici. 16 00:01:02,595 --> 00:01:07,150 Imamo više od 13 milijuna bibliografskih zapisi, milijuni slika, 17 00:01:07,150 --> 00:01:11,090 i tisuće obavijesnih pomagala, koja u biti su dokumenti koji opisuju 18 00:01:11,090 --> 00:01:15,500 zbirke, govoreći ono što je u njima, kutije radova 19 00:01:15,500 --> 00:01:21,080 i tako dalje da predstavljaju više milijun pojedinačnih dokumenata. 20 00:01:21,080 --> 00:01:24,290 A tu je i mnogo Informacije koje knjižnica ima 21 00:01:24,290 --> 00:01:28,180 o tome kako se koristi sadržaj koji može biti od interesa za ljude 22 00:01:28,180 --> 00:01:32,400 tko bi htio raditi s njim. 23 00:01:32,400 --> 00:01:36,150 >> Dakle, sve informacije Knjižnica ima metapodataka. 24 00:01:36,150 --> 00:01:39,500 Dakle metapodataka je podatke o podacima. 25 00:01:39,500 --> 00:01:42,070 Dakle, kada govorimo o Informacije koje je 26 00:01:42,070 --> 00:01:44,890 dostupni putem knjižnica oblak koji je na raspolaganju, 27 00:01:44,890 --> 00:01:47,760 to nije nužno stvarni dokumenti 28 00:01:47,760 --> 00:01:53,060 sami, a ne nužno i puna Tekst knjige ili slike u punoj, 29 00:01:53,060 --> 00:01:54,890 iako to zapravo može biti slučaj. 30 00:01:54,890 --> 00:01:57,550 No, to je stvarno informacija o podacima. 31 00:01:57,550 --> 00:02:00,909 >> Dakle, možete misliti katalogizaciju Informacije, pozivni brojevi, predmeti, 32 00:02:00,909 --> 00:02:02,700 koliko kopije Knjiga ima, ono 33 00:02:02,700 --> 00:02:06,380 su izdanja, što su formata, autori, i tako dalje. 34 00:02:06,380 --> 00:02:12,250 Dakle, postoji mnogo informacija o Informacije u zbirci koja, 35 00:02:12,250 --> 00:02:14,400 samo po sebi, je vrsta inherentno korisna. 36 00:02:14,400 --> 00:02:19,230 A ipak, ako ste rade u dubini istraživanja, 37 00:02:19,230 --> 00:02:25,160 ti očito žele doći do stvarne samom sadržaju i pogledate podatke, 38 00:02:25,160 --> 00:02:30,140 metapodataka je korisna u smislu i analizira korpus u cjelini, 39 00:02:30,140 --> 00:02:33,870 kao što su stvari u kolekciji. 40 00:02:33,870 --> 00:02:35,520 Kako se oni odnose? 41 00:02:35,520 --> 00:02:39,482 Pomaže li doista pronaći druge stvari, što je zapravo glavna svrha toga. 42 00:02:39,482 --> 00:02:41,190 Točka metapodataka i kataloga 43 00:02:41,190 --> 00:02:43,230 je da vam pomoći pronaći sve Informacije koje je 44 00:02:43,230 --> 00:02:46,590 dostupan u zbirkama. 45 00:02:46,590 --> 00:02:53,690 >> Dakle, ovo je primjer metapodataka za knjige u knjižnici Harvard. 46 00:02:53,690 --> 00:02:56,370 Tako da je tamo. 47 00:02:56,370 --> 00:02:59,850 A možete vidjeti da je zapravo umjereno složena. 48 00:02:59,850 --> 00:03:04,610 I dio vrijednosti metapodataka u Harvard knjižnični sustav 49 00:03:04,610 --> 00:03:09,320 je da je to bila neka vrsta izgrađen od strane catalogers 50 00:03:09,320 --> 00:03:12,720 i sastavljen od ljudi koji se prijavljuju puno znanja i vještine 51 00:03:12,720 --> 00:03:20,030 i mislio na nju s vremenom, koja ima mnogo vrijednosti. 52 00:03:20,030 --> 00:03:25,450 >> Dakle, ako ste uzeti pogledati ovaj rekord za Označeni Alice, možete saznati 53 00:03:25,450 --> 00:03:32,590 imaš titulu, tko ga je napisao, autora, a svi su različiti predmeti 54 00:03:32,590 --> 00:03:35,380 kojoj ljudi su ga katalogizirana u. 55 00:03:35,380 --> 00:03:40,110 A što možete vidjeti postoji također, u dodatak puno dobrih informacija 56 00:03:40,110 --> 00:03:42,852 Ovdje, postoji neki dupliciranje. 57 00:03:42,852 --> 00:03:45,560 Postoji mnogo složenosti koje je ogleda kroz metapodataka 58 00:03:45,560 --> 00:03:46,300 da imate. 59 00:03:46,300 --> 00:03:50,320 >> Dakle, jedan naslov ove knjige Alisa u zemlji čudesa. 60 00:03:50,320 --> 00:03:53,880 Dakle, to je označeni verzija toj knjizi. 61 00:03:53,880 --> 00:03:56,380 No, to je također pozvao Točku Alice, Alice je Avanture 62 00:03:56,380 --> 00:03:58,570 u zemlji čudesa, jer to je nešto što 63 00:03:58,570 --> 00:04:00,430 Martin Gardner je napisao i označeni knjigu. 64 00:04:00,430 --> 00:04:03,369 A tu je dosta velika informacija O logičkih zagonetki i stvari 65 00:04:03,369 --> 00:04:05,410 u Alice koja vas Vjerojatno nije znao. 66 00:04:05,410 --> 00:04:07,000 Tako da bi trebao ići pročitati ga. 67 00:04:07,000 --> 00:04:11,940 >> No, što se može vidjeti postoji puno detalja ovdje, 68 00:04:11,940 --> 00:04:15,340 uključujući identifikatore, kada je to stvorena, gdje je došao iz, 69 00:04:15,340 --> 00:04:17,420 U odnosu na Harvardu Sustav, i tako dalje. 70 00:04:17,420 --> 00:04:20,350 Dakle, ovo je uzorak vrsta metapodataka 71 00:04:20,350 --> 00:04:24,340 koje možete vidjeti za knjigu u Harvard Knjižnica skup. 72 00:04:24,340 --> 00:04:26,680 >> To je nešto sasvim drugo. 73 00:04:26,680 --> 00:04:32,610 Dakle, ne postoji sustav pod nazivom VIA Harvard, koji je u osnovi 74 00:04:32,610 --> 00:04:39,990 je katalogiziranje slike i objekte umjetnosti i vizualne stvari tijekom Harvardu, 75 00:04:39,990 --> 00:04:44,010 i dodao neke metapodatke za njih, klasificiranje ih, 76 00:04:44,010 --> 00:04:49,200 i, u nekim slučajevima, osigurava Minijatura slike 77 00:04:49,200 --> 00:04:51,250 koji možete poduzeti pogledati ako to žele. 78 00:04:51,250 --> 00:04:54,240 >> Dakle, ovo je primjer metapodataka koje imate na tanjuru 79 00:04:54,240 --> 00:04:57,840 od, vjerojatno, Alisa u zemlji čudesa. 80 00:04:57,840 --> 00:05:00,499 A što možete vidjeti postoji manje metapodataka ovdje. 81 00:05:00,499 --> 00:05:02,040 To je samo druga vrsta objekta. 82 00:05:02,040 --> 00:05:03,425 I tako ima manje informacija. 83 00:05:03,425 --> 00:05:07,790 >> Vi uglavnom imaju činjenicu da, poziv broj, bitno tko ga je stvorio, - 84 00:05:07,790 --> 00:05:10,410 >> Ne znamo kada je nastao. 85 00:05:10,410 --> 00:05:13,320 >> --and naslov. 86 00:05:13,320 --> 00:05:14,300 >> Drugi primjer. 87 00:05:14,300 --> 00:05:16,380 To je otkriće pomoći. 88 00:05:16,380 --> 00:05:19,030 Dakle, postoji zbirka Lewis Carroll je radovi na Harvardu. 89 00:05:19,030 --> 00:05:23,601 Dakle, ovo što opisuje je u toj zbirci. 90 00:05:23,601 --> 00:05:26,100 Dakle, netko je prošla i pogledao kroz sve kutije 91 00:05:26,100 --> 00:05:32,220 i katalogizirao, dati neki background, pisani sažetak onoga što je ovdje. 92 00:05:32,220 --> 00:05:35,290 A ako ste bili na pogledati dodatno na to, ovaj 93 00:05:35,290 --> 00:05:39,620 ide na stranicama i stranicama i stranice, ali će vam reći 94 00:05:39,620 --> 00:05:41,860 ono slova i ono datira iz onoga kutije 95 00:05:41,860 --> 00:05:44,289 postojala u cijeloj kolekciji. 96 00:05:44,289 --> 00:05:46,330 No, to je nešto da, ako ste na Harvardu, 97 00:05:46,330 --> 00:05:50,720 možete ići i zapravo fizički izgledaju i, vjerojatno, pogledajte. 98 00:05:50,720 --> 00:05:53,440 >> Dakle, ovo je sve super. 99 00:05:53,440 --> 00:05:54,450 To metapodataka je korisno. 100 00:05:54,450 --> 00:05:56,327 To je u Harvard knjižnični sustav. 101 00:05:56,327 --> 00:05:58,910 Postoje alati online, gdje vas Možete otići i pogledati u njega, 102 00:05:58,910 --> 00:05:59,993 i vidjeti, a to traži. 103 00:05:59,993 --> 00:06:02,810 A možete ga i kockice narezati to je u mnogo različitih načina. 104 00:06:02,810 --> 00:06:06,920 >> No, to je stvarno dostupna samo ako ti si čovjek sjedi 105 00:06:06,920 --> 00:06:12,600 u vašem web pregledniku ili nešto ili telefon i prolazite kroz nju. 106 00:06:12,600 --> 00:06:16,730 To zapravo nije dostupan u bilo kakav koristan način 107 00:06:16,730 --> 00:06:19,520 za druge sustave ili druga računala za korištenje, 108 00:06:19,520 --> 00:06:21,500 Ne sa sustavima unutar Knjižnica Harvard, 109 00:06:21,500 --> 00:06:24,890 ali sustavi u vanjskom svijetu, samo drugim ljudima. 110 00:06:24,890 --> 00:06:30,210 Dakle, pitanje je, kako možemo učiniti dostupnim računalima 111 00:06:30,210 --> 00:06:33,560 tako da možemo učiniti još zanimljivijim stvari s njim nego samo 112 00:06:33,560 --> 00:06:36,550 pregledavanje sami ga? 113 00:06:36,550 --> 00:06:39,766 >> Pa zašto bi želite učiniti? 114 00:06:39,766 --> 00:06:41,140 Postoji mnogo mogućnosti. 115 00:06:41,140 --> 00:06:43,980 Jedan od njih je što bi mogao izgraditi potpuno drugačiji način pregledavanja 116 00:06:43,980 --> 00:06:46,962 sadržaj koji je dostupan kroz Harvard knjižnica. 117 00:06:46,962 --> 00:06:48,670 Ja ću vam pokazati jedan kasnije nazvao Stacklife, 118 00:06:48,670 --> 00:06:52,440 koji ima potpuno drugačije preuzeti u potrazi za sadržaj. 119 00:06:52,440 --> 00:06:54,560 >> Ti bi mogao izgraditi preporuka motor. 120 00:06:54,560 --> 00:06:57,955 Dakle Harvard Knjižnica nije u Posao govoreći, volite ovu knjigu. 121 00:06:57,955 --> 00:07:01,080 Zatim idite pogledati na njih još 17 Knjige koje bi mogle biti zainteresirane za 122 00:07:01,080 --> 00:07:03,200 ili ti 18 ostalih slika. 123 00:07:03,200 --> 00:07:06,040 No, to sigurno mogao biti vrijedna značajka. 124 00:07:06,040 --> 00:07:09,272 A s obzirom metapodataka, to može moguće staviti zajedno. 125 00:07:09,272 --> 00:07:11,980 Možda ćete imati različite potrebe u Uvjeti traži sadržaj, 126 00:07:11,980 --> 00:07:16,200 kao što možda unatoč alata koji su na raspolaganju da knjižnica čini 127 00:07:16,200 --> 00:07:18,450 dostupni, možda želite tražiti na drugačiji način 128 00:07:18,450 --> 00:07:21,847 ili optimizirati za određenu uporabu slučaj, što možda je vrlo specijalizirani. 129 00:07:21,847 --> 00:07:23,930 Možda postoji samo nekoliko ljudi u svijetu koji su 130 00:07:23,930 --> 00:07:25,846 želite pretraživati ​​sadržaj na taj način, ali 131 00:07:25,846 --> 00:07:28,985 bilo bi sjajno kada bismo može neka to. 132 00:07:28,985 --> 00:07:30,860 Postoji puno analitike u koliko ljudi 133 00:07:30,860 --> 00:07:33,860 koristiti sadržaje koji bi stvarno zanimljivo znati, saznajte 134 00:07:33,860 --> 00:07:37,280 što se knjige koriste, što nisu, i tako dalje. 135 00:07:37,280 --> 00:07:41,670 A tu je i mnogo prilika za integraciju 136 00:07:41,670 --> 00:07:45,210 s druge informacije to je vani na webu. 137 00:07:45,210 --> 00:07:46,880 Tako smo have-- 138 00:07:46,880 --> 00:07:50,260 >> Na primjer, NPR ima Book Review segment, 139 00:07:50,260 --> 00:07:53,090 gdje su intervju Autori o knjigama. 140 00:07:53,090 --> 00:07:56,837 I tako to bi bilo sjajno, ako ste bili podigavši ​​knjigu u Harvardu 141 00:07:56,837 --> 00:07:59,670 Knjižnica, a ti kažeš, u redu, tu je bio razgovor s autorom. 142 00:07:59,670 --> 00:08:00,878 Idemo pogledati to. 143 00:08:00,878 --> 00:08:05,461 Ili postoji stranica Wikipedia, kao vjerodostojna, znanstveni reference 144 00:08:05,461 --> 00:08:07,710 O ovoj knjizi koja vas možda želite pogledati. 145 00:08:07,710 --> 00:08:12,600 >> Postoje ove vrste izvora razasuti po webu. 146 00:08:12,600 --> 00:08:16,555 I da ih stavi zajedno mogla biti velika uporabu 147 00:08:16,555 --> 00:08:18,930 nekome gleda sadržaj, u potrazi za nečim. 148 00:08:18,930 --> 00:08:20,180 No, to je također nije vrsta stvar koju bih 149 00:08:20,180 --> 00:08:23,205 Želite knjižnica biti odgovoran za idući prema dolje i lov dolje 150 00:08:23,205 --> 00:08:25,455 Svi ovi različiti izvori i uključiti ih zajedno 151 00:08:25,455 --> 00:08:28,920 jer oni mijenjaju kontinuirano. 152 00:08:28,920 --> 00:08:33,570 I ono što mislim da je važno svibnja ne biti ono što mislite da je važno. 153 00:08:33,570 --> 00:08:36,929 >> I još više, zapravo postoji Puno stvari nismo mislili od još. 154 00:08:36,929 --> 00:08:42,222 Dakle, ako možemo otvoriti ovo gore, više ljudi pored pola tuceta ili tako, 155 00:08:42,222 --> 00:08:45,174 koji se gleda na to na redovito se sjetiti ideje 156 00:08:45,174 --> 00:08:47,340 i masaža podataka, i učiniti ono što oni žele s njim. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> Dakle, želimo napraviti ovo dostupni na svijetu podataka. 159 00:08:54,045 --> 00:08:55,670 Pa, postoji nekoliko komplikacija. 160 00:08:55,670 --> 00:08:58,540 Jedan od njih je da je ovaj metapodataka u različitim sustavima. 161 00:08:58,540 --> 00:09:01,110 To je u različitim formatima. 162 00:09:01,110 --> 00:09:04,719 Dakle, postoji neki normalizacija što treba da se desi, 163 00:09:04,719 --> 00:09:08,010 što normalizacija se proces donosi stvari iz različitih formata 164 00:09:08,010 --> 00:09:12,940 te ih mapiranje na jednom formatu tako da su polja poklapati. 165 00:09:12,940 --> 00:09:15,160 >> Postoje neka ograničenja autorskih prava. 166 00:09:15,160 --> 00:09:21,010 Čudnovato dovoljno, unos u katalog O knjizi je odgovoran za autorska prava. 167 00:09:21,010 --> 00:09:24,060 Dakle, iako je to samo Informacije dobivene iz knjige, 168 00:09:24,060 --> 00:09:25,330 to je copyrightable. 169 00:09:25,330 --> 00:09:28,400 I ovisno o tome tko je zapravo stvorena da metapodataka, 170 00:09:28,400 --> 00:09:32,175 postoji svibanj biti ograničenja na koga Možete ga distribuirati, slično to-- 171 00:09:32,175 --> 00:09:33,402 >> Ne znam. 172 00:09:33,402 --> 00:09:36,110 To može, ali ne mora biti sličan Situacija tekstovima pjesama, 173 00:09:36,110 --> 00:09:36,610 npr. 174 00:09:36,610 --> 00:09:38,560 Dakle, svi znamo kako je to tave out. 175 00:09:38,560 --> 00:09:40,450 Tako vam je potrebno da biste dobili okolo tom pitanju. 176 00:09:40,450 --> 00:09:44,910 >> A onda još jedan je da postoji mnogo podataka. 177 00:09:44,910 --> 00:09:52,420 Dakle, ako sam nekoga tko želi raditi s podacima ili ima super ideja, 178 00:09:52,420 --> 00:09:55,350 bavi 14 milijuna kuna zapisi na moj laptop 179 00:09:55,350 --> 00:09:57,487 moglo biti problematično i teško upravljati. 180 00:09:57,487 --> 00:09:59,320 Dakle, želimo smanjiti barijere za osobe 181 00:09:59,320 --> 00:10:02,130 da bi mogli raditi s podacima. 182 00:10:02,130 --> 00:10:07,880 >> Tako pristup nadamo adrese svih tih problema je dva dijela. 183 00:10:07,880 --> 00:10:11,770 Jedan gradi platformu koja traje Podaci iz svih tih različitih izvora 184 00:10:11,770 --> 00:10:14,350 a otežava ga, normalizira, ga obogaćuje, i čini 185 00:10:14,350 --> 00:10:16,650 to dostupno na jednom mjestu. 186 00:10:16,650 --> 00:10:20,950 I to ga čini dostupan putem javni API da ljudi mogu nazvati. 187 00:10:20,950 --> 00:10:24,430 >> Dakle API je aplikacija Programiranje sučelja. 188 00:10:24,430 --> 00:10:28,930 I to u osnovi se odnosi na Krajnja točka koja sustava ili tehnologije 189 00:10:28,930 --> 00:10:31,720 možete nazvati i dobiti podatke natrag strukturirani format na način 190 00:10:31,720 --> 00:10:32,900 da se može koristiti. 191 00:10:32,900 --> 00:10:36,060 Dakle, to ne ovisi na ide na web stranicu 192 00:10:36,060 --> 00:10:37,970 i struganje podatke off to je, na primjer. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> Dakle, to je početna stranica Knjižnica Cloud točka API, 195 00:10:45,010 --> 00:10:47,220 koji je u suštini njegova verzija dva. 196 00:10:47,220 --> 00:10:50,130 Dakle, to je druga iteracija pokušava učiniti sve ove podatke 197 00:10:50,130 --> 00:10:53,280 dostupni na svijetu. 198 00:10:53,280 --> 00:10:59,560 Tako je http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 I samo razbiti ovaj dolje malo, što to znači 200 00:11:03,830 --> 00:11:06,115 je da je ova verzija dva API. 201 00:11:06,115 --> 00:11:08,490 Postoji inačica jedan, koji Neću govoriti o tome. 202 00:11:08,490 --> 00:11:09,750 No, tu je verzija jedan. 203 00:11:09,750 --> 00:11:14,740 >> I ako zovete ovo API, što su sve stavke. 204 00:11:14,740 --> 00:11:20,640 I dio idejom API je API je ugovor. 205 00:11:20,640 --> 00:11:23,440 To je nešto što je neće promijeniti. 206 00:11:23,440 --> 00:11:24,850 Tako, na primjer, - 207 00:11:24,850 --> 00:11:27,410 >> A razlog je da ako ja izgraditi nekakav sustav koji 208 00:11:27,410 --> 00:11:33,210 će se koristiti knjižnica oblak API za prikaz knjige ili pomoći ljudima da pronađu 209 00:11:33,210 --> 00:11:36,190 Informacije na jedinstven način, ono što ne želimo da se dogodi 210 00:11:36,190 --> 00:11:38,940 je za nas da ide promijeniti način kako API radi, i odjednom 211 00:11:38,940 --> 00:11:41,340 sve lomi na krajnjeg korisnika strani. 212 00:11:41,340 --> 00:11:46,710 Dakle, dio, ako radite API dostupan na svijetu, to je 213 00:11:46,710 --> 00:11:49,396 Dobra je praksa da se stavi Broj verzije u njemu, tako ljudi 214 00:11:49,396 --> 00:11:51,020 Znaš ono inačica oni bave. 215 00:11:51,020 --> 00:11:54,300 >> Dakle, ako smo odlučili smo pronaći bolji način stavljanja na raspolaganje ove informacije, 216 00:11:54,300 --> 00:11:57,295 bismo mogli promijeniti da bi nazvati tu verziju tri. 217 00:11:57,295 --> 00:11:59,920 Dakle, svatko tko je još uvijek koriste Verzija dva, da će i dalje raditi. 218 00:11:59,920 --> 00:12:03,490 Ali inačica tri bi imaju sve nove stvari. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> Dakle, to je API, ali ovo stvarno izgleda kao URL. 221 00:12:09,210 --> 00:12:11,680 I što je to primjer je ono što je 222 00:12:11,680 --> 00:12:16,615 pozvao API ostatak, koji je dostupan tijekom samo redovito web veze. 223 00:12:16,615 --> 00:12:19,680 A možete zapravo ići na nju u pregledniku. 224 00:12:19,680 --> 00:12:28,550 >> Dakle, ovdje sam upravo otvorio Firefox i otišao api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 I tako ono što mogu dobiti ovdje zapravo prva stranica 226 00:12:31,560 --> 00:12:34,740 rezultata iz cijele skup stavki koje imamo. 227 00:12:34,740 --> 00:12:37,460 I to je ovdje u XML formatu. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 I to je također bio prettified Firefox. 230 00:12:42,210 --> 00:12:45,850 To zapravo ne moraju svi ovi malo širi i ugovaranje 231 00:12:45,850 --> 00:12:47,880 doohickeys ovdje. 232 00:12:47,880 --> 00:12:52,520 To je vrsta ljepše Verzija način gledanja na nju. 233 00:12:52,520 --> 00:12:57,040 >> No, što to govori nam se Ja sam tražio sve stavke. 234 00:12:57,040 --> 00:13:03,120 Dakle, postoje 13289475 stavke. 235 00:13:03,120 --> 00:13:06,150 I ja gledam prvi 10, s početkom u poziciji nula 236 00:13:06,150 --> 00:13:09,760 jer u računalnoj znanosti uvijek početi od nule. 237 00:13:09,760 --> 00:13:15,150 A ono što sam ovdje, ako sam samo kolaps to, vidjet ćete da sam dobio 10 predmeta. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> A ako pogledamo na stavku, mogu vidim da sam dobio informaciju o tome. 240 00:13:25,210 --> 00:13:27,400 I to je ono što se zove MODS oblik. 241 00:13:27,400 --> 00:13:30,860 I tako ću se prebaciti ovamo na trenutak. 242 00:13:30,860 --> 00:13:33,750 OK. 243 00:13:33,750 --> 00:13:37,447 >> Tako ćemo tražiti nešto u posebna jer prvi predmet koji 244 00:13:37,447 --> 00:13:40,030 se događa da se, kada pogledate kroz cijelu kolekciju 245 00:13:40,030 --> 00:13:41,750 je, po definiciji, slučajni. 246 00:13:41,750 --> 00:13:44,550 Tako ćemo tražiti neke krafne. 247 00:13:44,550 --> 00:13:46,830 Oh. 248 00:13:46,830 --> 00:13:49,190 >> OK. 249 00:13:49,190 --> 00:13:49,940 Tako krafne. 250 00:13:49,940 --> 00:13:55,360 Tako smo našli tu su 80 predmeta u Zbirka koja referenca krafne. 251 00:13:55,360 --> 00:13:57,150 Tražimo u prvom njih 10. 252 00:13:57,150 --> 00:14:01,890 Sada, možete vidjeti ovdje način na koji I rekao sam u potrazi za krafne, 253 00:14:01,890 --> 00:14:04,400 Upravo sam dodao nešto niza upita URL. 254 00:14:04,400 --> 00:14:09,680 Dakle, q jednak krafne, koje možete pogledajte malo lakše ovdje. 255 00:14:09,680 --> 00:14:12,131 >> A to zapravo znači da je spec za API, koji je 256 00:14:12,131 --> 00:14:13,880 definira što sve Ovi parametri znače. 257 00:14:13,880 --> 00:14:17,150 A to znači da ćemo se Pretražite sve za krafne. 258 00:14:17,150 --> 00:14:24,910 >> Dakle, na prvom stavku ovdje imamo možete vidjeti naslov Donuts, 259 00:14:24,910 --> 00:14:29,310 a tu je titl naziva Američki strast, što je, pretpostavljam, 260 00:14:29,310 --> 00:14:31,610 potrebi. 261 00:14:31,610 --> 00:14:36,134 Postoji mnogo different-- 262 00:14:36,134 --> 00:14:38,050 Kada dođete do točke dobivanja podataka, 263 00:14:38,050 --> 00:14:41,020 Postoji mnogo različitih formati da možete ući. 264 00:14:41,020 --> 00:14:44,050 A tu su i različite jačine i slabosti za sve njih. 265 00:14:44,050 --> 00:14:49,000 Dakle ovo, možete vidjeti Ovdje, ovaj oblik je vrlo bogata. 266 00:14:49,000 --> 00:14:51,946 I to je standardizirana. 267 00:14:51,946 --> 00:14:55,040 >> Dakle, postoji određeni naslov polje, titl polje. 268 00:14:55,040 --> 00:14:58,950 Postoji alternativni Naslov, American strast. 269 00:14:58,950 --> 00:15:01,650 Tu je ime povezano s njom. 270 00:15:01,650 --> 00:15:03,120 Tip je izvor teksta. 271 00:15:03,120 --> 00:15:06,070 Tu je puno informacija ovdje u ovom formatu. 272 00:15:06,070 --> 00:15:09,480 >> No, tu su i hrpa različitih formata. 273 00:15:09,480 --> 00:15:11,920 Dakle, ono što smo bili samo gledajući je format 274 00:15:11,920 --> 00:15:17,700 nazivaju MODS, koja se zalaže za Metadata Objekt Opis usluga, 275 00:15:17,700 --> 00:15:18,250 potencijalno. 276 00:15:18,250 --> 00:15:23,030 Ja sam zapravo sasvim sigurni S. Ali, to je prilično složena format. 277 00:15:23,030 --> 00:15:24,240 To je zadani format. 278 00:15:24,240 --> 00:15:30,260 >> No, to je onaj koji čuva bogatstvo svih podataka 279 00:15:30,260 --> 00:15:33,820 da knjižnica ima, jer to je vrlo blizu onome što 280 00:15:33,820 --> 00:15:35,110 Knjižnica koristi interno. 281 00:15:35,110 --> 00:15:39,030 To je standard koji je koristi u cijeloj zemlji, 282 00:15:39,030 --> 00:15:40,944 diljem svijeta u akademskim knjižnicama. 283 00:15:40,944 --> 00:15:42,110 I to je vrlo udjelovanje. 284 00:15:42,110 --> 00:15:44,852 Dakle, ako ste je dobio dokument koji je u Mods formatu, 285 00:15:44,852 --> 00:15:47,560 možete dati da se netko drugi čiji sustavi razumiju Modovi, 286 00:15:47,560 --> 00:15:48,518 i oni mogu uvesti. 287 00:15:48,518 --> 00:15:50,840 Dakle, to je standard. 288 00:15:50,840 --> 00:15:54,250 To je vrlo dobro definirana, vrlo specifičan. 289 00:15:54,250 --> 00:15:58,980 I to je ono što ga čini udjelovanje jer ako netko kaže, 290 00:15:58,980 --> 00:16:04,930 ovo je alternativni naslov snimanje, svi znaju što to znači. 291 00:16:04,930 --> 00:16:07,740 S druge strane, to je vrlo komplicirano. 292 00:16:07,740 --> 00:16:13,160 >> Dakle, ako ste se pogledati U ovom rekord ovdje, 293 00:16:13,160 --> 00:16:15,320 ako ja samo želim da se Naslov ovog dokumenta, 294 00:16:15,320 --> 00:16:21,150 ove knjige, koja je vjerojatno Donuts, Američki Passion, parsiranje ga 295 00:16:21,150 --> 00:16:22,940 je malo koji su uključeni. 296 00:16:22,940 --> 00:16:27,380 Dok postoji još jedan Format naziva Dublin Core, 297 00:16:27,380 --> 00:16:29,730 što je mnogo, mnogo jednostavniji oblik. 298 00:16:29,730 --> 00:16:33,764 >> I tako vidite ovdje, ne postoji naslov, podnaslov, alternativni naslov. 299 00:16:33,764 --> 00:16:35,930 Postoji samo naslov, Donuts, American strast, 300 00:16:35,930 --> 00:16:38,780 i još jedan naslov, American strast. 301 00:16:38,780 --> 00:16:42,907 Dakle, kada ste u potrazi na kojoj formi želite dobiti podatke iz, 302 00:16:42,907 --> 00:16:44,740 Puno ovisi o tome kako ti si idući u ga koristiti. 303 00:16:44,740 --> 00:16:46,573 Koristite li za interoperabilnost ili radite 304 00:16:46,573 --> 00:16:49,970 Želite nešto jednostavno da možda biti lakše raditi? 305 00:16:49,970 --> 00:16:56,002 >> S druge strane, puno Pojedinosti se vrsta squished dolje. 306 00:16:56,002 --> 00:16:58,460 Možda ćete izgubiti nijanse ono što posebno znači polja 307 00:16:58,460 --> 00:17:02,960 Ako ste se bave Dublin Core, koji ne bi dobili s Mods. 308 00:17:02,960 --> 00:17:06,462 Dakle, to su dva formata možete dobiti iz API. 309 00:17:06,462 --> 00:17:08,920 A u biti, mi smo imajući je iza kulisa u Mods. 310 00:17:08,920 --> 00:17:14,179 No, možemo vam dati ga u Mods a Dublin Core i sve ostalo što je dobro. 311 00:17:14,179 --> 00:17:16,470 Drugi obzir prilikom ste u potrazi za podacima 312 00:17:16,470 --> 00:17:21,210 je li ga dobiti ili kao JSON, koji znači JavaScript Object notacija, 313 00:17:21,210 --> 00:17:24,720 ili XML, koja se zalaže za Extensible Markup Language. 314 00:17:24,720 --> 00:17:30,080 I ovi podaci prikazi i ima točno iste podatke, točno 315 00:17:30,080 --> 00:17:31,080 istom području. 316 00:17:31,080 --> 00:17:33,644 Ali oni su samo sintaktički razlikuju. 317 00:17:33,644 --> 00:17:40,401 >> Dakle, to je A- 318 00:17:40,401 --> 00:17:41,400 Pa, neka je samo prebaciti. 319 00:17:41,400 --> 00:17:47,490 Dakle, ovo je naš upit za krafne u XML formatu. 320 00:17:47,490 --> 00:17:53,470 Ako sam samo prebaciti to biti JSON, Vidim da izgleda drugačije. 321 00:17:53,470 --> 00:17:58,580 Dakle, sada je to isti sadržaj, ali različite strukture. 322 00:17:58,580 --> 00:18:00,080 Postoje manje uglate zagrade. 323 00:18:00,080 --> 00:18:02,530 Tu je manje preopširan. 324 00:18:02,530 --> 00:18:06,440 >> A to je format koji, ako vas rade u web okruženju, 325 00:18:06,440 --> 00:18:09,680 što se najvjerojatnije događa da želite koristiti, jer jednom 326 00:18:09,680 --> 00:18:12,630 od lijepih stvari o JSON je je kompatibilan s JavaScript. 327 00:18:12,630 --> 00:18:17,680 Dakle, ako ja pišem web aplikaciju, mogu povući u JSON i jednostavno raditi s njim izravno. 328 00:18:17,680 --> 00:18:20,187 Dok s XML, to je malo više komplicirano. 329 00:18:20,187 --> 00:18:21,520 Pa opet, to su i korisni. 330 00:18:21,520 --> 00:18:26,387 Samo su različiti slučajevi korištenje gdje se ljudi možda žele da ih koriste. 331 00:18:26,387 --> 00:18:26,886 OK. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 Dakle, natrag na API. 334 00:18:31,680 --> 00:18:32,900 Dakle, možemo tražiti for-- 335 00:18:32,900 --> 00:18:36,220 >> Dajem primjer u potrazi za krafne. 336 00:18:36,220 --> 00:18:39,330 Također možete tražiti samo u Posebno polje roku ovdje. 337 00:18:39,330 --> 00:18:41,310 Dakle, umjesto da traži Cijeli rekord, 338 00:18:41,310 --> 00:18:43,870 Mogu samo traži polje naslov. 339 00:18:43,870 --> 00:18:48,810 I tako sada ima 25 stvari koje ima krafne u naslovu, od kojih je jedan 340 00:18:48,810 --> 00:18:52,430 o vraćanju močvare u upravljanju 341 00:18:52,430 --> 00:18:54,990 rupe u krafna Program, koji je vjerojatno 342 00:18:54,990 --> 00:18:58,970 nije nužno ono što tražimo kad smo u potrazi za krafne. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> Također možete, ako ste bave API-- 345 00:19:05,490 --> 00:19:08,827 >> Dio ima API daje Ljudi pristup do velikih skupova podataka. 346 00:19:08,827 --> 00:19:11,410 A tu su i par drugačiji Alati možete koristiti za to. 347 00:19:11,410 --> 00:19:14,170 Jedan od njih je, vrlo jednostavno, što Možete stranica putem podataka. 348 00:19:14,170 --> 00:19:17,340 Dakle, baš kao da ste učinili upit putem web sučelja, 349 00:19:17,340 --> 00:19:19,470 možete pogledati na stranici jedne, Stranica dvije, tri stranice. 350 00:19:19,470 --> 00:19:22,040 Možete napraviti isto stvar kroz API. 351 00:19:22,040 --> 00:19:24,150 Vi samo trebate biti izričit u tome što to učinite. 352 00:19:24,150 --> 00:19:29,511 >> Tako na primjer, ako tražim na moj prvi upit ovdje, 353 00:19:29,511 --> 00:19:32,510 gdje radim potragu za stvarima s krafnama u naslovu, ja mogu reći, 354 00:19:32,510 --> 00:19:35,415 a ograničenje iznosi 20, što znači daj mi prvih 20 zapisa, a ne 355 00:19:35,415 --> 00:19:38,540 prvih 10, što je zadana, jer želim gledati na 20 u isto vrijeme. 356 00:19:38,540 --> 00:19:43,435 Ili ja mogu reći, postaviti početi jednak 20 i granice 357 00:19:43,435 --> 00:19:47,150 jednaka 20, koji će dati ja bilježi 21 do 40. 358 00:19:47,150 --> 00:19:52,680 >> Pa valjda je stvar oduzeti ovdje 359 00:19:52,680 --> 00:19:57,290 da smo pomoću žice upita postaviti parametre na upit. 360 00:19:57,290 --> 00:20:02,760 I to vam omogućuje kontrolu ono što ste dobili natrag. 361 00:20:02,760 --> 00:20:05,980 >> Još jedan alat koji možete koristiti, - 362 00:20:05,980 --> 00:20:09,250 >> I to je zapravo korisna u Uvjeti istražujući podatke. 363 00:20:09,250 --> 00:20:10,840 >> --is nešto što se zove faceting. 364 00:20:10,840 --> 00:20:15,530 Dakle, termin je faceting Ne nužno zajedničko. 365 00:20:15,530 --> 00:20:16,880 No, svi smo ga vidjeli prije. 366 00:20:16,880 --> 00:20:18,630 Ako pogledamo Amazon, na primjer, 367 00:20:18,630 --> 00:20:20,870 i obaviti pretrage za krafne u knjigama, 368 00:20:20,870 --> 00:20:27,080 Ovdje oni 'je dobio niz knjiga, i oni su grupirani po kategorijama, 369 00:20:27,080 --> 00:20:30,470 i dobiti različite kategorije, i koliko knjiga u svakoj kategoriji 370 00:20:30,470 --> 00:20:31,330 pojaviti. 371 00:20:31,330 --> 00:20:33,420 >> Dakle, to je u osnovi aspekt. 372 00:20:33,420 --> 00:20:37,570 Možete uzeti sve njihove knjige, 1800 Knjige koje odgovaraju krafne na Amazonu. 373 00:20:37,570 --> 00:20:39,820 12 od njih su u Kategorija doručak. 374 00:20:39,820 --> 00:20:43,100 21 u tijesto i pečenje, i tako dalje i tako dalje. 375 00:20:43,100 --> 00:20:47,670 >> Dakle, ovo je stvarno korisno alat za istraživanje sadržaj 376 00:20:47,670 --> 00:20:53,260 u knjižnici te jer kada pogledate na aspekt, 377 00:20:53,260 --> 00:20:56,520 To vam daje ideju o tome koje su teme postoji, kao što vrste predmeta 378 00:20:56,520 --> 00:20:58,510 su najpopularniji u vašem upita set. 379 00:20:58,510 --> 00:21:00,950 I to vam pomaže da otjerati i istraživanje. 380 00:21:00,950 --> 00:21:02,770 Dakle, što možemo učiniti istu stvar. 381 00:21:02,770 --> 00:21:05,940 >> Ako želite koristiti API i pogledati aspektima, 382 00:21:05,940 --> 00:21:08,950 možemo dodati još jedan parametar naš prijatelj niza upita. 383 00:21:08,950 --> 00:21:12,540 Dakle aspektima jednako zarez odvojen popis onoga što želimo aspekt dalje. 384 00:21:12,540 --> 00:21:14,790 Tako je jedan od aspekata može biti predmetom. 385 00:21:14,790 --> 00:21:16,565 Drugi bi mogao biti jezik. 386 00:21:16,565 --> 00:21:19,665 I tako, ako smo pokrenuti taj upit, mi get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 Izgleda prilično mnogo isto ovdje. 389 00:21:24,830 --> 00:21:29,010 No, dodali smo do kraja popisa skup aspekata. 390 00:21:29,010 --> 00:21:34,060 Dakle, imamo aspekt zove predmet. 391 00:21:34,060 --> 00:21:40,250 Dakle, to nam govori da ako gledam na moje 80 rezultata krafna upit, 392 00:21:40,250 --> 00:21:42,100 13 od njih su podvrgnuti Sjedinjene Države. 393 00:21:42,100 --> 00:21:43,684 Tri su predmetnih krafne. 394 00:21:43,684 --> 00:21:45,600 Tri su predmet močvarnih obnove, 395 00:21:45,600 --> 00:21:47,720 koja može biti naš rupa u krafne. 396 00:21:47,720 --> 00:21:51,780 Dvije od njih, Simpsoni, i tako dalje i tako dalje. 397 00:21:51,780 --> 00:21:59,211 >> Dakle, to može biti korisno ako želite suziti svoju pretragu. 398 00:21:59,211 --> 00:22:00,210 To vam može pomoći da to učiniti. 399 00:22:00,210 --> 00:22:03,580 Pogotovo ako imate više od, recimo, 80 rezultati. 400 00:22:03,580 --> 00:22:05,980 >> Isto tako, zamolili smo za aspekata na jeziku. 401 00:22:05,980 --> 00:22:14,790 Dakle, ako gledamo na naše rezultate, vidjet ćemo 76 od njih su na engleskom jeziku, četiri na francuskom, 402 00:22:14,790 --> 00:22:19,620 dva na španjolskom, dva, mislim da je to nedefiniran ili nepoznato, nizozemski i latinski. 403 00:22:19,620 --> 00:22:22,830 Zato mislim da je latinski krafna rezultat, opet, 404 00:22:22,830 --> 00:22:24,922 nema nikakve veze s pečenim proizvodima. 405 00:22:24,922 --> 00:22:25,630 Ali tamo ići. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> Dakle, to je vrsta te prikazuje Kako možete povući sadržaj natrag 408 00:22:38,630 --> 00:22:41,270 iz API samo kroz web preglednik, što je super. 409 00:22:41,270 --> 00:22:44,320 No, to zapravo nije ono što bi obično se koriste u API za njega. 410 00:22:44,320 --> 00:22:48,710 Tako je jedan primjer kako vas moze napraviti to imam 411 00:22:48,710 --> 00:22:54,720 napisano super mali program, koji je, opet, ne moja krafna pretraživanje 412 00:22:54,720 --> 00:22:59,010 i odabire par polja i prikazuje ih u tablici. 413 00:22:59,010 --> 00:23:01,610 Dakle, to je vrlo Isti sadržaj koji smo upravo 414 00:23:01,610 --> 00:23:04,830 pila s nekoliko polja izvukao. 415 00:23:04,830 --> 00:23:12,090 Dakle, popis naslova, u Položaj što knjiga 416 00:23:12,090 --> 00:23:15,120 je oko, jezik, i tako dalje i tako dalje. 417 00:23:15,120 --> 00:23:20,480 >> Pa kako se to zapravo dogodilo, jer Mislim da moramo gledati u nekom kodu, 418 00:23:20,480 --> 00:23:22,420 is-- 419 00:23:22,420 --> 00:23:28,060 >> Ono što imamo ovdje je jednostavan HTML stranica, koji prikazuje tekst, 420 00:23:28,060 --> 00:23:32,900 Dobrodošli u knjižnici oblaka i zatim prikazuje tablicu rezultata. 421 00:23:32,900 --> 00:23:37,790 A tu su očito nema rezultata u stol, kada Stranica se učitava. 422 00:23:37,790 --> 00:23:41,380 No, ono što smo radili je, prije svega, što 423 00:23:41,380 --> 00:23:46,290 se učitava knjižnicu pod nazivom jQuery, što je u osnovi 424 00:23:46,290 --> 00:23:52,030 JavaScript knjižnica, što ga čini vrlo lako manipulirati JavaScript 425 00:23:52,030 --> 00:23:58,780 nativno, HTML i izradu web stranica, klijent-side logike i web stranice. 426 00:23:58,780 --> 00:24:01,595 >> Pa što imamo ovdje je jQuery ima metodu pod nazivom Get, 427 00:24:01,595 --> 00:24:05,270 koji se u bitnome će ići URL, koji je, u ovom slučaju, 428 00:24:05,270 --> 00:24:09,070 ovo poznato izgleda URL. 429 00:24:09,070 --> 00:24:14,440 A onda će doći na sadržaj da URL, a zatim pokrenuti funkciju na njemu. 430 00:24:14,440 --> 00:24:19,240 Tako smo, rekao je otići api.lib.harvard / edu. 431 00:24:19,240 --> 00:24:20,060 Traži krafne. 432 00:24:20,060 --> 00:24:21,300 Dajte nam 20 zapisa. 433 00:24:21,300 --> 00:24:28,590 A onda pokrenuti ovu funkciju, što Ja sam odabrana, prolazi mu podatke. 434 00:24:28,590 --> 00:24:34,430 A podatak da je JSON dobio vratio iz API. 435 00:24:34,430 --> 00:24:40,120 >> I onda mi kaže, da u roku Podaci postoji polje naziva stavke. 436 00:24:40,120 --> 00:24:48,117 I ako odem pogledati unatrag na jedan od ovih rezultata koje je ovdje, 437 00:24:48,117 --> 00:24:49,200 postoji nešto called-- 438 00:24:49,200 --> 00:24:50,220 >> Pa, to se zove opcija. 439 00:24:50,220 --> 00:24:53,520 Tako da može biti da. 440 00:24:53,520 --> 00:25:01,840 A što je to ipak ga prolazi kroz svaku stavku 441 00:25:01,840 --> 00:25:05,300 i onda zove još Funkcija na svaku stavku. 442 00:25:05,300 --> 00:25:08,440 A da je funkcija osnovi uzima vrijednost 443 00:25:08,440 --> 00:25:12,010 stavke koje se biti osobni rekord 444 00:25:12,010 --> 00:25:18,220 i omogućuje nam da izvući naslov, Pokrivenost i jezik. 445 00:25:18,220 --> 00:25:21,640 >> Tako mi nazivamo funkcionira na svim predmet koji smo se vratili iz API. 446 00:25:21,640 --> 00:25:25,397 A ako samo pogledamo U ovom komadu upravo ovdje, 447 00:25:25,397 --> 00:25:27,230 ono što mi radimo je mi stvaramo niz, 448 00:25:27,230 --> 00:25:31,810 što je u biti neki HTML markup oko stola, s value.title, 449 00:25:31,810 --> 00:25:35,790 što je titula objekt, value.coverage, 450 00:25:35,790 --> 00:25:36,790 što je pokrivenost, - 451 00:25:36,790 --> 00:25:38,225 >> I mi smo radili ček Ovdje se vidi tko je nedefiniran 452 00:25:38,225 --> 00:25:40,570 i to skriva li ona kaže nedefinirana, jer nismo stvarno zanima 453 00:25:40,570 --> 00:25:41,600 u tome. 454 00:25:41,600 --> 00:25:42,939 >> --and zatim jezik. 455 00:25:42,939 --> 00:25:44,730 I onda ono što smo radi se dodavanjem da 456 00:25:44,730 --> 00:25:48,510 na stolu koji je prepoznaje se po tom nizu ovdje. 457 00:25:48,510 --> 00:25:50,790 A kako se radi jQuery je ono što se to govori 458 00:25:50,790 --> 00:25:56,420 je u potrazi za stolom s idejom Rezultati i dodati ovaj tekst na njega. 459 00:25:56,420 --> 00:25:59,380 I ovo je tablica s rezultatima ideju. 460 00:25:59,380 --> 00:26:04,998 Dakle, ono što ste završili s je stranicu ovdje. 461 00:26:04,998 --> 00:26:06,206 A kako bi vidjeli source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 Pa, izvor zapravo nije ažurira kada se to dogodilo. 464 00:26:13,810 --> 00:26:18,740 Tako možete vidjeti stvarna Rezultati tablice ovdje ipak. 465 00:26:18,740 --> 00:26:24,770 >> Dakle, to je samo jednostavan primjer radi vrlo osnovni upit protiv API 466 00:26:24,770 --> 00:26:29,020 i prikazivanje podataka na neki drugi čine, a ne radi ništa previše fancy. 467 00:26:29,020 --> 00:26:36,370 Sada, još jedan primjer je kao Zahtjev je napisao David Weinberger 468 00:26:36,370 --> 00:26:39,120 kao demo toga što u biti pokazuje 469 00:26:39,120 --> 00:26:44,620 Kako možete zgnječiti do rezultata da ste uzimajući iz knjižnice oblaka API 470 00:26:44,620 --> 00:26:46,250 s, recimo, Google Books. 471 00:26:46,250 --> 00:26:52,225 >> I razmišljanje je da ja mogu pokrenuti upit protiv Google Books, 472 00:26:52,225 --> 00:26:56,060 dobiti cjelovito tekstualno pretraživanje, dobiti neke rezultate natrag, saznati koji od tih predmeta 473 00:26:56,060 --> 00:27:01,180 Zapravo postoje u Hollis, knjižnični sustav, 474 00:27:01,180 --> 00:27:03,200 i onda mi daju linkove natrag na tim stavkama. 475 00:27:03,200 --> 00:27:12,730 Dakle, ako sam tražiti, bilo je mračna i olujna noć, ja 476 00:27:12,730 --> 00:27:16,210 vratiti hrpu rezultata iz Googlea, a zatim je jedan rezultat 477 00:27:16,210 --> 00:27:19,460 što je bora u vremenu. 478 00:27:19,460 --> 00:27:29,330 A to su linkovi na knjige koje postoje u Harvard knjižnice sustava. 479 00:27:29,330 --> 00:27:32,160 >> Dakle, mislim da ovdje se ne toliko da to može ili ne 480 00:27:32,160 --> 00:27:34,118 biti onako kako želite tražiti u knjižnicu, 481 00:27:34,118 --> 00:27:38,310 ali to je potpuno drugačiji Način na koji nije bio dostupan za vas 482 00:27:38,310 --> 00:27:42,884 prije, kao da nikako nije mogla raditi Puni tekst pretraživanja na knjige koje još 483 00:27:42,884 --> 00:27:44,550 bili su dio Harvard knjižnice sustava. 484 00:27:44,550 --> 00:27:46,870 Dakle, sada je to način koje možete učiniti. 485 00:27:46,870 --> 00:27:51,930 A možete ih prikazati u bilo kojem formatu želite. 486 00:27:51,930 --> 00:27:55,990 Dakle, ovdje se, zapravo, mi smo otvaranje nove načine za ljude 487 00:27:55,990 --> 00:27:59,080 za rad s podacima. 488 00:27:59,080 --> 00:28:07,925 >> Drugi dio knjižnice oblaka je da pomaže izložiti neke podatke u korištenja 489 00:28:07,925 --> 00:28:08,800 da knjižnica ima. 490 00:28:08,800 --> 00:28:12,630 Dakle, ako idete u knjižnicu, a vi ste u potrazi za knjige, 491 00:28:12,630 --> 00:28:15,770 što ne mora nužno zapravo imaju ideju, 492 00:28:15,770 --> 00:28:19,080 za sve stavke u Konkretno predmet, što 493 00:28:19,080 --> 00:28:21,200 ljudi u zajednice, bilo da je 494 00:28:21,200 --> 00:28:24,890 definira kao Harvardu ili zemlja ili vaš razred, 495 00:28:24,890 --> 00:28:26,421 Što su otkrili najkorisnije? 496 00:28:26,421 --> 00:28:28,920 A knjižnica zapravo ima tona informacija o tome što 497 00:28:28,920 --> 00:28:32,999 je vrlo korisno, jer ako se puno ljudi su checking out knjigu, 498 00:28:32,999 --> 00:28:34,040 koji vam govori nešto. 499 00:28:34,040 --> 00:28:36,498 Tu mora biti neki razlog oni žele da se to provjeriti. 500 00:28:36,498 --> 00:28:38,270 Puno ljudi ga staviti na rezervi. 501 00:28:38,270 --> 00:28:42,520 >> Ako je na rezervni popis za puno nastave, koji vam govori nešto. 502 00:28:42,520 --> 00:28:45,960 Ako nastavnici su provjere iz puno i studenti nisu, 503 00:28:45,960 --> 00:28:47,200 da mi kaže nešto. 504 00:28:47,200 --> 00:28:49,280 Vice versa, koji je također govori vam nešto. 505 00:28:49,280 --> 00:28:54,680 Dakle, to bi bilo jako zanimljivo stavio tu informaciju vani i neka 506 00:28:54,680 --> 00:28:59,969 ljudi ga koristiti da im pomogne pronaći djeluje u okviru knjižničnog sustava. 507 00:28:59,969 --> 00:29:02,260 Druga strana je to postoje neke ozbiljne privatnosti 508 00:29:02,260 --> 00:29:07,854 zabrinutost zbog jednog od temeljne odrednice o knjižnici 509 00:29:07,854 --> 00:29:10,770 se nećemo biti priča ljudi što drugi ljudi čitaju. 510 00:29:10,770 --> 00:29:17,360 Pa čak i ako ovo govorim Knjiga je provjerio četiri puta 511 00:29:17,360 --> 00:29:20,070 u određenom mjesecu, kako bi se mogla koristiti 512 00:29:20,070 --> 00:29:25,252 link na određeni Osoba koju de-anonimnim podataka 513 00:29:25,252 --> 00:29:26,710 i saznati tko je to provjerio. 514 00:29:26,710 --> 00:29:30,792 Dakle, način na koji možemo avoid-- 515 00:29:30,792 --> 00:29:33,750 Način na koji možemo pokušati izvući Neki signal iz svih informacija 516 00:29:33,750 --> 00:29:36,740 bez povrede ičije privatnost 517 00:29:36,740 --> 00:29:42,150 je u biti gledamo 10 godina podataka o korištenju, - 518 00:29:42,150 --> 00:29:43,930 >> Tako da je tijekom dugog vremenskog razdoblja. 519 00:29:43,930 --> 00:29:50,639 >> --and reći, OK, neka je vidjeti kako mnogo puta to je rad koji se koriste, 520 00:29:50,639 --> 00:29:52,930 i koji su tijekom tog razdoblja vremena, a zatim se u osnovi 521 00:29:52,930 --> 00:29:56,300 vratiti broj koji zovemo stog rezultat, koji je u osnovi 522 00:29:56,300 --> 00:29:59,910 predstavlja koliko je bio korišten. 523 00:29:59,910 --> 00:30:01,084 I to number-- 524 00:30:01,084 --> 00:30:03,250 Mnogo različitih kalkulacija ići u taj broj. 525 00:30:03,250 --> 00:30:05,150 --but je vrlo grubo podatak koji vam pruža 526 00:30:05,150 --> 00:30:11,300 neke ideje o tome kako Zajednica može cijeniti taj posao. 527 00:30:11,300 --> 00:30:16,772 >> I tako jedna vrsta čak više konkretizira primjenu 528 00:30:16,772 --> 00:30:18,480 koji iskorištava to je nešto 529 00:30:18,480 --> 00:30:24,000 zove Stacklife, koji je zapravo dostupne putem glavnog Harvardu 530 00:30:24,000 --> 00:30:24,880 Knjižnica portal. 531 00:30:24,880 --> 00:30:26,700 Dakle, ići na library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 Vidjet ćete veliki broj različitih načini traženja knjižnici. 533 00:30:29,360 --> 00:30:32,300 A jedan od njih se zove Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> A to je aplikacija koja pregleda sadržaja knjižnice, 535 00:30:38,980 --> 00:30:43,490 ali potpuno je izgrađen na vrhu tih API. 536 00:30:43,490 --> 00:30:46,910 Dakle, ne postoji posebna stvar događa iza kulisa. 537 00:30:46,910 --> 00:30:49,570 Nema pristupa Podaci koje nemate. 538 00:30:49,570 --> 00:30:54,090 To je pomoću API-ja koji će vam dati s potpuno različitim pregledavanja 539 00:30:54,090 --> 00:30:55,480 iskustva. 540 00:30:55,480 --> 00:30:58,570 >> Dakle, ako sam tražiti Alice u zemlji čudesa u ovom slučaju, 541 00:30:58,570 --> 00:31:02,600 I dobiti rezultat koji izgleda kao to, što je prilično much-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> To je vrlo slično na bilo koji drugi pretraživanja što bi mogli učiniti, osim u ovom slučaju 544 00:31:10,870 --> 00:31:15,730 mi smo rangiranje stavke stackscore, koji vam pruža 545 00:31:15,730 --> 00:31:19,850 neke ideje o tome kako popularni ovi predmeti bili u zajednici. 546 00:31:19,850 --> 00:31:25,610 I tako jasno, Alice in Wonderland Walt Disney je vrlo popularan. 547 00:31:25,610 --> 00:31:36,570 No, što se također može vidjeti četiri najbolje Ovdje su one koje se ne bi moglo actually-- 548 00:31:36,570 --> 00:31:39,220 >> Stvari koje su vrlo koriste, ali ne smijete odmah 549 00:31:39,220 --> 00:31:41,240 povezivanje s Alice u zemlji čudesa. 550 00:31:41,240 --> 00:31:44,650 Dakle, naš stari prijatelj Točku Alice je ovdje. 551 00:31:44,650 --> 00:31:46,350 Dakle, ja mogu pogledati njega. 552 00:31:46,350 --> 00:31:52,010 A sada ono što tražim u osnovi je postavljen of-- 553 00:31:52,010 --> 00:31:53,760 Mogu imati Točku Alice ovdje. 554 00:31:53,760 --> 00:31:56,700 Imam informacije o tome. 555 00:31:56,700 --> 00:32:00,230 I ja također imaju stackscore od, u ovom slučaju, 26. 556 00:32:00,230 --> 00:32:03,169 A to mi govori vrsta grubo Kako smo došli do ovoga stackscore, 557 00:32:03,169 --> 00:32:05,835 kao i tko je to provjerio, kao i kako mnogo puta to je odjavljena, 558 00:32:05,835 --> 00:32:08,440 kao i fakulteta ili undergrads, kako mnoge kopije knjižnica, 559 00:32:08,440 --> 00:32:11,300 i tako dalje i tako dalje. 560 00:32:11,300 --> 00:32:16,460 >> A također možete, dovoljno zanimljiva Ovdje, pregledati snopove gotovo. 561 00:32:16,460 --> 00:32:19,550 Tako su podaci ovdje, to vas pokazuje svojevrsno 562 00:32:19,550 --> 00:32:23,547 virtualnog predstavljanja od onoga što je polica moći 563 00:32:23,547 --> 00:32:25,880 izgledati, ako ste bili da se Svi knjižnici građa 564 00:32:25,880 --> 00:32:28,940 i staviti ih zajedno na jednoj beskrajnoj polici. 565 00:32:28,940 --> 00:32:30,990 I lijepo je što smo can-- 566 00:32:30,990 --> 00:32:33,380 >> Prije svega, metapodataka o tim knjigama 567 00:32:33,380 --> 00:32:35,627 često govori kada je objavljena. 568 00:32:35,627 --> 00:32:37,085 To vam govori koliko stranica ima. 569 00:32:37,085 --> 00:32:38,459 To bi moglo reći dimenzije. 570 00:32:38,459 --> 00:32:42,930 Dakle, možete vidjeti da se ogleda ovdje u smislu veličine knjige. 571 00:32:42,930 --> 00:32:46,740 >> A onda možemo koristiti stog rezultat za isticanje 572 00:32:46,740 --> 00:32:49,170 knjige koje su veće stog rezultate. 573 00:32:49,170 --> 00:32:54,930 Dakle, ako je tamnija, to znači da je, vjerojatno, da se upotrebljava češće. 574 00:32:54,930 --> 00:32:57,040 Dakle, u ovom slučaju, ja sam će pogoditi da je ovaj 575 00:32:57,040 --> 00:33:03,226 je verzija Alise u zemlji čudesa koji se vrlo često koristi i većina 576 00:33:03,226 --> 00:33:05,100 pristupiti, knjižnica ima najviše kopije. 577 00:33:05,100 --> 00:33:06,975 Dakle, ako ste u potrazi za Alisa u zemlji čudesa, 578 00:33:06,975 --> 00:33:10,220 to bi moglo biti dobro mjesto za početak. 579 00:33:10,220 --> 00:33:13,500 >> I onda ovdje možete povezati se da, recimo, Amazon kupiti knjigu, 580 00:33:13,500 --> 00:33:15,182 i tako dalje i tako dalje. 581 00:33:15,182 --> 00:33:17,140 Točka ovdje, opet, Nije toliko da je ovaj 582 00:33:17,140 --> 00:33:25,030 je najbolji način za pregledavanje knjižnicu ili pravi alat za svaku prigodu. 583 00:33:25,030 --> 00:33:28,400 No, to je još jedan način to radi. 584 00:33:28,400 --> 00:33:31,359 I čineći podatke dostupan putem API-ja, koji je 585 00:33:31,359 --> 00:33:34,650 izrađen je od vrlo jednostavnih građevnih blokova, koja vam omogućuje pretraživanje sadržaja, 586 00:33:34,650 --> 00:33:39,420 možete izgraditi nešto kao što je to da je moguće 587 00:33:39,420 --> 00:33:41,520 biti izuzetno vrijedna nekim ljudima. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> Dakle, to je vrsta, koliko god želim reći zaista o tome što je API 590 00:33:51,860 --> 00:33:56,070 a ono što izlaže, postoji cijeli gomila stvari iza kulisa, što 591 00:33:56,070 --> 00:33:59,480 Samo ću se osvrnuti na kratko Samo zato što na neki način dolazi na ovaj 592 00:33:59,480 --> 00:34:03,720 iz sasvim drugog kuta u Uvjeti kako se nešto ovako 593 00:34:03,720 --> 00:34:04,580 se staviti na svoje mjesto? 594 00:34:04,580 --> 00:34:10,820 >> Dakle API je standardni sučelje za sve ove sadržaje. 595 00:34:10,820 --> 00:34:13,820 No, da bi ga tamo, Prva stvar koju smo morali napraviti 596 00:34:13,820 --> 00:34:17,260 je pribrati podatke knjiga i slika 597 00:34:17,260 --> 00:34:21,580 i obavijesnih pomagala skup Dokument iz različitih Harvarda sustava. 598 00:34:21,580 --> 00:34:23,929 Aleph, VIA, a OAZA su imena sustava. 599 00:34:23,929 --> 00:34:28,820 A oni u biti idu u Plinovod, obradu cjevovod. 600 00:34:28,820 --> 00:34:33,230 >> Dakle, prije svega, dobili smo izvoz datoteke iz svih tih sustava. 601 00:34:33,230 --> 00:34:35,130 Mi ih podijeliti u pojedinim stavkama. 602 00:34:35,130 --> 00:34:39,360 Dakle, imamo datoteku, što je gigabajt, koji ima milijun zapisa u njemu. 603 00:34:39,360 --> 00:34:42,290 Tako smo ga podijeljen na posebne stavke. 604 00:34:42,290 --> 00:34:45,374 Zatim, za svaku stavku, možemo ga pretvoriti u mods, jer su neki od njih 605 00:34:45,374 --> 00:34:47,040 su nativno MODS, neki od njih nisu. 606 00:34:47,040 --> 00:34:49,204 Tako ćemo ih sve do biti u istom formatu. 607 00:34:49,204 --> 00:34:51,120 Zatim tu su i razne obogaćivanje koraka, gdje 608 00:34:51,120 --> 00:34:55,969 ćemo dodati više informacija o podacima nego je dostupna u knjižnici. 609 00:34:55,969 --> 00:34:59,750 Dakle, moramo dodati, prije svega imamo ono knjižnice ga držite. 610 00:34:59,750 --> 00:35:02,250 Idemo kroz koraku izračuna stackscore. 611 00:35:02,250 --> 00:35:07,112 Idemo kroz drugi korak dodavanjem više metapodataka u smislu 612 00:35:07,112 --> 00:35:10,730 o onome što zbirki ljudi možda je dodao this-- 613 00:35:10,730 --> 00:35:12,532 >> Ljudi stvaraju zbirke predmeta. 614 00:35:12,532 --> 00:35:13,990 Što zbirki to pripada? 615 00:35:13,990 --> 00:35:17,220 Kako su se ljudi tagged Ovaj sadržaj je u prošlosti? 616 00:35:17,220 --> 00:35:20,750 Tada ćete filtrirati, a ograničiti zapisi, jer, kao što sam spomenuo, 617 00:35:20,750 --> 00:35:24,120 postoji neki zapisi koji, zbog autorskih prava, ne možemo prikazati. 618 00:35:24,120 --> 00:35:26,700 I onda smo ih učitati u nešto što se zove 619 00:35:26,700 --> 00:35:31,680 Solr, što nije pogrešno napisana, ali je naziv komad softvera 620 00:35:31,680 --> 00:35:35,710 koji radi za pretraživanje indeksiranje, što vozi sve pretrage iza API. 621 00:35:35,710 --> 00:35:40,110 I onda to postaje dostupna API-ja, i ljudi mogu ga koristiti. 622 00:35:40,110 --> 00:35:44,640 >> Dakle, to je kao prilično jednostavan proces. 623 00:35:44,640 --> 00:35:47,230 Jedan od zanimljivih stvari o tome je 624 00:35:47,230 --> 00:35:50,990 da se radi o s 13 milijuna albuma 625 00:35:50,990 --> 00:35:53,820 a mi ćemo se bave ili više. 626 00:35:53,820 --> 00:36:01,260 A mi želimo biti u mogućnosti da obrađuju to u relativno brz način. 627 00:36:01,260 --> 00:36:03,630 Potrebno je dugo vremena da obraditi 13 milijuna ploča. 628 00:36:03,630 --> 00:36:09,529 >> Pa kako to da je cjevovod postaviti je da li can-- 629 00:36:09,529 --> 00:36:12,070 Mislim da je prednost plinovod, problem koji smo 630 00:36:12,070 --> 00:36:15,580 pokušavaju riješiti ovdje, da sve transformacije, sve 631 00:36:15,580 --> 00:36:18,729 ovi koraci u tom Plinovod se odvojiti. 632 00:36:18,729 --> 00:36:19,645 Nema ovisnosti. 633 00:36:19,645 --> 00:36:22,146 Ako ste obradu zapis o jednoj knjizi, 634 00:36:22,146 --> 00:36:24,270 nema ovisnosti u da je između drugu knjigu. 635 00:36:24,270 --> 00:36:27,760 >> Dakle, ono što možemo učiniti je zapravo, na svakom koraku u cjevovod, 636 00:36:27,760 --> 00:36:30,470 smo ga stavili u red u oblaku. 637 00:36:30,470 --> 00:36:32,250 Slučajno sam se na Amazon Web Services. 638 00:36:32,250 --> 00:36:35,140 Dakle, postoji popis, kažu, 10.000 stavke koje 639 00:36:35,140 --> 00:36:38,100 trebaju biti normaliziran i pretvoriti u Mods formatu. 640 00:36:38,100 --> 00:36:41,620 A mi zavrti onoliko poslužiteljima kao što smo željeli, možda 10 poslužitelja. 641 00:36:41,620 --> 00:36:44,860 I svaki od tih poslužitelja jednostavno sjedi, gleda u tom redu, 642 00:36:44,860 --> 00:36:46,730 vidi da je onaj koji treba se obrađuju, vuče off redu, 643 00:36:46,730 --> 00:36:48,740 ga obrađuje i palicama to na sljedeći red. 644 00:36:48,740 --> 00:36:54,200 >> I tako ono što nas omogućuje učiniti je prijaviti, u biti, 645 00:36:54,200 --> 00:36:58,110 koliko hardver kao i mi želimo da se to Problem u vrlo kratkom vremenskom razdoblju 646 00:36:58,110 --> 00:37:02,970 obraditi podatke što je brže moguće, što je nešto što se samo, 647 00:37:02,970 --> 00:37:08,220 Sada u svijetu cloud computing mi može odredbom poslužitelji u osnovi 648 00:37:08,220 --> 00:37:09,890 trenutno je to korisno. 649 00:37:09,890 --> 00:37:12,260 Dakle, ne moramo imati div poslužitelja sjede 650 00:37:12,260 --> 00:37:16,700 Sve vrijeme za napraviti obradu da bi se moglo dogoditi samo jednom tjedno. 651 00:37:16,700 --> 00:37:21,440 >> Dakle, to je uglavnom to. 652 00:37:21,440 --> 00:37:27,590 Postoji dokumentacija dostupni za knjižnice Cloud točka API 653 00:37:27,590 --> 00:37:31,960 na ovom URL-u, koji će se biti dostupna kasnije. 654 00:37:31,960 --> 00:37:36,730 I molimo vas pogledajte da li postoji nešto, 655 00:37:36,730 --> 00:37:37,579 Imate li ideje. 656 00:37:37,579 --> 00:37:38,120 Igrajte se s njim. 657 00:37:38,120 --> 00:37:38,830 Šaliti. 658 00:37:38,830 --> 00:37:42,800 I nadam se da možete doći s nešto veliko. 659 00:37:42,800 --> 00:37:44,740 Hvala Vam. 660 00:37:44,740 --> 00:37:45,899