1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 Jeffrey Licht: Živjo. 3 00:00:12,370 --> 00:00:13,550 Sem Jeffrey Licht. 4 00:00:13,550 --> 00:00:17,890 In jaz sem tukaj, da govoriti o Harvard Library in gradnja jutrišnjih 5 00:00:17,890 --> 00:00:20,870 danes knjižnica, I guess. 6 00:00:20,870 --> 00:00:23,040 Torej, tukaj v ozadju, igrišče za to sejo 7 00:00:23,040 --> 00:00:26,930 je v bistvu, da je Veliko bibliografskih podatkov 8 00:00:26,930 --> 00:00:28,400 na voljo v Harvard knjižnicah. 9 00:00:28,400 --> 00:00:33,434 In tam je priložnost, skozi nekatera orodja 10 00:00:33,434 --> 00:00:36,350 in projekt, ki se je razvila, da bi dobili dostop do informacij 11 00:00:36,350 --> 00:00:42,430 in se za kraje, ki Harvard Library je ne delaš prav zdaj, 12 00:00:42,430 --> 00:00:45,460 narediti nove stvari z njim, eksperiment in igral z njim. 13 00:00:45,460 --> 00:00:52,413 >> Torej vstopna točka v to API imenovano Harvard Library Cloud, ki 14 00:00:52,413 --> 00:00:57,650 je odprt metapodatki strežnik, katerih bom govoril o zdaj. 15 00:00:57,650 --> 00:01:02,595 Tako je ozadje, da je Veliko stvari v knjižnici Harvard. 16 00:01:02,595 --> 00:01:07,150 Imamo več kot 13 milijonov bibliografskih evidence, na milijone slik, 17 00:01:07,150 --> 00:01:11,090 in tisoče iskanju pomoči, ki so v bistvu dokumenti, ki opisujejo 18 00:01:11,090 --> 00:01:15,500 Zbirke, ki pravijo, kaj kar je v njih, škatle referatov 19 00:01:15,500 --> 00:01:21,080 in tako naprej, ki predstavljajo več kot milijon posamezne dokumente. 20 00:01:21,080 --> 00:01:24,290 In tam je tudi veliko informacije, ki jih ima knjižnica 21 00:01:24,290 --> 00:01:28,180 o tem, kako se uporablja, da vsebina bi bilo v interesu ljudi 22 00:01:28,180 --> 00:01:32,400 ki bi želeli delati z njim. 23 00:01:32,400 --> 00:01:36,150 >> Torej vse informacije Knjižnica ima metapodatkov. 24 00:01:36,150 --> 00:01:39,500 Torej metapodatki so podatki o podatkih. 25 00:01:39,500 --> 00:01:42,070 Torej, ko govorimo o informacije, ki jih je 26 00:01:42,070 --> 00:01:44,890 na voljo preko knjižnice oblak, ki je na voljo, 27 00:01:44,890 --> 00:01:47,760 to ni nujno dejanski dokumenti 28 00:01:47,760 --> 00:01:53,060 same, ne nujno v celoti Besedilo knjig ali popolnih podob, 29 00:01:53,060 --> 00:01:54,890 čeprav to dejansko lahko zgodilo. 30 00:01:54,890 --> 00:01:57,550 Ampak to je res informacije o podatkih. 31 00:01:57,550 --> 00:02:00,909 >> Torej si lahko zamislite katalogizacijo Informacije, klicnih številk, predmeti, 32 00:02:00,909 --> 00:02:02,700 koliko kopij knjiga obstaja, kaj 33 00:02:02,700 --> 00:02:06,380 so izdaje, kaj so Oblike, avtorji in tako naprej. 34 00:02:06,380 --> 00:02:12,250 Tako da je veliko informacij o Podatki v zbirki, da 35 00:02:12,250 --> 00:02:14,400 samo po sebi, je nekako samo po sebi koristna. 36 00:02:14,400 --> 00:02:19,230 In čeprav, če ste početje poglobljene raziskave, 37 00:02:19,230 --> 00:02:25,160 si seveda želeli, da bi dobili, da dejansko sama vsebino in pogled na podatke, 38 00:02:25,160 --> 00:02:30,140 metapodatkov je koristno v smislu analiziranju korpus kot celoto, 39 00:02:30,140 --> 00:02:33,870 všeč, kaj so stvari v zbirki. 40 00:02:33,870 --> 00:02:35,520 Kako so povezani? 41 00:02:35,520 --> 00:02:39,482 Pomaga vam res našli druge stvari, ki je pravzaprav glavni namen tega. 42 00:02:39,482 --> 00:02:41,190 Točka metapodatkov in katalog 43 00:02:41,190 --> 00:02:43,230 je, da vam pomaga najti vse informacije, ki jih je 44 00:02:43,230 --> 00:02:46,590 na voljo v zbirkah. 45 00:02:46,590 --> 00:02:53,690 >> Torej, to je primer metapodatkov za knjigo v knjižnici Harvard. 46 00:02:53,690 --> 00:02:56,370 Tako da je tam. 47 00:02:56,370 --> 00:02:59,850 In lahko vidite, da je dejansko nekoliko zapleteno. 48 00:02:59,850 --> 00:03:04,610 In del vrednosti metapodatkov znotraj sistema Harvard Library 49 00:03:04,610 --> 00:03:09,320 je, da je to bilo nekako od zgradili s catalogers 50 00:03:09,320 --> 00:03:12,720 in sestavljeni ljudje, ki uporabljajo Veliko znanja in spretnosti 51 00:03:12,720 --> 00:03:20,030 in mislili, da ji s časom, ki ima veliko vrednost. 52 00:03:20,030 --> 00:03:25,450 >> Torej, če ste vzeli pogled na ta zapis za Obrazloženi Alice, lahko ugotovite, 53 00:03:25,450 --> 00:03:32,590 imaš naslov, ki ga je napisal, avtorski in vsi različni predmeti so 54 00:03:32,590 --> 00:03:35,380 , ljudje so jo katalogizirati v. 55 00:03:35,380 --> 00:03:40,110 In lahko vidite, da je tudi v dodatek za veliko dobrih informacij 56 00:03:40,110 --> 00:03:42,852 Tukaj pa je nekaj podvajanja. 57 00:03:42,852 --> 00:03:45,560 Obstaja veliko kompleksnosti, ki je odraža skozi metapodatkov 58 00:03:45,560 --> 00:03:46,300 da imate. 59 00:03:46,300 --> 00:03:50,320 >> Torej, en naslov te knjige je Alice Adventures in Wonderland. 60 00:03:50,320 --> 00:03:53,880 Torej je to obrazloženim različica te knjige. 61 00:03:53,880 --> 00:03:56,380 Vendar pa je pozval tudi obrazloženim Alice, Alice Adventures 62 00:03:56,380 --> 00:03:58,570 v čudežni deželi, ker to je nekaj, kar 63 00:03:58,570 --> 00:04:00,430 Martin Gardner je napisal in označeni knjigo. 64 00:04:00,430 --> 00:04:03,369 In tam je veliko veliko informacij o logične uganke in stvari 65 00:04:03,369 --> 00:04:05,410 v Alice, ki vas Verjetno ni vedel. 66 00:04:05,410 --> 00:04:07,000 Torej, morate iti prebrati. 67 00:04:07,000 --> 00:04:11,940 >> Vendar pa lahko vidite, da je Veliko podrobnosti tukaj, 68 00:04:11,940 --> 00:04:15,340 vključno identifikatorje, ko ga je bila ustanovljena, od koder so prišli, 69 00:04:15,340 --> 00:04:17,420 glede na Harvard sistem, in tako naprej. 70 00:04:17,420 --> 00:04:20,350 Torej je to vzorec vrsta metapodatkov 71 00:04:20,350 --> 00:04:24,340 da boste lahko videli za knjigo v Zbirka Harvard Library. 72 00:04:24,340 --> 00:04:26,680 >> To je nekaj povsem drugega. 73 00:04:26,680 --> 00:04:32,610 Torej je sistem, imenovan VIA Harvard, ki je v bistvu 74 00:04:32,610 --> 00:04:39,990 je katalogiziranje slik in predmetov in vizualne stvari vsej Harvardu, 75 00:04:39,990 --> 00:04:44,010 in dodal nekaj metapodatkov z njimi, ki jih razvršča, 76 00:04:44,010 --> 00:04:49,200 in, v nekaterih primerih, ki zagotavlja majhne sličice 77 00:04:49,200 --> 00:04:51,250 da si lahko poglej, če si to želijo. 78 00:04:51,250 --> 00:04:54,240 >> Torej je to primer metapodatke, ki jih imajo za ploščo 79 00:04:54,240 --> 00:04:57,840 od, verjetno, Alice v čudežni deželi. 80 00:04:57,840 --> 00:05:00,499 In lahko vidite, da je minus metapodatki tukaj. 81 00:05:00,499 --> 00:05:02,040 To je samo drugačna vrsta objekta. 82 00:05:02,040 --> 00:05:03,425 In zato je tudi manj informacij. 83 00:05:03,425 --> 00:05:07,790 >> Imate predvsem dejstvo, da klic Številka, ki jo je v bistvu ustvaril, - 84 00:05:07,790 --> 00:05:10,410 >> Mi ne vemo, kdaj je bila ustvarjena. 85 00:05:10,410 --> 00:05:13,320 >> --and naslov. 86 00:05:13,320 --> 00:05:14,300 >> Drug primer. 87 00:05:14,300 --> 00:05:16,380 To je pomoč ugotovitev. 88 00:05:16,380 --> 00:05:19,030 Tako da je zbirka Lewis Članki Carrolla na Harvardu. 89 00:05:19,030 --> 00:05:23,601 Torej, to opisuje, kaj v tej zbirki. 90 00:05:23,601 --> 00:05:26,100 Torej je nekdo šel skozi in pogledal po vseh poljih 91 00:05:26,100 --> 00:05:32,220 in katalogizirati, saj nekateri v ozadju, napisal povzetek, kaj je tukaj. 92 00:05:32,220 --> 00:05:35,290 In če ste bili videti nadalje na to, to 93 00:05:35,290 --> 00:05:39,620 gre naprej za strani in strani in strani, ampak vam bo povedal, 94 00:05:39,620 --> 00:05:41,860 kaj črke in kaj izvira iz kakšnih škatel 95 00:05:41,860 --> 00:05:44,289 obstajala vsej zbirki. 96 00:05:44,289 --> 00:05:46,330 Ampak to je nekaj, da, če ste na Harvardu, 97 00:05:46,330 --> 00:05:50,720 lahko greš in dejansko fizično pogledati in, verjetno, si oglejte. 98 00:05:50,720 --> 00:05:53,440 >> Torej, to je vse super. 99 00:05:53,440 --> 00:05:54,450 Ta metapodatkovni je koristno. 100 00:05:54,450 --> 00:05:56,327 To je v sistemu Harvard Library. 101 00:05:56,327 --> 00:05:58,910 Obstajajo orodja na spletu, kjer vas Lahko greš in si oglejte na to, 102 00:05:58,910 --> 00:05:59,993 in glej ga, in ga iščete. 103 00:05:59,993 --> 00:06:02,810 In ga lahko in kocke narežite je v veliko različnih načinov. 104 00:06:02,810 --> 00:06:06,920 >> Ampak to je res na voljo samo, če ste človek sedel 105 00:06:06,920 --> 00:06:12,600 na svojem spletnem brskalniku ali nečesa ali telefon in navigacijo skozi to. 106 00:06:12,600 --> 00:06:16,730 To ni res na voljo v kakršne koli uporabne mode 107 00:06:16,730 --> 00:06:19,520 za druge sisteme ali drugi računalniki za uporabo, 108 00:06:19,520 --> 00:06:21,500 ne s sistemi v Knjižnica Harvard, 109 00:06:21,500 --> 00:06:24,890 ampak sistemi v zunanjem svetu, le druge ljudi na splošno. 110 00:06:24,890 --> 00:06:30,210 Torej, vprašanje je, kako lahko da na voljo za računalnike 111 00:06:30,210 --> 00:06:33,560 tako da lahko naredimo bolj zanimivo stvari z njim, kot le 112 00:06:33,560 --> 00:06:36,550 Brskanje po njej sami? 113 00:06:36,550 --> 00:06:39,766 >> Torej, zakaj bi si želeli to storiti? 114 00:06:39,766 --> 00:06:41,140 Obstaja veliko možnosti. 115 00:06:41,140 --> 00:06:43,980 Ena je, da bi lahko zgraditi popolnoma drugačen način brskanja 116 00:06:43,980 --> 00:06:46,962 vsebino, ki je na voljo skozi Harvard knjižnic. 117 00:06:46,962 --> 00:06:48,670 Pokazal vam bom eno kasneje imenovano Stacklife, 118 00:06:48,670 --> 00:06:52,440 ki ima popolnoma drugačen prevzamejo iščejo vsebine. 119 00:06:52,440 --> 00:06:54,560 >> Lahko graditi priporočilo motor. 120 00:06:54,560 --> 00:06:57,955 Torej Harvard Library ni poslovni rekel, rad to knjigo. 121 00:06:57,955 --> 00:07:01,080 Nato pojdite si oglejte na teh 17 drugih knjige, ki bi se radi 122 00:07:01,080 --> 00:07:03,200 ali ti 18 drugih slik. 123 00:07:03,200 --> 00:07:06,040 Ampak to zagotovo lahko biti dragocena lastnost. 124 00:07:06,040 --> 00:07:09,272 In glede metapodatkov, lahko to mogoče bi dal, da skupaj. 125 00:07:09,272 --> 00:07:11,980 Morda imate različne potrebe Pogoji iskanje vsebine, 126 00:07:11,980 --> 00:07:16,200 kot morda kljub orodij, ki so na voljo, da knjižnica omogoča 127 00:07:16,200 --> 00:07:18,450 na voljo, boste morda želeli iskati drugače 128 00:07:18,450 --> 00:07:21,847 ali optimizacijo za posameznega primera uporabe, ki morda je zelo specializirana. 129 00:07:21,847 --> 00:07:23,930 Morda obstaja le malo ljudi na svetu, ki 130 00:07:23,930 --> 00:07:25,846 želite iskati vsebino na ta način, vendar 131 00:07:25,846 --> 00:07:28,985 bi bilo super, če bi lahko dovolite, da to storim. 132 00:07:28,985 --> 00:07:30,860 Obstaja veliko analitike v samo kako ljudi 133 00:07:30,860 --> 00:07:33,860 uporabo vsebin, da bi bilo res zanimivo vedeti, če želite izvedeti 134 00:07:33,860 --> 00:07:37,280 katere knjige se uporabljajo, kaj niso, in tako naprej. 135 00:07:37,280 --> 00:07:41,670 In potem je tukaj še veliko priložnost, da se vključijo 136 00:07:41,670 --> 00:07:45,210 z drugimi informacijami da je tam na spletu. 137 00:07:45,210 --> 00:07:46,880 Tako smo have-- 138 00:07:46,880 --> 00:07:50,260 >> Na primer, NPR ima Segment pregled knjige, 139 00:07:50,260 --> 00:07:53,090 kjer so intervju avtorji o knjigah. 140 00:07:53,090 --> 00:07:56,837 In tako bi bilo super, če bi bili ozrl knjigo na Harvardu 141 00:07:56,837 --> 00:07:59,670 Knjižnica, in pravite, OK, tam je bil intervju z avtorjem. 142 00:07:59,670 --> 00:08:00,878 Pojdimo si oglejte to. 143 00:08:00,878 --> 00:08:05,461 Ali obstaja Wikipedia stran, kot je verodostojni, znanstvene reference 144 00:08:05,461 --> 00:08:07,710 O tej knjigi, ki vas morda želeli, da pogled na. 145 00:08:07,710 --> 00:08:12,600 >> Obstaja te vrste virov razpršeni po spletu. 146 00:08:12,600 --> 00:08:16,555 In jih združi je lahko le uporaba 147 00:08:16,555 --> 00:08:18,930 da nekdo gledaš Vsebina, ki iščejo nekaj. 148 00:08:18,930 --> 00:08:20,180 Vendar je tudi ne vrsta stvari, ki ste jo 149 00:08:20,180 --> 00:08:23,205 želijo knjižnica, ki je odgovoren za Padamo in lov določitvi 150 00:08:23,205 --> 00:08:25,455 vsi ti različni viri in jih priključiti skupaj 151 00:08:25,455 --> 00:08:28,920 ker oni nenehno spreminja. 152 00:08:28,920 --> 00:08:33,570 In tisto, kar mislijo, da je pomembno, maj ni bilo, kaj misliš, da je pomembno. 153 00:08:33,570 --> 00:08:36,929 >> In še bolj, v bistvu tam Veliko stvari nismo mislili doslej. 154 00:08:36,929 --> 00:08:42,222 Torej, če bomo to lahko odprejo več, ljudje poleg pol ducata ali tako, 155 00:08:42,222 --> 00:08:45,174 ki iščejo na ta na redno zaposlena lahko zamislite idej 156 00:08:45,174 --> 00:08:47,340 in masažo podatke, in to, kar hočejo z njim. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> Zato želimo, da bi to ki so na voljo v svet podatkov. 159 00:08:54,045 --> 00:08:55,670 No, obstaja nekaj zapletov. 160 00:08:55,670 --> 00:08:58,540 Ena je, da ta metapodatkov je v različnih sistemih. 161 00:08:58,540 --> 00:09:01,110 To je v različnih formatih. 162 00:09:01,110 --> 00:09:04,719 Torej obstaja nekaj normalizacija kar se mora zgoditi, 163 00:09:04,719 --> 00:09:08,010 ki normalizacija čemer postopek prinaša stvari iz različnih formatih 164 00:09:08,010 --> 00:09:12,940 in jih preslikavo v enotni obliki tako, da bodo polja ujemajo. 165 00:09:12,940 --> 00:09:15,160 >> Obstajajo nekatere omejitve avtorskih pravic. 166 00:09:15,160 --> 00:09:21,010 Nenavadno je, da vpis v katalog O knjiga je odgovoren za avtorske pravice. 167 00:09:21,010 --> 00:09:24,060 Torej, čeprav je to samo informacije, pridobljene iz knjige, 168 00:09:24,060 --> 00:09:25,330 to je tiskani. 169 00:09:25,330 --> 00:09:28,400 In glede na to, kdo dejansko ustvarjen, da so metapodatki, 170 00:09:28,400 --> 00:09:32,175 lahko obstajajo omejitve kdo Lahko ga razdeli, podobno to-- 171 00:09:32,175 --> 00:09:33,402 >> Jaz ne vem. 172 00:09:33,402 --> 00:09:36,110 To je lahko ali ne sme biti podoben Položaj besedila pesmi, 173 00:09:36,110 --> 00:09:36,610 npr. 174 00:09:36,610 --> 00:09:38,560 Torej, vsi vemo, kako, da soline ven. 175 00:09:38,560 --> 00:09:40,450 Tako da boste morali, da se okoli tega vprašanja. 176 00:09:40,450 --> 00:09:44,910 >> In potem še en kos je da obstaja veliko podatkov. 177 00:09:44,910 --> 00:09:52,420 Torej, če sem nekoga, ki želi delati s podatki, ali je kul ideja, 178 00:09:52,420 --> 00:09:55,350 ki se ukvarjajo z 14 milijonov evidence o moj laptop 179 00:09:55,350 --> 00:09:57,487 lahko problematično in težko upravljati. 180 00:09:57,487 --> 00:09:59,320 Zato želimo, da se zmanjša ovire za ljudi 181 00:09:59,320 --> 00:10:02,130 biti sposoben za delo s podatki. 182 00:10:02,130 --> 00:10:07,880 >> Tako pristop, ki bo, upajmo, naslovi vseh teh skrbi je iz dveh delov. 183 00:10:07,880 --> 00:10:11,770 Ena gradi platformo, ki bo Podatki iz vseh teh neusklajenih virov 184 00:10:11,770 --> 00:10:14,350 in ga poslabša, normalizira, ga oplemeniti in naredi 185 00:10:14,350 --> 00:10:16,650 je na voljo na enem mestu. 186 00:10:16,650 --> 00:10:20,950 In to naredi na voljo prek javni API, da ljudje lahko pokličete. 187 00:10:20,950 --> 00:10:24,430 >> Torej API Application Programski vmesnik. 188 00:10:24,430 --> 00:10:28,930 In se v osnovi nanaša na končne točke, ki sistem ali tehnologija 189 00:10:28,930 --> 00:10:31,720 lahko pokličete in dobite podatke nazaj v strukturiran format na način, 190 00:10:31,720 --> 00:10:32,900 da se lahko uporablja. 191 00:10:32,900 --> 00:10:36,060 Tako da to ni odvisno od o gre za spletno stran 192 00:10:36,060 --> 00:10:37,970 in strganje podatke off od tega, na primer. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> Torej je to domačo stran Postavka API knjižnica Cloud, 195 00:10:45,010 --> 00:10:47,220 ki je v bistvu njena različica dva. 196 00:10:47,220 --> 00:10:50,130 Torej, to je druga ponovitev trudijo, da bi vse te podatke 197 00:10:50,130 --> 00:10:53,280 na voljo na svetu. 198 00:10:53,280 --> 00:10:59,560 Torej, to je http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 In samo, da bi prekinil to dol malo, kaj to pomeni 200 00:11:03,830 --> 00:11:06,115 je, da je ta različica dva API. 201 00:11:06,115 --> 00:11:08,490 Tam je ena verzija, ki Ne bom govoril o tem. 202 00:11:08,490 --> 00:11:09,750 Vendar je različica on. 203 00:11:09,750 --> 00:11:14,740 >> In če kličeš to API, ste dobili predmetov. 204 00:11:14,740 --> 00:11:20,640 In del idejo API je API je pogodba. 205 00:11:20,640 --> 00:11:23,440 To je nekaj, kar je ne bo spremenilo. 206 00:11:23,440 --> 00:11:24,850 Tako na primer, - 207 00:11:24,850 --> 00:11:27,410 >> In razlog za to je, da če sem graditi nekakšen sistem, ki 208 00:11:27,410 --> 00:11:33,210 se dogaja, da uporabite knjižnica oblak API Za prikaz knjig ali pomagati ljudem najti 209 00:11:33,210 --> 00:11:36,190 Informacije na edinstvene načine, kar ne želimo, da se zgodi 210 00:11:36,190 --> 00:11:38,940 je za nas, da gredo spremeniti, kako da API deluje, in nenadoma 211 00:11:38,940 --> 00:11:41,340 vse izbruhne na strani končnega uporabnika. 212 00:11:41,340 --> 00:11:46,710 Torej del, če delaš API na voljo na svetu, to je 213 00:11:46,710 --> 00:11:49,396 dobra praksa, da dajo Številka različice v njem tako ljudi 214 00:11:49,396 --> 00:11:51,020 vem, kaj različica oni se ukvarjajo z. 215 00:11:51,020 --> 00:11:54,300 >> Torej, če se odločimo, moramo najti boljši način za dajanje na voljo te informacije, 216 00:11:54,300 --> 00:11:57,295 smo se lahko spremeni, da bi poklicati te različice tri. 217 00:11:57,295 --> 00:11:59,920 Torej, vsi, ki se še vedno uporabljajo Različica dve, da bom še vedno deluje. 218 00:11:59,920 --> 00:12:03,490 Različica za tri pa bi imajo vse nove stvari. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> Torej je to API, vendar je to Res izgleda kot URL. 221 00:12:09,210 --> 00:12:11,680 In kaj je to Primer je tisto, kar je 222 00:12:11,680 --> 00:12:16,615 imenuje API počitek, ki je na voljo več kot le redno spletne povezave. 223 00:12:16,615 --> 00:12:19,680 In lahko dejansko iti k njej v brskalniku. 224 00:12:19,680 --> 00:12:28,550 >> Torej, tukaj sem pravkar odprla Firefox in šli na api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 In kaj dobim tu v bistvu prva stran 226 00:12:31,560 --> 00:12:34,740 rezultatov iz celotne nabor predmetov, ki smo jih dobili. 227 00:12:34,740 --> 00:12:37,460 In to je tukaj v formatu XML. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 In to je bilo tudi prettified Firefox. 230 00:12:42,210 --> 00:12:45,850 To ne dejansko imajo vsi ti malo širi in sklepanje pogodb 231 00:12:45,850 --> 00:12:47,880 doohickeys tukaj. 232 00:12:47,880 --> 00:12:52,520 To je nekako lepše Različica način, da pogled na to. 233 00:12:52,520 --> 00:12:57,040 >> Toda kaj to nam govori, je Sem zahteval vse predmete. 234 00:12:57,040 --> 00:13:03,120 Torej obstaja 13289475 predmetov. 235 00:13:03,120 --> 00:13:06,150 In iščem na prvi 10, ki se začne na položaju ničelni 236 00:13:06,150 --> 00:13:09,760 ker v računalništvu smo se vedno začne na ničlo. 237 00:13:09,760 --> 00:13:15,150 In kaj imam tukaj, če sem samo kolaps to, boste videli, da imam 10 predmetov. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> In če pogledam na točki, sem lahko vidim, da sem dobil informacije o njem. 240 00:13:25,210 --> 00:13:27,400 In to je tisto, kar se imenuje MODS oblika. 241 00:13:27,400 --> 00:13:30,860 In tako se bom, da preklopite nazaj za trenutek. 242 00:13:30,860 --> 00:13:33,750 OK. 243 00:13:33,750 --> 00:13:37,447 >> Torej, kaj je iskati nekaj v posebno zato, ker je prvi element, ki 244 00:13:37,447 --> 00:13:40,030 se zgodi, da pridejo gor, ko si ogledujete skozi celotno zbirko 245 00:13:40,030 --> 00:13:41,750 je, po definiciji, naključno. 246 00:13:41,750 --> 00:13:44,550 Torej, si oglejmo nekaj krofov. 247 00:13:44,550 --> 00:13:46,830 Oh. 248 00:13:46,830 --> 00:13:49,190 >> OK. 249 00:13:49,190 --> 00:13:49,940 Tako krofi. 250 00:13:49,940 --> 00:13:55,360 Tako smo ugotovili, da je 80 predmetov v Zbirka, ki reference krofe. 251 00:13:55,360 --> 00:13:57,150 Iščemo po prvih 10 izmed njih. 252 00:13:57,150 --> 00:14:01,890 Zdaj si lahko ogledate tukaj, tako da Rekel sem, da iščem krofi, 253 00:14:01,890 --> 00:14:04,400 Pravkar sem dodal nekaj poizvedba URL-ja. 254 00:14:04,400 --> 00:14:09,680 Torej q enak krofe, ki jih lahko glej malo lažje tukaj. 255 00:14:09,680 --> 00:14:12,131 >> In to v bistvu pomeni, da je spec za API, ki 256 00:14:12,131 --> 00:14:13,880 določa, kaj vse ti parametri pomenijo. 257 00:14:13,880 --> 00:14:17,150 In to pomeni, da bomo iskanje vse za krofe. 258 00:14:17,150 --> 00:14:24,910 >> Torej, prvi točki imamo tu lahko vidite naslov je Donuts, 259 00:14:24,910 --> 00:14:29,310 in tam je podnaslov imenuje Ameriški Strast, ki je, mislim, 260 00:14:29,310 --> 00:14:31,610 primerno. 261 00:14:31,610 --> 00:14:36,134 Obstaja veliko different-- 262 00:14:36,134 --> 00:14:38,050 Ko prideš do točke pridobivanje podatkov, 263 00:14:38,050 --> 00:14:41,020 obstaja veliko različnih Oblike, ki jo lahko dobite v. 264 00:14:41,020 --> 00:14:44,050 In tam so različne jakosti in slabosti za vse od njih. 265 00:14:44,050 --> 00:14:49,000 Tako da je to ena, lahko vidite tukaj, je ta oblika zelo bogata. 266 00:14:49,000 --> 00:14:51,946 In to je standardizirana. 267 00:14:51,946 --> 00:14:55,040 >> Torej obstaja poseben naslov polje, podnaslov polje. 268 00:14:55,040 --> 00:14:58,950 Tam je namestnik Naslov, ameriški Passion. 269 00:14:58,950 --> 00:15:01,650 Tam je ime povezano z njim. 270 00:15:01,650 --> 00:15:03,120 Vrsta vira je besedilo. 271 00:15:03,120 --> 00:15:06,070 Obstaja veliko informacij tukaj v tem formatu. 272 00:15:06,070 --> 00:15:09,480 >> Vendar pa obstaja kup različnih formatov. 273 00:15:09,480 --> 00:15:11,920 Torej, kaj smo pravkar gledaš je format 274 00:15:11,920 --> 00:15:17,700 imenovane MODS, ki stoji za Metadata Object Opis storitev, 275 00:15:17,700 --> 00:15:18,250 potencialno. 276 00:15:18,250 --> 00:15:23,030 Jaz sem pravzaprav ni povsem prepričan o S. Ampak to je precej zapletena oblika. 277 00:15:23,030 --> 00:15:24,240 To je privzeti format. 278 00:15:24,240 --> 00:15:30,260 >> Ampak to je tista, ki ohranja Bogastvo vseh podatkov 279 00:15:30,260 --> 00:15:33,820 da je knjižnica zaradi to je zelo blizu temu, kar 280 00:15:33,820 --> 00:15:35,110 Knjižnica uporablja interno. 281 00:15:35,110 --> 00:15:39,030 To je standard, ki je uporabljajo po vsej državi, 282 00:15:39,030 --> 00:15:40,944 po vsem svetu v visokošolskih knjižnicah. 283 00:15:40,944 --> 00:15:42,110 In to je zelo interoperabilni. 284 00:15:42,110 --> 00:15:44,852 Torej, če imaš dokument da je v formatu obrambnih ministrstev, 285 00:15:44,852 --> 00:15:47,560 lahko daš, da nekomu drugemu katerih sistemi razumeti Mods, 286 00:15:47,560 --> 00:15:48,518 in jih lahko uvozite. 287 00:15:48,518 --> 00:15:50,840 Torej, to je standardni. 288 00:15:50,840 --> 00:15:54,250 To je zelo dobro opredeljena, zelo poseben. 289 00:15:54,250 --> 00:15:58,980 In to je tisto, kar je interoperabilni, ker če nekdo reče, 290 00:15:58,980 --> 00:16:04,930 to je namestnik naslov zapis, vsi vedo, kaj to pomeni. 291 00:16:04,930 --> 00:16:07,740 Na flip strani, to je zelo zapleteno. 292 00:16:07,740 --> 00:16:13,160 >> Torej, če ste vzeli pogled pri tem zapisu tukaj, 293 00:16:13,160 --> 00:16:15,320 Če želim, da bi dobili Naslov tega dokumenta, 294 00:16:15,320 --> 00:16:21,150 te knjige, ki je verjetno krofi, Ameriški Passion, ga razčlenjevanju ven 295 00:16:21,150 --> 00:16:22,940 je malo sodelujejo. 296 00:16:22,940 --> 00:16:27,380 Ker obstaja še en format imenovan Dublin Core, 297 00:16:27,380 --> 00:16:29,730 kar je še veliko, veliko preprostejše format. 298 00:16:29,730 --> 00:16:33,764 >> In tako vidite tukaj, ni naslov, podnaslov, namestnik naslov. 299 00:16:33,764 --> 00:16:35,930 Obstaja samo naslov, Krofi, ameriški Passion, 300 00:16:35,930 --> 00:16:38,780 in še en naslov, ameriška Passion. 301 00:16:38,780 --> 00:16:42,907 Torej, če ste iskali na kakšni obliki želite, da bi dobili podatke iz, 302 00:16:42,907 --> 00:16:44,740 Veliko je odvisno od tega, kako boste za njeno uporabo. 303 00:16:44,740 --> 00:16:46,573 Ali uporabljate za interoperabilnost, ali vam 304 00:16:46,573 --> 00:16:49,970 želite nekaj preprostega, da Morda bi bilo lažje delati? 305 00:16:49,970 --> 00:16:56,002 >> Na flip strani, veliko Podatki se nekako squished navzdol. 306 00:16:56,002 --> 00:16:58,460 Morda ste izgubili nianse kaj se na posameznem področju sredstvo 307 00:16:58,460 --> 00:17:02,960 Če imate opravka s Dublin Core, ki si ne bi dobili z Mods. 308 00:17:02,960 --> 00:17:06,462 Torej tisti, sta dva od formatov lahko dobite iz API. 309 00:17:06,462 --> 00:17:08,920 In v bistvu, smo vodenje je v zakulisju v mods. 310 00:17:08,920 --> 00:17:14,179 Lahko pa vam ga v mods in Dublin Core in karkoli drugega, kot dobro. 311 00:17:14,179 --> 00:17:16,470 Drugi dejavnik pri iščete v podatkih 312 00:17:16,470 --> 00:17:21,210 se ga lahko dobite bodisi kot JSON, ki stojala za JavaScript Object Notation, 313 00:17:21,210 --> 00:17:24,720 ali XML, ki stoji za Extensible Markup Language. 314 00:17:24,720 --> 00:17:30,080 In ti podatki predstavništva tako imajo popolnoma enake podatke, točno 315 00:17:30,080 --> 00:17:31,080 na istih področjih. 316 00:17:31,080 --> 00:17:33,644 Ampak oni so samo skladenjsko drugačna. 317 00:17:33,644 --> 00:17:40,401 >> Torej je to a-- 318 00:17:40,401 --> 00:17:41,400 No, kaj je samo stikalo. 319 00:17:41,400 --> 00:17:47,490 Torej je to naša poizvedba za krofi v obliki XML. 320 00:17:47,490 --> 00:17:53,470 Če sem stikalo, da je to JSON, Vidim, da izgleda drugače. 321 00:17:53,470 --> 00:17:58,580 Torej, zdaj je to isto vsebino, vendar drugačno strukturo. 322 00:17:58,580 --> 00:18:00,080 Obstajajo manj kotni nosilci. 323 00:18:00,080 --> 00:18:02,530 Tam je manj verbose. 324 00:18:02,530 --> 00:18:06,440 >> In to je format, ki, če vas delujejo v spletnem okolju, 325 00:18:06,440 --> 00:18:09,680 ste najverjetneje bo želeli uporabiti, ker ena 326 00:18:09,680 --> 00:18:12,630 od lepih stvari o JSON je združljiv z JavaScriptom. 327 00:18:12,630 --> 00:18:17,680 Torej, če pišem spletno aplikacijo, lahko potegnite v JSON in samo delo z njo neposredno. 328 00:18:17,680 --> 00:18:20,187 Ker je z XML, je malo bolj zapletena. 329 00:18:20,187 --> 00:18:21,520 Torej še enkrat, to so tako uporabni. 330 00:18:21,520 --> 00:18:26,387 So samo različni primeri uporabe kjer bi si ljudje želijo, da jih uporabljajo. 331 00:18:26,387 --> 00:18:26,886 OK. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 Torej nazaj na API. 334 00:18:31,680 --> 00:18:32,900 Tako bomo lahko poiščete for-- 335 00:18:32,900 --> 00:18:36,220 >> Dam primer iskanje krofi. 336 00:18:36,220 --> 00:18:39,330 Prav tako lahko poiščete samo v zlasti v polje tu. 337 00:18:39,330 --> 00:18:41,310 Torej, namesto da bi iskali Celoten zapis, 338 00:18:41,310 --> 00:18:43,870 Jaz lahko samo iskanje naslovnega polja. 339 00:18:43,870 --> 00:18:48,810 In tako zdaj obstaja 25 stvari, ki jih imajo krofe v naslovu, od katerih je eden 340 00:18:48,810 --> 00:18:52,430 Gre za obnavljanje mokrišča v upravljanju 341 00:18:52,430 --> 00:18:54,990 luknje v krof Program, ki je verjetno 342 00:18:54,990 --> 00:18:58,970 ni nujno, da tisto, kar smo iskali za takrat, ko smo iskali krofi. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> Lahko tudi, ko ste ki se ukvarjajo z API-- 345 00:19:05,490 --> 00:19:08,827 >> Del, ki ima API daje ljudje dostop do velikih zbirk podatkov. 346 00:19:08,827 --> 00:19:11,410 In tam so nekaj drugačni orodja, ki jih lahko uporabite za to. 347 00:19:11,410 --> 00:19:14,170 Eden od njih je, zelo preprosto, si Lahko Stran s podatki. 348 00:19:14,170 --> 00:19:17,340 Torej, tako kot, če vam poizvedbo prek spletnega vmesnika, 349 00:19:17,340 --> 00:19:19,470 si lahko ogledate na strani enega, Stran dva, tri strani. 350 00:19:19,470 --> 00:19:22,040 To lahko storite enako stvar skozi API. 351 00:19:22,040 --> 00:19:24,150 Samo morate biti izrecno v tem, kako si to naredil. 352 00:19:24,150 --> 00:19:29,511 >> Tako na primer, če iščem na moji prvi poizvedbi tukaj, 353 00:19:29,511 --> 00:19:32,510 kje delam iskanje stvari s krofi v naslovu, lahko rečem, 354 00:19:32,510 --> 00:19:35,415 in meja je enaka 20, kar pomeni, daj mi prvih 20 zapisov, ne 355 00:19:35,415 --> 00:19:38,540 Prvih 10, ki je privzeto, ker želim, da pogled na 20 naenkrat. 356 00:19:38,540 --> 00:19:43,435 Ali lahko rečem, nastavite začetek enak 20 in mejo 357 00:19:43,435 --> 00:19:47,150 enak 20, ki bo me beleži 21 skozi 40 let. 358 00:19:47,150 --> 00:19:52,680 >> Torej, mislim, da je stvar vzeti tu 359 00:19:52,680 --> 00:19:57,290 da smo z uporabo nizov poizvedbo nastaviti parametre na poizvedbo. 360 00:19:57,290 --> 00:20:02,760 In to vam omogoča nadzor kaj dobiš nazaj. 361 00:20:02,760 --> 00:20:05,980 >> Drugo orodje, ki ga lahko uporabite, - 362 00:20:05,980 --> 00:20:09,250 >> In to je res v pomoč pri Pogoji raziskovanju podatkov. 363 00:20:09,250 --> 00:20:10,840 >> --is nekaj, kar ti fasetirane optike. 364 00:20:10,840 --> 00:20:15,530 Tako izraz fasetirane optike je ni nujno, pogosti. 365 00:20:15,530 --> 00:20:16,880 Ampak si jo vsi videli. 366 00:20:16,880 --> 00:20:18,630 Če ste vzeli pogled na Amazon, na primer, 367 00:20:18,630 --> 00:20:20,870 in vam iskanje krofi v knjigah, 368 00:20:20,870 --> 00:20:27,080 Tukaj sem, da imam vrsto knjig, in oni so razvrščeni po kategorijah, 369 00:20:27,080 --> 00:20:30,470 in dobiš različne kategorije, in koliko knjig v vsaki kategoriji 370 00:20:30,470 --> 00:20:31,330 pokažejo. 371 00:20:31,330 --> 00:20:33,420 >> Torej, to je v bistvu vidik. 372 00:20:33,420 --> 00:20:37,570 Vzameš vse svoje knjige, 1800 knjige, ki ustrezajo krofe na Amazon. 373 00:20:37,570 --> 00:20:39,820 12 jih je v kategorija zajtrk. 374 00:20:39,820 --> 00:20:43,100 21 v peciva in peko in tako naprej in tako naprej. 375 00:20:43,100 --> 00:20:47,670 >> Torej, to je res uporabno orodje za raziskovanje vsebine 376 00:20:47,670 --> 00:20:53,260 v knjižnici, kot tudi ker če pogledaš na plati, 377 00:20:53,260 --> 00:20:56,520 vam daje idejo, kaj podredi obstaja, kot kakšne vrste predmetov 378 00:20:56,520 --> 00:20:58,510 so najbolj priljubljeni v vašem poizvedbe nizu. 379 00:20:58,510 --> 00:21:00,950 In to vam pomaga voziti off in raziskovanje. 380 00:21:00,950 --> 00:21:02,770 Tako bomo lahko storijo enako stvar. 381 00:21:02,770 --> 00:21:05,940 >> Če želimo uporabiti API in pogled na robu, 382 00:21:05,940 --> 00:21:08,950 smo dodali še en parameter naš prijatelj poizvedbi. 383 00:21:08,950 --> 00:21:12,540 Torej plati enaka vejico ločen seznam, kaj želimo fasete na. 384 00:21:12,540 --> 00:21:14,790 Tako je eden od vidikov lahko predmet. 385 00:21:14,790 --> 00:21:16,565 Druga bi bila jezik. 386 00:21:16,565 --> 00:21:19,665 In tako, če bomo zagnati poizvedbo, smo get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 Videti je precej isto tukaj. 389 00:21:24,830 --> 00:21:29,010 Vendar smo dodali do konca seznama niz vidikov. 390 00:21:29,010 --> 00:21:34,060 Torej imamo plati imenovano predmet. 391 00:21:34,060 --> 00:21:40,250 Torej, to nam pove, da če gledam pri mojih 80 rezultatov iz krof poizvedbo, 392 00:21:40,250 --> 00:21:42,100 13 jih ima izpostavljajte Združene države Amerike. 393 00:21:42,100 --> 00:21:43,684 Trije imajo tematska krofe. 394 00:21:43,684 --> 00:21:45,600 Trije imajo temo od mokrišč obnove, 395 00:21:45,600 --> 00:21:47,720 ki je lahko naša luknjo v krof. 396 00:21:47,720 --> 00:21:51,780 Dva od njih so Simpsons, in tako naprej in tako naprej. 397 00:21:51,780 --> 00:21:59,211 >> Torej, to je lahko koristno, če vas želite zožiti iskanje. 398 00:21:59,211 --> 00:22:00,210 To vam lahko pomaga narediti. 399 00:22:00,210 --> 00:22:03,580 Še posebej, če imate več kot, recimo, 80 rezultatov. 400 00:22:03,580 --> 00:22:05,980 >> Podobno smo tudi vprašal za fasete na jeziku. 401 00:22:05,980 --> 00:22:14,790 Torej, če se ozremo na naše rezultate, vidimo 76 od njih so v angleščini, štiri v francoščini, 402 00:22:14,790 --> 00:22:19,620 dva v španščini, dva, mislim, da je undefined ali neznano, nizozemsko in latinsko. 403 00:22:19,620 --> 00:22:22,830 Tako da mislim, latinščino krof rezultat, še enkrat, 404 00:22:22,830 --> 00:22:24,922 nima veze s pečenim blaga. 405 00:22:24,922 --> 00:22:25,630 Ampak tam greš. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> Torej, to je nekako vam bo pokazal, kako lahko potegnite vsebine nazaj 408 00:22:38,630 --> 00:22:41,270 od API samo prek spletni brskalnik, kar je super. 409 00:22:41,270 --> 00:22:44,320 Ampak to ni res, kaj bi običajno uporabljajo v API za njo. 410 00:22:44,320 --> 00:22:48,710 Torej, en primer, kako se bi dejansko naredil to sem imel 411 00:22:48,710 --> 00:22:54,720 napisal super majhen program, ki je, še enkrat, ne moj krof iskanje 412 00:22:54,720 --> 00:22:59,010 in izbere par polj in jih prikaže v tabeli. 413 00:22:59,010 --> 00:23:01,610 Torej, to je zelo veliko Ista vsebina, ki smo ga pravkar 414 00:23:01,610 --> 00:23:04,830 žaga z nekaj področjih potegnil ven. 415 00:23:04,830 --> 00:23:12,090 Torej, seznam naslovov, na lokacija kakšni knjigi 416 00:23:12,090 --> 00:23:15,120 gre, jezik, in tako naprej in tako naprej. 417 00:23:15,120 --> 00:23:20,480 >> Torej, kako se je to dejansko zgodilo, saj Mislim, da moramo gledati na neki kodo, 418 00:23:20,480 --> 00:23:22,420 is-- 419 00:23:22,420 --> 00:23:28,060 >> Kaj imamo tukaj je preprost HTML Stran, ki prikazuje besedila, 420 00:23:28,060 --> 00:23:32,900 dobrodošli v knjižnici oblak in nato prikaže tabelo rezultatov. 421 00:23:32,900 --> 00:23:37,790 In tam so očitno ni rezultati v Tabela ko postane stran naloži. 422 00:23:37,790 --> 00:23:41,380 Toda kaj delamo je, najprej smo 423 00:23:41,380 --> 00:23:46,290 nalagate knjižnico, imenovano jQuery, ki je v bistvu 424 00:23:46,290 --> 00:23:52,030 JavaScript knjižnico, ki si ga zelo enostavno manipulirati JavaScript 425 00:23:52,030 --> 00:23:58,780 naravno, HTML, in ustvarjanje spletnih strani, strani odjemalca logika in spletne strani. 426 00:23:58,780 --> 00:24:01,595 >> Torej, kaj imamo tukaj je jQuery Ima metodo, imenovano Get, 427 00:24:01,595 --> 00:24:05,270 ki v bistvu bo šel v URL, ki je v tem primeru, 428 00:24:05,270 --> 00:24:09,070 je to pozna išče URL. 429 00:24:09,070 --> 00:24:14,440 In bo potem dobil vsebino da URL in nato zaženite funkcijo na njem. 430 00:24:14,440 --> 00:24:19,240 Zato smo rekli, pojdite api.lib.harvard / edu. 431 00:24:19,240 --> 00:24:20,060 Iskanje krofi. 432 00:24:20,060 --> 00:24:21,300 Dajte nam 20 zapisov. 433 00:24:21,300 --> 00:24:28,590 In nato zaženete to funkcijo, Sem izbrana, ji posreduje podatke. 434 00:24:28,590 --> 00:24:34,430 In podatki JSON da dobil vrnil iz API. 435 00:24:34,430 --> 00:24:40,120 >> In potem mi govoriš, v roku, ki Podatki tam polje se imenuje točka. 436 00:24:40,120 --> 00:24:48,117 In če grem poglej nazaj ena od teh rezultatov, ki je tukaj, 437 00:24:48,117 --> 00:24:49,200 je nekaj called-- 438 00:24:49,200 --> 00:24:50,220 >> No, se imenuje točka. 439 00:24:50,220 --> 00:24:53,520 Tako da lahko da. 440 00:24:53,520 --> 00:25:01,840 In kaj počne je to, gre skozi vsako točko 441 00:25:01,840 --> 00:25:05,300 in pokliče drugega funkcija na vsaki točki. 442 00:25:05,300 --> 00:25:08,440 In da je v bistvu funkcija je ob vrednosti 443 00:25:08,440 --> 00:25:12,010 postavke, ki je bistvu posamezen zapis 444 00:25:12,010 --> 00:25:18,220 in nam omogoča, da izvleči naziv, pokritost in jezik. 445 00:25:18,220 --> 00:25:21,640 >> Tako pravimo funkcijo za vsak postavka, da smo dobili nazaj od API. 446 00:25:21,640 --> 00:25:25,397 In če si pogledamo na tem delu tukaj, 447 00:25:25,397 --> 00:25:27,230 kar počnemo, je smo ustvariti niz, 448 00:25:27,230 --> 00:25:31,810 ki je v bistvu nekaj HTML markup mizo, z value.title, 449 00:25:31,810 --> 00:25:35,790 ki je naslov objekt, value.coverage, 450 00:25:35,790 --> 00:25:36,790 ki je pokritost, - 451 00:25:36,790 --> 00:25:38,225 >> In delamo ček Tukaj lahko vidiš, kdo je nedefinirana 452 00:25:38,225 --> 00:25:40,570 in ga skrivali, če piše undefined, zato, ker smo v resnici ne zanima 453 00:25:40,570 --> 00:25:41,600 s tem. 454 00:25:41,600 --> 00:25:42,939 >> --and nato jezik. 455 00:25:42,939 --> 00:25:44,730 In potem, kaj smo početje je slepič, da 456 00:25:44,730 --> 00:25:48,510 na mizo, ki je označene s to vrvico tukaj. 457 00:25:48,510 --> 00:25:50,790 In kako deluje jQuery je, kaj je to rekel 458 00:25:50,790 --> 00:25:56,420 je pogledati za mizo z idejo Rezultati in dodajte to besedilo z njo. 459 00:25:56,420 --> 00:25:59,380 In to je miza z idejo rezultatov. 460 00:25:59,380 --> 00:26:04,998 Torej, kaj boste na koncu z to stran tukaj. 461 00:26:04,998 --> 00:26:06,206 In da si ogledate source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 No, vir je dejansko ni posodobitev, ko se je to zgodilo. 464 00:26:13,810 --> 00:26:18,740 Tako boste lahko videli dejansko Rezultati v tabeli tukaj, čeprav. 465 00:26:18,740 --> 00:26:24,770 >> Torej, to je samo preprost primer početje zelo osnovno poizvedbo proti API 466 00:26:24,770 --> 00:26:29,020 in prikazovanju informacij v nekaterih drugih oblikujejo in ničesar preveč fancy ne počne. 467 00:26:29,020 --> 00:26:36,370 Zdaj pa še en primer je kot Vloga David Weinberger napisal 468 00:26:36,370 --> 00:26:39,120 kot demo to, kar v bistvu prikazuje 469 00:26:39,120 --> 00:26:44,620 kako lahko mash up rezultate ste dobili iz knjižnice v oblaku API 470 00:26:44,620 --> 00:26:46,250 z, recimo, Google Books. 471 00:26:46,250 --> 00:26:52,225 >> In razmišljanje, tukaj je, da sem lahko zagnati poizvedbo zoper Google Books, 472 00:26:52,225 --> 00:26:56,060 dobili iskanja po vsem besedilu, dobili nekaj rezultatov nazaj, izvedeli, kateri od teh postavk 473 00:26:56,060 --> 00:27:01,180 dejansko obstajajo v Hollis, knjižnični sistem, 474 00:27:01,180 --> 00:27:03,200 in potem mi povezave nazaj na teh postavkah. 475 00:27:03,200 --> 00:27:12,730 Torej, če sem iskati, je bilo temno in nevihtno noč sem 476 00:27:12,730 --> 00:27:16,210 nazaj kup rezultatov od Googla, in nato en rezultat 477 00:27:16,210 --> 00:27:19,460 ki je gub v času. 478 00:27:19,460 --> 00:27:29,330 In to so povezave do knjig, ki obstajajo znotraj sistema Harvard Library. 479 00:27:29,330 --> 00:27:32,160 >> Tako da mislim, točka tukaj ni toliko, da je to lahko ali pa ne 480 00:27:32,160 --> 00:27:34,118 je pot, ki jo želite iskanje knjižnico, 481 00:27:34,118 --> 00:27:38,310 vendar je povsem drugačen način, ki ni bil na voljo za vas 482 00:27:38,310 --> 00:27:42,884 prej, kot si ti imel način, kako Celotno besedilo išče v knjigah, da je tudi 483 00:27:42,884 --> 00:27:44,550 so bili del sistema Harvard Library. 484 00:27:44,550 --> 00:27:46,870 Torej, zdaj je to pot da lahko to storite. 485 00:27:46,870 --> 00:27:51,930 In jih lahko prikažete v ne glede na obliko, ki jo želite. 486 00:27:51,930 --> 00:27:55,990 Torej točka tukaj je, v bistvu, smo odpira nove načine za ljudi 487 00:27:55,990 --> 00:27:59,080 za delo s podatki. 488 00:27:59,080 --> 00:28:07,925 >> Še en kos knjižničnega oblaku je, da pomaga izpostaviti nekatere podatke o uporabi 489 00:28:07,925 --> 00:28:08,800 da ima knjižnica. 490 00:28:08,800 --> 00:28:12,630 Torej, če greš v knjižnico, in iščeš knjige, 491 00:28:12,630 --> 00:28:15,770 vam ni nujno, dejansko imajo idejo, 492 00:28:15,770 --> 00:28:19,080 za vse postavke v Zlasti velja, kar 493 00:28:19,080 --> 00:28:21,200 so ljudje v skupnosti, ali je to 494 00:28:21,200 --> 00:28:24,890 opredeljena kot Harvardu ali Država ali vaš razred, 495 00:28:24,890 --> 00:28:26,421 kaj so našli najbolj uporaben? 496 00:28:26,421 --> 00:28:28,920 In knjižnica ima dejansko ton informacij o tem, kaj 497 00:28:28,920 --> 00:28:32,999 je najbolj uporabno, ker če veliko ljudi, ki so preverjanje ven knjigo, 498 00:28:32,999 --> 00:28:34,040 da vam pove nekaj. 499 00:28:34,040 --> 00:28:36,498 Tam je moralo biti nekaj razloga hočejo, da ga preverite. 500 00:28:36,498 --> 00:28:38,270 Veliko ljudi ga dal na rezervo. 501 00:28:38,270 --> 00:28:42,520 >> Če je na čakalni seznam za veliko razredov, ki vam pove nekaj. 502 00:28:42,520 --> 00:28:45,960 Če člani fakultete se je preverjanje ven veliko in študenti niso, 503 00:28:45,960 --> 00:28:47,200 da mi nekaj pove. 504 00:28:47,200 --> 00:28:49,280 Obratno, da je prav tako vam pove nekaj. 505 00:28:49,280 --> 00:28:54,680 Tako da bi bilo res zanimivo dal te informacije tam in pustite, 506 00:28:54,680 --> 00:28:59,969 ljudje uporabljajo, da bi jim pomagali najti deluje v okviru knjižničnega sistema. 507 00:28:59,969 --> 00:29:02,260 Druga plat tega je, obstaja nekaj resnih zasebnost 508 00:29:02,260 --> 00:29:07,854 zaskrbljenost zaradi enega od temeljni načeli knjižnici 509 00:29:07,854 --> 00:29:10,770 se mi ne bo treba pove ljudje, kaj drugi ljudje branje. 510 00:29:10,770 --> 00:29:17,360 In tudi če se to rekel Knjiga je odjavil štirikrat 511 00:29:17,360 --> 00:29:20,070 v določenem mesecu, da bi se lahko uporabili 512 00:29:20,070 --> 00:29:25,252 za povezavo nazaj na posebno Oseba, ki jo podatkov de-anonimnosti 513 00:29:25,252 --> 00:29:26,710 in ugotovitev, ki jo je odjavil. 514 00:29:26,710 --> 00:29:30,792 Torej način, da bomo lahko avoid-- 515 00:29:30,792 --> 00:29:33,750 Tako, da bomo lahko poskusite izvleči nekatere signal iz vseh podatkov, 516 00:29:33,750 --> 00:29:36,740 ne da bi kršil skrbi zasebnosti nikomur 517 00:29:36,740 --> 00:29:42,150 je v bistvu gledamo na 10 let podatkov o uporabi, - 518 00:29:42,150 --> 00:29:43,930 >> Torej je v daljšem časovnem obdobju. 519 00:29:43,930 --> 00:29:50,639 >> --and reči, OK, pa poglejmo, kako mnogokrat to delo je bila uporabljena, 520 00:29:50,639 --> 00:29:52,930 in kdo v tem obdobju časa, in nato v bistvu 521 00:29:52,930 --> 00:29:56,300 dati nazaj na številko, ki jo imenujemo ocena stack, ki je v bistvu 522 00:29:56,300 --> 00:29:59,910 predstavlja, koliko je bil uporabljen. 523 00:29:59,910 --> 00:30:01,084 In da number-- 524 00:30:01,084 --> 00:30:03,250 Veliko različnih izračunov iti v to številko. 525 00:30:03,250 --> 00:30:05,150 --but je zelo groba metrike, ki vam daje 526 00:30:05,150 --> 00:30:11,300 kakšno idejo kako skupnost lahko cenijo to delo. 527 00:30:11,300 --> 00:30:16,772 >> In tako še nekako celo več razvilo aplikacijo 528 00:30:16,772 --> 00:30:18,480 ki izkorišča to je nekaj 529 00:30:18,480 --> 00:30:24,000 imenovano Stacklife, ki je dejansko na voljo skozi glavni Harvardu 530 00:30:24,000 --> 00:30:24,880 Knjižnica portal. 531 00:30:24,880 --> 00:30:26,700 Torej greš na library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 Boste videli številne drugačne načini iskanja knjižnico. 533 00:30:29,360 --> 00:30:32,300 In eden od njih se imenuje Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> In to je vloga, ki brska vsebino knjižnice, 535 00:30:38,980 --> 00:30:43,490 vendar je v celoti zgrajen na vrhu teh API. 536 00:30:43,490 --> 00:30:46,910 Torej ni nobene posebne stvari dogaja v zakulisju. 537 00:30:46,910 --> 00:30:49,570 Ni dostopa do Podatki, ki jih nimajo. 538 00:30:49,570 --> 00:30:54,090 To je z uporabo API-jev, da vam s popolnoma drugačno brskanje 539 00:30:54,090 --> 00:30:55,480 izkušnja. 540 00:30:55,480 --> 00:30:58,570 >> Torej, če iščem Alice Wonderland v tem primeru, 541 00:30:58,570 --> 00:31:02,600 Dobim rezultat, ki izgleda kot to, kar je precej much-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> To je zelo podobna nobeni drugi iskanje lahko naredite, razen v tem primeru, 544 00:31:10,870 --> 00:31:15,730 smo razvrstitev postavk, ki jih stackscore, ki vam daje 545 00:31:15,730 --> 00:31:19,850 kakšno idejo, kako priljubljena ti predmeti so bili znotraj skupnosti. 546 00:31:19,850 --> 00:31:25,610 In tako je jasno, Alice in Wonderland Walt Disney, je zelo priljubljena. 547 00:31:25,610 --> 00:31:36,570 Vendar pa si lahko ogledate tudi med prve štiri tukaj so tiste, ki jih morda ne actually-- 548 00:31:36,570 --> 00:31:39,220 >> Stvari, ki so zelo uporabljajo, vendar je ne smete takoj 549 00:31:39,220 --> 00:31:41,240 povezati z Alice v čudežni deželi. 550 00:31:41,240 --> 00:31:44,650 Torej, naš stari prijatelj Obrazloženi Alice je tu. 551 00:31:44,650 --> 00:31:46,350 Tako sem lahko, da pogled na to. 552 00:31:46,350 --> 00:31:52,010 In zdaj, kaj iščem v bistvu je nastavljen of-- 553 00:31:52,010 --> 00:31:53,760 Lahko imajo obrazloženim Alice tukaj. 554 00:31:53,760 --> 00:31:56,700 Imam podatke o njem. 555 00:31:56,700 --> 00:32:00,230 In imam tudi stackscore o, v tem primeru, 26. 556 00:32:00,230 --> 00:32:03,169 In to mi je povedal nekako v grobem kako smo prišli do te stackscore, 557 00:32:03,169 --> 00:32:05,835 kot, ki ga odjavil, kot so, kako kolikorkrat je bilo odjavili, 558 00:32:05,835 --> 00:32:08,440 kot predavatelji ali undergrads, kako veliko kopij knjižnica ima, 559 00:32:08,440 --> 00:32:11,300 in tako naprej in tako naprej. 560 00:32:11,300 --> 00:32:16,460 >> In lahko tudi dovolj zanimivo tu, brskanje nizov praktično. 561 00:32:16,460 --> 00:32:19,550 Zato so podatki tukaj, to se vam bo pokazal neke 562 00:32:19,550 --> 00:32:23,547 virtualne reprezentacije o tem, kaj polico moči 563 00:32:23,547 --> 00:32:25,880 izgledal, če ste bili, da sprejmejo vsa kmetijska gospodarstva knjižnice 564 00:32:25,880 --> 00:32:28,940 in jih skupaj na eni neskončno pasu. 565 00:32:28,940 --> 00:32:30,990 In lepo je, da smo can-- 566 00:32:30,990 --> 00:32:33,380 >> Najprej, metapodatki o teh knjigah 567 00:32:33,380 --> 00:32:35,627 Pogosto vam pove, ko je bila objavljena. 568 00:32:35,627 --> 00:32:37,085 To vam pove, koliko strani ima. 569 00:32:37,085 --> 00:32:38,459 Morda vam povem dimenzije. 570 00:32:38,459 --> 00:32:42,930 Torej, lahko vidite, da je tu odraža glede na velikost knjige. 571 00:32:42,930 --> 00:32:46,740 >> In potem lahko uporabite kup rezultat izpostaviti 572 00:32:46,740 --> 00:32:49,170 knjige, ki imajo višje žetonov rezultate. 573 00:32:49,170 --> 00:32:54,930 Torej, če je temnejša, to pomeni, da je verjetno se uporablja pogosteje. 574 00:32:54,930 --> 00:32:57,040 Torej, v tem primeru sem dogaja uganiti, da je to 575 00:32:57,040 --> 00:33:03,226 je verzija Alice v čudežni deželi da se zelo pogosto uporablja in najbolj 576 00:33:03,226 --> 00:33:05,100 pogledali, knjižnica ima največ izvodov. 577 00:33:05,100 --> 00:33:06,975 Torej, če iščete za Alice v čudežni deželi, 578 00:33:06,975 --> 00:33:10,220 to je lahko dober kraj za začetek. 579 00:33:10,220 --> 00:33:13,500 >> In potem tukaj lahko tudi povežete ven da, recimo, Amazon za nakup knjige, 580 00:33:13,500 --> 00:33:15,182 in tako naprej in tako naprej. 581 00:33:15,182 --> 00:33:17,140 Bistvo tukaj, še enkrat, ni tako veliko, da je to 582 00:33:17,140 --> 00:33:25,030 je najboljši način za brskanje knjižnico ali pravo orodje za vsako priložnost. 583 00:33:25,030 --> 00:33:28,400 Ampak to je še en način za to početje. 584 00:33:28,400 --> 00:33:31,359 In tako, da podatke na voljo prek API, ki 585 00:33:31,359 --> 00:33:34,650 Izdelana je iz zelo enostavnih gradnikov, ki vam omogoča, da poiščete vsebino, 586 00:33:34,650 --> 00:33:39,420 lahko gradijo nekaj kot je ta, da lahko 587 00:33:39,420 --> 00:33:41,520 biti izredno koristno za nekatere ljudi. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> Torej, to je nekako, kot toliko, kot hočem res povedati o tem, kaj je API 590 00:33:51,860 --> 00:33:56,070 in kaj to izpostavlja, da je cela Kup stvari v ozadju, ki je 591 00:33:56,070 --> 00:33:59,480 Jaz sem samo dogaja na dotik na kratko samo zato, ker nekako gre pri tem 592 00:33:59,480 --> 00:34:03,720 iz povsem drugačnega zornega kota v Pogoji kako deluje nekako takole 593 00:34:03,720 --> 00:34:04,580 se dajo v mestu? 594 00:34:04,580 --> 00:34:10,820 >> Torej API standard vmesnik za vse te vsebine. 595 00:34:10,820 --> 00:34:13,820 Ampak, da bi ga dobil tam, Prva stvar, ki smo morali storiti 596 00:34:13,820 --> 00:34:17,260 je združila podatke knjig in slik 597 00:34:17,260 --> 00:34:21,580 in ugotovitvi, pripomočki, zbirka Dokument iz različnih sistemov Harvarda. 598 00:34:21,580 --> 00:34:23,929 Aleph, VIA in OASIS so imena sistemov. 599 00:34:23,929 --> 00:34:28,820 In v bistvu so šli v plinovod, plinovod predelavo. 600 00:34:28,820 --> 00:34:33,230 >> Torej, najprej smo dobili izvoz datotek iz vseh teh sistemov. 601 00:34:33,230 --> 00:34:35,130 Jih razdeli smo gor v posameznih postavkah. 602 00:34:35,130 --> 00:34:39,360 Torej imamo datoteko, ki je GB, ki ima milijon zapisov v njem. 603 00:34:39,360 --> 00:34:42,290 Zato smo ga razdelite v posamezne postavke. 604 00:34:42,290 --> 00:34:45,374 Nato za vsako postavko, jo pretvori v mods, ker nekateri od teh 605 00:34:45,374 --> 00:34:47,040 so naravno MODS, nekateri od njih pa ne. 606 00:34:47,040 --> 00:34:49,204 Tako smo dobili vse, da v isti obliki. 607 00:34:49,204 --> 00:34:51,120 Potem so tu še razne obogatitev koraki, kjer 608 00:34:51,120 --> 00:34:55,969 smo dodali več informacij do podatkov kot je na voljo v knjižnici. 609 00:34:55,969 --> 00:34:59,750 Torej, moramo dodati, najprej imamo kaj knjižnice ga držite. 610 00:34:59,750 --> 00:35:02,250 Gremo skozi korak izračun stackscore. 611 00:35:02,250 --> 00:35:07,112 Gremo skozi drugo stopnjo dodajanjem več metapodatke v smislu 612 00:35:07,112 --> 00:35:10,730 , katera zbirke ljudi morda dodal this-- 613 00:35:10,730 --> 00:35:12,532 >> Ljudje ustvarjamo zbirke predmetov. 614 00:35:12,532 --> 00:35:13,990 Kaj zbirke tako ne pripada? 615 00:35:13,990 --> 00:35:17,220 Kako so se ljudje označili ta vsebina v preteklosti? 616 00:35:17,220 --> 00:35:20,750 Potem ste izločili in ga omejujejo zapisi, ker, kot sem že omenil, 617 00:35:20,750 --> 00:35:24,120 obstaja nekaj zapisov, ki zaradi Razlogi za avtorske pravice, ne moremo prikazati. 618 00:35:24,120 --> 00:35:26,700 In potem smo jih naložite v nekaj, kar ti 619 00:35:26,700 --> 00:35:31,680 Solr, ki ni Pravopisna napaka, ampak je ime kos opreme 620 00:35:31,680 --> 00:35:35,710 da ne iskanje indeksiranje, ki poganja vse oglase zadaj API. 621 00:35:35,710 --> 00:35:40,110 In potem postane na voljo API, in ljudje ga lahko uporabite. 622 00:35:40,110 --> 00:35:44,640 >> Torej, to je kot dokaj preprost postopek. 623 00:35:44,640 --> 00:35:47,230 Eden izmed zanimivo stvari o njem je 624 00:35:47,230 --> 00:35:50,990 da imamo opravka z 13 milijonov zapisov 625 00:35:50,990 --> 00:35:53,820 in se bomo, da se ukvarjajo ali več. 626 00:35:53,820 --> 00:36:01,260 In želimo biti sposobni obvladovati ti v relativno hitro modo. 627 00:36:01,260 --> 00:36:03,630 To traja dolgo časa, do obdelati 13 milijonov zapisov. 628 00:36:03,630 --> 00:36:09,529 >> Torej, kako to cevovod ustanovljena je, da si can-- 629 00:36:09,529 --> 00:36:12,070 Mislim, da je prednost plinovod, problem, ki smo 630 00:36:12,070 --> 00:36:15,580 poskuša tukaj rešiti, je, da vse transformacije, vse 631 00:36:15,580 --> 00:36:18,729 Ti koraki v to Plinovod so ločljivi. 632 00:36:18,729 --> 00:36:19,645 Ni odvisnost. 633 00:36:19,645 --> 00:36:22,146 Če ste za obdelavo zapis eno knjigo, 634 00:36:22,146 --> 00:36:24,270 ni odvisnosti v da je med drugo knjigo. 635 00:36:24,270 --> 00:36:27,760 >> Torej, kaj lahko storimo, je, v bistvu, na vsakem koraku v cevovodu, 636 00:36:27,760 --> 00:36:30,470 mi smo jih postavili v čakalno vrsto v oblaku. 637 00:36:30,470 --> 00:36:32,250 Jaz se je zgodilo, da se na Amazon Web Services. 638 00:36:32,250 --> 00:36:35,140 Tako da je seznam, pravijo, 10.000 predmetov, ki 639 00:36:35,140 --> 00:36:38,100 morajo biti normalizirana in pretvorijo v format Mods. 640 00:36:38,100 --> 00:36:41,620 In smo spin gor toliko strežnikov kot smo želeli, morda 10 strežnikov. 641 00:36:41,620 --> 00:36:44,860 In vsaka od teh strežnikov samo sedi tam, izgleda v tej vrsti, 642 00:36:44,860 --> 00:36:46,730 vidi, da je tisti, ki mora treba obdelati, ga potegne v čakalno vrsto, 643 00:36:46,730 --> 00:36:48,740 jo obdela in palice je na naslednji vrsti. 644 00:36:48,740 --> 00:36:54,200 >> In kaj, ki nam omogoča, storiti je, da se uporabljajo, v bistvu, 645 00:36:54,200 --> 00:36:58,110 toliko opreme, kot smo želeli, da to problem zelo kratkem času 646 00:36:58,110 --> 00:37:02,970 za obdelavo podatkov, kakor hitro je mogoče, kar je nekaj, samo, 647 00:37:02,970 --> 00:37:08,220 Zdaj je v svetu računalništva v oblaku Mi lahko oskrba s strežniki v bistvu 648 00:37:08,220 --> 00:37:09,890 sprašuje, je, da je koristen. 649 00:37:09,890 --> 00:37:12,260 Tako nam ni treba imeti velikan strežnik poseda 650 00:37:12,260 --> 00:37:16,700 ves čas za obdelavo da se lahko zgodi samo enkrat na teden. 651 00:37:16,700 --> 00:37:21,440 >> Tako, da je v glavnem to. 652 00:37:21,440 --> 00:37:27,590 Tam je dokumentacija na voljo za knjižnice Cloud Item API 653 00:37:27,590 --> 00:37:31,960 na tem URL-ju, ki bo na voljo kasneje. 654 00:37:31,960 --> 00:37:36,730 In pojdite si oglejte to, da vidim, če je kaj, 655 00:37:36,730 --> 00:37:37,579 imate ideje. 656 00:37:37,579 --> 00:37:38,120 Igrajte se z njo. 657 00:37:38,120 --> 00:37:38,830 Norec okoli. 658 00:37:38,830 --> 00:37:42,800 In upajmo, da lahko prideš z nekaj velikega. 659 00:37:42,800 --> 00:37:44,740 Hvala. 660 00:37:44,740 --> 00:37:45,899