Jeffrey Licht: Živjo. Sem Jeffrey Licht. In jaz sem tukaj, da govoriti o Harvard Library in gradnja jutrišnjih danes knjižnica, I guess. Torej, tukaj v ozadju, igrišče za to sejo je v bistvu, da je Veliko bibliografskih podatkov na voljo v Harvard knjižnicah. In tam je priložnost, skozi nekatera orodja in projekt, ki se je razvila, da bi dobili dostop do informacij in se za kraje, ki Harvard Library je ne delaš prav zdaj, narediti nove stvari z njim, eksperiment in igral z njim. Torej vstopna točka v to API imenovano Harvard Library Cloud, ki je odprt metapodatki strežnik, katerih bom govoril o zdaj. Tako je ozadje, da je Veliko stvari v knjižnici Harvard. Imamo več kot 13 milijonov bibliografskih evidence, na milijone slik, in tisoče iskanju pomoči, ki so v bistvu dokumenti, ki opisujejo Zbirke, ki pravijo, kaj kar je v njih, škatle referatov in tako naprej, ki predstavljajo več kot milijon posamezne dokumente. In tam je tudi veliko informacije, ki jih ima knjižnica o tem, kako se uporablja, da vsebina bi bilo v interesu ljudi ki bi želeli delati z njim. 

Torej vse informacije Knjižnica ima metapodatkov. Torej metapodatki so podatki o podatkih. Torej, ko govorimo o informacije, ki jih je na voljo preko knjižnice oblak, ki je na voljo, to ni nujno dejanski dokumenti same, ne nujno v celoti Besedilo knjig ali popolnih podob, čeprav to dejansko lahko zgodilo. Ampak to je res informacije o podatkih. 

Torej si lahko zamislite katalogizacijo Informacije, klicnih številk, predmeti, koliko kopij knjiga obstaja, kaj so izdaje, kaj so Oblike, avtorji in tako naprej. Tako da je veliko informacij o Podatki v zbirki, da samo po sebi, je nekako samo po sebi koristna. In čeprav, če ste početje poglobljene raziskave, si seveda želeli, da bi dobili, da dejansko sama vsebino in pogled na podatke, metapodatkov je koristno v smislu analiziranju korpus kot celoto, všeč, kaj so stvari v zbirki. Kako so povezani? Pomaga vam res našli druge stvari, ki je pravzaprav glavni namen tega. Točka metapodatkov in katalog je, da vam pomaga najti vse informacije, ki jih je na voljo v zbirkah. 

Torej, to je primer metapodatkov za knjigo v knjižnici Harvard. Tako da je tam. In lahko vidite, da je dejansko nekoliko zapleteno. In del vrednosti metapodatkov znotraj sistema Harvard Library je, da je to bilo nekako od zgradili s catalogers in sestavljeni ljudje, ki uporabljajo Veliko znanja in spretnosti in mislili, da ji s časom, ki ima veliko vrednost. 

Torej, če ste vzeli pogled na ta zapis za Obrazloženi Alice, lahko ugotovite, imaš naslov, ki ga je napisal, avtorski in vsi različni predmeti so , ljudje so jo katalogizirati v. In lahko vidite, da je tudi v dodatek za veliko dobrih informacij Tukaj pa je nekaj podvajanja. Obstaja veliko kompleksnosti, ki je odraža skozi metapodatkov da imate. 

Torej, en naslov te knjige je Alice Adventures in Wonderland. Torej je to obrazloženim različica te knjige. Vendar pa je pozval tudi obrazloženim Alice, Alice Adventures v čudežni deželi, ker to je nekaj, kar Martin Gardner je napisal in označeni knjigo. In tam je veliko veliko informacij o logične uganke in stvari v Alice, ki vas Verjetno ni vedel. Torej, morate iti prebrati. 

Vendar pa lahko vidite, da je Veliko podrobnosti tukaj, vključno identifikatorje, ko ga je bila ustanovljena, od koder so prišli, glede na Harvard sistem, in tako naprej. Torej je to vzorec vrsta metapodatkov da boste lahko videli za knjigo v Zbirka Harvard Library. 

To je nekaj povsem drugega. Torej je sistem, imenovan VIA Harvard, ki je v bistvu je katalogiziranje slik in predmetov in vizualne stvari vsej Harvardu, in dodal nekaj metapodatkov z njimi, ki jih razvršča, in, v nekaterih primerih, ki zagotavlja majhne sličice da si lahko poglej, če si to želijo. 

Torej je to primer metapodatke, ki jih imajo za ploščo od, verjetno, Alice v čudežni deželi. In lahko vidite, da je minus metapodatki tukaj. To je samo drugačna vrsta objekta. In zato je tudi manj informacij. 

Imate predvsem dejstvo, da klic Številka, ki jo je v bistvu ustvaril, - 

Mi ne vemo, kdaj je bila ustvarjena. 

--and naslov. 

Drug primer. To je pomoč ugotovitev. Tako da je zbirka Lewis Članki Carrolla na Harvardu. Torej, to opisuje, kaj v tej zbirki. Torej je nekdo šel skozi in pogledal po vseh poljih in katalogizirati, saj nekateri v ozadju, napisal povzetek, kaj je tukaj. In če ste bili videti nadalje na to, to gre naprej za strani in strani in strani, ampak vam bo povedal, kaj črke in kaj izvira iz kakšnih škatel obstajala vsej zbirki. Ampak to je nekaj, da, če ste na Harvardu, lahko greš in dejansko fizično pogledati in, verjetno, si oglejte. 

Torej, to je vse super. Ta metapodatkovni je koristno. To je v sistemu Harvard Library. Obstajajo orodja na spletu, kjer vas Lahko greš in si oglejte na to, in glej ga, in ga iščete. In ga lahko in kocke narežite je v veliko različnih načinov. 

Ampak to je res na voljo samo, če ste človek sedel na svojem spletnem brskalniku ali nečesa ali telefon in navigacijo skozi to. To ni res na voljo v kakršne koli uporabne mode za druge sisteme ali drugi računalniki za uporabo, ne s sistemi v Knjižnica Harvard, ampak sistemi v zunanjem svetu, le druge ljudi na splošno. Torej, vprašanje je, kako lahko da na voljo za računalnike tako da lahko naredimo bolj zanimivo stvari z njim, kot le Brskanje po njej sami? 

Torej, zakaj bi si želeli to storiti? Obstaja veliko možnosti. Ena je, da bi lahko zgraditi popolnoma drugačen način brskanja vsebino, ki je na voljo skozi Harvard knjižnic. Pokazal vam bom eno kasneje imenovano Stacklife, ki ima popolnoma drugačen prevzamejo iščejo vsebine. 

Lahko graditi priporočilo motor. Torej Harvard Library ni poslovni rekel, rad to knjigo. Nato pojdite si oglejte na teh 17 drugih knjige, ki bi se radi ali ti 18 drugih slik. Ampak to zagotovo lahko biti dragocena lastnost. In glede metapodatkov, lahko to mogoče bi dal, da skupaj. Morda imate različne potrebe Pogoji iskanje vsebine, kot morda kljub orodij, ki so na voljo, da knjižnica omogoča na voljo, boste morda želeli iskati drugače ali optimizacijo za posameznega primera uporabe, ki morda je zelo specializirana. Morda obstaja le malo ljudi na svetu, ki želite iskati vsebino na ta način, vendar bi bilo super, če bi lahko dovolite, da to storim. Obstaja veliko analitike v samo kako ljudi uporabo vsebin, da bi bilo res zanimivo vedeti, če želite izvedeti katere knjige se uporabljajo, kaj niso, in tako naprej. In potem je tukaj še veliko priložnost, da se vključijo z drugimi informacijami da je tam na spletu. Tako smo have-- 

Na primer, NPR ima Segment pregled knjige, kjer so intervju avtorji o knjigah. In tako bi bilo super, če bi bili ozrl knjigo na Harvardu Knjižnica, in pravite, OK, tam je bil intervju z avtorjem. Pojdimo si oglejte to. Ali obstaja Wikipedia stran, kot je verodostojni, znanstvene reference O tej knjigi, ki vas morda želeli, da pogled na. 

Obstaja te vrste virov razpršeni po spletu. In jih združi je lahko le uporaba da nekdo gledaš Vsebina, ki iščejo nekaj. Vendar je tudi ne vrsta stvari, ki ste jo želijo knjižnica, ki je odgovoren za Padamo in lov določitvi vsi ti različni viri in jih priključiti skupaj ker oni nenehno spreminja. In tisto, kar mislijo, da je pomembno, maj ni bilo, kaj misliš, da je pomembno. 

In še bolj, v bistvu tam Veliko stvari nismo mislili doslej. Torej, če bomo to lahko odprejo več, ljudje poleg pol ducata ali tako, ki iščejo na ta na redno zaposlena lahko zamislite idej in masažo podatke, in to, kar hočejo z njim. 

Zato želimo, da bi to ki so na voljo v svet podatkov. No, obstaja nekaj zapletov. Ena je, da ta metapodatkov je v različnih sistemih. To je v različnih formatih. Torej obstaja nekaj normalizacija kar se mora zgoditi, ki normalizacija čemer postopek prinaša stvari iz različnih formatih in jih preslikavo v enotni obliki tako, da bodo polja ujemajo. 

Obstajajo nekatere omejitve avtorskih pravic. Nenavadno je, da vpis v katalog O knjiga je odgovoren za avtorske pravice. Torej, čeprav je to samo informacije, pridobljene iz knjige, to je tiskani. In glede na to, kdo dejansko ustvarjen, da so metapodatki, lahko obstajajo omejitve kdo Lahko ga razdeli, podobno to-- 

Jaz ne vem. To je lahko ali ne sme biti podoben Položaj besedila pesmi, npr. Torej, vsi vemo, kako, da soline ven. Tako da boste morali, da se okoli tega vprašanja. 

In potem še en kos je da obstaja veliko podatkov. Torej, če sem nekoga, ki želi delati s podatki, ali je kul ideja, ki se ukvarjajo z 14 milijonov evidence o moj laptop lahko problematično in težko upravljati. Zato želimo, da se zmanjša ovire za ljudi biti sposoben za delo s podatki. 

Tako pristop, ki bo, upajmo, naslovi vseh teh skrbi je iz dveh delov. Ena gradi platformo, ki bo Podatki iz vseh teh neusklajenih virov in ga poslabša, normalizira, ga oplemeniti in naredi je na voljo na enem mestu. In to naredi na voljo prek javni API, da ljudje lahko pokličete. 

Torej API Application Programski vmesnik. In se v osnovi nanaša na končne točke, ki sistem ali tehnologija lahko pokličete in dobite podatke nazaj v strukturiran format na način, da se lahko uporablja. Tako da to ni odvisno od o gre za spletno stran in strganje podatke off od tega, na primer. 

Torej je to domačo stran Postavka API knjižnica Cloud, ki je v bistvu njena različica dva. Torej, to je druga ponovitev trudijo, da bi vse te podatke na voljo na svetu. Torej, to je http://api.lib.harvard.edu/v2/items. In samo, da bi prekinil to dol malo, kaj to pomeni je, da je ta različica dva API. Tam je ena verzija, ki Ne bom govoril o tem. Vendar je različica on. 

In če kličeš to API, ste dobili predmetov. In del idejo API je API je pogodba. To je nekaj, kar je ne bo spremenilo. Tako na primer, - 

In razlog za to je, da če sem graditi nekakšen sistem, ki se dogaja, da uporabite knjižnica oblak API Za prikaz knjig ali pomagati ljudem najti Informacije na edinstvene načine, kar ne želimo, da se zgodi je za nas, da gredo spremeniti, kako da API deluje, in nenadoma vse izbruhne na strani končnega uporabnika. Torej del, če delaš API na voljo na svetu, to je dobra praksa, da dajo Številka različice v njem tako ljudi vem, kaj različica oni se ukvarjajo z. 

Torej, če se odločimo, moramo najti boljši način za dajanje na voljo te informacije, smo se lahko spremeni, da bi poklicati te različice tri. Torej, vsi, ki se še vedno uporabljajo Različica dve, da bom še vedno deluje. Različica za tri pa bi imajo vse nove stvari. 

Torej je to API, vendar je to Res izgleda kot URL. In kaj je to Primer je tisto, kar je imenuje API počitek, ki je na voljo več kot le redno spletne povezave. In lahko dejansko iti k njej v brskalniku. 

Torej, tukaj sem pravkar odprla Firefox in šli na api.lib.harvard.edu/v2/items. In kaj dobim tu v bistvu prva stran rezultatov iz celotne nabor predmetov, ki smo jih dobili. In to je tukaj v formatu XML. In to je bilo tudi prettified Firefox. To ne dejansko imajo vsi ti malo širi in sklepanje pogodb doohickeys tukaj. To je nekako lepše Različica način, da pogled na to. 

Toda kaj to nam govori, je Sem zahteval vse predmete. Torej obstaja 13289475 predmetov. In iščem na prvi 10, ki se začne na položaju ničelni ker v računalništvu smo se vedno začne na ničlo. In kaj imam tukaj, če sem samo kolaps to, boste videli, da imam 10 predmetov. 

In če pogledam na točki, sem lahko vidim, da sem dobil informacije o njem. In to je tisto, kar se imenuje MODS oblika. In tako se bom, da preklopite nazaj za trenutek. OK. 

Torej, kaj je iskati nekaj v posebno zato, ker je prvi element, ki se zgodi, da pridejo gor, ko si ogledujete skozi celotno zbirko je, po definiciji, naključno. Torej, si oglejmo nekaj krofov. Oh. 

OK. Tako krofi. Tako smo ugotovili, da je 80 predmetov v Zbirka, ki reference krofe. Iščemo po prvih 10 izmed njih. Zdaj si lahko ogledate tukaj, tako da Rekel sem, da iščem krofi, Pravkar sem dodal nekaj poizvedba URL-ja. Torej q enak krofe, ki jih lahko glej malo lažje tukaj. 

In to v bistvu pomeni, da je spec za API, ki določa, kaj vse ti parametri pomenijo. In to pomeni, da bomo iskanje vse za krofe. 

Torej, prvi točki imamo tu lahko vidite naslov je Donuts, in tam je podnaslov imenuje Ameriški Strast, ki je, mislim, primerno. Obstaja veliko different-- Ko prideš do točke pridobivanje podatkov, obstaja veliko različnih Oblike, ki jo lahko dobite v. In tam so različne jakosti in slabosti za vse od njih. Tako da je to ena, lahko vidite tukaj, je ta oblika zelo bogata. In to je standardizirana. 

Torej obstaja poseben naslov polje, podnaslov polje. Tam je namestnik Naslov, ameriški Passion. Tam je ime povezano z njim. Vrsta vira je besedilo. Obstaja veliko informacij tukaj v tem formatu. 

Vendar pa obstaja kup različnih formatov. Torej, kaj smo pravkar gledaš je format imenovane MODS, ki stoji za Metadata Object Opis storitev, potencialno. Jaz sem pravzaprav ni povsem prepričan o S. Ampak to je precej zapletena oblika. To je privzeti format. 

Ampak to je tista, ki ohranja Bogastvo vseh podatkov da je knjižnica zaradi to je zelo blizu temu, kar Knjižnica uporablja interno. To je standard, ki je uporabljajo po vsej državi, po vsem svetu v visokošolskih knjižnicah. In to je zelo interoperabilni. Torej, če imaš dokument da je v formatu obrambnih ministrstev, lahko daš, da nekomu drugemu katerih sistemi razumeti Mods, in jih lahko uvozite. Torej, to je standardni. To je zelo dobro opredeljena, zelo poseben. In to je tisto, kar je interoperabilni, ker če nekdo reče, to je namestnik naslov zapis, vsi vedo, kaj to pomeni. Na flip strani, to je zelo zapleteno. 

Torej, če ste vzeli pogled pri tem zapisu tukaj, Če želim, da bi dobili Naslov tega dokumenta, te knjige, ki je verjetno krofi, Ameriški Passion, ga razčlenjevanju ven je malo sodelujejo. Ker obstaja še en format imenovan Dublin Core, kar je še veliko, veliko preprostejše format. 

In tako vidite tukaj, ni naslov, podnaslov, namestnik naslov. Obstaja samo naslov, Krofi, ameriški Passion, in še en naslov, ameriška Passion. Torej, če ste iskali na kakšni obliki želite, da bi dobili podatke iz, Veliko je odvisno od tega, kako boste za njeno uporabo. Ali uporabljate za interoperabilnost, ali vam želite nekaj preprostega, da Morda bi bilo lažje delati? 

Na flip strani, veliko Podatki se nekako squished navzdol. Morda ste izgubili nianse kaj se na posameznem področju sredstvo Če imate opravka s Dublin Core, ki si ne bi dobili z Mods. Torej tisti, sta dva od formatov lahko dobite iz API. In v bistvu, smo vodenje je v zakulisju v mods. Lahko pa vam ga v mods in Dublin Core in karkoli drugega, kot dobro. Drugi dejavnik pri iščete v podatkih se ga lahko dobite bodisi kot JSON, ki stojala za JavaScript Object Notation, ali XML, ki stoji za Extensible Markup Language. In ti podatki predstavništva tako imajo popolnoma enake podatke, točno na istih področjih. Ampak oni so samo skladenjsko drugačna. 

Torej je to a-- No, kaj je samo stikalo. Torej je to naša poizvedba za krofi v obliki XML. Če sem stikalo, da je to JSON, Vidim, da izgleda drugače. Torej, zdaj je to isto vsebino, vendar drugačno strukturo. Obstajajo manj kotni nosilci. Tam je manj verbose. 

In to je format, ki, če vas delujejo v spletnem okolju, ste najverjetneje bo želeli uporabiti, ker ena od lepih stvari o JSON je združljiv z JavaScriptom. Torej, če pišem spletno aplikacijo, lahko potegnite v JSON in samo delo z njo neposredno. Ker je z XML, je malo bolj zapletena. Torej še enkrat, to so tako uporabni. So samo različni primeri uporabe kjer bi si ljudje želijo, da jih uporabljajo. OK. Torej nazaj na API. Tako bomo lahko poiščete for-- 

Dam primer iskanje krofi. Prav tako lahko poiščete samo v zlasti v polje tu. Torej, namesto da bi iskali Celoten zapis, Jaz lahko samo iskanje naslovnega polja. In tako zdaj obstaja 25 stvari, ki jih imajo krofe v naslovu, od katerih je eden Gre za obnavljanje mokrišča v upravljanju luknje v krof Program, ki je verjetno ni nujno, da tisto, kar smo iskali za takrat, ko smo iskali krofi. 

Lahko tudi, ko ste ki se ukvarjajo z API-- 

Del, ki ima API daje ljudje dostop do velikih zbirk podatkov. In tam so nekaj drugačni orodja, ki jih lahko uporabite za to. Eden od njih je, zelo preprosto, si Lahko Stran s podatki. Torej, tako kot, če vam poizvedbo prek spletnega vmesnika, si lahko ogledate na strani enega, Stran dva, tri strani. To lahko storite enako stvar skozi API. Samo morate biti izrecno v tem, kako si to naredil. 

Tako na primer, če iščem na moji prvi poizvedbi tukaj, kje delam iskanje stvari s krofi v naslovu, lahko rečem, in meja je enaka 20, kar pomeni, daj mi prvih 20 zapisov, ne Prvih 10, ki je privzeto, ker želim, da pogled na 20 naenkrat. Ali lahko rečem, nastavite začetek enak 20 in mejo enak 20, ki bo me beleži 21 skozi 40 let. 

Torej, mislim, da je stvar vzeti tu da smo z uporabo nizov poizvedbo nastaviti parametre na poizvedbo. In to vam omogoča nadzor kaj dobiš nazaj. 

Drugo orodje, ki ga lahko uporabite, - 

In to je res v pomoč pri Pogoji raziskovanju podatkov. 

--is nekaj, kar ti fasetirane optike. Tako izraz fasetirane optike je ni nujno, pogosti. Ampak si jo vsi videli. Če ste vzeli pogled na Amazon, na primer, in vam iskanje krofi v knjigah, Tukaj sem, da imam vrsto knjig, in oni so razvrščeni po kategorijah, in dobiš različne kategorije, in koliko knjig v vsaki kategoriji pokažejo. 

Torej, to je v bistvu vidik. Vzameš vse svoje knjige, 1800 knjige, ki ustrezajo krofe na Amazon. 12 jih je v kategorija zajtrk. 21 v peciva in peko in tako naprej in tako naprej. 

Torej, to je res uporabno orodje za raziskovanje vsebine v knjižnici, kot tudi ker če pogledaš na plati, vam daje idejo, kaj podredi obstaja, kot kakšne vrste predmetov so najbolj priljubljeni v vašem poizvedbe nizu. In to vam pomaga voziti off in raziskovanje. Tako bomo lahko storijo enako stvar. 

Če želimo uporabiti API in pogled na robu, smo dodali še en parameter naš prijatelj poizvedbi. Torej plati enaka vejico ločen seznam, kaj želimo fasete na. Tako je eden od vidikov lahko predmet. Druga bi bila jezik. In tako, če bomo zagnati poizvedbo, smo get-- Videti je precej isto tukaj. Vendar smo dodali do konca seznama niz vidikov. Torej imamo plati imenovano predmet. Torej, to nam pove, da če gledam pri mojih 80 rezultatov iz krof poizvedbo, 13 jih ima izpostavljajte Združene države Amerike. Trije imajo tematska krofe. Trije imajo temo od mokrišč obnove, ki je lahko naša luknjo v krof. Dva od njih so Simpsons, in tako naprej in tako naprej. 

Torej, to je lahko koristno, če vas želite zožiti iskanje. To vam lahko pomaga narediti. Še posebej, če imate več kot, recimo, 80 rezultatov. 

Podobno smo tudi vprašal za fasete na jeziku. Torej, če se ozremo na naše rezultate, vidimo 76 od njih so v angleščini, štiri v francoščini, dva v španščini, dva, mislim, da je undefined ali neznano, nizozemsko in latinsko. Tako da mislim, latinščino krof rezultat, še enkrat, nima veze s pečenim blaga. Ampak tam greš. 

Torej, to je nekako vam bo pokazal, kako lahko potegnite vsebine nazaj od API samo prek spletni brskalnik, kar je super. Ampak to ni res, kaj bi običajno uporabljajo v API za njo. Torej, en primer, kako se bi dejansko naredil to sem imel napisal super majhen program, ki je, še enkrat, ne moj krof iskanje in izbere par polj in jih prikaže v tabeli. Torej, to je zelo veliko Ista vsebina, ki smo ga pravkar žaga z nekaj področjih potegnil ven. Torej, seznam naslovov, na lokacija kakšni knjigi gre, jezik, in tako naprej in tako naprej. 

Torej, kako se je to dejansko zgodilo, saj Mislim, da moramo gledati na neki kodo, is-- 

Kaj imamo tukaj je preprost HTML Stran, ki prikazuje besedila, dobrodošli v knjižnici oblak in nato prikaže tabelo rezultatov. In tam so očitno ni rezultati v Tabela ko postane stran naloži. Toda kaj delamo je, najprej smo nalagate knjižnico, imenovano jQuery, ki je v bistvu JavaScript knjižnico, ki si ga zelo enostavno manipulirati JavaScript naravno, HTML, in ustvarjanje spletnih strani, strani odjemalca logika in spletne strani. 

Torej, kaj imamo tukaj je jQuery Ima metodo, imenovano Get, ki v bistvu bo šel v URL, ki je v tem primeru, je to pozna išče URL. In bo potem dobil vsebino da URL in nato zaženite funkcijo na njem. Zato smo rekli, pojdite api.lib.harvard / edu. Iskanje krofi. Dajte nam 20 zapisov. In nato zaženete to funkcijo, Sem izbrana, ji posreduje podatke. In podatki JSON da dobil vrnil iz API. 

In potem mi govoriš, v roku, ki Podatki tam polje se imenuje točka. In če grem poglej nazaj ena od teh rezultatov, ki je tukaj, je nekaj called-- 

No, se imenuje točka. Tako da lahko da. In kaj počne je to, gre skozi vsako točko in pokliče drugega funkcija na vsaki točki. In da je v bistvu funkcija je ob vrednosti postavke, ki je bistvu posamezen zapis in nam omogoča, da izvleči naziv, pokritost in jezik. 

Tako pravimo funkcijo za vsak postavka, da smo dobili nazaj od API. In če si pogledamo na tem delu tukaj, kar počnemo, je smo ustvariti niz, ki je v bistvu nekaj HTML markup mizo, z value.title, ki je naslov objekt, value.coverage, ki je pokritost, - 

In delamo ček Tukaj lahko vidiš, kdo je nedefinirana in ga skrivali, če piše undefined, zato, ker smo v resnici ne zanima s tem. 

--and nato jezik. In potem, kaj smo početje je slepič, da na mizo, ki je označene s to vrvico tukaj. In kako deluje jQuery je, kaj je to rekel je pogledati za mizo z idejo Rezultati in dodajte to besedilo z njo. In to je miza z idejo rezultatov. Torej, kaj boste na koncu z to stran tukaj. In da si ogledate source-- No, vir je dejansko ni posodobitev, ko se je to zgodilo. Tako boste lahko videli dejansko Rezultati v tabeli tukaj, čeprav. 

Torej, to je samo preprost primer početje zelo osnovno poizvedbo proti API in prikazovanju informacij v nekaterih drugih oblikujejo in ničesar preveč fancy ne počne. Zdaj pa še en primer je kot Vloga David Weinberger napisal kot demo to, kar v bistvu prikazuje kako lahko mash up rezultate ste dobili iz knjižnice v oblaku API z, recimo, Google Books. 

In razmišljanje, tukaj je, da sem lahko zagnati poizvedbo zoper Google Books, dobili iskanja po vsem besedilu, dobili nekaj rezultatov nazaj, izvedeli, kateri od teh postavk dejansko obstajajo v Hollis, knjižnični sistem, in potem mi povezave nazaj na teh postavkah. Torej, če sem iskati, je bilo temno in nevihtno noč sem nazaj kup rezultatov od Googla, in nato en rezultat ki je gub v času. In to so povezave do knjig, ki obstajajo znotraj sistema Harvard Library. 

Tako da mislim, točka tukaj ni toliko, da je to lahko ali pa ne je pot, ki jo želite iskanje knjižnico, vendar je povsem drugačen način, ki ni bil na voljo za vas prej, kot si ti imel način, kako Celotno besedilo išče v knjigah, da je tudi so bili del sistema Harvard Library. Torej, zdaj je to pot da lahko to storite. In jih lahko prikažete v ne glede na obliko, ki jo želite. Torej točka tukaj je, v bistvu, smo odpira nove načine za ljudi za delo s podatki. 

Še en kos knjižničnega oblaku je, da pomaga izpostaviti nekatere podatke o uporabi da ima knjižnica. Torej, če greš v knjižnico, in iščeš knjige, vam ni nujno, dejansko imajo idejo, za vse postavke v Zlasti velja, kar so ljudje v skupnosti, ali je to opredeljena kot Harvardu ali Država ali vaš razred, kaj so našli najbolj uporaben? In knjižnica ima dejansko ton informacij o tem, kaj je najbolj uporabno, ker če veliko ljudi, ki so preverjanje ven knjigo, da vam pove nekaj. Tam je moralo biti nekaj razloga hočejo, da ga preverite. Veliko ljudi ga dal na rezervo. 

Če je na čakalni seznam za veliko razredov, ki vam pove nekaj. Če člani fakultete se je preverjanje ven veliko in študenti niso, da mi nekaj pove. Obratno, da je prav tako vam pove nekaj. Tako da bi bilo res zanimivo dal te informacije tam in pustite, ljudje uporabljajo, da bi jim pomagali najti deluje v okviru knjižničnega sistema. Druga plat tega je, obstaja nekaj resnih zasebnost zaskrbljenost zaradi enega od temeljni načeli knjižnici se mi ne bo treba pove ljudje, kaj drugi ljudje branje. In tudi če se to rekel Knjiga je odjavil štirikrat v določenem mesecu, da bi se lahko uporabili za povezavo nazaj na posebno Oseba, ki jo podatkov de-anonimnosti in ugotovitev, ki jo je odjavil. Torej način, da bomo lahko avoid-- Tako, da bomo lahko poskusite izvleči nekatere signal iz vseh podatkov, ne da bi kršil skrbi zasebnosti nikomur je v bistvu gledamo na 10 let podatkov o uporabi, - 

Torej je v daljšem časovnem obdobju. 

--and reči, OK, pa poglejmo, kako mnogokrat to delo je bila uporabljena, in kdo v tem obdobju časa, in nato v bistvu dati nazaj na številko, ki jo imenujemo ocena stack, ki je v bistvu predstavlja, koliko je bil uporabljen. In da number-- Veliko različnih izračunov iti v to številko. --but je zelo groba metrike, ki vam daje kakšno idejo kako skupnost lahko cenijo to delo. 

In tako še nekako celo več razvilo aplikacijo ki izkorišča to je nekaj imenovano Stacklife, ki je dejansko na voljo skozi glavni Harvardu Knjižnica portal. Torej greš na library.harvard.edu. Boste videli številne drugačne načini iskanja knjižnico. In eden od njih se imenuje Stacklife. 

In to je vloga, ki brska vsebino knjižnice, vendar je v celoti zgrajen na vrhu teh API. Torej ni nobene posebne stvari dogaja v zakulisju. Ni dostopa do Podatki, ki jih nimajo. To je z uporabo API-jev, da vam s popolnoma drugačno brskanje izkušnja. 

Torej, če iščem Alice Wonderland v tem primeru, Dobim rezultat, ki izgleda kot to, kar je precej much-- 

To je zelo podobna nobeni drugi iskanje lahko naredite, razen v tem primeru, smo razvrstitev postavk, ki jih stackscore, ki vam daje kakšno idejo, kako priljubljena ti predmeti so bili znotraj skupnosti. In tako je jasno, Alice in Wonderland Walt Disney, je zelo priljubljena. Vendar pa si lahko ogledate tudi med prve štiri tukaj so tiste, ki jih morda ne actually-- 

Stvari, ki so zelo uporabljajo, vendar je ne smete takoj povezati z Alice v čudežni deželi. Torej, naš stari prijatelj Obrazloženi Alice je tu. Tako sem lahko, da pogled na to. In zdaj, kaj iščem v bistvu je nastavljen of-- Lahko imajo obrazloženim Alice tukaj. Imam podatke o njem. In imam tudi stackscore o, v tem primeru, 26. In to mi je povedal nekako v grobem kako smo prišli do te stackscore, kot, ki ga odjavil, kot so, kako kolikorkrat je bilo odjavili, kot predavatelji ali undergrads, kako veliko kopij knjižnica ima, in tako naprej in tako naprej. 

In lahko tudi dovolj zanimivo tu, brskanje nizov praktično. Zato so podatki tukaj, to se vam bo pokazal neke virtualne reprezentacije o tem, kaj polico moči izgledal, če ste bili, da sprejmejo vsa kmetijska gospodarstva knjižnice in jih skupaj na eni neskončno pasu. In lepo je, da smo can-- 

Najprej, metapodatki o teh knjigah Pogosto vam pove, ko je bila objavljena. To vam pove, koliko strani ima. Morda vam povem dimenzije. Torej, lahko vidite, da je tu odraža glede na velikost knjige. 

In potem lahko uporabite kup rezultat izpostaviti knjige, ki imajo višje žetonov rezultate. Torej, če je temnejša, to pomeni, da je verjetno se uporablja pogosteje. Torej, v tem primeru sem dogaja uganiti, da je to je verzija Alice v čudežni deželi da se zelo pogosto uporablja in najbolj pogledali, knjižnica ima največ izvodov. Torej, če iščete za Alice v čudežni deželi, to je lahko dober kraj za začetek. 

In potem tukaj lahko tudi povežete ven da, recimo, Amazon za nakup knjige, in tako naprej in tako naprej. Bistvo tukaj, še enkrat, ni tako veliko, da je to je najboljši način za brskanje knjižnico ali pravo orodje za vsako priložnost. Ampak to je še en način za to početje. In tako, da podatke na voljo prek API, ki Izdelana je iz zelo enostavnih gradnikov, ki vam omogoča, da poiščete vsebino, lahko gradijo nekaj kot je ta, da lahko biti izredno koristno za nekatere ljudi. 

Torej, to je nekako, kot toliko, kot hočem res povedati o tem, kaj je API in kaj to izpostavlja, da je cela Kup stvari v ozadju, ki je Jaz sem samo dogaja na dotik na kratko samo zato, ker nekako gre pri tem iz povsem drugačnega zornega kota v Pogoji kako deluje nekako takole se dajo v mestu? 

Torej API standard vmesnik za vse te vsebine. Ampak, da bi ga dobil tam, Prva stvar, ki smo morali storiti je združila podatke knjig in slik in ugotovitvi, pripomočki, zbirka Dokument iz različnih sistemov Harvarda. Aleph, VIA in OASIS so imena sistemov. In v bistvu so šli v plinovod, plinovod predelavo. 

Torej, najprej smo dobili izvoz datotek iz vseh teh sistemov. Jih razdeli smo gor v posameznih postavkah. Torej imamo datoteko, ki je GB, ki ima milijon zapisov v njem. Zato smo ga razdelite v posamezne postavke. Nato za vsako postavko, jo pretvori v mods, ker nekateri od teh so naravno MODS, nekateri od njih pa ne. Tako smo dobili vse, da v isti obliki. Potem so tu še razne obogatitev koraki, kjer smo dodali več informacij do podatkov kot je na voljo v knjižnici. Torej, moramo dodati, najprej imamo kaj knjižnice ga držite. Gremo skozi korak izračun stackscore. Gremo skozi drugo stopnjo dodajanjem več metapodatke v smislu , katera zbirke ljudi morda dodal this-- 

Ljudje ustvarjamo zbirke predmetov. Kaj zbirke tako ne pripada? Kako so se ljudje označili ta vsebina v preteklosti? Potem ste izločili in ga omejujejo zapisi, ker, kot sem že omenil, obstaja nekaj zapisov, ki zaradi Razlogi za avtorske pravice, ne moremo prikazati. In potem smo jih naložite v nekaj, kar ti Solr, ki ni Pravopisna napaka, ampak je ime kos opreme da ne iskanje indeksiranje, ki poganja vse oglase zadaj API. In potem postane na voljo API, in ljudje ga lahko uporabite. 

Torej, to je kot dokaj preprost postopek. Eden izmed zanimivo stvari o njem je da imamo opravka z 13 milijonov zapisov in se bomo, da se ukvarjajo ali več. In želimo biti sposobni obvladovati ti v relativno hitro modo. To traja dolgo časa, do obdelati 13 milijonov zapisov. 

Torej, kako to cevovod ustanovljena je, da si can-- Mislim, da je prednost plinovod, problem, ki smo poskuša tukaj rešiti, je, da vse transformacije, vse Ti koraki v to Plinovod so ločljivi. Ni odvisnost. Če ste za obdelavo zapis eno knjigo, ni odvisnosti v da je med drugo knjigo. 

Torej, kaj lahko storimo, je, v bistvu, na vsakem koraku v cevovodu, mi smo jih postavili v čakalno vrsto v oblaku. Jaz se je zgodilo, da se na Amazon Web Services. Tako da je seznam, pravijo, 10.000 predmetov, ki morajo biti normalizirana in pretvorijo v format Mods. In smo spin gor toliko strežnikov kot smo želeli, morda 10 strežnikov. In vsaka od teh strežnikov samo sedi tam, izgleda v tej vrsti, vidi, da je tisti, ki mora treba obdelati, ga potegne v čakalno vrsto, jo obdela in palice je na naslednji vrsti. 

In kaj, ki nam omogoča, storiti je, da se uporabljajo, v bistvu, toliko opreme, kot smo želeli, da to problem zelo kratkem času za obdelavo podatkov, kakor hitro je mogoče, kar je nekaj, samo, Zdaj je v svetu računalništva v oblaku Mi lahko oskrba s strežniki v bistvu sprašuje, je, da je koristen. Tako nam ni treba imeti velikan strežnik poseda ves čas za obdelavo da se lahko zgodi samo enkrat na teden. 

Tako, da je v glavnem to. Tam je dokumentacija na voljo za knjižnice Cloud Item API na tem URL-ju, ki bo na voljo kasneje. In pojdite si oglejte to, da vidim, če je kaj, imate ideje. Igrajte se z njo. Norec okoli. In upajmo, da lahko prideš z nekaj velikega. Hvala.