JEFFREY LICHT: Bună acolo. Sunt Jeffrey Licht. Și eu sunt aici să vorbesc cu tine despre Harvard Biblioteca și construirea de mâine bibliotecă astăzi, cred. Deci, fundal de aici, teren pentru această sesiune este, în esență, că există o mulțime de date bibliografice disponibil în bibliotecile de la Harvard. Și există o oportunitate, prin unele dintre instrumentele și un proiect care este în curs de dezvoltare, pentru a avea acces la informațiile și duceți-l la locuri care Harvard Biblioteca nu este de a face chiar acum, face lucruri noi cu ea, experiment și să se joace în jurul cu ea. Deci, punctul de intrare în aceasta este un API numit Harvard Library Cloud, care este un server de metadate deschis, care voi vorbi despre acum. Deci fundalul este că există o mulțime de lucruri în bibliotecă Harvard. Avem peste 13 milioane de bibliografică înregistrări, milioane de imagini, și mii de ajutoare de constatare, care sunt în esență documente care descriu colecții, spunând ceea ce este în ele, cutii de documente și așa mai departe încât reprezintă peste un milion de documente individuale. Și există, de asemenea, o mulțime de informații că biblioteca are despre modul în care este folosit continutul care ar putea fi de interes pentru oameni care ar putea dori sa lucreze cu el. 

Deci toată informația biblioteca are metadate. Deci, metadate sunt date despre date. Așa că atunci când vorbim despre informațiile pe care este disponibil prin intermediul bibliotecii nor care este disponibil, nu este neapărat documentele reale ei înșiși, nu neapărat pe deplin Textul din carti sau imagini complete, dacă acest fapt ar putea fi cazul. Dar e adevărat informații despre datele. 

Deci, vă puteți gândi de catalogare informații, numere de apel, subiecte, cât de multe copii ale carte există, ceea ce sunt edițiile, care sunt formate, autorii, și așa mai departe. Deci, există o mulțime de informații despre informațiile din colecția că, în sine, este un fel de inerent util. Și, deși dacă sunteți a face cercetare în profunzime, evident doriți pentru a ajunge la reale se continut si uita-te la date, metadatele este util din punct de vedere atât analiza corpusului în ansamblu, ca ceea ce lucrurile sunt în colecția. Cum se referă? Aceasta vă ajută să găsiți într-adevăr alte lucruri, care este de fapt scopul principal al acesteia. Punctul de metadate și catalogul este de a vă ajuta să găsiți tot informațiile pe care este disponibil în colecțiile. 

Deci, acesta este un exemplu de metadate pentru o carte în Biblioteca Harvard. Deci e acolo. Și puteți vedea că este de fapt moderat complex. Și o parte din valoarea de metadate în cadrul sistemului Harvard Library se că a fost un fel de construit prin cataloage și asamblate prin persoane care solicită o mulțime de expertiză și calificare și gândit să-l în timp, care are o mulțime de valoare. 

Deci, dacă aruncăm o privire la acest record Adnotată Alice, puteți afla ai titlul care a scris, autor, și toate diferitele subiecte care oameni l-au catalogat in. Și puteți vedea există, de asemenea, în plus față de o mulțime de informații bune aici, există unele suprapuneri. Există o mulțime de complexitate care este reflectată prin metadatele care le au. 

Deci, un titlu al acestei cărți este Aventurile lui Alice în Țara Minunilor. Deci, aceasta este o adnotată Versiunea de acea carte. Dar se numește, de asemenea, adnotat Alice, Aventurile lui Alice in Tara Minunilor, deoarece e ceva care Martin Gardner a scris și adnotat cartea. Și există o mulțime de mare de informații despre puzzle-uri logice și lucruri în Alice pe care le Probabil că nu știa despre. Deci ar trebui să citească. 

Dar puteți vedea acolo e o mulțime de detalii aici, inclusiv de identificare, atunci când a fost creat, de unde a venit de la, în ceea ce privește Harvard sistem, și așa mai departe. Deci, aceasta este o mostră de tipul de metadate care s-ar putea vedea, de o carte în colecția Biblioteca Harvard. 

Acest lucru este ceva complet diferit. Deci, există un sistem numit VIA Harvard, care, practic, este catalogarea imagini și obiecte de artă și lucrurile vizuale în întreaga Harvard, și adăugarea unele metadate pentru ei, clasificându-le, și, în unele cazuri, oferind imagini în miniatură mici pe care le puteți lua o uita-te la cazul în care doresc acest lucru. 

Deci, acesta este un exemplu de metadate că aveți o placă din, probabil, Alice in Tara Minunilor. Și puteți vedea acolo e mai puțin metadate aici. E doar un alt fel de obiect. Și nu e puțin informații. 

Ai mai ales faptul că, un apel număr, în esență, care a creat-o, - 

Nu știm când a fost creat. 

--and un titlu. 

Un alt exemplu. Acesta este un ajutor constatare. Deci, există o colecție de Lewis Lucrări Carroll lui de la Harvard. Deci, aceasta descrie ceea ce este în colecție. Deci, cineva a trecut prin și privi prin toate casetele și catalogate, dat unele de fundal, scris un rezumat a ceea ce este aici. Și dacă ar fi să te uiți în continuare la acest lucru, acest continuă pentru pagini și pagini și pagini, dar vă va spune ceea ce scrisori și ce dateaza din ce cutii existat în colecția. Dar acest lucru este ceva că, dacă ești la Harvard, poti sa te duci si de fapt uite fizic și, probabil, să ia o privire la. 

Deci, aceasta este tot mare. Acest metadate lui util. E în sistemul Harvard Library. Există instrumente online, unde pot merge și să ia o privire la ea, și-l vezi, si cauta-l. Și tu poți și zaruri felie se într-o mulțime de moduri diferite. 

Dar e adevărat disponibilă numai dacă esti o fiinta umana sta jos la browser-ul de web sau ceva sau telefon și navigarea prin ea. Nu e adevărat disponibile în orice fel de moda utila pentru alte sisteme sau alte computere de a utiliza, nu cu sisteme din cadrul Harvard Biblioteca, dar sistemele din lumea exterioară, doar alte persoane, în general. Deci, întrebarea este, cum putem pune la dispoziția calculatoare astfel încât să putem face mai interesant chestii cu ea decât navigare ea noi înșine? 

Deci, de ce vrei să faci asta? Există o mulțime de posibilități. Unul este ai putea construi un complet alt mod de a navigare conținutul care este disponibil prin bibliotecile de la Harvard. O să-ți arăt o mai târziu numit Stacklife, care are o cu totul diferit ia pe căutarea pentru conținut. 

Ai putea construi un motor de recomandare. Deci Harvard Biblioteca nu este în afaceri de a spune, iti place aceasta carte. Apoi, du-te să ia o privire la aceste 17 alte cărților pe care le-ar putea fi interesat de sau aceste 18 alte imagini. Dar cu siguranță ar putea fi o caracteristică valoros. Și având în vedere metadatele, aceasta poate fi posibil pentru a pune asta împreună. S-ar putea avea nevoi diferite în termeni de căutare de conținut, ca poate ciuda instrumentele care sunt disponibile ca biblioteca face disponibil, ați putea dori pentru a căuta într-un mod diferit sau optimiza pentru un anumit caz de utilizare, care poate e foarte specializate. Poate că există doar câteva oameni din lume care doresc să căutați conținut în acest fel, dar ea Ar fi minunat dacă am ar putea să le facă asta. Există o mulțime de analiză în doar modul în care oamenii utiliza conținutul care ar fi cu adevărat interesant de stiut despre, afla ce cărți sunt folosite, ceea ce nu sunt, și așa mai departe. Și apoi există o mulțime de posibilitatea de a integra cu alte informații că e acolo pe web. Așa că am have-- 

De exemplu, NPR are un segment recenzie de carte, în cazul în care interviu autori despre cărți. Și așa ar fi minunat dacă ați fost Cautati o carte în Harvard Biblioteca, iar tu spui, OK, nu e a fost un interviu cu autorul. Să mergem să aruncăm o privire la asta. Sau există o pagină Wikipedia, ca un autoritate de referință, academice despre aceasta carte pe care le ar putea dori să aruncăm o privire la. 

Există aceste tipuri de surse împrăștiate în întreaga web. Și le aduce laolaltă ar putea fi un mare folos pentru cineva care cauta la conținut, în căutarea pentru ceva. Dar nu e, de asemenea, fel de lucru pe care îl ai doresc biblioteca să fie responsabil pentru a merge în jos și de vânătoare în jos toate aceste surse diferite și conectarea lor împreună pentru că acestea sunt în continuă schimbare. Și ceea ce ei cred ca este mai importantă să nu fie ceea ce crezi este important. 

Si chiar mai mult, practic există un mulțime de lucruri nu ne-am gândit încă. Deci, dacă putem deschide asta, mai mult oameni în afară de o jumătate de duzină sau așa, care se uita la acest lucru pe o în mod regulat pot gândi idei și masaj de date, și face ce vor cu ea. 

Deci, vrem să facem acest datele disponibile la lume. Ei bine, există câteva complicații. Unul este acela că această metadate este în diferite sisteme. Este scris în diferite formate. Deci, există unele normalizare care trebuie să se întâmple, care normalizare fiind procesul de aducând lucrurile din diferite formate și le cartografiere la un singur format astfel încât câmpurile vor potrivi. 

Există unele restricții privind drepturile de autor. Destul de ciudat, la intrarea catalog despre o carte este răspunzător pentru drepturile de autor. Deci, chiar dacă e doar informații derivate din carte, e drept de autor. Și în funcție de cine de fapt a creat acea metadate, pot exista restricții privind cine poate distribui, sa-- similare 

Nu știu. Acesta poate sau nu poate fi similar situația song lyrics, de exemplu. Deci, știm cu toții cum că bucătărie afară. Deci, aveți nevoie pentru a obține în jurul valorii de această problemă. 

Și apoi o altă piesă este că există o mulțime de date. Deci, dacă eu sunt cineva care vrea să lucreze cu datele sau are o idee misto, se ocupă cu 14 milioane înregistrărilor privind laptop-ul meu ar putea fi problematică și dificil de gestionat. Așa că vrem să reducă barierele pentru oameni pentru a putea lucra cu datele. 

Deci, abordarea pe care sperăm adrese toate aceste preocupări este de două părți. Un construiește o platformă care să date de la toate aceste surse diferite și-l agravează, normalizeaza, îmbogățește ea, și face la dispoziție într-o singură locație. Și ea face disponibile prin intermediul un API public care oamenii pot apela. 

Deci, un API este o aplicație Interfață de programare. Și practic se referă la o endpoint că un sistem sau tehnologie puteți apela și obține date înapoi în un format structurat într-un mod care poate fi utilizat. Deci nu e dependent pe de gând la un site web și răzuire date de pe de aceasta, de exemplu. 

Deci, aceasta este pagina de start a Articolul API Library Cloud, care este în esență versiune doi. Deci, este a doua repetare a încercarea de a face toate aceste date disponibil în lume. Deci e http://api.lib.harvard.edu/v2/items. Și doar pentru a rupe acest jos un pic, ce înseamnă acest lucru este că aceasta este versiunea doi a API. Există o versiune una, care N-am de gând să vorbesc despre. Dar există o versiune unul. 

Și dacă suni acest API, primiți elemente. Și o parte din ideea de API este un API este un contract. E ceva care este nu va schimba. Deci, de exemplu, - 

Iar motivul este că, dacă am construi un fel de sistem care se va folosi un API bibliotecă nor pentru a afișa cărți sau ajuta oamenii să găsească informații în moduri unice, ceea ce nu vrem să se întâmple este pentru noi să mergem schimba modul că API lucrări, și dintr-o dată tot sparge pe partea de utilizator final. Deci, o parte din, dacă faci API disponibil în lume, e bune practici pentru a pune o Numărul versiunii în ea atât de oameni Știi ce versiune se de-a face cu. 

Deci, dacă ne-am hotărî vom găsi o cale mai bună de a face aceste informații disponibile, am putea schimba asta apel această versiune trei. Deci, oricine este încă utilizează Versiunea doi, care va funcționa în continuare. Dar versiunea trei ar fi au toate lucruri noi. 

Deci, aceasta este un API, dar aceasta într-adevăr arată ca o adresă URL. Și ce este o exemplu de este ceea ce este numit un API de odihnă, care este disponibil peste doar o conexiune web regulat. Și poți de fapt du-te să-l într-un browser. 

Deci, aici eu doar am deschis Firefox și plecat la api.lib.harvard.edu/v2/items. Și așa cum am ajuns aici este practic prima pagină rezultatelor din întreaga set de elemente pe care le-am luat. Și e aici, în format XML. Și a fost, de asemenea prettified de Firefox. Ea nu are de fapt toate acestea puțin expansiune și contractare doohickeys aici. Aceasta este un fel de frumos Versiunea mod de a privi la ea. 

Dar ceea ce ne spune acest este Am cerut toate elementele. Deci, există 13289475 elemente. Și mă uit la primul 10, începând de la poziția zero pentru că în informatică am mereu încep de la zero. Și ce am aici, dacă am doar colaps aceasta, veți vedea că am 10 bucăți. 

Și dacă aruncăm o privire la un articol, pot vezi că am informații despre el. Și acest lucru este în ceea ce se numește formă MODS. Și așa am de gând pentru a comuta înapoi aici pentru un moment. OK. 

Deci, haideți să caute ceva în specifică că primul element care se întâmplă să vină atunci când te uiți prin întreaga colecție este, prin definiție, aleatoare. Așa că haideți să ne uităm pentru câteva gogoși. Oh. 

OK. Deci gogoși. Așa că am găsit acolo sunt 80 de articole în colecția de referință care gogoși. Ne uităm la primele 10 de ele. Acum, puteți vedea aici modul în care I-am spus caut gogoși, Am adăugat doar ceva la șirul de interogare a URL-ul. Deci q este egal cu gogoși, pe care le puteți a se vedea un pic mai ușor aici. 

Și acest lucru înseamnă în esență există un spec pentru API, care definește ce toate acești parametri medie. Și asta înseamnă că vom caută tot pentru gogoși. 

Deci, primul element aici avem puteți vedea titlul este Donuts, și există un subtitlu numit O Pasiunea american, care este, cred, adecvat. Există o mulțime de different-- Odată ce ajunge la punctul de a obține date, există o mulțime de diferite formate pe care îl puteți obține în. Și există diferite concentrații și slabe pentru toți. Deci acesta, puteți vedea aici, această formă este foarte bogat. Și este standardizat. 

Deci, există un anumit titlu câmp, un câmp subtitrare. Există o alternativă titlu, o pasiune american. Nu este numele asociat cu el. Tipul de resursa este text. Există o mulțime de informații aici, în acest format. 

Dar există o grămadă de diferite formate. Deci, ceea ce am fost pur și simplu uita la este un format numite MODS, care vine de la Metadate obiect Descriere Service, potențial. Sunt de fapt, nu chiar sigur S. Dar este un format destul de complex. Este formatul implicit. 

Dar e cea care ține bogăția toate datele că biblioteca are, deoarece este foarte aproape de ceea ce biblioteca folosește intern. Este un standard care este folosit în întreaga țară, în întreaga lume în bibliotecile universitare. Și este foarte interoperabil. Deci, dacă ai un document care este în format MODS, puteți da ca la altcineva ale căror sisteme înțelege MODS, și ei pot importa. Deci, este un etalon. Este foarte bine definit, foarte specific. Și asta este ceea ce face interoperabile pentru că dacă cineva spune, aceasta este titlul alternativă a unui înregistrare, toată lumea știe ce înseamnă asta. Pe de alta parte, e foarte complicat. 

Deci, dacă vă veți uita la acest record aici, dacă vreau doar pentru a obține titlul acestui document, din această carte, care este, probabil, Donuts, O pasiune american, aceasta parsarea afară este un pic implicat. Întrucât există o altă format numit Dublin Core, care este un, format mult mai simplu mult. 

Și așa te văd aici, nu e nici o titlu, subtitlu, titlul alternativ. Nu e doar titlul, Donuts, o pasiune american, și un alt titlu, Passion american. Deci, atunci când te uiți la ce formă doriți să obțineți date din, o mulțime depinde de cât de ai de gând să-l folosească. Utilizați pentru interoperabilitate sau a face tu vrei ceva simplu că ar putea fi mai ușor de a lucra cu? 

Pe de alta parte, o mulțime de Detalii se un fel de squished jos. S-ar putea pierde nuanțele de ceea ce un anumit mijloc de câmp dacă ai de a face cu Dublin Core, care nu v-ar lua cu MODS. Deci, acestea sunt două din formatele puteți ieși din API. Și de fapt, suntem păstrarea aceasta spatele scenei din MODS. Dar vă putem da în MODS și Dublin Core și orice altceva, de asemenea. Alte considerare atunci când căutați în datele este puteți să-l fie ca JSON, care standuri pentru JavaScript Object Notation, sau XML, care vine de la Extensible Markup Language. Și aceste reprezentări de date, atât au exact aceleași date, exact aceleași domenii. Dar acestea sunt doar sintactic diferit. 

Deci, aceasta este un-- Ei bine, hai să comutați. Deci, aceasta este interogare noastră pentru gogoși în format XML. Dacă am trece acest lucru să fie JSON, Văd că arată altfel. Deci, acum acest lucru este același conținut, dar o structură diferită. Există puține paranteze unghiulare. Nu e mai puțin detaliată. 

Și aceasta este un format care, daca lucrează în mediul web, pe care cel mai probabil vor să doriți să utilizați pentru că o de lucrurile frumoase despre JSON este e compatibil cu JavaScript. Deci, dacă eu scriu aplicație web, pot trage în JSON și doar a lucra cu el direct. Întrucât cu XML, este o pic mai complicate. Deci, din nou, acestea sunt atât de utile. Ei doar sunt diferite cazuri de utilizare în cazul în care oamenii ar putea dori să le folosească. OK. Deci, înapoi la API. Deci, putem căuta for-- 

Dau un exemplu de căutați gogoși. Putem, de asemenea, căuta doar într-o câmp special în cadrul aici. Deci, în loc de a căuta întreaga înregistrare, Pot căuta doar câmpul titlu. Și așa că acum sunt 25 de lucruri pe care au gogoși în titlu, dintre care unul este de aproximativ restabilirea zone umede în management de gaura din gogoasa Programul, care este, probabil, nu neapărat ceea ce căutăm pentru că atunci când suntem în căutare de gogoși. 

Puteți, de asemenea, dacă sunteți a face cu un API-- 

Parte a avea un API este avertizat oameni accesul la seturi mari de date. Și există un cuplu diferit instrumente pe care le puteți folosi pentru a face asta. Una dintre ele este, foarte simplu, tu poate pagină prin datele. Deci, la fel ca și cum ai face o interogare printr-o interfață web, poti sa te uiti la pagina unu, pagină doi, trei pagină. Puteți face același lucru lucru prin intermediul API. Trebuie doar să fie explicit în modul în care o faci. 

Deci, de exemplu, dacă mă uit la prima mea interogare aici, în cazul în care fac o căutare pentru lucruri cu gogoși în titlu, pot spune, și limita atinge 20, ceea ce înseamnă da-mi primele 20 de înregistrările, nu primii 10, care este implicit, pentru că vreau să mă uit la 20, la un moment dat. Sau pot spune, setați începe egală cu 20 și limita egal 20, care va da mă înregistrează 21 prin 40. 

Deci cred că lucrul pentru a ține departe de aici este pe care îl utilizăm siruri de caractere de interogare pentru a seta parametrii pe interogare. Și vă permite să controlați ce te întorci. 

Un alt instrument pe care le puteți utiliza, - 

Și acest lucru este foarte util în ceea ce privește explorarea datelor. 

--is ceva numit fatetare. Deci, fațetarea termen este nu neapărat comun. Dar l-ați văzut totul înainte. Dacă aruncăm o privire la Amazon, de exemplu, și faci o căutare pentru gogoși în cărți, aici le-am luat o serie de cărți, și sunt grupate pe categorii, și veți obține diferite categorii, și cât de multe cărți în fiecare categorie apar. 

Deci, aceasta este de fapt o fațetă. Iei toate cărțile lor, 1800 Cărți care se potrivesc gogoși la Amazon. 12 dintre ele sunt în categorie micul dejun. 21 în patiserie și panificație, și așa mai departe și așa mai departe. 

Deci, aceasta este într-adevăr un util instrument pentru explorarea conținutului în cadrul bibliotecii, precum și pentru că atunci când te uiți la un aspect, vă oferă o idee despre ceea ce subiecte există, ca ceea ce tipuri de subiecte sunt cele mai populare în setul de interogare. Și vă ajută să conduci de pe și de a explora. Deci, putem face același lucru. 

Dacă doriți să utilizați API și uita-te la fațete, am adăuga un alt parametru de prietenul nostru șir de interogare. Deci, fatete este egal cu un separate prin virgulă Listă de ceea ce vrem să fațetelor pe. Astfel, una dintre fațetele ar putea fi supus. Un alt ar putea fi limba. Și așa, dacă am alerga că interogare, noi get-- Se pare destul de mult la fel aici. Dar am adăugat la sfârșitul listei unui set de fațete. Deci, avem o fațetă numit subiect. Deci asta ne spune că dacă mă uit la mea 80 de rezultate de interogare gogoasa, 13 dintre ei au supună Statele Unite ale Americii. Trei au gogoși subiect. Trei au subiectului de restaurare zonelor umede, care poate fi gaură noastră în gogoasa. Doi dintre ei, Simpsons, și așa mai departe și așa mai departe. 

Deci, acest lucru poate fi util dacă ați doresc să restrânge căutarea. Acesta vă poate ajuta să faci asta. Mai ales dacă aveți mai mult, spune, 80 de rezultate. 

În mod similar, am cerut, de asemenea pentru fatete pe limbă. Deci, dacă ne uităm la rezultatele noastre, vom vedea 76 dintre ele sunt în limba engleză, patru în franceză, două în limba spaniolă, două, cred că e nedefinit sau necunoscute, olandeză și latină. Deci, cred că latina Rezultatul gogoasa, din nou, nu are nimic de-a face cu produse de patiserie. Dar te duci. 

Deci, acest lucru este un fel de care vă arată cum poti trage conținutul înapoi de la API doar prin browser web, care este mare. Dar nu e chiar ceea ce ar fi în mod normal, folosind în API pentru el. Deci, un exemplu de cum te ar putea face de fapt acest lucru este Am scris un program de super-mic, care, din nou, căutarea mea gogoasa și selectează câteva domenii și le afișează într-un tabel. Deci, acest lucru este foarte mult același conținut care tocmai am ferăstrău cu câteva domenii tras în afară. Deci listă a titlurilor, a Locul de amplasare a ceea ce carte este de aproximativ, limba, și așa mai departe și așa mai departe. 

Deci, cum sa întâmplat de fapt acest, întrucât Cred că trebuie să se uite la unele cod, este-- 

Ceea ce avem aici este un cod HTML simplu pagină, care afișează textul, Bine ati venit la nor bibliotecă și apoi afișează un tabel de rezultate. Și acolo sunt, evident, nici un rezultat in tabel atunci când pagina se încarcă. Dar ce facem este, în primul rând, încărcați o bibliotecă numită jQuery, care este de fapt o bibliotecă JavaScript, care o face foarte ușor de manipulat JavaScript nativ, HTML, și de a crea pagini web, logică client-side și pagini web. 

Deci, ce avem aici este jQuery are o metoda numita Get, care, în esență, va merge la un URL, care, în acest caz, este acest URL familiar cautati. Și va primi apoi continutul din că URL-ul și apoi executați o funcție pe ea. Deci, am spus merge la api.lib.harvard / edu. Căutați gogoși. Dă-ne 20 de înregistrări. Și apoi executați această funcție, care Am ales, care trece aceasta datele. Iar datele sunt JSON că am întors de la API. 

Și apoi vom spune, în acest date există un câmp numit element. Și dacă mă duc aruncăm o privire înapoi la unul dintre aceste rezultate e aici, e ceva called-- 

Ei bine, se numește element. Deci, care ar putea fi faptul că. Și ceea ce face este trece prin fiecare element și apoi solicită un alt Funcția pe fiecare element. Și această funcție, practic, este de a lua valoarea a elementului, care este în esență, înregistrarea individuală și ne permite să scoate titlu, acoperirea și limba. 

Deci, noi numim o funcție pe fiecare element care ne-am întors de la API. Și dacă luați doar o privire la această piesă aici, ceea ce facem este suntem crearea unui șir de caractere, care este în esență o anumită HTML markup în jurul unei mese, cu value.title, care este titlul obiect, value.coverage, care este acoperirea, - 

Și facem o verificare aici pentru a vedea cine este nedefinit și ascunde-l dacă se spune nedefinit, pentru că nu suntem cu adevărat interesați în acel. 

--and apoi limba. Și apoi ce suntem face este adăugarea că la masa care este identificate prin acest șir aici. Și cum functioneaza jQuery este ceea ce acest spune este sa te uiti pentru masa cu ideea Rezultatele și se adaugă acest text să-l. Și aceasta este tabelul cu rezultatele idee. Deci, ce va ajunge cu este aceasta pagina aici. Și în scopul de a vizualiza source-- Ei bine, sursa nu este de fapt actualizat atunci când sa întâmplat. Deci, puteți vedea reale Rezultatele din tabelul de mai jos, totuși. 

Deci, asta e doar un simplu exemplu de a face o interogare foarte de bază împotriva API și afișarea informațiilor într-o altă formează, și a nu face nimic prea fantezist. Acum, un alt exemplu este ca o cerere scrisă de David Weinberger ca un demo de acest lucru, care în esență, vă arată cum poti mash-up rezultatele esti obtinerea de API bibliotecă nor cu, să zicem, Google Books. 

Iar gândirea aici este că eu pot executați o interogare împotriva Google Books, obține o căutare de text complet, pentru a primi niște rezultate înapoi, pentru a afla care dintre aceste elemente exista de fapt în Hollis, sistemul de biblioteci, și apoi da-mi link-uri înapoi la acele elemente. Deci, dacă am căuta, a fost o noapte întunecată și furtunoasă, eu primi înapoi o grămadă de rezultate de la Google, iar apoi un rezultat care este o ridurilor în timp. Și acestea sunt link-uri către cărți care există în cadrul sistemului Harvard Library. 

Deci cred că punctul de aici nu este atât de mult încât aceasta poate sau nu poate fie modul în care doriți pentru a căuta în bibliotecă, dar este un complet diferit mod care nu a fost disponibil pentru tine înainte, ca și cum ai avea nici un fel de a face Textul integral căutări pe cărțile pe care chiar au fost parte din sistemul Harvard Library. Deci, acum aceasta este o modalitate pe care le puteți face asta. Și tu poți să le afișați în indiferent de format vrei. Deci, punctul de aici este, de fapt, ne deschide noi căi pentru oameni pentru a lucra cu datele. 

O altă piesă de nor de bibliotecă este că ajută expune o parte din date utilizare că biblioteca are. Deci, dacă te duci la bibliotecă, și căutați pentru cărți, tu nu neapărat de fapt, au o idee de, pentru toate elementele dintr-un subiect special, ceea ce sunt oameni în comunitate, fie că este vorba definit auxiliar Harvard sau țara sau clasa ta, Ce au găsit cele mai utile? Iar biblioteca are de fapt o tona de informații cu privire la ceea ce este cel mai util pentru că dacă o mult de persoane sunt verificarea o carte, care vă spune ceva. Trebuie să fi fost un motiv oarecare ei doresc să-l verificați. O mulțime de oameni pune-l pe rezervă. 

Dacă e pe lista de rezervă pentru un lot de clase, care vă spune ceva. În cazul în care membri ai facultăților îl verificare o mulțime și studenți nu sunt, care îmi spune ceva. Vice versa, care, de asemenea vă spune ceva. Așa că ar fi foarte interesant să pune aceste informații acolo și lasă- oameni l utilizați pentru a le ajuta să găsească lucrează în sistemul de biblioteci. Reversul este există unele intimitate grave preocupările pentru că una dintre principii de bază ale bibliotecii este că nu o să spun oameni ce alte persoane sunt citind. Și chiar dacă vi se spune acest Cartea a fost verificat de patru ori într-o anumită lună, care ar putea fi utilizate pentru a lega înapoi la un anumit Persoana de date de-a anonimatului și de a afla cine a verificat. Deci, modul în care putem avoid-- Modul în care putem încerca să extrage un semnal de la toate informațiile fără a încălca probleme de confidențialitate nimănui este, în esență, ne uităm la 10 ani de date de utilizare, - 

Deci, este pe o perioadă lungă de timp. 

--and spune, OK, hai sa vedem cum de multe ori a fost folosit acest lucru, și de care în această perioadă de timp, și apoi practic da înapoi un număr, pe care o numim un scor stivă, care, practic, reprezintă cât de mult a fost folosit. Și number-- O mulțime de diferite calcule du-te în acest număr. --but este un foarte dur metric, care vă oferă o idee cât de comunitate poate apreciază că munca. 

Și astfel un alt fel de chiar mai mult completate cerere că profită de acest lucru este ceva numita Stacklife, care este de fapt disponibil prin intermediul principal Harvard Portal Biblioteca. Deci, te duci la library.harvard.edu. Veți vedea un număr de diferit modalități de căutare bibliotecii. Și unul dintre ei se numește Stacklife. 

Și aceasta este o aplicație care parcurge conținutul bibliotecii, dar este complet construit pe partea de sus a acestor API-uri. Deci nu e nici chestii de construcții întâmplă în spatele scenei. Nu e nici acces la datele care nu aveți. Se utilizează API-urile pentru a vă oferi cu o navigare complet diferit experiență. 

Deci, dacă am căuta Alice în Țara Minunilor, în acest caz, I a lua un rezultat care arata ca aceasta, care este destul de much-- 

Este foarte similar cu orice alt căutare s-ar putea face, cu excepția, în acest caz suntem clasament elementele de stackscore, care vă oferă o idee cât de popular acestea articole au fost în cadrul comunității. Și atât de clar, Alice in Tara Minunilor de Walt Disney este foarte popular. Dar puteți vedea, de asemenea, primele patru aici sunt cele ar putea să nu actually-- 

Lucrurile care sunt foarte utilizate, dar tu nu pot imediat conecta cu Alice in Tara Minunilor. Deci, vechiul nostru prieten Adnotată Alice este aici. Deci, eu pot lua o privire la ea. Și acum, ce caut la este de fapt un set de de-- Pot avea adnotat Alice chiar aici. Am informații despre el. Și am, de asemenea, un stackscore a, în acest caz, 26. Și asta mi-a spus tip de aproximativ cum am ajuns la această stackscore, ca care a verificat, ca și cum de multe ori a fost împrumutat, ca facultate sau undergrads, cum multe exemplare biblioteca are, și așa mai departe și așa mai departe. 

Și puteți, de asemenea, destul de interesant aici, vezi stivele practic. Astfel, datele de aici, aceasta dă tu un fel de o reprezentare virtuală a ceea ce s-ar putea raft arata ca dacă ar fi să luați toate exploatațiile bibliotecii și le-a pus împreună pe o raft infinit. Și lucrul frumos este ca noi can-- 

Mai întâi de toate, metadate despre aceste cărți de multe ori vă spune când a fost publicată. Aceasta vă spune cât de multe pagini are. S-ar putea să vă spun dimensiunile. Deci, puteți vedea care este reflectat aici în ceea ce privește dimensiunea cărților. 

Și apoi putem folosi stiva scor pentru a evidenția cărțile care au scoruri mai mari stack. Deci, dacă este inchisa, aceasta înseamnă că, probabil, este folosit mai des. Deci, în acest caz, sunt O să cred că această este versiunea de Alice în Țara Minunilor care este foarte frecvent utilizat și cel mai accesat, biblioteca are cele mai multe exemplare ale. Deci, dacă sunteți în căutarea pentru Alice in Tara Minunilor, acest lucru ar putea fi un loc bun pentru a începe. 

Și apoi aici puteti, de asemenea, link-afară la, să zicem, Amazon să cumpere cartea, și așa mai departe și așa mai departe. Punctul de aici, din nou, nu este atât de mult încât această este cel mai bun mod de a naviga pe biblioteca sau instrumentul potrivit pentru orice ocazie. Dar e un alt mod de a face asta. Și prin datele disponibil printr-un API, care este construita din blocuri foarte simplu de constructii, care vă permite să căutați conținut, puteți construi ceva ca asta, care poate fi extrem de valoros pentru unii oameni. 

Deci asta e un fel de, la fel de mult ca doresc să spun într-adevăr despre ceea ce API este și ceea ce expune, există un întreg grămadă de lucruri în spatele scenei, care Mă duc să atinge pe scurt doar pentru că un fel de vorba la acest dintr-un unghi complet diferit în ceea ce privește modul în care face ceva de genul asta se pune în aplicare? 

Deci, un API este un standard de interfata la toate acest conținut. Dar să-l acolo, primul lucru pe care a trebuit să facem a fost trage împreună informații de cărți și imagini și ajutoarele constatare, colectarea document din diferite sisteme Harvard. Aleph, VIA, și OASIS sunt numele sistemelor. Și se duc, în esență, într-o conducte, o conductă de prelucrare. 

Deci, în primul rând, vom obține export fișiere de toate aceste sisteme. Le-am împărțit în elemente individuale. Deci, avem un fișier, care este un gigabyte, care are un milion de înregistrări în ea. Așa l-am împărțit în elemente individuale. Apoi, pentru fiecare element, l-am transforma în MODS, deoarece unele dintre acestea sunt MODS nativ, unele dintre ele nu sunt. Așa că le ajunge pentru să fie în același format. Apoi, există diverse pași de îmbogățire, în cazul în care vom adăuga mai multe informații la datele decât a fost la biblioteca. Deci, avem nevoie pentru a adăuga, în primul rând avem ceea ce biblioteci țineți-l. Trecem printr-o etapă de calcularea stackscore. Trecem printr-o altă etapă a adăugarea de mai multe metadate din punct de vedere de ce oameni colecții ar fi adăugat astea-- 

Oamenii sunt crearea Colectiile de articole. Ce colecții nu-l aparține? Cum s-au persoane au etichetat acest conținut în trecut? Apoi filtra, și tu restrânge înregistrările pentru că, așa cum am menționat, există unele înregistrări că, din cauza motive de copyright, nu putem afișa. Și apoi le încărcați în ceva numit Solr, care nu este o greseala, un dar este numele de o bucată de software care face căutare de indexare, care conduce toate căutare din spatele API. Și atunci el devine disponibil pentru API, și oamenii pot folosi. 

Deci, aceasta este ca un destul de proces simplu. Unul dintre interesante lucruri despre ea este că avem de-a face 13 de milioane de discuri și vom fi a face sau mai mult. Și noi vrem să fie în măsură să se ocupe de acestea într-un mod relativ rapidă. Este nevoie de o lungă perioadă de timp pentru procesa 13 milioane de înregistrări. 

Deci, cum aceasta conducta este instituit este că can-- Cred că profită de această conducte, problema pe care suntem încearcă să rezolve aici, este că toate transformările, toate acești pași în această conducte sunt separabile. Nu e nici o dependență. Dacă sunteți de prelucrare un record de o carte, nu exista nici o dependență în că între o altă carte. 

Deci, ce putem face este, în principiu, la fiecare pas în conducta, am pus într-o coadă în nor. I sa întâmplat să fie pe Amazon Web Services. Deci, există o listă de, spune, 10.000 US care trebuie să fie normalizată și convertite în format MODS. Și ne-am învârti în sus cat mai multe servere așa cum ne-am dori, poate 10 servere. Și fiecare dintre aceste servere doar stă acolo, arată că în coadă, vede că există unul care are nevoie pentru a fi prelucrate, se trage de pe coadă, procesează, și bastoane se pe coada următor. 

Și ce ne permite ca sa faci este sa aplice, în esență, la fel de mult ca hardware-ul vrem să această problemă pentru o perioadă foarte scurtă de timp pentru a procesa datele cât mai repede posibil, ceea ce este ceva care numai, acum în lumea de cloud computing putem servere de furnizare esență instantaneu, este că util. Deci, nu trebuie să aibă un serverul gigant ședinței în jurul valorii de tot timpul pentru a face prelucrarea care s-ar putea întâmpla doar o dată pe săptămână. 

Așa că este mai mult o. Există documentație disponibil pentru postul API Biblioteca Cloud la acest URL, care va fi disponibil mai târziu. Și vă rugăm să mergeți gasiti l pentru a vedea dacă există ceva, aveți idei. Joaca cu ea. Fool în jurul. Și sperăm că vă puteți veni cu ceva mare. Mulțumesc.