JEFFREY LICHT: Hola. Estic Jeffrey Licht. I jo sÃ³c aquÃ­ per parlar amb vostÃ¨ sobre la Biblioteca de la Universitat de Harvard i la construcciÃ³ del matÃ­ biblioteca avui, suposo. AixÃ­ el fons aquÃ­, el terreny de joc per aquesta sessiÃ³ Ã©s essencialment que hi ha una gran quantitat de dades bibliogrÃ fiques disponibles a les biblioteques de Harvard. I hi ha una oportunitat, a travÃ©s d'algunes de les eines i un projecte que s'estÃ  desenvolupant, per accedir a la informaciÃ³ i portar-la als llocs que la Biblioteca de la Universitat de Harvard no estÃ  fent en aquest moment, fer coses noves amb ell, experiment i jugar una estona amb ell. AixÃ­ que el punt d'entrada en aquesta Ã©s una API anomenada la Harvard Biblioteca NÃºvol, que Ã©s un servidor de metadades obert, que vaig a parlar ara. AixÃ­ que el fons Ã©s que hi ha una munt de coses a la biblioteca de la Universitat de Harvard. Tenim mÃ©s de 13 milions bibliogrÃ fica registres, milions d'imatges, i milers d'instruments de descripciÃ³, que sÃ³n essencialment documents que descriuen colÂ·leccions, dient el hi ha en ells, caixes de papers etc., que representen mÃ©s del un miliÃ³ de documents individuals. I tambÃ© hi ha una gran quantitat de informaciÃ³ que la biblioteca tÃ© sobre com s'utilitza el contingut que podria ser d'interÃ¨s per a les persones que podria voler treballar amb ell. 

AixÃ­ que tota la informaciÃ³ la biblioteca compta amb metadades. AixÃ­ que les metadades sÃ³n dades sobre dades. AixÃ­ que quan parlem de la informaciÃ³ que estÃ  disponible a travÃ©s de la biblioteca nÃºvol que estÃ  disponible, no Ã©s necessÃ riament els documents reals si mateixos, no necessÃ riament la plena text dels llibres o les imatges a tot, perÃ², que en realitat pot ser el cas. PerÃ² en realitat Ã©s informaciÃ³ sobre les dades. 

AixÃ­ que vostÃ¨ pot pensar en la catalogaciÃ³ informaciÃ³, nÃºmeros de trucada, temes, quantes cÃ²pies de la llibre hi ha, el que sÃ³n les edicions, quins sÃ³n els formats, els autors, i aixÃ­ successivament. AixÃ­ que hi ha una gran quantitat d'informaciÃ³ sobre la informaciÃ³ de la colÂ·lecciÃ³ que, en si mateix, Ã©s una espÃ¨cie de inherentment Ãºtil. I encara que si estÃ s fent una investigaciÃ³ en profunditat, Ã©s obvi que vol arribar a la real acontentar i mirar les dades, les metadades Ã©s Ãºtil en termes de tant l'anÃ lisi de la corpus en el seu conjunt, com el que sÃ³n les coses en la colÂ·lecciÃ³. Com es relacionen? L'ajuda realment a trobar altres coses, que Ã©s realment el propÃ²sit principal de la mateixa. El punt de la metadades i del catÃ leg Ã©s ajudar a trobar de tot la informaciÃ³ que estÃ  disponible dins de les colÂ·leccions. 

AixÃ­ que aquest Ã©s un exemple de metadades d'un llibre a la Biblioteca de la Universitat de Harvard. AixÃ­ que aquÃ­ estÃ . I es pot veure que Ã©s en realitat moderadament complex. I part del valor de les metadades dins del sistema de Biblioteca de la Universitat de Harvard Ã©s que ha estat una espÃ¨cie l'acumulat pels catalogadors i muntats per persones que solÂ·liciten una gran quantitat d'experiÃ¨ncia i habilitat i es creu que amb el temps, que tÃ© molt valor. 

AixÃ­ que si vostÃ¨ fes un cop d'ull a aquest expedient per Alicia anotada, vostÃ¨ pot descobrir que tingui el tÃ­tol, que el va escriure, el autor, i tots els diferents temes Quines persones han catalogat a. I vostÃ¨ pot veure que hi ha tambÃ©, en A mÃ©s d'un munt de bona informaciÃ³ aquÃ­, hi ha certa duplicaciÃ³. Hi ha una gran quantitat de complexitat que Ã©s reflecteix a travÃ©s de les metadades que tÃ©. 

AixÃ­ que un tÃ­tol d'aquest llibre Ã©s Les aventures d'Alicia al PaÃ­s de les Meravelles. AixÃ­ que aquest Ã©s un Anotat versiÃ³ d'aquest llibre. PerÃ² tambÃ© diu El Anotat Alice, les aventures d'AlÃ­cia in Wonderland perquÃ¨ Ã©s una cosa que Martin Gardner va escriure i anotada del llibre. I hi ha una gran quantitat d'informaciÃ³ sobre de trencaclosques de lÃ²gica i coses dins d'Alice que probablement no conÃ¨ixer. AixÃ­ que cal anar llegir. 

PerÃ² vostÃ¨ pot veure que hi ha molt detall aquÃ­, inclosos els identificadors, quan va ser creat, d'on ve, en termes de la Universitat de Harvard sistema, i aixÃ­ successivament. AixÃ­ que aixÃ² Ã©s una mostra de el tipus de metadades que vostÃ¨ pot veure per un llibre en la ColÂ·lecciÃ³ de la biblioteca de Harvard. 

AixÃ² Ã©s una cosa completament diferent. AixÃ­ que hi ha un sistema anomenat VIA Harvard, que, bÃ sicament, estÃ  catalogant imatges i objectes d'art i les coses visuals al llarg de Harvard, i l'addiciÃ³ d'alguns metadades a ells, classificant, i, en alguns casos, proporcionant petites imatges en miniatura que pot prendre un mira si aixÃ­ ho desitja. 

AixÃ­ que aquest Ã©s un exemple de la metadades que vostÃ¨ tÃ© per a una placa de, presumiblement, AlÃ­cia al PaÃ­s de les Meravelles. I vostÃ¨ pot veure que hi ha menys metadades aquÃ­. Ãs nomÃ©s un tipus diferent d'objecte. I el que hi ha menys informaciÃ³. 

VostÃ¨ majoritÃ riament tÃ© el fet que, una trucada nombre, essencialment que el va crear, - 

No sabem quan es va crear. 

--i un tÃ­tol. 

Un altre exemple. Es tracta d'un instrument de descripciÃ³. AixÃ­ que hi ha una colÂ·lecciÃ³ de Lewis Treballs de Carroll a Harvard. AixÃ­ que aixÃ² descriu el que Ã©s en aquesta colÂ·lecciÃ³. AixÃ­ que algÃº ha passat per i mirat a travÃ©s de totes les caixes i el va catalogar, donat alguns antecedents, escrit un resum del que hi ha aquÃ­. I si anÃ©s a mirar addicionalment a aixÃ², aquest continua durant pÃ gines i pÃ gines i pÃ gines, perÃ² li dirÃ  quines cartes i quÃ¨ data de quina caixes existit en tota la colÂ·lecciÃ³. PerÃ² aixÃ² Ã©s una cosa que, si estÃ s a Harvard, vostÃ¨ pot anar i realment es veuen fÃ­sicament i, presumiblement, fer una ullada a. 

AixÃ­ que aixÃ² Ã©s genial. D'utilitat Aquestes metadades. EstÃ  en el sistema de Biblioteca de la Universitat de Harvard. Hi ha eines en lÃ­nia on vostÃ¨ pot anar a prendre una mirada en ella, i veure-ho, i buscar-la. I vostÃ¨ pot tallar i daus en un munt de diferents maneres. 

PerÃ² en realitat nomÃ©s estÃ  disponible si vostÃ¨ Ã©s un Ã©sser humÃ  que se senti baix en el seu navegador web o alguna cosa o el seu telÃ¨fon i navegar a travÃ©s d'ell. En realitat no Ã©s disponible en qualsevol tipus de moda utilitzable per a altres sistemes o altres equips a utilitzar, no amb sistemes dins de la Biblioteca de Harvard, perÃ² els sistemes al mÃ³n exterior, nomÃ©s altres persones en general. Llavors la pregunta Ã©s, com podem nosaltres posar-lo a disposiciÃ³ dels ordinadors de manera que puguem fer mÃ©s interessant coses amb ell que amb prou feines navegaciÃ³ per nosaltres mateixos? 

AixÃ­ que per quÃ¨ vols fer aixÃ²? Hi ha un munt de possibilitats. Una d'elles Ã©s que podria construir un complet diferent manera de navegaciÃ³ el contingut que estÃ  disponible a travÃ©s de les biblioteques de Harvard. Et vaig a mostrar 1 mÃ©s tard anomenat Stacklife, que tÃ© un completament diferent prendre en la recerca de contingut. 

Es pot construir un motor de recomanaciÃ³. AixÃ­ Biblioteca Harvard no estÃ  en el negoci de dir, t'agrada aquest llibre. DesprÃ©s anar a prendre un cop d'ull a aquests altres 17 llibres que us poden interessar o aquests 18 altres imatges. PerÃ² que sens dubte podria ser una caracterÃ­stica valuosa. I tenint en compte les metadades, pot ser possible ajuntar aixÃ². Ãs possible que tingui diferents necessitats en termes de cerca en el contingut, com potser tot i les eines que estan disponibles de que la biblioteca fa disponibles, Ã©s possible que vulgueu per buscar d'una manera diferent o optimitzar per a un cas concret, que potser Ã©s molt especialitzat. Potser nomÃ©s hi ha uns pocs persones al mÃ³n que voler buscar el contingut d'aquesta manera, perÃ² seria genial si podria deixar que ells facin aixÃ². Hi ha una gran quantitat d'anÃ lisi en tot just com la gent utilitzar el contingut que seria realment interessant per conÃ¨ixer, descobrir quins llibres s'estan utilitzant, el que no ho sÃ³n, i aixÃ­ successivament. I desprÃ©s hi ha una gran quantitat de oportunitat d'integrar amb una altra informaciÃ³ aixÃ² Ã©s per aquÃ­ a la web. AixÃ­ que tener-- 

Per exemple, NPR tÃ© un segment de ressenyes de llibres, on entrevisten autors de llibres. I aixÃ­ que seria genial si fossis buscar un llibre a la Universitat de Harvard Biblioteca, i dius, OK, no hi ha estat una entrevista amb l'autor. Anem a fer una ullada a aixÃ². O hi ha una pÃ gina de Wikipedia, com referÃ¨ncia autoritzada, acadÃ¨mic sobre aquest llibre que pot ser que vulgui fer una ullada a. 

Hi ha aquests tipus de fonts dispersos per tot el web. I reunint podria ser un gran Ãºs per a algÃº que busca en el contingut, a la recerca d'alguna cosa. PerÃ² tambÃ© no Ã©s el tipus de cosa que vol que la biblioteca sigui responsable per baixar i la caÃ§a de totes aquestes diferents fonts i connectar junts perquÃ¨ estan en continu canvi. I el que ells pensen que Ã©s important maig no ser el que vostÃ¨ pensa Ã©s important. 

I mÃ©s encara, en el fons hi ha una munt de coses que no hem pensat encara. AixÃ­ que si podem obrir aixÃ², mÃ©s persones, a mÃ©s d'una mitja dotzena o aixÃ­, que estan mirant aixÃ² en un de forma regular pot pensar en idees i massatges les dades, i facin el que vulguin amb ell. 

AixÃ­ que volem fer d'aquest les dades disponibles per al mÃ³n. BÃ©, hi ha un parell de complicacions. Una Ã©s que aquests metadades Ã©s en diferents sistemes. EstÃ  en diferents formats. AixÃ­ que hi ha certa normalitzaciÃ³ que ha de succeir, que la normalitzaciÃ³ Ã©s el procÃ©s de portant coses de diferents formats i mapar a un Ãºnic format perquÃ¨ els camps coincidiran. 

Hi ha algunes restriccions de copyright. Per estrany que sembli, l'entrada del catÃ leg sobre un llibre es fa responsable dels drets d'autor. AixÃ­ que, encara que Ã©s nomÃ©s informaciÃ³ derivada de la llibre, Ã©s dret d'autor. I depenent que en realitat creat que les metadades, pot haver restriccions sobre qui pot distribuir-lo, A-- similars 

No ho sÃ©. Pot o pot no ser similar a la situaciÃ³ de les lletres de canÃ§ons, per exemple. AixÃ­ que tots sabem el que surt bÃ©. AixÃ­ que cal aconseguir al voltant d'aquest tema. 

I desprÃ©s una altra peÃ§a Ã©s que hi ha una gran quantitat de dades. AixÃ­ que si jo sÃ³c algÃº que vol treballar amb les dades o tÃ© una idea genial, tractar amb 14 milions registres en el meu portÃ til podria ser problemÃ tic i difÃ­cil de manejar. AixÃ­ que volem reduir les barreres per a les persones per poder treballar amb les dades. 

El que l'enfocament que s'espera adreces totes aquestes preocupacions Ã©s dues parts. Un Ã©s la construcciÃ³ d'una plataforma que pren les dades de totes aquestes fonts dispars i l'agreuja, normalitza, l'enriqueix, i marques a disposiciÃ³ en un sol lloc. I ho fa disponible a travÃ©s de una API pÃºblica que la gent pot trucar. 

AixÃ­ que una API Ã©s una aplicaciÃ³ InterfÃ­cie de programaciÃ³. I bÃ sicament es refereix a un punt final que un sistema o tecnologia pot trucar i obtenir dades de tornada a un format estructurat d'una manera que es pot utilitzar. AixÃ­ que no Ã©s dependent a anar a un lloc web i raspant dades fora de la mateixa, per exemple. 

AixÃ­ que aquesta Ã©s la pÃ gina principal de Cloud Library API d'article, que Ã©s essencialment la seva versiÃ³ dos. AixÃ­ que Ã©s la segona iteraciÃ³ de tractant de fer totes aquestes dades a disposiciÃ³ del mÃ³n. Pel que Ã©s http://api.lib.harvard.edu/v2/items. I nomÃ©s per descompondre una mica, el que aixÃ² significa Ã©s que aquesta Ã©s la segona versiÃ³ de l'API. Hi ha una versiÃ³ d'un, el que Jo no vaig a parlar. PerÃ² hi ha una versiÃ³ d'un. 

I si vostÃ¨ estÃ  trucant a aquest API, que estÃ  rebent els articles. I parteix de la idea d'un API Ã©s una API Ã©s un contracte. Ãs una cosa que Ã©s no canviarÃ . AixÃ­, per exemple, - 

I la raÃ³ Ã©s que si jo construir algun tipus de sistema que es va a utilitzar una API de biblioteca de nÃºvol per mostrar llibres o ajudar a la gent a trobar informaciÃ³ d'una manera Ãºnica, el que no volem que passi Ã©s per a nosaltres anar canviar la forma que funciona API, i de sobte tot el que es trenca en el costat de l'usuari final. AixÃ­ que part de si estÃ s fent API a disposiciÃ³ del mÃ³n, Ã©s bones prÃ ctiques per posar un nombre de versiÃ³ en ella perquÃ¨ la gent saben quina versiÃ³ s'estÃ  tractant. 

AixÃ­ que si decidim trobem una millor manera de fer que aquesta informaciÃ³ estigui disponible, podrÃ­em canviar aixÃ² a cridar a aquesta versiÃ³ 3. AixÃ­ que tot el que encara estÃ  utilitzant versiÃ³ dos, que encara va a treballar. PerÃ² la versiÃ³ de tres faria tenir totes les coses noves. 

AixÃ­ que aquest Ã©s un API, perÃ² aquesta Realment sembla un URL. I aixÃ­ el que es tracta d'una exemple del que Ã©s la anomenat API resta, que estÃ  disponible sobre nomÃ©s una connexiÃ³ web normal. I en realitat es pot anar-hi en un navegador. 

AixÃ­ que aquÃ­ Acabo d'obrir Firefox i anat a api.lib.harvard.edu/v2/items. I aixÃ­ ho he arribat fins aquÃ­ Ã©s bÃ sicament la primera pÃ gina dels resultats de la totalitat conjunt d'elements que ens tenim. I Ã©s aquÃ­ en format XML. I tambÃ© ha estat prettified per Firefox. En realitat, no tÃ© tots aquests poca expansiÃ³ i contracciÃ³ doohickeys aquÃ­. Aquesta Ã©s una espÃ¨cie d'agradable VersiÃ³ manera de veure-ho. 

PerÃ² el que aixÃ² ens estÃ  dient Ã©s He demanat a tots els articles. AixÃ­ que hi ha 13.289.475 articles. I estic buscant a la primera 10, comenÃ§ant en la posiciÃ³ zero perquÃ¨ en ciÃ¨ncies de la computaciÃ³ sempre comencem a zero. I el que tinc aquÃ­, si acabo de colÂ·lapsar aixÃ², veurÃ s que tinc 10 articles. 

I si em prenc un cop d'ull a un article, puc veig que tinc informaciÃ³ al respecte. I aixÃ² Ã©s en el que s'anomena forma MODS. I aixÃ­ em vaig a canviar tornar aquÃ­ per un moment. D'acord. 

AixÃ­ que anem a buscar alguna cosa a especÃ­fic perquÃ¨ el primer element que passa per arribar quan es mira a travÃ©s de tota la colÂ·lecciÃ³ Ã©s, per definiciÃ³, a l'atzar. AixÃ­ que donem una ullada a alguns donuts. Oh. 

D'acord. AixÃ­ donas. AixÃ­ trobem que hi ha 80 articles en la colÂ·lecciÃ³ que la referÃ¨ncia donuts. Estem pensant en el primer 10 d'ells. Ara, es pot veure aquÃ­ la forma en quÃ¨ Li vaig dir que estic buscant donas, Acabo d'afegir alguna cosa a la cadena de consulta de la URL. AixÃ­ q Ã©s igual a rosquilles, que es pot veure una mica mÃ©s fÃ cil aquÃ­. 

I aixÃ² bÃ sicament vol dir que hi ha una especificaciÃ³ de l'API, que defineix el que tots aquests parÃ metres signifiquen. I aixÃ² vol dir que anem a buscar tot per donas. 

AixÃ­ que el primer article aquÃ­ tenim es pot veure el tÃ­tol Ã©s Donuts, i hi ha un subtÃ­tol anomenat Un American Passion, que Ã©s, suposo, apropiat. Hi ha un munt de diferent-- Un cop al punt d'obtenir les dades, hi ha un munt de diferents formats que vostÃ¨ pot aconseguir a. I hi ha diferents punts forts i debilitats per a tots ells. AixÃ­ que aquest, vostÃ¨ pot veure aquÃ­, aquesta forma Ã©s molt rica. I ha estat estandarditzada. 

AixÃ­ que hi ha un tÃ­tol especÃ­fic camp, un camp de subtÃ­tols. Hi ha un suplent tÃ­tol, An American Passion. No Ã©s el nom associat amb ell. Tipus del recurs Ã©s text. Hi ha una gran quantitat d'informaciÃ³ aquÃ­ en aquest format. 

PerÃ² hi ha un munt de formats diferents. AixÃ­ que el que estÃ vem veient Ã©s un format anomenats MODS, que significa Metadades d'objecte DescripciÃ³ Servei, potencialment. En realitat estic molt segur sobre la S. PerÃ² Ã©s un format bastant complexa. Ãs el format per defecte. 

PerÃ² Ã©s la que mantÃ© la riquesa de totes les dades que la biblioteca tÃ© perquÃ¨ que Ã©s molt proper al que La biblioteca utilitza internament. Ãs una norma que Ã©s utilitzat en tot el paÃ­s, a tot el mÃ³n a les biblioteques universitÃ ries. I Ã©s molt interoperable. AixÃ­ que si vostÃ¨ tÃ© un document que estÃ  en format MODS, vostÃ¨ pot donar-li aixÃ² a una altra persona els sistemes entenen MODS, i poden importar. AixÃ­ que Ã©s un estÃ ndard. EstÃ  molt ben definit, molt especÃ­fic. I aixÃ² Ã©s el que el fa interoperable perquÃ¨ si algÃº diu, aquest Ã©s el tÃ­tol alternatiu d'una registre, tothom sap el que aixÃ² significa. D'altra banda, Ã©s molt complicat. 

AixÃ­ que si vostÃ¨ fes un cop d'ull en aquest disc aquÃ­, si nomÃ©s vull aconseguir el tÃ­tol d'aquest document, d'aquest llibre, que Ã©s probablement Donuts, Una passiÃ³ americana, analitzar-fora Ã©s una mica involucrats. Mentre que hi ha un altre format anomenat Dublin Core, que Ã©s un format molt, molt mÃ©s simple. 

I pel que es veu aquÃ­, no hi ha tÃ­tol, subtÃ­tol, tÃ­tol alternatiu. No Ã©s nomÃ©s el tÃ­tol, Donuts, An American Passion, i un nou tÃ­tol, American Passion. AixÃ­ que quan vostÃ¨ estÃ  buscant en quina forma Per obtenir les dades de, molt depÃ¨n de com vas a usar-lo. EstÃ  utilitzant per interoperabilitat o vostÃ¨ volen alguna cosa simple que podria ser mÃ©s fÃ cil treballar amb ell? 

D'altra banda, una gran part del detalls aconsegueixen espÃ¨cie de aixafades cap avall. Ãs possible que perdi els matisos de el que significa una determinada parcelÂ·la si vostÃ¨ estÃ  tractant amb Dublin Core, que no et donen amb MODS. AixÃ­ que aquests sÃ³n dos dels formats vostÃ¨ pot sortir de l'API. I en el fons, estem mantenint darrere de les escenes en MODS. PerÃ² podem donar-li a MODS i Dublin Core i tota la resta tambÃ©. L'altra consideraciÃ³ quan vostÃ¨ estÃ  buscant en les dades Ã©s que vostÃ¨ pot aconseguir com sigui JSON, que Ã©s sinÃ²nim de JavaScript Object Notation, o XML, el que significa Extensible Markup Language. I aquestes representacions de dades tant tenir exactament les mateixes dades, exactament els mateixos camps. PerÃ² sÃ³n nomÃ©s sintÃ cticament diferent. 

AixÃ­ que aixÃ² Ã©s A-- BÃ©, anem a canviar. AixÃ­ que aquesta Ã©s la nostra consulta per donas en format XML. Si nomÃ©s em canvi que es tracta de JSON, Puc veure que es veu diferent. AixÃ­ que ara aquest Ã©s el mateix contingut, perÃ² una estructura diferent. Hi ha menys parÃ¨ntesis angulars. Hi ha menys detallat. 

I aquest Ã©s un format que, si estan treballant en l'entorn web, vostÃ¨ Ã©s mÃ©s probable va a voler utilitzar perquÃ¨ un de les coses bones de JSON Ã©s Ã©s compatible amb JavaScript. AixÃ­ que si estic escrivint aplicaciÃ³ web, puc tirar en JSON i simplement treballar directament amb ell. Mentre que amb XML, Ã©s un poc mÃ©s complicat. AixÃ­ que de nou, aquests sÃ³n alhora Ãºtil. Ells nomÃ©s sÃ³n diferents casos d'Ãºs on la gent podria voler usar-los. D'acord. AixÃ­ que de tornada a l'API. AixÃ­ que podem buscar la finalitat de: 

Dono un exemple de la recerca de donuts. Podem buscar nomÃ©s en un en particular de camp dins d'aquÃ­. AixÃ­ que en lloc de buscar la totalitat de l'expedient, NomÃ©s puc buscar el camp de tÃ­tol. I pel que ara hi ha 25 coses que tenir donuts en el tÃ­tol, un dels quals Ã©s sobre la restauraciÃ³ aiguamolls en la gestiÃ³ del forat de la rosquilla programa, que Ã©s probablement no necessÃ riament el que estem buscant per quan estem a la recerca de donuts. 

TambÃ© pot, quan estÃ s tractar amb un API-- 

Part d'haver una API estÃ  donant persones l'accÃ©s a grans conjunts de dades. I hi ha un parell diferent eines que pot utilitzar per fer aixÃ². Un d'ells Ã©s, simplement, que pot desplaÃ§ar-se per les dades. AixÃ­ com si vostÃ¨ fa una consulta a travÃ©s d'una interfÃ­cie web, es pot veure a la pÃ gina un, la segona pÃ gina, la pÃ gina tres. VostÃ¨ pot fer el mateix cosa a travÃ©s de l'API. VostÃ¨ nomÃ©s ha de ser explÃ­cit en com ho fa. 

AixÃ­, per exemple, si estic buscant en la meva primera consulta aquÃ­, on jo estic fent una recerca de les coses amb donuts en el tÃ­tol, el que puc dir, i el lÃ­mit Ã©s igual a 20, el que significa dÃ³na'm els primers 20 registres, no el primer 10, que Ã©s el valor per defecte, perquÃ¨ vull mirar a 20 alhora. O el que puc dir, establir el iniciar igual a 20 i el lÃ­mit igual a 20, el que donarÃ  em Registres 21 a 40. 

AixÃ­ que suposo que la cosa per portar aquÃ­ Ã©s que estem fent servir les cadenes de consulta per establir els parÃ metres de la consulta. I et permet el control el que rep. 

Una altra de les eines que pot utilitzar, - 

I aixÃ² Ã©s realment Ãºtil en termes de l'exploraciÃ³ de les dades. 

--Ãs Una cosa anomenada facetat. AixÃ­ el terme facetat Ã©s no necessÃ riament comÃº. PerÃ² tots vostÃ¨s ho ha vist abans. Si fes un cop d'ull a Amazon, per exemple, i vostÃ¨ fa una recerca per donuts en els llibres, aquÃ­ el que tenen una sÃ¨rie de llibres, i que estan agrupats per categoria, i et donen les diferents categories, i el nombre de llibres en cada categoria aparÃ¨ixer. 

AixÃ­ que aixÃ² Ã©s bÃ sicament una faceta. VostÃ¨ pren tots els seus llibres, el 1800 llibres que coincideixin amb feu donaciÃ³ a Amazon. 12 d'ells estan en el categoria d'esmorzar. 21 en pastisseria i fleca, i aixÃ­ successivament i aixÃ­ successivament. 

AixÃ­ que aixÃ² Ã©s realment una eina eina per explorar el contingut dins de la biblioteca, aixÃ­ perquÃ¨ quan ens fixem en una faceta, que et dÃ³na una idea de quins temes existeix, com quins tipus de temes sÃ³n les mÃ©s populars dins del seu conjunt de consultes. I ajuda d'anar-se'n i explorar. Pel que podem fer el mateix. 

Si volem utilitzar el API i mirar facetes, afegim un altre parÃ metre a la nostra amiga la cadena de consulta. AixÃ­ facetes iguals separats per comes llista del que volem en la faceta. AixÃ­ que una de les facetes podria estar subjecte. Un altre podria ser idioma. I pel que si correm aquesta consulta, ens get-- Es veu mÃ©s o menys el mateix aquÃ­. PerÃ² hem afegit al final de la llista d'un conjunt de facetes. AixÃ­ que tenim una faceta anomenada matÃ¨ria. AixÃ­ que aixÃ² ens estÃ  dient que si miro als meus 80 resultats de la consulta d'rosquilla, 13 d'ells tenen la sotmetre Estats Units. Tres tenen els donuts subjectes. Tres tenen el tema de la restauraciÃ³ d'aiguamolls, que pot ser el nostre forat de la dona. Dos d'ells, els Simpsons, i aixÃ­ successivament i aixÃ­ successivament. 

AixÃ­ que aixÃ² pot ser Ãºtil si vostÃ¨ volen reduir la cerca. Pot ajudar a fer aixÃ². Especialment si vostÃ¨ tÃ© mÃ©s de, diguem, 80 resultats. 

De la mateixa manera, tambÃ© demanem de facetes en el llenguatge. AixÃ­ que si ens fixem en els nostres resultats, veiem 76 d'ells estan en AnglÃ¨s, quatre en francÃ¨s, dos a espanyol, dos, crec que aixÃ² Ã©s indefinit o desconegut, holandÃ¨s i llatÃ­. AixÃ­ que crec que l'AmÃ¨rica rosquilla resultat, de nou, no tÃ© res a veure amb els productes forn. PerÃ² cal anar. 

AixÃ­ que aixÃ² Ã©s una espÃ¨cie de mostra que com es pot tirar el contingut de nou de l'API nomÃ©s a travÃ©s de navegador web, la qual cosa Ã©s genial. PerÃ² en realitat no Ã©s el que ho faria normalment utilitzant en API per a aixÃ². AixÃ­ que un exemple de com es en realitat podria fer aixÃ² Ã©s que he escrit un super petit programa, que, de nou, quÃ¨ la cerca rosquilla i seleccioneu un parell de camps i les mostra en una taula. AixÃ­ que aixÃ² Ã©s molt el mateix contingut que acabem de serra amb alguns camps treure. AixÃ­ llista de tÃ­tols, els ubicaciÃ³ del que el llibre estÃ  a punt, l'idioma, i aixÃ­ successivament i aixÃ­ successivament. 

Llavors, com aixÃ² va succeir realment, ja que Crec que hem de mirar una mica de codi, Ã©s-- 

El que tenim aquÃ­ Ã©s un simple HTML La pÃ gina, que mostra el text, la benvinguda al nÃºvol biblioteca i a continuaciÃ³, mostra una taula de resultats. I Ã²bviament no hi ha resultats a la taula quan la pÃ gina es carrega. PerÃ² el que estem fent Ã©s, en primer lloc, que es carrega d'una biblioteca anomenada jQuery, que Ã©s bÃ sicament una biblioteca de JavaScript, que fa molt fÃ cil de manipular JavaScript nativament, HTML i crear pÃ gines web, lÃ²gica del costat del client i pÃ gines web. 

AixÃ­ que el que tenim aquÃ­ Ã©s jQuery tÃ© un mÃ¨tode anomenat Get, que essencialment es destinarÃ  a una URL, que, en aquest cas, Ã©s aquesta URL d'aspecte familiar. I desprÃ©s obtenir el contingut de aquesta URL i executi una funciÃ³ en ell. Llavors vam dir anar a api.lib.harvard / edu. Cerca de donuts. DÃ³na'ns 20 registres. I a continuaciÃ³, executeu aquesta funciÃ³, que He seleccionat, passant-li les dades. I les dades Ã©s la que JSON va aconseguir tornar de l'API. 

I llavors el que estem dient, dins d'aquest dades hi ha un camp anomenat article. I si em vaig fer una ullada enrere en un d'aquests resultats que estÃ  aquÃ­, hi ha alguna cosa called-- 

BÃ©, es diu element. AixÃ­ que pot ser aixÃ². I el que fa Ã©s que passa a travÃ©s de cada element i desprÃ©s crida a un altre funciÃ³ en cada element. I aquesta funciÃ³, bÃ sicament, estÃ  prenent el valor del tema, que Ã©s essencialment el registre individual i ens permet treure el tÃ­tol, la cobertura i l'idioma. 

AixÃ­ que cridem a una funciÃ³ en cada element que tornem de l'API. I si vostÃ¨ acaba de prendre un cop d'ull en aquesta peÃ§a aquÃ­, el que estem fent Ã©s estem creant una cadena, que Ã©s essencialment una mica de marcat HTML al voltant d'una taula, amb value.title, que Ã©s el tÃ­tol de la objecte, value.coverage, que Ã©s la cobertura, - 

I estem fent un xec aquÃ­ per veure qui Ã©s indefinit i ocultar si diu indefinit, perquÃ¨ no estem realment interessats en aixÃ². 

-i desprÃ©s l'idioma. I llavors el que estem fent Ã©s agregant que a la taula que Ã©s identificat per aquesta cadena aquÃ­. I com funciona jQuery Ã©s el que aixÃ² estÃ  dient Ã©s buscar la taula amb idea resultats i afegir text a ell. I aquesta Ã©s la taula amb resultats idea. AixÃ­ que el que vostÃ¨ acaba amb Ã©s aquesta pÃ gina aquÃ­. I per tal de veure source-- BÃ©, la font no Ã©s en realitat actualitzat quan aixÃ² va succeir. AixÃ­ que vostÃ¨ pot veure el real Els resultats de la taula aquÃ­ perÃ². 

AixÃ­ que aixÃ² Ã©s nomÃ©s un exemple simple de fent una consulta molt bÃ sica en contra de l'API i mostrar la informaciÃ³ en algun altre formar, i no fer res massa luxÃ³s. Ara, un altre exemple Ã©s com una solÂ·licitud per escrit per David Weinberger com una demostraciÃ³ d'aixÃ², el que en essÃ¨ncia el que mostra com es pot triturar els resultats que busques rebent de l'API de biblioteca nÃºvol amb, per exemple, Google Books. 

I el pensament aquÃ­ Ã©s que puc executar una consulta a Google Books, obtenir una recerca de text complet, obtenir alguns resultats esquena, esbrinar quin d'aquests articles en realitat existeixen en Hollis, el sistema de biblioteques, i desprÃ©s donar-me enllaÃ§os de nou a aquests articles. AixÃ­ que si jo busco, que era una nit fosca i tempestuosa, em tornar un munt de resultats de Google, i desprÃ©s un dels resultats que Ã©s una arruga en el temps. I aquests sÃ³n els enllaÃ§os als llibres que existeixen dins del sistema de Biblioteca de la Universitat de Harvard. 

AixÃ­ que suposo que el punt aquÃ­ no Ã©s tant que aixÃ² pot o no ser el camÃ­ que desitja per buscar a la biblioteca, perÃ² Ã©s un completament diferent de manera que no estava disponible per a vostÃ¨ abans, com que no tenia manera de fer recerques de text complet en els llibres que fins i tot eren part del sistema de Biblioteca de la Universitat de Harvard. AixÃ­ que ara aquesta Ã©s una manera que vostÃ¨ pot fer aixÃ². I vostÃ¨ pot mostrar-los en qualsevol format que desitgi. AixÃ­ que el punt aquÃ­ Ã©s, bÃ sicament, estem obrint nous camins per a la gent per treballar amb les dades. 

Un altre tros de nÃºvol biblioteca Ã©s que ajuda a exposar algunes de les dades d'Ãºs que la biblioteca tÃ©. AixÃ­ que si vas a la biblioteca, i que estÃ  buscant per als llibres, No necessÃ riament realment tenir una idea de, per a tots els elements d'una tema en particular, el que sÃ³n persones al comunitat, ja sigui definida com Harvard o la paÃ­s o de la seva classe, Â¿QuÃ¨ han trobat mÃ©s Ãºtil? I la biblioteca tÃ© en realitat un tona d'informaciÃ³ sobre el que Ã©s mÃ©s Ãºtil perquÃ¨ si un munt de la gent estÃ  mirant un llibre, que et diu alguna cosa. Hi ha d'haver hagut alguna raÃ³ volen comprovar-ho. Molta gent el va posar en servei. 

Si Ã©s a la llista de reserva per a molts de les classes, que et diu alguna cosa. Si els membres de la facultat estan comprovant que fos molt i estudiants universitaris no sÃ³n, aixÃ² em diu alguna cosa. Viceversa, que tambÃ© et diu alguna cosa. AixÃ­ que seria molt interessant posar aquesta informaciÃ³ per aquÃ­ i deixar persones l'utilitzen per ajudar-los a trobar que funciona dins del sistema de biblioteques. L'altra cara d'aixÃ² Ã©s hi ha una mica de privacitat greu preocupacions perquÃ¨ una de les principis bÃ sics de la biblioteca Ã©s que no estarem dient la gent el que estan llegint altres persones. I fins i tot si vostÃ¨ estÃ  dient aixÃ² llibre va ser desprotegit quatre vegades en un mes determinat, que podrien utilitzar- vincular de nou a un particular, persona per les dades de-anonimat i descobrir que el va obtenir. AixÃ­ que la forma en quÃ¨ podem avoid-- La forma en quÃ¨ podem tractar d'extreure algun senyal de tota la informaciÃ³ sense infringir preocupacions sobre la privacitat de ningÃº Ã©s essencialment mirem 10 anys de dades d'Ãºs, - 

AixÃ­ que Ã©s durant un llarg perÃ­ode de temps. 

--i diuen, OK, anem a veure com moltes vegades es va utilitzar aquest treball, i per que en aquest perÃ­ode de temps, i desprÃ©s bÃ sicament retornar un nombre, el que anomenem una puntuaciÃ³ de pila, que, bÃ sicament, representa la quantitat que ha estat utilitzat. I aixÃ² number-- Hi ha gran quantitat de cÃ lculs entrar en aquest nombre. --perÃ² que Ã©s una molt aspra mÃ¨trica que li dÃ³na una idea de com el comunitat pot valorar aquest treball. 

I pel que un altre tipus de fins mÃ©s concretar aplicaciÃ³ que s'aprofita d'aixÃ² Ã©s una cosa Stacklife trucada, que Ã©s en realitat disponible a travÃ©s de la principal Harvard Portal de la Biblioteca. AixÃ­ que vas a library.harvard.edu. VostÃ¨ veurÃ  un nombre de diferents maneres de buscar la biblioteca. I un d'ells es diu Stacklife. 

I aquesta Ã©s una aplicaciÃ³ que busca el contingut de la biblioteca, sinÃ³ que estÃ  completament construÃ¯t a la part superior d'aquestes API. AixÃ­ que no hi ha coses especials passant darrere de les escenes. No hi ha accÃ©s a dades que no hi ha. Es tracta d'utilitzar les API per proporcionar amb una navegaciÃ³ completament diferent experiÃ¨ncia. 

AixÃ­ que si jo busco Alice in Wonderland en aquest cas, Obtinc un resultat que sembla aixÃ², la qual cosa Ã©s bastant molt-- 

Ãs molt similar a qualsevol altra cerca vostÃ¨ pot fer, excepte en aquest cas estem classificant els elements per stackscore, que li dÃ³na una idea del popular que aquests articles estaven dins de la comunitat. I amb tanta claredat, AlÃ­cia al PaÃ­s de les Meravelles per Walt Disney Ã©s molt popular. PerÃ² tambÃ© es pot veure als quatre primers aquÃ­ sÃ³n les que vostÃ¨ pot ser que no actually-- 

Les coses que sÃ³n molt utilitzats, perÃ² no pots immediatament connectar amb AlÃ­cia al PaÃ­s de les Meravelles. AixÃ­ que el nostre vell amic el AlÃ­cia anotada Ã©s aquÃ­. AixÃ­ que puc tenir una mirada en ella. I ara el que estic buscant en Ã©s bÃ sicament un conjunt de-- Puc tenir la Anotat Alice aquÃ­. Tinc informaciÃ³ al respecte. I tambÃ© tinc un stackscore de, en aquest cas, 26. I aixÃ² em diu espÃ¨cie d'aproximadament com hem arribat a aquesta stackscore, com que l'hagi facturat a terme, com la forma moltes vegades es marxem, com a professors o estudiants de llicenciatura, com moltes cÃ²pies de la biblioteca tÃ©, i aixÃ­ successivament i aixÃ­ successivament. 

I vostÃ¨ pot tambÃ©, prou interessant aquÃ­, revisar les piles de forma virtual. AixÃ­ que les dades aquÃ­, aquesta li estÃ  mostrant espÃ¨cie d'una representaciÃ³ virtual del que el poder prestatge veurÃ  com si anÃ©s a prendre tots els fons de la biblioteca i posar-los junts en un prestatge infinit. I el millor Ã©s que can-- 

En primer lloc, la metadades sobre aquests llibres sovint li diu quan es va publicar. Se li indica el nombre de pÃ gines que tÃ©. Podria dir-te les dimensions. AixÃ­ es pot veure que es reflecteix aquÃ­ en termes de la mida dels llibres. 

I llavors podem utilitzar el apilar puntuaciÃ³ per destacar els llibres que tenen puntuacions mÃ©s alts de la pila. AixÃ­ que si Ã©s mÃ©s fosc, vol dir que, presumiblement, s'utilitza amb mÃ©s freqÃ¼Ã¨ncia. AixÃ­ que en aquest cas, estic suposarÃ  que aquest Ã©s la versiÃ³ d'AlÃ­cia al PaÃ­s de les Meravelles que s'utilitza amb molta freqÃ¼Ã¨ncia i mÃ©s visitada, la biblioteca tÃ© la majoria de les cÃ²pies de. AixÃ­ que si vostÃ¨ estÃ  buscant per AlÃ­cia al paÃ­s de les meravelles, aixÃ² podria ser un bon lloc per comenÃ§ar. 

I llavors aquÃ­ tambÃ© es pot vincular a terme a, diguem, Amazon per comprar el llibre, i aixÃ­ successivament i aixÃ­ successivament. El punt aquÃ­, de nou, no Ã©s tant que aquesta Ã©s la millor manera d'explorar la biblioteca o l'eina adequada per a cada ocasiÃ³. PerÃ² Ã©s una altra manera de fer-ho. I pel que les dades disponible a travÃ©s d'una API, que estÃ  fet de blocs de construcciÃ³ molt simples, que li permet buscar en el contingut, vostÃ¨ pot construir alguna cosa com aquest que pot ser extraordinÃ riament valuosa per a algunes persones. 

AixÃ­ que aixÃ² Ã©s mÃ©s o menys, tant com jo vull dir realment sobre el que Ã©s l'API i el que s'exposa, hi ha un conjunt munt de coses darrere de les escenes, que Jo nomÃ©s vaig a tocar en breu nomÃ©s perquÃ¨ Ã©s una espÃ¨cie de tracta en aquest des d'un angle completament diferent a termes de com fa alguna cosa com aixÃ² arribar a posar al seu lloc? 

AixÃ­ una API Ã©s un estÃ ndard interconnectar a tot aquest contingut. PerÃ² per arribar-hi, el El primer que havÃ­em de fer va ser reunir informaciÃ³ de llibres i imatges i els instruments de descripciÃ³, la colÂ·lecciÃ³ document de diversos sistemes de Harvard. Aleph, VIA, i OASIS sÃ³n els noms dels sistemes. I essencialment entren en un oleoducte, una canonada de processament. 

AixÃ­, en primer lloc, tenim l'exportaciÃ³ arxius de tots aquests sistemes. Nosaltres els dividim en elements individuals. AixÃ­ que tenim un arxiu, que Ã©s d'un gigabyte, que compta amb un miliÃ³ de discos al mateix. AixÃ­ que dividir-lo en elements individuals. DesprÃ©s, per a cada article, el convertim en MODS, perquÃ¨ alguns d'ells sÃ³n MODS nativa, alguns d'ells no ho sÃ³n. AixÃ­ que tots arribem a estar en el mateix format. DesprÃ©s hi ha diversos passos d'enriquiment, on afegim mÃ©s informaciÃ³ a les dades que estava disponible a la biblioteca. AixÃ­ que hem d'afegir, en primer lloc tenim el que les biblioteques han de. Anem a travÃ©s d'un pas de el cÃ lcul de la stackscore. Anem a travÃ©s d'un pas de l'addiciÃ³ de mÃ©s metadades en termes del que la gent colÂ·leccions podria haver afegit esto-- 

Les persones estan creant colÂ·leccions d'articles. QuÃ¨ colÂ·leccions tambÃ© us pertany? Com han etiquetat persones aquest contingut en el passat? A continuaciÃ³, filtrar, i es restringeix els registres, ja que, com he esmentat, hi ha alguns registres que, a causa de raons de drets d'autor, no podem mostrar. I desprÃ©s ens carregarem en una cosa anomenada Solr, que no Ã©s una falta d'ortografia, perÃ² Ã©s el nom d'una peÃ§a de programari que fa la recerca d'indexaciÃ³, que impulsa tota la recerca darrere de l'API. I llavors es torna disponible per les API, i les persones poden utilitzar-lo. 

AixÃ­ que aixÃ² Ã©s com una justa procÃ©s senzill. Un dels interessant coses sobre ell Ã©s que es tracta amb 13 milions de discos i estarem tractant o mÃ©s. I volem ser capaÃ§os de manejar aquests d'una manera relativament rÃ pida. Es necessita molt de temps per processar 13 milions de registres. 

Llavors, com aquesta canonada Ã©s establir Ã©s que can-- Suposo que l'avantatge de la canonada, el problema que estem tractant de resoldre aquÃ­, Ã©s que totes les transformacions, tot aquests passos d'aquest canonada sÃ³n separables. No hi ha dependÃ¨ncia. Si vostÃ¨ estÃ  processant un registre d'un llibre, no hi ha dependÃ¨ncia en que entre l'altre llibre. 

AixÃ­ que el que podem fer Ã©s, bÃ sicament, en cada pas de la canonada, el posem en una cua en el nÃºvol. Em va passar a ser a Amazon Web Services. AixÃ­ que hi ha una llista de, dir, 10.000 articles que necessita ser normalitzat i convertits a format MODS. I fem girar el major nombre de servidors com volem, potser 10 servidors. I cada un d'aquests servidors nomÃ©s senti allÃ , es veu en aquesta cua, veu que n'hi ha un que necessita ser processada, la desenganxa de la cua, processa i pals en la segÃ¼ent cua. 

I aixÃ­ el que ens permet de fer Ã©s aplicar, en essÃ¨ncia, tant de maquinari com volem a aquesta problema per a un perÃ­ode molt curt de temps per processar les dades tan rÃ pidament com possible, que Ã©s una cosa que nomÃ©s, ara en el mÃ³n de la computaciÃ³ en nÃºvol podem els servidors de provisiÃ³ essencialment instantÃ niament, Ã©s que Ãºtil. AixÃ­ que no has de tenir un servidor gegant asseguts al voltant tot el temps per fer el processament que podria passar nomÃ©s una vegada a la setmana. 

AixÃ­ que Ã©s sobretot aixÃ². Hi ha documentaciÃ³ disponible per al nÃºvol Biblioteca API d'article en aquesta direcciÃ³, el que farÃ  estarÃ  disponible mÃ©s endavant. I si us plau anar a prendre un cop d'ull a a veure si hi ha alguna cosa, vostÃ¨ tÃ© alguna idea. Juga amb ella. Perdre el temps. I espero que vostÃ¨ pot venir amb alguna cosa gran. GrÃ cies.