Jeffrey Licht: Hi tie. Mi estas Jeffrey Licht. Kaj mi estas ĉi tie por paroli al vi pri la Harvard Biblioteko kaj konstruaĵo morgaŭa biblioteko hodiaŭ, mi supozas. Do la fono tie, la tonalton por tiu sesio Estas esence, ke ekzistas multan bibliografiaj datumoj disponebla en la Harvard bibliotekoj. Kaj tie estas ŝanco, tra iu de la iloj kaj projekto kiu estas gestando, por akiri aliron al la informoj kaj prenu al lokoj kiujn la Harvard Biblioteko ne faras nun, fari novajn aferojn kun ĝi, eksperimento kaj amuziĝu per ĝi. Do la enirpunkto en tiu estas API nomita la Harvard Biblioteko Cloud, kiu estas malferma metadatuma servilo, kiun mi parolos de nun. Do la fono estas ke ekzistas multe da taskoj en la Harvard biblioteko. Ni havas super 13 milionoj bibliografiaj registrojn, milionoj de bildoj, kaj miloj de trovanta helpojn, kiuj estas esence dokumentoj priskribante kolektoj, dirante kion estas en ili, skatoloj de paperoj ks kiuj reprezentas super miliono individuaj dokumentoj. Kaj tie estas ankaŭ multe da informon kiun la biblioteko havas pri kiel la enhavo estas uzita ke povus esti de intereso al homoj kiuj volos labori kun ĝi. 

Do ĉiuj la informo la biblioteko havas metadatos. Do metadatenoj datumoj pri datumoj. Do kiam oni parolas pri la informo tio disponebla tra la biblioteko nubo kiu estas havebla, ĝi estas ne nepre la realaj dokumentoj sin, ne nepre la kompleta teksto de libroj aŭ la plena bildoj, kvankam tio efektive povas esti la kazo. Sed estas vere informojn pri la datumoj. 

Do vi povas pensi pri katalogado informo, alvoko nombroj, temoj, kiom da kopioj de la libro estas, kio estas la eldonoj, kiuj estas la formatoj, la aŭtoroj, ks. Do tie estas multa informo pri la informoj en la kolekto kiu, en si mem, estas speco de propre utila. Kaj kvankam se vi estas faranta detala esploro, vi evidente deziras akiri al la efektiva kontentigi sin kaj rigardas la datumojn, la metadatenoj utila en terminoj de ambaŭ analizante la tekstaro kiel tuto, kiel kion aĵoj estas en la kolekto. Kjel rilatigas? Ĝi helpas vin vere trovi aliajn aĵojn, kiu estas vere la ĉefa celo de ĝi. La punkto de la pridatumon kaj la katalogo estas helpi vin trovi ĉiujn la informo tio disponebla ene la kolektoj. 

Do tiu estas ekzemplo de metadatenoj por libro en la Harvard Biblioteko. Do estas tie. Kaj vi povas vidi ĝin estas vere modere kompleksa. Kaj parto de la valoro de metadatenoj ene de la Harvard Biblioteko sistemo estas ke jam pasis speco de ekkonstruis catalogers kaj ensamblados por homoj aplikanta multan sperton kaj lertecon kaj intencis ĝin super tempo, kiu havas multan valoron. 

Do se vi prenas rigardi ĉi rekordon La Prinotis Alice, vi povas elŝeligi vi havas la titolo, kiu verkis ĝin, la aŭtoro, kaj ĉiuj malsamaj temoj kiuj homoj katalogis ĝin. Kaj vi povas vidi tie estas ankaŭ, en Krom multajn bonajn informojn tie, tie estas kelkaj duplikaton. Tie estas multa complejidad tio reflektita tra la metadatuma ke vi havas. 

Do unu titolo de tiu libro estas La aventuroj de Alicio en Mirlando. Do tiu estas acotado versio de tiu libro. Sed gxi ankaux nomis La Prinotis Alicia, Alicia Aventuroj in Wonderland ĉar ĝi estas io kion Martin Gardner skribis kaj prinotita la libro. Kaj tie estas multa granda informo pri logiko enigmoj kaj aĵoj ene Alico ke vi probable ne scias pri. Do vi iru legi ĝin. 

Sed vi povas vidi ke estas multa detalo tie, inkludante ensalutiloj, kiam estis kreita, kie ĝi devenas; en terminoj de la Harvard sistemo, kaj tiel antaŭen. Do ĉi tiu estas specimeno de la tipon de metadatos ke vi povus vidi por libro en la Harvard Biblioteko kolekto. 

Tio estas io tute alia. Do tie estas nomita sistemo VIA Harvard, kiu esence estas katalogante bildoj kaj celoj de arto kaj vida aferoj tra Harvard, kaj aldonante iuj metadatuma al ili, klasifikante ilin, kaj, en iuj kazoj, havigante malgranda bildeton bildoj ke vi povas preni rigardi, se vi tiel deziras. 

Do ĉi tio estas ekzemplo de la metadatuma ke vi havas por telero de, supozeble, Alice in Wonderland. Kaj vi povas vidi ke estas malpli metadata tie. Estas nur alia speco de objekto. Kaj do tie estas malpli da informo. 

Vi plejparte konas la fakton ke, alvoko nombro, esence kiuj kreis ĝin, - 

Ni ne scias kiam ĝi estis kreita. 

--and titolo. 

Alia ekzemplo. Jen trovo helpo. Do tie estas kolekto de Lewis Carroll paperojn ĉe Harvard. Do tiu priskribas kio Estas en tiu kolekto. Do iu pasis por kaj rigardis tra ĉiuj skatoloj kaj katalogis, donitaj iuj fono skribita resumon de kio estas tie. Kaj se vi volus rigardi plu je tio, tiu daŭrigas por paĝoj kaj paĝoj kaj paĝoj, sed anoncos al vi kio leteroj kaj kion datoj de kio skatoloj ekzistis tuta kolekto. Sed tio estas io ke, se vi estas ĉe Harvard, vi povas iri kaj fakte fizike rigardu supren kaj, supozeble, rigardu. 

Do tiu estas tuta granda. Ĉi metadatuma la utilaj. Ĝi estas en la Harvard Biblioteko sistemo. Estas iloj en linio kie vi povas iri kaj preni rigardi ĝin, kaj vidos kaj esplori gxin. Kaj vi povas tranĉi ŝin kaj ĵetkubo ĝi en multaj malsamaj manieroj. 

Sed estas vere nur havebla se vi estas homo sidiĝinte je via retumilo aŭ ion aŭ via telefono kaj navigi tra ĝi. Tio ne vere disponebla en ĉia uzebla modo por aliaj sistemoj aŭ aliajn komputilojn por uzi, Ne kun sistemoj ene la Harvard Biblioteko, sed sistemoj en la ekstera mondo, nur aliaj homoj ĝenerale. Do la demando estas, kiel oni povas fari ŝin disponebla por komputiloj tiel ke ni povas fari pli interesa stuff kun ĝi ol nur navigacio ĝi mem? 

Do kial oni volus fari tion? Ekzistas multe da ebloj. Unu estas vi povis konstrui tute malsame de navigacio la enhavo kiu estas havebla tra la Harvard Bibliotekoj. Mi montros al vi unu poste nomita Stacklife, kiu havas tute alian alpreni serĉas enhavo. 

Vi rajtas konstrui rekomendo motoro. Do Harvard Biblioteko ne estas en la negoco de diri, ke vi ŝatas ĉi libro. Tiam iru rigardu tiujn 17 aliaj libroj kiujn oni povus esti interese aŭ tiuj 18 aliaj bildoj. Sed tio certe povus esti valora trajto. Kaj donita la metadatenojn, eble eblos meti ke kune. Vi povus havi malsamajn bezonojn en Kondiĉoj de serĉanta la enhavo, kiel eble malgraŭ la iloj kiuj estas haveblaj ke la biblioteko faras disponebla, vi eble volas serĉi en alia maniero aŭ optimizar por aparta uzo kazo, kiu eble estas tre specialigitaj. Eble tie estas nur kelkaj homoj en la mondo kiuj volas serĉi la enhavon tiamaniere, sed estus granda se ni povis lasi ilin fari tion. Tie estas multa analytics en kiom homoj uzi la enhavo kiu estus vere Interese scii pri, eltrovi kio libroj estas uzitaj, kio ne estas, kaj tiel antaŭen. Kaj tiam tie estas multa ŝanco integri kun aliaj informoj ke estas ekstere tie en la reto. Do ni have-- 

Ekzemple, NPR havas libron recenzo segmento, kie intervjui aŭtoroj pri libroj. Kaj tiel estus granda se vi estis suprenrigardinte libron en Harward Biblioteko, kaj vi diras, bone, ekzistas estis intervjuo kun la aŭtoro. Ni iru rigardu tion. Aux tie estas Vikipedia paĝo, kiel aŭtoritata, fak referenco pri tiu libro, ke vi eble volos rigardu. 

Ekzistas tiuj tipoj de fontoj ekzistas tra la retejo. Kaj alportante ilin kune povus esti granda uzo al iu rigardante la enhavo, serĉas ion. Sed estas ankaŭ ne la Ion tian oni kredus volas la biblioteko esti respondeca por subiro kaj ĉasas sube ĉiuj tiuj malsamaj fontoj kaj ŝtopanta ilin kune ĉar ili ŝanĝas senĉese. Kaj kion ili pensas estas grava majo Ne estu kion vi opinias estas grava. 

Kaj eĉ pli, esence estas multe da taskoj ni ne pripensis ankoraŭ. Do se ni povas malfermi tiu supre, pli homoj krom duona dekduo aŭ tiel, kiu estas rigardanta ĉi sur regula bazo povas pensi de ideoj kaj masaĝi la datumojn, kaj fari kion ili volas kun ĝi. 

Do ni volas fari ĉi disponeblaj datumoj por la mondo. Nu, estas kelkaj aliaj komplikaĵoj. Unu estas tiu ĉi metadatuma estas en malsamaj sistemoj. Ĝi estas en malsamaj formatoj. Do tie estas kelkaj normaligo kio devas okazi, kiu normaligo estante la procezo de alportante aferojn el malsamaj formatoj kaj surĵeto ili al unuopa formato tiel ke la kampoj, kongruos supren. 

Estas iuj kopirajto restriktoj. Por stranga kiu similas, la katalogo eniro pri libro estas tia ke por kopirajto. Do kvankam estas nur informo derivita de la libro, ĝi estas copyrightable. Kaj dependante de kiu reale kreis tiun metadatenojn, povas ekzisti restriktoj sur kiuj povas distribui ĝin, simila to-- 

Mi ne scias. Ĝi povas aŭ ne esti simila al la situacio de la Kanzontekstoj, ekzemple. Do ni ĉiuj scias ke sukcesos. Do vi devas akiri ĉirkaŭ tiu temo. 

Kaj tiam alia peco estas ke restas multa de datumoj. Do se mi estas iu kiu volas labori kun la datumoj aŭ havas malvarmeta ideo, kontraktanta kun 14 milionoj registroj sur mia tekkomputilo povus esti problema kaj malfacila de manipuli. Do ni volas redukti la barojn por homoj por povi labori kun la datumoj. 

Do la enfokusigu ke espereble adresoj ĉiuj tiuj maltrankviloj estas du partoj. Unu konstruas platformon kiu prenas datumoj de ĉiuj tiuj pafas fontoj kaj pligravigas ĝin, normaligas, riĉigas ĝin, kaj ĝi faras disponebla en sola loko. Kaj ĝi faras ĝin havebla tra publika API kiu homoj povas nomi. 

Do API estas apliko Programado interfaco. Kaj ĝi esence raportas al finpunkton kiu sistemo aŭ teknologion povas nomi kaj ricevi datumojn reen en strukturitan formaton en maniero ke ĝi povas esti uzita. Do estas ne dependa sur irante al retejo kaj skrapita datumoj ekstere de ĝi, ekzemple. 

Do tiu estas la ĉefa paĝo de la Biblioteko Nubo Item API, kiu estas esence lia versio du. Do estas la dua ripeto de provante fari ĉion ĉi datumoj disponebla por la mondo. Do estas http://api.lib.harvard.edu/v2/items. Kaj ĝuste por rompi ĉi malsupren iomete, kio tio signifas estas kiu klopodas version du el la API. Ekzistas versio, kio Mi ne iras paroli. Sed tie estas versio unu. 

Kaj se vi vokas ĉi API, vi ricevas erojn. Kaj parto de la ideo de API estas API estas kontrakto. Estas iu kiu estas ne tuj ŝanĝos. Do ekzemple, - 

Kaj la kialo estas ke se mi konstrui ian sistemon kiu tuj uzos biblioteko nubo API por montri librojn aŭ helpi homojn trovi informo unikan, kion ni ne volas okazi estas por ni iri ŝanĝi kiom ke API funkcias, kaj subite ĉiu rompas sur la uzanto fino flanko. Do parto de se vi faras API disponebla por la mondo, estas bona praktiko meti versia numero en ĝi sekve homoj scias kion versio ili estas kontraktanta kun. 

Do se ni decidas nin trovi pli bonan manieron fari ĉi tiun informon havebla, ni povus ŝanĝi tion al nomas tiun version tri. Do ĉiuj kiuj estas ankoraŭ uzanta Versio du, kiuj tion ankoraŭ funkcios. Sed version tri farus havas ĉiuj novaj ajxoj. 

Do tiu estas API, sed ĉi vere aspektas kiel URL. Kaj tiel kion ĉi estas Ekzemplo de tio estas kion estas nomata resto API, kiu estas disponebla super nur regula retejo konektiĝi. Kaj vi povas reale iru al ĝi en retumilo. 

Do jen mi ĵus malfermis Firefox kaj iris al api.lib.harvard.edu/v2/items. Kaj do kion mi alvenas tie estas baze la unua paĝo de rezultoj de la tuta aro de aĵoj kiujn ni havas. Kaj estas tie en XML formato. Kaj ĝi estas ankaŭ prettified per Firefox. Ĝi fakte ne havas ĉiujn tiujn iom pligrandigante kaj kontrakti doohickeys tie. Tiu estas speco de agrabla versio maniero rigardi ĝin. 

Sed kion tiu diras al ni estas Mi petis ciujn erojn. Do estas 13.289.475 erojn. Kaj mi rigardis la unuajn 10, startanta je pozicio nulo ĉar en komputiko Ni ĉiam komencas je nulo. Kaj kion mi havas ĉi tie, se mi ĝuste kolapsos tiu, vi vidos mi havas 10 erojn. 

Kaj se mi rigardu artikolon, mi povas vidi ke mi havas informon pri tio. Kaj tiu estas en kio nomas Mods formo. Kaj tial Mi iras ŝanĝi reen tie dum momento. Akcepti. 

Do ni serĉu ion en specifaĵoj ĉar la unua ítem kiu okazas veni supren kiam vi rigardas tra la tuta kolekto estas, por difino, hazarda. Do ni serĉas iun kringojn. Oh. 

Akcepti. Do kringojn. Do ni trovis estas 80 artikoloj en la kolekto kiu referenco kringojn. Ni soifas je la unuaj 10 el ili. Nun, vi povas vidi ĉi tie la vojo ke Mi diris Mi serĉas benjetoj, Mi ĵus aldonis ion al la informpeto kordoj de la URL. Do q egalas benjetoj, kiun vi povas vidi iom pli facile ĉi tie. 

Kaj ĉi esence signifas ke estas oni specifon por la API, kiu difinas kion ĉiuj tiuj parametroj signifi. Kaj tiu signifas ni tuj serĉi ĉion por benjetoj. 

Do la unua listero tie ni havas vi povas vidi la titolon estas Donuts, kaj okazas subtitolon nomita An Amerika Pasio, kiu estas, mi supozas, taŭga. Ekzistas multe de different-- Unufoje vi akiras al la punkto de prenanta la datumoj, ekzistas multaj malsamaj formatoj kiu vi povas akiri ĝin en. Kaj ekzistas malsamaj fortoj kaj malfortojn por ĉiuj el ili. Do ĉi tiu, vi povas vidi tie, ĉi tiu formo estas tre riĉa. Kaj ĝi estas normigita. 

Do ekzistas specifa titolo kampo, subtitolo kampo. Ekzistas alterna titolo, An American Pasio. Tie estas la nomo asociita kun ĝi. Tipo de la rimedo estas teksto. Tie estas multa informo tie en tiu formato. 

Sed estas faskon de malsamaj formatoj. Do kion ni ĵus rigardante estas formato nomata mods, kiu staras por Metadatumoj Objekto Priskribo Servo, potenciale. Mi fakte ne tute certa pri la S. Sed estas sufiĉe kompleksa formato. Estas la defaŭltan formaton. 

Sed estas la unu kiu subtenas la riĉeco de ĉiuj datumoj ke la biblioteko havas ĉar ĝi estas tre proksima al kio la biblioteko uzas interne. Estas normo kiu estas uzita tra la lando, trans la mondo en akademiaj bibliotekoj. Kaj estas tre interoperables. Do se vi hvas dokumenton kiu estas en mods formato, Vi povas doni tiun al aliulo kies sistemoj kompreni mods, kaj ili povas importi ĝin. Do ĝi estas normo. Ĝi estas tre bone difinitaj, tre specifa. Kaj tio estas kion lin faras interoperables ĉar se iu diras, ĉi estas la alternativa titolo de rekordo, ĉiuj scias kion tio signifas. Sur la flip flanko, estas tre komplika. 

Do se vi zorge ĉe tiu rekordo tie, se Mi nur volas ricevi la titolo de la dokumento, de tiu libro, kiu estas probable Donuts, Usona Pasio, sintaksanalizi ĝin estas iom implikita. Dum kiu estas alia formato nomita Dublin Core, kio estas multe, multe pli simpla formato. 

Kaj tial vi vidas tie, ne estas titolo, subtitolo, alterna titolo. Tie estas nur la titolo, Benjetoj, An American Pasio, kaj alia titolo, usona Pasio. Do kiam vi serĉas je kio formo vi volas ricevi la datumoj el, multe dependas de kiel vi tuj uzas ĝin. Ĉu vi uzas por interoperabilidad aŭ ĉu vi volas ion simplan ke povus esti pli simpla al laboro kun? 

Sur la flip flanko, multe de la detaloj get ia squished suben. Vi povus perdi la nuancojn de kio aparta kampo pere se vi kontraktanta kun Dublin Core, kion vi ne alvenus kun mods. Do tiuj estas du el la formatoj vi povas akiri el la API. Kaj esence, ni tenas ĝi malantaŭ la scenoj en mods. Sed ni povas doni vin en mods kaj Dublin Core kaj ion ajn tiel. La alia konsidero kiam vi serĉas en la datumoj estas vi povas akiri ĝin kiel ĉu JSON, kio staras por JavaScript Objekto Skribmaniero, aŭ XML, kio signifas Extensible Markup Language. Kaj ĉi tiuj datumoj reprezentoj ambaŭ havas ekzakte la samaj datumoj, ekzakte la samaj kampoj. Sed ili estas nur sintakse malsamaj. 

Do tiu estas a-- Nu, ni nur ŝanĝi. Do jen nia konsulto por benjetoj en XML formato. Se mi simple ŝanĝi ĉi tion al esti JSON, Mi povas vidi tion aspektas malsamaj. Do nun tiu estas la sama enhavo, sed malsama strukturo. Estas malpli angulajn krampojn. Ekzistas malpli parolema. 

Kaj tiu estas formato kiu, se vi laboras en la retejo medio, vi plej verŝajna iri voli uzi ĉar oni bonegan manĝaĵon pri JSON estas ĝi estas kongrua kun JavaScript. Do se mi skribas ttt app, mi povas tiri en JSON kaj simple labori kun ŝi rekte. Dum kiu kun XML, estas Iomete pli komplikita. Do denove, ĉi tiuj estas ambaŭ utila. Ili simple estas malsamaj Uzkazoj kie homoj povus deziri uzi ilin. Akcepti. Do reen al la API. Do ni povas serĉi for-- 

Mi donu ekzemplon de sercxas kringojn. Ni ankaŭ povas serĉi nur en aparta kampo ene tie. Do anstataŭ serĉado la tutan rekordon, Mi povas nur esplori la titolo kampo. Kaj tiel nun ekzistas 25 aferojn havi benjetoj en la titolo, unu el kiuj temas pri restarigi malsekejoj en demarŝo de la truo en la Donut programo, kiu estas probable ne nepre kion ni serĉas cxar kiam ni serĉas kringojn. 

Vi povas ankaŭ, kiam vi estas kontraktanta kun API-- 

Parto havi API donas homo aliro al grandaj datenaroj. Kaj estas kelkaj malsamaj iloj vi povas uzi por fari tion. Unu estas, tre simple, vi povas paĝo tra la datumoj. Do kvazaŭ vi faras konsulto tra ttt interfacon, vi povas rigardi paĝo unu, paĝo du, paĝo tri. Vi povas fari la saman aĵon tra la API. Vi nur bezonas esti eksplicita en kiel vi faras ĝin. 

Do ekzemple, se mi serĉas CXe mia unua konsulto tie, kie mi faras serĉon por aĵoj kun benjetoj en la titolo, mi povas diri, kaj limo egalas 20, kiu signifas donu al mi la unuajn 20 rekordoj, ne la unuaj 10, kiu estas la standarda ĉar mi volas rigardi 20 samtempe. Aŭ mi povas diri, almetis la komenci egala al 20 kaj limo egalas 20, kiu donos mi registras 21 tra 40. 

Do mi supozas ke la afero forpreni tie estas ke ni uzante la informpeto kordoj agordi parametrojn de la mendo. Kaj ĝi permesas kontrolo kion vi reiri. 

Alia ilo ke vi povas uzi, - 

Kaj tiu estas vere helpemaj en Kondiĉoj de esplori la datumojn. 

--is iun nomita senton. Do la termino senton estas ne nepre komunaj. Sed vi cxiuj vidis lin antaŭe. Se vi rigardu Amazon, ekzemple, kaj vi fari serĉon por benjetoj en la libroj, tie ili havas serion de libroj, kaj ili estas kolektitaj de kategorio, kaj vi ricevos la malsamaj kategorioj, kaj kiom da libroj en ĉiu kategorio montri supren. 

Do tiu estas esence faceto. Vi prenu cxiujn siajn librojn, la 1.800 librojn kiuj kongruas benjetoj en Amazon. 12 el ili estas en la matenmanĝo kategorio. 21 en kukvendejo kaj bakado, kaj tiel plu kaj tiel antaŭen. 

Do tiu estas vere utilaj ilo por esplori la enhavon ene de la biblioteko tiel ĉar kiam vi rigardas faceto, ĝi donas al vi ideon de kio temoj Ekzistas, kiel kio tipo de temoj estas la plej popularaj inter viaj informpeto aro. Kaj ĝi helpas vin marŝi kaj esplori. Do ni povas fari la samon. 

Se ni volas uzi la API kaj rigardi facetoj, Ni aldonu alian parametron al nia amiko la informpeto kordo. Do facetoj egalas komo disigitaj lerta de kion ni volas faceto plu. Do unu el la facetoj povas esti subjekto. Alia povus esti lingvo. Kaj do se ni kuras tiu konsulto, ni get-- Ĝi aspektas preskaux la samo tie. Sed ni aldonis al la fino de la lerta aro de facetoj. Do ni havas faceto nomita temo. Do tiu diras al ni, ke se mi aspektas ĉe miaj 80 rezultoj el la benjeto konsulto, 13 el ili havas la submeti Usono. Tri havas la temon kringojn. Tri havi la temo de humidejoj restarigo, kiu eble estas nia truo en la benjeto. Du el ili, La Simpson, kaj tiel plu kaj tiel antaŭen. 

Do ĉi povas esti utila se vi volas mallarĝigi malsupren vian serĉon. Ĝi povas helpi vin fari tion. Speciale se vi havas pli ol, diras, 80 rezultojn. 

Simile, ni ankaŭ demandas por facetojn sur lingvo. Do se ni rigardas niajn rezultojn, ni vidos 76 de ili estas en la angla, kvar en la franca, du en la hispana, du, mi kredas ke tio estas nedefinita aŭ nekonata, nederlanda kaj latina. Do mi kredas ke la latina benjeto rezulto, denove, havas nenion komunan kun bakis varoj. Sed vi iru. 

Do ĉi tiu estas speco de montrante vin kiom vi povas tiri la enhavo reen el la API nur tra retumilon, kiu estas granda. Sed ne estas vere kion vi farus kutime estos uzante en API por ĝi. Do unu ekzemplo de kiel vi povus reale faras ĉi estas mi havas skribita super malgranda programo, kiu, denove, kio mia Donut serĉo kaj selektas paron kampoj kaj vidigas ilin en tabelo. Do tiu estas tre multe la sama enhavo kiun ni ĵus segilo kun kelkaj kampoj eltiris. Do liston de titoloj, la situo de kio la libro estas pri, la lingvo, kaj tiel plu kaj tiel antaŭen. 

Do kiel tio fakte okazis, ĉar Mi supozas ke ni devas rigardi iom da kodo, is-- 

Kion ni havas tie estas simpla HTML paĝo, kiu montras la tekston, bonvenigi al biblioteko nubo kaj tiam montras tabelon de rezultoj. Kaj ekzistas evidente ne rezultigas la tablo kiam la paĝo ricevas ŝarĝita. Sed kion ni faras Estas, antaŭ ĉiu, ni estas ŝarĝante biblioteko nomita jQuery, kiu estas esence JavaScript biblioteko, kiu faras tre facile manipuli Ĝavoskripto denaske, HTML, kaj krei retpaĝojn, kliento-flanko logiko kaj retpaĝojn. 

Do kion ni havas ĉi tie estas jQuery havas metodo nomata Akiri, kiuj esence iros URL, kiu, en tiu kazo, Estas ĉi familiara rigardante URL. Kaj tiam akiri la enhavo de ke URL kaj poste ekzekuti funkcio sur ĝi. Do ni diris iru api.lib.harvard / edu. Serĉi kringojn. Donu al ni 20 registroj. Kaj poste ekzekuti ĉi tiu funkcio, kiun Mi jam selektis, pasante lin la datumoj. Kaj la datumoj estas la JSON ke got revenis de la API. 

Kaj tiam ni diras, ene de tiu datumoj ekzistas kampo nomita listero. Kaj se mi iros tuj iri reen en unu el ĉi tiuj rezultoj kiuj estas tie ĉi, estas io called-- 

Nu, ĝi nomiĝas listero. Tiel ke eble estas tiel. Kaj kion ĝi faras estas ĝi iras tra ĉiu listero kaj tiam alvokas alian funkcio sur ĉiu ero. Kaj tiu funkcio esence prenas la valoron de la listero, kiu estas esence la individuo rekordo kaj kiu nin permesas eltiri la titolo, la kovrado kaj la lingvo. 

Do ni nomas funkcio sur ĉiu listero ke ni revenis de la API. Kaj se vi nur rigardu je ĉi tiu peco dekstra tie, kion ni faras estas ni kreante kordoj, kiu estas esence iu HTML markado ĉirkaŭ tablo, kun value.title, kiu estas la titolo de la objekto, value.coverage, kiu estas la kovrado, - 

Kaj ni faras ĉekon tie por vidi kiu estas nedifinita kaj kaŝante ĝin se ĝi diras nedefinita, ĉar ni ne estas vere interesita en tiu. 

--and tiam la lingvo. Kaj tiam kio ni estas faras estas almuntanta ke al la tablo, kiu staras identigitaj per tiu ŝnuro tie. Kaj kiel jQuery laboras estas kio ĉi estas diranta estas serĉi la tablo kun ideo rezultoj kaj aldonu ĉi tiun tekston al tio. Kaj jen estas la tablo kun ideo rezultoj. Do kion vi finas kun estas ĉi paĝo ĉi tie. Kaj por vidi source-- Nu, la fonto estas ne reale ĝisdatigita kiam tio okazis. Do vi povas vidi la realan rezultoj de la tabelo ĉi tie tamen. 

Do tio estas nur simpla ekzemplo de fari tre baza informpeto kontraŭ la API kaj montri informojn en iu alia formas, kaj nenion faras tro kaprico. Nun, alia ekzemplo estas kvazaŭ apliko skribita de Davido Weinberger kiel demo de ĉi tiu, kiu esence montras vi kiel vi povas Mash up la rezultojn vi estas ricevas el biblioteko nubo API kun, diru, Google Books. 

Kaj la penso estas, ke mi povas kuri konsulto kontraŭ Google Books, akiri tekstoserĉon, akir iuj rezultoj reen, eltrovi kiun el tiuj eroj efektive ekzistas en Hollis, la biblioteko sistemo, kaj donu al mi ligilojn reen al tiuj eroj. Do se mi serĉu, ĝi estis malluma kaj ŝtorma nokto, mi reiri faskon da rezultoj de Google, kaj tiam unu rezulto kiu estas sulko en Tempo. Kaj tiuj estas ligiloj al libroj kiuj ekzistas ene de la Harvard Biblioteko sistemo. 

Do mi supozas ke la punkto ĉi tie estas ne tiel ke ĉi povas aŭ ne esti la vojo, kiun vi volas esplori la biblioteko, sed estas tute malsamaj maniero kiu ne estis disponebla por vi antaŭe, kiel vi havis neniun manieron de fari plena teksto serĉoj en libroj kiuj eĉ estis parto de la Harvard Biblioteko sistemo. Do nun tiu estas vojo ke vi povas fari tion. Kaj vi povas montri ilin en ajn formato vi volas. Do la punkto ĉi tie estas, esence, ni malfermas novajn vojojn por homoj labori kun la datumoj. 

Alia peco de biblioteko nubo estas ke ĝi helpas elmontri iuj de la uzado datumoj ke la biblioteko posedas. Do se vi iras al la biblioteko, kaj vi serĉas librojn, Vi ne nepre fakte havas ideon de, por ĉiuj ítems en aparta subjekto, kio Estas homoj en la komunumo, ĉu ĝi estas difinita kiel Harvard aŭ la lando aŭ via klaso, Kion ili trovis plej utilaj? Kaj la biblioteko reale havas ton de informo sur kion estas plej utila cxar, se multa de personoj estas kontrolanta el libro, kiu rakontas al vi ion. Certe estis ial ili volas kontroli ĝin. Multaj homoj metis ĝin sur rezervo. 

Se temas pri la rezervo listo por multa de klasoj, kiu rakontas al vi ion. Se fakultatanoj estas kontrolanta ĝi multon kaj studentoj ne estas, kiu rakontas al mi ion. Inverse, ke ankaŭ diras al vi ion. Do estus vere interese meti tiun informon tie kaj lasu homoj uzas gxin por helpi ilin trovi funkcias ene de la biblioteko sistemo. La flip flanko de tio estas estas kelkaj seriozaj privateco koncernoj ĉar unu el la kerno dogmoj de la biblioteko Estas ni ne tuj estos rakontis homoj kion aliaj personoj legas. Kaj eĉ se vi diras ĉi libro estis Taksis kvaroble en aparta monato, kiu povus uzi referencas al aparta persono de de-anonymizing datumoj kaj ekscii kiuj rigard ĝin. Do la modo kiun povas avoid-- La maniero ke ni povas provi ĉerpi iu signalo de ĉiuj informoj sen malobservi ies ajn privatecon zorgojn estas esence ni rigardas 10 jaroj de uzado datumojn, - 

Do estas pli longa periodo de tempo. 

--and diri, OK, vidu kiom multaj fojoj ĉi tiu verko uzis, kaj per kiuj super tiu periodo de tempo, kaj tiam esence redoni numero, kiun ni nomas staka partituro, kiu esence reprezentas kiom ĝi estas uzita. Kaj ke number-- Multaj malsamaj kalkuloj iru en tiu numero. --but ĝi estas tre malglata metriko kiu donas vin iu ideo de kiel la komunumo povas taksi tiun laboron. 

Kaj tial alia speco de eĉ pli malgrasaj ekstere apliko kiu utiligas de ĉi tio estas io nomata Stacklife, kiu estas fakte disponebla tra la ĉefaj Harvard Biblioteko portalo. Do vi iru al library.harvard.edu. Vi vidos plurajn malsamajn manierojn de serĉanta la biblioteko. Kaj unu el ili nomiĝas Stacklife. 

Kaj tiu estas apliko kiu navigas la enhavo de la biblioteko, sed estas tute konstruita sur supro de tiuj APIs. Do estas nenia speciala stuff irante sur malantaŭ la scenoj. Ekzistas neniu aliro al datumoj, kiujn vi ne havas. Ĝi estas uzanta la APIs provizi vin kun tute malsama navigacio sperto. 

Do se mi serĉu Alico en Mirlando tiukaze Mi akiros rezulton kiu similas tiu, kiu estas bela much-- 

Estas tre simila al ajna alia serĉo vi eble faros, krom en tiu kazo ni rango la erojn per stackscore, kiu donas al vi iu ideo de kiel populara tiuj eroj estis ene de la komunumo. Kaj tiel klare, Alico en Mirlando de Walt Disney estas tre populara. Sed vi povas ankaŭ vidi la supro kvar jen tiuj kiujn vi eble ne actually-- 

Aĵoj kiuj estas tre uzitaj, sed vi ne tuj konekti kun Alice in Wonderland. Do nia malnova amiko La Prinotis Alice estas ĉi tie. Do mi povas preni rigardi ĝin. Kaj nun kion mi serĉas je estas esence aro of-- Mi povas havi la Prinotis Alico dekstra tie. Mi havas informojn pri ĝi. Kaj mi ankaux havas stackscore de, en tiu kazo, 26. Kaj tion diras al mi specon de krude kiel ni alvenis al ĉi stackscore, kiel kiuj rigard ĝin, ekzemple kiel multaj fojoj estis Taksis, kiel fakultato aŭ undergrads, kiom multaj kopioj la biblioteko havas, kaj tiel plu kaj tiel antaŭen. 

Kaj vi povas ankaŭ, interese sufiĉe tie, foliumi la stakoj virtuale. Do la datumoj tie, ĉi ekmontras vi speco de virtuala reprezento de kio la breto heroajxoj aspektas kiel se vi estis preni ĉiuj biblioteko, la posedaĵoj kaj metis ilin kune sur unu senfina breto. Kaj la bela afero estas, ke ni can-- 

Antaŭ ĉio, la metadatumon pri tiuj libroj ofte diras al vi, kiam gxi estis eldonita. Ĝi diros al vi kiom da paĝoj ĝi havas. Povus informi vin pri la dimensioj. Do vi povas vidi ke estas reflektita tie en terminoj de la grandeco de la libroj. 

Kaj tiam ni povas uzi la pilo partituro reliefigi la libroj kiuj havas pli altan stakon partituroj. Do se estas pli malluma, ĝi signifas ke, supozeble, ĝi estas uzata pli ofte. Do en ĉi tiu kazo, kiu estas tuj diveni ke ĉi Estas la versio de Alico en Mirlando kiu tre komune uzataj kaj plej alirita, la biblioteko havas la plej kopioj de. Do se vi serĉas por Alico en Mirlando, tiu povus esti bona loko por komenci. 

Kaj tiam tie vi povas ankaŭ ligi ekstere al, diri, Amazon al aĉeti la libron, kaj tiel plu kaj tiel antaŭen. La punkto ĉi tie, denove, Ne tiom ke ĉi estas la plej bona maniero por foliumi la biblioteko aŭ la dekstra ilo por ĉiu okazo. Sed estas alia maniero de fari ĝin. Kaj farante la datumoj disponebla tra API, kiu estas farita de tre simpla konstruaĵo blokoj, kiu permesas vin serĉi la enhavon, vi povas konstrui ion kiel ĉi tiu povas eksterordinare valora al iuj personoj. 

Do tio estas ia, tiel kiel mi volas diri vere pri kio la API estas kaj kion ĝi elmontras, estas tuta faskon da stuff malantaŭ la scenoj, kiujn Mi nur tuj tuŝos en mallonge nur ĉar ĝi ia venas je tiu de tute malsama angulo en terminoj de kiel faras iu kiel ĉi get meti enen loko? 

Do API estas normo interfaco al ĉiuj de tiu ĉi enhavo. Sed akiri ĝin tie, la ni unue devis fari estis tiri kune informo de libroj kaj bildoj kaj la trovanta helpojn, la kolekto dokumento el diversaj Harvard sistemoj. Alef, VIA kaj OASIS estas la nomoj de la sistemoj. Ili esence iri enen dukto, procesorado dukto. 

Do unue: ni preni eksportado dosierojn de ĉiuj de ĉi tiuj sistemoj. Ni dividis ilin en individuajn erojn. Do ni havas dosieron, kiu estas gigabajto, kiu havas milionojn rekordojn en ĝi. Do ni disigu ĝin supren en individuajn erojn. Tiam, por ĉiu elemento, ni konverti ĝin en mods, ĉar kelkaj el tiuj estas denaske mods, iuj de ili ne estas. Do ni preni ilin ĉiuj al esti en la sama formato. Tiam ekzistas diversaj riĉigo paŝoj, kie ni aldonas pli informo por la datumoj ol estis havebla en la biblioteko. Do ni devas aldoni, unue ni havas kio bibliotekoj tenas ĝin. Ni iru tra paŝo de kalkulanta la stackscore. Ni iru tra alia ŝtupo de aldonante pli metadatumon en terminoj kion kolektoj homoj eble aldonis this-- 

Homoj kreas kolektoj de celoj. Kio kolektoj faras ĝi apartenas? Kiamaniere homoj etikeditaj ĉi enhavo en la estinteco? Tiam vi filtri, kaj vi restriktos la rekordojn ĉar, kiel mi menciis, ekzistas iuj registroj kiuj, pro kopirajto kialoj, ni ne povas montri. Kaj tiam ni ŝarĝi ilin en iu nomita Solr, kiu estas ne misliterumadoj sed estas la nomo de peco de programaro kiu faras serĉon indeksado, kiu pelas ĉiujn serĉo malantaŭ la API. Kaj tiam ĝi iĝas havebla al la API, kaj homoj povas uzi ĝin. 

Do ĉi tio estas kiel sufiĉe simpla procezo. Unu el la interesaj aferojn pri ĝi ke ni estas kontraktanta kun 13 milionoj de diskoj kaj ni tuj estos kontraktanta aŭ pli. Kaj ni volas esti kapablaj de manipuli tiuj en relative rapida modo. Ĝi prenas longan tempon por procesi 13 milionoj de diskoj. 

Do kiel tiu dukto estas starigis estas ke vi can-- Mi supozas ke la avantaĝo de la dukto, la problemo kiun ni estas klopodi solvi ĉi tie, estas ke ĉiuj transformoj, ĉiuj tiuj ŝtupoj en tiu dukto estas apartigebla. Mankas dependecon. Se vi procesi registron de unu libro, ne estas dependeco en ke inter alia libro. 

Do kion ni povas fari estas esence, ĉe ĉiu paŝo en la dukto, ni metu ĝin en la vosto en la nubo. Mi estus en Amazon Retejo Services. Do Estas listo de, diru, 10.000 elementoj kiuj bezonas esti ununormigita kaj konvertiĝis al mods formato. Kaj ni spino supren kiel multaj serviloj kiel ni deziras, eble 10 serviloj. Kaj ĉiu el tiuj serviloj simple sidas tie, aspektas en tiu vosto, vidas ke ekzistas unu kiu bezonu procesi, tiras ŝin for la vosto, procesas ŝin kaj bastonoj ĝi la sekvantan vosto. 

Kaj tiel kion tiu permesas ni fari estas apliki, esence, tiel aparataro kiel ni volas ĉi problemo por tre mallonga periodo de tempo procesi la datumojn tiel rapide kiel ebla, kiu estas iu kiu nur, nun en la mondo de nubo komputado ni povas provizo serviloj esence instantáneamente, estas tiom utila. Do ni ne devas havi giganto servilo sidas ĉirkaŭe tutan tempon por fari la prilaborado ke povus okazi nur unufoje semajne. 

Do kiu estas plejparte ĝin. Ekzistas dokumentado disponebla por la Biblioteko Nubo Item API ĉe tiu retadreso, kiu estos disponebla poste. Kaj bonvolu iri rigardu tio al vidi se estas io, vi havas iujn ideojn. Ludu kun ĝi. Fool ĉirkaŭe. Kaj espereble vi povas veni supren kun io granda. Dankon.