JEFFREY LICHT: Hi han. Naiz Jeffrey Licht. Eta hemen nago buruz nahi duzu hitz egin Harvard Liburutegia eta eraikin biharko gaur liburutegia, asmatzen dut. Beraz atzealde hemen, Saio honetarako zelaia funtsean, ez dela bibliografia datu asko Harvard liburutegietan eskuragarri. Eta ez dago aukera bat da, tresna batzuen bidez eta hori garatzen ari da proiektu bat, informazioa eskura eta eraman lekuetara diren Harvard Liburutegia ez da oraintxe egiten, egin gauza berriak berarekin, esperimentu eta play inguruan berarekin. Beraz, sarrera honetan sartu puntua API bat da Harvardeko Liburutegia Cloud, izeneko open metadata zerbitzaria da, hau da, orain buruz hitz egingo dut. Beraz atzealde da ez dela bat Gauza asko Harvard liburutegian. 13 milioi bibliografiko baino gehiago ditugu Erregistro, irudiak milioika, eta tresnetan milaka, eta horrek dira deskribatzen funtsean dokumentu Bildumak, esanez zer haietan da, paperak kutxak eta abar baino gehiago ordezkatzen duten Banakako bat milioi dokumentuak. Eta han ere asko liburutegia duela informazioa edukiak nola erabiltzen da, Jende interesgarri izan liteke nor agian berarekin lan egin nahi. Beraz informazio guztia liburutegia metadata ditu. Beraz metadata datuak buruz dituen datuak dira. Beraz, buruz hitz egiten dugu hori da informazioa liburutegiaren bidez eskuragarri hodei hori da eskuragarri, ez da zertan benetako dokumentuak beraiek, ez derrigorrez osoa liburuak edo osoa irudien testua, benetan duten arren kasua izan daiteke. Baina benetan datuei buruzko informazioa. Beraz katalogazioaren pentsa dezakezu informazioa, deien zenbakiak, gaiak, zenbat kopiak liburu daude, zer edizioak daude, zein dira formatuak, egileek, eta abar. Beraz, ez dago informazio asko buruz bilduman duen informazioa, berez, berez erabilgarria da, mota. Eta bazaude arren sakoneko ikerketa egiten, jakina, benetako iritsi nahi duzu Eduki nagusira bera eta datu begiratzeko metadatuak erabilgarria da termino bai corpus osoan bezala aztertzeko, bezalako zer gauza bilduman daude. Nola erlazionatzeko? Beste gauzak benetan aurkituko duzu laguntzen du, benetan da bere helburu nagusia da. Puntua metadatuak eta katalogoa da guztiak aurkituko dituzu laguntzeko hori da informazioa Bildumak barruan. Beraz, hau metadata adibidea da Harvard Liburutegian liburu bat da. Beraz, ez da. Eta ikusiko duzu da benetan neurrizko konplexua. Eta metadata balioa zati Harvard Liburutegia sistemaren barruan da, hori izan da sort eraiki up catalogers arabera eta eskatzen duen jende arabera muntatu esperientzia eta trebetasun asko eta horri pentsatu denborarekin, haren balio asko ditu. Beraz errekorra honetan begirada bat hartzen baduzu Comentada Alice The, jakin dezakezu got duzun titulua, nork idatzi du, egilea, eta hainbat irakasgai guztiak horrek jende katalogatu sartu. Eta ikusiko duzu han ere, in Informazio onak asko gain Hemen, ez bikoizketa batzuk. Ez dago hori konplexutasuna asko da metadatuen bidez islatzen duzula. Beraz, liburu honen izenburua da Aliceren abenturak Wonderland. Beraz, hau da ohar bat liburu horren bertsio. Baina, bestalde, Comentada izeneko Alice, Aliceren abenturak Wonderland delako zerbait bertan Martin Gardner idatzi eta liburua anotatu. Eta ez dago informazio handia asko da Puzzleak eta logika gauzak buruz Alice barruan duzun hori Ziurrenik ez zuen ezagutu. Beraz, irakurri egiten joan behar duzu. Baina ikusi ahal izango duzu dago Xehetasun asko hemen, Identifikatzaile barne, noiz da sortu zen, non zen, Harvard jartzeari dagokionez sistema, eta abar. Beraz, hau lagin bat da metadata-mota agian duzula liburu bat ikusi Harvard Liburutegia bilduma. Hau zerbait erabat desberdina da. Beraz, ez dago izeneko sistema da VIA Harvard, funtsean irudiak eta artearen objektu katalogatzeko eta Harvard zehar entzunezko gauzak, eta metadatuak batzuk gehituz horiek, horiek sailkatzeko, eta, kasu batzuetan, emanez miniaturak txiki hori hartu ahal izango duzu Hala nahi izanez gero begiratu. Beraz, hau adibidea da metadata plaka bat behar duzu tik, ustez, Alice Wonderland. Eta ikusiko duzu, ez da metadata gutxiago hemen. Da objektu ezberdin moduko bat besterik ez. Eta, beraz, ez dago informazio gutxiagora. Gehienbat daukazu Izan ere, dei bat zenbakia, funtsean nork sortu du, - Ez dakigu noiz sortu den. Izenburu bat --eta. Beste adibide bat. Hau Aurkikuntza laguntza bat da. Beraz, ez Lewis bilduma bat da Carroll-en paperak Harvard at. Beraz, hau deskribatzen du zer bilduma horretan dago. Beraz, norbaitek pasatu du eta koadro guztiak bidez begiratu eta katalogatu ditu, atzeko batzuk eman, Zer da hemen laburpena idatzita. Eta begiratu bazenitu gehiago honetan, hau doa orriak eta orri for eta orriak, baina esango dizu zer letrak eta jarraitu zer kutxak datak bilketa osoan existitu. Baina hau da zerbait duten, Oraindik Harvard at bada, jo dezakezu, eta benetan fisikoki itxura gora eta, ustez, hartu begirada bat. Beraz, hau guztia handia. Metadata honen erabilgarria. Da Harvard Liburutegia sisteman ditu. Badira Tresna online non duzu joan eta begirada bat hartu zuen, eta ikusten da, eta bilatu da. Eta hori eta dado xerra dezakezu modu ezberdinetan asko dago. Baina benetan da bakarrik bada eskuragarri gizaki bat eserita zara zure nabigatzailean edo zerbait, edo, Telefonoaren eta bertatik nabigatu. Ez da benetan erabilgarri Edozein erabilgarria moda mota beste sistema edo erabili, beste ordenagailu barruan sistemekin ez Harvardeko Library, baina kanpoko munduan sistemak, bakarrik, oro har, beste pertsona. Beraz, galdera da, nola ahal dugun eskuragarri ordenagailuak ahal duten interesgarriagoa egin ahal izango dugu, beraz, berarekin stuff baino browsing geure burua? Beraz, zergatik hori egin nahi duzula? Badira aukerak asko daude. Bata oso bat sortzeko, ezin duzu browsing modu desberdinak hori da eskuragarri edukiak Harvard Liburutegiak bidez. Erakutsi dut bat geroago Stacklife deitzen, eta horrek ez du erabat desberdina edukien bila ari hartu. Gomendioa motor bat eraiki ahal izango duzu. Beraz Harvard Liburutegia ez da hasi esaten negozioa, liburu hau gustatzen. Ondoren, 17 beste hauek begirada bat hartu liburuak duzula liteke interesa edo 18 beste irudi hauek. Baina, zalantzarik gabe, Could Ezaugarri baliotsua izan. Eta metadatuak eman, berak posible zela elkarrekin jartzea. Agian beharrak desberdinak dituzte duzu edukia bilatzen dagokionez, agian tresnak arren eskuragarri daude liburutegian egiten dela erabilgarri, agian nahi duzun beste modu batean bilatu edo erabilera kasu jakin baterako optimizatzeko, Horrek agian oso espezializatuak da. Agian, ez dira gutxi batzuk bakarrik Munduko pertsona batek edukia bilatu nahi modu horretan, baina handia izango litzateke badugu hori egiten utzi daiteke. Ez dago analytics asko da besterik gabe, nola pertsonengan edukia benetan izango litzateke erabili interesgarria ezagutu, jakiteko zer liburu erabiltzen ari dira, zer ez dira, eta abar. Eta gero, ez asko da integratzeko aukera Beste informazioarekin hori ez dago web orrian. Beraz egun ditugun Adibidez, NPR ditu a book review segmentu, non dira elkarrizketatzeko liburuei buruzko egileek. Eta, beraz, handia izango litzateke zuk balitz liburu bat gora begira Harvard-en Liburutegia, eta, esan Ados, ez da egileak egindako elkarrizketa bat izan da. Goazen duten begirada bat hartu. Edo han Wikipedia orri bat da, gisa autoritario, akademiko erreferentzia liburu honi buruzko duzula begirada bat hartu nahi izatea. Badira iturri mota hauek Web barreiaturik. Eta hirurak elkartzen erabilera handia izan liteke norbaiti begira edukia, zerbaiten bila. Baina, era berean, ez Gauza mota duzu litzaidake Liburutegiko arduradun izan nahi jaisterakoan eta behera ehiza iturri desberdin horiek guztiak eta horiek elkarrekin plugging etengabe aldatzen ari delako. Eta zer uste dute martxoaren garrantzitsua da ez direla garrantzitsuak zer pentsatzen duzun da. Eta are gehiago, funtsean, ez da bat stuff ez dugu pentsatu gabe asko. Beraz, hau ireki ahal bada, gehiago dozena erdi bat edo, beraz gain, pertsonak, direnek hau begira batean erregularrean ideia pentsa dezakezu eta datuak masajea, eta zer nahi berarekin dute. Beraz, hau egin nahi dugu Datu mundua eskura. Beno, ez dira pare konplikazioak bat. One metadata hau dela sistema desberdinak da. Da hainbat formatutan da. Beraz, ez dago normalizazio batzuk bertan gertatuko behar du, bertan normalizazio prozesuan izateaz gauzak jarriz formatuak ezberdinetako eta horiek kartografiatzeko formatu bakar bati beraz, eremuak ez datoz bat izango. Badira copyright murrizketak batzuk. Bitxia bada, katalogo Sarreraren buruzko liburu bat da copyright erantzule. Beraz, nahiz eta, besterik gabe, nahiz eta liburua eratorritako informazioa, copyrightable da. Eta nor benetan arabera metadata duten pertsonak, ez duten mugak egon daitezke banatu ahal izango da, antzeko zaie Ez dakit. Edo agian izango da ez izatea antzekoak abestiaren letra egoerari, adibidez. Beraz denok dakigu nola erabiltzen zartaginak. Beraz gai horren inguruan lortu behar duzu. Eta gero, beste pieza bat da ez dagoela datu asko da. Beraz nago norbaitek lanera nahi duenak badu datuekin edo cool ideia bat du, 14 milioi aurre Nire eramangarria erregistro problematikoa izan daiteke eta zaila kudeatzeko. Beraz, murriztea nahi dugu pertsonei oztopoak to datuekin lan egin ahal izateko. Beraz hurbilketa dela espero helbideak Kezka horiek guztiak bi zati da. One eramango plataforma bat eraikitzen ari da iturri horiek guztien datuak eta larriago egiten du, normalizes, aberastu egingo du, eta egiten kokaleku bakar batean. Eta egiten du eskuragarri bidez API publiko bat duten pertsona deitu daiteke. Beraz API bat aplikazio bat da Programen interfazea. Eta hori, funtsean, bat aipatzen amaierako puntua duten sistema edo teknologia deitu eta datuak eskuratu ahal izango modu batean formatuan egituratua hori erabili ahal izango da. Beraz, ez da menpeko web-orri batera joan eta datuen off scraping Da, adibidez. Beraz, hau home orria Liburutegi Cloud Item API, horrek, funtsean, bere bi bertsio bat da. Beraz bigarren iterazio da Datu horiek guztiak egin nahian Mundu eskura. Beraz, http://api.lib.harvard.edu/v2/items. Eta besterik gabe, hau apurtu behera pixka bat, zer esan nahi da hau, bi bertsioak API da. Ez dago bat bertsio bat da, eta horrek Ez dut buruz hitz egingo. Baina bada bat bertsio bat da. Eta zuk hau deitzen ari bada API, diren elementuak izango dituzu. Eta ideia zati API API bat kontratu bat da. Dela zerbait da Ez aldatu egingo da. Beraz, adibidez, - Eta arrazoia hori bada I sistema mota batzuk eraikitzeko dagoela liburutegian hodei API bat erabili joan liburuak bistaratzeko edo norbait aurkitzeko modu berezia informazioa, zer ez dugu nahi gertatuko joan guretzat alda nola da API hori du lan, eta bat-batean guztia azken erabiltzaileak aldean hausten. Beraz, zuk egiten ari API bada zati Mundu eskura, da praktika onak jarri Bertsio bertan zenbakia, beraz, jende Badakizu zer bertsio batekin ari dira aurre. Beraz, erabaki bada modu hobe bat aurkituko dugu Informazio hori eskuragarri egiteko, baliteke aldatzeko dugu Hiru bertsio hori deitu. Beraz, denek nor da oraindik erabiliz bi bertsio, hori izango oraindik lan. Baina bertsio hiru litzateke gauza berriak guztiak. Beraz, hau API bat da, baina hau benetan URL bat itxura. Eta beraz, zer da hau bat adibide da zer da Gainerako API bat da, eta eskuragarri dago deitua besterik web erregularra konexioa gainean. Eta egia esan, ahal duzun bertara joan arakatzaile batean. Beraz, hemen besterik ez dut ireki zuen Firefox eta api.lib.harvard.edu/v2/items joan. Eta, beraz, hemen zer lortu dut da Funtsean lehen orria osoa emaitzak hori lortu dugu artikulu multzoa. Eta hemen da XML formatuan. Eta, era berean izan da, Firefox arabera prettified. Ez du benetan dute horiek guztiak zabalduz eta kontratazio gutxi doohickeys hemen. Hau ikusgarriago bat sort da Bertsio horrela begiratzen. Baina, zer da hau gurekin kontatzea da Elementu guztiak antolatu dut. Beraz, ez dago 13.289.475 elementuak dira. Eta lehen at nabil 10, zero posizioan hasten informatika delako beti zero lanean hasiko gara. Eta hemen dut, kolapso besterik ez bada hau, ikusiko duzu lortu dut 10 elementuak. Eta begirada bat hartu nuen bada elementu bat at, I can ikusi dudan lortu duen azaltzen. Eta hau zer deitzen MODS inprimakia da. Eta beraz, ez dut aldatzeko joan atzera hemen une batez. OK. Hargatik bilatu zerbait en zehatz lehen elementua delako Etorri denean begiratzen duzu gertatzen bilduma osoa bidez da, definizioz, ausazko. Hargatik begiratu erroskilak batzuk. Oh. OK. Beraz erroskilak. Beraz aurkitu dugu, ez dira 80 elementu Bildumaren erroskilak erreferentzia. Dugu, eta horietako 10 lehen at bilatzen ari zaren. Orain, ikusi ahal izango duzu hemen modu hori I erroskilak bila nabil esan dut, Besterik gabe, zerbait gehitu dut eskaera URL katea. Beraz q berdinen erroskilak, bertan egin ahal izango dituzu ikusi pixka bat gehiago hemen erraz. Eta hori, funtsean, esan nahi du ez dela API, zehaztapenak zein definitzen guztia parametro horiek esan nahi. Eta horrek esan nahi du goaz bilatu erroskilak dena. Beraz, lehen elementua hemen dugu ikusi izenburua Donuts da, dezakezu eta han An izeneko azpititulua bat da Passion American, hau da, uste dut, egokia. Badira desberdina asko Behin puntu lortu duzu Datuak lortzeko, badira desberdinak asko formatuetan dela lor dezakezu sartu. Eta badira hainbat indargune eta horiek guztiak ahuleziak. Beraz, hau, ikusi ahal izango duzu Hemen, formulario hau oso aberatsa da. Eta normalizatua da. Beraz, ez dago izenburua partida bat eremu, azpititulua eremu bat. Ez dago ordezko bat da izenburua, American Passion An. Ez dago berarekin lotutako izena da. Baliabidearen idatzi testua da. Ez dago informazio asko Hemen formatu honetan. Baina badira sorta bat dira formatuen ezberdinak. Beraz, zer besterik izan ginen begira formatu bat da MODS izeneko, horrek nabarmentzen Metadata Objektu Zerbitzua, potentzialki. Ez nahiko ziur nago benetan S. Baina formatu nahiko konplexu bat da. Formatu lehenetsia da. Baina hori mantentzen bat da datu guztien aberastasuna liburutegia erabiltzen duelako Oso hurbil da zer Liburutegia erabiltzen barrutik. Hau da, estandar bat da herrialde osoan erabiltzen da, liburutegiak akademikoa munduan zehar. Eta oso egingarria da. Beraz duzun got bada dokumentu bat duten MODS formatuan dago, hori eman norbaitek dezakezu zeinen sistemak ulertzen MODS, eta inporta daitezke. Beraz estandar bat da. Honez oso ondo definitu, oso zehatzak. Eta hori da, zer egiten du Norbaitek esaten badu egingarria delako, honek, ordezko baten izenburua da erregistroa, mundu guztiak daki zer esan nahi duen. Flip aldean, oso zaila da. Beraz begirada bat hartu baduzu Disko honetan hemen, lortu besterik ez dut nahi bada Dokumentu honen izenburua, Liburu honetan, hau da, ziurrenik Donuts beharrean, American Passion An, analizatzean egindako Apur bat parte hartzen. Berriz badago beste bat Formatu Dublin Core izeneko, horrek askoz formatu bat, askoz errazagoa. Eta beraz, hemen ikusten duzu, ez dago titulua, azpititulua, ordezko izenburua. Ez dago izenburua besterik, Donuts, American Passion An, eta izenburua beste, American Passion. Beraz, zer inprimaki ikusten ari zara Datuak lortzeko amaitu nahi duzun, asko nola araberakoa erabili joan zaren. Erabiltzen ari for elkarreragingarritasuna edo ez duzun zerbait simple nahi errazagoa da lan izan daiteke? Flip aldean, asko Xehetasunak eskuratzeko ordenatzeko squished behera. Ñabardurak galduko dezakezu zer bat bereziki eremu bitartekoak Dublin Core aurre ari bada, eta zuk ez litzateke mods lortzeko. Beraz, horiek formatuen bi dira API ateratzeko dezakezu. Eta, batez ere, ari gara mantentzen MODS eszenak atzean. Baina eman ahal dugun MODS eta Dublin Core eta beste ezer, baita. Beste consideración denean datuetan ezkerreko zabiltzala dela lor dezakezu JSON bai gisa bertan JavaScript dago, edo XML, bertan nabarmentzen Extensible Markup Language. Eta datu errepresentazio horiek biak zehazki datu bera dute, zehazki eremuak bera. Baina besterik ez ari dira sintaktikoki desberdinak. Beraz, hau da a-- Beno, dezagun piztu nahiko luke. Beraz, hau gure kontsulta da XML formatuan erroskilak. I pizten bada besterik hau JSON izan, Ikusten dut hainbat badirudi. Beraz, gaur egun hau eduki bera da, baina beste egitura bat. Angelu parentesi gutxiago daude. Ez dago gutxiago hedatua. Eta hau formatu bat da hori, baduzu diren web ingurunean lan egiten, ziurrenik zoazen bat delako erabili nahi Nizako gauza buruz JSON da JavaScript bateragarria da. Beraz, web aplikazioa idazten ari naiz, ezin tira I JSON eta besterik berarekin lan zuzenean. XML, berriz, bat da Pixka zailagoa da. Beraz, berriro ere, horiek oso erabilgarriak dira biak. Dira besterik erabilera kasu ezberdinak non pertsona horiek erabili nahi izatea. OK. Beraz API itzuli. Beraz bilatu dezakegu For Adibide bat ematen dut erroskilak bila. Era berean, ezin dugu besterik bilatu batean bereziki arlo hemen barruan. Bilatzen Beraz ordez erregistro osoa, Besterik ez dut bilatu dezakezu izenburu eremua. Eta, beraz, gaur egun ez dira 25 gauzak izenburuan erroskilak, izan eta horietako bat berrezartzeari buruz da kudeaketa hezegune donut zuloa of programa, hau da, ziurrenik, ez du zertan zer nahi dugun denean donuts bilatzen ari gara da. Ere egin dezakezu, zaudenean API-- bat jorratuz API bat izatea zati emanez Jende datuak multzo handiak sartzeko. Eta han desberdinak pare bat daude Tresna hori egin, erabili ahal izango duzu. Bat da, oso besterik gabe, zuk datuen bidez page can. Beraz, besterik ez balitz bezala, eskaera bat egin nahi duzu web interfaze baten bidez, duzu orrialde bat begira dezakezu, bi orrialde, hiru orrialde. Gauza bera egin dezakezu Gauza API bidez. Besterik ez duzu nahi izan nola egiten duzun esplizituak. Beraz, adibidez, egiten dit bada Nire lehen eskaera hemen, non Bilaketa bat gauzak egiten ari naiz izenburuan erroskilak, esan dezaket, eta muga berdinen 20, horrek esan nahi du ematen dit lehen 20 disko, ez lehen 10, eta horrek lehenetsia da, to 20 begiratzeko garai batean nahi dudalako. Edo esan dezaket, ezarri hasteko berdina 20 eta muga Berdindu 20, egingo eman 21 40 bidez grabatzen me. Beraz, gauza asmatzen dut eramateko hemen dago Kontsulta-kateak erabiltzen ari gara kontsultari buruzko parametroak doitzeko. Eta zuk kontrola aukera dago zer lortu duzun. Erabili ditzakezun beste tresna, - Eta hau da, benetan lagungarria Datu horiek aztertzeari dagokionez. faceting zerbait izeneko --is. Beraz, epe faceting da ez du zertan ohikoa. Baina Guztiak ikusi aurretik. Begirada bat hartu baduzu Amazon, esate baterako, eta bilaketa bat egin nahi duzu liburuetan erroskilak, Hemen nik liburu sorta bat, eta kategoriaren arabera ari dira bilduta, eta kategoria desberdinetan lortzen dituzu, nola eta askok kategoria bakoitzean liburuak erakusteko sortu. Beraz, hau da, funtsean, alderdi bat. Guztiak beren liburuak hartzen duzu, 1.800 egin erroskilak bat egiten duten Amazon at liburuak. Horietako 12 daude gosaria kategorian. Gozogintza eta gozogintza 21, eta abar eta abar. Beraz, hau da, benetan erabilgarria Edukia miatzeko tresna liburutegi barruan ere bai begiratzen facet bat duzulako, zuk zer irakasgaien ideia bat ematen du existitzen da, zer irakasgai mota bezalako dira gehien zure eskaera multzo barruan popular. Eta off gidatzeko duzu eta arakatzeko laguntzen du. Beraz, gauza bera egin ahal izango dugu. Erabili nahi badugu API eta alderdi begiratu, parametro bat gehitu dugu gure lagun kontsulta-katea. Beraz aurpegi erakusten bereizita koma berdinen zer facet nahi dugun zerrenda. Beraz alderdi bat gaia izan daiteke. Beste hizkuntza izan liteke. Eta beraz, kontsulta hori exekutatzen badugu, get-- dugu Beti, bera hemen dirudi. Baina amaierara dugu gehitu zerrendan alderdi multzo bat. Beraz gaia izeneko alderdia izan dugu. Beraz, hau da gurekin kontatzea dudala begiratuz gero Nire donut eskaera egin duen 80 emaitza at, Horietako 13 izan du Gaia United States. Hiru dute subjektu erroskilak. Hiru dute gaia hezegune zaharberritze, horrek gure donut zulo izan daitezke. Horietako bi, Simpsons, eta abar eta abar. Beraz, hau baliagarria baduzu izan daiteke behera mugatu zure bilaketa nahi. Hori egin duzu lagun dezake. Bereziki bat baduzu , baino gehiago esan, 80 emaitza. Era berean, galdetu dugu Hizkuntza on aurpegi erakusten da. Beraz begiratzen dugu gure emaitzak kontuan hartuz gero, ikusiko dugu 76 Horietako ingelesez, lau dira frantsesez, gaztelaniaz, bi, bi, uste dut hori undefined edo ezezaguna, Holandako eta Latin. Beraz Latin uste dut donut emaitza, berriz ere, ezer ondasun labean egin du. Baina ez duzu joan. Beraz, hau da ordenatzeko duzu erakusten nola edukia atzera tira dezakezu besterik bidez API batetik web nabigatzailea, handia da. Baina ez da benetan zer egiten duzun normalean egiten API erabiliz. Beraz, nola duzu adibide bat Egia esan, ezin egin hau da dut super programa txiki bat idatzia, eta, berriz ere, nire donut bilaketa egiten du eta pare eremuak hautatzen eta erakutsi egiten ditu mahai batean. Beraz, hau da, oso eduki bera besterik ez dugu eremu batzuk zerra atera. Beraz izenburuak, zerrenda zer liburuaren kokapena da buruzko, hizkuntza, eta abar eta abar. Beraz, nola benetan gertatu honetan geroztik, Asmatzen dut kodea batzuk begiratu behar dugu, is-- Hemen duguna da HTML sinple bat orria, testua bistaratzen du, liburutegia hodei ongietorria eta ondoren, emaitzen taula bat bistaratzen du. Eta badira, jakina, emaitzak ez mahai orriko kargatzen. Baina zer egiten ari gara da, lehenik eta behin, ez dugu Liburutegi bat deitu eta kargatzen ari jQuery, hau da, funtsean JavaScript liburutegi bat, eta horrek egiten du Oso erraza JavaScript manipulatzeko jatorriz, HTML, eta web orriak egiteko, bezeroaren aldeko logika eta web orriak. Beraz, zer dugu hemen da jQuery Talde izeneko metodo bat du, horrek, funtsean da joan URL bat da, eta, kasu honetan, familiar bila URL hau. Eta izango da, ondoren, edukia eskuratu URL horretan eta, ondoren, funtzioa exekutatu. Beraz api.lib.harvard / edu joan esan dugu. Search erroskilak egiteko. Emaiguzu 20 erregistro. Eta gero, funtzio hau, eta horrek exekutatu Aukeratu dut, datuen pasatuz. Eta datuak JSON da hori got API itzuli. Eta gero, esaten ari gara horren barruan Datu elementutik izeneko eremu bat da. Eta joan nintzen begirada atzera at bada Emaitza horiek, hori da hemen bat, han zerbait izeneko Beno, elementu deitzen. Beraz, hori izan daiteke. Eta zer egiten da Elementu bakoitzaren bidez doa eta, ondoren, deiak beste funtzioa elementu bakoitzaren gainean. Eta funtzio hori, funtsean, balioa hartzen ari da elementua, hau da, funtsean, banakako erregistro eta, horri esker tira digu izenburua, estaldura eta hizkuntza. Beraz guztietan funtzio bat deitzen dugu elementua API batetik itzuli ginen. Eta zuk begirada bat hartu besterik ez bada Pieza honetan hementxe, zer egiten ari garen kate bat sortzen ari gara, horrek, funtsean HTML marka batzuk mahai baten inguruan, value.title batera, horrek izenburua da objektu, value.coverage, estaldura da, - Eta txeke bat egiten ari gara Hemen nor undefined ikusteko eta izkutatuz undefined dio bada, Oraindik ez benetan interesatzen dugulako horretan. --eta gero hizkuntza. Eta gero, zer ari gara da erantsi hori egiten taula hau da Kate honek hemen identifikatzen. Eta jQuery nola funtzionatzen da, zer da hori esaten ideia Mahaian begiratu emaitzak eta testu hau gehitu. Eta hau da ideia emaitzekin taula da. Beraz, zer amaituko duzu orrialde hau hemen da. Eta ordena source ikusteko Beno, iturria ez da benetan hori gertatu zenean eguneratu. Beraz, benetako ikusi ahal izango duzu Mahaiaren emaitzak hemen arren. Beraz, adibide sinple bat besterik ez da API aurka oso oinarrizko kontsulta bat egiten eta beste batzuetan, datuak erakusten osatzeko, eta ez dute ezer ere fancy egiten. Orain, beste adibide bat baino ez da, Aplikazio David Weinberger ek idatzitako hau demo bat, eta horrek funtsean erakusten dizu emaitzak Oraindik nola birrintzeko dezakezu gora liburutegia hodei API batetik lortzean batera, esan, Google Books. Eta pentsamendu hemen I can dela Google Books aurka kontsulta bat exekutatu, Testu eta bilaketa osoa lortu, emaitza batzuk lortzeko back, jakiteko elementu horiek zein benetan Hollis existitzen, liburutegiko sistema, eta gero eman dit loturak elementu horiek itzuli. Beraz bilatu dut, zen Gau ilun eta Ekaitz, I itzultzeko emaitza sorta bat Google, eta gero emaitza batetik bertan Time Zimurren A da. Eta horiek liburu loturak existitzen diren Harvard Liburutegia sistemaren barruan. Beraz, uste dut puntua hemen ez da hainbeste dezakete, edo ez hori Nahi izanez horrela izan liburutegian bilatu, baina erabat desberdina da era horretan erabilgarri ez zen nahi aurretik, zuk bezala izan ez egiteko modu testu osoa liburu bilaketak, nahiz Harvard Liburutegia sistemaren zati izan ziren. Beraz, gaur egun hau modu bat da hori egin ahal izango duzu. Eta horiek erakutsi ahal izango duzu edozein formatu nahi duzun. Beraz puntua hemen da, funtsean, pertsonentzako berria eman ari gara to datuekin lan egiteko. Liburutegia hodei beste pieza bat dela erabileraren datu batzuk busti laguntzen du liburutegia erabiltzen du. Beraz bazoaz liburutegira, eta liburuak bila ari zaren, ez duzu nahitaez benetan ideia bat izan, batean elementu guztientzat gai jakin, zer pertsonak dira ere komunitatea, ea Harvard edo gisa definitzen Herrialde edo zure klasean, zer izan gehien erabilgarria aurkitu zuten? Eta liburutegian benetan ditu a buruzko informazioa tona zer Oso erabilgarria da, asko bada delako jendea liburu bat egiaztatzea, duen zerbait esaten dizu. Ez dago arrazoi bat egongo da egiaztatu behar da nahi dute. Jende asko ipini erreserba on. Da erreserbako zerrendan agertzen da bada asko egiteko klaseak, zerbait esaten dizu. Fakultateko kideak badu egiaztapena out asko eta ikasmailari ez dira, duen zerbait esaten dit. Alderantziz, hori ere zerbait esaten dizu. Beraz, benetan interesgarria izango litzateke Informazio hori jarri han eta utzi pertsona inguruk hitz egiten horiek aurkitu laguntzeko liburutegi sistemaren barruan egiten du lan. Honen alde irauli da han pribatutasun batzuk larriak dira kezketako bat delako oinarrizko liburutegia tenets da, ez gabiltza egon kontatzea joan zer beste pertsona irakurtzen ari jendea. Eta nahiz eta hau esaten ari liburu hautatuta zuten lau aldiz hilabete jakin batean, hori erabili ahal izango Atzera lotzeko jakin bati de-anonymizing datu arabera pertsona eta nor checked out aurkitzeko. Beraz, modu hori avoid-- dezakegu Modu horretara ateratzeko dastatu ahal izango dugu informazio guztia seinale batzuk apurtu gabe inoren pribatutasuna kezka funtsean begiratzen dugu 10 urte erabilera datuen, - Beraz, denbora epe luze bat baino gehiago da. --eta esaten, OK, ikus dezagun nola hainbat aldiz lan hau erabiltzen zen, eta aldi horretan duen batek Denboraren, eta, ondoren, funtsean, kopurua, eta horrek deitzen dugun eman back pila puntuazio bat, funtsean suposatzen du zenbat erabili izan da. Eta zenbaki hori Kalkulu desberdinak asko zenbaki hori sartu. --but oso zakarra da ematen dizu metrikoa nola ideia batzuk auzolana baloratzen daitezke. Eta, beraz, nahiz moduko beste gehiago lantzen du, aplikazio duten abantaila hartzen hau zerbait da Stacklife deitzen zaio, hau da, benetan Harvardeko nagusien bitartez eskuragarri Liburutegia ataria. Beraz library.harvard.edu joan. Desberdinak zenbaki bat ikusiko duzu liburutegian bilatzen moduak. Eta horietako bat Stacklife deritzo. Eta hau aplikazio bat da, Liburutegiko edukia nabigatu, baina erabat eraikitzen da APIak horien gainean. Beraz, ez dago gauza bereziak joan eszenak atzean. Ez dago sarbidea ez Ez duzula izan datu. APIak erabiliz Honez emateko erabat desberdina, nabigazio batekin esperientzia. Bilatu dut Alice Beraz, kasu honetan Wonderland, Ondorioz itxura lortu dut honetan, hau da pretty askoz Oso bestelako edozein bilaketa antzekoa da egin dezakezu, kasu honetan ordea Ari elementuak ranking ditugu arabera stackscore, ematen dizu nola herri horien ideia batzuk Elementu komunitatearen barnean zeuden. Eta, beraz, argi eta garbi, Alice in Wonderland Walt Disneyk oso ezaguna da. Zuk Baina goiko lau ere ikus dezakezu Hemen ere bai, agian ez duzu Benetan Hori oso erabiltzen dira gauzak, baina ezin duzu berehala Alice konektatu Wonderland. Beraz, gure laguna zaharra Comentada Alice da hemen. Beraz, begirada bat hartu ahal izango dut. Eta orain zer bilatzen ari naiz at da, funtsean, bat ezartzeko gertatuko Comentada izan ahal dut Alice hementxe. Hari buruzko informazioa behar dut. Eta, gainera, stackscore bat dut eta, kasu honetan, 26 dira. Eta hau sort esaten dit of gutxi gorabehera nola lortu stackscore honetara dugu, gustuko duten checked out, nola bezalakoa hainbat aldiz berrikusi ezazu, fakultateko edo undergrads, nola bezalakoa kopia asko liburutegian ditu, eta abar eta abar. Eta, gainera, ahal duzun, interesgarria nahikoa Hemen, arakatu pilak ia. Beraz, datuak hemen, hau zuk moduko erakusten irudikapen birtuala apal zer GORABEHEREK hartu zuk balitz bezala begiratu Liburutegiko ustiategiak guztiak eta jarri elkarrekin apala infinitua on bat. Eta gauza polita da can-- garela Lehenik eta behin, egin Liburu horiei buruz metadata askotan argitaratu zen esaten dizu. Kontatzen da zenbat orrialde ditu. Zuk dimentsioak agian esango du. Beraz, ikusi ahal izango dituzu hemen islatzen Honez liburuak tamainaren aldetik. Eta, ondoren, erabili ahal izango dugu pilatu puntuazioaren nabarmendu liburuak pila puntuazioak altuagoak izan. Beraz ilunagoa da bada, esan nahi du, ustez, sarriago erabiltzen da. Beraz, kasu honetan, ez naiz hori asmatzen joan Alice bertsio Wonderland da hori oso normalean erabiltzen da, eta gehien sar, liburutegian kopiak gehienak ditu. Beraz, bilatzen ari zaren Alice Wonderland egiteko, hau leku ona hasiko izan daiteke. Eta gero, hemen ere lotu ahal out , esan, Amazon liburua erosteko, eta abar eta abar. Puntua hemen, berriz ere, ez da hainbeste hori liburutegiko arakatzeko modurik onena da edo une bakoitzerako tresna egokia. Baina egiteko beste era bat da. Eta datu eginez API bat, bidez eskuragarri eraikin bloke oso erraza eginda, zein eduki bilatzeko aukera ematen du, zerbait eraiki ahal izango duzu ahal honen antzeko izan izugarri pertsona batzuk baliotsua. Beraz, hori da ordenatzeko, askoz nahi dudan bezala benetan esan API aurkeztuko dizuegu ra eta zer den azaltzen, ez dago oso bat da stuff sorta eszenak, atzean bertan Besterik ez naiz laburki ukituko Ordena da hau dator, besterik ez delako erabat, beste ikuspegi batetik nola honen antzeko zerbait dagokionez get lekuan jarri? Beraz API bat estandarra da Eduki hau guztia gainazalean. Baina han, lortu Lehenengo gauza egin behar izan genuen Informazio tira zuten elkarrekin liburuak eta irudiak eta topatzea laguntzak, bilduma Dokumentu hainbat Harvard sistemak from. Aleph, VIA, eta OASIS dira sistemen izenak. Eta dute funtsean batean sartu gasbide, prozesatzeko hodi baten. Beraz, lehenik eta, export lortuko dugu Sistema horietako guztietako fitxategiak. Haiek sakabanatu ginen banakako elementuak sartu. Beraz, fitxategi bat, eta horrek gigabyte bat da egin behar dugu, bertan milioi bat edozein erregistro ditu. Beraz moztu egiten dugu banakako elementuak sartu. Ondoren, elementu bakoitzarentzat, bihurtzeko dugu MODS sartu, horietako batzuk delako dira jatorriz MODS, horietako batzuk ez daude. Beraz, horiek guztiak lortu dugu formatu bera izango da. Ondoren daude hainbat aberasteko urratsak, non Informazio gehiago gehitu ditugu datuen eskuragarri liburutegian baino. Beraz, gehitu lehenik behar dugu zer liburutegiak eutsi behar dugu. Pauso baten bidez joan gara stackscore kalkulatzerakoan. Pauso beste batzuk egin beharko metadata gehiago gehituz dagokionez Bildumak zer pertsona gehitu this-- izan liteke Pertsonak sortzen ari elementuak bildumarik. Zer bildumak du dagozkio da? Jendeak nola etiketatu egin Eduki hau iraganean? Ondoren, iragazi duzu, eta mugatu egin duzu erregistroak, zeren aipatu dudan bezala, han erregistro batzuk, baita copyright-arrazoiengatik, ezin dugu marrazteko. Eta gero horiek kargatu dugu izeneko zerbait sartu Solr, eta hori ez da misspelling bat, baina software pieza baten izena da duten bilaketen indexazioa egiten bertan API atzean bilaketa guztiak gidatzen. Eta gero eskura bihurtzen da API, eta jendeak erabil dezake. Beraz, hau nahiko bat bezalakoa da zuzeneko prozesu. Interesgarrienetako bat gauzei buruz da hori ari gara aurre 13 milioi erregistro eta be aurre edo gehiago gertatzen ari gara. Eta kudeatzeko gai izan nahi dugu nahiko moda bat berehala horiek. Denbora luzea behar izaten ditu prozesatu 13 milioi erregistro. Beraz gasbide hori nola da eratu da can-- duzula Asmatzen dut abantaila gasbide, arazoa gara Hemen konpontzen saiatzen da, hau da eraldaketak, guztiak honetan urrats hauek gasbide bana daude. Mendekotasuna ez da. Zuk prozesatzen ari bada liburu bat erregistro bat, ez dago mendekotasun no liburu bestearen arteko dagoela. Beraz, zer egin ahal izango dugu, funtsean, gasbide batean, pausoz pauso, jarri dugu hodeia ilaran sartu. Amazon Web Services egon gertatu dut. Beraz, ez zerrenda bat da, esan, 10.000 elementuak normalizatua izan behar du eta MODS formatu bihurtzen. Eta gora spin dugu zerbitzariei asko nahi dugun bezala, agian 10 zerbitzariak. Eta zerbitzariak horietako bakoitzean besterik eserita dago, ilaran duten itxura, ikusten ez dagoela da bat hori behar da prozesatu, tira ilaran off, prozesatu, eta makilak da hurrengo ilarako orrian. Eta beraz, zer aukera ematen digu aplikatu da egin, funtsean, askoz hardware bezala hau nahi dugun bezala denbora epe oso laburrean arazo datuak azkar bezala prozesatu posible, eta horrek zerbait da hori bakarrik, orain hodei informatika munduan ahal dugun zerbitzariak funtsean xedapen berehala, oso erabilgarria dela. Beraz, ez dugu bat izateko zerbitzari erraldoia inguruan eserita denbora guztian tratamenduari egin hori behin bakarrik gerta liteke aste bat. Beraz, hori da batez ere. Ez dago dokumentazio eskuragarri Liburutegia Cloud Item API URL honetan, egingo den egotea erabilgarri geroago. Eta mesedez, atzera begirada bat hartu ez ezer ikusi behar da, ba al duzue. Berarekin jolastea. Engaina inguruan. Eta zorionez etorri dezakezu Zerbait handiz sortu. Eskerrik asko.