JEFFREY LICHT: Moi. Olen Jeffrey Licht. Ja minä olen täällä puhua teille Harvard Library ja rakennuksen huomisen kirjasto tänään, luulisin. Joten tausta täällä, piki tämän istunnon on lähinnä, että on olemassa paljon kirjallisuustiedot käytettävissä Harvard kirjastoissa. Ja siellä on mahdollisuus, läpi joitakin työkaluja ja projekti, joka on kehitteillä, päästä käsiksi tietoihin ja vie se paikkoihin, Harvard Library ei tee juuri nyt, tehdä uusia juttuja sen kanssa, kokeilu ja leikkiä sen kanssa. Joten puilta tämä on API nimeltään Harvard Library Cloud, joka on avoin Metadata Server, jonka aion puhua nyt. Niin tausta on, että Paljon tavaraa Harvardin kirjastosta. Meillä on yli 13 miljoonaa viitettä kirjaa, miljoonia kuvia, ja tuhansia löytää apuvälineitä, jotka ovat lähinnä kuvaavat asiakirjat kokoelmat, sanoen mitä heissä on, laatikot papereita ja niin edelleen, jotka edustavat yli miljoonaa yksittäisiä asiakirjoja. Ja siellä on myös paljon tiedot, jotka kirjasto on miten sisältöä käytetään, että voisi kiinnostaa ihmisiä jotka ehkä haluavat työskennellä sen kanssa. 

Joten kaikki tiedot kirjastossa on metatiedot. Joten metatiedot on tietoa tietoja. Joten kun puhumme tietoa, joka on saatavilla kirjastosta pilvi, joka on saatavilla, se ei välttämättä itse asiakirjoissa itse, ei välttämättä koko teksti kirjoja tai täyskuvien, vaikka se itse asiassa voi olla kyse. Mutta se on todella tietoa datan. 

Joten voit ajatella luetteloinnin tietoa, puhelun numeroita, aiheita, kuinka monta kopiota kirja on, mitä ovat painokset, mitkä ovat muodoissa, kirjoittajat, ja niin edelleen. Joten siellä on paljon tietoa tiedot kokoelma, joka, itsessään on eräänlainen luonnostaan ​​hyödyllisiä. Ja vaikka jos olet tekee perusteellista tutkimusta, olet ilmeisesti haluat saada todellista tyytyä ja tarkastella tietoja, metatiedot on hyödyllinen kannalta sekä analysoidaan corpus kokonaisuutena, kuten mitkä asiat ovat kokoelma. Miten ne liittyvät? Se auttaa sinua todella löytää muita juttuja, joka on todella päätarkoitus sitä. Piste metatiedot ja luettelo on auttaa sinua löytämään kaikki tietoa, joka on käytettävissä kokoelmista. 

Joten tämä on esimerkki metatietojen kirja Harvard Library. Joten se on siellä. Ja voit nähdä sen oikeastaan ​​kohtalaisen monimutkainen. Ja osa arvosta metatietojen sisällä Harvard Library järjestelmä on, että se on ollut tavallaan Rakennetun kasvoi postimyyjät ja koota ihmiset hakevat paljon asiantuntemusta ja taitoa ja ajattelin sen ajan, joka on paljon arvoa. 

Joten jos katsomaan tämä ennätys Annotated Alice, voit selvittää sinulla otsikko, joka kirjoitti sen, kirjailija, ja kaikki eri aiheista joissa ihmiset ovat luetteloitu sen. Ja voit nähdä siellä myös, vuonna lisäksi paljon hyvää tietoa täällä, siellä on jotkut päällekkäisyyttä. Siellä on paljon monimutkaisuutta, joka on heijastuu metatiedot että sinulla on. 

Joten yksi otsikko tämä kirja on Liisan seikkailut ihmemaassa. Joten tämä on selityksin versio tuon kirjan. Mutta se on myös kutsutaan Annotated Alice, Liisan seikkailut Ihmemaassa koska se on jotain, joka Martin Gardner kirjoitti ja selityksineen kirja. Ja siellä on paljon hienoja tietoa noin logiikka palapelit ja asioita sisällä Alice että olet luultavasti ei tiennyt. Joten sinun pitäisi mennä lukemaan sitä. 

Mutta voit nähdä siellä paljon yksityiskohtia täällä, mukaan lukien tunnisteet, kun se luotiin, mistä se tuli, kannalta Harvardin järjestelmä, ja niin edelleen. Joten tämä on näyte metatietojen tyyppi että saatat nähdä kirjan Harvard Library kokoelma. 

Tämä on jotain aivan muuta. Joten on nimeltään VIA Harvard, joka pohjimmiltaan on luettelointi kuvia ja taide-esineisiin ja visuaalinen asioita koko Harvard, ja lisäämällä joitakin metatietoja heille luokittelemalla ne, ja, joissakin tapauksissa, joka tarjoaa pientä kuvaa että voit ottaa katso jos niin haluavat. 

Joten tämä on esimerkki metatiedot että sinulla on kilpi alkaen, oletettavasti, Alice in Wonderland. Ja voit nähdä siellä vähemmän metatiedot täällä. Se on vain erilainen esine. Ja niin siellä on vähemmän tietoa. 

Sinulla on useimmiten se, että puhelun numero, lähinnä kuka sen loi, - 

Emme tiedä, milloin se on luotu. 

--and otsikko. 

Toinen esimerkki. Tämä on havainto tuki. Joten siellä on kokoelma Lewis Carrollin paperit Harvardissa. Joten tämä kertoo, mitä on, että kokoelma. Joten joku on mennyt läpi ja Katsoin läpi kaikki laatikot ja luetteloitu sen annetaan hieman taustaa, kirjallinen yhteenveto siitä, mitä on täällä. Ja jos katsotte edelleen tässä, tässä jatkuu vielä sivukaupalla ja sivuja, mutta kerron teille mitä kirjaimet ja mitä vuodelta mitä laatikot olemassa koko kokoelma. Mutta tämä on jotain että, jos olet Harvardissa voit mennä ja itse fyysisesti näyttää ylös ja oletettavasti katsomaan. 

Tämä kaikki on siis suuri. Tämä metadata käyttöiän. Se on Harvardin kirjaston järjestelmään. On olemassa työkaluja verkossa, jossa voit voi mennä ja katsoa sitä, ja nähdä sen, ja etsiä sitä. Ja voit leikkaamista ja kuutioi sitä monin eri tavoin. 

Mutta se on todella käytettävissä vain, jos olet ihminen istuu alas klo selain tai jotain tai Puhelimen ja navigoinnin kautta. Se ei ole oikeastaan ​​saatavilla kaikenlaista käyttökelpoista muoti muihin järjestelmiin tai muut tietokoneiden käyttöä, ei järjestelmien kanssa Harvard Library, mutta järjestelmien ulkomaailmaan, juuri muita ihmisiä yleensä. Joten kysymys on, miten voimme annettava se tietokoneet jotta voimme tehdä enemmän mielenkiintoisia juttuja kuin vain selailu sen itse? 

Joten miksi haluat tehdä tämän? On paljon mahdollisuuksia. Yksi on voit rakentaa täysin erilainen tapa selailun sisältöä, joka on saatavilla kautta Harvard Kirjastot. Näytän sinulle yhden myöhemmin nimeltään Stacklife, joka on täysin erilainen ottaa etsivät sisältöä. 

Voisit rakentaa suositus moottori. Joten Harvard Library ei ole liiketoiminnan sanoen pidät tämän kirjan. Sitten mene katsomaan näitä 17 muuta kirjoja, jotka saatat olla kiinnostunut tai nämä 18 muuta kuvaa. Mutta se varmasti voisi olla arvokas ominaisuus. Ja koska metatiedot, se voi olla mahdollista laittaa, että yhdessä. Saatat olla erilaisia ​​tarpeita ehdot etsivät sisältöä, kuten ehkä vaikka työkaluja, ovat käytettävissä, jotka kirjasto tekee käytettävissä, saatat haluta etsiä eri tavalla tai optimoida tiettyä käyttöä varten tapauksessa joka ehkä se on hyvin erikoistunutta. Ehkä on olemassa vain muutamia ihmiset maailmassa, jotka haluat hakea sisältöä tällä tavalla, mutta se Olisi hienoa, jos me voisi anna heidän tehdä sitä. Siellä on paljon analytiikka vain miten ihmiset käyttää sisältöä, joka olisi todella mielenkiintoista tietää, selvittää mitä kirjoja käytetään, mitkä eivät, ja niin edelleen. Ja sitten on paljon mahdollisuus sisällyttää muiden tietojen se siellä Webissä. Joten me have-- 

Esimerkiksi NPR on Kirja-arvostelu segmentti, jos ne haastattelu Kirjoittajat kirjoista. Ja niin se olisi hienoa, jos olisit etsii kirjan Harvardin Kirjasto ja sanot, OK, siellä ollut haastattelussa kirjailija. Mennään katsomaan sitä. Tai siellä Wikipedian sivun, koska arvovaltainen, tieteellinen yhteistyö tästä kirjasta, että te kannattaa vilkaista. 

On nämä tyypit lähteistä hajallaan verkossa. Sekä koota voisi olla paljon hyötyä joku katsot sisältöä, etsivät jotain. Mutta se on myös ei sellainen asia olisit haluavat kirjaston olevan vastuussa menee alas ja jahtaa kaikki nämä eri lähteistä ja kytkemällä ne yhteen koska he muuttuvat jatkuvasti. Ja mitä he ajattelevat on tärkeää toukokuuta olla mitä mieltä on tärkeää. 

Ja vielä enemmän, periaatteessa siellä paljon tavaraa emme ole ajatelleet vielä. Joten jos voimme avata tätä, enemmän ihmiset lisäksi puoli tusinaa, jotka etsivät tämä säännöllisesti voi ajatella ideoita ja hieronta tiedot, ja mitä he haluavat sitä. 

Joten me haluamme tehdä tästä tietoja maailmalle. No, on olemassa pari komplikaatioita. Yksi on se, että tämä metadata on eri järjestelmissä. Se on eri muodoissa. Joten siellä on normalisointi joka täytyy tapahtua, joka normalisointi on prosessi tuo asioita eri muodoissa ja kartoittaa ne yhteen muotoon niin että kentät täsmää. 

On joitakin tekijänoikeuden rajoituksia. Kumma kyllä, luettelo merkintä noin kirja on vastuussa tekijänoikeus. Joten vaikka se on vain saatuja tietoja kirjasta, se on tekijänoikeussuojan. Ja riippuen siitä, kuka oikeastaan luotu metatiedon, voi olla rajoituksia, jotka voi jakaa sitä, samanlainen to-- 

En tiedä. Se voi olla tai ei ole samanlainen kuin tilanne song lyrics, esimerkiksi. Joten me kaikki tiedämme, miten astiat pois. Joten sinun täytyy kiertää tätä kysymystä. 

Ja sitten toinen pala on että siellä on paljon tietoa. Joten jos olen joku, joka haluaa työskennellä tietojen kanssa tai on viileä idea, tekemisissä 14 miljoonaa kirjaa minun laptop voisi olla ongelmallista ja vaikea hallita. Joten haluamme vähentää esteitä ihmisille pystyä toimimaan tietoihin. 

Joten lähestymistapaa, toivottavasti osoitteet kaikki nämä huolenaiheet on kaksi osaa. Yksi rakentaa alusta, joka vie tiedot kaikista näiden eri lähteistä ja pahentaa se, normalisoi, rikastaa sitä, ja merkkeihin saataville yhteen paikkaan. Ja se saattaa kautta julkinen API, että ihmiset voivat soittaa. 

Joten API on Application Programming Interface. Ja se tarkoittaa lähtökohtaisesti päätepiste, että järjestelmä tai tekniikka voi soittaa ja saada tietoja takaisin rakenteellisesta tavalla että sitä voidaan käyttää. Joten se ei ole riippuvainen menossa verkkosivuilla ja kaavinta tiedot pois sitä, esimerkiksi. 

Joten tämä on kotisivu Kirjasto Cloud Tuote API, joka on lähinnä sen versio kaksi. Joten se toinen iteroinnin yrittää tehdä kaiken tämän tiedon käytettävissä maailmalle. Joten se http://api.lib.harvard.edu/v2/items. Ja juuri rikkoa tämän alas vähän, mitä tämä tarkoittaa on se, että tämä on versio kaksi API. On versio yksi, joka En aio puhua. Mutta on versio yksi. 

Ja jos soitat tämän API, saat kohteita. Ja osa ajatuksen API on API on sopimus. Se on jotain, joka on aio muuttaa. Niinpä esimerkiksi, - 

Ja syy on se, että jos minä rakentaa jonkinlainen järjestelmä aikoo käyttää kirjaston pilvi API näyttämään kirjoja tai auttaa ihmisiä löytämään tietoa ainutlaatuisia tapoja, mitä emme halua tapahtuvan on meille mennä muuttaa että API toimii, ja yhtäkkiä kaikki asunnot loppukäyttäjän puolella. Joten osa jos teet API käytettävissä maailmalle, se on hyvä käytäntö laittaa versionumero niin ihmiset tietää, mitä versiota he käsittelevät. 

Joten jos päätämme löytää parempi tapa tehdä nämä tiedot, voisimme vaihtaa sen soittaa, että versio kolme. Joten jokainen, joka on edelleen käytössä version kaksi, jotka silti toimivat. Mutta version kolme olisi kaikki uudet jutut. 

Joten tämä on API, mutta tämä todella näyttää URL. Ja niin mitä tämä on esimerkki on mitä kutsutaan lepo API, joka on saatavilla yli vain säännöllisesti web-yhteyden. Ja voit itse Siirry sen selaimessa. 

Joten tässä olen juuri avannut Firefox ja mennyt api.lib.harvard.edu/v2/items. Ja niin mitä saan tässä pohjimmiltaan ensimmäinen sivu tulosten koko joukko kohteita, jotka meillä on. Ja se on täällä XML-muodossa. Ja se on myös ollut prettified Firefox. Se ei oikeastaan ​​ole kaikkia näitä pikku laajeneva ja supistuva doohickeys täällä. Tämä on tavallaan mukavampaa versio tapa tarkastella sitä. 

Mutta mitä tämä kertoo meille on Olen pyytänyt kaikkia kohteita. Joten on 13289475 eriä. Ja Etsin ensin 10 alkaen peruslukemilla koska tietotekniikassa me aina alkavat nollasta. Ja mitä minulla on täällä, jos minulla vain romahtaa Tässä näet minulla 10 kohdetta. 

Ja jos minä katsomaan kohteen, voin nähdä, että minulla tietoja. Ja tämä on mitä kutsutaan MODS muodossa. Ja niin aion vaihtaa tänne hetkeksi. OK. 

Joten etsi jotain erityisenä, koska ensimmäinen erä, joka sattuu keksimään, kun katsot läpi koko kokoelma on määritelmän mukaan satunnainen. Joten etsiä joitakin munkkeja. Oh. 

OK. Niin munkkeja. Joten löysimme on 80 tuotetta kokoelma, joka viite munkkeja. Etsimme ensimmäisen 10 niistä. Nyt voit nähdä täällä niin, että Sanoin Etsin munkkeja, Olen vain lisännyt jotain kyselymerkkijonossa URL. Joten Q on yhtä munkkeja, jotka voit nähdä hieman helpommin täällä. 

Ja tämä tarkoittaa periaatteessa sitä siellä spec API, joka määritellään, mitä kaikkia Näiden parametrien tarkoittaa. Ja tämä tarkoittaa aiomme etsi kaiken munkkeja. 

Joten ensimmäinen erä tässä meillä voit nähdä otsikko on Donuts, ja siellä on tekstitys nimeltään Amerikkalainen Passion, joka on, luulisin, tarkoituksenmukaista. On paljon different-- Kun saat pisteen saada tietoja, on olemassa paljon erilaisia formaatissa, että voit saada sen. Ja on eri vahvuuksia ja heikkoudet niitä kaikkia. Joten tämä yksi, voit nähdä täällä, tämä muoto on hyvin rikas. Ja se vakioitu. 

Joten siellä on erityinen osasto kenttä, tekstitys kenttään. On vaihtoehtoinen otsikko, amerikkalainen Passion. On nimi liittyy siihen. Tyyppi resurssi on tekstiä. Siellä on paljon tietoa täällä tässä muodossa. 

Mutta on olemassa joukko eri muodoissa. Joten mitä me olimme vain katsot on muotoa nimeltään MODS, joka tarkoittaa Metadata Object Kuvaus Service, mahdollisesti. Olen oikeastaan ​​ole aivan varma S. Mutta se on melko monimutkainen muoto. Se oletusesitys. 

Mutta se yksi, joka pitää rikkaus kaikki tiedot että kirjasto on, koska se on hyvin lähellä sitä, mitä Kirjasto käyttää sisäisesti. Se on standardi, joka on käytetään eri puolilla maata, ympäri maailman tieteellisten kirjastojen. Ja se on erittäin yhteentoimivia. Joten jos sinulla dokumentti joka on MODS muodossa, voit antaa, että joku muu joiden järjestelmät ymmärtävät MODS, ja he voivat tuoda sen. Joten se on vakio. Se on hyvin määritelty, hyvin erityinen. Ja että se tekee siitä yhteentoimivien koska jos joku sanoo, Tämä on vaihtoehtoinen otsikko ennätys, kaikki tietävät, mitä se tarkoittaa. Kääntöpuoli, se on hyvin monimutkainen. 

Joten jos olet katsomaan Tämän ennätys täällä, jos haluan vain saada otsikko tämän asiakirjan, Tämän kirjan, joka on luultavasti Donuts, Amerikkalainen Passion, jäsentämiseen se ulos on vähän mukana. Sekä katsoo, että toinen muodossa nimeltä Dublin Core, joka on paljon, paljon yksinkertaisempi muoto. 

Ja niin näet täällä, ei ole mitään otsikko, alaotsikko, varajäsen otsikko. On vain otsikko, Donuts, amerikkalainen Passion, ja toinen nimike, amerikkalainen Passion. Joten kun etsit missä muodossa Haluatko saada tietoja ulos, Paljon riippuu siitä, miten aiot käyttää sitä. Käytätkö varten yhteentoimivuuden vai oletteko haluat jotain yksinkertaista, että saattaa olla helpompi työskennellä? 

Kääntöpuoli, paljon yksityiskohdat päästä tavallaan squished alas. Saatat menettää vivahteita mitä tietyn alan välineet jos olet tekemisissä Dublin Core, johon ei saisi kanssa MODS. Joten ne ovat kaksi formaatit saat pois API. Ja pohjimmiltaan pidämme se kulissien MODS. Mutta voimme antaa sinulle sen MODS ja Dublin Core ja mitään muuta kuin hyvin. Muut huomioon, kun etsit data on saat sen joko JSON, joka sanoista JavaScript Object Notation, tai XML, joka tarkoittaa Extensible Markup Language. Ja nämä tiedot esityksiä sekä on täsmälleen samat tiedot, täsmälleen samoilla aloilla. Mutta he vain syntaktisesti eri. 

Joten tämä on a-- No, katsotaanpa vain vaihtaa. Joten tämä on meidän kysely munkkeja XML-muodossa. Jos minä vain vaihtaa tämän olevan JSON, Näen sen näyttää erilaiselta. Nyt tämä on sama sisältö, mutta erilainen rakenne. On vähemmän kulmasulkeet. On vähemmän monisanainen. 

Ja tämä on formaatti, että jos työskentelevät web-ympäristöön, olet todennäköisesti menossa haluta käyttää, koska yksi on mukavia asioita JSON on se on yhteensopiva JavaScript. Joten jos olen kirjallisesti web app, voin vetää JSON ja vain työtä sen kanssa suoraan. Katsoo XML, se hieman monimutkaisempi. Joten jälleen, nämä ovat hyödyllisiä. He vain ovat erilaisia ​​käyttötapauksia missä ihmiset saattavat haluta käyttää niitä. OK. Joten takaisin API. Joten voimme etsiä for-- 

Annan esimerkin etsivät munkkeja. Voimme myös etsiä vain Erityisesti alan sisällä täällä. Joten sen sijaan etsivät koko levy, Voin vain etsiä otsikon kenttään. Ja niin nyt on 25 asioita, jotka on munkkeja otsikossa, joista yksi on noin palauttaminen kosteikkojen hallinta reiän donitsi ohjelma, joka on luultavasti ei välttämättä mitä etsimme sillä kun me etsit munkkeja. 

Voit myös, kun olet tekemisissä API-- 

Osa ottaa API antaa ihmiset saavat suuria tietomääriä. Ja on pari eri työkaluja, joilla voit tehdä sen. Yksi on, hyvin yksinkertaisesti, voit voi selata tietoja. Joten aivan kuin teet kyselyn kautta web-käyttöliittymä, voit katsoa etusivulla, sivu kaksi, sivu kolme. Voit tehdä saman asia läpi API. Sinun tarvitsee vain olla nimenomaisesti, miten teet sen. 

Niinpä esimerkiksi, jos etsin minun ensimmäinen kysely täällä, jos mulla etsiä asioita munkkeja otsikossa, voin sanoa, ja raja on yhtä suuri kuin 20, mikä tarkoittaa, antaa minulle ensimmäinen 20 kirjaa, ei ensimmäinen 10, joka on oletuksena, koska en halua katsoa 20 kerrallaan. Tai voin sanoa, asettaa alkaa sama 20 ja raja vastaavat 20, joka antaa minulle kirjaa 21 kautta 40. 

Joten kai asia ottaa pois tässä että käytämme kyselymerkkijonojen asettaa parametrit kyselyn. Ja sen avulla voit ohjaus mitä saat takaisin. 

Toinen työkalu, jota voit käyttää, - 

Ja tämä on todella hyödyllinen ehdot tutkia tietoja. 

--is jotain kutsutaan faceting. Joten termi faceting on ei välttämättä yhteistä. Mutta te kaikki nähneet sitä ennen. Jos katsomaan Amazon, esimerkiksi ja teet haun munkkeja kirjoja, täällä heillä sarjan kirjoja, ja he ryhmitelty luokan, ja saat eri luokkaan, ja kuinka monta kirjaa kussakin luokassa näy. 

Joten tämä on periaatteessa puoli. Otat kaikki kirjat, 1800 kirjoja, jotka vastaavat munkkeja Amazon. 12 heistä ovat aamiainen luokkaan. 21 leivonnaiset ja leivontaan, ja niin edelleen ja niin edelleen. 

Joten tämä on todella hyödyllinen työkalu tutustumiseen sisältöä kirjaston sisällä sekä koska kun katsot puoli, se antaa sinulle käsityksen siitä, mistä aiheista olemassa, kuten millaiset aiheet ovat suosituimpia omassa kyselyn asetettu. Ja se auttaa sinua ajaa pois ja tutkia. Joten voimme tehdä saman. 

Jos haluamme käyttää API ja katsoa puolia, lisäämme uuden parametrin ystävämme kyselymerkkijonossa. Joten puolia on yhtä pilkulla erotettuna lista, mitä haluamme fasettia. Joten yksi puolista voidaan edellyttää. Toinen voisi olla kieli. Ja niin jos me juoksemme, että kyselyn, me get-- Se näyttää melko sama täällä. Mutta olemme loppuun lisätään luettelon joukko puolia. Joten meillä on puoli nimeltään aihe. Joten tämä kertoo meille, että jos katson minun 80 tuloksia donitsi kyselyn, 13 heistä on altista Yhdysvallat. Kolme on aihe munkkeja. Kolme on aihe kosteikkojen palauttaminen, joka voi olla meidän reikä donitsi. Kaksi heistä, Simpsonit ja niin edelleen ja niin edelleen. 

Joten tämä voi olla hyödyllistä, jos haluat rajata hakua. Se voi auttaa sinua tekemään niin. Varsinkin, jos sinulla on yli, sanovat, 80 tuloksia. 

Samoin myös pyysi varten puolia kielen. Joten jos katsomme meidän tuloksia, näemme 76 heistä ovat Englanti, neljä ranskaksi, kaksi espanjaksi, kaksi, luulen että määrittelemätön tai tuntematon, Hollannin ja latina. Joten mielestäni Latinalaisen donitsi seurauksena uudelleen, ei ole mitään tekemistä leivonnaisia. Mutta siellä mennään. 

Joten tämä on tavallaan näyttämällä miten voit vetää sisältöä takaisin alkaen API juuri läpi web-selain, joka on suuri. Mutta se ei oikeastaan ​​mitä olisit yleensä käyttäen API sitä. Joten yksi esimerkki siitä, miten voisi itse tehdä tämä on olen kirjoittanut Super pieni ohjelma, joka taas tekee minun donitsi haku ja valitsee pari kentät ja näyttää ne taulukossa. Joten tämä on hyvin paljon samaa sisältöä, että me vain sahaa muutamia kenttiä vedetty ulos. Joten luettelo otsikot, sijainti, mitä kirja on noin, kieli, ja niin edelleen ja niin edelleen. 

Joten miten tämä todella tapahtui, koska Kai meidän täytyy tarkastella joitakin koodi, is-- 

Tässä meillä on yksinkertainen HTML sivu, joka näyttää tekstin, Tervetuloa kirjastoon pilvi ja näyttää sitten taulukko tuloksia. Ja on ilmeisesti ole tuloksia taulukko kun sivu latautuu. Mutta mitä me teemme on, ensinnäkin, me Noudet- kirjasto nimeltään jQuery, joka on pohjimmiltaan JavaScript-kirjaston, joka tekee erittäin helppo manipuloida JavaScript natiivisti, HTML, ja luoda web-sivuja, client-side logiikan ja web-sivuja. 

Joten mitä meillä täällä on jQuery on menetelmä nimeltä Get, joka olennaisesti menee URL, joka tässä tapauksessa, on tämä tuttu näköinen URL. Ja sitten saavat sisältöä että URL ja suorita toiminto sitä. Joten sanoimme mennä api.lib.harvard / edu. Etsi munkkeja. Anna meille 20 kirjaa. Ja sitten suorittaa tämän toiminnon, joka Olen valinnut, kulkee sen tiedot. Ja tiedot on JSON että sai palasi API. 

Ja sitten me sanomme, kyseisen data siellä kentän nimeltään erä. Ja vaikka minä menen katsomaan takaisin yksi näistä tuloksista, jotka on täällä, siellä on jotain called-- 

No, sitä kutsutaan kohteen. Niin, että voi olla, että. Ja mitä se tekee on se menee läpi kunkin kohteen ja sitten pyytää toista toiminto kunkin kohteen. Ja että toiminto pohjimmiltaan ottaa arvo alkion, joka on lähinnä yksittäisten ennätys ja voimme vedä otsikko, kattavuus ja kieli. 

Joten me kutsumme toiminto joka Tuote että saimme takaisin API. Ja jos vain katsomaan Tämän pala täällä, mitä teemme on Luomme merkkijono, joka on lähinnä joitakin HTML markup pöydän ympärillä, jossa value.title, mikä on otsikko esine, value.coverage, joka on kattavuus, - 

Ja me teemme tarkastus Täältä näet kuka määrittelemätön ja piilottamalla sen, jos se sanoo määrittelemätön, koska emme ole todella kiinnostunut että. 

--and sitten kieli. Ja sitten mitä me olemme tekemässä liittämällä että pöytään, joka on tunnistaa tämän merkkijono täällä. Ja miten jQuery toimii mitä tämä sanoo on etsiä pöydän idea Tulokset ja lisää tämä teksti siihen. Ja tämä on pöytä idea tuloksia. Joten mitä voit päätyä kanssa on tämä sivu täällä. Ja jotta katsella source-- No, lähde ei ole oikeastaan päivitetään kun se tapahtui. Joten voit nähdä todellinen tulokset taulukossa täällä kuitenkin. 

Niin, että on vain yksinkertainen esimerkki tekee hyvin perus kyselyn vastaan ​​API ja näytetään tiedot muulla muodostavat, ja ei tee mitään liian fancy. Nyt toinen esimerkki on kuin sovellus kirjoitettu David Weinberger koska demo tästä, joka olennaisesti näyttää miten voit mash up tuloksia olet saada kirjastosta pilvi API kanssa, sanovat, Google Books. 

Ja ajattelu on, että voin ajaa kyselyn vastaan ​​Google Books, saat koko tekstin haku, saada joitakin tuloksia takaisin, selvittää mitkä näistä kohdetta todella olemassa Hollis, kirjastojärjestelmä, ja sitten antaa minulle linkkejä takaisin näitä kohteita. Joten jos etsin, se oli synkkä ja myrskyinen yö, minä saada takaisin kasan tuloksia Google, ja sitten yksi tulos joka on Wrinkle in Time. Ja nämä ovat linkkejä kirjoja, jotka ovat olemassa sisällä Harvardin Kirjastot. 

Joten kai tässä on ei niin paljon, että tämä voidaan tai ei olla niin, että haluat etsiä kirjastosta, mutta se on täysin erilainen tavalla, joka ei ollut käytössäsi ennen, kuin sinulla ei ollut mitään tapaa tehdä koko tekstin hakee kirjoja, että jopa olivat osa Harvardin kirjaston järjestelmään. Nyt tämä on tapa että voit tehdä. Ja voit näyttää ne tahansa muodossa haluat. Joten tässä on, pohjimmiltaan, olemme uusia tapoja ihmisille työskennellä tiedot. 

Toinen pala kirjaston pilvi on, että se auttaa paljastaa joitakin käyttötiedot että kirjasto on. Joten jos menet kirjastoon, ja etsit kirjoja, et välttämättä todella on ajatus, kaikki kohteet Erityisesti aihe, mitä ovat ihmisiä yhteisö, onko se määritellään Harvardin tai maan tai oman luokan, Mitä he ovat löytyi eniten hyötyä? Ja kirjasto on itse asiassa ton tietoa siitä, mitä on kaikkein hyödyllinen, koska jos on paljon ihmiset tsekata kirja, joka kertoo jotain. On ollut jostain syystä he haluavat tarkistaa sitä. Monet ihmiset laittaa sen varaukseen. 

Jos se on varallaololuetteloon paljon luokkien, joka kertoo jotain. Jos tiedekunnan jäsenet ovat tarkkailun se ulos paljon ja opiskelijoista eivät ole, että kertoo minulle jotain. Kääntäen, että myös kertoo jotain. Joten se olisi todella mielenkiintoista esittää, että tietoa siellä ja anna ihmiset käyttää sitä auttaa heitä löytämään työskentelee kirjastojärjestelmä. Kääntöpuoli tästä on joitakin vakavia yksityisyyden huolta, koska yksi ydin periaatteista kirjasto ei emme aio olla kertomatta ihmiset mitä muut ihmiset lukevat. Ja vaikka te sanotte tästä Kirja kassalla neljä kertaa tietyssä kuussa, , joita voidaan käyttää linkin takaisin tiettyyn henkilön de-anonymisoivan tiedot ja selvittää kuka tarkistanut sen. Niin siten, että voimme avoid-- Tavalla, että voimme yrittää poimia Joissakin signaalin kaikki tiedot loukkaamatta kenenkään huoli yksityisyydestä on olennaisesti katsomme 10 vuotta käyttötietoja, - 

Joten se on ohi pitkäksi aikaa. 

--and sanovat, OK, katsotaanpa miten monta kertaa tätä työtä käytettiin, ja joka tällä kaudella aikaa, ja sitten pohjimmiltaan antaa takaisin numero, jota kutsumme pino pisteet, joka pohjimmiltaan edustaa, kuinka paljon se on käytetty. Ja että number-- Paljon erilaisia ​​laskelmia mennä että määrä. --but se on hyvin karkea metrinen, joka antaa sinulle jonkinlaisen käsityksen siitä, miten yhteisö voi arvostaa tätä työtä. 

Ja niin toinen tavallaan jopa lisää konkreettisempi sovellus joka hyödyntää tästä on jotain nimeltään Stacklife, joka on itse asiassa saatavilla tärkein Harvardin Kirjasto portaali. Joten menet library.harvard.edu. Näet useita eri tapoja etsiä kirjastosta. Ja yksi niistä on nimeltään Stacklife. 

Ja tämä on sovellus, joka selaa sisällön kirjaston, mutta on täysin rakennettu päälle näitä API. Joten ei ole mitään erityistä tavaraa käynnissä kulissien takana. Ei ole pääsyä tietoja, joita sinulla ei ole. Se käyttää API antaa sinulle kanssa täysin eri selailu kokemus. 

Joten jos etsin Alice Ihmemaassa tässä tapauksessa, Saan tuloksen, joka näyttää tämä, joka on melko much-- 

Se on hyvin samanlainen kuin kaikki muut hakua saatat tehdä, paitsi tässä tapauksessa olemme ranking kohteita stackscore, joka antaa sinulle jonkinlaisen käsityksen siitä, kuinka suosittuja nämä erät olivat yhteisössä. Ja niin selvästi, Alice in Wonderland Walt Disney on erittäin suosittu. Mutta voit myös nähdä neljän parhaan tässä ovat ne, et ehkä actually-- 

Asiat, jotka ovat kovassa käytössä, mutta et saa heti yhteyden Alice in Wonderland. Joten meidän vanha ystävä Annotated Alice on täällä. Voin siis katsomaan sitä. Ja nyt, mitä olen etsimässä kello on pohjimmiltaan asetettu of-- Voin olla Annotated Alice täällä. Minulla on tietoja. Ja minulla on myös stackscore on, tässä tapauksessa 26. Ja tämä kertoo minulle tavallaan karkeasti miten saimme tämän stackscore, kuten kuka Tarkistin asian, kuten miten monta kertaa se oli kassalla, kuten tiedekunnan tai undergrads, miten monta kappaletta kirjastossa, ja niin edelleen ja niin edelleen. 

Ja voit myös tarpeeksi kiinnostava täällä, selata pinot käytännössä. Joten tietoja täällä, tämä näyttää sinulle tavallaan virtuaalisen edustus mitä hyllyn voimin näyttää jos ottaisi kaikki kirjaston tilojen ja laittaa ne yhteen yhtä ääretön hyllylle. Ja kiva juttu on se, että me can-- 

Ensinnäkin, metatietoa nämä kirjat usein kertoo, kun se julkaistiin. Se kertoo, kuinka monta sivua siinä on. Se saattaa kertoa mitat. Voit siis nähdä, että heijastuu täällä kannalta koko kirjoja. 

Ja sitten voimme käyttää pino pisteet korosta kirjoja, jotka ovat suurempia pino tulokset. Joten jos se on tummempi, se tarkoittaa, että, oletettavasti, sitä käytetään useammin. Joten tässä tapauksessa, olen menossa arvata, että tämä on versio Alice in Wonderland että on hyvin yleisesti käytetty ja eniten näytetty, kirjasto on eniten kopioita. Joten jos etsit Alice in Wonderland, tämä voisi olla hyvä paikka aloittaa. 

Ja sitten täällä voit myös linkittää ulos vaikkapa Amazon ostaa kirjan, ja niin edelleen ja niin edelleen. Kohta täällä taas ei ole niin paljon, että tämä on paras tapa selata kirjastoa tai oikea työkalu joka lähtöön. Mutta se on toinen tapa tehdä se. Ja tekemällä tiedot kautta API, joka on tehty hyvin yksinkertainen rakennuspalikoita, jonka avulla voit etsiä sisältöä, voit rakentaa jotain näin, että voi tavattoman arvokas joitakin ihmisiä. 

Niin, että on tavallaan, niin paljon kuin haluan sanoa todella, mitä API on ja mitä se paljastaa, siellä on koko nippu tavaraa kulissien takana, joka Olen juuri menossa käsitellä lyhyesti vain koska se tavallaan tulee tässä täysin eri kulma suhteen, miten tekee jotain tällaista päästä laittaa paikalleen? 

Joten API on vakio rajapinta kaikki tämän sisällön. Mutta saada sitä siellä, Ensimmäinen asia, joka meidän oli pakko tehdä oli vetää yhteen tietoa Kirjojen ja kuvien ja löytää apuvälineitä, kokoelma asiakirjan eri Harvardin järjestelmiin. Aleph, VIA, ja OASIS ovat nimet järjestelmissä. Ja he pohjimmiltaan mennä putki, jalostus putki. 

Joten ensinnäkin, saamme vienti tiedostoja kaikista näistä järjestelmistä. Me jakaa ne yksittäisiä kohteita. Joten meillä on tiedosto, joka on gigatavu, joka on miljoona kirjaa sen. Joten me jakaa sen ylös yksittäisiä kohteita. Sitten kunkin kohteen, me muuntaa sen osaksi MODS, koska jotkut näistä ovat natiivisti MODS, jotkut niistä eivät ole. Joten saamme heidät kaikki olla samassa muodossa. Sitten on olemassa erilaisia rikastamiseen vaiheet, joissa lisäämme tietoa data kuin oli saatavilla kirjastosta. Joten meidän täytyy lisätä, ensinnäkin meillä on mitä kirjastoja pidä sitä. Käymme läpi vaihe laskettaessa stackscore. Käymme läpi toisen vaiheen lisäämällä metatiedot kannalta mitä kokoelmia ihmisiä olisi voinut lisätä this-- 

Ihmiset luovat kokoelmia kohteita. Mitä kokoelmat se kuuluu? Miten ihmiset tagged Tämän sisällön aikaisemmin? Sitten suodattaa, ja voit rajoittaa kirjaa, koska kuten mainitsin, siellä on joitakin kirjaa, että koska tekijänoikeus syistä emme voi näyttää. Ja sitten me ladata niitä jotain kutsutaan Solr, joka ei ole kirjoitusvirhe, mutta on nimi pala ohjelmisto joka tekee hakuindeksointia, joka ajaa kaikki haku takana API. Ja sitten se tulee saataville API, ja ihmiset voivat käyttää sitä. 

Joten tämä on kuin melko suoraviivainen prosessi. Yksi mielenkiintoinen asioita siitä on että olemme tekemisissä 13 miljoonaa levyä ja aiomme olla tekemisissä tai enemmän. Ja haluamme pystyä käsittelemään nämä suhteellisen nopeaa muotia. Se kestää kauan jalostaa 13 miljoonaa kirjaa. 

Joten miten tämä putki on perustettu on, että can-- Oletan etu putki, ongelma, että olemme yritetään ratkaista täällä, on se, että kaikki muunnokset, kaikki nämä vaiheet tässä putki ovat erotettavissa. Ei ole riippuvuutta. Jos käsittely kirjaa yhden kirjan, ei ole mitään riippuvuutta että välillä toinen kirja. 

Joten mitä voimme tehdä, on periaatteessa, kussakin vaiheessa valmisteilla, laitamme sen jonoon pilvessä. Satuin olemaan Amazon Web Services. Joten siellä on luettelo, sanoa, 10000 kohdetta, että täytyy olla normalisoitu ja muunnetaan MODS muotoon. Ja me spin niin monta palvelimia kuin haluamme, ehkä 10-palvelimia. Ja jokainen näistä palvelimia vain istuu siellä, näyttää, että jono, näkee, että on olemassa yksi, joka tarvitsee käsiteltävä, vetää sen pois jonosta, prosessoi sen ja sauvat se seuraavalla jonossa. 

Ja mitä sitten, jonka avulla voimme tehdä on soveltaa pääasiallisesti, niin paljon laitteita kuin haluamme tämän ongelma hyvin lyhyessä ajassa käsitellä tietoja niin nopeasti kuin mahdollista, mikä on jotain, että vain, nyt maailman cloud computing voimme säännös palvelimet olennaisesti välittömästi, että hyödyllinen. Joten meillä ei tarvitse olla jättiläinen palvelin istumisesta kaikki aika tehdä käsittelyyn että voi tapahtua vain kerran viikossa. 

Niin, että on useimmiten se. On asiakirjat saatavilla kirjastolle Cloud Tuote API Tämän URL, joka saataville myöhemmin. Ja mene katsomaan se, onko siellä jotain, sinulla ideoita. Leiki sen. Pelleillä. Ja toivottavasti voit tulla kanssa jotain suurta. Kiitos.