JEFFREY Licht: Hi huko. Mimi nina Jeffrey Licht. Na mimi niko hapa kuzungumza na wewe kuhusu Harvard Library na kujenga kesho maktaba leo, mimi nadhani. Hivyo background hapa, lami kwa ajili ya kikao hiki kimsingi ni kwamba kuna mengi ya data bibliographic inapatikana katika maktaba Harvard. Na kuna nafasi, kupitia baadhi ya zana na mradi hiyo kuwa na maendeleo, ili kupata habari na kuchukua kwa maeneo ambayo Harvard Library si kufanya sasa hivi, kufanya mambo mapya na hayo, majaribio na kucheza karibu na hiyo. Hivyo hatua ya kuingia ndani ya hii ni API kuitwa Harvard Library Cloud, ambayo ni wazi metadata server, ambayo nitazungumzia sasa. Hivyo background ni kwamba kuna mengi ya mambo katika maktaba Harvard. Tuna zaidi ya milioni 13 bibliographic kumbukumbu, mamilioni ya picha, na maelfu ya misaada kutafuta, ambayo kimsingi nyaraka kuelezea makusanyo, kusema nini ndani yao, masanduku ya karatasi na kadhalika kwamba kuwakilisha juu ya milioni nyaraka binafsi. Na pia kuna mengi ya habari kwamba maktaba ina kuhusu jinsi ya maudhui ni kutumika kwamba inaweza kuwa ya manufaa kwa watu ambao wanaweza wanataka kufanya kazi na yake. Hivyo wote wa habari maktaba ina metadata. Hivyo metadata ni data kuhusu data. Hivyo wakati sisi majadiliano juu ya habari kwamba inapatikana kwa njia ya maktaba wingu hiyo inapatikana, ni si lazima nyaraka halisi wenyewe, si lazima full Nakala ya vitabu au picha kamili, ingawa kwamba kweli inaweza kuwa kesi. Lakini ni kweli habari kuhusu data. Hivyo unaweza kufikiria cataloging habari, namba ya simu, masomo, nakala ngapi ya kitabu kuna, nini matoleo, ni nini muundo, waandishi, na kadhalika. Hivyo kuna habari nyingi kuhusu habari katika ukusanyaji kwamba, yenyewe, ni aina ya asili muhimu. Na ingawa kama wewe ni kufanya utafiti wa kina, wewe ni wazi wanataka kupata halisi yaliyomo yenyewe na kuangalia data, metadata ni muhimu katika suala la wote kuchambua corpus kwa ujumla, kama mambo ni katika ukusanyaji. Jinsi gani wao yanahusiana? Ni husaidia kweli kupata mambo mengine, ambayo ni kweli lengo kuu yake. hatua ya metadata na catalog ni kukusaidia kupata yote habari kwamba inapatikana ndani ya makusanyo. Hivyo hii ni mfano wa metadata kwa ajili ya kitabu katika maktaba Harvard. Hivyo ni huko. Na unaweza kuona ni kweli kiasi tata. Na sehemu ya thamani ya metadata ndani ya mfumo wa Harvard Library ni kwamba imekuwa ni aina ya kujengwa na catalogers na walikutana na watu kuomba mengi ya utaalamu na ujuzi na mawazo yake baada ya muda, ambayo ina mengi ya thamani. Hivyo kama wewe kuangalia rekodi hii kwa Annotated Alice, unaweza kupata nje nimepata cheo, ambaye aliandika, mwandishi, na masomo yote tofauti ambayo watu kuorodhesha ndani. Na unaweza kuona kuna pia, katika Mbali na habari nzuri nyingi hapa, kuna baadhi ya kurudia. Kuna mengi ya utata kwamba yalijitokeza kwa njia ya metadata kwamba una. Hivyo cheo moja ya kitabu hiki ni Adventures Alice katika Wonderland. Hivyo hii ni zenye maelezo toleo la kitabu hicho. Lakini pia hujulikana Annotated Alice, Adventures Alice ya katika Wonderland kwa sababu ni kitu ambacho Martin Gardner aliandika na Annotated kitabu. Na kuna mengi ya habari kubwa kuhusu puzzles mantiki na mambo ndani ya Alice kwamba pengine hawakujua juu. Hivyo unapaswa kwenda kusoma. Lakini unaweza kuona kuna mengi ya undani hapa, ikiwa ni pamoja na vitambulisho, wakati iliundwa, ambapo alifika kutoka, katika suala la Harvard mfumo, na kadhalika. Hivyo hii ni sampuli ya aina ya metadata kwamba unaweza kuona kwa kitabu katika Mkusanyiko Harvard Library. Hii ni kitu tofauti kabisa. Kwa hiyo, kuna mfumo uitwao VIA Harvard, ambayo kimsingi ni akaorodhesha picha na malengo ya sanaa na mambo ya Visual katika Harvard, na kuongeza baadhi ya metadata kwao, kuainisha yao, na katika baadhi ya kesi, kutoa images ndogo thumbnail kuwa unaweza kuchukua kuangalia kama hivyo unataka. Hivyo hii ni mfano wa metadata kwamba una kwa sahani kutoka, labda, Alice katika Wonderland. Na unaweza kuona kuna metadata chini hapa. Ni tu aina tofauti ya kifaa. Na hivyo kuna habari kidogo. You zaidi na ukweli kwamba, wito simu, kimsingi aliye Muumba yake, - Hatujui wakati iliundwa. --and cheo. Mfano mwingine. Hii ni misaada kutafuta. Hivyo kuna mkusanyiko wa Lewis Karatasi Carroll ya saa Harvard. Hivyo hii inaeleza nini ni katika ukusanyaji hiyo. Hivyo mtu aliyepata kupitia na inaonekana kwa njia ya masanduku yote na kuorodhesha yake, kutokana na baadhi ya background, imeandikwa muhtasari wa nini hapa. Na kama wewe walikuwa kuangalia zaidi katika hii, unaendelea kwa kurasa na kurasa na kurasa, lakini atakuambia herufi gani na nini tarehe kutokana na kile masanduku kuwepo katika ukusanyaji. Lakini hili ni jambo kwamba, kama uko katika Harvard, unaweza kwenda na kwa kweli kimwili kuangalia up na, pengine, tuangalie. Hivyo hii ni makuu yote. Metadata huu muhimu. Ni katika mfumo Harvard Library. Kuna zana online ambapo unaweza kwenda na kuangalia saa hiyo, na kuona, na kutafuta yake. Na unaweza kipande na kete katika kura ya njia tofauti. Lakini ni kweli inapatikana tu kama wewe ni binadamu kukaa chini katika mtandao browser yako au kitu au simu yako na punde kwa njia hiyo. Ni kweli inapatikana katika aina yoyote ya usable mtindo kwa mifumo mingine au kompyuta nyingine kutumia, si kwa mifumo ya ndani ya Harvard Library, lakini mifumo katika dunia ya nje, tu watu wengine kwa ujumla. Hivyo swali ni, ni jinsi gani sisi kufanya hivyo inapatikana kwa kompyuta ili tuweze kufanya zaidi ya kuvutia mambo nayo kuliko tu kuvinjari wenyewe? Hivyo ni kwa nini unataka kufanya hili? Kuna mengi ya uwezekano. Moja ni unaweza kujenga kabisa njia tofauti ya kuvinjari maudhui ambayo inapatikana kupitia Maktaba Harvard. Mimi nitakuonyesha moja baadaye kuitwa Stacklife, ambayo ina tofauti kabisa kuchukua kuangalia kwa maudhui. Unaweza kujenga injini mapendekezo. Hivyo Harvard Library si katika biashara ya kusema, wewe kama kitabu hiki. Kisha kwenda kuangalia hayo mengine 17 vitabu kwamba unaweza kuwa na nia ya au hizi 18 picha nyingine. Lakini kwamba hakika inaweza kuwa kipengele muhimu. Na kutokana na metadata, inaweza kuwa inawezekana kuweka kwamba pamoja. Unaweza kuwa na mahitaji mbalimbali katika suala la kutafuta maudhui, kama labda licha zana kwamba zinapatikana kwamba maktaba hufanya inapatikana, unaweza kutaka kutafuta katika njia tofauti au kuongeza kwa fulani matumizi ya kesi, ambayo labda ni maalumu sana. Labda kuna wachache tu watu katika ulimwengu ambao unataka kutafuta maudhui kwa njia hii, lakini Itakuwa kubwa kama sisi inaweza waache kufanya hivyo. Kuna mengi ya analytics katika watu tu jinsi kutumia maudhui kwamba itakuwa kweli kuvutia kujua kuhusu, kujua nini vitabu zinatumika, nini si, na kadhalika. Na kisha kuna mengi ya nafasi ya kuunganisha na taarifa nyingine kwamba huko nje kwenye mtandao. Hivyo sisi have-- Kwa mfano, NPR ina kitabu mapitio sehemu, ambako mahojiano waandishi juu ya vitabu. Na hivyo itakuwa kubwa kama ungekuwa kuangalia juu kitabu katika Harvard Library, na kusema, OK, kuna imekuwa mahojiano na mwandishi. Hebu kwenda kuangalia hiyo. Au kuna ukurasa Wikipedia, kama mamlaka, kitaalamu kumbukumbu juu ya kitabu hiki kwamba kutaka kuangalia. Kuna aina hii ya vyanzo kutawanyika katika mtandao. Na kuwaleta pamoja inaweza kuwa matumizi makubwa kwa mtu kuangalia maudhui, kutafuta kitu. Lakini pia ni si aina ya kitu wewe d wanataka maktaba kuwajibika kwa ajili ya kwenda chini na uwindaji chini vyanzo vyote hivi tofauti na plugging yao pamoja kwa sababu wao ni kubadilisha daima. Na nini wanafikiri ni muhimu may kuwa nini unafikiri ni muhimu. Na hata hivyo zaidi, kimsingi kuna mengi ya mambo sisi si mawazo ya bado. Hivyo kama tunaweza kufungua hili, zaidi watu badala ya nusu dazeni au hivyo, ambao ni kuangalia hii juu ya mara kwa mara unaweza kufikiria mawazo na massage data, na kufanya nini wanataka na hayo. Hivyo tunataka kufanya hili data inapatikana kwa ulimwengu. Naam, kuna matatizo ya wanandoa. Moja ni kwamba metadata hii ni katika mifumo tofauti. Ni katika miundo mbalimbali. Hivyo kuna baadhi ya kuhalalisha ambayo mahitaji ya kutokea, ambayo kuhalalisha kuwa mchakato wa kuleta mambo kutoka miundo mbalimbali na kuchora ramani yao na muundo moja ili mashamba mechi up. Kuna vikwazo baadhi ya hati miliki. Oddly kutosha, kuingia catalog kuhusu kitabu ni yeye binafsi kwa hati miliki. Hivyo hata kama ni tu habari inayotokana na kitabu, ni copyrightable. Na kulingana na ambao kwa kweli kuundwa metadata kwamba, kunaweza kuwa na vikwazo juu ya nani unaweza kugawa, sawa to-- Sijui. Ni wanaweza au si kuwa sawa na hali ya wimbo lyrics, kwa mfano. Hivyo sisi wote tunajua jinsi kwamba sufuria nje. Hivyo haja ya kupata kote kwamba suala hilo. Na kisha mwingine kipande ni kwamba kuna mengi ya data. Hivyo kama mimi ni mtu ambaye anataka kufanya kazi na data au ana wazo baridi, kushughulika na milioni 14 kumbukumbu juu ya mbali yangu inaweza kuwa tatizo na vigumu kusimamia. Hivyo tunataka kupunguza vikwazo kwa watu kuwa na uwezo wa kufanya kazi na data. Hivyo mbinu kwamba hopefully anwani wote wa masuala hayo ni sehemu mbili. Moja ni kujenga jukwaa kwamba inachukua data kutoka vyanzo haya yote tofauti na aggravates yake, normalizes, kuimarisha, na hufanya kupatikana katika eneo moja. Na inafanya inapatikana kwa njia ya API umma kwamba watu wanaweza kupiga simu. Hivyo API ni Maombi Programming Interface. Na kimsingi inahusu endpoint kwamba mfumo au teknolojia wanaweza kupiga na kupata data nyuma katika format muundo katika njia kwamba inaweza kutumika. Hivyo si tegemezi juu ya kwenda tovuti na kugema data off yake, kwa mfano. Hivyo hii ni ukurasa wa nyumbani wa Library Cloud Item API, ambayo kimsingi ni toleo zake mbili. Hivyo ni iteration pili ya kujaribu kufanya yote ya takwimu hii inapatikana kwa ulimwengu. Hivyo ni http://api.lib.harvard.edu/v2/items. Na tu kuvunja hii chini kidogo, hii ina maana gani ni kwamba hii ni toleo wawili wa API. Kuna toleo moja, ambayo Mimi si kwenda kuzungumza kuhusu. Lakini kuna toleo moja. Na kama wewe ni wito huu API, wewe ni kupata vitu. Na sehemu ya wazo la API ni API ni mkataba. Ni kitu ambacho ni si kwenda na mabadiliko. Hivyo kwa mfano, - Na sababu ni kwamba kama mimi kujenga aina fulani ya mfumo kwamba ni kwenda kutumia maktaba wingu API kuonyesha vitabu au kuwasaidia watu kupata habari kwa namna ya kipekee, nini hatutaki kutokea ni kwa ajili yetu kwenda kubadili jinsi kwamba API kazi, na ghafla kila kitu mapumziko upande mtumiaji wa mwisho. Hivyo sehemu ya kama wewe ni kufanya API inapatikana kwa dunia, ni mazoezi mazuri kuweka nambari ya toleo katika hivyo watu kujua nini version wao ni kushughulika na. Hivyo kama sisi kuamua sisi kupata njia bora ya kufanya habari hii inapatikana, tupate mabadiliko ya kwamba kwa wito kwamba toleo tatu. Hivyo kila mtu ambaye bado ni kutumia toleo mbili, kwamba utakuwa bado kazi. Lakini toleo tatu ingekuwa na mambo yote mapya. Hivyo hii ni API, lakini hii kweli inaonekana kama URL. Na hivyo jambo hili ni mfano wa ni nini kuitwa API wengine, ambayo inapatikana juu ya mara kwa mara tu mtandao uhusiano. Na unaweza kweli kwenda katika browser. Hivyo hapa nimekuwa tu wazi juu ya Firefox na wamekwenda api.lib.harvard.edu/v2/items. Na hivyo kile mimi kupata hapa ni kimsingi ukurasa wa kwanza kwa matokeo ya nzima seti ya vitu kwamba sisi tumepewa. Na ni hapa katika XML format. Na ni pia wamekuwa prettified na Firefox. Haina kweli kuwa yote haya kupanua kidogo na kuambukizwa doohickeys hapa. Hii ni aina ya nicer toleo njia ya kuangalia saa yake. Lakini nini hii ni kutuambia ni Nimekuwa aliomba vitu vyote. Hivyo kuna vitu 13,289,475. Na mimi nina kuangalia kwa mara ya kwanza 10, kuanzia saa nafasi zero kwa sababu katika sayansi ya kompyuta sisi daima kuanza saa sifuri. Na kile Mimi hapa, kama mimi tu kuanguka hii, utaona Mimi nimepata vitu 10. Na kama mimi kuangalia bidhaa, naweza kuona kwamba mimi nimepata habari kuhusu hilo. Na hii ni katika kile kinachoitwa mods fomu. Na hivyo mimi nina kwenda kubadili nyuma hapa kwa sasa. OK. Basi hebu kutafuta kitu katika maalum kwa sababu bidhaa ya kwanza kwamba kinachotokea kuja wakati ukiangalia njia ya ukusanyaji nzima ni, kwa ufafanuzi, random. Basi hebu kuangalia kwa baadhi donuts. Oh. OK. Hivyo donuts. Hivyo sisi kupatikana kuna 80 vitu katika ukusanyaji kwamba rejea donuts. Sisi ni kuangalia kwa mara ya kwanza 10 kati yao. Sasa, unaweza kuona hapa kwamba njia Mimi alisema mimi nina kuangalia kwa donuts, I just aliongeza na kitu cha kamba swala la URL. Hivyo q sawa donuts, ambayo unaweza kuona kidogo kwa urahisi zaidi hapa. Na hii kimsingi ina maana kuna spec kwa API, ambayo amefafanua nini yote ya vigezo haya yana maana. Na hii ina maana tunakwenda kutafuta kila kitu kwa ajili donuts. Hivyo bidhaa kwanza hapa tuna unaweza kuona cheo ni Donuts, na kuna Subtitle kuitwa An Passion Marekani, ambayo ni, mimi nadhani, sahihi. Kuna mengi ya different-- Baada ya kupata kwa uhakika ya kupata data, kuna mengi ya tofauti muundo kwamba unaweza kupata ndani. Na kuna nguvu mbalimbali na udhaifu kwa wao wote. Hivyo hii moja, unaweza kuona hapa, aina hii ni tajiri sana. Na ni sanifu. Hivyo kuna cheo maalum uwanja, shamba Subtitle. Kuna mbadala cheo, Passion Marekani. Kuna jina yanayohusiana na hayo. Aina ya rasilimali ni wa maandishi. Kuna mengi ya habari hapa katika muundo huu. Lakini kuna rundo muundo wa tofauti. Hivyo kile sisi walikuwa tu kuangalia ni format kuitwa mods, ambayo inasimamia kwa Metadata Object Maelezo Service, uwezekano. Mimi kwa kweli si uhakika kabisa kuhusu S. Lakini ni format haki tata. Ni format default. Lakini ni moja kwamba anaendelea utajiri wa data wote kwamba maktaba ina sababu ni karibu sana na kile maktaba inatumia ndani. Ni kiwango ambacho ni kutumika nchini kote, duniani kote katika maktaba kitaaluma. Na ni haishirikiani sana. Hivyo kama wewe nimepata hati yaani katika mods format, unaweza kutoa kwamba kwa mtu mwingine mifumo ambao kuelewa mods, na wanaweza kuagiza. Hivyo ni standard. Ni vizuri sana defined, maalum sana. Na kwamba ni nini hufanya haishirikiani kwa sababu kama mtu anasema, hii ni cheo mbadala ya rekodi, kila mtu anajua kwamba ina maana gani. Upande wa flip, ni ngumu sana. Hivyo kama wewe kuangalia katika rekodi hii hapa, kama nataka tu kupata jina la waraka huu, ya kitabu hiki, ambayo pengine ni Donuts, Passion Marekani, parsing nje ni kidogo wanaohusika. Wakati kuna mwingine format inaitwa Dublin Core, ambayo ni mengi, mengi rahisi format. Na hivyo unaweza kuona hapa, hakuna cheo, Subtitle, jina mbadala. Kuna tu cheo ni, Donuts, Passion Marekani, na mwingine cheo, American Passion. Hivyo wakati wewe ni kuangalia namna gani unataka kupata data nje ya, mengi inategemea jinsi wewe ni kwenda kuitumia. Je, wewe ni kutumia kwa ajili ya driftskompatibilitet au kufanya unataka kitu rahisi kwamba inaweza kuwa rahisi kufanya kazi na? Upande wa flip, mengi ya maelezo kupata aina ya squished chini. Unaweza kupoteza nuances ya nini uwanja njia fulani kama wewe ni kushughulika na Dublin Core, ambayo bila kupata na mods. Basi hizo mbili ya muundo unaweza kupata nje ya API. Na kimsingi, sisi ni kutunza ni nyuma ya pazia katika mods. Lakini tunaweza kukupa ni katika mods na Dublin Core na kitu kingine chochote pia. kuzingatia wengine wakati wewe ni kuangalia katika data ni unaweza kupata kama ama JSON, ambayo anasimama kwa JavaScript Object Notation, au XML, ambayo inasimamia kwa Extensible ghafi lugha. Na hawa uwakilishi data wote na hasa data huo, hasa sawa mashamba. Lakini wao uko tu syntactically tofauti. Hivyo hii ni a-- Naam, hebu tu kubadili. Hivyo hii ni swala yetu kwa ajili ya donuts katika XML format. Kama mimi tu kubadili hili kuwa JSON, Mimi naona inaonekana tofauti. Hivyo sasa hii ni maudhui sawa, lakini muundo tofauti. Kuna mabano wachache pembeni. Kuna chini verbose. Na hii ni format kwamba, kama wewe wanafanya kazi katika mazingira ya mtandao, wewe ni zaidi uwezekano wa kwenda kutaka kutumia kwa sababu moja ya mambo mazuri kuhusu JSON ni ni sambamba na JavaScript. Hivyo kama mimi nina maandishi mtandao programu, siwezi kuvuta katika JSON na tu kazi na hivyo moja kwa moja. Ambapo pamoja na XML, ni kidogo ngumu zaidi. Hivyo tena, hizi ni wawili muhimu. Wao tu ni kesi ya matumizi mbalimbali ambapo watu kutaka kutumia yao. OK. Hivyo nyuma API. Hivyo tunaweza kutafuta for-- Mimi kutoa mfano wa kwa ajili ya kutafuta donuts. Sisi pia unaweza kutafuta tu katika Hasa uwanja ndani ya hapa. Hivyo badala ya kutafuta rekodi nzima, Naweza tu kutafuta uwanja cheo. Na hivyo sasa kuna mambo 25 ambayo kuwa donuts katika cheo, moja ambayo ni juu ya kurejesha ardhi katika usimamizi ya shimo katika donut mpango, ambayo pengine ni sio kile sisi ni kuangalia kwa wakati sisi ni kwa ajili ya kutafuta donuts. Unaweza pia, wakati uko kushughulika na API-- Sehemu ya kuwa API ni kutoa watu upatikanaji wa seti kubwa data. Na kuna wanandoa mbalimbali zana unaweza kutumia kufanya hivyo. Moja ni, sana tu, wewe unaweza ukurasa kupitia data. Hivyo tu kama wewe kufanya swala kupitia interface mtandao, unaweza kuangalia ukurasa mmoja, ukurasa mbili, ukurasa wa tatu. Unaweza kufanya hivyo Jambo kupitia API. Wewe tu haja ya kuwa na wazi katika jinsi ya kufanya hivyo. Hivyo kwa mfano, kama mimi nina kuangalia katika swala yangu ya kwanza hapa, ambapo mimi nina kufanya search kwa ajili ya mambo na donuts katika cheo, naweza kusema, na kikomo ni sawa na 20, ambayo ina maana nipe kwanza rekodi 20, si 10 ya kwanza, ambayo ni ya msingi, kwa sababu nataka kuangalia 20 wakati huo. Au naweza kusema, kuweka kuanza sawa na 20 na kikomo sawa 20, ambayo nitakupa mimi kumbukumbu 21 kwa njia ya 40. Kwa hiyo mimi nadhani jambo kuchukua hapa ni kwamba sisi ni kutumia masharti query kuweka vigezo juu ya swala. Na inakuwezesha kudhibiti wewe nini kupata nyuma. Chombo kingine kwamba unaweza kutumia, - Na hii ni kweli kusaidia katika suala la kuchunguza data. --is kitu kinachoitwa Faceting. Hivyo mrefu Faceting ni si lazima kawaida. Lakini ve wote kuonekana ni kabla. Kama wewe kuangalia Amazon, kwa mfano, na kufanya search kwa donuts katika vitabu, hapa nimepata mfululizo wa vitabu, na wao uko makundi na jamii, na wewe kupata makundi mbalimbali, na jinsi vitabu katika kila jamii nyingi show up. Hivyo hii ni kimsingi facet. Unaweza kuchukua vitabu vyao yote, 1,800 vitabu wanaofanana donuts katika Amazon. 12 kati yao ni katika kifungua kinywa jamii. 21 katika keki na kuoka, na kadhalika na kadhalika. Hivyo hii ni kweli muhimu chombo kwa ajili ya kuchunguza maudhui ndani ya maktaba pamoja kwa sababu wakati ukiangalia facet, inakupa wazo la nini masomo lipo, kama ni aina gani ya masomo ni maarufu zaidi ndani ya kuweka yako swala. Na inasaidia gari mbali na kuchunguza. Hivyo tunaweza kufanya kitu kimoja. Kama tunataka kutumia API na kuangalia pande, sisi kuongeza parameter mwingine rafiki yetu kamba swala. Hivyo pande sawa comma kutengwa orodha ya nini tunataka facet juu. Hivyo moja ya pande inaweza kuwa chini. Mwingine anaweza kuwa lugha. Na hivyo kama sisi kukimbia kwamba swala, sisi get-- Inaonekana pretty kiasi sawa hapa. Lakini tumekuwa aliongeza kwa mwisho orodha ya seti ya pande. Hivyo tuna facet kuitwa somo. Hivyo hii ni kutuambia kwamba kama mimi kuangalia katika matokeo yangu 80 kutoka donut swala, 13 kati yao na somo nchini Marekani. Tatu na donuts somo. Tatu kuwa na somo ya ardhi oevu marejesho, ambayo inaweza kuwa shimo wetu katika donut. Wawili kati yao, Simpsons, na kadhalika na kadhalika. Hivyo hii inaweza kuwa na manufaa kama wewe wanataka nyembamba chini tafuta wako. Ni inaweza kukusaidia kufanya hivyo. Hasa kama una zaidi, kusema, matokeo 80. Vile vile, sisi pia aliuliza kwa pande lugha. Hivyo kama sisi kuangalia matokeo yetu, tunaona 76 wao ni katika Kiingereza, nne katika Kifaransa, mbili katika lugha ya Kihispaniola, mbili, nadhani hiyo ni undefined au haijulikani, Uholanzi na Kilatini. Hivyo nadhani Kilatini donut matokeo, tena, ina kitu cha kufanya na bidhaa Motoni. Lakini kuna kwenda. Hivyo hii ni aina ya kuonyesha jinsi gani unaweza kuvuta maudhui nyuma kutoka API kupitia tu mtandao browser, ambayo ni kubwa. Lakini si kweli nini wewe ungekuwa kawaida kuwa kutumia katika API kwa ajili yake. Basi mfano mmoja wa jinsi gani inaweza kweli kufanya hivyo ni mimi wameweza imeandikwa mpango super ndogo, ambayo, tena, haina donut yangu search na kuchagua mashamba wanandoa na kuvipanga katika meza. Hivyo hii ni mengi sana maudhui sawa kwamba sisi tu saw na mashamba chache vunjwa nje. Hivyo orodha ya majina, eneo la kile kitabu ni kuhusu, lugha, na kadhalika na kadhalika. Hivyo ni jinsi hii kweli kilichotokea, tangu Nadhani tuna kuangalia baadhi ya kanuni, is-- Nini sisi hapa ni HTML rahisi ukurasa, ambayo maonyesho maandishi, kuwakaribisha kwa maktaba wingu na kisha maonyesho jedwali la matokeo. Na kuna wazi hakuna matokeo katika meza wakati ukurasa anapata kubeba. Lakini nini sisi ni kufanya ni, kwanza ya yote, sisi ni upakiaji maktaba kuitwa jQuery, ambayo kimsingi ni Maktaba JavaScript, ambayo inafanya rahisi sana kuendesha JavaScript natively, HTML, na kujenga kurasa za mtandao, mteja upande mantiki na kurasa za mtandao. Hivyo nini sisi hapa ni jQuery ina njia inayoitwa Kupata, ambayo kimsingi watakwenda URL, ambayo, katika kesi hii, hii ni familiar kuangalia URL. Na kisha kupata bidhaa kutoka URL na kisha kukimbia kazi juu yake. Hivyo tulisema kwenda api.lib.harvard / edu. Kutafuta donuts. Utupe rekodi 20. Na kisha kukimbia kazi hii, ambayo Nimekuwa kuchaguliwa, kupita data. Na data ni JSON kwamba got akarudi kutoka API. Na kisha sisi ni kusema, ndani ya kwamba data kuna shamba iitwayo item. Na nikienda kuangalia nyuma katika mmoja wa haya matokeo ya kuwa hapa, kuna kitu called-- Naam, ni kuitwa item. Hivyo kwamba inaweza kuwa kwamba. Na nini ni gani ni huenda kwa njia ya kila kitu na kisha wito mwingine kazi juu ya kila kitu. Na kazi kwamba kimsingi ni kuchukua thamani ya bidhaa, ambayo ni kimsingi rekodi ya mtu binafsi na inaruhusu sisi kujiondoa cheo, chanjo na lugha. Hivyo tunatoa wito kazi juu ya kila bidhaa kwamba sisi got nyuma kutoka API. Na kama wewe tu kuangalia kipande haki hii hapa, nini sisi ni kufanya ni sisi ni kujenga kamba, ambayo kimsingi ni baadhi ghafi HTML karibu na meza, na value.title, ambayo ni jina la kitu, value.coverage, ambayo ni chanjo, - Na sisi ni kufanya hundi hapa kuona nani kisichojulikana na kujificha ni kama anasema undefined, kwa sababu sisi siyo kweli nia katika hiyo. --and basi lugha. Na kisha nini tuko kufanya ni appending kwamba mezani kwamba ni kutambuliwa na hii kamba hapa. Na jinsi jQuery kazi ni nini hii ni kusema ni kuangalia kwa meza na wazo matokeo na kuongeza Nakala hii yake. Na hii ni meza na matokeo wazo. Hivyo nini kuishia na ni ukurasa hii hapa. Na ili kuona source-- Naam, chanzo ni si kweli updated wakati yaliyotokea. Hivyo unaweza kuona halisi matokeo ya meza hapa ingawa. Hivyo hiyo ni mfano tu rahisi ya kufanya swala ya msingi sana juu ya API na kuonyesha habari katika baadhi ya wengine kuunda, na si kufanya kitu chochote pia dhana tu. Sasa, mfano mwingine ni kama maombi iliyoandikwa na David Weinberger kama demo ya hii, ambayo kimsingi inaonyesha jinsi gani unaweza mash up matokeo uko kupata kutoka maktaba wingu API na, kusema, vitabu Google. Na kufikiri hapa ni kwamba naweza kukimbia swala dhidi Books Google, kupata Nakala search kamili, kupata baadhi ya matokeo nyuma, kupata nje ambayo ya vitu hivyo kweli zipo katika Hollis, mfumo maktaba, na kisha nipe viungo nyuma vitu hivyo. Hivyo kama mimi kutafuta, ilikuwa giza na dhoruba usiku, mimi kupata nyuma rundo la matokeo kutoka Google, na kisha moja ya matokeo ambayo ni kasoro katika Time. Na hawa ni viungo vitabu ambazo zipo ndani ya mfumo wa Harvard Library. Kwa hiyo mimi nadhani uhakika hapa ni si kiasi kwamba hii inaweza au si kuwa njia unataka kutafuta maktaba, lakini ni tofauti kabisa njia ambayo ilikuwa si inapatikana na wewe kabla ya, kama wewe hakuwa na njia ya kufanya Nakala kamili utafutaji katika vitabu kwamba hata walikuwa sehemu ya mfumo wa Harvard Library. Hivyo sasa hii ni njia kwamba unaweza kufanya hivyo. Na unaweza kuonyesha yao katika chochote format unataka. Hivyo uhakika hapa ni, kimsingi, tuko kufungua njia mpya kwa ajili ya watu kufanya kazi na data. Mwingine kipande ya maktaba wingu ni kwamba inasaidia nje baadhi ya matumizi ya data kwamba maktaba ina. Hivyo kama wewe kwenda maktaba, na wewe ni kuangalia kwa vitabu, huna lazima kweli kuwa na wazo la, ajili ya vitu vyote katika mada fulani, nini ni watu katika jamii, kama ni hufafanuliwa kama Harvard au nchi au darasa lako, nini kuwa wao kupatikana muhimu zaidi? Na maktaba kweli ina tani wa habari kuhusu nini ni muhimu sana kwa sababu kama mengi ya watu ni kuangalia nje kitabu, anayewaambia kitu. Kuna lazima wamekuwa sababu baadhi wanataka kuangalia ni nje. mengi ya watu kuiweka juu ya hifadhi. Kama ni kwenye orodha ya hifadhi kwa ajili ya kura wa madarasa, anayewaambia kitu. Kama wanachama kitivo ni kuangalia ni nje mengi na undergraduates si, kwamba anaelezea mimi kitu. Kinyume chake, kwamba pia atakwambia kitu. Hivyo itakuwa kweli kuvutia kuweka habari kwamba huko nje na basi watu kuitumia ili kuwasaidia kupata kazi ndani ya mfumo wa maktaba. hasara ya hii ni kuna faragha baadhi kubwa wasiwasi kwa sababu moja ya malengo ya msingi ya maktaba ni sisi siyo kwenda kuwa kuwaambia watu nini watu wengine ni kusoma. Na hata kama wewe ni kusema hii kitabu alikuwa checked nje mara nne katika mwezi husika, ambayo inaweza kutumika zilizounganishwa nyuma na hasa mtu na data de-anonymizing na kutafuta nje ambao checked nje. Hivyo njia kwamba tunaweza avoid-- njia hiyo tunaweza kujaribu kutafuta baadhi ishara kutoka habari zote bila zinazokiuka wasiwasi wa faragha ya mtu yeyote kimsingi ni sisi kuangalia Miaka 10 ya matumizi ya data, - Hivyo ni juu ya kipindi cha muda mrefu. --and kusema, OK, hebu angalia jinsi mara nyingi kazi hii ilitumika, na kwa ambaye katika kipindi hiki ya muda, na kisha kimsingi kutoa nyuma ya simu, ambayo sisi kuwaita stack alama, ambayo kimsingi inawakilisha ni kiasi gani imekuwa kutumika. Na kwamba number-- mengi ya mahesabu tofauti kwenda katika idadi hiyo. --but ni mbaya sana metric kwamba anatoa wazo baadhi ya jinsi jamii wanaweza kuthamini kazi hiyo. Na hivyo aina nyingine ya hata zaidi fleshed nje maombi kwamba inachukua faida ya hili ni jambo kuitwa Stacklife, ambayo ni kweli inapatikana kwa njia ya Harvard kuu Library portal. Hivyo wewe kwenda library.harvard.edu. Utaona idadi ya tofauti njia ya kutafuta maktaba. Na mmoja wao aitwaye Stacklife. Na hii ni maombi ambayo browses maudhui ya maktaba, lakini ni kabisa kujengwa juu ya APIs haya. Hivyo hakuna mambo maalum kinachoendelea nyuma ya pazia. Hakuna upatikanaji wa data kwamba huna. Ni kwa kutumia APIs kutoa na kuvinjari tofauti kabisa uzoefu. Hivyo kama mimi kutafuta Alice katika Wonderland katika kesi hii, Mimi kupata matokeo kwamba inaonekana kama hii, ambayo ni pretty much-- Ni sawa na yoyote search nyingine unaweza kufanya, isipokuwa katika kesi hii tuko cheo vitu kwa stackscore, ambayo inakupa wazo baadhi ya jinsi maarufu hizi vitu walikuwa ndani ya jamii. Na hivyo kwa uwazi, Alice katika Wonderland na Walt Disney ni maarufu sana. Lakini pia unaweza kuona juu nne hapa ni wale unaweza si actually-- Mambo ambayo ni sana kutumika, lakini msitende mara moja kuungana na Alice katika Wonderland. Hivyo rafiki yetu ya zamani Annotated Alice ni hapa. Hivyo siwezi kuangalia saa yake. Na sasa nini mimi nina kuangalia katika kimsingi kuweka of-- Naweza kuwa Annotated Alice haki hapa. Mimi kuwa na taarifa kuhusu hilo. Na mimi pia stackscore ya, katika kesi hii, 26. Na hii inaniambia aina ya takribani jinsi tulipata stackscore hii, kama ambao checked nje, kama jinsi mara nyingi ilikuwa ni checked nje, kama kitivo au undergrads, jinsi nakala nyingi maktaba ina, na kadhalika na kadhalika. Na unaweza pia, ya kuvutia ya kutosha hapa, kuvinjari mwingi karibu. Hivyo data hapa, hii ni kuonyesha wewe aina ya uwakilishi virtual ya nini rafu nguvu kuangalia kama kama ungekuwa na kuchukua Holdings maktaba wote na kuziweka pamoja juu ya moja usio rafu. Na jambo zuri ni kwamba sisi can-- Awali ya yote, metadata kuhusu vitabu hivi mara nyingi anakwambia wakati ilikuwa kuchapishwa. Hukueleza kurasa nyingi ina. Huenda kukuambia vipimo. Hivyo unaweza kuona hiyo yalijitokeza hapa katika suala la ukubwa wa vitabu. Na kisha tunaweza kutumia stack alama ya kuonyesha vitabu na alama ya juu stack. Hivyo kama ni nyeusi, maana yake ni kwamba, labda, ni kutumika mara nyingi zaidi. Hivyo katika kesi hii, mimi nina kwenda nadhani kwamba hii ni toleo la Alice katika Wonderland kuwa ni kawaida sana kutumika na wengi kupatikana, maktaba ina nakala zaidi ya. Hivyo kama wewe ni kuangalia kwa Alice katika Wonderland, hii inaweza kuwa nafasi nzuri kuanza. Na kisha hapa unaweza pia kiungo nje kwa, kusema, Amazon kununua kitabu, na kadhalika na kadhalika. uhakika hapa, tena, si sana kwamba hii ni njia bora ya kuvinjari maktaba au chombo cha haki kwa kila tukio. Lakini ni njia nyingine ya kufanya hivyo. Na kwa kufanya data inapatikana kwa njia ya API, ambayo ni alifanya ya vitalu rahisi sana kujenga, ambayo utapata kutafuta maudhui, unaweza kujenga kitu kama hii ambayo inaweza kuwa extraordinarily thamani kwa baadhi ya watu. Hivyo hiyo ni aina ya, kama vile nataka kusema kweli kuhusu nini API ni na nini ni kuanika, kuna nzima rundo la mambo nyuma ya pazia, ambayo Mimi tu kwenda kugusa ufupi tu kwa sababu ni aina ya inakuja katika hii kutoka angle tofauti kabisa katika suala la jinsi gani kitu kama hii kupata kuweka katika nafasi? Hivyo API ni kiwango interface yote ya maudhui hii. Lakini kupata huko, Jambo la kwanza tulikuwa na kufanya mara kuvuta kwa pamoja habari ya vitabu na picha na misaada kutafuta, ukusanyaji waraka kutoka mifumo mbalimbali Harvard. Aleph, VIA, na OASIS ni majina ya mifumo. Na wao kimsingi kwenda katika bomba, usindikaji bomba. Hivyo kwanza ya yote, sisi kupata nje files kutoka wote wa mifumo ya haya. Sisi kupasuliwa yao juu katika vitu binafsi. Hivyo tuna file, ambayo ni gigabyte, ambayo ina milioni kumbukumbu ndani yake. Hivyo sisi kupasuliwa up ndani ya vitu binafsi. Basi, kwa kila kitu, sisi kubadili katika mods, kwa sababu baadhi ya haya ni mods natively, baadhi yao si. Hivyo sisi kupata yao yote kwa kuwa katika utaratibu huo huo. Kisha kuna mbalimbali hatua utajiri, ambapo sisi kuongeza habari zaidi na data kuliko ilikuwa inapatikana katika maktaba. Hivyo tunahitaji kuongeza, kwanza ya yote tuna nini maktaba kushikilia yake. Sisi kwenda kwa njia ya hatua ya kuhesabu stackscore. Sisi kwenda kwa njia ya hatua nyingine ya kuongeza metadata zaidi katika suala ya nini makusanyo watu anaweza kuwa aliongeza this-- Watu ni kujenga makusanyo ya vitu. Nini makusanyo gani ni ya? Jinsi ya kuwa na watu tagged maudhui hii katika siku za nyuma? Basi kuchuja nje, na kuzuia kumbukumbu kwa sababu, kama nilivyoeleza, kuna baadhi ya kumbukumbu kwamba, kwa sababu ya sababu hati miliki, hatuwezi kuonyesha. Na kisha sisi shehena yao katika kitu kinachoitwa Solr, ambayo si misspelling, lakini ni jina la kipande cha programu kwamba hana search Indexing, ambayo anatoa wote search nyuma API. Na kisha inakuwa inapatikana kwa API, na watu wanaweza kuitumia. Hivyo hii ni kama haki moja kwa moja mchakato. Moja ya kuvutia mambo kuhusu ni kwamba sisi ni kushughulika na rekodi milioni 13 na sisi ni kwenda kuwa kushughulika au zaidi. Na tunataka kuwa na uwezo wa kushughulikia hizi katika mtindo kiasi haraka. Inachukua muda mrefu kwa mchakato rekodi milioni 13. Hivyo ni jinsi bomba hilo ni kuanzisha ni kwamba can-- Nadhani faida ya bomba, tatizo kwamba tuko kujaribu kutatua hapa, ni kwamba mabadiliko yote, kila hatua hizi katika hii bomba ni ungulika. Hakuna utegemezi. Kama wewe ni usindikaji rekodi ya kitabu kimoja, hakuna utegemezi katika kwamba kati ya kitabu kingine. Hivyo nini tunaweza kufanya ni kimsingi, katika kila hatua katika bomba, sisi kuiweka katika foleni katika wingu. Mimi kilichotokea kwa kuwa juu ya Amazon Huduma za mtandao. Hivyo kuna orodha ya, kusema, vitu 10,000 kwamba haja ya kuwa normalized na waongofu na mods format. Na sisi spin up servrar kama wengi kama tunataka, labda 10 servrar. Na kila moja ya servrar wale tu anakaa pale, inaonekana katika foleni hiyo, anaona kwamba kuna moja kwamba mahitaji ya kuwa processed, pulls ni mbali foleni, michakato yake, na vijiti ni katika foleni ya pili. Na hivyo kile ambayo inaruhusu sisi kufanya ni kuomba, kimsingi, kama vifaa vile tunataka hii tatizo kwa muda mfupi sana wa muda mchakato wa data kwa haraka kama inawezekana, ambayo ni kitu ambacho tu, sasa katika ulimwengu wa kompyuta wingu tunaweza utoaji servrar kimsingi mara moja, ni kwamba muhimu. Hivyo hatuna kuwa na kubwa server wamekaa kuzunguka muda wote kufanya usindikaji ambayo yanaweza kutokea mara moja tu kwa wiki. Hivyo kwamba ni wengi. Kuna nyaraka inapatikana kwa Library Cloud Item API katika URL hii, ambayo itakuwa kuwa inapatikana baadaye. Na tafadhali kwenda kuangalia ni kuona kama kuna kitu chochote, una mawazo yoyote. Kucheza na hayo. Matani. Na hopefully unaweza kuja na kitu kubwa. Asante.