ЈЕФФРЕИ Лицхт: Здраво. Ја сам Џефри Лихт. И овде сам да разговарам с тобом о Харвард Библиотека и зграда сутрашње Данас библиотека, претпостављам. Дакле позадина овде, терен за ову седницу је у суштини да постоји доста библиографских података доступно у Харвардових библиотекама. И ту је прилика, кроз неке алате и пројекат који је развијен, да бисте добили приступ информацијама и да га на места која Харвард Библиотека не ради сада, радим нове ствари са њим, експеримент и занимљива. Дакле поента у овај унос је АПИ зове Харвард Библиотека Цлоуд, која је отворен метаподатака сервера, који ћу говорити о сада. Дакле, позадина је да постоји Много ствари у библиотеци у Харвард. Имамо преко 13 милиона библиографских евиденција, милиони слика, и хиљаде информативних средстава, која су у суштини документи који описују колекције, рекавши како је у њима, кутије радова и тако даље да представљају преко милион појединачни акти. И ту је доста информације које библиотека има о томе како се користи садржај који могу бити од интереса за људе ко би желео да ради са њим. Дакле, све информације Библиотека има метаподатака. Дакле метаподатака је податке о подацима. Дакле, када говоримо о информације које је доступне преко библиотеке облак који је доступан, није нужно стварни документи сами, не нужно пуну Текст књига или пуним слика, иако то заправо може бити случај. Али то је заиста Подаци о подацима. Тако да можете мислити каталогизације информације, позивни бројеви, субјекти, колико копија Књига има, ста су издања, шта су формати, аутори, и тако даље. Дакле има пуно информација о информације у колекцији која, само по себи, је некако по себи корисно. И мада ако си ради детаљнијег истраживања, Ви очигледно желе да дођете до стварне цонтент себе и погледате податке, метаподатака је користан у смислу како анализирање корпус у целини, као што су ствари у колекцији. Како се они односе? Помаже ли заиста видети остале ствари, која је заиста главна сврха тога. Тачка метаподатака и каталог је да вам помогне да пронађете све информације које је доступни у оквиру збирки. Дакле, ово је пример метаподатака за књигу у библиотеци Харвард у. Тако да је ту. И можете да видите да је то заправо умерено комплекс. И део вредности метаподатака у Харвард Либрари система је да је то врста била од изграђена од каталогизатора и окупио људи који конкуришу много стручности и вештине и мислио на њега током времена, која има много вредности. Дакле, ако сте погледамо овај запис за Аннотатед Алиса, можете сазнати имаш титулу, ко га је написао, ауторски и сви различити предмети које људи су га каталогизирани у. И можете да видите ту је, у додатак много добрих информација овде, постоји нека дуплирање. Има пуно сложености која је огледа кроз метаподацима да имате. Дакле, један наслов ове књиге је Алиса у земљи чуда. Дакле, ово је са белешкама верзија те књиге. Али је такође позвао је Анотираног Алице, Алице ин Вондерланд јер то је нешто што Мартин Гарднер написао и аннотатед књигу. И ту је доста велике информација о логичких слагалица и стварима у Алице то ти Вероватно није знао за. Значи да треба да читате га. Али можете да видите ту је пуно детаља овде, укључујући идентификаторе, када га је настао, одакле је дошао, у смислу Харвард систем, и тако даље. Дакле, ово је узорак тип метаподатака да би сте видели неку књигу у Харвард Библиотека колекција. Ово је нешто потпуно другачије. Дакле постоји систем назван ВИА Харвард, који у основи је каталогизација слике и објекте уметности и визуелне ствари широм Харварду, и додајем метаподатака им, класификацију их, и, у неким случајевима, пружајући мале сличице да можете узети погледај ако то желите. Дакле, ово је пример метаподатака да имате за плочу од, вероватно, Алице ин Вондерланд. И можете да видите да је мање метаподатака овде. То је само другачија врста објекта. И тако има мање информација. Ви углавном имају чињеницу да, позив број, у суштини ко га је створио, - Ми не знамо када је настао. --и наслов. Још један пример. Ово је налаз помоћ. Тако да збирка Левис Царролл папири на Харварду. Дакле, ово описује шта је у том колекцији. Дакле, неко је прошла кроз и Погледао је кроз све кутије и каталогизирана га, с обзиром неке позадина, написао резиме ста је овде. А ако сте били да погледате даље на ово, ово Траје странице и странице и странице, али ће вам рећи која слова и шта датуми из онога што кутијама постојао током колекције. Али ово је нешто да, ако сте на Харварду, можете отићи и заправо физички изгледају горе и, по свој прилици, погледајте. Дакле, ово је све супер. Ово је корисно метаподатака. То је у Харвард Либрари система. Постоје алати на мрежи где ти може ићи и погледати у њу, и види га, и тражи га. И можете га и коцкице исећи она у много различитих начина. Али стварно је доступна само ако ти си људско биће седи доле на вашем браузере или нечему или Ваш телефон и навигацију кроз њу. Није баш доступан у било каквог корисног моде за друге системе или другим рачунарима да користе, Не са системима унутар Харвард Библиотека, али системи у спољном свету, само други људи уопште. Дакле, питање је, како можемо ставља га на располагање рачунарима тако да можемо да урадимо више занимљиво ствари са њим него само прегледања се тога? Па зашто би желите да урадите ово? Постоји много могућности. Прва је да се може радити потпуно другачији начин прегледања садржај који је доступан кроз Харварда библиотекама у. Ја ћу вам показати један касније назван Стацклифе, која има потпуно другачије преузму тражи садржај. Могао би саградити препоруку мотор. Дакле Харвард Библиотека није у пословање говорећи, волите ову књигу. Онда иди погледај ово 17 остало књиге које сте могли бити заинтересовани у или ови други 18 слике. Али то свакако могао бити вредан карактеристика. А с обзиром метаподатака, то може бити могуће ставити заједно. Можда имају различите потребе у Услови претраживање садржаја, као можда упркос алата који су доступни да библиотека чини доступна, можда ћете желети за претрагу на другачији начин или оптимизовати за одређену случај употребе, која можда је врло специјализована. Можда постоје само неколико људи у свету који желите да претражите садржај на овај начин, али било би лепо када би могао да им то. Има много аналитике за само колико људи коришћења садржаја који би био стварно занимљиво знати о, сазнати које књиге се користе, шта су не, и тако даље. А ту је и доста прилика да се интегришу са другим информацијама да је тамо на Интернету. Тако смо бих-- На пример, НПР има сегмент приказ књиге, где су интервјуисали Аутори о књигама. И тако то би било сјајно када сте били лоокинг уп књигу у Харварду Библиотека, а ви кажете, у реду, ту је био интервју са аутором. Хајде да погледамо то. Или постоји Википедија страна, као ауторитативно, научна референтна о овој књизи која вас можда желети да погледамо. Постоје ове врсте извора разбацани широм Интернета. И их спајајући бити велики употреба некоме гледа Садржај, траже нешто. Али је исто тако није ствар коју бих Желим библиотека да буде одговоран за одлазак доле и лови сви ти различити извори и прикључите их заједно јер они стално мењају. А шта они мисле је важно мај Не будите оно што мислиш је важно. А још више, у основи постоји Много ствари нисмо помислили још. Дакле, ако можемо да отворимо ово више, људи поред пола десетак, који су гледајући ово на Редовно на памет идеја и масирајте податке, и раде шта желе са њом. Зато желимо да ово доступни на свету података. Па, има неколико компликације. Једна је да овај метаподацима је у различитим системима. То је у различитим форматима. Дакле постоји нека нормализација која треба да се деси, што нормализација као процес доносећи ствари из различитих формата и њихово мапирање на један формат тако да су поља ће се поклопити. Постоје нека ограничења ауторских права. Зачудо, улаз каталог о Књига је одговоран за цопиригхт. Дакле, иако је то само информација изведена из књиге, то је цопиригхтабле. И у зависности од ко заправо створио ту метаподатака, могу постојати ограничења вхо може га дистрибуирати, слично да-- Не знам. Он може или не мора бити слична ситуација сонг лирицс, на пример. Сви знамо како се то панс напоље. Зато морате да добијете око тог питања. А онда још један комад је да има много података. Дакле, ако сам ја неко ко жели да ради са подацима или има кул идеју, бави 14 милиона евиденцију о свом лаптопу може бити проблематично и тешко управљати. Тако желимо да смањимо препреке за људе да би могли да раде са подацима. Тако приступ који би, надамо адресе све ове забринутости је два дела. Једна гради платформу која узима Подаци из свих ових различитих извора и отежава га, нормализује, обогаћује га, и брендови она могу бити у истој локацији. И то га ставља на располагање преко јавни АПИ који људи могу назвати. Дакле АПИ је апликација Програмски интерфејс. И то је практично односи на Крајња тачка да систем или технологија могу позвати и добити податке назад у структуриран формату на неки начин да се може користити. Дакле, није зависна на одлазак на сајт и стругање податке са тога, на пример. Дакле, ово је насловна страна од Библиотека Цлоуд АПИ артикла, која је у суштини његова верзија два. Тако да је друга итерација покушавајући да направи све ове податке доступна у свет. Тако је то хттп://апи.либ.харвард.еду/в2/итемс. И само да се пробије ово доле мало, шта то значи да је ово верзија два АПИ. Постоји верзија један, који Нећу да причам о томе. Али постоји и верзија један. И ако зовете ово АПИ, добијате предмете. И део идеје о АПИ је АПИ је уговор. То је нешто што је неће променити. Тако на пример, - А разлог је тај што сам изгради неку врсту система који ће користити библиотека цлоуд АПИ да прикажете књиге или помоћ у проналажењу Информације на јединствене начине, оно што не желимо да се догоди На нама је да идемо променити начин које АПИ ради, и одједном све ломи на крајњег корисника страни. Дакле део ако правите АПИ доступна на свету, то је добра пракса да стави Број верзије у њему тако људи знате коју верзију имају посла. Дакле, ако се одлучимо да наћи бољи начин израде ове информације доступне, можемо промијенити у позовите ту верзију три. Дакле свако ко је још увек користи Верзија два, то ће и даље радити. Али верзија три би има све нове ствари. Дакле, ово је АПИ, али ово стварно изгледа као УРЛ. И шта је ово Пример је оно што је зове одмор АПИ, који је доступан над обичне веб везе. А ти стварно можеш идите на њу у претраживачу. Па ево управо сам отворио Фирефок и отишао у апи.либ.харвард.еду/в2/итемс. И шта ја овде добити је у основи прва страна резултата из цијеле сет ствари које смо добили. И овде је у КСМЛ формату. И то је такође било преттифиед од Фирефок. То у ствари не морају сви ови мало шири и уговарање доохицкеис овде. Ово је врста лепше Верзија начин гледања на њега. Али шта то нам говори је Ја сам тражио све ставке. Дакле, постоје ствари 13.289.475. И Гледам први 10, са почетком у положају нулту јер у рачунарству увек се крећу од нуле. И шта ја овде имам, ако само колапс ово, видећете имам 10 ставки. А ако ја погледамо неке ставке, ја могу видим да имам информацију о томе. И ово је у оно што се зове МОДС форма. И тако ћу пребацити овде на тренутак. У реду. Па хајде да тражите нешто у специфична јер прва ставка која деси да дође до када погледате кроз целу колекцију је, по дефиницији, случајан. Погледајмо неке крофне. Ох. У реду. Со крофне. Тако смо нашли постоје 80 издања у колекција која референце крофне. Гледамо на првом њих 10. Сада, можете видети овде начин да Рекао сам да тражим крофне, Само додао нешто да упит низ УРЛ. Дакле к једнако крофне, које можете мало лакше овде види. И ово у суштини значи да спец за АПИ који дефинише шта све ови параметри значе. А то значи да ћемо претраживање све за крофне. Дакле прва тачка овде имамо можете видети наслов је Донутс, и постоји титл зове Амерички Страст, која је, претпостављам, прикладно. Постоји много дифферент-- Када дођете до тачке добијања података, има много другачији Формати које можете га добити у. И постоје различити предности и слабости за све њих. Према томе, ова, можете видети Овде, овај облик је веома богата. И то је стандардизован. Тако да специфична наслов поље, преводи поље. Постоји алтернативни наслов, амерички Страст. Постоји име повезан са њим. Врста извора је текст. Има пуно информација овде у овом формату. Али постоје гомила различитих формата. Па шта смо управо били гледајући је формат називају МОДС, што је скраћеница за Метадата објекта Опис сервис, потенцијално. Ја заправо нисам сасвим сигуран С. Али то је прилично сложен формату. То је стандардна формата. Али то је онај који држи Богатство свих података да библиотека има јер то је врло близу ономе што библиотека користи интерно. То је стандард који је користи широм земље, широм света у академским библиотекама. И то је веома интероперабилни. Дакле, ако имате документ који је у МОДС формату, можете дати да некоме другом чији системи разумеју МОДС, и они да га увезете. Тако да је стандардна. То је веома добро дефинисан, врло специфичан. И то је оно што га чини интероперабилан јер ако неко каже, ово је алтернативни назив запис, сви знају шта то значи. Са друге стране, веома је компликовано. Дакле, ако се погледа у овом записнику овде, ако желим да се Наслов овог документа, ове књиге, која је вероватно Донутс, Амерички Страст, ит парсинг напоље је мало укључена. Док постоји други Формат зове Даблинскојезгро, који је много, много једноставнија формату. И тако видите овде, нема наслов, поднаслов, Упоредни наслов. Постоји само наслов, Крофне, амерички Страст, и још једна титула, Американац Страст. Дакле, када гледате ком облику желите да добијете податке из, Много зависи од тога како ти ћеш га користити. Да ли користите за интероперабилност или вам Желим нешто једноставно да Можда би било лакше да раде са? Са друге стране, много Детаљи се некако скуисхед доле. Можете да изгубите нијансе шта одређеној области средство ако имате посла са Дублин Цоре, која не би се са МОДС. Дакле, то су два формата можете изаћи из АПИ. И у основи, ми задржавамо она иза сцене у МОДС. Али можемо вам дати га у МОДС и Дублин Цоре и све друго као добро. Други фактор приликом гледате у подацима је можете добити у варијанти ЈСОН, која скраћеница за ЈаваСцрипт Објецт нотација, или КСМЛ, која се залаже за Прошириви језик за означавање. А ови подаци репрезентације оба имају потпуно исте податке, тачно исти поља. Али то су само синтаксички другачије. Дакле, ово је је-- Па, хајде да пребаците. Дакле, ово је наш упит за крофне у КСМЛ формату. Ако сам само пребаците ово да буде ЈСОН, Видим да изгледа другачије. Тако да сада ово је исти садржај, али другачије структуре. Има мање заграда. Има мање опширан. А ово је формат који, ако вас раде у веб окружењу, ви највероватније ће да желе да користе јер један од лијепих ствари о ЈСОН је то је компатибилан са ЈаваСцрипт. Дакле, ако пишем веб апликацију, ја могу повући у ЈСОН и само радим са њим директно. Док са КСМЛ, то је мало компликовано. Дакле опет, то су и корисно. Они само су различити случајеви усе где људи желети да их користите. У реду. Вратимо се на АПИ. Тако можемо потражити ораси-- Дајем пример потрази за крофне. Такође можемо потражити само у Посебно поље унутар овде. Дакле, умјесто да трага цео запис, Само могу да претражују терен наслова. И тако сада има 25 ствари које имају крофне у називу, од којих је један је око враћања мочваре у управљању из рупе у крофни Програм, који је вероватно не нужно оно што тражимо за када смо у потрази за крофне. Можете и да, кад си бавимо АПИ-- Део који има АПИ даје људи приступ великим скуповима података. А постоје пар другачији алати можете користити за то. Један је, веома једноставно, ви цан страна кроз податке. Дакле, само као да радите упит кроз веб интерфејс, можете погледати на страници једне, страница два, три страна. То можете учинити исто ствар преко АПИ-ја. Само треба да буду изричит у како ти то радиш. Тако на пример, ако гледам у мом првом упита овде, где радим у потрагу за стварима са крофни у наслову, ја могу да кажем, и граница износи 20, што значи дај ми првих 20 записа, не Први 10, који је подразумевани, јер желим да погледамо 20 у исто време. Или могу да кажем, поставити старт једнака 20 и лимита једнаке 20, који ће дати ја рецордс 21 кроз 40. Тако да претпостављам ствар да одузме овде је да користимо све конце упита да подесите параметре на упит. И то вам омогућава да контролишете шта се вратиш. Још један алат који можете користити, - А ово је заиста корисно у Услови истражује податке. --ис нешто што се зове фацетинг. Тако термин фацетинг је Не нужно уобичајена. Али ви сте сви то раније. Ако погледамо Амазон, на пример, а ви урадите потрагу за крофне у књигама, Овде они имају низ књига, и они групишу по категоријама, и добијате различите категорије, и колико књига у свакој категорији појавити. Дакле, ово је у основи аспект. Узмеш све своје књиге, 1.800 књиге које се подударају крофне у Амазону. 12 од њих су у доручак категорија. 21 у пецива и печења, и тако даље и тако даље. Дакле, ово је заиста корисно алат за истраживање садржаја у библиотеци, као и јер кад погледате на верзији, то вам даје идеју шта субјецтс постоји, као Које врсте предмета су најпопуларнији у вашем сету упита. И то помаже вожњи и истражују. Тако можемо учинити исту ствар. Ако желимо да користимо АПИ и погледај аспектима, додамо још једну параметар наш пријатељ Стринг упита. Дакле аспектима једнако одвојених зарезом Листа онога што желимо да Фацет на. Зато је један од аспеката може бити предмет. Други можда језика. И тако ако останемо ту упит, ми добијам-- Изгледа прилично исто овде. Али ми смо додат на крају листе скуп аспеката. Тако имамо аспект се зове предмет. Дакле, ово нам говори да ако ја изгледам у моје 80 резултате из крофне упита, 13 од њих имају излажете САД. Три имају предметне крофне. Три имају тему од мочварама рестаурације, која може бити наша рупа у крофни. Двојица од њих, Симпсони, и тако даље и тако даље. Дакле, ово може бити корисно ако вас Желим да сузили претрагу. То вам може помоћи да урадите. Поготово ако имате више од, рецимо, 80 резултати. Слично томе, ми такође затражио за аспеката на језику. Дакле, ако погледамо наше резултате, видимо 76 од њих су на енглеском језику, четири на француском, два у шпанском, два, мислим да је то недефинисан или непознат, холандски и латински. Па мислим да латински крофна резултат, опет, нема никакве везе са пекарским производима. Али ето. Дакле, ово је врста вам показујем како можете да повучете садржај назад из АПИ управо кроз веб претраживач, који је сјајно. Али то није баш оно што би нормално да користи у АПИ за њу. Тако један пример како вас могао заправо ово је имам написао супер мали програм, који, опет, да ли ми крофне претрагу и бира пар поља и приказује их у табели. Дакле, ово је веома Исти садржај који смо управо тестера са неколико поља извукао. Дакле листи наслова, на локација шта књиге је око, језик, и тако даље и тако даље. Па како то стварно десило, јер Претпостављам да треба да погледамо неки код, је-- Оно што овде имамо јесте једноставна ХТМЛ страна, која приказује текст, велцоме то библиотеке облак и затим приказује табелу резултата. А ту су очигледно нема резултата у сто када страница буде лоадед. Али шта да радимо је, пре свега, ми се учитава библиотеку под називом јКуери, која је у основи ЈаваСцрипт библиотека, која га чини Веома лако манипулисати ЈаваСцрипт нативно, ХТМЛ, а креирање веб странице, на страни клијента логика и веб странице. Па шта имамо овде је јКуери има метод назван Гет, који у суштини ће ићи у УРЛ адреса, која, у овом случају, је ово познато гледа УРЛ адреса. А онда ће добити садржај из да УРЛ адреса, а затим покренути функцију на њему. Тако да смо рекли да иду апи.либ.харвард / Еду. Сеарцх фор крофне. Дајте нам 20 записа. И онда покренути ову функцију која Одабрао сам, то пролази податке. И податак је да ЈСОН добио вратио из АПИ. А онда говоримо, у оквиру које Подаци постоји поље зове ставка. И ако одем да погледам уназад на један од ових резултата које је овде, има нешто цаллед-- Па, то се зове тачка. Тако да може бити да. И оно што ради то је пролази кроз сваку ставку а затим позива друга Функција на сваку ставку. А то функција у суштини изводи вредност добра, што је суштини појединац запис и омогућава нам да извуче титулу, покривеност и језика. Тако да смо позвали функцију на сваки ставка да смо се вратили из АПИ. И ако само погледате у овом комаду овде, шта радимо је ми правите стринг, која је у суштини нека ХТМЛ маркап око стола, са валуе.титле, који је наслов објекат, валуе.цовераге, која је покривеност, - И ми радимо чек овде да се види ко је недефинисан и крије ако пише недефинисан, јер нисмо баш занима у то. --и онда језика. И онда шта смо ради се додавањем да за сто који је препознаје се по овом низу овде. И како јКуери ради је шта ово говори се тражити табели са идејом Резултати и додајте овај текст на њега. А ово је табела са резултатима идеа. Па шта завршиш са је ова страница овде. А да би се видели соурце-- Па, извор није заправо упдатед када се то догодило. Тако да можете видети стварни Резултати табели овде ипак. Дакле, то је само једноставан пример ради веома једноставан упит против АПИ и приказивање информација у неком другом формирају, а не ради ништа превише фенси. Сада, још један пример је као Апликација написао Давид Веинбергер као демо ово, која у суштини вам показује како можете да масх уп резултате које сте геттинг из библиотека облака АПИ са, кажу, Гоогле Боокс. И овде је размишљање да могу Покренути упит против Гоогле књигама, гет претрагу пуну текста, добијем неке резултате назад, сазнати који од тих ставки заправо постоје у Холлис, библиотека систем, а онда ми дај линкове назад на тим позицијама. Дакле, ако сам тражити, било је тамна и олујне ноћи, ја вратимо гомилу резултата из Гоогле-а, а затим један резултат која је бора ин Тиме. А ово су линкови ка књигама које постоје у Харвард Либрари система. Тако да претпостављам поента овде није толико да ово може и не може бити начин на који желите да тражи библиотеку, али је потпуно другачија Начин на који није био доступан за вас пре, као и ти имао начина да радим комплетног текста тражи на књигама које чак били део Харвард Либрари система. Дакле, сада је ово начин да можете да урадите то. А можете их приказати у било ком формату желите. Дакле поента овде је, у основи, ми отвара нове начине за људе за рад са подацима. Још један комад библиотеке облака је да помаже излагати неке податке о коришћењу да библиотека има. Дакле, ако идете у библиотеку, и тражиш књиге, Ви не нужно заправо имају идеју, за све ставке у Посебан предмет, шта су људи у заједница, без обзира да ли је то дефинисан као Харварду или земља или твој разред, ста има су пронашли најкорисније? И библиотека заправо има милион информација о томе шта је најкориснији јер ако много од људи преузимате књигу, да вам говори нешто. Мора да је било неких разлога они желе да то провере. Много људи га ставити на резерви. Ако је на листи резерви за много класа, која вам говори нешто. Ако професори су га провере од много и студенти нису, то ми говори нешто. Обрнуто, који такође говори ти нешто. Тако да би било стварно занимљиво стави ту информацију тамо и нека људи ово користе како би им помогли да пронађу ради у оквиру система библиотека. Друга страна медаље је ово постоје неки озбиљни приватности забринутост због једног од цоре начела библиотеке се нећемо да се говори људи ста други људи читају. А чак и ако кажете ово Књига је закључана од четири пута у одређени месец, које би се могле користити да повеже назад на посебно Лице од де-анонимизинг података и сазнам ко је проверио. Тако начин да можемо авоид-- Начин на који можемо покушати да извуче неки сигнал из свих података без повреде забринутости за приватност ничију је у суштини посматрамо 10 година подацима употреба, - Тако да је током дугог временског периода. --и кажу, у реду, хајде да видимо како много пута ово дело је користе, и од кога за тај период времена, а затим основи врати број који зовемо стек резултат, који у основи представља колико се то користи. А то нумбер-- Много различитих прорачуна иду у том броју. --бут то је веома груба метрички да вас даје нека идеја како заједница може цијенити тај посао. И тако још једна врста чак више разрадити пријаву да користи предности ово је нешто зове Стацклифе, која је у ствари доступне кроз главну Харвард Библиотека портала. Дакле одете у либрари.харвард.еду. Видећете бројне другачије начини сеарцхинг библиотеку. А један од њих се зове Стацклифе. А ово је апликација која претражује садржај библиотеке, али је потпуно изграђено на врху ових АПИ. Тако да нема посебна ствар дешава иза сцене. Нема приступ Подаци које немате. То је користе АПИ да вам пружи са потпуно новим претраживање искуство. Дакле, ако сам тражити Алице ин Вондерланд у овом случају, Ја добијем резултат који личи ово, што је прилично муцх-- То је врло слично било ком другом потрази и ти би могао, осим у овом случају ми ранкинг ставке по стацксцоре, који вам даје нека идеја како популаран ових предмети били у заједници. И тако јасно, Алице ин Вондерланд Волт Дизни је веома популаран. Али можете видети у првих четири Овде су оне можда нећете стварно-- Ствари које су високо користе, али не можете одмах повежу са Алице ин Вондерланд. Тако је наш стари пријатељ Белешкама Алис је овде. Тако да могу да погледам њу. А сад оно што тражим у основи је постављен од-- Ја могу да имају са белешкама Алице овде. Имам информације о томе. И ја такође имам стацксцоре оф, у овом случају, 26. А ово ми говори некако грубо како смо дошли до овог стацксцоре, Као ко га преузели, као начин много пута је преузели, Као факултет или недипломираних, како много копија библиотека има, и тако даље и тако даље. А можете и да, довољно интересантно Овде, претражујете гомиле практично. Тако су подаци овде, ово Вас показује врста виртуелног представљања онога што је полке моћи Изгледаш као да си узети све књигама у библиотеци је и ставите их заједно на једној полици бесконачне. И лепо је што смо можеш-- Пре свега, метаподатака о овим књигама Често вам говори када је објављена. То вам говори колико страница има. То би могло рећи димензије. Тако да можете видети да је овде огледа у смислу величине књига. И онда можемо да користимо стацк резултат за истицање књиге које имају веће резултате. стек Дакле, ако је то тамнија, то значи да, вероватно се користи чешће. Дакле, у овом случају, ја сам ће погодити да је овај је верзија Алице ин Вондерланд да се веома често користи и већина приступљено, библиотека има највише копије. Дакле, ако сте у потрази за Алиса у земљи чуда, ово може бити добро место за почетак. А онда овде можете повезати се да, кажу, Амазон да купи књигу, и тако даље и тако даље. Поента овде, опет, није толико да је овај је најбољи начин да претражујете библиотеку или одговарајући алат за сваку прилику. Али то је још један начин да се то уради. И чинећи податке доступан кроз АПИ, који је направљен од веома једноставних градивних блокова, која вам омогућава да претражите садржај, можете изградити нешто овако да могу изванредно вредни за неке људе. Дакле, то је нека врста, колико ја желим да заиста кажу шта је АПИ и оно што излаже, постоји читава гомила ствари иза сцене, који Само ћу да се осврнем на кратко Само зато што некако долази у ово из потпуно другачијег угла у Услови како се нешто овако се стави на своје место? Дакле АПИ је стандардна интерфејс за све ове садржаја. Али да га тамо, Прва ствар смо морали да урадимо је сабрати информације књига и слика и проналажење помагала, збирка Документ из разних система Харварда. Алеф, ВИА, и ОАСИС су имена система. И они у суштини иду у Гасовод, обрада цевовода. Пре свега, добијамо извоз филес фром све ове системе. Их растали се у појединим ставкама. Тако да имате фајл, што је гигабајт, која има милион рекорде у њој. Тако смо га подијелити у појединим ставкама. Затим, за сваку ставку, ми га претворити у МОДС, јер су неки од њих су изворно МОДС, неки од њих нису. Тако смо их све до бити у истом формату. Затим, ту су различити обогаћивање кораци, гдје додамо још информација у подацима него је био доступан у библиотеци. Зато морамо да додамо, пре свега имамо шта библиотеке стани. Идемо кроз корак израчунавања стацксцоре. Пролазимо кроз још један корак додајући више мета-података у смислу од оног наплате људи Можда је додао ово-- Људи стварају колекције предмета. Шта колекције то припада? Како су људи означена Овај текст у прошлости? Онда филтрирати, и ви ограничити евиденција јер, као што сам поменуо, постоје неке евиденције које, због цопиригхт разлога, не можемо приказати. И онда смо их учитати у нечему што се зове Солр, што није погрешно писање, али је назив неког програма да ли претраживање индексирање, који вози све претрагу иза АПИ. И онда то постаје доступна АПИ, и људи могу да га користе. Дакле, ово је као прилично једноставан процес. Један од интересантно ствари о томе је да се ради са 13 милиона плоча а ми ћемо се бавити или више. И ми желимо да будемо у стању да обради ово у релативно брзом начин. Потребно је много времена да обрадити 13 милиона плоча. Па како ово гасовод је подесите је да сте можеш-- Претпостављам предност Нафтовод, проблем који смо покушавајући да реши овде, јесте да сви трансформације, све ови кораци у ово Гасовод могу одвојити. Нема зависност. Ако обраду запис о једној књизи, нема зависност у да између другог књизи. Па шта можемо да урадимо је у основи, на сваком кораку у цевоводу, смо је ставили у ред у облаку. Ја сам се на Амазон Веб Сервицес. Тако да списак, кажу, 10.000 артикала који морају бити нормализована и конвертоване у МОДС формат. И ми спин што више сервера као што смо желели, можда 10 сервери. И сваки од тих сервера само седи тамо, гледа у том реду, види да постоји онај који треба да се обрађивати, смирена и реда, обрађује га, и штапићи то на следећем реду. И шта да нам дозвољава да урадите је да примењује, у суштини, колико хардвера јер желимо да ово Проблем за веома кратко време да обрађује податке у најкраћем могуће, што је нешто што само, Сада у свету цлоуд цомпутинг Можемо да резервисања сервери суштини тренутно, је то корисно. Дакле, ми не морамо да имамо гигант сервера седим све време да уради обраду да би се могло десити само једном недељно. Дакле, то је углавном то. Има документација доступна Библиотека за Цлоуд АПИ артикла на овој УРЛ, који ће бити доступан касније. И молим вас идите погледајте то да видим има ли шта, имате неку идеју. Играј се са њом. Зезамо. И надамо се можете доћи са нечим великим. Хвала.