Джэфры LICHT: Прывітанне. Я Джэфры Licht. І я тут, каб пагаварыць з вамі пра Бібліятэка Гарвардскага універсітэта і будынак заўтра Бібліятэка сёння, я думаю. Так фон тут, крок да гэтай сесіі па сутнасці, што існуе шмат бібліяграфічных дадзеных даступныя ў бібліятэках Гарварда. І ёсць магчымасць, праз некаторыя з інструментаў, і праект, які распрацоўваецца, каб атрымаць доступ да інфармацыі, і прыняць яго на месцах, Бібліятэка Гарвардскага універсітэта не рабіць прама зараз, зрабіць новы матэрыял з ёй, эксперымент і пагуляць з ім. Такім чынам, кропка ўваходу ў гэта API называецца Бібліятэка Гарвардскага універсітэта воблака, якое з'яўляецца адкрытым сервер метададзеных, якія я буду казаць цяпер. Такім чынам, фон, які існуе Шмат матэрыялу ў бібліятэцы Гарвардскага універсітэта. У нас ёсць больш за 13 мільёнаў кнігазнаўчыя запісы, мільёны малюнкаў, і тысячы знаходжання сродкаў, якія па сутнасці, дакументы, якія апісваюць Калекцыі, кажучы, што у іх, скрыні папер і гэтак далей, якія складаюць больш мільён асобныя дакументы. І ёсць таксама шмат інфармацыя, бібліятэка мае аб тым, як змест, што выкарыстоўваецца можа прадстаўляць цікавасць для людзей, хто хацеў бы працаваць з ім. 

Так усю інфармацыю Бібліятэка мае метададзеныя. Так метададзеныя гэта дадзеныя аб дадзеных. Таму, калі мы гаворым пра інфармацыю, якая даступныя праз бібліятэку Воблака, якое даступна, гэта не абавязкова фактычныя дакументы Самі, не абавязкова поўная Тэкст кнігі ці поўных вобразаў, аднак, што на самой справе можа мець месца. Але гэта на самай справе Інфармацыя аб дадзеных. 

Такім чынам, вы можаце думаць аб каталагізацыі Інфармацыя, абаненцкія нумары, суб'екты, колькі копій Кніга ёсць, тое, што з'яўляюцца выданні, якія фарматы, аўтары, і гэтак далей. Так што шмат інфармацыі аб Інфармацыя, якая змяшчаецца ў зборы, што, само па сабе, гэта свайго роду першапачаткова карыснымі. І, хоць, калі вы рабіць глыбокія даследаванні, Вы, відавочна, хочуць, каб дабрацца да фактычнай здавольвацца і паглядзіце на дадзеныя, Метададзеныя карысна з пункту гледжання і аналіз корпус у цэлым, як тое, што рэчы знаходзяцца ў калекцыі. Як яны суадносяцца паміж сабой? Гэта дапаможа вам знайсці сапраўды іншыя рэчы, які з'яўляецца сапраўды галоўнай мэтай ёй. Кропка Каталог метададзеных і каб дапамагчы вам знайсці ўсе інфармацыю, якая даступныя ў калекцыях. 

Такім чынам, гэта з'яўляецца прыкладам метададзеных для кнігі ў Гарвардскім бібліятэкі. Так што гэта там. І вы можаце бачыць, што гэта на самай справе вельмі складаны. І частку кошту метададзеных у рамках сістэмы Бібліятэка Гарвардскага універсітэта з'яўляецца тое, што гэта было свайго роду з забудавана каталагізавальніка і сабраў людзей, якія прэтэндуюць шмат вопыту і майстэрства і думкі да яго на працягу доўгага часу, які мае вялікую каштоўнасць. 

Так што, калі вы паглядзіце на гэтым запісы для Анатаваны Аліса, вы можаце даведацца ў вас ёсць тытул, які напісаў яго, Аўтар, а ўсе розныя прадметы якія людзі каталог яго ў. І вы можаце бачыць, ёсць таксама ў дадатак да шмат добрай інфармацыі тут, ёсць некаторы дубляванне. Там гэта шмат складанасці гэта адлюстраванне ў метададзеных што ў вас ёсць. 

Так што назва гэтай кнігі Прыгоды Алісы ў краіне цудаў. Так што гэта анатаваных версія гэтай кнігі. Але гэта таксама называецца анатаваных Аліса, Аліса ў краіне цудаў, таму што гэта тое, што Марцін Гарднер напісаў і анатаваны кнігу. І ёсць шмат карыснай інфармацыі аб лагічных галаваломак і рэчаў у Эліс, што вы верагодна, не ведаюць. Такім чынам, вы павінны ісці чытаць гэта. 

Але вы можаце бачыць, што гэта Шмат тут падрабязна, у тым ліку ідэнтыфікатары, калі яго была створана, калі ён прыйшоў, з пункту гледжання Гарвардзе Сістэма і гэтак далей. Так што гэта ўзор тып метададзеных што для кнігі ў вы можаце ўбачыць Калекцыя Бібліятэка Гарвардскага універсітэта. 

Гэта нешта зусім іншае. Так што ёсць сістэма, званая VIA Гарвард, які ў асноўным з'яўляецца каталагізацыя малюнкаў і прадметаў мастацтва і візуальныя рэчы па ўсёй Гарвардзе, і даданне некаторых метададзеных да іх, іх класіфікацыі, і, у некаторых выпадках, забяспечваючы мініяцюр малюнкаў што вы можаце ўзяць паглядзець, калі вы так хочаце. 

Такім чынам, гэта з'яўляецца прыкладам метададзеныя, якія ў вас ёсць для пласціны ад, як мяркуецца, Аліса ў краіне цудаў. І вы можаце бачыць, што гэта менш метададзеныя тут. Гэта проста іншы выгляд аб'екта. І такім чынам, ёсць менш інфармацыі. 

У вас хутчэй за ўсё той факт, што выклік Колькасць, па сутнасці, хто яго стварыў, - 

Мы не ведаем, калі яна была створана. 

--і назву. 

Іншы прыклад. Гэта дапамога знаходкай. Так што калекцыя Люіс Газеты Кэрала ў Гарвардзе. Так гэта апісвае, што у гэтай калекцыі. Дык хто-то пайшоў да канца і прагледзеў усе палі і каталягізаваць яго, улічваючы некаторыя фон, напісаў агляд таго, што тут. І калі вы паглядзіце У далейшым, пры гэтым, гэта працягваецца на працягу старонкі і старонкі і старонкі, але скажу вам, якія літары і што даты ад таго, што скрынкі існавала на працягу ўсёй калекцыі. Але гэта нешта што, калі вы ў Гарвардзе, Вы можаце пайсці і на самай справе фізічна глядзець і, па-відаць, зірнуць на. 

Так што гэта ўсё выдатна. Гэтыя метададзеныя Карысныя. Гэта ў сістэме Бібліятэка Гарвардскага універсітэта. Ёсць інструменты онлайн, дзе вас можа пайсці і зірнуць на яго, і ўбачыць яго, і шукаць яго. І вы можаце нарэзаць яго і косткі гэта ў вялікай колькасці розных спосабаў. 

Але гэта сапраўды даступная, толькі калі Вы чалавек істота сядзіць ўніз ў вашым вэб-браўзэры або што- Ваш тэлефон і навігацыі па іх. Гэта на самай справе не даступны ў любы від карыснай моды для іншых сістэм або іншыя кампутары ў выкарыстанні, няма з сістэмамі ў рамках Бібліятэка Гарвардскага універсітэта, але сістэмы ў навакольным свеце, за ўсё іншыя людзі ў цэлым. Так пытанне ў тым, як мы можам зрабіць яго даступным для кампутараў так што мы можам зрабіць больш цікавым Матэрыял з ёй, чым проста прагляд гэта самі? 

Дык чаму ж вы хочаце гэта зрабіць? Ёсць шмат магчымасцяў. Адным з іх з'яўляецца, вы можаце пабудаваць цалкам іншы спосаб прагляду змест, якое даступна праз Гарварда бібліятэк. Я пакажу вам адзін пазней названы Stacklife, які мае зусім іншы ўзяць на доступ да змесціва. 

Вы маглі б пабудаваць рэкамендацыі рухавіка. Так Бібліятэка Гарвардскага універсітэта не знаходзіцца ў бізнес кажучы, вам падабаецца гэтая кніга. Затым перайдзіце зірнуць на іх яшчэ 17 кнігі, якія вы маглі б быць зацікаўлены ў або гэтыя 18 іншыя выявы. Але гэта, вядома, маглі быць каштоўным уласцівасцю. А калі ўлічыць, метададзеныя, ён можа можна пакласці, што разам. Вы можаце мець розныя патрэбы ў Умовы пошуку змест, як, можа быць, нягледзячы на ​​інструменты, якія даступныя, што бібліятэка робіць ў наяўнасці, вы можаце шукаць па-іншаму або аптымізаваць для канкрэтнага выкарыстання, якія, можа быць, гэта вельмі спэцыялізаваўся. Можа быць, ёсць толькі некалькі людзі ў свеце, якія хочаце шукаць ўтрыманне У гэтым выпадку, аднак было б выдатна, калі мы мог дазволіць ім зрабіць гэта. Там вельмі шмат аналітыкі за ўсё, як людзі выкарыстоўваем змесціва, якое будзе сапраўды Цікава ведаць пра, даведацца, якія кнігі выкарыстоўваюцца, што няма, і гэтак далей. А тут яшчэ шмат магчымасць інтэграцыі з іншай інфармацыяй што-то там у Інтэрнэце. Такім чынам, мы have-- 

Напрыклад, NPR мае сегмент Рэцэнзія на кнігу, дзе яны бяруць інтэрв'ю Аўтары пра кнігі. І таму было б выдатна, калі б вы былі гледзячы кнігу ў Гарвардзе Бібліятэка, а вы кажаце, добра, што ёсць быў Інтэрв'ю з аўтарам. Давайце зірнем на гэта. Ці ёсць старонка Вікіпедыі, а аўтарытэтны, навуковая даведка аб гэтай кнізе, што вы магчыма, захочаце зірнуць на. 

Ёсць гэтыя тыпы крыніц раскіданыя па ўсёй сеткі. І чаго іх разам можа быць вялікая выкарыстанне для каго-то, гледзячы на Змест, гледзячы на ​​нешта. Але гэта таксама ня выгляд, што вы б хачу бібліятэка несці адказнасць для пераходу ўніз і паляванне усе гэтыя розныя крыніцы і падключыць іх разам таму што яны ўвесь час мяняліся. І тое, што яны думаюць, што вельмі важна мая не можа быць тое, што вы лічыце важным. 

І ўжо тым больш, у асноўным там шмат рэчаў мы не думалі да гэтага часу. Так што, калі мы можам адкрыць гэта, больш людзі, акрамя паўтара дзесятка або каля таго, хто глядзіць на гэта на рэгулярнай аснове можа думаць ідэй і масаж дадзеныя, і рабіць тое, што яны хочуць з ім. 

Таму мы хочам, каб зрабіць гэта Дадзеныя з наяўных у свеце. Ну, ёсць пара ўскладненні. Па-першае, гэты метададзеных у розных сістэмах. Гэта ў розных фарматах. Так што некаторыя нармалізацыя які павінен адбыцца, якія нармалізацыі быць працэс даводзячы справу з розных фарматаў і адлюстраванне іх у адзіны фармат так, што поля будзе супадаць. 

Ёсць некаторыя абмежаванні аўтарскага права. Як ні дзіўна, размяшчэнне інфармацыі ў каталогу пра кнігу адказнасці за аўтарскія правы. Таму, нават калі гэта проста звесткі, атрыманыя з кнігі, гэта защищаема. І ў залежнасці ад таго, хто на самай справе створана гэтыя метададзеныя, могуць быць абмежаванні адносна таго, хто можа распаўсюджваць яго, падобна to-- 

Я не ведаю. Гэта можа ці не можа быць аналагічны Становішча тэксту песні, напрыклад. Так што мы ўсе ведаем, як гэта рондаля. Такім чынам, вы павінны абыйсці гэтую праблему. 

А потым яшчэ кавалак што ёсць шмат дадзеных. Так што, калі я каго-небудзь, хто хоча працаваць з дадзенымі або мае класная ідэя, справу з 14000000 запісы на маім ноўтбуку можа быць праблематычным і цяжка кіраваць. Таму мы хочам, каб паменшыць бар'еры для людзей каб мець магчымасць працаваць з дадзенымі. 

Так падыходу, які, мы спадзяемся, адрасу усе гэтыя праблемы з'яўляецца дзве часткі. Адзін будуе платформу, якая прымае Дадзеныя ад усіх гэтых разнастайных крыніц і пагаршае яе, нармалізуе, ўзбагачае яго, і робіць гэта даступна ў адным месцы. І гэта робіць яго даступным праз грамадскага API, што людзі могуць патэлефанаваць. 

Так API з'яўляецца прымяненне Інтэрфейс праграмавання. І гэта ў асноўным ставіцца да Канчатковая кропка, сістэма або тэхналогія можа патэлефанаваць і атрымаць дадзеныя назад у структураваны фармат такім чынам, што ён можа быць выкарыстаны. Так што гэта не залежыць пры пераходзе на сайт і выскрабанне дадзеныя з гэта, напрыклад. 

Так што гэта хатняя старонка Бібліятэка Cloud тавару API, які з'яўляецца па сутнасці яе варыянт два. Так што гэта другі ітэрацыі спрабуе зрабіць усё гэтыя дадзеныя распаўсюд па ўсім свеце. Так што гэта http://api.lib.harvard.edu/v2/items. І толькі разарваць гэты ўніз ледзь-ледзь, што гэта значыць тое, што гэта варыянт два з API. Там гэта версія аднаго, які Я не збіраюся казаць пра гэта. Але ёсць версія адна. 

І калі вы тэлефануеце ў гэтым API, вы атрымліваеце элементы. І частка ідэі API з'яўляецца API з'яўляецца кантракт. Гэта тое, што з'яўляецца не збіраецца мяняць. Так, напрыклад, - 

І прычына ў тым, што калі я пабудаваць нейкую сістэму, збіраецца выкарыстоўваць бібліятэку хмарных API для адлюстравання кнігі ці дапамагчы людзям знайсці Інфармацыя, якая змяшчаецца ў унікальных спосабаў, што мы не хочам каб гэта адбылося для нас, каб пайсці змяніць, як што API працуе, і раптам усе ламае на баку канчатковага карыстальніка. Так што частка, калі вы робіце API распаўсюд па ўсім свеце, гэта добрая практыка, каб пакласці нумар версіі ў ім, каб людзі даведацца, якая версія яны маюць справу з. 

Так што, калі мы вырашым, што знайсці лепшы спосаб зрабіць гэтую інфармацыю даступнай, мы маглі б змяніць, што назваць гэта трэцяй версіі. Таму кожны, хто па-ранейшаму выкарыстоўвае Версія другая, што яшчэ будзем працаваць. Але версія тры будзе ёсць ўвесь новы матэрыял. 

Такім чынам, гэта API, але гэта сапраўды падобна на URL. І так, што гэта Прыкладам з'яўляецца тое, што называецца API адпачынак, які даступны Толькі за звычайны вэб злучэння. І вы можаце на самой справе ісці да яе ў браўзэры. 

Дык вось, я проста адкрыў Firefox і адправіліся ў api.lib.harvard.edu/v2/items. І так, што я атрымліваю тут у асноўным першая старонка вынікаў ад усяго набор элементаў, якія мы атрымалі. І менавіта тут у фармаце XML. І гэта таксама prettified па Firefox. Гэта на самай справе не ўсе з іх трохі пашырацца і сціскацца doohickeys тут. Гэта свайго роду прыемней Версія спосаб глядзець на яго. 

Але тое, што гэта кажа нам пра тое, Я прасіў ўсе дэталі. Такім чынам, ёсць 13289475 пункты. І я гляджу на першы 10, пачынаючы з пазіцыі нулявога таму што ў інфарматыцы мы заўсёды пачынаем з нуля. І тое, што я тут, калі я проста абрынецца гэта, вы ўбачыце, што я атрымаў 10 пунктаў. 

І калі я зірну на пункт, я магу бачыць, што ў мяне ёсць інфармацыю пра яго. І гэта ў той, што называецца MODS форма. І таму я буду перамыкацца сюды на хвіліну. ОК. 

Такім чынам, давайце шукаць што-то ў пэўнымі, таму што першы элемент, які адбываецца, каб прыдумаць, калі вы глядзіце ўсю калекцыю гэта, па вызначэнні, выпадковым чынам. Такім чынам, давайце паглядзім на некаторыя пончыкі. Ох. 

ОК. Так пончыкі. Такім чынам, мы знайшлі там 80 пунктаў у Калекцыя, якія спасылаюцца на пончыкі. Мы глядзім на першыя 10 з іх. Цяпер вы можаце паглядзець тут так, што Я сказаў, што я шукаю для пончыкаў, Я проста дадаў нешта Радок запыту ў URL. Так Q роўны пончыкі, якія вы можаце см крыху лягчэй тут. 

І гэта ў асноўным азначае, што ёсць Спецыфікацыя для API, які вызначае, што ўсе Гэтыя параметры азначаюць. А гэта значыць, што мы збіраемся пошук усё для пончыкаў. 

Дык вось першы пункт у нас ёсць Вы можаце бачыць назву Donuts, і існуе субтытраў называецца Амерыканскі запал, якая, я думаю ,, адпаведна. Ёсць шмат different-- Пасля таго як вы дойдзеце да кропкі, атрымання дадзеных, Ёсць шмат розных Фарматы, якія вы можаце атрымаць яго ў. І існуюць розныя моцныя і слабыя для ўсіх з іх. Так што гэта адзін, вы можаце ўбачыць тут, гэтая форма вельмі багаты. І гэта стандартызаваны. 

Так што канкрэтную назву поле, поле субтытры. Там гэта альтэрнатыўны назву, амерыканскі страсці. Існуе імя, звязанае з ім. Тып рэсурсу тэкстаў. Там вельмі шмат інфармацыі Тут, у гэтым фармаце. 

Але ёсць куча розных фарматаў. Такім чынам, што мы былі проста гледзячы на ​​гэта фармат званыя моды, якая стаіць за Аб'ект метададзеных Апісанне Service, патэнцыйна. На самай справе я не зусім упэўнены, аб С. Але гэта даволі складаны фармат. Гэта фармат па змаўчанні. 

Але гэта той, які трымае Багацце ўсіх дадзеных, што бібліятэка мае, таму што гэта вельмі блізка да таго, што Бібліятэка выкарыстоўвае ўнутрана. Гэта стандарт, які з'яўляецца выкарыстоўваецца па ўсёй краіне, па ўсім свеце ў акадэмічных бібліятэках. І гэта вельмі сумяшчальныя. Так што, калі ў вас ёсць дакумент што ў фармаце моды, Вы можаце даць, што кагосьці іншага чые сістэмы разумеюць моды, і яны могуць імпартаваць яго. Так што гэта стандарт. Гэта вельмі добра вызначаны, вельмі спецыфічны. І гэта тое, што робіць яго ўзаемадзейнічаць, таму што калі хто-то кажа, гэта альтэрнатыўны назву запіс, усе ведаюць, што гэта значыць. З іншага боку, гэта вельмі складана. 

Так што, калі вы паглядзіце у гэтым запісы тут, калі я проста хачу, каб атрымаць назва гэтага дакумента, з гэтай кнігі, якая, верагодна, Donuts, Амерыканскі Страсць, аналіз яго гэта крыху удзел. У той час як ёсць іншы фармат, званы Dublin Core, які з'яўляецца значна, значна прасцей фармат. 

І таму вы не ўбачыце тут, няма ніякай загаловак, падзагаловак, альтэрнатыўны назву. Там проста назва, Donuts, амерыканскі Страсць, і яшчэ адзін тытул, амерыканскі страсці. Таму, калі вы глядзіце на тое, што форма Вы хочаце, каб атрымаць дадзеныя з, Многае залежыць ад таго, як Вы збіраецеся яго выкарыстоўваць. Карыстаецеся Ці вы для сумяшчальнасць ці вы хочаце нешта простае, што можа быць лягчэй працаваць? 

З іншага боку, шмат якія дэталі накшталт сплясканыя ўніз. Вы можаце страціць усе нюансы што канкрэтныя сродкі на месцах калі вы маеце справу з Dublin Core, якія вы не атрымаеце з модамі. Так што тыя два з фарматаў Вы можаце выйсці з API. І ў асноўным, мы трымаем гэта за кулісамі ў модов. Але мы можам даць вам яго ў Моды і Dublin Core і ўсё астатняе таксама. Іншае меркаванне, калі Вы шукаеце ў дадзеных што вы можаце атрымаць яго альбо як JSON, які выступае за натацыі аб'ектаў JavaScript, ці XML, якая выступае за Extensible Markup Language. І гэтыя прадстаўлення дадзеных і маюць адны і тыя ж дадзеныя, дакладна адны і тыя ж поля. Але яны проста сінтаксічна розныя. 

Так што гэта a-- Ну, давайце проста пераключыцца. Так што гэта наш запыт на пончыкі ў фармаце XML. Калі б я проста пераключыцца, каб гэта было JSON, Я бачу, што выглядае па-іншаму. Так што цяпер гэта ж самае ўтрыманне, а іншая структура. Ёсць менш вуглавыя дужкі. Там гэта менш шматслоўным. 

І гэта фармат, які, калі вы працуюць у вэб-асяроддзі, вы, хутчэй за ўсё, будзе хочаце выкарыстоўваць, таму што адзін з добрых рэчаў аб JSON з'яўляецца ён сумяшчальны з JavaScript. Так што, калі я пішу вэб-дадатак, я магу цягнуць у JSON і проста працаваць з ім напрамую. У той час як з XML, гэта крыху больш складана. Такім чынам, яшчэ раз, гэта як карысна. Яны проста розныя выпадкі выкарыстання дзе людзі маглі б хацець выкарыстоўваць іх. ОК. Такім чынам, вернемся да API. Так мы можам шукаць for-- 

Я прывяду прыклад пошук пончыкі. Мы таксама можам шукаць толькі ў канкрэтнае поле ў тут. Такім чынам, замест таго, каб шукаць Уся запіс, Я магу проста шукаць у поле загалоўка. І вось зараз ёсць 25 рэчаў, якія ёсць пончыкі ў загалоўку, адзін з якіх аб аднаўленні водна-балотных угоддзяў у кіраванні адтуліны ў пончык Праграма, якая, верагодна, не абавязкова, што мы шукаем калі мы шукаем для пончыкаў. 

Вы можаце таксама, калі вы справу з API-- 

Частка які мае API дае людзям доступ да вялікіх наборам дадзеных. І ёсць некалькі розных інструменты, якія можна выкарыстоўваць, каб зрабіць гэта. Адным з іх з'яўляецца, вельмі проста, вы можа прагартаць дадзеных. Так як калі б вы зрабіць запыт праз вэб-інтэрфейс, Вы можаце паглядзець на першай старонцы, другая старонка, старонка тры. Вы можаце зрабіць тое ж самае што праз API. Вы проста павінны быць Відавочны ў тым, як вы гэта робіце. 

Так, напрыклад, калі я шукаю ў маім першым запыце тут, дзе я раблю пошук для рэчаў з пончыкі ў назве, я магу казаць, і мяжа роўны 20, што азначае, даць мне першыя 20 запісаў, а не першы 10, які з'яўляецца па змаўчанні, таму што я хачу паглядзець на 20 адначасова. Ці я магу сказаць, усталяваць пачаць роўна 20 і мяжа раўняцца 20, што дасць мне запісвае з 21 па 40. 

Так што я думаю рэч забраць тут што мы, выкарыстоўваючы радкі запыту каб усталяваць параметры на запыт. І гэта дазваляе кантраляваць тое, што вы вернецеся. 

Яшчэ адзін інструмент, які можна выкарыстоўваць, - 

І гэта сапраўды карысна ў Умовы вывучае дадзеныя. 

--is тое, што называецца агранка. Так тэрмін агранка з'яўляецца не павінны быць агульнымі. Але вы ўсё бачылі яго раней. Калі вы паглядзіце на Amazon, напрыклад, і вы робіце пошук пончыкі ў кнігах, тут яны атрымалі серыю кніг, і яны згрупаваныя па катэгорыях, і вы атрымаеце розныя катэгорыі, і колькі кніг у кожнай катэгорыі паказаць ўверх. 

Так што гэта ў асноўным аспект. Вы бераце ўсе свае кнігі, 1800 кнігі, якія адпавядаюць пончыкі на Amazon. 12 з іх знаходзяцца ў катэгорыя сняданак. 21 у цесцю і выпечка, і гэтак далей, і гэтак далей. 

Так што гэта сапраўды карысна інструмент для даследавання ўтрымання ў бібліятэцы, а таму што, калі вы глядзіце на мяжы, гэта дае вам ўяўленне пра тое, якія прадметы існуе, як, якія віды суб'ектаў Найбольш папулярныя ў ваш набор запыту. І гэта дапаможа вам адагнаць і даследаваць. Такім чынам, мы можам зрабіць тое ж самае. 

Калі мы хочам выкарыстоўваць API і паглядзець на мяжы, мы дадаць яшчэ адзін параметр наш сябар радок запыту. Так граняў складае коску Спіс таго, што мы хочам, каб фаскай па. Такім чынам, адна з граняў можа быць прадметам. Яшчэ можа быць мова. І таму, калі мы запусцім гэты запыт, мы get-- Гэта выглядае даволі шмат ж самае. Але мы дадалі да канца з спісу набор граняў. Такім чынам, мы маем аспект, званы аб'ектам. Так што гэта кажа нам, што калі я гляджу на мае 80 вынікаў пончык запыту, 13 з іх маюць тэрыторыі Злучаных Штатаў. Тры ёсць пончыкі па тэме. Тры мець тэму аднаўлення водна-балотных угоддзяў, які можа быць наш адтуліну ў пончык. Двое з іх, Сімпсаны, і гэтак далей, і гэтак далей. 

Так што гэта можа быць карысна, калі вы хочаце, каб звузіць свой пошук. Гэта можа дапамагчы вам зрабіць гэта. Асабліва, калі ў вас ёсць больш чым, скажам, 80 вынікаў. 

Акрамя таго, мы таксама папрасілі для гранямі мове. Так што, калі мы паглядзім на нашы вынікі, мы бачым, 76 з іх на англійскай мове, чатыры на французскай мове, два на іспанскай мове, два, я думаю, што гэта не вызначана, ці невядома, галандскі і латынь. Так што я думаю, што па-латыні пончык вынік, зноў жа, не мае нічога агульнага з хлебабулачных вырабаў. Але там вы ідзяце. 

Так што гэта свайго роду паказваючы вам, як вы можаце выцягнуць дадзеныя назад ад API толькі праз вэб-браўзэр, які выдатна падыходзіць. Але гэта не зусім тое, што вы б як правіла, з выкарыстаннем у API для гэтага. Так адзін прыклад таго, як трэба можа на самай справе зрабіць гэта я маю напісана супер невялікая праграма, якія, зноў жа, не мой пошук пончыкі і выбірае пару поля і адлюстроўвае іх у выглядзе табліцы. Так што гэта вельмі той жа змест, што мы проста піла з некалькімі палямі выцягнуў. Так спіс назваў, у размяшчэнне, што кніга о, мова, і гэтак далей, і гэтак далей. 

Так, як гэта адбылося на самай справе, так як Я думаю, мы павінны глядзець на код, is-- 

Тое, што мы маем тут справу з простай HTML старонка, якая адлюстроўвае тэкст, Сардэчна запрашаем у бібліятэку воблака і то на экран выводзіцца табліца вынікаў. І няма, відавочна, не прыводзіць да Табліца калі старонка загружаецца. Але тое, што мы робім гэта, у першую чаргу, мы загружаюцца бібліятэку пад назвай JQuery, які з'яўляецца ў асноўным Бібліятэка наяўнасць якога робіць яго вельмі лёгка маніпуляваць наяўнасць першапачаткова, HTML, а таксама ствараць вэб-старонкі, на баку кліента логіка і вэб-старонак. 

Такім чынам, што мы маем тут справу з JQuery мае метад Get, што істотна пойдзе на Спасылка, якая, у дадзеным выпадку, гэта знаёма гледзячы URL. І тады атрымаеце ўтрыманне ад што URL, а затым запусціць функцыю на ёй. Таму мы сказалі пайсці ў api.lib.harvard / Edu. Пошук пончыкі. Дайце нам 20 запісаў. І затым запусціць гэтую функцыю, якая Я абраў, перадаючы яму дадзеныя. І дадзеныя JSON, што атрымаў вярнуўся з API. 

І тады мы кажам, у тым, што Дадзеныя ёсць поле, званае пункт. І калі я пайду зірнуць назад на адзін з гэтых вынікаў, што тут, ёсць што-то called-- 

Ну, гэта называецца пункт. Так, што можа быць, што. І тое, што яна робіць, гэта яго праходзіць праз кожнага элемента а затым выклікае іншае Функцыя па кожным пункце. І, што функцыя ў асноўным прымае значэнне пункта, што з'яўляецца па сутнасці асобная запіс і дазваляе выцягнуць назву, ахоп і мову. 

Так мы называем функцыю на кожны элемент, які мы вярнуліся з API. І калі вы проста паглядзіце на гэты кавалак прама тут, тое, што мы робім, мы ствараем радок, які з'яўляецца па сутнасці некаторыя HTML разметка вакол стала, з value.title, што назва Аб'ект, value.coverage, які з'яўляецца асвятленне, - 

І мы робім праверку тут, каб убачыць, хто не вызначана і хаваючы яго, калі ён кажа, што не вызначана, таму што мы на самай справе не зацікаўлены ў гэтым. 

--і тады мову. І тады тое, што мы робіце дадання, што да табліцы, якая вызначаны гэтым радком тут. І як JQuery працуе гэта тое, што гэта гаворыць гэта паглядзець на табліцу з ідэяй Вынікі і дадайце ў яго тэкст. І гэта табліца з вынікамі ідэя. Так што вы ў канчатковым выніку з гэта старонкі тут. А для таго, каб праглядзець source-- Ну, крыніцай на самай справе не абнаўляюцца, калі гэта адбылося. Такім чынам, вы можаце ўбачыць фактычнае Вынікі табліцы, хоць тут. 

Так што гэта проста просты прыклад робіць вельмі просты запыт да API і адлюстравання інфармацыі, у нейкай іншай форме, і нічога не робіць занадта фантазіі. Цяпер яшчэ адзін прыклад, як праграма, напісаная Дэвідам Вайнбергером як дэма гэта, што па сутнасці паказвае вам, як вы можаце пюрэ вынікі вы атрыманне з бібліятэкі хмарных API з, скажам, Google Books. 

І мысленне тут з'яўляецца тое, што я магу выканаем запыт Google Books, атрымаць паўнатэкставы пошук, атрымаць некаторыя вынікі назад, высветліць, якія з гэтых элементаў на самай справе існуе ў Холлис, бібліятэчная сістэма, а затым даць мне спасылкі Вярнуцца да гэтых элементаў. Так што, калі я шукаю, гэта было цёмная і бурная ноч, я вярнуцца кучу вынікаў ад Google, а затым адзін вынік што маршчын ў часе. І гэта спасылкі на кнігі, якія існуюць у рамках сістэмы Бібліятэка Гарвардскага універсітэта. 

Так што я думаю, справа тут не ў так што гэта можа ці не можа быць так, што вы хочаце шукаць бібліятэку, але гэта зусім розныя так, што не было даступна для вас перш, як вас не было ніякай магчымасці рабіць Поўны тэкст пошук па кнігах, што нават былі часткай сістэмы Бібліятэка Гарвардскага універсітэта. Так што цяпер гэта спосаб што вы можаце зрабіць гэта. І іх можна адлюстраваць у любы фармат, вы хочаце. Так момантам тут з'яўляецца, у асноўным, мы адкрываем новыя шляхі для людзей працаваць з дадзенымі. 

Іншая частка бібліятэкі аблокі, што гэта дапамагае раскрыць некаторыя з дадзеных выкарыстання што бібліятэка мае. Так што, калі вы ідзяце ў бібліятэку, і вы шукаеце для кніг, Вам не абавязкова на самай справе маюць уяўленне аб тым ,, для ўсіх элементаў у канкрэтны суб'ект, тое, што людзі ў супольнасць, няхай гэта будзе вызначаецца як Гарвард ці краіна ці ваш клас, Што яны апынуліся найбольш карыснымі? І бібліятэка на самай справе мае Велізарная колькасць інфармацыі аб тым, што найбольш карысны, паколькі калі шмат людзей праверыць кнігу, што кажа вам што-то. Там быў нейкай прычыне яны хочуць, каб праверыць яго. Шмат людзей пакласці яго ў запасе. 

Калі гэта рэзервовы спіс для многіх класаў, які кажа вам што-то. Калі выкладчыкі правяраюць яго з шмат і студэнты не з'яўляюцца, што кажа мне нешта. І наадварот, што таксама кажа вам што-то. Таму было б вельмі цікава пакласці гэтую інфармацыю там, і хай людзі выкарыстоўваюць яго, каб дапамагчы ім знайсці працуе ўнутры бібліятэчнай сістэмы. Адваротным бокам гэтага з'яўляецца ёсць некаторыя сур'ёзныя прыватнасці праблемы, таму што адзін з Асноўныя прынцыпы бібліятэкі што мы не збіраемся распавядаць людзі, што іншыя людзі чытаюць. І нават калі вы кажаце, гэта Кніга была праверана чатыры разы у пэўным месяцы, , Якія могуць быць выкарыстаны спасылаюцца на асаблівасці чалавек па дадзеных дэ-анонимизирующая і высветліць, хто праверыў гэта. Так так, што мы можам avoid-- Так, што мы можам паспрабаваць атрымаць некаторыя сігнал ад усёй інфармацыі, без парушэння недатыкальнасці прыватнага жыцця нічыіх па сутнасці мы глядзім на 10 гадоў дадзеныя аб выкарыстанні, - 

Такім чынам, гэта на працягу доўгага перыяду часу. 

--і кажуць, добра, давайце паглядзім, як шмат разоў быў выкарыстаны гэтую працу, і якія на працягу гэтага перыяду часу, і то ў асноўным вярнуць нумар, які мы называем адзнака стэк, які ў асноўным паказвае, наколькі яна была выкарыстаная. І што number-- Шмат розных разлікаў перайсці ў гэты лік. --but гэта вельмі грубая паказчык, які дае вам Некаторы ўяўленне пра тое, як супольнасць могуць ацэньваць гэтую працу. 

І так іншага роду, нават больш канкрэтызаваны прыкладання якая скарыстаецца перавагамі гэтага з'яўляецца тое, называецца Stacklife, якая на самой справе даступныя праз галоўнае Гарвардзе Бібліятэка партала. Так вы ідзяце ў library.harvard.edu. Вы ўбачыце шэраг розных шляху пошуку бібліятэкі. І адзін з іх завецца Stacklife. 

І гэта дадатак, якое праглядае ўтрыманне бібліятэкі, але цалкам пабудаваны па-над гэтых інтэрфейсаў. Такім чынам, няма ніякіх спецыяльных матэрыял адбываецца за кулісамі. Там няма доступу да дадзеныя, якія вы не маеце. Яна выкарыстоўвае API-інтэрфейсы, каб даць вам з зусім іншай прагляду вопыт. 

Так што, калі я шукаю для Алісы ў краіне цудаў у гэтым выпадку, Я атрымліваю вынік, які выглядае як гэта, які з'яўляецца даволі much-- 

Гэта вельмі падобны на любы іншы катэгорыі Вы маглі б зрабіць, акрамя як у гэтым выпадку мы ранжыравання дэталі stackscore, што дае вам Некаторы ўяўленне пра тое, як папулярныя ў гэтыя прадметы былі ў грамадстве. І так ясна, Аліса ў краіне цудаў Уолт Дысней вельмі папулярныя. Але вы таксама можаце ўбачыць першую чацвёрку вось тыя, што вы, магчыма, не actually-- 

Рэчы, якія высока выкарыстоўваюцца, але вы не можаце адразу звязацца з Аліса ў краіне цудаў. Такім чынам, наш стары сябар Анатаваны Аліса тут. Так што я магу зірнуць на яго. А зараз тое, што я шукаю у асноўным усталёўваецца of-- Я магу мець з заўвагамі Аліса тут. У мяне ёсць інфармацыя пра яго. І ў мяне таксама ёсць stackscore ад таго, у гэтым выпадку, 26. І гэта кажа мне накшталт прыкладна як мы патрапілі ў гэты stackscore, як хто правяраў яго, напрыклад, як шмат разоў быў праверылі, як факультэт або старшакурснікі, як шмат копій бібліятэка мае, і гэтак далей, і гэтак далей. 

І вы можаце таксама, досыць цікава тут, праглядаць стэкі віртуальна. Такім чынам, дадзеныя тут, гэта паказвае вам разабрацца віртуальнага прадстаўлення ад таго, які шэльфа моцы выглядаць, калі вы павінны былі прыняць усе фондаў бібліятэкі і пакласці іх разам на адной бясконцай паліцы. І прыемна тое, што мы can-- 

Перш за ўсё, метададзеныя аб гэтых кнігах часта кажа вам, калі яна была апублікаваная. Яна кажа вам, колькі старонак ён мае. Гэта можа сказаць вам памеры. Такім чынам, вы можаце бачыць, што адлюстравана тут па памеры кніг. 

І тады мы можам выкарыстоўваць стэк кошт, каб вылучыць кнігі, якія маюць больш высокія паказчыкі складаюцца. Так што, калі ён цямней, гэта азначае, што, Мяркуюць, што яна выкарыстоўваецца часцей. Такім чынам, у гэтым выпадку, я буду гадаць, што гэта Гэта версія Алісе ў краіне цудаў які вельмі шырока выкарыстоўваецца і найбольш Доступ, бібліятэка мае больш копій. Так што, калі вы шукаеце Аліса ў краіне цудаў, гэта можа быць добрым месцам для пачатку. 

І тады тут Вы можаце таксама звязаць з , Скажам, Amazon, каб купіць кнігу, і гэтак далей, і гэтак далей. Справа тут, зноў жа, не так шмат, што гэта гэта лепшы спосаб, каб праглядзець бібліятэку ці правільны інструмент для кожнага выпадку. Але гэта яшчэ адзін спосаб зрабіць гэта. І, зрабіўшы дадзеныя даступныя праз API, які выраблена з вельмі простых блокаў, які дазваляе шукаць кантэнт, Вы можаце пабудаваць што-то як гэта, што можна быць надзвычай каштоўным для некаторых людзей. 

Дык вось накшталт, як я хачу сказаць на самой справе аб тым, што API з'яўляецца і тое, што ён дае, ёсць уся куча рэчаў за кулісамі, якія Я проста хачу, каб дакрануцца да коратка толькі таму, што ён быццам ідзе на гэта з цалкам іншага пункту гледжання ў Ўмовы, як робіць нешта накшталт гэтага атрымаць пакласці на месца? 

Так API з'яўляецца стандартным інтэрфейс для ўсяго гэтага кантэнту. Але каб атрымаць яго там, Першае, што мы павінны былі зрабіць быў зблізіць інфармацыі кніг і малюнкаў і сістэмах пошуку, збору Дакумент з розных сістэм Гарварда. Алеф, VIA і аазіса імёны сістэм. І яны па сутнасці ісці ў Трубаправод, канвеер апрацоўкі. 

Такім чынам, перш за ўсё, мы атрымліваем экспарт файлы з усіх гэтых сістэм. Мы падзялілі іх на асобныя элементы. Таму ў нас ёсць файл, які гігабайт, які мае мільёнаў запісаў у ім. Такім чынам, мы падзялілі яго на асобныя элементы. Затым, для кожнага элемента, мы ператвараем яго у моды, таму што некаторыя з іх зыходна моды, некаторыя з іх не. Такім чынам, мы атрымліваем іх усё, каб знаходзіцца ў тым жа фармаце. Тады існуюць розныя ўзбагачэнні крокаў, дзе дадаць дадатковую інфармацыю да дадзеных чым была даступная ў бібліятэцы. Такім чынам, мы павінны дадаць, у першую чаргу мы маем тое, што бібліятэкі ўтрымаць яго. Мы праходзім праз стадыю разліку stackscore. Мы праходзім праз іншы стадыі дадаўшы больш метададзеных у плане з якіх набораў людзей мог бы дадаць this-- 

Людзі ствараюць наборы элементаў. Што калекцыі ён належыць? Як бы людзі з тэгамі гэта ўтрыманне ў мінулым? Тады вы адфільтраваць, і вы абмяжоўваеце запісы, таму што, як я ўжо казаў, ёсць некаторыя запісы, якія, з-за Прычыны аўтарскіх правоў, мы не можам адлюстраваць. А потым мы загружаем іх у тое, што называецца Solr, якая не памылка друку, але Гэтае імя часткі праграмнага забеспячэння што робіць індэксаванне пошуку, якія Прывады Усе пошукам ззаду API. І тады ён становіцца даступным для API-інтэрфейс, і людзі могуць яго выкарыстоўваць. 

Так што гэта, як справядліва просты працэс. Адным з цікавых усё аб ім што мы маем справу 13 мільёнаў запісаў і мы будзем мець справу ці больш. І мы хочам, каб быць у стане справіцца гэта ў адносна хутчэйшага моды. Гэта займае шмат часу, каб апрацоўваць 13 мільёнаў запісаў. 

Так як гэты трубаправод наладзіць, што вы can-- Я думаю, перавага Трубаправод, праблема, што мы спрабуе вырашыць тут, з'яўляецца тое, што усе пераўтварэнні, усё Гэтыя крокі ў гэтым Трубаправод неаддзельныя. Там няма залежнасці. Калі вы апрацоўваеце запіс адной кнігі, няма утрыманцаў ў што паміж іншай кнізе. 

Такім чынам, што мы можам зрабіць, гэта ў асноўным, на кожным кроку ў трубаправодзе, мы ставім яго ў чаргу ў воблаку. Мне давялося быць на Amazon Web Services. Так што спіс, кажуць, 10000 прадметаў, якія павінны быць нармалізаваныя і пераўтворыцца ў фармат модов. І мы раскручваецца столькі сервераў Так як мы хочам, можа быць, 10 сервераў. І кожны з гэтых сервераў толькі сядзіць там, глядзіць у гэтай чарзе, бачыць, што ёсць адзін, які павінен апрацоўвацца, цягне яго з чаргі, апрацоўвае яго і палачкі На наступным чарзе. 

І так, што гэта дазваляе нам зрабіць, гэта ўжыць, па сутнасці, як шмат апаратных сродкаў, а мы хочам, каб гэта Праблема ў працягу вельмі кароткага перыяду часу для апрацоўкі дадзеных так хутка, як магчыма, што-то, што толькі, цяпер у свеце хмарных вылічэнняў Мы можам прадастаўленне серверы па сутнасці імгненна, у тым, што карысна. Такім чынам, мы не павінны мець гігант сервер сядзець ўвесь час, каб зрабіць апрацоўку што можа здарыцца толькі адзін раз у тыдзень. 

Так што гэта ў асноўным гэта. Там жа дакументацыя Для бібліятэкі Cloud Кропка API па гэтым адрасе, які будзе будзе даступная пазней. І, калі ласка, пайсці зірнуць на яго, каб убачыць, калі ёсць што-небудзь, ў вас ёсць нейкія ідэі. Гуляць з ім. Дурань вакол. І, спадзяюся, вы можаце прыйсці з чаго-то вялікага. Дзякуй.