1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 ЈЕФФРЕИ Лицхт: Здраво. 3 00:00:12,370 --> 00:00:13,550 Ја сам Џефри Лихт. 4 00:00:13,550 --> 00:00:17,890 И овде сам да разговарам с тобом о Харвард Библиотека и зграда сутрашње 5 00:00:17,890 --> 00:00:20,870 Данас библиотека, претпостављам. 6 00:00:20,870 --> 00:00:23,040 Дакле позадина овде, терен за ову седницу 7 00:00:23,040 --> 00:00:26,930 је у суштини да постоји доста библиографских података 8 00:00:26,930 --> 00:00:28,400 доступно у Харвардових библиотекама. 9 00:00:28,400 --> 00:00:33,434 И ту је прилика, кроз неке алате 10 00:00:33,434 --> 00:00:36,350 и пројекат који је развијен, да бисте добили приступ информацијама 11 00:00:36,350 --> 00:00:42,430 и да га на места која Харвард Библиотека не ради сада, 12 00:00:42,430 --> 00:00:45,460 радим нове ствари са њим, експеримент и занимљива. 13 00:00:45,460 --> 00:00:52,413 >> Дакле поента у овај унос је АПИ зове Харвард Библиотека Цлоуд, која 14 00:00:52,413 --> 00:00:57,650 је отворен метаподатака сервера, који ћу говорити о сада. 15 00:00:57,650 --> 00:01:02,595 Дакле, позадина је да постоји Много ствари у библиотеци у Харвард. 16 00:01:02,595 --> 00:01:07,150 Имамо преко 13 милиона библиографских евиденција, милиони слика, 17 00:01:07,150 --> 00:01:11,090 и хиљаде информативних средстава, која су у суштини документи који описују 18 00:01:11,090 --> 00:01:15,500 колекције, рекавши како је у њима, кутије радова 19 00:01:15,500 --> 00:01:21,080 и тако даље да представљају преко милион појединачни акти. 20 00:01:21,080 --> 00:01:24,290 И ту је доста информације које библиотека има 21 00:01:24,290 --> 00:01:28,180 о томе како се користи садржај који могу бити од интереса за људе 22 00:01:28,180 --> 00:01:32,400 ко би желео да ради са њим. 23 00:01:32,400 --> 00:01:36,150 >> Дакле, све информације Библиотека има метаподатака. 24 00:01:36,150 --> 00:01:39,500 Дакле метаподатака је податке о подацима. 25 00:01:39,500 --> 00:01:42,070 Дакле, када говоримо о информације које је 26 00:01:42,070 --> 00:01:44,890 доступне преко библиотеке облак који је доступан, 27 00:01:44,890 --> 00:01:47,760 није нужно стварни документи 28 00:01:47,760 --> 00:01:53,060 сами, не нужно пуну Текст књига или пуним слика, 29 00:01:53,060 --> 00:01:54,890 иако то заправо може бити случај. 30 00:01:54,890 --> 00:01:57,550 Али то је заиста Подаци о подацима. 31 00:01:57,550 --> 00:02:00,909 >> Тако да можете мислити каталогизације информације, позивни бројеви, субјекти, 32 00:02:00,909 --> 00:02:02,700 колико копија Књига има, ста 33 00:02:02,700 --> 00:02:06,380 су издања, шта су формати, аутори, и тако даље. 34 00:02:06,380 --> 00:02:12,250 Дакле има пуно информација о информације у колекцији која, 35 00:02:12,250 --> 00:02:14,400 само по себи, је некако по себи корисно. 36 00:02:14,400 --> 00:02:19,230 И мада ако си ради детаљнијег истраживања, 37 00:02:19,230 --> 00:02:25,160 Ви очигледно желе да дођете до стварне цонтент себе и погледате податке, 38 00:02:25,160 --> 00:02:30,140 метаподатака је користан у смислу како анализирање корпус у целини, 39 00:02:30,140 --> 00:02:33,870 као што су ствари у колекцији. 40 00:02:33,870 --> 00:02:35,520 Како се они односе? 41 00:02:35,520 --> 00:02:39,482 Помаже ли заиста видети остале ствари, која је заиста главна сврха тога. 42 00:02:39,482 --> 00:02:41,190 Тачка метаподатака и каталог 43 00:02:41,190 --> 00:02:43,230 је да вам помогне да пронађете све информације које је 44 00:02:43,230 --> 00:02:46,590 доступни у оквиру збирки. 45 00:02:46,590 --> 00:02:53,690 >> Дакле, ово је пример метаподатака за књигу у библиотеци Харвард у. 46 00:02:53,690 --> 00:02:56,370 Тако да је ту. 47 00:02:56,370 --> 00:02:59,850 И можете да видите да је то заправо умерено комплекс. 48 00:02:59,850 --> 00:03:04,610 И део вредности метаподатака у Харвард Либрари система 49 00:03:04,610 --> 00:03:09,320 је да је то врста била од изграђена од каталогизатора 50 00:03:09,320 --> 00:03:12,720 и окупио људи који конкуришу много стручности и вештине 51 00:03:12,720 --> 00:03:20,030 и мислио на њега током времена, која има много вредности. 52 00:03:20,030 --> 00:03:25,450 >> Дакле, ако сте погледамо овај запис за Аннотатед Алиса, можете сазнати 53 00:03:25,450 --> 00:03:32,590 имаш титулу, ко га је написао, ауторски и сви различити предмети 54 00:03:32,590 --> 00:03:35,380 које људи су га каталогизирани у. 55 00:03:35,380 --> 00:03:40,110 И можете да видите ту је, у додатак много добрих информација 56 00:03:40,110 --> 00:03:42,852 овде, постоји нека дуплирање. 57 00:03:42,852 --> 00:03:45,560 Има пуно сложености која је огледа кроз метаподацима 58 00:03:45,560 --> 00:03:46,300 да имате. 59 00:03:46,300 --> 00:03:50,320 >> Дакле, један наслов ове књиге је Алиса у земљи чуда. 60 00:03:50,320 --> 00:03:53,880 Дакле, ово је са белешкама верзија те књиге. 61 00:03:53,880 --> 00:03:56,380 Али је такође позвао је Анотираног Алице, Алице 62 00:03:56,380 --> 00:03:58,570 ин Вондерланд јер то је нешто што 63 00:03:58,570 --> 00:04:00,430 Мартин Гарднер написао и аннотатед књигу. 64 00:04:00,430 --> 00:04:03,369 И ту је доста велике информација о логичких слагалица и стварима 65 00:04:03,369 --> 00:04:05,410 у Алице то ти Вероватно није знао за. 66 00:04:05,410 --> 00:04:07,000 Значи да треба да читате га. 67 00:04:07,000 --> 00:04:11,940 >> Али можете да видите ту је пуно детаља овде, 68 00:04:11,940 --> 00:04:15,340 укључујући идентификаторе, када га је настао, одакле је дошао, 69 00:04:15,340 --> 00:04:17,420 у смислу Харвард систем, и тако даље. 70 00:04:17,420 --> 00:04:20,350 Дакле, ово је узорак тип метаподатака 71 00:04:20,350 --> 00:04:24,340 да би сте видели неку књигу у Харвард Библиотека колекција. 72 00:04:24,340 --> 00:04:26,680 >> Ово је нешто потпуно другачије. 73 00:04:26,680 --> 00:04:32,610 Дакле постоји систем назван ВИА Харвард, који у основи 74 00:04:32,610 --> 00:04:39,990 је каталогизација слике и објекте уметности и визуелне ствари широм Харварду, 75 00:04:39,990 --> 00:04:44,010 и додајем метаподатака им, класификацију их, 76 00:04:44,010 --> 00:04:49,200 и, у неким случајевима, пружајући мале сличице 77 00:04:49,200 --> 00:04:51,250 да можете узети погледај ако то желите. 78 00:04:51,250 --> 00:04:54,240 >> Дакле, ово је пример метаподатака да имате за плочу 79 00:04:54,240 --> 00:04:57,840 од, вероватно, Алице ин Вондерланд. 80 00:04:57,840 --> 00:05:00,499 И можете да видите да је мање метаподатака овде. 81 00:05:00,499 --> 00:05:02,040 То је само другачија врста објекта. 82 00:05:02,040 --> 00:05:03,425 И тако има мање информација. 83 00:05:03,425 --> 00:05:07,790 >> Ви углавном имају чињеницу да, позив број, у суштини ко га је створио, - 84 00:05:07,790 --> 00:05:10,410 >> Ми не знамо када је настао. 85 00:05:10,410 --> 00:05:13,320 >> --и наслов. 86 00:05:13,320 --> 00:05:14,300 >> Још један пример. 87 00:05:14,300 --> 00:05:16,380 Ово је налаз помоћ. 88 00:05:16,380 --> 00:05:19,030 Тако да збирка Левис Царролл папири на Харварду. 89 00:05:19,030 --> 00:05:23,601 Дакле, ово описује шта је у том колекцији. 90 00:05:23,601 --> 00:05:26,100 Дакле, неко је прошла кроз и Погледао је кроз све кутије 91 00:05:26,100 --> 00:05:32,220 и каталогизирана га, с обзиром неке позадина, написао резиме ста је овде. 92 00:05:32,220 --> 00:05:35,290 А ако сте били да погледате даље на ово, ово 93 00:05:35,290 --> 00:05:39,620 Траје странице и странице и странице, али ће вам рећи 94 00:05:39,620 --> 00:05:41,860 која слова и шта датуми из онога што кутијама 95 00:05:41,860 --> 00:05:44,289 постојао током колекције. 96 00:05:44,289 --> 00:05:46,330 Али ово је нешто да, ако сте на Харварду, 97 00:05:46,330 --> 00:05:50,720 можете отићи и заправо физички изгледају горе и, по свој прилици, погледајте. 98 00:05:50,720 --> 00:05:53,440 >> Дакле, ово је све супер. 99 00:05:53,440 --> 00:05:54,450 Ово је корисно метаподатака. 100 00:05:54,450 --> 00:05:56,327 То је у Харвард Либрари система. 101 00:05:56,327 --> 00:05:58,910 Постоје алати на мрежи где ти може ићи и погледати у њу, 102 00:05:58,910 --> 00:05:59,993 и види га, и тражи га. 103 00:05:59,993 --> 00:06:02,810 И можете га и коцкице исећи она у много различитих начина. 104 00:06:02,810 --> 00:06:06,920 >> Али стварно је доступна само ако ти си људско биће седи доле 105 00:06:06,920 --> 00:06:12,600 на вашем браузере или нечему или Ваш телефон и навигацију кроз њу. 106 00:06:12,600 --> 00:06:16,730 Није баш доступан у било каквог корисног моде 107 00:06:16,730 --> 00:06:19,520 за друге системе или другим рачунарима да користе, 108 00:06:19,520 --> 00:06:21,500 Не са системима унутар Харвард Библиотека, 109 00:06:21,500 --> 00:06:24,890 али системи у спољном свету, само други људи уопште. 110 00:06:24,890 --> 00:06:30,210 Дакле, питање је, како можемо ставља га на располагање рачунарима 111 00:06:30,210 --> 00:06:33,560 тако да можемо да урадимо више занимљиво ствари са њим него само 112 00:06:33,560 --> 00:06:36,550 прегледања се тога? 113 00:06:36,550 --> 00:06:39,766 >> Па зашто би желите да урадите ово? 114 00:06:39,766 --> 00:06:41,140 Постоји много могућности. 115 00:06:41,140 --> 00:06:43,980 Прва је да се може радити потпуно другачији начин прегледања 116 00:06:43,980 --> 00:06:46,962 садржај који је доступан кроз Харварда библиотекама у. 117 00:06:46,962 --> 00:06:48,670 Ја ћу вам показати један касније назван Стацклифе, 118 00:06:48,670 --> 00:06:52,440 која има потпуно другачије преузму тражи садржај. 119 00:06:52,440 --> 00:06:54,560 >> Могао би саградити препоруку мотор. 120 00:06:54,560 --> 00:06:57,955 Дакле Харвард Библиотека није у пословање говорећи, волите ову књигу. 121 00:06:57,955 --> 00:07:01,080 Онда иди погледај ово 17 остало књиге које сте могли бити заинтересовани у 122 00:07:01,080 --> 00:07:03,200 или ови други 18 слике. 123 00:07:03,200 --> 00:07:06,040 Али то свакако могао бити вредан карактеристика. 124 00:07:06,040 --> 00:07:09,272 А с обзиром метаподатака, то може бити могуће ставити заједно. 125 00:07:09,272 --> 00:07:11,980 Можда имају различите потребе у Услови претраживање садржаја, 126 00:07:11,980 --> 00:07:16,200 као можда упркос алата који су доступни да библиотека чини 127 00:07:16,200 --> 00:07:18,450 доступна, можда ћете желети за претрагу на другачији начин 128 00:07:18,450 --> 00:07:21,847 или оптимизовати за одређену случај употребе, која можда је врло специјализована. 129 00:07:21,847 --> 00:07:23,930 Можда постоје само неколико људи у свету који 130 00:07:23,930 --> 00:07:25,846 желите да претражите садржај на овај начин, али 131 00:07:25,846 --> 00:07:28,985 било би лепо када би могао да им то. 132 00:07:28,985 --> 00:07:30,860 Има много аналитике за само колико људи 133 00:07:30,860 --> 00:07:33,860 коришћења садржаја који би био стварно занимљиво знати о, сазнати 134 00:07:33,860 --> 00:07:37,280 које књиге се користе, шта су не, и тако даље. 135 00:07:37,280 --> 00:07:41,670 А ту је и доста прилика да се интегришу 136 00:07:41,670 --> 00:07:45,210 са другим информацијама да је тамо на Интернету. 137 00:07:45,210 --> 00:07:46,880 Тако смо бих-- 138 00:07:46,880 --> 00:07:50,260 >> На пример, НПР има сегмент приказ књиге, 139 00:07:50,260 --> 00:07:53,090 где су интервјуисали Аутори о књигама. 140 00:07:53,090 --> 00:07:56,837 И тако то би било сјајно када сте били лоокинг уп књигу у Харварду 141 00:07:56,837 --> 00:07:59,670 Библиотека, а ви кажете, у реду, ту је био интервју са аутором. 142 00:07:59,670 --> 00:08:00,878 Хајде да погледамо то. 143 00:08:00,878 --> 00:08:05,461 Или постоји Википедија страна, као ауторитативно, научна референтна 144 00:08:05,461 --> 00:08:07,710 о овој књизи која вас можда желети да погледамо. 145 00:08:07,710 --> 00:08:12,600 >> Постоје ове врсте извора разбацани широм Интернета. 146 00:08:12,600 --> 00:08:16,555 И их спајајући бити велики употреба 147 00:08:16,555 --> 00:08:18,930 некоме гледа Садржај, траже нешто. 148 00:08:18,930 --> 00:08:20,180 Али је исто тако није ствар коју бих 149 00:08:20,180 --> 00:08:23,205 Желим библиотека да буде одговоран за одлазак доле и лови 150 00:08:23,205 --> 00:08:25,455 сви ти различити извори и прикључите их заједно 151 00:08:25,455 --> 00:08:28,920 јер они стално мењају. 152 00:08:28,920 --> 00:08:33,570 А шта они мисле је важно мај Не будите оно што мислиш је важно. 153 00:08:33,570 --> 00:08:36,929 >> А још више, у основи постоји Много ствари нисмо помислили још. 154 00:08:36,929 --> 00:08:42,222 Дакле, ако можемо да отворимо ово више, људи поред пола десетак, 155 00:08:42,222 --> 00:08:45,174 који су гледајући ово на Редовно на памет идеја 156 00:08:45,174 --> 00:08:47,340 и масирајте податке, и раде шта желе са њом. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> Зато желимо да ово доступни на свету података. 159 00:08:54,045 --> 00:08:55,670 Па, има неколико компликације. 160 00:08:55,670 --> 00:08:58,540 Једна је да овај метаподацима је у различитим системима. 161 00:08:58,540 --> 00:09:01,110 То је у различитим форматима. 162 00:09:01,110 --> 00:09:04,719 Дакле постоји нека нормализација која треба да се деси, 163 00:09:04,719 --> 00:09:08,010 што нормализација као процес доносећи ствари из различитих формата 164 00:09:08,010 --> 00:09:12,940 и њихово мапирање на један формат тако да су поља ће се поклопити. 165 00:09:12,940 --> 00:09:15,160 >> Постоје нека ограничења ауторских права. 166 00:09:15,160 --> 00:09:21,010 Зачудо, улаз каталог о Књига је одговоран за цопиригхт. 167 00:09:21,010 --> 00:09:24,060 Дакле, иако је то само информација изведена из књиге, 168 00:09:24,060 --> 00:09:25,330 то је цопиригхтабле. 169 00:09:25,330 --> 00:09:28,400 И у зависности од ко заправо створио ту метаподатака, 170 00:09:28,400 --> 00:09:32,175 могу постојати ограничења вхо може га дистрибуирати, слично да-- 171 00:09:32,175 --> 00:09:33,402 >> Не знам. 172 00:09:33,402 --> 00:09:36,110 Он може или не мора бити слична ситуација сонг лирицс, 173 00:09:36,110 --> 00:09:36,610 на пример. 174 00:09:36,610 --> 00:09:38,560 Сви знамо како се то панс напоље. 175 00:09:38,560 --> 00:09:40,450 Зато морате да добијете око тог питања. 176 00:09:40,450 --> 00:09:44,910 >> А онда још један комад је да има много података. 177 00:09:44,910 --> 00:09:52,420 Дакле, ако сам ја неко ко жели да ради са подацима или има кул идеју, 178 00:09:52,420 --> 00:09:55,350 бави 14 милиона евиденцију о свом лаптопу 179 00:09:55,350 --> 00:09:57,487 може бити проблематично и тешко управљати. 180 00:09:57,487 --> 00:09:59,320 Тако желимо да смањимо препреке за људе 181 00:09:59,320 --> 00:10:02,130 да би могли да раде са подацима. 182 00:10:02,130 --> 00:10:07,880 >> Тако приступ који би, надамо адресе све ове забринутости је два дела. 183 00:10:07,880 --> 00:10:11,770 Једна гради платформу која узима Подаци из свих ових различитих извора 184 00:10:11,770 --> 00:10:14,350 и отежава га, нормализује, обогаћује га, и брендови 185 00:10:14,350 --> 00:10:16,650 она могу бити у истој локацији. 186 00:10:16,650 --> 00:10:20,950 И то га ставља на располагање преко јавни АПИ који људи могу назвати. 187 00:10:20,950 --> 00:10:24,430 >> Дакле АПИ је апликација Програмски интерфејс. 188 00:10:24,430 --> 00:10:28,930 И то је практично односи на Крајња тачка да систем или технологија 189 00:10:28,930 --> 00:10:31,720 могу позвати и добити податке назад у структуриран формату на неки начин 190 00:10:31,720 --> 00:10:32,900 да се може користити. 191 00:10:32,900 --> 00:10:36,060 Дакле, није зависна на одлазак на сајт 192 00:10:36,060 --> 00:10:37,970 и стругање податке са тога, на пример. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> Дакле, ово је насловна страна од Библиотека Цлоуд АПИ артикла, 195 00:10:45,010 --> 00:10:47,220 која је у суштини његова верзија два. 196 00:10:47,220 --> 00:10:50,130 Тако да је друга итерација покушавајући да направи све ове податке 197 00:10:50,130 --> 00:10:53,280 доступна у свет. 198 00:10:53,280 --> 00:10:59,560 Тако је то хттп://апи.либ.харвард.еду/в2/итемс. 199 00:10:59,560 --> 00:11:03,830 И само да се пробије ово доле мало, шта то значи 200 00:11:03,830 --> 00:11:06,115 да је ово верзија два АПИ. 201 00:11:06,115 --> 00:11:08,490 Постоји верзија један, који Нећу да причам о томе. 202 00:11:08,490 --> 00:11:09,750 Али постоји и верзија један. 203 00:11:09,750 --> 00:11:14,740 >> И ако зовете ово АПИ, добијате предмете. 204 00:11:14,740 --> 00:11:20,640 И део идеје о АПИ је АПИ је уговор. 205 00:11:20,640 --> 00:11:23,440 То је нешто што је неће променити. 206 00:11:23,440 --> 00:11:24,850 Тако на пример, - 207 00:11:24,850 --> 00:11:27,410 >> А разлог је тај што сам изгради неку врсту система који 208 00:11:27,410 --> 00:11:33,210 ће користити библиотека цлоуд АПИ да прикажете књиге или помоћ у проналажењу 209 00:11:33,210 --> 00:11:36,190 Информације на јединствене начине, оно што не желимо да се догоди 210 00:11:36,190 --> 00:11:38,940 На нама је да идемо променити начин које АПИ ради, и одједном 211 00:11:38,940 --> 00:11:41,340 све ломи на крајњег корисника страни. 212 00:11:41,340 --> 00:11:46,710 Дакле део ако правите АПИ доступна на свету, то је 213 00:11:46,710 --> 00:11:49,396 добра пракса да стави Број верзије у њему тако људи 214 00:11:49,396 --> 00:11:51,020 знате коју верзију имају посла. 215 00:11:51,020 --> 00:11:54,300 >> Дакле, ако се одлучимо да наћи бољи начин израде ове информације доступне, 216 00:11:54,300 --> 00:11:57,295 можемо промијенити у позовите ту верзију три. 217 00:11:57,295 --> 00:11:59,920 Дакле свако ко је још увек користи Верзија два, то ће и даље радити. 218 00:11:59,920 --> 00:12:03,490 Али верзија три би има све нове ствари. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> Дакле, ово је АПИ, али ово стварно изгледа као УРЛ. 221 00:12:09,210 --> 00:12:11,680 И шта је ово Пример је оно што је 222 00:12:11,680 --> 00:12:16,615 зове одмор АПИ, који је доступан над обичне веб везе. 223 00:12:16,615 --> 00:12:19,680 А ти стварно можеш идите на њу у претраживачу. 224 00:12:19,680 --> 00:12:28,550 >> Па ево управо сам отворио Фирефок и отишао у апи.либ.харвард.еду/в2/итемс. 225 00:12:28,550 --> 00:12:31,560 И шта ја овде добити је у основи прва страна 226 00:12:31,560 --> 00:12:34,740 резултата из цијеле сет ствари које смо добили. 227 00:12:34,740 --> 00:12:37,460 И овде је у КСМЛ формату. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 И то је такође било преттифиед од Фирефок. 230 00:12:42,210 --> 00:12:45,850 То у ствари не морају сви ови мало шири и уговарање 231 00:12:45,850 --> 00:12:47,880 доохицкеис овде. 232 00:12:47,880 --> 00:12:52,520 Ово је врста лепше Верзија начин гледања на њега. 233 00:12:52,520 --> 00:12:57,040 >> Али шта то нам говори је Ја сам тражио све ставке. 234 00:12:57,040 --> 00:13:03,120 Дакле, постоје ствари 13.289.475. 235 00:13:03,120 --> 00:13:06,150 И Гледам први 10, са почетком у положају нулту 236 00:13:06,150 --> 00:13:09,760 јер у рачунарству увек се крећу од нуле. 237 00:13:09,760 --> 00:13:15,150 И шта ја овде имам, ако само колапс ово, видећете имам 10 ставки. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> А ако ја погледамо неке ставке, ја могу видим да имам информацију о томе. 240 00:13:25,210 --> 00:13:27,400 И ово је у оно што се зове МОДС форма. 241 00:13:27,400 --> 00:13:30,860 И тако ћу пребацити овде на тренутак. 242 00:13:30,860 --> 00:13:33,750 У реду. 243 00:13:33,750 --> 00:13:37,447 >> Па хајде да тражите нешто у специфична јер прва ставка која 244 00:13:37,447 --> 00:13:40,030 деси да дође до када погледате кроз целу колекцију 245 00:13:40,030 --> 00:13:41,750 је, по дефиницији, случајан. 246 00:13:41,750 --> 00:13:44,550 Погледајмо неке крофне. 247 00:13:44,550 --> 00:13:46,830 Ох. 248 00:13:46,830 --> 00:13:49,190 >> У реду. 249 00:13:49,190 --> 00:13:49,940 Со крофне. 250 00:13:49,940 --> 00:13:55,360 Тако смо нашли постоје 80 издања у колекција која референце крофне. 251 00:13:55,360 --> 00:13:57,150 Гледамо на првом њих 10. 252 00:13:57,150 --> 00:14:01,890 Сада, можете видети овде начин да Рекао сам да тражим крофне, 253 00:14:01,890 --> 00:14:04,400 Само додао нешто да упит низ УРЛ. 254 00:14:04,400 --> 00:14:09,680 Дакле к једнако крофне, које можете мало лакше овде види. 255 00:14:09,680 --> 00:14:12,131 >> И ово у суштини значи да спец за АПИ који 256 00:14:12,131 --> 00:14:13,880 дефинише шта све ови параметри значе. 257 00:14:13,880 --> 00:14:17,150 А то значи да ћемо претраживање све за крофне. 258 00:14:17,150 --> 00:14:24,910 >> Дакле прва тачка овде имамо можете видети наслов је Донутс, 259 00:14:24,910 --> 00:14:29,310 и постоји титл зове Амерички Страст, која је, претпостављам, 260 00:14:29,310 --> 00:14:31,610 прикладно. 261 00:14:31,610 --> 00:14:36,134 Постоји много дифферент-- 262 00:14:36,134 --> 00:14:38,050 Када дођете до тачке добијања података, 263 00:14:38,050 --> 00:14:41,020 има много другачији Формати које можете га добити у. 264 00:14:41,020 --> 00:14:44,050 И постоје различити предности и слабости за све њих. 265 00:14:44,050 --> 00:14:49,000 Према томе, ова, можете видети Овде, овај облик је веома богата. 266 00:14:49,000 --> 00:14:51,946 И то је стандардизован. 267 00:14:51,946 --> 00:14:55,040 >> Тако да специфична наслов поље, преводи поље. 268 00:14:55,040 --> 00:14:58,950 Постоји алтернативни наслов, амерички Страст. 269 00:14:58,950 --> 00:15:01,650 Постоји име повезан са њим. 270 00:15:01,650 --> 00:15:03,120 Врста извора је текст. 271 00:15:03,120 --> 00:15:06,070 Има пуно информација овде у овом формату. 272 00:15:06,070 --> 00:15:09,480 >> Али постоје гомила различитих формата. 273 00:15:09,480 --> 00:15:11,920 Па шта смо управо били гледајући је формат 274 00:15:11,920 --> 00:15:17,700 називају МОДС, што је скраћеница за Метадата објекта Опис сервис, 275 00:15:17,700 --> 00:15:18,250 потенцијално. 276 00:15:18,250 --> 00:15:23,030 Ја заправо нисам сасвим сигуран С. Али то је прилично сложен формату. 277 00:15:23,030 --> 00:15:24,240 То је стандардна формата. 278 00:15:24,240 --> 00:15:30,260 >> Али то је онај који држи Богатство свих података 279 00:15:30,260 --> 00:15:33,820 да библиотека има јер то је врло близу ономе што 280 00:15:33,820 --> 00:15:35,110 библиотека користи интерно. 281 00:15:35,110 --> 00:15:39,030 То је стандард који је користи широм земље, 282 00:15:39,030 --> 00:15:40,944 широм света у академским библиотекама. 283 00:15:40,944 --> 00:15:42,110 И то је веома интероперабилни. 284 00:15:42,110 --> 00:15:44,852 Дакле, ако имате документ који је у МОДС формату, 285 00:15:44,852 --> 00:15:47,560 можете дати да некоме другом чији системи разумеју МОДС, 286 00:15:47,560 --> 00:15:48,518 и они да га увезете. 287 00:15:48,518 --> 00:15:50,840 Тако да је стандардна. 288 00:15:50,840 --> 00:15:54,250 То је веома добро дефинисан, врло специфичан. 289 00:15:54,250 --> 00:15:58,980 И то је оно што га чини интероперабилан јер ако неко каже, 290 00:15:58,980 --> 00:16:04,930 ово је алтернативни назив запис, сви знају шта то значи. 291 00:16:04,930 --> 00:16:07,740 Са друге стране, веома је компликовано. 292 00:16:07,740 --> 00:16:13,160 >> Дакле, ако се погледа у овом записнику овде, 293 00:16:13,160 --> 00:16:15,320 ако желим да се Наслов овог документа, 294 00:16:15,320 --> 00:16:21,150 ове књиге, која је вероватно Донутс, Амерички Страст, ит парсинг напоље 295 00:16:21,150 --> 00:16:22,940 је мало укључена. 296 00:16:22,940 --> 00:16:27,380 Док постоји други Формат зове Даблинскојезгро, 297 00:16:27,380 --> 00:16:29,730 који је много, много једноставнија формату. 298 00:16:29,730 --> 00:16:33,764 >> И тако видите овде, нема наслов, поднаслов, Упоредни наслов. 299 00:16:33,764 --> 00:16:35,930 Постоји само наслов, Крофне, амерички Страст, 300 00:16:35,930 --> 00:16:38,780 и још једна титула, Американац Страст. 301 00:16:38,780 --> 00:16:42,907 Дакле, када гледате ком облику желите да добијете податке из, 302 00:16:42,907 --> 00:16:44,740 Много зависи од тога како ти ћеш га користити. 303 00:16:44,740 --> 00:16:46,573 Да ли користите за интероперабилност или вам 304 00:16:46,573 --> 00:16:49,970 Желим нешто једноставно да Можда би било лакше да раде са? 305 00:16:49,970 --> 00:16:56,002 >> Са друге стране, много Детаљи се некако скуисхед доле. 306 00:16:56,002 --> 00:16:58,460 Можете да изгубите нијансе шта одређеној области средство 307 00:16:58,460 --> 00:17:02,960 ако имате посла са Дублин Цоре, која не би се са МОДС. 308 00:17:02,960 --> 00:17:06,462 Дакле, то су два формата можете изаћи из АПИ. 309 00:17:06,462 --> 00:17:08,920 И у основи, ми задржавамо она иза сцене у МОДС. 310 00:17:08,920 --> 00:17:14,179 Али можемо вам дати га у МОДС и Дублин Цоре и све друго као добро. 311 00:17:14,179 --> 00:17:16,470 Други фактор приликом гледате у подацима 312 00:17:16,470 --> 00:17:21,210 је можете добити у варијанти ЈСОН, која скраћеница за ЈаваСцрипт Објецт нотација, 313 00:17:21,210 --> 00:17:24,720 или КСМЛ, која се залаже за Прошириви језик за означавање. 314 00:17:24,720 --> 00:17:30,080 А ови подаци репрезентације оба имају потпуно исте податке, тачно 315 00:17:30,080 --> 00:17:31,080 исти поља. 316 00:17:31,080 --> 00:17:33,644 Али то су само синтаксички другачије. 317 00:17:33,644 --> 00:17:40,401 >> Дакле, ово је је-- 318 00:17:40,401 --> 00:17:41,400 Па, хајде да пребаците. 319 00:17:41,400 --> 00:17:47,490 Дакле, ово је наш упит за крофне у КСМЛ формату. 320 00:17:47,490 --> 00:17:53,470 Ако сам само пребаците ово да буде ЈСОН, Видим да изгледа другачије. 321 00:17:53,470 --> 00:17:58,580 Тако да сада ово је исти садржај, али другачије структуре. 322 00:17:58,580 --> 00:18:00,080 Има мање заграда. 323 00:18:00,080 --> 00:18:02,530 Има мање опширан. 324 00:18:02,530 --> 00:18:06,440 >> А ово је формат који, ако вас раде у веб окружењу, 325 00:18:06,440 --> 00:18:09,680 ви највероватније ће да желе да користе јер један 326 00:18:09,680 --> 00:18:12,630 од лијепих ствари о ЈСОН је то је компатибилан са ЈаваСцрипт. 327 00:18:12,630 --> 00:18:17,680 Дакле, ако пишем веб апликацију, ја могу повући у ЈСОН и само радим са њим директно. 328 00:18:17,680 --> 00:18:20,187 Док са КСМЛ, то је мало компликовано. 329 00:18:20,187 --> 00:18:21,520 Дакле опет, то су и корисно. 330 00:18:21,520 --> 00:18:26,387 Они само су различити случајеви усе где људи желети да их користите. 331 00:18:26,387 --> 00:18:26,886 У реду. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 Вратимо се на АПИ. 334 00:18:31,680 --> 00:18:32,900 Тако можемо потражити ораси-- 335 00:18:32,900 --> 00:18:36,220 >> Дајем пример потрази за крофне. 336 00:18:36,220 --> 00:18:39,330 Такође можемо потражити само у Посебно поље унутар овде. 337 00:18:39,330 --> 00:18:41,310 Дакле, умјесто да трага цео запис, 338 00:18:41,310 --> 00:18:43,870 Само могу да претражују терен наслова. 339 00:18:43,870 --> 00:18:48,810 И тако сада има 25 ствари које имају крофне у називу, од којих је један 340 00:18:48,810 --> 00:18:52,430 је око враћања мочваре у управљању 341 00:18:52,430 --> 00:18:54,990 из рупе у крофни Програм, који је вероватно 342 00:18:54,990 --> 00:18:58,970 не нужно оно што тражимо за када смо у потрази за крофне. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> Можете и да, кад си бавимо АПИ-- 345 00:19:05,490 --> 00:19:08,827 >> Део који има АПИ даје људи приступ великим скуповима података. 346 00:19:08,827 --> 00:19:11,410 А постоје пар другачији алати можете користити за то. 347 00:19:11,410 --> 00:19:14,170 Један је, веома једноставно, ви цан страна кроз податке. 348 00:19:14,170 --> 00:19:17,340 Дакле, само као да радите упит кроз веб интерфејс, 349 00:19:17,340 --> 00:19:19,470 можете погледати на страници једне, страница два, три страна. 350 00:19:19,470 --> 00:19:22,040 То можете учинити исто ствар преко АПИ-ја. 351 00:19:22,040 --> 00:19:24,150 Само треба да буду изричит у како ти то радиш. 352 00:19:24,150 --> 00:19:29,511 >> Тако на пример, ако гледам у мом првом упита овде, 353 00:19:29,511 --> 00:19:32,510 где радим у потрагу за стварима са крофни у наслову, ја могу да кажем, 354 00:19:32,510 --> 00:19:35,415 и граница износи 20, што значи дај ми првих 20 записа, не 355 00:19:35,415 --> 00:19:38,540 Први 10, који је подразумевани, јер желим да погледамо 20 у исто време. 356 00:19:38,540 --> 00:19:43,435 Или могу да кажем, поставити старт једнака 20 и лимита 357 00:19:43,435 --> 00:19:47,150 једнаке 20, који ће дати ја рецордс 21 кроз 40. 358 00:19:47,150 --> 00:19:52,680 >> Тако да претпостављам ствар да одузме овде је 359 00:19:52,680 --> 00:19:57,290 да користимо све конце упита да подесите параметре на упит. 360 00:19:57,290 --> 00:20:02,760 И то вам омогућава да контролишете шта се вратиш. 361 00:20:02,760 --> 00:20:05,980 >> Још један алат који можете користити, - 362 00:20:05,980 --> 00:20:09,250 >> А ово је заиста корисно у Услови истражује податке. 363 00:20:09,250 --> 00:20:10,840 >> --ис нешто што се зове фацетинг. 364 00:20:10,840 --> 00:20:15,530 Тако термин фацетинг је Не нужно уобичајена. 365 00:20:15,530 --> 00:20:16,880 Али ви сте сви то раније. 366 00:20:16,880 --> 00:20:18,630 Ако погледамо Амазон, на пример, 367 00:20:18,630 --> 00:20:20,870 а ви урадите потрагу за крофне у књигама, 368 00:20:20,870 --> 00:20:27,080 Овде они имају низ књига, и они групишу по категоријама, 369 00:20:27,080 --> 00:20:30,470 и добијате различите категорије, и колико књига у свакој категорији 370 00:20:30,470 --> 00:20:31,330 појавити. 371 00:20:31,330 --> 00:20:33,420 >> Дакле, ово је у основи аспект. 372 00:20:33,420 --> 00:20:37,570 Узмеш све своје књиге, 1.800 књиге које се подударају крофне у Амазону. 373 00:20:37,570 --> 00:20:39,820 12 од њих су у доручак категорија. 374 00:20:39,820 --> 00:20:43,100 21 у пецива и печења, и тако даље и тако даље. 375 00:20:43,100 --> 00:20:47,670 >> Дакле, ово је заиста корисно алат за истраживање садржаја 376 00:20:47,670 --> 00:20:53,260 у библиотеци, као и јер кад погледате на верзији, 377 00:20:53,260 --> 00:20:56,520 то вам даје идеју шта субјецтс постоји, као Које врсте предмета 378 00:20:56,520 --> 00:20:58,510 су најпопуларнији у вашем сету упита. 379 00:20:58,510 --> 00:21:00,950 И то помаже вожњи и истражују. 380 00:21:00,950 --> 00:21:02,770 Тако можемо учинити исту ствар. 381 00:21:02,770 --> 00:21:05,940 >> Ако желимо да користимо АПИ и погледај аспектима, 382 00:21:05,940 --> 00:21:08,950 додамо још једну параметар наш пријатељ Стринг упита. 383 00:21:08,950 --> 00:21:12,540 Дакле аспектима једнако одвојених зарезом Листа онога што желимо да Фацет на. 384 00:21:12,540 --> 00:21:14,790 Зато је један од аспеката може бити предмет. 385 00:21:14,790 --> 00:21:16,565 Други можда језика. 386 00:21:16,565 --> 00:21:19,665 И тако ако останемо ту упит, ми добијам-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 Изгледа прилично исто овде. 389 00:21:24,830 --> 00:21:29,010 Али ми смо додат на крају листе скуп аспеката. 390 00:21:29,010 --> 00:21:34,060 Тако имамо аспект се зове предмет. 391 00:21:34,060 --> 00:21:40,250 Дакле, ово нам говори да ако ја изгледам у моје 80 резултате из крофне упита, 392 00:21:40,250 --> 00:21:42,100 13 од њих имају излажете САД. 393 00:21:42,100 --> 00:21:43,684 Три имају предметне крофне. 394 00:21:43,684 --> 00:21:45,600 Три имају тему од мочварама рестаурације, 395 00:21:45,600 --> 00:21:47,720 која може бити наша рупа у крофни. 396 00:21:47,720 --> 00:21:51,780 Двојица од њих, Симпсони, и тако даље и тако даље. 397 00:21:51,780 --> 00:21:59,211 >> Дакле, ово може бити корисно ако вас Желим да сузили претрагу. 398 00:21:59,211 --> 00:22:00,210 То вам може помоћи да урадите. 399 00:22:00,210 --> 00:22:03,580 Поготово ако имате више од, рецимо, 80 резултати. 400 00:22:03,580 --> 00:22:05,980 >> Слично томе, ми такође затражио за аспеката на језику. 401 00:22:05,980 --> 00:22:14,790 Дакле, ако погледамо наше резултате, видимо 76 од њих су на енглеском језику, четири на француском, 402 00:22:14,790 --> 00:22:19,620 два у шпанском, два, мислим да је то недефинисан или непознат, холандски и латински. 403 00:22:19,620 --> 00:22:22,830 Па мислим да латински крофна резултат, опет, 404 00:22:22,830 --> 00:22:24,922 нема никакве везе са пекарским производима. 405 00:22:24,922 --> 00:22:25,630 Али ето. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> Дакле, ово је врста вам показујем како можете да повучете садржај назад 408 00:22:38,630 --> 00:22:41,270 из АПИ управо кроз веб претраживач, који је сјајно. 409 00:22:41,270 --> 00:22:44,320 Али то није баш оно што би нормално да користи у АПИ за њу. 410 00:22:44,320 --> 00:22:48,710 Тако један пример како вас могао заправо ово је имам 411 00:22:48,710 --> 00:22:54,720 написао супер мали програм, који, опет, да ли ми крофне претрагу 412 00:22:54,720 --> 00:22:59,010 и бира пар поља и приказује их у табели. 413 00:22:59,010 --> 00:23:01,610 Дакле, ово је веома Исти садржај који смо управо 414 00:23:01,610 --> 00:23:04,830 тестера са неколико поља извукао. 415 00:23:04,830 --> 00:23:12,090 Дакле листи наслова, на локација шта књиге 416 00:23:12,090 --> 00:23:15,120 је око, језик, и тако даље и тако даље. 417 00:23:15,120 --> 00:23:20,480 >> Па како то стварно десило, јер Претпостављам да треба да погледамо неки код, 418 00:23:20,480 --> 00:23:22,420 је-- 419 00:23:22,420 --> 00:23:28,060 >> Оно што овде имамо јесте једноставна ХТМЛ страна, која приказује текст, 420 00:23:28,060 --> 00:23:32,900 велцоме то библиотеке облак и затим приказује табелу резултата. 421 00:23:32,900 --> 00:23:37,790 А ту су очигледно нема резултата у сто када страница буде лоадед. 422 00:23:37,790 --> 00:23:41,380 Али шта да радимо је, пре свега, ми 423 00:23:41,380 --> 00:23:46,290 се учитава библиотеку под називом јКуери, која је у основи 424 00:23:46,290 --> 00:23:52,030 ЈаваСцрипт библиотека, која га чини Веома лако манипулисати ЈаваСцрипт 425 00:23:52,030 --> 00:23:58,780 нативно, ХТМЛ, а креирање веб странице, на страни клијента логика и веб странице. 426 00:23:58,780 --> 00:24:01,595 >> Па шта имамо овде је јКуери има метод назван Гет, 427 00:24:01,595 --> 00:24:05,270 који у суштини ће ићи у УРЛ адреса, која, у овом случају, 428 00:24:05,270 --> 00:24:09,070 је ово познато гледа УРЛ адреса. 429 00:24:09,070 --> 00:24:14,440 А онда ће добити садржај из да УРЛ адреса, а затим покренути функцију на њему. 430 00:24:14,440 --> 00:24:19,240 Тако да смо рекли да иду апи.либ.харвард / Еду. 431 00:24:19,240 --> 00:24:20,060 Сеарцх фор крофне. 432 00:24:20,060 --> 00:24:21,300 Дајте нам 20 записа. 433 00:24:21,300 --> 00:24:28,590 И онда покренути ову функцију која Одабрао сам, то пролази податке. 434 00:24:28,590 --> 00:24:34,430 И податак је да ЈСОН добио вратио из АПИ. 435 00:24:34,430 --> 00:24:40,120 >> А онда говоримо, у оквиру које Подаци постоји поље зове ставка. 436 00:24:40,120 --> 00:24:48,117 И ако одем да погледам уназад на један од ових резултата које је овде, 437 00:24:48,117 --> 00:24:49,200 има нешто цаллед-- 438 00:24:49,200 --> 00:24:50,220 >> Па, то се зове тачка. 439 00:24:50,220 --> 00:24:53,520 Тако да може бити да. 440 00:24:53,520 --> 00:25:01,840 И оно што ради то је пролази кроз сваку ставку 441 00:25:01,840 --> 00:25:05,300 а затим позива друга Функција на сваку ставку. 442 00:25:05,300 --> 00:25:08,440 А то функција у суштини изводи вредност 443 00:25:08,440 --> 00:25:12,010 добра, што је суштини појединац запис 444 00:25:12,010 --> 00:25:18,220 и омогућава нам да извуче титулу, покривеност и језика. 445 00:25:18,220 --> 00:25:21,640 >> Тако да смо позвали функцију на сваки ставка да смо се вратили из АПИ. 446 00:25:21,640 --> 00:25:25,397 И ако само погледате у овом комаду овде, 447 00:25:25,397 --> 00:25:27,230 шта радимо је ми правите стринг, 448 00:25:27,230 --> 00:25:31,810 која је у суштини нека ХТМЛ маркап око стола, са валуе.титле, 449 00:25:31,810 --> 00:25:35,790 који је наслов објекат, валуе.цовераге, 450 00:25:35,790 --> 00:25:36,790 која је покривеност, - 451 00:25:36,790 --> 00:25:38,225 >> И ми радимо чек овде да се види ко је недефинисан 452 00:25:38,225 --> 00:25:40,570 и крије ако пише недефинисан, јер нисмо баш занима 453 00:25:40,570 --> 00:25:41,600 у то. 454 00:25:41,600 --> 00:25:42,939 >> --и онда језика. 455 00:25:42,939 --> 00:25:44,730 И онда шта смо ради се додавањем да 456 00:25:44,730 --> 00:25:48,510 за сто који је препознаје се по овом низу овде. 457 00:25:48,510 --> 00:25:50,790 И како јКуери ради је шта ово говори 458 00:25:50,790 --> 00:25:56,420 се тражити табели са идејом Резултати и додајте овај текст на њега. 459 00:25:56,420 --> 00:25:59,380 А ово је табела са резултатима идеа. 460 00:25:59,380 --> 00:26:04,998 Па шта завршиш са је ова страница овде. 461 00:26:04,998 --> 00:26:06,206 А да би се видели соурце-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 Па, извор није заправо упдатед када се то догодило. 464 00:26:13,810 --> 00:26:18,740 Тако да можете видети стварни Резултати табели овде ипак. 465 00:26:18,740 --> 00:26:24,770 >> Дакле, то је само једноставан пример ради веома једноставан упит против АПИ 466 00:26:24,770 --> 00:26:29,020 и приказивање информација у неком другом формирају, а не ради ништа превише фенси. 467 00:26:29,020 --> 00:26:36,370 Сада, још један пример је као Апликација написао Давид Веинбергер 468 00:26:36,370 --> 00:26:39,120 као демо ово, која у суштини вам показује 469 00:26:39,120 --> 00:26:44,620 како можете да масх уп резултате које сте геттинг из библиотека облака АПИ 470 00:26:44,620 --> 00:26:46,250 са, кажу, Гоогле Боокс. 471 00:26:46,250 --> 00:26:52,225 >> И овде је размишљање да могу Покренути упит против Гоогле књигама, 472 00:26:52,225 --> 00:26:56,060 гет претрагу пуну текста, добијем неке резултате назад, сазнати који од тих ставки 473 00:26:56,060 --> 00:27:01,180 заправо постоје у Холлис, библиотека систем, 474 00:27:01,180 --> 00:27:03,200 а онда ми дај линкове назад на тим позицијама. 475 00:27:03,200 --> 00:27:12,730 Дакле, ако сам тражити, било је тамна и олујне ноћи, ја 476 00:27:12,730 --> 00:27:16,210 вратимо гомилу резултата из Гоогле-а, а затим један резултат 477 00:27:16,210 --> 00:27:19,460 која је бора ин Тиме. 478 00:27:19,460 --> 00:27:29,330 А ово су линкови ка књигама које постоје у Харвард Либрари система. 479 00:27:29,330 --> 00:27:32,160 >> Тако да претпостављам поента овде није толико да ово може и не може 480 00:27:32,160 --> 00:27:34,118 бити начин на који желите да тражи библиотеку, 481 00:27:34,118 --> 00:27:38,310 али је потпуно другачија Начин на који није био доступан за вас 482 00:27:38,310 --> 00:27:42,884 пре, као и ти имао начина да радим комплетног текста тражи на књигама које чак 483 00:27:42,884 --> 00:27:44,550 били део Харвард Либрари система. 484 00:27:44,550 --> 00:27:46,870 Дакле, сада је ово начин да можете да урадите то. 485 00:27:46,870 --> 00:27:51,930 А можете их приказати у било ком формату желите. 486 00:27:51,930 --> 00:27:55,990 Дакле поента овде је, у основи, ми отвара нове начине за људе 487 00:27:55,990 --> 00:27:59,080 за рад са подацима. 488 00:27:59,080 --> 00:28:07,925 >> Још један комад библиотеке облака је да помаже излагати неке податке о коришћењу 489 00:28:07,925 --> 00:28:08,800 да библиотека има. 490 00:28:08,800 --> 00:28:12,630 Дакле, ако идете у библиотеку, и тражиш књиге, 491 00:28:12,630 --> 00:28:15,770 Ви не нужно заправо имају идеју, 492 00:28:15,770 --> 00:28:19,080 за све ставке у Посебан предмет, шта 493 00:28:19,080 --> 00:28:21,200 су људи у заједница, без обзира да ли је то 494 00:28:21,200 --> 00:28:24,890 дефинисан као Харварду или земља или твој разред, 495 00:28:24,890 --> 00:28:26,421 ста има су пронашли најкорисније? 496 00:28:26,421 --> 00:28:28,920 И библиотека заправо има милион информација о томе шта 497 00:28:28,920 --> 00:28:32,999 је најкориснији јер ако много од људи преузимате књигу, 498 00:28:32,999 --> 00:28:34,040 да вам говори нешто. 499 00:28:34,040 --> 00:28:36,498 Мора да је било неких разлога они желе да то провере. 500 00:28:36,498 --> 00:28:38,270 Много људи га ставити на резерви. 501 00:28:38,270 --> 00:28:42,520 >> Ако је на листи резерви за много класа, која вам говори нешто. 502 00:28:42,520 --> 00:28:45,960 Ако професори су га провере од много и студенти нису, 503 00:28:45,960 --> 00:28:47,200 то ми говори нешто. 504 00:28:47,200 --> 00:28:49,280 Обрнуто, који такође говори ти нешто. 505 00:28:49,280 --> 00:28:54,680 Тако да би било стварно занимљиво стави ту информацију тамо и нека 506 00:28:54,680 --> 00:28:59,969 људи ово користе како би им помогли да пронађу ради у оквиру система библиотека. 507 00:28:59,969 --> 00:29:02,260 Друга страна медаље је ово постоје неки озбиљни приватности 508 00:29:02,260 --> 00:29:07,854 забринутост због једног од цоре начела библиотеке 509 00:29:07,854 --> 00:29:10,770 се нећемо да се говори људи ста други људи читају. 510 00:29:10,770 --> 00:29:17,360 А чак и ако кажете ово Књига је закључана од четири пута 511 00:29:17,360 --> 00:29:20,070 у одређени месец, које би се могле користити 512 00:29:20,070 --> 00:29:25,252 да повеже назад на посебно Лице од де-анонимизинг података 513 00:29:25,252 --> 00:29:26,710 и сазнам ко је проверио. 514 00:29:26,710 --> 00:29:30,792 Тако начин да можемо авоид-- 515 00:29:30,792 --> 00:29:33,750 Начин на који можемо покушати да извуче неки сигнал из свих података 516 00:29:33,750 --> 00:29:36,740 без повреде забринутости за приватност ничију 517 00:29:36,740 --> 00:29:42,150 је у суштини посматрамо 10 година подацима употреба, - 518 00:29:42,150 --> 00:29:43,930 >> Тако да је током дугог временског периода. 519 00:29:43,930 --> 00:29:50,639 >> --и кажу, у реду, хајде да видимо како много пута ово дело је користе, 520 00:29:50,639 --> 00:29:52,930 и од кога за тај период времена, а затим основи 521 00:29:52,930 --> 00:29:56,300 врати број који зовемо стек резултат, који у основи 522 00:29:56,300 --> 00:29:59,910 представља колико се то користи. 523 00:29:59,910 --> 00:30:01,084 А то нумбер-- 524 00:30:01,084 --> 00:30:03,250 Много различитих прорачуна иду у том броју. 525 00:30:03,250 --> 00:30:05,150 --бут то је веома груба метрички да вас даје 526 00:30:05,150 --> 00:30:11,300 нека идеја како заједница може цијенити тај посао. 527 00:30:11,300 --> 00:30:16,772 >> И тако још једна врста чак више разрадити пријаву 528 00:30:16,772 --> 00:30:18,480 да користи предности ово је нешто 529 00:30:18,480 --> 00:30:24,000 зове Стацклифе, која је у ствари доступне кроз главну Харвард 530 00:30:24,000 --> 00:30:24,880 Библиотека портала. 531 00:30:24,880 --> 00:30:26,700 Дакле одете у либрари.харвард.еду. 532 00:30:26,700 --> 00:30:29,360 Видећете бројне другачије начини сеарцхинг библиотеку. 533 00:30:29,360 --> 00:30:32,300 А један од њих се зове Стацклифе. 534 00:30:32,300 --> 00:30:38,980 >> А ово је апликација која претражује садржај библиотеке, 535 00:30:38,980 --> 00:30:43,490 али је потпуно изграђено на врху ових АПИ. 536 00:30:43,490 --> 00:30:46,910 Тако да нема посебна ствар дешава иза сцене. 537 00:30:46,910 --> 00:30:49,570 Нема приступ Подаци које немате. 538 00:30:49,570 --> 00:30:54,090 То је користе АПИ да вам пружи са потпуно новим претраживање 539 00:30:54,090 --> 00:30:55,480 искуство. 540 00:30:55,480 --> 00:30:58,570 >> Дакле, ако сам тражити Алице ин Вондерланд у овом случају, 541 00:30:58,570 --> 00:31:02,600 Ја добијем резултат који личи ово, што је прилично муцх-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> То је врло слично било ком другом потрази и ти би могао, осим у овом случају 544 00:31:10,870 --> 00:31:15,730 ми ранкинг ставке по стацксцоре, који вам даје 545 00:31:15,730 --> 00:31:19,850 нека идеја како популаран ових предмети били у заједници. 546 00:31:19,850 --> 00:31:25,610 И тако јасно, Алице ин Вондерланд Волт Дизни је веома популаран. 547 00:31:25,610 --> 00:31:36,570 Али можете видети у првих четири Овде су оне можда нећете стварно-- 548 00:31:36,570 --> 00:31:39,220 >> Ствари које су високо користе, али не можете одмах 549 00:31:39,220 --> 00:31:41,240 повежу са Алице ин Вондерланд. 550 00:31:41,240 --> 00:31:44,650 Тако је наш стари пријатељ Белешкама Алис је овде. 551 00:31:44,650 --> 00:31:46,350 Тако да могу да погледам њу. 552 00:31:46,350 --> 00:31:52,010 А сад оно што тражим у основи је постављен од-- 553 00:31:52,010 --> 00:31:53,760 Ја могу да имају са белешкама Алице овде. 554 00:31:53,760 --> 00:31:56,700 Имам информације о томе. 555 00:31:56,700 --> 00:32:00,230 И ја такође имам стацксцоре оф, у овом случају, 26. 556 00:32:00,230 --> 00:32:03,169 А ово ми говори некако грубо како смо дошли до овог стацксцоре, 557 00:32:03,169 --> 00:32:05,835 Као ко га преузели, као начин много пута је преузели, 558 00:32:05,835 --> 00:32:08,440 Као факултет или недипломираних, како много копија библиотека има, 559 00:32:08,440 --> 00:32:11,300 и тако даље и тако даље. 560 00:32:11,300 --> 00:32:16,460 >> А можете и да, довољно интересантно Овде, претражујете гомиле практично. 561 00:32:16,460 --> 00:32:19,550 Тако су подаци овде, ово Вас показује врста 562 00:32:19,550 --> 00:32:23,547 виртуелног представљања онога што је полке моћи 563 00:32:23,547 --> 00:32:25,880 Изгледаш као да си узети све књигама у библиотеци је 564 00:32:25,880 --> 00:32:28,940 и ставите их заједно на једној полици бесконачне. 565 00:32:28,940 --> 00:32:30,990 И лепо је што смо можеш-- 566 00:32:30,990 --> 00:32:33,380 >> Пре свега, метаподатака о овим књигама 567 00:32:33,380 --> 00:32:35,627 Често вам говори када је објављена. 568 00:32:35,627 --> 00:32:37,085 То вам говори колико страница има. 569 00:32:37,085 --> 00:32:38,459 То би могло рећи димензије. 570 00:32:38,459 --> 00:32:42,930 Тако да можете видети да је овде огледа у смислу величине књига. 571 00:32:42,930 --> 00:32:46,740 >> И онда можемо да користимо стацк резултат за истицање 572 00:32:46,740 --> 00:32:49,170 књиге које имају веће резултате. стек 573 00:32:49,170 --> 00:32:54,930 Дакле, ако је то тамнија, то значи да, вероватно се користи чешће. 574 00:32:54,930 --> 00:32:57,040 Дакле, у овом случају, ја сам ће погодити да је овај 575 00:32:57,040 --> 00:33:03,226 је верзија Алице ин Вондерланд да се веома често користи и већина 576 00:33:03,226 --> 00:33:05,100 приступљено, библиотека има највише копије. 577 00:33:05,100 --> 00:33:06,975 Дакле, ако сте у потрази за Алиса у земљи чуда, 578 00:33:06,975 --> 00:33:10,220 ово може бити добро место за почетак. 579 00:33:10,220 --> 00:33:13,500 >> А онда овде можете повезати се да, кажу, Амазон да купи књигу, 580 00:33:13,500 --> 00:33:15,182 и тако даље и тако даље. 581 00:33:15,182 --> 00:33:17,140 Поента овде, опет, није толико да је овај 582 00:33:17,140 --> 00:33:25,030 је најбољи начин да претражујете библиотеку или одговарајући алат за сваку прилику. 583 00:33:25,030 --> 00:33:28,400 Али то је још један начин да се то уради. 584 00:33:28,400 --> 00:33:31,359 И чинећи податке доступан кроз АПИ, који 585 00:33:31,359 --> 00:33:34,650 је направљен од веома једноставних градивних блокова, која вам омогућава да претражите садржај, 586 00:33:34,650 --> 00:33:39,420 можете изградити нешто овако да могу 587 00:33:39,420 --> 00:33:41,520 изванредно вредни за неке људе. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> Дакле, то је нека врста, колико ја желим да заиста кажу шта је АПИ 590 00:33:51,860 --> 00:33:56,070 и оно што излаже, постоји читава гомила ствари иза сцене, који 591 00:33:56,070 --> 00:33:59,480 Само ћу да се осврнем на кратко Само зато што некако долази у ово 592 00:33:59,480 --> 00:34:03,720 из потпуно другачијег угла у Услови како се нешто овако 593 00:34:03,720 --> 00:34:04,580 се стави на своје место? 594 00:34:04,580 --> 00:34:10,820 >> Дакле АПИ је стандардна интерфејс за све ове садржаја. 595 00:34:10,820 --> 00:34:13,820 Али да га тамо, Прва ствар смо морали да урадимо 596 00:34:13,820 --> 00:34:17,260 је сабрати информације књига и слика 597 00:34:17,260 --> 00:34:21,580 и проналажење помагала, збирка Документ из разних система Харварда. 598 00:34:21,580 --> 00:34:23,929 Алеф, ВИА, и ОАСИС су имена система. 599 00:34:23,929 --> 00:34:28,820 И они у суштини иду у Гасовод, обрада цевовода. 600 00:34:28,820 --> 00:34:33,230 >> Пре свега, добијамо извоз филес фром све ове системе. 601 00:34:33,230 --> 00:34:35,130 Их растали се у појединим ставкама. 602 00:34:35,130 --> 00:34:39,360 Тако да имате фајл, што је гигабајт, која има милион рекорде у њој. 603 00:34:39,360 --> 00:34:42,290 Тако смо га подијелити у појединим ставкама. 604 00:34:42,290 --> 00:34:45,374 Затим, за сваку ставку, ми га претворити у МОДС, јер су неки од њих 605 00:34:45,374 --> 00:34:47,040 су изворно МОДС, неки од њих нису. 606 00:34:47,040 --> 00:34:49,204 Тако смо их све до бити у истом формату. 607 00:34:49,204 --> 00:34:51,120 Затим, ту су различити обогаћивање кораци, гдје 608 00:34:51,120 --> 00:34:55,969 додамо још информација у подацима него је био доступан у библиотеци. 609 00:34:55,969 --> 00:34:59,750 Зато морамо да додамо, пре свега имамо шта библиотеке стани. 610 00:34:59,750 --> 00:35:02,250 Идемо кроз корак израчунавања стацксцоре. 611 00:35:02,250 --> 00:35:07,112 Пролазимо кроз још један корак додајући више мета-података у смислу 612 00:35:07,112 --> 00:35:10,730 од оног наплате људи Можда је додао ово-- 613 00:35:10,730 --> 00:35:12,532 >> Људи стварају колекције предмета. 614 00:35:12,532 --> 00:35:13,990 Шта колекције то припада? 615 00:35:13,990 --> 00:35:17,220 Како су људи означена Овај текст у прошлости? 616 00:35:17,220 --> 00:35:20,750 Онда филтрирати, и ви ограничити евиденција јер, као што сам поменуо, 617 00:35:20,750 --> 00:35:24,120 постоје неке евиденције које, због цопиригхт разлога, не можемо приказати. 618 00:35:24,120 --> 00:35:26,700 И онда смо их учитати у нечему што се зове 619 00:35:26,700 --> 00:35:31,680 Солр, што није погрешно писање, али је назив неког програма 620 00:35:31,680 --> 00:35:35,710 да ли претраживање индексирање, који вози све претрагу иза АПИ. 621 00:35:35,710 --> 00:35:40,110 И онда то постаје доступна АПИ, и људи могу да га користе. 622 00:35:40,110 --> 00:35:44,640 >> Дакле, ово је као прилично једноставан процес. 623 00:35:44,640 --> 00:35:47,230 Један од интересантно ствари о томе је 624 00:35:47,230 --> 00:35:50,990 да се ради са 13 милиона плоча 625 00:35:50,990 --> 00:35:53,820 а ми ћемо се бавити или више. 626 00:35:53,820 --> 00:36:01,260 И ми желимо да будемо у стању да обради ово у релативно брзом начин. 627 00:36:01,260 --> 00:36:03,630 Потребно је много времена да обрадити 13 милиона плоча. 628 00:36:03,630 --> 00:36:09,529 >> Па како ово гасовод је подесите је да сте можеш-- 629 00:36:09,529 --> 00:36:12,070 Претпостављам предност Нафтовод, проблем који смо 630 00:36:12,070 --> 00:36:15,580 покушавајући да реши овде, јесте да сви трансформације, све 631 00:36:15,580 --> 00:36:18,729 ови кораци у ово Гасовод могу одвојити. 632 00:36:18,729 --> 00:36:19,645 Нема зависност. 633 00:36:19,645 --> 00:36:22,146 Ако обраду запис о једној књизи, 634 00:36:22,146 --> 00:36:24,270 нема зависност у да између другог књизи. 635 00:36:24,270 --> 00:36:27,760 >> Па шта можемо да урадимо је у основи, на сваком кораку у цевоводу, 636 00:36:27,760 --> 00:36:30,470 смо је ставили у ред у облаку. 637 00:36:30,470 --> 00:36:32,250 Ја сам се на Амазон Веб Сервицес. 638 00:36:32,250 --> 00:36:35,140 Тако да списак, кажу, 10.000 артикала који 639 00:36:35,140 --> 00:36:38,100 морају бити нормализована и конвертоване у МОДС формат. 640 00:36:38,100 --> 00:36:41,620 И ми спин што више сервера као што смо желели, можда 10 сервери. 641 00:36:41,620 --> 00:36:44,860 И сваки од тих сервера само седи тамо, гледа у том реду, 642 00:36:44,860 --> 00:36:46,730 види да постоји онај који треба да се обрађивати, смирена и реда, 643 00:36:46,730 --> 00:36:48,740 обрађује га, и штапићи то на следећем реду. 644 00:36:48,740 --> 00:36:54,200 >> И шта да нам дозвољава да урадите је да примењује, у суштини, 645 00:36:54,200 --> 00:36:58,110 колико хардвера јер желимо да ово Проблем за веома кратко време 646 00:36:58,110 --> 00:37:02,970 да обрађује податке у најкраћем могуће, што је нешто што само, 647 00:37:02,970 --> 00:37:08,220 Сада у свету цлоуд цомпутинг Можемо да резервисања сервери суштини 648 00:37:08,220 --> 00:37:09,890 тренутно, је то корисно. 649 00:37:09,890 --> 00:37:12,260 Дакле, ми не морамо да имамо гигант сервера седим 650 00:37:12,260 --> 00:37:16,700 све време да уради обраду да би се могло десити само једном недељно. 651 00:37:16,700 --> 00:37:21,440 >> Дакле, то је углавном то. 652 00:37:21,440 --> 00:37:27,590 Има документација доступна Библиотека за Цлоуд АПИ артикла 653 00:37:27,590 --> 00:37:31,960 на овој УРЛ, који ће бити доступан касније. 654 00:37:31,960 --> 00:37:36,730 И молим вас идите погледајте то да видим има ли шта, 655 00:37:36,730 --> 00:37:37,579 имате неку идеју. 656 00:37:37,579 --> 00:37:38,120 Играј се са њом. 657 00:37:38,120 --> 00:37:38,830 Зезамо. 658 00:37:38,830 --> 00:37:42,800 И надамо се можете доћи са нечим великим. 659 00:37:42,800 --> 00:37:44,740 Хвала. 660 00:37:44,740 --> 00:37:45,899