1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 JEFFREY Licht: Hi there. 3 00:00:12,370 --> 00:00:13,550 Ég er Jeffrey Licht. 4 00:00:13,550 --> 00:00:17,890 Og ég er hér að tala við þig um Harvard Library og byggja morgun 5 00:00:17,890 --> 00:00:20,870 bókasafn í dag, held ég. 6 00:00:20,870 --> 00:00:23,040 Svo bakgrunnur hér, kasta fyrir þessa lotu 7 00:00:23,040 --> 00:00:26,930 er fyrst og fremst að það er a einhver fjöldi af skráningargögn 8 00:00:26,930 --> 00:00:28,400 í boði í Harvard bókasöfnum. 9 00:00:28,400 --> 00:00:33,434 Og það er tækifæri, í gegnum sumir af þeim verkfærum 10 00:00:33,434 --> 00:00:36,350 og verkefni sem er verið að þróa, að fá aðgang að upplýsingum 11 00:00:36,350 --> 00:00:42,430 og taka það til staða sem er Harvard Library er ekki að gera núna, 12 00:00:42,430 --> 00:00:45,460 gera nýtt efni með það, tilraun og leika í kring með það. 13 00:00:45,460 --> 00:00:52,413 >> Svo innganga benda inn í þetta er API kallað Harvard Library Cloud, sem 14 00:00:52,413 --> 00:00:57,650 er opinn lýsigögn miðlara, sem ég mun tala um núna. 15 00:00:57,650 --> 00:01:02,595 Svo bakgrunnur er að það er mikið af efni í Harvard safninu. 16 00:01:02,595 --> 00:01:07,150 Við höfum yfir 13 milljónir bókfræðilegar Skrár, milljónir myndum, 17 00:01:07,150 --> 00:01:11,090 og þúsundir finna hjálpartæki, sem eru í raun skjöl sem lýsa 18 00:01:11,090 --> 00:01:15,500 söfn, segja hvað í þeim er, kassar af fyrirlestrum 19 00:01:15,500 --> 00:01:21,080 og svo framvegis sem tákna yfir milljón einstök skjöl. 20 00:01:21,080 --> 00:01:24,290 Og það er líka fullt af upplýsingar sem safnsins 21 00:01:24,290 --> 00:01:28,180 um hvernig efni er notað sem gæti verið áhugaverð fyrir fólk 22 00:01:28,180 --> 00:01:32,400 sem gæti langað til að vinna með það. 23 00:01:32,400 --> 00:01:36,150 >> Svo allar upplýsingar safnsins lýsigögn. 24 00:01:36,150 --> 00:01:39,500 Svo lýsigögn eru gögn um gögn. 25 00:01:39,500 --> 00:01:42,070 Svo þegar við tölum um upplýsingar sem er 26 00:01:42,070 --> 00:01:44,890 í boði í gegnum bókasafn ský sem er í boði, 27 00:01:44,890 --> 00:01:47,760 það er ekki endilega raunveruleg gögn 28 00:01:47,760 --> 00:01:53,060 sjálfir, ekki endilega að fullu texti af bókum eða fullt myndum, 29 00:01:53,060 --> 00:01:54,890 þó að í raun getur verið að ræða. 30 00:01:54,890 --> 00:01:57,550 En það er í raun Upplýsingar um gögnin. 31 00:01:57,550 --> 00:02:00,909 >> Svo er hægt að hugsa um skráningu upplýsingar, tölur kalla, einstaklingar, 32 00:02:00,909 --> 00:02:02,700 hversu mörg eintök af bók eru, hvað 33 00:02:02,700 --> 00:02:06,380 eru útgáfur, hvað eru snið, höfundar, og svo framvegis. 34 00:02:06,380 --> 00:02:12,250 Þannig að það er a einhver fjöldi af upplýsingar um upplýsingar í safn sem, 35 00:02:12,250 --> 00:02:14,400 í sjálfu sér, er góður af eðli sínu gagnlegt. 36 00:02:14,400 --> 00:02:19,230 Og þó ef þú ert gera í-dýpt rannsóknir, 37 00:02:19,230 --> 00:02:25,160 þú vilt greinilega að fá að raunverulegt efni sig og líta á gögnin, 38 00:02:25,160 --> 00:02:30,140 lýsigagnataflan er gagnlegt með tilliti til bæði greina Corpus í heild, 39 00:02:30,140 --> 00:02:33,870 eins og það sem hlutir eru í safninu. 40 00:02:33,870 --> 00:02:35,520 Hvernig þeir tengjast? 41 00:02:35,520 --> 00:02:39,482 Það hjálpar þér að finna virkilega annað efni, sem er í raun helsta tilgang hennar. 42 00:02:39,482 --> 00:02:41,190 Aðalatriðið að lýsigögn og verslun 43 00:02:41,190 --> 00:02:43,230 er að hjálpa þér að finna allar upplýsingar sem er 44 00:02:43,230 --> 00:02:46,590 aðgengilegt í söfnum. 45 00:02:46,590 --> 00:02:53,690 >> Svo er þetta dæmi um lýsigögn fyrir bók í Harvard Library. 46 00:02:53,690 --> 00:02:56,370 Svo það er það. 47 00:02:56,370 --> 00:02:59,850 Og þú getur séð það er reyndar nokkuð flókið. 48 00:02:59,850 --> 00:03:04,610 Og hluti af verðmæti lýsigögn innan Harvard Gegnir 49 00:03:04,610 --> 00:03:09,320 er að það er verið að raða af byggt upp af catalogers 50 00:03:09,320 --> 00:03:12,720 og saman við fólk sem sækja a einhver fjöldi af þekkingu og færni 51 00:03:12,720 --> 00:03:20,030 og hélt að það með tímanum, sem hefur mikið gildi. 52 00:03:20,030 --> 00:03:25,450 >> Svo ef þú taka a líta á þessa færslu fyrir The merktar Alice, getur þú fundið út 53 00:03:25,450 --> 00:03:32,590 þú hafir fengið titilinn, sem skrifaði það, höfundur og allir mismunandi einstaklingar 54 00:03:32,590 --> 00:03:35,380 sem menn hafa skrásett það inn. 55 00:03:35,380 --> 00:03:40,110 Og þú getur séð það er líka í viðbót við fullt af góðum upplýsingum 56 00:03:40,110 --> 00:03:42,852 hér, það er sumir tvíverknað. 57 00:03:42,852 --> 00:03:45,560 There er a einhver fjöldi af flókið sem er endurspeglast í gegnum lýsigögn 58 00:03:45,560 --> 00:03:46,300 sem þú hefur. 59 00:03:46,300 --> 00:03:50,320 >> Svo er einn titill bókarinnar Lísa í Undralandi. 60 00:03:50,320 --> 00:03:53,880 Svo er þetta viðburði útgáfa af þeirri bók. 61 00:03:53,880 --> 00:03:56,380 En það er einnig kallað The viðburði Alice, Lísa 62 00:03:56,380 --> 00:03:58,570 í Undralandi því það er eitthvað sem 63 00:03:58,570 --> 00:04:00,430 Martin Gardner skrifaði og merktar bókina. 64 00:04:00,430 --> 00:04:03,369 Og það er mikið af mikill upplýsingar um þrautir rökfræði og hlutum 65 00:04:03,369 --> 00:04:05,410 innan Alice að þér sennilega ekki vita um. 66 00:04:05,410 --> 00:04:07,000 Svo þú ættir að fara að lesa það. 67 00:04:07,000 --> 00:04:11,940 >> En þú getur séð það er a einhver fjöldi af smáatriðum hér, 68 00:04:11,940 --> 00:04:15,340 þ.mt auðkenni þegar það var búið til, þar sem það kom frá, 69 00:04:15,340 --> 00:04:17,420 í skilmálum Harvard kerfi, og svo framvegis. 70 00:04:17,420 --> 00:04:20,350 Þannig að þetta er sýnishorn af gerð lýsigagna 71 00:04:20,350 --> 00:04:24,340 að þú gætir séð fyrir bók í Harvard Library safn. 72 00:04:24,340 --> 00:04:26,680 >> Þetta er eitthvað allt öðruvísi. 73 00:04:26,680 --> 00:04:32,610 Svo er það kerfi sem kallast VIA Harvard, sem í grundvallaratriðum 74 00:04:32,610 --> 00:04:39,990 er skráningu myndir og listmuni og sjón hluti allan Harvard, 75 00:04:39,990 --> 00:04:44,010 og bæta við nokkrum lýsigögnum þeim, flokka þá, 76 00:04:44,010 --> 00:04:49,200 og, í sumum tilvikum, að veita lítil smámyndir 77 00:04:49,200 --> 00:04:51,250 að þú getur tekið a líta á ef þú vilt svo. 78 00:04:51,250 --> 00:04:54,240 >> Svo er þetta dæmi um að lýsigögn sem þú hefur fyrir plötu 79 00:04:54,240 --> 00:04:57,840 frá, væntanlega, Lísa í Undralandi. 80 00:04:57,840 --> 00:05:00,499 Og þú getur séð það er minna lýsigögn hér. 81 00:05:00,499 --> 00:05:02,040 Það er bara öðruvísi hlut. 82 00:05:02,040 --> 00:05:03,425 Og svo er það minni upplýsingar. 83 00:05:03,425 --> 00:05:07,790 >> Þú hefur að mestu sú staðreynd að, að hringja númer í raun sem skapaði það, - 84 00:05:07,790 --> 00:05:10,410 >> Við vitum ekki hvenar það var búið. 85 00:05:10,410 --> 00:05:13,320 >> --and titil. 86 00:05:13,320 --> 00:05:14,300 >> Annað dæmi. 87 00:05:14,300 --> 00:05:16,380 Þetta er niðurstaða aðstoð. 88 00:05:16,380 --> 00:05:19,030 Þannig að það er safn af Lewis Pappíra Carroll á Harvard. 89 00:05:19,030 --> 00:05:23,601 Svo lýsir þetta hvað er í því safni. 90 00:05:23,601 --> 00:05:26,100 Svo einhver hefur gengið í gegnum og horfði í gegnum alla kassa 91 00:05:26,100 --> 00:05:32,220 og raðaði því, í ljósi sumir bakgrunnur, skrifað yfirlit yfir hvað er hér. 92 00:05:32,220 --> 00:05:35,290 Og ef þú varst að leita frekar á þetta, þetta 93 00:05:35,290 --> 00:05:39,620 fer á fyrir síður og síður og síður, en mun segja þér 94 00:05:39,620 --> 00:05:41,860 hvað bréf og hvað er frá hvaða kassa 95 00:05:41,860 --> 00:05:44,289 verið um söfnun. 96 00:05:44,289 --> 00:05:46,330 En þetta er eitthvað að ef þú ert í Harvard, 97 00:05:46,330 --> 00:05:50,720 þú getur farið og í raun líkamlega líta upp og væntanlega taka a líta á. 98 00:05:50,720 --> 00:05:53,440 >> Svo er þetta allt frábært. 99 00:05:53,440 --> 00:05:54,450 Þetta lýsigögn er gagnlegt. 100 00:05:54,450 --> 00:05:56,327 Það er í Harvard Gegnir. 101 00:05:56,327 --> 00:05:58,910 Það eru verkfæri á netinu þar sem þú getur farið og taka a líta á það, 102 00:05:58,910 --> 00:05:59,993 og sjá það, og leita það. 103 00:05:59,993 --> 00:06:02,810 Og þú getur sneið það og teningar það í fullt af mismunandi vegu. 104 00:06:02,810 --> 00:06:06,920 >> En það er í raun aðeins í boði ef þú ert manneskja að setjast niður 105 00:06:06,920 --> 00:06:12,600 á vafranum eða eitthvað eða síminn og siglingar í gegnum það. 106 00:06:12,600 --> 00:06:16,730 Það er í raun ekki í boði í hvers konar nothæfa tísku 107 00:06:16,730 --> 00:06:19,520 fyrir önnur kerfi eða aðrar tölvur til að nota, 108 00:06:19,520 --> 00:06:21,500 ekki með kerfi innan Harvard Library, 109 00:06:21,500 --> 00:06:24,890 en kerfi í umheiminum, bara annað fólk almennt. 110 00:06:24,890 --> 00:06:30,210 Svo spurningin er, hvernig getum við gera þær aðgengilegar tölvur 111 00:06:30,210 --> 00:06:33,560 svo að við getum gert meira áhugavert efni með það en bara 112 00:06:33,560 --> 00:06:36,550 beit það sjálf? 113 00:06:36,550 --> 00:06:39,766 >> Svo hvers vegna vildi þú vilja til gera þetta? 114 00:06:39,766 --> 00:06:41,140 There ert a einhver fjöldi af möguleikum. 115 00:06:41,140 --> 00:06:43,980 Eitt er að þú gætir byggja algjörlega öðruvísi leið beit 116 00:06:43,980 --> 00:06:46,962 efni sem er í boði gegnum Harvard bókasafna. 117 00:06:46,962 --> 00:06:48,670 Ég skal sýna þér einn síðar kallaði Stacklife, 118 00:06:48,670 --> 00:06:52,440 sem hefur allt öðruvísi taka á að leita að efni. 119 00:06:52,440 --> 00:06:54,560 >> Þú gætir byggja meðmæli vél. 120 00:06:54,560 --> 00:06:57,955 Svo er Harvard Library ekki í Viðskipti segja, þú eins og þessa bók. 121 00:06:57,955 --> 00:07:01,080 Þá fara að taka a líta á þessar 17 annað bækur sem þú gætir haft áhuga á 122 00:07:01,080 --> 00:07:03,200 eða þessar 18 aðrar myndir. 123 00:07:03,200 --> 00:07:06,040 En það vissulega gæti vera dýrmætur eiginleiki. 124 00:07:06,040 --> 00:07:09,272 Og miðað við lýsigögn, getur það að vera hægt að setja það saman. 125 00:07:09,272 --> 00:07:11,980 Þú gætir hafa mismunandi þörfum í Skilmálar leita á efni, 126 00:07:11,980 --> 00:07:16,200 eins og kannski þrátt fyrir verkfæri sem eru að bókasafnið gerir 127 00:07:16,200 --> 00:07:18,450 í boði, þú might vilja að leita á annan hátt 128 00:07:18,450 --> 00:07:21,847 eða hagræða til tiltekinna nota tilfelli, sem kannski er það mjög sérhæfð. 129 00:07:21,847 --> 00:07:23,930 Kannski eru aðeins fáeinir fólk í heiminum sem 130 00:07:23,930 --> 00:07:25,846 að leita á efni á þennan hátt, en það 131 00:07:25,846 --> 00:07:28,985 væri frábært ef við gæti látið þá gera það. 132 00:07:28,985 --> 00:07:30,860 There er a einhver fjöldi af greinandi á aðeins hvernig fólk 133 00:07:30,860 --> 00:07:33,860 nota efni sem væri í raun áhugavert að vita um, að finna út 134 00:07:33,860 --> 00:07:37,280 hvaða bækur eru notaðar, hvað eru ekki, og svo framvegis. 135 00:07:37,280 --> 00:07:41,670 Og þá er það a einhver fjöldi af tækifæri til að samþætta 136 00:07:41,670 --> 00:07:45,210 öðrum upplýsingum það er þarna úti á vefnum. 137 00:07:45,210 --> 00:07:46,880 Þannig að við have-- 138 00:07:46,880 --> 00:07:50,260 >> Til dæmis, NPR hefur bókagagnrýni hluti, 139 00:07:50,260 --> 00:07:53,090 þar sem þeir viðtal Höfundar um bækur. 140 00:07:53,090 --> 00:07:56,837 Og svo það væri frábært ef þú værir leita upp bókinni í Harvard 141 00:07:56,837 --> 00:07:59,670 Bókasafn, og þú segir, OK, það er verið viðtal við höfund. 142 00:07:59,670 --> 00:08:00,878 Við skulum fara að taka a líta á það. 143 00:08:00,878 --> 00:08:05,461 Eða það er Wikipedia síðu, sem er opinber, fræðileg tilvísun 144 00:08:05,461 --> 00:08:07,710 um þessa bók sem þú might vilja til taka a líta á. 145 00:08:07,710 --> 00:08:12,600 >> Það eru þessar tegundir af heimildum dreifðir um vefinn. 146 00:08:12,600 --> 00:08:16,555 Og koma þeim saman gæti verið mikill nota 147 00:08:16,555 --> 00:08:18,930 að einhver horfa á efni, að leita að einhverju. 148 00:08:18,930 --> 00:08:20,180 En það er líka ekki konar hlutur að þú vilt 149 00:08:20,180 --> 00:08:23,205 vilja bókasafn til að vera ábyrgur fyrir að fara niður og veiða niður 150 00:08:23,205 --> 00:08:25,455 Öll þessi mismunandi heimildir og tengja þá saman 151 00:08:25,455 --> 00:08:28,920 vegna þess að þeir eru að breytast stöðugt. 152 00:08:28,920 --> 00:08:33,570 Og hvað þeir hugsa er mikilvægt may ekki vera það sem þér finnst mikilvægt. 153 00:08:33,570 --> 00:08:36,929 >> Og jafnvel meira svo, í grundvallaratriðum er það mikið af efni sem við höfum ekki hugsað um enn. 154 00:08:36,929 --> 00:08:42,222 Svo ef við getum opnað þetta upp, meira fólk auk hálfa tylft eða svo, 155 00:08:42,222 --> 00:08:45,174 sem eru að horfa á þetta á a reglulega getur hugsað hugmyndir 156 00:08:45,174 --> 00:08:47,340 og nudd gögn og gera það sem þeir vilja með það. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> Þannig að við viljum gera þetta upplýsingar liggja fyrir um allan heim. 159 00:08:54,045 --> 00:08:55,670 Jæja, það eru nokkrar fylgikvillar. 160 00:08:55,670 --> 00:08:58,540 Eitt er að þetta lýsigögn er í mismunandi kerfum. 161 00:08:58,540 --> 00:09:01,110 Það er í mismunandi snið. 162 00:09:01,110 --> 00:09:04,719 Svo er það einhver eðlileg sem þarf að gerast, 163 00:09:04,719 --> 00:09:08,010 sem eðlileg vera ferli uppeldi hlutina frá mismunandi snið 164 00:09:08,010 --> 00:09:12,940 og kortleggja þau í einu sniði svo að akrar passa upp. 165 00:09:12,940 --> 00:09:15,160 >> There ert sumir höfundarrétti takmarkanir. 166 00:09:15,160 --> 00:09:21,010 Einkennilega nóg, verslun færslu um bók er ábyrgur fyrir höfundarrétt. 167 00:09:21,010 --> 00:09:24,060 Svo jafnvel þó að það er bara Upplýsingar fengnar úr bókinni, 168 00:09:24,060 --> 00:09:25,330 það er copyrightable. 169 00:09:25,330 --> 00:09:28,400 Og eftir sem í raun búin að lýsigögn, 170 00:09:28,400 --> 00:09:32,175 there mega vera hömlur á hver getur dreifa því, svipað to-- 171 00:09:32,175 --> 00:09:33,402 >> Ég veit ekki. 172 00:09:33,402 --> 00:09:36,110 Það mega eða mega ekki vera svipað ástandið á söngtexta, 173 00:09:36,110 --> 00:09:36,610 til dæmis. 174 00:09:36,610 --> 00:09:38,560 Þannig að við vitum öll hvernig það pönnur út. 175 00:09:38,560 --> 00:09:40,450 Svo þú þarft að fá í kringum þessi mál. 176 00:09:40,450 --> 00:09:44,910 >> Og þá er annar stykki að það er mikið af gögnum. 177 00:09:44,910 --> 00:09:52,420 Svo ef ég er einhver sem vill vinna með gögnum eða hefur a kaldur hugmynd, 178 00:09:52,420 --> 00:09:55,350 að takast á við 14 milljónir færslur á minn laptop 179 00:09:55,350 --> 00:09:57,487 gæti verið erfið og erfitt að stjórna. 180 00:09:57,487 --> 00:09:59,320 Þannig að við viljum að draga úr hindranir fyrir fólk 181 00:09:59,320 --> 00:10:02,130 að vera fær um að vinna með gögnin. 182 00:10:02,130 --> 00:10:07,880 >> Þannig að nálgun sem vonandi heimilisföng allar þessar áhyggjur er tveir hlutar. 183 00:10:07,880 --> 00:10:11,770 Eitt er að byggja upp vettvang sem tekur gögn frá öllum þessum ólíku heimildum 184 00:10:11,770 --> 00:10:14,350 og atferli það, normalizes, auðgar það og gerðum 185 00:10:14,350 --> 00:10:16,650 það í boði á einum stað. 186 00:10:16,650 --> 00:10:20,950 Og það gerir það í gegnum opinber API sem fólk getur hringt. 187 00:10:20,950 --> 00:10:24,430 >> Svo er API er umsókn Forritun Interface. 188 00:10:24,430 --> 00:10:28,930 Og það átt í rauninni til endapunktur á því að kerfið eða tækni 189 00:10:28,930 --> 00:10:31,720 getur hringt og fengið gögn til baka í skipulögð snið á þann hátt 190 00:10:31,720 --> 00:10:32,900 að það er hægt að nota. 191 00:10:32,900 --> 00:10:36,060 Svo það er ekki háð á að fara til a website 192 00:10:36,060 --> 00:10:37,970 og skafa gögn burt um það, til dæmis. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> Þannig að þetta er heimasíða um Library Cloud Item API, 195 00:10:45,010 --> 00:10:47,220 sem er í raun útgáfa hennar tveir. 196 00:10:47,220 --> 00:10:50,130 Svo er það annað endurtekning af reyna að gera alla þessa gögnum 197 00:10:50,130 --> 00:10:53,280 í boði til heimsins. 198 00:10:53,280 --> 00:10:59,560 Svo það er http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 Og bara til að brjóta þetta niður svolítið, hvað þetta þýðir 200 00:11:03,830 --> 00:11:06,115 er að þetta er útgáfa tveimur API. 201 00:11:06,115 --> 00:11:08,490 There er a útgáfa einn, sem Ég ætla ekki að tala um. 202 00:11:08,490 --> 00:11:09,750 En það er útgáfa einn. 203 00:11:09,750 --> 00:11:14,740 >> Og ef þú ætlar að hringja í API, þú ert að fá atriði. 204 00:11:14,740 --> 00:11:20,640 Og hluti af the hugmynd af að API er API er samningur. 205 00:11:20,640 --> 00:11:23,440 Það er eitthvað sem er ekki að fara að breytast. 206 00:11:23,440 --> 00:11:24,850 Svo til dæmis, - 207 00:11:24,850 --> 00:11:27,410 >> Og ástæðan er sú að ef ég byggja einhvers konar kerfi sem 208 00:11:27,410 --> 00:11:33,210 er að fara að nota bókasafn ský API til að birta bækur eða hjálpa fólki að finna 209 00:11:33,210 --> 00:11:36,190 Upplýsingar í einstaka hátt, það sem við viljum ekki að gerast 210 00:11:36,190 --> 00:11:38,940 er fyrir okkur að fara að breyta því hvernig að API virkar, og skyndilega 211 00:11:38,940 --> 00:11:41,340 allt brýtur á the endir notandi hlið. 212 00:11:41,340 --> 00:11:46,710 Svo hluti af ef þú ert að gera API í boði í heiminum, það er 213 00:11:46,710 --> 00:11:49,396 gott að setja útgáfunúmer í það þannig að fólk 214 00:11:49,396 --> 00:11:51,020 vita hvaða útgáfa þeir eru að fást við. 215 00:11:51,020 --> 00:11:54,300 >> Svo ef við ákveðum að finna betri leið að gera þessar upplýsingar, 216 00:11:54,300 --> 00:11:57,295 við gætum breytt því til kalla það útgáfu þrjú. 217 00:11:57,295 --> 00:11:59,920 Svo allir sem er enn að nota útgáfa tveimur, sem mun enn vinna. 218 00:11:59,920 --> 00:12:03,490 En útgáfa þrír myndu hafa öll nýtt efni. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> Svo er þetta API, en þetta raunverulega lítur út eins og tengill. 221 00:12:09,210 --> 00:12:11,680 Og svo er það þetta sem dæmi um hvað er 222 00:12:11,680 --> 00:12:16,615 kallað hvíla API, sem er í boði yfir bara venjulegur vefur tengingu. 223 00:12:16,615 --> 00:12:19,680 Og þú getur raunverulega fara til henni í vafranum. 224 00:12:19,680 --> 00:12:28,550 >> Svo hér er ég hef bara opnaði Firefox og farið til api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 Og svo er það sem ég fæ hér grundvallaratriðum á fyrstu síðu 226 00:12:31,560 --> 00:12:34,740 úrslit frá öllu setja af hlutum sem við erum með. 227 00:12:34,740 --> 00:12:37,460 Og það er hér á XML formi. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 Og það er líka verið prettified af Firefox. 230 00:12:42,210 --> 00:12:45,850 Það er í raun ekki hafa allar þessar lítið vaxandi og samningagerð 231 00:12:45,850 --> 00:12:47,880 doohickeys hér. 232 00:12:47,880 --> 00:12:52,520 Þetta er tegund af a ágætur útgáfa leið til að líta á það. 233 00:12:52,520 --> 00:12:57,040 >> En hvað þetta er að segja okkur er Ég hef beðið alla hluti. 234 00:12:57,040 --> 00:13:03,120 Þannig að það eru 13.289.475 hlutir. 235 00:13:03,120 --> 00:13:06,150 Og ég er að horfa á fyrsta 10, hefst í stöðu núll 236 00:13:06,150 --> 00:13:09,760 vegna þess að í tölvunarfræði við byrjum alltaf á núlli. 237 00:13:09,760 --> 00:13:15,150 Og það sem ég hef hér, ef ég hrynja bara þetta, munt þú sjá að ég hef fengið 10 atriði. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> Og ef ég taka a líta á hlut, ég get sjá að ég hef fengið upplýsingar um það. 240 00:13:25,210 --> 00:13:27,400 Og þetta er í það sem er kallað Mods formi. 241 00:13:27,400 --> 00:13:30,860 Og svo ætla ég að skipta aftur hingað í smástund. 242 00:13:30,860 --> 00:13:33,750 OK. 243 00:13:33,750 --> 00:13:37,447 >> Svo skulum leita að einhverju í sérstakur vegna þess að fyrsta atriði sem 244 00:13:37,447 --> 00:13:40,030 gerist að koma upp þegar þú horfir í gegnum allt safn 245 00:13:40,030 --> 00:13:41,750 er, samkvæmt skilgreiningu, handahófi. 246 00:13:41,750 --> 00:13:44,550 Svo skulum líta á sumir kleinuhringir. 247 00:13:44,550 --> 00:13:46,830 Oh. 248 00:13:46,830 --> 00:13:49,190 >> OK. 249 00:13:49,190 --> 00:13:49,940 Svo kleinuhringir. 250 00:13:49,940 --> 00:13:55,360 Þannig að við að finna að það eru 80 atriði í söfnun sem tilvísun kleinuhringir. 251 00:13:55,360 --> 00:13:57,150 Við erum að horfa á fyrstu 10 af þeim. 252 00:13:57,150 --> 00:14:01,890 Nú getur þú séð hér á þann hátt að Ég sagði að ég er að leita að kleinuhringir, 253 00:14:01,890 --> 00:14:04,400 Ég bætti bara eitthvað til að fyrirspurn band af vefslóðinni. 254 00:14:04,400 --> 00:14:09,680 Svo q jafngildir kleinuhringir, sem þú getur sjá aðeins meira auðveldlega hér. 255 00:14:09,680 --> 00:14:12,131 >> Og þetta þýðir í rauninni að það er a sérstakur fyrir API, sem 256 00:14:12,131 --> 00:14:13,880 skilgreinir hvað allar þessir þættir þýða. 257 00:14:13,880 --> 00:14:17,150 Og þetta þýðir að við erum að fara að leita allt fyrir kleinuhringir. 258 00:14:17,150 --> 00:14:24,910 >> Svo fyrsta lið hér höfum við þú getur séð titill er kleinuhringir, 259 00:14:24,910 --> 00:14:29,310 og það er Undirtitils kallast An American Passion, sem er, held ég, 260 00:14:29,310 --> 00:14:31,610 við á. 261 00:14:31,610 --> 00:14:36,134 There ert a einhver fjöldi af different-- 262 00:14:36,134 --> 00:14:38,050 Þegar þú fá til the benda um að fá gögn, 263 00:14:38,050 --> 00:14:41,020 það eru fullt af mismunandi snið sem hægt er að fá það inn í. 264 00:14:41,020 --> 00:14:44,050 Og það eru mismunandi styrkleikar og veikleikar fyrir þeim öllum. 265 00:14:44,050 --> 00:14:49,000 Svo þetta er hægt að sjá hér, þetta form er mjög ríkur. 266 00:14:49,000 --> 00:14:51,946 Og það er staðlað. 267 00:14:51,946 --> 00:14:55,040 >> Svo er einhver sérstök titill reit, a undirtitill sviði. 268 00:14:55,040 --> 00:14:58,950 Það er varamaður titill, An American Passion. 269 00:14:58,950 --> 00:15:01,650 Það er nafn í tengslum við það. 270 00:15:01,650 --> 00:15:03,120 Tegund auðlindinni er texti. 271 00:15:03,120 --> 00:15:06,070 There er a einhver fjöldi af upplýsingar hér í þessu formi. 272 00:15:06,070 --> 00:15:09,480 >> En það eru fullt af mismunandi snið. 273 00:15:09,480 --> 00:15:11,920 Svo það sem við vorum bara horfa á er snið 274 00:15:11,920 --> 00:15:17,700 kallast mods, sem stendur fyrir Metadata Object Lýsing Service, 275 00:15:17,700 --> 00:15:18,250 hugsanlega. 276 00:15:18,250 --> 00:15:23,030 Ég er reyndar ekki alveg viss um S. En það er nokkuð flókið snið. 277 00:15:23,030 --> 00:15:24,240 Það er sjálfgefið snið. 278 00:15:24,240 --> 00:15:30,260 >> En það er einn sem heldur auðlegð öllum gögnum 279 00:15:30,260 --> 00:15:33,820 að bókasafnið hefur því það er mjög nálægt því 280 00:15:33,820 --> 00:15:35,110 bókasafn notar innra. 281 00:15:35,110 --> 00:15:39,030 Það er staðall sem er notað víða um land, 282 00:15:39,030 --> 00:15:40,944 um allan heim í fræðilegum söfnum. 283 00:15:40,944 --> 00:15:42,110 Og það er mjög samhæfð. 284 00:15:42,110 --> 00:15:44,852 Svo ef þú hefur fengið skjal sem er í mods sniði, 285 00:15:44,852 --> 00:15:47,560 þú getur gefið það til einhver annar sem hafa kerfi skilja mods, 286 00:15:47,560 --> 00:15:48,518 og þeir geta flytja það. 287 00:15:48,518 --> 00:15:50,840 Svo það er staðall. 288 00:15:50,840 --> 00:15:54,250 Það er mjög vel skilgreind, mjög sérstakur. 289 00:15:54,250 --> 00:15:58,980 Og það er það sem gerir það samhæfð því ef einhver segir, 290 00:15:58,980 --> 00:16:04,930 þetta er varamaður titill a met, allir vita hvað það þýðir. 291 00:16:04,930 --> 00:16:07,740 Á bakhlið, það er mjög flókið. 292 00:16:07,740 --> 00:16:13,160 >> Svo ef þú taka a líta á þessari færslu hér, 293 00:16:13,160 --> 00:16:15,320 ef ég vil bara að fá yfirskrift þessa skjals, 294 00:16:15,320 --> 00:16:21,150 þessa bók, sem er sennilega kleinuhringir, An American Passion, þáttun það út 295 00:16:21,150 --> 00:16:22,940 er svolítið þátt. 296 00:16:22,940 --> 00:16:27,380 En það er annað kallast Dublin Core, 297 00:16:27,380 --> 00:16:29,730 sem er miklu, miklu einfaldara sniði. 298 00:16:29,730 --> 00:16:33,764 >> Og svo þú sérð hér, það er engin titill, texti, varamaður titill. 299 00:16:33,764 --> 00:16:35,930 Það er bara titill, Kleinuhringir, An American Passion, 300 00:16:35,930 --> 00:16:38,780 og annar titill, American Passion. 301 00:16:38,780 --> 00:16:42,907 Svo þegar þú ert að horfa á hvaða formi þú vilt fá gögn úr, 302 00:16:42,907 --> 00:16:44,740 mikið veltur á hvernig þú ert að fara að nota það. 303 00:16:44,740 --> 00:16:46,573 Ert þú að nota fyrir samvirkni eða þú 304 00:16:46,573 --> 00:16:49,970 vil eitthvað einfalt að gæti verið auðveldara að vinna með? 305 00:16:49,970 --> 00:16:56,002 >> Á bakhlið, a einhver fjöldi af upplýsingar fá konar varla snúið niður. 306 00:16:56,002 --> 00:16:58,460 Þú gætir tapað blæbrigði hvað á ákveðnu sviði leið 307 00:16:58,460 --> 00:17:02,960 ef þú ert að takast á við Dublin Core, sem þú myndir ekki fá með mods. 308 00:17:02,960 --> 00:17:06,462 Þeir eru tveir af snið þú getur fengið út úr API. 309 00:17:06,462 --> 00:17:08,920 Og í rauninni erum við að halda það á bak við tjöldin í mods. 310 00:17:08,920 --> 00:17:14,179 En við getum gefið þér það í mods og Dublin Core og allt annað eins og heilbrigður. 311 00:17:14,179 --> 00:17:16,470 Hin huga þegar þú ert að leita í gögnum 312 00:17:16,470 --> 00:17:21,210 er hægt að fá það eins og annað hvort JSON, sem stendur fyrir JavaScript Object Ritháttur, 313 00:17:21,210 --> 00:17:24,720 eða XML, sem stendur fyrir Teygjanlegur Markup Language. 314 00:17:24,720 --> 00:17:30,080 Og þessar upplýsingar framsetning bæði hafa nákvæmlega sömu gögn, nákvæmlega 315 00:17:30,080 --> 00:17:31,080 sömu sviðum. 316 00:17:31,080 --> 00:17:33,644 En þeir eru bara setningafræðilega öðruvísi. 317 00:17:33,644 --> 00:17:40,401 >> Svo er þetta a-- 318 00:17:40,401 --> 00:17:41,400 Jæja, við skulum skipta bara. 319 00:17:41,400 --> 00:17:47,490 Svo er þetta fyrirspurn okkar fyrir kleinuhringir í XML-sniði. 320 00:17:47,490 --> 00:17:53,470 Ef ég skipta bara þetta að vera JSON, Ég get séð það lítur öðruvísi. 321 00:17:53,470 --> 00:17:58,580 Svo nú er þetta sama efnið, en mismunandi uppbygging. 322 00:17:58,580 --> 00:18:00,080 Það eru færri Oddklofa. 323 00:18:00,080 --> 00:18:02,530 Það er minna fjölorður. 324 00:18:02,530 --> 00:18:06,440 >> Og þetta er snið sem, ef þú eru að vinna í vefnum umhverfi, 325 00:18:06,440 --> 00:18:09,680 þú ert líklega að fara til að vilja nota vegna þess að eitt 326 00:18:09,680 --> 00:18:12,630 af the ágætur hluti um JSON er það er samhæft við JavaScript. 327 00:18:12,630 --> 00:18:17,680 Svo ef ég ætla að skrifa vefforrit, get ég draga í JSON og bara vinna með það beint. 328 00:18:17,680 --> 00:18:20,187 En með XML, er það svolítið flóknari. 329 00:18:20,187 --> 00:18:21,520 Svo aftur, þetta eru bæði gagnlegt. 330 00:18:21,520 --> 00:18:26,387 Þeir eru bara mismunandi tilvikum nota þar sem fólk might vilja til að nota þær. 331 00:18:26,387 --> 00:18:26,886 OK. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 Svo aftur til API. 334 00:18:31,680 --> 00:18:32,900 Þannig að við getum leitað for-- 335 00:18:32,900 --> 00:18:36,220 >> Ég gefa dæmi um leita kleinuhringir. 336 00:18:36,220 --> 00:18:39,330 Við getum einnig leitað bara í a einkum sviði innan hér. 337 00:18:39,330 --> 00:18:41,310 Þannig að í stað þess að leita allt met, 338 00:18:41,310 --> 00:18:43,870 Ég get bara leitað titil sviði. 339 00:18:43,870 --> 00:18:48,810 Og svo nú eru 25 hlutir sem hafa kleinuhringir í titlinum, einn sem 340 00:18:48,810 --> 00:18:52,430 er um að endurheimta votlendi í stjórnun 341 00:18:52,430 --> 00:18:54,990 holunnar í donut program, sem er sennilega 342 00:18:54,990 --> 00:18:58,970 ekki endilega það sem við erum að leita þegar við erum að leita að kleinuhringir. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> Þú getur einnig, þegar þú ert að takast á við API-- 345 00:19:05,490 --> 00:19:08,827 >> Hluti af því að hafa API gefur fólki aðgang að stórum gagnagrunnum. 346 00:19:08,827 --> 00:19:11,410 Og það eru nokkrar mismunandi verkfæri sem þú getur notað til að gera það. 347 00:19:11,410 --> 00:19:14,170 Eitt er, mjög einfaldlega, þú getur síðu í gegnum þau gögn. 348 00:19:14,170 --> 00:19:17,340 Svo bara eins og ef þú gerir fyrirspurn í gegnum vefviðmót, 349 00:19:17,340 --> 00:19:19,470 hægt að líta á síðu eitt, síðu tvö, síðu þrjú. 350 00:19:19,470 --> 00:19:22,040 Þú getur gert það sama hlutur í gegnum API. 351 00:19:22,040 --> 00:19:24,150 Þú þarft bara að vera skýr í því hvernig þú gerir það. 352 00:19:24,150 --> 00:19:29,511 >> Svo til dæmis, ef ég er að leita við fyrstu fyrirspurn minni hér, 353 00:19:29,511 --> 00:19:32,510 þar sem ég er að gera leit að hlutum með kleinuhringir í titlinum, get ég sagt, 354 00:19:32,510 --> 00:19:35,415 og takmörk jafngildir 20, sem þýðir gefa mér fyrstu 20 skrár, ekki 355 00:19:35,415 --> 00:19:38,540 fyrstu 10, sem er sjálfgefið, vegna þess að ég vil að líta á 20 í einu. 356 00:19:38,540 --> 00:19:43,435 Eða ég get sagt, setja byrja jafnt 20 og takmörk 357 00:19:43,435 --> 00:19:47,150 jafnir 20, sem mun gefa mér skráir 21 til 40. 358 00:19:47,150 --> 00:19:52,680 >> Svo ég giska á neitt að taka í burtu hér er 359 00:19:52,680 --> 00:19:57,290 að við erum að nota fyrirspurn strengi að setja breytur á fyrirspurn. 360 00:19:57,290 --> 00:20:02,760 Og það er hægt að stjórna það sem þú færð til baka. 361 00:20:02,760 --> 00:20:05,980 >> Annar tól sem þú getur notað, - 362 00:20:05,980 --> 00:20:09,250 >> Og þetta er mjög gagnlegt í Skilmálar kanna gögn. 363 00:20:09,250 --> 00:20:10,840 >> --is eitthvað sem heitir faceting. 364 00:20:10,840 --> 00:20:15,530 Svo er hugtakið faceting ekki endilega algeng. 365 00:20:15,530 --> 00:20:16,880 En þú hefur öll séð það áður. 366 00:20:16,880 --> 00:20:18,630 Ef þú taka a líta á Amazon, til dæmis, 367 00:20:18,630 --> 00:20:20,870 og þú gera a leita kleinuhringir í bókum, 368 00:20:20,870 --> 00:20:27,080 hér þeir 'got a röð af bókum, og þeir eru flokkaðar eftir tegundum, 369 00:20:27,080 --> 00:20:30,470 og þú færð mismunandi flokka, og hversu margar bækur í hverjum flokki 370 00:20:30,470 --> 00:20:31,330 mæta. 371 00:20:31,330 --> 00:20:33,420 >> Svo er þetta í grundvallaratriðum a flötur. 372 00:20:33,420 --> 00:20:37,570 Þú tekur allar bækur sínar, 1800 bækur sem passa kleinuhringir á Amazon. 373 00:20:37,570 --> 00:20:39,820 12 þeirra eru í Morgunverður flokki. 374 00:20:39,820 --> 00:20:43,100 21 í sætabrauð og bakstur, og svo framvegis og svo framvegis. 375 00:20:43,100 --> 00:20:47,670 >> Svo er þetta virkilega gagnlegt tól til að kanna innihald 376 00:20:47,670 --> 00:20:53,260 innan bókasafnsins eins og heilbrigður vegna þess að þegar þú horfir á flötur, 377 00:20:53,260 --> 00:20:56,520 það gefur þér hugmynd um hvað greinar er til, eins og hvaða tegundir einstaklinga 378 00:20:56,520 --> 00:20:58,510 eru vinsæll innan fyrirspurn þitt. 379 00:20:58,510 --> 00:21:00,950 Og það hjálpar þér aka burt og kanna. 380 00:21:00,950 --> 00:21:02,770 Þannig að við getum gert það sama. 381 00:21:02,770 --> 00:21:05,940 >> Ef við viljum að nota API og líta á hliðar, 382 00:21:05,940 --> 00:21:08,950 við bætum annað breytu vinur okkar fyrirspurn band. 383 00:21:08,950 --> 00:21:12,540 Svo hliðar jafngildir kommu aðskilin listi yfir það sem við viljum að flötur á. 384 00:21:12,540 --> 00:21:14,790 Svo ein af hliðar gæti verið háð. 385 00:21:14,790 --> 00:21:16,565 Annar gæti verið tungumál. 386 00:21:16,565 --> 00:21:19,665 Og svo ef við hlaupa þessi fyrirspurn, get-- við 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 Það lítur laglegur mikill the sami hér. 389 00:21:24,830 --> 00:21:29,010 En við höfum bætt við enda af listanum a setja af hliðar. 390 00:21:29,010 --> 00:21:34,060 Þannig að við höfum flötur heitir háð. 391 00:21:34,060 --> 00:21:40,250 Þannig að þetta er að segja okkur að ef ég lít á 80 úrslitum mínum frá donut fyrirspurn, 392 00:21:40,250 --> 00:21:42,100 13 af þeim hafa háð Bandaríkjunum. 393 00:21:42,100 --> 00:21:43,684 Þrír hafa fyrirvara kleinuhringir. 394 00:21:43,684 --> 00:21:45,600 Þrír hafa efni af endurheimt votlendis, 395 00:21:45,600 --> 00:21:47,720 sem getur verið holu okkar í donut. 396 00:21:47,720 --> 00:21:51,780 Tveir af þeim, Simpsons, og svo framvegis og svo framvegis. 397 00:21:51,780 --> 00:21:59,211 >> Þannig að þetta getur verið gagnlegt ef þú langar að þrengja niður við leitina. 398 00:21:59,211 --> 00:22:00,210 Það getur hjálpað þér að gera það. 399 00:22:00,210 --> 00:22:03,580 Sérstaklega ef þú ert með meira en, segjum, 80 úrslit. 400 00:22:03,580 --> 00:22:05,980 >> Á sama hátt, spurði við einnig fyrir hliðar á tungumál. 401 00:22:05,980 --> 00:22:14,790 Þannig að ef við lítum á niðurstöður okkar, sjáum við 76 þeirra eru á ensku, fjórir í French, 402 00:22:14,790 --> 00:22:19,620 tveir í spænsku, tveir, held ég að er óskilgreindur eða óþekkt, hollenska og Latin. 403 00:22:19,620 --> 00:22:22,830 Þannig að ég held að latínu donut Niðurstaðan, aftur, 404 00:22:22,830 --> 00:22:24,922 hefur ekkert að gera með bakaðri vöru. 405 00:22:24,922 --> 00:22:25,630 En þar sem þú ferð. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> Þannig að þetta er tegund af að sýna þér hvernig þú getur draga efni til baka 408 00:22:38,630 --> 00:22:41,270 frá API bara með vefur flettitæki, sem er frábært. 409 00:22:41,270 --> 00:22:44,320 En það er í raun ekki hvað þú myndir jafnaði vera með í API fyrir það. 410 00:22:44,320 --> 00:22:48,710 Svo eitt dæmi um hvernig þú gæti í raun að gera þetta er að ég hef 411 00:22:48,710 --> 00:22:54,720 skrifað frábær lítill program, sem, aftur, er donut leit mína 412 00:22:54,720 --> 00:22:59,010 og velur nokkra sviðum og birtir þær í töflu. 413 00:22:59,010 --> 00:23:01,610 Svo er þetta mjög mikið sama efnið sem við bara 414 00:23:01,610 --> 00:23:04,830 sá með nokkrum sviðum dreginn út. 415 00:23:04,830 --> 00:23:12,090 Svo lista af titlum, þeim staðsetning hvaða bók 416 00:23:12,090 --> 00:23:15,120 er um tungumálið, og svo framvegis og svo framvegis. 417 00:23:15,120 --> 00:23:20,480 >> Svo hvernig þetta raunverulega gerðist, þar Ég held að við verðum að líta á nokkur númer, 418 00:23:20,480 --> 00:23:22,420 is-- 419 00:23:22,420 --> 00:23:28,060 >> Það sem við höfum hér er einföld HTML síðu, sem birtir texta, 420 00:23:28,060 --> 00:23:32,900 velkomið að ský bókasafna og þá birtir töflu yfir niðurstöður. 421 00:23:32,900 --> 00:23:37,790 Og það eru greinilega engin úrslit í borðið þegar síðan verður hlaðinn. 422 00:23:37,790 --> 00:23:41,380 En hvað við erum að gera er fyrst af öllu, við 423 00:23:41,380 --> 00:23:46,290 eru hleðsla bókasafn kallast jQuery, sem er í grundvallaratriðum 424 00:23:46,290 --> 00:23:52,030 a JavaScript bókasafn, sem gerir það mjög auðvelt að stjórna JavaScript 425 00:23:52,030 --> 00:23:58,780 innfæddur maður, HTML, og búa til vefsíður, client-megin rökfræði og vefsíður. 426 00:23:58,780 --> 00:24:01,595 >> Svo það sem við höfum hér er jQuery hefur aðferð sem kallast fá, 427 00:24:01,595 --> 00:24:05,270 sem í raun mun fara til a URL, sem, í þessu tilfelli, 428 00:24:05,270 --> 00:24:09,070 er þetta kunnuglegt útlit URL. 429 00:24:09,070 --> 00:24:14,440 Og mun þá fá efni frá sem URL og þá hlaupa aðgerð á það. 430 00:24:14,440 --> 00:24:19,240 Svo ég sagði fara til api.lib.harvard / edu. 431 00:24:19,240 --> 00:24:20,060 Leita að kleinuhringir. 432 00:24:20,060 --> 00:24:21,300 Gefðu okkur 20 færslur. 433 00:24:21,300 --> 00:24:28,590 Og þá hlaupa þessa aðgerð, sem Ég hef valið, liggur það gögnin. 434 00:24:28,590 --> 00:24:34,430 Og gögn er JSON sem fékk aftur frá API. 435 00:24:34,430 --> 00:24:40,120 >> Og þá erum við að segja, innan sem gögn það er sviði kallast atriði. 436 00:24:40,120 --> 00:24:48,117 Og ef ég fer að kíkja aftur á einn af þessum árangri sem er hér, 437 00:24:48,117 --> 00:24:49,200 það er eitthvað called-- 438 00:24:49,200 --> 00:24:50,220 >> Jæja, það er kallað atriði. 439 00:24:50,220 --> 00:24:53,520 Svo sem kann að vera að. 440 00:24:53,520 --> 00:25:01,840 Og hvað það gerir er það fer í gegnum hvert atriði 441 00:25:01,840 --> 00:25:05,300 og kallar annar virka á hvern hlut. 442 00:25:05,300 --> 00:25:08,440 Og virka í grundvallaratriðum er að taka gildi 443 00:25:08,440 --> 00:25:12,010 hlutarins, sem er í meginatriðum einstaka færslur 444 00:25:12,010 --> 00:25:18,220 og gerir okkur kleift að draga út í titli, umfjöllun og tungumál. 445 00:25:18,220 --> 00:25:21,640 >> Svo við köllum aðgerð á hverjum atriði sem við fengum til baka frá API. 446 00:25:21,640 --> 00:25:25,397 Og ef þú tekur bara kíkja á þessu stykki hérna, 447 00:25:25,397 --> 00:25:27,230 hvað við erum að gera er við erum að búa til band, 448 00:25:27,230 --> 00:25:31,810 sem er fyrst og fremst sum HTML Markup um borð, með value.title, 449 00:25:31,810 --> 00:25:35,790 sem er titill hlut, value.coverage, 450 00:25:35,790 --> 00:25:36,790 sem er umfjöllun, - 451 00:25:36,790 --> 00:25:38,225 >> Og við erum að gera ávísun hér til að sjá hver er óskilgreindur 452 00:25:38,225 --> 00:25:40,570 og fela það ef það segir óskilgreindur, vegna þess að við erum í raun ekki áhuga 453 00:25:40,570 --> 00:25:41,600 í því. 454 00:25:41,600 --> 00:25:42,939 >> --and síðan tungumál. 455 00:25:42,939 --> 00:25:44,730 Og þá hvað við erum að gera er að auka við það 456 00:25:44,730 --> 00:25:48,510 að borðinu sem er greindust þessum streng hér. 457 00:25:48,510 --> 00:25:50,790 Og hvernig jQuery virkar hvað er þetta er að segja 458 00:25:50,790 --> 00:25:56,420 er útlit fyrir borð með hugmynd Niðurstöður og bæta þessum texta við það. 459 00:25:56,420 --> 00:25:59,380 Og þetta er borðið með hugmynd niðurstöður. 460 00:25:59,380 --> 00:26:04,998 Svo hvað þú endar með er þessari síðu hér. 461 00:26:04,998 --> 00:26:06,206 Og í því skyni að skoða source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 Jæja, the uppspretta er í raun ekki uppfærð þegar það gerðist. 464 00:26:13,810 --> 00:26:18,740 Svo er hægt að sjá í raun Niðurstöður töflunni hér þó. 465 00:26:18,740 --> 00:26:24,770 >> Svo er það bara einfalt dæmi um gera einfaldar fyrirspurn gegn API 466 00:26:24,770 --> 00:26:29,020 og birta upplýsingar á nokkrum öðrum mynda, og ekki að gera neitt of fínt. 467 00:26:29,020 --> 00:26:36,370 Nú, annað dæmi er eins og umsókn skrifuð af David Weinberger 468 00:26:36,370 --> 00:26:39,120 sem kynningu á þessu, sem meginatriðum sýnir þér 469 00:26:39,120 --> 00:26:44,620 hvernig þú getur blanda upp þær niðurstöður sem þú ert fá frá bókasafn ský API 470 00:26:44,620 --> 00:26:46,250 með, segja, Google Books. 471 00:26:46,250 --> 00:26:52,225 >> Og hugsun hér er að ég get keyra fyrirspurn gegn Google Books, 472 00:26:52,225 --> 00:26:56,060 fá heildartexta leita, fá niðurstöður aftur, finna út hver af þessum hlutum 473 00:26:56,060 --> 00:27:01,180 í raun fyrir hendi í Hollis, bókasafn kerfi, 474 00:27:01,180 --> 00:27:03,200 og þá gefa mér tengla aftur til þeirra liða. 475 00:27:03,200 --> 00:27:12,730 Svo ef ég er að leita að, það var dökk og óveðurskvöldi, I 476 00:27:12,730 --> 00:27:16,210 fá aftur fullt af niðurstöðum frá Google, og síðan einn vegna 477 00:27:16,210 --> 00:27:19,460 sem er A Wrinkle í Time. 478 00:27:19,460 --> 00:27:29,330 Og þetta eru tenglar á bækur sem eru fyrir hendi innan Harvard Gegnir. 479 00:27:29,330 --> 00:27:32,160 >> Svo ég held að benda hér er ekki svo mikið að það getur eða getur ekki 480 00:27:32,160 --> 00:27:34,118 vera leið sem þú vilt til að leita á bókasafn, 481 00:27:34,118 --> 00:27:38,310 en það er allt öðruvísi leiðin sem ekki var í boði fyrir þig 482 00:27:38,310 --> 00:27:42,884 áður, eins og þú hefðir enga leið til að gera Heildartexti leitar á bókum sem jafnvel 483 00:27:42,884 --> 00:27:44,550 voru hluti af Harvard Gegnir. 484 00:27:44,550 --> 00:27:46,870 Svo nú er þetta leið að þú getur gert það. 485 00:27:46,870 --> 00:27:51,930 Og þú getur birta þær í hvaða formi sem þú vilt. 486 00:27:51,930 --> 00:27:55,990 Svo er málið hér, í grundvallaratriðum, við erum að opna nýjar leiðir fyrir fólk 487 00:27:55,990 --> 00:27:59,080 að vinna með gögnin. 488 00:27:59,080 --> 00:28:07,925 >> Annað stykki af skýinu bókasafn er að það hjálpar Haldið sumir af the notkun gagna 489 00:28:07,925 --> 00:28:08,800 að bókasafnið hefur. 490 00:28:08,800 --> 00:28:12,630 Svo ef þú ferð á bókasafnið, og þú ert að leita að bókum, 491 00:28:12,630 --> 00:28:15,770 þú ert ekki endilega hafa í raun hugmynd um, 492 00:28:15,770 --> 00:28:19,080 fyrir öllum þeim atriðum í a einkum háð, hvað 493 00:28:19,080 --> 00:28:21,200 er fólk í samfélag, hvort sem það er 494 00:28:21,200 --> 00:28:24,890 skilgreind sem Harvard eða að land eða bekknum þínum, 495 00:28:24,890 --> 00:28:26,421 hvað hafa þeir fundið gagnlegur? 496 00:28:26,421 --> 00:28:28,920 Og safnsins raun tonn af upplýsingum um hvað 497 00:28:28,920 --> 00:28:32,999 er gagnlegur því ef mikið af fólki eru að skoða bók, 498 00:28:32,999 --> 00:28:34,040 það segir þér eitthvað. 499 00:28:34,040 --> 00:28:36,498 Það hlýtur að hafa verið einhver ástæða þeir vilja til að stöðva það út. 500 00:28:36,498 --> 00:28:38,270 A einhver fjöldi af fólk setja það á varasjóð. 501 00:28:38,270 --> 00:28:42,520 >> Ef það er á gjaldeyrisforða lista fyrir a einhver fjöldi flokka, sem segir þér eitthvað. 502 00:28:42,520 --> 00:28:45,960 Ef kennarar eru að skoða það út a einhver fjöldi og háskólastúdent eru ekki, 503 00:28:45,960 --> 00:28:47,200 sem segir mér eitthvað. 504 00:28:47,200 --> 00:28:49,280 Öfugt, sem einnig segir þér eitthvað. 505 00:28:49,280 --> 00:28:54,680 Svo það væri mjög áhugavert að setja þessar upplýsingar út there og láta 506 00:28:54,680 --> 00:28:59,969 fólk notar það til að hjálpa þeim að finna virkar innan bókasafns kerfi. 507 00:28:59,969 --> 00:29:02,260 The bakhlið þessa er það eru sumir alvarlegur næði 508 00:29:02,260 --> 00:29:07,854 áhyggjur af því að einn af algerlega tenets af safninu 509 00:29:07,854 --> 00:29:10,770 er að við erum ekki að fara að segja fólk hvað aðrir eru að lesa. 510 00:29:10,770 --> 00:29:17,360 Og jafnvel ef þú ert að segja þetta Bókin var köflóttur út fjórum sinnum 511 00:29:17,360 --> 00:29:20,070 í tiltekinn mánuð, sem hægt væri að nota 512 00:29:20,070 --> 00:29:25,252 að tengja aftur til a sérstaklega maður með de-nafnlausar gögnum 513 00:29:25,252 --> 00:29:26,710 og finna út hver köflóttur það út. 514 00:29:26,710 --> 00:29:30,792 Svo leið að við getum avoid-- 515 00:29:30,792 --> 00:29:33,750 Leiðin sem við getum reynt að vinna úr sumir merki frá öllum upplýsingum 516 00:29:33,750 --> 00:29:36,740 án þess að skerða næði áhyggjur hver er 517 00:29:36,740 --> 00:29:42,150 er í meginatriðum við skoðum 10 ára notkun gagna, - 518 00:29:42,150 --> 00:29:43,930 >> Svo það er á löngum tíma. 519 00:29:43,930 --> 00:29:50,639 >> --and segja, OK, við skulum sjá hvernig oft þetta verk var notuð, 520 00:29:50,639 --> 00:29:52,930 og hver á þessu tímabili tíma, og þá í rauninni 521 00:29:52,930 --> 00:29:56,300 gefa til baka númer, sem við köllum stafla skora, sem í grundvallaratriðum 522 00:29:56,300 --> 00:29:59,910 stendur fyrir hversu mikið það hefur verið notað. 523 00:29:59,910 --> 00:30:01,084 Og það number-- 524 00:30:01,084 --> 00:30:03,250 A einhver fjöldi af mismunandi útreikninga fara inn í þessi númer. 525 00:30:03,250 --> 00:30:05,150 --but það er mjög gróft mæling sem gefur þér 526 00:30:05,150 --> 00:30:11,300 einhverja hugmynd um hvernig samfélag getur meta að vinna. 527 00:30:11,300 --> 00:30:16,772 >> Og svo annað konar jafnvel meira fleshed út umsókn 528 00:30:16,772 --> 00:30:18,480 sem tekur kostur þetta er eitthvað 529 00:30:18,480 --> 00:30:24,000 heitir Stacklife, sem er í raun í boði í gegnum helstu Harvard 530 00:30:24,000 --> 00:30:24,880 Library vefgáttinni. 531 00:30:24,880 --> 00:30:26,700 Þannig að þú ferð að library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 Þú munt sjá fjölda mismunandi leiðir að leita á bókasafn. 533 00:30:29,360 --> 00:30:32,300 Og einn af þeim er kallaður Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> Og þetta er forrit sem skoðar innihald safnsins, 535 00:30:38,980 --> 00:30:43,490 en er algjörlega byggt ofan á þessum API. 536 00:30:43,490 --> 00:30:46,910 Þannig að það er engin sérstök efni að fara á bak við tjöldin. 537 00:30:46,910 --> 00:30:49,570 Það er enginn aðgangur að gögn sem þú þarft ekki. 538 00:30:49,570 --> 00:30:54,090 Það er með því að nota API til að veita þér með alveg mismunandi beit 539 00:30:54,090 --> 00:30:55,480 reynsla. 540 00:30:55,480 --> 00:30:58,570 >> Svo ef ég leita að Alice í Undralandi í þessu tilfelli, 541 00:30:58,570 --> 00:31:02,600 Ég fá niðurstöðu sem lítur út eins þetta, sem er nokkuð much-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> Það er mjög svipað öðrum leit þú gætir gert, nema í þessu tilfelli 544 00:31:10,870 --> 00:31:15,730 við erum röðun atriði með stackscore, sem gefur þér 545 00:31:15,730 --> 00:31:19,850 einhverja hugmynd um hvernig vinsæll þessum atriði voru innan samfélagsins. 546 00:31:19,850 --> 00:31:25,610 Og svo greinilega, Alice í Undralandi af Walt Disney er mjög vinsæll. 547 00:31:25,610 --> 00:31:36,570 En þú getur líka séð topp fjórum hér eru þær sem þú getur ekki actually-- 548 00:31:36,570 --> 00:31:39,220 >> Hlutir sem eru mjög notuð, en þú getur ekki strax 549 00:31:39,220 --> 00:31:41,240 tengjast Lísa í Undralandi. 550 00:31:41,240 --> 00:31:44,650 Svo gamall vinur okkar The Merktar Alice er hér. 551 00:31:44,650 --> 00:31:46,350 Svo ég get að líta á það. 552 00:31:46,350 --> 00:31:52,010 Og nú það sem ég er að leita á er í grundvallaratriðum a setja of-- 553 00:31:52,010 --> 00:31:53,760 Ég get Hafa merktar Alice hérna. 554 00:31:53,760 --> 00:31:56,700 Ég hef upplýsingar um það. 555 00:31:56,700 --> 00:32:00,230 Og ég hef líka stackscore af, í þessu tilfelli, 26. 556 00:32:00,230 --> 00:32:03,169 Og þetta segir mér svona u.þ.b. hvernig við komum til þessa stackscore, 557 00:32:03,169 --> 00:32:05,835 eins sem skoðaði það út, eins og hvernig Margir sinnum það var köflóttur út, 558 00:32:05,835 --> 00:32:08,440 eins kennara eða undergrads, hvernig mörg eintök safnsins, 559 00:32:08,440 --> 00:32:11,300 og svo framvegis og svo framvegis. 560 00:32:11,300 --> 00:32:16,460 >> Og þú getur líka, áhugavert nóg hér, skoða stafla nánast. 561 00:32:16,460 --> 00:32:19,550 Þannig að gögn hér, þetta sýnir þér að raða 562 00:32:19,550 --> 00:32:23,547 af a raunverulegur framsetning um hvað hillu gæti 563 00:32:23,547 --> 00:32:25,880 líta út eins og ef þú varst að taka allt eign safnsins 564 00:32:25,880 --> 00:32:28,940 og setja þá saman á einn óendanlega hillu. 565 00:32:28,940 --> 00:32:30,990 Og ágætur hlutur er að við can-- 566 00:32:30,990 --> 00:32:33,380 >> Fyrst af öllu, lýsigögn um þessar bækur 567 00:32:33,380 --> 00:32:35,627 oft segir þér þegar það var birt. 568 00:32:35,627 --> 00:32:37,085 Það segir þér hversu margar síður eru. 569 00:32:37,085 --> 00:32:38,459 Það gæti sagt þér mál. 570 00:32:38,459 --> 00:32:42,930 Svo er hægt að sjá að er fram hér hvað varðar stærð bókanna. 571 00:32:42,930 --> 00:32:46,740 >> Og þá getum við notað stafla skora til að varpa ljósi 572 00:32:46,740 --> 00:32:49,170 bækur sem hafa hærri Stack skora. 573 00:32:49,170 --> 00:32:54,930 Svo ef það er dekkri, þá þýðir það að, væntanlega er það notað oftar. 574 00:32:54,930 --> 00:32:57,040 Svo í þessu tilfelli, ég er fara að giska á að þetta 575 00:32:57,040 --> 00:33:03,226 er útgáfa af Alice í Undralandi sem er mjög algengt og flestir 576 00:33:03,226 --> 00:33:05,100 nálgast, bókasafn hefur mest afrit af. 577 00:33:05,100 --> 00:33:06,975 Svo ef þú ert að leita fyrir Lísa í Undralandi, 578 00:33:06,975 --> 00:33:10,220 þetta gæti verið góður staður til að byrja. 579 00:33:10,220 --> 00:33:13,500 >> Og þá er hér er einnig hægt að tengja út að segja, Amazon til að kaupa bókina, 580 00:33:13,500 --> 00:33:15,182 og svo framvegis og svo framvegis. 581 00:33:15,182 --> 00:33:17,140 Aðalatriðið hér, aftur, er ekki svo mikið að þetta 582 00:33:17,140 --> 00:33:25,030 er besta leiðin til að fletta á bókasafnið eða rétt tól fyrir hvert tilefni. 583 00:33:25,030 --> 00:33:28,400 En það er önnur leið til að gera það. 584 00:33:28,400 --> 00:33:31,359 Og með því að gera gögn í boði í gegnum API, sem 585 00:33:31,359 --> 00:33:34,650 er úr mjög einföldum kubbar, sem leyfir þér að leita að efni, 586 00:33:34,650 --> 00:33:39,420 þú getur byggt eitthvað eins og þetta sem getur 587 00:33:39,420 --> 00:33:41,520 verið ótrúlega dýrmæt sumir fólk. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> Svo er þessi tegund af eins mikið og ég vil að segja í raun um hvað API er 590 00:33:51,860 --> 00:33:56,070 og hvað það sýnir, að það er allt fullt af efni á bak við tjöldin, sem 591 00:33:56,070 --> 00:33:59,480 Ég ætla bara að fara að minnast á í stutta stund bara vegna þess að það kemur svona á þetta 592 00:33:59,480 --> 00:34:03,720 frá allt öðru sjónarhorni í Skilmálar hvernig gerir eitthvað eins og þetta 593 00:34:03,720 --> 00:34:04,580 fá setja í stað? 594 00:34:04,580 --> 00:34:10,820 >> Svo er API staðall tengi öllum af þessu efni. 595 00:34:10,820 --> 00:34:13,820 En til að fá það þarna, fyrsta sem við þurftum að gera 596 00:34:13,820 --> 00:34:17,260 var að draga saman upplýsingar af bókum og myndum 597 00:34:17,260 --> 00:34:21,580 og niðurstöðunnar hjálpartæki, söfnun skjal frá ýmsum Harvard kerfi. 598 00:34:21,580 --> 00:34:23,929 Aleph, VIA og OASIS eru nöfn kerfi. 599 00:34:23,929 --> 00:34:28,820 Og þeir fara í raun inn í a leiðsla, vinnsla leiðsla. 600 00:34:28,820 --> 00:34:33,230 >> Svo fyrst af öllu, fá við útflutning skrár frá öllum þessum kerfum. 601 00:34:33,230 --> 00:34:35,130 Við hættu þá upp í einstökum liðum. 602 00:34:35,130 --> 00:34:39,360 Þannig að við hafa a skrá, sem er gígabæti, sem hefur milljón færslur í það. 603 00:34:39,360 --> 00:34:42,290 Þannig að við skipta því niður í einstökum liðum. 604 00:34:42,290 --> 00:34:45,374 Þá, fyrir hvert atriði, breytum við það í mods, því sumir af þessum 605 00:34:45,374 --> 00:34:47,040 eru innfæddur maður mods, sumir af þeim ekki. 606 00:34:47,040 --> 00:34:49,204 Svo við fáum þá alla til vera í sama formi. 607 00:34:49,204 --> 00:34:51,120 Þá eru ýmsir auðgun skref, þar 608 00:34:51,120 --> 00:34:55,969 við bætum meiri upplýsingar um gögnin en var í boði í safninu. 609 00:34:55,969 --> 00:34:59,750 Þannig að við þurfum að bæta við, fyrst af öllu við höfum það bókasöfn halda það. 610 00:34:59,750 --> 00:35:02,250 Við förum í gegnum skref reikna stackscore. 611 00:35:02,250 --> 00:35:07,112 Við förum í gegnum aðra skref bæta við fleiri lýsigögnum í skilmálar 612 00:35:07,112 --> 00:35:10,730 af hvaða söfn fólks gæti hafa bætt this-- 613 00:35:10,730 --> 00:35:12,532 >> Fólk er að búa söfn af hlutum. 614 00:35:12,532 --> 00:35:13,990 Hvað söfn er það tilheyra? 615 00:35:13,990 --> 00:35:17,220 Hvernig hefur fólk tagged þetta efni í fortíðinni? 616 00:35:17,220 --> 00:35:20,750 Síðan sem þú sía út, og að takmarka færslur vegna þess, eins og ég nefndi, 617 00:35:20,750 --> 00:35:24,120 það er sumir færslur sem vegna ástæður höfundarrétt, getum við ekki birt. 618 00:35:24,120 --> 00:35:26,700 Og þá erum við að hlaða þeim í eitthvað sem kallast 619 00:35:26,700 --> 00:35:31,680 Solr, sem er ekki misspelling, en er nafn af a stykki af hugbúnaður 620 00:35:31,680 --> 00:35:35,710 sem gerir leit flokkun, sem rekur alla leit á bak API. 621 00:35:35,710 --> 00:35:40,110 Og þá verður það í boði til API, og fólk getur notað það. 622 00:35:40,110 --> 00:35:44,640 >> Svo er þetta eins og a sæmilega einfalt ferli. 623 00:35:44,640 --> 00:35:47,230 Einn af the áhugaverður hlutir um það er 624 00:35:47,230 --> 00:35:50,990 að við erum að fást með 13 milljónir færslur 625 00:35:50,990 --> 00:35:53,820 og við erum að fara að vera að takast eða meira. 626 00:35:53,820 --> 00:36:01,260 Og við viljum vera fær um að takast þessar í tiltölulega hröðum hátt. 627 00:36:01,260 --> 00:36:03,630 Það tekur langan tíma að vinna 13 milljónir færslur. 628 00:36:03,630 --> 00:36:09,529 >> Svo hvernig þetta leiðsla er sett upp er að þú can-- 629 00:36:09,529 --> 00:36:12,070 Ég giska á kostur af the leiðsla, vandamál sem við erum 630 00:36:12,070 --> 00:36:15,580 að reyna að leysa hér, er að Allar umbreytingarnar, allir 631 00:36:15,580 --> 00:36:18,729 Þessi skref í þessu leiðsla eru aðskilja. 632 00:36:18,729 --> 00:36:19,645 Það er engin ánauðar. 633 00:36:19,645 --> 00:36:22,146 Ef þú ert að vinna skrá yfir einni bók, 634 00:36:22,146 --> 00:36:24,270 það er engin fíkn í að á milli annarri bók. 635 00:36:24,270 --> 00:36:27,760 >> Svo er það sem við getum gert í grundvallaratriðum, í hverju skrefi í leiðslum, 636 00:36:27,760 --> 00:36:30,470 við setjum það í biðröð í skýinu. 637 00:36:30,470 --> 00:36:32,250 Ég varð að vera á Amazon Web Services. 638 00:36:32,250 --> 00:36:35,140 Þannig að það er a listi af, segja, 10.000 hlutir sem 639 00:36:35,140 --> 00:36:38,100 þurfa að vera eðlileg og breytt í Mods sniði. 640 00:36:38,100 --> 00:36:41,620 Og við snúast upp eins margar netþjóna eins og við viljum, kannski 10 netþjónum. 641 00:36:41,620 --> 00:36:44,860 Og hver af þessum netþjónum bara þar sitr, lítur í þeirri biðröð, 642 00:36:44,860 --> 00:36:46,730 sér að það er eitt sem þarf að að vinna, draga það burt biðröð, 643 00:36:46,730 --> 00:36:48,740 ferli þess og prik það á næsta biðröð. 644 00:36:48,740 --> 00:36:54,200 >> Og svo hvað það gerir okkur að gera er að sækja um, í raun, 645 00:36:54,200 --> 00:36:58,110 eins mikið vélbúnaður eins og við viljum að þessu vandamál í mjög stuttan tíma 646 00:36:58,110 --> 00:37:02,970 að vinna úr gögnum eins fljótt og mögulegt, sem er eitthvað sem aðeins 647 00:37:02,970 --> 00:37:08,220 nú í heimi ský computing Við getum ákvæði netþjónum raun 648 00:37:08,220 --> 00:37:09,890 samstundis, er það gagnlegt. 649 00:37:09,890 --> 00:37:12,260 Þannig að við þurfum ekki að hafa risastór framreiðslumaður lota í kring 650 00:37:12,260 --> 00:37:16,700 allan tímann að gera vinnslu sem gæti gerst bara einu sinni í viku. 651 00:37:16,700 --> 00:37:21,440 >> Svo er að mestu leyti það. 652 00:37:21,440 --> 00:37:27,590 Það er gögn í boði fyrir Library Cloud Item API 653 00:37:27,590 --> 00:37:31,960 á þessari vefslóð, sem mun vera laus seinna. 654 00:37:31,960 --> 00:37:36,730 Og vinsamlegast fara að taka a líta á það til að sjá hvort það er eitthvað, 655 00:37:36,730 --> 00:37:37,579 þú hefur einhverjar hugmyndir. 656 00:37:37,579 --> 00:37:38,120 Leika með það. 657 00:37:38,120 --> 00:37:38,830 Bjáni í kring. 658 00:37:38,830 --> 00:37:42,800 Og vonandi er hægt að koma upp með eitthvað miklu. 659 00:37:42,800 --> 00:37:44,740 Þakka þér. 660 00:37:44,740 --> 00:37:45,899