1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 JEFFREY Licht: Hi there. 3 00:00:12,370 --> 00:00:13,550 Ma olen Jeffrey Licht. 4 00:00:13,550 --> 00:00:17,890 Ja ma olen siin, et teile rääkida Harvard raamatukogu ja hoone homset 5 00:00:17,890 --> 00:00:20,870 raamatukogu täna, ma arvan. 6 00:00:20,870 --> 00:00:23,040 Nii taustal siin pigi käesoleva istungi 7 00:00:23,040 --> 00:00:26,930 sisuliselt, et on palju bibliograafiliste andmete 8 00:00:26,930 --> 00:00:28,400 saadaval Harvard raamatukogud. 9 00:00:28,400 --> 00:00:33,434 Ja seal on võimalus, läbi mõned tööriistad 10 00:00:33,434 --> 00:00:36,350 ja projekti, mis on välja töötatud, saada juurdepääs info 11 00:00:36,350 --> 00:00:42,430 ja seda kohtadesse, Harvard Raamatukogu ei tee just nüüd, 12 00:00:42,430 --> 00:00:45,460 teha uusi asju koos sellega, katse ja mängida seda. 13 00:00:45,460 --> 00:00:52,413 >> Nii sisenevad see on API nimetatakse Harvard Raamatukogu Cloud, mis 14 00:00:52,413 --> 00:00:57,650 on avatud metaandmete server, mis räägin nüüd. 15 00:00:57,650 --> 00:01:02,595 Nii on taust, mis on palju kraami Harvard raamatukogu. 16 00:01:02,595 --> 00:01:07,150 Meil on üle 13 miljoni bibliograafilise arvestust miljoneid pilte 17 00:01:07,150 --> 00:01:11,090 ja tuhandeid leida abivahendeid, mis on sisuliselt kirjeldavad dokumendid 18 00:01:11,090 --> 00:01:15,500 kogud, öelda, mida on neid, karbid paberid 19 00:01:15,500 --> 00:01:21,080 ja nii edasi, mis esindavad üle miljonit individuaalseid dokumente. 20 00:01:21,080 --> 00:01:24,290 Ja seal on ka palju teavet, mis on raamatukogus 21 00:01:24,290 --> 00:01:28,180 kuidas sisu kasutatakse, et võib huvi inimestele 22 00:01:28,180 --> 00:01:32,400 kes võiksid tööd teha. 23 00:01:32,400 --> 00:01:36,150 >> Nii kogu teave Raamatukogus on metaandmed. 24 00:01:36,150 --> 00:01:39,500 Nii metaandmed on andmed andmete kohta. 25 00:01:39,500 --> 00:01:42,070 Nii et kui me räägime teavet, mis on 26 00:01:42,070 --> 00:01:44,890 kaudu kättesaadavaks raamatukogu pilv, mis on saadaval, 27 00:01:44,890 --> 00:01:47,760 see ei ole tingimata tegelik dokumente 28 00:01:47,760 --> 00:01:53,060 ise, mitte tingimata täielikult teksti raamatuid või täielik pilte 29 00:01:53,060 --> 00:01:54,890 kuigi tegelikult võib juhtuda. 30 00:01:54,890 --> 00:01:57,550 Aga see on tõesti informatsioon andmeid. 31 00:01:57,550 --> 00:02:00,909 >> Nii et sa ei mõtle kataloogimise informatsiooni, telefoninumbrid, teemad, 32 00:02:00,909 --> 00:02:02,700 mitu koopiat Raamat on, mida 33 00:02:02,700 --> 00:02:06,380 on väljaandeid, millised on formaate, autorid, ja nii edasi. 34 00:02:06,380 --> 00:02:12,250 Nii et palju teavet teabe kogumist, et 35 00:02:12,250 --> 00:02:14,400 iseenesest on selline olemuselt kasulik. 36 00:02:14,400 --> 00:02:19,230 Ja kuigi kui sa oled teeme põhjalikke uuringuid, 37 00:02:19,230 --> 00:02:25,160 sa ilmselt tahad saada tegelikku piirduda ja vaadata andmeid, 38 00:02:25,160 --> 00:02:30,140 metaandmed on kasulik nii nii analüüsides corpus tervikuna 39 00:02:30,140 --> 00:02:33,870 nagu mida asja on kogumisel. 40 00:02:33,870 --> 00:02:35,520 Kuidas need on seotud? 41 00:02:35,520 --> 00:02:39,482 See aitab teil tõesti leida muud kraami, mis on tõesti peamine eesmärk seda. 42 00:02:39,482 --> 00:02:41,190 Koht metaandmed ja Kataloog 43 00:02:41,190 --> 00:02:43,230 on aidata teil leida kõik teavet, mis on 44 00:02:43,230 --> 00:02:46,590 saadaval kogudest. 45 00:02:46,590 --> 00:02:53,690 >> Nii on see näiteks metaandmete raamatu Harvard Library. 46 00:02:53,690 --> 00:02:56,370 Nii et see on olemas. 47 00:02:56,370 --> 00:02:59,850 Ja näed see on tegelikult mõõdukalt keeruline. 48 00:02:59,850 --> 00:03:04,610 Ja osa väärtus metaandmed jooksul Harvard Raamatukogu süsteemi 49 00:03:04,610 --> 00:03:09,320 on see, et see on olnud omamoodi on üles ehitatud catalogers 50 00:03:09,320 --> 00:03:12,720 ja kokku pannud taotlevate isikute palju teadmisi ja oskusi 51 00:03:12,720 --> 00:03:20,030 ja mõtlesin, et see ajas mis on palju raha. 52 00:03:20,030 --> 00:03:25,450 >> Nii et kui te võtate pilk see rekord Annoteeritud Alice, saate teada, 53 00:03:25,450 --> 00:03:32,590 sul title, kes selle kirjutas, Autor ja kõik erinevatel teemadel 54 00:03:32,590 --> 00:03:35,380 kus inimesed on katalogiseeritud see. 55 00:03:35,380 --> 00:03:40,110 Ja näed seal ka sisse Lisaks palju häid info 56 00:03:40,110 --> 00:03:42,852 siin, seal on mõned dubleerimist. 57 00:03:42,852 --> 00:03:45,560 Seal on palju keerukust, mis on peegeldumas metaandmed 58 00:03:45,560 --> 00:03:46,300 mis sul on. 59 00:03:46,300 --> 00:03:50,320 >> Nii et üks pealkiri see raamat on Alice Imedemaal. 60 00:03:50,320 --> 00:03:53,880 Nii et see on annoteeritud versioon sellest raamatust. 61 00:03:53,880 --> 00:03:56,380 Aga see on ka nn annoteeritud Alice, Alice seiklused 62 00:03:56,380 --> 00:03:58,570 in Wonderland, sest see on midagi, mis 63 00:03:58,570 --> 00:04:00,430 Martin Gardner kirjutas ja selgitustega raamat. 64 00:04:00,430 --> 00:04:03,369 Ja seal on palju suurepäraseid teavet umbes loogika mõistatusi ja asjad 65 00:04:03,369 --> 00:04:05,410 jooksul Alice, et teil ilmselt ei teadnud. 66 00:04:05,410 --> 00:04:07,000 Nii et sa peaksid minema seda lugeda. 67 00:04:07,000 --> 00:04:11,940 >> Aga näed seal palju detail siin 68 00:04:11,940 --> 00:04:15,340 sealhulgas identifikaatoreid, kui see loodi, kust see tuli, 69 00:04:15,340 --> 00:04:17,420 nii Harvard süsteemi, ja nii edasi. 70 00:04:17,420 --> 00:04:20,350 Nii et see on valimi tüüpi metaandmed 71 00:04:20,350 --> 00:04:24,340 et võite näha raamat Harvard Raamatukogu kollektsioon. 72 00:04:24,340 --> 00:04:26,680 >> See on hoopis midagi muud. 73 00:04:26,680 --> 00:04:32,610 Seega on süsteem nimega VIA Harvard, mis põhimõtteliselt 74 00:04:32,610 --> 00:04:39,990 on kataloogimise pildid ja kunsti- ja visuaalse asju kogu Harvard, 75 00:04:39,990 --> 00:04:44,010 ja lisades mõned metaandmed neile, liigitades need, 76 00:04:44,010 --> 00:04:49,200 ja mõningatel juhtudel, pakkudes pisipildi 77 00:04:49,200 --> 00:04:51,250 et saate vaadata, kui te seda soovite. 78 00:04:51,250 --> 00:04:54,240 >> Seega on see näide metaandmed, et teil on plaadi 79 00:04:54,240 --> 00:04:57,840 alates eeldatavalt Alice in Wonderland. 80 00:04:57,840 --> 00:05:00,499 Ja näed seal vähem metaandmete siin. 81 00:05:00,499 --> 00:05:02,040 See on lihtsalt teistsugune objekti. 82 00:05:02,040 --> 00:05:03,425 Ja nii seal on vähem informatsiooni. 83 00:05:03,425 --> 00:05:07,790 >> Sa enamasti asjaolu, et kõne number sisuliselt, kes selle loonud, - 84 00:05:07,790 --> 00:05:10,410 >> Me ei tea, millal see loodi. 85 00:05:10,410 --> 00:05:13,320 >> --and pealkiri. 86 00:05:13,320 --> 00:05:14,300 >> Teine näide. 87 00:05:14,300 --> 00:05:16,380 See on järeldus abi. 88 00:05:16,380 --> 00:05:19,030 Nii et kogumise Lewis Carroll paberid Harvardi. 89 00:05:19,030 --> 00:05:23,601 Nii et see kirjeldab on selles kollektsioon. 90 00:05:23,601 --> 00:05:26,100 Nii et keegi on läbi käinud ja vaatasin läbi kõik kastid 91 00:05:26,100 --> 00:05:32,220 ja kataloogimine seda, sest mõned taustal, kirjalik kokkuvõte, mis siin on. 92 00:05:32,220 --> 00:05:35,290 Ja kui sa olid vaatama veelgi selles, see 93 00:05:35,290 --> 00:05:39,620 läheb lehti ja lehti ja lehti, kuid ütlen teile 94 00:05:39,620 --> 00:05:41,860 mida tähed ja mida pärineb, mida karbid 95 00:05:41,860 --> 00:05:44,289 olemas kogu kollektsioon. 96 00:05:44,289 --> 00:05:46,330 Aga see on midagi et kui sa oled Harvardi 97 00:05:46,330 --> 00:05:50,720 võid minna ja tegelikult füüsiliselt otsima üles ning eeldatavasti heita pilk. 98 00:05:50,720 --> 00:05:53,440 >> Nii et see on kõik suurepärane. 99 00:05:53,440 --> 00:05:54,450 See metaandmed on kasulik. 100 00:05:54,450 --> 00:05:56,327 See on Harvard Raamatukogu süsteemi. 101 00:05:56,327 --> 00:05:58,910 On olemas vahendid online, kus võib minna ja võtta pilk see, 102 00:05:58,910 --> 00:05:59,993 ja seda näen, ja otsida seda. 103 00:05:59,993 --> 00:06:02,810 Ja sa võid viil seda ja täringud see on palju erinevaid võimalusi. 104 00:06:02,810 --> 00:06:06,920 >> Aga see on tõesti ainult siis, kui sa oled inimene istudes 105 00:06:06,920 --> 00:06:12,600 Teie veebilehitseja või midagi või telefoni ja navigeerimise läbi. 106 00:06:12,600 --> 00:06:16,730 See ei ole tegelikult olemas mis tahes kasutatavad mood 107 00:06:16,730 --> 00:06:19,520 teiste süsteemide või teiste arvutite kasutada, 108 00:06:19,520 --> 00:06:21,500 mitte süsteemide Harvard Raamatukogu, 109 00:06:21,500 --> 00:06:24,890 kuid süsteemide välismaailmaga, lihtsalt teised inimesed üldiselt. 110 00:06:24,890 --> 00:06:30,210 Seega on küsimus selles, kuidas me saame teha see kättesaadavaks arvutid 111 00:06:30,210 --> 00:06:33,560 nii et me saame teha huvitavamaks värk sellega kui lihtsalt 112 00:06:33,560 --> 00:06:36,550 sirvimise seda ise? 113 00:06:36,550 --> 00:06:39,766 >> Miks sa tahad seda teha? 114 00:06:39,766 --> 00:06:41,140 Seal on palju võimalusi. 115 00:06:41,140 --> 00:06:43,980 Üks on siis võiks ehitada täiesti teistmoodi sirvimine 116 00:06:43,980 --> 00:06:46,962 sisu on saadaval läbi Harvard Raamatukogud. 117 00:06:46,962 --> 00:06:48,670 Ma näitan sulle ühte hiljem kutsuti Stacklife, 118 00:06:48,670 --> 00:06:52,440 mis on täiesti erinevad võtta otsivad sisu. 119 00:06:52,440 --> 00:06:54,560 >> Sa võid ehitada soovitus mootor. 120 00:06:54,560 --> 00:06:57,955 Nii Harvard Raamatukogu ei ole äri, öeldes, et sulle meeldib see raamat. 121 00:06:57,955 --> 00:07:01,080 Siis mine heita pilk nende 17 muud raamatuid, mis sa võiksid olla huvitatud 122 00:07:01,080 --> 00:07:03,200 või on need 18 muud pildid. 123 00:07:03,200 --> 00:07:06,040 Aga kindlasti võiks olla väärtuslik omadus. 124 00:07:06,040 --> 00:07:09,272 Ja arvestades metaandmed, võib ta olema võimalik panna, et üheskoos. 125 00:07:09,272 --> 00:07:11,980 Sa võid olla erinevad vajadused osas otsivad sisu, 126 00:07:11,980 --> 00:07:16,200 nagu võibolla vaatamata vahendid, mis Saadaval on, et raamatukogu teeb 127 00:07:16,200 --> 00:07:18,450 saadaval, võite otsida teistmoodi 128 00:07:18,450 --> 00:07:21,847 või optimeerida konkreetse kasutuse puhul, mis võibolla on väga spetsiifiline. 129 00:07:21,847 --> 00:07:23,930 Võib-olla on vaid mõned inimesi maailmas, kes 130 00:07:23,930 --> 00:07:25,846 soovite otsida sisu Sel viisil, kuid see 131 00:07:25,846 --> 00:07:28,985 Oleks tore, kui me võiks lasta neil seda teha. 132 00:07:28,985 --> 00:07:30,860 Seal on palju analytics vaid kuidas inimesed 133 00:07:30,860 --> 00:07:33,860 kasutada sisu, mis oleks tõesti huvitav teada, teada 134 00:07:33,860 --> 00:07:37,280 Mis raamatud on kasutatud, mida ei ole, ja nii edasi. 135 00:07:37,280 --> 00:07:41,670 Ja siis on palju võimalus ühendada 136 00:07:41,670 --> 00:07:45,210 muud teavet see on seal veebis. 137 00:07:45,210 --> 00:07:46,880 Nii et me have-- 138 00:07:46,880 --> 00:07:50,260 >> Näiteks NPR on raamat läbi segment, 139 00:07:50,260 --> 00:07:53,090 kus nad küsitleda autorite raamatutest. 140 00:07:53,090 --> 00:07:56,837 Ja nii see oleks tore, kui sa olid soojaks raamat Harvard 141 00:07:56,837 --> 00:07:59,670 Raamatukogu ja te ütlete, OK, seal on olnud intervjuu autor. 142 00:07:59,670 --> 00:08:00,878 Lähme vaatame seda. 143 00:08:00,878 --> 00:08:05,461 Või seal Wikipedia lehele, kui autoriteetne, teaduslikud viide 144 00:08:05,461 --> 00:08:07,710 umbes see raamat, et sa Võiksid võtta pilk. 145 00:08:07,710 --> 00:08:12,600 >> On tüüpi allikatest hajutatud web. 146 00:08:12,600 --> 00:08:16,555 Ja nende koondamiseks võiks olla väga kasulik 147 00:08:16,555 --> 00:08:18,930 keegi vaadates sisu, otsin midagi. 148 00:08:18,930 --> 00:08:20,180 Aga see ei ole ka selline asi, mida tahaks 149 00:08:20,180 --> 00:08:23,205 tahad raamatukogu vastutab läheb alla ja jahi ette 150 00:08:23,205 --> 00:08:25,455 kõik need erinevatest allikatest ja kõrvaldamine neid koos 151 00:08:25,455 --> 00:08:28,920 sest nad on pidevas muutumises. 152 00:08:28,920 --> 00:08:33,570 Ja mida nad arvavad on oluline mai ei ole, mida sa arvad on oluline. 153 00:08:33,570 --> 00:08:36,929 >> Ja veelgi enam, põhiliselt seal palju asju me ei ole mõelnud veel. 154 00:08:36,929 --> 00:08:42,222 Nii et kui me saame avada selle üles rohkem inimesed lisaks pool tosinat või nii, 155 00:08:42,222 --> 00:08:45,174 kes otsivad seda regulaarselt ei mõtle ideed 156 00:08:45,174 --> 00:08:47,340 ja masseerida andmeid ning teha seda, mida nad tahavad seda. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> Nii et me tahame teha seda andmed, mis on maailmas. 159 00:08:54,045 --> 00:08:55,670 Noh, seal on paar komplikatsioone. 160 00:08:55,670 --> 00:08:58,540 Üks on see, et metaandmed on erinevad süsteemid. 161 00:08:58,540 --> 00:09:01,110 See on erinevates vormides. 162 00:09:01,110 --> 00:09:04,719 Nii et mõned normaliseerumine mis peab juhtuma, 163 00:09:04,719 --> 00:09:08,010 mis normaliseerimine on protsess tuues asju erinevates formaatides 164 00:09:08,010 --> 00:09:12,940 ja kaardistamisel ühtses vormis nii et väljad vastakuti. 165 00:09:12,940 --> 00:09:15,160 >> Leidub autoriõigusega seatud piirangud. 166 00:09:15,160 --> 00:09:21,010 Kummalisel kombel ei kataloogi kirje umbes raamatu vastutab autoriõigusega. 167 00:09:21,010 --> 00:09:24,060 Nii et kuigi see on lihtsalt saadud informatsiooni raamat, 168 00:09:24,060 --> 00:09:25,330 see on copyrightable. 169 00:09:25,330 --> 00:09:28,400 Ja olenevalt sellest, kes tegelikult loodud metaandmete, 170 00:09:28,400 --> 00:09:32,175 võib olla piiratud, kes võib levitada seda, mis on sarnane mina-- 171 00:09:32,175 --> 00:09:33,402 >> Ma ei tea. 172 00:09:33,402 --> 00:09:36,110 See võib olla või mitte olla sarnane olukorra laulusõnu 173 00:09:36,110 --> 00:09:36,610 näiteks. 174 00:09:36,610 --> 00:09:38,560 Nii et me kõik teame, kuidas see pannid välja. 175 00:09:38,560 --> 00:09:40,450 Nii et sa pead saada umbes selles küsimuses. 176 00:09:40,450 --> 00:09:44,910 >> Ja siis veel üks tükk on et seal on palju andmeid. 177 00:09:44,910 --> 00:09:52,420 Nii et kui ma kedagi, kes tahab töötada andmetega või on lahe idee, 178 00:09:52,420 --> 00:09:55,350 tegelevad 14000000 arvestust oma sülearvuti 179 00:09:55,350 --> 00:09:57,487 võib olla problemaatiline ja raske toime tulla. 180 00:09:57,487 --> 00:09:59,320 Nii et me tahame vähendada inimestevahelised barjäärid 181 00:09:59,320 --> 00:10:02,130 saaks töötada andmeid. 182 00:10:02,130 --> 00:10:07,880 >> Nii lähenemisviisi, mis loodetavasti aadressid kõik need probleemid on kahest osast. 183 00:10:07,880 --> 00:10:11,770 Üks ehitab platvormi, mis võtab andmeid kõigi nende erinevate allikate 184 00:10:11,770 --> 00:10:14,350 ja raskendab see, normaliseerib, rikastab seda ja teeb 185 00:10:14,350 --> 00:10:16,650 kättesaadavaks ühes kohas. 186 00:10:16,650 --> 00:10:20,950 Ja ta teeb selle kättesaadavaks kaudu avaliku API, et inimesed saavad helistada. 187 00:10:20,950 --> 00:10:24,430 >> Nii API on taotlemine Programming Interface. 188 00:10:24,430 --> 00:10:28,930 Ja siis põhimõtteliselt viitab tulemusnäitaja, et süsteemi või tehnoloogia 189 00:10:28,930 --> 00:10:31,720 võib helistada ja saada andmeid tagasi struktureeritud kujul viisil 190 00:10:31,720 --> 00:10:32,900 et seda saab kasutada. 191 00:10:32,900 --> 00:10:36,060 Nii see ei ole sõltuv minekuks veebilehel 192 00:10:36,060 --> 00:10:37,970 ja kraapimine andmeid off seda näiteks. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> Nii et see on kodulehekülg Raamatukogu Cloud Punkt API, 195 00:10:45,010 --> 00:10:47,220 mis on sisuliselt oma versioon kaks. 196 00:10:47,220 --> 00:10:50,130 Nii et see on teine ​​esitus üritavad teha kõik nende andmete 197 00:10:50,130 --> 00:10:53,280 kättesaadavaks kogu maailmas. 198 00:10:53,280 --> 00:10:59,560 Nii et see on http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 Ja just jaotada see natuke, mida see tähendab 200 00:11:03,830 --> 00:11:06,115 on, et see on versioon kaks API. 201 00:11:06,115 --> 00:11:08,490 Seal versiooni üks, mis Ma ei hakka rääkima. 202 00:11:08,490 --> 00:11:09,750 Aga seal on versioon ühest. 203 00:11:09,750 --> 00:11:14,740 >> Ja kui te helistate seda API, siis saavad punkte. 204 00:11:14,740 --> 00:11:20,640 Ja osa idee API on API on leping. 205 00:11:20,640 --> 00:11:23,440 See on midagi, mis on ei muutu. 206 00:11:23,440 --> 00:11:24,850 Nii näiteks, - 207 00:11:24,850 --> 00:11:27,410 >> Ja põhjus on see, et kui ma ehitada mingi süsteem, mis 208 00:11:27,410 --> 00:11:33,210 kavatsevad neid tooteid kasutada raamatukogu pilv API näidata raamatuid või aidata inimestel leida 209 00:11:33,210 --> 00:11:36,190 teavet ainulaadset võimalust, mida me ei taha juhtuda 210 00:11:36,190 --> 00:11:38,940 on meil minna muuta, kuidas et API töötab, ja äkki 211 00:11:38,940 --> 00:11:41,340 kõik puruneb lõpptarbija poolt. 212 00:11:41,340 --> 00:11:46,710 Nii osa, kui sa üritad API kättesaadavaks kogu maailmas, see on 213 00:11:46,710 --> 00:11:49,396 Hea tava panna versiooni number see, et inimesed 214 00:11:49,396 --> 00:11:51,020 tea, mis versioon nad tegelevad. 215 00:11:51,020 --> 00:11:54,300 >> Nii et kui me otsustame me leida parem viis ning teha see teave kättesaadavaks, 216 00:11:54,300 --> 00:11:57,295 me võiksime muuta, et helistada, et versioon kolm. 217 00:11:57,295 --> 00:11:59,920 Nii et igaüks, kes on endiselt kasutades versioon kaks, et ikka töötab. 218 00:11:59,920 --> 00:12:03,490 Aga versiooni kolmekesi kõik uued asjad. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> Seega on see API, kuid see tegelikult näeb välja nagu URL. 221 00:12:09,210 --> 00:12:11,680 Ja mis siis see on näide on see, mis 222 00:12:11,680 --> 00:12:16,615 nimetatakse ülejäänud API, mis on saadaval üle lihtsalt regulaarne internetiühendust. 223 00:12:16,615 --> 00:12:19,680 Ja tegelikult võite minna brauseris. 224 00:12:19,680 --> 00:12:28,550 >> Nii et siin ma olen lihtsalt avas Firefox ja läinud api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 Ja nii ma saan siin põhimõtteliselt esilehele 226 00:12:31,560 --> 00:12:34,740 Tulemuste kogu kogum objekte, mis meil on. 227 00:12:34,740 --> 00:12:37,460 Ja see on siin XML-vormingus. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 Ja see on ka olnud prettified Firefox. 230 00:12:42,210 --> 00:12:45,850 See tegelikult ei ole kõik need natuke laiendada ja tellija 231 00:12:45,850 --> 00:12:47,880 doohickeys siin. 232 00:12:47,880 --> 00:12:52,520 See on omamoodi kenamaks versioon viis seda vaadata. 233 00:12:52,520 --> 00:12:57,040 >> Aga mida see ütleb meile on Olen palunud, et esemed. 234 00:12:57,040 --> 00:13:03,120 Seega on 13289475 esemeid. 235 00:13:03,120 --> 00:13:06,150 Ja ma vaatan kõigepealt 10, algusega kell asendis null 236 00:13:06,150 --> 00:13:09,760 sest infotehnoloogia me alati alustada nullist. 237 00:13:09,760 --> 00:13:15,150 Ja mida ma pean siin, kui ma lihtsalt kokku variseda Selle, näete mul 10 objekti. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> Ja kui ma võtan pilk kirje suudan näha, et mul informatsiooni. 240 00:13:25,210 --> 00:13:27,400 Ja see on, mida nimetatakse MODS kujul. 241 00:13:27,400 --> 00:13:30,860 Ja nii ma lähen üle minna tagasi siin korraks. 242 00:13:30,860 --> 00:13:33,750 OK. 243 00:13:33,750 --> 00:13:37,447 >> Nii saab otsida midagi spetsiifiline, sest esimese punktina, et 244 00:13:37,447 --> 00:13:40,030 juhtub tulla, kui sa vaatad läbi kogu kollektsioon 245 00:13:40,030 --> 00:13:41,750 on pisteline. 246 00:13:41,750 --> 00:13:44,550 Vaatame mõned sõõrikud. 247 00:13:44,550 --> 00:13:46,830 Oh. 248 00:13:46,830 --> 00:13:49,190 >> OK. 249 00:13:49,190 --> 00:13:49,940 Nii sõõrikud. 250 00:13:49,940 --> 00:13:55,360 Nii leidsime on 80 kirjed kogumist, et viide sõõrikud. 251 00:13:55,360 --> 00:13:57,150 Otsime esimesel neist 10. 252 00:13:57,150 --> 00:14:01,890 Nüüd, näed siit nii, et Ma ütlesin, et ma otsin sõõrikud, 253 00:14:01,890 --> 00:14:04,400 Ma lihtsalt midagi lisanud päringustringiga URL. 254 00:14:04,400 --> 00:14:09,680 Nii q võrdub sõõrikud, mida saab vaata natuke kergemini siin. 255 00:14:09,680 --> 00:14:12,131 >> Ja see tähendab põhimõtteliselt seal spec API, mis 256 00:14:12,131 --> 00:14:13,880 määratleb kõik Nende parameetrite mõtlen. 257 00:14:13,880 --> 00:14:17,150 Ja see tähendab, et me läheme otsida kõik sõõrikud. 258 00:14:17,150 --> 00:14:24,910 >> Nii et esimene punkt on meil siin näete pealkiri on Donuts, 259 00:14:24,910 --> 00:14:29,310 ja seal on alapealkirja nimetatakse American Passion, mis on, ma arvan, 260 00:14:29,310 --> 00:14:31,610 asjakohane. 261 00:14:31,610 --> 00:14:36,134 Seal on palju erinevalt-- 262 00:14:36,134 --> 00:14:38,050 Kui sa saad selle punktini saada andmeid, 263 00:14:38,050 --> 00:14:41,020 seal on palju erinevaid formaate, et saad selle. 264 00:14:41,020 --> 00:14:44,050 Ja seal on erinevaid tugevusi ja nõrku külgi neile kõigile. 265 00:14:44,050 --> 00:14:49,000 Nii et see üks, näete siin, see vorm on väga rikas. 266 00:14:49,000 --> 00:14:51,946 Ja see on standardiseeritud. 267 00:14:51,946 --> 00:14:55,040 >> Nii et konkreetne pealkiri valdkonnas, subtiitrite valdkonnas. 268 00:14:55,040 --> 00:14:58,950 Seal vahelduvad pealkiri, American Passion. 269 00:14:58,950 --> 00:15:01,650 On koos nimega. 270 00:15:01,650 --> 00:15:03,120 Tüüp ressurss on tekst. 271 00:15:03,120 --> 00:15:06,070 Seal on palju teavet siin selles formaadis. 272 00:15:06,070 --> 00:15:09,480 >> Aga seal on hunnik eri vormides. 273 00:15:09,480 --> 00:15:11,920 Nii et me olime lihtsalt vaadates on formaat 274 00:15:11,920 --> 00:15:17,700 nimetatakse MODS, mis tähistab Metaandmed Objekti kirjeldus Service, 275 00:15:17,700 --> 00:15:18,250 potentsiaalselt. 276 00:15:18,250 --> 00:15:23,030 Ma olen tegelikult ei ole päris kindel S. Aga see on üsna keerukas formaadis. 277 00:15:23,030 --> 00:15:24,240 See on vaikimisi formaati. 278 00:15:24,240 --> 00:15:30,260 >> Aga see on üks, mis hoiab rikkust kõik andmed 279 00:15:30,260 --> 00:15:33,820 et raamatukogu on seetõttu see on väga lähedal sellele, mida 280 00:15:33,820 --> 00:15:35,110 Raamatukogu kasutab sisemiselt. 281 00:15:35,110 --> 00:15:39,030 See on standard, mis on kasutatakse üle kogu riigi, 282 00:15:39,030 --> 00:15:40,944 üle maailma akadeemilised raamatukogud. 283 00:15:40,944 --> 00:15:42,110 Ja see on väga koostalitlusvõimelised. 284 00:15:42,110 --> 00:15:44,852 Nii et kui sul on dokument mis on MODS formaadis 285 00:15:44,852 --> 00:15:47,560 saab anda, et keegi teine kelle süsteemid aru MODS, 286 00:15:47,560 --> 00:15:48,518 ja nad saavad importida. 287 00:15:48,518 --> 00:15:50,840 Nii et see on standard. 288 00:15:50,840 --> 00:15:54,250 See on väga täpselt määratletud, väga konkreetne. 289 00:15:54,250 --> 00:15:58,980 Ja see on see, mis muudab koostalitlusvõimelised, sest kui keegi ütleb, 290 00:15:58,980 --> 00:16:04,930 see on asendusliige pealkiri rekord, igaüks teab, mida see tähendab. 291 00:16:04,930 --> 00:16:07,740 Sisse Tagakülg, see on väga keeruline. 292 00:16:07,740 --> 00:16:13,160 >> Nii et kui te võtate pilk See rekord siin 293 00:16:13,160 --> 00:16:15,320 kui ma tahan saada Pealkiri see dokument, 294 00:16:15,320 --> 00:16:21,150 see raamat, mis on ilmselt Donuts, American Passion, sõelumine it out 295 00:16:21,150 --> 00:16:22,940 on vähe kaasatud. 296 00:16:22,940 --> 00:16:27,380 Arvestades seal on teine vormi nimetatakse Dublin Core, 297 00:16:27,380 --> 00:16:29,730 mis on palju-palju lihtsam formaadis. 298 00:16:29,730 --> 00:16:33,764 >> Ja nii näed siin, ei ole pealkiri, alapealkiri, asendusliige pealkiri. 299 00:16:33,764 --> 00:16:35,930 Seal on lihtsalt pealkiri, Donuts, American Passion, 300 00:16:35,930 --> 00:16:38,780 ja teine ​​pealkiri, American Passion. 301 00:16:38,780 --> 00:16:42,907 Nii et kui te vaatate millises vormis sa tahad saada andmeid välja, 302 00:16:42,907 --> 00:16:44,740 Palju sõltub sellest, kuidas sa lähed seda kasutada. 303 00:16:44,740 --> 00:16:46,573 Kas kasutate eest koostalitlusvõime või sa 304 00:16:46,573 --> 00:16:49,970 tahad midagi lihtsat, mis võib olla lihtsam töötada? 305 00:16:49,970 --> 00:16:56,002 >> Sisse Tagakülg, palju üksikasjad saada omamoodi squished alla. 306 00:16:56,002 --> 00:16:58,460 Sa võid kaotada nüansse mida konkreetses valdkonnas vahendid 307 00:16:58,460 --> 00:17:02,960 kui olete tegelevad Dublin Core, millest Sa ei saa koos MODS. 308 00:17:02,960 --> 00:17:06,462 Nii et need on kaks formaadid saad läbi API. 309 00:17:06,462 --> 00:17:08,920 Ja põhimõtteliselt, me hoiame see kulisside taga MODS. 310 00:17:08,920 --> 00:17:14,179 Aga me ei saa anda teile seda MODS ja Dublin Core ja kõike muud ka. 311 00:17:14,179 --> 00:17:16,470 Teine kaalutlus otsite andmete 312 00:17:16,470 --> 00:17:21,210 on saad seda kas JSON, mis tähistab JavaScript Object Märge, 313 00:17:21,210 --> 00:17:24,720 või XML, mis tähistab Extensible Markup Language. 314 00:17:24,720 --> 00:17:30,080 Ja need andmed esindused nii on täpselt ühesugune, täpselt 315 00:17:30,080 --> 00:17:31,080 samas valdkonnas. 316 00:17:31,080 --> 00:17:33,644 Aga nad lihtsalt süntaktiliselt erinevad. 317 00:17:33,644 --> 00:17:40,401 >> Nii et see on a-- 318 00:17:40,401 --> 00:17:41,400 Noh, lihtsalt vahetada. 319 00:17:41,400 --> 00:17:47,490 Nii et see on meie päringu sõõrikud XML-vormingus. 320 00:17:47,490 --> 00:17:53,470 Kui ma selle aktiveerid olema JSON, Ma näen seda muutunud. 321 00:17:53,470 --> 00:17:58,580 Nüüd on see sama sisu, kuid erinev struktuur. 322 00:17:58,580 --> 00:18:00,080 Seal on vähem noolsulgudes. 323 00:18:00,080 --> 00:18:02,530 Seal on napisõnalisemat. 324 00:18:02,530 --> 00:18:06,440 >> Ja see on formaat, et kui sa töötavad veebikeskkond, 325 00:18:06,440 --> 00:18:09,680 siis on teil tõenäoliselt läheb taha kasutada, sest üks 326 00:18:09,680 --> 00:18:12,630 on tore asju JSON on see on kooskõlas JavaScript. 327 00:18:12,630 --> 00:18:17,680 Nii et kui ma olen kirjalikult web app, ma ei tõmba JSON ja lihtsalt töötada otse. 328 00:18:17,680 --> 00:18:20,187 Arvestades XML, see on veidi keerulisem. 329 00:18:20,187 --> 00:18:21,520 Nii jälle need nii kasulikud. 330 00:18:21,520 --> 00:18:26,387 Nad lihtsalt on erinevad kasutamine juhtudel kus inimesed võiksid neid kasutada. 331 00:18:26,387 --> 00:18:26,886 OK. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 Nii tagasi API. 334 00:18:31,680 --> 00:18:32,900 Nii saame otsida for-- 335 00:18:32,900 --> 00:18:36,220 >> Ma annan näide otsivad sõõrikud. 336 00:18:36,220 --> 00:18:39,330 Me otsida ka ainult konkreetse valdkonna piires siin. 337 00:18:39,330 --> 00:18:41,310 Nii et selle asemel, et otsida terve kirje, 338 00:18:41,310 --> 00:18:43,870 Ma lihtsalt otsida pealkirja väljal. 339 00:18:43,870 --> 00:18:48,810 Ja nii nüüd on 25 asja, on sõõrikud pealkirja, millest üks 340 00:18:48,810 --> 00:18:52,430 on umbes taastamine märgalade majandamine 341 00:18:52,430 --> 00:18:54,990 augu sõõrik programmi, mis on ilmselt 342 00:18:54,990 --> 00:18:58,970 ei pruugi see, mida me otsime kui me otsite sõõrikud. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> Samuti saate, kui olete tegelevad API-- 345 00:19:05,490 --> 00:19:08,827 >> Osa millel API annab elanikel juurdepääsu suure andmekogumi saatmiseks. 346 00:19:08,827 --> 00:19:11,410 Ja seal on paar erinevat vahendeid, mida saab kasutada, et seda teha. 347 00:19:11,410 --> 00:19:14,170 Üks on väga lihtsalt, siis saab sirvida andmeid. 348 00:19:14,170 --> 00:19:17,340 Nii lihtsalt, kui sa teha päringu läbi veebiliidese 349 00:19:17,340 --> 00:19:19,470 võite vaadata leheküljel üks, lk kaks, kolmandal leheküljel. 350 00:19:19,470 --> 00:19:22,040 Seda saab teha sama asi läbi API. 351 00:19:22,040 --> 00:19:24,150 Sa lihtsalt vaja olla selgesõnaline kuidas seda teha. 352 00:19:24,150 --> 00:19:29,511 >> Nii näiteks, kui ma otsin minu esimene päring siin 353 00:19:29,511 --> 00:19:32,510 kui ma teen otsida asju koos sõõrikud pealkirjas, võin öelda, 354 00:19:32,510 --> 00:19:35,415 ja piirata võrdub 20, mis tähendab, anna mulle esimese 20 kirjed, mitte 355 00:19:35,415 --> 00:19:38,540 Esimesed 10, mis on vaikimisi, sest ma tahan vaadata 20 korraga. 356 00:19:38,540 --> 00:19:43,435 Või ma ei saa öelda, seadke alustada võrdne 20 ja piirata 357 00:19:43,435 --> 00:19:47,150 võrdne 20, mis annab mul salvestab 21 kuni 40. 358 00:19:47,150 --> 00:19:52,680 >> Nii et ma arvan, et asi ära võtta siin 359 00:19:52,680 --> 00:19:57,290 et me kasutame päringustringi määrata parameetrid päring. 360 00:19:57,290 --> 00:20:02,760 Ja see võimaldab teil kontrollida mida sa tagasi. 361 00:20:02,760 --> 00:20:05,980 >> Teine vahend, mida saab kasutada, - 362 00:20:05,980 --> 00:20:09,250 >> Ja see on tõesti kasulik poolest, et uurida andmeid. 363 00:20:09,250 --> 00:20:10,840 >> --is midagi, mida nimetatakse faceting. 364 00:20:10,840 --> 00:20:15,530 Nii perspektiivis faceting on ei pea olema ühised. 365 00:20:15,530 --> 00:20:16,880 Aga sa kõik oleme näinud seda varem. 366 00:20:16,880 --> 00:20:18,630 Kui te võtate pilk Amazon, näiteks 367 00:20:18,630 --> 00:20:20,870 ja sa ei otsi sõõrikud raamatud 368 00:20:20,870 --> 00:20:27,080 Siin nad ju mitmeid raamatuid, ja nad grupeerida, 369 00:20:27,080 --> 00:20:30,470 ja sa saad erinevatesse kategooriatesse, ja kui palju raamatuid igas kategoorias 370 00:20:30,470 --> 00:20:31,330 näita üles. 371 00:20:31,330 --> 00:20:33,420 >> Nii et see on põhimõtteliselt tahk. 372 00:20:33,420 --> 00:20:37,570 Te võtate kõik oma raamatud, 1800 raamatuid, mis vastavad sõõrikud Amazonist. 373 00:20:37,570 --> 00:20:39,820 12 neist on breakfast kategooriasse. 374 00:20:39,820 --> 00:20:43,100 21 saia ja küpsetamiseks ja nii edasi ja nii edasi. 375 00:20:43,100 --> 00:20:47,670 >> Nii et see on tõesti kasulik vahend uurimaks sisu 376 00:20:47,670 --> 00:20:53,260 raamatukogu sees kui ka sest kui te vaatate tahk, 377 00:20:53,260 --> 00:20:56,520 see annab sulle idee, mida allutab olemas, nagu milliseid teemasid 378 00:20:56,520 --> 00:20:58,510 on kõige populaarsem teie päringu komplekti. 379 00:20:58,510 --> 00:21:00,950 Ja see aitab teil sõitma ja uurida. 380 00:21:00,950 --> 00:21:02,770 Nii saame teha sama asja. 381 00:21:02,770 --> 00:21:05,940 >> Kui me tahame kasutada API ja vaadata tahku, 382 00:21:05,940 --> 00:21:08,950 lisame teise parameetri meie sõber päringustringiga. 383 00:21:08,950 --> 00:21:12,540 Nii tahku võrdub eralda komaga nimekiri, mida me tahame tahk on. 384 00:21:12,540 --> 00:21:14,790 Nii et üks tahke võiks kehtida. 385 00:21:14,790 --> 00:21:16,565 Teine võiks olla keeles. 386 00:21:16,565 --> 00:21:19,665 Ja nii, kui võtame selle päringu, me get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 Tundub üsna sama siin. 389 00:21:24,830 --> 00:21:29,010 Aga me oleme lõppu lisatakse nimekirja komplekt tahku. 390 00:21:29,010 --> 00:21:34,060 Nii et meil on tahk nimetatakse suhtes. 391 00:21:34,060 --> 00:21:40,250 Nii et see ütleb meile, et kui ma vaatan minu 80 tuleneb sõõrik päringu 392 00:21:40,250 --> 00:21:42,100 13 neist on allutada Ameerika Ühendriigid. 393 00:21:42,100 --> 00:21:43,684 Kolm on suhtes sõõrikud. 394 00:21:43,684 --> 00:21:45,600 Kolm on teema Märgalade taastamine, 395 00:21:45,600 --> 00:21:47,720 mis võib olla meie augu sõõrik. 396 00:21:47,720 --> 00:21:51,780 Kaks neist, Simpsons, ja nii edasi ja nii edasi. 397 00:21:51,780 --> 00:21:59,211 >> Nii et see võib olla kasulik, kui soovite kitsendada otsingut. 398 00:21:59,211 --> 00:22:00,210 See võib aidata teil seda teha. 399 00:22:00,210 --> 00:22:03,580 Eriti kui teil on rohkem kui, ütleme, 80 tulemusi. 400 00:22:03,580 --> 00:22:05,980 >> Samuti palusime jaoks tahku keele. 401 00:22:05,980 --> 00:22:14,790 Nii et kui me vaatame meie tulemused, näeme 76 neist on inglise keeles, neli prantsuse, 402 00:22:14,790 --> 00:22:19,620 kaks hispaania, kaks, ma arvan, et määratlemata või teadmata, Hollandi ja ladina keeles. 403 00:22:19,620 --> 00:22:22,830 Nii et ma arvan, et Ladina- sõõrik tulemus jällegi 404 00:22:22,830 --> 00:22:24,922 ei ole midagi pistmist küpsetisi. 405 00:22:24,922 --> 00:22:25,630 Aga seal lähete. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> Nii et see on omamoodi näitab teile, kuidas saab tõmmata sisu tagasi 408 00:22:38,630 --> 00:22:41,270 alates API lihtsalt läbi veebibrauser, mis on suurepärane. 409 00:22:41,270 --> 00:22:44,320 Aga see ei ole tõesti, mida soovid tavaliselt kasutades API ta. 410 00:22:44,320 --> 00:22:48,710 Nii et üks näide sellest, kuidas te võiks tegelikult teha on ma olen 411 00:22:48,710 --> 00:22:54,720 kirjaliku super väike programm, mis jällegi on mu sõõrik otsing 412 00:22:54,720 --> 00:22:59,010 ja valib mõne väljad ja kuvab need tabelis. 413 00:22:59,010 --> 00:23:01,610 Nii et see on väga sama sisu, et me lihtsalt 414 00:23:01,610 --> 00:23:04,830 nägin paar väljad tõmmatud. 415 00:23:04,830 --> 00:23:12,090 Nii nimetuste loetelus, asukoht, mida see raamat 416 00:23:12,090 --> 00:23:15,120 on umbes, keele, ja nii edasi ja nii edasi. 417 00:23:15,120 --> 00:23:20,480 >> Niisiis, kuidas see tegelikult juhtus, sest Ma arvan, et me peame vaatama mingi kood, 418 00:23:20,480 --> 00:23:22,420 on-- 419 00:23:22,420 --> 00:23:28,060 >> Mis meil siin on lihtne HTML lehekülg, mis kuvab teksti, 420 00:23:28,060 --> 00:23:32,900 Tere tulemast raamatukogu pilve ja kuvab tabeli tulemusi. 421 00:23:32,900 --> 00:23:37,790 Ja ilmselt on mingit tulemused Tabelis kui leht laaditakse. 422 00:23:37,790 --> 00:23:41,380 Aga mida me teeme on, esiteks, me 423 00:23:41,380 --> 00:23:46,290 laadimisel raamatukogu kutsus jQuery, mis on põhimõtteliselt 424 00:23:46,290 --> 00:23:52,030 JavaScript raamatukogu, mis muudab väga lihtne manipuleerida JavaScript 425 00:23:52,030 --> 00:23:58,780 algupäraselt, HTML, ja luua veebilehti, kliendipoolse loogika ja veebilehti. 426 00:23:58,780 --> 00:24:01,595 >> Mis meil siin on jQuery on meetod, mida kutsutakse Saa, 427 00:24:01,595 --> 00:24:05,270 mis sisuliselt läheb URL, mis käesoleval juhul 428 00:24:05,270 --> 00:24:09,070 on see tuttav otsib URL. 429 00:24:09,070 --> 00:24:14,440 Ja siis saan sisu et URL ja seejärel käivitage funktsioon peal. 430 00:24:14,440 --> 00:24:19,240 Nii me ütlesime minna api.lib.harvard / edu. 431 00:24:19,240 --> 00:24:20,060 Otsi sõõrikud. 432 00:24:20,060 --> 00:24:21,300 Anna meile 20 arvestust. 433 00:24:21,300 --> 00:24:28,590 Ja seejärel käivitage see funktsioon, mis Olen valinud, juhtides selle andmed. 434 00:24:28,590 --> 00:24:34,430 Ja andmed on JSON et sain naasnud API. 435 00:24:34,430 --> 00:24:40,120 >> Ja siis me ütleme, selles andmed seal Väli objekt. 436 00:24:40,120 --> 00:24:48,117 Ja kui ma olen läinud võtma tagasi vaadata üks neist tulemustest, mis on siin, 437 00:24:48,117 --> 00:24:49,200 seal on midagi nimetaks 438 00:24:49,200 --> 00:24:50,220 >> Noh, seda nimetatakse objekt. 439 00:24:50,220 --> 00:24:53,520 Nii et võib olla, et. 440 00:24:53,520 --> 00:25:01,840 Ja mida ta teeb, on see läbib iga kirje 441 00:25:01,840 --> 00:25:05,300 ja siis nõuab teise funktsiooni iga objekti. 442 00:25:05,300 --> 00:25:08,440 Ja see funktsioon põhimõtteliselt võtab väärtus 443 00:25:08,440 --> 00:25:12,010 objekti, mis on sisuliselt individuaalse rekord 444 00:25:12,010 --> 00:25:18,220 ja võimaldab meil tõmmake pealkiri, katvuse ja keel. 445 00:25:18,220 --> 00:25:21,640 >> Nii me nimetame funktsiooni igal objekt, tagasi jõudsime API. 446 00:25:21,640 --> 00:25:25,397 Ja kui sa lihtsalt võtta pilk See tükk siinsamas, 447 00:25:25,397 --> 00:25:27,230 mida me teeme on loome string, 448 00:25:27,230 --> 00:25:31,810 mis on sisuliselt mõned HTML Markup laua koos value.title, 449 00:25:31,810 --> 00:25:35,790 mis on pealkiri objekti value.coverage, 450 00:25:35,790 --> 00:25:36,790 mis on kaetus, - 451 00:25:36,790 --> 00:25:38,225 >> Ja me teeme check siin näha, kes on määratlemata 452 00:25:38,225 --> 00:25:40,570 ja varjates seda, kui ta ütleb määramata, sest me ei ole tõesti huvitatud 453 00:25:40,570 --> 00:25:41,600 selles. 454 00:25:41,600 --> 00:25:42,939 >> --and siis keelt. 455 00:25:42,939 --> 00:25:44,730 Ja siis me oleme teeme, on lisades, et 456 00:25:44,730 --> 00:25:48,510 tabeli, mis on mida käesoleva string siin. 457 00:25:48,510 --> 00:25:50,790 Ja kuidas jQuery töötab mida see ütleb 458 00:25:50,790 --> 00:25:56,420 on otsida tabeli idee Tulemused ja lisada see tekst on. 459 00:25:56,420 --> 00:25:59,380 Ja see on laual idee tulemusi. 460 00:25:59,380 --> 00:26:04,998 Nii et mida sa lõpuks koos on see leht siin. 461 00:26:04,998 --> 00:26:06,206 Ja selleks, et vaadata source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 Noh, allikas ei ole tegelikult uuendatakse, kui see juhtus. 464 00:26:13,810 --> 00:26:18,740 Nii saab näha tegelikku tulemused tabelisse siin küll. 465 00:26:18,740 --> 00:26:24,770 >> Nii see on lihtsalt lihtne näide teeb väga põhilised päringu peale API 466 00:26:24,770 --> 00:26:29,020 ja kuvada informatsiooni muul moodustada ja ei tee midagi liiga fancy. 467 00:26:29,020 --> 00:26:36,370 Nüüd teine ​​näide on nagu taotluse kirjutanud David Weinberger 468 00:26:36,370 --> 00:26:39,120 kui demo sellest, mis sisuliselt näitab teile 469 00:26:39,120 --> 00:26:44,620 kuidas saab puder up tulemusi sa oled saada raamatukogu pilv API 470 00:26:44,620 --> 00:26:46,250 koos, ütleme, Google Books. 471 00:26:46,250 --> 00:26:52,225 >> Ja mõtlemine on selles, et ma ei saa joosta päringu peale Google Books, 472 00:26:52,225 --> 00:26:56,060 saada täistekstiotsingu, saaksin tulemused tagasi, selgitada välja, kes need esemed 473 00:26:56,060 --> 00:27:01,180 tegelikult olemas Hollis, raamatukogu, 474 00:27:01,180 --> 00:27:03,200 ja siis anna mulle lingid tagasi need teemad. 475 00:27:03,200 --> 00:27:12,730 Nii et kui ma otsida, see oli pime ja tormine öö, ma 476 00:27:12,730 --> 00:27:16,210 saada tagasi hunnik tulemusi Google ja seejärel üks tulemus 477 00:27:16,210 --> 00:27:19,460 mis on Wrinkle in Time. 478 00:27:19,460 --> 00:27:29,330 Ja need lingid raamatud, mis on olemas jooksul Harvard Raamatukogu süsteemi. 479 00:27:29,330 --> 00:27:32,160 >> Nii et ma arvan, et siinkohal ei ole nii palju, et see võib olla või mitte 480 00:27:32,160 --> 00:27:34,118 olla nii, et sa tahad otsida raamatukogu 481 00:27:34,118 --> 00:27:38,310 kuid see on täiesti erinev nii, et ei olnud teile kättesaadavad 482 00:27:38,310 --> 00:27:42,884 Enne, nagu sa ei olnud viisiks täistekstiotsing raamatute, et isegi 483 00:27:42,884 --> 00:27:44,550 kuulusid Harvard Raamatukogu süsteemi. 484 00:27:44,550 --> 00:27:46,870 Nüüd on see viis et võite seda teha. 485 00:27:46,870 --> 00:27:51,930 Ja saate kuvada neid olenemata selle vormist, mida soovid. 486 00:27:51,930 --> 00:27:55,990 Nii Siinkohal on põhiliselt me avades uusi mooduseid inimestele 487 00:27:55,990 --> 00:27:59,080 töötada andmeid. 488 00:27:59,080 --> 00:28:07,925 >> Teine tükk raamatukogu pilv on see, et see aitab paljastada mõned kasutusandmeid 489 00:28:07,925 --> 00:28:08,800 et raamatukogu on. 490 00:28:08,800 --> 00:28:12,630 Nii et kui te minna raamatukokku, ja otsite raamatud 491 00:28:12,630 --> 00:28:15,770 Sa ei pea tegelikult on idee, 492 00:28:15,770 --> 00:28:19,080 kõik kirjed konkreetse teema, mida 493 00:28:19,080 --> 00:28:21,200 on inimesi, kogukond, kas see on 494 00:28:21,200 --> 00:28:24,890 defineeritud Harvard või riigi või oma klassis 495 00:28:24,890 --> 00:28:26,421 Mida nad leida kõige kasulikum? 496 00:28:26,421 --> 00:28:28,920 Ja raamatukogu on tegelikult ton teavet, mida 497 00:28:28,920 --> 00:28:32,999 Kõige kasulikum on, sest kui palju inimesed end välja raamatu 498 00:28:32,999 --> 00:28:34,040 mis ütleb sulle midagi. 499 00:28:34,040 --> 00:28:36,498 Seal pidi olema mingil põhjusel nad tahavad, et seda kontrollida. 500 00:28:36,498 --> 00:28:38,270 Paljud inimesed panid selle reservi. 501 00:28:38,270 --> 00:28:42,520 >> Kui see on reservnimekirja jaoks palju klasside, mis ütleb sulle midagi. 502 00:28:42,520 --> 00:28:45,960 Kui õppejõud on kontrollimata välja palju ja üliõpilastele ei ole, 503 00:28:45,960 --> 00:28:47,200 mis ütleb mulle midagi. 504 00:28:47,200 --> 00:28:49,280 Vastupidi, et ka ütleb sulle midagi. 505 00:28:49,280 --> 00:28:54,680 Seega oleks tõesti huvitav pane see teave olemas ja las 506 00:28:54,680 --> 00:28:59,969 inimesed kasutavad seda, et aidata neil leida teosed raamatukogu. 507 00:28:59,969 --> 00:29:02,260 Tagakülg on see seal on mõned tõsised privaatsust 508 00:29:02,260 --> 00:29:07,854 probleeme, sest üks tuum tõekspidamiste raamatukogu 509 00:29:07,854 --> 00:29:10,770 on me ei kavatse olla ütlen inimesed, mida teised inimesed loevad. 510 00:29:10,770 --> 00:29:17,360 Ja isegi kui sa ei ütle seda Raamat möllitud neli korda 511 00:29:17,360 --> 00:29:20,070 konkreetsel kuul mida võiks kasutada 512 00:29:20,070 --> 00:29:25,252 lingi eriti isiku de-anonymizing andmeid 513 00:29:25,252 --> 00:29:26,710 ja välja selgitada, kes kontrollib seda. 514 00:29:26,710 --> 00:29:30,792 Nii, et me saame avoid-- 515 00:29:30,792 --> 00:29:33,750 Nii, et saame proovida ekstrakti mõned signaali kogu teave 516 00:29:33,750 --> 00:29:36,740 rikkumata kellegi eraelu puutumatusega seotud probleemidele 517 00:29:36,740 --> 00:29:42,150 on sisuliselt me ​​vaatame 10 aastat kasutusandmeid, - 518 00:29:42,150 --> 00:29:43,930 >> Seega see on pika aja jooksul. 519 00:29:43,930 --> 00:29:50,639 >> --and öelda, OK, vaatame, kuidas mitu korda seda tööd kasutati, 520 00:29:50,639 --> 00:29:52,930 ja kes selle aja jooksul aega ja siis põhimõtteliselt 521 00:29:52,930 --> 00:29:56,300 tagasi anda number, mida me nimetame stack skoor, mis põhimõtteliselt 522 00:29:56,300 --> 00:29:59,910 näitab kui palju see on ära kasutatud. 523 00:29:59,910 --> 00:30:01,084 Ja see number-- 524 00:30:01,084 --> 00:30:03,250 Palju erinevaid arvutusi minema, et number. 525 00:30:03,250 --> 00:30:05,150 --aga see on väga karm mõõdik, mis annab teile 526 00:30:05,150 --> 00:30:11,300 mõned ideed, kuidas kogukonna võivad hinnata seda tööd. 527 00:30:11,300 --> 00:30:16,772 >> Ja nii teise omamoodi isegi rohkem täiendas taotluse 528 00:30:16,772 --> 00:30:18,480 et ära see on midagi 529 00:30:18,480 --> 00:30:24,000 nimetatakse Stacklife, mis on tegelikult kaudu kättesaadavaks peamine Harvard 530 00:30:24,000 --> 00:30:24,880 Raamatukogu portaal. 531 00:30:24,880 --> 00:30:26,700 Nii et sa minna library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 Näete mitmeid erinevaid võimalusi otsivad raamatukogu. 533 00:30:29,360 --> 00:30:32,300 Ja üks neist on nn Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> Ja see on rakendus, mis sirvib sisu raamatukogu 535 00:30:38,980 --> 00:30:43,490 kuid on täiesti ehitatud peal need rakendusliideste. 536 00:30:43,490 --> 00:30:46,910 Seega puudub eriline kraam toimub kulisside taga. 537 00:30:46,910 --> 00:30:49,570 Ei ole juurdepääsu andmed, et sa ei pea. 538 00:30:49,570 --> 00:30:54,090 See kasutades API annab teile hoopis teine ​​sirvimine 539 00:30:54,090 --> 00:30:55,480 kogemus. 540 00:30:55,480 --> 00:30:58,570 >> Nii et kui ma otsin Alice in Wonderland sel juhul, 541 00:30:58,570 --> 00:31:02,600 Ma saan tulemuse, mis näeb see, mis on päris much-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> See on väga sarnane muu otsingut sa võiks teha, aga antud juhul 544 00:31:10,870 --> 00:31:15,730 me hinne esemed stackscore, mis annab teile 545 00:31:15,730 --> 00:31:19,850 mõned ideed, kuidas populaarne nendel kirjed olid ühenduses. 546 00:31:19,850 --> 00:31:25,610 Ja nii selgelt, Alice in Wonderland Walt Disney on väga populaarne. 547 00:31:25,610 --> 00:31:36,570 Aga sa võid ka näha nelja suurima siin on need, mida ei pruugi actually-- 548 00:31:36,570 --> 00:31:39,220 >> Asjad, mis on väga kasutada, aga sa ei tohi kohe 549 00:31:39,220 --> 00:31:41,240 ühendada Alice in Wonderland. 550 00:31:41,240 --> 00:31:44,650 Nii et meie vana sõber Annoteeritud Alice on siin. 551 00:31:44,650 --> 00:31:46,350 Ma võin võtta pilk see. 552 00:31:46,350 --> 00:31:52,010 Ja nüüd, mida ma otsin kell on põhiliselt määratud of-- 553 00:31:52,010 --> 00:31:53,760 Võin olla annoteeritud Alice siin. 554 00:31:53,760 --> 00:31:56,700 Mul on selle kohta teavet. 555 00:31:56,700 --> 00:32:00,230 Ja mul on ka stackscore of, antud juhul 26. 556 00:32:00,230 --> 00:32:03,169 Ja see ütleb mulle mingi umbes kuidas me saime selle stackscore, 557 00:32:03,169 --> 00:32:05,835 nagu, kes kontrollib ära, nagu kuidas mitu korda see möllitud, 558 00:32:05,835 --> 00:32:08,440 nagu õppejõud või undergrads, kuidas palju koopiaid raamatukogu on, 559 00:32:08,440 --> 00:32:11,300 ja nii edasi ja nii edasi. 560 00:32:11,300 --> 00:32:16,460 >> Ja te saate ka piisavalt huvitav siin linnas korstnad praktiliselt. 561 00:32:16,460 --> 00:32:19,550 Nii andmete siin, see näitab teile omamoodi 562 00:32:19,550 --> 00:32:23,547 virtuaalne esindus mida riiul väest 563 00:32:23,547 --> 00:32:25,880 nägema, kui sa olid võtma kõik raamatukogu osalusi 564 00:32:25,880 --> 00:32:28,940 ja paneb kokku üks lõputu riiulil. 565 00:32:28,940 --> 00:32:30,990 Ja hea asi on see, et me can-- 566 00:32:30,990 --> 00:32:33,380 >> Esiteks, metaandmeid neid raamatuid 567 00:32:33,380 --> 00:32:35,627 Sageli öeldakse, millal see ilmus. 568 00:32:35,627 --> 00:32:37,085 See näitab, kui palju lehti on. 569 00:32:37,085 --> 00:32:38,459 Võib öelda mõõtmed. 570 00:32:38,459 --> 00:32:42,930 Nii et näete, mis on kajastatud siin poolest suurus raamatuid. 571 00:32:42,930 --> 00:32:46,740 >> Ja siis saame kasutada Kestab punktisumma esile tõsta 572 00:32:46,740 --> 00:32:49,170 raamatuid, mis on suurem stack hinded. 573 00:32:49,170 --> 00:32:54,930 Niisiis, kui see on tumedam, see tähendab, et arvatavasti kasutatakse seda sagedamini. 574 00:32:54,930 --> 00:32:57,040 Nii et kui ma olen läheb arvan, et see 575 00:32:57,040 --> 00:33:03,226 on versioon Alice in Wonderland mis on laialt levinud ja kõige 576 00:33:03,226 --> 00:33:05,100 juurde, raamatukogu on kõige koopiaid. 577 00:33:05,100 --> 00:33:06,975 Nii et kui te otsite Alice in Wonderland, 578 00:33:06,975 --> 00:33:10,220 see võiks olla hea koht alustamiseks. 579 00:33:10,220 --> 00:33:13,500 >> Ja siis siin saab ka link välja to, öelda, Amazon osta raamat, 580 00:33:13,500 --> 00:33:15,182 ja nii edasi ja nii edasi. 581 00:33:15,182 --> 00:33:17,140 Siinkohal jällegi ei ole nii palju, et see 582 00:33:17,140 --> 00:33:25,030 on parim viis sirvida raamatukogu või õige vahend iga kord. 583 00:33:25,030 --> 00:33:28,400 Aga see on üks võimalus seda teha. 584 00:33:28,400 --> 00:33:31,359 Ning tehes andmeid saadaval läbi API, mis 585 00:33:31,359 --> 00:33:34,650 on valmistatud väga lihtne ehitusplokkide mis võimaldab otsida sisu 586 00:33:34,650 --> 00:33:39,420 saab ehitada midagi nagu see, mida saab 587 00:33:39,420 --> 00:33:41,520 erakordselt väärtuslik, et mõned inimesed. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> Nii et omamoodi, nii palju kui ma tahan öelda tõesti, mida API on 590 00:33:51,860 --> 00:33:56,070 ja mida ta paljastab, seal on terve hunnik asju kulisside taga, mis 591 00:33:56,070 --> 00:33:59,480 Ma lihtsalt puudutada lühidalt lihtsalt sellepärast, et see omamoodi tuleb selles 592 00:33:59,480 --> 00:34:03,720 hoopis teisest nurgast tingimuste kuidas midagi sellist 593 00:34:03,720 --> 00:34:04,580 saada paika panna? 594 00:34:04,580 --> 00:34:10,820 >> Nii API on standard liidestamise kõik see sisu. 595 00:34:10,820 --> 00:34:13,820 Aga et saada sinna, Esimene asi, mida me pidime tegema 596 00:34:13,820 --> 00:34:17,260 oli koondada teave raamatute ja pildid 597 00:34:17,260 --> 00:34:21,580 ja leida abivahendid, kogumine dokumendi eri Harvard süsteeme. 598 00:34:21,580 --> 00:34:23,929 Aleph, VIA ja OASIS on nimed süsteemid. 599 00:34:23,929 --> 00:34:28,820 Ja nad sisuliselt minema torujuhe, töötlemise gaasijuhe. 600 00:34:28,820 --> 00:34:33,230 >> Nii esiteks, saame ekspordi failid kõik need süsteemid. 601 00:34:33,230 --> 00:34:35,130 Meil need tükeldada üksikuteks esemeid. 602 00:34:35,130 --> 00:34:39,360 Nii et meil on fail, mis on gigabyte, mis on miljoni plaadi ta. 603 00:34:39,360 --> 00:34:42,290 Nii et me jagati see üksikud punktid. 604 00:34:42,290 --> 00:34:45,374 Siis iga kirje, siis muuta see arvesse MODS, sest mõned neist 605 00:34:45,374 --> 00:34:47,040 on algupäraselt MODS, mõned neist ei ole. 606 00:34:47,040 --> 00:34:49,204 Nii saame neid kõiki olema samas vormis. 607 00:34:49,204 --> 00:34:51,120 Siis on erinevate rikastamise samme, kui 608 00:34:51,120 --> 00:34:55,969 lisame rohkem teavet andmeid kui oli kättesaadav raamatukokku. 609 00:34:55,969 --> 00:34:59,750 Seega on meil vaja lisada, kõigepealt meil on, mida raamatukogud hoia seda. 610 00:34:59,750 --> 00:35:02,250 Me läheme läbi samm arvutamisel stackscore. 611 00:35:02,250 --> 00:35:07,112 Me läheme läbi teise etappi lisades metaandmete poolest 612 00:35:07,112 --> 00:35:10,730 mis kogusid inimesed oleks võinud lisada see-- 613 00:35:10,730 --> 00:35:12,532 >> Inimesed loovad kogud punkte. 614 00:35:12,532 --> 00:35:13,990 Mida kogud see kuulub? 615 00:35:13,990 --> 00:35:17,220 Kuidas on inimesed kodeeritud Sisu varem? 616 00:35:17,220 --> 00:35:20,750 Siis sa filtreerida, ja sa piirata arvestust, sest nagu ma mainisin, 617 00:35:20,750 --> 00:35:24,120 seal on mõned kirjed, et kuna autoriõiguse põhjustel, ei saa me näidata. 618 00:35:24,120 --> 00:35:26,700 Ja siis me laadida millekski kutsutud 619 00:35:26,700 --> 00:35:31,680 Solr, mis ei ole trükiviga, kuid on nimi tükk tarkvara 620 00:35:31,680 --> 00:35:35,710 et ei otsi indekseerimine, mis juhib kogu search taga API. 621 00:35:35,710 --> 00:35:40,110 Ja siis see muutub kättesaadavaks API, ja inimesed saavad seda kasutada. 622 00:35:40,110 --> 00:35:44,640 >> Nii et see on nagu üsna lihtne protsess. 623 00:35:44,640 --> 00:35:47,230 Üks huvitav asju on 624 00:35:47,230 --> 00:35:50,990 et me tegeleme 13 miljoni plaadi 625 00:35:50,990 --> 00:35:53,820 ja me käsitleme või rohkem. 626 00:35:53,820 --> 00:36:01,260 Ja me tahame olla suuteline käitlema Nende suhteliselt kiire mood. 627 00:36:01,260 --> 00:36:03,630 See võtab kaua aega töödelda 13 miljonit arvestust. 628 00:36:03,630 --> 00:36:09,529 >> Niisiis, kuidas see gaasijuhe loodud on, et sa can-- 629 00:36:09,529 --> 00:36:12,070 Ma arvan, et ära torujuhtme probleem, et me oleme 630 00:36:12,070 --> 00:36:15,580 püüab lahendada siin, on see, et kõik transformatsioone, kõik 631 00:36:15,580 --> 00:36:18,729 tehke selles torujuhtme on eraldatavad. 632 00:36:18,729 --> 00:36:19,645 Ei ole sõltuvust. 633 00:36:19,645 --> 00:36:22,146 Kui oled töötlemine rekord ühe raamatu, 634 00:36:22,146 --> 00:36:24,270 pole mingit sõltuvust et vahel teine ​​raamat. 635 00:36:24,270 --> 00:36:27,760 >> Mida me saame teha, on põhimõtteliselt igal sammul tulemas, 636 00:36:27,760 --> 00:36:30,470 me seda ellu järjekorda pilv. 637 00:36:30,470 --> 00:36:32,250 Sattusin olema Amazon Web Services. 638 00:36:32,250 --> 00:36:35,140 Nii et nimekiri, öelda, 10000 esemeid 639 00:36:35,140 --> 00:36:38,100 olema normaliseeritud ja ümber MODS formaadis. 640 00:36:38,100 --> 00:36:41,620 Ja me spin up nii palju servereid kui tahame, võibolla 10 servereid. 641 00:36:41,620 --> 00:36:44,860 Ja kõik need serverid lihtsalt istub seal, tundub, et järjekorda, 642 00:36:44,860 --> 00:36:46,730 näeb, et seal on üks, mis vajab töödelda, tõmbab selle maha järjekorda, 643 00:36:46,730 --> 00:36:48,740 töötleb ja mälupulgad see järgmise järjekorras. 644 00:36:48,740 --> 00:36:54,200 >> Ja mis siis, mis võimaldab meil tegema, on kehtivad sisuliselt 645 00:36:54,200 --> 00:36:58,110 nii palju riistvara, kui me tahame seda probleem väga lühikese aja 646 00:36:58,110 --> 00:37:02,970 töödelda andmeid nii kiiresti kui võimalik, mis on midagi, ainult, 647 00:37:02,970 --> 00:37:08,220 nüüd maailma cloud computing saame pakkumise serverid sisuliselt 648 00:37:08,220 --> 00:37:09,890 silmapilkselt, et kasulik. 649 00:37:09,890 --> 00:37:12,260 Nii et me ei pea olema hiiglane server istuvad 650 00:37:12,260 --> 00:37:16,700 kogu aeg tegema töötlemine mis võib juhtuda ainult üks kord nädalas. 651 00:37:16,700 --> 00:37:21,440 >> Nii on see enamast ta. 652 00:37:21,440 --> 00:37:27,590 Seal dokumentatsiooni raamatukogule Cloud Punkt API 653 00:37:27,590 --> 00:37:31,960 sellelt aadressilt, mille saadaval olla hiljem. 654 00:37:31,960 --> 00:37:36,730 Ja palun minge heita pilk et näha, kas seal on midagi, 655 00:37:36,730 --> 00:37:37,579 teil on mingeid ideid. 656 00:37:37,579 --> 00:37:38,120 Mängi seda. 657 00:37:38,120 --> 00:37:38,830 Lollita. 658 00:37:38,830 --> 00:37:42,800 Ja loodetavasti saate tulla välja midagi suurt. 659 00:37:42,800 --> 00:37:44,740 Aitäh. 660 00:37:44,740 --> 00:37:45,899