1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 Jeffrey LICHT: Sziasztok. 3 00:00:12,370 --> 00:00:13,550 Én vagyok Jeffrey Licht. 4 00:00:13,550 --> 00:00:17,890 Azért vagyok itt, hogy veled beszélni a Harvard Könyvtár és építési holnap 5 00:00:17,890 --> 00:00:20,870 könyvtárban ma, azt hiszem. 6 00:00:20,870 --> 00:00:23,040 Tehát a háttérben van, A pályán ezen az ülésen 7 00:00:23,040 --> 00:00:26,930 lényegében az, hogy van Sok bibliográfiai adatok 8 00:00:26,930 --> 00:00:28,400 rendelkezésre Harvard könyvtárak. 9 00:00:28,400 --> 00:00:33,434 És van egy olyan lehetőség, révén néhány eszközt 10 00:00:33,434 --> 00:00:36,350 és hogy a projekt fejlesztés alatt áll, arra, hogy hozzáférjenek az információs 11 00:00:36,350 --> 00:00:42,430 és vigyük el a helyeken, hogy a Harvard Library nem csinálsz most, 12 00:00:42,430 --> 00:00:45,460 csinálni új dolgokat vele, kísérlet és játszadozik vele. 13 00:00:45,460 --> 00:00:52,413 >> Tehát a belépési pont ebbe egy API úgynevezett Harvard Library Cloud, amely 14 00:00:52,413 --> 00:00:57,650 egy nyílt metaadat szerver, amely fogok beszélni most. 15 00:00:57,650 --> 00:01:02,595 Tehát a háttér az, hogy van egy csomó dolgot a Harvard könyvtárban. 16 00:01:02,595 --> 00:01:07,150 Jelenleg több mint 13 millió bibliográfiai nyilvántartások, millió kép, 17 00:01:07,150 --> 00:01:11,090 és több ezer segédletek, amelyek alapvetően leíró dokumentumok 18 00:01:11,090 --> 00:01:15,500 gyűjtemények, mondván, mi van bennük, doboz papírok 19 00:01:15,500 --> 00:01:21,080 és így tovább, hogy egy több mint egy millió egyedi dokumentumokat. 20 00:01:21,080 --> 00:01:24,290 És van még egy csomó információ, hogy a könyvtár 21 00:01:24,290 --> 00:01:28,180 arról, hogy a tartalom használunk, amely lehet az érdeke, hogy az emberek 22 00:01:28,180 --> 00:01:32,400 akik esetleg szeretnének dolgozni vele. 23 00:01:32,400 --> 00:01:36,150 >> Tehát az összes információt A könyvtár metaadatok. 24 00:01:36,150 --> 00:01:39,500 Tehát metaadatok adatok az adatokról. 25 00:01:39,500 --> 00:01:42,070 Tehát amikor arról beszélünk, Az információk, amelyek 26 00:01:42,070 --> 00:01:44,890 érhető el a könyvtár cloud hogy a rendelkezésre álló, 27 00:01:44,890 --> 00:01:47,760 Ez nem feltétlenül A tényleges dokumentumok 28 00:01:47,760 --> 00:01:53,060 maguk, nem feltétlenül a teljes szövege könyvek, illetve a teljes kép, 29 00:01:53,060 --> 00:01:54,890 azonban, hogy valóban lehet a helyzet. 30 00:01:54,890 --> 00:01:57,550 De ez tényleg információt az adatokat. 31 00:01:57,550 --> 00:02:00,909 >> Szóval lehet gondolni katalogizálás információk, hívószámok, tárgyak, 32 00:02:00,909 --> 00:02:02,700 hány példányban a könyv van, mit 33 00:02:02,700 --> 00:02:06,380 a kiadást, melyek a formátumok, a szerzők, és így tovább. 34 00:02:06,380 --> 00:02:12,250 Szóval van egy csomó információt Az információk gyűjtése, hogy, 35 00:02:12,250 --> 00:02:14,400 önmagában is egyfajta eleve hasznos. 36 00:02:14,400 --> 00:02:19,230 És bár ha Ennek alapos kutatás, 37 00:02:19,230 --> 00:02:25,160 akkor nyilván szeretnénk elérni, hogy a tényleges elégedhet meg, és nézzük az adatokat, 38 00:02:25,160 --> 00:02:30,140 A metaadatok hasznos szempontjából mindkét elemzése a korpusz egészére, 39 00:02:30,140 --> 00:02:33,870 mint amit a dolgok a gyűjteményben. 40 00:02:33,870 --> 00:02:35,520 Hogyan viszonyulnak? 41 00:02:35,520 --> 00:02:39,482 Ez segít igazán találja egyéb dolgokat, amely valóban a fő célját is. 42 00:02:39,482 --> 00:02:41,190 A lényeg a metaadatok és a katalógusban 43 00:02:41,190 --> 00:02:43,230 van, hogy segítsen megtalálni az összes Az információk, amelyek 44 00:02:43,230 --> 00:02:46,590 belül rendelkezésre álló gyűjteményt. 45 00:02:46,590 --> 00:02:53,690 >> Tehát ez egy példa a metaadat egy könyv a Harvard Library. 46 00:02:53,690 --> 00:02:56,370 Szóval ez van. 47 00:02:56,370 --> 00:02:59,850 És láthatjuk, hogy az ténylegesen mérsékelten bonyolult. 48 00:02:59,850 --> 00:03:04,610 És része a metaadatok értékének a Harvard Library rendszer 49 00:03:04,610 --> 00:03:09,320 az, hogy ez már egyfajta A felépített katalógusáruházak 50 00:03:09,320 --> 00:03:12,720 és összeszerelt kérő személyek sok szakértelem és ügyességi 51 00:03:12,720 --> 00:03:20,030 és arra gondoltam, hogy ez idővel, amely egy csomó értéket. 52 00:03:20,030 --> 00:03:25,450 >> Tehát, ha egy pillantást ezt a rekordot A magyarázó jegyzetekkel ellátott Alice, akkor megtudja, 53 00:03:25,450 --> 00:03:32,590 megvan a cím, aki írta, a könyv szerzője, és a különböző tantárgyak 54 00:03:32,590 --> 00:03:35,380 amelyekért az emberek katalogizált be. 55 00:03:35,380 --> 00:03:40,110 És láthatjuk ott is, a Amellett, hogy a sok jó információ 56 00:03:40,110 --> 00:03:42,852 Itt van néhány átfedések. 57 00:03:42,852 --> 00:03:45,560 Van egy csomó összetettsége ez tükröződik a metaadatok 58 00:03:45,560 --> 00:03:46,300 hogy van. 59 00:03:46,300 --> 00:03:50,320 >> Tehát az egyik könyv címe is Alice Csodaországban. 60 00:03:50,320 --> 00:03:53,880 Tehát ez egy megjegyzésekkel ellátott változata a könyvet. 61 00:03:53,880 --> 00:03:56,380 De ez más néven a Annotated Alice, Alice kalandjai 62 00:03:56,380 --> 00:03:58,570 in Wonderland, mert ez valami, ami 63 00:03:58,570 --> 00:04:00,430 Martin Gardner írt és jegyzetekkel ellátott könyv. 64 00:04:00,430 --> 00:04:03,369 És van egy csomó nagy információ mintegy logikai rejtvények, és a dolgok 65 00:04:03,369 --> 00:04:05,410 belül Alice, hogy Valószínűleg nem tudni. 66 00:04:05,410 --> 00:04:07,000 Szóval kell menni olvasni. 67 00:04:07,000 --> 00:04:11,940 >> De láthatod van Sok részlet van, 68 00:04:11,940 --> 00:04:15,340 beleértve azonosítókat, amikor azt jött létre, hogy honnan jött, 69 00:04:15,340 --> 00:04:17,420 szempontjából a Harvard rendszer, és így tovább. 70 00:04:17,420 --> 00:04:20,350 Tehát ez egy minta A metaadatok típusa 71 00:04:20,350 --> 00:04:24,340 hogy lehet látni egy könyv A Harvard Könyvtár gyűjteménye. 72 00:04:24,340 --> 00:04:26,680 >> Ez valami teljesen más. 73 00:04:26,680 --> 00:04:32,610 Tehát van egy rendszer, az úgynevezett VIA Harvard, ami alapvetően 74 00:04:32,610 --> 00:04:39,990 a katalogizálás képek és műtárgyak, és a vizuális dolgokat egész Harvard, 75 00:04:39,990 --> 00:04:44,010 és hozzá néhány metaadat nekik, osztályozza őket, 76 00:04:44,010 --> 00:04:49,200 és, bizonyos esetekben, amely kis thumbnail képek 77 00:04:49,200 --> 00:04:51,250 hogy meg lehet venni egy nézd meg, ha úgy kívánják. 78 00:04:51,250 --> 00:04:54,240 >> Tehát ez egy példa a metaadat, hogy van egy lemez 79 00:04:54,240 --> 00:04:57,840 a feltehetően Alice Csodaországban. 80 00:04:57,840 --> 00:05:00,499 És láthatjuk van kevesebb metaadatok itt. 81 00:05:00,499 --> 00:05:02,040 Ez csak egy másfajta objektum. 82 00:05:02,040 --> 00:05:03,425 És így kevesebb információt. 83 00:05:03,425 --> 00:05:07,790 >> Meg többnyire a tényt, hogy egy hívás számú, lényegében aki teremtette, - 84 00:05:07,790 --> 00:05:10,410 >> Nem tudjuk, mikor hozták létre. 85 00:05:10,410 --> 00:05:13,320 >> --and címet. 86 00:05:13,320 --> 00:05:14,300 >> Egy másik példa. 87 00:05:14,300 --> 00:05:16,380 Ez a megállapítás támogatást. 88 00:05:16,380 --> 00:05:19,030 Szóval van egy gyűjtemény Lewis Carroll papírjait a Harvardon. 89 00:05:19,030 --> 00:05:23,601 Tehát ez leírja, hogy mi van, hogy gyűjteménye. 90 00:05:23,601 --> 00:05:26,100 Szóval valaki ment keresztül, és nézett végig a dobozok 91 00:05:26,100 --> 00:05:32,220 és katalogizált meg, adott némi hátteret, írásos összefoglalót, mi van itt. 92 00:05:32,220 --> 00:05:35,290 És ha úgy döntesz, hogy néz ki További ebben, ennek 93 00:05:35,290 --> 00:05:39,620 megy a hosszú oldalakon és oldalt, de meg fogja mondani, 94 00:05:39,620 --> 00:05:41,860 betűkről és mit ből származik, amit dobozok 95 00:05:41,860 --> 00:05:44,289 létezett az egész gyűjtemény. 96 00:05:44,289 --> 00:05:46,330 De ez valami hogy ha a Harvardon, 97 00:05:46,330 --> 00:05:50,720 mehetsz és fizikailag nézni up és feltehetően vessen egy pillantást. 98 00:05:50,720 --> 00:05:53,440 >> Szóval ez az egész nagy. 99 00:05:53,440 --> 00:05:54,450 Ez a metaadat hasznos. 100 00:05:54,450 --> 00:05:56,327 Ez a Harvard Library rendszert. 101 00:05:56,327 --> 00:05:58,910 Vannak olyan eszközök, ahol online lehet menni, és nézd meg, hogy, 102 00:05:58,910 --> 00:05:59,993 és nézd meg, és keressük meg. 103 00:05:59,993 --> 00:06:02,810 És akkor szeleteljük, kocka ez a sok különböző módon. 104 00:06:02,810 --> 00:06:06,920 >> De ez tényleg csak akkor elérhető, ha Ön egy emberi lény ült le 105 00:06:06,920 --> 00:06:12,600 az Ön böngészőjében, vagy valami, vagy A telefon és a navigálást is. 106 00:06:12,600 --> 00:06:16,730 Ez nem igazán áll rendelkezésre bármilyen felhasználható divat 107 00:06:16,730 --> 00:06:19,520 más rendszerek, illetve Más számítógépek használata, 108 00:06:19,520 --> 00:06:21,500 Nem a rendszerek belül A Harvard Library, 109 00:06:21,500 --> 00:06:24,890 de rendszereket a külvilág, Csak más emberek általában. 110 00:06:24,890 --> 00:06:30,210 A kérdés tehát az, hogyan tudjuk hozzáférhetővé teszi a számítógépek 111 00:06:30,210 --> 00:06:33,560 hogy többre vagyunk képesek érdekes cucc vele, mint 112 00:06:33,560 --> 00:06:36,550 böngészés magunk? 113 00:06:36,550 --> 00:06:39,766 >> Szóval miért is akarja ezt? 114 00:06:39,766 --> 00:06:41,140 Van egy csomó lehetőséget. 115 00:06:41,140 --> 00:06:43,980 Az egyik az, meg tudná építeni egy teljesen másfajta böngészés 116 00:06:43,980 --> 00:06:46,962 A tartalmakat, amelyek rendelkezésre a Harvard könyvtárak. 117 00:06:46,962 --> 00:06:48,670 Megmutatom az egyik későbbi nevén Stacklife, 118 00:06:48,670 --> 00:06:52,440 amely egy teljesen más hogy a keresett tartalmat. 119 00:06:52,440 --> 00:06:54,560 >> Lehet építeni egy ajánlást motort. 120 00:06:54,560 --> 00:06:57,955 Tehát Harvard Library nem a üzleti mondván, tetszik ez a könyv. 121 00:06:57,955 --> 00:07:01,080 Akkor menj vessen egy pillantást a 17 egyéb könyv, amit lehet, hogy érdekel 122 00:07:01,080 --> 00:07:03,200 vagy a 18 más képeket. 123 00:07:03,200 --> 00:07:06,040 De ez bizonyosan lehet hasznos jellemző. 124 00:07:06,040 --> 00:07:09,272 És mivel a metaadatok, akkor: lehet tenni, hogy össze. 125 00:07:09,272 --> 00:07:11,980 Lehet, hogy különböző szükségleteknek tekintetében keresi a tartalmat, 126 00:07:11,980 --> 00:07:16,200 mint talán annak ellenére, hogy milyen eszközöket állnak rendelkezésre, hogy a könyvtár létrehozása 127 00:07:16,200 --> 00:07:18,450 rendelkezésre, akkor érdemes keresni másképp 128 00:07:18,450 --> 00:07:21,847 vagy optimalizálni egy adott felhasználásra esetben, ami lehet, hogy nagyon speciális. 129 00:07:21,847 --> 00:07:23,930 Lehet, hogy csak néhány ember a világon, aki 130 00:07:23,930 --> 00:07:25,846 akar keresni a tartalmat ilyen módon, de 131 00:07:25,846 --> 00:07:28,985 Nagyszerű lenne, ha engedhette őket erre. 132 00:07:28,985 --> 00:07:30,860 Van egy csomó analitika mindössze, hogy az emberek 133 00:07:30,860 --> 00:07:33,860 használja a tartalma nem igazán Érdekes tudni, megtudja, 134 00:07:33,860 --> 00:07:37,280 milyen könyveket használnak, mi nem, és így tovább. 135 00:07:37,280 --> 00:07:41,670 És akkor ott van egy csomó lehetőséget, hogy integrálják 136 00:07:41,670 --> 00:07:45,210 Más információk hogy odakint az interneten. 137 00:07:45,210 --> 00:07:46,880 Tehát have-- 138 00:07:46,880 --> 00:07:50,260 >> Például, NPR rendelkezik a könyvkritika szegmens, 139 00:07:50,260 --> 00:07:53,090 ahol interjút szerzők könyvekről. 140 00:07:53,090 --> 00:07:56,837 És ez így jó lenne, ha te lennél keres egy könyvet a Harvard 141 00:07:56,837 --> 00:07:59,670 Könyvtár, és azt mondod, OK, van volt egy interjú a szerző. 142 00:07:59,670 --> 00:08:00,878 Menjünk egy pillantást, hogy. 143 00:08:00,878 --> 00:08:05,461 Vagy ott van a Wikipedia oldalt, mint hiteles, tudományos hivatkozás 144 00:08:05,461 --> 00:08:07,710 ezt a könyvet, hogy Érdemes egy pillantást. 145 00:08:07,710 --> 00:08:12,600 >> Vannak ilyen típusú források szétszórva az interneten. 146 00:08:12,600 --> 00:08:16,555 És abban, lehet egy nagyszerű használata 147 00:08:16,555 --> 00:08:18,930 hogy valaki nézi a tartalmat, keres valamit. 148 00:08:18,930 --> 00:08:20,180 De ez nem is az fajta dolog, amit 149 00:08:20,180 --> 00:08:23,205 szeretné, hogy a könyvtár felelős megy le, és levadássza 150 00:08:23,205 --> 00:08:25,455 Ezeknek a különböző forrásokból és bedugjuk őket 151 00:08:25,455 --> 00:08:28,920 mert ők folyamatosan változik. 152 00:08:28,920 --> 00:08:33,570 És mit tartanak fontosnak május nem lehet, amit fontosnak tartasz. 153 00:08:33,570 --> 00:08:36,929 >> És még inkább, alapvetően van egy Sok dolgot még nem gondoltam még. 154 00:08:36,929 --> 00:08:42,222 Tehát, ha tudjuk megnyitni ezt fel, több az emberek mellett egy fél tucat, 155 00:08:42,222 --> 00:08:45,174 aki nézi ezt a rendszeresen lehet gondolni ötletek 156 00:08:45,174 --> 00:08:47,340 és masszírozza az adatokat, és csináljanak, amit akarnak vele. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> Tehát azt szeretnénk, hogy ez a adat, hogy a világon. 159 00:08:54,045 --> 00:08:55,670 Nos, van egy pár komplikációk. 160 00:08:55,670 --> 00:08:58,540 Az egyik az, hogy ez a metaadatok van a különböző rendszerekben. 161 00:08:58,540 --> 00:09:01,110 Ez különböző formátumokban. 162 00:09:01,110 --> 00:09:04,719 Szóval egy kis normalizálása amelynek meg kell történnie, 163 00:09:04,719 --> 00:09:08,010 amely normalizálás a folyamat így a dolgokat különböző formátumokban 164 00:09:08,010 --> 00:09:12,940 feltérképezése, hogy egységes formátumban úgy, hogy a mezők meg fognak egyezni. 165 00:09:12,940 --> 00:09:15,160 >> Vannak szerzői jogi korlátozások. 166 00:09:15,160 --> 00:09:21,010 Furcsa módon, a katalógusívet egy könyvet felel a szerzői jog. 167 00:09:21,010 --> 00:09:24,060 Így aztán, bár ez csak származó információk könyvet, 168 00:09:24,060 --> 00:09:25,330 ez a szerzői jogvédelem. 169 00:09:25,330 --> 00:09:28,400 És attól függően, akik ténylegesen létre, hogy a metaadatok, 170 00:09:28,400 --> 00:09:32,175 korlátozások lehetnek arról, hogy kik terjeszthető, hasonló to-- 171 00:09:32,175 --> 00:09:33,402 >> Nem tudom. 172 00:09:33,402 --> 00:09:36,110 Ez lehet vagy nem lehet hasonló a A helyzet a dalszövegeket, 173 00:09:36,110 --> 00:09:36,610 például. 174 00:09:36,610 --> 00:09:38,560 Szóval mindannyian tudjuk, hogyan, hogy serpenyők ki. 175 00:09:38,560 --> 00:09:40,450 Tehát meg kell hogy körül, hogy a kérdést. 176 00:09:40,450 --> 00:09:44,910 >> És akkor egy másik darab hogy van egy csomó adat. 177 00:09:44,910 --> 00:09:52,420 Tehát, ha én vagyok, aki dolgozni akar az adatokkal, vagy van egy jó ötlet, 178 00:09:52,420 --> 00:09:55,350 foglalkozó 14 millió nyilvántartást a laptopomon 179 00:09:55,350 --> 00:09:57,487 problémás lehet és nehezen kezelhető. 180 00:09:57,487 --> 00:09:59,320 Tehát szeretnénk csökkenteni Az emberek előtti akadályok 181 00:09:59,320 --> 00:10:02,130 hogy képes dolgozni az adatokkal. 182 00:10:02,130 --> 00:10:07,880 >> Tehát az a megközelítés, hogy remélhetőleg címek az összes ilyen aggályok is két részből áll. 183 00:10:07,880 --> 00:10:11,770 Az egyik épület egy platform, amely úgy az adatokat az összes ezeket a különböző eredetű 184 00:10:11,770 --> 00:10:14,350 és súlyosbítja azt, normalizálja, gazdagítja, és teszi 185 00:10:14,350 --> 00:10:16,650 elérhetővé egy helyen. 186 00:10:16,650 --> 00:10:20,950 És ez teszi elérhetővé a nyilvános API, hogy az emberek hívhatják. 187 00:10:20,950 --> 00:10:24,430 >> Így egy API egy Application Programming Interface. 188 00:10:24,430 --> 00:10:28,930 És ez alapvetően utal, hogy a végpont, hogy a rendszer vagy technológia 189 00:10:28,930 --> 00:10:31,720 lehet hívni, és kap adatokat vissza strukturált formában oly módon, 190 00:10:31,720 --> 00:10:32,900 hogy fel lehet használni. 191 00:10:32,900 --> 00:10:36,060 Tehát ez nem függ megy, hogy egy website 192 00:10:36,060 --> 00:10:37,970 és kaparás adatok off IT, például. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> Szóval ez a kezdőlapja A Library Cloud Elem API, 195 00:10:45,010 --> 00:10:47,220 amely lényegében a verzió kettő. 196 00:10:47,220 --> 00:10:50,130 Szóval ez a második közelítése törekedjünk, hogy az összes adat 197 00:10:50,130 --> 00:10:53,280 áll a világ. 198 00:10:53,280 --> 00:10:59,560 Tehát http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 És csak azért, hogy megtörje ezt le egy kicsit, hogy ez mit jelent 200 00:11:03,830 --> 00:11:06,115 az, hogy ez a változata két az API-t. 201 00:11:06,115 --> 00:11:08,490 Van egy változata az egyik, ami Nem fogok beszélni. 202 00:11:08,490 --> 00:11:09,750 De van egy változata az egyik. 203 00:11:09,750 --> 00:11:14,740 >> És ha hívsz erre API, akkor kapok tételek. 204 00:11:14,740 --> 00:11:20,640 És részben az elképzelést, API egy API egy szerződést. 205 00:11:20,640 --> 00:11:23,440 Ez valami olyasmi, ami nem fog megváltozni. 206 00:11:23,440 --> 00:11:24,850 Így például - 207 00:11:24,850 --> 00:11:27,410 >> És az ok az, hogy ha én építeni valamilyen rendszer 208 00:11:27,410 --> 00:11:33,210 fogja használni a könyvtár cloud API megjelenítésére könyvek, vagy segítsen az embereknek megtalálni 209 00:11:33,210 --> 00:11:36,190 információs egyedülálló módon, amit nem szeretnénk, hogy megtörténjen 210 00:11:36,190 --> 00:11:38,940 van, hogy menjünk módosításához hogy az API működik, és hirtelen 211 00:11:38,940 --> 00:11:41,340 mindent megtöri a végfelhasználó oldalán. 212 00:11:41,340 --> 00:11:46,710 Így része, ha még van API áll a világon, ez 213 00:11:46,710 --> 00:11:49,396 Jó gyakorlat, hogy egy verziószám benne, hogy az emberek 214 00:11:49,396 --> 00:11:51,020 tudja, milyen verziójú ők foglalkoznak. 215 00:11:51,020 --> 00:11:54,300 >> Tehát, ha úgy döntünk, hogy talál egy jobb módja Az, hogy ez a rendelkezésre álló információk, 216 00:11:54,300 --> 00:11:57,295 talán változtatni, hogy a nevezném verziója három. 217 00:11:57,295 --> 00:11:59,920 Tehát mindenki, aki még mindig használ verziója a másik, hogy akkor is működik. 218 00:11:59,920 --> 00:12:03,490 De verzió hárman az összes új cucc. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> Tehát ez egy API, de ez Tényleg úgy néz ki, mint egy URL-t. 221 00:12:09,210 --> 00:12:11,680 És akkor mi ez a Például az az, ami 222 00:12:11,680 --> 00:12:16,615 úgynevezett pihenés API, amely elérhető több mint csak egy sima webes kapcsolat. 223 00:12:16,615 --> 00:12:19,680 És tulajdonképpen lépjünk be a böngészőben. 224 00:12:19,680 --> 00:12:28,550 >> Tehát itt Épp most megnyílt Firefox és elment api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 És akkor mi van kapok itt Alapvetően az első oldalon 226 00:12:31,560 --> 00:12:34,740 Az eredmények a teljes elemek halmaza, hogy megvan. 227 00:12:34,740 --> 00:12:37,460 És ez itt, XML formátumban. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 És ez is volt prettified a Firefox. 230 00:12:42,210 --> 00:12:45,850 Ez valójában nem rendelkezik az összes ilyen kicsit bővítése és szerződéskötési 231 00:12:45,850 --> 00:12:47,880 doohickeys itt. 232 00:12:47,880 --> 00:12:52,520 Ez a fajta egy szebb verzió módja annak, hogy nézd meg. 233 00:12:52,520 --> 00:12:57,040 >> De mi ez azt mondja nekünk, Már kért összes elemet. 234 00:12:57,040 --> 00:13:03,120 Tehát vannak 13.289.475 tételeket. 235 00:13:03,120 --> 00:13:06,150 És nézem az első 10, pozícióban kezdődő nulla 236 00:13:06,150 --> 00:13:09,760 mert a számítógép-tudomány mindig nulláról indulnak. 237 00:13:09,760 --> 00:13:15,150 És mi van itt, ha én csak összeomlik ez az, látni fogod, kaptam 10 darab. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> És ha veszek egy pillantást egy elemet, tudom látni, hogy kaptam információt róla. 240 00:13:25,210 --> 00:13:27,400 És ez az, amit a neve MODS formában. 241 00:13:27,400 --> 00:13:30,860 És így fogok váltani vissza ide egy pillanatra. 242 00:13:30,860 --> 00:13:33,750 OK. 243 00:13:33,750 --> 00:13:37,447 >> Úgyhogy keresni valamit egyedi, mert az első elem, hogy 244 00:13:37,447 --> 00:13:40,030 történik, hogy jöjjön fel, ha megnézed az egész gyűjtemény 245 00:13:40,030 --> 00:13:41,750 , definíció szerint, véletlenszerű. 246 00:13:41,750 --> 00:13:44,550 Szóval nézzük néhány fánkot. 247 00:13:44,550 --> 00:13:46,830 Oh. 248 00:13:46,830 --> 00:13:49,190 >> OK. 249 00:13:49,190 --> 00:13:49,940 Tehát fánkot. 250 00:13:49,940 --> 00:13:55,360 Tehát ott talált 80 db A gyűjtemény hivatkozó fánkot. 251 00:13:55,360 --> 00:13:57,150 Megnézzük az első közülük 10. 252 00:13:57,150 --> 00:14:01,890 Most, itt látható az is, hogy Azt mondtam, én keresek fánk, 253 00:14:01,890 --> 00:14:04,400 Én csak hozzá valamit A lekérdezés szöveg az URL. 254 00:14:04,400 --> 00:14:09,680 Tehát q egyenlő fánk, amit lehet hogy egy kicsit könnyebben itt. 255 00:14:09,680 --> 00:14:12,131 >> És ez alapvetően azt jelenti, van a spec az API, amely 256 00:14:12,131 --> 00:14:13,880 meghatározza, hogy mi minden Ezeket a paramétereket jelenti. 257 00:14:13,880 --> 00:14:17,150 És ez azt jelenti, megyünk keresni mindent fánkot. 258 00:14:17,150 --> 00:14:24,910 >> Tehát az első elem itt van láthatjuk a cím Donuts, 259 00:14:24,910 --> 00:14:29,310 és van egy alcím úgynevezett American Passion, ami, azt hiszem, 260 00:14:29,310 --> 00:14:31,610 megfelelő. 261 00:14:31,610 --> 00:14:36,134 Van egy csomó different-- 262 00:14:36,134 --> 00:14:38,050 Ha egyszer kap arra a pontra, Az adat beszerzésével, 263 00:14:38,050 --> 00:14:41,020 van egy csomó más formátumokat, hogy lehet kapni azt. 264 00:14:41,020 --> 00:14:44,050 És vannak más erősségeit és gyengeségeit mindannyiuk számára. 265 00:14:44,050 --> 00:14:49,000 Tehát ez az egyik, akkor láthatjuk, Itt, ebben a formában nagyon gazdag. 266 00:14:49,000 --> 00:14:51,946 És ez szabványosított. 267 00:14:51,946 --> 00:14:55,040 >> Szóval van egy konkrét címet mező, a felirat mezőbe. 268 00:14:55,040 --> 00:14:58,950 Van egy másik cím, An American Passion. 269 00:14:58,950 --> 00:15:01,650 Van a név társul hozzá. 270 00:15:01,650 --> 00:15:03,120 Az erőforrás típusát szöveg. 271 00:15:03,120 --> 00:15:06,070 Van egy csomó információt Itt ebben a formátumban. 272 00:15:06,070 --> 00:15:09,480 >> De van egy csomó A különböző formátumok. 273 00:15:09,480 --> 00:15:11,920 Tehát mi voltunk, csak néztem egy olyan formátum 274 00:15:11,920 --> 00:15:17,700 nevű mod, amelynek jelentése Metaadat Object Description Service, 275 00:15:17,700 --> 00:15:18,250 potenciálisan. 276 00:15:18,250 --> 00:15:23,030 Én tényleg nem vagyok egészen biztos a S. De ez egy meglehetősen komplex formában. 277 00:15:23,030 --> 00:15:24,240 Ez az alapértelmezett formátum. 278 00:15:24,240 --> 00:15:30,260 >> De ez az egyetlen, ami megtartja gazdagságát az összes adatot 279 00:15:30,260 --> 00:15:33,820 hogy a könyvtár, mert nagyon közel van ahhoz, amit 280 00:15:33,820 --> 00:15:35,110 A könyvtár házon belül használt. 281 00:15:35,110 --> 00:15:39,030 Ez egy alap, amely használt szerte az országban, 282 00:15:39,030 --> 00:15:40,944 az egész világ felsőoktatási könyvtárak. 283 00:15:40,944 --> 00:15:42,110 És ez nagyon átjárható. 284 00:15:42,110 --> 00:15:44,852 Tehát, ha már van egy dokumentum ez a MODS formátumban, 285 00:15:44,852 --> 00:15:47,560 tudod adni, hogy valaki másnak akinek rendszerek megérteni MODS, 286 00:15:47,560 --> 00:15:48,518 és ők is importálni. 287 00:15:48,518 --> 00:15:50,840 Tehát ez egy alap. 288 00:15:50,840 --> 00:15:54,250 Ez nagyon jól definiált, nagyon különleges. 289 00:15:54,250 --> 00:15:58,980 És ez az, ami átjárható, mert ha valaki azt mondja, 290 00:15:58,980 --> 00:16:04,930 ez az alternatív címe annak a rekord, mindenki tudja, hogy ez mit jelent. 291 00:16:04,930 --> 00:16:07,740 Az érem másik oldala, hogy nagyon bonyolult. 292 00:16:07,740 --> 00:16:13,160 >> Tehát ha megnézed Ebben nyilvántartania, 293 00:16:13,160 --> 00:16:15,320 ha csak azt, hogy a Cím ennek a dokumentumnak, 294 00:16:15,320 --> 00:16:21,150 Ennek a könyvnek, ami valószínűleg Donuts, Egy amerikai Passion, értelmezési ki 295 00:16:21,150 --> 00:16:22,940 egy kis részt. 296 00:16:22,940 --> 00:16:27,380 Mivel van egy másik formában nevű Dublin Core, 297 00:16:27,380 --> 00:16:29,730 ami egy sokkal, sokkal egyszerűbb formátum. 298 00:16:29,730 --> 00:16:33,764 >> És így itt látsz, nincs cím, alcím, alternatív címet. 299 00:16:33,764 --> 00:16:35,930 Már csak a cím, Donuts, An American Passion, 300 00:16:35,930 --> 00:16:38,780 és egy másik címet, American Passion. 301 00:16:38,780 --> 00:16:42,907 Tehát, ha keres, hogy milyen formában azt szeretné, hogy az adatokat ki, 302 00:16:42,907 --> 00:16:44,740 Sok függ attól, hogyan fogsz használni. 303 00:16:44,740 --> 00:16:46,573 Ön használja az interoperabilitás vagy szeretné 304 00:16:46,573 --> 00:16:49,970 szeretnénk valami egyszerű, hogy Lehet, hogy könnyebb dolgozni? 305 00:16:49,970 --> 00:16:56,002 >> Az érem másik oldala, sok a részletek kap egyfajta összenyomva le. 306 00:16:56,002 --> 00:16:58,460 Lehet, hogy elveszíti az árnyalatok amit az adott területen úton 307 00:16:58,460 --> 00:17:02,960 Ha van dolgunk, Dublin Core, amit nem kap a MODS. 308 00:17:02,960 --> 00:17:06,462 Tehát ezek két formátum akkor gyere ki a API. 309 00:17:06,462 --> 00:17:08,920 És alapvetően, mi tartja ez a színfalak mögött a MODS. 310 00:17:08,920 --> 00:17:14,179 De mi adhat meg a MODS és Dublin Core és bármi mást is. 311 00:17:14,179 --> 00:17:16,470 A másik szempont, amikor keres az adatokat 312 00:17:16,470 --> 00:17:21,210 van aki hozzá tud jutni, mint akár JSON, amelyek jelentése JavaScript Object Notation, 313 00:17:21,210 --> 00:17:24,720 vagy XML, amelynek jelentése Extensible Markup Language. 314 00:17:24,720 --> 00:17:30,080 És ezek az adatok ábrázolások mind pontosan ugyanazokat az adatokat, hogy pontosan 315 00:17:30,080 --> 00:17:31,080 ugyanazon területre. 316 00:17:31,080 --> 00:17:33,644 De ők csak mondattanilag más. 317 00:17:33,644 --> 00:17:40,401 >> Tehát ez a-- 318 00:17:40,401 --> 00:17:41,400 Nos, nézzük csak váltani. 319 00:17:41,400 --> 00:17:47,490 Szóval ez a mi Kérdés fánk XML formátumban. 320 00:17:47,490 --> 00:17:53,470 Ha én csak be kell kapcsolnia, hogy ez JSON, Látom másképp néz ki. 321 00:17:53,470 --> 00:17:58,580 Tehát most ez ugyanaz a tartalom, de egy eltérő szerkezetű. 322 00:17:58,580 --> 00:18:00,080 Kevesebb a szögletes zárójelet. 323 00:18:00,080 --> 00:18:02,530 Van kevésbé lesznek beszédesek. 324 00:18:02,530 --> 00:18:06,440 >> És ez egy olyan formátum, ha dolgozik a webes környezetben, 325 00:18:06,440 --> 00:18:09,680 Ön nagy valószínűséggel lesz szeretnénk használni, mert az egyik 326 00:18:09,680 --> 00:18:12,630 A szép dolog JSON ez kompatibilis JavaScript. 327 00:18:12,630 --> 00:18:17,680 Tehát ha írok web app, tudom húzni JSON és csak dolgozni vele közvetlenül. 328 00:18:17,680 --> 00:18:20,187 Mivel az XML, ez egy kicsit bonyolultabb. 329 00:18:20,187 --> 00:18:21,520 Tehát még egyszer: ezek mind hasznosak. 330 00:18:21,520 --> 00:18:26,387 Ők csak különböző használati esetek ahol az emberek lehet, hogy használni őket. 331 00:18:26,387 --> 00:18:26,886 OK. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 Szóval vissza az API. 334 00:18:31,680 --> 00:18:32,900 Így lehet keresni for-- 335 00:18:32,900 --> 00:18:36,220 >> Adok egy példát keres fánkot. 336 00:18:36,220 --> 00:18:39,330 Azt is keresni csak egy Különösen a területen belül van. 337 00:18:39,330 --> 00:18:41,310 Tehát nem azt keressük, az egész rekordot, 338 00:18:41,310 --> 00:18:43,870 Én is csak keresni a cím mezőt. 339 00:18:43,870 --> 00:18:48,810 És így most van 25 dolog, Van fánk a cím, amelyek közül az egyik 340 00:18:48,810 --> 00:18:52,430 kb helyreállítása vizes élőhelyek kezelése 341 00:18:52,430 --> 00:18:54,990 A lyuk a fánk programot, ami valószínűleg 342 00:18:54,990 --> 00:18:58,970 nem feltétlenül az, amit keresünk Mert amikor a keresendő fánkot. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> Azt is, ha éppen Foglalkozó API-- 345 00:19:05,490 --> 00:19:08,827 >> Része, amelynek API ad az emberek hozzáférést nagy adathalmazok. 346 00:19:08,827 --> 00:19:11,410 És van egy pár más eszközöket lehet használni erre. 347 00:19:11,410 --> 00:19:14,170 Az egyik az, nagyon leegyszerűsítve: oldalon keresztül az adatokat. 348 00:19:14,170 --> 00:19:17,340 Ahogyan tehát ha csinálsz egy lekérdezést webes felületen keresztül, 349 00:19:17,340 --> 00:19:19,470 akkor nézd meg az egyik oldalon, oldal két oldal három. 350 00:19:19,470 --> 00:19:22,040 Meg tudod csinálni ugyanazt dolog az API. 351 00:19:22,040 --> 00:19:24,150 Csak azt kell lennie explicit hogyan csinálod. 352 00:19:24,150 --> 00:19:29,511 >> Így például, ha én keresem életem első lekérdezés itt, 353 00:19:29,511 --> 00:19:32,510 ahol csinálok egy keresést a dolgokat A fánk a címben, azt mondhatom, 354 00:19:32,510 --> 00:19:35,415 és határérték egyenlő a 20, ami azt jelenti, hogy nekem az első 20 rekordokat, nem 355 00:19:35,415 --> 00:19:38,540 Az első 10, ami az alapértelmezett, mert meg akarom nézni 20 egy időben. 356 00:19:38,540 --> 00:19:43,435 Vagy azt mondhatom, meg a kezdeni egyenlő 20 és határérték 357 00:19:43,435 --> 00:19:47,150 egyenlő a 20, ami megadja nekem rögzíti a 21-től 40. 358 00:19:47,150 --> 00:19:52,680 >> Szóval azt hiszem, a dolog hogy elvegye itt 359 00:19:52,680 --> 00:19:57,290 hogy mi használ a lekérdezés húrok paraméterek beállítását a query. 360 00:19:57,290 --> 00:20:02,760 És ez lehetővé teszi, vezérlő mit kap vissza. 361 00:20:02,760 --> 00:20:05,980 >> Egy másik eszköz, melynek segítségével, - 362 00:20:05,980 --> 00:20:09,250 >> És ez tényleg hasznos szempontjából vizsgálja az adatokat. 363 00:20:09,250 --> 00:20:10,840 >> --is úgynevezett faceting. 364 00:20:10,840 --> 00:20:15,530 Tehát a kifejezés faceting van nem feltétlenül közös. 365 00:20:15,530 --> 00:20:16,880 De ha már az összes látták. 366 00:20:16,880 --> 00:20:18,630 Ha egy pillantást Amazon, például, 367 00:20:18,630 --> 00:20:20,870 és nem a keresés a fánk könyvek, 368 00:20:20,870 --> 00:20:27,080 Itt van egy könyvsorozat, és ők kategóriák szerint csoportosított, 369 00:20:27,080 --> 00:20:30,470 és megkapod a különböző kategóriákban, és hány könyvet minden kategóriában 370 00:20:30,470 --> 00:20:31,330 jelennek meg. 371 00:20:31,330 --> 00:20:33,420 >> Tehát ez alapvetően egy aspektusa. 372 00:20:33,420 --> 00:20:37,570 Veszel minden könyvet, az 1800 könyvek, amelyek megfelelnek a fánk az Amazon-on. 373 00:20:37,570 --> 00:20:39,820 Közülük 12 a reggeli kategóriában. 374 00:20:39,820 --> 00:20:43,100 21 cukrászati ​​és sütés, és így tovább és így tovább. 375 00:20:43,100 --> 00:20:47,670 >> Szóval ez tényleg hasznos eszköze, hogy felfedezzük a tartalmat 376 00:20:47,670 --> 00:20:53,260 a könyvtár is mert ha megnézzük színesíti, 377 00:20:53,260 --> 00:20:56,520 ez ad ön egy eszme, milyen tantárgyakat létezik, mint a milyen típusú tárgyak 378 00:20:56,520 --> 00:20:58,510 a legnépszerűbb belül a Lekérdezéskészlet. 379 00:20:58,510 --> 00:21:00,950 És ez segít elhajtani, és fedezze fel. 380 00:21:00,950 --> 00:21:02,770 Így tudjuk ugyanezt csinálja. 381 00:21:02,770 --> 00:21:05,940 >> Ha azt akarjuk, hogy a API és nézd meg arcát, 382 00:21:05,940 --> 00:21:08,950 adunk egy másik paramétert barátunk a query string. 383 00:21:08,950 --> 00:21:12,540 Tehát arcát egyenlő vesszővel elválasztva listát, hogy mit akarunk színesíti tovább. 384 00:21:12,540 --> 00:21:14,790 Tehát az egyik aspektusát lehetnek kitéve. 385 00:21:14,790 --> 00:21:16,565 A másik lehet a nyelvet. 386 00:21:16,565 --> 00:21:19,665 És így ha futunk, hogy kérdésére, get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 Úgy néz ki, nagyjából ugyanaz itt. 389 00:21:24,830 --> 00:21:29,010 De már hozzá, hogy a végén A lista egy sor oldalait. 390 00:21:29,010 --> 00:21:34,060 Tehát van egy aspektus nevű téma. 391 00:21:34,060 --> 00:21:40,250 Tehát ez azt mondja nekünk, hogy ha nézek én 80 eredmények a fánk lekérdezés, 392 00:21:40,250 --> 00:21:42,100 13 közülük a alá Egyesült Államokban. 393 00:21:42,100 --> 00:21:43,684 Három van a témában fánkot. 394 00:21:43,684 --> 00:21:45,600 Három van a témában A vizes élőhelyek helyreállítása, 395 00:21:45,600 --> 00:21:47,720 amely lehet a lyuk a fánk. 396 00:21:47,720 --> 00:21:51,780 Ezek közül kettő, a Simpsons, és így tovább és így tovább. 397 00:21:51,780 --> 00:21:59,211 >> Tehát ez hasznos lehet, ha szeretné szűkíteni a keresést. 398 00:21:59,211 --> 00:22:00,210 Ez segíthet csinálni. 399 00:22:00,210 --> 00:22:03,580 Különösen, ha van több mint, mondjuk, 80 db. 400 00:22:03,580 --> 00:22:05,980 >> Hasonlóképpen, mi is megkérdeztük A metszettel nyelven. 401 00:22:05,980 --> 00:22:14,790 Tehát ha megnézzük Eredményeink azt látjuk, 76 közülük angolul, négy francia, 402 00:22:14,790 --> 00:22:19,620 Két spanyol, két, azt hiszem, ez meghatározatlan vagy ismeretlen, holland és latin. 403 00:22:19,620 --> 00:22:22,830 Szóval azt hiszem, a latin- fánk eredmény, ismét, 404 00:22:22,830 --> 00:22:24,922 semmi köze a péksütemények. 405 00:22:24,922 --> 00:22:25,630 De tessék. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> Tehát ez a fajta, amely megmutatja, hogyan lehet húzni a tartalmat vissza 408 00:22:38,630 --> 00:22:41,270 A API csak a böngésző, ami nagyszerű. 409 00:22:41,270 --> 00:22:44,320 De ez nem igazán mit akar általában használ API érte. 410 00:22:44,320 --> 00:22:48,710 Tehát az egyik példa arra, hogyan ténylegesen ennek az, én már 411 00:22:48,710 --> 00:22:54,720 írt egy szuper kis program, ami megint nem az én fánk keresés 412 00:22:54,720 --> 00:22:59,010 és kiválasztja pár mezők és megjeleníti őket egy asztalhoz. 413 00:22:59,010 --> 00:23:01,610 Tehát ez nagyon is ugyanazt a tartalmat, hogy mi csak 414 00:23:01,610 --> 00:23:04,830 fűrészt néhány területen húzni. 415 00:23:04,830 --> 00:23:12,090 Tehát tételek listája, a helyét, amit a könyv 416 00:23:12,090 --> 00:23:15,120 szól, a nyelv, és így tovább és így tovább. 417 00:23:15,120 --> 00:23:20,480 >> Szóval hogyan is történt valójában, hiszen Azt hiszem, meg kell nézni néhány kódot, 418 00:23:20,480 --> 00:23:22,420 ez-- 419 00:23:22,420 --> 00:23:28,060 >> Mi van itt egy egyszerű HTML oldal, amely megjeleníti a szöveget, 420 00:23:28,060 --> 00:23:32,900 Üdvözöljük a könyvtár felhő és majd megjeleníti az eredményeket. 421 00:23:32,900 --> 00:23:37,790 És vannak természetesen nem eredményez A táblázat, ha az oldal betöltődik. 422 00:23:37,790 --> 00:23:41,380 De mit csinálunk az, először is, mi 423 00:23:41,380 --> 00:23:46,290 tölt nevű könyvtárat jQuery, ami alapvetően 424 00:23:46,290 --> 00:23:52,030 egy JavaScript könyvtár, ami miatt nagyon könnyű manipulálni JavaScript 425 00:23:52,030 --> 00:23:58,780 natívan, HTML, és hozzon létre weboldalakat, kliens-oldali logika és a weboldalakat. 426 00:23:58,780 --> 00:24:01,595 >> Tehát mi van itt van jQuery van egy módszer az úgynevezett Get, 427 00:24:01,595 --> 00:24:05,270 amely lényegében megy egy URL-t, amely, ebben az esetben, 428 00:24:05,270 --> 00:24:09,070 ez ismerős keres URL. 429 00:24:09,070 --> 00:24:14,440 És akkor majd kap a tartalmat hogy URL majd futtassa a függvényt. 430 00:24:14,440 --> 00:24:19,240 És azt mondtuk menjen api.lib.harvard / edu. 431 00:24:19,240 --> 00:24:20,060 Keresés a fánk. 432 00:24:20,060 --> 00:24:21,300 Adj nekünk 20 rekordokat. 433 00:24:21,300 --> 00:24:28,590 És futtassa ezt a funkciót, amely Már kiválasztott, átadva az adatokat. 434 00:24:28,590 --> 00:24:34,430 És ezek az adatok a JSON hogy kapott vissza az API. 435 00:24:34,430 --> 00:24:40,120 >> És akkor azt mondjuk, azon belül is adatokat van egy mező nevű elemet. 436 00:24:40,120 --> 00:24:48,117 És ha elmegyek egy pillantást vissza egy ilyen eredmény, hogy itt van, 437 00:24:48,117 --> 00:24:49,200 van valami called-- 438 00:24:49,200 --> 00:24:50,220 >> Nos, ezt hívják elemet. 439 00:24:50,220 --> 00:24:53,520 Szóval, hogy lehet, hogy. 440 00:24:53,520 --> 00:25:01,840 És mit csinál ez áthalad minden elem 441 00:25:01,840 --> 00:25:05,300 majd felhívja a másik funkciót minden egyes darabjáról. 442 00:25:05,300 --> 00:25:08,440 És ez a funkció alapvetően vesz az értéket 443 00:25:08,440 --> 00:25:12,010 A tétel, amely a Lényegében az egyéni rekordja 444 00:25:12,010 --> 00:25:18,220 és lehetővé teszi számunkra, hogy húzza ki a címet, A lefedettség és a nyelvet. 445 00:25:18,220 --> 00:25:21,640 >> Tehát meg a funkció minden elemet, amit értem vissza az API. 446 00:25:21,640 --> 00:25:25,397 És ha csak egy pillantást ez a darab itt, 447 00:25:25,397 --> 00:25:27,230 mit csinálunk a hozunk létre egy húr, 448 00:25:27,230 --> 00:25:31,810 amely lényegében néhány HTML jelölőnyelv egy asztal körül, a value.title, 449 00:25:31,810 --> 00:25:35,790 ami a címe a objektumot, value.coverage, 450 00:25:35,790 --> 00:25:36,790 amely a lefedettség, - 451 00:25:36,790 --> 00:25:38,225 >> És csinálunk egy csekket ide, akik a meghatározatlan 452 00:25:38,225 --> 00:25:40,570 és elrejti azt, ha azt mondja nem definiált, mert nem vagyunk igazán érdekel 453 00:25:40,570 --> 00:25:41,600 abban. 454 00:25:41,600 --> 00:25:42,939 >> --and majd a nyelvet. 455 00:25:42,939 --> 00:25:44,730 És akkor mi vagyunk Ennek van hozzáfűzve, hogy 456 00:25:44,730 --> 00:25:48,510 hogy a tábla, amely azonosíthatók karakterlánc itt. 457 00:25:48,510 --> 00:25:50,790 És hogyan jQuery működik amit ez mond 458 00:25:50,790 --> 00:25:56,420 van keresni az asztalra ötlet eredményeket, és ezt a szöveget hozzá. 459 00:25:56,420 --> 00:25:59,380 És ez az asztal ötlet eredménye. 460 00:25:59,380 --> 00:26:04,998 Tehát amit a végén A ez az oldal itt. 461 00:26:04,998 --> 00:26:06,206 És annak érdekében, hogy megtekinthesse source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 Nos, a forrás valójában nem Frissített hogy ez mikor történt. 464 00:26:13,810 --> 00:26:18,740 Szóval lehet látni a tényleges eredményeit a táblázat itt mégis. 465 00:26:18,740 --> 00:26:24,770 >> Tehát ez csak egy egyszerű példa Ennek egy nagyon egyszerű lekérdezést a API 466 00:26:24,770 --> 00:26:29,020 és az információ megjelenítése valamilyen más alkotnak, és nem csinál semmit túl díszes. 467 00:26:29,020 --> 00:26:36,370 Most egy másik példa olyan, mint egy alkalmazás által írt David Weinberger 468 00:26:36,370 --> 00:26:39,120 mint egy demo ennek, ami Lényegében azt mutatja, 469 00:26:39,120 --> 00:26:44,620 hogyan lehet a cefre fel a kívánt eredményt kapok a könyvtárból cloud API 470 00:26:44,620 --> 00:26:46,250 a, mondjuk, a Google Books. 471 00:26:46,250 --> 00:26:52,225 >> És a gondolkodás az, hogy tudom futtasson egy lekérdezést a Google Books, 472 00:26:52,225 --> 00:26:56,060 kap egy teljes szöveges keresést, hogy néhány eredmény vissza, tudd meg, melyek azok a tételek 473 00:26:56,060 --> 00:27:01,180 valóban léteznek a Hollis, A könyvtári rendszer, 474 00:27:01,180 --> 00:27:03,200 majd adj linkek vissza az elemeket. 475 00:27:03,200 --> 00:27:12,730 Szóval, ha keresni, ez volt Egy sötét és viharos éjszakán, 476 00:27:12,730 --> 00:27:16,210 hogy újra egy csomó eredmények a Google, majd egy eredmény 477 00:27:16,210 --> 00:27:19,460 amely egy ránc az időben. 478 00:27:19,460 --> 00:27:29,330 És ezek a linkek könyvek létező a Harvard Library rendszert. 479 00:27:29,330 --> 00:27:32,160 >> Szóval azt hiszem, a lényeg itt nem annyira, hogy ez lehet, hogy nem 480 00:27:32,160 --> 00:27:34,118 lehet az is, hogy azt szeretnénk, keresni a könyvtár, 481 00:27:34,118 --> 00:27:38,310 de ez egy teljesen más hogy nem volt elérhető az Ön számára 482 00:27:38,310 --> 00:27:42,884 előtt, mint te nem volt módja a a teljes szöveg kutatása a könyveket, hogy még 483 00:27:42,884 --> 00:27:44,550 része volt a Harvard Library rendszert. 484 00:27:44,550 --> 00:27:46,870 Tehát most ez egy módja hogy meg tudod csinálni ezt. 485 00:27:46,870 --> 00:27:51,930 És akkor megjeleníti őket amit kívánt formátumot. 486 00:27:51,930 --> 00:27:55,990 Tehát a lényeg itt az, alapvetően, mi, hogy új lehetőségeket az emberek 487 00:27:55,990 --> 00:27:59,080 dolgozni az adatokat. 488 00:27:59,080 --> 00:28:07,925 >> Egy másik darab könyvtár felhő, hogy ez segít ki néhány, a felhasználási adatok 489 00:28:07,925 --> 00:28:08,800 hogy a könyvtár. 490 00:28:08,800 --> 00:28:12,630 Tehát, ha megy a könyvtárba, és keres könyvek, 491 00:28:12,630 --> 00:28:15,770 Nem feltétlenül valóban van egy ötlete, 492 00:28:15,770 --> 00:28:19,080 az összes elem egy adott témában, mit 493 00:28:19,080 --> 00:28:21,200 emberek tartózkodnak a közösség, legyen az 494 00:28:21,200 --> 00:28:24,890 meghatározása a Harvard vagy a ország vagy az osztály, 495 00:28:24,890 --> 00:28:26,421 ugyan mit találtam a leghasznosabbnak? 496 00:28:26,421 --> 00:28:28,920 És a könyvtár valójában egy csomó információt arról, hogy mi 497 00:28:28,920 --> 00:28:32,999 akkor a leghasznosabb, mert ha sokat Az ember megnézni egy könyvet, 498 00:28:32,999 --> 00:28:34,040 hogy megmondja neked valamit. 499 00:28:34,040 --> 00:28:36,498 Biztos volt valami miatt akarják, hogy ellenőrizze ki. 500 00:28:36,498 --> 00:28:38,270 Sokan tedd a tartalék. 501 00:28:38,270 --> 00:28:42,520 >> Ha ez a tartaléklistára a sok Az osztályok, hogy megmondja neked valamit. 502 00:28:42,520 --> 00:28:45,960 Ha oktatók ellenőrzik, hogy ki a sok és egyetemisták nem, 503 00:28:45,960 --> 00:28:47,200 hogy megmondja nekem valamit. 504 00:28:47,200 --> 00:28:49,280 Vice versa, hogy is mond neked valamit. 505 00:28:49,280 --> 00:28:54,680 Így lenne igazán érdekes, hogy tedd, hogy információt ott, és hagyja, 506 00:28:54,680 --> 00:28:59,969 használják az emberek, hogy segítsen nekik megtalálni működik a könyvtári rendszer. 507 00:28:59,969 --> 00:29:02,260 A másik oldala ennek az, van néhány komoly adatvédelmi 508 00:29:02,260 --> 00:29:07,854 aggodalmakat, mert az egyik core tanait a könyvtárban 509 00:29:07,854 --> 00:29:10,770 A nem fogunk kell mondani az emberek mások mit olvasnak. 510 00:29:10,770 --> 00:29:17,360 És akkor is, ha azt mondod, ez a könyv kivett négyszer 511 00:29:17,360 --> 00:29:20,070 egy adott hónapban, hogy fel lehetne használni 512 00:29:20,070 --> 00:29:25,252 link vissza egy adott személy de-anonimizáló adatok 513 00:29:25,252 --> 00:29:26,710 és azzal, ki ellenőriztük. 514 00:29:26,710 --> 00:29:30,792 Tehát az is, hogy tudjuk avoid-- 515 00:29:30,792 --> 00:29:33,750 Az így tudjuk megpróbálja kibontani Néhány jelet minden olyan információt, 516 00:29:33,750 --> 00:29:36,740 megsértése nélkül bárki adatvédelmi aggályok 517 00:29:36,740 --> 00:29:42,150 lényegében nézzük 10 éves használati adatok, - 518 00:29:42,150 --> 00:29:43,930 >> Tehát ez hosszú ideig. 519 00:29:43,930 --> 00:29:50,639 >> --and mondják, OK, lássuk, hogyan Sokszor ez a munka használták, 520 00:29:50,639 --> 00:29:52,930 és akik ezen időszak alatt az idő, majd lényegében 521 00:29:52,930 --> 00:29:56,300 adja vissza a számot, amit úgy hívunk egy köteg pontszámot, ami alapvetően 522 00:29:56,300 --> 00:29:59,910 megmutatja, mekkora, hogy már használják. 523 00:29:59,910 --> 00:30:01,084 És hogy number-- 524 00:30:01,084 --> 00:30:03,250 A sok különböző számítások bemegy a szám. 525 00:30:03,250 --> 00:30:05,150 --but ez egy nagyon durva metrikus, hogy megadja neked 526 00:30:05,150 --> 00:30:11,300 néhány ötlet, hogy a Közösség értékelheti, hogy a munka. 527 00:30:11,300 --> 00:30:16,772 >> És így egy másik fajta is több tartalommal megtölteni alkalmazás 528 00:30:16,772 --> 00:30:18,480 hogy kihasználja Ennek van valami 529 00:30:18,480 --> 00:30:24,000 nevű Stacklife, ami valójában érhetők el a fő Harvard 530 00:30:24,000 --> 00:30:24,880 Könyvtári portál. 531 00:30:24,880 --> 00:30:26,700 Szóval megy library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 Látni fogod, számos különböző módjait keresi a könyvtárban. 533 00:30:29,360 --> 00:30:32,300 És egyikük hívják Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> És ez egy olyan alkalmazás, amely böngészik a tartalom a könyvtár, 535 00:30:38,980 --> 00:30:43,490 de teljesen épül Ezen felül az API-k. 536 00:30:43,490 --> 00:30:46,910 Szóval nincs külön cucc folyik a színfalak mögött. 537 00:30:46,910 --> 00:30:49,570 Nincs hozzáférés adatokat, hogy nem kell. 538 00:30:49,570 --> 00:30:54,090 Ez a programozási felületek, hogy az Ön egy teljesen más böngészés 539 00:30:54,090 --> 00:30:55,480 tapasztalat. 540 00:30:55,480 --> 00:30:58,570 >> Szóval, ha keresni Alice Csodaországban Ebben az esetben, 541 00:30:58,570 --> 00:31:02,600 Kapok egy eredménye, hogy néz ki, mint ez az, ami elég much-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> Ez nagyon hasonló a más kereső talán nem, csak ebben az esetben 544 00:31:10,870 --> 00:31:15,730 mi rangsor a tételeket stackscore, amely megadja 545 00:31:15,730 --> 00:31:19,850 Néhány ötlet, hogyan népszerűbb ezekben tételek voltak a közösségen belül. 546 00:31:19,850 --> 00:31:25,610 És így egyértelműen, Alice in Wonderland Walt Disney nagyon népszerű. 547 00:31:25,610 --> 00:31:36,570 De azt is látni az első négy itt is lehet, hogy nem actually-- 548 00:31:36,570 --> 00:31:39,220 >> Dolgok nagyon használják, De lehet, hogy nem azonnal 549 00:31:39,220 --> 00:31:41,240 csatlakoztassa az Alice Csodaországban. 550 00:31:41,240 --> 00:31:44,650 Tehát a mi régi barát A Annotated Alice itt. 551 00:31:44,650 --> 00:31:46,350 Szóval lehet, hogy egy pillantást rá. 552 00:31:46,350 --> 00:31:52,010 És most mit keresek A alapvetően a beállított of-- 553 00:31:52,010 --> 00:31:53,760 Azt lehet jegyzetelt Alice itt. 554 00:31:53,760 --> 00:31:56,700 Van információt róla. 555 00:31:56,700 --> 00:32:00,230 És nekem is van egy stackscore Az ebben az esetben, 26. 556 00:32:00,230 --> 00:32:03,169 És ez azt súgja valami durván hogyan jutottunk el ezt a stackscore, 557 00:32:03,169 --> 00:32:05,835 mint aki utánanézett, mint például, hogy Sokszor azt kivették, 558 00:32:05,835 --> 00:32:08,440 mint a kar vagy a undergrads, hogyan sok példányban a könyvtár, 559 00:32:08,440 --> 00:32:11,300 és így tovább és így tovább. 560 00:32:11,300 --> 00:32:16,460 >> És akkor is, elég érdekes Itt böngészhet a halom virtuálisan. 561 00:32:16,460 --> 00:32:19,550 Így az adatok itt, ebben a mutatja rendezésnél 562 00:32:19,550 --> 00:32:23,547 a virtuális képviselet amit a polcon erejével 563 00:32:23,547 --> 00:32:25,880 kinézni, ha veszel minden könyvtár állománya 564 00:32:25,880 --> 00:32:28,940 és tedd össze egy végtelen polcon. 565 00:32:28,940 --> 00:32:30,990 És a szép az egészben az, hogy mi can-- 566 00:32:30,990 --> 00:32:33,380 >> Először is, a metaadatok ezekről a könyvekről 567 00:32:33,380 --> 00:32:35,627 Gyakran mondja, amikor közzétették. 568 00:32:35,627 --> 00:32:37,085 Azt mondja, hogy hány oldalt van. 569 00:32:37,085 --> 00:32:38,459 Lehet mondani, hogy a méretek. 570 00:32:38,459 --> 00:32:42,930 Tehát láthatjuk, ez tükröződik itt szempontjából a méret a könyveket. 571 00:32:42,930 --> 00:32:46,740 >> És akkor tudjuk használni a verem pontszám kiemelni 572 00:32:46,740 --> 00:32:49,170 A könyvek, amelyeket magasabb stack pontszámokat. 573 00:32:49,170 --> 00:32:54,930 Tehát ha ez sötétebb, az azt jelenti, hogy, Feltehetően elterjedtebb. 574 00:32:54,930 --> 00:32:57,040 Tehát ebben az esetben, én vagyok fog kitalálni, hogy ez a 575 00:32:57,040 --> 00:33:03,226 az a változat, az Alice Csodaországban amelyet nagyon gyakran használják, és a legtöbb 576 00:33:03,226 --> 00:33:05,100 elérhető, a könyvtár van a legtöbb példányban. 577 00:33:05,100 --> 00:33:06,975 Tehát, ha keres Alice in Wonderland, 578 00:33:06,975 --> 00:33:10,220 ez lehet egy jó kiindulópont lehet. 579 00:33:10,220 --> 00:33:13,500 >> És akkor itt is hivatkoznak arra, hogy, mondjuk, Amazon, hogy megvásárolja a könyvet, 580 00:33:13,500 --> 00:33:15,182 és így tovább és így tovább. 581 00:33:15,182 --> 00:33:17,140 A lényeg itt, ismét, nem annyira, hogy ez a 582 00:33:17,140 --> 00:33:25,030 a legjobb módja annak, hogy keresse a könyvtárban vagy a megfelelő eszköz minden alkalomra. 583 00:33:25,030 --> 00:33:28,400 De ez egy másik módja, hogy. 584 00:33:28,400 --> 00:33:31,359 Valamint azáltal, hogy az adatok keresztül elérhető egy API, amely 585 00:33:31,359 --> 00:33:34,650 készült nagyon egyszerű építőelemek, amely lehetővé teszi a keresést a tartalmat, 586 00:33:34,650 --> 00:33:39,420 meg lehet építeni valamit mint ez, amely 587 00:33:39,420 --> 00:33:41,520 pedig rendkívül értékes, hogy néhány ember. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> Szóval ez a fajta, mint én akarom, ezzel kapcsolatban mondani arról, hogy mi az API 590 00:33:51,860 --> 00:33:56,070 és mit kiteszi, van egy egész csomó dolgot a színfalak mögött, amely 591 00:33:56,070 --> 00:33:59,480 Én csak akar nyúlni a röviden csak azért, mert ez a fajta jön erre 592 00:33:59,480 --> 00:34:03,720 egy teljesen más szögben tekintve, hogy nem valami ilyesmi 593 00:34:03,720 --> 00:34:04,580 kap fel a helyére? 594 00:34:04,580 --> 00:34:10,820 >> Tehát egy API egy szabvány interfész minden a tartalom. 595 00:34:10,820 --> 00:34:13,820 De, hogy ott, a első dolog, amit meg kellett tennie 596 00:34:13,820 --> 00:34:17,260 ben húzza össze az információkat A könyvek és képek 597 00:34:17,260 --> 00:34:21,580 és a segédkönyvek, a gyűjtemény dokumentum különböző Harvard rendszerek. 598 00:34:21,580 --> 00:34:23,929 Aleph, VIA, az OASIS és a a nevét a rendszer. 599 00:34:23,929 --> 00:34:28,820 És lényegében bemegy egy gázvezeték, a feldolgozó rendszer. 600 00:34:28,820 --> 00:34:33,230 >> Tehát először is, kapunk export fájlok az összes ilyen rendszerek. 601 00:34:33,230 --> 00:34:35,130 Mi szétszedés az egyes tételekre vonatkozóan. 602 00:34:35,130 --> 00:34:39,360 Tehát van egy fájl, amely egy gigabyte, amely egy millió feljegyzéseket tartalmaz. 603 00:34:39,360 --> 00:34:42,290 Így vágd szét az egyes elemeket. 604 00:34:42,290 --> 00:34:45,374 Ezután minden egyes elem, amit konvertálni a MODS, mivel ezek közül néhány 605 00:34:45,374 --> 00:34:47,040 amelyek natív MODS, némelyik nem. 606 00:34:47,040 --> 00:34:49,204 Így kapunk mindet hogy ugyanabban a formában. 607 00:34:49,204 --> 00:34:51,120 Aztán ott vannak a különböző dúsítási lépéseket, ahol 608 00:34:51,120 --> 00:34:55,969 folyamatosan újabb információkat az adatokat mint állt rendelkezésre a könyvtárban. 609 00:34:55,969 --> 00:34:59,750 Tehát mi kell hozzá, mindenekelőtt Van, amit könyvtárak tartsa. 610 00:34:59,750 --> 00:35:02,250 Mi megy keresztül lépése kiszámításakor stackscore. 611 00:35:02,250 --> 00:35:07,112 Átmegyünk egy másik lépésre hozzátéve, több metaadatok terén 612 00:35:07,112 --> 00:35:10,730 A mi gyűjtemények emberek Lehet, hogy hozzá this-- 613 00:35:10,730 --> 00:35:12,532 >> Az emberek létrehozása gyűjtemények tételek. 614 00:35:12,532 --> 00:35:13,990 Mit gyűjtemények nem tartozik? 615 00:35:13,990 --> 00:35:17,220 Hogy az emberek címkézett a tartalom a múltban? 616 00:35:17,220 --> 00:35:20,750 Akkor kiszűrni, és korlátozhatja A rekordok azért, mert, mint már említettem, 617 00:35:20,750 --> 00:35:24,120 van néhány rekordokat, mert szerzői jogi okokból, nem tudjuk megjeleníteni. 618 00:35:24,120 --> 00:35:26,700 És akkor mi betöltésére valami úgynevezett 619 00:35:26,700 --> 00:35:31,680 Solr, amely nem elírás, de a neve egy szoftver 620 00:35:31,680 --> 00:35:35,710 hogy nem kereső indexelés, amely hajtja az összes keresési mögött API. 621 00:35:35,710 --> 00:35:40,110 És akkor elérhetővé válik Az API, és az emberek is használhatják. 622 00:35:40,110 --> 00:35:44,640 >> Tehát ez olyan, mint egy meglehetősen egyszerű folyamat. 623 00:35:44,640 --> 00:35:47,230 Az egyik érdekes dolog ez 624 00:35:47,230 --> 00:35:50,990 hogy van dolgunk 13 millió lemezt 625 00:35:50,990 --> 00:35:53,820 és mi lesz a dolgunk, vagy több. 626 00:35:53,820 --> 00:36:01,260 És azt akarjuk, hogy képes legyen kezelni Ezek a viszonylag gyors divat. 627 00:36:01,260 --> 00:36:03,630 Ez hosszú időt vesz igénybe, hogy folyamat 13 millió lemezt. 628 00:36:03,630 --> 00:36:09,529 >> Tehát, hogy ez a csővezeték létre, hogy Ön can-- 629 00:36:09,529 --> 00:36:12,070 Azt hiszem, az az előnye a gázvezeték, a probléma, hogy mi vagyunk 630 00:36:12,070 --> 00:36:15,580 próbálják megoldani itt, hogy minden átalakulások, az összes 631 00:36:15,580 --> 00:36:18,729 lépések alapján gázvezeték elkülöníthetők. 632 00:36:18,729 --> 00:36:19,645 Nincs függőség. 633 00:36:19,645 --> 00:36:22,146 Ha feldolgozása nyilván egy könyvet, 634 00:36:22,146 --> 00:36:24,270 nincs függőség hogy között egy másik könyvet. 635 00:36:24,270 --> 00:36:27,760 >> Szóval, mit tehetünk alapvetően, minden lépésben a csővezeték, 636 00:36:27,760 --> 00:36:30,470 rakjuk bele a sorba a felhő. 637 00:36:30,470 --> 00:36:32,250 Azt történt, hogy az Amazon Web Services. 638 00:36:32,250 --> 00:36:35,140 Szóval van egy lista, azt mondják, 10.000 tétel, hogy 639 00:36:35,140 --> 00:36:38,100 kell normalizálni és alakítja MODS formátumban. 640 00:36:38,100 --> 00:36:41,620 És mi felpörög annyi szerverek ahogy mi akarjuk, talán 10 szervereket. 641 00:36:41,620 --> 00:36:44,860 És minden egyes ilyen szerverek csak ül ott, úgy néz ki, hogy sorban, 642 00:36:44,860 --> 00:36:46,730 látja, hogy az egyik, hogy meg kell feldolgozni, lehúzza a sorban, 643 00:36:46,730 --> 00:36:48,740 feldolgozza azt, és botok ez a következő sorban. 644 00:36:48,740 --> 00:36:54,200 >> És akkor mi van, amely lehetővé teszi számunkra, tennie, hogy alkalmazza, lényegében, 645 00:36:54,200 --> 00:36:58,110 annyi hardvert, mint azt szeretnénk, hogy ez a probléma egy nagyon rövid idő alatt 646 00:36:58,110 --> 00:37:02,970 az adatok feldolgozására, amilyen gyorsan csak lehetséges, ami valami, csak, 647 00:37:02,970 --> 00:37:08,220 Most a világ a cloud computing tudjuk rendelkezés szerverek alapvetően 648 00:37:08,220 --> 00:37:09,890 azonnal, hogy hasznos. 649 00:37:09,890 --> 00:37:12,260 Tehát nem kell, hogy egy óriás szerveren üldögél 650 00:37:12,260 --> 00:37:16,700 minden időben, hogy a feldolgozó hogy megtörténhet csak hetente egyszer. 651 00:37:16,700 --> 00:37:21,440 >> Szóval ez többnyire azt. 652 00:37:21,440 --> 00:37:27,590 Van dokumentáció A Library Cloud Elem API 653 00:37:27,590 --> 00:37:31,960 Ebben URL, amely elérhető később. 654 00:37:31,960 --> 00:37:36,730 És kérlek, menj nézd meg, hogy hátha van valami, 655 00:37:36,730 --> 00:37:37,579 Van valami ötleted. 656 00:37:37,579 --> 00:37:38,120 Játszani vele. 657 00:37:38,120 --> 00:37:38,830 Hülyéskedik. 658 00:37:38,830 --> 00:37:42,800 És remélhetőleg akkor jön valami jó. 659 00:37:42,800 --> 00:37:44,740 Köszönöm. 660 00:37:44,740 --> 00:37:45,899