1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 Jeffrey LICHT: Kumusta doon. 3 00:00:12,370 --> 00:00:13,550 Ako Jeffrey Licht. 4 00:00:13,550 --> 00:00:17,890 At ako dito upang makipag-usap sa iyo tungkol sa Harvard Library at gusali bukas 5 00:00:17,890 --> 00:00:20,870 library ngayon, hulaan ko. 6 00:00:20,870 --> 00:00:23,040 Kaya background dito, ang pitch para sa session na ito 7 00:00:23,040 --> 00:00:26,930 ay tunay na mayroong Marami bibliographic data 8 00:00:26,930 --> 00:00:28,400 Available sa Harvard aklatan. 9 00:00:28,400 --> 00:00:33,434 At doon ay isang pagkakataon, sa pamamagitan ng ilan sa mga tool 10 00:00:33,434 --> 00:00:36,350 at isang proyekto na ina-binuo, upang makakuha ng access sa impormasyon 11 00:00:36,350 --> 00:00:42,430 at dalhin ito sa mga lugar na ang Harvard Library ay hindi mahusay sa ngayon, 12 00:00:42,430 --> 00:00:45,460 gawin bagong bagay-bagay dito, eksperimento at i-play sa paligid na may ito. 13 00:00:45,460 --> 00:00:52,413 >> Kaya ang entry point sa ito ay isang API na tinatawag na ang Harvard Library Cloud, na 14 00:00:52,413 --> 00:00:57,650 ay isang open metadata server, na ako ay makipag-usap tungkol sa ngayon. 15 00:00:57,650 --> 00:01:02,595 Kaya ang background na mayroong maraming mga bagay-bagay sa Harvard library. 16 00:01:02,595 --> 00:01:07,150 Mayroon kaming mahigit sa 13 milyong bibliographic mga tala, milyon-milyong mga imahe, 17 00:01:07,150 --> 00:01:11,090 at libu-libong mga paghahanap ng mga pantulong, na ang mga mahalagang mga dokumento na naglalarawan 18 00:01:11,090 --> 00:01:15,500 mga koleksyon, na nagsasabi kung ano ay nasa kanila, mga kahon ng papel 19 00:01:15,500 --> 00:01:21,080 at iba pa na kumakatawan sa higit sa isang milyong mga indibidwal na mga dokumento. 20 00:01:21,080 --> 00:01:24,290 At mayroon ding maraming impormasyon na aklatan ay may 21 00:01:24,290 --> 00:01:28,180 tungkol sa kung paano ang nilalaman ay ginamit na maaaring maging kawili-wili sa mga tao 22 00:01:28,180 --> 00:01:32,400 na maaaring gusto upang gumana sa mga ito. 23 00:01:32,400 --> 00:01:36,150 >> Kaya ang lahat ng impormasyon ang library ay may metadata. 24 00:01:36,150 --> 00:01:39,500 Kaya metadata ay data tungkol sa data. 25 00:01:39,500 --> 00:01:42,070 Kaya kapag makipag-usap namin tungkol sa ang impormasyon na 26 00:01:42,070 --> 00:01:44,890 makukuha sa pamamagitan ng library ulap na magagamit, 27 00:01:44,890 --> 00:01:47,760 ito ay hindi kinakailangan ang aktwal na mga dokumento 28 00:01:47,760 --> 00:01:53,060 kanilang sarili, hindi kinakailangan ang buong teksto ng mga libro o ang buong larawan, 29 00:01:53,060 --> 00:01:54,890 bagaman na aktwal na maaaring hindi ito ang kaso. 30 00:01:54,890 --> 00:01:57,550 Ngunit talaga impormasyon tungkol sa data. 31 00:01:57,550 --> 00:02:00,909 >> Kaya maaari mong isipin na cataloging impormasyon, mga numero ng tawag, mga paksa, 32 00:02:00,909 --> 00:02:02,700 kung gaano karaming mga kopya ng aklat mayroong, kung ano 33 00:02:02,700 --> 00:02:06,380 ang mga edisyon, ano ang mga format, mga may-akda, at iba pa. 34 00:02:06,380 --> 00:02:12,250 Kaya mayroong maraming impormasyon tungkol sa ang impormasyon sa koleksyon na, 35 00:02:12,250 --> 00:02:14,400 sa sarili nito, ay uri ng likas na kapaki-pakinabang. 36 00:02:14,400 --> 00:02:19,230 At kahit na kung ikaw ay paggawa ng malalim na pananaliksik, 37 00:02:19,230 --> 00:02:25,160 nang walang alinlangan mo gusto upang makakuha ng sa aktwal na nilalamang sarili nito at tingnan ang data, 38 00:02:25,160 --> 00:02:30,140 ang metadata ay kapaki-pakinabang sa mga tuntunin ng ang parehong pag-aaral ng corpus bilang isang buo, 39 00:02:30,140 --> 00:02:33,870 tulad ng kung anong bagay na nasa koleksyon. 40 00:02:33,870 --> 00:02:35,520 Paano ito ay kaugnay? 41 00:02:35,520 --> 00:02:39,482 Tinutulungan mo ba talagang makahanap ng iba pang mga bagay-bagay, na kung saan ay talagang ang pangunahing layunin ng mga ito. 42 00:02:39,482 --> 00:02:41,190 Ang punto ng metadata at ang katalogo 43 00:02:41,190 --> 00:02:43,230 ay upang makatulong sa mahanap mo ang lahat ng ang impormasyon na 44 00:02:43,230 --> 00:02:46,590 Available sa loob ng koleksyon. 45 00:02:46,590 --> 00:02:53,690 >> Kaya ito ay isang halimbawa ng metadata para sa isang libro sa Harvard Library. 46 00:02:53,690 --> 00:02:56,370 Kaya doon. 47 00:02:56,370 --> 00:02:59,850 At maaari mong makita ito talaga Katamtamang complex. 48 00:02:59,850 --> 00:03:04,610 At bahagi ng halaga ng metadata sa loob ng sistema ng Harvard Library 49 00:03:04,610 --> 00:03:09,320 ay na naging pag-uuri ng built up sa pamamagitan ng catalogers 50 00:03:09,320 --> 00:03:12,720 at binuo sa pamamagitan ng paglalapat ng mga tao ng maraming kadalubhasaan at mga kasanayan 51 00:03:12,720 --> 00:03:20,030 at naisip na ito sa paglipas ng panahon, na may maraming halaga. 52 00:03:20,030 --> 00:03:25,450 >> Kaya kung kumuha ka ng isang pagtingin sa talaang ito para sa Ang mga nakatalang Alice, maaari mong malaman 53 00:03:25,450 --> 00:03:32,590 na kailangan ng pamagat, na isinulat ito, ang may-akda, at lahat ng iba't ibang mga paksa 54 00:03:32,590 --> 00:03:35,380 kung saan ang mga tao na natala ito sa. 55 00:03:35,380 --> 00:03:40,110 At maaari mong makita mayroon ding, sa Bukod sa maraming mga mahusay na impormasyon 56 00:03:40,110 --> 00:03:42,852 dito, may ilang mga sipi. 57 00:03:42,852 --> 00:03:45,560 Marami ng pagiging kumplikado na masasalamin sa pamamagitan ng metadata 58 00:03:45,560 --> 00:03:46,300 na mayroon ka. 59 00:03:46,300 --> 00:03:50,320 >> Kaya isa pamagat ng aklat na ito Alice ng Adventures sa Wonderland. 60 00:03:50,320 --> 00:03:53,880 Kaya ito ay isang annotate bersyon ng aklat na iyon. 61 00:03:53,880 --> 00:03:56,380 Ngunit ito ay tinatawag din na ang mga nakatalang Alice, Alice ng Adventures 62 00:03:56,380 --> 00:03:58,570 sa Wonderland dahil ito ay isang bagay na 63 00:03:58,570 --> 00:04:00,430 Sinulat ni Martin Gardner at itinala sa aklat. 64 00:04:00,430 --> 00:04:03,369 At maraming ng mahusay na impormasyon tungkol sa logic puzzle at mga bagay 65 00:04:03,369 --> 00:04:05,410 sa loob Alice na marahil ay hindi malaman. 66 00:04:05,410 --> 00:04:07,000 Kaya dapat kang pumunta basahin ito. 67 00:04:07,000 --> 00:04:11,940 >> Ngunit maaari mong makita mayroong ng maraming detalye dito, 68 00:04:11,940 --> 00:04:15,340 kabilang ang identifier, kapag ito Nilikha, kung saan ito ay nagmula sa, 69 00:04:15,340 --> 00:04:17,420 sa mga tuntunin ng Harvard system, at iba pa. 70 00:04:17,420 --> 00:04:20,350 Kaya ito ay isang sample ng ang uri ng metadata 71 00:04:20,350 --> 00:04:24,340 na maaari mong makita para sa isang libro sa ang koleksyon Harvard Library. 72 00:04:24,340 --> 00:04:26,680 >> Ito ay isang bagay na ganap na naiiba. 73 00:04:26,680 --> 00:04:32,610 Kaya doon ay isang sistema na tinatawag na VIA Harvard, na talaga 74 00:04:32,610 --> 00:04:39,990 ay cataloging mga larawan at mga bagay ng sining at visual na bagay sa buong Harvard, 75 00:04:39,990 --> 00:04:44,010 at pagdaragdag ng ilang metadata sa kanila, pag-uuri ang mga ito, 76 00:04:44,010 --> 00:04:49,200 at, sa ilang mga kaso, na nagbibigay ng maliit na thumbnail na larawan 77 00:04:49,200 --> 00:04:51,250 na maaari mong gawin ang isang tumingin sa kung kaya't nais. 78 00:04:51,250 --> 00:04:54,240 >> Kaya ito ay isang halimbawa ng metadata na mayroon ka para sa isang plato 79 00:04:54,240 --> 00:04:57,840 mula sa, siguro, Alice sa Wonderland. 80 00:04:57,840 --> 00:05:00,499 At maaari mong makita mayroong mas metadata dito. 81 00:05:00,499 --> 00:05:02,040 Ito ay isang iba't ibang lamang uri ng object. 82 00:05:02,040 --> 00:05:03,425 At kaya walang gaanong impormasyon. 83 00:05:03,425 --> 00:05:07,790 >> Ikaw ang karamihan ay mayroon ang katotohanan na, ang isang tawag numero, mahalagang na nilikha nito, - 84 00:05:07,790 --> 00:05:10,410 >> Hindi namin alam kapag ito ay nalikha. 85 00:05:10,410 --> 00:05:13,320 >> --and ng pamagat. 86 00:05:13,320 --> 00:05:14,300 >> Ang isa pang halimbawa. 87 00:05:14,300 --> 00:05:16,380 Ito ay isang pasiya aid. 88 00:05:16,380 --> 00:05:19,030 Kaya mayroong isang koleksyon ng mga Lewis Paper Carroll ni sa Harvard. 89 00:05:19,030 --> 00:05:23,601 Kaya ito ang naglalarawan sa kung ano ang Nasa koleksyon iyon. 90 00:05:23,601 --> 00:05:26,100 Kaya ang isang tao sumailalim sa at tumingin sa lahat ng mga kahon 91 00:05:26,100 --> 00:05:32,220 at natala ito, na ibinigay ng ilang mga background, nagsulat ng isang buod ng kung ano ang dito. 92 00:05:32,220 --> 00:05:35,290 At kung ikaw ay upang tumingin higit sa na ito, ito 93 00:05:35,290 --> 00:05:39,620 napupunta sa para sa mga pahina at mga pahina at mga pahina, ngunit ang magsasabi sa iyo 94 00:05:39,620 --> 00:05:41,860 ano ang mga titik at kung ano petsa mula sa kung ano ang mga kahon 95 00:05:41,860 --> 00:05:44,289 umiral sa buong koleksyon. 96 00:05:44,289 --> 00:05:46,330 Ngunit ito ay isang bagay na, kung ikaw ay nasa Harvard, 97 00:05:46,330 --> 00:05:50,720 maaari kang pumunta at aktwal na pisikal na hitsura up at, marahil, tingnan ang. 98 00:05:50,720 --> 00:05:53,440 >> Kaya ito ay ang lahat ng mahusay. 99 00:05:53,440 --> 00:05:54,450 Metadata na ito kapaki-pakinabang. 100 00:05:54,450 --> 00:05:56,327 Ito ay sa sistema ng Harvard Library. 101 00:05:56,327 --> 00:05:58,910 May mga tool na online na kung saan mo maaaring pumunta at tingnan ito, 102 00:05:58,910 --> 00:05:59,993 at makita ito, at maghanap ito. 103 00:05:59,993 --> 00:06:02,810 At maaari mo itong dice at hatiin ito sa maraming iba't ibang paraan. 104 00:06:02,810 --> 00:06:06,920 >> Ngunit ito ay talagang magagamit lamang kung ikaw ay isang tao pagkatao sitting down na 105 00:06:06,920 --> 00:06:12,600 sa iyong web browser o isang bagay o iyong telepono at pag-navigate sa pamamagitan nito. 106 00:06:12,600 --> 00:06:16,730 Ito ay hindi tunay na magagamit sa anumang uri ng kapaki-pakinabang na paraan 107 00:06:16,730 --> 00:06:19,520 para sa iba pang mga sistema o iba pang mga computer upang gamitin, 108 00:06:19,520 --> 00:06:21,500 hindi sa mga sistema sa loob ng ang Harvard Library, 109 00:06:21,500 --> 00:06:24,890 ngunit mga sistema sa labas ng mundo, iba pang mga tao lamang sa pangkalahatan. 110 00:06:24,890 --> 00:06:30,210 Kaya ang tanong ay, paano kaya namin gawin itong available sa mga computer 111 00:06:30,210 --> 00:06:33,560 nang sa gayon ay magawa namin ng higit pang mga kawili-wiling mga bagay-bagay dito kaysa lamang 112 00:06:33,560 --> 00:06:36,550 -browse ito ang ating mga sarili? 113 00:06:36,550 --> 00:06:39,766 >> Kaya bakit nais mong gawin ito? 114 00:06:39,766 --> 00:06:41,140 Mayroong maraming mga posibilidad. 115 00:06:41,140 --> 00:06:43,980 Ang isa ay maaari kang bumuo ng isang ganap na iba't ibang paraan ng pag-browse 116 00:06:43,980 --> 00:06:46,962 ang nilalaman na magagamit sa pamamagitan ng Harvard Aklatan. 117 00:06:46,962 --> 00:06:48,670 Kukunin ko ipakita sa iyo ng isa mamaya na tinatawag na Stacklife, 118 00:06:48,670 --> 00:06:52,440 na may isang ganap na naiibang mga kumuha sa naghahanap ng nilalaman. 119 00:06:52,440 --> 00:06:54,560 >> Maaari kang bumuo ng isang rekumendasyon engine. 120 00:06:54,560 --> 00:06:57,955 Kaya Harvard Library ay wala sa negosyo ng sinasabi, gusto mo ang aklat na ito. 121 00:06:57,955 --> 00:07:01,080 Pagkatapos ay pumunta tingnan ang mga 17 iba pang mga libro na iyo ay maaaring interesado sa 122 00:07:01,080 --> 00:07:03,200 o mga 18 iba pang mga imahe. 123 00:07:03,200 --> 00:07:06,040 Ngunit iyon ay tiyak na magagawa maging isang mahalagang tampok. 124 00:07:06,040 --> 00:07:09,272 At bibigyan ng metadata, maaari itong magiging posible upang ilagay ang sama-sama. 125 00:07:09,272 --> 00:07:11,980 Maaaring mayroon kang iba't ibang mga pangangailangan sa mga tuntunin ng paghahanap ng nilalaman, 126 00:07:11,980 --> 00:07:16,200 tulad siguro sa kabila ng mga tool na Available na ang library ginagawang 127 00:07:16,200 --> 00:07:18,450 magagamit, maaaring gusto upang maghanap sa ibang paraan 128 00:07:18,450 --> 00:07:21,847 o-optimize para sa isang partikular na kaso ng paggamit, na siguro ay masyadong nagdadalubhasang. 129 00:07:21,847 --> 00:07:23,930 Siguro may ilang lamang mga tao sa mundo na 130 00:07:23,930 --> 00:07:25,846 Gusto upang maghanap sa nilalaman sa ganitong paraan, ngunit ito 131 00:07:25,846 --> 00:07:28,985 ay magiging mahusay na kung namin maaaring hayaan silang gawin iyon. 132 00:07:28,985 --> 00:07:30,860 Marami ng analytics sa mga tao lamang kung paano 133 00:07:30,860 --> 00:07:33,860 gamitin ang nilalaman na hindi talaga na interesante sa mga malaman, alamin 134 00:07:33,860 --> 00:07:37,280 kung ano ang aklat ay ginagamit, kung ano ang hindi, at iba pa. 135 00:07:37,280 --> 00:07:41,670 At pagkatapos ay mayroong maraming pagkakataon na pagsamahin ang 136 00:07:41,670 --> 00:07:45,210 sa iba pang impormasyon na out doon sa web. 137 00:07:45,210 --> 00:07:46,880 Kaya have-- namin 138 00:07:46,880 --> 00:07:50,260 >> Halimbawa, NPR ay isang segment pagsusuri sa aklat, 139 00:07:50,260 --> 00:07:53,090 kung saan sila interbiyu mga may-akda tungkol sa mga aklat. 140 00:07:53,090 --> 00:07:56,837 At kaya magiging mahusay na kung ikaw ay hinahanap ang isang libro sa Harvard 141 00:07:56,837 --> 00:07:59,670 Library, at sabihin mo, OK, mayroong naging isang pakikipanayam na may-akda. 142 00:07:59,670 --> 00:08:00,878 Tara tingnan iyon. 143 00:08:00,878 --> 00:08:05,461 O mayroong isang pahina ng Wikipedia, bilang isang makapangyarihan, masipag mag-aral reference 144 00:08:05,461 --> 00:08:07,710 tungkol sa aklat na ito na baka gusto mong tingnan. 145 00:08:07,710 --> 00:08:12,600 >> May mga ganitong uri ng mga pinagkukunan nakakalat sa buong web. 146 00:08:12,600 --> 00:08:16,555 At dinadala ang mga iyon nang magkakasama maaaring maging isang mahusay na paggamit 147 00:08:16,555 --> 00:08:18,930 sa isang tao ng pagtingin sa mga nilalaman, naghahanap ng isang bagay. 148 00:08:18,930 --> 00:08:20,180 Pero hindi rin ang uri ng bagay na ikaw ay 149 00:08:20,180 --> 00:08:23,205 gusto ang library na maging responsable para sa lapag at pangangaso down na 150 00:08:23,205 --> 00:08:25,455 lahat ng mga iba't ibang mga pinagmulan at i-plug ang mga ito nang sama-sama 151 00:08:25,455 --> 00:08:28,920 dahil patuloy sila nagbabago. 152 00:08:28,920 --> 00:08:33,570 At kung ano ang sa tingin nila ay mahalaga Mayo hindi kung ano ang iyong palagay ay mahalaga. 153 00:08:33,570 --> 00:08:36,929 >> At kahit na higit pa kaya, isa lamang mayroong isang maraming mga bagay-bagay hindi pa kami naisip ng. 154 00:08:36,929 --> 00:08:42,222 Kaya kung maaari naming buksan ito up, higit pa mga tao bukod sa kalahating dosenang o kaya, 155 00:08:42,222 --> 00:08:45,174 na naghahanap sa ito sa regular na batayan ay maaaring sa tingin ng mga ideya 156 00:08:45,174 --> 00:08:47,340 at massage ang data, at gawin kung ano ang gusto nila dito. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> Kaya gusto naming gawin ito Available sa mundo ng data. 159 00:08:54,045 --> 00:08:55,670 Well, may mga ilang mga komplikasyon. 160 00:08:55,670 --> 00:08:58,540 Ang isa ay na ito metadata ay sa iba't-ibang mga sistema. 161 00:08:58,540 --> 00:09:01,110 Ito ay sa iba't-ibang mga format. 162 00:09:01,110 --> 00:09:04,719 Kaya mayroong ilang normalisasyon na kailangang mangyari, 163 00:09:04,719 --> 00:09:08,010 na normalisasyon pagiging ang proseso ng nagdadala sa mga bagay mula sa iba't ibang mga format 164 00:09:08,010 --> 00:09:12,940 at pagma-map ang mga ito sa isang solong format nang sa gayon ang mga patlang tutugma. 165 00:09:12,940 --> 00:09:15,160 >> May ilang mga paghihigpit sa copyright. 166 00:09:15,160 --> 00:09:21,010 Nang kakatwa sapat na, ang entry katalogo tungkol sa isang libro ay mananagot para sa copyright. 167 00:09:21,010 --> 00:09:24,060 Kaya kahit na ito ay lamang impormasyon na nakuha mula sa libro, 168 00:09:24,060 --> 00:09:25,330 ito ay copyrightable. 169 00:09:25,330 --> 00:09:28,400 At depende sa kung sino ang talagang nilikha na metadata, 170 00:09:28,400 --> 00:09:32,175 maaaring may mga paghihigpit sa kung sino maaari itong ipamahagi, katulad to-- 171 00:09:32,175 --> 00:09:33,402 >> Hindi ko alam. 172 00:09:33,402 --> 00:09:36,110 Maaaring ito o hindi maaaring maging katulad ng ang sitwasyon ng lyrics ng kanta, 173 00:09:36,110 --> 00:09:36,610 halimbawa. 174 00:09:36,610 --> 00:09:38,560 Kaya alam namin ang lahat ng kung paano na pans out. 175 00:09:38,560 --> 00:09:40,450 Kaya kailangan mo upang makakuha ng paligid na isyu. 176 00:09:40,450 --> 00:09:44,910 >> At pagkatapos ay isa pang piraso ay na mayroong ng maraming data. 177 00:09:44,910 --> 00:09:52,420 Kaya kung ako ay isang tao na nagnanais na magtrabaho may data o may mga cool na ideya, 178 00:09:52,420 --> 00:09:55,350 pagharap sa 14,000,000 mga tala sa aking laptop 179 00:09:55,350 --> 00:09:57,487 ay maaaring may problemang at mahirap na pamahalaan. 180 00:09:57,487 --> 00:09:59,320 Kaya gusto naming bawasan ang mga hadlang para sa mga tao 181 00:09:59,320 --> 00:10:02,130 upang magawang gumana sa mga data. 182 00:10:02,130 --> 00:10:07,880 >> Kaya ang diskarte na sana address lahat ng mga alalahanin ay dalawang bahagi. 183 00:10:07,880 --> 00:10:11,770 Ang isa ay pagbuo ng isang platform na dadalhin data mula sa lahat ng mga disparate pinagmumulan 184 00:10:11,770 --> 00:10:14,350 at aggravates ito, normalizes, enriches ito, at ginagawa 185 00:10:14,350 --> 00:10:16,650 itong available sa iisang lokasyon. 186 00:10:16,650 --> 00:10:20,950 At ito ay ginagawang magagamit sa pamamagitan ng isang pampublikong API na ang mga tao ay maaaring tumawag. 187 00:10:20,950 --> 00:10:24,430 >> Kaya isang API ay isang Application Programming Interface. 188 00:10:24,430 --> 00:10:28,930 At ito talaga ay tumutukoy sa isang Dulo na ang isang sistema o teknolohiya 189 00:10:28,930 --> 00:10:31,720 maaaring tumawag at makabalik data sa isang nakabalangkas na format sa isang paraan 190 00:10:31,720 --> 00:10:32,900 na ito ay maaaring gamitin. 191 00:10:32,900 --> 00:10:36,060 Kaya hindi umaasa dumalo sa isang website 192 00:10:36,060 --> 00:10:37,970 at nagi-scrap ng data off nito, halimbawa. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> Kaya ito ay ang home page ng ang API Item Library Cloud, 195 00:10:45,010 --> 00:10:47,220 na kung saan ay tunay na bersyon nito sa dalawa. 196 00:10:47,220 --> 00:10:50,130 Kaya ang pangalawang pag-ulit ng sinusubukan na gawin ang lahat ng data na ito 197 00:10:50,130 --> 00:10:53,280 Available sa buong mundo. 198 00:10:53,280 --> 00:10:59,560 Kaya http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 At lamang upang masira ito pababa Medyo, ano ang ibig sabihin nito 200 00:11:03,830 --> 00:11:06,115 ay hindi ito bersyon ng dalawang ng API. 201 00:11:06,115 --> 00:11:08,490 Mayroong isang bersyon ng isa, na Hindi ako pupunta pag-uusapan. 202 00:11:08,490 --> 00:11:09,750 Ngunit mayroong isang bersyon ng isa. 203 00:11:09,750 --> 00:11:14,740 >> At kung ikaw ay pagtawag na ito API, nakakakuha ka ng item. 204 00:11:14,740 --> 00:11:20,640 At bahagi ng ideya ng isang Ang API ay isang API ay isang kontrata. 205 00:11:20,640 --> 00:11:23,440 Ito ay isang bagay na hindi pagpunta upang baguhin. 206 00:11:23,440 --> 00:11:24,850 Kaya halimbawa, - 207 00:11:24,850 --> 00:11:27,410 >> At ang dahilan ay kung ako bumuo ng ilang mga uri ng system na 208 00:11:27,410 --> 00:11:33,210 Mawawala na gumamit ng ulap library API upang ipakita ang mga aklat o matulungan ang mga tao mahanap 209 00:11:33,210 --> 00:11:36,190 impormasyon sa natatanging paraan, kung ano ang hindi namin gustong mangyari 210 00:11:36,190 --> 00:11:38,940 ay para sa amin upang pumunta baguhin kung paano Gumagana na API, at biglang 211 00:11:38,940 --> 00:11:41,340 lahat ng bagay Pinaghihiwa sa gilid end user. 212 00:11:41,340 --> 00:11:46,710 Kaya bahagi ng kung nagsasagawa ka ng API Available sa buong mundo, ito ay 213 00:11:46,710 --> 00:11:49,396 mahusay na kasanayan na maglagay ng numero ng bersyon sa ito nang sa gayon mga tao 214 00:11:49,396 --> 00:11:51,020 malaman kung ano ang bersyon nila pagharap sa. 215 00:11:51,020 --> 00:11:54,300 >> Kaya kung magpasya namin nakita namin ng mas mahusay na paraan ng paggawa ng magagamit ang impormasyong ito, 216 00:11:54,300 --> 00:11:57,295 maaari naming baguhin iyon upang tumawag na bersyon tatlo. 217 00:11:57,295 --> 00:11:59,920 Kaya sa lahat na ay pa rin gamit bersyon ng dalawa, na makikita pa rin gumagana. 218 00:11:59,920 --> 00:12:03,490 Ngunit bersyon ng tatlong gagawin may lahat ng mga bagong bagay-bagay. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> Kaya ito ay isang API, ngunit ito talagang ganito ang hitsura ng URL. 221 00:12:09,210 --> 00:12:11,680 At kaya kung ano na ito ay isang Halimbawa ng ay kung ano ang 222 00:12:11,680 --> 00:12:16,615 tinatawag na API pahinga, na magagamit sa ibabaw lamang ng isang regular na koneksyon sa web. 223 00:12:16,615 --> 00:12:19,680 At maaari mo talaga pumunta sa ito sa isang browser. 224 00:12:19,680 --> 00:12:28,550 >> Kaya dito na lang Kakabukas ko hanggang sa Firefox at nawala sa api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 At kaya kung ano ang nakukuha ko dito ay talaga ang unang pahina 226 00:12:31,560 --> 00:12:34,740 ng mga resulta mula sa buong set ng mga item na mayroon kami. 227 00:12:34,740 --> 00:12:37,460 At dito sa XML format. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 At naging din prettified sa pamamagitan ng Firefox. 230 00:12:42,210 --> 00:12:45,850 Ito ay hindi tunay na mayroon ka ng lahat ng mga maliit na pagpapalawak at Pangongontrata 231 00:12:45,850 --> 00:12:47,880 doohickeys dito. 232 00:12:47,880 --> 00:12:52,520 Ito ay uri ng isang nicer bersyon paraan upang tumingin sa ito. 233 00:12:52,520 --> 00:12:57,040 >> Ngunit kung ano ito ay nagsasabi sa amin ay Hiniling ko ang lahat ng mga item. 234 00:12:57,040 --> 00:13:03,120 Kaya may mga 13,289,475 item. 235 00:13:03,120 --> 00:13:06,150 At Naghahanap ako sa unang 10, na nagsisimula sa posisyong zero 236 00:13:06,150 --> 00:13:09,760 dahil sa computer science palagi naming magsimula sa zero. 237 00:13:09,760 --> 00:13:15,150 At kung ano ang mayroon akong dito, kung tiklupin ko lang ito, makikita mo Mayroon akong 10 mga item. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> At kung gagawin ko ang isang pagtingin sa isang item, maaari ko makita na Nakakuha ako ng impormasyon tungkol dito. 240 00:13:25,210 --> 00:13:27,400 At ito ay nasa kung ano ang tinatawag na Mods form. 241 00:13:27,400 --> 00:13:30,860 At kaya ako pupunta upang lumipat Bumalik dito para sa isang sandali. 242 00:13:30,860 --> 00:13:33,750 OK. 243 00:13:33,750 --> 00:13:37,447 >> Kaya sabihin maghanap para sa isang bagay sa partikular na dahil ang unang item na 244 00:13:37,447 --> 00:13:40,030 ang mangyayari upang makabuo kapag tiningnan mo sa pamamagitan ng buong koleksyon 245 00:13:40,030 --> 00:13:41,750 ay, sa pamamagitan ng kahulugan, random. 246 00:13:41,750 --> 00:13:44,550 Kaya tumingin para sa ilang mga donut ipaalam. 247 00:13:44,550 --> 00:13:46,830 Oh. 248 00:13:46,830 --> 00:13:49,190 >> OK. 249 00:13:49,190 --> 00:13:49,940 Kaya donut. 250 00:13:49,940 --> 00:13:55,360 Kaya nakita namin may 80 item sa ang collection na tumutukoy sa mga donut. 251 00:13:55,360 --> 00:13:57,150 Naghahanap kami sa unang 10 sa mga ito. 252 00:13:57,150 --> 00:14:01,890 Ngayon, maaari mong makita dito ang paraan sa Sinabi ko Naghahanap ako ng mga donut, 253 00:14:01,890 --> 00:14:04,400 Idinagdag ko lamang ng isang bagay sa sa query string ng URL. 254 00:14:04,400 --> 00:14:09,680 Kaya q ay katumbas ng mga donut, kung saan maaari kang makita ang isang maliit na mas madali dito. 255 00:14:09,680 --> 00:14:12,131 >> At ito talaga ay nangangahulugan na mayroong isang spec para sa mga API, na 256 00:14:12,131 --> 00:14:13,880 Tinutukoy kung ano ang lahat ng mga parameter na ito ang ibig sabihin. 257 00:14:13,880 --> 00:14:17,150 At ito ay nangangahulugang kami ng pagpunta sa maghanap para sa lahat ng mga donut. 258 00:14:17,150 --> 00:14:24,910 >> Kaya ang unang item dito mayroon kaming maaari mong tingnan ang mga pamagat ay mga donut, 259 00:14:24,910 --> 00:14:29,310 at may subtitle na tinatawag na isang Amerikano silakbo ng damdamin, na, Sa tingin ko, 260 00:14:29,310 --> 00:14:31,610 naaangkop. 261 00:14:31,610 --> 00:14:36,134 Maraming ng different-- 262 00:14:36,134 --> 00:14:38,050 Sa sandaling makuha mo na ang punto ng pagkuha ng data, 263 00:14:38,050 --> 00:14:41,020 mayroong maraming iba't ibang format na maaari mo itong makuha sa. 264 00:14:41,020 --> 00:14:44,050 At mayroong iba't ibang mga lakas at kahinaan para sa kanilang lahat. 265 00:14:44,050 --> 00:14:49,000 Kaya ang isang ito, maaari mong makita ang dito, ang form na ito ay napaka-mayaman. 266 00:14:49,000 --> 00:14:51,946 At ito ay Standardized. 267 00:14:51,946 --> 00:14:55,040 >> Kaya mayroong isang partikular na pamagat patlang, isang subtitle na patlang. 268 00:14:55,040 --> 00:14:58,950 Mayroong isang alternatibong pamagat, ang American silakbo ng damdamin. 269 00:14:58,950 --> 00:15:01,650 May mga pangalan na nauugnay dito. 270 00:15:01,650 --> 00:15:03,120 Uri ng mapagkukunan ay teksto. 271 00:15:03,120 --> 00:15:06,070 Marami ng impormasyon dito sa format na ito. 272 00:15:06,070 --> 00:15:09,480 >> Ngunit may isang bungkos ng iba't-ibang mga format. 273 00:15:09,480 --> 00:15:11,920 Kaya kung ano ang namin lamang tumitingin sa isang format 274 00:15:11,920 --> 00:15:17,700 tinatawag Mods, na ang ibig sabihin ay Serbisyo ng Paglalarawan ng Bagay metadata, 275 00:15:17,700 --> 00:15:18,250 potensyal na. 276 00:15:18,250 --> 00:15:23,030 Sa tingin ko talaga hindi masyadong sigurado tungkol sa S. Ngunit ito ay isang medyo kumplikado ang format. 277 00:15:23,030 --> 00:15:24,240 Ito ang default na format. 278 00:15:24,240 --> 00:15:30,260 >> Ngunit ito ay ang isa na Pinapanatiling ang kayamanan ng lahat ng data 279 00:15:30,260 --> 00:15:33,820 na ang library ay dahil napakalapit sa kung ano ang 280 00:15:33,820 --> 00:15:35,110 ang library ay gumagamit ng panloob. 281 00:15:35,110 --> 00:15:39,030 Ito ay isang standard na ginagamit sa buong bansa, 282 00:15:39,030 --> 00:15:40,944 sa buong mundo sa pang-akademikong mga aklatan. 283 00:15:40,944 --> 00:15:42,110 At ito ay napaka interoperable. 284 00:15:42,110 --> 00:15:44,852 Kaya kung mayroon ka ng isang dokumento na nasa Mods format, 285 00:15:44,852 --> 00:15:47,560 maaari mong ibigay na sa ibang tao kaninong mga system maunawaan Mods, 286 00:15:47,560 --> 00:15:48,518 at maaari nilang i-import ito. 287 00:15:48,518 --> 00:15:50,840 Kaya ito ay isang karaniwang. 288 00:15:50,840 --> 00:15:54,250 Napakahusay Ito ay tinukoy, napaka-tukoy na. 289 00:15:54,250 --> 00:15:58,980 At iyon ay kung ano ang ginagawang interoperable dahil kung may isang taong nagsasabing, 290 00:15:58,980 --> 00:16:04,930 ito ay ang mga kahaliling pamagat ng isang talaan, alam ng lahat ng tao ano ang ibig sabihin iyon. 291 00:16:04,930 --> 00:16:07,740 Sa flip side, ay masyadong kumplikado. 292 00:16:07,740 --> 00:16:13,160 >> Kaya kung kumuha ka ng isang hitsura sa talaang ito dito, 293 00:16:13,160 --> 00:16:15,320 kung gusto ko lang upang makuha ang pamagat ng dokumentong ito, 294 00:16:15,320 --> 00:16:21,150 ng aklat na ito, na kung saan ay marahil donut, Ang American silakbo ng damdamin, pag-parse ito 295 00:16:21,150 --> 00:16:22,940 ay isang maliit na kasangkot. 296 00:16:22,940 --> 00:16:27,380 Sapagkat mayroong ibang format na tinatawag Dublin Core, 297 00:16:27,380 --> 00:16:29,730 kung saan ay mas, magkano ang mas simpleng format. 298 00:16:29,730 --> 00:16:33,764 >> At kaya nakikita mo dito, walang pamagat, subtitle, kahaliling pamagat. 299 00:16:33,764 --> 00:16:35,930 Mayroon lamang ang pamagat, Donut, ang American silakbo ng damdamin, 300 00:16:35,930 --> 00:16:38,780 at isa pang pamagat, American silakbo ng damdamin. 301 00:16:38,780 --> 00:16:42,907 Kaya kapag tumitingin ka sa kung anong paraan Gusto mo upang makuha ang mga data mula sa, 302 00:16:42,907 --> 00:16:44,740 Marami ay depende sa kung paano na iyong pupuntahan na gamitin ito. 303 00:16:44,740 --> 00:16:46,573 Gumagamit ka ba para sa interoperability o gawin mo 304 00:16:46,573 --> 00:16:49,970 Gusto ng isang bagay na ay maaaring maging mas madali upang gumana sa? 305 00:16:49,970 --> 00:16:56,002 >> Sa flip side, ng maraming mga detalye makakuha ng uri ng squished pababa. 306 00:16:56,002 --> 00:16:58,460 Maaari mong mawala ang nuances ng kung ano ang isang partikular na field paraan 307 00:16:58,460 --> 00:17:02,960 kung ikaw ay pagharap sa Dublin Core, na hindi mo nais makakuha ng may Mods. 308 00:17:02,960 --> 00:17:06,462 Kaya mga dalawang mga format maaari kang makakuha ng out sa API. 309 00:17:06,462 --> 00:17:08,920 At isa lamang, nang pinapanatili namin ang ito ang nasa likod ng mga eksena sa Mods. 310 00:17:08,920 --> 00:17:14,179 Ngunit maaari naming bigyan mo ito sa Mods at Dublin Core at anumang bagay pati na rin. 311 00:17:14,179 --> 00:17:16,470 Ang iba pang mga pagsasaalang-alang kapag naghahanap ka sa data 312 00:17:16,470 --> 00:17:21,210 ay maaari kang makakuha ng ito bilang alinman sa JSON, na ang ibig sabihin ay ang JavaScript Bagay pagtatanda, 313 00:17:21,210 --> 00:17:24,720 o XML, na ang ibig sabihin ay Extensible Markup Language. 314 00:17:24,720 --> 00:17:30,080 At ang mga representasyon ng data sa parehong mayroong eksaktong parehong data, eksakto 315 00:17:30,080 --> 00:17:31,080 sa parehong patlang. 316 00:17:31,080 --> 00:17:33,644 Ngunit ang mga ito lamang syntactically kakaiba. 317 00:17:33,644 --> 00:17:40,401 >> Kaya ito ay a-- 318 00:17:40,401 --> 00:17:41,400 Well, lumipat na lamang hayaan. 319 00:17:41,400 --> 00:17:47,490 Kaya ito ay ang aming query para sa donut sa XML format. 320 00:17:47,490 --> 00:17:53,470 Kung lumipat lang ako ang maging JSON, Maaari ko bang makita ang hitsura ito naiiba. 321 00:17:53,470 --> 00:17:58,580 Kaya ngayon ito ang parehong nilalaman, ngunit sa ibang istraktura. 322 00:17:58,580 --> 00:18:00,080 May mas kaunting mga anggulo bracket. 323 00:18:00,080 --> 00:18:02,530 Mayroong mas mababa maligoy. 324 00:18:02,530 --> 00:18:06,440 >> At ito ay isang format na iyon, kung Nagsusumikap sa kapaligiran ng web, 325 00:18:06,440 --> 00:18:09,680 ikaw ay pinaka-malamang pagpunta sa nais na gumamit dahil ang isa 326 00:18:09,680 --> 00:18:12,630 ng magaling na mga bagay tungkol sa JSON ay tugma ito sa JavaScript. 327 00:18:12,630 --> 00:18:17,680 Kaya kung Sumusulat ako web app, maaari ba akong hilahin sa JSON at gagana lamang sa mga ito nang direkta. 328 00:18:17,680 --> 00:18:20,187 Sapagkat sa XML, ito ay isang Medyo higit pang kumplikado. 329 00:18:20,187 --> 00:18:21,520 Kaya muli, ang mga parehong kapaki-pakinabang. 330 00:18:21,520 --> 00:18:26,387 Sila lamang ay magkaibang mga kaso paggamit kung saan ang mga tao ay maaaring nais na gamitin ang mga ito. 331 00:18:26,387 --> 00:18:26,886 OK. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 Kaya pabalik sa API. 334 00:18:31,680 --> 00:18:32,900 Kaya maaari naming maghanap for-- 335 00:18:32,900 --> 00:18:36,220 >> Bigyan ako ng isang halimbawa ng naghahanap ng mga donut. 336 00:18:36,220 --> 00:18:39,330 Pwede rin kaming maghanap lamang sa isang partikular na field sa loob dito. 337 00:18:39,330 --> 00:18:41,310 Kaya sa halip na naghahanap ang buong record, 338 00:18:41,310 --> 00:18:43,870 Maaari ko lang maghanap sa field na pamagat. 339 00:18:43,870 --> 00:18:48,810 At kaya ngayon may 25 bagay na May donut sa pamagat, isa rito 340 00:18:48,810 --> 00:18:52,430 ay tungkol sa pagpapanumbalik wetlands sa pamamahala 341 00:18:52,430 --> 00:18:54,990 ng butas sa donut programa, na kung saan ay marahil 342 00:18:54,990 --> 00:18:58,970 hindi nangangahulugang kung ano kaming naghahanap ng para kapag kami ay naghahanap para sa mga donut. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> Maaari ka ring, kapag handa ka pagharap sa isang API-- 345 00:19:05,490 --> 00:19:08,827 >> Bahagi ng pagkakaroon ng isang API ay nagbibigay sa mga tao ng access sa malaking hanay ng data. 346 00:19:08,827 --> 00:19:11,410 At may mga ilang iba't ibang mga tool na maaari mong gamitin upang gawin iyon. 347 00:19:11,410 --> 00:19:14,170 Ang isa ay, napaka-simple, mo Maaari pahina sa pamamagitan ng data. 348 00:19:14,170 --> 00:19:17,340 Kaya tulad ng kung gumawa ka ng query sa pamamagitan ng isang web interface, 349 00:19:17,340 --> 00:19:19,470 maaari kang tumingin sa pahina ng isa, pahina ng dalawa, tatlo pahina. 350 00:19:19,470 --> 00:19:22,040 Maaari mong gawin ang parehong bagay sa pamamagitan ng API. 351 00:19:22,040 --> 00:19:24,150 Kailangan mo lamang na maging tahasang sa kung paano ito gawin. 352 00:19:24,150 --> 00:19:29,511 >> Kaya halimbawa, kung Naghahanap ako sa dito sa aking unang tanong, 353 00:19:29,511 --> 00:19:32,510 kung saan makakakuha ako ng paggawa ng isang paghahanap para sa mga bagay may donut sa pamagat, maaari kong sabihin, 354 00:19:32,510 --> 00:19:35,415 at limitasyon ay katumbas ng 20, na nangangahulugan bigyan ako ang unang 20 mga talaan, hindi 355 00:19:35,415 --> 00:19:38,540 ang unang 10, kung saan ay ang default, dahil gusto ko upang tumingin sa 20 sa isang pagkakataon. 356 00:19:38,540 --> 00:19:43,435 O maaari kong sabihin, itakda ang simulan katumbas ng 20 at limitasyon 357 00:19:43,435 --> 00:19:47,150 kasing-halaga ng 20, na kung saan ay magbibigay sa sa akin Itinatala 21 sa pamamagitan ng 40. 358 00:19:47,150 --> 00:19:52,680 >> Kaya hulaan ko ang mga bagay upang mag-alis dito ay 359 00:19:52,680 --> 00:19:57,290 na ginagamit namin ang mga string ng query upang magtakda ng mga parameter sa query. 360 00:19:57,290 --> 00:20:02,760 At ito ay nagbibigay-daan sa iyo ng kontrol kung ano ang makakakuha ka pabalik. 361 00:20:02,760 --> 00:20:05,980 >> Ang isa pang tool na maaari mong gamitin, - 362 00:20:05,980 --> 00:20:09,250 >> At ito ay talagang kapaki-pakinabang sa tuntunin ng paggalugad ng data. 363 00:20:09,250 --> 00:20:10,840 >> --is isang bagay na tinatawag faceting. 364 00:20:10,840 --> 00:20:15,530 Kaya ang term faceting ay hindi naman pangkaraniwan. 365 00:20:15,530 --> 00:20:16,880 Ngunit ang lahat ng iyong nakita ito bago. 366 00:20:16,880 --> 00:20:18,630 Kung tumingin sa Amazon, halimbawa, 367 00:20:18,630 --> 00:20:20,870 at gumawa ka ng paghahanap para sa donut sa aklat, 368 00:20:20,870 --> 00:20:27,080 dito na nakakuha sila ng isang serye ng mga libro, at sila ay naka-grupo sa pamamagitan ng kategorya, 369 00:20:27,080 --> 00:20:30,470 at makukuha mo ang iba't ibang mga kategorya, at kung gaano karaming mga aklat sa bawat kategorya 370 00:20:30,470 --> 00:20:31,330 ipakita up. 371 00:20:31,330 --> 00:20:33,420 >> Kaya ito ay isa lamang facet. 372 00:20:33,420 --> 00:20:37,570 Dadalhin ka sa lahat ng kanilang mga aklat, ang 1,800 mga libro na tumutugma sa mga donut sa Amazon. 373 00:20:37,570 --> 00:20:39,820 12 sa mga ito ay nasa kategorya almusal. 374 00:20:39,820 --> 00:20:43,100 21 sa pastry at baking, at iba pa at iba pa. 375 00:20:43,100 --> 00:20:47,670 >> Kaya ito ay talagang kapaki-pakinabang ang isang tool para tuklasin ang nilalaman 376 00:20:47,670 --> 00:20:53,260 sa loob ng library pati na rin dahil kapag tumingin ka sa isang facet, 377 00:20:53,260 --> 00:20:56,520 binibigyan ka nito ng ideya ng kung ano ang Paksa Umiiral, tulad ng kung anong uri ng mga paksa 378 00:20:56,520 --> 00:20:58,510 ang pinaka-popular na sa loob ng iyong hanay ng query. 379 00:20:58,510 --> 00:21:00,950 At ito ay tumutulong sa iyo magpalayas at galugarin. 380 00:21:00,950 --> 00:21:02,770 Kaya maaari naming gawin ang parehong bagay. 381 00:21:02,770 --> 00:21:05,940 >> Kung gusto naming gamitin ang API at tumingin sa facet, 382 00:21:05,940 --> 00:21:08,950 magdagdag kami ng isa pang parameter ang aming mga kaibigan sa query string. 383 00:21:08,950 --> 00:21:12,540 Kaya facet ay katumbas ng isang comma separated listahan ng kung ano ang gusto naming facet sa. 384 00:21:12,540 --> 00:21:14,790 Kaya isa sa mga facet ay maaaring maging paksa. 385 00:21:14,790 --> 00:21:16,565 Ang isa pang maaaring maging wika. 386 00:21:16,565 --> 00:21:19,665 At kaya kung tumakbo kami sa query na iyon, get-- namin 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 Mukhang halos parehong dito. 389 00:21:24,830 --> 00:21:29,010 Ngunit kami ay idinagdag sa dulo ng listahan ng isang hanay ng mga facet. 390 00:21:29,010 --> 00:21:34,060 Kaya mayroon kaming facet na tinatawag na paksa. 391 00:21:34,060 --> 00:21:40,250 Kaya ito ay nagsasabi sa amin na kung tiningnan ako sa aking 80 resulta mula sa query donut, 392 00:21:40,250 --> 00:21:42,100 13 sa mga ito ay ang Paksa Estados Unidos. 393 00:21:42,100 --> 00:21:43,684 Tatlong magkaroon paksa donut. 394 00:21:43,684 --> 00:21:45,600 Tatlong magkaroon paksa ng wetland pagpapanumbalik, 395 00:21:45,600 --> 00:21:47,720 na maaaring maging ang aming mga butas sa donut. 396 00:21:47,720 --> 00:21:51,780 Dalawa sa kanila, The Simpsons, at iba pa at iba pa. 397 00:21:51,780 --> 00:21:59,211 >> Kaya ito ay maaaring maging kapaki-pakinabang kung Gusto upang paliitin ang iyong paghahanap. 398 00:21:59,211 --> 00:22:00,210 Maaari itong makatulong sa iyo na gawin iyon. 399 00:22:00,210 --> 00:22:03,580 Lalo na kung mayroon kang higit sa, sabihin nating, 80 mga resulta. 400 00:22:03,580 --> 00:22:05,980 >> Katulad nito, kami din tinanong para sa mga facet sa wika. 401 00:22:05,980 --> 00:22:14,790 Kaya kung tinitingnan namin ang aming mga resulta, tingnan ang aming 76 sa kanila ay nasa wikang Ingles, apat sa Pranses, 402 00:22:14,790 --> 00:22:19,620 dalawang sa Espanyol, dalawang, sa tingin ko na hindi natukoy na o hindi kilala, Dutch at Latin. 403 00:22:19,620 --> 00:22:22,830 Kaya sa tingin ko ang mga Latin donut dito, muli, 404 00:22:22,830 --> 00:22:24,922 May kinalaman sa lutong kalakal. 405 00:22:24,922 --> 00:22:25,630 Ngunit may kang pumunta. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> Kaya ito ay isang uri ng pagpapakita sa iyo kung paano maaari mong hilahin ang nilalaman likod 408 00:22:38,630 --> 00:22:41,270 mula sa API lamang sa pamamagitan ng web browser, na kung saan ay napakahusay. 409 00:22:41,270 --> 00:22:44,320 Pero hindi talaga kung ano ang gagawin mo normal na paggamit sa API para dito. 410 00:22:44,320 --> 00:22:48,710 Kaya isang halimbawa ng kung paano mo maaaring aktwal na gawin ito ay na hindi ko na 411 00:22:48,710 --> 00:22:54,720 nagsulat ng isang sobrang maliit na programa, na kung saan, muli, ang aking donut paghahanap 412 00:22:54,720 --> 00:22:59,010 at pumipili ng ilang mga patlang at ipinapakita ang mga ito sa isang table. 413 00:22:59,010 --> 00:23:01,610 Kaya ito ay talaga ang parehong nilalaman na namin lamang 414 00:23:01,610 --> 00:23:04,830 maglagari sa ilang mga patlang na nakuha out. 415 00:23:04,830 --> 00:23:12,090 Kaya listahan ng mga aklat, ang lokasyon ng kung ano ang aklat 416 00:23:12,090 --> 00:23:15,120 Humigit kumulang, ang wika, at iba pa at iba pa. 417 00:23:15,120 --> 00:23:20,480 >> Kaya kung paano ito aktwal na naganap, dahil Sa tingin ko mayroon kaming upang tumingin sa ilang code, 418 00:23:20,480 --> 00:23:22,420 is-- 419 00:23:22,420 --> 00:23:28,060 >> Ano ang mayroon kami dito ay isang simpleng HTML pahina, na nagpapakita ng teksto, 420 00:23:28,060 --> 00:23:32,900 maligayang pagdating sa library ulap at pagkatapos ay nagpapakita ng isang talahanayan ng mga resulta. 421 00:23:32,900 --> 00:23:37,790 At malinaw naman walang mga resulta sa talahanayan kapag ang pahina ay na-load. 422 00:23:37,790 --> 00:23:41,380 Ngunit kung anong ginagawa namin ay, una sa lahat, kami 423 00:23:41,380 --> 00:23:46,290 -load ng library na tinatawag na jQuery, na ay isa lamang 424 00:23:46,290 --> 00:23:52,030 isang JavaScript library, na ginagawang Napakadaling upang manipulahin ang JavaScript 425 00:23:52,030 --> 00:23:58,780 natively, HTML, at lumikha ng mga web page, sa panig ng client logic at mga web page. 426 00:23:58,780 --> 00:24:01,595 >> Kaya kung ano ang mayroon kami dito ay jQuery May pamamaraan na tinatawag Get, 427 00:24:01,595 --> 00:24:05,270 na tunay ay pupunta sa isang URL, kung saan, sa kasong ito, 428 00:24:05,270 --> 00:24:09,070 ay ang pamilyar na naghahanap URL. 429 00:24:09,070 --> 00:24:14,440 At pagkatapos ay kunin ang nilalaman mula sa URL na iyon at pagkatapos ay magpatakbo ng isang function na ito. 430 00:24:14,440 --> 00:24:19,240 Kaya't sinabi namin pumunta sa api.lib.harvard / edu. 431 00:24:19,240 --> 00:24:20,060 Maghanap ng mga donut. 432 00:24:20,060 --> 00:24:21,300 Bigyan kami ng 20 mga tala. 433 00:24:21,300 --> 00:24:28,590 At pagkatapos ay patakbuhin ang function na ito, na Na pinili ko, pagpasa nito ang data. 434 00:24:28,590 --> 00:24:34,430 At ang data ay ang JSON na Kaka ibinalik mula sa API. 435 00:24:34,430 --> 00:24:40,120 >> At pagkatapos ay iyong sinasabi namin, sa loob ng data mayroong isang patlang na tinatawag na item. 436 00:24:40,120 --> 00:24:48,117 At kung pumunta ako tumingin pabalik sa ang isa sa mga resulta na dito, 437 00:24:48,117 --> 00:24:49,200 mayroong isang bagay called-- 438 00:24:49,200 --> 00:24:50,220 >> Well, ito ay tinatawag na item. 439 00:24:50,220 --> 00:24:53,520 Kaya na maaaring iyon. 440 00:24:53,520 --> 00:25:01,840 At kung ano ang ginagawa nito ay ito napupunta sa pamamagitan ng bawat item 441 00:25:01,840 --> 00:25:05,300 at pagkatapos ay isa pang tawag -andar sa bawat item. 442 00:25:05,300 --> 00:25:08,440 At na function na talaga Nagtatagal ang halaga 443 00:25:08,440 --> 00:25:12,010 ng item, na mahalagang mga indibidwal na tala 444 00:25:12,010 --> 00:25:18,220 at nagbibigay-daan sa amin upang bunutin ang pamagat, ang saklaw at ang wika. 445 00:25:18,220 --> 00:25:21,640 >> Kaya tinatawag naming isang function sa bawat item na aming nakuha pabalik mula sa API. 446 00:25:21,640 --> 00:25:25,397 At kung gagawin mo lang ang hitsura sa piraso na ito dito mismo, 447 00:25:25,397 --> 00:25:27,230 kung ano ang aming ginagawa ay kami ay ang paglikha ng isang string, 448 00:25:27,230 --> 00:25:31,810 na kung saan ay lubos ng ilang mga HTML markup sa paligid ng isang talahanayan, na may value.title, 449 00:25:31,810 --> 00:25:35,790 kung saan ay ang pamagat ng bagay, value.coverage, 450 00:25:35,790 --> 00:25:36,790 kung saan ay ang coverage, - 451 00:25:36,790 --> 00:25:38,225 >> At kami gumawa ka ng isang tseke dito upang makita kung sino ang hindi natukoy 452 00:25:38,225 --> 00:25:40,570 at ng pagtatago nito kung sinasabi nito na hindi natukoy, dahil hindi kami talaga interesado 453 00:25:40,570 --> 00:25:41,600 sa iyon. 454 00:25:41,600 --> 00:25:42,939 >> --and pagkatapos ay ang wika. 455 00:25:42,939 --> 00:25:44,730 At pagkatapos ay kung ano kami ay paggawa ay appending na 456 00:25:44,730 --> 00:25:48,510 sa talahanayan na makikilala sa pamamagitan ng ang string na ito dito. 457 00:25:48,510 --> 00:25:50,790 At kung paano gumagana ang jQuery ay kung ano ito ay sinasabi 458 00:25:50,790 --> 00:25:56,420 ay hanapin ang talahanayan na may ideya mga resulta at magdagdag ng tekstong ito dito. 459 00:25:56,420 --> 00:25:59,380 At ito ang talahanayan na may mga resulta na ideya. 460 00:25:59,380 --> 00:26:04,998 Kaya kung ano magtapos ka up may ay ang pahinang ito dito. 461 00:26:04,998 --> 00:26:06,206 At upang makita ang source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 Well, ang pinagmulan ay hindi tunay -update kapag nangyari iyon. 464 00:26:13,810 --> 00:26:18,740 Kaya maaari mong makita ang aktwal na resulta ng talahanayan dito bagaman. 465 00:26:18,740 --> 00:26:24,770 >> Kaya ito lamang ay isang simpleng halimbawa ng paggawa ng isang napaka-basic query laban sa API 466 00:26:24,770 --> 00:26:29,020 at pagpapakita ng impormasyon sa ilang mga iba pang bumuo, at hindi ginagawa kahit ano masyadong fancy. 467 00:26:29,020 --> 00:26:36,370 Ngayon, isa pang halimbawa ay tulad ng isang application na isinulat ni David Weinberger 468 00:26:36,370 --> 00:26:39,120 bilang isang demo ng ito, na talaga nagpapakita sa iyo 469 00:26:39,120 --> 00:26:44,620 kung paano mo maaaring i-mash up ang mga resulta ikaw ay nakukuha mula sa cloud library API 470 00:26:44,620 --> 00:26:46,250 sa, sabihin nating, Google Books. 471 00:26:46,250 --> 00:26:52,225 >> At ang pag-iisip dito ay na maaari kong magpatakbo ng isang query sa Google Books, 472 00:26:52,225 --> 00:26:56,060 makakuha ng isang kumpletong paghahanap ng teksto, makakuha ng ilang mga resulta pagbabalik, alamin kung alin sa mga item na iyon 473 00:26:56,060 --> 00:27:01,180 talaga umiiral sa Hollis, sistema ng library, 474 00:27:01,180 --> 00:27:03,200 at pagkatapos ay magbigay sa akin ng mga link bumalik sa mga item na iyon. 475 00:27:03,200 --> 00:27:12,730 Kaya kung hahanapin ko ang, ito ay isang madilim at mabagyo gabi, ako 476 00:27:12,730 --> 00:27:16,210 makabalik ng grupo ng mga resulta mula sa Google, at pagkatapos ay isa resulta 477 00:27:16,210 --> 00:27:19,460 kung saan ay isang kulubot sa Time. 478 00:27:19,460 --> 00:27:29,330 At ang mga ito ay mga link sa mga aklat na mayroon sa loob ng sistema ng Harvard Library. 479 00:27:29,330 --> 00:27:32,160 >> Kaya tingin ko ang punto dito ay hindi kaya magkano na ito ay maaaring o hindi maaaring 480 00:27:32,160 --> 00:27:34,118 maging ang paraan na gusto mo upang maghanap sa library, 481 00:27:34,118 --> 00:27:38,310 ngunit ito ay isang ganap na naiibang mga paraan na hindi available si sa iyo 482 00:27:38,310 --> 00:27:42,884 bago, katulad mo ay nagkaroon walang paraan ng paggawa buong teksto naghahanap sa mga libro na kahit na 483 00:27:42,884 --> 00:27:44,550 ay bahagi na ng sistema ng Harvard Library. 484 00:27:44,550 --> 00:27:46,870 Kaya ngayon ito ay isang paraan na maaari mong gawin iyon. 485 00:27:46,870 --> 00:27:51,930 At maaari mong ipakita ang mga ito sa kahit anong format na gusto mo. 486 00:27:51,930 --> 00:27:55,990 Kaya ang punto dito ay, talaga, naka binubuksan namin up ng mga bagong paraan para sa mga tao 487 00:27:55,990 --> 00:27:59,080 upang gumana sa ang data. 488 00:27:59,080 --> 00:28:07,925 >> Ang isa pang bahagi ng library sa cloud ay ang ito ay tumutulong ilantad ang ilan sa mga data ng paggamit 489 00:28:07,925 --> 00:28:08,800 na ang library ay may. 490 00:28:08,800 --> 00:28:12,630 Kaya kung kang pumunta sa library, at naghahanap ka ng mga aklat, 491 00:28:12,630 --> 00:28:15,770 hindi mo kinakailangang talagang magkaroon ng isang ideya ng, 492 00:28:15,770 --> 00:28:19,080 para sa lahat ng mga item sa isang partikular na paksa, kung ano 493 00:28:19,080 --> 00:28:21,200 mga tao sa komunidad, maging ito man ay 494 00:28:21,200 --> 00:28:24,890 tinukoy bilang Harvard o ang bansa o sa iyong klase, 495 00:28:24,890 --> 00:28:26,421 kung ano ang mga ito ay natagpuan pinaka-kapaki-pakinabang? 496 00:28:26,421 --> 00:28:28,920 At ang library talaga ay may tonelada ng impormasyon tungkol sa kung ano 497 00:28:28,920 --> 00:28:32,999 ay pinakakapaki-pakinabang dahil kung marami ng mga tao ay mag-check out ng aklat, 498 00:28:32,999 --> 00:28:34,040 na nagsasabi sa iyo ng isang bagay. 499 00:28:34,040 --> 00:28:36,498 Dapat na mayroong ilang mga kadahilanan gusto nilang subukan ito. 500 00:28:36,498 --> 00:28:38,270 Isang maraming mga tao ilagay ito sa reserba. 501 00:28:38,270 --> 00:28:42,520 >> Kung ito ay nasa listahan reserba para sa marami ng mga klase, na nagsasabi sa iyo ng isang bagay. 502 00:28:42,520 --> 00:28:45,960 Kung miyembro faculty Sinusuri ito out ng maraming at undergraduates ay hindi, 503 00:28:45,960 --> 00:28:47,200 na nagsasabi sa akin ng isang bagay. 504 00:28:47,200 --> 00:28:49,280 Kabaligtaran, na rin Sinasabi sa iyo ng isang bagay. 505 00:28:49,280 --> 00:28:54,680 Kaya ay ito talagang kawili-wili sa ilagay ang impormasyon na iyon doon at hayaang 506 00:28:54,680 --> 00:28:59,969 mga tao gamitin ito upang tulungan silang mahanap Gumagana sa loob ng sistema ng library. 507 00:28:59,969 --> 00:29:02,260 Ang pumitik bahagi ng ito ay mayroong ilang mga malubhang privacy 508 00:29:02,260 --> 00:29:07,854 alalahanin dahil ang isa sa mga pangunahing tenets ng library 509 00:29:07,854 --> 00:29:10,770 Hindi namin pagpunta sa ay nagsasabi mga tao kung ano ang binabasa ng ibang mga tao. 510 00:29:10,770 --> 00:29:17,360 At kahit na sinasabi mo na ito aklat-check out apat na beses 511 00:29:17,360 --> 00:29:20,070 sa isang partikular na buwan, na maaaring magamit 512 00:29:20,070 --> 00:29:25,252 mag-link pabalik sa isang partikular na tao sa pamamagitan ng data ng de-hindi kilala 513 00:29:25,252 --> 00:29:26,710 at paghahanap ng kung sino-check ito. 514 00:29:26,710 --> 00:29:30,792 Kaya ang paraan na maaari naming avoid-- 515 00:29:30,792 --> 00:29:33,750 Ang paraan na maaari naming subukang i-extract ang ilang mga signal mula sa lahat ng mga impormasyon 516 00:29:33,750 --> 00:29:36,740 walang lumalabag na alalahanin sa privacy kahit sino ay 517 00:29:36,740 --> 00:29:42,150 ay mahalagang tinitingnan namin ang 10 taon ng data sa paggamit, - 518 00:29:42,150 --> 00:29:43,930 >> Kaya sa loob ng mahabang panahon. 519 00:29:43,930 --> 00:29:50,639 >> --and sabihin, OK, tingnan natin kung paano maraming beses sa trabahong ito ay ginamit, 520 00:29:50,639 --> 00:29:52,930 at sa pamamagitan ng na sa paglipas ng panahon na ito ng panahon, at pagkatapos ay isa lamang 521 00:29:52,930 --> 00:29:56,300 magsauli ng isang numero, na tinatawag naming isang stack ng kalidad, na talaga 522 00:29:56,300 --> 00:29:59,910 Kinakatawan kung magkano ito ay nagamit na. 523 00:29:59,910 --> 00:30:01,084 At na number-- 524 00:30:01,084 --> 00:30:03,250 Isang maraming iba't ibang mga kalkulasyon pumunta sa numerong iyon. 525 00:30:03,250 --> 00:30:05,150 --but ito ay isang napaka-magaspang sukatan na nagbibigay sa iyo 526 00:30:05,150 --> 00:30:11,300 ilang ideya kung gaano ang maaaring Pinahahalagahan ng komunidad ang trabahong iyon. 527 00:30:11,300 --> 00:30:16,772 >> At kaya isa pang uri ng kahit higit pa fleshed out application 528 00:30:16,772 --> 00:30:18,480 na tumatagal ng kalamangan ng ito ay isang bagay 529 00:30:18,480 --> 00:30:24,000 tinatawag na Stacklife, na kung saan ay talagang makukuha sa pamamagitan ng mga pangunahing Harvard 530 00:30:24,000 --> 00:30:24,880 Library portal. 531 00:30:24,880 --> 00:30:26,700 Kaya pumunta ka sa library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 Makakakita ka ng isang bilang ng iba't ibang mga paraan ng paghahanap ng library. 533 00:30:29,360 --> 00:30:32,300 At isa sa mga ito ay tinatawag na Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> At ito ay isang application na -browse ang nilalaman ng library, 535 00:30:38,980 --> 00:30:43,490 ngunit ganap na binuo sa ibabaw ng mga API na ito. 536 00:30:43,490 --> 00:30:46,910 Kaya walang mga espesyal na mga bagay-bagay nangyayari sa likod ng mga eksena. 537 00:30:46,910 --> 00:30:49,570 Walang pag-access sa data na hindi mo na kailangang. 538 00:30:49,570 --> 00:30:54,090 Ang paggamit nito sa mga API upang magbigay sa iyo may isang ganap na naiibang mga pag-browse 539 00:30:54,090 --> 00:30:55,480 karanasan. 540 00:30:55,480 --> 00:30:58,570 >> Kaya kung hahanapin ko ang Alice sa Wonderland sa kasong ito, 541 00:30:58,570 --> 00:31:02,600 Kumuha ako ng resultang may kamukha ito, na kung saan ay medyo much-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> Ito ay halos kapareho sa anumang iba pang mga paghahanap maaari mong gawin, maliban sa kasong ito 544 00:31:10,870 --> 00:31:15,730 kami ay pagra-ranggo ng mga item sa pamamagitan ng stackscore, na nagbibigay sa iyo ng 545 00:31:15,730 --> 00:31:19,850 ilang ideya kung gaano popular na mga mga item ay sa loob ng komunidad. 546 00:31:19,850 --> 00:31:25,610 At kaya malinaw, Alice sa Wonderland sa pamamagitan ng Walt Disney ay lubhang popular. 547 00:31:25,610 --> 00:31:36,570 Ngunit maaari mo ring makita ang nangungunang apat narito ang mga hindi mo maaaring actually-- 548 00:31:36,570 --> 00:31:39,220 >> Mga bagay na lubos na ginamit, ngunit hindi mo maaaring agad 549 00:31:39,220 --> 00:31:41,240 kumonekta sa Alice sa Wonderland. 550 00:31:41,240 --> 00:31:44,650 Kaya aming lumang kaibigan Ang -Annotate na Alice ay dito. 551 00:31:44,650 --> 00:31:46,350 Kaya ang maaari kong tingnan ito. 552 00:31:46,350 --> 00:31:52,010 At ngayon kung ano ang Naghahanap ako sa ay isa lamang itakda of-- 553 00:31:52,010 --> 00:31:53,760 Maaari ba akong magkaroon ang mga nakatalang Alice dito mismo. 554 00:31:53,760 --> 00:31:56,700 Mayroon akong impormasyon tungkol dito. 555 00:31:56,700 --> 00:32:00,230 At mayroon din akong stackscore ng, sa kasong ito, 26. 556 00:32:00,230 --> 00:32:03,169 At ito ay nagsasabi sa akin uri ng halos kung paano namin nakuha sa stackscore, 557 00:32:03,169 --> 00:32:05,835 tulad ng kung sino ang naka-check ito, tulad ng kung paano maraming beses na ito ay naka-check out, 558 00:32:05,835 --> 00:32:08,440 tulad ng mga guro o undergrads, kung paano maraming mga kopya ng library ay may, 559 00:32:08,440 --> 00:32:11,300 at iba pa at iba pa. 560 00:32:11,300 --> 00:32:16,460 >> At maaari din sa iyo, sapat na kawili-wili dito, i-browse ang mga stack halos. 561 00:32:16,460 --> 00:32:19,550 Kaya ang data dito, ito ay nagpapakita sa iyo ng pag-uuri 562 00:32:19,550 --> 00:32:23,547 ng isang virtual na representasyon ng kung ano ang maaaring shelf 563 00:32:23,547 --> 00:32:25,880 hitsura kung ikaw ay gumawa ng lahat ng Kompanya sa library ni 564 00:32:25,880 --> 00:32:28,940 at ilagay ang mga ito nang sama-sama sa isang walang-katapusang shelf. 565 00:32:28,940 --> 00:32:30,990 At ang magaling na bagay ay na can-- namin 566 00:32:30,990 --> 00:32:33,380 >> Una sa lahat, ang metadata tungkol sa mga aklat na ito 567 00:32:33,380 --> 00:32:35,627 Madalas na nagsasabi sa iyo kapag ito ay nai-publish. 568 00:32:35,627 --> 00:32:37,085 Sinasabi nito sa iyo kung gaano karaming mga pahina nito ay may. 569 00:32:37,085 --> 00:32:38,459 Maaaring sabihin sa iyo ang mga sukat. 570 00:32:38,459 --> 00:32:42,930 Kaya maaari mong makita na ipinapakita dito sa mga tuntunin ng laki ng mga aklat. 571 00:32:42,930 --> 00:32:46,740 >> At pagkatapos ay maaari naming gamitin ang stack ng kalidad upang i-highlight 572 00:32:46,740 --> 00:32:49,170 mga libro na may mas mataas na mga marka ng stack. 573 00:32:49,170 --> 00:32:54,930 Kaya kung mas madilim na, nangangahulugan ito na, siguro, mas madalas ito ginagamit. 574 00:32:54,930 --> 00:32:57,040 Kaya sa kasong ito, ako pagpunta sa hulaan na ito 575 00:32:57,040 --> 00:33:03,226 ay ang bersyon ng Alice sa Wonderland na napaka-karaniwang ginagamit at pinaka 576 00:33:03,226 --> 00:33:05,100 -access, ang library May mga pinaka-kopya ng. 577 00:33:05,100 --> 00:33:06,975 Kaya kung naghahanap ka ng para sa Alice sa Wonderland, 578 00:33:06,975 --> 00:33:10,220 maaaring ito ay isang magandang lugar upang magsimula. 579 00:33:10,220 --> 00:33:13,500 >> At pagkatapos dito maaari mo ring i-link out sa, sabihin nating, Amazon upang bilhin ang aklat, 580 00:33:13,500 --> 00:33:15,182 at iba pa at iba pa. 581 00:33:15,182 --> 00:33:17,140 Ang punto dito, muli, Hindi kaya magkano na ito 582 00:33:17,140 --> 00:33:25,030 ang pinakamahusay na paraan upang i-browse ang library o ang karapatan na kasangkapan para sa bawat okasyon. 583 00:33:25,030 --> 00:33:28,400 Pero ang isa pang paraan ng paggawa nito. 584 00:33:28,400 --> 00:33:31,359 At sa pamamagitan ng paggawa ng data makukuha sa pamamagitan ng isang API, na 585 00:33:31,359 --> 00:33:34,650 ay gawa sa napaka-simpleng mga bloke ng gusali, na nagbibigay-daan sa iyo upang maghanap sa nilalaman, 586 00:33:34,650 --> 00:33:39,420 maaari kang bumuo ng isang bagay tulad nito na maaari 587 00:33:39,420 --> 00:33:41,520 maging extraordinarily mahalaga sa ilang mga tao. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> Kaya na uri ng, hangga't gusto ko sasabihin talaga tungkol sa kung ano ang API ay 590 00:33:51,860 --> 00:33:56,070 at kung ano ang naglalantad ito, may kabuuan bungkos ng mga bagay-bagay sa likod ng mga eksena, na 591 00:33:56,070 --> 00:33:59,480 Lamang ako ng pagpunta sa pindutin sa maikling dahil lang sa isang uri ng pagdating sa ito 592 00:33:59,480 --> 00:34:03,720 mula sa isang ganap na naiibang mga anggulo sa mga tuntunin ng kung paano gumagana ang isang bagay na tulad nito 593 00:34:03,720 --> 00:34:04,580 makakuha ng ilagay sa lugar? 594 00:34:04,580 --> 00:34:10,820 >> Kaya isang API ay isang karaniwang interface sa lahat ng nilalamang ito. 595 00:34:10,820 --> 00:34:13,820 Ngunit upang makakuha ng doon, ang ang unang bagay na namin ay may gawin 596 00:34:13,820 --> 00:34:17,260 ay pagsamahin impormasyon ng mga libro at mga larawan 597 00:34:17,260 --> 00:34:21,580 at ang paghahanap ng mga pantulong, mga koleksyon dokumento mula sa iba't ibang mga sistema ng Harvard. 598 00:34:21,580 --> 00:34:23,929 Alef, VIA, at Oasis ay mga pangalan ng mga sistema. 599 00:34:23,929 --> 00:34:28,820 At tunay nilang pumunta sa isang pipeline, isang pagpoproseso ng pipeline. 600 00:34:28,820 --> 00:34:33,230 >> Kaya una sa lahat, makakakuha tayo ng pag-export mga file mula sa lahat ng mga sistema. 601 00:34:33,230 --> 00:34:35,130 Hinati namin ang mga ito hanggang sa mga indibidwal na item. 602 00:34:35,130 --> 00:34:39,360 Kaya mayroon kaming isang file, na kung saan ay isang gigabyte, na may isang milyong mga talaan sa loob nito. 603 00:34:39,360 --> 00:34:42,290 Kaya hinati namin ito up sa indibidwal na mga item. 604 00:34:42,290 --> 00:34:45,374 Pagkatapos, para sa bawat item, i-convert namin ito sa Mods, dahil ang ilan sa mga 605 00:34:45,374 --> 00:34:47,040 ay natively Mods, ang ilan sa kanila ay hindi. 606 00:34:47,040 --> 00:34:49,204 Kaya makuha namin ang lahat ng ito sa nasa parehong format. 607 00:34:49,204 --> 00:34:51,120 Pagkatapos ay may mga iba't-ibang pagpayaman hakbang, kung saan 608 00:34:51,120 --> 00:34:55,969 magdagdag namin ng karagdagang impormasyon sa data kaysa noon ay magagamit sa aklatan. 609 00:34:55,969 --> 00:34:59,750 Kaya kailangan namin upang magdagdag, una sa lahat mayroon kaming kung ano library ito nang matagal. 610 00:34:59,750 --> 00:35:02,250 Pumunta kami sa pamamagitan ng isang hakbang ng pagkalkula ng mga stackscore. 611 00:35:02,250 --> 00:35:07,112 Pumunta kami sa pamamagitan ng ibang hakbang ng magdagdag ng higit pang metadata sa mga tuntunin 612 00:35:07,112 --> 00:35:10,730 ng kung ano ang mga koleksyon ng mga tao Maaaring naidagdag this-- 613 00:35:10,730 --> 00:35:12,532 >> Ang mga tao ay lumilikha ng koleksyon ng mga item. 614 00:35:12,532 --> 00:35:13,990 Ano koleksyon aabutin nabibilang sa? 615 00:35:13,990 --> 00:35:17,220 Paano na-tag ng mga tao ang nilalamang ito sa nakaraan? 616 00:35:17,220 --> 00:35:20,750 Pagkatapos na i-filter out, at mong paghigpitan mga talaan dahil, bilang ko na nabanggit, 617 00:35:20,750 --> 00:35:24,120 mayroong ilang mga tala na, dahil sa mga dahilan ng copyright, hindi namin maipakita. 618 00:35:24,120 --> 00:35:26,700 At pagkatapos ay load namin ang mga ito sa isang bagay na tinatawag 619 00:35:26,700 --> 00:35:31,680 Solr, na ay hindi isang maling pagbaybay, ngunit ay ang pangalan ng isang piraso ng software 620 00:35:31,680 --> 00:35:35,710 na ang pag-index ng paghahanap, na humihimok sa lahat ng mga paghahanap sa likod ng API. 621 00:35:35,710 --> 00:35:40,110 At pagkatapos ay magagamit sa Maaari itong gamitin ang API, at ang mga tao. 622 00:35:40,110 --> 00:35:44,640 >> Kaya ito ay tulad ng isang walang kinikilingan prangka proseso. 623 00:35:44,640 --> 00:35:47,230 Isa sa mga kawili-wiling mga bagay tungkol dito ay 624 00:35:47,230 --> 00:35:50,990 na kami ay pakikitungo may 13 milyong mga talaan 625 00:35:50,990 --> 00:35:53,820 at pagpunta kami na pakikitungo o higit pa. 626 00:35:53,820 --> 00:36:01,260 At gusto naming magagawang upang mahawakan ang mga ito sa isang medyo mabilis na paraan. 627 00:36:01,260 --> 00:36:03,630 Ito ay tumatagal ng isang mahabang panahon upang iproseso ang 13,000,000 mga talaan. 628 00:36:03,630 --> 00:36:09,529 >> Kaya kung paano ito pipeline ay -set up ay na can-- mo 629 00:36:09,529 --> 00:36:12,070 Sa tingin ko ang mga bentahe ng pipeline, ang problema na hindi namin 630 00:36:12,070 --> 00:36:15,580 sinusubukan mong malutas dito, ay ang lahat ng mga pagbabago, ang lahat ng 631 00:36:15,580 --> 00:36:18,729 ang mga hakbang na ito sa pipeline ay maihihiwalay. 632 00:36:18,729 --> 00:36:19,645 Walang dependency. 633 00:36:19,645 --> 00:36:22,146 Kung ikaw ay pinoproseso isang talaan ng isang libro, 634 00:36:22,146 --> 00:36:24,270 walang dependency sa na sa pagitan ng isa pang aklat. 635 00:36:24,270 --> 00:36:27,760 >> Kaya kung ano ang maaari naming gawin ay isa lamang, sa bawat hakbang sa pipeline, 636 00:36:27,760 --> 00:36:30,470 ilalagay namin ito sa isang queue sa cloud. 637 00:36:30,470 --> 00:36:32,250 Nangyari kong maging sa Amazon Web Services. 638 00:36:32,250 --> 00:36:35,140 Kaya mayroong isang listahan ng, sabihin, 10,000 ang mga item na 639 00:36:35,140 --> 00:36:38,100 kailangang maging normalize at -convert sa format ng Mods. 640 00:36:38,100 --> 00:36:41,620 At iikot kami ng maraming server ayon sa gusto namin, siguro 10 server. 641 00:36:41,620 --> 00:36:44,860 At bawat isa sa mga server lang nakaupo doon, mukhang sa na pila, 642 00:36:44,860 --> 00:36:46,730 nakikita na mayroong isa na nangangailangang maproseso, pulls-off ito sa pila, 643 00:36:46,730 --> 00:36:48,740 Pinoproseso ng ito, at sticks ito sa susunod na queue. 644 00:36:48,740 --> 00:36:54,200 >> At kaya kung ano na nagpapahintulot sa amin gawin ay mag-apply, mahalagang, 645 00:36:54,200 --> 00:36:58,110 ng maraming hardware bilang gusto naming ito problema para sa isang napaka-ikling oras ng panahon 646 00:36:58,110 --> 00:37:02,970 -proseso ang data nang mabilis hangga't maaari, na kung saan ay isang bagay na lamang, 647 00:37:02,970 --> 00:37:08,220 ngayon sa mundo ng cloud computing kaya namin probisyon mga server tunay 648 00:37:08,220 --> 00:37:09,890 agad, ay kapaki-pakinabang na. 649 00:37:09,890 --> 00:37:12,260 Kaya namin Hindi mo na kailangang magkaroon ng isang higanteng server na nakaupo sa paligid 650 00:37:12,260 --> 00:37:16,700 lahat ng oras upang gawin ang pagproseso na maaaring mangyari nang isang beses lamang sa isang linggo. 651 00:37:16,700 --> 00:37:21,440 >> Kaya na halos ito. 652 00:37:21,440 --> 00:37:27,590 May papeles na magagamit para sa API Library Cloud Item 653 00:37:27,590 --> 00:37:31,960 sa URL na ito, na magiging available sa ibang pagkakataon. 654 00:37:31,960 --> 00:37:36,730 At mangyaring pumunta tingnan ang upang makita kung mayroong anumang bagay, 655 00:37:36,730 --> 00:37:37,579 mayroon kang anumang mga ideya. 656 00:37:37,579 --> 00:37:38,120 I-play na may ito. 657 00:37:38,120 --> 00:37:38,830 Maglimayon. 658 00:37:38,830 --> 00:37:42,800 At sana ay maaari mong dumating up gamit ang isang bagay mahusay. 659 00:37:42,800 --> 00:37:44,740 Salamat sa inyo. 660 00:37:44,740 --> 00:37:45,899