1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 JEFFREY Licht: Hi atje. 3 00:00:12,370 --> 00:00:13,550 Unë jam Jeffrey Licht. 4 00:00:13,550 --> 00:00:17,890 Dhe unë jam këtu për të folur me ju në lidhje Harvard Biblioteka dhe ndërtimin e së nesërmes 5 00:00:17,890 --> 00:00:20,870 sot bibliotekë, I guess. 6 00:00:20,870 --> 00:00:23,040 Pra sfond këtu, katran për këtë sesion 7 00:00:23,040 --> 00:00:26,930 është në thelb që ka një shumë e të dhënave bibliografike 8 00:00:26,930 --> 00:00:28,400 në dispozicion në bibliotekat e Harvardit. 9 00:00:28,400 --> 00:00:33,434 Dhe ka një mundësi, përmes disa nga mjetet 10 00:00:33,434 --> 00:00:36,350 dhe një projekt që është duke u zhvilluar, për të marrë qasje në informata 11 00:00:36,350 --> 00:00:42,430 dhe të marrë atë në vende që Biblioteka Harvard nuk është duke bërë tani, 12 00:00:42,430 --> 00:00:45,460 bëjë gjëra të reja me të, eksperiment dhe luajnë rreth me të. 13 00:00:45,460 --> 00:00:52,413 >> Pra, pika e hyrjes në këtë është një API i quajtur Biblioteka Cloud Harvardit, e cila 14 00:00:52,413 --> 00:00:57,650 është një server i hapur metadata, që unë do të flasim për tani. 15 00:00:57,650 --> 00:01:02,595 Pra sfond është se ka një shumë gjëra në bibliotekën e Harvardit. 16 00:01:02,595 --> 00:01:07,150 Ne kemi mbi 13 milionë bibliografike të dhënat, miliona imazheve, 17 00:01:07,150 --> 00:01:11,090 dhe mijëra ndihmave të gjetur, të cilat janë në thelb dokumente që përshkruajnë 18 00:01:11,090 --> 00:01:15,500 koleksionet, duke thënë çfarë është në to, kuti e letrave 19 00:01:15,500 --> 00:01:21,080 dhe kështu me radhë që përfaqësojnë mbi një milion dokumente individuale. 20 00:01:21,080 --> 00:01:24,290 Dhe ka edhe shumë Informacioni që biblioteka ka 21 00:01:24,290 --> 00:01:28,180 për mënyrën se si përmbajtja është përdorur që mund të jetë me interes për njerëzit 22 00:01:28,180 --> 00:01:32,400 që mund të duan të punojnë me të. 23 00:01:32,400 --> 00:01:36,150 >> Pra, të gjithë informacionin Biblioteka ka metadata. 24 00:01:36,150 --> 00:01:39,500 Pra metadata është të dhëna në lidhje me të dhënat. 25 00:01:39,500 --> 00:01:42,070 Pra, kur flasim për informacion që është 26 00:01:42,070 --> 00:01:44,890 në dispozicion përmes bibliotekës re që është në dispozicion, 27 00:01:44,890 --> 00:01:47,760 kjo nuk është domosdoshmërisht dokumentet aktuale 28 00:01:47,760 --> 00:01:53,060 vetë, jo domosdoshmërisht i plotë Teksti i librave apo imazheve të plota, 29 00:01:53,060 --> 00:01:54,890 edhe pse që në të vërtetë mund të jetë rasti. 30 00:01:54,890 --> 00:01:57,550 Por është e vërtetë Informacioni për të dhënat. 31 00:01:57,550 --> 00:02:00,909 >> Kështu që ju mund të mendoni se e katalogimit informacion, numrat e thirrjes, subjektet, 32 00:02:00,909 --> 00:02:02,700 sa kopje të Libri ka, çfarë 33 00:02:02,700 --> 00:02:06,380 janë botimet, çfarë janë Formatet, autorët, dhe kështu me radhë. 34 00:02:06,380 --> 00:02:12,250 Pra, nuk është një shumë e informacionit në lidhje me Informacioni në mbledhjen që, 35 00:02:12,250 --> 00:02:14,400 në vetvete, është lloj i natyrshme të dobishme. 36 00:02:14,400 --> 00:02:19,230 Dhe pse në qoftë se ju jeni duke bërë hulumtime në thellësi, 37 00:02:19,230 --> 00:02:25,160 ju padyshim doni të merrni në aktuale përmbajtja e vetë dhe të shikojmë në të dhënat, 38 00:02:25,160 --> 00:02:30,140 metadata është e dobishme në aspektin e të dy analizuar korpusin si një e tërë, 39 00:02:30,140 --> 00:02:33,870 si ajo që gjërat janë në koleksionin. 40 00:02:33,870 --> 00:02:35,520 Si mund ata të bëjnë? 41 00:02:35,520 --> 00:02:39,482 Kjo ju ndihmon të gjeni të vërtetë sende të tjera, e cila është me të vërtetë qëllimi kryesor i saj. 42 00:02:39,482 --> 00:02:41,190 Pika e metadata dhe katalogu 43 00:02:41,190 --> 00:02:43,230 është që të ju ndihmojë të gjeni të gjithë informacion që është 44 00:02:43,230 --> 00:02:46,590 në dispozicion brenda koleksionet. 45 00:02:46,590 --> 00:02:53,690 >> Pra, ky është një shembull i metadata për një libër në Bibliotekën e Harvardit. 46 00:02:53,690 --> 00:02:56,370 Kështu që është atje. 47 00:02:56,370 --> 00:02:59,850 Dhe ju mund të shihni se është në të vërtetë moderuar kompleks. 48 00:02:59,850 --> 00:03:04,610 Dhe pjesë e vlerës së metadata brenda sistemit Bibliotekën e Harvardit 49 00:03:04,610 --> 00:03:09,320 është se kjo është lloj i ndërtuar nga catalogers 50 00:03:09,320 --> 00:03:12,720 dhe mbledhur nga njerëzit që aplikojnë një shumë të ekspertizës dhe aftësi 51 00:03:12,720 --> 00:03:20,030 dhe menduar për atë me kalimin e kohës, e cila ka shumë vlerë. 52 00:03:20,030 --> 00:03:25,450 >> Pra, nëse ju merrni një vështrim në këtë arkiv të dhënash për Annotated Alice, ju mund të gjeni 53 00:03:25,450 --> 00:03:32,590 ju keni marrë titullin, i cili shkroi atë, autori, dhe të gjitha subjektet e ndryshme 54 00:03:32,590 --> 00:03:35,380 të cilat njerëzit kanë kataloguar atë në. 55 00:03:35,380 --> 00:03:40,110 Dhe ju mund të shihni atje gjithashtu, në shtesë të një shumë të informacionit të mirë 56 00:03:40,110 --> 00:03:42,852 këtu, ka disa dyfishim. 57 00:03:42,852 --> 00:03:45,560 Ka shumë të kompleksitetit që është pasqyrohet përmes metadata 58 00:03:45,560 --> 00:03:46,300 që ju keni. 59 00:03:46,300 --> 00:03:50,320 >> Pra, një titull i këtij libri është Adventures Alice in Wonderland. 60 00:03:50,320 --> 00:03:53,880 Pra, kjo është një SHËNIME version i këtij libri. 61 00:03:53,880 --> 00:03:56,380 Por është quajtur gjithashtu i Annotated Alice, Adventures Alice 62 00:03:56,380 --> 00:03:58,570 në Wonderland sepse kjo është diçka që 63 00:03:58,570 --> 00:04:00,430 Martin Gardner shkruan dhe Annotated librin. 64 00:04:00,430 --> 00:04:03,369 Dhe nuk është një shumë e informacionit të madh për puzzles logjikë dhe gjëra të 65 00:04:03,369 --> 00:04:05,410 brenda Alice se ju ndoshta nuk e dini rreth. 66 00:04:05,410 --> 00:04:07,000 Kështu që ju duhet të shkoni lexoni atë. 67 00:04:07,000 --> 00:04:11,940 >> Por ju mund të shihni se ka shumë detaje këtu, 68 00:04:11,940 --> 00:04:15,340 duke përfshirë identifikuesit, kur atë ishte krijuar, ku ajo erdhi nga, 69 00:04:15,340 --> 00:04:17,420 në aspektin e Harvardit sistem, dhe kështu me radhë. 70 00:04:17,420 --> 00:04:20,350 Pra, kjo është një mostër e lloji i metadata 71 00:04:20,350 --> 00:04:24,340 që ju mund të shihni për një libër në koleksion Biblioteka Harvard. 72 00:04:24,340 --> 00:04:26,680 >> Kjo është diçka krejtësisht e ndryshme. 73 00:04:26,680 --> 00:04:32,610 Pra, ekziston një sistem i quajtur VIA Harvard, e cila në thelb 74 00:04:32,610 --> 00:04:39,990 është katalogimin imazhe dhe objektet e artit dhe gjëra vizuale gjithë Harvard, 75 00:04:39,990 --> 00:04:44,010 dhe duke shtuar disa metadata tyre, klasifikimin e tyre, 76 00:04:44,010 --> 00:04:49,200 dhe, në disa raste, sigurimin thumbnail imazhe të vogla 77 00:04:49,200 --> 00:04:51,250 që ju mund të marrë një shikoni në qoftë se ju dëshironi. 78 00:04:51,250 --> 00:04:54,240 >> Pra, ky është një shembull i metadata që ju keni për një pjatë 79 00:04:54,240 --> 00:04:57,840 nga, me sa duket, Alice in Wonderland. 80 00:04:57,840 --> 00:05:00,499 Dhe ju mund të shihni se ka më pak metadata këtu. 81 00:05:00,499 --> 00:05:02,040 Është vetëm një lloj të ndryshëm të objektit. 82 00:05:02,040 --> 00:05:03,425 Dhe kështu që nuk ka më pak informacion. 83 00:05:03,425 --> 00:05:07,790 >> Ju kryesisht kanë faktin se, një telefonatë numër, në thelb që e krijoi atë, - 84 00:05:07,790 --> 00:05:10,410 >> Ne nuk e dimë kur ajo u krijua. 85 00:05:10,410 --> 00:05:13,320 >> --and një titull. 86 00:05:13,320 --> 00:05:14,300 >> Një shembull tjetër. 87 00:05:14,300 --> 00:05:16,380 Kjo është një ndihmë e gjetur. 88 00:05:16,380 --> 00:05:19,030 Pra, ka një koleksion i Lewis Gazeta Carroll-së në Harvard. 89 00:05:19,030 --> 00:05:23,601 Pra, kjo përshkruan çfarë është në këtë koleksion. 90 00:05:23,601 --> 00:05:26,100 Pra, dikush ka shkuar nëpër dhe shikoi nëpër të gjitha kutitë 91 00:05:26,100 --> 00:05:32,220 dhe kataloguar atë, duke pasur parasysh disa sfond, shkruar një përmbledhje të asaj që është këtu. 92 00:05:32,220 --> 00:05:35,290 Dhe në qoftë se ju do të shikoni më tej në këtë, kjo 93 00:05:35,290 --> 00:05:39,620 vazhdon për faqet dhe faqet dhe faqet, por do të ju them 94 00:05:39,620 --> 00:05:41,860 çfarë letra dhe çfarë daton nga çfarë kutive 95 00:05:41,860 --> 00:05:44,289 ekzistuar gjatë gjithë mbledhjes. 96 00:05:44,289 --> 00:05:46,330 Por kjo është diçka që, në qoftë se ju jeni në Harvard, 97 00:05:46,330 --> 00:05:50,720 ju mund të shkoni dhe të shikoni në të vërtetë fizikisht lart dhe, me sa duket, të marrë një sy në. 98 00:05:50,720 --> 00:05:53,440 >> Pra, kjo është e gjitha e madhe. 99 00:05:53,440 --> 00:05:54,450 Ky metadata-së dobishme. 100 00:05:54,450 --> 00:05:56,327 Është në sistemin Library Harvard. 101 00:05:56,327 --> 00:05:58,910 Nuk janë mjete në internet ku ju mund të shkoni dhe të marrë një vështrim në të, 102 00:05:58,910 --> 00:05:59,993 dhe e shohin atë, dhe kërkoni atë. 103 00:05:59,993 --> 00:06:02,810 Dhe ju mund të fetë dhe zare ajo në shumë mënyra të ndryshme. 104 00:06:02,810 --> 00:06:06,920 >> Por kjo është me të vërtetë në dispozicion vetëm në qoftë se ju jeni një qenie njerëzore i ulur poshtë 105 00:06:06,920 --> 00:06:12,600 në shfletuesin tuaj web ose diçka ose telefoni juaj dhe të lundrimit nëpërmjet saj. 106 00:06:12,600 --> 00:06:16,730 Kjo nuk është me të vërtetë në dispozicion në çdo lloj i modës përdorshme 107 00:06:16,730 --> 00:06:19,520 për sistemet e tjera ose kompjuterat e tjerë të përdorur, 108 00:06:19,520 --> 00:06:21,500 jo me sisteme brenda Biblioteka Harvard, 109 00:06:21,500 --> 00:06:24,890 por sistemet në botën e jashtme, vetëm njerëzit e tjerë në përgjithësi. 110 00:06:24,890 --> 00:06:30,210 Pra, pyetja është, si mund ne e bëjnë atë në dispozicion në kompjuter 111 00:06:30,210 --> 00:06:33,560 kështu që ne mund të bëjmë më interesante sende me atë se vetëm 112 00:06:33,560 --> 00:06:36,550 browsing ajo veten? 113 00:06:36,550 --> 00:06:39,766 >> Pra, pse do të doni ta bëni këtë? 114 00:06:39,766 --> 00:06:41,140 Nuk janë një shumë e mundësive. 115 00:06:41,140 --> 00:06:43,980 Njëra është që ju mund të ndërtuar një plotësisht Mënyra tjetër e shfletimit 116 00:06:43,980 --> 00:06:46,962 përmbajtje që është në dispozicion përmes Bibliotekat e Harvardit. 117 00:06:46,962 --> 00:06:48,670 Unë do t'ju tregoj një të tillë më vonë i quajtur Stacklife, 118 00:06:48,670 --> 00:06:52,440 e cila ka një krejtësisht të ndryshme të marrë në kërkim për përmbajtjen. 119 00:06:52,440 --> 00:06:54,560 >> Ju mund të ndërtojë një motor rekomandim. 120 00:06:54,560 --> 00:06:57,955 Pra Biblioteka Harvard nuk është në Biznesi i thënë: ju pëlqen këtë libër. 121 00:06:57,955 --> 00:07:01,080 Pastaj shkoni merrni një vështrim në këto 17-tjetrin libra që ju mund të jenë të interesuar në 122 00:07:01,080 --> 00:07:03,200 ose këto 18 imazhe të tjera. 123 00:07:03,200 --> 00:07:06,040 Por që me siguri mund të të jetë një tipar i vlefshëm. 124 00:07:06,040 --> 00:07:09,272 Dhe duke pasur parasysh metadata, ajo mund të jetë e mundur për të vënë atë së bashku. 125 00:07:09,272 --> 00:07:11,980 Ju mund të kenë nevoja të ndryshme në Termat e kërkimit përmbajtjen, 126 00:07:11,980 --> 00:07:16,200 si ndoshta pavarësisht nga mjetet që janë në dispozicion që biblioteka e bën 127 00:07:16,200 --> 00:07:18,450 në dispozicion, ju mund të dëshironi për të kërkuar në një mënyrë të ndryshme 128 00:07:18,450 --> 00:07:21,847 apo jam optimist për një rast të përdorimit të veçantë, e cila ndoshta është shumë i specializuar. 129 00:07:21,847 --> 00:07:23,930 Ndoshta ka vetëm disa njerëz në botë të cilët 130 00:07:23,930 --> 00:07:25,846 dëshironi të kërkoni përmbajtjen në këtë mënyrë, por ajo 131 00:07:25,846 --> 00:07:28,985 do të jetë i madh nëse ne mund të le ta bëjë këtë. 132 00:07:28,985 --> 00:07:30,860 Ka shumë e analytics në vetëm se si njerëzit 133 00:07:30,860 --> 00:07:33,860 përdorni përmbajtje që do të jetë me të vërtetë interesante të dini rreth, gjeni 134 00:07:33,860 --> 00:07:37,280 çfarë libra janë duke u përdorur, çfarë nuk janë, dhe kështu me radhë. 135 00:07:37,280 --> 00:07:41,670 Dhe pastaj nuk ka shumë mundësi për të integruar 136 00:07:41,670 --> 00:07:45,210 me informacione të tjera që është atje në web. 137 00:07:45,210 --> 00:07:46,880 Pra, ne have-- 138 00:07:46,880 --> 00:07:50,260 >> Për shembull, NPR ka një segment shqyrtim libër, 139 00:07:50,260 --> 00:07:53,090 ku ata të intervistojnë Autorët rreth librave. 140 00:07:53,090 --> 00:07:56,837 Dhe kështu ajo do të jetë i madh në qoftë se ju ishin të shikuar deri një libër në Harvard 141 00:07:56,837 --> 00:07:59,670 Biblioteka, dhe ju thoni, OK, nuk ka qenë një intervistë me autorin. 142 00:07:59,670 --> 00:08:00,878 Le të shkojnë të marrin një vështrim në atë. 143 00:08:00,878 --> 00:08:05,461 Ose ka një faqe Wikipedia, si një autoritar, referenca shkencore 144 00:08:05,461 --> 00:08:07,710 në lidhje me këtë libër që të ju mund të dëshironi të hidhni një sy në. 145 00:08:07,710 --> 00:08:12,600 >> Nuk janë këto lloje të burimeve shpërndara në të gjithë web. 146 00:08:12,600 --> 00:08:16,555 Dhe sjelljen e tyre së bashku mund të jetë një përdorim i madh 147 00:08:16,555 --> 00:08:18,930 për dikë duke kërkuar në Përmbajtja, duke kërkuar për diçka. 148 00:08:18,930 --> 00:08:20,180 Por nuk është edhe lloj gjë që ju do të 149 00:08:20,180 --> 00:08:23,205 dua bibliotekë të jetë përgjegjës për të shkuar poshtë dhe gjurmimin 150 00:08:23,205 --> 00:08:25,455 të gjitha këto burime të ndryshme dhe mbylljen e tyre së bashku 151 00:08:25,455 --> 00:08:28,920 sepse ata janë duke ndryshuar vazhdimisht. 152 00:08:28,920 --> 00:08:33,570 Dhe çfarë ata mendojnë se është e rëndësishme maj mos të jetë ajo që ju mendoni se është e rëndësishme. 153 00:08:33,570 --> 00:08:36,929 >> Dhe edhe më shumë, në thelb nuk ka një shumë gjëra që ne nuk kemi menduar ende. 154 00:08:36,929 --> 00:08:42,222 Pra, nëse ne mund të hapur këtë ide, më shumë njerëz përveç një gjysmë duzinë apo më shumë, 155 00:08:42,222 --> 00:08:45,174 të cilët janë duke kërkuar në këtë në një bazë të rregullt mund të mendojnë për ide të 156 00:08:45,174 --> 00:08:47,340 dhe masazh të dhënave, dhe bëjnë atë që ata duan me të. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> Pra, ne duam të bërë këtë të dhënat në dispozicion për të botës. 159 00:08:54,045 --> 00:08:55,670 E pra, ka disa komplikime çift. 160 00:08:55,670 --> 00:08:58,540 Njëra është se këtë metadata është në sistemet ndryshme. 161 00:08:58,540 --> 00:09:01,110 Është në formate të ndryshme. 162 00:09:01,110 --> 00:09:04,719 Pra, ka disa normalizim që duhet të ndodhë, 163 00:09:04,719 --> 00:09:08,010 që normalizimi të qenë proces i duke sjellë gjëra nga formate të ndryshme 164 00:09:08,010 --> 00:09:12,940 dhe hartës ato në një format të vetëm kështu që fushat do të përputhen deri. 165 00:09:12,940 --> 00:09:15,160 >> Ka disa kufizime autorit. 166 00:09:15,160 --> 00:09:21,010 Kaq të çuditshme të mjaftueshme, hyrja katalog për një libër është përgjegjës për të drejtat e autorit. 167 00:09:21,010 --> 00:09:24,060 Pra, edhe pse kjo është vetëm Informacioni i nxjerrë nga libri, 168 00:09:24,060 --> 00:09:25,330 është copyrightable. 169 00:09:25,330 --> 00:09:28,400 Dhe në varësi të cilët në fakt krijuar atë metadata, 170 00:09:28,400 --> 00:09:32,175 mund të ketë kufizime për të cilët mund të shpërndajë atë, to-- ngjashme 171 00:09:32,175 --> 00:09:33,402 >> Nuk e di. 172 00:09:33,402 --> 00:09:36,110 Kjo mund ose nuk mund të jetë i ngjashëm me Situata e lyrics këngë, 173 00:09:36,110 --> 00:09:36,610 për shembull. 174 00:09:36,610 --> 00:09:38,560 Pra, ne të gjithë e dimë se si se pans jashtë. 175 00:09:38,560 --> 00:09:40,450 Kështu që ju duhet për të marrë rreth kësaj çështje. 176 00:09:40,450 --> 00:09:44,910 >> Dhe pastaj një tjetër pjesë është se ka shumë të dhëna. 177 00:09:44,910 --> 00:09:52,420 Pra, në qoftë se unë jam dikush që dëshiron të punojë me të dhënat apo ka një ide të ftohtë, 178 00:09:52,420 --> 00:09:55,350 që kanë të bëjnë me 14 milion shënimet për laptop tim 179 00:09:55,350 --> 00:09:57,487 mund të jetë problematike dhe i vështirë për t'u menaxhuar. 180 00:09:57,487 --> 00:09:59,320 Pra, ne duam për të reduktuar pengesat për njerëzit 181 00:09:59,320 --> 00:10:02,130 të jetë në gjendje për të punuar me të dhënat. 182 00:10:02,130 --> 00:10:07,880 >> Kështu qasje që shpresojmë se adresat të gjitha këto shqetësime është dy pjesë. 183 00:10:07,880 --> 00:10:11,770 Njëra është duke ndërtuar një platformë që merr Të dhënat nga të gjitha këto burime të ndryshëm 184 00:10:11,770 --> 00:10:14,350 dhe përkeqëson atë, normalizes, pasuron atë, dhe bën 185 00:10:14,350 --> 00:10:16,650 ajo në dispozicion në një lokacion të vetëm. 186 00:10:16,650 --> 00:10:20,950 Dhe kjo e bën atë në dispozicion përmes një API publik që njerëzit mund të telefononi. 187 00:10:20,950 --> 00:10:24,430 >> Pra një API është një Aplikimi Programming Interface. 188 00:10:24,430 --> 00:10:28,930 Dhe kjo në thelb i referohet një endpoint që një sistem apo teknologji 189 00:10:28,930 --> 00:10:31,720 mund të telefononi dhe të marrin të dhëna të kthehet në një format të strukturuar në një mënyrë të 190 00:10:31,720 --> 00:10:32,900 që mund të përdoret. 191 00:10:32,900 --> 00:10:36,060 Pra, nuk është e varur në vazhdim e sipër në një faqe interneti 192 00:10:36,060 --> 00:10:37,970 dhe scraping të dhënat off e saj, për shembull. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> Pra, kjo është faqja e Item API Biblioteka Cloud, 195 00:10:45,010 --> 00:10:47,220 e cila është në thelb version i saj dy. 196 00:10:47,220 --> 00:10:50,130 Kështu që është përsëritje e dytë e duke u përpjekur për të bërë gjithë këtë të dhënave 197 00:10:50,130 --> 00:10:53,280 në dispozicion në botë. 198 00:10:53,280 --> 00:10:59,560 Kështu që është e http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 Dhe vetëm për të thyer këtë poshtë pak, çfarë do të thotë kjo 200 00:11:03,830 --> 00:11:06,115 është se kjo është version dy i API. 201 00:11:06,115 --> 00:11:08,490 Ka një version njëra, e cila Unë nuk jam duke shkuar për të folur rreth. 202 00:11:08,490 --> 00:11:09,750 Por ka një version një. 203 00:11:09,750 --> 00:11:14,740 >> Dhe nëse ju jeni duke bërë thirrje kjo API, ju jeni duke marrë sende. 204 00:11:14,740 --> 00:11:20,640 Dhe pjesë e idesë së një API është një API është një kontratë. 205 00:11:20,640 --> 00:11:23,440 Kjo është diçka që është nuk do të ndryshojë. 206 00:11:23,440 --> 00:11:24,850 Kështu për shembull, - 207 00:11:24,850 --> 00:11:27,410 >> Dhe arsyeja është se në qoftë se unë të ndërtuar një lloj të sistemit që 208 00:11:27,410 --> 00:11:33,210 është duke shkuar për të përdorur një API cloud bibliotekë për të shfaqur libra apo të ndihmojë njerëzit të gjejnë 209 00:11:33,210 --> 00:11:36,190 informacion në mënyra unike, ajo që ne nuk duam të ndodhë 210 00:11:36,190 --> 00:11:38,940 është për ne për të shkuar të ndryshojë mënyrën se si se API punon, dhe papritmas 211 00:11:38,940 --> 00:11:41,340 gjithçka prishet në anën e përdoruesit fund. 212 00:11:41,340 --> 00:11:46,710 Pra, pjesë e në qoftë se ju jeni duke e bërë API në dispozicion për të botës, është e 213 00:11:46,710 --> 00:11:49,396 praktikë e mirë për të vënë një Numri version në të aq njerëz 214 00:11:49,396 --> 00:11:51,020 e di se çfarë version ata janë që kanë të bëjnë me të. 215 00:11:51,020 --> 00:11:54,300 >> Pra, nëse ne vendosim ne gjejmë një mënyrë më të mirë e bërë këtë informacion në dispozicion, 216 00:11:54,300 --> 00:11:57,295 ne mund të ndryshojë që të e quajnë atë versionin tre. 217 00:11:57,295 --> 00:11:59,920 Pra, kushdo që është ende duke përdorur version dy, që do ende punë. 218 00:11:59,920 --> 00:12:03,490 Por version tre do keni të gjitha stuff e ri. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> Pra, kjo është një API, por kjo me të vërtetë duket si një URL. 221 00:12:09,210 --> 00:12:11,680 Dhe kështu ajo që kjo është një Shembulli i është çfarë është 222 00:12:11,680 --> 00:12:16,615 quajtur një API pjesa tjetër, e cila është në dispozicion mbi vetëm një lidhje të rregullt të internetit. 223 00:12:16,615 --> 00:12:19,680 Dhe ju mund të vërtetë të shkojnë në atë në një shfletues. 224 00:12:19,680 --> 00:12:28,550 >> Kështu që këtu unë e kam hapur vetëm deri Firefox dhe shkuar për të api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 Dhe kështu ajo që unë të marrë këtu është thelb faqja e parë 226 00:12:31,560 --> 00:12:34,740 e rezultateve nga i gjithë vendosur të artikujve që ne kemi marrë. 227 00:12:34,740 --> 00:12:37,460 Dhe është këtu në formatin XML. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 Dhe kjo është edhe prettified nga Firefox. 230 00:12:42,210 --> 00:12:45,850 Ajo nuk ka të vërtetë kanë të gjitha këto pak zgjerimi dhe kontraktues 231 00:12:45,850 --> 00:12:47,880 doohickeys këtu. 232 00:12:47,880 --> 00:12:52,520 Kjo është lloj i një nicer version mënyrë për të parë atë. 233 00:12:52,520 --> 00:12:57,040 >> Por ajo që kjo është duke na thënë është Unë e kam kërkuar të gjitha sendet. 234 00:12:57,040 --> 00:13:03,120 Pra, ka 13.289.475 artikuj. 235 00:13:03,120 --> 00:13:06,150 Dhe unë jam duke kërkuar në e parë 10, duke filluar në pozicionin zero 236 00:13:06,150 --> 00:13:09,760 sepse në shkenca kompjuterike ne gjithmonë të fillojë në zero. 237 00:13:09,760 --> 00:13:15,150 Dhe ajo që unë kam këtu, në qoftë se unë vetëm të shembet kjo, ju do të shihni unë kam marrë 10 artikuj. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> Dhe në qoftë se unë të marrë një sy në një artikull, unë mund shihni se unë kam marrë informacion në lidhje me të. 240 00:13:25,210 --> 00:13:27,400 Dhe kjo është në atë që quhet formë mods. 241 00:13:27,400 --> 00:13:30,860 Dhe kështu që unë jam duke shkuar për të kaluar përsëri këtu për një çast. 242 00:13:30,860 --> 00:13:33,750 OK. 243 00:13:33,750 --> 00:13:37,447 >> Pra, le të kërkoni për diçka në specifik sepse çështja e parë që 244 00:13:37,447 --> 00:13:40,030 ndodh për të ardhur deri kur ju shikoni nëpërmjet gjithë mbledhjes 245 00:13:40,030 --> 00:13:41,750 është, sipas definicionit, të rastit. 246 00:13:41,750 --> 00:13:44,550 Pra, le të shikoni për disa donuts. 247 00:13:44,550 --> 00:13:46,830 Oh. 248 00:13:46,830 --> 00:13:49,190 >> OK. 249 00:13:49,190 --> 00:13:49,940 Kështu donuts. 250 00:13:49,940 --> 00:13:55,360 Pra, ne kemi gjetur se ka 80 artikuj në koleksion që referencë donuts. 251 00:13:55,360 --> 00:13:57,150 Ne jemi duke kërkuar në 10 e parë të tyre. 252 00:13:57,150 --> 00:14:01,890 Tani, ju mund të shihni këtu mënyrë që Unë i thashë që unë jam duke kërkuar për donuts, 253 00:14:01,890 --> 00:14:04,400 Unë vetëm shtuar diçka për të string query e URL. 254 00:14:04,400 --> 00:14:09,680 Pra q barabartë donuts, të cilat ju mund të shih pak më lehtë këtu. 255 00:14:09,680 --> 00:14:12,131 >> Dhe kjo në thelb do të thotë se ka një spekulim për API, e cila 256 00:14:12,131 --> 00:14:13,880 përcakton atë që të gjithë e këto parametra do të thotë. 257 00:14:13,880 --> 00:14:17,150 Dhe kjo do të thotë që ne jemi duke shkuar për kërko gjithçka për donuts. 258 00:14:17,150 --> 00:14:24,910 >> Pra, pika e parë këtu kemi ju mund të shihni titulli është Donuts, 259 00:14:24,910 --> 00:14:29,310 dhe ka një nëntitull i quajtur Një Passion amerikan, që është, unë mendoj, 260 00:14:29,310 --> 00:14:31,610 përshtatshme. 261 00:14:31,610 --> 00:14:36,134 Nuk janë një shumë e different-- 262 00:14:36,134 --> 00:14:38,050 Pasi ju të merrni deri në pikën të marrë të dhënat, 263 00:14:38,050 --> 00:14:41,020 ka shumë të ndryshëm Formatet që ju mund të merrni atë në. 264 00:14:41,020 --> 00:14:44,050 Dhe nuk janë pikat e forta të ndryshme dhe të dobëta për të gjithë ata. 265 00:14:44,050 --> 00:14:49,000 Pra, kjo një, ju mund të shihni këtu, kjo formë është shumë e pasur. 266 00:14:49,000 --> 00:14:51,946 Dhe është e standardizuar. 267 00:14:51,946 --> 00:14:55,040 >> Pra, ka një titull specifik fushë, një fushë subtitle. 268 00:14:55,040 --> 00:14:58,950 Ka një alternativ Titulli, Një Passion amerikan. 269 00:14:58,950 --> 00:15:01,650 Nuk është emri i lidhur me të. 270 00:15:01,650 --> 00:15:03,120 Lloji i burimit është teksti. 271 00:15:03,120 --> 00:15:06,070 Nuk është një shumë e informacionit këtu në këtë format. 272 00:15:06,070 --> 00:15:09,480 >> Por ka një bandë Formatet e ndryshme. 273 00:15:09,480 --> 00:15:11,920 Pra, ajo që ne ishim vetëm duke kërkuar në një format 274 00:15:11,920 --> 00:15:17,700 quajtur Mods, i cili qëndron për Metadata Object Përshkrim Service, 275 00:15:17,700 --> 00:15:18,250 potencialisht. 276 00:15:18,250 --> 00:15:23,030 Unë jam në të vërtetë nuk mjaft të sigurt për S. Por kjo është një format mjaft kompleks. 277 00:15:23,030 --> 00:15:24,240 Është format default. 278 00:15:24,240 --> 00:15:30,260 >> Por është ai që e mban pasurinë e të gjitha të dhënave 279 00:15:30,260 --> 00:15:33,820 që Biblioteka ka sepse është shumë e afërt me atë që 280 00:15:33,820 --> 00:15:35,110 Biblioteka përdor brenda vendit. 281 00:15:35,110 --> 00:15:39,030 Është një standard që është përdoret në të gjithë vendin, 282 00:15:39,030 --> 00:15:40,944 në të gjithë botën në bibliotekat akademike. 283 00:15:40,944 --> 00:15:42,110 Dhe kjo është shumë e ndërveprueshme. 284 00:15:42,110 --> 00:15:44,852 Pra, në qoftë se ju keni marrë një dokument që është në formatin Mods, 285 00:15:44,852 --> 00:15:47,560 ju mund të jepni atë për dikë tjetër sistemet e të cilëve kuptoj Mods, 286 00:15:47,560 --> 00:15:48,518 dhe ata mund të importojë atë. 287 00:15:48,518 --> 00:15:50,840 Kështu që është një standard. 288 00:15:50,840 --> 00:15:54,250 Është definuar shumë mirë, shumë specifike. 289 00:15:54,250 --> 00:15:58,980 Dhe kjo është ajo që e bën atë ndërveprueshme sepse në qoftë se dikush thotë: 290 00:15:58,980 --> 00:16:04,930 ky është titulli i një alternative rekord, të gjithë e di se çfarë do të thotë. 291 00:16:04,930 --> 00:16:07,740 Në anën rrokullisje, është shumë e komplikuar. 292 00:16:07,740 --> 00:16:13,160 >> Pra, nëse ju merrni një vështrim në këtë arkiv të dhënash këtu, 293 00:16:13,160 --> 00:16:15,320 në qoftë se unë vetëm dua të të marrë Titulli i këtij dokumenti, 294 00:16:15,320 --> 00:16:21,150 i këtij libri, i cili është ndoshta Donuts, Një Passion amerikan, parsing it out 295 00:16:21,150 --> 00:16:22,940 është pak e përfshirë. 296 00:16:22,940 --> 00:16:27,380 Ndërsa ka një tjetër Formati i quajtur Dublin Core, 297 00:16:27,380 --> 00:16:29,730 e cila është një shumë, format shumë më të thjeshtë. 298 00:16:29,730 --> 00:16:33,764 >> Dhe kështu që ju shihni këtu, nuk ka asnjë titulli, subtitle, titull alternativ. 299 00:16:33,764 --> 00:16:35,930 Nuk është vetëm titulli, Donuts, Një Passion amerikan, 300 00:16:35,930 --> 00:16:38,780 dhe një tjetër titull, Passion amerikan. 301 00:16:38,780 --> 00:16:42,907 Pra, kur ju jeni duke kërkuar në atë formë ju doni të merrni të dhënat nga, 302 00:16:42,907 --> 00:16:44,740 shumë varet se si ju jeni do të përdorin atë. 303 00:16:44,740 --> 00:16:46,573 A jeni duke përdorur për ndërveprimit ose të bëni ju 304 00:16:46,573 --> 00:16:49,970 doni diçka të thjeshtë që mund të jetë më e lehtë për të punuar me të? 305 00:16:49,970 --> 00:16:56,002 >> Në anën rrokullisje, një shumë e Detaje të merrni lloj squished poshtë. 306 00:16:56,002 --> 00:16:58,460 Ju mund të humbni nuancat e çfarë një mjet i veçantë në terren 307 00:16:58,460 --> 00:17:02,960 në qoftë se ju jeni që kanë të bëjnë me Dublin Core, që ju nuk do të merrni me mods. 308 00:17:02,960 --> 00:17:06,462 Pra, ato janë dy nga formatet ju mund të merrni nga API. 309 00:17:06,462 --> 00:17:08,920 Dhe në thelb, ne jemi duke e mbajtur ajo prapa skenave në mods. 310 00:17:08,920 --> 00:17:14,179 Por ne mund të ju jap atë në mods dhe Dublin Core dhe çdo gjë tjetër si. 311 00:17:14,179 --> 00:17:16,470 Konsideratë tjetër kur ju jeni duke kërkuar në të dhënat e 312 00:17:16,470 --> 00:17:21,210 është që ju mund të merrni atë si ose JSON, e cila qëndron për JavaScript Object shënim, 313 00:17:21,210 --> 00:17:24,720 ose XML, i cili qëndron për Extensible Markup Language. 314 00:17:24,720 --> 00:17:30,080 Dhe këto përfaqësime të dhënave të dy kanë pikërisht të njëjtat të dhëna, pikërisht 315 00:17:30,080 --> 00:17:31,080 të njëjtat fusha. 316 00:17:31,080 --> 00:17:33,644 Por ata janë vetëm syntactically ndryshme. 317 00:17:33,644 --> 00:17:40,401 >> Pra, kjo është a-- 318 00:17:40,401 --> 00:17:41,400 E pra, le të vetëm të kaloni. 319 00:17:41,400 --> 00:17:47,490 Pra, kjo është query tonë për donuts në formatin XML. 320 00:17:47,490 --> 00:17:53,470 Nëse unë vetëm të kaloni këtë të jetë JSON, Unë mund të shoh ajo duket ndryshe. 321 00:17:53,470 --> 00:17:58,580 Pra, tani kjo është e njëjtë përmbajtja, por një strukturë të ndryshme. 322 00:17:58,580 --> 00:18:00,080 Ka më pak kllapa kënd. 323 00:18:00,080 --> 00:18:02,530 Ka më pak fjalëshumë. 324 00:18:02,530 --> 00:18:06,440 >> Dhe kjo është një format që, në qoftë se ju po punojnë në mjedisin e internetit, 325 00:18:06,440 --> 00:18:09,680 ju jeni më shumë gjasa do që dëshironi të përdorni për shkak se një 326 00:18:09,680 --> 00:18:12,630 nga gjërat e këndshme për JSON është është e pajtueshme me JavaScript. 327 00:18:12,630 --> 00:18:17,680 Pra, nëse unë jam shkrim web app, unë mund të tërheqë në JSON dhe vetëm të punojnë me të drejtpërdrejt. 328 00:18:17,680 --> 00:18:20,187 Ndërsa me XML, kjo është një pak më e komplikuar. 329 00:18:20,187 --> 00:18:21,520 Pra, përsëri, këto janë të dyja të dobishme. 330 00:18:21,520 --> 00:18:26,387 Ata vetëm janë raste të ndryshme të përdorimit të ku njerëzit mund të dëshironi të përdorni ato. 331 00:18:26,387 --> 00:18:26,886 OK. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 Pra, përsëri në API. 334 00:18:31,680 --> 00:18:32,900 Pra, ne mund të kërkoni for-- 335 00:18:32,900 --> 00:18:36,220 >> I jap një shembull të kërkoni për donuts. 336 00:18:36,220 --> 00:18:39,330 Ne gjithashtu mund të kërkoni vetëm në një fushë të veçantë brenda këtu. 337 00:18:39,330 --> 00:18:41,310 Pra, në vend të kërkimit tërë rekord, 338 00:18:41,310 --> 00:18:43,870 Unë vetëm mund të kërkoni në fushë titullin. 339 00:18:43,870 --> 00:18:48,810 Dhe kështu që tani ka 25 gjëra që kanë donuts në titull, një nga të cilat 340 00:18:48,810 --> 00:18:52,430 ka të bëjë me rivendosjen ligatinat në menaxhimin e 341 00:18:52,430 --> 00:18:54,990 e vrimë në donut program, i cili është ndoshta 342 00:18:54,990 --> 00:18:58,970 jo domosdoshmërisht atë që ne jemi duke shikuar për kur ne jemi në kërkim për donuts. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> Ju gjithashtu mund të, kur ju jeni që kanë të bëjnë me një API-- 345 00:19:05,490 --> 00:19:08,827 >> Pjesë e të paturit e një API është duke i dhënë njerëzve akses në të dhënat e grupe të mëdha. 346 00:19:08,827 --> 00:19:11,410 Dhe ka një çift të ndryshme mjete që ju mund të përdorni për të bërë këtë. 347 00:19:11,410 --> 00:19:14,170 Njëra është, shumë thjesht, ju mund faqe përmes të dhënave. 348 00:19:14,170 --> 00:19:17,340 Pra, ashtu si në qoftë se ju bëni një pyetje nëpërmjet një ndërfaqe web, 349 00:19:17,340 --> 00:19:19,470 ju mund të shikoni në një faqe, faqe dy, tre faqe. 350 00:19:19,470 --> 00:19:22,040 Ju mund të bëjë të njëjtën gjë gjë përmes API. 351 00:19:22,040 --> 00:19:24,150 Ju vetëm duhet të jenë të i qartë në mënyrën se si ju të bëjë atë. 352 00:19:24,150 --> 00:19:29,511 >> Kështu për shembull, në qoftë se unë jam duke kërkuar në pyetjen time të parë këtu, 353 00:19:29,511 --> 00:19:32,510 ku unë jam duke bërë një kërkim për gjëra të me donuts në titull, unë mund të them, 354 00:19:32,510 --> 00:19:35,415 dhe kufiri është e barabartë me 20, që do të thotë më jepni 20 të dhënat e para, nuk 355 00:19:35,415 --> 00:19:38,540 10 pare, e cila është e paracaktuar, sepse unë dua të shikoni në 20 në një kohë. 356 00:19:38,540 --> 00:19:43,435 Ose unë mund të them, i vendosur fillojnë e barabartë me 20 dhe kufi 357 00:19:43,435 --> 00:19:47,150 barabartë 20, e cila do t'i japë mua regjistron 21 përmes 40. 358 00:19:47,150 --> 00:19:52,680 >> Kështu që unë mendoj gjë për të marr me vete këtu është 359 00:19:52,680 --> 00:19:57,290 që ne jemi duke përdorur strings pyetje për të vendosur parametrat në pyetje. 360 00:19:57,290 --> 00:20:02,760 Dhe kjo ju lejon të kontrollit çfarë ju merrni mbrapa. 361 00:20:02,760 --> 00:20:05,980 >> Një tjetër mjet që ju mund të përdorni, - 362 00:20:05,980 --> 00:20:09,250 >> Dhe kjo është me të vërtetë e dobishme në Kushtet e eksploruar e të dhënave. 363 00:20:09,250 --> 00:20:10,840 >> --is diçka të quajtur Faceting. 364 00:20:10,840 --> 00:20:15,530 Pra Faceting afat është jo domosdoshmërisht të zakonshme. 365 00:20:15,530 --> 00:20:16,880 Por ju keni parë gjithë atë para. 366 00:20:16,880 --> 00:20:18,630 Nëse ju merrni një vështrim në Amazon, për shembull, 367 00:20:18,630 --> 00:20:20,870 dhe ju bëni një kërkim për donuts në librat, 368 00:20:20,870 --> 00:20:27,080 këtu ata kanë marrë një seri librash, dhe ata janë të grupuara sipas kategorive, 369 00:20:27,080 --> 00:20:30,470 dhe ju merrni kategoritë e ndryshme, dhe sa libra në çdo kategori 370 00:20:30,470 --> 00:20:31,330 shfaqen. 371 00:20:31,330 --> 00:20:33,420 >> Pra, kjo është në thelb një aspekt. 372 00:20:33,420 --> 00:20:37,570 Ju merrni të gjitha librat e tyre, 1800 libra nuk plotëson donuts në Amazon. 373 00:20:37,570 --> 00:20:39,820 12 prej tyre janë në kategori mëngjes. 374 00:20:39,820 --> 00:20:43,100 21 në pastë dhe pjekje, dhe kështu me radhë e kështu me radhë. 375 00:20:43,100 --> 00:20:47,670 >> Pra, kjo është me të vërtetë një i dobishëm mjet për eksplorimin e përmbajtjes 376 00:20:47,670 --> 00:20:53,260 brenda bibliotekës, si dhe sepse kur ju shikoni në një aspekt, 377 00:20:53,260 --> 00:20:56,520 kjo ju jep një ide se çfarë nënshtron ekziston, si çfarë llojet e subjekteve 378 00:20:56,520 --> 00:20:58,510 janë më të popullarizuara brenda vendosur tuaj pyetje. 379 00:20:58,510 --> 00:21:00,950 Dhe kjo ju ndihmon të përzënë jashtë dhe të eksplorojnë. 380 00:21:00,950 --> 00:21:02,770 Pra, ne mund të bëjë të njëjtën gjë. 381 00:21:02,770 --> 00:21:05,940 >> Nëse ne duam të përdorim API dhe shikoni në aspekte, 382 00:21:05,940 --> 00:21:08,950 ne të shtoni një tjetër parametër për miku ynë string query. 383 00:21:08,950 --> 00:21:12,540 Pra aspektet e barabartë me një presje të ndara listë të asaj që ne duam të aspekt më. 384 00:21:12,540 --> 00:21:14,790 Pra, një nga aspektet mund të jetë subjekt. 385 00:21:14,790 --> 00:21:16,565 Një tjetër mund të jetë gjuhë. 386 00:21:16,565 --> 00:21:19,665 Dhe kështu që në qoftë se kemi drejtuar këtë pyetje, ne get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 Ajo duket shumë e shumë të njëjtën gjë këtu. 389 00:21:24,830 --> 00:21:29,010 Por ne kemi shtuar në fund i listës një sërë aspektet. 390 00:21:29,010 --> 00:21:34,060 Pra, ne kemi një aspekt të quajtur subjekt. 391 00:21:34,060 --> 00:21:40,250 Pra, kjo na është thënë se në qoftë se unë shoh në 80 rezultatet e mia nga donut pyetje, 392 00:21:40,250 --> 00:21:42,100 13 prej tyre kanë nënshtrojnë Shtetet e Bashkuara. 393 00:21:42,100 --> 00:21:43,684 Tre kanë donuts subjekt. 394 00:21:43,684 --> 00:21:45,600 Tre kanë subjektin e restaurimit ligatinave, 395 00:21:45,600 --> 00:21:47,720 të cilat mund të jenë të vrimë ynë në donut. 396 00:21:47,720 --> 00:21:51,780 Dy prej tyre, Simpsons, dhe kështu me radhë e kështu me radhë. 397 00:21:51,780 --> 00:21:59,211 >> Pra, kjo mund të jetë e dobishme në qoftë se ju dëshironi të kufizoni kërkimin tuaj. 398 00:21:59,211 --> 00:22:00,210 Kjo mund të ju ndihmojë të bëni atë. 399 00:22:00,210 --> 00:22:03,580 Sidomos në qoftë se ju keni më shumë se, të themi, 80 rezultate. 400 00:22:03,580 --> 00:22:05,980 >> Në mënyrë të ngjashme, ne gjithashtu e pyeti për aspektet mbi gjuhën. 401 00:22:05,980 --> 00:22:14,790 Pra, nëse ne shikojmë në rezultatet tona, ne shohim 76 prej tyre janë në gjuhën angleze, katër në frëngjisht, 402 00:22:14,790 --> 00:22:19,620 dy në spanjisht, dy, unë mendoj se është e pa definuar ose i panjohur, holandisht dhe Latine. 403 00:22:19,620 --> 00:22:22,830 Kështu që unë mendoj në latinisht donut rezultat, përsëri, 404 00:22:22,830 --> 00:22:24,922 nuk ka të bëjë me mallrat e pjekur. 405 00:22:24,922 --> 00:22:25,630 Por ju shkoni atje. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> Pra, kjo është lloj i ju tregon se si ju mund të tërheqë përmbajtjen mbrapsht 408 00:22:38,630 --> 00:22:41,270 nga API vetëm përmes shfletues web, e cila është e madhe. 409 00:22:41,270 --> 00:22:44,320 Por kjo nuk është e vërtetë ajo që ju do të normalisht të jetë përdorur në API për të. 410 00:22:44,320 --> 00:22:48,710 Pra, një shembull se si ju në të vërtetë do të mund ta bëni këtë është që unë e kam 411 00:22:48,710 --> 00:22:54,720 shkruar një program super i vogël, e cila, përsëri, e bën kërkimin tim donut 412 00:22:54,720 --> 00:22:59,010 dhe zgjedh një fushat çift dhe tregon ato në një tryezë. 413 00:22:59,010 --> 00:23:01,610 Pra, kjo është shumë e shumë Përmbajtja e njëjta që ne vetëm 414 00:23:01,610 --> 00:23:04,830 sharrë me disa fusha nxorrën jashtë. 415 00:23:04,830 --> 00:23:12,090 Pra listën e titujve, të vend i asaj librit 416 00:23:12,090 --> 00:23:15,120 është rreth, gjuha, dhe kështu me radhë e kështu me radhë. 417 00:23:15,120 --> 00:23:20,480 >> Pra, si kjo në të vërtetë ka ndodhur, që nga Unë mendoj që ne duhet të shikojmë në një kod, 418 00:23:20,480 --> 00:23:22,420 is-- 419 00:23:22,420 --> 00:23:28,060 >> Çfarë kemi këtu është një HTML thjeshtë faqe, e cila tregon tekstin, 420 00:23:28,060 --> 00:23:32,900 mirëpritur të renë e bibliotekës dhe pastaj tregon një tabelë të rezultateve. 421 00:23:32,900 --> 00:23:37,790 Dhe nuk janë të qartë, asnjë shpallje në tryezë kur faqja merr ngarkuar. 422 00:23:37,790 --> 00:23:41,380 Por ajo që ne jemi duke bërë është, para së gjithash, ne 423 00:23:41,380 --> 00:23:46,290 janë të ngarkimit të një bibliotekë të quajtur jQuery, e cila është në thelb 424 00:23:46,290 --> 00:23:52,030 një bibliotekë JavaScript, e cila e bën atë shumë e lehtë për të manipuluar JavaScript 425 00:23:52,030 --> 00:23:58,780 natively, HTML, dhe për të krijuar faqe web, Logjika klient-side dhe web faqet. 426 00:23:58,780 --> 00:24:01,595 >> Pra, ajo që ne kemi këtu është jQuery ka një metodë të quajtur Get, 427 00:24:01,595 --> 00:24:05,270 e cila në thelb do të shkojnë në a URL, i cili, në këtë rast, 428 00:24:05,270 --> 00:24:09,070 është ky i njohur kërkim URL. 429 00:24:09,070 --> 00:24:14,440 Dhe pastaj do të marrë përmbajtje nga që URL dhe pastaj të drejtuar një funksion në të. 430 00:24:14,440 --> 00:24:19,240 Pra, ne i tha të shkojë në api.lib.harvard / edu. 431 00:24:19,240 --> 00:24:20,060 Kërko për donuts. 432 00:24:20,060 --> 00:24:21,300 Na jep 20 shënime. 433 00:24:21,300 --> 00:24:28,590 Dhe pastaj të drejtuar këtë funksion, i cili Unë e kam zgjedhur, duke kaluar atë të të dhënave. 434 00:24:28,590 --> 00:24:34,430 Dhe të dhënave është JSON që u kthye nga API. 435 00:24:34,430 --> 00:24:40,120 >> Dhe atëherë ne jemi duke thënë, brenda se të dhënave ka një fushë të quajtur artikull. 436 00:24:40,120 --> 00:24:48,117 Dhe kur të shkoj të marrë një vështrim mbrapa në një prej këtyre rezultateve që është këtu, 437 00:24:48,117 --> 00:24:49,200 ka diçka called-- 438 00:24:49,200 --> 00:24:50,220 >> E pra, ajo që quhet pika. 439 00:24:50,220 --> 00:24:53,520 Kështu që mund të jetë se. 440 00:24:53,520 --> 00:25:01,840 Dhe çfarë ajo bën është ajo shkon nëpër çdo artikull 441 00:25:01,840 --> 00:25:05,300 dhe pastaj e quan një tjetër funksion për çdo send. 442 00:25:05,300 --> 00:25:08,440 Dhe që funksion në thelb është duke marrë vlerën 443 00:25:08,440 --> 00:25:12,010 i elementit, që është në thelb rekord individual 444 00:25:12,010 --> 00:25:18,220 dhe na lejon të largohen nga titulli, mbulimi dhe gjuha. 445 00:25:18,220 --> 00:25:21,640 >> Kështu që ne e quajmë një funksion në çdo Pika që ne u kthyer nga API. 446 00:25:21,640 --> 00:25:25,397 Dhe në qoftë se ju vetëm të marrë një sy në këtë pjesë të drejtë këtu, 447 00:25:25,397 --> 00:25:27,230 ajo që ne po bëjmë është ne jemi duke krijuar një varg, 448 00:25:27,230 --> 00:25:31,810 e cila është në thelb një Markup HTML rreth një tavolinë, me value.title, 449 00:25:31,810 --> 00:25:35,790 cila është titulli i objekt, value.coverage, 450 00:25:35,790 --> 00:25:36,790 cila është mbulimi, - 451 00:25:36,790 --> 00:25:38,225 >> Dhe ne jemi duke bërë një kontroll këtu për të parë se kush është i padefinuar 452 00:25:38,225 --> 00:25:40,570 dhe fshehur atë nëse ai thotë papërcaktuar, sepse ne nuk jemi të interesuar 453 00:25:40,570 --> 00:25:41,600 ne ate. 454 00:25:41,600 --> 00:25:42,939 >> --and atëherë gjuha. 455 00:25:42,939 --> 00:25:44,730 Dhe pastaj çfarë ne jemi duke bërë është bashkëngjitur që 456 00:25:44,730 --> 00:25:48,510 në tryezë që është të identifikuar nga ky varg këtu. 457 00:25:48,510 --> 00:25:50,790 Dhe si punon jQuery është ajo që kjo është duke thënë 458 00:25:50,790 --> 00:25:56,420 është të shikoni për tryezë me idenë Rezultatet dhe shtoni këtë tekst në të. 459 00:25:56,420 --> 00:25:59,380 Dhe kjo është tabela me rezultatet ide. 460 00:25:59,380 --> 00:26:04,998 Pra, çfarë ju deri në fund me të është kjo faqe këtu. 461 00:26:04,998 --> 00:26:06,206 Dhe në mënyrë për të parë source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 E pra, burimi nuk është në të vërtetë përditësuar kur kjo ndodhi. 464 00:26:13,810 --> 00:26:18,740 Kështu që ju mund të shihni aktual Rezultatet e tabelës këtu pse. 465 00:26:18,740 --> 00:26:24,770 >> Pra, kjo është vetëm një shembull i thjeshtë i duke bërë një pyetje shumë themelore kundër API 466 00:26:24,770 --> 00:26:29,020 dhe duke shfaqur informacion në disa të tjera formuar, dhe nuk bëjnë asgjë shumë të dashuroj. 467 00:26:29,020 --> 00:26:36,370 Tani, një tjetër shembull është si një Aplikimi i shkruar nga David Weinberger 468 00:26:36,370 --> 00:26:39,120 si një demo e ky, i cili në thelb ju tregon 469 00:26:39,120 --> 00:26:44,620 se si ju mund të pure deri rezultatet e ju jeni duke marrë nga cloud bibliotekë API 470 00:26:44,620 --> 00:26:46,250 me, të themi, Google Books. 471 00:26:46,250 --> 00:26:52,225 >> Dhe duke menduar këtu është se unë mund drejtuar një pyetje kundër Google Books, 472 00:26:52,225 --> 00:26:56,060 të marrë një kërkim me tekst të plotë, të merrni disa rezultate përsëri, të gjetur se cili prej këtyre artikujve 473 00:26:56,060 --> 00:27:01,180 në të vërtetë ekzistojnë në Hollis, Sistemi i bibliotekës, 474 00:27:01,180 --> 00:27:03,200 dhe pastaj jepni lidhje të përsëri në ato objekte. 475 00:27:03,200 --> 00:27:12,730 Pra, në qoftë se unë të kërkuar për të, ajo ishte një natë të errët dhe të stuhishme, unë 476 00:27:12,730 --> 00:27:16,210 të marrë përsëri një bandë e rezultateve nga Google, dhe pastaj një rezultat 477 00:27:16,210 --> 00:27:19,460 i cili është Një rrudhë në kohë. 478 00:27:19,460 --> 00:27:29,330 Dhe këto janë lidhjet për libra që ekzistojnë brenda sistemit të Bibliotekës Harvard. 479 00:27:29,330 --> 00:27:32,160 >> Kështu që unë mendoj Pika këtu nuk është aq shumë sa që kjo mund ose nuk mund 480 00:27:32,160 --> 00:27:34,118 të jetë në mënyrën që ju dëshironi për të kërkuar në bibliotekë, 481 00:27:34,118 --> 00:27:38,310 por ajo është një krejtësisht të ndryshme mënyrë që nuk ishte në dispozicion për ju 482 00:27:38,310 --> 00:27:42,884 para, si ju nuk kishte asnjë mënyrë për të bërë Teksti i plotë kërkimet në libra se edhe 483 00:27:42,884 --> 00:27:44,550 ishin pjesë e sistemit të Bibliotekës Harvard. 484 00:27:44,550 --> 00:27:46,870 Deri tani kjo është një mënyrë e që ju mund të bëni atë. 485 00:27:46,870 --> 00:27:51,930 Dhe ju mund të shfaqin ato në çfarëdo formati që ju dëshironi. 486 00:27:51,930 --> 00:27:55,990 Pra Pika këtu është, në thelb, ne jemi duke hapur rrugë të reja për njerëzit 487 00:27:55,990 --> 00:27:59,080 për të punuar me të dhënat. 488 00:27:59,080 --> 00:28:07,925 >> Një tjetër pjesë e resë bibliotekës është se ajo ndihmon të vë në dukje disa nga të dhënat e përdorimit 489 00:28:07,925 --> 00:28:08,800 që Biblioteka ka. 490 00:28:08,800 --> 00:28:12,630 Pra, nëse ju shkoni në bibliotekë, dhe ju jeni në kërkim për libra, 491 00:28:12,630 --> 00:28:15,770 ju nuk bëni domosdo në të vërtetë kanë një ide se, 492 00:28:15,770 --> 00:28:19,080 për të gjitha sendet në një subjekt të veçantë, çfarë 493 00:28:19,080 --> 00:28:21,200 janë njerëz në komuniteti, nëse është e 494 00:28:21,200 --> 00:28:24,890 përkufizohet si Harvard ose Vendi apo klasa juaj, 495 00:28:24,890 --> 00:28:26,421 çfarë kanë ata gjetën më të dobishme? 496 00:28:26,421 --> 00:28:28,920 Dhe bibliotekë në të vërtetë ka një ton e informacionit në lidhje me çfarë 497 00:28:28,920 --> 00:28:32,999 është më e dobishme për shkak se në qoftë se një shumë e njerëzit janë të kontrolluar nga një libër, 498 00:28:32,999 --> 00:28:34,040 që ju tregon diçka. 499 00:28:34,040 --> 00:28:36,498 Nuk duhet të ketë qenë disa arsye ata duan për të kontrolluar atë. 500 00:28:36,498 --> 00:28:38,270 Shumë njerëz e vënë atë në rezervë. 501 00:28:38,270 --> 00:28:42,520 >> Nëse kjo është në listën rezervë për një shumë e klasave, që ju tregon diçka. 502 00:28:42,520 --> 00:28:45,960 Nëse anëtarë të fakultetit janë kontrolluar atë nga shumë studentë dhe nuk janë, 503 00:28:45,960 --> 00:28:47,200 që tregon mua diçka. 504 00:28:47,200 --> 00:28:49,280 Anasjelltas, se edhe ju tregon diçka. 505 00:28:49,280 --> 00:28:54,680 Pra, kjo do të jetë me të vërtetë interesante për vënë këtë informacion atje dhe le të 506 00:28:54,680 --> 00:28:59,969 njerëz e përdorin atë për të ndihmuar ata të gjejnë punon në kuadër të sistemit të bibliotekave. 507 00:28:59,969 --> 00:29:02,260 Anë rrokullisje e kjo është ka disa privacy serioz 508 00:29:02,260 --> 00:29:07,854 Shqetësimet sepse një nga Parimet kryesore të bibliotekës 509 00:29:07,854 --> 00:29:10,770 po ne nuk jemi duke shkuar për të thënë njerëz se çka njerëzit tjerë po lexoni. 510 00:29:10,770 --> 00:29:17,360 Dhe edhe në qoftë se ju jeni duke thënë se kjo Libri është kontrolluar nga katër herë 511 00:29:17,360 --> 00:29:20,070 në një muaj të caktuar, që mund të përdoren 512 00:29:20,070 --> 00:29:25,252 të lidhura prapa në një mënyrë të veçantë Personi me të dhënat e de-anonymizing 513 00:29:25,252 --> 00:29:26,710 dhe gjetja se kush e kontrolluar atë. 514 00:29:26,710 --> 00:29:30,792 Pra mënyrë që ne mund të avoid-- 515 00:29:30,792 --> 00:29:33,750 Mënyrë që ne mund të përpiqemi për të nxjerrë disa sinjal nga të gjitha informatat e 516 00:29:33,750 --> 00:29:36,740 pa cenuar Shqetësimet e intimitetit askujt 517 00:29:36,740 --> 00:29:42,150 është në thelb ne shikojmë në 10 vjet të dhënave të përdorimit, - 518 00:29:42,150 --> 00:29:43,930 >> Pra, është e gjatë një periudhe të gjatë kohore. 519 00:29:43,930 --> 00:29:50,639 >> --and them, OK, le të shohim se si shumë herë kjo punë u përdorur, 520 00:29:50,639 --> 00:29:52,930 dhe nga të cilët gjatë kësaj periudhe e kohës, dhe pastaj në thelb 521 00:29:52,930 --> 00:29:56,300 jap përsëri një numër, që ne e quajmë një rezultat rafte, e cila në thelb 522 00:29:56,300 --> 00:29:59,910 paraqet se sa shumë ajo është përdorur. 523 00:29:59,910 --> 00:30:01,084 Dhe se number-- 524 00:30:01,084 --> 00:30:03,250 Një shumë e llogaritjeve të ndryshme shkojnë në këtë numër. 525 00:30:03,250 --> 00:30:05,150 --but kjo është një shumë e përafërt metrikë që ju jep 526 00:30:05,150 --> 00:30:11,300 disa ide se si Komuniteti mund të vlerësojmë atë punë. 527 00:30:11,300 --> 00:30:16,772 >> Dhe kështu një tjetër lloj madje më shumë plotësohet aplikacionin 528 00:30:16,772 --> 00:30:18,480 që merr përparësi e kjo është diçka 529 00:30:18,480 --> 00:30:24,000 i quajtur Stacklife, e cila është në të vërtetë në dispozicion nëpërmjet Harvard kryesore 530 00:30:24,000 --> 00:30:24,880 Portal Library. 531 00:30:24,880 --> 00:30:26,700 Pra, ju shkoni në library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 Ju do të shihni një numër të ndryshëm mënyrat e kërkimit të bibliotekës. 533 00:30:29,360 --> 00:30:32,300 Dhe një prej tyre është quajtur Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> Dhe kjo është një kërkesë që browses përmbajtjen e bibliotekës, 535 00:30:38,980 --> 00:30:43,490 por është e ndërtuar tërësisht në krye të këtyre TV. 536 00:30:43,490 --> 00:30:46,910 Kështu që nuk ka gjëra të veçanta ndodh prapa skenave. 537 00:30:46,910 --> 00:30:49,570 Nuk ka qasje në Të dhënat që ju nuk keni. 538 00:30:49,570 --> 00:30:54,090 Është përdorur TV për të siguruar ju me një shfletim të krejtësisht të ndryshme 539 00:30:54,090 --> 00:30:55,480 përvojë. 540 00:30:55,480 --> 00:30:58,570 >> Pra, në qoftë se unë të kërkuar për Alice në Wonderland në këtë rast, 541 00:30:58,570 --> 00:31:02,600 Kam marrë një rezultat që duket si kjo, e cila është shumë e much-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> Kjo është shumë e ngjashme me ndonjë kërkim tjetër ju mund të bëni, me përjashtim në këtë rast 544 00:31:10,870 --> 00:31:15,730 ne jemi duke u renditur e artikujve nga stackscore, e cila ju jep 545 00:31:15,730 --> 00:31:19,850 disa ide se si popullor këto artikuj ishin brenda komunitetit. 546 00:31:19,850 --> 00:31:25,610 Dhe kështu në mënyrë të qartë, Alice në Wonderland nga Walt Disney është shumë popullor. 547 00:31:25,610 --> 00:31:36,570 Por ju gjithashtu mund të shihni katër të lartë këtu janë ato që ju nuk mund të actually-- 548 00:31:36,570 --> 00:31:39,220 >> Gjërat që janë përdorur shumë, por ju nuk mund menjëherë 549 00:31:39,220 --> 00:31:41,240 lidhur me Alice in Wonderland. 550 00:31:41,240 --> 00:31:44,650 Pra, miku ynë i vjetër Annotated Alice është këtu. 551 00:31:44,650 --> 00:31:46,350 Kështu që unë mund të marrë një vështrim në të. 552 00:31:46,350 --> 00:31:52,010 Dhe tani ajo që unë jam duke kërkuar në thelb është një vendosur of-- 553 00:31:52,010 --> 00:31:53,760 Unë mund të ketë The Annotated Alice drejtë këtu. 554 00:31:53,760 --> 00:31:56,700 Unë kam informacion në lidhje me të. 555 00:31:56,700 --> 00:32:00,230 Dhe unë gjithashtu kam një stackscore nga, në këtë rast, 26. 556 00:32:00,230 --> 00:32:03,169 Dhe kjo tregon mua lloj afërsisht se si ne e mori për këtë stackscore, 557 00:32:03,169 --> 00:32:05,835 si cili kontrolluar atë, si si shumë herë ajo u kontrolluar jashtë, 558 00:32:05,835 --> 00:32:08,440 si fakultet apo paradiplomantë, si shumë kopje bibliotekë ka, 559 00:32:08,440 --> 00:32:11,300 dhe kështu me radhë e kështu me radhë. 560 00:32:11,300 --> 00:32:16,460 >> Dhe ju gjithashtu mund të, mjaft interesante këtu, shfletoni oxhaqet praktikisht. 561 00:32:16,460 --> 00:32:19,550 Pra, të dhënat këtu, kjo është duke treguar ty lloj 562 00:32:19,550 --> 00:32:23,547 i një përfaqësim virtuale i asaj fuqinë raft 563 00:32:23,547 --> 00:32:25,880 duket si në qoftë se keni qenë për të marrë të gjithë pasurinë e bibliotekës 564 00:32:25,880 --> 00:32:28,940 dhe vënien e tyre së bashku në një raft të pafund. 565 00:32:28,940 --> 00:32:30,990 Dhe gjë e bukur është se ne can-- 566 00:32:30,990 --> 00:32:33,380 >> Para së gjithash, metadata rreth këtyre librave 567 00:32:33,380 --> 00:32:35,627 shpesh ju tregon kur ajo ishte botuar. 568 00:32:35,627 --> 00:32:37,085 Ajo ju tregon se sa faqe ka. 569 00:32:37,085 --> 00:32:38,459 Kjo mund të ju tregojnë dimensionet. 570 00:32:38,459 --> 00:32:42,930 Kështu që ju mund të shihni se është reflektuar këtu në aspektin e madhësisë së librave. 571 00:32:42,930 --> 00:32:46,740 >> Dhe atëherë ne mund të përdorim rafte rezultatin për të nxjerrë në pah 572 00:32:46,740 --> 00:32:49,170 librat që kanë rezultate më të larta rafte. 573 00:32:49,170 --> 00:32:54,930 Pra, nëse është e errët, kjo do të thotë se, me sa duket, ajo është përdorur më shpesh. 574 00:32:54,930 --> 00:32:57,040 Pra në këtë rast, unë jam do të mendoj se kjo 575 00:32:57,040 --> 00:33:03,226 është versioni i Alice in Wonderland që është përdorur shumë shpesh dhe më 576 00:33:03,226 --> 00:33:05,100 arrihen, bibliotekë ka më shumë kopje të. 577 00:33:05,100 --> 00:33:06,975 Pra, nëse ju jeni në kërkim për Alice in Wonderland, 578 00:33:06,975 --> 00:33:10,220 kjo mund të jetë një vend i mirë për të filluar. 579 00:33:10,220 --> 00:33:13,500 >> Dhe atëherë këtu ju gjithashtu mund të lidhura nga për të, thonë, Amazon për të blerë librin, 580 00:33:13,500 --> 00:33:15,182 dhe kështu me radhë e kështu me radhë. 581 00:33:15,182 --> 00:33:17,140 Pika këtu, përsëri, nuk është aq shumë sa që ky 582 00:33:17,140 --> 00:33:25,030 është mënyra më e mirë për të shfletoni bibliotekën ose mjet i duhur për çdo rast. 583 00:33:25,030 --> 00:33:28,400 Por kjo është një tjetër mënyrë për të bërë atë. 584 00:33:28,400 --> 00:33:31,359 Dhe duke e bërë të dhënat e në dispozicion përmes një API, e cila 585 00:33:31,359 --> 00:33:34,650 është bërë nga blloqe shumë të thjeshtë të ndërtimit, e cila ju lejon të kërkoni përmbajtjen, 586 00:33:34,650 --> 00:33:39,420 ju mund të ndërtojë diçka si kjo që mund 587 00:33:39,420 --> 00:33:41,520 të jetë jashtëzakonisht të vlefshme për disa njerëz. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> Pra, kjo është lloj i, sa më shumë që unë dua për të thënë me të vërtetë në lidhje me atë API është 590 00:33:51,860 --> 00:33:56,070 dhe atë që ekspozon, ka një e tërë bandë e sende prapa skenave, të cilat 591 00:33:56,070 --> 00:33:59,480 Unë jam vetëm duke shkuar për të prekur në një kohë të shkurtër vetëm për shkak se ajo lloj vjen në këtë 592 00:33:59,480 --> 00:34:03,720 nga një kënd krejtësisht të ndryshme në Kushtet e si e bën diçka si kjo 593 00:34:03,720 --> 00:34:04,580 të marrë të vënë në vend? 594 00:34:04,580 --> 00:34:10,820 >> Pra një API është një standard ndërfaqe për të gjithë këtë përmbajtje. 595 00:34:10,820 --> 00:34:13,820 Por për të marrë atë atje, gjëja e parë që ne kishim për të bërë 596 00:34:13,820 --> 00:34:17,260 u tërhequr së bashku informacionin e librave dhe imazheve 597 00:34:17,260 --> 00:34:21,580 dhe ndihmat gjetja, grumbullimi dokument nga sistemet e ndryshme Harvardit. 598 00:34:21,580 --> 00:34:23,929 Aleph, VIA, dhe OASIS janë emrat e sistemeve. 599 00:34:23,929 --> 00:34:28,820 Ata në thelb të shkojnë në një tubacioni, një tubacioni të përpunimit. 600 00:34:28,820 --> 00:34:33,230 >> Pra, para së gjithash, ne të merrni të eksportit fotografi nga të gjitha këto sisteme. 601 00:34:33,230 --> 00:34:35,130 Ne ndarë ata, mbi sendet individuale. 602 00:34:35,130 --> 00:34:39,360 Pra, ne kemi një fotografi, e cila është një Gigabyte, i cili ka një milion të dhënat në të. 603 00:34:39,360 --> 00:34:42,290 Pra, ne ndarë atë deri në sendet individuale. 604 00:34:42,290 --> 00:34:45,374 Pastaj, për çdo artikull, ne të kthyer atë në Mods, sepse disa nga këto 605 00:34:45,374 --> 00:34:47,040 janë Mods vetvetiu, disa prej tyre nuk janë. 606 00:34:47,040 --> 00:34:49,204 Pra, ne të merrni ato të gjitha në jetë në të njëjtin format. 607 00:34:49,204 --> 00:34:51,120 Pastaj nuk janë të ndryshme Hapat e pasurimit, ku 608 00:34:51,120 --> 00:34:55,969 ne të shtoni më shumë informacion të dhënave se ishte në dispozicion në bibliotekë. 609 00:34:55,969 --> 00:34:59,750 Pra, ne kemi nevojë për të shtuar, para së gjithash ne kemi atë që bibliotekat do ta mbajë atë. 610 00:34:59,750 --> 00:35:02,250 Ne kalojnë nëpër një hap të llogaritjen e stackscore. 611 00:35:02,250 --> 00:35:07,112 Ne shkojmë nëpër një tjetër hap të duke shtuar më shumë metadata në terma 612 00:35:07,112 --> 00:35:10,730 i asaj që njerëzit koleksione mund të ketë shtuar this-- 613 00:35:10,730 --> 00:35:12,532 >> Njerëzit janë krijuar koleksionet e artikujve. 614 00:35:12,532 --> 00:35:13,990 Çfarë koleksionet e bën atë të takojnë? 615 00:35:13,990 --> 00:35:17,220 Si kanë etiketuar njerëz kjo përmbajtje në të kaluarën? 616 00:35:17,220 --> 00:35:20,750 Pastaj ju të filtruar nga, dhe ju të kufizojë të dhënat për shkak se, siç e përmenda, 617 00:35:20,750 --> 00:35:24,120 ka disa shënime që, për shkak të Arsyet e autorit, ne nuk mund të ekranit. 618 00:35:24,120 --> 00:35:26,700 Dhe pastaj ne të ngarkesës së tyre në diçka të quajtur 619 00:35:26,700 --> 00:35:31,680 Solr, e cila nuk është një gabim drejtshkrimi, por është emri i një copë software 620 00:35:31,680 --> 00:35:35,710 që e bën indeksimin e kërkimit, të cilat drejton gjithë kërkimin e prapa API. 621 00:35:35,710 --> 00:35:40,110 Dhe pastaj ai bëhet i disponueshëm për e API, dhe njerëzit mund ta përdorin atë. 622 00:35:40,110 --> 00:35:44,640 >> Pra, kjo është si një mënyrë të drejtë proces i hapur. 623 00:35:44,640 --> 00:35:47,230 Një prej interesante gjëra në lidhje me të është 624 00:35:47,230 --> 00:35:50,990 se kemi të bëjmë me 13 milion regjistrime 625 00:35:50,990 --> 00:35:53,820 dhe ne do të të bëjnë apo më shumë. 626 00:35:53,820 --> 00:36:01,260 Dhe ne duam të jetë në gjendje për të trajtuar këto në një mënyrë relativisht të shpejtë. 627 00:36:01,260 --> 00:36:03,630 Ajo merr një kohë të gjatë për përpunojë 13 milion regjistrime. 628 00:36:03,630 --> 00:36:09,529 >> Pra, si ky tubacion është ngritur është se ju can-- 629 00:36:09,529 --> 00:36:12,070 I guess avantazhin e tubacioni, problemi që ne jemi 630 00:36:12,070 --> 00:36:15,580 duke u përpjekur për të zgjidhur këtu, është se të gjitha transformimet, të gjithë 631 00:36:15,580 --> 00:36:18,729 këto hapa në këtë Tubacioni janë të ndashme. 632 00:36:18,729 --> 00:36:19,645 Nuk ka asnjë varësisë. 633 00:36:19,645 --> 00:36:22,146 Nëse jeni duke përpunimit një rekord i një libri, 634 00:36:22,146 --> 00:36:24,270 nuk ka asnjë varësisë në që në mes të një tjetër libër. 635 00:36:24,270 --> 00:36:27,760 >> Pra, çfarë mund të bëjmë është në thelb, në çdo hap në tubacion, 636 00:36:27,760 --> 00:36:30,470 ne kemi vënë atë në një radhë të re. 637 00:36:30,470 --> 00:36:32,250 I ka ndodhur të jetë në Amazon Web Services. 638 00:36:32,250 --> 00:36:35,140 Pra, ka një listë të, të themi, 10.000 artikuj që 639 00:36:35,140 --> 00:36:38,100 duhet të jetë e normalizuar dhe konvertuar në formatin mods. 640 00:36:38,100 --> 00:36:41,620 Dhe ne tjerr deri sa më shumë servera si ne duam, ndoshta 10 servers. 641 00:36:41,620 --> 00:36:44,860 Dhe secili prej këtyre serverave vetëm ulet atje, duket në këtë radhë, 642 00:36:44,860 --> 00:36:46,730 e sheh se ka një që ka nevojë për të të jenë të përpunuara, tërheq atë radhë, 643 00:36:46,730 --> 00:36:48,740 përpunon atë, dhe shkopinj ajo në radhë të ardhshëm. 644 00:36:48,740 --> 00:36:54,200 >> Dhe kështu ajo që na lejon të bëni është të aplikojë, në thelb, 645 00:36:54,200 --> 00:36:58,110 sa më shumë hardware si ne duam të kësaj problem për një periudhë shumë të shkurtër kohe 646 00:36:58,110 --> 00:37:02,970 të procesit të të dhënave sa më shpejtë mundur, e cila është diçka që vetëm, 647 00:37:02,970 --> 00:37:08,220 tani në botën e cloud computing Ne mund të servers dispozitë në thelb 648 00:37:08,220 --> 00:37:09,890 menjëherë, është se i dobishëm. 649 00:37:09,890 --> 00:37:12,260 Pra, ne nuk duhet të ketë një server gjigant ulur rreth 650 00:37:12,260 --> 00:37:16,700 të gjithë kohën për të bërë përpunimin që mund të ndodhë vetëm një herë në javë. 651 00:37:16,700 --> 00:37:21,440 >> Kështu që është më së shumti ajo. 652 00:37:21,440 --> 00:37:27,590 Ka dokumentacion në dispozicion për Item API Biblioteka Cloud 653 00:37:27,590 --> 00:37:31,960 në këtë URL, e cila do të të jetë në dispozicion më vonë. 654 00:37:31,960 --> 00:37:36,730 Dhe ju lutem shkoni merrni një vështrim në ajo për të parë nëse ka ndonjë gjë, 655 00:37:36,730 --> 00:37:37,579 ju keni ndonjë ide. 656 00:37:37,579 --> 00:37:38,120 Luaj me të. 657 00:37:38,120 --> 00:37:38,830 Luaj. 658 00:37:38,830 --> 00:37:42,800 Dhe shpresojmë se ju mund të vijnë me diçka të madhe. 659 00:37:42,800 --> 00:37:44,740 Falemnderit. 660 00:37:44,740 --> 00:37:45,899