1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 JEFFREY Licht: Hi yno. 3 00:00:12,370 --> 00:00:13,550 Rwy'n Jeffrey Licht. 4 00:00:13,550 --> 00:00:17,890 A dwi'n yma i siarad â chi am y Llyfrgell ac adeiladu Harvard yfory 5 00:00:17,890 --> 00:00:20,870 llyfrgell heddiw, yr wyf yn dyfalu. 6 00:00:20,870 --> 00:00:23,040 Felly y cefndir yma, y cae ar gyfer y sesiwn hon 7 00:00:23,040 --> 00:00:26,930 yn ei hanfod bod yna llawer o ddata llyfryddol 8 00:00:26,930 --> 00:00:28,400 ar gael yn y llyfrgelloedd Harvard. 9 00:00:28,400 --> 00:00:33,434 Ac mae cyfle, drwy rai o'r offer 10 00:00:33,434 --> 00:00:36,350 a phrosiect sydd wedi cael ei ddatblygu, i gael mynediad at y wybodaeth 11 00:00:36,350 --> 00:00:42,430 ac yn mynd ag ef i leoedd fod y Nid Llyfrgell Harvard yn ei wneud ar hyn o bryd, 12 00:00:42,430 --> 00:00:45,460 yn gwneud pethau newydd ag ef, arbrofi ac yn chwarae o gwmpas gyda hi. 13 00:00:45,460 --> 00:00:52,413 >> Felly, y pwynt mynediad i mewn i hyn yn API Gelwir y Llyfrgell Harvard Cloud, a oedd yn 14 00:00:52,413 --> 00:00:57,650 yn gweinydd metadata agored, y byddaf yn siarad am nawr. 15 00:00:57,650 --> 00:01:02,595 Felly y cefndir yw bod yna llawer o bethau yn y llyfrgell Harvard. 16 00:01:02,595 --> 00:01:07,150 Mae gennym dros 13 miliwn llyfryddol cofnodion, mae miliynau o ddelweddau, 17 00:01:07,150 --> 00:01:11,090 a miloedd o ddod o hyd cymhorthion, a oedd yn yn eu hanfod ddogfennau sy'n disgrifio 18 00:01:11,090 --> 00:01:15,500 casgliadau, gan ddweud yr hyn y yw ynddynt, bocsys o bapurau 19 00:01:15,500 --> 00:01:21,080 ac yn y blaen sy'n cynrychioli dros miliwn o ddogfennau unigol. 20 00:01:21,080 --> 00:01:24,290 Ac mae hefyd yn llawer o wybodaeth sydd gan y llyfrgell 21 00:01:24,290 --> 00:01:28,180 am y ffordd y cynnwys yn cael ei ddefnyddio fod Gallai fod o ddiddordeb i bobl 22 00:01:28,180 --> 00:01:32,400 Efallai sydd am weithio ag ef. 23 00:01:32,400 --> 00:01:36,150 >> Felly yr holl wybodaeth Mae gan y llyfrgell metadata. 24 00:01:36,150 --> 00:01:39,500 Felly metadata yn ddata am ddata. 25 00:01:39,500 --> 00:01:42,070 Felly, pan fyddwn yn sôn am y wybodaeth sy'n 26 00:01:42,070 --> 00:01:44,890 ar gael drwy'r llyfrgell cwmwl sydd ar gael, 27 00:01:44,890 --> 00:01:47,760 nid yw'n reidrwydd y dogfennau gwirioneddol 28 00:01:47,760 --> 00:01:53,060 eu hunain, nid o reidrwydd y llawn destun y llyfrau neu y lluniau llawn, 29 00:01:53,060 --> 00:01:54,890 Efallai bod hynny mewn gwirionedd yn wir. 30 00:01:54,890 --> 00:01:57,550 Ond mae'n wirioneddol gwybodaeth am y data. 31 00:01:57,550 --> 00:02:00,909 >> Felly, gallwch chi feddwl am catalogio gwybodaeth, rhifau galwadau, pynciau, 32 00:02:00,909 --> 00:02:02,700 faint o gopïau o'r llyfr ceir, beth 33 00:02:02,700 --> 00:02:06,380 yw'r argraffiadau, beth yw'r fformatau, mae'r awduron, ac yn y blaen. 34 00:02:06,380 --> 00:02:12,250 Felly mae llawer o wybodaeth am y wybodaeth yn y casgliad hwnnw, 35 00:02:12,250 --> 00:02:14,400 ynddo'i hun, yn fath o gynhenid ​​ddefnyddiol. 36 00:02:14,400 --> 00:02:19,230 Ac er os ydych yn gwneud ymchwil manwl, 37 00:02:19,230 --> 00:02:25,160 yr ydych yn amlwg yn awyddus i gyrraedd y gwir content ei hun ac yn edrych ar y data, 38 00:02:25,160 --> 00:02:30,140 y metadata yn ddefnyddiol o ran yn dadansoddi'r corpws yn ei gyfanrwydd, 39 00:02:30,140 --> 00:02:33,870 fel pa bethau sydd yn y casgliad. 40 00:02:33,870 --> 00:02:35,520 Sut maent yn berthnasol? 41 00:02:35,520 --> 00:02:39,482 Mae'n eich helpu chi wir yn dod o hyd i bethau eraill, sydd mewn gwirionedd prif bwrpas ohono. 42 00:02:39,482 --> 00:02:41,190 Y pwynt yr metadata a'r catalog 43 00:02:41,190 --> 00:02:43,230 yw eich helpu i ddod o hyd i gyd y wybodaeth sy'n 44 00:02:43,230 --> 00:02:46,590 ar gael yn y casgliadau. 45 00:02:46,590 --> 00:02:53,690 >> Felly, mae hyn yn enghraifft o metadata am lyfr yn y Llyfrgell Harvard. 46 00:02:53,690 --> 00:02:56,370 Felly mae'n yno. 47 00:02:56,370 --> 00:02:59,850 A gallwch weld ei fod yn mewn gwirionedd yn gymharol gymhleth. 48 00:02:59,850 --> 00:03:04,610 A rhan o werth metadata o fewn y system Harvard Llyfrgell 49 00:03:04,610 --> 00:03:09,320 yw y mae wedi bod yn didoli o cronni gan catalogers 50 00:03:09,320 --> 00:03:12,720 ac yn cydosod gan bobl sy'n gwneud cais llawer o arbenigedd a sgiliau 51 00:03:12,720 --> 00:03:20,030 ac yn meddwl iddo dros amser, sydd â llawer o werth. 52 00:03:20,030 --> 00:03:25,450 >> Felly, os ydych yn edrych ar y cofnod hwn er Mae'r anodedig Alice, gallwch gael gwybod 53 00:03:25,450 --> 00:03:32,590 eich bod wedi cael y teitl, a ysgrifennodd ef, y awdur, a holl wahanol bynciau 54 00:03:32,590 --> 00:03:35,380 mae pobl wedi catalogio i mewn. 55 00:03:35,380 --> 00:03:40,110 A gallwch weld mae hefyd, yn ogystal â llawer o wybodaeth dda 56 00:03:40,110 --> 00:03:42,852 yma, mae rhywfaint o ddyblygu. 57 00:03:42,852 --> 00:03:45,560 Mae llawer o gymhlethdod sy'n hadlewyrchu drwy'r metadata 58 00:03:45,560 --> 00:03:46,300 sydd gennych. 59 00:03:46,300 --> 00:03:50,320 >> Felly, un teitl y llyfr hwn Anturiaethau Alice in Wonderland. 60 00:03:50,320 --> 00:03:53,880 Felly mae hwn yn anodedig fersiwn o'r llyfr. 61 00:03:53,880 --> 00:03:56,380 Ond mae hefyd yn cael ei alw'n The Annotated Alice, Anturiaethau Alice 62 00:03:56,380 --> 00:03:58,570 in Wonderland oherwydd mae'n rhywbeth sy'n 63 00:03:58,570 --> 00:04:00,430 Martin Gardner Ysgrifennodd a'u hanodi y llyfr. 64 00:04:00,430 --> 00:04:03,369 Ac mae llawer o wybodaeth mawr am posau rhesymeg a phethau 65 00:04:03,369 --> 00:04:05,410 o fewn Alice bod chi Mae'n debyg nad oedd yn gwybod am. 66 00:04:05,410 --> 00:04:07,000 Felly, dylech fynd ddarllen. 67 00:04:07,000 --> 00:04:11,940 >> Ond gallwch weld does llawer o fanylion fan hyn, 68 00:04:11,940 --> 00:04:15,340 gan gynnwys dynodyddion, pan fydd yn ei greu, o ble y daeth, 69 00:04:15,340 --> 00:04:17,420 o ran y Harvard system, ac yn y blaen. 70 00:04:17,420 --> 00:04:20,350 Felly mae hwn yn sampl o y math o metadata 71 00:04:20,350 --> 00:04:24,340 y gallech eu gweld am lyfr mewn casgliad y Llyfrgell Harvard. 72 00:04:24,340 --> 00:04:26,680 >> Mae hyn yn rhywbeth hollol wahanol. 73 00:04:26,680 --> 00:04:32,610 Felly mae system o'r enw VIA Harvard, a oedd yn y bôn 74 00:04:32,610 --> 00:04:39,990 yn catalogio delweddau a gwrthrychau celf a phethau gweledol ledled Harvard, 75 00:04:39,990 --> 00:04:44,010 ac yn ychwanegu rhai metadata iddynt, eu dosbarthu, 76 00:04:44,010 --> 00:04:49,200 ac, mewn rhai achosion, gan ddarparu delweddau thumbnail bach 77 00:04:49,200 --> 00:04:51,250 y gallwch gymryd edrych ar os ydych yn dymuno gwneud hynny. 78 00:04:51,250 --> 00:04:54,240 >> Felly, mae hyn yn enghraifft o'r metadata sydd gennych am blât 79 00:04:54,240 --> 00:04:57,840 o, yn ôl pob tebyg, Alice in Wonderland. 80 00:04:57,840 --> 00:05:00,499 A gallwch weld does llai o metadata yma. 81 00:05:00,499 --> 00:05:02,040 'I' jyst gwahanol fath o wrthrych. 82 00:05:02,040 --> 00:05:03,425 Ac felly mae llai o wybodaeth. 83 00:05:03,425 --> 00:05:07,790 >> Rydych yn bennaf yn cael y ffaith, galwad Rhif, yn y bôn a greodd ef, - 84 00:05:07,790 --> 00:05:10,410 >> Nid ydym yn gwybod pryd y cafodd ei greu. 85 00:05:10,410 --> 00:05:13,320 >> --and teitl. 86 00:05:13,320 --> 00:05:14,300 >> Enghraifft arall. 87 00:05:14,300 --> 00:05:16,380 Mae hwn yn gymorth dod o hyd. 88 00:05:16,380 --> 00:05:19,030 Felly mae 'na gasgliad o Lewis Papurau Carroll yn Harvard. 89 00:05:19,030 --> 00:05:23,601 Felly, mae hyn yn disgrifio'r hyn yn y casgliad. 90 00:05:23,601 --> 00:05:26,100 Felly rhywun wedi mynd trwy ac edrych drwy'r holl flychau 91 00:05:26,100 --> 00:05:32,220 ac yn catalogio hynny, rhoi rhywfaint o gefndir, ysgrifennu crynodeb o'r hyn sydd yma. 92 00:05:32,220 --> 00:05:35,290 Ac os ydych yn edrych ymhellach ar hyn, mae hyn yn 93 00:05:35,290 --> 00:05:39,620 yn mynd ymlaen ar gyfer tudalennau a thudalennau a thudalennau, ond bydd yn rhoi gwybod i chi 94 00:05:39,620 --> 00:05:41,860 pa llythyrau a pha yn dyddio o pa flychau 95 00:05:41,860 --> 00:05:44,289 yn bodoli drwy gydol y casgliad. 96 00:05:44,289 --> 00:05:46,330 Ond mae hyn yn rhywbeth hynny, os ydych yn Harvard, 97 00:05:46,330 --> 00:05:50,720 gallwch fynd ac mewn gwirionedd yn edrych yn gorfforol i fyny ac, yn ôl pob tebyg, yn edrych ar. 98 00:05:50,720 --> 00:05:53,440 >> Felly, mae hyn i gyd yn wych. 99 00:05:53,440 --> 00:05:54,450 Mae hyn yn metadata yn ddefnyddiol. 100 00:05:54,450 --> 00:05:56,327 Mae'n yn y system Harvard Llyfrgell. 101 00:05:56,327 --> 00:05:58,910 Mae offer ar-lein lle rydych yn Gall fynd ac edrych arno, 102 00:05:58,910 --> 00:05:59,993 ac yn ei weld, a chwilio amdano. 103 00:05:59,993 --> 00:06:02,810 A gallwch sleisio iddo a dis mewn llawer o wahanol ffyrdd. 104 00:06:02,810 --> 00:06:06,920 >> Ond mae'n wirioneddol ond ar gael os ydych yn bod dynol yn eistedd i lawr 105 00:06:06,920 --> 00:06:12,600 yn eich porwr gwe neu rywbeth neu eich ffôn ac yn llywio drwyddo. 106 00:06:12,600 --> 00:06:16,730 Dyw hi ddim yn wir yn ar gael unrhyw fath o ffasiwn y gellir ei ddefnyddio 107 00:06:16,730 --> 00:06:19,520 ar gyfer systemau eraill neu cyfrifiaduron eraill i'w defnyddio, 108 00:06:19,520 --> 00:06:21,500 nid gyda systemau o fewn Llyfrgell Harvard, 109 00:06:21,500 --> 00:06:24,890 ond mae systemau yn y byd y tu allan, dim ond pobl eraill yn gyffredinol. 110 00:06:24,890 --> 00:06:30,210 Felly, y cwestiwn yw, sut allwn ni yn ei gwneud yn ar gael i gyfrifiaduron 111 00:06:30,210 --> 00:06:33,560 fel y gallwn ni ei wneud yn fwy diddorol pethau ag ef na dim ond 112 00:06:33,560 --> 00:06:36,550 pori ein hunain? 113 00:06:36,550 --> 00:06:39,766 >> Felly byddai pam eich bod am wneud hyn? 114 00:06:39,766 --> 00:06:41,140 Mae llawer o bosibiliadau. 115 00:06:41,140 --> 00:06:43,980 Mae un yn y gallech adeiladu yn gyfan gwbl ffordd wahanol o bori 116 00:06:43,980 --> 00:06:46,962 y cynnwys sydd ar gael drwy'r Llyfrgelloedd Harvard. 117 00:06:46,962 --> 00:06:48,670 'N annhymerus' yn dangos i chi un Gelwir ddiweddarach Stacklife, 118 00:06:48,670 --> 00:06:52,440 sydd â hollol wahanol cymryd ar chwilio am y cynnwys. 119 00:06:52,440 --> 00:06:54,560 >> Gallech adeiladu argymhelliad peiriant. 120 00:06:54,560 --> 00:06:57,955 Felly nid Llyfrgell Harvard yn y busnes o ddweud, chi'n hoffi y llyfr hwn. 121 00:06:57,955 --> 00:07:01,080 Yna ewch yn edrych ar y rhain 17 arall llyfrau y gallech fod â diddordeb mewn 122 00:07:01,080 --> 00:07:03,200 neu y rhain 18 o ddelweddau eraill. 123 00:07:03,200 --> 00:07:06,040 Ond mae hynny yn sicr gallai fod yn nodwedd werthfawr. 124 00:07:06,040 --> 00:07:09,272 Ac o ystyried y metadata, caiff yn bosibl rhoi hynny at ei gilydd. 125 00:07:09,272 --> 00:07:11,980 Efallai y byddwch wahanol anghenion mewn ran chwilio cynnwys, 126 00:07:11,980 --> 00:07:16,200 fel efallai er gwaethaf yr offer sy'n ar gael bod y llyfrgell yn gwneud 127 00:07:16,200 --> 00:07:18,450 sydd ar gael, efallai y byddwch am i chwilio mewn ffordd wahanol 128 00:07:18,450 --> 00:07:21,847 neu optimize ar gyfer achos ddefnydd penodol, sydd efallai ei bod yn arbenigol iawn. 129 00:07:21,847 --> 00:07:23,930 Efallai nid oes dim ond ychydig bobl yn y byd sydd 130 00:07:23,930 --> 00:07:25,846 eisiau chwilio cynnwys yn y ffordd hon, ond mae'n 131 00:07:25,846 --> 00:07:28,985 byddai'n wych os ydym Gallai gadael iddyn nhw wneud hynny. 132 00:07:28,985 --> 00:07:30,860 Mae llawer o analytics mewn dim ond sut mae pobl 133 00:07:30,860 --> 00:07:33,860 Defnyddiwch y cynnwys a fyddai'n wir yn ddiddorol gwybod am, cael gwybod 134 00:07:33,860 --> 00:07:37,280 pa lyfrau yn cael eu defnyddio, yr hyn nad yw, ac yn y blaen. 135 00:07:37,280 --> 00:07:41,670 Ac yna mae llawer o cyfle i integreiddio 136 00:07:41,670 --> 00:07:45,210 â gwybodaeth arall dyna allan yna ar y we. 137 00:07:45,210 --> 00:07:46,880 Felly rydym have-- 138 00:07:46,880 --> 00:07:50,260 >> Er enghraifft, mae gan NPR segment adolygu llyfr, 139 00:07:50,260 --> 00:07:53,090 lle maent yn cyfweld awduron am lyfrau. 140 00:07:53,090 --> 00:07:56,837 Ac felly byddai'n wych pe baech yn edrych i fyny lyfr yn y Harvard 141 00:07:56,837 --> 00:07:59,670 Llyfrgell, ac yr ydych yn dweud, OK, mae cyfweliad gyda'r awdur wedi bod. 142 00:07:59,670 --> 00:08:00,878 Gadewch i ni fynd yn edrych ar hynny. 143 00:08:00,878 --> 00:08:05,461 Neu mae 'na dudalen Wikipedia, fel awdurdodol cyfeirio, ysgolheigaidd 144 00:08:05,461 --> 00:08:07,710 am y llyfr hwn sy'n eich Efallai am gymryd golwg ar. 145 00:08:07,710 --> 00:08:12,600 >> Mae mathau hyn o ffynonellau gwasgaru ar draws y we. 146 00:08:12,600 --> 00:08:16,555 A dod â hwy at ei gilydd Gallai fod yn ddefnydd mawr 147 00:08:16,555 --> 00:08:18,930 i rywun edrych ar y cynnwys, chwilio am rywbeth. 148 00:08:18,930 --> 00:08:20,180 Ond nid hefyd yw'r math o beth byddech yn 149 00:08:20,180 --> 00:08:23,205 am i'r llyfrgell i fod yn gyfrifol ar gyfer mynd i lawr ac yn hela i lawr 150 00:08:23,205 --> 00:08:25,455 i gyd yn wahanol ffynonellau hyn ac yn eu plygio gyda'i gilydd 151 00:08:25,455 --> 00:08:28,920 oherwydd eu bod yn newid yn barhaus. 152 00:08:28,920 --> 00:08:33,570 A beth maen nhw'n meddwl sy'n caiff pwysig na fydd beth yw eich barn yn bwysig. 153 00:08:33,570 --> 00:08:36,929 >> A hyd yn oed yn fwy felly, yn y bôn mae 'na llawer o bethau nad ydym wedi meddwl amdanynt eto. 154 00:08:36,929 --> 00:08:42,222 Felly, os gallwn agor y fyny, mwy pobl ar wahân hanner dwsin neu fwy, 155 00:08:42,222 --> 00:08:45,174 sydd yn edrych ar hyn ar rheolaidd gallu meddwl am syniadau 156 00:08:45,174 --> 00:08:47,340 ac yn tylino y data, a gwneud yr hyn y maent ei eisiau ag ef. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> Felly rydym am wneud hyn data sydd ar gael i'r byd. 159 00:08:54,045 --> 00:08:55,670 Wel, mae yna gwpl o gymhlethdodau. 160 00:08:55,670 --> 00:08:58,540 Un yw bod metadata hwn mewn systemau gwahanol. 161 00:08:58,540 --> 00:09:01,110 Mae'n mewn fformatau gwahanol. 162 00:09:01,110 --> 00:09:04,719 Felly mae rhywfaint o normaleiddio y mae angen i hyn ddigwydd, 163 00:09:04,719 --> 00:09:08,010 sy'n normaleiddio sef y broses o gan ddod â phethau o fformatau gwahanol 164 00:09:08,010 --> 00:09:12,940 ac yn eu mapio i fformat sengl fel y bydd y meysydd cyd-fynd i fyny. 165 00:09:12,940 --> 00:09:15,160 >> Mae rhai cyfyngiadau hawlfraint. 166 00:09:15,160 --> 00:09:21,010 Yn rhyfedd ddigon, y cofnod catalog am lyfr yn atebol am hawlfraint. 167 00:09:21,010 --> 00:09:24,060 Felly, hyd yn oed er 'i' jyst wybodaeth a geir yn y llyfr, 168 00:09:24,060 --> 00:09:25,330 ei fod yn â hawlfraint. 169 00:09:25,330 --> 00:09:28,400 Ac yn dibynnu ar bwy mewn gwirionedd creu y metadata, 170 00:09:28,400 --> 00:09:32,175 gall fod cyfyngiadau ar bwy Gall ddosbarthu, i-- tebyg 171 00:09:32,175 --> 00:09:33,402 >> Nid wyf yn gwybod. 172 00:09:33,402 --> 00:09:36,110 Mae'n neu beidio fod yn debyg i'r y sefyllfa y geiriau caneuon, 173 00:09:36,110 --> 00:09:36,610 er enghraifft. 174 00:09:36,610 --> 00:09:38,560 Felly, rydym i gyd yn gwybod sut hwyl a gaiff arni. 175 00:09:38,560 --> 00:09:40,450 Felly, mae angen i chi fynd o gwmpas y mater hwnnw. 176 00:09:40,450 --> 00:09:44,910 >> Ac yna darn arall yw fod yna llawer o ddata. 177 00:09:44,910 --> 00:09:52,420 Felly, os wyf yn rhywun sydd am weithio â'r data neu ganddi syniad oer, 178 00:09:52,420 --> 00:09:55,350 delio â 14 miliwn cofnodion ar fy ngliniadur 179 00:09:55,350 --> 00:09:57,487 Gallai fod yn broblem ac yn anodd i'w rheoli. 180 00:09:57,487 --> 00:09:59,320 Felly rydym am leihau y rhwystrau i bobl 181 00:09:59,320 --> 00:10:02,130 i allu gweithio gyda'r data. 182 00:10:02,130 --> 00:10:07,880 >> Felly mae'r dull hwnnw, gobeithio, cyfeiriadau pob un o'r pryderon hyn yw dwy ran. 183 00:10:07,880 --> 00:10:11,770 Mae un yn adeiladu llwyfan sy'n cymryd data o holl ffynonellau gwahanol hyn 184 00:10:11,770 --> 00:10:14,350 ac yn gwaethygu hynny, normalizes, cyfoethogi ef, ac yn gwneud 185 00:10:14,350 --> 00:10:16,650 ei fod ar gael mewn un lleoliad. 186 00:10:16,650 --> 00:10:20,950 Ac mae'n ei gwneud yn ar gael drwy API cyhoeddus y gall pobl ffonio. 187 00:10:20,950 --> 00:10:24,430 >> Felly API yn Gais Rhyngwyneb Rhaglennu Rhaglen. 188 00:10:24,430 --> 00:10:28,930 Ac mae'n y bôn yn cyfeirio at endpoint bod system neu dechnoleg 189 00:10:28,930 --> 00:10:31,720 Gall alw a chael data yn ôl yn fformat strwythuredig mewn ffordd 190 00:10:31,720 --> 00:10:32,900 y gellir ei ddefnyddio. 191 00:10:32,900 --> 00:10:36,060 Felly nid yw'n ddibynnol ar fynd i'r wefan 192 00:10:36,060 --> 00:10:37,970 ac yn crafu data ffwrdd ohono, er enghraifft. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> Felly, mae hyn yw'r dudalen gartref Llyfrgell Cloud API eitem, 195 00:10:45,010 --> 00:10:47,220 sydd yn ei hanfod ei fersiwn dau. 196 00:10:47,220 --> 00:10:50,130 Felly mae'n ail ailadroddiad o ceisio gwneud yr holl ddata hwn 197 00:10:50,130 --> 00:10:53,280 sydd ar gael i'r byd. 198 00:10:53,280 --> 00:10:59,560 Felly mae'n http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 A dim ond i dorri i lawr ychydig bach, beth mae hyn yn ei olygu 200 00:11:03,830 --> 00:11:06,115 yw bod hyn yn fersiwn dau o'r API. 201 00:11:06,115 --> 00:11:08,490 Mae 'na fersiwn un, a oedd yn Dydw i ddim yn mynd i siarad am. 202 00:11:08,490 --> 00:11:09,750 Ond mae yna fersiwn un. 203 00:11:09,750 --> 00:11:14,740 >> Ac os ydych yn ffonio hon API, rydych yn cael eitemau. 204 00:11:14,740 --> 00:11:20,640 A rhan o'r syniad o API yn API yn gontract. 205 00:11:20,640 --> 00:11:23,440 Mae'n rhywbeth sy'n ddim yn mynd i newid. 206 00:11:23,440 --> 00:11:24,850 Felly, er enghraifft, - 207 00:11:24,850 --> 00:11:27,410 >> A'r rheswm yw bod os byddaf adeiladu rhyw fath o system sy'n 208 00:11:27,410 --> 00:11:33,210 yn mynd i ddefnyddio API cwmwl llyfrgell i arddangos llyfrau neu helpu pobl i ddod o hyd i 209 00:11:33,210 --> 00:11:36,190 gwybodaeth mewn ffyrdd unigryw, yr hyn nad ydym am ei weld yn digwydd 210 00:11:36,190 --> 00:11:38,940 yw i ni fynd newid y ffordd hynny API yn gweithio, ac yn sydyn 211 00:11:38,940 --> 00:11:41,340 popeth yn torri ar yr ochr defnyddiwr. 212 00:11:41,340 --> 00:11:46,710 Felly yn rhan o os ydych yn gwneud API sydd ar gael i'r byd, 'i' 213 00:11:46,710 --> 00:11:49,396 arfer da i roi rhif y fersiwn ynddo fel bod pobl 214 00:11:49,396 --> 00:11:51,020 yn gwybod pa fersiwn y maent yn delio â. 215 00:11:51,020 --> 00:11:54,300 >> Felly, os byddwn yn penderfynu ydym yn dod o hyd i ffordd well o sicrhau bod yr wybodaeth hon ar gael, 216 00:11:54,300 --> 00:11:57,295 efallai y byddwn yn newid hynny i ffoniwch y fersiwn tri. 217 00:11:57,295 --> 00:11:59,920 Felly pawb sy'n dal i ddefnyddio Fersiwn dau, bydd hynny yn dal i weithio. 218 00:11:59,920 --> 00:12:03,490 Ond mae fersiwn tri byddai yr holl stwff newydd. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> Felly mae hwn yn API, ond mae hyn 'n sylweddol yn edrych fel URL. 221 00:12:09,210 --> 00:12:11,680 Ac felly yr hyn y mae hyn yn Enghraifft o hyn yw 222 00:12:11,680 --> 00:12:16,615 a elwir yn API gorffwys, sydd ar gael dros dim cysylltiad gwe rheolaidd. 223 00:12:16,615 --> 00:12:19,680 Ac gallwch mewn gwirionedd mynd ato mewn porwr. 224 00:12:19,680 --> 00:12:28,550 >> Felly dyma Rwyf newydd agor i fyny Firefox a mynd i'r api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 Ac felly yr hyn yr wyf yn ei gael yma yw yn y bôn y dudalen gyntaf 226 00:12:31,560 --> 00:12:34,740 o ganlyniadau o'r cyfan set o eitemau sy'n gennym. 227 00:12:34,740 --> 00:12:37,460 Ac mae'n yma mewn fformat XML. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 Ac mae hefyd wedi bod prettified gan Firefox. 230 00:12:42,210 --> 00:12:45,850 Nid yw'n mewn gwirionedd yn cael pob un o'r rhain ychydig o ehangu a chontractio 231 00:12:45,850 --> 00:12:47,880 doohickeys yma. 232 00:12:47,880 --> 00:12:52,520 Mae hwn yn fath o brafiach Fersiwn ffordd i edrych arno. 233 00:12:52,520 --> 00:12:57,040 >> Ond beth mae hyn yn ei ddweud wrthym yw Rwyf wedi gofyn yr holl eitemau. 234 00:12:57,040 --> 00:13:03,120 Felly, mae yna 13,289,475 o eitemau. 235 00:13:03,120 --> 00:13:06,150 Ac yr wyf i'n edrych ar y cyntaf 10, yn dechrau am sefyllfa sero 236 00:13:06,150 --> 00:13:09,760 oherwydd mewn gwyddoniaeth gyfrifiadurol rydym bob amser yn dechrau ar sero. 237 00:13:09,760 --> 00:13:15,150 A hyn yr wyf wedi yma, os Fi jyst yn cwympo hyn, byddwch yn gweld gen i 10 o eitemau. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> Ac os wyf yn edrych ar eitem, gallaf gweld bod gen i wybodaeth am y peth. 240 00:13:25,210 --> 00:13:27,400 Ac mae hyn yn yn yr hyn a elwir ffurflen Mods. 241 00:13:27,400 --> 00:13:30,860 Ac felly dwi'n mynd i newid yn ôl yma am eiliad. 242 00:13:30,860 --> 00:13:33,750 OK. 243 00:13:33,750 --> 00:13:37,447 >> Felly, gadewch i ni chwilio am rywbeth mewn benodol oherwydd bod yr eitem gyntaf y 244 00:13:37,447 --> 00:13:40,030 yn digwydd i ddod i fyny pan fyddwch yn edrych drwy'r casgliad cyfan 245 00:13:40,030 --> 00:13:41,750 yw, drwy ddiffiniad, ar hap. 246 00:13:41,750 --> 00:13:44,550 Felly, gadewch i ni edrych ar gyfer rhai toesenni. 247 00:13:44,550 --> 00:13:46,830 Oh. 248 00:13:46,830 --> 00:13:49,190 >> OK. 249 00:13:49,190 --> 00:13:49,940 Felly toesenni. 250 00:13:49,940 --> 00:13:55,360 Felly, canfuom mae 80 o eitemau yn y casgliad sy'n cyfeirio toesenni. 251 00:13:55,360 --> 00:13:57,150 Rydym yn edrych ar y 10 cyntaf ohonynt. 252 00:13:57,150 --> 00:14:01,890 Nawr, gallwch weld yma y ffordd y Dywedais fy mod i'n chwilio am toesenni, 253 00:14:01,890 --> 00:14:04,400 Fi jyst ychwanegu rhywbeth at y llinyn ymholiad y URL. 254 00:14:04,400 --> 00:14:09,680 Felly q hafal toesenni, y gallwch gweld ychydig yn haws yma. 255 00:14:09,680 --> 00:14:12,131 >> Ac mae hyn yn y bôn yn golygu mae manyleb ar gyfer yr API, a oedd yn 256 00:14:12,131 --> 00:14:13,880 diffinio'r hyn i gyd paramedrau hyn yn ei olygu. 257 00:14:13,880 --> 00:14:17,150 Ac mae hyn yn golygu ein bod yn mynd i chwilio popeth ar gyfer toesenni. 258 00:14:17,150 --> 00:14:24,910 >> Felly, yr eitem gyntaf yma rydym wedi gallwch weld y teitl yw Donuts, 259 00:14:24,910 --> 00:14:29,310 ac mae is-deitl Gelwir Passion Americanaidd, sydd, mae'n debyg, 260 00:14:29,310 --> 00:14:31,610 briodol. 261 00:14:31,610 --> 00:14:36,134 Mae llawer o different-- 262 00:14:36,134 --> 00:14:38,050 Unwaith y byddwch yn cyrraedd y pwynt o gael y data, 263 00:14:38,050 --> 00:14:41,020 mae yna lawer o wahanol fformatau y gallwch ei gael i mewn. 264 00:14:41,020 --> 00:14:44,050 Ac mae gwahanol gryfderau a gwendidau ar gyfer pob un ohonynt. 265 00:14:44,050 --> 00:14:49,000 Felly, mae hyn yn un, gallwch weld yma, y ​​ffurflen hon yn gyfoethog iawn. 266 00:14:49,000 --> 00:14:51,946 Ac mae'n safoni. 267 00:14:51,946 --> 00:14:55,040 >> Felly mae 'na deitl penodol maes, cae isdeitlo. 268 00:14:55,040 --> 00:14:58,950 Mae 'na bob yn ail teitl, An Passion Americanaidd. 269 00:14:58,950 --> 00:15:01,650 Ceir yr enw sy'n gysylltiedig ag ef. 270 00:15:01,650 --> 00:15:03,120 Math o adnodd yw testun. 271 00:15:03,120 --> 00:15:06,070 Mae llawer o wybodaeth yma yn y fformat hwn. 272 00:15:06,070 --> 00:15:09,480 >> Ond mae yna griw fformatau gwahanol. 273 00:15:09,480 --> 00:15:11,920 Felly yr hyn yr ydym yn unig edrych arno yw fformat 274 00:15:11,920 --> 00:15:17,700 Gelwir mods, sy'n sefyll am Metadata Gwasanaeth Gwrthrych Disgrifiad, 275 00:15:17,700 --> 00:15:18,250 o bosibl. 276 00:15:18,250 --> 00:15:23,030 Rwy'n mewn gwirionedd yn ddim yn hollol siŵr am y S. Ond mae'n fformat eithaf cymhleth. 277 00:15:23,030 --> 00:15:24,240 Mae'n y fformat diofyn. 278 00:15:24,240 --> 00:15:30,260 >> Ond mae'n yr un sy'n cadw cyfoeth holl ddata 279 00:15:30,260 --> 00:15:33,820 bod y llyfrgell oherwydd bod mae'n agos iawn at yr hyn y 280 00:15:33,820 --> 00:15:35,110 y llyfrgell yn defnyddio fewnol. 281 00:15:35,110 --> 00:15:39,030 Mae'n safon sy'n defnyddio ar draws y wlad, 282 00:15:39,030 --> 00:15:40,944 ar draws y byd mewn llyfrgelloedd academaidd. 283 00:15:40,944 --> 00:15:42,110 Ac mae'n rhyngweithredol iawn. 284 00:15:42,110 --> 00:15:44,852 Felly, os oes gennych dogfen hynny yw mewn fformat Mods, 285 00:15:44,852 --> 00:15:47,560 gallwch ei roi y i rywun arall systemau y mae eu deall mods, 286 00:15:47,560 --> 00:15:48,518 a gallant ei fewnforio. 287 00:15:48,518 --> 00:15:50,840 Felly mae'n safon. 288 00:15:50,840 --> 00:15:54,250 Mae wedi diffinio'n dda iawn, yn benodol iawn. 289 00:15:54,250 --> 00:15:58,980 A dyna beth sy'n ei wneud rhyngweithredol oherwydd os bydd rhywun yn dweud, 290 00:15:58,980 --> 00:16:04,930 dyma'r teitl yn ail o cofnodi, pawb yn gwybod beth y mae hynny'n ei olygu. 291 00:16:04,930 --> 00:16:07,740 Ar y llaw arall, mae'n gymhleth iawn. 292 00:16:07,740 --> 00:16:13,160 >> Felly, os ydych yn edrych yn yn y cofnod hwn yma, 293 00:16:13,160 --> 00:16:15,320 os Fi jyst am gael y teitl y ddogfen hon, 294 00:16:15,320 --> 00:16:21,150 y llyfr hwn, sydd yn ôl pob tebyg Donuts, Mae Passion Americanaidd, dosrannu 'ii maes 295 00:16:21,150 --> 00:16:22,940 yn ychydig yn cymryd rhan. 296 00:16:22,940 --> 00:16:27,380 Tra mae un arall fformat a elwir yn Dublin Core, 297 00:16:27,380 --> 00:16:29,730 sydd yn llawer fformat, llawer symlach. 298 00:16:29,730 --> 00:16:33,764 >> Ac er mwyn i chi weld yma, does dim teitl, is-deitl, teitl yn ail. 299 00:16:33,764 --> 00:16:35,930 Mae yna dim ond y teitl, Toesenni, Mae Passion Americanaidd, 300 00:16:35,930 --> 00:16:38,780 a theitl arall, Passion Americanaidd. 301 00:16:38,780 --> 00:16:42,907 Felly, pan fyddwch yn edrych ar ba ffurf ydych am gael y data allan o, 302 00:16:42,907 --> 00:16:44,740 mae llawer yn dibynnu ar ba mor rydych yn mynd i'w ddefnyddio. 303 00:16:44,740 --> 00:16:46,573 Ydych chi'n defnyddio ar gyfer gallu i ryngweithredu neu ydych chi'n 304 00:16:46,573 --> 00:16:49,970 eisiau rhywbeth syml sy'n allai fod yn haws i weithio gyda? 305 00:16:49,970 --> 00:16:56,002 >> Ar y llaw arall, mae llawer o'r manylion yn cael fath o squished i lawr. 306 00:16:56,002 --> 00:16:58,460 Efallai y byddwch yn colli y naws pa arbennig modd cae 307 00:16:58,460 --> 00:17:02,960 os ydych yn delio â Dublin Core, lle na fyddech yn ei gael gyda Mods. 308 00:17:02,960 --> 00:17:06,462 Felly, y rhai yn ddau o'r fformatau y gallwch ei gael allan o'r API. 309 00:17:06,462 --> 00:17:08,920 Ac yn y bôn, rydym yn cadw y tu ôl i'r llenni yn y Mods. 310 00:17:08,920 --> 00:17:14,179 Ond gallwn roi i chi mewn Mods a Dublin Core ac unrhyw beth arall yn ogystal. 311 00:17:14,179 --> 00:17:16,470 Yr ystyriaeth arall pan ydych yn chwilio yn y data 312 00:17:16,470 --> 00:17:21,210 yn gallwch ei gael fel naill ai JSON, a oedd yn yn sefyll am JavaScript Nodiant Gwrthrych, 313 00:17:21,210 --> 00:17:24,720 neu XML, sy'n sefyll am Iaith Markup estynadwy. 314 00:17:24,720 --> 00:17:30,080 Ac mae'r rhain cynrychioliadau data ddau yn union yr un data, yn union 315 00:17:30,080 --> 00:17:31,080 yr un gaeau. 316 00:17:31,080 --> 00:17:33,644 Ond maen nhw jyst syntactically wahanol. 317 00:17:33,644 --> 00:17:40,401 >> Felly mae hwn yn a-- 318 00:17:40,401 --> 00:17:41,400 Wel, gadewch i ni dim ond newid. 319 00:17:41,400 --> 00:17:47,490 Felly mae hyn yn ein ymholiad am toesenni mewn fformat XML. 320 00:17:47,490 --> 00:17:53,470 Os Fi jyst newid hyn i fod yn JSON, Gallaf weld ei fod yn edrych yn wahanol. 321 00:17:53,470 --> 00:17:58,580 Felly, yn awr mae hyn yn yr un cynnwys, ond strwythur gwahanol. 322 00:17:58,580 --> 00:18:00,080 Mae llai cromfachau ongl. 323 00:18:00,080 --> 00:18:02,530 Mae llai amleiriog. 324 00:18:02,530 --> 00:18:06,440 >> Ac mae hyn yn fformat, os ydych yn gweithio yn yr amgylchedd ar y we, 325 00:18:06,440 --> 00:18:09,680 ydych yn mynd yn fwyaf tebygol i am ddefnyddio oherwydd bod un 326 00:18:09,680 --> 00:18:12,630 o'r pethau neis am JSON yn mae'n gydnaws â JavaScript. 327 00:18:12,630 --> 00:18:17,680 Felly, os ydw i'n ysgrifennu ar y we app, gallaf dynnu yn JSON a dim ond yn gweithio'n uniongyrchol ag ef. 328 00:18:17,680 --> 00:18:20,187 Tra gyda XML, mae'n ychydig bach yn fwy cymhleth. 329 00:18:20,187 --> 00:18:21,520 Felly eto, mae'r rhain yn ddefnyddiol. 330 00:18:21,520 --> 00:18:26,387 Maent yn unig yn achosion defnyddio gwahanol lle gallai pobl yn dymuno eu defnyddio. 331 00:18:26,387 --> 00:18:26,886 OK. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 Felly, yn ôl i'r API. 334 00:18:31,680 --> 00:18:32,900 Felly, gallwn chwilio for-- 335 00:18:32,900 --> 00:18:36,220 >> Rhoddaf enghraifft o chwilio am toesenni. 336 00:18:36,220 --> 00:18:39,330 Gallwn hefyd chwilio yn unig mewn maes arbennig o fewn yma. 337 00:18:39,330 --> 00:18:41,310 Felly, yn lle chwilio y cofnod cyfan, 338 00:18:41,310 --> 00:18:43,870 Gall Fi jyst chwilio drwy'r cae teitl. 339 00:18:43,870 --> 00:18:48,810 Ac felly erbyn hyn mae 25 o bethau y cael toesenni yn y teitl, un ohonynt 340 00:18:48,810 --> 00:18:52,430 yn ymwneud adfer gwlyptiroedd mewn rheoli 341 00:18:52,430 --> 00:18:54,990 o'r twll yn y toesen rhaglen, sydd yn ôl pob tebyg 342 00:18:54,990 --> 00:18:58,970 nid o reidrwydd yr hyn yr ydym yn chwilio gyfer yr adeg pan rydym yn chwilio am toesenni. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> Gallwch hefyd, pan fyddwch yn ymdrin ag API-- 345 00:19:05,490 --> 00:19:08,827 >> Rhan o gael API yn rhoi pobl gael mynediad i setiau data mawr. 346 00:19:08,827 --> 00:19:11,410 Ac mae yna gwpl wahanol offer y gallwch eu defnyddio i wneud hynny. 347 00:19:11,410 --> 00:19:14,170 Mae un yn, yn syml iawn, i chi gall dudalen trwy'r data. 348 00:19:14,170 --> 00:19:17,340 Felly yn union fel os ydych yn gwneud ymholiad drwy ryngwyneb gwe, 349 00:19:17,340 --> 00:19:19,470 gallwch edrych ar dudalen un, tudalen dau, tri dudalen. 350 00:19:19,470 --> 00:19:22,040 Gallwch chi wneud yr un peth beth trwy'r API. 351 00:19:22,040 --> 00:19:24,150 'Ch jyst angen i chi fod yn eglur yn sut yr ydych yn ei wneud. 352 00:19:24,150 --> 00:19:29,511 >> Felly, er enghraifft, os wyf i'n edrych yn fy ymholiad cyntaf yma, 353 00:19:29,511 --> 00:19:32,510 lle rwy'n i'n gwneud chwiliad am bethau gyda toesenni yn y teitl, gallaf ddweud, 354 00:19:32,510 --> 00:19:35,415 a therfyn hafal 20, sy'n golygu rhoi'r 20 o gofnodion cyntaf i mi, nid 355 00:19:35,415 --> 00:19:38,540 y 10 cyntaf, sef 'r ball, oherwydd yr wyf am edrych yn 20 ar y tro. 356 00:19:38,540 --> 00:19:43,435 Neu gallaf ddweud, yn gosod y dechrau gyfartal i 20 a therfyn 357 00:19:43,435 --> 00:19:47,150 yn gyfartal 20, a fydd yn rhoi fi yn cofnodi 21 trwy 40. 358 00:19:47,150 --> 00:19:52,680 >> Felly, yr wyf yn dyfalu y peth i fynd i ffwrdd yma yw 359 00:19:52,680 --> 00:19:57,290 ein bod yn defnyddio'r llinynnau ymholiad i osod paramedrau ar yr ymholiad. 360 00:19:57,290 --> 00:20:02,760 Ac mae'n gadael i reolaeth i chi yr hyn yr ydych yn mynd yn ôl. 361 00:20:02,760 --> 00:20:05,980 >> Offeryn arall y gallwch ei ddefnyddio, - 362 00:20:05,980 --> 00:20:09,250 >> Ac mae hyn yn wir yn ddefnyddiol o ran ran archwilio'r data. 363 00:20:09,250 --> 00:20:10,840 >> --is rywbeth o'r enw faceting. 364 00:20:10,840 --> 00:20:15,530 Felly, mae'r term faceting yn Nid yw o reidrwydd yn gyffredin. 365 00:20:15,530 --> 00:20:16,880 Ond i chi i gyd wedi ei weld o'r blaen. 366 00:20:16,880 --> 00:20:18,630 Os byddwch yn edrych ar Amazon, er enghraifft, 367 00:20:18,630 --> 00:20:20,870 ac rydych yn gwneud chwiliad am toesenni yn y llyfrau, 368 00:20:20,870 --> 00:20:27,080 yma ganddyn nhw cyfres o lyfrau, ac maen nhw'n grwpio yn ôl categori, 369 00:20:27,080 --> 00:20:30,470 a byddwch yn cael y gwahanol gategorïau, a faint o lyfrau ym mhob categori 370 00:20:30,470 --> 00:20:31,330 arddangos i fyny. 371 00:20:31,330 --> 00:20:33,420 >> Felly, mae hyn yn y bôn yn agwedd. 372 00:20:33,420 --> 00:20:37,570 Byddwch yn cymryd eu holl lyfrau, mae'r 1,800 llyfrau sy'n cyfateb toesenni yn Amazon. 373 00:20:37,570 --> 00:20:39,820 12 ohonynt yn y Categori brecwast. 374 00:20:39,820 --> 00:20:43,100 21 mewn crwst a phobi, ac yn y blaen ac yn y blaen. 375 00:20:43,100 --> 00:20:47,670 >> Felly, mae hyn yn wir yn ddefnyddiol offeryn ar gyfer archwilio cynnwys 376 00:20:47,670 --> 00:20:53,260 o fewn y llyfrgell yn ogystal oherwydd pan edrychwch ar agwedd, 377 00:20:53,260 --> 00:20:56,520 mae'n rhoi syniad o pa bynciau yr ydych yn bodoli, fel pa fath o bynciau 378 00:20:56,520 --> 00:20:58,510 yn fwyaf poblogaidd yn eich set ymholiad. 379 00:20:58,510 --> 00:21:00,950 Ac mae'n helpu i chi yrru i ffwrdd ac archwilio. 380 00:21:00,950 --> 00:21:02,770 Felly, gallwn wneud yr un peth. 381 00:21:02,770 --> 00:21:05,940 >> Os ydym am ddefnyddio'r API ac edrych ar agweddau, 382 00:21:05,940 --> 00:21:08,950 rydym yn ychwanegu paramedr arall i mae ein cyfaill y llinyn ymholiad. 383 00:21:08,950 --> 00:21:12,540 Felly agweddau hafal coma gwahanu rhestr o'r hyn yr ydym am ei agwedd ar. 384 00:21:12,540 --> 00:21:14,790 Felly, efallai y bydd un o'r agweddau yn ddarostyngedig. 385 00:21:14,790 --> 00:21:16,565 Efallai arall fyddai iaith. 386 00:21:16,565 --> 00:21:19,665 Ac felly os ydym yn rhedeg y ymholiad, rydym yn get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 Mae'n edrych 'n bert lawer yr un peth yma. 389 00:21:24,830 --> 00:21:29,010 Ond rydym wedi ychwanegu at ddiwedd o'r rhestr set o agweddau. 390 00:21:29,010 --> 00:21:34,060 Felly, mae gennym agwedd o'r enw pwnc. 391 00:21:34,060 --> 00:21:40,250 Felly, mae hyn yn dweud wrthym fod os wyf yn edrych ar fy 80 o ganlyniadau o'r ymholiad toesen, 392 00:21:40,250 --> 00:21:42,100 13 ohonynt yn cael y pwnc Unol Daleithiau. 393 00:21:42,100 --> 00:21:43,684 Mae tri yn cael y toesenni pwnc. 394 00:21:43,684 --> 00:21:45,600 Mae tri yn cael y pwnc o adfer gwlyptiroedd, 395 00:21:45,600 --> 00:21:47,720 a all fod yn ein twll yn y toesen. 396 00:21:47,720 --> 00:21:51,780 Mae dau ohonynt, y Simpsons, ac yn y blaen ac yn y blaen. 397 00:21:51,780 --> 00:21:59,211 >> Felly, gall hyn fod yn ddefnyddiol os ydych yn awyddus i gyfyngu ar eich chwiliad. 398 00:21:59,211 --> 00:22:00,210 Gall eich helpu chi wneud hynny. 399 00:22:00,210 --> 00:22:03,580 Yn enwedig os oes gennych yn fwy na, dyweder, 80 o ganlyniadau. 400 00:22:03,580 --> 00:22:05,980 >> Yn yr un modd, gofynnwyd i ni hefyd am agweddau ar iaith. 401 00:22:05,980 --> 00:22:14,790 Felly, os edrychwn ar ein canlyniadau, rydym yn gweld 76 ohonynt yn Saesneg, pedwar yn Ffrangeg, 402 00:22:14,790 --> 00:22:19,620 dau yn Sbaeneg, dau, rwy'n credu bod hynny'n amhenodol neu anhysbys, Iseldireg a Lladin. 403 00:22:19,620 --> 00:22:22,830 Felly, yr wyf yn meddwl bod y Lladin canlyniad toesen, unwaith eto, 404 00:22:22,830 --> 00:22:24,922 wedi ddim i'w wneud â nwyddau pobi. 405 00:22:24,922 --> 00:22:25,630 Ond dyna ni. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> Felly, mae hyn yn fath o ddangos i chi sut y gallwch dynnu y cynnwys yn ôl 408 00:22:38,630 --> 00:22:41,270 oddi wrth y API yn unig drwy porwr gwe, sy'n wych. 409 00:22:41,270 --> 00:22:44,320 Ond nid yw'n wir yn yr hyn y byddech fel arfer yn defnyddio yn API ar ei gyfer. 410 00:22:44,320 --> 00:22:48,710 Felly, un enghraifft o sut yr ydych yn Gallai ei wneud mewn gwirionedd mae hyn yn fy mod i wedi 411 00:22:48,710 --> 00:22:54,720 ysgrifennu rhaglen super fach, sydd, unwaith eto, a yw fy chwilio toesen 412 00:22:54,720 --> 00:22:59,010 ac yn dewis meysydd cwpl ac yn eu harddangos mewn tabl. 413 00:22:59,010 --> 00:23:01,610 Felly mae hyn yn fawr iawn y un cynnwys yr ydym newydd 414 00:23:01,610 --> 00:23:04,830 gwelodd gydag ychydig o gaeau tynnu allan. 415 00:23:04,830 --> 00:23:12,090 Felly rhestr o deitlau, mae'r Lleoliad o'r hyn y mae'r llyfr 416 00:23:12,090 --> 00:23:15,120 yn ymwneud, yr iaith, ac yn y blaen ac yn y blaen. 417 00:23:15,120 --> 00:23:20,480 >> Felly, sut mae hyn yn digwydd mewn gwirionedd, gan fod Amcana rhaid i ni edrych ar rai cod, 418 00:23:20,480 --> 00:23:22,420 yw-- 419 00:23:22,420 --> 00:23:28,060 >> Yr hyn sydd gennym yma yw HTML syml tudalen, sy'n dangos y testun, 420 00:23:28,060 --> 00:23:32,900 croeso i gwmwl llyfrgell a Yna yn dangos tabl o ganlyniadau. 421 00:23:32,900 --> 00:23:37,790 Ac mae yn amlwg dim canlyniadau mewn y tabl pan gyhoeddir dudalen yn cael ei lwytho. 422 00:23:37,790 --> 00:23:41,380 Ond yr hyn rydym yn ei wneud yw, yn gyntaf oll, rydym yn 423 00:23:41,380 --> 00:23:46,290 yn llwytho llyfrgell o'r enw jQuery, sydd yn y bôn 424 00:23:46,290 --> 00:23:52,030 llyfrgell JavaScript, sy'n ei gwneud yn hawdd iawn i'w drin JavaScript 425 00:23:52,030 --> 00:23:58,780 frodorol, HTML, a chreu tudalennau gwe, rhesymeg ar ochr cleientiaid a thudalennau gwe. 426 00:23:58,780 --> 00:24:01,595 >> Felly beth sydd gennym yma yw jQuery Mae dull o'r enw Get, 427 00:24:01,595 --> 00:24:05,270 sydd yn eu hanfod yn mynd i URL, sydd, yn yr achos hwn, 428 00:24:05,270 --> 00:24:09,070 mae hyn yn URL cyfarwydd yn edrych. 429 00:24:09,070 --> 00:24:14,440 Ac yna bydd yn cael y cynnwys gan hynny URL ac yna yn rhedeg swyddogaeth arno. 430 00:24:14,440 --> 00:24:19,240 Felly dywedasom ewch i api.lib.harvard / edu. 431 00:24:19,240 --> 00:24:20,060 Chwilio am toesenni. 432 00:24:20,060 --> 00:24:21,300 Rhowch 20 o gofnodion ni. 433 00:24:21,300 --> 00:24:28,590 Ac yna rhedeg y swyddogaeth hon, a oedd yn Rwyf wedi dewis, gan fynd heibio iddo y data. 434 00:24:28,590 --> 00:24:34,430 Ac y data yn y JSON y got ddychwelyd o'r API. 435 00:24:34,430 --> 00:24:40,120 >> Ac yna rydym yn dweud, o fewn hynny data mae cae o'r enw eitem. 436 00:24:40,120 --> 00:24:48,117 Ac os af yn edrych yn ôl ar un o'r canlyniadau hyn sy'n fan hyn, 437 00:24:48,117 --> 00:24:49,200 mae rhywbeth called-- 438 00:24:49,200 --> 00:24:50,220 >> Wel, fe'i gelwir eitem. 439 00:24:50,220 --> 00:24:53,520 Felly all fod yn hynny. 440 00:24:53,520 --> 00:25:01,840 A beth mae'n ei wneud yw ei yn mynd drwy bob eitem 441 00:25:01,840 --> 00:25:05,300 ac yna yn galw un arall swyddogaeth ar bob eitem. 442 00:25:05,300 --> 00:25:08,440 A bod y swyddogaeth yn y bôn yn cymryd y gwerth 443 00:25:08,440 --> 00:25:12,010 yr eitem, sef yn y bôn y cofnod unigol 444 00:25:12,010 --> 00:25:18,220 ac yn ein galluogi i dynnu allan y teitl, y sylw a'r iaith. 445 00:25:18,220 --> 00:25:21,640 >> Felly, rydym yn galw swyddogaeth ar bob eitem yr ydym yn mynd yn ôl oddi wrth y API. 446 00:25:21,640 --> 00:25:25,397 Ac os ydych yn unig yn edrych yn yn y darn hwn yn iawn yma, 447 00:25:25,397 --> 00:25:27,230 yr hyn yr ydym yn ei wneud yw rydym yn creu llinyn, 448 00:25:27,230 --> 00:25:31,810 sydd yn ei hanfod rhywfaint o markup HTML o amgylch bwrdd, gyda value.title, 449 00:25:31,810 --> 00:25:35,790 sef teitl y gwrthrych, value.coverage, 450 00:25:35,790 --> 00:25:36,790 sef y sylw, - 451 00:25:36,790 --> 00:25:38,225 >> Ac rydym yn gwneud gwiriad yma i weld pwy sy'n undefined 452 00:25:38,225 --> 00:25:40,570 ac yn cuddio ei os yw'n dweud undefined, am nad ydym yn wir ddiddordeb 453 00:25:40,570 --> 00:25:41,600 yn hynny. 454 00:25:41,600 --> 00:25:42,939 >> --and yna yr iaith. 455 00:25:42,939 --> 00:25:44,730 Ac yna beth rydym yn yn ei wneud yn atodi bod 456 00:25:44,730 --> 00:25:48,510 at y tabl sydd yn a nodwyd gan llinyn hwn yma. 457 00:25:48,510 --> 00:25:50,790 A sut jQuery yn gweithio yw beth mae hyn yn ei ddweud 458 00:25:50,790 --> 00:25:56,420 yn edrych am y bwrdd gyda syniad canlyniadau ac ychwanegu testun hwn ato. 459 00:25:56,420 --> 00:25:59,380 Ac mae hyn yn y tabl gyda chanlyniadau syniad. 460 00:25:59,380 --> 00:26:04,998 Felly, yr hyn yr ydych yn y pen draw gyda'r yw'r dudalen hon fan hyn. 461 00:26:04,998 --> 00:26:06,206 Ac er mwyn gweld source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 Wel, nid yw'r ffynhonnell mewn gwirionedd diweddaru pan ddigwyddodd. 464 00:26:13,810 --> 00:26:18,740 Felly, gallwch weld y gwir canlyniadau'r tabl yma er. 465 00:26:18,740 --> 00:26:24,770 >> Felly dyna dim ond yn enghraifft syml o gwneud ymholiad sylfaenol iawn yn erbyn y API 466 00:26:24,770 --> 00:26:29,020 ac arddangos gwybodaeth mewn rhyw arall ffurfio, ac nid gwneud unrhyw beth yn rhy ffansi. 467 00:26:29,020 --> 00:26:36,370 Yn awr, enghraifft arall yn debyg i cais ysgrifenedig gan David Weinberger 468 00:26:36,370 --> 00:26:39,120 fel demo o hyn, a oedd yn yn ei hanfod yn dangos i chi 469 00:26:39,120 --> 00:26:44,620 sut y gallwch stwnsio i fyny canlyniadau rydych yn gael gan y API cwmwl llyfrgell 470 00:26:44,620 --> 00:26:46,250 gyda, dyweder, Google Books. 471 00:26:46,250 --> 00:26:52,225 >> Ac mae'r meddwl yma yw bod gallaf rhedeg ymholiad yn erbyn Google Books, 472 00:26:52,225 --> 00:26:56,060 cael chwiliad testun llawn, yn cael rhai canlyniadau yn ôl, cael gwybod pa un o'r eitemau hynny 473 00:26:56,060 --> 00:27:01,180 bodoli mewn gwirionedd yn Hollis, y system llyfrgell, 474 00:27:01,180 --> 00:27:03,200 ac yna rhoi cysylltiadau i mi yn ôl at yr eitemau hynny. 475 00:27:03,200 --> 00:27:12,730 Felly, os wyf yn chwilio am, roedd yn noson dywyll a stormus, yr wyf yn 476 00:27:12,730 --> 00:27:16,210 fynd yn ôl criw o ganlyniadau o Google, ac yna un canlyniad 477 00:27:16,210 --> 00:27:19,460 sef A wrinkle mewn Amser. 478 00:27:19,460 --> 00:27:29,330 Ac mae'r rhain yn gysylltiadau i lyfrau sy'n bodoli o fewn y system Harvard Llyfrgell. 479 00:27:29,330 --> 00:27:32,160 >> Felly, yr wyf yn dyfalu na fydd y pwynt yma yw cymaint y gall hyn neu beidio 480 00:27:32,160 --> 00:27:34,118 fod y ffordd yr ydych ei eisiau i chwilio'r llyfrgell, 481 00:27:34,118 --> 00:27:38,310 ond mae'n hollol wahanol ffordd na oedd ar gael i chi 482 00:27:38,310 --> 00:27:42,884 o'r blaen, fel chi ganddo unrhyw ffordd o wneud chwilio testun llawn ar lyfrau, hyd yn oed 483 00:27:42,884 --> 00:27:44,550 Roedd rhan o'r system Harvard Llyfrgell. 484 00:27:44,550 --> 00:27:46,870 Felly nawr mae hyn yn ffordd y gallwch wneud hynny. 485 00:27:46,870 --> 00:27:51,930 A gallwch eu harddangos mewn beth bynnag fformat yr ydych am. 486 00:27:51,930 --> 00:27:55,990 Felly, y pwynt yma yw, yn y bôn, rydym yn agor ffyrdd newydd i bobl 487 00:27:55,990 --> 00:27:59,080 i weithio gyda'r data. 488 00:27:59,080 --> 00:28:07,925 >> Darn arall o gwmwl llyfrgell yw bod mae'n helpu amlygu rhywfaint o'r data defnydd 489 00:28:07,925 --> 00:28:08,800 bod y llyfrgell. 490 00:28:08,800 --> 00:28:12,630 Felly, os ydych yn mynd i'r llyfrgell, ac ydych yn chwilio am lyfrau, 491 00:28:12,630 --> 00:28:15,770 Nid ydych yn ei wneud o reidrwydd mewn gwirionedd yn cael syniad o'r, 492 00:28:15,770 --> 00:28:19,080 ar gyfer yr holl eitemau mewn pwnc penodol, yr hyn y 493 00:28:19,080 --> 00:28:21,200 yn bobl yn y cymuned, boed yn 494 00:28:21,200 --> 00:28:24,890 a ddiffinnir fel Harvard neu'r wlad neu eich dosbarth, 495 00:28:24,890 --> 00:28:26,421 yr hyn sydd daethant o hyd fwyaf defnyddiol? 496 00:28:26,421 --> 00:28:28,920 A'r llyfrgell mewn gwirionedd mae gan tunnell o wybodaeth am yr hyn 497 00:28:28,920 --> 00:28:32,999 yn fwyaf defnyddiol oherwydd os llawer o bobl yn edrych ar lyfr, 498 00:28:32,999 --> 00:28:34,040 sy'n dweud rhywbeth i chi. 499 00:28:34,040 --> 00:28:36,498 Rhaid bod wedi ryw reswm maent am ei edrych arni. 500 00:28:36,498 --> 00:28:38,270 Mae llawer o bobl yn ei roi ar gefn. 501 00:28:38,270 --> 00:28:42,520 >> Os yw'n ar y rhestr wrth gefn am lawer o ddosbarthiadau, mae hynny'n dweud rhywbeth i chi. 502 00:28:42,520 --> 00:28:45,960 Os yw aelodau gyfadran yn gwirio ei allan nad yw llawer ac israddedigion yn, 503 00:28:45,960 --> 00:28:47,200 sy'n dweud wrth rhywbeth wrthyf. 504 00:28:47,200 --> 00:28:49,280 I'r gwrthwyneb, sydd hefyd yn yn dweud rhywbeth i chi. 505 00:28:49,280 --> 00:28:54,680 Felly byddai'n wirioneddol ddiddorol rhoi'r wybodaeth honno ar gael a gadael 506 00:28:54,680 --> 00:28:59,969 pobl yn ei ddefnyddio i'w helpu i ddod o hyd i yn gweithio o fewn y system llyfrgell. 507 00:28:59,969 --> 00:29:02,260 Ochr arall y geiniog o hyn yw mae rhai o breifatrwydd difrifol 508 00:29:02,260 --> 00:29:07,854 pryderon oherwydd bod un o'r daliadau craidd y llyfrgell 509 00:29:07,854 --> 00:29:10,770 nid ydym yn mynd i fod yn dweud pobl yr hyn y mae pobl eraill yn ei ddarllen. 510 00:29:10,770 --> 00:29:17,360 A hyd yn oed os ydych yn dweud hyn llyfr gwirio allan bedair gwaith 511 00:29:17,360 --> 00:29:20,070 mewn mis arbennig, Gellid eu defnyddio 512 00:29:20,070 --> 00:29:25,252 i gysylltu yn ôl i manylyn person gan ddata dad-anonymizing 513 00:29:25,252 --> 00:29:26,710 a darganfod pwy gwirio allan. 514 00:29:26,710 --> 00:29:30,792 Felly, y ffordd y gallwn avoid-- 515 00:29:30,792 --> 00:29:33,750 Mae'r ffordd y gallwn geisio dynnu rhywfaint signal o holl wybodaeth 516 00:29:33,750 --> 00:29:36,740 heb dorri pryderon preifatrwydd unrhyw un yn 517 00:29:36,740 --> 00:29:42,150 yn ei hanfod rydym yn edrych ar 10 mlynedd o ddata defnydd, - 518 00:29:42,150 --> 00:29:43,930 >> Felly mae'n dros gyfnod hir o amser. 519 00:29:43,930 --> 00:29:50,639 >> --and dweud, OK, gadewch i ni weld sut sawl gwaith y gwaith hwn yn cael ei ddefnyddio, 520 00:29:50,639 --> 00:29:52,930 a chan pwy dros y cyfnod hwn o amser, ac yna yn y bôn 521 00:29:52,930 --> 00:29:56,300 rhoi rhif, yr ydym yn galw yn ôl sgôr stac, sydd yn y bôn 522 00:29:56,300 --> 00:29:59,910 yn cynrychioli faint y mae wedi bod yn ei ddefnyddio. 523 00:29:59,910 --> 00:30:01,084 A bod number-- 524 00:30:01,084 --> 00:30:03,250 Mae llawer o wahanol gyfrifiadau mynd i mewn y rhif hwnnw. 525 00:30:03,250 --> 00:30:05,150 --but mae'n arw iawn metrig sy'n rhoi i chi 526 00:30:05,150 --> 00:30:11,300 rhyw syniad o sut mae'r Efallai y gymuned yn gwerthfawrogi'r gwaith hwnnw. 527 00:30:11,300 --> 00:30:16,772 >> Ac felly fath arall o hyd yn oed mwy cnawd allan cais 528 00:30:16,772 --> 00:30:18,480 sy'n cymryd mantais o hyn yn rhywbeth 529 00:30:18,480 --> 00:30:24,000 Gelwir Stacklife, sydd mewn gwirionedd ar gael drwy'r prif Harvard 530 00:30:24,000 --> 00:30:24,880 Porth llyfrgell. 531 00:30:24,880 --> 00:30:26,700 Felly, byddwch yn mynd i library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 Byddwch yn gweld nifer o wahanol ffyrdd o chwilio y llyfrgell. 533 00:30:29,360 --> 00:30:32,300 Ac a alwodd un ohonynt yn Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> Ac mae hyn yn gais sy'n bori cynnwys y llyfrgell, 535 00:30:38,980 --> 00:30:43,490 ond wedi ei adeiladu yn gyfan gwbl ar ben y APIs hyn. 536 00:30:43,490 --> 00:30:46,910 Felly does dim stwff arbennig mynd ymlaen tu ôl i'r llenni. 537 00:30:46,910 --> 00:30:49,570 Does dim mynediad i data nad oes rhaid i chi. 538 00:30:49,570 --> 00:30:54,090 Mae wedi defnyddio'r APIs i roi i chi gyda pori hollol wahanol 539 00:30:54,090 --> 00:30:55,480 profiad. 540 00:30:55,480 --> 00:30:58,570 >> Felly, os wyf yn chwilio am Alice in Wonderland yn yr achos hwn, 541 00:30:58,570 --> 00:31:02,600 Rwy'n cael canlyniad sy'n edrych fel hyn, sydd yn eithaf much-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> Mae'n debyg iawn i unrhyw chwilio eraill efallai y byddwch yn ei wneud, ac eithrio yn yr achos hwn 544 00:31:10,870 --> 00:31:15,730 rydym yn trefnu'r eitemau gan stackscore, sy'n rhoi i chi 545 00:31:15,730 --> 00:31:19,850 rhyw syniad o ba mor boblogaidd yma eitemau o fewn y gymuned. 546 00:31:19,850 --> 00:31:25,610 Ac felly yn amlwg, Alice in Wonderland gan Walt Disney yn hynod boblogaidd. 547 00:31:25,610 --> 00:31:36,570 Ond gallwch hefyd weld y pedwar uchaf dyma rai efallai na fyddwch actually-- 548 00:31:36,570 --> 00:31:39,220 >> Pethau sy'n cael eu defnyddio'n iawn, ond efallai y byddwch chi nid ar unwaith 549 00:31:39,220 --> 00:31:41,240 cysylltu â Alice in Wonderland. 550 00:31:41,240 --> 00:31:44,650 Felly mae ein hen gyfaill Y Annotated Alice yma. 551 00:31:44,650 --> 00:31:46,350 Felly gallaf fwrw golwg arno. 552 00:31:46,350 --> 00:31:52,010 Ac yn awr yr hyn yr wyf i'n edrych yn cael ei bôn yn gosod o- 553 00:31:52,010 --> 00:31:53,760 Gallaf rhaid i'r Annotated Alice dde yma. 554 00:31:53,760 --> 00:31:56,700 Mae gen i wybodaeth am y peth. 555 00:31:56,700 --> 00:32:00,230 Ac yr wyf hefyd yn cael stackscore y, yn yr achos hwn, 26. 556 00:32:00,230 --> 00:32:03,169 Ac mae hyn yn dweud wrthyf fath o fras sut yr ydym yn mynd i stackscore hwn, 557 00:32:03,169 --> 00:32:05,835 fel oedd yn gwirio allan, fel sut sawl gwaith y cafodd ei gwirio allan, 558 00:32:05,835 --> 00:32:08,440 fel cyfadran neu israddedigion, sut mae llawer o gopïau gan y llyfrgell, 559 00:32:08,440 --> 00:32:11,300 ac yn y blaen ac yn y blaen. 560 00:32:11,300 --> 00:32:16,460 >> A gallwch hefyd, yn ddigon diddorol yma, bori y staciau bron. 561 00:32:16,460 --> 00:32:19,550 Felly mae'r data yma, mae hyn yn yn dangos i chi didoli 562 00:32:19,550 --> 00:32:23,547 o gynrychiolaeth rhithwir o'r hyn y mae'r grym silff 563 00:32:23,547 --> 00:32:25,880 edrych fel pe baech yn cymryd holl ddaliadau y llyfrgell 564 00:32:25,880 --> 00:32:28,940 ac yn rhoi at ei gilydd ar un silff anfeidrol. 565 00:32:28,940 --> 00:32:30,990 A'r peth braf yw ein bod yn can-- 566 00:32:30,990 --> 00:32:33,380 >> Yn gyntaf oll, mae'r metadata am y llyfrau hyn 567 00:32:33,380 --> 00:32:35,627 yn aml yn dweud wrthych pan gafodd ei gyhoeddi. 568 00:32:35,627 --> 00:32:37,085 Mae'n dweud wrthych faint o dudalennau sydd ganddo. 569 00:32:37,085 --> 00:32:38,459 Gallai fod yn dweud wrthych y dimensiynau. 570 00:32:38,459 --> 00:32:42,930 Felly gallwch weld bod wedi ei adlewyrchu yma o ran maint y llyfrau. 571 00:32:42,930 --> 00:32:46,740 >> Ac yna gallwn ddefnyddio'r stacio sgôr i dynnu sylw at 572 00:32:46,740 --> 00:32:49,170 y llyfrau sydd â sgoriau simnai uwch. 573 00:32:49,170 --> 00:32:54,930 Felly, os yw'n dywyllach, mae'n golygu bod, yn ôl pob tebyg, mae'n cael ei ddefnyddio yn fwy aml. 574 00:32:54,930 --> 00:32:57,040 Felly, yn yr achos hwn, rwy'n mynd i ddyfalu bod hyn 575 00:32:57,040 --> 00:33:03,226 yw'r fersiwn o Alice in Wonderland sy'n cael ei ddefnyddio yn gyffredin iawn ac mae'r rhan fwyaf 576 00:33:03,226 --> 00:33:05,100 mynediad, y llyfrgell Mae gan y rhan fwyaf o gopïau o. 577 00:33:05,100 --> 00:33:06,975 Felly os ydych chi'n chwilio ar gyfer Alice in Wonderland, 578 00:33:06,975 --> 00:33:10,220 gallai hyn fod yn lle da i ddechrau. 579 00:33:10,220 --> 00:33:13,500 >> Ac yna yma gallwch hefyd gysylltu allan i, dyweder, Amazon i brynu'r llyfr, 580 00:33:13,500 --> 00:33:15,182 ac yn y blaen ac yn y blaen. 581 00:33:15,182 --> 00:33:17,140 Y pwynt yma, unwaith eto, Nid yn gymaint bod hyn 582 00:33:17,140 --> 00:33:25,030 yw'r ffordd orau i bori llyfrgell neu yr offeryn cywir ar gyfer pob achlysur. 583 00:33:25,030 --> 00:33:28,400 Ond mae'n ffordd arall o wneud hynny. 584 00:33:28,400 --> 00:33:31,359 A thrwy wneud y data ar gael drwy API, a oedd yn 585 00:33:31,359 --> 00:33:34,650 cael ei wneud o flociau adeiladu syml iawn, sy'n caniatáu i chi chwilio y cynnwys, 586 00:33:34,650 --> 00:33:39,420 gallwch adeiladu rhywbeth fel hyn y gall 587 00:33:39,420 --> 00:33:41,520 fod yn hynod o werthfawr i rai pobl. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> Felly dyna fath o, gymaint ag y dymunaf i ddweud 'n sylweddol am yr hyn mae'r API yn 590 00:33:51,860 --> 00:33:56,070 a'r hyn y mae'n datgelu, mae ei gyfanrwydd criw o bethau y tu ôl i'r llenni, a oedd yn 591 00:33:56,070 --> 00:33:59,480 Im 'jyst yn mynd i gyffwrdd ar fyr dim ond oherwydd ei fod yn fath o yn dod ar hyn 592 00:33:59,480 --> 00:34:03,720 o ongl hollol wahanol mewn ran sut mae rhywbeth fel hyn 593 00:34:03,720 --> 00:34:04,580 cael eu rhoi ar waith? 594 00:34:04,580 --> 00:34:10,820 >> Felly API yn safon rhyngwynebu i bob un o'r cynnwys hwn. 595 00:34:10,820 --> 00:34:13,820 Ond i'w gael yno, mae'r peth cyntaf roedd rhaid i ni wneud 596 00:34:13,820 --> 00:34:17,260 Roedd tynnu ynghyd gwybodaeth o lyfrau a delweddau 597 00:34:17,260 --> 00:34:21,580 ac mae'r cymhorthion darganfod, mae'r casgliad dogfen o wahanol systemau Harvard. 598 00:34:21,580 --> 00:34:23,929 Aleph, VIA, ac OASIS yw enwau'r systemau. 599 00:34:23,929 --> 00:34:28,820 Ac maent yn ei hanfod yn mynd i mewn i biblinell, pibell prosesu. 600 00:34:28,820 --> 00:34:33,230 >> Felly, yn gyntaf oll, rydym yn cael allforio ffeiliau o bob un o'r systemau hyn. 601 00:34:33,230 --> 00:34:35,130 Rydym yn rhannu nhw i fyny i mewn eitemau unigol. 602 00:34:35,130 --> 00:34:39,360 Felly mae gennym ffeil, sydd yn gigabeit, sydd â miliwn o gofnodion ynddo. 603 00:34:39,360 --> 00:34:42,290 Felly, rydym yn rhannu i fyny i mewn eitemau unigol. 604 00:34:42,290 --> 00:34:45,374 Yna, ar gyfer pob eitem, rydym yn troi ei i mewn i Mods, gan fod rhai o'r rhain 605 00:34:45,374 --> 00:34:47,040 yn mods yn frodorol, nid yw rhai ohonynt yn cael eu. 606 00:34:47,040 --> 00:34:49,204 Felly rydym nhw i gyd gyrraedd fod yn yr un fformat. 607 00:34:49,204 --> 00:34:51,120 Yna mae amryw o camau cyfoethogi, lle 608 00:34:51,120 --> 00:34:55,969 rydym yn ychwanegu mwy o wybodaeth at y data nag oedd ar gael yn y llyfrgell. 609 00:34:55,969 --> 00:34:59,750 Felly mae angen i ychwanegu, yn gyntaf oll gennym yr hyn llyfrgelloedd ddal. 610 00:34:59,750 --> 00:35:02,250 Rydym yn mynd trwy cam o cyfrifo'r stackscore. 611 00:35:02,250 --> 00:35:07,112 Rydym yn mynd drwy gam arall o ychwanegu mwy metadata yn nhermau 612 00:35:07,112 --> 00:35:10,730 o'r hyn y mae pobl casgliadau Efallai wedi ychwanegu this-- 613 00:35:10,730 --> 00:35:12,532 >> Mae pobl yn creu casgliadau o eitemau. 614 00:35:12,532 --> 00:35:13,990 Pa gasgliadau y mae'n perthyn? 615 00:35:13,990 --> 00:35:17,220 Sut mae pobl yn tagio cynnwys hwn yn y gorffennol? 616 00:35:17,220 --> 00:35:20,750 Yna byddwch yn hidlo allan, ac yn eich cyfyngu cofnodion oherwydd, fel y soniais, 617 00:35:20,750 --> 00:35:24,120 mae rhai cofnodion, oherwydd rhesymau hawlfraint, ni allwn arddangos. 618 00:35:24,120 --> 00:35:26,700 Ac yna rydym yn eu llwytho i mewn i rywbeth o'r enw 619 00:35:26,700 --> 00:35:31,680 Solr, nad yw'n camsillafu, ond yw enw'r darn o feddalwedd 620 00:35:31,680 --> 00:35:35,710 sy'n gwneud mynegeio chwilio, a oedd yn gyrru yr holl chwiliad tu ôl i'r API. 621 00:35:35,710 --> 00:35:40,110 Ac yna bydd ar gael i Gall y API, a'r bobl yn ei ddefnyddio. 622 00:35:40,110 --> 00:35:44,640 >> Felly mae hyn yn debyg i eithaf broses syml. 623 00:35:44,640 --> 00:35:47,230 Un o'r ddiddorol pethau am ei fod yn 624 00:35:47,230 --> 00:35:50,990 ein bod yn delio gyda 13 miliwn o gofnodion 625 00:35:50,990 --> 00:35:53,820 ac rydym yn mynd i fod yn delio neu fwy. 626 00:35:53,820 --> 00:36:01,260 Ac rydym am fod yn gallu trin y rhain mewn modd cymharol gyflym. 627 00:36:01,260 --> 00:36:03,630 Mae'n cymryd amser hir i prosesu 13 miliwn o gofnodion. 628 00:36:03,630 --> 00:36:09,529 >> Felly, sut bibell hwn yw sefydlu yw eich bod yn can-- 629 00:36:09,529 --> 00:36:12,070 Amcana y manteisio ar y biblinell, mae'r broblem yr ydym ni'n 630 00:36:12,070 --> 00:36:15,580 ceisio datrys yma, yw bod yr holl trawsnewidiadau, pob 631 00:36:15,580 --> 00:36:18,729 camau hyn yn hyn biblinell yn gwahanadwy. 632 00:36:18,729 --> 00:36:19,645 Does dim dibyniaeth. 633 00:36:19,645 --> 00:36:22,146 Os ydych yn prosesu cofnod o un llyfr, 634 00:36:22,146 --> 00:36:24,270 does dim dibyniaeth mewn bod rhwng llyfr arall. 635 00:36:24,270 --> 00:36:27,760 >> Felly beth y gallwn ei wneud yn y bôn, ar bob cam ar y gweill, 636 00:36:27,760 --> 00:36:30,470 rydym yn ei roi mewn ciw yn y cwmwl. 637 00:36:30,470 --> 00:36:32,250 Yr wyf yn digwydd bod ar Wasanaethau Gwe Amazon. 638 00:36:32,250 --> 00:36:35,140 Felly mae 'na restr o, yn dweud, 10,000 o eitemau y 639 00:36:35,140 --> 00:36:38,100 angen bod yn normaleiddio ac trosi i fformat Mods. 640 00:36:38,100 --> 00:36:41,620 Ac rydym yn troelli i fyny fel llawer o weinyddion gan ein bod eisiau, efallai 10 o weinyddion. 641 00:36:41,620 --> 00:36:44,860 Ac mae pob un o'r gweinyddion rhai yn unig yn eistedd yno, yn edrych yn y ciw, 642 00:36:44,860 --> 00:36:46,730 gweld fod yna un y mae angen ei brosesu, tynnu oddi ar y ciw, 643 00:36:46,730 --> 00:36:48,740 prosesau hynny, a ffyn ar y ciw nesaf. 644 00:36:48,740 --> 00:36:54,200 >> Ac felly yr hyn sy'n ein galluogi ei wneud yw gwneud cais, yn y bôn, 645 00:36:54,200 --> 00:36:58,110 cymaint o galedwedd gan ein bod yn awyddus i hyn problem am gyfnod byr iawn o amser 646 00:36:58,110 --> 00:37:02,970 i brosesu'r data mor gyflym ag bosibl, sy'n rhywbeth y yn unig, 647 00:37:02,970 --> 00:37:08,220 awr yn y byd o cyfrifiadura cwmwl gallwn ddarparu gweinyddion yn y bôn 648 00:37:08,220 --> 00:37:09,890 ar unwaith, yw bod yn ddefnyddiol. 649 00:37:09,890 --> 00:37:12,260 Felly, nid oes gennym i gael gweinydd enfawr yn eistedd o gwmpas 650 00:37:12,260 --> 00:37:16,700 drwy'r amser i wneud y prosesu Gallai hynny ddigwydd dim ond unwaith yr wythnos. 651 00:37:16,700 --> 00:37:21,440 >> Felly dyna yw hi yn bennaf. 652 00:37:21,440 --> 00:37:27,590 Mae dogfennaeth ar gael ar gyfer y Llyfrgell Cloud API Eitem 653 00:37:27,590 --> 00:37:31,960 yn y URL hwn, a fydd yn ar gael yn ddiweddarach. 654 00:37:31,960 --> 00:37:36,730 Ac ewch edrychwch ar i weld os oes unrhyw beth, 655 00:37:36,730 --> 00:37:37,579 oes gennych unrhyw syniadau. 656 00:37:37,579 --> 00:37:38,120 Chwarae gyda hi. 657 00:37:38,120 --> 00:37:38,830 Ffwl o gwmpas. 658 00:37:38,830 --> 00:37:42,800 A gobeithio y gallwch ddod o hyd i rywbeth mawr. 659 00:37:42,800 --> 00:37:44,740 Diolch yn fawr. 660 00:37:44,740 --> 00:37:45,899