1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 Джэфры LICHT: Прывітанне. 3 00:00:12,370 --> 00:00:13,550 Я Джэфры Licht. 4 00:00:13,550 --> 00:00:17,890 І я тут, каб пагаварыць з вамі пра Бібліятэка Гарвардскага універсітэта і будынак заўтра 5 00:00:17,890 --> 00:00:20,870 Бібліятэка сёння, я думаю. 6 00:00:20,870 --> 00:00:23,040 Так фон тут, крок да гэтай сесіі 7 00:00:23,040 --> 00:00:26,930 па сутнасці, што існуе шмат бібліяграфічных дадзеных 8 00:00:26,930 --> 00:00:28,400 даступныя ў бібліятэках Гарварда. 9 00:00:28,400 --> 00:00:33,434 І ёсць магчымасць, праз некаторыя з інструментаў, 10 00:00:33,434 --> 00:00:36,350 і праект, які распрацоўваецца, каб атрымаць доступ да інфармацыі, 11 00:00:36,350 --> 00:00:42,430 і прыняць яго на месцах, Бібліятэка Гарвардскага універсітэта не рабіць прама зараз, 12 00:00:42,430 --> 00:00:45,460 зрабіць новы матэрыял з ёй, эксперымент і пагуляць з ім. 13 00:00:45,460 --> 00:00:52,413 >> Такім чынам, кропка ўваходу ў гэта API называецца Бібліятэка Гарвардскага універсітэта воблака, якое 14 00:00:52,413 --> 00:00:57,650 з'яўляецца адкрытым сервер метададзеных, якія я буду казаць цяпер. 15 00:00:57,650 --> 00:01:02,595 Такім чынам, фон, які існуе Шмат матэрыялу ў бібліятэцы Гарвардскага універсітэта. 16 00:01:02,595 --> 00:01:07,150 У нас ёсць больш за 13 мільёнаў кнігазнаўчыя запісы, мільёны малюнкаў, 17 00:01:07,150 --> 00:01:11,090 і тысячы знаходжання сродкаў, якія па сутнасці, дакументы, якія апісваюць 18 00:01:11,090 --> 00:01:15,500 Калекцыі, кажучы, што у іх, скрыні папер 19 00:01:15,500 --> 00:01:21,080 і гэтак далей, якія складаюць больш мільён асобныя дакументы. 20 00:01:21,080 --> 00:01:24,290 І ёсць таксама шмат інфармацыя, бібліятэка мае 21 00:01:24,290 --> 00:01:28,180 аб тым, як змест, што выкарыстоўваецца можа прадстаўляць цікавасць для людзей, 22 00:01:28,180 --> 00:01:32,400 хто хацеў бы працаваць з ім. 23 00:01:32,400 --> 00:01:36,150 >> Так усю інфармацыю Бібліятэка мае метададзеныя. 24 00:01:36,150 --> 00:01:39,500 Так метададзеныя гэта дадзеныя аб дадзеных. 25 00:01:39,500 --> 00:01:42,070 Таму, калі мы гаворым пра інфармацыю, якая 26 00:01:42,070 --> 00:01:44,890 даступныя праз бібліятэку Воблака, якое даступна, 27 00:01:44,890 --> 00:01:47,760 гэта не абавязкова фактычныя дакументы 28 00:01:47,760 --> 00:01:53,060 Самі, не абавязкова поўная Тэкст кнігі ці поўных вобразаў, 29 00:01:53,060 --> 00:01:54,890 аднак, што на самой справе можа мець месца. 30 00:01:54,890 --> 00:01:57,550 Але гэта на самай справе Інфармацыя аб дадзеных. 31 00:01:57,550 --> 00:02:00,909 >> Такім чынам, вы можаце думаць аб каталагізацыі Інфармацыя, абаненцкія нумары, суб'екты, 32 00:02:00,909 --> 00:02:02,700 колькі копій Кніга ёсць, тое, што 33 00:02:02,700 --> 00:02:06,380 з'яўляюцца выданні, якія фарматы, аўтары, і гэтак далей. 34 00:02:06,380 --> 00:02:12,250 Так што шмат інфармацыі аб Інфармацыя, якая змяшчаецца ў зборы, што, 35 00:02:12,250 --> 00:02:14,400 само па сабе, гэта свайго роду першапачаткова карыснымі. 36 00:02:14,400 --> 00:02:19,230 І, хоць, калі вы рабіць глыбокія даследаванні, 37 00:02:19,230 --> 00:02:25,160 Вы, відавочна, хочуць, каб дабрацца да фактычнай здавольвацца і паглядзіце на дадзеныя, 38 00:02:25,160 --> 00:02:30,140 Метададзеныя карысна з пункту гледжання і аналіз корпус у цэлым, 39 00:02:30,140 --> 00:02:33,870 як тое, што рэчы знаходзяцца ў калекцыі. 40 00:02:33,870 --> 00:02:35,520 Як яны суадносяцца паміж сабой? 41 00:02:35,520 --> 00:02:39,482 Гэта дапаможа вам знайсці сапраўды іншыя рэчы, які з'яўляецца сапраўды галоўнай мэтай ёй. 42 00:02:39,482 --> 00:02:41,190 Кропка Каталог метададзеных і 43 00:02:41,190 --> 00:02:43,230 каб дапамагчы вам знайсці ўсе інфармацыю, якая 44 00:02:43,230 --> 00:02:46,590 даступныя ў калекцыях. 45 00:02:46,590 --> 00:02:53,690 >> Такім чынам, гэта з'яўляецца прыкладам метададзеных для кнігі ў Гарвардскім бібліятэкі. 46 00:02:53,690 --> 00:02:56,370 Так што гэта там. 47 00:02:56,370 --> 00:02:59,850 І вы можаце бачыць, што гэта на самай справе вельмі складаны. 48 00:02:59,850 --> 00:03:04,610 І частку кошту метададзеных у рамках сістэмы Бібліятэка Гарвардскага універсітэта 49 00:03:04,610 --> 00:03:09,320 з'яўляецца тое, што гэта было свайго роду з забудавана каталагізавальніка 50 00:03:09,320 --> 00:03:12,720 і сабраў людзей, якія прэтэндуюць шмат вопыту і майстэрства 51 00:03:12,720 --> 00:03:20,030 і думкі да яго на працягу доўгага часу, які мае вялікую каштоўнасць. 52 00:03:20,030 --> 00:03:25,450 >> Так што, калі вы паглядзіце на гэтым запісы для Анатаваны Аліса, вы можаце даведацца 53 00:03:25,450 --> 00:03:32,590 ў вас ёсць тытул, які напісаў яго, Аўтар, а ўсе розныя прадметы 54 00:03:32,590 --> 00:03:35,380 якія людзі каталог яго ў. 55 00:03:35,380 --> 00:03:40,110 І вы можаце бачыць, ёсць таксама ў дадатак да шмат добрай інфармацыі 56 00:03:40,110 --> 00:03:42,852 тут, ёсць некаторы дубляванне. 57 00:03:42,852 --> 00:03:45,560 Там гэта шмат складанасці гэта адлюстраванне ў метададзеных 58 00:03:45,560 --> 00:03:46,300 што ў вас ёсць. 59 00:03:46,300 --> 00:03:50,320 >> Так што назва гэтай кнігі Прыгоды Алісы ў краіне цудаў. 60 00:03:50,320 --> 00:03:53,880 Так што гэта анатаваных версія гэтай кнігі. 61 00:03:53,880 --> 00:03:56,380 Але гэта таксама называецца анатаваных Аліса, Аліса 62 00:03:56,380 --> 00:03:58,570 ў краіне цудаў, таму што гэта тое, што 63 00:03:58,570 --> 00:04:00,430 Марцін Гарднер напісаў і анатаваны кнігу. 64 00:04:00,430 --> 00:04:03,369 І ёсць шмат карыснай інфармацыі аб лагічных галаваломак і рэчаў 65 00:04:03,369 --> 00:04:05,410 у Эліс, што вы верагодна, не ведаюць. 66 00:04:05,410 --> 00:04:07,000 Такім чынам, вы павінны ісці чытаць гэта. 67 00:04:07,000 --> 00:04:11,940 >> Але вы можаце бачыць, што гэта Шмат тут падрабязна, 68 00:04:11,940 --> 00:04:15,340 у тым ліку ідэнтыфікатары, калі яго была створана, калі ён прыйшоў, 69 00:04:15,340 --> 00:04:17,420 з пункту гледжання Гарвардзе Сістэма і гэтак далей. 70 00:04:17,420 --> 00:04:20,350 Так што гэта ўзор тып метададзеных 71 00:04:20,350 --> 00:04:24,340 што для кнігі ў вы можаце ўбачыць Калекцыя Бібліятэка Гарвардскага універсітэта. 72 00:04:24,340 --> 00:04:26,680 >> Гэта нешта зусім іншае. 73 00:04:26,680 --> 00:04:32,610 Так што ёсць сістэма, званая VIA Гарвард, які ў асноўным 74 00:04:32,610 --> 00:04:39,990 з'яўляецца каталагізацыя малюнкаў і прадметаў мастацтва і візуальныя рэчы па ўсёй Гарвардзе, 75 00:04:39,990 --> 00:04:44,010 і даданне некаторых метададзеных да іх, іх класіфікацыі, 76 00:04:44,010 --> 00:04:49,200 і, у некаторых выпадках, забяспечваючы мініяцюр малюнкаў 77 00:04:49,200 --> 00:04:51,250 што вы можаце ўзяць паглядзець, калі вы так хочаце. 78 00:04:51,250 --> 00:04:54,240 >> Такім чынам, гэта з'яўляецца прыкладам метададзеныя, якія ў вас ёсць для пласціны 79 00:04:54,240 --> 00:04:57,840 ад, як мяркуецца, Аліса ў краіне цудаў. 80 00:04:57,840 --> 00:05:00,499 І вы можаце бачыць, што гэта менш метададзеныя тут. 81 00:05:00,499 --> 00:05:02,040 Гэта проста іншы выгляд аб'екта. 82 00:05:02,040 --> 00:05:03,425 І такім чынам, ёсць менш інфармацыі. 83 00:05:03,425 --> 00:05:07,790 >> У вас хутчэй за ўсё той факт, што выклік Колькасць, па сутнасці, хто яго стварыў, - 84 00:05:07,790 --> 00:05:10,410 >> Мы не ведаем, калі яна была створана. 85 00:05:10,410 --> 00:05:13,320 >> --і назву. 86 00:05:13,320 --> 00:05:14,300 >> Іншы прыклад. 87 00:05:14,300 --> 00:05:16,380 Гэта дапамога знаходкай. 88 00:05:16,380 --> 00:05:19,030 Так што калекцыя Люіс Газеты Кэрала ў Гарвардзе. 89 00:05:19,030 --> 00:05:23,601 Так гэта апісвае, што у гэтай калекцыі. 90 00:05:23,601 --> 00:05:26,100 Дык хто-то пайшоў да канца і прагледзеў усе палі 91 00:05:26,100 --> 00:05:32,220 і каталягізаваць яго, улічваючы некаторыя фон, напісаў агляд таго, што тут. 92 00:05:32,220 --> 00:05:35,290 І калі вы паглядзіце У далейшым, пры гэтым, гэта 93 00:05:35,290 --> 00:05:39,620 працягваецца на працягу старонкі і старонкі і старонкі, але скажу вам, 94 00:05:39,620 --> 00:05:41,860 якія літары і што даты ад таго, што скрынкі 95 00:05:41,860 --> 00:05:44,289 існавала на працягу ўсёй калекцыі. 96 00:05:44,289 --> 00:05:46,330 Але гэта нешта што, калі вы ў Гарвардзе, 97 00:05:46,330 --> 00:05:50,720 Вы можаце пайсці і на самай справе фізічна глядзець і, па-відаць, зірнуць на. 98 00:05:50,720 --> 00:05:53,440 >> Так што гэта ўсё выдатна. 99 00:05:53,440 --> 00:05:54,450 Гэтыя метададзеныя Карысныя. 100 00:05:54,450 --> 00:05:56,327 Гэта ў сістэме Бібліятэка Гарвардскага універсітэта. 101 00:05:56,327 --> 00:05:58,910 Ёсць інструменты онлайн, дзе вас можа пайсці і зірнуць на яго, 102 00:05:58,910 --> 00:05:59,993 і ўбачыць яго, і шукаць яго. 103 00:05:59,993 --> 00:06:02,810 І вы можаце нарэзаць яго і косткі гэта ў вялікай колькасці розных спосабаў. 104 00:06:02,810 --> 00:06:06,920 >> Але гэта сапраўды даступная, толькі калі Вы чалавек істота сядзіць ўніз 105 00:06:06,920 --> 00:06:12,600 ў вашым вэб-браўзэры або што- Ваш тэлефон і навігацыі па іх. 106 00:06:12,600 --> 00:06:16,730 Гэта на самай справе не даступны ў любы від карыснай моды 107 00:06:16,730 --> 00:06:19,520 для іншых сістэм або іншыя кампутары ў выкарыстанні, 108 00:06:19,520 --> 00:06:21,500 няма з сістэмамі ў рамках Бібліятэка Гарвардскага універсітэта, 109 00:06:21,500 --> 00:06:24,890 але сістэмы ў навакольным свеце, за ўсё іншыя людзі ў цэлым. 110 00:06:24,890 --> 00:06:30,210 Так пытанне ў тым, як мы можам зрабіць яго даступным для кампутараў 111 00:06:30,210 --> 00:06:33,560 так што мы можам зрабіць больш цікавым Матэрыял з ёй, чым проста 112 00:06:33,560 --> 00:06:36,550 прагляд гэта самі? 113 00:06:36,550 --> 00:06:39,766 >> Дык чаму ж вы хочаце гэта зрабіць? 114 00:06:39,766 --> 00:06:41,140 Ёсць шмат магчымасцяў. 115 00:06:41,140 --> 00:06:43,980 Адным з іх з'яўляецца, вы можаце пабудаваць цалкам іншы спосаб прагляду 116 00:06:43,980 --> 00:06:46,962 змест, якое даступна праз Гарварда бібліятэк. 117 00:06:46,962 --> 00:06:48,670 Я пакажу вам адзін пазней названы Stacklife, 118 00:06:48,670 --> 00:06:52,440 які мае зусім іншы ўзяць на доступ да змесціва. 119 00:06:52,440 --> 00:06:54,560 >> Вы маглі б пабудаваць рэкамендацыі рухавіка. 120 00:06:54,560 --> 00:06:57,955 Так Бібліятэка Гарвардскага універсітэта не знаходзіцца ў бізнес кажучы, вам падабаецца гэтая кніга. 121 00:06:57,955 --> 00:07:01,080 Затым перайдзіце зірнуць на іх яшчэ 17 кнігі, якія вы маглі б быць зацікаўлены ў 122 00:07:01,080 --> 00:07:03,200 або гэтыя 18 іншыя выявы. 123 00:07:03,200 --> 00:07:06,040 Але гэта, вядома, маглі быць каштоўным уласцівасцю. 124 00:07:06,040 --> 00:07:09,272 А калі ўлічыць, метададзеныя, ён можа можна пакласці, што разам. 125 00:07:09,272 --> 00:07:11,980 Вы можаце мець розныя патрэбы ў Умовы пошуку змест, 126 00:07:11,980 --> 00:07:16,200 як, можа быць, нягледзячы на ​​інструменты, якія даступныя, што бібліятэка робіць 127 00:07:16,200 --> 00:07:18,450 ў наяўнасці, вы можаце шукаць па-іншаму 128 00:07:18,450 --> 00:07:21,847 або аптымізаваць для канкрэтнага выкарыстання, якія, можа быць, гэта вельмі спэцыялізаваўся. 129 00:07:21,847 --> 00:07:23,930 Можа быць, ёсць толькі некалькі людзі ў свеце, якія 130 00:07:23,930 --> 00:07:25,846 хочаце шукаць ўтрыманне У гэтым выпадку, аднак 131 00:07:25,846 --> 00:07:28,985 было б выдатна, калі мы мог дазволіць ім зрабіць гэта. 132 00:07:28,985 --> 00:07:30,860 Там вельмі шмат аналітыкі за ўсё, як людзі 133 00:07:30,860 --> 00:07:33,860 выкарыстоўваем змесціва, якое будзе сапраўды Цікава ведаць пра, даведацца, 134 00:07:33,860 --> 00:07:37,280 якія кнігі выкарыстоўваюцца, што няма, і гэтак далей. 135 00:07:37,280 --> 00:07:41,670 А тут яшчэ шмат магчымасць інтэграцыі 136 00:07:41,670 --> 00:07:45,210 з іншай інфармацыяй што-то там у Інтэрнэце. 137 00:07:45,210 --> 00:07:46,880 Такім чынам, мы have-- 138 00:07:46,880 --> 00:07:50,260 >> Напрыклад, NPR мае сегмент Рэцэнзія на кнігу, 139 00:07:50,260 --> 00:07:53,090 дзе яны бяруць інтэрв'ю Аўтары пра кнігі. 140 00:07:53,090 --> 00:07:56,837 І таму было б выдатна, калі б вы былі гледзячы кнігу ў Гарвардзе 141 00:07:56,837 --> 00:07:59,670 Бібліятэка, а вы кажаце, добра, што ёсць быў Інтэрв'ю з аўтарам. 142 00:07:59,670 --> 00:08:00,878 Давайце зірнем на гэта. 143 00:08:00,878 --> 00:08:05,461 Ці ёсць старонка Вікіпедыі, а аўтарытэтны, навуковая даведка 144 00:08:05,461 --> 00:08:07,710 аб гэтай кнізе, што вы магчыма, захочаце зірнуць на. 145 00:08:07,710 --> 00:08:12,600 >> Ёсць гэтыя тыпы крыніц раскіданыя па ўсёй сеткі. 146 00:08:12,600 --> 00:08:16,555 І чаго іх разам можа быць вялікая выкарыстанне 147 00:08:16,555 --> 00:08:18,930 для каго-то, гледзячы на Змест, гледзячы на ​​нешта. 148 00:08:18,930 --> 00:08:20,180 Але гэта таксама ня выгляд, што вы б 149 00:08:20,180 --> 00:08:23,205 хачу бібліятэка несці адказнасць для пераходу ўніз і паляванне 150 00:08:23,205 --> 00:08:25,455 усе гэтыя розныя крыніцы і падключыць іх разам 151 00:08:25,455 --> 00:08:28,920 таму што яны ўвесь час мяняліся. 152 00:08:28,920 --> 00:08:33,570 І тое, што яны думаюць, што вельмі важна мая не можа быць тое, што вы лічыце важным. 153 00:08:33,570 --> 00:08:36,929 >> І ўжо тым больш, у асноўным там шмат рэчаў мы не думалі да гэтага часу. 154 00:08:36,929 --> 00:08:42,222 Так што, калі мы можам адкрыць гэта, больш людзі, акрамя паўтара дзесятка або каля таго, 155 00:08:42,222 --> 00:08:45,174 хто глядзіць на гэта на рэгулярнай аснове можа думаць ідэй 156 00:08:45,174 --> 00:08:47,340 і масаж дадзеныя, і рабіць тое, што яны хочуць з ім. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> Таму мы хочам, каб зрабіць гэта Дадзеныя з наяўных у свеце. 159 00:08:54,045 --> 00:08:55,670 Ну, ёсць пара ўскладненні. 160 00:08:55,670 --> 00:08:58,540 Па-першае, гэты метададзеных у розных сістэмах. 161 00:08:58,540 --> 00:09:01,110 Гэта ў розных фарматах. 162 00:09:01,110 --> 00:09:04,719 Так што некаторыя нармалізацыя які павінен адбыцца, 163 00:09:04,719 --> 00:09:08,010 якія нармалізацыі быць працэс даводзячы справу з розных фарматаў 164 00:09:08,010 --> 00:09:12,940 і адлюстраванне іх у адзіны фармат так, што поля будзе супадаць. 165 00:09:12,940 --> 00:09:15,160 >> Ёсць некаторыя абмежаванні аўтарскага права. 166 00:09:15,160 --> 00:09:21,010 Як ні дзіўна, размяшчэнне інфармацыі ў каталогу пра кнігу адказнасці за аўтарскія правы. 167 00:09:21,010 --> 00:09:24,060 Таму, нават калі гэта проста звесткі, атрыманыя з кнігі, 168 00:09:24,060 --> 00:09:25,330 гэта защищаема. 169 00:09:25,330 --> 00:09:28,400 І ў залежнасці ад таго, хто на самай справе створана гэтыя метададзеныя, 170 00:09:28,400 --> 00:09:32,175 могуць быць абмежаванні адносна таго, хто можа распаўсюджваць яго, падобна to-- 171 00:09:32,175 --> 00:09:33,402 >> Я не ведаю. 172 00:09:33,402 --> 00:09:36,110 Гэта можа ці не можа быць аналагічны Становішча тэксту песні, 173 00:09:36,110 --> 00:09:36,610 напрыклад. 174 00:09:36,610 --> 00:09:38,560 Так што мы ўсе ведаем, як гэта рондаля. 175 00:09:38,560 --> 00:09:40,450 Такім чынам, вы павінны абыйсці гэтую праблему. 176 00:09:40,450 --> 00:09:44,910 >> А потым яшчэ кавалак што ёсць шмат дадзеных. 177 00:09:44,910 --> 00:09:52,420 Так што, калі я каго-небудзь, хто хоча працаваць з дадзенымі або мае класная ідэя, 178 00:09:52,420 --> 00:09:55,350 справу з 14000000 запісы на маім ноўтбуку 179 00:09:55,350 --> 00:09:57,487 можа быць праблематычным і цяжка кіраваць. 180 00:09:57,487 --> 00:09:59,320 Таму мы хочам, каб паменшыць бар'еры для людзей 181 00:09:59,320 --> 00:10:02,130 каб мець магчымасць працаваць з дадзенымі. 182 00:10:02,130 --> 00:10:07,880 >> Так падыходу, які, мы спадзяемся, адрасу усе гэтыя праблемы з'яўляецца дзве часткі. 183 00:10:07,880 --> 00:10:11,770 Адзін будуе платформу, якая прымае Дадзеныя ад усіх гэтых разнастайных крыніц 184 00:10:11,770 --> 00:10:14,350 і пагаршае яе, нармалізуе, ўзбагачае яго, і робіць 185 00:10:14,350 --> 00:10:16,650 гэта даступна ў адным месцы. 186 00:10:16,650 --> 00:10:20,950 І гэта робіць яго даступным праз грамадскага API, што людзі могуць патэлефанаваць. 187 00:10:20,950 --> 00:10:24,430 >> Так API з'яўляецца прымяненне Інтэрфейс праграмавання. 188 00:10:24,430 --> 00:10:28,930 І гэта ў асноўным ставіцца да Канчатковая кропка, сістэма або тэхналогія 189 00:10:28,930 --> 00:10:31,720 можа патэлефанаваць і атрымаць дадзеныя назад у структураваны фармат такім чынам, 190 00:10:31,720 --> 00:10:32,900 што ён можа быць выкарыстаны. 191 00:10:32,900 --> 00:10:36,060 Так што гэта не залежыць пры пераходзе на сайт 192 00:10:36,060 --> 00:10:37,970 і выскрабанне дадзеныя з гэта, напрыклад. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> Так што гэта хатняя старонка Бібліятэка Cloud тавару API, 195 00:10:45,010 --> 00:10:47,220 які з'яўляецца па сутнасці яе варыянт два. 196 00:10:47,220 --> 00:10:50,130 Так што гэта другі ітэрацыі спрабуе зрабіць усё гэтыя дадзеныя 197 00:10:50,130 --> 00:10:53,280 распаўсюд па ўсім свеце. 198 00:10:53,280 --> 00:10:59,560 Так што гэта http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 І толькі разарваць гэты ўніз ледзь-ледзь, што гэта значыць 200 00:11:03,830 --> 00:11:06,115 тое, што гэта варыянт два з API. 201 00:11:06,115 --> 00:11:08,490 Там гэта версія аднаго, які Я не збіраюся казаць пра гэта. 202 00:11:08,490 --> 00:11:09,750 Але ёсць версія адна. 203 00:11:09,750 --> 00:11:14,740 >> І калі вы тэлефануеце ў гэтым API, вы атрымліваеце элементы. 204 00:11:14,740 --> 00:11:20,640 І частка ідэі API з'яўляецца API з'яўляецца кантракт. 205 00:11:20,640 --> 00:11:23,440 Гэта тое, што з'яўляецца не збіраецца мяняць. 206 00:11:23,440 --> 00:11:24,850 Так, напрыклад, - 207 00:11:24,850 --> 00:11:27,410 >> І прычына ў тым, што калі я пабудаваць нейкую сістэму, 208 00:11:27,410 --> 00:11:33,210 збіраецца выкарыстоўваць бібліятэку хмарных API для адлюстравання кнігі ці дапамагчы людзям знайсці 209 00:11:33,210 --> 00:11:36,190 Інфармацыя, якая змяшчаецца ў унікальных спосабаў, што мы не хочам каб гэта адбылося 210 00:11:36,190 --> 00:11:38,940 для нас, каб пайсці змяніць, як што API працуе, і раптам 211 00:11:38,940 --> 00:11:41,340 усе ламае на баку канчатковага карыстальніка. 212 00:11:41,340 --> 00:11:46,710 Так што частка, калі вы робіце API распаўсюд па ўсім свеце, гэта 213 00:11:46,710 --> 00:11:49,396 добрая практыка, каб пакласці нумар версіі ў ім, каб людзі 214 00:11:49,396 --> 00:11:51,020 даведацца, якая версія яны маюць справу з. 215 00:11:51,020 --> 00:11:54,300 >> Так што, калі мы вырашым, што знайсці лепшы спосаб зрабіць гэтую інфармацыю даступнай, 216 00:11:54,300 --> 00:11:57,295 мы маглі б змяніць, што назваць гэта трэцяй версіі. 217 00:11:57,295 --> 00:11:59,920 Таму кожны, хто па-ранейшаму выкарыстоўвае Версія другая, што яшчэ будзем працаваць. 218 00:11:59,920 --> 00:12:03,490 Але версія тры будзе ёсць ўвесь новы матэрыял. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> Такім чынам, гэта API, але гэта сапраўды падобна на URL. 221 00:12:09,210 --> 00:12:11,680 І так, што гэта Прыкладам з'яўляецца тое, што 222 00:12:11,680 --> 00:12:16,615 называецца API адпачынак, які даступны Толькі за звычайны вэб злучэння. 223 00:12:16,615 --> 00:12:19,680 І вы можаце на самой справе ісці да яе ў браўзэры. 224 00:12:19,680 --> 00:12:28,550 >> Дык вось, я проста адкрыў Firefox і адправіліся ў api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 І так, што я атрымліваю тут у асноўным першая старонка 226 00:12:31,560 --> 00:12:34,740 вынікаў ад усяго набор элементаў, якія мы атрымалі. 227 00:12:34,740 --> 00:12:37,460 І менавіта тут у фармаце XML. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 І гэта таксама prettified па Firefox. 230 00:12:42,210 --> 00:12:45,850 Гэта на самай справе не ўсе з іх трохі пашырацца і сціскацца 231 00:12:45,850 --> 00:12:47,880 doohickeys тут. 232 00:12:47,880 --> 00:12:52,520 Гэта свайго роду прыемней Версія спосаб глядзець на яго. 233 00:12:52,520 --> 00:12:57,040 >> Але тое, што гэта кажа нам пра тое, Я прасіў ўсе дэталі. 234 00:12:57,040 --> 00:13:03,120 Такім чынам, ёсць 13289475 пункты. 235 00:13:03,120 --> 00:13:06,150 І я гляджу на першы 10, пачынаючы з пазіцыі нулявога 236 00:13:06,150 --> 00:13:09,760 таму што ў інфарматыцы мы заўсёды пачынаем з нуля. 237 00:13:09,760 --> 00:13:15,150 І тое, што я тут, калі я проста абрынецца гэта, вы ўбачыце, што я атрымаў 10 пунктаў. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> І калі я зірну на пункт, я магу бачыць, што ў мяне ёсць інфармацыю пра яго. 240 00:13:25,210 --> 00:13:27,400 І гэта ў той, што называецца MODS форма. 241 00:13:27,400 --> 00:13:30,860 І таму я буду перамыкацца сюды на хвіліну. 242 00:13:30,860 --> 00:13:33,750 ОК. 243 00:13:33,750 --> 00:13:37,447 >> Такім чынам, давайце шукаць што-то ў пэўнымі, таму што першы элемент, які 244 00:13:37,447 --> 00:13:40,030 адбываецца, каб прыдумаць, калі вы глядзіце ўсю калекцыю 245 00:13:40,030 --> 00:13:41,750 гэта, па вызначэнні, выпадковым чынам. 246 00:13:41,750 --> 00:13:44,550 Такім чынам, давайце паглядзім на некаторыя пончыкі. 247 00:13:44,550 --> 00:13:46,830 Ох. 248 00:13:46,830 --> 00:13:49,190 >> ОК. 249 00:13:49,190 --> 00:13:49,940 Так пончыкі. 250 00:13:49,940 --> 00:13:55,360 Такім чынам, мы знайшлі там 80 пунктаў у Калекцыя, якія спасылаюцца на пончыкі. 251 00:13:55,360 --> 00:13:57,150 Мы глядзім на першыя 10 з іх. 252 00:13:57,150 --> 00:14:01,890 Цяпер вы можаце паглядзець тут так, што Я сказаў, што я шукаю для пончыкаў, 253 00:14:01,890 --> 00:14:04,400 Я проста дадаў нешта Радок запыту ў URL. 254 00:14:04,400 --> 00:14:09,680 Так Q роўны пончыкі, якія вы можаце см крыху лягчэй тут. 255 00:14:09,680 --> 00:14:12,131 >> І гэта ў асноўным азначае, што ёсць Спецыфікацыя для API, які 256 00:14:12,131 --> 00:14:13,880 вызначае, што ўсе Гэтыя параметры азначаюць. 257 00:14:13,880 --> 00:14:17,150 А гэта значыць, што мы збіраемся пошук усё для пончыкаў. 258 00:14:17,150 --> 00:14:24,910 >> Дык вось першы пункт у нас ёсць Вы можаце бачыць назву Donuts, 259 00:14:24,910 --> 00:14:29,310 і існуе субтытраў называецца Амерыканскі запал, якая, я думаю ,, 260 00:14:29,310 --> 00:14:31,610 адпаведна. 261 00:14:31,610 --> 00:14:36,134 Ёсць шмат different-- 262 00:14:36,134 --> 00:14:38,050 Пасля таго як вы дойдзеце да кропкі, атрымання дадзеных, 263 00:14:38,050 --> 00:14:41,020 Ёсць шмат розных Фарматы, якія вы можаце атрымаць яго ў. 264 00:14:41,020 --> 00:14:44,050 І існуюць розныя моцныя і слабыя для ўсіх з іх. 265 00:14:44,050 --> 00:14:49,000 Так што гэта адзін, вы можаце ўбачыць тут, гэтая форма вельмі багаты. 266 00:14:49,000 --> 00:14:51,946 І гэта стандартызаваны. 267 00:14:51,946 --> 00:14:55,040 >> Так што канкрэтную назву поле, поле субтытры. 268 00:14:55,040 --> 00:14:58,950 Там гэта альтэрнатыўны назву, амерыканскі страсці. 269 00:14:58,950 --> 00:15:01,650 Існуе імя, звязанае з ім. 270 00:15:01,650 --> 00:15:03,120 Тып рэсурсу тэкстаў. 271 00:15:03,120 --> 00:15:06,070 Там вельмі шмат інфармацыі Тут, у гэтым фармаце. 272 00:15:06,070 --> 00:15:09,480 >> Але ёсць куча розных фарматаў. 273 00:15:09,480 --> 00:15:11,920 Такім чынам, што мы былі проста гледзячы на ​​гэта фармат 274 00:15:11,920 --> 00:15:17,700 званыя моды, якая стаіць за Аб'ект метададзеных Апісанне Service, 275 00:15:17,700 --> 00:15:18,250 патэнцыйна. 276 00:15:18,250 --> 00:15:23,030 На самай справе я не зусім упэўнены, аб С. Але гэта даволі складаны фармат. 277 00:15:23,030 --> 00:15:24,240 Гэта фармат па змаўчанні. 278 00:15:24,240 --> 00:15:30,260 >> Але гэта той, які трымае Багацце ўсіх дадзеных, 279 00:15:30,260 --> 00:15:33,820 што бібліятэка мае, таму што гэта вельмі блізка да таго, што 280 00:15:33,820 --> 00:15:35,110 Бібліятэка выкарыстоўвае ўнутрана. 281 00:15:35,110 --> 00:15:39,030 Гэта стандарт, які з'яўляецца выкарыстоўваецца па ўсёй краіне, 282 00:15:39,030 --> 00:15:40,944 па ўсім свеце ў акадэмічных бібліятэках. 283 00:15:40,944 --> 00:15:42,110 І гэта вельмі сумяшчальныя. 284 00:15:42,110 --> 00:15:44,852 Так што, калі ў вас ёсць дакумент што ў фармаце моды, 285 00:15:44,852 --> 00:15:47,560 Вы можаце даць, што кагосьці іншага чые сістэмы разумеюць моды, 286 00:15:47,560 --> 00:15:48,518 і яны могуць імпартаваць яго. 287 00:15:48,518 --> 00:15:50,840 Так што гэта стандарт. 288 00:15:50,840 --> 00:15:54,250 Гэта вельмі добра вызначаны, вельмі спецыфічны. 289 00:15:54,250 --> 00:15:58,980 І гэта тое, што робіць яго ўзаемадзейнічаць, таму што калі хто-то кажа, 290 00:15:58,980 --> 00:16:04,930 гэта альтэрнатыўны назву запіс, усе ведаюць, што гэта значыць. 291 00:16:04,930 --> 00:16:07,740 З іншага боку, гэта вельмі складана. 292 00:16:07,740 --> 00:16:13,160 >> Так што, калі вы паглядзіце у гэтым запісы тут, 293 00:16:13,160 --> 00:16:15,320 калі я проста хачу, каб атрымаць назва гэтага дакумента, 294 00:16:15,320 --> 00:16:21,150 з гэтай кнігі, якая, верагодна, Donuts, Амерыканскі Страсць, аналіз яго 295 00:16:21,150 --> 00:16:22,940 гэта крыху удзел. 296 00:16:22,940 --> 00:16:27,380 У той час як ёсць іншы фармат, званы Dublin Core, 297 00:16:27,380 --> 00:16:29,730 які з'яўляецца значна, значна прасцей фармат. 298 00:16:29,730 --> 00:16:33,764 >> І таму вы не ўбачыце тут, няма ніякай загаловак, падзагаловак, альтэрнатыўны назву. 299 00:16:33,764 --> 00:16:35,930 Там проста назва, Donuts, амерыканскі Страсць, 300 00:16:35,930 --> 00:16:38,780 і яшчэ адзін тытул, амерыканскі страсці. 301 00:16:38,780 --> 00:16:42,907 Таму, калі вы глядзіце на тое, што форма Вы хочаце, каб атрымаць дадзеныя з, 302 00:16:42,907 --> 00:16:44,740 Многае залежыць ад таго, як Вы збіраецеся яго выкарыстоўваць. 303 00:16:44,740 --> 00:16:46,573 Карыстаецеся Ці вы для сумяшчальнасць ці вы 304 00:16:46,573 --> 00:16:49,970 хочаце нешта простае, што можа быць лягчэй працаваць? 305 00:16:49,970 --> 00:16:56,002 >> З іншага боку, шмат якія дэталі накшталт сплясканыя ўніз. 306 00:16:56,002 --> 00:16:58,460 Вы можаце страціць усе нюансы што канкрэтныя сродкі на месцах 307 00:16:58,460 --> 00:17:02,960 калі вы маеце справу з Dublin Core, якія вы не атрымаеце з модамі. 308 00:17:02,960 --> 00:17:06,462 Так што тыя два з фарматаў Вы можаце выйсці з API. 309 00:17:06,462 --> 00:17:08,920 І ў асноўным, мы трымаем гэта за кулісамі ў модов. 310 00:17:08,920 --> 00:17:14,179 Але мы можам даць вам яго ў Моды і Dublin Core і ўсё астатняе таксама. 311 00:17:14,179 --> 00:17:16,470 Іншае меркаванне, калі Вы шукаеце ў дадзеных 312 00:17:16,470 --> 00:17:21,210 што вы можаце атрымаць яго альбо як JSON, які выступае за натацыі аб'ектаў JavaScript, 313 00:17:21,210 --> 00:17:24,720 ці XML, якая выступае за Extensible Markup Language. 314 00:17:24,720 --> 00:17:30,080 І гэтыя прадстаўлення дадзеных і маюць адны і тыя ж дадзеныя, дакладна 315 00:17:30,080 --> 00:17:31,080 адны і тыя ж поля. 316 00:17:31,080 --> 00:17:33,644 Але яны проста сінтаксічна розныя. 317 00:17:33,644 --> 00:17:40,401 >> Так што гэта a-- 318 00:17:40,401 --> 00:17:41,400 Ну, давайце проста пераключыцца. 319 00:17:41,400 --> 00:17:47,490 Так што гэта наш запыт на пончыкі ў фармаце XML. 320 00:17:47,490 --> 00:17:53,470 Калі б я проста пераключыцца, каб гэта было JSON, Я бачу, што выглядае па-іншаму. 321 00:17:53,470 --> 00:17:58,580 Так што цяпер гэта ж самае ўтрыманне, а іншая структура. 322 00:17:58,580 --> 00:18:00,080 Ёсць менш вуглавыя дужкі. 323 00:18:00,080 --> 00:18:02,530 Там гэта менш шматслоўным. 324 00:18:02,530 --> 00:18:06,440 >> І гэта фармат, які, калі вы працуюць у вэб-асяроддзі, 325 00:18:06,440 --> 00:18:09,680 вы, хутчэй за ўсё, будзе хочаце выкарыстоўваць, таму што адзін 326 00:18:09,680 --> 00:18:12,630 з добрых рэчаў аб JSON з'яўляецца ён сумяшчальны з JavaScript. 327 00:18:12,630 --> 00:18:17,680 Так што, калі я пішу вэб-дадатак, я магу цягнуць у JSON і проста працаваць з ім напрамую. 328 00:18:17,680 --> 00:18:20,187 У той час як з XML, гэта крыху больш складана. 329 00:18:20,187 --> 00:18:21,520 Такім чынам, яшчэ раз, гэта як карысна. 330 00:18:21,520 --> 00:18:26,387 Яны проста розныя выпадкі выкарыстання дзе людзі маглі б хацець выкарыстоўваць іх. 331 00:18:26,387 --> 00:18:26,886 ОК. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 Такім чынам, вернемся да API. 334 00:18:31,680 --> 00:18:32,900 Так мы можам шукаць for-- 335 00:18:32,900 --> 00:18:36,220 >> Я прывяду прыклад пошук пончыкі. 336 00:18:36,220 --> 00:18:39,330 Мы таксама можам шукаць толькі ў канкрэтнае поле ў тут. 337 00:18:39,330 --> 00:18:41,310 Такім чынам, замест таго, каб шукаць Уся запіс, 338 00:18:41,310 --> 00:18:43,870 Я магу проста шукаць у поле загалоўка. 339 00:18:43,870 --> 00:18:48,810 І вось зараз ёсць 25 рэчаў, якія ёсць пончыкі ў загалоўку, адзін з якіх 340 00:18:48,810 --> 00:18:52,430 аб аднаўленні водна-балотных угоддзяў у кіраванні 341 00:18:52,430 --> 00:18:54,990 адтуліны ў пончык Праграма, якая, верагодна, 342 00:18:54,990 --> 00:18:58,970 не абавязкова, што мы шукаем калі мы шукаем для пончыкаў. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> Вы можаце таксама, калі вы справу з API-- 345 00:19:05,490 --> 00:19:08,827 >> Частка які мае API дае людзям доступ да вялікіх наборам дадзеных. 346 00:19:08,827 --> 00:19:11,410 І ёсць некалькі розных інструменты, якія можна выкарыстоўваць, каб зрабіць гэта. 347 00:19:11,410 --> 00:19:14,170 Адным з іх з'яўляецца, вельмі проста, вы можа прагартаць дадзеных. 348 00:19:14,170 --> 00:19:17,340 Так як калі б вы зрабіць запыт праз вэб-інтэрфейс, 349 00:19:17,340 --> 00:19:19,470 Вы можаце паглядзець на першай старонцы, другая старонка, старонка тры. 350 00:19:19,470 --> 00:19:22,040 Вы можаце зрабіць тое ж самае што праз API. 351 00:19:22,040 --> 00:19:24,150 Вы проста павінны быць Відавочны ў тым, як вы гэта робіце. 352 00:19:24,150 --> 00:19:29,511 >> Так, напрыклад, калі я шукаю ў маім першым запыце тут, 353 00:19:29,511 --> 00:19:32,510 дзе я раблю пошук для рэчаў з пончыкі ў назве, я магу казаць, 354 00:19:32,510 --> 00:19:35,415 і мяжа роўны 20, што азначае, даць мне першыя 20 запісаў, а не 355 00:19:35,415 --> 00:19:38,540 першы 10, які з'яўляецца па змаўчанні, таму што я хачу паглядзець на 20 адначасова. 356 00:19:38,540 --> 00:19:43,435 Ці я магу сказаць, усталяваць пачаць роўна 20 і мяжа 357 00:19:43,435 --> 00:19:47,150 раўняцца 20, што дасць мне запісвае з 21 па 40. 358 00:19:47,150 --> 00:19:52,680 >> Так што я думаю рэч забраць тут 359 00:19:52,680 --> 00:19:57,290 што мы, выкарыстоўваючы радкі запыту каб усталяваць параметры на запыт. 360 00:19:57,290 --> 00:20:02,760 І гэта дазваляе кантраляваць тое, што вы вернецеся. 361 00:20:02,760 --> 00:20:05,980 >> Яшчэ адзін інструмент, які можна выкарыстоўваць, - 362 00:20:05,980 --> 00:20:09,250 >> І гэта сапраўды карысна ў Умовы вывучае дадзеныя. 363 00:20:09,250 --> 00:20:10,840 >> --is тое, што называецца агранка. 364 00:20:10,840 --> 00:20:15,530 Так тэрмін агранка з'яўляецца не павінны быць агульнымі. 365 00:20:15,530 --> 00:20:16,880 Але вы ўсё бачылі яго раней. 366 00:20:16,880 --> 00:20:18,630 Калі вы паглядзіце на Amazon, напрыклад, 367 00:20:18,630 --> 00:20:20,870 і вы робіце пошук пончыкі ў кнігах, 368 00:20:20,870 --> 00:20:27,080 тут яны атрымалі серыю кніг, і яны згрупаваныя па катэгорыях, 369 00:20:27,080 --> 00:20:30,470 і вы атрымаеце розныя катэгорыі, і колькі кніг у кожнай катэгорыі 370 00:20:30,470 --> 00:20:31,330 паказаць ўверх. 371 00:20:31,330 --> 00:20:33,420 >> Так што гэта ў асноўным аспект. 372 00:20:33,420 --> 00:20:37,570 Вы бераце ўсе свае кнігі, 1800 кнігі, якія адпавядаюць пончыкі на Amazon. 373 00:20:37,570 --> 00:20:39,820 12 з іх знаходзяцца ў катэгорыя сняданак. 374 00:20:39,820 --> 00:20:43,100 21 у цесцю і выпечка, і гэтак далей, і гэтак далей. 375 00:20:43,100 --> 00:20:47,670 >> Так што гэта сапраўды карысна інструмент для даследавання ўтрымання 376 00:20:47,670 --> 00:20:53,260 ў бібліятэцы, а таму што, калі вы глядзіце на мяжы, 377 00:20:53,260 --> 00:20:56,520 гэта дае вам ўяўленне пра тое, якія прадметы існуе, як, якія віды суб'ектаў 378 00:20:56,520 --> 00:20:58,510 Найбольш папулярныя ў ваш набор запыту. 379 00:20:58,510 --> 00:21:00,950 І гэта дапаможа вам адагнаць і даследаваць. 380 00:21:00,950 --> 00:21:02,770 Такім чынам, мы можам зрабіць тое ж самае. 381 00:21:02,770 --> 00:21:05,940 >> Калі мы хочам выкарыстоўваць API і паглядзець на мяжы, 382 00:21:05,940 --> 00:21:08,950 мы дадаць яшчэ адзін параметр наш сябар радок запыту. 383 00:21:08,950 --> 00:21:12,540 Так граняў складае коску Спіс таго, што мы хочам, каб фаскай па. 384 00:21:12,540 --> 00:21:14,790 Такім чынам, адна з граняў можа быць прадметам. 385 00:21:14,790 --> 00:21:16,565 Яшчэ можа быць мова. 386 00:21:16,565 --> 00:21:19,665 І таму, калі мы запусцім гэты запыт, мы get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 Гэта выглядае даволі шмат ж самае. 389 00:21:24,830 --> 00:21:29,010 Але мы дадалі да канца з спісу набор граняў. 390 00:21:29,010 --> 00:21:34,060 Такім чынам, мы маем аспект, званы аб'ектам. 391 00:21:34,060 --> 00:21:40,250 Так што гэта кажа нам, што калі я гляджу на мае 80 вынікаў пончык запыту, 392 00:21:40,250 --> 00:21:42,100 13 з іх маюць тэрыторыі Злучаных Штатаў. 393 00:21:42,100 --> 00:21:43,684 Тры ёсць пончыкі па тэме. 394 00:21:43,684 --> 00:21:45,600 Тры мець тэму аднаўлення водна-балотных угоддзяў, 395 00:21:45,600 --> 00:21:47,720 які можа быць наш адтуліну ў пончык. 396 00:21:47,720 --> 00:21:51,780 Двое з іх, Сімпсаны, і гэтак далей, і гэтак далей. 397 00:21:51,780 --> 00:21:59,211 >> Так што гэта можа быць карысна, калі вы хочаце, каб звузіць свой пошук. 398 00:21:59,211 --> 00:22:00,210 Гэта можа дапамагчы вам зрабіць гэта. 399 00:22:00,210 --> 00:22:03,580 Асабліва, калі ў вас ёсць больш чым, скажам, 80 вынікаў. 400 00:22:03,580 --> 00:22:05,980 >> Акрамя таго, мы таксама папрасілі для гранямі мове. 401 00:22:05,980 --> 00:22:14,790 Так што, калі мы паглядзім на нашы вынікі, мы бачым, 76 з іх на англійскай мове, чатыры на французскай мове, 402 00:22:14,790 --> 00:22:19,620 два на іспанскай мове, два, я думаю, што гэта не вызначана, ці невядома, галандскі і латынь. 403 00:22:19,620 --> 00:22:22,830 Так што я думаю, што па-латыні пончык вынік, зноў жа, 404 00:22:22,830 --> 00:22:24,922 не мае нічога агульнага з хлебабулачных вырабаў. 405 00:22:24,922 --> 00:22:25,630 Але там вы ідзяце. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> Так што гэта свайго роду паказваючы вам, як вы можаце выцягнуць дадзеныя назад 408 00:22:38,630 --> 00:22:41,270 ад API толькі праз вэб-браўзэр, які выдатна падыходзіць. 409 00:22:41,270 --> 00:22:44,320 Але гэта не зусім тое, што вы б як правіла, з выкарыстаннем у API для гэтага. 410 00:22:44,320 --> 00:22:48,710 Так адзін прыклад таго, як трэба можа на самай справе зрабіць гэта я маю 411 00:22:48,710 --> 00:22:54,720 напісана супер невялікая праграма, якія, зноў жа, не мой пошук пончыкі 412 00:22:54,720 --> 00:22:59,010 і выбірае пару поля і адлюстроўвае іх у выглядзе табліцы. 413 00:22:59,010 --> 00:23:01,610 Так што гэта вельмі той жа змест, што мы проста 414 00:23:01,610 --> 00:23:04,830 піла з некалькімі палямі выцягнуў. 415 00:23:04,830 --> 00:23:12,090 Так спіс назваў, у размяшчэнне, што кніга 416 00:23:12,090 --> 00:23:15,120 о, мова, і гэтак далей, і гэтак далей. 417 00:23:15,120 --> 00:23:20,480 >> Так, як гэта адбылося на самай справе, так як Я думаю, мы павінны глядзець на код, 418 00:23:20,480 --> 00:23:22,420 is-- 419 00:23:22,420 --> 00:23:28,060 >> Тое, што мы маем тут справу з простай HTML старонка, якая адлюстроўвае тэкст, 420 00:23:28,060 --> 00:23:32,900 Сардэчна запрашаем у бібліятэку воблака і то на экран выводзіцца табліца вынікаў. 421 00:23:32,900 --> 00:23:37,790 І няма, відавочна, не прыводзіць да Табліца калі старонка загружаецца. 422 00:23:37,790 --> 00:23:41,380 Але тое, што мы робім гэта, у першую чаргу, мы 423 00:23:41,380 --> 00:23:46,290 загружаюцца бібліятэку пад назвай JQuery, які з'яўляецца ў асноўным 424 00:23:46,290 --> 00:23:52,030 Бібліятэка наяўнасць якога робіць яго вельмі лёгка маніпуляваць наяўнасць 425 00:23:52,030 --> 00:23:58,780 першапачаткова, HTML, а таксама ствараць вэб-старонкі, на баку кліента логіка і вэб-старонак. 426 00:23:58,780 --> 00:24:01,595 >> Такім чынам, што мы маем тут справу з JQuery мае метад Get, 427 00:24:01,595 --> 00:24:05,270 што істотна пойдзе на Спасылка, якая, у дадзеным выпадку, 428 00:24:05,270 --> 00:24:09,070 гэта знаёма гледзячы URL. 429 00:24:09,070 --> 00:24:14,440 І тады атрымаеце ўтрыманне ад што URL, а затым запусціць функцыю на ёй. 430 00:24:14,440 --> 00:24:19,240 Таму мы сказалі пайсці ў api.lib.harvard / Edu. 431 00:24:19,240 --> 00:24:20,060 Пошук пончыкі. 432 00:24:20,060 --> 00:24:21,300 Дайце нам 20 запісаў. 433 00:24:21,300 --> 00:24:28,590 І затым запусціць гэтую функцыю, якая Я абраў, перадаючы яму дадзеныя. 434 00:24:28,590 --> 00:24:34,430 І дадзеныя JSON, што атрымаў вярнуўся з API. 435 00:24:34,430 --> 00:24:40,120 >> І тады мы кажам, у тым, што Дадзеныя ёсць поле, званае пункт. 436 00:24:40,120 --> 00:24:48,117 І калі я пайду зірнуць назад на адзін з гэтых вынікаў, што тут, 437 00:24:48,117 --> 00:24:49,200 ёсць што-то called-- 438 00:24:49,200 --> 00:24:50,220 >> Ну, гэта называецца пункт. 439 00:24:50,220 --> 00:24:53,520 Так, што можа быць, што. 440 00:24:53,520 --> 00:25:01,840 І тое, што яна робіць, гэта яго праходзіць праз кожнага элемента 441 00:25:01,840 --> 00:25:05,300 а затым выклікае іншае Функцыя па кожным пункце. 442 00:25:05,300 --> 00:25:08,440 І, што функцыя ў асноўным прымае значэнне 443 00:25:08,440 --> 00:25:12,010 пункта, што з'яўляецца па сутнасці асобная запіс 444 00:25:12,010 --> 00:25:18,220 і дазваляе выцягнуць назву, ахоп і мову. 445 00:25:18,220 --> 00:25:21,640 >> Так мы называем функцыю на кожны элемент, які мы вярнуліся з API. 446 00:25:21,640 --> 00:25:25,397 І калі вы проста паглядзіце на гэты кавалак прама тут, 447 00:25:25,397 --> 00:25:27,230 тое, што мы робім, мы ствараем радок, 448 00:25:27,230 --> 00:25:31,810 які з'яўляецца па сутнасці некаторыя HTML разметка вакол стала, з value.title, 449 00:25:31,810 --> 00:25:35,790 што назва Аб'ект, value.coverage, 450 00:25:35,790 --> 00:25:36,790 які з'яўляецца асвятленне, - 451 00:25:36,790 --> 00:25:38,225 >> І мы робім праверку тут, каб убачыць, хто не вызначана 452 00:25:38,225 --> 00:25:40,570 і хаваючы яго, калі ён кажа, што не вызначана, таму што мы на самай справе не зацікаўлены 453 00:25:40,570 --> 00:25:41,600 ў гэтым. 454 00:25:41,600 --> 00:25:42,939 >> --і тады мову. 455 00:25:42,939 --> 00:25:44,730 І тады тое, што мы робіце дадання, што 456 00:25:44,730 --> 00:25:48,510 да табліцы, якая вызначаны гэтым радком тут. 457 00:25:48,510 --> 00:25:50,790 І як JQuery працуе гэта тое, што гэта гаворыць 458 00:25:50,790 --> 00:25:56,420 гэта паглядзець на табліцу з ідэяй Вынікі і дадайце ў яго тэкст. 459 00:25:56,420 --> 00:25:59,380 І гэта табліца з вынікамі ідэя. 460 00:25:59,380 --> 00:26:04,998 Так што вы ў канчатковым выніку з гэта старонкі тут. 461 00:26:04,998 --> 00:26:06,206 А для таго, каб праглядзець source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 Ну, крыніцай на самай справе не абнаўляюцца, калі гэта адбылося. 464 00:26:13,810 --> 00:26:18,740 Такім чынам, вы можаце ўбачыць фактычнае Вынікі табліцы, хоць тут. 465 00:26:18,740 --> 00:26:24,770 >> Так што гэта проста просты прыклад робіць вельмі просты запыт да API 466 00:26:24,770 --> 00:26:29,020 і адлюстравання інфармацыі, у нейкай іншай форме, і нічога не робіць занадта фантазіі. 467 00:26:29,020 --> 00:26:36,370 Цяпер яшчэ адзін прыклад, як праграма, напісаная Дэвідам Вайнбергером 468 00:26:36,370 --> 00:26:39,120 як дэма гэта, што па сутнасці паказвае вам, 469 00:26:39,120 --> 00:26:44,620 як вы можаце пюрэ вынікі вы атрыманне з бібліятэкі хмарных API 470 00:26:44,620 --> 00:26:46,250 з, скажам, Google Books. 471 00:26:46,250 --> 00:26:52,225 >> І мысленне тут з'яўляецца тое, што я магу выканаем запыт Google Books, 472 00:26:52,225 --> 00:26:56,060 атрымаць паўнатэкставы пошук, атрымаць некаторыя вынікі назад, высветліць, якія з гэтых элементаў 473 00:26:56,060 --> 00:27:01,180 на самай справе існуе ў Холлис, бібліятэчная сістэма, 474 00:27:01,180 --> 00:27:03,200 а затым даць мне спасылкі Вярнуцца да гэтых элементаў. 475 00:27:03,200 --> 00:27:12,730 Так што, калі я шукаю, гэта было цёмная і бурная ноч, я 476 00:27:12,730 --> 00:27:16,210 вярнуцца кучу вынікаў ад Google, а затым адзін вынік 477 00:27:16,210 --> 00:27:19,460 што маршчын ў часе. 478 00:27:19,460 --> 00:27:29,330 І гэта спасылкі на кнігі, якія існуюць у рамках сістэмы Бібліятэка Гарвардскага універсітэта. 479 00:27:29,330 --> 00:27:32,160 >> Так што я думаю, справа тут не ў так што гэта можа ці не можа 480 00:27:32,160 --> 00:27:34,118 быць так, што вы хочаце шукаць бібліятэку, 481 00:27:34,118 --> 00:27:38,310 але гэта зусім розныя так, што не было даступна для вас 482 00:27:38,310 --> 00:27:42,884 перш, як вас не было ніякай магчымасці рабіць Поўны тэкст пошук па кнігах, што нават 483 00:27:42,884 --> 00:27:44,550 былі часткай сістэмы Бібліятэка Гарвардскага універсітэта. 484 00:27:44,550 --> 00:27:46,870 Так што цяпер гэта спосаб што вы можаце зрабіць гэта. 485 00:27:46,870 --> 00:27:51,930 І іх можна адлюстраваць у любы фармат, вы хочаце. 486 00:27:51,930 --> 00:27:55,990 Так момантам тут з'яўляецца, у асноўным, мы адкрываем новыя шляхі для людзей 487 00:27:55,990 --> 00:27:59,080 працаваць з дадзенымі. 488 00:27:59,080 --> 00:28:07,925 >> Іншая частка бібліятэкі аблокі, што гэта дапамагае раскрыць некаторыя з дадзеных выкарыстання 489 00:28:07,925 --> 00:28:08,800 што бібліятэка мае. 490 00:28:08,800 --> 00:28:12,630 Так што, калі вы ідзяце ў бібліятэку, і вы шукаеце для кніг, 491 00:28:12,630 --> 00:28:15,770 Вам не абавязкова на самай справе маюць уяўленне аб тым ,, 492 00:28:15,770 --> 00:28:19,080 для ўсіх элементаў у канкрэтны суб'ект, тое, што 493 00:28:19,080 --> 00:28:21,200 людзі ў супольнасць, няхай гэта будзе 494 00:28:21,200 --> 00:28:24,890 вызначаецца як Гарвард ці краіна ці ваш клас, 495 00:28:24,890 --> 00:28:26,421 Што яны апынуліся найбольш карыснымі? 496 00:28:26,421 --> 00:28:28,920 І бібліятэка на самай справе мае Велізарная колькасць інфармацыі аб тым, што 497 00:28:28,920 --> 00:28:32,999 найбольш карысны, паколькі калі шмат людзей праверыць кнігу, 498 00:28:32,999 --> 00:28:34,040 што кажа вам што-то. 499 00:28:34,040 --> 00:28:36,498 Там быў нейкай прычыне яны хочуць, каб праверыць яго. 500 00:28:36,498 --> 00:28:38,270 Шмат людзей пакласці яго ў запасе. 501 00:28:38,270 --> 00:28:42,520 >> Калі гэта рэзервовы спіс для многіх класаў, які кажа вам што-то. 502 00:28:42,520 --> 00:28:45,960 Калі выкладчыкі правяраюць яго з шмат і студэнты не з'яўляюцца, 503 00:28:45,960 --> 00:28:47,200 што кажа мне нешта. 504 00:28:47,200 --> 00:28:49,280 І наадварот, што таксама кажа вам што-то. 505 00:28:49,280 --> 00:28:54,680 Таму было б вельмі цікава пакласці гэтую інфармацыю там, і хай 506 00:28:54,680 --> 00:28:59,969 людзі выкарыстоўваюць яго, каб дапамагчы ім знайсці працуе ўнутры бібліятэчнай сістэмы. 507 00:28:59,969 --> 00:29:02,260 Адваротным бокам гэтага з'яўляецца ёсць некаторыя сур'ёзныя прыватнасці 508 00:29:02,260 --> 00:29:07,854 праблемы, таму што адзін з Асноўныя прынцыпы бібліятэкі 509 00:29:07,854 --> 00:29:10,770 што мы не збіраемся распавядаць людзі, што іншыя людзі чытаюць. 510 00:29:10,770 --> 00:29:17,360 І нават калі вы кажаце, гэта Кніга была праверана чатыры разы 511 00:29:17,360 --> 00:29:20,070 у пэўным месяцы, , Якія могуць быць выкарыстаны 512 00:29:20,070 --> 00:29:25,252 спасылаюцца на асаблівасці чалавек па дадзеных дэ-анонимизирующая 513 00:29:25,252 --> 00:29:26,710 і высветліць, хто праверыў гэта. 514 00:29:26,710 --> 00:29:30,792 Так так, што мы можам avoid-- 515 00:29:30,792 --> 00:29:33,750 Так, што мы можам паспрабаваць атрымаць некаторыя сігнал ад усёй інфармацыі, 516 00:29:33,750 --> 00:29:36,740 без парушэння недатыкальнасці прыватнага жыцця нічыіх 517 00:29:36,740 --> 00:29:42,150 па сутнасці мы глядзім на 10 гадоў дадзеныя аб выкарыстанні, - 518 00:29:42,150 --> 00:29:43,930 >> Такім чынам, гэта на працягу доўгага перыяду часу. 519 00:29:43,930 --> 00:29:50,639 >> --і кажуць, добра, давайце паглядзім, як шмат разоў быў выкарыстаны гэтую працу, 520 00:29:50,639 --> 00:29:52,930 і якія на працягу гэтага перыяду часу, і то ў асноўным 521 00:29:52,930 --> 00:29:56,300 вярнуць нумар, які мы называем адзнака стэк, які ў асноўным 522 00:29:56,300 --> 00:29:59,910 паказвае, наколькі яна была выкарыстаная. 523 00:29:59,910 --> 00:30:01,084 І што number-- 524 00:30:01,084 --> 00:30:03,250 Шмат розных разлікаў перайсці ў гэты лік. 525 00:30:03,250 --> 00:30:05,150 --but гэта вельмі грубая паказчык, які дае вам 526 00:30:05,150 --> 00:30:11,300 Некаторы ўяўленне пра тое, як супольнасць могуць ацэньваць гэтую працу. 527 00:30:11,300 --> 00:30:16,772 >> І так іншага роду, нават больш канкрэтызаваны прыкладання 528 00:30:16,772 --> 00:30:18,480 якая скарыстаецца перавагамі гэтага з'яўляецца тое, 529 00:30:18,480 --> 00:30:24,000 называецца Stacklife, якая на самой справе даступныя праз галоўнае Гарвардзе 530 00:30:24,000 --> 00:30:24,880 Бібліятэка партала. 531 00:30:24,880 --> 00:30:26,700 Так вы ідзяце ў library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 Вы ўбачыце шэраг розных шляху пошуку бібліятэкі. 533 00:30:29,360 --> 00:30:32,300 І адзін з іх завецца Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> І гэта дадатак, якое праглядае ўтрыманне бібліятэкі, 535 00:30:38,980 --> 00:30:43,490 але цалкам пабудаваны па-над гэтых інтэрфейсаў. 536 00:30:43,490 --> 00:30:46,910 Такім чынам, няма ніякіх спецыяльных матэрыял адбываецца за кулісамі. 537 00:30:46,910 --> 00:30:49,570 Там няма доступу да дадзеныя, якія вы не маеце. 538 00:30:49,570 --> 00:30:54,090 Яна выкарыстоўвае API-інтэрфейсы, каб даць вам з зусім іншай прагляду 539 00:30:54,090 --> 00:30:55,480 вопыт. 540 00:30:55,480 --> 00:30:58,570 >> Так што, калі я шукаю для Алісы ў краіне цудаў у гэтым выпадку, 541 00:30:58,570 --> 00:31:02,600 Я атрымліваю вынік, які выглядае як гэта, які з'яўляецца даволі much-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> Гэта вельмі падобны на любы іншы катэгорыі Вы маглі б зрабіць, акрамя як у гэтым выпадку 544 00:31:10,870 --> 00:31:15,730 мы ранжыравання дэталі stackscore, што дае вам 545 00:31:15,730 --> 00:31:19,850 Некаторы ўяўленне пра тое, як папулярныя ў гэтыя прадметы былі ў грамадстве. 546 00:31:19,850 --> 00:31:25,610 І так ясна, Аліса ў краіне цудаў Уолт Дысней вельмі папулярныя. 547 00:31:25,610 --> 00:31:36,570 Але вы таксама можаце ўбачыць першую чацвёрку вось тыя, што вы, магчыма, не actually-- 548 00:31:36,570 --> 00:31:39,220 >> Рэчы, якія высока выкарыстоўваюцца, але вы не можаце адразу 549 00:31:39,220 --> 00:31:41,240 звязацца з Аліса ў краіне цудаў. 550 00:31:41,240 --> 00:31:44,650 Такім чынам, наш стары сябар Анатаваны Аліса тут. 551 00:31:44,650 --> 00:31:46,350 Так што я магу зірнуць на яго. 552 00:31:46,350 --> 00:31:52,010 А зараз тое, што я шукаю у асноўным усталёўваецца of-- 553 00:31:52,010 --> 00:31:53,760 Я магу мець з заўвагамі Аліса тут. 554 00:31:53,760 --> 00:31:56,700 У мяне ёсць інфармацыя пра яго. 555 00:31:56,700 --> 00:32:00,230 І ў мяне таксама ёсць stackscore ад таго, у гэтым выпадку, 26. 556 00:32:00,230 --> 00:32:03,169 І гэта кажа мне накшталт прыкладна як мы патрапілі ў гэты stackscore, 557 00:32:03,169 --> 00:32:05,835 як хто правяраў яго, напрыклад, як шмат разоў быў праверылі, 558 00:32:05,835 --> 00:32:08,440 як факультэт або старшакурснікі, як шмат копій бібліятэка мае, 559 00:32:08,440 --> 00:32:11,300 і гэтак далей, і гэтак далей. 560 00:32:11,300 --> 00:32:16,460 >> І вы можаце таксама, досыць цікава тут, праглядаць стэкі віртуальна. 561 00:32:16,460 --> 00:32:19,550 Такім чынам, дадзеныя тут, гэта паказвае вам разабрацца 562 00:32:19,550 --> 00:32:23,547 віртуальнага прадстаўлення ад таго, які шэльфа моцы 563 00:32:23,547 --> 00:32:25,880 выглядаць, калі вы павінны былі прыняць усе фондаў бібліятэкі 564 00:32:25,880 --> 00:32:28,940 і пакласці іх разам на адной бясконцай паліцы. 565 00:32:28,940 --> 00:32:30,990 І прыемна тое, што мы can-- 566 00:32:30,990 --> 00:32:33,380 >> Перш за ўсё, метададзеныя аб гэтых кнігах 567 00:32:33,380 --> 00:32:35,627 часта кажа вам, калі яна была апублікаваная. 568 00:32:35,627 --> 00:32:37,085 Яна кажа вам, колькі старонак ён мае. 569 00:32:37,085 --> 00:32:38,459 Гэта можа сказаць вам памеры. 570 00:32:38,459 --> 00:32:42,930 Такім чынам, вы можаце бачыць, што адлюстравана тут па памеры кніг. 571 00:32:42,930 --> 00:32:46,740 >> І тады мы можам выкарыстоўваць стэк кошт, каб вылучыць 572 00:32:46,740 --> 00:32:49,170 кнігі, якія маюць больш высокія паказчыкі складаюцца. 573 00:32:49,170 --> 00:32:54,930 Так што, калі ён цямней, гэта азначае, што, Мяркуюць, што яна выкарыстоўваецца часцей. 574 00:32:54,930 --> 00:32:57,040 Такім чынам, у гэтым выпадку, я буду гадаць, што гэта 575 00:32:57,040 --> 00:33:03,226 Гэта версія Алісе ў краіне цудаў які вельмі шырока выкарыстоўваецца і найбольш 576 00:33:03,226 --> 00:33:05,100 Доступ, бібліятэка мае больш копій. 577 00:33:05,100 --> 00:33:06,975 Так што, калі вы шукаеце Аліса ў краіне цудаў, 578 00:33:06,975 --> 00:33:10,220 гэта можа быць добрым месцам для пачатку. 579 00:33:10,220 --> 00:33:13,500 >> І тады тут Вы можаце таксама звязаць з , Скажам, Amazon, каб купіць кнігу, 580 00:33:13,500 --> 00:33:15,182 і гэтак далей, і гэтак далей. 581 00:33:15,182 --> 00:33:17,140 Справа тут, зноў жа, не так шмат, што гэта 582 00:33:17,140 --> 00:33:25,030 гэта лепшы спосаб, каб праглядзець бібліятэку ці правільны інструмент для кожнага выпадку. 583 00:33:25,030 --> 00:33:28,400 Але гэта яшчэ адзін спосаб зрабіць гэта. 584 00:33:28,400 --> 00:33:31,359 І, зрабіўшы дадзеныя даступныя праз API, які 585 00:33:31,359 --> 00:33:34,650 выраблена з вельмі простых блокаў, які дазваляе шукаць кантэнт, 586 00:33:34,650 --> 00:33:39,420 Вы можаце пабудаваць што-то як гэта, што можна 587 00:33:39,420 --> 00:33:41,520 быць надзвычай каштоўным для некаторых людзей. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> Дык вось накшталт, як я хачу сказаць на самой справе аб тым, што API з'яўляецца 590 00:33:51,860 --> 00:33:56,070 і тое, што ён дае, ёсць уся куча рэчаў за кулісамі, якія 591 00:33:56,070 --> 00:33:59,480 Я проста хачу, каб дакрануцца да коратка толькі таму, што ён быццам ідзе на гэта 592 00:33:59,480 --> 00:34:03,720 з цалкам іншага пункту гледжання ў Ўмовы, як робіць нешта накшталт гэтага 593 00:34:03,720 --> 00:34:04,580 атрымаць пакласці на месца? 594 00:34:04,580 --> 00:34:10,820 >> Так API з'яўляецца стандартным інтэрфейс для ўсяго гэтага кантэнту. 595 00:34:10,820 --> 00:34:13,820 Але каб атрымаць яго там, Першае, што мы павінны былі зрабіць 596 00:34:13,820 --> 00:34:17,260 быў зблізіць інфармацыі кніг і малюнкаў 597 00:34:17,260 --> 00:34:21,580 і сістэмах пошуку, збору Дакумент з розных сістэм Гарварда. 598 00:34:21,580 --> 00:34:23,929 Алеф, VIA і аазіса імёны сістэм. 599 00:34:23,929 --> 00:34:28,820 І яны па сутнасці ісці ў Трубаправод, канвеер апрацоўкі. 600 00:34:28,820 --> 00:34:33,230 >> Такім чынам, перш за ўсё, мы атрымліваем экспарт файлы з усіх гэтых сістэм. 601 00:34:33,230 --> 00:34:35,130 Мы падзялілі іх на асобныя элементы. 602 00:34:35,130 --> 00:34:39,360 Таму ў нас ёсць файл, які гігабайт, які мае мільёнаў запісаў у ім. 603 00:34:39,360 --> 00:34:42,290 Такім чынам, мы падзялілі яго на асобныя элементы. 604 00:34:42,290 --> 00:34:45,374 Затым, для кожнага элемента, мы ператвараем яго у моды, таму што некаторыя з іх 605 00:34:45,374 --> 00:34:47,040 зыходна моды, некаторыя з іх не. 606 00:34:47,040 --> 00:34:49,204 Такім чынам, мы атрымліваем іх усё, каб знаходзіцца ў тым жа фармаце. 607 00:34:49,204 --> 00:34:51,120 Тады існуюць розныя ўзбагачэнні крокаў, дзе 608 00:34:51,120 --> 00:34:55,969 дадаць дадатковую інфармацыю да дадзеных чым была даступная ў бібліятэцы. 609 00:34:55,969 --> 00:34:59,750 Такім чынам, мы павінны дадаць, у першую чаргу мы маем тое, што бібліятэкі ўтрымаць яго. 610 00:34:59,750 --> 00:35:02,250 Мы праходзім праз стадыю разліку stackscore. 611 00:35:02,250 --> 00:35:07,112 Мы праходзім праз іншы стадыі дадаўшы больш метададзеных у плане 612 00:35:07,112 --> 00:35:10,730 з якіх набораў людзей мог бы дадаць this-- 613 00:35:10,730 --> 00:35:12,532 >> Людзі ствараюць наборы элементаў. 614 00:35:12,532 --> 00:35:13,990 Што калекцыі ён належыць? 615 00:35:13,990 --> 00:35:17,220 Як бы людзі з тэгамі гэта ўтрыманне ў мінулым? 616 00:35:17,220 --> 00:35:20,750 Тады вы адфільтраваць, і вы абмяжоўваеце запісы, таму што, як я ўжо казаў, 617 00:35:20,750 --> 00:35:24,120 ёсць некаторыя запісы, якія, з-за Прычыны аўтарскіх правоў, мы не можам адлюстраваць. 618 00:35:24,120 --> 00:35:26,700 А потым мы загружаем іх у тое, што называецца 619 00:35:26,700 --> 00:35:31,680 Solr, якая не памылка друку, але Гэтае імя часткі праграмнага забеспячэння 620 00:35:31,680 --> 00:35:35,710 што робіць індэксаванне пошуку, якія Прывады Усе пошукам ззаду API. 621 00:35:35,710 --> 00:35:40,110 І тады ён становіцца даступным для API-інтэрфейс, і людзі могуць яго выкарыстоўваць. 622 00:35:40,110 --> 00:35:44,640 >> Так што гэта, як справядліва просты працэс. 623 00:35:44,640 --> 00:35:47,230 Адным з цікавых усё аб ім 624 00:35:47,230 --> 00:35:50,990 што мы маем справу 13 мільёнаў запісаў 625 00:35:50,990 --> 00:35:53,820 і мы будзем мець справу ці больш. 626 00:35:53,820 --> 00:36:01,260 І мы хочам, каб быць у стане справіцца гэта ў адносна хутчэйшага моды. 627 00:36:01,260 --> 00:36:03,630 Гэта займае шмат часу, каб апрацоўваць 13 мільёнаў запісаў. 628 00:36:03,630 --> 00:36:09,529 >> Так як гэты трубаправод наладзіць, што вы can-- 629 00:36:09,529 --> 00:36:12,070 Я думаю, перавага Трубаправод, праблема, што мы 630 00:36:12,070 --> 00:36:15,580 спрабуе вырашыць тут, з'яўляецца тое, што усе пераўтварэнні, усё 631 00:36:15,580 --> 00:36:18,729 Гэтыя крокі ў гэтым Трубаправод неаддзельныя. 632 00:36:18,729 --> 00:36:19,645 Там няма залежнасці. 633 00:36:19,645 --> 00:36:22,146 Калі вы апрацоўваеце запіс адной кнігі, 634 00:36:22,146 --> 00:36:24,270 няма утрыманцаў ў што паміж іншай кнізе. 635 00:36:24,270 --> 00:36:27,760 >> Такім чынам, што мы можам зрабіць, гэта ў асноўным, на кожным кроку ў трубаправодзе, 636 00:36:27,760 --> 00:36:30,470 мы ставім яго ў чаргу ў воблаку. 637 00:36:30,470 --> 00:36:32,250 Мне давялося быць на Amazon Web Services. 638 00:36:32,250 --> 00:36:35,140 Так што спіс, кажуць, 10000 прадметаў, якія 639 00:36:35,140 --> 00:36:38,100 павінны быць нармалізаваныя і пераўтворыцца ў фармат модов. 640 00:36:38,100 --> 00:36:41,620 І мы раскручваецца столькі сервераў Так як мы хочам, можа быць, 10 сервераў. 641 00:36:41,620 --> 00:36:44,860 І кожны з гэтых сервераў толькі сядзіць там, глядзіць у гэтай чарзе, 642 00:36:44,860 --> 00:36:46,730 бачыць, што ёсць адзін, які павінен апрацоўвацца, цягне яго з чаргі, 643 00:36:46,730 --> 00:36:48,740 апрацоўвае яго і палачкі На наступным чарзе. 644 00:36:48,740 --> 00:36:54,200 >> І так, што гэта дазваляе нам зрабіць, гэта ўжыць, па сутнасці, 645 00:36:54,200 --> 00:36:58,110 як шмат апаратных сродкаў, а мы хочам, каб гэта Праблема ў працягу вельмі кароткага перыяду часу 646 00:36:58,110 --> 00:37:02,970 для апрацоўкі дадзеных так хутка, як магчыма, што-то, што толькі, 647 00:37:02,970 --> 00:37:08,220 цяпер у свеце хмарных вылічэнняў Мы можам прадастаўленне серверы па сутнасці 648 00:37:08,220 --> 00:37:09,890 імгненна, у тым, што карысна. 649 00:37:09,890 --> 00:37:12,260 Такім чынам, мы не павінны мець гігант сервер сядзець 650 00:37:12,260 --> 00:37:16,700 ўвесь час, каб зрабіць апрацоўку што можа здарыцца толькі адзін раз у тыдзень. 651 00:37:16,700 --> 00:37:21,440 >> Так што гэта ў асноўным гэта. 652 00:37:21,440 --> 00:37:27,590 Там жа дакументацыя Для бібліятэкі Cloud Кропка API 653 00:37:27,590 --> 00:37:31,960 па гэтым адрасе, які будзе будзе даступная пазней. 654 00:37:31,960 --> 00:37:36,730 І, калі ласка, пайсці зірнуць на яго, каб убачыць, калі ёсць што-небудзь, 655 00:37:36,730 --> 00:37:37,579 ў вас ёсць нейкія ідэі. 656 00:37:37,579 --> 00:37:38,120 Гуляць з ім. 657 00:37:38,120 --> 00:37:38,830 Дурань вакол. 658 00:37:38,830 --> 00:37:42,800 І, спадзяюся, вы можаце прыйсці з чаго-то вялікага. 659 00:37:42,800 --> 00:37:44,740 Дзякуй. 660 00:37:44,740 --> 00:37:45,899