1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 JEFFREY LICHT: Hi არსებობს. 3 00:00:12,370 --> 00:00:13,550 მე Jeffrey სინათლის. 4 00:00:13,550 --> 00:00:17,890 და მე აქ გაიგო თქვენ შესახებ ჰარვარდის ბიბლიოთეკა და სამშენებლო ხვალ 5 00:00:17,890 --> 00:00:20,870 ბიბლიოთეკაში გაიმართა, ვფიქრობ. 6 00:00:20,870 --> 00:00:23,040 ისე ფონზე აქ, მოედანზე ამ სხდომაზე 7 00:00:23,040 --> 00:00:26,930 არსებითად, რომ არ არსებობს ბევრი ბიბლიოგრაფიული მონაცემები 8 00:00:26,930 --> 00:00:28,400 ხელმისაწვდომია ჰარვარდის ბიბლიოთეკები. 9 00:00:28,400 --> 00:00:33,434 და არ არსებობს საშუალება, მეშვეობით ზოგიერთი ინსტრუმენტები 10 00:00:33,434 --> 00:00:36,350 და პროექტი, რომელიც მიმდინარეობს განვითარებული, რათა მიიღოთ დაშვება ინფორმაცია 11 00:00:36,350 --> 00:00:42,430 და მას ადგილებში, რომ ჰარვარდის ბიბლიოთეკა არ აკეთებს ახლა, 12 00:00:42,430 --> 00:00:45,460 გავაკეთოთ ახალი პერსონალი მას, ექსპერიმენტი და ითამაშოს გარშემო. 13 00:00:45,460 --> 00:00:52,413 >> ამიტომ შესვლის წერტილი შევიდა ეს არის API მოუწოდა ჰარვარდის ბიბლიოთეკა Cloud, რომელიც 14 00:00:52,413 --> 00:00:57,650 ღია მეტადატის სერვერზე, რომელიც მე ლაპარაკი ახლა. 15 00:00:57,650 --> 00:01:02,595 ისე ფონზე არის ის, რომ არ არის ბევრი პერსონალი ჰარვარდის ბიბლიოთეკაში. 16 00:01:02,595 --> 00:01:07,150 ჩვენ გვაქვს 13 მილიონი ბიბლიოგრაფიული ჩანაწერების მილიონობით სურათები, 17 00:01:07,150 --> 00:01:11,090 და ათასობით მოძიებაში დამხმარე, რომელიც ძირითადად ამსახველი დოკუმენტები 18 00:01:11,090 --> 00:01:15,500 კრებული, რომ ის, რასაც მათ შორის, ყუთები ნაშრომების 19 00:01:15,500 --> 00:01:21,080 და ა.შ., რომელიც წარმოადგენს მეტი მილიონი ინდივიდუალური დოკუმენტები. 20 00:01:21,080 --> 00:01:24,290 და იქ ასევე უამრავი ინფორმაცია, რომ ბიბლიოთეკას აქვს 21 00:01:24,290 --> 00:01:28,180 იმაზე, თუ როგორ შინაარსი გამოიყენება, რომ შეიძლება იყოს საინტერესო ადამიანი 22 00:01:28,180 --> 00:01:32,400 რომელიც გსურთ მუშაობა მას. 23 00:01:32,400 --> 00:01:36,150 >> ასე რომ ყველა ინფორმაცია ბიბლიოთეკას აქვს მეტადატის. 24 00:01:36,150 --> 00:01:39,500 ასე მეტამონაცემები მონაცემების შესახებ მონაცემები. 25 00:01:39,500 --> 00:01:42,070 ასე რომ, როდესაც ჩვენ ვსაუბრობთ ინფორმაცია, რომ 26 00:01:42,070 --> 00:01:44,890 შესაძლებელია ბიბლიოთეკა ღრუბელი, რომელიც არის შესაძლებელი, 27 00:01:44,890 --> 00:01:47,760 ეს არ არის აუცილებელი ფაქტობრივი დოკუმენტები 28 00:01:47,760 --> 00:01:53,060 თავს, არ არის აუცილებელი, სრული ტექსტის წიგნები და სრული სურათებით, 29 00:01:53,060 --> 00:01:54,890 მიუხედავად იმისა, რომ რეალურად შეიძლება იყოს საქმე. 30 00:01:54,890 --> 00:01:57,550 მაგრამ ეს ნამდვილად ინფორმაცია მონაცემების შესახებ. 31 00:01:57,550 --> 00:02:00,909 >> ასე რომ თქვენ შეგიძლიათ ვფიქრობ cataloging ინფორმაცია, ზარის ნომრები, სუბიექტების, 32 00:02:00,909 --> 00:02:02,700 რამდენი ასლები წიგნი არსებობს, რა 33 00:02:02,700 --> 00:02:06,380 არიან გამოცემები, რა არის ფორმატებში, ავტორები, და სხვ. 34 00:02:06,380 --> 00:02:12,250 ასე რომ, არსებობს უამრავი ინფორმაცია ინფორმაციის შეგროვების, რომ 35 00:02:12,250 --> 00:02:14,400 თავისთავად, არის ერთგვარი არსებითად სასარგებლო. 36 00:02:14,400 --> 00:02:19,230 და მიუხედავად იმისა, რომ, თუ თქვენ აკეთებს სიღრმისეული კვლევა, 37 00:02:19,230 --> 00:02:25,160 თქვენ აშკარად გვინდა ფაქტობრივი შინაარსი თავად და შევხედოთ მონაცემებით, 38 00:02:25,160 --> 00:02:30,140 მეტამონაცემების არის სასარგებლო თვალსაზრისით ორივე ანალიზის corpus, როგორც მთელი, 39 00:02:30,140 --> 00:02:33,870 როგორიცაა რა რამ კოლექცია. 40 00:02:33,870 --> 00:02:35,520 როგორ ისინი ეხება? 41 00:02:35,520 --> 00:02:39,482 ეს ეხმარება თქვენ ნამდვილად სხვა პერსონალი, რომელიც მართლაც მთავარი მიზანი იყო. 42 00:02:39,482 --> 00:02:41,190 წერტილი მეტადატის და კატალოგი 43 00:02:41,190 --> 00:02:43,230 რათა დაგეხმაროთ თქვენ იპოვით ყველა ინფორმაცია, რომ 44 00:02:43,230 --> 00:02:46,590 ხელმისაწვდომია ფარგლებში კოლექციებში. 45 00:02:46,590 --> 00:02:53,690 >> ასე რომ, ეს არის მაგალითი იმისა, მეტადატის წიგნი ჰარვარდის ბიბლიოთეკა. 46 00:02:53,690 --> 00:02:56,370 ასე რომ, ეს არ არსებობს. 47 00:02:56,370 --> 00:02:59,850 და თქვენ ხედავთ, რომ ეს რეალურად ზომიერად კომპლექსური. 48 00:02:59,850 --> 00:03:04,610 და ღირებულების ნაწილი მეტადატის ფარგლებში ჰარვარდის ბიბლიოთეკა სისტემა 49 00:03:04,610 --> 00:03:09,320 ის არის, რომ ეს იყო ერთგვარი of აშენებულ catalogers 50 00:03:09,320 --> 00:03:12,720 და აწყობილი ადამიანები, რომლებიც მოდიან ბევრი გამოცდილება და უნარი 51 00:03:12,720 --> 00:03:20,030 და ეგონა, რომ ეს დროთა განმავლობაში, რომელსაც აქვს ბევრი მნიშვნელობა. 52 00:03:20,030 --> 00:03:25,450 >> ასე რომ, თუ თქვენ შეხედეთ ამ რეკორდი ანოტირებული Alice, შეგიძლიათ გასარკვევად, 53 00:03:25,450 --> 00:03:32,590 თქვენ მოხვდით სათაური, ვინც ეს დაწერა, ავტორი, და ყველა სხვადასხვა საგნების 54 00:03:32,590 --> 00:03:35,380 რომელიც ხალხს კატალოგში შევიდა. 55 00:03:35,380 --> 00:03:40,110 და თქვენ ხედავთ, არსებობს ასევე, გარდა იმისა, რომ ბევრი კარგი ინფორმაცია 56 00:03:40,110 --> 00:03:42,852 აქ, არსებობს გარკვეული დუბლირებას. 57 00:03:42,852 --> 00:03:45,560 არსებობს უამრავი სირთულის, რომ გამოიხატება მეტადატის 58 00:03:45,560 --> 00:03:46,300 რომ თქვენ გაქვთ. 59 00:03:46,300 --> 00:03:50,320 >> ასე რომ, ერთი ტიტული ამ წიგნში არის Alice თავგადასავალი საოცრებათა. 60 00:03:50,320 --> 00:03:53,880 ასე რომ, ეს არის ანოტირებული ვერსია, რომ წიგნში. 61 00:03:53,880 --> 00:03:56,380 მაგრამ ის ასევე მოუწოდა ანოტირებული Alice, Alice თავგადასავალი 62 00:03:56,380 --> 00:03:58,570 in Wonderland, რადგან ეს რაღაც, რომელიც 63 00:03:58,570 --> 00:04:00,430 Martin Gardner დაწერა და ანოტირებული წიგნი. 64 00:04:00,430 --> 00:04:03,369 და არსებობს უამრავი დიდი ინფორმაცია შესახებ ლოგიკა თავსატეხები და რამ 65 00:04:03,369 --> 00:04:05,410 ფარგლებში Alice, რომ თქვენ ალბათ არ იციან ამის შესახებ. 66 00:04:05,410 --> 00:04:07,000 ასე რომ თქვენ უნდა წაიკითხავს. 67 00:04:07,000 --> 00:04:11,940 >> მაგრამ თქვენ ხედავთ, არსებობს ბევრი დეტალი აქ, 68 00:04:11,940 --> 00:04:15,340 მათ შორის იდენტიფიკაცია, როდესაც ის შეიქმნა, სადაც იგი მოვიდა, 69 00:04:15,340 --> 00:04:17,420 თვალსაზრისით ჰარვარდის სისტემა, და სხვ. 70 00:04:17,420 --> 00:04:20,350 ასე რომ, ეს არის ნიმუში ტიპის მეტადატის 71 00:04:20,350 --> 00:04:24,340 რომ თქვენ შეიძლება ნახოთ წიგნი ჰარვარდის კოლექციაში. 72 00:04:24,340 --> 00:04:26,680 >> ეს არის რაღაც სრულიად განსხვავებული. 73 00:04:26,680 --> 00:04:32,610 ასე არ არის სისტემა უწოდა VIA ჰარვარდის, რომელიც ძირითადად 74 00:04:32,610 --> 00:04:39,990 არის cataloging სურათები და ობიექტების ხელოვნების და ვიზუალური რამ მთელი ჰარვარდის, 75 00:04:39,990 --> 00:04:44,010 და დასძინა, ზოგიერთი მეტადატის მათ, კლასიფიცირების მათ, 76 00:04:44,010 --> 00:04:49,200 და, ზოგიერთ შემთხვევაში, რომელიც უზრუნველყოფს პატარა მინიატურების გამოსახულება 77 00:04:49,200 --> 00:04:51,250 რომ თქვენ შეუძლია შევხედოთ, თუ ასე სურთ. 78 00:04:51,250 --> 00:04:54,240 >> ასე რომ, ეს არის მაგალითი იმისა, მეტამონაცემების რომ თქვენ გაქვთ დისკო 79 00:04:54,240 --> 00:04:57,840 საწყისი სავარაუდოდ, Alice in Wonderland. 80 00:04:57,840 --> 00:05:00,499 და თქვენ ხედავთ, არსებობს ნაკლები მეტადატის აქ. 81 00:05:00,499 --> 00:05:02,040 ეს უბრალოდ სხვადასხვა სახის ობიექტი. 82 00:05:02,040 --> 00:05:03,425 და ასე რომ ნაკლები ინფორმაცია. 83 00:05:03,425 --> 00:05:07,790 >> თქვენ ძირითადად აქვს იმ ფაქტს, რომ ზარი ნომერი, არსებითად რომელმაც შექმნა იგი, - 84 00:05:07,790 --> 00:05:10,410 >> ჩვენ არ ვიცით, როდესაც ის შეიქმნა. 85 00:05:10,410 --> 00:05:13,320 >> --and სათაური. 86 00:05:13,320 --> 00:05:14,300 >> კიდევ ერთი მაგალითი. 87 00:05:14,300 --> 00:05:16,380 ეს არის დასკვნა დახმარებას. 88 00:05:16,380 --> 00:05:19,030 ასე რომ, არსებობს კოლექცია Lewis Carroll საბუთები ჰარვარდის. 89 00:05:19,030 --> 00:05:23,601 ასე რომ, ეს აღწერს, თუ რა არის, რომ კოლექცია. 90 00:05:23,601 --> 00:05:26,100 ასე რომ ვინმე გაიარა და გადახედა ყველა ყუთები 91 00:05:26,100 --> 00:05:32,220 და კატალოგში, გარკვეული ფონზე, წერილობითი შემაჯამებელი რა არის აქ. 92 00:05:32,220 --> 00:05:35,290 და თუ თქვენ უნდა გამოიყურებოდეს შემდგომი ამ, ამ 93 00:05:35,290 --> 00:05:39,620 გრძელდება გვერდებზე და გვერდების და გვერდებზე, მაგრამ გეტყვით, 94 00:05:39,620 --> 00:05:41,860 რა წერილებს და რა თარიღდება, რაც ყუთები 95 00:05:41,860 --> 00:05:44,289 არსებობდა მთელ კოლექცია. 96 00:05:44,289 --> 00:05:46,330 მაგრამ ეს არის რაღაც რომ, თუ თქვენ ჰარვარდის, 97 00:05:46,330 --> 00:05:50,720 შეგიძლიათ და რეალურად ფიზიკურად გამოიყურება და, სავარაუდოდ, შევხედოთ. 98 00:05:50,720 --> 00:05:53,440 >> ასე რომ ეს არის დიდი. 99 00:05:53,440 --> 00:05:54,450 ამ მეტადატის ის სასარგებლო. 100 00:05:54,450 --> 00:05:56,327 ეს ჰარვარდის ბიბლიოთეკა სისტემა. 101 00:05:56,327 --> 00:05:58,910 არსებობს ონლაინ ინსტრუმენტები, სადაც თქვენ შეუძლია წავიდეს და შევხედოთ მას, 102 00:05:58,910 --> 00:05:59,993 და ვხედავ, და მას. 103 00:05:59,993 --> 00:06:02,810 და შეგიძლიათ ნაჭერი და კამათელი მას უამრავი სხვადასხვა გზა. 104 00:06:02,810 --> 00:06:06,920 >> მაგრამ ეს ნამდვილად ხელმისაწვდომია მხოლოდ თუ თქვენ ხართ ადამიანის დაჯდომა 105 00:06:06,920 --> 00:06:12,600 თქვენს ბრაუზერში ან რაღაც ან თქვენი ტელეფონი და სანავიგაციო მეშვეობით. 106 00:06:12,600 --> 00:06:16,730 ეს ნამდვილად არ არის შესაძლებელი ნებისმიერი სახის გამოყენებადი მოდის 107 00:06:16,730 --> 00:06:19,520 სხვა სისტემები და სხვა კომპიუტერების გამოყენება, 108 00:06:19,520 --> 00:06:21,500 არა სისტემები ჰარვარდის ბიბლიოთეკა, 109 00:06:21,500 --> 00:06:24,890 მაგრამ სისტემები გარე სამყაროსთან, უბრალოდ სხვა ადამიანების მიმართ. 110 00:06:24,890 --> 00:06:30,210 ასე რომ, კითხვა, როგორ შეიძლება ჩვენ რათა ის ხელმისაწვდომი კომპიუტერები 111 00:06:30,210 --> 00:06:33,560 ასე რომ ჩვენ შეგვიძლია გავაკეთოთ უფრო საინტერესო პერსონალის, ვიდრე უბრალოდ 112 00:06:33,560 --> 00:06:36,550 გვერდების იგი საკუთარ თავს? 113 00:06:36,550 --> 00:06:39,766 >> ასე რატომ გსურთ ამის გაკეთება? 114 00:06:39,766 --> 00:06:41,140 არსებობს უამრავი შესაძლებლობები. 115 00:06:41,140 --> 00:06:43,980 ერთი არის თქვენ შეიძლება ააშენოს მთლიანად სხვადასხვა გზა ათვალიერებს 116 00:06:43,980 --> 00:06:46,962 შინაარსი, რომელიც არ არის შესაძლებელი მეშვეობით ჰარვარდის ბიბლიოთეკა. 117 00:06:46,962 --> 00:06:48,670 მე შენ გაჩვენებ ერთი მოგვიანებით Stacklife, 118 00:06:48,670 --> 00:06:52,440 რომელსაც აქვს სრულიად განსხვავებული მიიღოს ეძებს ფაილი. 119 00:06:52,440 --> 00:06:54,560 >> თქვენ შეიძლება ააშენოს რეკომენდაციით სისტემა. 120 00:06:54,560 --> 00:06:57,955 ასე რომ, ჰარვარდის ბიბლიოთეკა არ არის ბიზნესი და განაცხადა, რომ თქვენ მიყვარს ეს წიგნი. 121 00:06:57,955 --> 00:07:01,080 მერე შევხედოთ ამ 17 წიგნები, რომ თქვენ შეიძლება იყოს დაინტერესებული 122 00:07:01,080 --> 00:07:03,200 ან ამ 18 images. 123 00:07:03,200 --> 00:07:06,040 მაგრამ, რა თქმა უნდა შეეძლო იყოს ღირებული ფუნქცია. 124 00:07:06,040 --> 00:07:09,272 და იმის გათვალისწინებით, მეტადატის, მას შეუძლია იყოს შესაძლებელი, რომ დააყენა ერთად. 125 00:07:09,272 --> 00:07:11,980 თქვენ შეიძლება განსხვავებული საჭიროებების პირობები ეძებს შინაარსი, 126 00:07:11,980 --> 00:07:16,200 როგორიცაა იქნებ მიუხედავად ინსტრუმენტები, რომ შესაძლებელია, რომ ბიბლიოთეკა რაც 127 00:07:16,200 --> 00:07:18,450 შესაძლებელია, დაგვჭირდება ძიება სხვაგვარად 128 00:07:18,450 --> 00:07:21,847 ან ოპტიმიზაცია კონკრეტული გამოყენების შემთხვევაში, რომელიც, შესაძლოა, ეს ძალიან სპეციალიზებული. 129 00:07:21,847 --> 00:07:23,930 იქნებ არსებობს მხოლოდ რამდენიმე ხალხი მსოფლიოში, რომელიც 130 00:07:23,930 --> 00:07:25,846 გსურთ მოძებნოთ content ამ გზით, მაგრამ ეს 131 00:07:25,846 --> 00:07:28,985 კარგი იქნება, თუ ჩვენ ვერ მისცეს მათ ამის გაკეთება. 132 00:07:28,985 --> 00:07:30,860 არსებობს უამრავი ანალიტიკა მხოლოდ როგორ ადამიანი 133 00:07:30,860 --> 00:07:33,860 გამოიყენოთ content იქნებოდა ნამდვილად საინტერესოა, დაახლოებით, გაირკვეს, 134 00:07:33,860 --> 00:07:37,280 რა წიგნები გამოიყენება, რა არა, და ასე შემდეგ. 135 00:07:37,280 --> 00:07:41,670 და შემდეგ იქ ბევრი შესაძლებლობა ინტეგრაცია 136 00:07:41,670 --> 00:07:45,210 სხვა ინფორმაცია რომ არის იქ ინტერნეტში. 137 00:07:45,210 --> 00:07:46,880 ასე რომ, ჩვენ ფლობის 138 00:07:46,880 --> 00:07:50,260 >> მაგალითად, NPR აქვს წიგნის მიმოხილვა სეგმენტი, 139 00:07:50,260 --> 00:07:53,090 სადაც ისინი გასაუბრებას ავტორები წიგნები. 140 00:07:53,090 --> 00:07:56,837 ასე რომ, ეს ძალიან კარგი იქნება თუ იყო ეძებს up წიგნი ჰარვარდის 141 00:07:56,837 --> 00:07:59,670 ბიბლიოთეკა, და თქვენ ამბობთ, ბატონო, აქ არის უკვე ინტერვიუ ავტორთან. 142 00:07:59,670 --> 00:08:00,878 მოდით წავიდეთ შევხედოთ, რომ. 143 00:08:00,878 --> 00:08:05,461 ან არსებობს ვიკიპედიის გვერდზე, როგორც ავტორიტეტული, სამეცნიერო მინიშნება 144 00:08:05,461 --> 00:08:07,710 ეს წიგნი, რომ თქვენ დაგვჭირდება შევხედოთ. 145 00:08:07,710 --> 00:08:12,600 >> არსებობს ამ ტიპის წყაროები მიმოფანტული ინტერნეტში. 146 00:08:12,600 --> 00:08:16,555 და მათი ერთად შეიძლება იყოს დიდი გამოყენება 147 00:08:16,555 --> 00:08:18,930 ვინმე ეძებს შინაარსი, ეძებს რაღაც. 148 00:08:18,930 --> 00:08:20,180 მაგრამ ასევე არ ასეთი რამ ნეტავ 149 00:08:20,180 --> 00:08:23,205 მინდა ბიბლიოთეკაში იქნება პასუხისმგებელი აპირებს ქვემოთ და ნადირობს ქვემოთ 150 00:08:23,205 --> 00:08:25,455 ყველა ამ სხვადასხვა წყაროების და ჩართვის მათ ერთად 151 00:08:25,455 --> 00:08:28,920 იმიტომ, რომ ისინი იცვლება მუდმივად. 152 00:08:28,920 --> 00:08:33,570 და, რა არის მნიშვნელოვანი may არ იყოს, რას ფიქრობთ არის მნიშვნელოვანი. 153 00:08:33,570 --> 00:08:36,929 >> და მით უფრო, ძირითადად არსებობს ბევრი რამ პერსონალის ჩვენ არ მიფიქრია არავის გაუკეთებია. 154 00:08:36,929 --> 00:08:42,222 ასე რომ, თუ ჩვენ შეგვიძლია გახსნა up, მეტი ადამიანი გარდა ნახევარი ათეული ან იმდენად, 155 00:08:42,222 --> 00:08:45,174 ვინც ეძებს ამ თემაზე რეგულარულად შეიძლება ვიფიქროთ, იდეები 156 00:08:45,174 --> 00:08:47,340 და მასაჟი მონაცემები და რა უნდათ ეს. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> ასე რომ ჩვენ გვინდა, რომ ეს მონაცემები ხელმისაწვდომი მსოფლიოში. 159 00:08:54,045 --> 00:08:55,670 ასევე, არსებობს რამდენიმე გართულებები. 160 00:08:55,670 --> 00:08:58,540 ერთი ის არის, რომ ამ მეტადატის არის სხვადასხვა სისტემები. 161 00:08:58,540 --> 00:09:01,110 ეს სხვადასხვა ფორმატებში. 162 00:09:01,110 --> 00:09:04,719 ამიტომ არსებობს გარკვეული ნორმალიზაცია რომელიც უნდა მოხდეს, 163 00:09:04,719 --> 00:09:08,010 რომელიც ნორმალიზაცია, რომ პროცესი შემოტანა რამ სხვადასხვა ფორმატებში 164 00:09:08,010 --> 00:09:12,940 და რუკების მათ ერთი ფორმატი ისე, რომ სხვა სფეროებში შეესაბამება. 165 00:09:12,940 --> 00:09:15,160 >> არსებობს გარკვეული საავტორო შეზღუდვა. 166 00:09:15,160 --> 00:09:21,010 უცნაური საკმარისი, კატალოგი შესვლის შესახებ წიგნი, პასუხისმგებელი საავტორო. 167 00:09:21,010 --> 00:09:24,060 ამიტომ, მიუხედავად იმისა, რომ ეს მხოლოდ ინფორმაცია გამომდინარე წიგნი, 168 00:09:24,060 --> 00:09:25,330 ეს copyrightable. 169 00:09:25,330 --> 00:09:28,400 და დამოკიდებულია, ვინც რეალურად შექმნა, რომელიც მეტადატის, 170 00:09:28,400 --> 00:09:32,175 შეიძლება არსებობდეს შეზღუდვები, რომლებიც შეგიძლიათ გაავრცელოთ იგი, მსგავსი მიზანია: 171 00:09:32,175 --> 00:09:33,402 >> მე არ ვიცი. 172 00:09:33,402 --> 00:09:36,110 ეს შეიძლება იყოს ან არ იყოს მსგავსი სიტუაცია სიმღერა ლექსები, 173 00:09:36,110 --> 00:09:36,610 მაგალითად. 174 00:09:36,610 --> 00:09:38,560 ასე რომ, ჩვენ ყველამ ვიცით, რა, რომ ტაფები გარეთ. 175 00:09:38,560 --> 00:09:40,450 ასე, რომ თქვენ უნდა მიიღოთ დაახლოებით რომ საკითხი. 176 00:09:40,450 --> 00:09:44,910 >> შემდეგ კი კიდევ ერთი ნაჭერი რომ არსებობს ბევრი მონაცემები. 177 00:09:44,910 --> 00:09:52,420 ასე რომ, თუ მე ვარ ადამიანი, რომელსაც სურს მუშაობა ერთად მონაცემები ან აქვს მაგარი იდეა, 178 00:09:52,420 --> 00:09:55,350 საქმე 14 მილიონი ჩანაწერების ჩემს ლეპტოპში 179 00:09:55,350 --> 00:09:57,487 შეიძლება იყოს პრობლემატური და რთული მართვა. 180 00:09:57,487 --> 00:09:59,320 ასე რომ, ჩვენ გვინდა, რომ შემცირდეს ბარიერები ადამიანი 181 00:09:59,320 --> 00:10:02,130 შეძლებს იმუშაოს მონაცემები. 182 00:10:02,130 --> 00:10:07,880 >> ასე მიდგომა, რომ იმედია მისამართები ყველა ამ შეშფოთებას, რომ ორ ნაწილად. 183 00:10:07,880 --> 00:10:11,770 აშენებს პლატფორმა, რომელიც იღებს მონაცემების ყველა ამ განსხვავებული წყაროები 184 00:10:11,770 --> 00:10:14,350 და ამძიმებს ის, ნორმალიზებას, ამდიდრებს მას და მარკა 185 00:10:14,350 --> 00:10:16,650 ეს შესაძლებელი ერთ ადგილას. 186 00:10:16,650 --> 00:10:20,950 და ეს ხდის შესაძლებელია საჯარო API, რომ ადამიანს შეუძლია მოვუწოდებთ. 187 00:10:20,950 --> 00:10:24,430 >> ასე API არის განაცხადის პროგრამირების ინტერფეისი. 188 00:10:24,430 --> 00:10:28,930 და ეს ძირითადად ეხება წერტილის, რომ სისტემის ან ტექნოლოგიის 189 00:10:28,930 --> 00:10:31,720 შეგიძლიათ დარეკოთ და მიიღეთ მონაცემები უკან სტრუქტურირებული ფორმატში ისე, 190 00:10:31,720 --> 00:10:32,900 რომ ეს შეიძლება იყოს გამოყენებული. 191 00:10:32,900 --> 00:10:36,060 ასე რომ, ეს არ არის დამოკიდებული აპირებს ნახვა 192 00:10:36,060 --> 00:10:37,970 და ცვეთის მონაცემები ეს, მაგალითად. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> ასე რომ, ეს მთავარი გვერდი ბიბლიოთეკა Cloud Item API, 195 00:10:45,010 --> 00:10:47,220 რომელიც არსებითად მისი ორი ვერსია. 196 00:10:47,220 --> 00:10:50,130 ასე რომ, ეს მეორე iteration ცდილობს, რათა ყოველივე ეს მონაცემები 197 00:10:50,130 --> 00:10:53,280 ხელმისაწვდომი მსოფლიოში. 198 00:10:53,280 --> 00:10:59,560 ასე რომ, ეს http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 და მხოლოდ დაარღვიოს ეს ქვემოთ ცოტა, რას ნიშნავს ეს 200 00:11:03,830 --> 00:11:06,115 რომ ეს არის ორი ვერსია API. 201 00:11:06,115 --> 00:11:08,490 არსებობს ერთი ვერსია, რომელიც მე არ ვაპირებ ვისაუბრო. 202 00:11:08,490 --> 00:11:09,750 მაგრამ არის ერთი ვერსია. 203 00:11:09,750 --> 00:11:14,740 >> და თუ თქვენ მოუწოდებდა ამ API, თქვენ მიღების საკითხი. 204 00:11:14,740 --> 00:11:20,640 და ნაწილი იდეა API არის API არის ხელშეკრულება. 205 00:11:20,640 --> 00:11:23,440 ის, რაც არის შეცვლას არ აპირებს. 206 00:11:23,440 --> 00:11:24,850 ასე მაგალითად, - 207 00:11:24,850 --> 00:11:27,410 >> და მიზეზი ის არის, რომ თუ მე ავაშენოთ გარკვეული სისტემა, რომელიც 208 00:11:27,410 --> 00:11:33,210 აპირებს გამოიყენოს ბიბლიოთეკა cloud API ცარიელია წიგნები და დაეხმარება ხალხს 209 00:11:33,210 --> 00:11:36,190 ინფორმაცია უნიკალური გზა, რაც ჩვენ არ გვინდა, რომ მოხდეს 210 00:11:36,190 --> 00:11:38,940 ჩვენთვის უნდა შეცვალოს, თუ როგორ რომ API მუშაობს, და მოულოდნელად 211 00:11:38,940 --> 00:11:41,340 ყველაფერი არღვევს ბოლოს მომხმარებლის მხარეს. 212 00:11:41,340 --> 00:11:46,710 ასე რომ, ნაწილი, თუ თქვენ მიღების API ხელმისაწვდომი მსოფლიოში, ეს არის ის, 213 00:11:46,710 --> 00:11:49,396 კარგი პრაქტიკა დააყენოს ვერსია ნომერი ასე ადამიანი 214 00:11:49,396 --> 00:11:51,020 იცით, რა ვერსია ისინი საქმე. 215 00:11:51,020 --> 00:11:54,300 >> ასე რომ, თუ ჩვენ გადავწყვეტთ ჩვენ უკეთესი გზა მიღების ამ ინფორმაციას, 216 00:11:54,300 --> 00:11:57,295 ჩვენ შეიძლება შეიცვალოს, რომ მოვუწოდებთ, რომ ვერსია სამი. 217 00:11:57,295 --> 00:11:59,920 ასე რომ ყველას, ვინც ჯერ კიდევ გამოყენებით ორი ვერსია, რომელიც ჯერ კიდევ მუშაობს. 218 00:11:59,920 --> 00:12:03,490 მაგრამ ვერსიას სამი გვინდა აქვს ყველა ახალი პერსონალი. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> ასე რომ, ეს არის API, მაგრამ ეს მართლაც ჰგავს URL. 221 00:12:09,210 --> 00:12:11,680 და ასე, რა არის ეს მაგალითად, თუ არის რა 222 00:12:11,680 --> 00:12:16,615 მოუწოდა დანარჩენი API, რომელიც ხელმისაწვდომია მეტი ჩვეულებრივი ვებ-კავშირი. 223 00:12:16,615 --> 00:12:19,680 და თქვენ შეგიძლიათ რეალურად წასვლა ეს ბრაუზერი. 224 00:12:19,680 --> 00:12:28,550 >> ასე რომ, აქ მე უბრალოდ გახსნეს Firefox და წავიდა api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 და მერე რა მე აქ არის ძირითადად პირველი გვერდი 226 00:12:31,560 --> 00:12:34,740 შედეგების მთელი მითითებული ელემენტი, რომელიც ჩვენ მივიღეთ. 227 00:12:34,740 --> 00:12:37,460 და ეს აქ XML ფორმატში. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 და ის, ასევე, prettified მიერ Firefox. 230 00:12:42,210 --> 00:12:45,850 ის ფაქტობრივად არ ჰქონდეს ყველა ეს პატარა გაფართოების და 231 00:12:45,850 --> 00:12:47,880 doohickeys აქ. 232 00:12:47,880 --> 00:12:52,520 ეს არის ერთგვარი გავალამაზოთ ვერსია გზა შევხედოთ მას. 233 00:12:52,520 --> 00:12:57,040 >> მაგრამ რა ეს გვეუბნებოდა ის არის, მე მოითხოვა ყველა საკითხი. 234 00:12:57,040 --> 00:13:03,120 ასე რომ, არსებობს 13.289.475 საკითხი. 235 00:13:03,120 --> 00:13:06,150 და მე ეძებს პირველი 10, დაწყებული პოზიცია ნულოვანი 236 00:13:06,150 --> 00:13:09,760 იმის გამო, რომ კომპიუტერული მეცნიერების ჩვენ ყოველთვის დაიწყება ნულოვანი. 237 00:13:09,760 --> 00:13:15,150 და რა მაქვს აქ, თუ უბრალოდ ჩამოიშლება ეს, დაინახავთ, მაქვს 10 საკითხი. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> და თუ მე შევხედოთ პუნქტის, მე არ შემიძლია , რომ მაქვს ეს ინფორმაცია. 240 00:13:25,210 --> 00:13:27,400 და ეს არის ის, რაც ე.წ. MODS ფორმა. 241 00:13:27,400 --> 00:13:30,860 და ამიტომ მე ვაპირებ გადართოთ უკან აქ ერთი წუთით. 242 00:13:30,860 --> 00:13:33,750 OK. 243 00:13:33,750 --> 00:13:37,447 >> ასე რომ, მოდით ძიება რაღაც კონკრეტული რადგან პირველი პუნქტის, რომ 244 00:13:37,447 --> 00:13:40,030 ხდება ამუშავება, როდესაც თქვენ შეხედეთ მთელი კოლექცია 245 00:13:40,030 --> 00:13:41,750 ეს არის, ზოგადად, შემთხვევითი. 246 00:13:41,750 --> 00:13:44,550 მოდით შევხედოთ ზოგიერთი donuts. 247 00:13:44,550 --> 00:13:46,830 Oh. 248 00:13:46,830 --> 00:13:49,190 >> OK. 249 00:13:49,190 --> 00:13:49,940 ასე donuts. 250 00:13:49,940 --> 00:13:55,360 ამიტომ ჩვენ აღმოვაჩინეთ არსებობს 80 ელემენტი კოლექცია, რომ მითითებას donuts. 251 00:13:55,360 --> 00:13:57,150 ჩვენ ვეძებთ პირველი 10 მათგანი. 252 00:13:57,150 --> 00:14:01,890 ახლა, თქვენ ხედავთ, აქ ისე, რომ მე ვთქვი, ვეძებ donuts, 253 00:14:01,890 --> 00:14:04,400 მე უბრალოდ დასძინა რაღაც შეკითხვის სიმებიანი URL. 254 00:14:04,400 --> 00:14:09,680 ასე q ტოლია donuts, რომელიც შეგიძლიათ იხილეთ უფრო მარტივად აქ. 255 00:14:09,680 --> 00:14:12,131 >> და ეს ნიშნავს იმას, რომ იქ სპეც API, რომელიც 256 00:14:12,131 --> 00:14:13,880 განსაზღვრავს, თუ რა ყველა ამ პარამეტრების ნიშნავს. 257 00:14:13,880 --> 00:14:17,150 და ეს იმას ნიშნავს, რომ ჩვენ ვაპირებთ ძიება ყველაფერი donuts. 258 00:14:17,150 --> 00:14:24,910 >> ასე რომ, პირველი პუნქტის, აქ ჩვენ გვაქვს თქვენ ხედავთ სათაური Donuts, 259 00:14:24,910 --> 00:14:29,310 და არსებობს subtitle მოუწოდა American Passion, რომელიც, ვფიქრობ, 260 00:14:29,310 --> 00:14:31,610 შესაბამისი. 261 00:14:31,610 --> 00:14:36,134 არსებობს ბევრი different-- 262 00:14:36,134 --> 00:14:38,050 მას შემდეგ, რაც თქვენ მიიღებთ წერტილი მიღების მონაცემები, 263 00:14:38,050 --> 00:14:41,020 არსებობს ბევრი სხვადასხვა ფორმატებს, რომ თქვენ შეგიძლიათ მიიღოთ იგი. 264 00:14:41,020 --> 00:14:44,050 და არსებობს სხვადასხვა ძლიერი და სუსტი მხარეები ყველა მათგანი. 265 00:14:44,050 --> 00:14:49,000 ასე რომ, ეს ერთი, თქვენ ხედავთ, აქ, ამ ფორმით არის ძალიან მდიდარი. 266 00:14:49,000 --> 00:14:51,946 და ეს არის სტანდარტიზებული. 267 00:14:51,946 --> 00:14:55,040 >> ასე რომ, არსებობს კონკრეტული სათაური სფეროში, subtitle სფეროში. 268 00:14:55,040 --> 00:14:58,950 არსებობს ალტერნატიული სათაური, ამერიკის Passion. 269 00:14:58,950 --> 00:15:01,650 არ არის სახელი ასოცირდება იგი. 270 00:15:01,650 --> 00:15:03,120 ტიპის რესურსი ტექსტი. 271 00:15:03,120 --> 00:15:06,070 არსებობს ბევრი ინფორმაცია აქ ამ ფორმატში. 272 00:15:06,070 --> 00:15:09,480 >> მაგრამ არსებობს რამოდენიმე სხვადასხვა ფორმატებში. 273 00:15:09,480 --> 00:15:11,920 ასე რომ, ჩვენ ვიყავით მხოლოდ შევხედავთ ფორმატში 274 00:15:11,920 --> 00:15:17,700 მოუწოდა MODS, რომელიც დგას მეტამონაცემების ობიექტის აღწერა სამსახურის, 275 00:15:17,700 --> 00:15:18,250 პოტენციურად. 276 00:15:18,250 --> 00:15:23,030 მე რეალურად არ დანამდვილებით შესახებ S. მაგრამ ეს საკმაოდ რთული ფორმატი. 277 00:15:23,030 --> 00:15:24,240 ეს default ფორმატში. 278 00:15:24,240 --> 00:15:30,260 >> მაგრამ ეს ერთი, რომ ინარჩუნებს სიმდიდრით ყველა მონაცემები 279 00:15:30,260 --> 00:15:33,820 რომ ბიბლიოთეკას აქვს, რადგან ეს ძალიან ახლოს რა 280 00:15:33,820 --> 00:15:35,110 ბიბლიოთეკის იყენებს იძულებით. 281 00:15:35,110 --> 00:15:39,030 ის სტანდარტი, რომელიც გამოიყენება მთელი ქვეყნის მასშტაბით, 282 00:15:39,030 --> 00:15:40,944 მთელს მსოფლიოში აკადემიური ბიბლიოთეკების. 283 00:15:40,944 --> 00:15:42,110 და ეს ძალიან თავსებადი. 284 00:15:42,110 --> 00:15:44,852 ასე რომ, თუ თქვენ მოხვდით დოკუმენტი რომ არის MODS ფორმატში, 285 00:15:44,852 --> 00:15:47,560 შეგიძლიათ მისცეს, რომ სხვისი რომლის სისტემები მესმის MODS, 286 00:15:47,560 --> 00:15:48,518 და მათ შეუძლიათ იმპორტი. 287 00:15:48,518 --> 00:15:50,840 ასე რომ, ეს სტანდარტი. 288 00:15:50,840 --> 00:15:54,250 ეს ძალიან კარგად განსაზღვრული, ძალიან კონკრეტული. 289 00:15:54,250 --> 00:15:58,980 და ეს არის ის, რაც ხდის თავსებადი რადგან თუ ვინმე ამბობს, 290 00:15:58,980 --> 00:16:04,930 ეს არის ალტერნატიული სათაური ჩანაწერი, ყველამ კარგად იცის, რას ნიშნავს ეს. 291 00:16:04,930 --> 00:16:07,740 Flip მხარის, ეს ძალიან რთულია. 292 00:16:07,740 --> 00:16:13,160 >> ასე რომ, თუ თქვენ შეხედეთ ამ ჩანაწერი აქ, 293 00:16:13,160 --> 00:16:15,320 თუ უბრალოდ გვინდა სათაური ამ დოკუმენტს, 294 00:16:15,320 --> 00:16:21,150 ეს წიგნი, რომელიც, სავარაუდოდ, Donuts, ამერიკელი Passion, parsing it out 295 00:16:21,150 --> 00:16:22,940 არის პატარა ჩართული. 296 00:16:22,940 --> 00:16:27,380 ვინაიდან არსებობს კიდევ ერთი ფორმატი მოუწოდა Dublin Core, 297 00:16:27,380 --> 00:16:29,730 რომელიც ბევრად, ბევრად უფრო მარტივია ფორმატში. 298 00:16:29,730 --> 00:16:33,764 >> და ასე რომ თქვენ აქ, არ არსებობს სათაური, subtitle, ალტერნატიული სათაური. 299 00:16:33,764 --> 00:16:35,930 არსებობს მხოლოდ სათაური, Donuts, ამერიკის Passion, 300 00:16:35,930 --> 00:16:38,780 და კიდევ ერთი ტიტული, ამერიკის Passion. 301 00:16:38,780 --> 00:16:42,907 ასე რომ, როდესაც თქვენ ეძებს რა ფორმით გსურთ მიიღოთ მონაცემები გარეთ, 302 00:16:42,907 --> 00:16:44,740 ბევრი რამ არის დამოკიდებული, თუ როგორ თქვენ აპირებს გამოიყენოს იგი. 303 00:16:44,740 --> 00:16:46,573 თქვენ გამოყენებით თავსებადობის ან თქვენ 304 00:16:46,573 --> 00:16:49,970 მინდა რაღაც მარტივი, რომ შეიძლება იყოს უფრო ადვილია მუშაობა? 305 00:16:49,970 --> 00:16:56,002 >> Flip მხარის, ბევრი დეტალები მისაღებად სახის squished ქვემოთ. 306 00:16:56,002 --> 00:16:58,460 თქვენ შეიძლება დაკარგოს ნიუანსი რა კონკრეტულ სფეროში საშუალებით 307 00:16:58,460 --> 00:17:02,960 თუ თქვენ საქმე Dublin Core, რომელიც თქვენ არ მიიღოს MODS. 308 00:17:02,960 --> 00:17:06,462 ეს არის ის ორი ფორმატში შეგიძლიათ გავიდნენ API. 309 00:17:06,462 --> 00:17:08,920 და, ძირითადად, ვტოვებთ ის კულუარებში MODS. 310 00:17:08,920 --> 00:17:14,179 მაგრამ ჩვენ შეგვიძლია მოგცეთ ის MODS და Dublin Core და არაფერი, ისევე. 311 00:17:14,179 --> 00:17:16,470 სხვა გათვალისწინებით, როდესაც თქვენ ეძებთ მონაცემები 312 00:17:16,470 --> 00:17:21,210 არის, რომ თქვენ შეგიძლიათ მიიღოთ ეს როგორც ან JSON, რომელიც დგას JavaScript Object ნოტაცია, 313 00:17:21,210 --> 00:17:24,720 ან XML, რომელიც დგას გააფართოვოთ მარკირებას ენა. 314 00:17:24,720 --> 00:17:30,080 და ეს მონაცემები წარმომადგენლობების ორივე ზუსტად იგივე მონაცემები, ზუსტად 315 00:17:30,080 --> 00:17:31,080 იგივე სფეროებში. 316 00:17:31,080 --> 00:17:33,644 მაგრამ ისინი მხოლოდ სინტაქსურად სხვადასხვა. 317 00:17:33,644 --> 00:17:40,401 >> ასე რომ, ეს a-- 318 00:17:40,401 --> 00:17:41,400 კარგად, მოდით უბრალოდ გადავიდეს. 319 00:17:41,400 --> 00:17:47,490 ასე რომ, ეს არის ჩვენი მოთხოვნა donuts XML ფორმატში. 320 00:17:47,490 --> 00:17:53,470 თუ უბრალოდ გადახვიდეთ ეს უნდა იყოს JSON, მე ვხედავ, რომ გამოიყურება სხვადასხვა. 321 00:17:53,470 --> 00:17:58,580 ასე რომ ეს არის იგივე შინაარსი, მაგრამ განსხვავებული სტრუქტურა. 322 00:17:58,580 --> 00:18:00,080 არსებობს ნაკლები კუთხური ფრჩხილები. 323 00:18:00,080 --> 00:18:02,530 იქ ნაკლები verbose. 324 00:18:02,530 --> 00:18:06,440 >> და ეს არის ფორმატი, რომელიც, თუ მუშაობს ვებ გარემო, 325 00:18:06,440 --> 00:18:09,680 თქვენ სავარაუდოდ აპირებს გინდათ გამოიყენოთ იმიტომ, რომ ერთი 326 00:18:09,680 --> 00:18:12,630 ლამაზი რამ შესახებ JSON არის ეს თავსებადი JavaScript. 327 00:18:12,630 --> 00:18:17,680 ასე რომ, თუ მე წერა web app, შემიძლია დახევის JSON და მხოლოდ მუშაობა პირდაპირ. 328 00:18:17,680 --> 00:18:20,187 ხოლო XML, ის ცოტა უფრო რთული. 329 00:18:20,187 --> 00:18:21,520 ასე რომ კიდევ ერთხელ, ეს ორივე სასარგებლოა. 330 00:18:21,520 --> 00:18:26,387 ისინი უბრალოდ სხვადასხვა გამოყენების შემთხვევაში სადაც ხალხი დაგვჭირდება მათი გამოყენება. 331 00:18:26,387 --> 00:18:26,886 OK. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 ასე რომ თავში API. 334 00:18:31,680 --> 00:18:32,900 ამიტომ ჩვენ შეგვიძლია ვეძებოთ for-- 335 00:18:32,900 --> 00:18:36,220 >> მე მისცეს მაგალითი ეძებს donuts. 336 00:18:36,220 --> 00:18:39,330 ჩვენ ასევე შეგიძლიათ მოძებნოთ მხოლოდ კონკრეტულ სფეროში ფარგლებში აქ. 337 00:18:39,330 --> 00:18:41,310 ასე ნაცვლად ძებნას მთელი ჩანაწერი, 338 00:18:41,310 --> 00:18:43,870 შემიძლია უბრალოდ მოძებნოთ სათაურის ველში. 339 00:18:43,870 --> 00:18:48,810 და ახლა არის 25 რამ, რომ აქვს donuts სათაური, რომელთაგან ერთი 340 00:18:48,810 --> 00:18:52,430 არის აღდგენის შესახებ ჭარბტენიანი მართვა 341 00:18:52,430 --> 00:18:54,990 ხვრელი donut პროგრამა, რომელიც, სავარაუდოდ, 342 00:18:54,990 --> 00:18:58,970 არ არის აუცილებელი, რასაც ჩვენ ვეძებთ მაშინ, როდესაც ჩვენ ეძებს donuts. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> ასევე, შეგიძლიათ, როდესაც თქვენ საქმე API-- 345 00:19:05,490 --> 00:19:08,827 >> ნაწილი, რომელსაც API იძლევა ადამიანებს დიდი მონაცემები კომპლექტი. 346 00:19:08,827 --> 00:19:11,410 და არსებობს რამდენიმე სხვადასხვა ინსტრუმენტები შეგიძლიათ გამოიყენოთ, რომ. 347 00:19:11,410 --> 00:19:14,170 ერთი, ძალიან უბრალოდ, თქვენ შეგიძლიათ გვერდი მეშვეობით მონაცემები. 348 00:19:14,170 --> 00:19:17,340 ასე რომ, როგორც რომ, თუ query ვებ ინტერფეისი, 349 00:19:17,340 --> 00:19:19,470 თქვენ შეგიძლიათ შეხედოთ გვერდზე ერთი, ორი, გვერდზე სამი. 350 00:19:19,470 --> 00:19:22,040 შეგიძლიათ გააკეთოთ იგივე რამ მეშვეობით API. 351 00:19:22,040 --> 00:19:24,150 თქვენ უბრალოდ უნდა იყოს აშკარა თუ როგორ გავაკეთოთ ეს. 352 00:19:24,150 --> 00:19:29,511 >> ასე მაგალითად, თუ მე ვეძებ ჩემი პირველი შეკითხვა აქ, 353 00:19:29,511 --> 00:19:32,510 სადაც მე ვაკეთებ ძიება ნივთები ერთად donuts სათაური, შემიძლია ვთქვა, 354 00:19:32,510 --> 00:19:35,415 და ლიმიტი შეადგენს 20, რაც იმას ნიშნავს, მომეცი პირველი 20 ჩანაწერი, რომელიც არ 355 00:19:35,415 --> 00:19:38,540 პირველი 10, რომელიც ჩვეულებრივ, იმიტომ, რომ მე მინდა შევხედოთ 20 დროს. 356 00:19:38,540 --> 00:19:43,435 ან შემიძლია ვთქვა, რომ მითითებული დაიწყოს ტოლია 20 და ლიმიტი 357 00:19:43,435 --> 00:19:47,150 გაუტოლდება 20, რომელიც მისცემს me შეაქვს 21 გზით 40. 358 00:19:47,150 --> 00:19:52,680 >> ამიტომ ვფიქრობ, რამ წართმევას აქ 359 00:19:52,680 --> 00:19:57,290 რომ ჩვენ გამოყენებით შეკითხვის strings მითითებული პარამეტრების შეკითხვის. 360 00:19:57,290 --> 00:20:02,760 და გაძლევთ კონტროლი რაც თქვენ დავუბრუნდეთ. 361 00:20:02,760 --> 00:20:05,980 >> ერთი ინსტრუმენტი, რომელიც შეგიძლიათ გამოიყენოთ, - 362 00:20:05,980 --> 00:20:09,250 >> და ეს მართლაც სასარგებლო პირობები შეისწავლოს მონაცემები. 363 00:20:09,250 --> 00:20:10,840 >> --is რაღაც მოუწოდა Faceting. 364 00:20:10,840 --> 00:20:15,530 ამიტომ ტერმინი Faceting არის არ არის აუცილებელი, საერთო. 365 00:20:15,530 --> 00:20:16,880 მაგრამ თქვენ ყველა მინახავს ეს ადრე. 366 00:20:16,880 --> 00:20:18,630 თუ თქვენ შეხედეთ Amazon, მაგალითად, 367 00:20:18,630 --> 00:20:20,870 და თქვენ ნუ ძიება donuts წიგნები, 368 00:20:20,870 --> 00:20:27,080 აქ მათ მოხვდით სერია წიგნებისა, და ისინი დაჯგუფებულია კატეგორიის მიხედვით, 369 00:20:27,080 --> 00:20:30,470 და თქვენ მიიღებთ სხვადასხვა კატეგორიები, და რამდენი წიგნების თითოეულ კატეგორიაში 370 00:20:30,470 --> 00:20:31,330 გამოჩნდება. 371 00:20:31,330 --> 00:20:33,420 >> ასე რომ, ეს არის ძირითადად საქმის. 372 00:20:33,420 --> 00:20:37,570 თქვენ მიიღოს ყველა მათი წიგნები, 1800 წიგნები, რომლებიც შეესაბამება donuts Amazon. 373 00:20:37,570 --> 00:20:39,820 12 მათგანი საუზმე კატეგორიაში. 374 00:20:39,820 --> 00:20:43,100 21 საკონდიტრო და საცხობი, და ასე შემდეგ და ასე შემდეგ. 375 00:20:43,100 --> 00:20:47,670 >> ასე რომ, ეს მართლაც სასარგებლო ინსტრუმენტი შესასწავლად content 376 00:20:47,670 --> 00:20:53,260 ბიბლიოთეკაში ასევე რადგან, როდესაც თქვენ შეხედეთ საქმის, 377 00:20:53,260 --> 00:20:56,520 ეს გაძლევთ იდეა რა სუბიექტების არსებობს, როგორიცაა, თუ რა სახის საგნების 378 00:20:56,520 --> 00:20:58,510 ყველაზე პოპულარული ფარგლებში თქვენს შეკითხვაზე კომპლექტი. 379 00:20:58,510 --> 00:21:00,950 და ეს გეხმარებათ off და შეისწავლონ. 380 00:21:00,950 --> 00:21:02,770 ასე რომ ჩვენ შეგვიძლია გავაკეთოთ იგივე. 381 00:21:02,770 --> 00:21:05,940 >> თუ გვინდა, რომ გამოიყენოთ API და შევხედოთ facets, 382 00:21:05,940 --> 00:21:08,950 დავუმატებთ კიდევ პარამეტრი ჩვენი მეგობარი შეკითხვის სიმებიანი. 383 00:21:08,950 --> 00:21:12,540 ასე facets ტოლია მძიმეებით ჩამონათვალი იმისა, რასაც ჩვენ გვინდა, რომ საქმის შესახებ. 384 00:21:12,540 --> 00:21:14,790 ასე რომ, ერთი facets შესაძლოა დაექვემდებაროს. 385 00:21:14,790 --> 00:21:16,565 სხვა შეიძლება იყოს ენაზე. 386 00:21:16,565 --> 00:21:19,665 ასე რომ, თუ ჩვენ აწარმოებს, რომ შეკითხვაზე, ჩვენ get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 ეს გამოიყურება საკმაოდ ბევრი იგივე აქ. 389 00:21:24,830 --> 00:21:29,010 მაგრამ ჩვენ დასძინა ბოლომდე სიაში კომპლექტი facets. 390 00:21:29,010 --> 00:21:34,060 ამიტომ ჩვენ გვაქვს საქმის მოუწოდა თემაზე. 391 00:21:34,060 --> 00:21:40,250 ასე რომ, ეს გვეუბნება, რომ თუ გავითვალისწინებთ ჩემი 80 შედეგები donut შეკითხვაზე, 392 00:21:40,250 --> 00:21:42,100 13 მათგანს აქვს აგზავნიდნენ შეერთებული შტატები. 393 00:21:42,100 --> 00:21:43,684 სამი აქვს საგანი donuts. 394 00:21:43,684 --> 00:21:45,600 სამი აქვს სათაური ჭარბტენიანი რესტავრაცია, 395 00:21:45,600 --> 00:21:47,720 რომლებიც შეიძლება ჩვენი ხვრელი Donut. 396 00:21:47,720 --> 00:21:51,780 ორი მათგანი, Simpsons, და ასე შემდეგ და ასე შემდეგ. 397 00:21:51,780 --> 00:21:59,211 >> ასე რომ, ეს შეიძლება იყოს სასარგებლო, თუ თქვენ მინდა ვიწრო ქვემოთ თქვენი ძებნა. 398 00:21:59,211 --> 00:22:00,210 ეს დაგეხმარებათ, რომ. 399 00:22:00,210 --> 00:22:03,580 განსაკუთრებით თუ თქვენ გაქვთ მეტი, ვიდრე, ვთქვათ, 80 შედეგები. 400 00:22:03,580 --> 00:22:05,980 >> ანალოგიურად, ჩვენ ასევე სთხოვა for facets ენაზე. 401 00:22:05,980 --> 00:22:14,790 ასე რომ, თუ დავაკვირდებით ჩვენი შედეგები, ჩვენ ვხედავთ 76 მათგანი ინგლისურ, ოთხი ფრანგული, 402 00:22:14,790 --> 00:22:19,620 ორი ესპანურად, ორი, მე ვფიქრობ, რომ undefined ან უცნობი, ჰოლანდიური და ლათინური. 403 00:22:19,620 --> 00:22:22,830 ამიტომ ვფიქრობ, ლათინური donut შედეგი, კიდევ ერთხელ, 404 00:22:22,830 --> 00:22:24,922 აქვს არაფერ შუაშია ცომეული. 405 00:22:24,922 --> 00:22:25,630 მაგრამ იქ წასვლა. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> ასე რომ, ეს არის ერთგვარი გვიჩვენებს, თუ როგორ შეგიძლიათ გაიყვანოს content უკან 408 00:22:38,630 --> 00:22:41,270 საწყისი API უბრალოდ მეშვეობით ვებ-ბრაუზერის მეშვეობით, რაც საკმაოდ დიდი. 409 00:22:41,270 --> 00:22:44,320 მაგრამ ეს არ არის ნამდვილად, რასაც თქვენ აკეთებთ როგორც წესი, გამოყენებით API იგი. 410 00:22:44,320 --> 00:22:48,710 ასე რომ, ერთი მაგალითია, თუ როგორ ვერ რეალურად ამის გაკეთება არის მე 411 00:22:48,710 --> 00:22:54,720 დაწერილი სუპერ პატარა პროგრამა, რომელიც, კიდევ ერთხელ, ჯერ ჩემი donut ძიების 412 00:22:54,720 --> 00:22:59,010 და ირჩევს რამდენიმე სფეროებში და აჩვენებს მათ მაგიდასთან. 413 00:22:59,010 --> 00:23:01,610 ასე რომ, ეს არის ძალიან იგივე შინაარსის, რომ ჩვენ უბრალოდ 414 00:23:01,610 --> 00:23:04,830 დაინახა რამდენიმე სფეროებში გაყვანილია. 415 00:23:04,830 --> 00:23:12,090 ასე სიაში ტიტული, განთავსების რა წიგნი 416 00:23:12,090 --> 00:23:15,120 დაახლოებით, ენა, და ასე შემდეგ და ასე შემდეგ. 417 00:23:15,120 --> 00:23:20,480 >> ასე როგორ ეს რეალურად მოხდა, რადგან ვფიქრობ, ჩვენ უნდა შევხედოთ ზოგიერთი კოდი, 418 00:23:20,480 --> 00:23:22,420 is-- 419 00:23:22,420 --> 00:23:28,060 >> რა გვაქვს აქ არის მარტივი HTML გვერდი, რომელიც აჩვენებს ტექსტი, 420 00:23:28,060 --> 00:23:32,900 მივესალმებით ბიბლიოთეკა ღრუბელი და შემდეგ აჩვენებს მაგიდასთან შედეგი. 421 00:23:32,900 --> 00:23:37,790 და არსებობს აშკარად არ შედეგები მაგიდა, როდესაც გვერდზე იღებს დატვირთული. 422 00:23:37,790 --> 00:23:41,380 მაგრამ, რას ვაკეთებთ ეს არის, პირველ რიგში, 423 00:23:41,380 --> 00:23:46,290 ნაძარცვი ბიბლიოთეკა მოუწოდა jQuery, რომელიც ძირითადად 424 00:23:46,290 --> 00:23:52,030 JavaScript ბიბლიოთეკა, რაც მანიპულირება ძალიან ადვილია JavaScript 425 00:23:52,030 --> 00:23:58,780 natively, HTML, და შექმნა ვებ გვერდები, კლიენტის მხარის ლოგიკა და ვებ გვერდებზე. 426 00:23:58,780 --> 00:24:01,595 >> ასე რომ, რა გვაქვს აქ არის jQuery აქვს მეთოდი ეწოდება მისაღებად, 427 00:24:01,595 --> 00:24:05,270 რომელიც არსებითად წავა URL, რომელიც, ამ შემთხვევაში, 428 00:24:05,270 --> 00:24:09,070 ეს არის ნაცნობი ეძებს URL. 429 00:24:09,070 --> 00:24:14,440 და მერე კიდევ შინაარსის რომ URL და შემდეგ აწარმოებს ფუნქციის იგი. 430 00:24:14,440 --> 00:24:19,240 ჩვენ ვთქვით წასვლა api.lib.harvard / edu. 431 00:24:19,240 --> 00:24:20,060 ძიება donuts. 432 00:24:20,060 --> 00:24:21,300 მოგვცეს 20 ჩანაწერი. 433 00:24:21,300 --> 00:24:28,590 და შემდეგ აწარმოებს ამ ფუნქციას, რაც მე შერჩეული გავლით ეს მონაცემები. 434 00:24:28,590 --> 00:24:34,430 და მონაცემები არის JSON, რომ მიიღო დაბრუნდა API. 435 00:24:34,430 --> 00:24:40,120 >> და მაშინ ჩვენ ვამბობთ, ფარგლებში, რომ მონაცემები არსებობს სფეროში მოუწოდა ერთეულზე. 436 00:24:40,120 --> 00:24:48,117 და თუ მე წავიდეთ მიიღოს ვიხსენებთ ერთ-ერთი ასეთი შედეგი, რომ აქ, 437 00:24:48,117 --> 00:24:49,200 არსებობს რაღაც called-- 438 00:24:49,200 --> 00:24:50,220 >> ასევე, ეს ე.წ. ერთეულზე. 439 00:24:50,220 --> 00:24:53,520 ასე რომ, შეიძლება ითქვას, რომ. 440 00:24:53,520 --> 00:25:01,840 და რა არ არის ეს გადის თითოეულ პუნქტს 441 00:25:01,840 --> 00:25:05,300 და შემდეგ მოუწოდებს სხვა ფუნქცია თითოეულ ერთეულზე. 442 00:25:05,300 --> 00:25:08,440 და რომ ფუნქცია ძირითადად მიმდინარეობს ღირებულება 443 00:25:08,440 --> 00:25:12,010 ნივთი, რომელიც არსებითად ინდივიდუალური რეკორდი 444 00:25:12,010 --> 00:25:18,220 და საშუალებას გვაძლევს გაიყვანოს სათაური, დაფარვის და ენა. 445 00:25:18,220 --> 00:25:21,640 >> ასე რომ, ჩვენ მოვუწოდებთ ფუნქცია ყველა ნივთი, რომელიც ჩვენ მივიღეთ უკან API. 446 00:25:21,640 --> 00:25:25,397 და თუ უბრალოდ შეხედეთ ამ piece უფლება აქ, 447 00:25:25,397 --> 00:25:27,230 ის, რასაც ჩვენ ვაკეთებთ ჩვენ შექმნის სიმებიანი, 448 00:25:27,230 --> 00:25:31,810 რომელიც არსებითად ზოგიერთი HTML markup მაგიდის გარშემო, რომელზეც value.title, 449 00:25:31,810 --> 00:25:35,790 რაც სათაურში ობიექტი, value.coverage, 450 00:25:35,790 --> 00:25:36,790 რომელიც გაშუქება, - 451 00:25:36,790 --> 00:25:38,225 >> და ვაკეთებთ გამშვები აქ ვინც გაურკვეველი 452 00:25:38,225 --> 00:25:40,570 და იმალებოდა, თუ იგი ამბობს undefined, იმიტომ, რომ ჩვენ არ აინტერესებს 453 00:25:40,570 --> 00:25:41,600 რომ. 454 00:25:41,600 --> 00:25:42,939 >> --and მაშინ ენაზე. 455 00:25:42,939 --> 00:25:44,730 და მაშინ რა ჩვენ აკეთებს მიერთება, რომ 456 00:25:44,730 --> 00:25:48,510 to მაგიდა, რომელიც მდებარეობს გამოვლენილი ეს სიმებიანი აქ. 457 00:25:48,510 --> 00:25:50,790 და როგორ jQuery მუშაობს არის რა ამ ამბობს 458 00:25:50,790 --> 00:25:56,420 არის ვეძებოთ მაგიდასთან იდეა შედეგები და დაამატოთ ეს ტექსტი მას. 459 00:25:56,420 --> 00:25:59,380 და ეს არის მაგიდა იდეა შედეგები. 460 00:25:59,380 --> 00:26:04,998 ასე რომ თქვენ დასრულდება მდე ერთად არის ამ გვერდზე აქ. 461 00:26:04,998 --> 00:26:06,206 და იმისათვის, რომ ნახოთ source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 ასევე, წყარო არ არის რეალურად განახლება, როდესაც მოხდა. 464 00:26:13,810 --> 00:26:18,740 ასე რომ თქვენ ხედავთ ფაქტობრივი შედეგები მაგიდასთან აქ თუმცა. 465 00:26:18,740 --> 00:26:24,770 >> ასე რომ, მხოლოდ მარტივი მაგალითია, აკეთებს ძალიან ძირითადი შეკითხვის წინააღმდეგ API 466 00:26:24,770 --> 00:26:29,020 და ჩვენებისას ინფორმაცია ზოგიერთ სხვა ფორმა, და არ აკეთებს არაფერს ძალიან ლამაზი. 467 00:26:29,020 --> 00:26:36,370 ახლა, კიდევ ერთი მაგალითია, როგორიცაა განაცხადის დაწერილი დავით Weinberger 468 00:26:36,370 --> 00:26:39,120 როგორც დემო ამ, რომელიც არსებითად გიჩვენებთ 469 00:26:39,120 --> 00:26:44,620 როგორ შეგიძლიათ ბადაგი up შედეგები თქვენ მიღების ბიბლიოთეკის cloud API 470 00:26:44,620 --> 00:26:46,250 ერთად, ვთქვათ, Google წიგნები. 471 00:26:46,250 --> 00:26:52,225 >> და ფიქრი ისაა, რომ მე არ შემიძლია აწარმოებს შეკითხვა წინააღმდეგ Google Books, 472 00:26:52,225 --> 00:26:56,060 მიიღოს სრული ტექსტი ძიება, ზოგიერთი შედეგები უკან, გაირკვეს, რომელიც იმ საქონელს, 473 00:26:56,060 --> 00:27:01,180 რეალურად არსებობს Hollis, ბიბლიოთეკის სისტემა, 474 00:27:01,180 --> 00:27:03,200 და მაშინ მაძლევს ბმულები უკან იმ საკითხი. 475 00:27:03,200 --> 00:27:12,730 ასე რომ, თუ მე მოძებნოთ, ეს იყო ბნელი და მშფოთვარე ღამე, მე 476 00:27:12,730 --> 00:27:16,210 დავუბრუნდეთ bunch of შედეგები Google, და შემდეგ ერთ-ერთი შედეგი 477 00:27:16,210 --> 00:27:19,460 რაც ნაოჭების დრო. 478 00:27:19,460 --> 00:27:29,330 და ეს კავშირები წიგნი, რომელიც არსებობს ფარგლებში ჰარვარდის ბიბლიოთეკა სისტემა. 479 00:27:29,330 --> 00:27:32,160 >> ამიტომ ვფიქრობ, საქმე ისაა, რომ არ იმდენად, რომ ეს შეიძლება იყოს ან არ 480 00:27:32,160 --> 00:27:34,118 იყოს ისე, რომ გსურთ ძებნის ბიბლიოთეკის, 481 00:27:34,118 --> 00:27:38,310 მაგრამ ეს არის სრულიად განსხვავებული ისე, რომ არ იყო ხელმისაწვდომი თქვენ 482 00:27:38,310 --> 00:27:42,884 ადრე, როგორც თქვენ მას სხვა გზა არ აკეთებს სრული ტექსტი ძიება შესახებ წიგნი, რომელიც კი 483 00:27:42,884 --> 00:27:44,550 ნაწილი იყო ჰარვარდის ბიბლიოთეკა სისტემა. 484 00:27:44,550 --> 00:27:46,870 ასე რომ ეს არის გზა რომელიც შეგიძლიათ გააკეთოთ, რომ. 485 00:27:46,870 --> 00:27:51,930 და შეგიძლიათ არიან მათ ნებისმიერი ფორმატის გსურთ. 486 00:27:51,930 --> 00:27:55,990 ასე რომ, აქ ისაა, რომ, ძირითადად, ჩვენ გახსნას ახალი გზები ხალხს 487 00:27:55,990 --> 00:27:59,080 მუშაობა მონაცემები. 488 00:27:59,080 --> 00:28:07,925 >> კიდევ ერთი ნაჭერი ბიბლიოთეკა cloud ის არის, რომ ის ეხმარება გამოამჟღავნონ ზოგიერთი გამოყენების მონაცემები 489 00:28:07,925 --> 00:28:08,800 რომ ბიბლიოთეკას აქვს. 490 00:28:08,800 --> 00:28:12,630 ასე რომ, თუ წასვლა ბიბლიოთეკა, და თქვენ ეძებს წიგნები, 491 00:28:12,630 --> 00:28:15,770 თქვენ არ არის აუცილებელი რეალურად აქვს იდეა, 492 00:28:15,770 --> 00:28:19,080 ყველა ელემენტი კერძოდ სათაური, რა 493 00:28:19,080 --> 00:28:21,200 არიან ადამიანები, საზოგადოებას, თუ არა ის 494 00:28:21,200 --> 00:28:24,890 განისაზღვრება, როგორც ჰარვარდის ან ქვეყანაში ან თქვენი კლასი, 495 00:28:24,890 --> 00:28:26,421 რა აღმოაჩინეს მათ ყველაზე სასარგებლო? 496 00:28:26,421 --> 00:28:28,920 და ბიბლიოთეკა რეალურად აქვს ტონა ინფორმაციას, თუ რა 497 00:28:28,920 --> 00:28:32,999 ყველაზე სასარგებლო, რადგან თუ ბევრი ხალხი შემოწმების წიგნი, 498 00:28:32,999 --> 00:28:34,040 წერია რაღაც. 499 00:28:34,040 --> 00:28:36,498 იქ უნდა ყოფილიყო რატომღაც მათ სურთ შეამოწმეთ იგი out. 500 00:28:36,498 --> 00:28:38,270 ბევრი ადამიანი დააყენა ის რეზერვი. 501 00:28:38,270 --> 00:28:42,520 >> თუ ის სარეზერვო სიაში ბევრი კლასების, რომელიც გიჩვენებთ რაღაც. 502 00:28:42,520 --> 00:28:45,960 თუ ფაკულტეტის წევრები შემოწმების გარეთ ბევრი და სტუდენტებს არ არიან, 503 00:28:45,960 --> 00:28:47,200 რომ მეუბნება რაღაც. 504 00:28:47,200 --> 00:28:49,280 პირიქით, რომ ასევე გიჩვენებთ რაღაც. 505 00:28:49,280 --> 00:28:54,680 ასე რომ, ეს იქნება მართლაც საინტერესოა ეს ინფორმაცია არსებობს და მიადევნე 506 00:28:54,680 --> 00:28:59,969 ხალხი გამოვიყენოთ, რათა დაეხმაროს მათ სამუშაოების ფარგლებში ბიბლიოთეკის სისტემაში. 507 00:28:59,969 --> 00:29:02,260 Flip მხარე, ეს არის არსებობს რამდენიმე სერიოზული კონფიდენციალურობის 508 00:29:02,260 --> 00:29:07,854 შეშფოთება იმის გამო, ერთ-ერთი ძირითადი პრინციპები ბიბლიოთეკაში 509 00:29:07,854 --> 00:29:10,770 არის ჩვენ არ ვაპირებთ ეთქვათ ადამიანი რა ადამიანი კითხულობს. 510 00:29:10,770 --> 00:29:17,360 და მაშინაც კი, თუ ვამბობ, რომ ეს შეამოწმეს ოთხჯერ 511 00:29:17,360 --> 00:29:20,070 ამ კონკრეტულ თვეში, რომელიც შეიძლება იქნას გამოყენებული 512 00:29:20,070 --> 00:29:25,252 ბმულის კონკრეტული პირის მიერ de-anonymizing მონაცემები 513 00:29:25,252 --> 00:29:26,710 და მოძიებაში, რომლებიც შევამოწმე ის. 514 00:29:26,710 --> 00:29:30,792 ასე რომ, ისე, რომ ჩვენ შეგვიძლია avoid-- 515 00:29:30,792 --> 00:29:33,750 ისე, რომ ჩვენ შეგვიძლია ცდილობენ ამონაწერი ზოგიერთი სიგნალი ყველა ინფორმაცია 516 00:29:33,750 --> 00:29:36,740 დარღვევის გარეშე არავის კონფიდენციალურობის შეშფოთება 517 00:29:36,740 --> 00:29:42,150 არსებითად დავაკვირდებით 10 წლის გამოყენების მონაცემები, - 518 00:29:42,150 --> 00:29:43,930 >> ასე რომ, ეს მეტი ხანგრძლივი დროის განმავლობაში. 519 00:29:43,930 --> 00:29:50,639 >> --and იტყვით, ვნახოთ, როგორ ბევრჯერ ეს ნამუშევარი იქნა გამოყენებული, 520 00:29:50,639 --> 00:29:52,930 და რომელიც ამ პერიოდში დრო და მაშინ ძირითადად 521 00:29:52,930 --> 00:29:56,300 მისცეს უკან ნომერი, რომელიც ჩვენ მოვუწოდებთ დასტის ანგარიში, რომელიც, ძირითადად, 522 00:29:56,300 --> 00:29:59,910 წარმოადგენს, თუ რამდენად იქნა გამოყენებული. 523 00:29:59,910 --> 00:30:01,084 და რომ რიცხვი 524 00:30:01,084 --> 00:30:03,250 ბევრი სხვადასხვა გათვლებით წასვლას, რომ ნომერი. 525 00:30:03,250 --> 00:30:05,150 --but ეს არის ძალიან უხეში მეტრულ რომელიც გაძლევთ 526 00:30:05,150 --> 00:30:11,300 ზოგიერთი იდეა თუ როგორ საზოგადოების შეიძლება ვაფასებთ, რომ მუშაობა. 527 00:30:11,300 --> 00:30:16,772 >> და ასე სხვა სახის კი უფრო დააკონკრეტეს განცხადება 528 00:30:16,772 --> 00:30:18,480 რომელიც იღებს უპირატესობა ეს არის რაღაც 529 00:30:18,480 --> 00:30:24,000 მოუწოდა Stacklife, რომელიც რეალურად შესაძლებელია main ჰარვარდის 530 00:30:24,000 --> 00:30:24,880 ბიბლიოთეკა ვერსია. 531 00:30:24,880 --> 00:30:26,700 ასე რომ თქვენ წასვლა library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 დაინახავთ რაოდენობის სხვადასხვა გზები ეძებს ბიბლიოთეკაში. 533 00:30:29,360 --> 00:30:32,300 ერთ-ერთი მათგანი ეწოდება Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> და ეს არის პროგრამა, რომელიც browses შინაარსი ბიბლიოთეკა, 535 00:30:38,980 --> 00:30:43,490 მაგრამ მთლიანად აგებულია თავზე ამ APIs. 536 00:30:43,490 --> 00:30:46,910 ასე რომ არ არსებობს სპეციალური პერსონალი მიმდინარეობს კულუარებში. 537 00:30:46,910 --> 00:30:49,570 არ არსებობს დაშვება მონაცემები, რომ თქვენ არ აქვს. 538 00:30:49,570 --> 00:30:54,090 ის გამოყენებით APIs მოგაწოდოთ სრულიად განსხვავებული ათვალიერებს 539 00:30:54,090 --> 00:30:55,480 გამოცდილება. 540 00:30:55,480 --> 00:30:58,570 >> ასე რომ, თუ მე მოძებნოთ Alice in Wonderland ამ შემთხვევაში, 541 00:30:58,570 --> 00:31:02,600 მივიღებ შედეგი, რომელიც ჰგავს ეს, რომელიც საკმაოდ ბევრი 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> ეს ძალიან ჰგავს ნებისმიერი სხვა საძიებო თქვენ შეიძლება გავაკეთოთ, გარდა ამ შემთხვევაში 544 00:31:10,870 --> 00:31:15,730 ჩვენ რეიტინგში ნივთები stackscore, რომელიც გაძლევთ 545 00:31:15,730 --> 00:31:19,850 ზოგიერთი იდეა რამდენად პოპულარულია ეს ელემენტი იყო საზოგადოებაში. 546 00:31:19,850 --> 00:31:25,610 და ისე ნათლად, Alice in Wonderland by Walt Disney ძალიან პოპულარულია. 547 00:31:25,610 --> 00:31:36,570 მაგრამ ასევე, შეგიძლიათ ნახოთ ოთხეულში აქ არის ის, რომ თქვენ შეიძლება არ რეალურად 548 00:31:36,570 --> 00:31:39,220 >> რამ, რაც უაღრესად გამოიყენება, მაგრამ თქვენ არ შეუძლია დაუყოვნებლივ 549 00:31:39,220 --> 00:31:41,240 დაკავშირება Alice in Wonderland. 550 00:31:41,240 --> 00:31:44,650 ასე რომ, ჩვენი ძველი მეგობარი ანოტირებული Alice აქ. 551 00:31:44,650 --> 00:31:46,350 ასე, რომ შეიძლება შევხედოთ მას. 552 00:31:46,350 --> 00:31:52,010 და ახლა, რაც მე ვეძებ at ძირითადად მითითებული of-- 553 00:31:52,010 --> 00:31:53,760 მე შემიძლია ანოტირებული Alice უფლება აქ. 554 00:31:53,760 --> 00:31:56,700 მე მაქვს ინფორმაცია. 555 00:31:56,700 --> 00:32:00,230 და ასევე მაქვს stackscore , ამ შემთხვევაში, 26. 556 00:32:00,230 --> 00:32:03,169 და ეს მეუბნება სახის უხეშად როგორ მივიღეთ ეს stackscore, 557 00:32:03,169 --> 00:32:05,835 როგორიცაა, ვინც შეამოწმა ის, როგორ ბევრი ჯერ ეს იყო გაწერილი, 558 00:32:05,835 --> 00:32:08,440 როგორიცაა ფაკულტეტის ან სტუდენტებს, როგორ ბევრი ასლები ბიბლიოთეკას აქვს, 559 00:32:08,440 --> 00:32:11,300 და ასე შემდეგ და ასე შემდეგ. 560 00:32:11,300 --> 00:32:16,460 >> და ასევე შეგიძლიათ, საინტერესო საკმარისი აქ, დაათვალიეროთ stacks პრაქტიკულად. 561 00:32:16,460 --> 00:32:19,550 ასე მონაცემები აქ, ამ გვიჩვენებს, სახის 562 00:32:19,550 --> 00:32:23,547 ვირტუალური წარმომადგენლობა რა შელფზე might 563 00:32:23,547 --> 00:32:25,880 ჰგავს თუ იყო მიიღოს ყველა ბიბლიოთეკის დაკავებები 564 00:32:25,880 --> 00:32:28,940 და ამით მათ ერთად ერთი უსასრულო თაროზე. 565 00:32:28,940 --> 00:32:30,990 და ლამაზი რამ არის, რომ ჩვენ can-- 566 00:32:30,990 --> 00:32:33,380 >> პირველ რიგში, მეტადატის შესახებ, რომ ეს წიგნები 567 00:32:33,380 --> 00:32:35,627 ხშირად გიჩვენებთ, როდესაც იგი გამოიცა. 568 00:32:35,627 --> 00:32:37,085 ის გიჩვენებთ რამდენი გვერდებზე აქვს. 569 00:32:37,085 --> 00:32:38,459 ეს შეიძლება გითხრათ ზომები. 570 00:32:38,459 --> 00:32:42,930 ასე რომ თქვენ ხედავთ, რომ ეს აისახება აქ თვალსაზრისით ზომა წიგნები. 571 00:32:42,930 --> 00:32:46,740 >> და მაშინ ჩვენ შეგვიძლია გამოვიყენოთ დასტის ანგარიშით ხაზი გავუსვა 572 00:32:46,740 --> 00:32:49,170 წიგნები, რომ უმაღლესი დასტის ქულით. 573 00:32:49,170 --> 00:32:54,930 ასე რომ, თუ ეს მუქი, ეს იმას ნიშნავს, რომ, სავარაუდოდ, იგი გამოიყენება უფრო ხშირად. 574 00:32:54,930 --> 00:32:57,040 ასე რომ, ამ შემთხვევაში, მე აპირებს ვხვდები, რომ ეს 575 00:32:57,040 --> 00:33:03,226 არის ვერსია Alice in Wonderland რომ არის ძალიან ხშირად გამოიყენება და ყველაზე 576 00:33:03,226 --> 00:33:05,100 ხელმისაწვდომი, ბიბლიოთეკა აქვს ყველაზე ასლები. 577 00:33:05,100 --> 00:33:06,975 ასე რომ, თუ თქვენ ვეძებთ for Alice in Wonderland, 578 00:33:06,975 --> 00:33:10,220 ეს შეიძლება იყოს კარგი ადგილია დაიწყება. 579 00:33:10,220 --> 00:33:13,500 >> და შემდეგ აქ თქვენ ასევე შეგიძლიათ ლინკი out , ვთქვათ, Amazon შეძენა წიგნი, 580 00:33:13,500 --> 00:33:15,182 და ასე შემდეგ და ასე შემდეგ. 581 00:33:15,182 --> 00:33:17,140 საქმე იმაშია, კიდევ ერთხელ, არ არის იმდენად, რომ ეს 582 00:33:17,140 --> 00:33:25,030 არის საუკეთესო გზა რათა დაათვალიეროთ ბიბლიოთეკაში ან უფლება ინსტრუმენტი, ყოველ შემთხვევაში. 583 00:33:25,030 --> 00:33:28,400 მაგრამ ეს არის კიდევ ერთი გზა ამის გაკეთება. 584 00:33:28,400 --> 00:33:31,359 და მიღების მონაცემები ხელმისაწვდომია მეშვეობით API, რომელიც 585 00:33:31,359 --> 00:33:34,650 მზადდება ძალიან მარტივი შენობა ბლოკები, რომელიც საშუალებას გაძლევთ მოძებნოთ შინაარსი, 586 00:33:34,650 --> 00:33:39,420 შეგიძლიათ აშენება რაღაც ასე რომ შეგიძლიათ 587 00:33:39,420 --> 00:33:41,520 არაჩვეულებრივად ძვირფასი რამდენიმე ადამიანი. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> ასე რომ, ერთგვარი, ისევე, როგორც მე მინდა, ვთქვა, ნამდვილად იმაზე, თუ რა API არის 590 00:33:51,860 --> 00:33:56,070 და რა კარგად ჩანს, არსებობს მთელი bunch პერსონალის კულისებში, რომელიც 591 00:33:56,070 --> 00:33:59,480 მე უბრალოდ აპირებს შევეხო მოკლედ მხოლოდ იმიტომ, რომ ეს ერთგვარი მოდის ეს 592 00:33:59,480 --> 00:34:03,720 სრულიად განსხვავებული კუთხე თვალსაზრისით, თუ როგორ აკეთებს რაღაც მოსწონს ეს 593 00:34:03,720 --> 00:34:04,580 მისაღებად შევიდა ადგილი? 594 00:34:04,580 --> 00:34:10,820 >> ასე API სტანდარტული ინტერფეისის ყველა ამ შინაარსის. 595 00:34:10,820 --> 00:34:13,820 მაგრამ მას იქ, პირველი, რაც უნდა გაგვეკეთებინა 596 00:34:13,820 --> 00:34:17,260 იყო გაიყვანოს ერთად ინფორმაცია წიგნები და სურათები 597 00:34:17,260 --> 00:34:21,580 და მოძიებაში დამხმარე, კოლექცია დოკუმენტის სხვადასხვა ჰარვარდის სისტემები. 598 00:34:21,580 --> 00:34:23,929 Aleph, VIA, და OASIS არიან სახელები სისტემები. 599 00:34:23,929 --> 00:34:28,820 და ისინი არსებითად წასვლას მილსადენის, გადამამუშავებელი მილსადენი. 600 00:34:28,820 --> 00:34:33,230 >> ასე რომ, პირველ რიგში, ჩვენ კიდევ ექსპორტი ფაილები ყველა ამ სისტემების. 601 00:34:33,230 --> 00:34:35,130 ჩვენ გაყოფილი მათ ინდივიდუალური საკითხი. 602 00:34:35,130 --> 00:34:39,360 ამიტომ ჩვენ გვაქვს ფაილი, რომელიც არის Gigabyte, რომელსაც აქვს მილიონი ჩანაწერი იგი. 603 00:34:39,360 --> 00:34:42,290 ასე რომ, ჩვენ გაყოფილი ეს დაყოფილია ინდივიდუალური საკითხი. 604 00:34:42,290 --> 00:34:45,374 მაშინ, თითოეული პუნქტის, ჩვენ გარდაქმნას იგი შევიდა MODS, რადგან ამ 605 00:34:45,374 --> 00:34:47,040 არის natively MODS, ზოგიერთი მათგანი არ არის. 606 00:34:47,040 --> 00:34:49,204 ასე რომ, ჩვენ მათ ყველა იყოს იმავე ფორმატში. 607 00:34:49,204 --> 00:34:51,120 მაშინ არსებობს სხვადასხვა გამდიდრების ნაბიჯები, სადაც 608 00:34:51,120 --> 00:34:55,969 ჩვენ დაამატოთ მეტი ინფორმაცია მონაცემებით ვიდრე იყო შესაძლებელი ბიბლიოთეკაში. 609 00:34:55,969 --> 00:34:59,750 ასე რომ, ჩვენ უნდა დაამატოთ, პირველ რიგში, ჩვენ გვაქვს რა ბიბლიოთეკები გამართავს იგი. 610 00:34:59,750 --> 00:35:02,250 ჩვენ გავლა ნაბიჯი გაანგარიშების stackscore. 611 00:35:02,250 --> 00:35:07,112 ჩვენ გაიაროს ერთი ნაბიჯია და დასძინა, უფრო მეტადატის თვალსაზრისით 612 00:35:07,112 --> 00:35:10,730 რა კოლექციების ადამიანი შესაძლოა დაემატოს გაკეთება 613 00:35:10,730 --> 00:35:12,532 >> ადამიანი შექმნა კოლექციები საკითხი. 614 00:35:12,532 --> 00:35:13,990 რა კოლექციების საკუთრებაა? 615 00:35:13,990 --> 00:35:17,220 როგორ არ ადამიანი tagged ამ შინაარსის წარსულში? 616 00:35:17,220 --> 00:35:20,750 მაშინ გავფილტროთ და შეზღუდოს ჩანაწერების რადგან, როგორც აღვნიშნე, 617 00:35:20,750 --> 00:35:24,120 არსებობს რამდენიმე ჩანაწერი, რომელიც, იმის გამო, საავტორო მიზეზების გამო, ჩვენ არ შეგვიძლია არიან. 618 00:35:24,120 --> 00:35:26,700 და მაშინ ჩვენ მათ ჩატვირთვაზე შევიდა რაღაც მოუწოდა 619 00:35:26,700 --> 00:35:31,680 Solr, რომელიც არ არის misspelling, მაგრამ არის სახელი ნაჭერი პროგრამული უზრუნველყოფა 620 00:35:31,680 --> 00:35:35,710 რომ არ ძებნის ინდექსირებას, რომელიც მართავს ყველა ძიების უკან API. 621 00:35:35,710 --> 00:35:40,110 და მაშინ იგი ხელმისაწვდომი გახდება API, და ხალხს შეუძლია გამოიყენოს იგი. 622 00:35:40,110 --> 00:35:44,640 >> ასე რომ, ეს, საკმაოდ პირდაპირი პროცესი. 623 00:35:44,640 --> 00:35:47,230 ერთ-ერთი საინტერესო რამ შესახებ ეს არის 624 00:35:47,230 --> 00:35:50,990 რომ ჩვენ საქმე 13 მილიონი ჩანაწერი 625 00:35:50,990 --> 00:35:53,820 და ჩვენ ვაპირებთ, რომ იყოს საქმე ან მეტი. 626 00:35:53,820 --> 00:36:01,260 და გვინდა, რომ შეძლებს გაუმკლავდეს ეს შედარებით სწრაფი მოდის. 627 00:36:01,260 --> 00:36:03,630 ის ხანგრძლივი დრო გადაამუშავებს 13 მილიონი ჩანაწერი. 628 00:36:03,630 --> 00:36:09,529 >> ასე როგორ მილსადენის შეიქმნა, რომ თქვენ can-- 629 00:36:09,529 --> 00:36:12,070 ვფიქრობ, უპირატესობა მილსადენის, პრობლემა, რომ ჩვენ 630 00:36:12,070 --> 00:36:15,580 ცდილობს გადაწყვიტოს აქ ის არის, რომ ყველა ტრანსფორმატორები, ყველა 631 00:36:15,580 --> 00:36:18,729 ეს ნაბიჯები ამ მილსადენის განცალკევება. 632 00:36:18,729 --> 00:36:19,645 არ არსებობს დამოკიდებულებას. 633 00:36:19,645 --> 00:36:22,146 თუ თქვენ დამუშავება ჩანაწერი ერთი წიგნი, 634 00:36:22,146 --> 00:36:24,270 არ არსებობს დამოკიდებულების ზრდა რომ შორის კიდევ ერთი წიგნი. 635 00:36:24,270 --> 00:36:27,760 >> რა შეგვიძლია გავაკეთოთ არის ძირითადად, ყოველ ნაბიჯზე მილსადენი, 636 00:36:27,760 --> 00:36:30,470 ჩვენ დააყენა იგი მდგომ ღრუბელი. 637 00:36:30,470 --> 00:36:32,250 I მოხდა, რომ Amazon ვებ სერვისები. 638 00:36:32,250 --> 00:36:35,140 ასე რომ, არსებობს სია, ამბობენ, 10,000 ელემენტი, რომ 639 00:36:35,140 --> 00:36:38,100 უნდა იყოს ნორმალიზება და გადაყვანილია MODS ფორმატში. 640 00:36:38,100 --> 00:36:41,620 და ჩვენ დაიძაბება up როგორც ბევრი სერვერები როგორც ჩვენ გვინდა, იქნებ 10 სერვერები. 641 00:36:41,620 --> 00:36:44,860 და თითოეული იმ სერვერები მხოლოდ ზის იქ, გამოიყურება რომ მდგომ, 642 00:36:44,860 --> 00:36:46,730 დაინახა, რომ ერთი, რომელიც საჭიროებს დამუშავდება, გაიყვანს ეს off მდგომ, 643 00:36:46,730 --> 00:36:48,740 ამუშავებს მას, და ჯოხები ის მომდევნო რიგში. 644 00:36:48,740 --> 00:36:54,200 >> და მერე რა, რომ საშუალებას გვაძლევს ამისათვის არის გამოიყენოს, არსებითად, 645 00:36:54,200 --> 00:36:58,110 იმდენი ტექნიკის, როგორც ჩვენ გვინდა, რომ ეს პრობლემა ძალიან მოკლე დროში 646 00:36:58,110 --> 00:37:02,970 მონაცემების დამუშავებისა როგორც სწრაფად, როგორც შესაძლებელია, რომელიც არის ის, რომ მხოლოდ, 647 00:37:02,970 --> 00:37:08,220 ახლა მსოფლიოში cloud computing ჩვენ შეგვიძლია უზრუნველყოფა სერვერები არსებითად 648 00:37:08,220 --> 00:37:09,890 მომენტალურად, ის არის, რომ სასარგებლოა. 649 00:37:09,890 --> 00:37:12,260 ამიტომ ჩვენ არ უნდა ჰქონდეს giant სერვერზე სხდომაზე გარშემო 650 00:37:12,260 --> 00:37:16,700 ყველა დრო, რომ გავაკეთოთ დამუშავება რაც შეიძლება მოხდეს მხოლოდ კვირაში ერთხელ. 651 00:37:16,700 --> 00:37:21,440 >> ასე რომ, ძირითადად იგი. 652 00:37:21,440 --> 00:37:27,590 არსებობს დოკუმენტაცია ხელმისაწვდომია ბიბლიოთეკის Cloud Item API 653 00:37:27,590 --> 00:37:31,960 ამ URL, რომელიც ხელმისაწვდომი იქნება მოგვიანებით. 654 00:37:31,960 --> 00:37:36,730 და გთხოვთ, რომ შევხედოთ ეს უნდა ნახოთ, თუ არსებობს რამე, 655 00:37:36,730 --> 00:37:37,579 გაქვთ რაიმე იდეები. 656 00:37:37,579 --> 00:37:38,120 ითამაშოთ მასთან ერთად. 657 00:37:38,120 --> 00:37:38,830 სულელი გარშემო. 658 00:37:38,830 --> 00:37:42,800 და იმედია შეგიძლიათ მოდის რაღაც დიდი. 659 00:37:42,800 --> 00:37:44,740 მადლობა. 660 00:37:44,740 --> 00:37:45,899