JEFFREY LICHT: Hi არსებობს. მე Jeffrey სინათლის. და მე აქ გაიგო თქვენ შესახებ ჰარვარდის ბიბლიოთეკა და სამშენებლო ხვალ ბიბლიოთეკაში გაიმართა, ვფიქრობ. ისე ფონზე აქ, მოედანზე ამ სხდომაზე არსებითად, რომ არ არსებობს ბევრი ბიბლიოგრაფიული მონაცემები ხელმისაწვდომია ჰარვარდის ბიბლიოთეკები. და არ არსებობს საშუალება, მეშვეობით ზოგიერთი ინსტრუმენტები და პროექტი, რომელიც მიმდინარეობს განვითარებული, რათა მიიღოთ დაშვება ინფორმაცია და მას ადგილებში, რომ ჰარვარდის ბიბლიოთეკა არ აკეთებს ახლა, გავაკეთოთ ახალი პერსონალი მას, ექსპერიმენტი და ითამაშოს გარშემო. ამიტომ შესვლის წერტილი შევიდა ეს არის API მოუწოდა ჰარვარდის ბიბლიოთეკა Cloud, რომელიც ღია მეტადატის სერვერზე, რომელიც მე ლაპარაკი ახლა. ისე ფონზე არის ის, რომ არ არის ბევრი პერსონალი ჰარვარდის ბიბლიოთეკაში. ჩვენ გვაქვს 13 მილიონი ბიბლიოგრაფიული ჩანაწერების მილიონობით სურათები, და ათასობით მოძიებაში დამხმარე, რომელიც ძირითადად ამსახველი დოკუმენტები კრებული, რომ ის, რასაც მათ შორის, ყუთები ნაშრომების და ა.შ., რომელიც წარმოადგენს მეტი მილიონი ინდივიდუალური დოკუმენტები. და იქ ასევე უამრავი ინფორმაცია, რომ ბიბლიოთეკას აქვს იმაზე, თუ როგორ შინაარსი გამოიყენება, რომ შეიძლება იყოს საინტერესო ადამიანი რომელიც გსურთ მუშაობა მას. 

ასე რომ ყველა ინფორმაცია ბიბლიოთეკას აქვს მეტადატის. ასე მეტამონაცემები მონაცემების შესახებ მონაცემები. ასე რომ, როდესაც ჩვენ ვსაუბრობთ ინფორმაცია, რომ შესაძლებელია ბიბლიოთეკა ღრუბელი, რომელიც არის შესაძლებელი, ეს არ არის აუცილებელი ფაქტობრივი დოკუმენტები თავს, არ არის აუცილებელი, სრული ტექსტის წიგნები და სრული სურათებით, მიუხედავად იმისა, რომ რეალურად შეიძლება იყოს საქმე. მაგრამ ეს ნამდვილად ინფორმაცია მონაცემების შესახებ. 

ასე რომ თქვენ შეგიძლიათ ვფიქრობ cataloging ინფორმაცია, ზარის ნომრები, სუბიექტების, რამდენი ასლები წიგნი არსებობს, რა არიან გამოცემები, რა არის ფორმატებში, ავტორები, და სხვ. ასე რომ, არსებობს უამრავი ინფორმაცია ინფორმაციის შეგროვების, რომ თავისთავად, არის ერთგვარი არსებითად სასარგებლო. და მიუხედავად იმისა, რომ, თუ თქვენ აკეთებს სიღრმისეული კვლევა, თქვენ აშკარად გვინდა ფაქტობრივი შინაარსი თავად და შევხედოთ მონაცემებით, მეტამონაცემების არის სასარგებლო თვალსაზრისით ორივე ანალიზის corpus, როგორც მთელი, როგორიცაა რა რამ კოლექცია. როგორ ისინი ეხება? ეს ეხმარება თქვენ ნამდვილად სხვა პერსონალი, რომელიც მართლაც მთავარი მიზანი იყო. წერტილი მეტადატის და კატალოგი რათა დაგეხმაროთ თქვენ იპოვით ყველა ინფორმაცია, რომ ხელმისაწვდომია ფარგლებში კოლექციებში. 

ასე რომ, ეს არის მაგალითი იმისა, მეტადატის წიგნი ჰარვარდის ბიბლიოთეკა. ასე რომ, ეს არ არსებობს. და თქვენ ხედავთ, რომ ეს რეალურად ზომიერად კომპლექსური. და ღირებულების ნაწილი მეტადატის ფარგლებში ჰარვარდის ბიბლიოთეკა სისტემა ის არის, რომ ეს იყო ერთგვარი of აშენებულ catalogers და აწყობილი ადამიანები, რომლებიც მოდიან ბევრი გამოცდილება და უნარი და ეგონა, რომ ეს დროთა განმავლობაში, რომელსაც აქვს ბევრი მნიშვნელობა. 

ასე რომ, თუ თქვენ შეხედეთ ამ რეკორდი ანოტირებული Alice, შეგიძლიათ გასარკვევად, თქვენ მოხვდით სათაური, ვინც ეს დაწერა, ავტორი, და ყველა სხვადასხვა საგნების რომელიც ხალხს კატალოგში შევიდა. და თქვენ ხედავთ, არსებობს ასევე, გარდა იმისა, რომ ბევრი კარგი ინფორმაცია აქ, არსებობს გარკვეული დუბლირებას. არსებობს უამრავი სირთულის, რომ გამოიხატება მეტადატის რომ თქვენ გაქვთ. 

ასე რომ, ერთი ტიტული ამ წიგნში არის Alice თავგადასავალი საოცრებათა. ასე რომ, ეს არის ანოტირებული ვერსია, რომ წიგნში. მაგრამ ის ასევე მოუწოდა ანოტირებული Alice, Alice თავგადასავალი in Wonderland, რადგან ეს რაღაც, რომელიც Martin Gardner დაწერა და ანოტირებული წიგნი. და არსებობს უამრავი დიდი ინფორმაცია შესახებ ლოგიკა თავსატეხები და რამ ფარგლებში Alice, რომ თქვენ ალბათ არ იციან ამის შესახებ. ასე რომ თქვენ უნდა წაიკითხავს. 

მაგრამ თქვენ ხედავთ, არსებობს ბევრი დეტალი აქ, მათ შორის იდენტიფიკაცია, როდესაც ის შეიქმნა, სადაც იგი მოვიდა, თვალსაზრისით ჰარვარდის სისტემა, და სხვ. ასე რომ, ეს არის ნიმუში ტიპის მეტადატის რომ თქვენ შეიძლება ნახოთ წიგნი ჰარვარდის კოლექციაში. 

ეს არის რაღაც სრულიად განსხვავებული. ასე არ არის სისტემა უწოდა VIA ჰარვარდის, რომელიც ძირითადად არის cataloging სურათები და ობიექტების ხელოვნების და ვიზუალური რამ მთელი ჰარვარდის, და დასძინა, ზოგიერთი მეტადატის მათ, კლასიფიცირების მათ, და, ზოგიერთ შემთხვევაში, რომელიც უზრუნველყოფს პატარა მინიატურების გამოსახულება რომ თქვენ შეუძლია შევხედოთ, თუ ასე სურთ. 

ასე რომ, ეს არის მაგალითი იმისა, მეტამონაცემების რომ თქვენ გაქვთ დისკო საწყისი სავარაუდოდ, Alice in Wonderland. და თქვენ ხედავთ, არსებობს ნაკლები მეტადატის აქ. ეს უბრალოდ სხვადასხვა სახის ობიექტი. და ასე რომ ნაკლები ინფორმაცია. 

თქვენ ძირითადად აქვს იმ ფაქტს, რომ ზარი ნომერი, არსებითად რომელმაც შექმნა იგი, - 

ჩვენ არ ვიცით, როდესაც ის შეიქმნა. 

--and სათაური. 

კიდევ ერთი მაგალითი. ეს არის დასკვნა დახმარებას. ასე რომ, არსებობს კოლექცია Lewis Carroll საბუთები ჰარვარდის. ასე რომ, ეს აღწერს, თუ რა არის, რომ კოლექცია. ასე რომ ვინმე გაიარა და გადახედა ყველა ყუთები და კატალოგში, გარკვეული ფონზე, წერილობითი შემაჯამებელი რა არის აქ. და თუ თქვენ უნდა გამოიყურებოდეს შემდგომი ამ, ამ გრძელდება გვერდებზე და გვერდების და გვერდებზე, მაგრამ გეტყვით, რა წერილებს და რა თარიღდება, რაც ყუთები არსებობდა მთელ კოლექცია. მაგრამ ეს არის რაღაც რომ, თუ თქვენ ჰარვარდის, შეგიძლიათ და რეალურად ფიზიკურად გამოიყურება და, სავარაუდოდ, შევხედოთ. 

ასე რომ ეს არის დიდი. ამ მეტადატის ის სასარგებლო. ეს ჰარვარდის ბიბლიოთეკა სისტემა. არსებობს ონლაინ ინსტრუმენტები, სადაც თქვენ შეუძლია წავიდეს და შევხედოთ მას, და ვხედავ, და მას. და შეგიძლიათ ნაჭერი და კამათელი მას უამრავი სხვადასხვა გზა. 

მაგრამ ეს ნამდვილად ხელმისაწვდომია მხოლოდ თუ თქვენ ხართ ადამიანის დაჯდომა თქვენს ბრაუზერში ან რაღაც ან თქვენი ტელეფონი და სანავიგაციო მეშვეობით. ეს ნამდვილად არ არის შესაძლებელი ნებისმიერი სახის გამოყენებადი მოდის სხვა სისტემები და სხვა კომპიუტერების გამოყენება, არა სისტემები ჰარვარდის ბიბლიოთეკა, მაგრამ სისტემები გარე სამყაროსთან, უბრალოდ სხვა ადამიანების მიმართ. ასე რომ, კითხვა, როგორ შეიძლება ჩვენ რათა ის ხელმისაწვდომი კომპიუტერები ასე რომ ჩვენ შეგვიძლია გავაკეთოთ უფრო საინტერესო პერსონალის, ვიდრე უბრალოდ გვერდების იგი საკუთარ თავს? 

ასე რატომ გსურთ ამის გაკეთება? არსებობს უამრავი შესაძლებლობები. ერთი არის თქვენ შეიძლება ააშენოს მთლიანად სხვადასხვა გზა ათვალიერებს შინაარსი, რომელიც არ არის შესაძლებელი მეშვეობით ჰარვარდის ბიბლიოთეკა. მე შენ გაჩვენებ ერთი მოგვიანებით Stacklife, რომელსაც აქვს სრულიად განსხვავებული მიიღოს ეძებს ფაილი. 

თქვენ შეიძლება ააშენოს რეკომენდაციით სისტემა. ასე რომ, ჰარვარდის ბიბლიოთეკა არ არის ბიზნესი და განაცხადა, რომ თქვენ მიყვარს ეს წიგნი. მერე შევხედოთ ამ 17 წიგნები, რომ თქვენ შეიძლება იყოს დაინტერესებული ან ამ 18 images. მაგრამ, რა თქმა უნდა შეეძლო იყოს ღირებული ფუნქცია. და იმის გათვალისწინებით, მეტადატის, მას შეუძლია იყოს შესაძლებელი, რომ დააყენა ერთად. თქვენ შეიძლება განსხვავებული საჭიროებების პირობები ეძებს შინაარსი, როგორიცაა იქნებ მიუხედავად ინსტრუმენტები, რომ შესაძლებელია, რომ ბიბლიოთეკა რაც შესაძლებელია, დაგვჭირდება ძიება სხვაგვარად ან ოპტიმიზაცია კონკრეტული გამოყენების შემთხვევაში, რომელიც, შესაძლოა, ეს ძალიან სპეციალიზებული. იქნებ არსებობს მხოლოდ რამდენიმე ხალხი მსოფლიოში, რომელიც გსურთ მოძებნოთ content ამ გზით, მაგრამ ეს კარგი იქნება, თუ ჩვენ ვერ მისცეს მათ ამის გაკეთება. არსებობს უამრავი ანალიტიკა მხოლოდ როგორ ადამიანი გამოიყენოთ content იქნებოდა ნამდვილად საინტერესოა, დაახლოებით, გაირკვეს, რა წიგნები გამოიყენება, რა არა, და ასე შემდეგ. და შემდეგ იქ ბევრი შესაძლებლობა ინტეგრაცია სხვა ინფორმაცია რომ არის იქ ინტერნეტში. ასე რომ, ჩვენ ფლობის 

მაგალითად, NPR აქვს წიგნის მიმოხილვა სეგმენტი, სადაც ისინი გასაუბრებას ავტორები წიგნები. ასე რომ, ეს ძალიან კარგი იქნება თუ იყო ეძებს up წიგნი ჰარვარდის ბიბლიოთეკა, და თქვენ ამბობთ, ბატონო, აქ არის უკვე ინტერვიუ ავტორთან. მოდით წავიდეთ შევხედოთ, რომ. ან არსებობს ვიკიპედიის გვერდზე, როგორც ავტორიტეტული, სამეცნიერო მინიშნება ეს წიგნი, რომ თქვენ დაგვჭირდება შევხედოთ. 

არსებობს ამ ტიპის წყაროები მიმოფანტული ინტერნეტში. და მათი ერთად შეიძლება იყოს დიდი გამოყენება ვინმე ეძებს შინაარსი, ეძებს რაღაც. მაგრამ ასევე არ ასეთი რამ ნეტავ მინდა ბიბლიოთეკაში იქნება პასუხისმგებელი აპირებს ქვემოთ და ნადირობს ქვემოთ ყველა ამ სხვადასხვა წყაროების და ჩართვის მათ ერთად იმიტომ, რომ ისინი იცვლება მუდმივად. და, რა არის მნიშვნელოვანი may არ იყოს, რას ფიქრობთ არის მნიშვნელოვანი. 

და მით უფრო, ძირითადად არსებობს ბევრი რამ პერსონალის ჩვენ არ მიფიქრია არავის გაუკეთებია. ასე რომ, თუ ჩვენ შეგვიძლია გახსნა up, მეტი ადამიანი გარდა ნახევარი ათეული ან იმდენად, ვინც ეძებს ამ თემაზე რეგულარულად შეიძლება ვიფიქროთ, იდეები და მასაჟი მონაცემები და რა უნდათ ეს. 

ასე რომ ჩვენ გვინდა, რომ ეს მონაცემები ხელმისაწვდომი მსოფლიოში. ასევე, არსებობს რამდენიმე გართულებები. ერთი ის არის, რომ ამ მეტადატის არის სხვადასხვა სისტემები. ეს სხვადასხვა ფორმატებში. ამიტომ არსებობს გარკვეული ნორმალიზაცია რომელიც უნდა მოხდეს, რომელიც ნორმალიზაცია, რომ პროცესი შემოტანა რამ სხვადასხვა ფორმატებში და რუკების მათ ერთი ფორმატი ისე, რომ სხვა სფეროებში შეესაბამება. 

არსებობს გარკვეული საავტორო შეზღუდვა. უცნაური საკმარისი, კატალოგი შესვლის შესახებ წიგნი, პასუხისმგებელი საავტორო. ამიტომ, მიუხედავად იმისა, რომ ეს მხოლოდ ინფორმაცია გამომდინარე წიგნი, ეს copyrightable. და დამოკიდებულია, ვინც რეალურად შექმნა, რომელიც მეტადატის, შეიძლება არსებობდეს შეზღუდვები, რომლებიც შეგიძლიათ გაავრცელოთ იგი, მსგავსი მიზანია: 

მე არ ვიცი. ეს შეიძლება იყოს ან არ იყოს მსგავსი სიტუაცია სიმღერა ლექსები, მაგალითად. ასე რომ, ჩვენ ყველამ ვიცით, რა, რომ ტაფები გარეთ. ასე, რომ თქვენ უნდა მიიღოთ დაახლოებით რომ საკითხი. 

შემდეგ კი კიდევ ერთი ნაჭერი რომ არსებობს ბევრი მონაცემები. ასე რომ, თუ მე ვარ ადამიანი, რომელსაც სურს მუშაობა ერთად მონაცემები ან აქვს მაგარი იდეა, საქმე 14 მილიონი ჩანაწერების ჩემს ლეპტოპში შეიძლება იყოს პრობლემატური და რთული მართვა. ასე რომ, ჩვენ გვინდა, რომ შემცირდეს ბარიერები ადამიანი შეძლებს იმუშაოს მონაცემები. 

ასე მიდგომა, რომ იმედია მისამართები ყველა ამ შეშფოთებას, რომ ორ ნაწილად. აშენებს პლატფორმა, რომელიც იღებს მონაცემების ყველა ამ განსხვავებული წყაროები და ამძიმებს ის, ნორმალიზებას, ამდიდრებს მას და მარკა ეს შესაძლებელი ერთ ადგილას. და ეს ხდის შესაძლებელია საჯარო API, რომ ადამიანს შეუძლია მოვუწოდებთ. 

ასე API არის განაცხადის პროგრამირების ინტერფეისი. და ეს ძირითადად ეხება წერტილის, რომ სისტემის ან ტექნოლოგიის შეგიძლიათ დარეკოთ და მიიღეთ მონაცემები უკან სტრუქტურირებული ფორმატში ისე, რომ ეს შეიძლება იყოს გამოყენებული. ასე რომ, ეს არ არის დამოკიდებული აპირებს ნახვა და ცვეთის მონაცემები ეს, მაგალითად. 

ასე რომ, ეს მთავარი გვერდი ბიბლიოთეკა Cloud Item API, რომელიც არსებითად მისი ორი ვერსია. ასე რომ, ეს მეორე iteration ცდილობს, რათა ყოველივე ეს მონაცემები ხელმისაწვდომი მსოფლიოში. ასე რომ, ეს http://api.lib.harvard.edu/v2/items. და მხოლოდ დაარღვიოს ეს ქვემოთ ცოტა, რას ნიშნავს ეს რომ ეს არის ორი ვერსია API. არსებობს ერთი ვერსია, რომელიც მე არ ვაპირებ ვისაუბრო. მაგრამ არის ერთი ვერსია. 

და თუ თქვენ მოუწოდებდა ამ API, თქვენ მიღების საკითხი. და ნაწილი იდეა API არის API არის ხელშეკრულება. ის, რაც არის შეცვლას არ აპირებს. ასე მაგალითად, - 

და მიზეზი ის არის, რომ თუ მე ავაშენოთ გარკვეული სისტემა, რომელიც აპირებს გამოიყენოს ბიბლიოთეკა cloud API ცარიელია წიგნები და დაეხმარება ხალხს ინფორმაცია უნიკალური გზა, რაც ჩვენ არ გვინდა, რომ მოხდეს ჩვენთვის უნდა შეცვალოს, თუ როგორ რომ API მუშაობს, და მოულოდნელად ყველაფერი არღვევს ბოლოს მომხმარებლის მხარეს. ასე რომ, ნაწილი, თუ თქვენ მიღების API ხელმისაწვდომი მსოფლიოში, ეს არის ის, კარგი პრაქტიკა დააყენოს ვერსია ნომერი ასე ადამიანი იცით, რა ვერსია ისინი საქმე. 

ასე რომ, თუ ჩვენ გადავწყვეტთ ჩვენ უკეთესი გზა მიღების ამ ინფორმაციას, ჩვენ შეიძლება შეიცვალოს, რომ მოვუწოდებთ, რომ ვერსია სამი. ასე რომ ყველას, ვინც ჯერ კიდევ გამოყენებით ორი ვერსია, რომელიც ჯერ კიდევ მუშაობს. მაგრამ ვერსიას სამი გვინდა აქვს ყველა ახალი პერსონალი. 

ასე რომ, ეს არის API, მაგრამ ეს მართლაც ჰგავს URL. და ასე, რა არის ეს მაგალითად, თუ არის რა მოუწოდა დანარჩენი API, რომელიც ხელმისაწვდომია მეტი ჩვეულებრივი ვებ-კავშირი. და თქვენ შეგიძლიათ რეალურად წასვლა ეს ბრაუზერი. 

ასე რომ, აქ მე უბრალოდ გახსნეს Firefox და წავიდა api.lib.harvard.edu/v2/items. და მერე რა მე აქ არის ძირითადად პირველი გვერდი შედეგების მთელი მითითებული ელემენტი, რომელიც ჩვენ მივიღეთ. და ეს აქ XML ფორმატში. და ის, ასევე, prettified მიერ Firefox. ის ფაქტობრივად არ ჰქონდეს ყველა ეს პატარა გაფართოების და doohickeys აქ. ეს არის ერთგვარი გავალამაზოთ ვერსია გზა შევხედოთ მას. 

მაგრამ რა ეს გვეუბნებოდა ის არის, მე მოითხოვა ყველა საკითხი. ასე რომ, არსებობს 13.289.475 საკითხი. და მე ეძებს პირველი 10, დაწყებული პოზიცია ნულოვანი იმის გამო, რომ კომპიუტერული მეცნიერების ჩვენ ყოველთვის დაიწყება ნულოვანი. და რა მაქვს აქ, თუ უბრალოდ ჩამოიშლება ეს, დაინახავთ, მაქვს 10 საკითხი. 

და თუ მე შევხედოთ პუნქტის, მე არ შემიძლია , რომ მაქვს ეს ინფორმაცია. და ეს არის ის, რაც ე.წ. MODS ფორმა. და ამიტომ მე ვაპირებ გადართოთ უკან აქ ერთი წუთით. OK. 

ასე რომ, მოდით ძიება რაღაც კონკრეტული რადგან პირველი პუნქტის, რომ ხდება ამუშავება, როდესაც თქვენ შეხედეთ მთელი კოლექცია ეს არის, ზოგადად, შემთხვევითი. მოდით შევხედოთ ზოგიერთი donuts. Oh. 

OK. ასე donuts. ამიტომ ჩვენ აღმოვაჩინეთ არსებობს 80 ელემენტი კოლექცია, რომ მითითებას donuts. ჩვენ ვეძებთ პირველი 10 მათგანი. ახლა, თქვენ ხედავთ, აქ ისე, რომ მე ვთქვი, ვეძებ donuts, მე უბრალოდ დასძინა რაღაც შეკითხვის სიმებიანი URL. ასე q ტოლია donuts, რომელიც შეგიძლიათ იხილეთ უფრო მარტივად აქ. 

და ეს ნიშნავს იმას, რომ იქ სპეც API, რომელიც განსაზღვრავს, თუ რა ყველა ამ პარამეტრების ნიშნავს. და ეს იმას ნიშნავს, რომ ჩვენ ვაპირებთ ძიება ყველაფერი donuts. 

ასე რომ, პირველი პუნქტის, აქ ჩვენ გვაქვს თქვენ ხედავთ სათაური Donuts, და არსებობს subtitle მოუწოდა American Passion, რომელიც, ვფიქრობ, შესაბამისი. არსებობს ბევრი different-- მას შემდეგ, რაც თქვენ მიიღებთ წერტილი მიღების მონაცემები, არსებობს ბევრი სხვადასხვა ფორმატებს, რომ თქვენ შეგიძლიათ მიიღოთ იგი. და არსებობს სხვადასხვა ძლიერი და სუსტი მხარეები ყველა მათგანი. ასე რომ, ეს ერთი, თქვენ ხედავთ, აქ, ამ ფორმით არის ძალიან მდიდარი. და ეს არის სტანდარტიზებული. 

ასე რომ, არსებობს კონკრეტული სათაური სფეროში, subtitle სფეროში. არსებობს ალტერნატიული სათაური, ამერიკის Passion. არ არის სახელი ასოცირდება იგი. ტიპის რესურსი ტექსტი. არსებობს ბევრი ინფორმაცია აქ ამ ფორმატში. 

მაგრამ არსებობს რამოდენიმე სხვადასხვა ფორმატებში. ასე რომ, ჩვენ ვიყავით მხოლოდ შევხედავთ ფორმატში მოუწოდა MODS, რომელიც დგას მეტამონაცემების ობიექტის აღწერა სამსახურის, პოტენციურად. მე რეალურად არ დანამდვილებით შესახებ S. მაგრამ ეს საკმაოდ რთული ფორმატი. ეს default ფორმატში. 

მაგრამ ეს ერთი, რომ ინარჩუნებს სიმდიდრით ყველა მონაცემები რომ ბიბლიოთეკას აქვს, რადგან ეს ძალიან ახლოს რა ბიბლიოთეკის იყენებს იძულებით. ის სტანდარტი, რომელიც გამოიყენება მთელი ქვეყნის მასშტაბით, მთელს მსოფლიოში აკადემიური ბიბლიოთეკების. და ეს ძალიან თავსებადი. ასე რომ, თუ თქვენ მოხვდით დოკუმენტი რომ არის MODS ფორმატში, შეგიძლიათ მისცეს, რომ სხვისი რომლის სისტემები მესმის MODS, და მათ შეუძლიათ იმპორტი. ასე რომ, ეს სტანდარტი. ეს ძალიან კარგად განსაზღვრული, ძალიან კონკრეტული. და ეს არის ის, რაც ხდის თავსებადი რადგან თუ ვინმე ამბობს, ეს არის ალტერნატიული სათაური ჩანაწერი, ყველამ კარგად იცის, რას ნიშნავს ეს. Flip მხარის, ეს ძალიან რთულია. 

ასე რომ, თუ თქვენ შეხედეთ ამ ჩანაწერი აქ, თუ უბრალოდ გვინდა სათაური ამ დოკუმენტს, ეს წიგნი, რომელიც, სავარაუდოდ, Donuts, ამერიკელი Passion, parsing it out არის პატარა ჩართული. ვინაიდან არსებობს კიდევ ერთი ფორმატი მოუწოდა Dublin Core, რომელიც ბევრად, ბევრად უფრო მარტივია ფორმატში. 

და ასე რომ თქვენ აქ, არ არსებობს სათაური, subtitle, ალტერნატიული სათაური. არსებობს მხოლოდ სათაური, Donuts, ამერიკის Passion, და კიდევ ერთი ტიტული, ამერიკის Passion. ასე რომ, როდესაც თქვენ ეძებს რა ფორმით გსურთ მიიღოთ მონაცემები გარეთ, ბევრი რამ არის დამოკიდებული, თუ როგორ თქვენ აპირებს გამოიყენოს იგი. თქვენ გამოყენებით თავსებადობის ან თქვენ მინდა რაღაც მარტივი, რომ შეიძლება იყოს უფრო ადვილია მუშაობა? 

Flip მხარის, ბევრი დეტალები მისაღებად სახის squished ქვემოთ. თქვენ შეიძლება დაკარგოს ნიუანსი რა კონკრეტულ სფეროში საშუალებით თუ თქვენ საქმე Dublin Core, რომელიც თქვენ არ მიიღოს MODS. ეს არის ის ორი ფორმატში შეგიძლიათ გავიდნენ API. და, ძირითადად, ვტოვებთ ის კულუარებში MODS. მაგრამ ჩვენ შეგვიძლია მოგცეთ ის MODS და Dublin Core და არაფერი, ისევე. სხვა გათვალისწინებით, როდესაც თქვენ ეძებთ მონაცემები არის, რომ თქვენ შეგიძლიათ მიიღოთ ეს როგორც ან JSON, რომელიც დგას JavaScript Object ნოტაცია, ან XML, რომელიც დგას გააფართოვოთ მარკირებას ენა. და ეს მონაცემები წარმომადგენლობების ორივე ზუსტად იგივე მონაცემები, ზუსტად იგივე სფეროებში. მაგრამ ისინი მხოლოდ სინტაქსურად სხვადასხვა. 

ასე რომ, ეს a-- კარგად, მოდით უბრალოდ გადავიდეს. ასე რომ, ეს არის ჩვენი მოთხოვნა donuts XML ფორმატში. თუ უბრალოდ გადახვიდეთ ეს უნდა იყოს JSON, მე ვხედავ, რომ გამოიყურება სხვადასხვა. ასე რომ ეს არის იგივე შინაარსი, მაგრამ განსხვავებული სტრუქტურა. არსებობს ნაკლები კუთხური ფრჩხილები. იქ ნაკლები verbose. 

და ეს არის ფორმატი, რომელიც, თუ მუშაობს ვებ გარემო, თქვენ სავარაუდოდ აპირებს გინდათ გამოიყენოთ იმიტომ, რომ ერთი ლამაზი რამ შესახებ JSON არის ეს თავსებადი JavaScript. ასე რომ, თუ მე წერა web app, შემიძლია დახევის JSON და მხოლოდ მუშაობა პირდაპირ. ხოლო XML, ის ცოტა უფრო რთული. ასე რომ კიდევ ერთხელ, ეს ორივე სასარგებლოა. ისინი უბრალოდ სხვადასხვა გამოყენების შემთხვევაში სადაც ხალხი დაგვჭირდება მათი გამოყენება. OK. ასე რომ თავში API. ამიტომ ჩვენ შეგვიძლია ვეძებოთ for-- 

მე მისცეს მაგალითი ეძებს donuts. ჩვენ ასევე შეგიძლიათ მოძებნოთ მხოლოდ კონკრეტულ სფეროში ფარგლებში აქ. ასე ნაცვლად ძებნას მთელი ჩანაწერი, შემიძლია უბრალოდ მოძებნოთ სათაურის ველში. და ახლა არის 25 რამ, რომ აქვს donuts სათაური, რომელთაგან ერთი არის აღდგენის შესახებ ჭარბტენიანი მართვა ხვრელი donut პროგრამა, რომელიც, სავარაუდოდ, არ არის აუცილებელი, რასაც ჩვენ ვეძებთ მაშინ, როდესაც ჩვენ ეძებს donuts. 

ასევე, შეგიძლიათ, როდესაც თქვენ საქმე API-- 

ნაწილი, რომელსაც API იძლევა ადამიანებს დიდი მონაცემები კომპლექტი. და არსებობს რამდენიმე სხვადასხვა ინსტრუმენტები შეგიძლიათ გამოიყენოთ, რომ. ერთი, ძალიან უბრალოდ, თქვენ შეგიძლიათ გვერდი მეშვეობით მონაცემები. ასე რომ, როგორც რომ, თუ query ვებ ინტერფეისი, თქვენ შეგიძლიათ შეხედოთ გვერდზე ერთი, ორი, გვერდზე სამი. შეგიძლიათ გააკეთოთ იგივე რამ მეშვეობით API. თქვენ უბრალოდ უნდა იყოს აშკარა თუ როგორ გავაკეთოთ ეს. 

ასე მაგალითად, თუ მე ვეძებ ჩემი პირველი შეკითხვა აქ, სადაც მე ვაკეთებ ძიება ნივთები ერთად donuts სათაური, შემიძლია ვთქვა, და ლიმიტი შეადგენს 20, რაც იმას ნიშნავს, მომეცი პირველი 20 ჩანაწერი, რომელიც არ პირველი 10, რომელიც ჩვეულებრივ, იმიტომ, რომ მე მინდა შევხედოთ 20 დროს. ან შემიძლია ვთქვა, რომ მითითებული დაიწყოს ტოლია 20 და ლიმიტი გაუტოლდება 20, რომელიც მისცემს me შეაქვს 21 გზით 40. 

ამიტომ ვფიქრობ, რამ წართმევას აქ რომ ჩვენ გამოყენებით შეკითხვის strings მითითებული პარამეტრების შეკითხვის. და გაძლევთ კონტროლი რაც თქვენ დავუბრუნდეთ. 

ერთი ინსტრუმენტი, რომელიც შეგიძლიათ გამოიყენოთ, - 

და ეს მართლაც სასარგებლო პირობები შეისწავლოს მონაცემები. 

--is რაღაც მოუწოდა Faceting. ამიტომ ტერმინი Faceting არის არ არის აუცილებელი, საერთო. მაგრამ თქვენ ყველა მინახავს ეს ადრე. თუ თქვენ შეხედეთ Amazon, მაგალითად, და თქვენ ნუ ძიება donuts წიგნები, აქ მათ მოხვდით სერია წიგნებისა, და ისინი დაჯგუფებულია კატეგორიის მიხედვით, და თქვენ მიიღებთ სხვადასხვა კატეგორიები, და რამდენი წიგნების თითოეულ კატეგორიაში გამოჩნდება. 

ასე რომ, ეს არის ძირითადად საქმის. თქვენ მიიღოს ყველა მათი წიგნები, 1800 წიგნები, რომლებიც შეესაბამება donuts Amazon. 12 მათგანი საუზმე კატეგორიაში. 21 საკონდიტრო და საცხობი, და ასე შემდეგ და ასე შემდეგ. 

ასე რომ, ეს მართლაც სასარგებლო ინსტრუმენტი შესასწავლად content ბიბლიოთეკაში ასევე რადგან, როდესაც თქვენ შეხედეთ საქმის, ეს გაძლევთ იდეა რა სუბიექტების არსებობს, როგორიცაა, თუ რა სახის საგნების ყველაზე პოპულარული ფარგლებში თქვენს შეკითხვაზე კომპლექტი. და ეს გეხმარებათ off და შეისწავლონ. ასე რომ ჩვენ შეგვიძლია გავაკეთოთ იგივე. 

თუ გვინდა, რომ გამოიყენოთ API და შევხედოთ facets, დავუმატებთ კიდევ პარამეტრი ჩვენი მეგობარი შეკითხვის სიმებიანი. ასე facets ტოლია მძიმეებით ჩამონათვალი იმისა, რასაც ჩვენ გვინდა, რომ საქმის შესახებ. ასე რომ, ერთი facets შესაძლოა დაექვემდებაროს. სხვა შეიძლება იყოს ენაზე. ასე რომ, თუ ჩვენ აწარმოებს, რომ შეკითხვაზე, ჩვენ get-- ეს გამოიყურება საკმაოდ ბევრი იგივე აქ. მაგრამ ჩვენ დასძინა ბოლომდე სიაში კომპლექტი facets. ამიტომ ჩვენ გვაქვს საქმის მოუწოდა თემაზე. ასე რომ, ეს გვეუბნება, რომ თუ გავითვალისწინებთ ჩემი 80 შედეგები donut შეკითხვაზე, 13 მათგანს აქვს აგზავნიდნენ შეერთებული შტატები. სამი აქვს საგანი donuts. სამი აქვს სათაური ჭარბტენიანი რესტავრაცია, რომლებიც შეიძლება ჩვენი ხვრელი Donut. ორი მათგანი, Simpsons, და ასე შემდეგ და ასე შემდეგ. 

ასე რომ, ეს შეიძლება იყოს სასარგებლო, თუ თქვენ მინდა ვიწრო ქვემოთ თქვენი ძებნა. ეს დაგეხმარებათ, რომ. განსაკუთრებით თუ თქვენ გაქვთ მეტი, ვიდრე, ვთქვათ, 80 შედეგები. 

ანალოგიურად, ჩვენ ასევე სთხოვა for facets ენაზე. ასე რომ, თუ დავაკვირდებით ჩვენი შედეგები, ჩვენ ვხედავთ 76 მათგანი ინგლისურ, ოთხი ფრანგული, ორი ესპანურად, ორი, მე ვფიქრობ, რომ undefined ან უცნობი, ჰოლანდიური და ლათინური. ამიტომ ვფიქრობ, ლათინური donut შედეგი, კიდევ ერთხელ, აქვს არაფერ შუაშია ცომეული. მაგრამ იქ წასვლა. 

ასე რომ, ეს არის ერთგვარი გვიჩვენებს, თუ როგორ შეგიძლიათ გაიყვანოს content უკან საწყისი API უბრალოდ მეშვეობით ვებ-ბრაუზერის მეშვეობით, რაც საკმაოდ დიდი. მაგრამ ეს არ არის ნამდვილად, რასაც თქვენ აკეთებთ როგორც წესი, გამოყენებით API იგი. ასე რომ, ერთი მაგალითია, თუ როგორ ვერ რეალურად ამის გაკეთება არის მე დაწერილი სუპერ პატარა პროგრამა, რომელიც, კიდევ ერთხელ, ჯერ ჩემი donut ძიების და ირჩევს რამდენიმე სფეროებში და აჩვენებს მათ მაგიდასთან. ასე რომ, ეს არის ძალიან იგივე შინაარსის, რომ ჩვენ უბრალოდ დაინახა რამდენიმე სფეროებში გაყვანილია. ასე სიაში ტიტული, განთავსების რა წიგნი დაახლოებით, ენა, და ასე შემდეგ და ასე შემდეგ. 

ასე როგორ ეს რეალურად მოხდა, რადგან ვფიქრობ, ჩვენ უნდა შევხედოთ ზოგიერთი კოდი, is-- 

რა გვაქვს აქ არის მარტივი HTML გვერდი, რომელიც აჩვენებს ტექსტი, მივესალმებით ბიბლიოთეკა ღრუბელი და შემდეგ აჩვენებს მაგიდასთან შედეგი. და არსებობს აშკარად არ შედეგები მაგიდა, როდესაც გვერდზე იღებს დატვირთული. მაგრამ, რას ვაკეთებთ ეს არის, პირველ რიგში, ნაძარცვი ბიბლიოთეკა მოუწოდა jQuery, რომელიც ძირითადად JavaScript ბიბლიოთეკა, რაც მანიპულირება ძალიან ადვილია JavaScript natively, HTML, და შექმნა ვებ გვერდები, კლიენტის მხარის ლოგიკა და ვებ გვერდებზე. 

ასე რომ, რა გვაქვს აქ არის jQuery აქვს მეთოდი ეწოდება მისაღებად, რომელიც არსებითად წავა URL, რომელიც, ამ შემთხვევაში, ეს არის ნაცნობი ეძებს URL. და მერე კიდევ შინაარსის რომ URL და შემდეგ აწარმოებს ფუნქციის იგი. ჩვენ ვთქვით წასვლა api.lib.harvard / edu. ძიება donuts. მოგვცეს 20 ჩანაწერი. და შემდეგ აწარმოებს ამ ფუნქციას, რაც მე შერჩეული გავლით ეს მონაცემები. და მონაცემები არის JSON, რომ მიიღო დაბრუნდა API. 

და მაშინ ჩვენ ვამბობთ, ფარგლებში, რომ მონაცემები არსებობს სფეროში მოუწოდა ერთეულზე. და თუ მე წავიდეთ მიიღოს ვიხსენებთ ერთ-ერთი ასეთი შედეგი, რომ აქ, არსებობს რაღაც called-- 

ასევე, ეს ე.წ. ერთეულზე. ასე რომ, შეიძლება ითქვას, რომ. და რა არ არის ეს გადის თითოეულ პუნქტს და შემდეგ მოუწოდებს სხვა ფუნქცია თითოეულ ერთეულზე. და რომ ფუნქცია ძირითადად მიმდინარეობს ღირებულება ნივთი, რომელიც არსებითად ინდივიდუალური რეკორდი და საშუალებას გვაძლევს გაიყვანოს სათაური, დაფარვის და ენა. 

ასე რომ, ჩვენ მოვუწოდებთ ფუნქცია ყველა ნივთი, რომელიც ჩვენ მივიღეთ უკან API. და თუ უბრალოდ შეხედეთ ამ piece უფლება აქ, ის, რასაც ჩვენ ვაკეთებთ ჩვენ შექმნის სიმებიანი, რომელიც არსებითად ზოგიერთი HTML markup მაგიდის გარშემო, რომელზეც value.title, რაც სათაურში ობიექტი, value.coverage, რომელიც გაშუქება, - 

და ვაკეთებთ გამშვები აქ ვინც გაურკვეველი და იმალებოდა, თუ იგი ამბობს undefined, იმიტომ, რომ ჩვენ არ აინტერესებს რომ. 

--and მაშინ ენაზე. და მაშინ რა ჩვენ აკეთებს მიერთება, რომ to მაგიდა, რომელიც მდებარეობს გამოვლენილი ეს სიმებიანი აქ. და როგორ jQuery მუშაობს არის რა ამ ამბობს არის ვეძებოთ მაგიდასთან იდეა შედეგები და დაამატოთ ეს ტექსტი მას. და ეს არის მაგიდა იდეა შედეგები. ასე რომ თქვენ დასრულდება მდე ერთად არის ამ გვერდზე აქ. და იმისათვის, რომ ნახოთ source-- ასევე, წყარო არ არის რეალურად განახლება, როდესაც მოხდა. ასე რომ თქვენ ხედავთ ფაქტობრივი შედეგები მაგიდასთან აქ თუმცა. 

ასე რომ, მხოლოდ მარტივი მაგალითია, აკეთებს ძალიან ძირითადი შეკითხვის წინააღმდეგ API და ჩვენებისას ინფორმაცია ზოგიერთ სხვა ფორმა, და არ აკეთებს არაფერს ძალიან ლამაზი. ახლა, კიდევ ერთი მაგალითია, როგორიცაა განაცხადის დაწერილი დავით Weinberger როგორც დემო ამ, რომელიც არსებითად გიჩვენებთ როგორ შეგიძლიათ ბადაგი up შედეგები თქვენ მიღების ბიბლიოთეკის cloud API ერთად, ვთქვათ, Google წიგნები. 

და ფიქრი ისაა, რომ მე არ შემიძლია აწარმოებს შეკითხვა წინააღმდეგ Google Books, მიიღოს სრული ტექსტი ძიება, ზოგიერთი შედეგები უკან, გაირკვეს, რომელიც იმ საქონელს, რეალურად არსებობს Hollis, ბიბლიოთეკის სისტემა, და მაშინ მაძლევს ბმულები უკან იმ საკითხი. ასე რომ, თუ მე მოძებნოთ, ეს იყო ბნელი და მშფოთვარე ღამე, მე დავუბრუნდეთ bunch of შედეგები Google, და შემდეგ ერთ-ერთი შედეგი რაც ნაოჭების დრო. და ეს კავშირები წიგნი, რომელიც არსებობს ფარგლებში ჰარვარდის ბიბლიოთეკა სისტემა. 

ამიტომ ვფიქრობ, საქმე ისაა, რომ არ იმდენად, რომ ეს შეიძლება იყოს ან არ იყოს ისე, რომ გსურთ ძებნის ბიბლიოთეკის, მაგრამ ეს არის სრულიად განსხვავებული ისე, რომ არ იყო ხელმისაწვდომი თქვენ ადრე, როგორც თქვენ მას სხვა გზა არ აკეთებს სრული ტექსტი ძიება შესახებ წიგნი, რომელიც კი ნაწილი იყო ჰარვარდის ბიბლიოთეკა სისტემა. ასე რომ ეს არის გზა რომელიც შეგიძლიათ გააკეთოთ, რომ. და შეგიძლიათ არიან მათ ნებისმიერი ფორმატის გსურთ. ასე რომ, აქ ისაა, რომ, ძირითადად, ჩვენ გახსნას ახალი გზები ხალხს მუშაობა მონაცემები. 

კიდევ ერთი ნაჭერი ბიბლიოთეკა cloud ის არის, რომ ის ეხმარება გამოამჟღავნონ ზოგიერთი გამოყენების მონაცემები რომ ბიბლიოთეკას აქვს. ასე რომ, თუ წასვლა ბიბლიოთეკა, და თქვენ ეძებს წიგნები, თქვენ არ არის აუცილებელი რეალურად აქვს იდეა, ყველა ელემენტი კერძოდ სათაური, რა არიან ადამიანები, საზოგადოებას, თუ არა ის განისაზღვრება, როგორც ჰარვარდის ან ქვეყანაში ან თქვენი კლასი, რა აღმოაჩინეს მათ ყველაზე სასარგებლო? და ბიბლიოთეკა რეალურად აქვს ტონა ინფორმაციას, თუ რა ყველაზე სასარგებლო, რადგან თუ ბევრი ხალხი შემოწმების წიგნი, წერია რაღაც. იქ უნდა ყოფილიყო რატომღაც მათ სურთ შეამოწმეთ იგი out. ბევრი ადამიანი დააყენა ის რეზერვი. 

თუ ის სარეზერვო სიაში ბევრი კლასების, რომელიც გიჩვენებთ რაღაც. თუ ფაკულტეტის წევრები შემოწმების გარეთ ბევრი და სტუდენტებს არ არიან, რომ მეუბნება რაღაც. პირიქით, რომ ასევე გიჩვენებთ რაღაც. ასე რომ, ეს იქნება მართლაც საინტერესოა ეს ინფორმაცია არსებობს და მიადევნე ხალხი გამოვიყენოთ, რათა დაეხმაროს მათ სამუშაოების ფარგლებში ბიბლიოთეკის სისტემაში. Flip მხარე, ეს არის არსებობს რამდენიმე სერიოზული კონფიდენციალურობის შეშფოთება იმის გამო, ერთ-ერთი ძირითადი პრინციპები ბიბლიოთეკაში არის ჩვენ არ ვაპირებთ ეთქვათ ადამიანი რა ადამიანი კითხულობს. და მაშინაც კი, თუ ვამბობ, რომ ეს შეამოწმეს ოთხჯერ ამ კონკრეტულ თვეში, რომელიც შეიძლება იქნას გამოყენებული ბმულის კონკრეტული პირის მიერ de-anonymizing მონაცემები და მოძიებაში, რომლებიც შევამოწმე ის. ასე რომ, ისე, რომ ჩვენ შეგვიძლია avoid-- ისე, რომ ჩვენ შეგვიძლია ცდილობენ ამონაწერი ზოგიერთი სიგნალი ყველა ინფორმაცია დარღვევის გარეშე არავის კონფიდენციალურობის შეშფოთება არსებითად დავაკვირდებით 10 წლის გამოყენების მონაცემები, - 

ასე რომ, ეს მეტი ხანგრძლივი დროის განმავლობაში. 

--and იტყვით, ვნახოთ, როგორ ბევრჯერ ეს ნამუშევარი იქნა გამოყენებული, და რომელიც ამ პერიოდში დრო და მაშინ ძირითადად მისცეს უკან ნომერი, რომელიც ჩვენ მოვუწოდებთ დასტის ანგარიში, რომელიც, ძირითადად, წარმოადგენს, თუ რამდენად იქნა გამოყენებული. და რომ რიცხვი ბევრი სხვადასხვა გათვლებით წასვლას, რომ ნომერი. --but ეს არის ძალიან უხეში მეტრულ რომელიც გაძლევთ ზოგიერთი იდეა თუ როგორ საზოგადოების შეიძლება ვაფასებთ, რომ მუშაობა. 

და ასე სხვა სახის კი უფრო დააკონკრეტეს განცხადება რომელიც იღებს უპირატესობა ეს არის რაღაც მოუწოდა Stacklife, რომელიც რეალურად შესაძლებელია main ჰარვარდის ბიბლიოთეკა ვერსია. ასე რომ თქვენ წასვლა library.harvard.edu. დაინახავთ რაოდენობის სხვადასხვა გზები ეძებს ბიბლიოთეკაში. ერთ-ერთი მათგანი ეწოდება Stacklife. 

და ეს არის პროგრამა, რომელიც browses შინაარსი ბიბლიოთეკა, მაგრამ მთლიანად აგებულია თავზე ამ APIs. ასე რომ არ არსებობს სპეციალური პერსონალი მიმდინარეობს კულუარებში. არ არსებობს დაშვება მონაცემები, რომ თქვენ არ აქვს. ის გამოყენებით APIs მოგაწოდოთ სრულიად განსხვავებული ათვალიერებს გამოცდილება. 

ასე რომ, თუ მე მოძებნოთ Alice in Wonderland ამ შემთხვევაში, მივიღებ შედეგი, რომელიც ჰგავს ეს, რომელიც საკმაოდ ბევრი 

ეს ძალიან ჰგავს ნებისმიერი სხვა საძიებო თქვენ შეიძლება გავაკეთოთ, გარდა ამ შემთხვევაში ჩვენ რეიტინგში ნივთები stackscore, რომელიც გაძლევთ ზოგიერთი იდეა რამდენად პოპულარულია ეს ელემენტი იყო საზოგადოებაში. და ისე ნათლად, Alice in Wonderland by Walt Disney ძალიან პოპულარულია. მაგრამ ასევე, შეგიძლიათ ნახოთ ოთხეულში აქ არის ის, რომ თქვენ შეიძლება არ რეალურად 

რამ, რაც უაღრესად გამოიყენება, მაგრამ თქვენ არ შეუძლია დაუყოვნებლივ დაკავშირება Alice in Wonderland. ასე რომ, ჩვენი ძველი მეგობარი ანოტირებული Alice აქ. ასე, რომ შეიძლება შევხედოთ მას. და ახლა, რაც მე ვეძებ at ძირითადად მითითებული of-- მე შემიძლია ანოტირებული Alice უფლება აქ. მე მაქვს ინფორმაცია. და ასევე მაქვს stackscore , ამ შემთხვევაში, 26. და ეს მეუბნება სახის უხეშად როგორ მივიღეთ ეს stackscore, როგორიცაა, ვინც შეამოწმა ის, როგორ ბევრი ჯერ ეს იყო გაწერილი, როგორიცაა ფაკულტეტის ან სტუდენტებს, როგორ ბევრი ასლები ბიბლიოთეკას აქვს, და ასე შემდეგ და ასე შემდეგ. 

და ასევე შეგიძლიათ, საინტერესო საკმარისი აქ, დაათვალიეროთ stacks პრაქტიკულად. ასე მონაცემები აქ, ამ გვიჩვენებს, სახის ვირტუალური წარმომადგენლობა რა შელფზე might ჰგავს თუ იყო მიიღოს ყველა ბიბლიოთეკის დაკავებები და ამით მათ ერთად ერთი უსასრულო თაროზე. და ლამაზი რამ არის, რომ ჩვენ can-- 

პირველ რიგში, მეტადატის შესახებ, რომ ეს წიგნები ხშირად გიჩვენებთ, როდესაც იგი გამოიცა. ის გიჩვენებთ რამდენი გვერდებზე აქვს. ეს შეიძლება გითხრათ ზომები. ასე რომ თქვენ ხედავთ, რომ ეს აისახება აქ თვალსაზრისით ზომა წიგნები. 

და მაშინ ჩვენ შეგვიძლია გამოვიყენოთ დასტის ანგარიშით ხაზი გავუსვა წიგნები, რომ უმაღლესი დასტის ქულით. ასე რომ, თუ ეს მუქი, ეს იმას ნიშნავს, რომ, სავარაუდოდ, იგი გამოიყენება უფრო ხშირად. ასე რომ, ამ შემთხვევაში, მე აპირებს ვხვდები, რომ ეს არის ვერსია Alice in Wonderland რომ არის ძალიან ხშირად გამოიყენება და ყველაზე ხელმისაწვდომი, ბიბლიოთეკა აქვს ყველაზე ასლები. ასე რომ, თუ თქვენ ვეძებთ for Alice in Wonderland, ეს შეიძლება იყოს კარგი ადგილია დაიწყება. 

და შემდეგ აქ თქვენ ასევე შეგიძლიათ ლინკი out , ვთქვათ, Amazon შეძენა წიგნი, და ასე შემდეგ და ასე შემდეგ. საქმე იმაშია, კიდევ ერთხელ, არ არის იმდენად, რომ ეს არის საუკეთესო გზა რათა დაათვალიეროთ ბიბლიოთეკაში ან უფლება ინსტრუმენტი, ყოველ შემთხვევაში. მაგრამ ეს არის კიდევ ერთი გზა ამის გაკეთება. და მიღების მონაცემები ხელმისაწვდომია მეშვეობით API, რომელიც მზადდება ძალიან მარტივი შენობა ბლოკები, რომელიც საშუალებას გაძლევთ მოძებნოთ შინაარსი, შეგიძლიათ აშენება რაღაც ასე რომ შეგიძლიათ არაჩვეულებრივად ძვირფასი რამდენიმე ადამიანი. 

ასე რომ, ერთგვარი, ისევე, როგორც მე მინდა, ვთქვა, ნამდვილად იმაზე, თუ რა API არის და რა კარგად ჩანს, არსებობს მთელი bunch პერსონალის კულისებში, რომელიც მე უბრალოდ აპირებს შევეხო მოკლედ მხოლოდ იმიტომ, რომ ეს ერთგვარი მოდის ეს სრულიად განსხვავებული კუთხე თვალსაზრისით, თუ როგორ აკეთებს რაღაც მოსწონს ეს მისაღებად შევიდა ადგილი? 

ასე API სტანდარტული ინტერფეისის ყველა ამ შინაარსის. მაგრამ მას იქ, პირველი, რაც უნდა გაგვეკეთებინა იყო გაიყვანოს ერთად ინფორმაცია წიგნები და სურათები და მოძიებაში დამხმარე, კოლექცია დოკუმენტის სხვადასხვა ჰარვარდის სისტემები. Aleph, VIA, და OASIS არიან სახელები სისტემები. და ისინი არსებითად წასვლას მილსადენის, გადამამუშავებელი მილსადენი. 

ასე რომ, პირველ რიგში, ჩვენ კიდევ ექსპორტი ფაილები ყველა ამ სისტემების. ჩვენ გაყოფილი მათ ინდივიდუალური საკითხი. ამიტომ ჩვენ გვაქვს ფაილი, რომელიც არის Gigabyte, რომელსაც აქვს მილიონი ჩანაწერი იგი. ასე რომ, ჩვენ გაყოფილი ეს დაყოფილია ინდივიდუალური საკითხი. მაშინ, თითოეული პუნქტის, ჩვენ გარდაქმნას იგი შევიდა MODS, რადგან ამ არის natively MODS, ზოგიერთი მათგანი არ არის. ასე რომ, ჩვენ მათ ყველა იყოს იმავე ფორმატში. მაშინ არსებობს სხვადასხვა გამდიდრების ნაბიჯები, სადაც ჩვენ დაამატოთ მეტი ინფორმაცია მონაცემებით ვიდრე იყო შესაძლებელი ბიბლიოთეკაში. ასე რომ, ჩვენ უნდა დაამატოთ, პირველ რიგში, ჩვენ გვაქვს რა ბიბლიოთეკები გამართავს იგი. ჩვენ გავლა ნაბიჯი გაანგარიშების stackscore. ჩვენ გაიაროს ერთი ნაბიჯია და დასძინა, უფრო მეტადატის თვალსაზრისით რა კოლექციების ადამიანი შესაძლოა დაემატოს გაკეთება 

ადამიანი შექმნა კოლექციები საკითხი. რა კოლექციების საკუთრებაა? როგორ არ ადამიანი tagged ამ შინაარსის წარსულში? მაშინ გავფილტროთ და შეზღუდოს ჩანაწერების რადგან, როგორც აღვნიშნე, არსებობს რამდენიმე ჩანაწერი, რომელიც, იმის გამო, საავტორო მიზეზების გამო, ჩვენ არ შეგვიძლია არიან. და მაშინ ჩვენ მათ ჩატვირთვაზე შევიდა რაღაც მოუწოდა Solr, რომელიც არ არის misspelling, მაგრამ არის სახელი ნაჭერი პროგრამული უზრუნველყოფა რომ არ ძებნის ინდექსირებას, რომელიც მართავს ყველა ძიების უკან API. და მაშინ იგი ხელმისაწვდომი გახდება API, და ხალხს შეუძლია გამოიყენოს იგი. 

ასე რომ, ეს, საკმაოდ პირდაპირი პროცესი. ერთ-ერთი საინტერესო რამ შესახებ ეს არის რომ ჩვენ საქმე 13 მილიონი ჩანაწერი და ჩვენ ვაპირებთ, რომ იყოს საქმე ან მეტი. და გვინდა, რომ შეძლებს გაუმკლავდეს ეს შედარებით სწრაფი მოდის. ის ხანგრძლივი დრო გადაამუშავებს 13 მილიონი ჩანაწერი. 

ასე როგორ მილსადენის შეიქმნა, რომ თქვენ can-- ვფიქრობ, უპირატესობა მილსადენის, პრობლემა, რომ ჩვენ ცდილობს გადაწყვიტოს აქ ის არის, რომ ყველა ტრანსფორმატორები, ყველა ეს ნაბიჯები ამ მილსადენის განცალკევება. არ არსებობს დამოკიდებულებას. თუ თქვენ დამუშავება ჩანაწერი ერთი წიგნი, არ არსებობს დამოკიდებულების ზრდა რომ შორის კიდევ ერთი წიგნი. 

რა შეგვიძლია გავაკეთოთ არის ძირითადად, ყოველ ნაბიჯზე მილსადენი, ჩვენ დააყენა იგი მდგომ ღრუბელი. I მოხდა, რომ Amazon ვებ სერვისები. ასე რომ, არსებობს სია, ამბობენ, 10,000 ელემენტი, რომ უნდა იყოს ნორმალიზება და გადაყვანილია MODS ფორმატში. და ჩვენ დაიძაბება up როგორც ბევრი სერვერები როგორც ჩვენ გვინდა, იქნებ 10 სერვერები. და თითოეული იმ სერვერები მხოლოდ ზის იქ, გამოიყურება რომ მდგომ, დაინახა, რომ ერთი, რომელიც საჭიროებს დამუშავდება, გაიყვანს ეს off მდგომ, ამუშავებს მას, და ჯოხები ის მომდევნო რიგში. 

და მერე რა, რომ საშუალებას გვაძლევს ამისათვის არის გამოიყენოს, არსებითად, იმდენი ტექნიკის, როგორც ჩვენ გვინდა, რომ ეს პრობლემა ძალიან მოკლე დროში მონაცემების დამუშავებისა როგორც სწრაფად, როგორც შესაძლებელია, რომელიც არის ის, რომ მხოლოდ, ახლა მსოფლიოში cloud computing ჩვენ შეგვიძლია უზრუნველყოფა სერვერები არსებითად მომენტალურად, ის არის, რომ სასარგებლოა. ამიტომ ჩვენ არ უნდა ჰქონდეს giant სერვერზე სხდომაზე გარშემო ყველა დრო, რომ გავაკეთოთ დამუშავება რაც შეიძლება მოხდეს მხოლოდ კვირაში ერთხელ. 

ასე რომ, ძირითადად იგი. არსებობს დოკუმენტაცია ხელმისაწვდომია ბიბლიოთეკის Cloud Item API ამ URL, რომელიც ხელმისაწვდომი იქნება მოგვიანებით. და გთხოვთ, რომ შევხედოთ ეს უნდა ნახოთ, თუ არსებობს რამე, გაქვთ რაიმე იდეები. ითამაშოთ მასთან ერთად. სულელი გარშემო. და იმედია შეგიძლიათ მოდის რაღაც დიდი. მადლობა.