เจฟฟรีย์ LICHT: สวัสดี ฉันเจฟฟรีย์ Licht และฉันที่นี่เพื่อพูดคุยกับคุณเกี่ยวกับ ฮาร์วาร์ห้องสมุดและอาคารของวันพรุ่งนี้ ห้องสมุดในวันนี้ผมคิดว่า ดังนั้นพื้นหลังที่นี่ สนามสำหรับการประชุมครั้งนี้ เป็นหลักว่ามี ข้อมูลจำนวนมากบรรณานุกรม ที่มีอยู่ในห้องสมุดฮาร์วาร์ และมีโอกาส ผ่านบางส่วนของเครื่องมือ และโครงการที่ได้รับการพัฒนา ที่จะได้รับการเข้าถึงข้อมูล และนำไปสถานที่ที่ ฮาร์วาร์ห้องสมุดไม่ได้ทำตอนนี้ ทำสิ่งใหม่ ๆ กับมันทดลอง และเล่นรอบกับมัน ดังนั้นจุดเริ่มต้นที่เป็นแบบนี้เป็น API เรียกว่าห้องสมุดฮาร์วาร์เมฆซึ่ง เป็นเซิร์ฟเวอร์ข้อมูลเมตาเปิด ซึ่งผมจะพูดถึงในขณะนี้ ดังนั้นพื้นหลังเป็นว่ามี จำนวนมากของสิ่งที่อยู่ในห้องสมุดฮาร์วาร์ ขณะนี้มีกว่า 13 ล้านบรรณานุกรม บันทึกล้านภาพ และหลายพันของการหาโรคเอดส์ซึ่ง เป็นหลักเอกสารอธิบาย คอลเลกชัน, พูดในสิ่งที่ อยู่ในนั้นกล่องของเอกสาร และอื่น ๆ ที่เป็นตัวแทนกว่า ล้านเอกสารของแต่ละบุคคล และนอกจากนี้ยังมีจำนวนมาก ข้อมูลที่ห้องสมุดมี เกี่ยวกับวิธีการเนื้อหาที่ถูกนำมาใช้ อาจจะเป็นที่สนใจของผู้คน ที่อาจต้องการที่จะทำงานกับมัน 

ดังนั้นข้อมูลทั้งหมด ห้องสมุดมีข้อมูลเมตา ดังนั้นเมตาดาต้าที่เป็นข้อมูลเกี่ยวกับข้อมูล ดังนั้นเมื่อเราพูดคุยเกี่ยวกับ ข้อมูลที่เป็น ใช้ได้ผ่านห้องสมุด เมฆที่มีอยู่, ก็ไม่จำเป็นต้อง เอกสารที่เกิดขึ้นจริง ตัวเองไม่จำเป็นต้องเต็ม ข้อความของหนังสือหรือภาพเต็ม แม้ว่าที่จริงอาจจะเป็นกรณี แต่มันเป็นเรื่องจริง ข้อมูลเกี่ยวกับข้อมูล 

ดังนั้นคุณสามารถคิดรายการ ข้อมูลหมายเลขโทรวิชา วิธีการหลายเล่ม หนังสือเล่มนี้ยังมีสิ่งที่ เป็นรุ่นสิ่งที่มี รูปแบบที่ผู้เขียนและอื่น ๆ ดังนั้นมีจำนวนมากของข้อมูลเกี่ยวกับ ในการเก็บรวบรวมข้อมูลที่ ในตัวเองเป็นชนิดที่มีประโยชน์โดยเนื้อแท้ และแม้ว่าถ้าคุณ การทำวิจัยในเชิงลึก เห็นได้ชัดว่าคุณต้องการที่จะได้รับที่จะเกิดขึ้นจริง เนื้อหาตัวเองและดูข้อมูลที่ เมตาดาต้าที่จะเป็นประโยชน์ในแง่ของการ ทั้งการวิเคราะห์ร่างกายโดยรวม เช่นเดียวกับสิ่งสิ่งที่อยู่ในคอลเลกชัน พวกเขาเกี่ยวข้องอย่างไร มันจะช่วยให้คุณจริงๆหาสิ่งอื่น ๆ ซึ่งจริงๆจุดประสงค์หลักของมัน จุดของ metadata และแคตตาล็อก จะช่วยให้คุณค้นหาทุก ข้อมูลที่เป็น มีอยู่ในคอลเลกชัน 

ดังนั้นนี่คือตัวอย่างของเมตาดาต้า สำหรับหนังสือในห้องสมุดฮาร์วาร์ ดังนั้นก็มี และคุณสามารถเห็นมัน จริงที่ซับซ้อนพอสมควร และเป็นส่วนหนึ่งของมูลค่าของเมตาดาต้า ในระบบห้องสมุดฮาร์วาร์ คือการที่จะได้รับการจัดเรียง การสร้างขึ้นโดย catalogers และประกอบโดยผู้ใช้ จำนวนมากที่มีความเชี่ยวชาญและทักษะ และคิดว่ามันเมื่อเวลาผ่านไป ซึ่งมีจำนวนมากของมูลค่า 

ดังนั้นถ้าคุณดูที่บันทึกนี้ ข้อเขียนของอลิซ, คุณสามารถหา คุณได้มีชื่อผู้เขียนมัน ผู้เขียนและทุกวิชาที่แตกต่าง ซึ่งคนที่ได้ลงในรายชื่อ และคุณสามารถเห็นนอกจากนี้ยังมีใน นอกเหนือไปจากข้อมูลจำนวนมากที่ดี ที่นี่มีการทำสำเนาบางส่วน มีจำนวนมากของความซับซ้อนที่เป็น สะท้อนผ่านข้อมูลเมตา ว่าคุณมี 

ดังนั้นหนึ่งชื่อของหนังสือเล่มนี้คือ การผจญภัยของอลิซในแดนมหัศจรรย์ ดังนั้นนี่คือคำอธิบายประกอบ รุ่นของหนังสือเล่มนั้น แต่ก็ยังเรียกว่าข้อเขียน อลิซผจญภัยของอลิซ เพราะในแดนมหัศจรรย์ มันเป็นสิ่งที่ มาร์ตินการ์ดเนอร์เขียน และข้อเขียนหนังสือ และมีจำนวนมากของข้อมูลที่ดี เกี่ยวกับปริศนาตรรกะและสิ่ง ภายในอลิซที่คุณ อาจไม่ทราบเกี่ยวกับ ดังนั้นคุณควรจะไปอ่านมัน 

แต่คุณสามารถดูมี จำนวนมากของรายละเอียดที่นี่ รวมทั้งระบุเมื่อมัน ถูกสร้างขึ้นมันมาจากไหน, ในแง่ของฮาร์วาร์ ระบบและอื่น ๆ ดังนั้นนี่คือตัวอย่างของ ประเภทของข้อมูลเมตา ที่คุณอาจเห็นในหนังสือ คอลเลกชันห้องสมุดฮาร์วาร์ 

นี่คือสิ่งที่แตกต่างอย่างสิ้นเชิง จึงมีระบบที่เรียกว่า VIA ฮาร์วาร์ซึ่งโดยทั่วไป เป็นแคตตาล็อกภาพและวัตถุของศิลปะ และสิ่งที่มองเห็นได้ตลอดทั้งฮาร์วาร์ และเพิ่มข้อมูลเมตาบาง ให้พวกเขาแบ่งพวกเขา และในบางกรณีการให้บริการ ภาพขนาดเล็ก ที่คุณสามารถใช้ ดูดังนั้นหากคุณต้องการ 

ดังนั้นนี่คือตัวอย่างของ เมตาดาต้าที่คุณมีสำหรับแผ่น จากการสันนิษฐานว่าอลิซในแดนมหัศจรรย์ และคุณสามารถเห็นมี เมตาดาต้าน้อยที่นี่ มันเป็นเพียงชนิดที่แตกต่างของวัตถุ และเพื่อให้มีข้อมูลน้อย 

คุณส่วนใหญ่มีความจริงที่ว่าโทร ตัวเลขหลักที่สร้างมัน - 

เราไม่ทราบว่าเมื่อมันถูกสร้างขึ้น 

--and ชื่อ 

อีกตัวอย่างหนึ่ง นี่คือการค้นพบความช่วยเหลือ ดังนั้นจึงมีการสะสมของลูอิส เอกสารของแครอลที่ฮาร์วาร์ ดังนั้นนี้อธิบายถึงสิ่งที่ อยู่ในคอลเลกชันที่ ดังนั้นคนที่ได้ผ่านและ มองผ่านกล่องทั้งหมด และรายชื่อมันให้พื้นหลังบาง เขียนสรุปของสิ่งที่อยู่ที่นี่ และถ้าคุณได้ดู เพิ่มเติมได้ที่นี้นี้ ไปในหน้าและหน้า และหน้า แต่จะบอกคุณ สิ่งที่ตัวอักษรและสิ่งที่ วันที่จากสิ่งที่กล่อง มีอยู่ทั่วทั้งคอลเลกชัน แต่นี่คือสิ่งที่ ว่าถ้าคุณอยู่ที่ฮาร์วาร์ คุณสามารถไปและเป็นจริงการมองร่างกาย ขึ้นและน่าจะดูที่ 

ดังนั้นนี้เป็นที่ดีทั้งหมด ข้อมูลเมตานี้ของที่มีประโยชน์ มันอยู่ในระบบห้องสมุดฮาร์วาร์ มีเครื่องมือออนไลน์ที่คุณ สามารถไปและจะดูที่มัน และดูมันและค้นหามัน และคุณสามารถเชือดมันและลูกเต๋า ในหลายวิธีที่แตกต่างกัน 

แต่มันเป็นเรื่องจริงที่มีอยู่เฉพาะในกรณีที่ คุณเป็นมนุษย์นั่งลง ที่เว็บเบราเซอร์ของคุณหรือบางสิ่งบางอย่างหรือ โทรศัพท์ของคุณและการนำทางผ่านมัน มันไม่จริงที่มีอยู่ใน ชนิดของแฟชั่นที่ใช้งานใด ๆ สำหรับระบบอื่น ๆ หรือ คอมพิวเตอร์เครื่องอื่น ๆ ในการใช้งาน ไม่ได้อยู่กับระบบภายใน ห้องสมุดฮาร์วาร์ แต่ระบบในโลกภายนอก เพียงแค่คนอื่น ๆ ทั่วไป ดังนั้นคำถามคือวิธีการที่เราสามารถ ทำให้มันสามารถใช้ได้กับคอมพิวเตอร์ เพื่อให้เราสามารถทำน่าสนใจมากขึ้น สิ่งที่มีกว่าเพียง เรียกดูมันเอง? 

ดังนั้นเหตุผลที่คุณจะต้องการที่จะทำเช่นนี้? มีจำนวนมากของความเป็นไปได้อยู่ หนึ่งคือการที่คุณสามารถสร้างได้อย่างสมบูรณ์ วิธีการที่แตกต่างกันของการเรียกดู เนื้อหาที่มีอยู่ ผ่านห้องสมุดฮาร์วาร์ ฉันจะแสดงให้คุณหนึ่ง ภายหลังเรียก Stacklife, ซึ่งมีความแตกต่างอย่างสิ้นเชิง ใช้เวลาในการมองหาเนื้อหา 

คุณสามารถสร้างเครื่องมือคำแนะนำ ดังนั้นห้องสมุดฮาร์วาร์ไม่ได้อยู่ใน ธุรกิจของบอกว่าคุณชอบหนังสือเล่มนี้ จากนั้นไปดูที่เหล่านี้ 17 อื่น ๆ หนังสือที่คุณอาจจะสนใจใน หรือเหล่านี้ 18 ภาพอื่น ๆ แต่ที่แน่นอนที่จะทำได้ เป็นคุณสมบัติที่มีคุณค่า และให้ข้อมูลเมตาก็อาจ จะเป็นไปได้ที่จะนำที่ร่วมกัน คุณอาจมีความต้องการที่แตกต่างกันใน แง่ของการค้นหาเนื้อหา เช่นบางทีแม้จะมีเครื่องมือที่ มีที่ห้องสมุดทำให้ สามารถใช้ได้คุณอาจต้องการ การค้นหาในทางที่แตกต่างกัน หรือเพิ่มประสิทธิภาพสำหรับกรณีที่ใช้โดยเฉพาะอย่างยิ่ง ซึ่งอาจจะเป็นเฉพาะมาก อาจจะมีเพียงไม่กี่ คนที่อยู่ในโลกที่ ต้องการค้นหาเนื้อหา ในทางนี้ แต่มัน จะดีถ้าเรา จะปล่อยให้พวกเขาทำอย่างนั้น มีจำนวนมากของการวิเคราะห์เป็น ในเวลาเพียงวิธีการที่คน ใช้เนื้อหาที่จะได้รับจริงๆ น่าสนใจที่จะรู้เกี่ยวกับการหา สิ่งที่หนังสือมีการใช้ สิ่งที่ไม่ได้และอื่น ๆ แล้วมีจำนวนมาก โอกาสที่จะบูรณาการ กับข้อมูลอื่น ๆ ที่ออกมีในเว็บ ดังนั้นเราจึง have-- 

ตัวอย่างเช่น NPR มี ส่วนการตรวจสอบหนังสือ ที่พวกเขาสัมภาษณ์ ผู้เขียนเกี่ยวกับหนังสือ และดังนั้นจึงจะดีถ้าคุณได้ มองหาหนังสือในฮาร์วาร์ ห้องสมุดและคุณบอกว่าโอเคมี รับการสัมภาษณ์กับผู้เขียน ลองไปดูที่ว่า หรือมีหน้าวิกิพีเดียเป็น อำนาจการอ้างอิงทางวิชาการ เกี่ยวกับหนังสือเล่มที่คุณนี้ อาจต้องการที่จะดูที่ 

มีเหล่านี้ประเภทของแหล่งที่มา กระจายอยู่ทั่วเว็บ และนำพวกเขาเข้าด้วยกัน อาจจะใช้งานที่ดี กับคนที่กำลังมองหาที่ เนื้อหาที่กำลังมองหาบางสิ่งบางอย่าง แต่มันก็ยังไม่ได้ ชนิดของสิ่งที่คุณต ต้องการห้องสมุดจะต้องรับผิดชอบ สำหรับการไปลงและการล่าสัตว์ลง ทั้งหมดเหล่านี้แหล่งที่มาที่แตกต่างกัน และเสียบเข้าด้วยกัน เพราะพวกเขากำลังเปลี่ยนแปลงอย่างต่อเนื่อง และสิ่งที่พวกเขาคิดว่าเป็นสิ่งสำคัญที่อาจ ไม่ได้เป็นสิ่งที่คุณคิดว่าเป็นสิ่งที่สำคัญ 

และมากขึ้นดังนั้นโดยทั่วไปมี จำนวนมากสิ่งที่เราไม่ได้คิดเลย ดังนั้นหากเราสามารถเปิดขึ้นนี้มากขึ้น คนนอกเหนือจากครึ่งโหลหรือดังนั้น ที่กำลังมองหาที่เกี่ยวกับเรื่องนี้ เป็นประจำสามารถคิดของความคิด และนวดข้อมูลและ ทำในสิ่งที่พวกเขาต้องการด้วย 

ดังนั้นเราจึงต้องการที่จะทำให้เรื่องนี้ ข้อมูลที่มีอยู่ในโลกใบนี้ ดีมีภาวะแทรกซ้อนทั้งคู่ หนึ่งคือการที่ข้อมูลเมตานี้ อยู่ในระบบที่แตกต่างกัน มันอยู่ในรูปแบบที่แตกต่างกัน ดังนั้นจึงมีการฟื้นฟูบางส่วน ซึ่งความต้องการที่จะเกิดขึ้น ซึ่งการฟื้นฟูเป็นกระบวนการของการ นำสิ่งจากรูปแบบที่แตกต่างกัน และการทำแผนที่ให้เป็นรูปแบบเดียว เพื่อให้สาขาที่จะตรงกับขึ้น 

มีข้อ จำกัด บางอย่างมีลิขสิทธิ์ ผิดปกติพอรายการแคตตาล็อก เกี่ยวกับหนังสือเล่มจะเป็นผู้รับผิดชอบสำหรับการมีลิขสิทธิ์ ดังนั้นแม้ว่าจะเป็นเพียง ข้อมูลที่ได้จากหนังสือเล่มนี้ มันมีลิขสิทธิ์ และขึ้นอยู่กับที่จริง สร้างเมตาดาต้าที่ อาจจะมีข้อ จำกัด ในการที่ สามารถกระจายมัน to-- ที่คล้ายกัน 

ฉันไม่รู้ มันอาจจะหรือไม่อาจจะคล้ายกับ สถานการณ์ของเนื้อเพลงเพลง เช่น ดังนั้นเราทุกคนรู้ว่ากระทะออก ดังนั้นคุณต้องได้รับการแก้ไขปัญหาที่ 

และจากนั้นอีกชิ้นหนึ่งคือ ว่ามีข้อมูลจำนวนมาก ดังนั้นถ้าผมคนที่ต้องการที่จะทำงาน ที่มีข้อมูลหรือมีความคิดที่เย็น การจัดการกับ 14 ล้าน บันทึกแล็ปท็อปของฉัน อาจจะมีปัญหา และยากที่จะจัดการ ดังนั้นเราจึงต้องการที่จะลด อุปสรรคสำหรับคน เพื่อให้สามารถทำงานกับข้อมูล 

ดังนั้นวิธีการที่ว่าที่อยู่หวังว่า ทั้งหมดของความกังวลเหล่านี้เป็นสองส่วน หนึ่งคือการสร้างแพลตฟอร์มที่ใช้เวลา ข้อมูลจากแหล่งที่มาที่แตกต่างกันเหล่านี้ และ aggravates มัน normalizes, เสริมสร้างมันและทำให้ มันมีอยู่ในสถานที่เดียว และก็จะทำให้มันสามารถใช้ได้ผ่าน API สาธารณะที่ผู้คนสามารถเรียก 

ดังนั้น API เป็นแอพลิเคชัน อินเตอร์เฟซการเขียนโปรแกรม และโดยทั่วไปหมายถึง ปลายทางที่ระบบหรือเทคโนโลยี สามารถโทรและได้รับข้อมูลกลับมาใน รูปแบบโครงสร้างในทาง ที่จะสามารถนำมาใช้ ดังนั้นจึงไม่ได้ขึ้นอยู่ ว่าจะไปที่เว็บไซต์ และข้อมูลการขูดออก ของมันตัวอย่างเช่น 

ดังนั้นนี่คือหน้าแรกของ ห้องสมุดเมฆรายการ API, ซึ่งเป็นหลักรุ่นสอง ดังนั้นจึงเป็นซ้ำสองของ พยายามที่จะทำให้ข้อมูลทั้งหมดนี้ ที่มีอยู่ในโลกใบนี้ ดังนั้นจึงเป็น http://api.lib.harvard.edu/v2/items และเพียงแค่นี้ที่จะทำลายลง นิด ๆ หน่อย ๆ สิ่งนี้หมายความว่า ว่าขณะนี้เป็นรุ่นที่สองของ API มีรุ่นหนึ่งซึ่ง ผมไม่อยากจะพูดคุยเกี่ยวกับ แต่มีรุ่นหนึ่ง 

และถ้าคุณกำลังเรียกร้องนี้ API คุณจะได้รับรายการ และเป็นส่วนหนึ่งของความคิดของ API เป็น API เป็นสัญญา มันเป็นสิ่งที่เป็น จะไม่มีการเปลี่ยนแปลง ดังนั้นตัวอย่างเช่น - 

และเหตุผลที่ว่าถ้าผม สร้างชนิดของระบบบางอย่างที่ จะใช้ห้องสมุดเมฆ API เพื่อแสดงหนังสือหรือช่วยให้คนหา ข้อมูลในรูปแบบที่ไม่ซ้ำกัน สิ่งที่เราไม่ต้องการให้เกิดขึ้น คือเราจะไปเปลี่ยนวิธีการ ที่ทำงาน API และก็ ทุกอย่างแตกที่ด้านข้างของผู้ใช้ ดังนั้นส่วนหนึ่งของถ้าคุณกำลังทำ API ที่มีอยู่ในโลกใบนี้ก็ การปฏิบัติที่ดีที่จะนำ หมายเลขรุ่นในนั้นเพื่อให้ประชาชน รู้ว่าสิ่งที่รุ่นที่พวกเขากำลังจัดการกับ 

ดังนั้นถ้าเราตัดสินใจที่เราพบว่าวิธีที่ดีกว่า การทำข้อมูลเหล่านี้สามารถใช้ได้ เราอาจจะเปลี่ยนที่ไป เรียกรุ่นที่สาม ดังนั้นทุกคนที่ยังคงใช้ สองรุ่นที่จะยังคงทำงาน แต่รุ่นที่สามจะ มีทุกสิ่งใหม่ ๆ 

ดังนั้นนี่คือ API แต่นี้ จริงๆดูเหมือน URL และเพื่อให้สิ่งนี้ ตัวอย่างของการเป็นสิ่งที่ เรียก API ส่วนที่เหลือซึ่งสามารถใช้ได้ มากกว่าเพียงแค่การเชื่อมต่อเว็บปกติ และคุณสามารถจริง ไปไว​​้ในเบราว์เซอร์ 

ดังนั้นที่นี่ฉันได้เปิดขึ้นเพียง Firefox และ ไป api.lib.harvard.edu/v2/items ดังนั้นสิ่งที่ฉันได้รับที่นี่เป็น พื้นหน้าแรก ผลจากทั้ง ชุดของรายการที่เรามี และมันก็เป็นที่นี่ในรูปแบบ XML และมันก็ยังคงเป็น prettified โดย Firefox มันไม่ได้จริงมีสิ่งเหล่านี้ ขยายตัวเล็กน้อยและการทำสัญญา doohickeys ที่นี่ นี่คือการจัดเรียงของดีกว่า วิธีรุ่นที่จะมองมัน 

แต่สิ่งนี้จะบอกเราก็คือ ฉันได้รับการร้องขอทุกรายการ ดังนั้นจึงมี 13,289,475 รายการ และฉันกำลังมองในตอนแรก 10 เริ่มต้นที่ศูนย์ตำแหน่ง เพราะในวิทยาการคอมพิวเตอร์ เรามักจะเริ่มต้นที่ศูนย์ และสิ่งที่ผมได้ที่นี่ถ้าฉันเพียงแค่ยุบ นี้คุณจะเห็นฉันมี 10 รายการ 

และถ้าผมจะดูที่รายการที่ฉันสามารถ เห็นว่าผมได้มีข้อมูลเกี่ยวกับเรื่องนี้ และนี่คือสิ่งที่เรียกว่ารูปแบบ MODS ดังนั้นฉันจะเปลี่ยน กลับมาที่นี่สักครู่ ตกลง 

ดังนั้นลองค้นหาสิ่งที่อยู่ใน ที่เฉพาะเจาะจงเพราะรายการแรกที่ ที่เกิดขึ้นที่จะเกิดขึ้นเมื่อคุณมอง ผ่านคอลเลกชันทั้งหมด คือโดยความหมายแบบสุ่ม เพื่อให้ดูสำหรับโดนัทบาง โอ้ 

ตกลง ดังนั้นโดนัท ดังนั้นเราจึงพบว่ามี 80 รายการใน คอลเลกชันที่อ้างอิงโดนัท เรากำลังมองหาที่ 10 อันดับแรกของพวกเขา ตอนนี้คุณสามารถดูที่นี่วิธีการที่ ฉันว่าฉันกำลังมองหาโดนัท ฉันเพิ่งเพิ่มบางสิ่งบางอย่าง สตริงแบบสอบถามของ URL ดังนั้น Q เท่ากับโดนัทที่คุณสามารถ เห็นได้ง่ายขึ้นเล็ก ๆ น้อย ๆ ที่นี่ 

และนี้โดยทั่วไปหมายถึงมี ข้อมูลจำเพาะสำหรับ API ซึ่ง กำหนดสิ่งที่ทุก พารามิเตอร์เหล่านี้หมายถึง และนั่นหมายความว่าเรากำลังจะ ค้นหาทุกอย่างสำหรับโดนัท 

ดังนั้นรายการแรกที่นี่เรามี คุณสามารถดูชื่อเป็นโดนัท, และมีคำบรรยายที่เรียกว่า อเมริกันกิเลสซึ่งเป็นฉันเดา เหมาะสม มีจำนวนมากที่ต่างออกไปคือ เมื่อคุณได้รับไปยังจุด ในการได้รับข้อมูลที่ มีจำนวนมากที่แตกต่างกัน รูปแบบที่คุณสามารถได้รับมันเป็น และมีจุดแข็งที่แตกต่างกัน และจุดอ่อนสำหรับพวกเขาทั้งหมด ดังนั้นหนึ่งนี้คุณสามารถดู ที่นี่เป็นแบบฟอร์มนี้รวยมาก และมันก็เป็นมาตรฐาน 

ดังนั้นจึงมีชื่อที่เฉพาะเจาะจง เขตข้อมูลคำบรรยาย มีทางเลือกคือ ชื่อเรื่องความรักของชาวอเมริกัน มีชื่อที่เกี่ยวข้องกับมันเป็น ประเภทของทรัพยากรเป็นข้อความ มีข้อมูลจำนวนมากเป็น ที่นี่ในรูปแบบนี้ 

แต่มีพวง รูปแบบที่แตกต่างกันของ ดังนั้นสิ่งที่เราเป็นเพียงแค่ กำลังมองหาที่เป็นรูปแบบ เรียกว่า MODS ซึ่งย่อมาจาก Metadata บริการคำอธิบายวัตถุ ที่อาจเกิดขึ้น ฉันจริงไม่แน่ใจเกี่ยวกับ เอส แต่มันเป็นรูปแบบที่ค่อนข้างซับซ้อน มันเป็นรูปแบบเริ่มต้น 

แต่ก็เป็นหนึ่งที่ช่วยให้ ความอุดมสมบูรณ์ของข้อมูลทั้งหมด ที่ห้องสมุดมีเพราะ มันใกล้มากกับสิ่งที่ ห้องสมุดใช้ภายใน มันเป็นมาตรฐานที่เป็น ที่ใช้ทั่วประเทศ ทั่วโลกในห้องสมุดวิชาการ และก็ทำงานร่วมกันมาก ดังนั้นถ้าคุณได้มีเอกสาร ที่อยู่ในรูปแบบ MODS, คุณสามารถให้ที่ให้กับคนอื่น มีระบบเข้าใจ MODS, และพวกเขาสามารถนำเข้า ดังนั้นจึงเป็นมาตรฐาน มันกำหนดไว้เป็นอย่างดีที่เฉพาะเจาะจงมาก และนั่นคือสิ่งที่ทำให้มัน ทำงานร่วมกันเพราะถ้ามีคนบอกว่า นี้เป็นชื่ออื่นของ บันทึกทุกคนรู้ว่าสิ่งที่หมายความว่า ในอีกด้านหนึ่งก็มีความซับซ้อนมาก 

ดังนั้นถ้าคุณจะดู ที่บันทึกนี้ที่นี่ ถ้าฉันเพียงแค่ต้องการที่จะได้รับ ชื่อของเอกสารนี้ ของหนังสือเล่มนี้ซึ่งน่าจะเป็นโดนัท, กิเลสอเมริกันแยกมันออกมา เป็นเพียงเล็กน้อยที่เกี่ยวข้อง ในขณะที่มีอีก รูปแบบที่เรียกว่าดับลินคอร์, ซึ่งเป็นมากในรูปแบบที่ง่ายมาก 

และเพื่อให้คุณดูที่นี่ไม่มี ชื่อคำบรรยายชื่อสำรอง มีเพียงชื่อของ, โดนัท, กิเลสอเมริกัน และชื่ออื่นกิเลสอเมริกัน ดังนั้นเมื่อคุณกำลังมองหาที่สิ่งที่รูปแบบ คุณต้องการที่จะได้รับข้อมูลที่ออกมาจาก มากขึ้นอยู่กับวิธีการ คุณกำลังจะใช้มัน ที่ใช้สำหรับ การทำงานร่วมกันหรือไม่หรือคุณ ต้องการสิ่งง่ายๆที่ อาจจะง่ายต่อการทำงานด้วย? 

ด้านพลิกจำนวนมาก รายละเอียดได้รับการจัดเรียงของ squished ลง คุณอาจสูญเสียความแตกต่างของ สิ่งที่หมายถึงสาขาเฉพาะ ถ้าคุณกำลังติดต่อกับดับลินคอร์, ซึ่งคุณจะไม่ได้รับกับ MODS ดังนั้นผู้มีสองรูปแบบ คุณจะได้รับจาก API และโดยทั่วไปเราจะรักษา มันอยู่เบื้องหลังใน MODS แต่เราสามารถให้คุณใน MODS และ ดับลินคอและสิ่งอื่น ๆ ได้เป็นอย่างดี การพิจารณาอื่น ๆ เมื่อ คุณกำลังมองหาในข้อมูล คุณจะได้รับมันเป็นทั้ง JSON ซึ่ง ย่อมาจาก JavaScript Object สัญลักษณ์, หรือ XML ซึ่งย่อมาจาก Extensible Markup Language และการแสดงข้อมูลเหล่านี้ทั้งสอง ได้ว่าข้อมูลเดียวกันว่า สาขาเดียวกัน แต่พวกเขากำลังเพียง ไวยากรณ์ที่แตกต่างกัน 

ดังนั้นนี่คือเเรก ดีขอเพียงแค่สลับ ดังนั้นนี่คือแบบสอบถามของเราสำหรับ โดนัทในรูปแบบ XML ถ้าฉันเพียงแค่เปลี่ยนนี้จะเป็น JSON, ฉันสามารถดูได้ลักษณะที่แตกต่างกัน ดังนั้นตอนนี้เป็นเนื้อหาเดียวกัน แต่โครงสร้างที่แตกต่างกัน มีน้อยวงเล็บมุมเป็น มีน้อย verbose เป็น 

และนี่คือรูปแบบที่ถ้าคุณ กำลังทำงานอยู่ในสภาพแวดล้อมที่เว็บ คุณจะมีโอกาสมากที่สุดที่จะ เพื่อต้องการที่จะใช้เพราะหนึ่ง ในสิ่งที่ดีเกี่ยวกับ JSON เป็น มันเข้ากันได้กับ JavaScript ดังนั้นถ้าผมเขียน app เว็บผมสามารถดึง ใน JSON และเพียงแค่ทำงานกับมันโดยตรง ในขณะที่มี XML มัน นิด ๆ หน่อย ๆ ที่ซับซ้อนมากขึ้น ดังนั้นอีกครั้งเหล่านี้มีทั้งที่มีประโยชน์ พวกเขาก็มีกรณีการใช้งานที่แตกต่างกัน ที่ผู้คนอาจต้องการที่จะใช้พวกเขา ตกลง เพื่อกลับไป API ดังนั้นเราจึงสามารถค้นหา for-- 

ผมให้ตัวอย่างของ ค้นหาโดนัท นอกจากนี้เรายังสามารถค้นหาเพียงแค่ใน โดยเฉพาะอย่างยิ่งข้อมูลภายในที่นี่ ดังนั้นแทนที่จะค้นหา บันทึกทั้งหมด ฉันเพียงแค่สามารถค้นหาข้อมูลชื่อ ดังนั้นตอนนี้มี 25 สิ่งที่ มีโดนัทในชื่อหนึ่งซึ่ง เป็นเรื่องเกี่ยวกับการฟื้นฟู พื้นที่ชุ่มน้ำในการบริหารจัดการ ของหลุมในโดนัท โปรแกรมซึ่งอาจเป็น ไม่จำเป็นต้องเป็นสิ่งที่เรากำลังมองหา เมื่อเรากำลังมองหาโดนัท 

คุณยังสามารถเมื่อคุณอยู่ จัดการกับ API-- 

ส่วนหนึ่งของการมี API คือการให้ คนเข้าถึงชุดข้อมูลขนาดใหญ่ และมีคู่ที่แตกต่างกัน เครื่องมือที่คุณสามารถใช้ในการทำเช่นนั้น หนึ่งคือมากเพียงคุณ สามารถหน้าผ่านข้อมูล ดังนั้นเช่นเดียวกับถ้าคุณทำแบบสอบถาม ผ่านเว็บอินเตอร์เฟส, คุณสามารถดูที่หน้าหนึ่ง หน้าสองหน้าสาม คุณสามารถทำเช่นเดียวกัน สิ่งที่ผ่าน API คุณเพียงแค่จะต้องมีการ อย่างชัดเจนในวิธีที่คุณทำมัน 

ดังนั้นสำหรับตัวอย่างเช่นถ้าฉันกำลังมองหา ที่แบบสอบถามครั้งแรกของฉันที่นี่ ที่ฉันทำค้นหาสำหรับสิ่งที่ กับโดนัทในชื่อเรื่องผมสามารถพูดได้ว่า และ จำกัด เท่ากับ 20 ซึ่งหมายความว่า ให้ฉันแรก 20 บันทึกไม่ได้ 10 อันดับแรกซึ่งเป็นค่าเริ่มต้น เพราะผมต้องการที่จะดูที่ 20 ในเวลา หรือฉันสามารถพูดได้ตั้งค่า เริ่มต้นเท่ากับ 20 และขีด จำกัด เท่ากับ 20 ซึ่งจะให้ ฉันบันทึก 21 ถึง 40 

ดังนั้นผมคิดว่าสิ่งที่ ที่จะไปที่นี่ ที่เรากำลังใช้สตริงแบบสอบถาม การตั้งค่าพารามิเตอร์ในแบบสอบถาม และมันช่วยให้คุณควบคุม สิ่งที่คุณจะได้รับกลับมา 

เป็นอีกเครื่องมือหนึ่งที่คุณสามารถใช้ - 

และนี่คือจริงๆเป็นประโยชน์ในการ แง่ของการสำรวจข้อมูล 

--is สิ่งที่เรียกว่า Faceting ดังนั้น Faceting ระยะคือ ไม่จำเป็นต้องร่วมกัน แต่คุณเคยเห็นมาก่อน ถ้าคุณดูที่ Amazon เช่น และคุณจะค้นหา โดนัทในหนังสือ ที่นี่พวกเขาได้มีชุดของหนังสือ และพวกเขากำลังจัดกลุ่มตามประเภท และคุณได้รับประเภทที่แตกต่างกัน และวิธีการหลายเล่มในแต่ละประเภท แสดงขึ้นมา 

ดังนั้นนี่เป็นพื้นด้าน คุณจะใช้หนังสือของพวกเขาทั้งหมด 1,800 หนังสือที่ตรงกับโดนัทที่ Amazon 12 ของพวกเขาใน ประเภทอาหารเช้า 21 ในขนมและเบเกอรี่ และอื่น ๆ และอื่น ๆ 

ดังนั้นนี้เป็นจริงที่มีประโยชน์ เครื่องมือสำหรับการสำรวจเนื้อหา ภายในห้องสมุดได้เป็นอย่างดี เพราะเมื่อคุณมองไปที่ด้าน, มันจะช่วยให้คุณมีความคิดของสิ่งที่วิชา ที่มีอยู่เช่นเดียวกับสิ่งที่ประเภทของอาสาสมัคร เป็นที่นิยมมากที่สุดภายในชุดคำค้นหาของคุณ และมันจะช่วยให้คุณขับรถออกไปและสำรวจ เพื่อให้เราสามารถทำสิ่งเดียวกัน 

ถ้าเราต้องการที่จะใช้ API และมองไปที่ทุกแง่มุม เราเพิ่มพารามิเตอร์ไปยังอีก เพื่อนของเราสตริงแบบสอบถาม ดังนั้นแง่มุมเท่ากับคั่นด้วยเครื่องหมายจุลภาค รายการของสิ่งที่เราต้องการที่จะด้านบน ดังนั้นหนึ่งในแง่มุมที่อาจมี อีกประการหนึ่งที่อาจจะเป็นภาษา ดังนั้นถ้าเราเรียกใช้แบบสอบถามที่เรา get-- มันดูสวยมากเหมือนกันที่นี่ แต่เราได้เพิ่มเข้าไปในท้ายที่สุด ของรายการชุดของแง่มุม ดังนั้นเราจึงมีแง่มุมที่เรียกว่าเรื่อง ดังนั้นนี่จะบอกเราว่าถ้าฉันมอง ที่ 80 ผลของฉันจากแบบสอบถามโดนัท, 13 ของพวกเขามี เรื่องสหรัฐอเมริกา สามมีโดนัทเรื่อง มีสามเรื่อง การฟื้นฟูพื้นที่ชุ่มน้ำ ซึ่งอาจจะเป็นหลุมของเราในโดนัท สองของพวกเขา, ซิมป์สัน, และอื่น ๆ และอื่น ๆ 

ดังนั้นนี้จะมีประโยชน์ถ้าคุณ ต้องการที่จะแคบลงการค้นหาของคุณ มันสามารถช่วยให้คุณทำ โดยเฉพาะอย่างยิ่งถ้าคุณมี มากกว่าพูด, 80 

ในทำนองเดียวกันเรายังถาม สำหรับแง่มุมเกี่ยวกับภาษา ดังนั้นถ้าเรามองไปที่ผลของเราเราจะเห็น 76 ของพวกเขาในอังกฤษสี่ในฝรั่งเศส สองในภาษาสเปนสองผมคิดว่าเป็น ไม่ได้กำหนดหรือไม่ทราบดัตช์และภาษาลาติน ดังนั้นผมจึงคิดว่าละติน ผลโดนัทอีกครั้ง มีอะไรจะทำอย่างไรกับขนมอบ แต่มีคุณไป 

ดังนั้นนี้จะเรียงลำดับของการแสดงให้คุณเห็น วิธีการที่คุณสามารถดึงเนื้อหากลับ จาก API เพียงแค่ผ่าน เว็บเบราเซอร์ซึ่งเป็นที่ดี แต่มันไม่ได้จริงๆสิ่งที่คุณจะ ปกติจะใช้ใน API สำหรับมัน ดังนั้นหนึ่งในตัวอย่างของวิธีการที่คุณ จริงอาจทำเช่นนี้คือฉัน เขียนโปรแกรมขนาดเล็กสุด ซึ่งอีกครั้งจะค้นหาโดนัทของฉัน และเลือกสาขาคู่ และแสดงไว้ในตาราง ดังนั้นนี้เป็นอย่างมาก เนื้อหาเดียวกับที่เราเพียงแค่ เลื่อยที่มีเขตข้อมูลไม่กี่ดึงออกมา ดังนั้นรายการชื่อเรื่อง สถานที่ตั้งของสิ่งที่หนังสือเล่มนี้ เป็นเรื่องเกี่ยวกับภาษา และอื่น ๆ และอื่น ๆ 

ดังนั้นวิธีการนี​​้เกิดขึ้นจริงเนื่องจาก ผมคิดว่าเราต้องมองไปที่รหัสบางอย่าง เท่าไหร่ 

สิ่งที่เรามีที่นี่เป็น HTML ง่ายๆ หน้าซึ่งจะแสดงข้อความ ยินดีต้อนรับสู่คลาวด์และห้องสมุด แล้วแสดงตารางผล และมีผลอย่างเห็นได้ชัดใน ตารางเมื่อเพจที่ได้รับการโหลด แต่สิ่งที่เรากำลังทำ เป็นครั้งแรกของทั้งหมดเรา มีการโหลดห้องสมุดที่เรียกว่า jQuery ซึ่งเป็นพื้น ห้องสมุด JavaScript, ซึ่งทำให้มัน ง่ายมากที่จะจัดการกับ JavaScript กำเนิด, HTML และสร้างหน้าเว็บ ตรรกะฝั่งไคลเอ็นต์และหน้าเว็บ 

ดังนั้นสิ่งที่เรามีที่นี่เป็น jQuery มีวิธีการที่เรียกว่าได้รับ, ซึ่งเป็นหลักที่จะไป URL ซึ่งในกรณีนี้ นี่คือ URL มอง​​คุ้นเคย และจากนั้นก็จะได้รับข้อมูลจาก URL ที่และเรียกใช้ฟังก์ชั่นที่มัน ดังนั้นเราจึงกล่าวไป api.lib.harvard / edu ค้นหาโดนัท ให้เรา 20 ระเบียน และเรียกใช้ฟังก์ชั่นนี้ซึ่ง ฉันได้เลือกผ่านมันข้อมูล และข้อมูลที่เป็น JSON ที่ ได้กลับมาจาก API 

และจากนั้นเรากำลังจะบอกว่าภายในว่า ข้อมูลที่มีข้อมูลที่เรียกว่ารายการ และถ้าเราไปใช้เวลามองย้อนกลับไปที่ หนึ่งในผลลัพธ์เหล่านี้ที่นี่ มีอะไรบางอย่าง called-- 

ดีก็เรียกว่ารายการ ดังนั้นที่อาจเป็นไปได้ว่า และสิ่งที่มันไม่ได้เป็น ผ่านไปแต่ละรายการ แล้วเรียกอีก ฟังก์ชั่นในแต่ละรายการ และฟังก์ชั่นที่พื้น คือการค่า ของรายการซึ่งเป็น เป็นหลักบันทึกของแต่ละบุคคล และช่วยให้เราสามารถดึงออกชื่อ ความคุ้มครองและการใช้ภาษา 

ดังนั้นเราเรียกฟังก์ชั่นในทุก รายการที่เราได้กลับมาจาก API และถ้าคุณเพียงแค่ใช้เวลาดู ที่งานชิ้นนี้ได้ที่นี่ สิ่งที่เรากำลังทำอยู่ เรากำลังสร้างสตริง ซึ่งเป็นหลักบางส่วนมาร์กอัป HTML รอบโต๊ะกับ value.title, ซึ่งเป็นชื่อของ วัตถุ value.coverage, ซึ่งเป็นความคุ้มครอง - 

และเรากำลังทำตรวจสอบ ที่นี่เพื่อดูว่ามีใครที่ไม่ได้กำหนด และซ่อนมันถ้ามันบอกว่าไม่ได้กำหนด เพราะเราไม่ได้สนใจจริงๆ ในการที่ 

--and แล้วภาษา และแล้วสิ่งที่เรากำลัง ทำคือการผนวกที่ ไปที่โต๊ะที่มี ระบุสตริงที่นี่ และวิธีการทำงาน jQuery นี้คือสิ่งที่จะพูด จะมองหาตารางที่มีความคิด ผลและเพิ่มข้อความนี้ไป และนี่คือตารางที่มีผลความคิด ดังนั้นสิ่งที่คุณจะจบลง กับเป็นหน้านี้ที่นี่ และเพื่อที่จะดู source-- ดีที่มาไม่จริง ปรับปรุงเมื่อที่เกิดขึ้น ดังนั้นคุณจะเห็นที่เกิดขึ้นจริง ผลของตารางที่นี่ว่า 

ดังนั้นนี่เป็นเพียงตัวอย่างง่ายๆของ การทำแบบสอบถามพื้นฐานมากกับ API และแสดงข้อมูลในบางอื่น ๆ รูปแบบและไม่ได้ทำอะไรแฟนซีเกินไป ตอนนี้เป็นอีกตัวอย่างหนึ่งเช่น การประยุกต์ใช้เขียนขึ้นโดยเดวิดไวน์เบอร์เกอร์ เป็นตัวอย่างของนี้ซึ่ง เป็นหลักแสดงให้คุณเห็น วิธีที่คุณสามารถป่นขึ้นผลลัพธ์ที่คุณกำลัง ที่ได้รับจากห้องสมุดเมฆ API กับพูดว่า Google หนังสือ 

และความคิดที่นี่คือการที่ฉันสามารถ เรียกใช้แบบสอบถามกับ Google หนังสือ, ได้รับการค้นหาข้อความเต็มรูปแบบได้รับผลบางอย่าง ย้อนกลับไปหาที่ของรายการเหล่านั้น จริงที่มีอยู่ใน Hollis, ระบบห้องสมุด แล้วให้ฉันเชื่อมโยง กลับไปที่รายการเหล่านั้น ดังนั้นถ้าฉันค้นหาก็คือ คืนที่มืดและมีพายุฉัน รับกลับพวงของผล จาก Google และจากนั้นหนึ่งในผล ซึ่งเป็นริ้วรอยในเวลา และสิ่งเหล่านี้มีการเชื่อมโยงไปยังหนังสือที่มีอยู่ ในระบบห้องสมุดฮาร์วาร์ 

ดังนั้นผมคิดว่าจุดที่นี่ไม่ได้ มากว่านี้อาจจะหรืออาจจะไม่ เป็นวิธีการที่คุณต้องการ เพื่อค้นหาห้องสมุด แต่มันเป็นเรื่องที่แตกต่างกันอย่างสิ้นเชิง วิธีการที่ไม่สามารถใช้ได้กับคุณ ก่อนเช่นคุณมีวิธีการทำไม่ ค้นหาข้อความเต็มในหนังสือว่าแม้ เป็นส่วนหนึ่งของระบบห้องสมุดฮาร์วาร์ ดังนั้นตอนนี้เป็นวิธีที่ ที่คุณสามารถทำเช่นนั้นได้ และคุณสามารถแสดงไว้ใน สิ่งที่รูปแบบที่คุณต้องการ ดังนั้นจุดที่นี่เป็นพื้น เรากำลังเปิดขึ้นวิธีการใหม่สำหรับคน ทำงานกับข้อมูล 

ชิ้นส่วนของเมฆห้องสมุดก็คือว่า มันจะช่วยให้เปิดเผยบางส่วนของข้อมูลการใช้งาน ที่ห้องสมุดมี ดังนั้นถ้าคุณไปที่ห้องสมุด และคุณกำลังมองหาหนังสือ คุณไม่จำเป็นต้อง จริงมีความคิดของ, สำหรับรายการทั้งหมดใน เรื่องโดยเฉพาะอย่างยิ่งสิ่งที่ เป็นคนที่อยู่ใน ชุมชนไม่ว่าจะเป็น กำหนดให้เป็นฮาร์วาร์หรือ ประเทศหรือระดับของคุณ สิ่งที่พวกเขาพบว่ามีประโยชน์มากที่สุด? และห้องสมุดจริงมี ตันของข้อมูลเกี่ยวกับสิ่งที่ มีประโยชน์มากที่สุดเพราะถ้ามาก ของคนที่ได้รับการตรวจสอบจากหนังสือ ที่จะบอกคุณบางสิ่งบางอย่าง ต้องมีเหตุผลบางอย่าง พวกเขาต้องการที่จะตรวจสอบออก ผู้คนจำนวนมากใส่ไว้ในทุนสำรอง 

ถ้ามันอยู่ในรายชื่อสำรองสำหรับจำนวนมาก ของการเรียนที่จะบอกคุณบางสิ่งบางอย่าง หากคณะกรรมการจะตรวจสอบมัน ออกมากและนักศึกษาระดับปริญญาตรีไม่ได้ ที่จะบอกอะไรบางอย่าง ในทางกลับกันที่ยัง บอกคุณบางสิ่งบางอย่าง ดังนั้นมันจะน่าสนใจที่จะ นำข้อมูลที่ออกมีและให้ คนใช้มันเพื่อช่วยให้พวกเขาพบ ทำงานภายในระบบห้องสมุด พลิกด้านนี้คือ มีบางส่วนที่เป็นส่วนตัวอย่างจริงจัง ความกังวลเพราะหนึ่ง หลักคำสอนหลักของห้องสมุด คือเราจะไม่บอก คนสิ่งที่คนอื่นกำลังอ่าน และแม้ว่าคุณจะพูดนี้ หนังสือเล่มนี้ได้รับการตรวจสอบออกมาสี่ครั้ง ในเดือนที่โดยเฉพาะอย่างยิ่ง ที่สามารถนำมาใช้ ที่จะเชื่อมโยงกลับไปโดยเฉพาะอย่างยิ่ง บุคคลโดยข้อมูล de anonymizing และหาว่าใครตรวจสอบออก ดังนั้นวิธีการที่เราสามารถ avoid-- วิธีการที่เราสามารถพยายามที่จะดึง สัญญาณจากข้อมูลทั้งหมด โดยไม่ละเมิด ใครละเมิดความเป็นส่วนตัว เป็นหลักที่เรามอง 10 ปีของข้อมูลการใช้งาน - 

ดังนั้นจึงเป็นช่วงเวลาที่ยาวนานของเวลา 

--and บอกว่าโอเคเรามาดูวิธี หลายครั้งที่งานนี้ถูกนำมาใช้ และโดยที่ในช่วงนี้ ของเวลาและโดยทั่วไปแล้ว ให้กลับจำนวนที่เราเรียกว่า คะแนนกองที่พื้น แสดงให้เห็นถึงวิธีการมากก็ถูกนำมาใช้ และที่ number-- จำนวนมากของการคำนวณที่แตกต่างกัน ไปเป็นตัวเลขที่ --but มันหยาบมาก ตัวชี้วัดที่ช่วยให้คุณ ความคิดของวิธีบาง ชุมชนอาจจะให้ความสำคัญกับการทำงานที่ 

และเพื่อให้การจัดเรียงของแม้อื่น เพิ่มเติมโป่งพองออกมาประยุกต์ใช้ ที่ใช้ประโยชน์ นี้คือสิ่งที่ เรียกว่า Stacklife ที่เป็นจริง พร้อมใช้งานผ่านฮาร์วาร์หลัก พอร์ทัลห้องสมุด ดังนั้นคุณจะไป library.harvard.edu คุณจะเห็นจำนวนของที่แตกต่างกัน วิธีการค้นหาห้องสมุด และหนึ่งในนั้นมีชื่อเรียกว่า Stacklife 

และนี่เป็นโปรแกรมที่ เรียกดูเนื้อหาของห้องสมุด แต่ถูกสร้างขึ้นอย่างสมบูรณ์ ด้านบนของ API เหล่านี้ จึงไม่มีสิ่งที่พิเศษ เกิดขึ้นเบื้องหลัง มีการเข้าถึงไม่ได้ ข้อมูลที่คุณจะได้ไม่ต้อง มันใช้ API ที่จะให้คุณ กับการเรียกดูที่แตกต่างกันอย่างสิ้นเชิง ประสบการณ์ 

ดังนั้นถ้าฉันค้นหาอลิซ ในดินแดนมหัศจรรย์ในกรณีนี้ ฉันจะได้รับผลที่มีลักษณะเช่น นี้ซึ่งเป็น much-- สวย 

มันคล้ายกับค้นหาอื่น ๆ คุณอาจจะยกเว้นในกรณีนี้ เรากำลังจัดอันดับรายการโดย stackscore ซึ่งจะช่วยให้คุณ ความคิดของวิธียอดนิยมเหล่านี้บางส่วน รายการที่อยู่ภายในชุมชน และเพื่อให้เห็นได้อย่างชัดเจน, อลิซในแดนมหัศจรรย์ โดยวอลท์ดิสนีย์ได้รับความนิยมอย่างสูง แต่คุณยังสามารถดูด้านบนสี่ ที่นี่จะเป็นคนที่คุณอาจไม่ได้ที่จริง 

สิ่งที่ถูกนำมาใช้อย่างมาก แต่คุณอาจไม่ได้ทันที เชื่อมต่อกับอลิซในแดนมหัศจรรย์ ดังนั้นเพื่อนเก่าของเรา ข้อเขียนของอลิซอยู่ที่นี่ ดังนั้นผมจึงสามารถดูที่มัน และตอนนี้สิ่งที่ฉันกำลังมองหา ที่เป็นพื้นตั้งเเล้ ฉันจะมีข้อเขียน อลิซที่นี่ ผมมีข้อมูลเกี่ยวกับเรื่องนี้ และผมยังมี stackscore ของในกรณีนี้, 26 และนี่บอกฉันเรียงลำดับของประมาณ วิธีการที่เราได้ไป stackscore นี้ เช่นเดียวกับที่ตรวจสอบออกเช่นวิธี หลายครั้งก็คือการตรวจสอบออก เช่นเดียวกับคณะนักศึกษาระดับปริญญาตรีหรือวิธี หลายเล่มที่ห้องสมุดมี และอื่น ๆ และอื่น ๆ 

และคุณยังสามารถที่น่าสนใจพอ ที่นี่เรียกดูกองจริง ดังนั้นข้อมูลที่นี่นี้ มีการแสดงคุณเรียงลำดับ ของการเป็นตัวแทนเสมือน ของสิ่งที่อาจจะเก็บรักษา ลักษณะเช่นถ้าคุณจะใช้เวลา ถือครองทั้งหมดของห้องสมุด และทำให้พวกเขาอยู่ด้วยกัน บนหิ้งที่ไม่มีที่สิ้นสุดหนึ่ง และสิ่งที่ดีคือการที่เรา can-- 

ครั้งแรกของทั้งหมด เมตาดาต้าที่เกี่ยวกับหนังสือเหล่านี้ มักจะบอกคุณเมื่อมันถูกตีพิมพ์ มันจะบอกคุณกี่หน้าก็มี มันอาจจะบอกคุณขนาด ดังนั้นคุณจะเห็นที่สะท้อนให้เห็นที่นี่ ในแง่ของขนาดของหนังสือ 

แล้วเราสามารถใช้ สแต็คคะแนนที่จะเน้น หนังสือที่มีคะแนนสแต็คที่สูงขึ้น ดังนั้นถ้าหากมันเป็นสีเข้มก็หมายความว่า สันนิษฐานว่ามันถูกใช้บ่อยครั้งมากขึ้น ดังนั้นในกรณีนี้ผม จะเดาว่านี้ เป็นรุ่นของ Alice in Wonderland ที่เป็นที่นิยมใช้มากที่สุดและมากที่สุด เข้าถึงห้องสมุด มีสำเนาที่สุดของ ดังนั้นหากคุณกำลังมองหา อลิซในแดนมหัศจรรย์, นี้อาจจะเป็นสถานที่ที่ดีที่จะเริ่มต้น 

และแล้วที่นี่คุณยังสามารถเชื่อมโยงออก ที่จะพูด, Amazon ที่จะซื้อหนังสือเล่มนี้ และอื่น ๆ และอื่น ๆ จุดที่นี่อีกครั้ง ไม่ได้มากว่านี้ เป็นวิธีที่ดีที่สุดเพื่อเรียกดูห้องสมุด หรือเครื่องมือที่เหมาะสมสำหรับทุกโอกาส แต่มันเป็นวิธีการที่จะทำมันอีก และโดยการทำข้อมูล พร้อมใช้งานผ่าน API ซึ่ง ทำจากหน่วยการสร้างที่ง่ายมาก ซึ่งจะช่วยให้คุณสามารถค้นหาเนื้อหา คุณสามารถสร้างบางสิ่งบางอย่าง เช่นนี้ที่สามารถ เป็นพิเศษ มีคุณค่าให้กับคนบางคน 

นั่นคือการจัดเรียงของมากที่สุดเท่าที่ฉันต้องการ ที่จะบอกว่าจริงๆเกี่ยวกับสิ่งที่ API เป็น และสิ่งที่มันก็หมายความว่ามีทั้ง พวงของสิ่งที่อยู่เบื้องหลังซึ่ง ฉันแค่จะไปสัมผัสกับเวลาสั้น ๆ เพียงเพราะการจัดเรียงของมานี้ จากมุมที่แตกต่างกันอย่างสมบูรณ์ใน แง่ของวิธีการทำอะไรบางอย่างเช่นนี้ ได้รับการใส่ลงไปในสถานที่? 

ดังนั้น API เป็นมาตรฐาน อินเตอร์เฟซให้กับทุกเนื้อหานี้ แต่การที่จะได้รับมันที่นั่น สิ่งแรกที่เราต้องทำ ถูกดึงข้อมูลร่วมกัน หนังสือและภาพ และช่วยหาคอลเลกชัน เอกสารจากระบบฮาร์วาร์ต่างๆ Aleph, VIA และ OASIS เป็น ชื่อของระบบ และพวกเขาเป็นหลักไปสู่ ท่อท่อการประมวลผล 

ดังนั้นครั้งแรกของทั้งหมดที่เราได้รับการส่งออก ไฟล์จากทั้งหมดของระบบเหล่านี้ เราแบ่งออกเป็นแต่ละรายการ ดังนั้นเราจึงมีไฟล์ซึ่งเป็นกิกะไบต์, ซึ่งมีล้านแผ่นในนั้น ดังนั้นเราจึงแบ่งมันออกเป็นแต่ละรายการ แล้วสำหรับแต่ละรายการเราแปลงเป็น เป็น MODS เพราะบางส่วนของเหล่านี้ มีกำเนิด MODS บางส่วนของพวกเขาไม่ได้ ดังนั้นเราจึงได้รับพวกเขาทั้งหมด จะอยู่ในรูปแบบเดียวกัน จากนั้นก็มีต่างๆ ขั้นตอนการตกแต่งที่ เราเพิ่มข้อมูลเพิ่มเติมข้อมูล กว่าที่มีอยู่ในห้องสมุด ดังนั้นเราจึงจำเป็นต้องเพิ่มครั้งแรกของทั้งหมด เรามีสิ่งที่ห้องสมุดถือมัน เราไปผ่านขั้นตอนของ คำนวณ stackscore เราไปผ่านขั้นตอนของอีก เพิ่มเมตาดาต้าที่มากขึ้นในแง่ ของสิ่งที่คนคอลเลกชัน อาจเพิ่มเจ้านี่ 

คนกำลังสร้าง คอลเลกชันของรายการ สิ่งที่คอลเลกชันที่ไม่ได้เป็นของใคร? มีวิธีการที่ผู้คนที่ติดแท็ก เนื้อหานี้ในอดีต? แล้วคุณกรองและคุณ จำกัด บันทึกเพราะที่ผมกล่าวถึง มีข้อมูลบางส่วนว่าเพราะ เหตุผลที่มีลิขสิทธิ์เราไม่สามารถแสดง และจากนั้นเราโหลดพวกเขา เป็นสิ่งที่เรียกว่า Solr ซึ่งไม่ได้สะกดผิด แต่ เป็นชื่อของชิ้นส่วนของซอฟต์แวร์ ที่จะจัดทำดัชนีการค้นหาซึ่ง ไดรฟ์ทั้งหมดการค้นหาที่อยู่เบื้องหลัง API และจากนั้นก็จะมีการ API และคนที่สามารถใช้งานได้ 

ดังนั้นนี้เป็นเหมือนอย่างเป็นธรรม กระบวนการที่ซับซ้อน หนึ่งที่น่าสนใจ สิ่งที่เกี่ยวกับมัน ที่เรากำลังเผชิญ 13 ล้านแผ่น และเรากำลังจะได้รับการติดต่อหรือมากกว่า และเราต้องการที่จะสามารถที่จะจัดการกับ เหล่านี้ในแฟชั่นที่ค่อนข้างรวดเร็ว มันต้องใช้เวลานานในการ ดำเนินการ 13 ล้านระเบียน 

ดังนั้นวิธีการที่ท่อนี้ ตั้งค่าคือการที่คุณ can-- ผมคิดว่าประโยชน์จาก ท่อปัญหาที่เรา พยายามที่จะแก้ปัญหาที่นี่คือ แปลงทั้งหมดทั้งหมด ขั้นตอนเหล่านี้ในเรื่องนี้ ท่อจะแยกกันไม่ออก มีการพึ่งพาไม่ได้ หากคุณกำลังประมวลผล บันทึกของหนังสือเล่มหนึ่ง, มีการพึ่งพาไม่มี ว่าระหว่างหนังสืออีกเล่มหนึ่ง 

ดังนั้นสิ่งที่เราสามารถทำได้คือโดยทั่วไป ในขั้นตอนในท่อแต่ละ เราใส่มันลงไปในคิวในเมฆ ฉันเกิดขึ้นจะต้องอยู่บน Amazon Web Services ดังนั้นจึงมีรายชื่อ, บอกว่า 10,000 รายการที่ จะต้องมีความปกติและ แปลงเป็นรูปแบบ MODS และเราหมุนเป็นเซิร์ฟเวอร์จำนวนมาก ตามที่เราต้องการอาจจะ 10 เซิร์ฟเวอร์ และแต่ละเซิร์ฟเวอร์เหล่านั้นเพียงแค่ นั่งอยู่ที่นั่นดูในคิวที่ เห็นว่ามีสิ่งหนึ่งที่ต้อง ต้องดำเนินการดึงมันออกคิว กระบวนการนั้นและ sticks มันในคิวต่อไป 

ดังนั้นสิ่งที่ช่วยให้เรา ทำคือการใช้เป็นหลัก เป็นฮาร์ดแวร์มากเท่าที่เราต้องการนี​​้ ปัญหาเป็นระยะเวลาที่สั้นมากของเวลา การประมวลผลข้อมูลได้อย่างรวดเร็ว เป็นไปได้ซึ่งเป็นสิ่งที่เท่านั้น ขณะนี้อยู่ในโลกของคอมพิวเตอร์เมฆ เราสามารถเซิร์ฟเวอร์บทบัญญัติหลัก ทันทีคือการที่มีประโยชน์ ดังนั้นเราจึงไม่จำเป็นต้องมี เซิร์ฟเวอร์ยักษ์นั่งรอบ ตลอดเวลาที่จะทำการประมวลผล ที่อาจจะเกิดขึ้นเพียงสัปดาห์ละครั้ง 

เพื่อให้เป็นส่วนใหญ่มัน มีเอกสารที่มีอยู่เป็น สำหรับห้องสมุดเมฆรายการ API ที่ URL นี้ซึ่งจะ สามารถใช้ได้ในภายหลัง และกรุณ​​าไปดูที่ เพื่อดูว่ามีอะไร คุณมีความคิดใด ๆ เล่นกับมัน เกลือกกลั้ว และหวังว่าคุณสามารถเข้ามา กับสิ่งที่ดี ขอบคุณ