1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 เจฟฟรีย์ LICHT: สวัสดี 3 00:00:12,370 --> 00:00:13,550 ฉันเจฟฟรีย์ Licht 4 00:00:13,550 --> 00:00:17,890 และฉันที่นี่เพื่อพูดคุยกับคุณเกี่ยวกับ ฮาร์วาร์ห้องสมุดและอาคารของวันพรุ่งนี้ 5 00:00:17,890 --> 00:00:20,870 ห้องสมุดในวันนี้ผมคิดว่า 6 00:00:20,870 --> 00:00:23,040 ดังนั้นพื้นหลังที่นี่ สนามสำหรับการประชุมครั้งนี้ 7 00:00:23,040 --> 00:00:26,930 เป็นหลักว่ามี ข้อมูลจำนวนมากบรรณานุกรม 8 00:00:26,930 --> 00:00:28,400 ที่มีอยู่ในห้องสมุดฮาร์วาร์ 9 00:00:28,400 --> 00:00:33,434 และมีโอกาส ผ่านบางส่วนของเครื่องมือ 10 00:00:33,434 --> 00:00:36,350 และโครงการที่ได้รับการพัฒนา ที่จะได้รับการเข้าถึงข้อมูล 11 00:00:36,350 --> 00:00:42,430 และนำไปสถานที่ที่ ฮาร์วาร์ห้องสมุดไม่ได้ทำตอนนี้ 12 00:00:42,430 --> 00:00:45,460 ทำสิ่งใหม่ ๆ กับมันทดลอง และเล่นรอบกับมัน 13 00:00:45,460 --> 00:00:52,413 >> ดังนั้นจุดเริ่มต้นที่เป็นแบบนี้เป็น API เรียกว่าห้องสมุดฮาร์วาร์เมฆซึ่ง 14 00:00:52,413 --> 00:00:57,650 เป็นเซิร์ฟเวอร์ข้อมูลเมตาเปิด ซึ่งผมจะพูดถึงในขณะนี้ 15 00:00:57,650 --> 00:01:02,595 ดังนั้นพื้นหลังเป็นว่ามี จำนวนมากของสิ่งที่อยู่ในห้องสมุดฮาร์วาร์ 16 00:01:02,595 --> 00:01:07,150 ขณะนี้มีกว่า 13 ล้านบรรณานุกรม บันทึกล้านภาพ 17 00:01:07,150 --> 00:01:11,090 และหลายพันของการหาโรคเอดส์ซึ่ง เป็นหลักเอกสารอธิบาย 18 00:01:11,090 --> 00:01:15,500 คอลเลกชัน, พูดในสิ่งที่ อยู่ในนั้นกล่องของเอกสาร 19 00:01:15,500 --> 00:01:21,080 และอื่น ๆ ที่เป็นตัวแทนกว่า ล้านเอกสารของแต่ละบุคคล 20 00:01:21,080 --> 00:01:24,290 และนอกจากนี้ยังมีจำนวนมาก ข้อมูลที่ห้องสมุดมี 21 00:01:24,290 --> 00:01:28,180 เกี่ยวกับวิธีการเนื้อหาที่ถูกนำมาใช้ อาจจะเป็นที่สนใจของผู้คน 22 00:01:28,180 --> 00:01:32,400 ที่อาจต้องการที่จะทำงานกับมัน 23 00:01:32,400 --> 00:01:36,150 >> ดังนั้นข้อมูลทั้งหมด ห้องสมุดมีข้อมูลเมตา 24 00:01:36,150 --> 00:01:39,500 ดังนั้นเมตาดาต้าที่เป็นข้อมูลเกี่ยวกับข้อมูล 25 00:01:39,500 --> 00:01:42,070 ดังนั้นเมื่อเราพูดคุยเกี่ยวกับ ข้อมูลที่เป็น 26 00:01:42,070 --> 00:01:44,890 ใช้ได้ผ่านห้องสมุด เมฆที่มีอยู่, 27 00:01:44,890 --> 00:01:47,760 ก็ไม่จำเป็นต้อง เอกสารที่เกิดขึ้นจริง 28 00:01:47,760 --> 00:01:53,060 ตัวเองไม่จำเป็นต้องเต็ม ข้อความของหนังสือหรือภาพเต็ม 29 00:01:53,060 --> 00:01:54,890 แม้ว่าที่จริงอาจจะเป็นกรณี 30 00:01:54,890 --> 00:01:57,550 แต่มันเป็นเรื่องจริง ข้อมูลเกี่ยวกับข้อมูล 31 00:01:57,550 --> 00:02:00,909 >> ดังนั้นคุณสามารถคิดรายการ ข้อมูลหมายเลขโทรวิชา 32 00:02:00,909 --> 00:02:02,700 วิธีการหลายเล่ม หนังสือเล่มนี้ยังมีสิ่งที่ 33 00:02:02,700 --> 00:02:06,380 เป็นรุ่นสิ่งที่มี รูปแบบที่ผู้เขียนและอื่น ๆ 34 00:02:06,380 --> 00:02:12,250 ดังนั้นมีจำนวนมากของข้อมูลเกี่ยวกับ ในการเก็บรวบรวมข้อมูลที่ 35 00:02:12,250 --> 00:02:14,400 ในตัวเองเป็นชนิดที่มีประโยชน์โดยเนื้อแท้ 36 00:02:14,400 --> 00:02:19,230 และแม้ว่าถ้าคุณ การทำวิจัยในเชิงลึก 37 00:02:19,230 --> 00:02:25,160 เห็นได้ชัดว่าคุณต้องการที่จะได้รับที่จะเกิดขึ้นจริง เนื้อหาตัวเองและดูข้อมูลที่ 38 00:02:25,160 --> 00:02:30,140 เมตาดาต้าที่จะเป็นประโยชน์ในแง่ของการ ทั้งการวิเคราะห์ร่างกายโดยรวม 39 00:02:30,140 --> 00:02:33,870 เช่นเดียวกับสิ่งสิ่งที่อยู่ในคอลเลกชัน 40 00:02:33,870 --> 00:02:35,520 พวกเขาเกี่ยวข้องอย่างไร 41 00:02:35,520 --> 00:02:39,482 มันจะช่วยให้คุณจริงๆหาสิ่งอื่น ๆ ซึ่งจริงๆจุดประสงค์หลักของมัน 42 00:02:39,482 --> 00:02:41,190 จุดของ metadata และแคตตาล็อก 43 00:02:41,190 --> 00:02:43,230 จะช่วยให้คุณค้นหาทุก ข้อมูลที่เป็น 44 00:02:43,230 --> 00:02:46,590 มีอยู่ในคอลเลกชัน 45 00:02:46,590 --> 00:02:53,690 >> ดังนั้นนี่คือตัวอย่างของเมตาดาต้า สำหรับหนังสือในห้องสมุดฮาร์วาร์ 46 00:02:53,690 --> 00:02:56,370 ดังนั้นก็มี 47 00:02:56,370 --> 00:02:59,850 และคุณสามารถเห็นมัน จริงที่ซับซ้อนพอสมควร 48 00:02:59,850 --> 00:03:04,610 และเป็นส่วนหนึ่งของมูลค่าของเมตาดาต้า ในระบบห้องสมุดฮาร์วาร์ 49 00:03:04,610 --> 00:03:09,320 คือการที่จะได้รับการจัดเรียง การสร้างขึ้นโดย catalogers 50 00:03:09,320 --> 00:03:12,720 และประกอบโดยผู้ใช้ จำนวนมากที่มีความเชี่ยวชาญและทักษะ 51 00:03:12,720 --> 00:03:20,030 และคิดว่ามันเมื่อเวลาผ่านไป ซึ่งมีจำนวนมากของมูลค่า 52 00:03:20,030 --> 00:03:25,450 >> ดังนั้นถ้าคุณดูที่บันทึกนี้ ข้อเขียนของอลิซ, คุณสามารถหา 53 00:03:25,450 --> 00:03:32,590 คุณได้มีชื่อผู้เขียนมัน ผู้เขียนและทุกวิชาที่แตกต่าง 54 00:03:32,590 --> 00:03:35,380 ซึ่งคนที่ได้ลงในรายชื่อ 55 00:03:35,380 --> 00:03:40,110 และคุณสามารถเห็นนอกจากนี้ยังมีใน นอกเหนือไปจากข้อมูลจำนวนมากที่ดี 56 00:03:40,110 --> 00:03:42,852 ที่นี่มีการทำสำเนาบางส่วน 57 00:03:42,852 --> 00:03:45,560 มีจำนวนมากของความซับซ้อนที่เป็น สะท้อนผ่านข้อมูลเมตา 58 00:03:45,560 --> 00:03:46,300 ว่าคุณมี 59 00:03:46,300 --> 00:03:50,320 >> ดังนั้นหนึ่งชื่อของหนังสือเล่มนี้คือ การผจญภัยของอลิซในแดนมหัศจรรย์ 60 00:03:50,320 --> 00:03:53,880 ดังนั้นนี่คือคำอธิบายประกอบ รุ่นของหนังสือเล่มนั้น 61 00:03:53,880 --> 00:03:56,380 แต่ก็ยังเรียกว่าข้อเขียน อลิซผจญภัยของอลิซ 62 00:03:56,380 --> 00:03:58,570 เพราะในแดนมหัศจรรย์ มันเป็นสิ่งที่ 63 00:03:58,570 --> 00:04:00,430 มาร์ตินการ์ดเนอร์เขียน และข้อเขียนหนังสือ 64 00:04:00,430 --> 00:04:03,369 และมีจำนวนมากของข้อมูลที่ดี เกี่ยวกับปริศนาตรรกะและสิ่ง 65 00:04:03,369 --> 00:04:05,410 ภายในอลิซที่คุณ อาจไม่ทราบเกี่ยวกับ 66 00:04:05,410 --> 00:04:07,000 ดังนั้นคุณควรจะไปอ่านมัน 67 00:04:07,000 --> 00:04:11,940 >> แต่คุณสามารถดูมี จำนวนมากของรายละเอียดที่นี่ 68 00:04:11,940 --> 00:04:15,340 รวมทั้งระบุเมื่อมัน ถูกสร้างขึ้นมันมาจากไหน, 69 00:04:15,340 --> 00:04:17,420 ในแง่ของฮาร์วาร์ ระบบและอื่น ๆ 70 00:04:17,420 --> 00:04:20,350 ดังนั้นนี่คือตัวอย่างของ ประเภทของข้อมูลเมตา 71 00:04:20,350 --> 00:04:24,340 ที่คุณอาจเห็นในหนังสือ คอลเลกชันห้องสมุดฮาร์วาร์ 72 00:04:24,340 --> 00:04:26,680 >> นี่คือสิ่งที่แตกต่างอย่างสิ้นเชิง 73 00:04:26,680 --> 00:04:32,610 จึงมีระบบที่เรียกว่า VIA ฮาร์วาร์ซึ่งโดยทั่วไป 74 00:04:32,610 --> 00:04:39,990 เป็นแคตตาล็อกภาพและวัตถุของศิลปะ และสิ่งที่มองเห็นได้ตลอดทั้งฮาร์วาร์ 75 00:04:39,990 --> 00:04:44,010 และเพิ่มข้อมูลเมตาบาง ให้พวกเขาแบ่งพวกเขา 76 00:04:44,010 --> 00:04:49,200 และในบางกรณีการให้บริการ ภาพขนาดเล็ก 77 00:04:49,200 --> 00:04:51,250 ที่คุณสามารถใช้ ดูดังนั้นหากคุณต้องการ 78 00:04:51,250 --> 00:04:54,240 >> ดังนั้นนี่คือตัวอย่างของ เมตาดาต้าที่คุณมีสำหรับแผ่น 79 00:04:54,240 --> 00:04:57,840 จากการสันนิษฐานว่าอลิซในแดนมหัศจรรย์ 80 00:04:57,840 --> 00:05:00,499 และคุณสามารถเห็นมี เมตาดาต้าน้อยที่นี่ 81 00:05:00,499 --> 00:05:02,040 มันเป็นเพียงชนิดที่แตกต่างของวัตถุ 82 00:05:02,040 --> 00:05:03,425 และเพื่อให้มีข้อมูลน้อย 83 00:05:03,425 --> 00:05:07,790 >> คุณส่วนใหญ่มีความจริงที่ว่าโทร ตัวเลขหลักที่สร้างมัน - 84 00:05:07,790 --> 00:05:10,410 >> เราไม่ทราบว่าเมื่อมันถูกสร้างขึ้น 85 00:05:10,410 --> 00:05:13,320 >> --and ชื่อ 86 00:05:13,320 --> 00:05:14,300 >> อีกตัวอย่างหนึ่ง 87 00:05:14,300 --> 00:05:16,380 นี่คือการค้นพบความช่วยเหลือ 88 00:05:16,380 --> 00:05:19,030 ดังนั้นจึงมีการสะสมของลูอิส เอกสารของแครอลที่ฮาร์วาร์ 89 00:05:19,030 --> 00:05:23,601 ดังนั้นนี้อธิบายถึงสิ่งที่ อยู่ในคอลเลกชันที่ 90 00:05:23,601 --> 00:05:26,100 ดังนั้นคนที่ได้ผ่านและ มองผ่านกล่องทั้งหมด 91 00:05:26,100 --> 00:05:32,220 และรายชื่อมันให้พื้นหลังบาง เขียนสรุปของสิ่งที่อยู่ที่นี่ 92 00:05:32,220 --> 00:05:35,290 และถ้าคุณได้ดู เพิ่มเติมได้ที่นี้นี้ 93 00:05:35,290 --> 00:05:39,620 ไปในหน้าและหน้า และหน้า แต่จะบอกคุณ 94 00:05:39,620 --> 00:05:41,860 สิ่งที่ตัวอักษรและสิ่งที่ วันที่จากสิ่งที่กล่อง 95 00:05:41,860 --> 00:05:44,289 มีอยู่ทั่วทั้งคอลเลกชัน 96 00:05:44,289 --> 00:05:46,330 แต่นี่คือสิ่งที่ ว่าถ้าคุณอยู่ที่ฮาร์วาร์ 97 00:05:46,330 --> 00:05:50,720 คุณสามารถไปและเป็นจริงการมองร่างกาย ขึ้นและน่าจะดูที่ 98 00:05:50,720 --> 00:05:53,440 >> ดังนั้นนี้เป็นที่ดีทั้งหมด 99 00:05:53,440 --> 00:05:54,450 ข้อมูลเมตานี้ของที่มีประโยชน์ 100 00:05:54,450 --> 00:05:56,327 มันอยู่ในระบบห้องสมุดฮาร์วาร์ 101 00:05:56,327 --> 00:05:58,910 มีเครื่องมือออนไลน์ที่คุณ สามารถไปและจะดูที่มัน 102 00:05:58,910 --> 00:05:59,993 และดูมันและค้นหามัน 103 00:05:59,993 --> 00:06:02,810 และคุณสามารถเชือดมันและลูกเต๋า ในหลายวิธีที่แตกต่างกัน 104 00:06:02,810 --> 00:06:06,920 >> แต่มันเป็นเรื่องจริงที่มีอยู่เฉพาะในกรณีที่ คุณเป็นมนุษย์นั่งลง 105 00:06:06,920 --> 00:06:12,600 ที่เว็บเบราเซอร์ของคุณหรือบางสิ่งบางอย่างหรือ โทรศัพท์ของคุณและการนำทางผ่านมัน 106 00:06:12,600 --> 00:06:16,730 มันไม่จริงที่มีอยู่ใน ชนิดของแฟชั่นที่ใช้งานใด ๆ 107 00:06:16,730 --> 00:06:19,520 สำหรับระบบอื่น ๆ หรือ คอมพิวเตอร์เครื่องอื่น ๆ ในการใช้งาน 108 00:06:19,520 --> 00:06:21,500 ไม่ได้อยู่กับระบบภายใน ห้องสมุดฮาร์วาร์ 109 00:06:21,500 --> 00:06:24,890 แต่ระบบในโลกภายนอก เพียงแค่คนอื่น ๆ ทั่วไป 110 00:06:24,890 --> 00:06:30,210 ดังนั้นคำถามคือวิธีการที่เราสามารถ ทำให้มันสามารถใช้ได้กับคอมพิวเตอร์ 111 00:06:30,210 --> 00:06:33,560 เพื่อให้เราสามารถทำน่าสนใจมากขึ้น สิ่งที่มีกว่าเพียง 112 00:06:33,560 --> 00:06:36,550 เรียกดูมันเอง? 113 00:06:36,550 --> 00:06:39,766 >> ดังนั้นเหตุผลที่คุณจะต้องการที่จะทำเช่นนี้? 114 00:06:39,766 --> 00:06:41,140 มีจำนวนมากของความเป็นไปได้อยู่ 115 00:06:41,140 --> 00:06:43,980 หนึ่งคือการที่คุณสามารถสร้างได้อย่างสมบูรณ์ วิธีการที่แตกต่างกันของการเรียกดู 116 00:06:43,980 --> 00:06:46,962 เนื้อหาที่มีอยู่ ผ่านห้องสมุดฮาร์วาร์ 117 00:06:46,962 --> 00:06:48,670 ฉันจะแสดงให้คุณหนึ่ง ภายหลังเรียก Stacklife, 118 00:06:48,670 --> 00:06:52,440 ซึ่งมีความแตกต่างอย่างสิ้นเชิง ใช้เวลาในการมองหาเนื้อหา 119 00:06:52,440 --> 00:06:54,560 >> คุณสามารถสร้างเครื่องมือคำแนะนำ 120 00:06:54,560 --> 00:06:57,955 ดังนั้นห้องสมุดฮาร์วาร์ไม่ได้อยู่ใน ธุรกิจของบอกว่าคุณชอบหนังสือเล่มนี้ 121 00:06:57,955 --> 00:07:01,080 จากนั้นไปดูที่เหล่านี้ 17 อื่น ๆ หนังสือที่คุณอาจจะสนใจใน 122 00:07:01,080 --> 00:07:03,200 หรือเหล่านี้ 18 ภาพอื่น ๆ 123 00:07:03,200 --> 00:07:06,040 แต่ที่แน่นอนที่จะทำได้ เป็นคุณสมบัติที่มีคุณค่า 124 00:07:06,040 --> 00:07:09,272 และให้ข้อมูลเมตาก็อาจ จะเป็นไปได้ที่จะนำที่ร่วมกัน 125 00:07:09,272 --> 00:07:11,980 คุณอาจมีความต้องการที่แตกต่างกันใน แง่ของการค้นหาเนื้อหา 126 00:07:11,980 --> 00:07:16,200 เช่นบางทีแม้จะมีเครื่องมือที่ มีที่ห้องสมุดทำให้ 127 00:07:16,200 --> 00:07:18,450 สามารถใช้ได้คุณอาจต้องการ การค้นหาในทางที่แตกต่างกัน 128 00:07:18,450 --> 00:07:21,847 หรือเพิ่มประสิทธิภาพสำหรับกรณีที่ใช้โดยเฉพาะอย่างยิ่ง ซึ่งอาจจะเป็นเฉพาะมาก 129 00:07:21,847 --> 00:07:23,930 อาจจะมีเพียงไม่กี่ คนที่อยู่ในโลกที่ 130 00:07:23,930 --> 00:07:25,846 ต้องการค้นหาเนื้อหา ในทางนี้ แต่มัน 131 00:07:25,846 --> 00:07:28,985 จะดีถ้าเรา จะปล่อยให้พวกเขาทำอย่างนั้น 132 00:07:28,985 --> 00:07:30,860 มีจำนวนมากของการวิเคราะห์เป็น ในเวลาเพียงวิธีการที่คน 133 00:07:30,860 --> 00:07:33,860 ใช้เนื้อหาที่จะได้รับจริงๆ น่าสนใจที่จะรู้เกี่ยวกับการหา 134 00:07:33,860 --> 00:07:37,280 สิ่งที่หนังสือมีการใช้ สิ่งที่ไม่ได้และอื่น ๆ 135 00:07:37,280 --> 00:07:41,670 แล้วมีจำนวนมาก โอกาสที่จะบูรณาการ 136 00:07:41,670 --> 00:07:45,210 กับข้อมูลอื่น ๆ ที่ออกมีในเว็บ 137 00:07:45,210 --> 00:07:46,880 ดังนั้นเราจึง have-- 138 00:07:46,880 --> 00:07:50,260 >> ตัวอย่างเช่น NPR มี ส่วนการตรวจสอบหนังสือ 139 00:07:50,260 --> 00:07:53,090 ที่พวกเขาสัมภาษณ์ ผู้เขียนเกี่ยวกับหนังสือ 140 00:07:53,090 --> 00:07:56,837 และดังนั้นจึงจะดีถ้าคุณได้ มองหาหนังสือในฮาร์วาร์ 141 00:07:56,837 --> 00:07:59,670 ห้องสมุดและคุณบอกว่าโอเคมี รับการสัมภาษณ์กับผู้เขียน 142 00:07:59,670 --> 00:08:00,878 ลองไปดูที่ว่า 143 00:08:00,878 --> 00:08:05,461 หรือมีหน้าวิกิพีเดียเป็น อำนาจการอ้างอิงทางวิชาการ 144 00:08:05,461 --> 00:08:07,710 เกี่ยวกับหนังสือเล่มที่คุณนี้ อาจต้องการที่จะดูที่ 145 00:08:07,710 --> 00:08:12,600 >> มีเหล่านี้ประเภทของแหล่งที่มา กระจายอยู่ทั่วเว็บ 146 00:08:12,600 --> 00:08:16,555 และนำพวกเขาเข้าด้วยกัน อาจจะใช้งานที่ดี 147 00:08:16,555 --> 00:08:18,930 กับคนที่กำลังมองหาที่ เนื้อหาที่กำลังมองหาบางสิ่งบางอย่าง 148 00:08:18,930 --> 00:08:20,180 แต่มันก็ยังไม่ได้ ชนิดของสิ่งที่คุณต 149 00:08:20,180 --> 00:08:23,205 ต้องการห้องสมุดจะต้องรับผิดชอบ สำหรับการไปลงและการล่าสัตว์ลง 150 00:08:23,205 --> 00:08:25,455 ทั้งหมดเหล่านี้แหล่งที่มาที่แตกต่างกัน และเสียบเข้าด้วยกัน 151 00:08:25,455 --> 00:08:28,920 เพราะพวกเขากำลังเปลี่ยนแปลงอย่างต่อเนื่อง 152 00:08:28,920 --> 00:08:33,570 และสิ่งที่พวกเขาคิดว่าเป็นสิ่งสำคัญที่อาจ ไม่ได้เป็นสิ่งที่คุณคิดว่าเป็นสิ่งที่สำคัญ 153 00:08:33,570 --> 00:08:36,929 >> และมากขึ้นดังนั้นโดยทั่วไปมี จำนวนมากสิ่งที่เราไม่ได้คิดเลย 154 00:08:36,929 --> 00:08:42,222 ดังนั้นหากเราสามารถเปิดขึ้นนี้มากขึ้น คนนอกเหนือจากครึ่งโหลหรือดังนั้น 155 00:08:42,222 --> 00:08:45,174 ที่กำลังมองหาที่เกี่ยวกับเรื่องนี้ เป็นประจำสามารถคิดของความคิด 156 00:08:45,174 --> 00:08:47,340 และนวดข้อมูลและ ทำในสิ่งที่พวกเขาต้องการด้วย 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> ดังนั้นเราจึงต้องการที่จะทำให้เรื่องนี้ ข้อมูลที่มีอยู่ในโลกใบนี้ 159 00:08:54,045 --> 00:08:55,670 ดีมีภาวะแทรกซ้อนทั้งคู่ 160 00:08:55,670 --> 00:08:58,540 หนึ่งคือการที่ข้อมูลเมตานี้ อยู่ในระบบที่แตกต่างกัน 161 00:08:58,540 --> 00:09:01,110 มันอยู่ในรูปแบบที่แตกต่างกัน 162 00:09:01,110 --> 00:09:04,719 ดังนั้นจึงมีการฟื้นฟูบางส่วน ซึ่งความต้องการที่จะเกิดขึ้น 163 00:09:04,719 --> 00:09:08,010 ซึ่งการฟื้นฟูเป็นกระบวนการของการ นำสิ่งจากรูปแบบที่แตกต่างกัน 164 00:09:08,010 --> 00:09:12,940 และการทำแผนที่ให้เป็นรูปแบบเดียว เพื่อให้สาขาที่จะตรงกับขึ้น 165 00:09:12,940 --> 00:09:15,160 >> มีข้อ จำกัด บางอย่างมีลิขสิทธิ์ 166 00:09:15,160 --> 00:09:21,010 ผิดปกติพอรายการแคตตาล็อก เกี่ยวกับหนังสือเล่มจะเป็นผู้รับผิดชอบสำหรับการมีลิขสิทธิ์ 167 00:09:21,010 --> 00:09:24,060 ดังนั้นแม้ว่าจะเป็นเพียง ข้อมูลที่ได้จากหนังสือเล่มนี้ 168 00:09:24,060 --> 00:09:25,330 มันมีลิขสิทธิ์ 169 00:09:25,330 --> 00:09:28,400 และขึ้นอยู่กับที่จริง สร้างเมตาดาต้าที่ 170 00:09:28,400 --> 00:09:32,175 อาจจะมีข้อ จำกัด ในการที่ สามารถกระจายมัน to-- ที่คล้ายกัน 171 00:09:32,175 --> 00:09:33,402 >> ฉันไม่รู้ 172 00:09:33,402 --> 00:09:36,110 มันอาจจะหรือไม่อาจจะคล้ายกับ สถานการณ์ของเนื้อเพลงเพลง 173 00:09:36,110 --> 00:09:36,610 เช่น 174 00:09:36,610 --> 00:09:38,560 ดังนั้นเราทุกคนรู้ว่ากระทะออก 175 00:09:38,560 --> 00:09:40,450 ดังนั้นคุณต้องได้รับการแก้ไขปัญหาที่ 176 00:09:40,450 --> 00:09:44,910 >> และจากนั้นอีกชิ้นหนึ่งคือ ว่ามีข้อมูลจำนวนมาก 177 00:09:44,910 --> 00:09:52,420 ดังนั้นถ้าผมคนที่ต้องการที่จะทำงาน ที่มีข้อมูลหรือมีความคิดที่เย็น 178 00:09:52,420 --> 00:09:55,350 การจัดการกับ 14 ล้าน บันทึกแล็ปท็อปของฉัน 179 00:09:55,350 --> 00:09:57,487 อาจจะมีปัญหา และยากที่จะจัดการ 180 00:09:57,487 --> 00:09:59,320 ดังนั้นเราจึงต้องการที่จะลด อุปสรรคสำหรับคน 181 00:09:59,320 --> 00:10:02,130 เพื่อให้สามารถทำงานกับข้อมูล 182 00:10:02,130 --> 00:10:07,880 >> ดังนั้นวิธีการที่ว่าที่อยู่หวังว่า ทั้งหมดของความกังวลเหล่านี้เป็นสองส่วน 183 00:10:07,880 --> 00:10:11,770 หนึ่งคือการสร้างแพลตฟอร์มที่ใช้เวลา ข้อมูลจากแหล่งที่มาที่แตกต่างกันเหล่านี้ 184 00:10:11,770 --> 00:10:14,350 และ aggravates มัน normalizes, เสริมสร้างมันและทำให้ 185 00:10:14,350 --> 00:10:16,650 มันมีอยู่ในสถานที่เดียว 186 00:10:16,650 --> 00:10:20,950 และก็จะทำให้มันสามารถใช้ได้ผ่าน API สาธารณะที่ผู้คนสามารถเรียก 187 00:10:20,950 --> 00:10:24,430 >> ดังนั้น API เป็นแอพลิเคชัน อินเตอร์เฟซการเขียนโปรแกรม 188 00:10:24,430 --> 00:10:28,930 และโดยทั่วไปหมายถึง ปลายทางที่ระบบหรือเทคโนโลยี 189 00:10:28,930 --> 00:10:31,720 สามารถโทรและได้รับข้อมูลกลับมาใน รูปแบบโครงสร้างในทาง 190 00:10:31,720 --> 00:10:32,900 ที่จะสามารถนำมาใช้ 191 00:10:32,900 --> 00:10:36,060 ดังนั้นจึงไม่ได้ขึ้นอยู่ ว่าจะไปที่เว็บไซต์ 192 00:10:36,060 --> 00:10:37,970 และข้อมูลการขูดออก ของมันตัวอย่างเช่น 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> ดังนั้นนี่คือหน้าแรกของ ห้องสมุดเมฆรายการ API, 195 00:10:45,010 --> 00:10:47,220 ซึ่งเป็นหลักรุ่นสอง 196 00:10:47,220 --> 00:10:50,130 ดังนั้นจึงเป็นซ้ำสองของ พยายามที่จะทำให้ข้อมูลทั้งหมดนี้ 197 00:10:50,130 --> 00:10:53,280 ที่มีอยู่ในโลกใบนี้ 198 00:10:53,280 --> 00:10:59,560 ดังนั้นจึงเป็น http://api.lib.harvard.edu/v2/items 199 00:10:59,560 --> 00:11:03,830 และเพียงแค่นี้ที่จะทำลายลง นิด ๆ หน่อย ๆ สิ่งนี้หมายความว่า 200 00:11:03,830 --> 00:11:06,115 ว่าขณะนี้เป็นรุ่นที่สองของ API 201 00:11:06,115 --> 00:11:08,490 มีรุ่นหนึ่งซึ่ง ผมไม่อยากจะพูดคุยเกี่ยวกับ 202 00:11:08,490 --> 00:11:09,750 แต่มีรุ่นหนึ่ง 203 00:11:09,750 --> 00:11:14,740 >> และถ้าคุณกำลังเรียกร้องนี้ API คุณจะได้รับรายการ 204 00:11:14,740 --> 00:11:20,640 และเป็นส่วนหนึ่งของความคิดของ API เป็น API เป็นสัญญา 205 00:11:20,640 --> 00:11:23,440 มันเป็นสิ่งที่เป็น จะไม่มีการเปลี่ยนแปลง 206 00:11:23,440 --> 00:11:24,850 ดังนั้นตัวอย่างเช่น - 207 00:11:24,850 --> 00:11:27,410 >> และเหตุผลที่ว่าถ้าผม สร้างชนิดของระบบบางอย่างที่ 208 00:11:27,410 --> 00:11:33,210 จะใช้ห้องสมุดเมฆ API เพื่อแสดงหนังสือหรือช่วยให้คนหา 209 00:11:33,210 --> 00:11:36,190 ข้อมูลในรูปแบบที่ไม่ซ้ำกัน สิ่งที่เราไม่ต้องการให้เกิดขึ้น 210 00:11:36,190 --> 00:11:38,940 คือเราจะไปเปลี่ยนวิธีการ ที่ทำงาน API และก็ 211 00:11:38,940 --> 00:11:41,340 ทุกอย่างแตกที่ด้านข้างของผู้ใช้ 212 00:11:41,340 --> 00:11:46,710 ดังนั้นส่วนหนึ่งของถ้าคุณกำลังทำ API ที่มีอยู่ในโลกใบนี้ก็ 213 00:11:46,710 --> 00:11:49,396 การปฏิบัติที่ดีที่จะนำ หมายเลขรุ่นในนั้นเพื่อให้ประชาชน 214 00:11:49,396 --> 00:11:51,020 รู้ว่าสิ่งที่รุ่นที่พวกเขากำลังจัดการกับ 215 00:11:51,020 --> 00:11:54,300 >> ดังนั้นถ้าเราตัดสินใจที่เราพบว่าวิธีที่ดีกว่า การทำข้อมูลเหล่านี้สามารถใช้ได้ 216 00:11:54,300 --> 00:11:57,295 เราอาจจะเปลี่ยนที่ไป เรียกรุ่นที่สาม 217 00:11:57,295 --> 00:11:59,920 ดังนั้นทุกคนที่ยังคงใช้ สองรุ่นที่จะยังคงทำงาน 218 00:11:59,920 --> 00:12:03,490 แต่รุ่นที่สามจะ มีทุกสิ่งใหม่ ๆ 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> ดังนั้นนี่คือ API แต่นี้ จริงๆดูเหมือน URL 221 00:12:09,210 --> 00:12:11,680 และเพื่อให้สิ่งนี้ ตัวอย่างของการเป็นสิ่งที่ 222 00:12:11,680 --> 00:12:16,615 เรียก API ส่วนที่เหลือซึ่งสามารถใช้ได้ มากกว่าเพียงแค่การเชื่อมต่อเว็บปกติ 223 00:12:16,615 --> 00:12:19,680 และคุณสามารถจริง ไปไว​​้ในเบราว์เซอร์ 224 00:12:19,680 --> 00:12:28,550 >> ดังนั้นที่นี่ฉันได้เปิดขึ้นเพียง Firefox และ ไป api.lib.harvard.edu/v2/items 225 00:12:28,550 --> 00:12:31,560 ดังนั้นสิ่งที่ฉันได้รับที่นี่เป็น พื้นหน้าแรก 226 00:12:31,560 --> 00:12:34,740 ผลจากทั้ง ชุดของรายการที่เรามี 227 00:12:34,740 --> 00:12:37,460 และมันก็เป็นที่นี่ในรูปแบบ XML 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 และมันก็ยังคงเป็น prettified โดย Firefox 230 00:12:42,210 --> 00:12:45,850 มันไม่ได้จริงมีสิ่งเหล่านี้ ขยายตัวเล็กน้อยและการทำสัญญา 231 00:12:45,850 --> 00:12:47,880 doohickeys ที่นี่ 232 00:12:47,880 --> 00:12:52,520 นี่คือการจัดเรียงของดีกว่า วิธีรุ่นที่จะมองมัน 233 00:12:52,520 --> 00:12:57,040 >> แต่สิ่งนี้จะบอกเราก็คือ ฉันได้รับการร้องขอทุกรายการ 234 00:12:57,040 --> 00:13:03,120 ดังนั้นจึงมี 13,289,475 รายการ 235 00:13:03,120 --> 00:13:06,150 และฉันกำลังมองในตอนแรก 10 เริ่มต้นที่ศูนย์ตำแหน่ง 236 00:13:06,150 --> 00:13:09,760 เพราะในวิทยาการคอมพิวเตอร์ เรามักจะเริ่มต้นที่ศูนย์ 237 00:13:09,760 --> 00:13:15,150 และสิ่งที่ผมได้ที่นี่ถ้าฉันเพียงแค่ยุบ นี้คุณจะเห็นฉันมี 10 รายการ 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> และถ้าผมจะดูที่รายการที่ฉันสามารถ เห็นว่าผมได้มีข้อมูลเกี่ยวกับเรื่องนี้ 240 00:13:25,210 --> 00:13:27,400 และนี่คือสิ่งที่เรียกว่ารูปแบบ MODS 241 00:13:27,400 --> 00:13:30,860 ดังนั้นฉันจะเปลี่ยน กลับมาที่นี่สักครู่ 242 00:13:30,860 --> 00:13:33,750 ตกลง 243 00:13:33,750 --> 00:13:37,447 >> ดังนั้นลองค้นหาสิ่งที่อยู่ใน ที่เฉพาะเจาะจงเพราะรายการแรกที่ 244 00:13:37,447 --> 00:13:40,030 ที่เกิดขึ้นที่จะเกิดขึ้นเมื่อคุณมอง ผ่านคอลเลกชันทั้งหมด 245 00:13:40,030 --> 00:13:41,750 คือโดยความหมายแบบสุ่ม 246 00:13:41,750 --> 00:13:44,550 เพื่อให้ดูสำหรับโดนัทบาง 247 00:13:44,550 --> 00:13:46,830 โอ้ 248 00:13:46,830 --> 00:13:49,190 >> ตกลง 249 00:13:49,190 --> 00:13:49,940 ดังนั้นโดนัท 250 00:13:49,940 --> 00:13:55,360 ดังนั้นเราจึงพบว่ามี 80 รายการใน คอลเลกชันที่อ้างอิงโดนัท 251 00:13:55,360 --> 00:13:57,150 เรากำลังมองหาที่ 10 อันดับแรกของพวกเขา 252 00:13:57,150 --> 00:14:01,890 ตอนนี้คุณสามารถดูที่นี่วิธีการที่ ฉันว่าฉันกำลังมองหาโดนัท 253 00:14:01,890 --> 00:14:04,400 ฉันเพิ่งเพิ่มบางสิ่งบางอย่าง สตริงแบบสอบถามของ URL 254 00:14:04,400 --> 00:14:09,680 ดังนั้น Q เท่ากับโดนัทที่คุณสามารถ เห็นได้ง่ายขึ้นเล็ก ๆ น้อย ๆ ที่นี่ 255 00:14:09,680 --> 00:14:12,131 >> และนี้โดยทั่วไปหมายถึงมี ข้อมูลจำเพาะสำหรับ API ซึ่ง 256 00:14:12,131 --> 00:14:13,880 กำหนดสิ่งที่ทุก พารามิเตอร์เหล่านี้หมายถึง 257 00:14:13,880 --> 00:14:17,150 และนั่นหมายความว่าเรากำลังจะ ค้นหาทุกอย่างสำหรับโดนัท 258 00:14:17,150 --> 00:14:24,910 >> ดังนั้นรายการแรกที่นี่เรามี คุณสามารถดูชื่อเป็นโดนัท, 259 00:14:24,910 --> 00:14:29,310 และมีคำบรรยายที่เรียกว่า อเมริกันกิเลสซึ่งเป็นฉันเดา 260 00:14:29,310 --> 00:14:31,610 เหมาะสม 261 00:14:31,610 --> 00:14:36,134 มีจำนวนมากที่ต่างออกไปคือ 262 00:14:36,134 --> 00:14:38,050 เมื่อคุณได้รับไปยังจุด ในการได้รับข้อมูลที่ 263 00:14:38,050 --> 00:14:41,020 มีจำนวนมากที่แตกต่างกัน รูปแบบที่คุณสามารถได้รับมันเป็น 264 00:14:41,020 --> 00:14:44,050 และมีจุดแข็งที่แตกต่างกัน และจุดอ่อนสำหรับพวกเขาทั้งหมด 265 00:14:44,050 --> 00:14:49,000 ดังนั้นหนึ่งนี้คุณสามารถดู ที่นี่เป็นแบบฟอร์มนี้รวยมาก 266 00:14:49,000 --> 00:14:51,946 และมันก็เป็นมาตรฐาน 267 00:14:51,946 --> 00:14:55,040 >> ดังนั้นจึงมีชื่อที่เฉพาะเจาะจง เขตข้อมูลคำบรรยาย 268 00:14:55,040 --> 00:14:58,950 มีทางเลือกคือ ชื่อเรื่องความรักของชาวอเมริกัน 269 00:14:58,950 --> 00:15:01,650 มีชื่อที่เกี่ยวข้องกับมันเป็น 270 00:15:01,650 --> 00:15:03,120 ประเภทของทรัพยากรเป็นข้อความ 271 00:15:03,120 --> 00:15:06,070 มีข้อมูลจำนวนมากเป็น ที่นี่ในรูปแบบนี้ 272 00:15:06,070 --> 00:15:09,480 >> แต่มีพวง รูปแบบที่แตกต่างกันของ 273 00:15:09,480 --> 00:15:11,920 ดังนั้นสิ่งที่เราเป็นเพียงแค่ กำลังมองหาที่เป็นรูปแบบ 274 00:15:11,920 --> 00:15:17,700 เรียกว่า MODS ซึ่งย่อมาจาก Metadata บริการคำอธิบายวัตถุ 275 00:15:17,700 --> 00:15:18,250 ที่อาจเกิดขึ้น 276 00:15:18,250 --> 00:15:23,030 ฉันจริงไม่แน่ใจเกี่ยวกับ เอส แต่มันเป็นรูปแบบที่ค่อนข้างซับซ้อน 277 00:15:23,030 --> 00:15:24,240 มันเป็นรูปแบบเริ่มต้น 278 00:15:24,240 --> 00:15:30,260 >> แต่ก็เป็นหนึ่งที่ช่วยให้ ความอุดมสมบูรณ์ของข้อมูลทั้งหมด 279 00:15:30,260 --> 00:15:33,820 ที่ห้องสมุดมีเพราะ มันใกล้มากกับสิ่งที่ 280 00:15:33,820 --> 00:15:35,110 ห้องสมุดใช้ภายใน 281 00:15:35,110 --> 00:15:39,030 มันเป็นมาตรฐานที่เป็น ที่ใช้ทั่วประเทศ 282 00:15:39,030 --> 00:15:40,944 ทั่วโลกในห้องสมุดวิชาการ 283 00:15:40,944 --> 00:15:42,110 และก็ทำงานร่วมกันมาก 284 00:15:42,110 --> 00:15:44,852 ดังนั้นถ้าคุณได้มีเอกสาร ที่อยู่ในรูปแบบ MODS, 285 00:15:44,852 --> 00:15:47,560 คุณสามารถให้ที่ให้กับคนอื่น มีระบบเข้าใจ MODS, 286 00:15:47,560 --> 00:15:48,518 และพวกเขาสามารถนำเข้า 287 00:15:48,518 --> 00:15:50,840 ดังนั้นจึงเป็นมาตรฐาน 288 00:15:50,840 --> 00:15:54,250 มันกำหนดไว้เป็นอย่างดีที่เฉพาะเจาะจงมาก 289 00:15:54,250 --> 00:15:58,980 และนั่นคือสิ่งที่ทำให้มัน ทำงานร่วมกันเพราะถ้ามีคนบอกว่า 290 00:15:58,980 --> 00:16:04,930 นี้เป็นชื่ออื่นของ บันทึกทุกคนรู้ว่าสิ่งที่หมายความว่า 291 00:16:04,930 --> 00:16:07,740 ในอีกด้านหนึ่งก็มีความซับซ้อนมาก 292 00:16:07,740 --> 00:16:13,160 >> ดังนั้นถ้าคุณจะดู ที่บันทึกนี้ที่นี่ 293 00:16:13,160 --> 00:16:15,320 ถ้าฉันเพียงแค่ต้องการที่จะได้รับ ชื่อของเอกสารนี้ 294 00:16:15,320 --> 00:16:21,150 ของหนังสือเล่มนี้ซึ่งน่าจะเป็นโดนัท, กิเลสอเมริกันแยกมันออกมา 295 00:16:21,150 --> 00:16:22,940 เป็นเพียงเล็กน้อยที่เกี่ยวข้อง 296 00:16:22,940 --> 00:16:27,380 ในขณะที่มีอีก รูปแบบที่เรียกว่าดับลินคอร์, 297 00:16:27,380 --> 00:16:29,730 ซึ่งเป็นมากในรูปแบบที่ง่ายมาก 298 00:16:29,730 --> 00:16:33,764 >> และเพื่อให้คุณดูที่นี่ไม่มี ชื่อคำบรรยายชื่อสำรอง 299 00:16:33,764 --> 00:16:35,930 มีเพียงชื่อของ, โดนัท, กิเลสอเมริกัน 300 00:16:35,930 --> 00:16:38,780 และชื่ออื่นกิเลสอเมริกัน 301 00:16:38,780 --> 00:16:42,907 ดังนั้นเมื่อคุณกำลังมองหาที่สิ่งที่รูปแบบ คุณต้องการที่จะได้รับข้อมูลที่ออกมาจาก 302 00:16:42,907 --> 00:16:44,740 มากขึ้นอยู่กับวิธีการ คุณกำลังจะใช้มัน 303 00:16:44,740 --> 00:16:46,573 ที่ใช้สำหรับ การทำงานร่วมกันหรือไม่หรือคุณ 304 00:16:46,573 --> 00:16:49,970 ต้องการสิ่งง่ายๆที่ อาจจะง่ายต่อการทำงานด้วย? 305 00:16:49,970 --> 00:16:56,002 >> ด้านพลิกจำนวนมาก รายละเอียดได้รับการจัดเรียงของ squished ลง 306 00:16:56,002 --> 00:16:58,460 คุณอาจสูญเสียความแตกต่างของ สิ่งที่หมายถึงสาขาเฉพาะ 307 00:16:58,460 --> 00:17:02,960 ถ้าคุณกำลังติดต่อกับดับลินคอร์, ซึ่งคุณจะไม่ได้รับกับ MODS 308 00:17:02,960 --> 00:17:06,462 ดังนั้นผู้มีสองรูปแบบ คุณจะได้รับจาก API 309 00:17:06,462 --> 00:17:08,920 และโดยทั่วไปเราจะรักษา มันอยู่เบื้องหลังใน MODS 310 00:17:08,920 --> 00:17:14,179 แต่เราสามารถให้คุณใน MODS และ ดับลินคอและสิ่งอื่น ๆ ได้เป็นอย่างดี 311 00:17:14,179 --> 00:17:16,470 การพิจารณาอื่น ๆ เมื่อ คุณกำลังมองหาในข้อมูล 312 00:17:16,470 --> 00:17:21,210 คุณจะได้รับมันเป็นทั้ง JSON ซึ่ง ย่อมาจาก JavaScript Object สัญลักษณ์, 313 00:17:21,210 --> 00:17:24,720 หรือ XML ซึ่งย่อมาจาก Extensible Markup Language 314 00:17:24,720 --> 00:17:30,080 และการแสดงข้อมูลเหล่านี้ทั้งสอง ได้ว่าข้อมูลเดียวกันว่า 315 00:17:30,080 --> 00:17:31,080 สาขาเดียวกัน 316 00:17:31,080 --> 00:17:33,644 แต่พวกเขากำลังเพียง ไวยากรณ์ที่แตกต่างกัน 317 00:17:33,644 --> 00:17:40,401 >> ดังนั้นนี่คือเเรก 318 00:17:40,401 --> 00:17:41,400 ดีขอเพียงแค่สลับ 319 00:17:41,400 --> 00:17:47,490 ดังนั้นนี่คือแบบสอบถามของเราสำหรับ โดนัทในรูปแบบ XML 320 00:17:47,490 --> 00:17:53,470 ถ้าฉันเพียงแค่เปลี่ยนนี้จะเป็น JSON, ฉันสามารถดูได้ลักษณะที่แตกต่างกัน 321 00:17:53,470 --> 00:17:58,580 ดังนั้นตอนนี้เป็นเนื้อหาเดียวกัน แต่โครงสร้างที่แตกต่างกัน 322 00:17:58,580 --> 00:18:00,080 มีน้อยวงเล็บมุมเป็น 323 00:18:00,080 --> 00:18:02,530 มีน้อย verbose เป็น 324 00:18:02,530 --> 00:18:06,440 >> และนี่คือรูปแบบที่ถ้าคุณ กำลังทำงานอยู่ในสภาพแวดล้อมที่เว็บ 325 00:18:06,440 --> 00:18:09,680 คุณจะมีโอกาสมากที่สุดที่จะ เพื่อต้องการที่จะใช้เพราะหนึ่ง 326 00:18:09,680 --> 00:18:12,630 ในสิ่งที่ดีเกี่ยวกับ JSON เป็น มันเข้ากันได้กับ JavaScript 327 00:18:12,630 --> 00:18:17,680 ดังนั้นถ้าผมเขียน app เว็บผมสามารถดึง ใน JSON และเพียงแค่ทำงานกับมันโดยตรง 328 00:18:17,680 --> 00:18:20,187 ในขณะที่มี XML มัน นิด ๆ หน่อย ๆ ที่ซับซ้อนมากขึ้น 329 00:18:20,187 --> 00:18:21,520 ดังนั้นอีกครั้งเหล่านี้มีทั้งที่มีประโยชน์ 330 00:18:21,520 --> 00:18:26,387 พวกเขาก็มีกรณีการใช้งานที่แตกต่างกัน ที่ผู้คนอาจต้องการที่จะใช้พวกเขา 331 00:18:26,387 --> 00:18:26,886 ตกลง 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 เพื่อกลับไป API 334 00:18:31,680 --> 00:18:32,900 ดังนั้นเราจึงสามารถค้นหา for-- 335 00:18:32,900 --> 00:18:36,220 >> ผมให้ตัวอย่างของ ค้นหาโดนัท 336 00:18:36,220 --> 00:18:39,330 นอกจากนี้เรายังสามารถค้นหาเพียงแค่ใน โดยเฉพาะอย่างยิ่งข้อมูลภายในที่นี่ 337 00:18:39,330 --> 00:18:41,310 ดังนั้นแทนที่จะค้นหา บันทึกทั้งหมด 338 00:18:41,310 --> 00:18:43,870 ฉันเพียงแค่สามารถค้นหาข้อมูลชื่อ 339 00:18:43,870 --> 00:18:48,810 ดังนั้นตอนนี้มี 25 สิ่งที่ มีโดนัทในชื่อหนึ่งซึ่ง 340 00:18:48,810 --> 00:18:52,430 เป็นเรื่องเกี่ยวกับการฟื้นฟู พื้นที่ชุ่มน้ำในการบริหารจัดการ 341 00:18:52,430 --> 00:18:54,990 ของหลุมในโดนัท โปรแกรมซึ่งอาจเป็น 342 00:18:54,990 --> 00:18:58,970 ไม่จำเป็นต้องเป็นสิ่งที่เรากำลังมองหา เมื่อเรากำลังมองหาโดนัท 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> คุณยังสามารถเมื่อคุณอยู่ จัดการกับ API-- 345 00:19:05,490 --> 00:19:08,827 >> ส่วนหนึ่งของการมี API คือการให้ คนเข้าถึงชุดข้อมูลขนาดใหญ่ 346 00:19:08,827 --> 00:19:11,410 และมีคู่ที่แตกต่างกัน เครื่องมือที่คุณสามารถใช้ในการทำเช่นนั้น 347 00:19:11,410 --> 00:19:14,170 หนึ่งคือมากเพียงคุณ สามารถหน้าผ่านข้อมูล 348 00:19:14,170 --> 00:19:17,340 ดังนั้นเช่นเดียวกับถ้าคุณทำแบบสอบถาม ผ่านเว็บอินเตอร์เฟส, 349 00:19:17,340 --> 00:19:19,470 คุณสามารถดูที่หน้าหนึ่ง หน้าสองหน้าสาม 350 00:19:19,470 --> 00:19:22,040 คุณสามารถทำเช่นเดียวกัน สิ่งที่ผ่าน API 351 00:19:22,040 --> 00:19:24,150 คุณเพียงแค่จะต้องมีการ อย่างชัดเจนในวิธีที่คุณทำมัน 352 00:19:24,150 --> 00:19:29,511 >> ดังนั้นสำหรับตัวอย่างเช่นถ้าฉันกำลังมองหา ที่แบบสอบถามครั้งแรกของฉันที่นี่ 353 00:19:29,511 --> 00:19:32,510 ที่ฉันทำค้นหาสำหรับสิ่งที่ กับโดนัทในชื่อเรื่องผมสามารถพูดได้ว่า 354 00:19:32,510 --> 00:19:35,415 และ จำกัด เท่ากับ 20 ซึ่งหมายความว่า ให้ฉันแรก 20 บันทึกไม่ได้ 355 00:19:35,415 --> 00:19:38,540 10 อันดับแรกซึ่งเป็นค่าเริ่มต้น เพราะผมต้องการที่จะดูที่ 20 ในเวลา 356 00:19:38,540 --> 00:19:43,435 หรือฉันสามารถพูดได้ตั้งค่า เริ่มต้นเท่ากับ 20 และขีด จำกัด 357 00:19:43,435 --> 00:19:47,150 เท่ากับ 20 ซึ่งจะให้ ฉันบันทึก 21 ถึง 40 358 00:19:47,150 --> 00:19:52,680 >> ดังนั้นผมคิดว่าสิ่งที่ ที่จะไปที่นี่ 359 00:19:52,680 --> 00:19:57,290 ที่เรากำลังใช้สตริงแบบสอบถาม การตั้งค่าพารามิเตอร์ในแบบสอบถาม 360 00:19:57,290 --> 00:20:02,760 และมันช่วยให้คุณควบคุม สิ่งที่คุณจะได้รับกลับมา 361 00:20:02,760 --> 00:20:05,980 >> เป็นอีกเครื่องมือหนึ่งที่คุณสามารถใช้ - 362 00:20:05,980 --> 00:20:09,250 >> และนี่คือจริงๆเป็นประโยชน์ในการ แง่ของการสำรวจข้อมูล 363 00:20:09,250 --> 00:20:10,840 >> --is สิ่งที่เรียกว่า Faceting 364 00:20:10,840 --> 00:20:15,530 ดังนั้น Faceting ระยะคือ ไม่จำเป็นต้องร่วมกัน 365 00:20:15,530 --> 00:20:16,880 แต่คุณเคยเห็นมาก่อน 366 00:20:16,880 --> 00:20:18,630 ถ้าคุณดูที่ Amazon เช่น 367 00:20:18,630 --> 00:20:20,870 และคุณจะค้นหา โดนัทในหนังสือ 368 00:20:20,870 --> 00:20:27,080 ที่นี่พวกเขาได้มีชุดของหนังสือ และพวกเขากำลังจัดกลุ่มตามประเภท 369 00:20:27,080 --> 00:20:30,470 และคุณได้รับประเภทที่แตกต่างกัน และวิธีการหลายเล่มในแต่ละประเภท 370 00:20:30,470 --> 00:20:31,330 แสดงขึ้นมา 371 00:20:31,330 --> 00:20:33,420 >> ดังนั้นนี่เป็นพื้นด้าน 372 00:20:33,420 --> 00:20:37,570 คุณจะใช้หนังสือของพวกเขาทั้งหมด 1,800 หนังสือที่ตรงกับโดนัทที่ Amazon 373 00:20:37,570 --> 00:20:39,820 12 ของพวกเขาใน ประเภทอาหารเช้า 374 00:20:39,820 --> 00:20:43,100 21 ในขนมและเบเกอรี่ และอื่น ๆ และอื่น ๆ 375 00:20:43,100 --> 00:20:47,670 >> ดังนั้นนี้เป็นจริงที่มีประโยชน์ เครื่องมือสำหรับการสำรวจเนื้อหา 376 00:20:47,670 --> 00:20:53,260 ภายในห้องสมุดได้เป็นอย่างดี เพราะเมื่อคุณมองไปที่ด้าน, 377 00:20:53,260 --> 00:20:56,520 มันจะช่วยให้คุณมีความคิดของสิ่งที่วิชา ที่มีอยู่เช่นเดียวกับสิ่งที่ประเภทของอาสาสมัคร 378 00:20:56,520 --> 00:20:58,510 เป็นที่นิยมมากที่สุดภายในชุดคำค้นหาของคุณ 379 00:20:58,510 --> 00:21:00,950 และมันจะช่วยให้คุณขับรถออกไปและสำรวจ 380 00:21:00,950 --> 00:21:02,770 เพื่อให้เราสามารถทำสิ่งเดียวกัน 381 00:21:02,770 --> 00:21:05,940 >> ถ้าเราต้องการที่จะใช้ API และมองไปที่ทุกแง่มุม 382 00:21:05,940 --> 00:21:08,950 เราเพิ่มพารามิเตอร์ไปยังอีก เพื่อนของเราสตริงแบบสอบถาม 383 00:21:08,950 --> 00:21:12,540 ดังนั้นแง่มุมเท่ากับคั่นด้วยเครื่องหมายจุลภาค รายการของสิ่งที่เราต้องการที่จะด้านบน 384 00:21:12,540 --> 00:21:14,790 ดังนั้นหนึ่งในแง่มุมที่อาจมี 385 00:21:14,790 --> 00:21:16,565 อีกประการหนึ่งที่อาจจะเป็นภาษา 386 00:21:16,565 --> 00:21:19,665 ดังนั้นถ้าเราเรียกใช้แบบสอบถามที่เรา get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 มันดูสวยมากเหมือนกันที่นี่ 389 00:21:24,830 --> 00:21:29,010 แต่เราได้เพิ่มเข้าไปในท้ายที่สุด ของรายการชุดของแง่มุม 390 00:21:29,010 --> 00:21:34,060 ดังนั้นเราจึงมีแง่มุมที่เรียกว่าเรื่อง 391 00:21:34,060 --> 00:21:40,250 ดังนั้นนี่จะบอกเราว่าถ้าฉันมอง ที่ 80 ผลของฉันจากแบบสอบถามโดนัท, 392 00:21:40,250 --> 00:21:42,100 13 ของพวกเขามี เรื่องสหรัฐอเมริกา 393 00:21:42,100 --> 00:21:43,684 สามมีโดนัทเรื่อง 394 00:21:43,684 --> 00:21:45,600 มีสามเรื่อง การฟื้นฟูพื้นที่ชุ่มน้ำ 395 00:21:45,600 --> 00:21:47,720 ซึ่งอาจจะเป็นหลุมของเราในโดนัท 396 00:21:47,720 --> 00:21:51,780 สองของพวกเขา, ซิมป์สัน, และอื่น ๆ และอื่น ๆ 397 00:21:51,780 --> 00:21:59,211 >> ดังนั้นนี้จะมีประโยชน์ถ้าคุณ ต้องการที่จะแคบลงการค้นหาของคุณ 398 00:21:59,211 --> 00:22:00,210 มันสามารถช่วยให้คุณทำ 399 00:22:00,210 --> 00:22:03,580 โดยเฉพาะอย่างยิ่งถ้าคุณมี มากกว่าพูด, 80 400 00:22:03,580 --> 00:22:05,980 >> ในทำนองเดียวกันเรายังถาม สำหรับแง่มุมเกี่ยวกับภาษา 401 00:22:05,980 --> 00:22:14,790 ดังนั้นถ้าเรามองไปที่ผลของเราเราจะเห็น 76 ของพวกเขาในอังกฤษสี่ในฝรั่งเศส 402 00:22:14,790 --> 00:22:19,620 สองในภาษาสเปนสองผมคิดว่าเป็น ไม่ได้กำหนดหรือไม่ทราบดัตช์และภาษาลาติน 403 00:22:19,620 --> 00:22:22,830 ดังนั้นผมจึงคิดว่าละติน ผลโดนัทอีกครั้ง 404 00:22:22,830 --> 00:22:24,922 มีอะไรจะทำอย่างไรกับขนมอบ 405 00:22:24,922 --> 00:22:25,630 แต่มีคุณไป 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> ดังนั้นนี้จะเรียงลำดับของการแสดงให้คุณเห็น วิธีการที่คุณสามารถดึงเนื้อหากลับ 408 00:22:38,630 --> 00:22:41,270 จาก API เพียงแค่ผ่าน เว็บเบราเซอร์ซึ่งเป็นที่ดี 409 00:22:41,270 --> 00:22:44,320 แต่มันไม่ได้จริงๆสิ่งที่คุณจะ ปกติจะใช้ใน API สำหรับมัน 410 00:22:44,320 --> 00:22:48,710 ดังนั้นหนึ่งในตัวอย่างของวิธีการที่คุณ จริงอาจทำเช่นนี้คือฉัน 411 00:22:48,710 --> 00:22:54,720 เขียนโปรแกรมขนาดเล็กสุด ซึ่งอีกครั้งจะค้นหาโดนัทของฉัน 412 00:22:54,720 --> 00:22:59,010 และเลือกสาขาคู่ และแสดงไว้ในตาราง 413 00:22:59,010 --> 00:23:01,610 ดังนั้นนี้เป็นอย่างมาก เนื้อหาเดียวกับที่เราเพียงแค่ 414 00:23:01,610 --> 00:23:04,830 เลื่อยที่มีเขตข้อมูลไม่กี่ดึงออกมา 415 00:23:04,830 --> 00:23:12,090 ดังนั้นรายการชื่อเรื่อง สถานที่ตั้งของสิ่งที่หนังสือเล่มนี้ 416 00:23:12,090 --> 00:23:15,120 เป็นเรื่องเกี่ยวกับภาษา และอื่น ๆ และอื่น ๆ 417 00:23:15,120 --> 00:23:20,480 >> ดังนั้นวิธีการนี​​้เกิดขึ้นจริงเนื่องจาก ผมคิดว่าเราต้องมองไปที่รหัสบางอย่าง 418 00:23:20,480 --> 00:23:22,420 เท่าไหร่ 419 00:23:22,420 --> 00:23:28,060 >> สิ่งที่เรามีที่นี่เป็น HTML ง่ายๆ หน้าซึ่งจะแสดงข้อความ 420 00:23:28,060 --> 00:23:32,900 ยินดีต้อนรับสู่คลาวด์และห้องสมุด แล้วแสดงตารางผล 421 00:23:32,900 --> 00:23:37,790 และมีผลอย่างเห็นได้ชัดใน ตารางเมื่อเพจที่ได้รับการโหลด 422 00:23:37,790 --> 00:23:41,380 แต่สิ่งที่เรากำลังทำ เป็นครั้งแรกของทั้งหมดเรา 423 00:23:41,380 --> 00:23:46,290 มีการโหลดห้องสมุดที่เรียกว่า jQuery ซึ่งเป็นพื้น 424 00:23:46,290 --> 00:23:52,030 ห้องสมุด JavaScript, ซึ่งทำให้มัน ง่ายมากที่จะจัดการกับ JavaScript 425 00:23:52,030 --> 00:23:58,780 กำเนิด, HTML และสร้างหน้าเว็บ ตรรกะฝั่งไคลเอ็นต์และหน้าเว็บ 426 00:23:58,780 --> 00:24:01,595 >> ดังนั้นสิ่งที่เรามีที่นี่เป็น jQuery มีวิธีการที่เรียกว่าได้รับ, 427 00:24:01,595 --> 00:24:05,270 ซึ่งเป็นหลักที่จะไป URL ซึ่งในกรณีนี้ 428 00:24:05,270 --> 00:24:09,070 นี่คือ URL มอง​​คุ้นเคย 429 00:24:09,070 --> 00:24:14,440 และจากนั้นก็จะได้รับข้อมูลจาก URL ที่และเรียกใช้ฟังก์ชั่นที่มัน 430 00:24:14,440 --> 00:24:19,240 ดังนั้นเราจึงกล่าวไป api.lib.harvard / edu 431 00:24:19,240 --> 00:24:20,060 ค้นหาโดนัท 432 00:24:20,060 --> 00:24:21,300 ให้เรา 20 ระเบียน 433 00:24:21,300 --> 00:24:28,590 และเรียกใช้ฟังก์ชั่นนี้ซึ่ง ฉันได้เลือกผ่านมันข้อมูล 434 00:24:28,590 --> 00:24:34,430 และข้อมูลที่เป็น JSON ที่ ได้กลับมาจาก API 435 00:24:34,430 --> 00:24:40,120 >> และจากนั้นเรากำลังจะบอกว่าภายในว่า ข้อมูลที่มีข้อมูลที่เรียกว่ารายการ 436 00:24:40,120 --> 00:24:48,117 และถ้าเราไปใช้เวลามองย้อนกลับไปที่ หนึ่งในผลลัพธ์เหล่านี้ที่นี่ 437 00:24:48,117 --> 00:24:49,200 มีอะไรบางอย่าง called-- 438 00:24:49,200 --> 00:24:50,220 >> ดีก็เรียกว่ารายการ 439 00:24:50,220 --> 00:24:53,520 ดังนั้นที่อาจเป็นไปได้ว่า 440 00:24:53,520 --> 00:25:01,840 และสิ่งที่มันไม่ได้เป็น ผ่านไปแต่ละรายการ 441 00:25:01,840 --> 00:25:05,300 แล้วเรียกอีก ฟังก์ชั่นในแต่ละรายการ 442 00:25:05,300 --> 00:25:08,440 และฟังก์ชั่นที่พื้น คือการค่า 443 00:25:08,440 --> 00:25:12,010 ของรายการซึ่งเป็น เป็นหลักบันทึกของแต่ละบุคคล 444 00:25:12,010 --> 00:25:18,220 และช่วยให้เราสามารถดึงออกชื่อ ความคุ้มครองและการใช้ภาษา 445 00:25:18,220 --> 00:25:21,640 >> ดังนั้นเราเรียกฟังก์ชั่นในทุก รายการที่เราได้กลับมาจาก API 446 00:25:21,640 --> 00:25:25,397 และถ้าคุณเพียงแค่ใช้เวลาดู ที่งานชิ้นนี้ได้ที่นี่ 447 00:25:25,397 --> 00:25:27,230 สิ่งที่เรากำลังทำอยู่ เรากำลังสร้างสตริง 448 00:25:27,230 --> 00:25:31,810 ซึ่งเป็นหลักบางส่วนมาร์กอัป HTML รอบโต๊ะกับ value.title, 449 00:25:31,810 --> 00:25:35,790 ซึ่งเป็นชื่อของ วัตถุ value.coverage, 450 00:25:35,790 --> 00:25:36,790 ซึ่งเป็นความคุ้มครอง - 451 00:25:36,790 --> 00:25:38,225 >> และเรากำลังทำตรวจสอบ ที่นี่เพื่อดูว่ามีใครที่ไม่ได้กำหนด 452 00:25:38,225 --> 00:25:40,570 และซ่อนมันถ้ามันบอกว่าไม่ได้กำหนด เพราะเราไม่ได้สนใจจริงๆ 453 00:25:40,570 --> 00:25:41,600 ในการที่ 454 00:25:41,600 --> 00:25:42,939 >> --and แล้วภาษา 455 00:25:42,939 --> 00:25:44,730 และแล้วสิ่งที่เรากำลัง ทำคือการผนวกที่ 456 00:25:44,730 --> 00:25:48,510 ไปที่โต๊ะที่มี ระบุสตริงที่นี่ 457 00:25:48,510 --> 00:25:50,790 และวิธีการทำงาน jQuery นี้คือสิ่งที่จะพูด 458 00:25:50,790 --> 00:25:56,420 จะมองหาตารางที่มีความคิด ผลและเพิ่มข้อความนี้ไป 459 00:25:56,420 --> 00:25:59,380 และนี่คือตารางที่มีผลความคิด 460 00:25:59,380 --> 00:26:04,998 ดังนั้นสิ่งที่คุณจะจบลง กับเป็นหน้านี้ที่นี่ 461 00:26:04,998 --> 00:26:06,206 และเพื่อที่จะดู source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 ดีที่มาไม่จริง ปรับปรุงเมื่อที่เกิดขึ้น 464 00:26:13,810 --> 00:26:18,740 ดังนั้นคุณจะเห็นที่เกิดขึ้นจริง ผลของตารางที่นี่ว่า 465 00:26:18,740 --> 00:26:24,770 >> ดังนั้นนี่เป็นเพียงตัวอย่างง่ายๆของ การทำแบบสอบถามพื้นฐานมากกับ API 466 00:26:24,770 --> 00:26:29,020 และแสดงข้อมูลในบางอื่น ๆ รูปแบบและไม่ได้ทำอะไรแฟนซีเกินไป 467 00:26:29,020 --> 00:26:36,370 ตอนนี้เป็นอีกตัวอย่างหนึ่งเช่น การประยุกต์ใช้เขียนขึ้นโดยเดวิดไวน์เบอร์เกอร์ 468 00:26:36,370 --> 00:26:39,120 เป็นตัวอย่างของนี้ซึ่ง เป็นหลักแสดงให้คุณเห็น 469 00:26:39,120 --> 00:26:44,620 วิธีที่คุณสามารถป่นขึ้นผลลัพธ์ที่คุณกำลัง ที่ได้รับจากห้องสมุดเมฆ API 470 00:26:44,620 --> 00:26:46,250 กับพูดว่า Google หนังสือ 471 00:26:46,250 --> 00:26:52,225 >> และความคิดที่นี่คือการที่ฉันสามารถ เรียกใช้แบบสอบถามกับ Google หนังสือ, 472 00:26:52,225 --> 00:26:56,060 ได้รับการค้นหาข้อความเต็มรูปแบบได้รับผลบางอย่าง ย้อนกลับไปหาที่ของรายการเหล่านั้น 473 00:26:56,060 --> 00:27:01,180 จริงที่มีอยู่ใน Hollis, ระบบห้องสมุด 474 00:27:01,180 --> 00:27:03,200 แล้วให้ฉันเชื่อมโยง กลับไปที่รายการเหล่านั้น 475 00:27:03,200 --> 00:27:12,730 ดังนั้นถ้าฉันค้นหาก็คือ คืนที่มืดและมีพายุฉัน 476 00:27:12,730 --> 00:27:16,210 รับกลับพวงของผล จาก Google และจากนั้นหนึ่งในผล 477 00:27:16,210 --> 00:27:19,460 ซึ่งเป็นริ้วรอยในเวลา 478 00:27:19,460 --> 00:27:29,330 และสิ่งเหล่านี้มีการเชื่อมโยงไปยังหนังสือที่มีอยู่ ในระบบห้องสมุดฮาร์วาร์ 479 00:27:29,330 --> 00:27:32,160 >> ดังนั้นผมคิดว่าจุดที่นี่ไม่ได้ มากว่านี้อาจจะหรืออาจจะไม่ 480 00:27:32,160 --> 00:27:34,118 เป็นวิธีการที่คุณต้องการ เพื่อค้นหาห้องสมุด 481 00:27:34,118 --> 00:27:38,310 แต่มันเป็นเรื่องที่แตกต่างกันอย่างสิ้นเชิง วิธีการที่ไม่สามารถใช้ได้กับคุณ 482 00:27:38,310 --> 00:27:42,884 ก่อนเช่นคุณมีวิธีการทำไม่ ค้นหาข้อความเต็มในหนังสือว่าแม้ 483 00:27:42,884 --> 00:27:44,550 เป็นส่วนหนึ่งของระบบห้องสมุดฮาร์วาร์ 484 00:27:44,550 --> 00:27:46,870 ดังนั้นตอนนี้เป็นวิธีที่ ที่คุณสามารถทำเช่นนั้นได้ 485 00:27:46,870 --> 00:27:51,930 และคุณสามารถแสดงไว้ใน สิ่งที่รูปแบบที่คุณต้องการ 486 00:27:51,930 --> 00:27:55,990 ดังนั้นจุดที่นี่เป็นพื้น เรากำลังเปิดขึ้นวิธีการใหม่สำหรับคน 487 00:27:55,990 --> 00:27:59,080 ทำงานกับข้อมูล 488 00:27:59,080 --> 00:28:07,925 >> ชิ้นส่วนของเมฆห้องสมุดก็คือว่า มันจะช่วยให้เปิดเผยบางส่วนของข้อมูลการใช้งาน 489 00:28:07,925 --> 00:28:08,800 ที่ห้องสมุดมี 490 00:28:08,800 --> 00:28:12,630 ดังนั้นถ้าคุณไปที่ห้องสมุด และคุณกำลังมองหาหนังสือ 491 00:28:12,630 --> 00:28:15,770 คุณไม่จำเป็นต้อง จริงมีความคิดของ, 492 00:28:15,770 --> 00:28:19,080 สำหรับรายการทั้งหมดใน เรื่องโดยเฉพาะอย่างยิ่งสิ่งที่ 493 00:28:19,080 --> 00:28:21,200 เป็นคนที่อยู่ใน ชุมชนไม่ว่าจะเป็น 494 00:28:21,200 --> 00:28:24,890 กำหนดให้เป็นฮาร์วาร์หรือ ประเทศหรือระดับของคุณ 495 00:28:24,890 --> 00:28:26,421 สิ่งที่พวกเขาพบว่ามีประโยชน์มากที่สุด? 496 00:28:26,421 --> 00:28:28,920 และห้องสมุดจริงมี ตันของข้อมูลเกี่ยวกับสิ่งที่ 497 00:28:28,920 --> 00:28:32,999 มีประโยชน์มากที่สุดเพราะถ้ามาก ของคนที่ได้รับการตรวจสอบจากหนังสือ 498 00:28:32,999 --> 00:28:34,040 ที่จะบอกคุณบางสิ่งบางอย่าง 499 00:28:34,040 --> 00:28:36,498 ต้องมีเหตุผลบางอย่าง พวกเขาต้องการที่จะตรวจสอบออก 500 00:28:36,498 --> 00:28:38,270 ผู้คนจำนวนมากใส่ไว้ในทุนสำรอง 501 00:28:38,270 --> 00:28:42,520 >> ถ้ามันอยู่ในรายชื่อสำรองสำหรับจำนวนมาก ของการเรียนที่จะบอกคุณบางสิ่งบางอย่าง 502 00:28:42,520 --> 00:28:45,960 หากคณะกรรมการจะตรวจสอบมัน ออกมากและนักศึกษาระดับปริญญาตรีไม่ได้ 503 00:28:45,960 --> 00:28:47,200 ที่จะบอกอะไรบางอย่าง 504 00:28:47,200 --> 00:28:49,280 ในทางกลับกันที่ยัง บอกคุณบางสิ่งบางอย่าง 505 00:28:49,280 --> 00:28:54,680 ดังนั้นมันจะน่าสนใจที่จะ นำข้อมูลที่ออกมีและให้ 506 00:28:54,680 --> 00:28:59,969 คนใช้มันเพื่อช่วยให้พวกเขาพบ ทำงานภายในระบบห้องสมุด 507 00:28:59,969 --> 00:29:02,260 พลิกด้านนี้คือ มีบางส่วนที่เป็นส่วนตัวอย่างจริงจัง 508 00:29:02,260 --> 00:29:07,854 ความกังวลเพราะหนึ่ง หลักคำสอนหลักของห้องสมุด 509 00:29:07,854 --> 00:29:10,770 คือเราจะไม่บอก คนสิ่งที่คนอื่นกำลังอ่าน 510 00:29:10,770 --> 00:29:17,360 และแม้ว่าคุณจะพูดนี้ หนังสือเล่มนี้ได้รับการตรวจสอบออกมาสี่ครั้ง 511 00:29:17,360 --> 00:29:20,070 ในเดือนที่โดยเฉพาะอย่างยิ่ง ที่สามารถนำมาใช้ 512 00:29:20,070 --> 00:29:25,252 ที่จะเชื่อมโยงกลับไปโดยเฉพาะอย่างยิ่ง บุคคลโดยข้อมูล de anonymizing 513 00:29:25,252 --> 00:29:26,710 และหาว่าใครตรวจสอบออก 514 00:29:26,710 --> 00:29:30,792 ดังนั้นวิธีการที่เราสามารถ avoid-- 515 00:29:30,792 --> 00:29:33,750 วิธีการที่เราสามารถพยายามที่จะดึง สัญญาณจากข้อมูลทั้งหมด 516 00:29:33,750 --> 00:29:36,740 โดยไม่ละเมิด ใครละเมิดความเป็นส่วนตัว 517 00:29:36,740 --> 00:29:42,150 เป็นหลักที่เรามอง 10 ปีของข้อมูลการใช้งาน - 518 00:29:42,150 --> 00:29:43,930 >> ดังนั้นจึงเป็นช่วงเวลาที่ยาวนานของเวลา 519 00:29:43,930 --> 00:29:50,639 >> --and บอกว่าโอเคเรามาดูวิธี หลายครั้งที่งานนี้ถูกนำมาใช้ 520 00:29:50,639 --> 00:29:52,930 และโดยที่ในช่วงนี้ ของเวลาและโดยทั่วไปแล้ว 521 00:29:52,930 --> 00:29:56,300 ให้กลับจำนวนที่เราเรียกว่า คะแนนกองที่พื้น 522 00:29:56,300 --> 00:29:59,910 แสดงให้เห็นถึงวิธีการมากก็ถูกนำมาใช้ 523 00:29:59,910 --> 00:30:01,084 และที่ number-- 524 00:30:01,084 --> 00:30:03,250 จำนวนมากของการคำนวณที่แตกต่างกัน ไปเป็นตัวเลขที่ 525 00:30:03,250 --> 00:30:05,150 --but มันหยาบมาก ตัวชี้วัดที่ช่วยให้คุณ 526 00:30:05,150 --> 00:30:11,300 ความคิดของวิธีบาง ชุมชนอาจจะให้ความสำคัญกับการทำงานที่ 527 00:30:11,300 --> 00:30:16,772 >> และเพื่อให้การจัดเรียงของแม้อื่น เพิ่มเติมโป่งพองออกมาประยุกต์ใช้ 528 00:30:16,772 --> 00:30:18,480 ที่ใช้ประโยชน์ นี้คือสิ่งที่ 529 00:30:18,480 --> 00:30:24,000 เรียกว่า Stacklife ที่เป็นจริง พร้อมใช้งานผ่านฮาร์วาร์หลัก 530 00:30:24,000 --> 00:30:24,880 พอร์ทัลห้องสมุด 531 00:30:24,880 --> 00:30:26,700 ดังนั้นคุณจะไป library.harvard.edu 532 00:30:26,700 --> 00:30:29,360 คุณจะเห็นจำนวนของที่แตกต่างกัน วิธีการค้นหาห้องสมุด 533 00:30:29,360 --> 00:30:32,300 และหนึ่งในนั้นมีชื่อเรียกว่า Stacklife 534 00:30:32,300 --> 00:30:38,980 >> และนี่เป็นโปรแกรมที่ เรียกดูเนื้อหาของห้องสมุด 535 00:30:38,980 --> 00:30:43,490 แต่ถูกสร้างขึ้นอย่างสมบูรณ์ ด้านบนของ API เหล่านี้ 536 00:30:43,490 --> 00:30:46,910 จึงไม่มีสิ่งที่พิเศษ เกิดขึ้นเบื้องหลัง 537 00:30:46,910 --> 00:30:49,570 มีการเข้าถึงไม่ได้ ข้อมูลที่คุณจะได้ไม่ต้อง 538 00:30:49,570 --> 00:30:54,090 มันใช้ API ที่จะให้คุณ กับการเรียกดูที่แตกต่างกันอย่างสิ้นเชิง 539 00:30:54,090 --> 00:30:55,480 ประสบการณ์ 540 00:30:55,480 --> 00:30:58,570 >> ดังนั้นถ้าฉันค้นหาอลิซ ในดินแดนมหัศจรรย์ในกรณีนี้ 541 00:30:58,570 --> 00:31:02,600 ฉันจะได้รับผลที่มีลักษณะเช่น นี้ซึ่งเป็น much-- สวย 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> มันคล้ายกับค้นหาอื่น ๆ คุณอาจจะยกเว้นในกรณีนี้ 544 00:31:10,870 --> 00:31:15,730 เรากำลังจัดอันดับรายการโดย stackscore ซึ่งจะช่วยให้คุณ 545 00:31:15,730 --> 00:31:19,850 ความคิดของวิธียอดนิยมเหล่านี้บางส่วน รายการที่อยู่ภายในชุมชน 546 00:31:19,850 --> 00:31:25,610 และเพื่อให้เห็นได้อย่างชัดเจน, อลิซในแดนมหัศจรรย์ โดยวอลท์ดิสนีย์ได้รับความนิยมอย่างสูง 547 00:31:25,610 --> 00:31:36,570 แต่คุณยังสามารถดูด้านบนสี่ ที่นี่จะเป็นคนที่คุณอาจไม่ได้ที่จริง 548 00:31:36,570 --> 00:31:39,220 >> สิ่งที่ถูกนำมาใช้อย่างมาก แต่คุณอาจไม่ได้ทันที 549 00:31:39,220 --> 00:31:41,240 เชื่อมต่อกับอลิซในแดนมหัศจรรย์ 550 00:31:41,240 --> 00:31:44,650 ดังนั้นเพื่อนเก่าของเรา ข้อเขียนของอลิซอยู่ที่นี่ 551 00:31:44,650 --> 00:31:46,350 ดังนั้นผมจึงสามารถดูที่มัน 552 00:31:46,350 --> 00:31:52,010 และตอนนี้สิ่งที่ฉันกำลังมองหา ที่เป็นพื้นตั้งเเล้ 553 00:31:52,010 --> 00:31:53,760 ฉันจะมีข้อเขียน อลิซที่นี่ 554 00:31:53,760 --> 00:31:56,700 ผมมีข้อมูลเกี่ยวกับเรื่องนี้ 555 00:31:56,700 --> 00:32:00,230 และผมยังมี stackscore ของในกรณีนี้, 26 556 00:32:00,230 --> 00:32:03,169 และนี่บอกฉันเรียงลำดับของประมาณ วิธีการที่เราได้ไป stackscore นี้ 557 00:32:03,169 --> 00:32:05,835 เช่นเดียวกับที่ตรวจสอบออกเช่นวิธี หลายครั้งก็คือการตรวจสอบออก 558 00:32:05,835 --> 00:32:08,440 เช่นเดียวกับคณะนักศึกษาระดับปริญญาตรีหรือวิธี หลายเล่มที่ห้องสมุดมี 559 00:32:08,440 --> 00:32:11,300 และอื่น ๆ และอื่น ๆ 560 00:32:11,300 --> 00:32:16,460 >> และคุณยังสามารถที่น่าสนใจพอ ที่นี่เรียกดูกองจริง 561 00:32:16,460 --> 00:32:19,550 ดังนั้นข้อมูลที่นี่นี้ มีการแสดงคุณเรียงลำดับ 562 00:32:19,550 --> 00:32:23,547 ของการเป็นตัวแทนเสมือน ของสิ่งที่อาจจะเก็บรักษา 563 00:32:23,547 --> 00:32:25,880 ลักษณะเช่นถ้าคุณจะใช้เวลา ถือครองทั้งหมดของห้องสมุด 564 00:32:25,880 --> 00:32:28,940 และทำให้พวกเขาอยู่ด้วยกัน บนหิ้งที่ไม่มีที่สิ้นสุดหนึ่ง 565 00:32:28,940 --> 00:32:30,990 และสิ่งที่ดีคือการที่เรา can-- 566 00:32:30,990 --> 00:32:33,380 >> ครั้งแรกของทั้งหมด เมตาดาต้าที่เกี่ยวกับหนังสือเหล่านี้ 567 00:32:33,380 --> 00:32:35,627 มักจะบอกคุณเมื่อมันถูกตีพิมพ์ 568 00:32:35,627 --> 00:32:37,085 มันจะบอกคุณกี่หน้าก็มี 569 00:32:37,085 --> 00:32:38,459 มันอาจจะบอกคุณขนาด 570 00:32:38,459 --> 00:32:42,930 ดังนั้นคุณจะเห็นที่สะท้อนให้เห็นที่นี่ ในแง่ของขนาดของหนังสือ 571 00:32:42,930 --> 00:32:46,740 >> แล้วเราสามารถใช้ สแต็คคะแนนที่จะเน้น 572 00:32:46,740 --> 00:32:49,170 หนังสือที่มีคะแนนสแต็คที่สูงขึ้น 573 00:32:49,170 --> 00:32:54,930 ดังนั้นถ้าหากมันเป็นสีเข้มก็หมายความว่า สันนิษฐานว่ามันถูกใช้บ่อยครั้งมากขึ้น 574 00:32:54,930 --> 00:32:57,040 ดังนั้นในกรณีนี้ผม จะเดาว่านี้ 575 00:32:57,040 --> 00:33:03,226 เป็นรุ่นของ Alice in Wonderland ที่เป็นที่นิยมใช้มากที่สุดและมากที่สุด 576 00:33:03,226 --> 00:33:05,100 เข้าถึงห้องสมุด มีสำเนาที่สุดของ 577 00:33:05,100 --> 00:33:06,975 ดังนั้นหากคุณกำลังมองหา อลิซในแดนมหัศจรรย์, 578 00:33:06,975 --> 00:33:10,220 นี้อาจจะเป็นสถานที่ที่ดีที่จะเริ่มต้น 579 00:33:10,220 --> 00:33:13,500 >> และแล้วที่นี่คุณยังสามารถเชื่อมโยงออก ที่จะพูด, Amazon ที่จะซื้อหนังสือเล่มนี้ 580 00:33:13,500 --> 00:33:15,182 และอื่น ๆ และอื่น ๆ 581 00:33:15,182 --> 00:33:17,140 จุดที่นี่อีกครั้ง ไม่ได้มากว่านี้ 582 00:33:17,140 --> 00:33:25,030 เป็นวิธีที่ดีที่สุดเพื่อเรียกดูห้องสมุด หรือเครื่องมือที่เหมาะสมสำหรับทุกโอกาส 583 00:33:25,030 --> 00:33:28,400 แต่มันเป็นวิธีการที่จะทำมันอีก 584 00:33:28,400 --> 00:33:31,359 และโดยการทำข้อมูล พร้อมใช้งานผ่าน API ซึ่ง 585 00:33:31,359 --> 00:33:34,650 ทำจากหน่วยการสร้างที่ง่ายมาก ซึ่งจะช่วยให้คุณสามารถค้นหาเนื้อหา 586 00:33:34,650 --> 00:33:39,420 คุณสามารถสร้างบางสิ่งบางอย่าง เช่นนี้ที่สามารถ 587 00:33:39,420 --> 00:33:41,520 เป็นพิเศษ มีคุณค่าให้กับคนบางคน 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> นั่นคือการจัดเรียงของมากที่สุดเท่าที่ฉันต้องการ ที่จะบอกว่าจริงๆเกี่ยวกับสิ่งที่ API เป็น 590 00:33:51,860 --> 00:33:56,070 และสิ่งที่มันก็หมายความว่ามีทั้ง พวงของสิ่งที่อยู่เบื้องหลังซึ่ง 591 00:33:56,070 --> 00:33:59,480 ฉันแค่จะไปสัมผัสกับเวลาสั้น ๆ เพียงเพราะการจัดเรียงของมานี้ 592 00:33:59,480 --> 00:34:03,720 จากมุมที่แตกต่างกันอย่างสมบูรณ์ใน แง่ของวิธีการทำอะไรบางอย่างเช่นนี้ 593 00:34:03,720 --> 00:34:04,580 ได้รับการใส่ลงไปในสถานที่? 594 00:34:04,580 --> 00:34:10,820 >> ดังนั้น API เป็นมาตรฐาน อินเตอร์เฟซให้กับทุกเนื้อหานี้ 595 00:34:10,820 --> 00:34:13,820 แต่การที่จะได้รับมันที่นั่น สิ่งแรกที่เราต้องทำ 596 00:34:13,820 --> 00:34:17,260 ถูกดึงข้อมูลร่วมกัน หนังสือและภาพ 597 00:34:17,260 --> 00:34:21,580 และช่วยหาคอลเลกชัน เอกสารจากระบบฮาร์วาร์ต่างๆ 598 00:34:21,580 --> 00:34:23,929 Aleph, VIA และ OASIS เป็น ชื่อของระบบ 599 00:34:23,929 --> 00:34:28,820 และพวกเขาเป็นหลักไปสู่ ท่อท่อการประมวลผล 600 00:34:28,820 --> 00:34:33,230 >> ดังนั้นครั้งแรกของทั้งหมดที่เราได้รับการส่งออก ไฟล์จากทั้งหมดของระบบเหล่านี้ 601 00:34:33,230 --> 00:34:35,130 เราแบ่งออกเป็นแต่ละรายการ 602 00:34:35,130 --> 00:34:39,360 ดังนั้นเราจึงมีไฟล์ซึ่งเป็นกิกะไบต์, ซึ่งมีล้านแผ่นในนั้น 603 00:34:39,360 --> 00:34:42,290 ดังนั้นเราจึงแบ่งมันออกเป็นแต่ละรายการ 604 00:34:42,290 --> 00:34:45,374 แล้วสำหรับแต่ละรายการเราแปลงเป็น เป็น MODS เพราะบางส่วนของเหล่านี้ 605 00:34:45,374 --> 00:34:47,040 มีกำเนิด MODS บางส่วนของพวกเขาไม่ได้ 606 00:34:47,040 --> 00:34:49,204 ดังนั้นเราจึงได้รับพวกเขาทั้งหมด จะอยู่ในรูปแบบเดียวกัน 607 00:34:49,204 --> 00:34:51,120 จากนั้นก็มีต่างๆ ขั้นตอนการตกแต่งที่ 608 00:34:51,120 --> 00:34:55,969 เราเพิ่มข้อมูลเพิ่มเติมข้อมูล กว่าที่มีอยู่ในห้องสมุด 609 00:34:55,969 --> 00:34:59,750 ดังนั้นเราจึงจำเป็นต้องเพิ่มครั้งแรกของทั้งหมด เรามีสิ่งที่ห้องสมุดถือมัน 610 00:34:59,750 --> 00:35:02,250 เราไปผ่านขั้นตอนของ คำนวณ stackscore 611 00:35:02,250 --> 00:35:07,112 เราไปผ่านขั้นตอนของอีก เพิ่มเมตาดาต้าที่มากขึ้นในแง่ 612 00:35:07,112 --> 00:35:10,730 ของสิ่งที่คนคอลเลกชัน อาจเพิ่มเจ้านี่ 613 00:35:10,730 --> 00:35:12,532 >> คนกำลังสร้าง คอลเลกชันของรายการ 614 00:35:12,532 --> 00:35:13,990 สิ่งที่คอลเลกชันที่ไม่ได้เป็นของใคร? 615 00:35:13,990 --> 00:35:17,220 มีวิธีการที่ผู้คนที่ติดแท็ก เนื้อหานี้ในอดีต? 616 00:35:17,220 --> 00:35:20,750 แล้วคุณกรองและคุณ จำกัด บันทึกเพราะที่ผมกล่าวถึง 617 00:35:20,750 --> 00:35:24,120 มีข้อมูลบางส่วนว่าเพราะ เหตุผลที่มีลิขสิทธิ์เราไม่สามารถแสดง 618 00:35:24,120 --> 00:35:26,700 และจากนั้นเราโหลดพวกเขา เป็นสิ่งที่เรียกว่า 619 00:35:26,700 --> 00:35:31,680 Solr ซึ่งไม่ได้สะกดผิด แต่ เป็นชื่อของชิ้นส่วนของซอฟต์แวร์ 620 00:35:31,680 --> 00:35:35,710 ที่จะจัดทำดัชนีการค้นหาซึ่ง ไดรฟ์ทั้งหมดการค้นหาที่อยู่เบื้องหลัง API 621 00:35:35,710 --> 00:35:40,110 และจากนั้นก็จะมีการ API และคนที่สามารถใช้งานได้ 622 00:35:40,110 --> 00:35:44,640 >> ดังนั้นนี้เป็นเหมือนอย่างเป็นธรรม กระบวนการที่ซับซ้อน 623 00:35:44,640 --> 00:35:47,230 หนึ่งที่น่าสนใจ สิ่งที่เกี่ยวกับมัน 624 00:35:47,230 --> 00:35:50,990 ที่เรากำลังเผชิญ 13 ล้านแผ่น 625 00:35:50,990 --> 00:35:53,820 และเรากำลังจะได้รับการติดต่อหรือมากกว่า 626 00:35:53,820 --> 00:36:01,260 และเราต้องการที่จะสามารถที่จะจัดการกับ เหล่านี้ในแฟชั่นที่ค่อนข้างรวดเร็ว 627 00:36:01,260 --> 00:36:03,630 มันต้องใช้เวลานานในการ ดำเนินการ 13 ล้านระเบียน 628 00:36:03,630 --> 00:36:09,529 >> ดังนั้นวิธีการที่ท่อนี้ ตั้งค่าคือการที่คุณ can-- 629 00:36:09,529 --> 00:36:12,070 ผมคิดว่าประโยชน์จาก ท่อปัญหาที่เรา 630 00:36:12,070 --> 00:36:15,580 พยายามที่จะแก้ปัญหาที่นี่คือ แปลงทั้งหมดทั้งหมด 631 00:36:15,580 --> 00:36:18,729 ขั้นตอนเหล่านี้ในเรื่องนี้ ท่อจะแยกกันไม่ออก 632 00:36:18,729 --> 00:36:19,645 มีการพึ่งพาไม่ได้ 633 00:36:19,645 --> 00:36:22,146 หากคุณกำลังประมวลผล บันทึกของหนังสือเล่มหนึ่ง, 634 00:36:22,146 --> 00:36:24,270 มีการพึ่งพาไม่มี ว่าระหว่างหนังสืออีกเล่มหนึ่ง 635 00:36:24,270 --> 00:36:27,760 >> ดังนั้นสิ่งที่เราสามารถทำได้คือโดยทั่วไป ในขั้นตอนในท่อแต่ละ 636 00:36:27,760 --> 00:36:30,470 เราใส่มันลงไปในคิวในเมฆ 637 00:36:30,470 --> 00:36:32,250 ฉันเกิดขึ้นจะต้องอยู่บน Amazon Web Services 638 00:36:32,250 --> 00:36:35,140 ดังนั้นจึงมีรายชื่อ, บอกว่า 10,000 รายการที่ 639 00:36:35,140 --> 00:36:38,100 จะต้องมีความปกติและ แปลงเป็นรูปแบบ MODS 640 00:36:38,100 --> 00:36:41,620 และเราหมุนเป็นเซิร์ฟเวอร์จำนวนมาก ตามที่เราต้องการอาจจะ 10 เซิร์ฟเวอร์ 641 00:36:41,620 --> 00:36:44,860 และแต่ละเซิร์ฟเวอร์เหล่านั้นเพียงแค่ นั่งอยู่ที่นั่นดูในคิวที่ 642 00:36:44,860 --> 00:36:46,730 เห็นว่ามีสิ่งหนึ่งที่ต้อง ต้องดำเนินการดึงมันออกคิว 643 00:36:46,730 --> 00:36:48,740 กระบวนการนั้นและ sticks มันในคิวต่อไป 644 00:36:48,740 --> 00:36:54,200 >> ดังนั้นสิ่งที่ช่วยให้เรา ทำคือการใช้เป็นหลัก 645 00:36:54,200 --> 00:36:58,110 เป็นฮาร์ดแวร์มากเท่าที่เราต้องการนี​​้ ปัญหาเป็นระยะเวลาที่สั้นมากของเวลา 646 00:36:58,110 --> 00:37:02,970 การประมวลผลข้อมูลได้อย่างรวดเร็ว เป็นไปได้ซึ่งเป็นสิ่งที่เท่านั้น 647 00:37:02,970 --> 00:37:08,220 ขณะนี้อยู่ในโลกของคอมพิวเตอร์เมฆ เราสามารถเซิร์ฟเวอร์บทบัญญัติหลัก 648 00:37:08,220 --> 00:37:09,890 ทันทีคือการที่มีประโยชน์ 649 00:37:09,890 --> 00:37:12,260 ดังนั้นเราจึงไม่จำเป็นต้องมี เซิร์ฟเวอร์ยักษ์นั่งรอบ 650 00:37:12,260 --> 00:37:16,700 ตลอดเวลาที่จะทำการประมวลผล ที่อาจจะเกิดขึ้นเพียงสัปดาห์ละครั้ง 651 00:37:16,700 --> 00:37:21,440 >> เพื่อให้เป็นส่วนใหญ่มัน 652 00:37:21,440 --> 00:37:27,590 มีเอกสารที่มีอยู่เป็น สำหรับห้องสมุดเมฆรายการ API 653 00:37:27,590 --> 00:37:31,960 ที่ URL นี้ซึ่งจะ สามารถใช้ได้ในภายหลัง 654 00:37:31,960 --> 00:37:36,730 และกรุณ​​าไปดูที่ เพื่อดูว่ามีอะไร 655 00:37:36,730 --> 00:37:37,579 คุณมีความคิดใด ๆ 656 00:37:37,579 --> 00:37:38,120 เล่นกับมัน 657 00:37:38,120 --> 00:37:38,830 เกลือกกลั้ว 658 00:37:38,830 --> 00:37:42,800 และหวังว่าคุณสามารถเข้ามา กับสิ่งที่ดี 659 00:37:42,800 --> 00:37:44,740 ขอบคุณ 660 00:37:44,740 --> 00:37:45,899