1
00:00:00,000 --> 00:00:11,370

2
00:00:11,370 --> 00:00:12,370
เจฟฟรีย์ LICHT: สวัสดี

3
00:00:12,370 --> 00:00:13,550
ฉันเจฟฟรีย์ Licht

4
00:00:13,550 --> 00:00:17,890
และฉันที่นี่เพื่อพูดคุยกับคุณเกี่ยวกับ
ฮาร์วาร์ห้องสมุดและอาคารของวันพรุ่งนี้

5
00:00:17,890 --> 00:00:20,870
ห้องสมุดในวันนี้ผมคิดว่า

6
00:00:20,870 --> 00:00:23,040
ดังนั้นพื้นหลังที่นี่
สนามสำหรับการประชุมครั้งนี้

7
00:00:23,040 --> 00:00:26,930
เป็นหลักว่ามี
ข้อมูลจำนวนมากบรรณานุกรม

8
00:00:26,930 --> 00:00:28,400
ที่มีอยู่ในห้องสมุดฮาร์วาร์

9
00:00:28,400 --> 00:00:33,434
และมีโอกาส
ผ่านบางส่วนของเครื่องมือ

10
00:00:33,434 --> 00:00:36,350
และโครงการที่ได้รับการพัฒนา
ที่จะได้รับการเข้าถึงข้อมูล

11
00:00:36,350 --> 00:00:42,430
และนำไปสถานที่ที่
ฮาร์วาร์ห้องสมุดไม่ได้ทำตอนนี้

12
00:00:42,430 --> 00:00:45,460
ทำสิ่งใหม่ ๆ กับมันทดลอง
และเล่นรอบกับมัน

13
00:00:45,460 --> 00:00:52,413
>> ดังนั้นจุดเริ่มต้นที่เป็นแบบนี้เป็น API
เรียกว่าห้องสมุดฮาร์วาร์เมฆซึ่ง

14
00:00:52,413 --> 00:00:57,650
เป็นเซิร์ฟเวอร์ข้อมูลเมตาเปิด
ซึ่งผมจะพูดถึงในขณะนี้

15
00:00:57,650 --> 00:01:02,595
ดังนั้นพื้นหลังเป็นว่ามี
จำนวนมากของสิ่งที่อยู่ในห้องสมุดฮาร์วาร์

16
00:01:02,595 --> 00:01:07,150
ขณะนี้มีกว่า 13 ล้านบรรณานุกรม
บันทึกล้านภาพ

17
00:01:07,150 --> 00:01:11,090
และหลายพันของการหาโรคเอดส์ซึ่ง
เป็นหลักเอกสารอธิบาย

18
00:01:11,090 --> 00:01:15,500
คอลเลกชัน, พูดในสิ่งที่
อยู่ในนั้นกล่องของเอกสาร

19
00:01:15,500 --> 00:01:21,080
และอื่น ๆ ที่เป็นตัวแทนกว่า
ล้านเอกสารของแต่ละบุคคล

20
00:01:21,080 --> 00:01:24,290
และนอกจากนี้ยังมีจำนวนมาก
ข้อมูลที่ห้องสมุดมี

21
00:01:24,290 --> 00:01:28,180
เกี่ยวกับวิธีการเนื้อหาที่ถูกนำมาใช้
อาจจะเป็นที่สนใจของผู้คน

22
00:01:28,180 --> 00:01:32,400
ที่อาจต้องการที่จะทำงานกับมัน

23
00:01:32,400 --> 00:01:36,150
>> ดังนั้นข้อมูลทั้งหมด
ห้องสมุดมีข้อมูลเมตา

24
00:01:36,150 --> 00:01:39,500
ดังนั้นเมตาดาต้าที่เป็นข้อมูลเกี่ยวกับข้อมูล

25
00:01:39,500 --> 00:01:42,070
ดังนั้นเมื่อเราพูดคุยเกี่ยวกับ
ข้อมูลที่เป็น

26
00:01:42,070 --> 00:01:44,890
ใช้ได้ผ่านห้องสมุด
เมฆที่มีอยู่,

27
00:01:44,890 --> 00:01:47,760
ก็ไม่จำเป็นต้อง
เอกสารที่เกิดขึ้นจริง

28
00:01:47,760 --> 00:01:53,060
ตัวเองไม่จำเป็นต้องเต็ม
ข้อความของหนังสือหรือภาพเต็ม

29
00:01:53,060 --> 00:01:54,890
แม้ว่าที่จริงอาจจะเป็นกรณี

30
00:01:54,890 --> 00:01:57,550
แต่มันเป็นเรื่องจริง
ข้อมูลเกี่ยวกับข้อมูล

31
00:01:57,550 --> 00:02:00,909
>> ดังนั้นคุณสามารถคิดรายการ
ข้อมูลหมายเลขโทรวิชา

32
00:02:00,909 --> 00:02:02,700
วิธีการหลายเล่ม
หนังสือเล่มนี้ยังมีสิ่งที่

33
00:02:02,700 --> 00:02:06,380
เป็นรุ่นสิ่งที่มี
รูปแบบที่ผู้เขียนและอื่น ๆ

34
00:02:06,380 --> 00:02:12,250
ดังนั้นมีจำนวนมากของข้อมูลเกี่ยวกับ
ในการเก็บรวบรวมข้อมูลที่

35
00:02:12,250 --> 00:02:14,400
ในตัวเองเป็นชนิดที่มีประโยชน์โดยเนื้อแท้

36
00:02:14,400 --> 00:02:19,230
และแม้ว่าถ้าคุณ
การทำวิจัยในเชิงลึก

37
00:02:19,230 --> 00:02:25,160
เห็นได้ชัดว่าคุณต้องการที่จะได้รับที่จะเกิดขึ้นจริง
เนื้อหาตัวเองและดูข้อมูลที่

38
00:02:25,160 --> 00:02:30,140
เมตาดาต้าที่จะเป็นประโยชน์ในแง่ของการ
ทั้งการวิเคราะห์ร่างกายโดยรวม

39
00:02:30,140 --> 00:02:33,870
เช่นเดียวกับสิ่งสิ่งที่อยู่ในคอลเลกชัน

40
00:02:33,870 --> 00:02:35,520
พวกเขาเกี่ยวข้องอย่างไร

41
00:02:35,520 --> 00:02:39,482
มันจะช่วยให้คุณจริงๆหาสิ่งอื่น ๆ
ซึ่งจริงๆจุดประสงค์หลักของมัน

42
00:02:39,482 --> 00:02:41,190
จุดของ
metadata และแคตตาล็อก

43
00:02:41,190 --> 00:02:43,230
จะช่วยให้คุณค้นหาทุก
ข้อมูลที่เป็น

44
00:02:43,230 --> 00:02:46,590
มีอยู่ในคอลเลกชัน

45
00:02:46,590 --> 00:02:53,690
>> ดังนั้นนี่คือตัวอย่างของเมตาดาต้า
สำหรับหนังสือในห้องสมุดฮาร์วาร์

46
00:02:53,690 --> 00:02:56,370
ดังนั้นก็มี

47
00:02:56,370 --> 00:02:59,850
และคุณสามารถเห็นมัน
จริงที่ซับซ้อนพอสมควร

48
00:02:59,850 --> 00:03:04,610
และเป็นส่วนหนึ่งของมูลค่าของเมตาดาต้า
ในระบบห้องสมุดฮาร์วาร์

49
00:03:04,610 --> 00:03:09,320
คือการที่จะได้รับการจัดเรียง
การสร้างขึ้นโดย catalogers

50
00:03:09,320 --> 00:03:12,720
และประกอบโดยผู้ใช้
จำนวนมากที่มีความเชี่ยวชาญและทักษะ

51
00:03:12,720 --> 00:03:20,030
และคิดว่ามันเมื่อเวลาผ่านไป
ซึ่งมีจำนวนมากของมูลค่า

52
00:03:20,030 --> 00:03:25,450
>> ดังนั้นถ้าคุณดูที่บันทึกนี้
ข้อเขียนของอลิซ, คุณสามารถหา

53
00:03:25,450 --> 00:03:32,590
คุณได้มีชื่อผู้เขียนมัน
ผู้เขียนและทุกวิชาที่แตกต่าง

54
00:03:32,590 --> 00:03:35,380
ซึ่งคนที่ได้ลงในรายชื่อ

55
00:03:35,380 --> 00:03:40,110
และคุณสามารถเห็นนอกจากนี้ยังมีใน
นอกเหนือไปจากข้อมูลจำนวนมากที่ดี

56
00:03:40,110 --> 00:03:42,852
ที่นี่มีการทำสำเนาบางส่วน

57
00:03:42,852 --> 00:03:45,560
มีจำนวนมากของความซับซ้อนที่เป็น
สะท้อนผ่านข้อมูลเมตา

58
00:03:45,560 --> 00:03:46,300
ว่าคุณมี

59
00:03:46,300 --> 00:03:50,320
>> ดังนั้นหนึ่งชื่อของหนังสือเล่มนี้คือ
การผจญภัยของอลิซในแดนมหัศจรรย์

60
00:03:50,320 --> 00:03:53,880
ดังนั้นนี่คือคำอธิบายประกอบ
รุ่นของหนังสือเล่มนั้น

61
00:03:53,880 --> 00:03:56,380
แต่ก็ยังเรียกว่าข้อเขียน
อลิซผจญภัยของอลิซ

62
00:03:56,380 --> 00:03:58,570
เพราะในแดนมหัศจรรย์
มันเป็นสิ่งที่

63
00:03:58,570 --> 00:04:00,430
มาร์ตินการ์ดเนอร์เขียน
และข้อเขียนหนังสือ

64
00:04:00,430 --> 00:04:03,369
และมีจำนวนมากของข้อมูลที่ดี
เกี่ยวกับปริศนาตรรกะและสิ่ง

65
00:04:03,369 --> 00:04:05,410
ภายในอลิซที่คุณ
อาจไม่ทราบเกี่ยวกับ

66
00:04:05,410 --> 00:04:07,000
ดังนั้นคุณควรจะไปอ่านมัน

67
00:04:07,000 --> 00:04:11,940
>> แต่คุณสามารถดูมี
จำนวนมากของรายละเอียดที่นี่

68
00:04:11,940 --> 00:04:15,340
รวมทั้งระบุเมื่อมัน
ถูกสร้างขึ้นมันมาจากไหน,

69
00:04:15,340 --> 00:04:17,420
ในแง่ของฮาร์วาร์
ระบบและอื่น ๆ

70
00:04:17,420 --> 00:04:20,350
ดังนั้นนี่คือตัวอย่างของ
ประเภทของข้อมูลเมตา

71
00:04:20,350 --> 00:04:24,340
ที่คุณอาจเห็นในหนังสือ
คอลเลกชันห้องสมุดฮาร์วาร์

72
00:04:24,340 --> 00:04:26,680
>> นี่คือสิ่งที่แตกต่างอย่างสิ้นเชิง

73
00:04:26,680 --> 00:04:32,610
จึงมีระบบที่เรียกว่า
VIA ฮาร์วาร์ซึ่งโดยทั่วไป

74
00:04:32,610 --> 00:04:39,990
เป็นแคตตาล็อกภาพและวัตถุของศิลปะ
และสิ่งที่มองเห็นได้ตลอดทั้งฮาร์วาร์

75
00:04:39,990 --> 00:04:44,010
และเพิ่มข้อมูลเมตาบาง
ให้พวกเขาแบ่งพวกเขา

76
00:04:44,010 --> 00:04:49,200
และในบางกรณีการให้บริการ
ภาพขนาดเล็ก

77
00:04:49,200 --> 00:04:51,250
ที่คุณสามารถใช้
ดูดังนั้นหากคุณต้องการ

78
00:04:51,250 --> 00:04:54,240
>> ดังนั้นนี่คือตัวอย่างของ
เมตาดาต้าที่คุณมีสำหรับแผ่น

79
00:04:54,240 --> 00:04:57,840
จากการสันนิษฐานว่าอลิซในแดนมหัศจรรย์

80
00:04:57,840 --> 00:05:00,499
และคุณสามารถเห็นมี
เมตาดาต้าน้อยที่นี่

81
00:05:00,499 --> 00:05:02,040
มันเป็นเพียงชนิดที่แตกต่างของวัตถุ

82
00:05:02,040 --> 00:05:03,425
และเพื่อให้มีข้อมูลน้อย

83
00:05:03,425 --> 00:05:07,790
>> คุณส่วนใหญ่มีความจริงที่ว่าโทร
ตัวเลขหลักที่สร้างมัน -

84
00:05:07,790 --> 00:05:10,410
>> เราไม่ทราบว่าเมื่อมันถูกสร้างขึ้น

85
00:05:10,410 --> 00:05:13,320
>> --and ชื่อ

86
00:05:13,320 --> 00:05:14,300
>> อีกตัวอย่างหนึ่ง

87
00:05:14,300 --> 00:05:16,380
นี่คือการค้นพบความช่วยเหลือ

88
00:05:16,380 --> 00:05:19,030
ดังนั้นจึงมีการสะสมของลูอิส
เอกสารของแครอลที่ฮาร์วาร์

89
00:05:19,030 --> 00:05:23,601
ดังนั้นนี้อธิบายถึงสิ่งที่
อยู่ในคอลเลกชันที่

90
00:05:23,601 --> 00:05:26,100
ดังนั้นคนที่ได้ผ่านและ
มองผ่านกล่องทั้งหมด

91
00:05:26,100 --> 00:05:32,220
และรายชื่อมันให้พื้นหลังบาง
เขียนสรุปของสิ่งที่อยู่ที่นี่

92
00:05:32,220 --> 00:05:35,290
และถ้าคุณได้ดู
เพิ่มเติมได้ที่นี้นี้

93
00:05:35,290 --> 00:05:39,620
ไปในหน้าและหน้า
และหน้า แต่จะบอกคุณ

94
00:05:39,620 --> 00:05:41,860
สิ่งที่ตัวอักษรและสิ่งที่
วันที่จากสิ่งที่กล่อง

95
00:05:41,860 --> 00:05:44,289
มีอยู่ทั่วทั้งคอลเลกชัน

96
00:05:44,289 --> 00:05:46,330
แต่นี่คือสิ่งที่
ว่าถ้าคุณอยู่ที่ฮาร์วาร์

97
00:05:46,330 --> 00:05:50,720
คุณสามารถไปและเป็นจริงการมองร่างกาย
ขึ้นและน่าจะดูที่

98
00:05:50,720 --> 00:05:53,440
>> ดังนั้นนี้เป็นที่ดีทั้งหมด

99
00:05:53,440 --> 00:05:54,450
ข้อมูลเมตานี้ของที่มีประโยชน์

100
00:05:54,450 --> 00:05:56,327
มันอยู่ในระบบห้องสมุดฮาร์วาร์

101
00:05:56,327 --> 00:05:58,910
มีเครื่องมือออนไลน์ที่คุณ
สามารถไปและจะดูที่มัน

102
00:05:58,910 --> 00:05:59,993
และดูมันและค้นหามัน

103
00:05:59,993 --> 00:06:02,810
และคุณสามารถเชือดมันและลูกเต๋า
ในหลายวิธีที่แตกต่างกัน

104
00:06:02,810 --> 00:06:06,920
>> แต่มันเป็นเรื่องจริงที่มีอยู่เฉพาะในกรณีที่
คุณเป็นมนุษย์นั่งลง

105
00:06:06,920 --> 00:06:12,600
ที่เว็บเบราเซอร์ของคุณหรือบางสิ่งบางอย่างหรือ
โทรศัพท์ของคุณและการนำทางผ่านมัน

106
00:06:12,600 --> 00:06:16,730
มันไม่จริงที่มีอยู่ใน
ชนิดของแฟชั่นที่ใช้งานใด ๆ

107
00:06:16,730 --> 00:06:19,520
สำหรับระบบอื่น ๆ หรือ
คอมพิวเตอร์เครื่องอื่น ๆ ในการใช้งาน

108
00:06:19,520 --> 00:06:21,500
ไม่ได้อยู่กับระบบภายใน
ห้องสมุดฮาร์วาร์

109
00:06:21,500 --> 00:06:24,890
แต่ระบบในโลกภายนอก
เพียงแค่คนอื่น ๆ ทั่วไป

110
00:06:24,890 --> 00:06:30,210
ดังนั้นคำถามคือวิธีการที่เราสามารถ
ทำให้มันสามารถใช้ได้กับคอมพิวเตอร์

111
00:06:30,210 --> 00:06:33,560
เพื่อให้เราสามารถทำน่าสนใจมากขึ้น
สิ่งที่มีกว่าเพียง

112
00:06:33,560 --> 00:06:36,550
เรียกดูมันเอง?

113
00:06:36,550 --> 00:06:39,766
>> ดังนั้นเหตุผลที่คุณจะต้องการที่จะทำเช่นนี้?

114
00:06:39,766 --> 00:06:41,140
มีจำนวนมากของความเป็นไปได้อยู่

115
00:06:41,140 --> 00:06:43,980
หนึ่งคือการที่คุณสามารถสร้างได้อย่างสมบูรณ์
วิธีการที่แตกต่างกันของการเรียกดู

116
00:06:43,980 --> 00:06:46,962
เนื้อหาที่มีอยู่
ผ่านห้องสมุดฮาร์วาร์

117
00:06:46,962 --> 00:06:48,670
ฉันจะแสดงให้คุณหนึ่ง
ภายหลังเรียก Stacklife,

118
00:06:48,670 --> 00:06:52,440
ซึ่งมีความแตกต่างอย่างสิ้นเชิง
ใช้เวลาในการมองหาเนื้อหา

119
00:06:52,440 --> 00:06:54,560
>> คุณสามารถสร้างเครื่องมือคำแนะนำ

120
00:06:54,560 --> 00:06:57,955
ดังนั้นห้องสมุดฮาร์วาร์ไม่ได้อยู่ใน
ธุรกิจของบอกว่าคุณชอบหนังสือเล่มนี้

121
00:06:57,955 --> 00:07:01,080
จากนั้นไปดูที่เหล่านี้ 17 อื่น ๆ
หนังสือที่คุณอาจจะสนใจใน

122
00:07:01,080 --> 00:07:03,200
หรือเหล่านี้ 18 ภาพอื่น ๆ

123
00:07:03,200 --> 00:07:06,040
แต่ที่แน่นอนที่จะทำได้
เป็นคุณสมบัติที่มีคุณค่า

124
00:07:06,040 --> 00:07:09,272
และให้ข้อมูลเมตาก็อาจ
จะเป็นไปได้ที่จะนำที่ร่วมกัน

125
00:07:09,272 --> 00:07:11,980
คุณอาจมีความต้องการที่แตกต่างกันใน
แง่ของการค้นหาเนื้อหา

126
00:07:11,980 --> 00:07:16,200
เช่นบางทีแม้จะมีเครื่องมือที่
มีที่ห้องสมุดทำให้

127
00:07:16,200 --> 00:07:18,450
สามารถใช้ได้คุณอาจต้องการ
การค้นหาในทางที่แตกต่างกัน

128
00:07:18,450 --> 00:07:21,847
หรือเพิ่มประสิทธิภาพสำหรับกรณีที่ใช้โดยเฉพาะอย่างยิ่ง
ซึ่งอาจจะเป็นเฉพาะมาก

129
00:07:21,847 --> 00:07:23,930
อาจจะมีเพียงไม่กี่
คนที่อยู่ในโลกที่

130
00:07:23,930 --> 00:07:25,846
ต้องการค้นหาเนื้อหา
ในทางนี้ แต่มัน

131
00:07:25,846 --> 00:07:28,985
จะดีถ้าเรา
จะปล่อยให้พวกเขาทำอย่างนั้น

132
00:07:28,985 --> 00:07:30,860
มีจำนวนมากของการวิเคราะห์เป็น
ในเวลาเพียงวิธีการที่คน

133
00:07:30,860 --> 00:07:33,860
ใช้เนื้อหาที่จะได้รับจริงๆ
น่าสนใจที่จะรู้เกี่ยวกับการหา

134
00:07:33,860 --> 00:07:37,280
สิ่งที่หนังสือมีการใช้
สิ่งที่ไม่ได้และอื่น ๆ

135
00:07:37,280 --> 00:07:41,670
แล้วมีจำนวนมาก
โอกาสที่จะบูรณาการ

136
00:07:41,670 --> 00:07:45,210
กับข้อมูลอื่น ๆ
ที่ออกมีในเว็บ

137
00:07:45,210 --> 00:07:46,880
ดังนั้นเราจึง have--

138
00:07:46,880 --> 00:07:50,260
>> ตัวอย่างเช่น NPR มี
ส่วนการตรวจสอบหนังสือ

139
00:07:50,260 --> 00:07:53,090
ที่พวกเขาสัมภาษณ์
ผู้เขียนเกี่ยวกับหนังสือ

140
00:07:53,090 --> 00:07:56,837
และดังนั้นจึงจะดีถ้าคุณได้
มองหาหนังสือในฮาร์วาร์

141
00:07:56,837 --> 00:07:59,670
ห้องสมุดและคุณบอกว่าโอเคมี
รับการสัมภาษณ์กับผู้เขียน

142
00:07:59,670 --> 00:08:00,878
ลองไปดูที่ว่า

143
00:08:00,878 --> 00:08:05,461
หรือมีหน้าวิกิพีเดียเป็น
อำนาจการอ้างอิงทางวิชาการ

144
00:08:05,461 --> 00:08:07,710
เกี่ยวกับหนังสือเล่มที่คุณนี้
อาจต้องการที่จะดูที่

145
00:08:07,710 --> 00:08:12,600
>> มีเหล่านี้ประเภทของแหล่งที่มา
กระจายอยู่ทั่วเว็บ

146
00:08:12,600 --> 00:08:16,555
และนำพวกเขาเข้าด้วยกัน
อาจจะใช้งานที่ดี

147
00:08:16,555 --> 00:08:18,930
กับคนที่กำลังมองหาที่
เนื้อหาที่กำลังมองหาบางสิ่งบางอย่าง

148
00:08:18,930 --> 00:08:20,180
แต่มันก็ยังไม่ได้
ชนิดของสิ่งที่คุณต

149
00:08:20,180 --> 00:08:23,205
ต้องการห้องสมุดจะต้องรับผิดชอบ
สำหรับการไปลงและการล่าสัตว์ลง

150
00:08:23,205 --> 00:08:25,455
ทั้งหมดเหล่านี้แหล่งที่มาที่แตกต่างกัน
และเสียบเข้าด้วยกัน

151
00:08:25,455 --> 00:08:28,920
เพราะพวกเขากำลังเปลี่ยนแปลงอย่างต่อเนื่อง

152
00:08:28,920 --> 00:08:33,570
และสิ่งที่พวกเขาคิดว่าเป็นสิ่งสำคัญที่อาจ
ไม่ได้เป็นสิ่งที่คุณคิดว่าเป็นสิ่งที่สำคัญ

153
00:08:33,570 --> 00:08:36,929
>> และมากขึ้นดังนั้นโดยทั่วไปมี
จำนวนมากสิ่งที่เราไม่ได้คิดเลย

154
00:08:36,929 --> 00:08:42,222
ดังนั้นหากเราสามารถเปิดขึ้นนี้มากขึ้น
คนนอกเหนือจากครึ่งโหลหรือดังนั้น

155
00:08:42,222 --> 00:08:45,174
ที่กำลังมองหาที่เกี่ยวกับเรื่องนี้
เป็นประจำสามารถคิดของความคิด

156
00:08:45,174 --> 00:08:47,340
และนวดข้อมูลและ
ทำในสิ่งที่พวกเขาต้องการด้วย

157
00:08:47,340 --> 00:08:49,920

158
00:08:49,920 --> 00:08:54,045
>> ดังนั้นเราจึงต้องการที่จะทำให้เรื่องนี้
ข้อมูลที่มีอยู่ในโลกใบนี้

159
00:08:54,045 --> 00:08:55,670
ดีมีภาวะแทรกซ้อนทั้งคู่

160
00:08:55,670 --> 00:08:58,540
หนึ่งคือการที่ข้อมูลเมตานี้
อยู่ในระบบที่แตกต่างกัน

161
00:08:58,540 --> 00:09:01,110
มันอยู่ในรูปแบบที่แตกต่างกัน

162
00:09:01,110 --> 00:09:04,719
ดังนั้นจึงมีการฟื้นฟูบางส่วน
ซึ่งความต้องการที่จะเกิดขึ้น

163
00:09:04,719 --> 00:09:08,010
ซึ่งการฟื้นฟูเป็นกระบวนการของการ
นำสิ่งจากรูปแบบที่แตกต่างกัน

164
00:09:08,010 --> 00:09:12,940
และการทำแผนที่ให้เป็นรูปแบบเดียว
เพื่อให้สาขาที่จะตรงกับขึ้น

165
00:09:12,940 --> 00:09:15,160
>> มีข้อ จำกัด บางอย่างมีลิขสิทธิ์

166
00:09:15,160 --> 00:09:21,010
ผิดปกติพอรายการแคตตาล็อก
เกี่ยวกับหนังสือเล่มจะเป็นผู้รับผิดชอบสำหรับการมีลิขสิทธิ์

167
00:09:21,010 --> 00:09:24,060
ดังนั้นแม้ว่าจะเป็นเพียง
ข้อมูลที่ได้จากหนังสือเล่มนี้

168
00:09:24,060 --> 00:09:25,330
มันมีลิขสิทธิ์

169
00:09:25,330 --> 00:09:28,400
และขึ้นอยู่กับที่จริง
สร้างเมตาดาต้าที่

170
00:09:28,400 --> 00:09:32,175
อาจจะมีข้อ จำกัด ในการที่
สามารถกระจายมัน to-- ที่คล้ายกัน

171
00:09:32,175 --> 00:09:33,402
>> ฉันไม่รู้

172
00:09:33,402 --> 00:09:36,110
มันอาจจะหรือไม่อาจจะคล้ายกับ
สถานการณ์ของเนื้อเพลงเพลง

173
00:09:36,110 --> 00:09:36,610
เช่น

174
00:09:36,610 --> 00:09:38,560
ดังนั้นเราทุกคนรู้ว่ากระทะออก

175
00:09:38,560 --> 00:09:40,450
ดังนั้นคุณต้องได้รับการแก้ไขปัญหาที่

176
00:09:40,450 --> 00:09:44,910
>> และจากนั้นอีกชิ้นหนึ่งคือ
ว่ามีข้อมูลจำนวนมาก

177
00:09:44,910 --> 00:09:52,420
ดังนั้นถ้าผมคนที่ต้องการที่จะทำงาน
ที่มีข้อมูลหรือมีความคิดที่เย็น

178
00:09:52,420 --> 00:09:55,350
การจัดการกับ 14 ล้าน
บันทึกแล็ปท็อปของฉัน

179
00:09:55,350 --> 00:09:57,487
อาจจะมีปัญหา
และยากที่จะจัดการ

180
00:09:57,487 --> 00:09:59,320
ดังนั้นเราจึงต้องการที่จะลด
อุปสรรคสำหรับคน

181
00:09:59,320 --> 00:10:02,130
เพื่อให้สามารถทำงานกับข้อมูล

182
00:10:02,130 --> 00:10:07,880
>> ดังนั้นวิธีการที่ว่าที่อยู่หวังว่า
ทั้งหมดของความกังวลเหล่านี้เป็นสองส่วน

183
00:10:07,880 --> 00:10:11,770
หนึ่งคือการสร้างแพลตฟอร์มที่ใช้เวลา
ข้อมูลจากแหล่งที่มาที่แตกต่างกันเหล่านี้

184
00:10:11,770 --> 00:10:14,350
และ aggravates มัน normalizes,
เสริมสร้างมันและทำให้

185
00:10:14,350 --> 00:10:16,650
มันมีอยู่ในสถานที่เดียว

186
00:10:16,650 --> 00:10:20,950
และก็จะทำให้มันสามารถใช้ได้ผ่าน
API สาธารณะที่ผู้คนสามารถเรียก

187
00:10:20,950 --> 00:10:24,430
>> ดังนั้น API เป็นแอพลิเคชัน
อินเตอร์เฟซการเขียนโปรแกรม

188
00:10:24,430 --> 00:10:28,930
และโดยทั่วไปหมายถึง
ปลายทางที่ระบบหรือเทคโนโลยี

189
00:10:28,930 --> 00:10:31,720
สามารถโทรและได้รับข้อมูลกลับมาใน
รูปแบบโครงสร้างในทาง

190
00:10:31,720 --> 00:10:32,900
ที่จะสามารถนำมาใช้

191
00:10:32,900 --> 00:10:36,060
ดังนั้นจึงไม่ได้ขึ้นอยู่
ว่าจะไปที่เว็บไซต์

192
00:10:36,060 --> 00:10:37,970
และข้อมูลการขูดออก
ของมันตัวอย่างเช่น

193
00:10:37,970 --> 00:10:40,690

194
00:10:40,690 --> 00:10:45,010
>> ดังนั้นนี่คือหน้าแรกของ
ห้องสมุดเมฆรายการ API,

195
00:10:45,010 --> 00:10:47,220
ซึ่งเป็นหลักรุ่นสอง

196
00:10:47,220 --> 00:10:50,130
ดังนั้นจึงเป็นซ้ำสองของ
พยายามที่จะทำให้ข้อมูลทั้งหมดนี้

197
00:10:50,130 --> 00:10:53,280
ที่มีอยู่ในโลกใบนี้

198
00:10:53,280 --> 00:10:59,560
ดังนั้นจึงเป็น
http://api.lib.harvard.edu/v2/items

199
00:10:59,560 --> 00:11:03,830
และเพียงแค่นี้ที่จะทำลายลง
นิด ๆ หน่อย ๆ สิ่งนี้หมายความว่า

200
00:11:03,830 --> 00:11:06,115
ว่าขณะนี้เป็นรุ่นที่สองของ API

201
00:11:06,115 --> 00:11:08,490
มีรุ่นหนึ่งซึ่ง
ผมไม่อยากจะพูดคุยเกี่ยวกับ

202
00:11:08,490 --> 00:11:09,750
แต่มีรุ่นหนึ่ง

203
00:11:09,750 --> 00:11:14,740
>> และถ้าคุณกำลังเรียกร้องนี้
API คุณจะได้รับรายการ

204
00:11:14,740 --> 00:11:20,640
และเป็นส่วนหนึ่งของความคิดของ
API เป็น API เป็นสัญญา

205
00:11:20,640 --> 00:11:23,440
มันเป็นสิ่งที่เป็น
จะไม่มีการเปลี่ยนแปลง

206
00:11:23,440 --> 00:11:24,850
ดังนั้นตัวอย่างเช่น -

207
00:11:24,850 --> 00:11:27,410
>> และเหตุผลที่ว่าถ้าผม
สร้างชนิดของระบบบางอย่างที่

208
00:11:27,410 --> 00:11:33,210
จะใช้ห้องสมุดเมฆ API
เพื่อแสดงหนังสือหรือช่วยให้คนหา

209
00:11:33,210 --> 00:11:36,190
ข้อมูลในรูปแบบที่ไม่ซ้ำกัน
สิ่งที่เราไม่ต้องการให้เกิดขึ้น

210
00:11:36,190 --> 00:11:38,940
คือเราจะไปเปลี่ยนวิธีการ
ที่ทำงาน API และก็

211
00:11:38,940 --> 00:11:41,340
ทุกอย่างแตกที่ด้านข้างของผู้ใช้

212
00:11:41,340 --> 00:11:46,710
ดังนั้นส่วนหนึ่งของถ้าคุณกำลังทำ API
ที่มีอยู่ในโลกใบนี้ก็

213
00:11:46,710 --> 00:11:49,396
การปฏิบัติที่ดีที่จะนำ
หมายเลขรุ่นในนั้นเพื่อให้ประชาชน

214
00:11:49,396 --> 00:11:51,020
รู้ว่าสิ่งที่รุ่นที่พวกเขากำลังจัดการกับ

215
00:11:51,020 --> 00:11:54,300
>> ดังนั้นถ้าเราตัดสินใจที่เราพบว่าวิธีที่ดีกว่า
การทำข้อมูลเหล่านี้สามารถใช้ได้

216
00:11:54,300 --> 00:11:57,295
เราอาจจะเปลี่ยนที่ไป
เรียกรุ่นที่สาม

217
00:11:57,295 --> 00:11:59,920
ดังนั้นทุกคนที่ยังคงใช้
สองรุ่นที่จะยังคงทำงาน

218
00:11:59,920 --> 00:12:03,490
แต่รุ่นที่สามจะ
มีทุกสิ่งใหม่ ๆ

219
00:12:03,490 --> 00:12:06,680

220
00:12:06,680 --> 00:12:09,210
>> ดังนั้นนี่คือ API แต่นี้
จริงๆดูเหมือน URL

221
00:12:09,210 --> 00:12:11,680
และเพื่อให้สิ่งนี้
ตัวอย่างของการเป็นสิ่งที่

222
00:12:11,680 --> 00:12:16,615
เรียก API ส่วนที่เหลือซึ่งสามารถใช้ได้
มากกว่าเพียงแค่การเชื่อมต่อเว็บปกติ

223
00:12:16,615 --> 00:12:19,680
และคุณสามารถจริง
ไปไว​​้ในเบราว์เซอร์

224
00:12:19,680 --> 00:12:28,550
>> ดังนั้นที่นี่ฉันได้เปิดขึ้นเพียง Firefox และ
ไป api.lib.harvard.edu/v2/items

225
00:12:28,550 --> 00:12:31,560
ดังนั้นสิ่งที่ฉันได้รับที่นี่เป็น
พื้นหน้าแรก

226
00:12:31,560 --> 00:12:34,740
ผลจากทั้ง
ชุดของรายการที่เรามี

227
00:12:34,740 --> 00:12:37,460
และมันก็เป็นที่นี่ในรูปแบบ XML

228
00:12:37,460 --> 00:12:40,130

229
00:12:40,130 --> 00:12:42,210
และมันก็ยังคงเป็น
prettified โดย Firefox

230
00:12:42,210 --> 00:12:45,850
มันไม่ได้จริงมีสิ่งเหล่านี้
ขยายตัวเล็กน้อยและการทำสัญญา

231
00:12:45,850 --> 00:12:47,880
doohickeys ที่นี่

232
00:12:47,880 --> 00:12:52,520
นี่คือการจัดเรียงของดีกว่า
วิธีรุ่นที่จะมองมัน

233
00:12:52,520 --> 00:12:57,040
>> แต่สิ่งนี้จะบอกเราก็คือ
ฉันได้รับการร้องขอทุกรายการ

234
00:12:57,040 --> 00:13:03,120
ดังนั้นจึงมี 13,289,475 รายการ

235
00:13:03,120 --> 00:13:06,150
และฉันกำลังมองในตอนแรก
10 เริ่มต้นที่ศูนย์ตำแหน่ง

236
00:13:06,150 --> 00:13:09,760
เพราะในวิทยาการคอมพิวเตอร์
เรามักจะเริ่มต้นที่ศูนย์

237
00:13:09,760 --> 00:13:15,150
และสิ่งที่ผมได้ที่นี่ถ้าฉันเพียงแค่ยุบ
นี้คุณจะเห็นฉันมี 10 รายการ

238
00:13:15,150 --> 00:13:20,410

239
00:13:20,410 --> 00:13:25,210
>> และถ้าผมจะดูที่รายการที่ฉันสามารถ
เห็นว่าผมได้มีข้อมูลเกี่ยวกับเรื่องนี้

240
00:13:25,210 --> 00:13:27,400
และนี่คือสิ่งที่เรียกว่ารูปแบบ MODS

241
00:13:27,400 --> 00:13:30,860
ดังนั้นฉันจะเปลี่ยน
กลับมาที่นี่สักครู่

242
00:13:30,860 --> 00:13:33,750
ตกลง

243
00:13:33,750 --> 00:13:37,447
>> ดังนั้นลองค้นหาสิ่งที่อยู่ใน
ที่เฉพาะเจาะจงเพราะรายการแรกที่

244
00:13:37,447 --> 00:13:40,030
ที่เกิดขึ้นที่จะเกิดขึ้นเมื่อคุณมอง
ผ่านคอลเลกชันทั้งหมด

245
00:13:40,030 --> 00:13:41,750
คือโดยความหมายแบบสุ่ม

246
00:13:41,750 --> 00:13:44,550
เพื่อให้ดูสำหรับโดนัทบาง

247
00:13:44,550 --> 00:13:46,830
โอ้

248
00:13:46,830 --> 00:13:49,190
>> ตกลง

249
00:13:49,190 --> 00:13:49,940
ดังนั้นโดนัท

250
00:13:49,940 --> 00:13:55,360
ดังนั้นเราจึงพบว่ามี 80 รายการใน
คอลเลกชันที่อ้างอิงโดนัท

251
00:13:55,360 --> 00:13:57,150
เรากำลังมองหาที่ 10 อันดับแรกของพวกเขา

252
00:13:57,150 --> 00:14:01,890
ตอนนี้คุณสามารถดูที่นี่วิธีการที่
ฉันว่าฉันกำลังมองหาโดนัท

253
00:14:01,890 --> 00:14:04,400
ฉันเพิ่งเพิ่มบางสิ่งบางอย่าง
สตริงแบบสอบถามของ URL

254
00:14:04,400 --> 00:14:09,680
ดังนั้น Q เท่ากับโดนัทที่คุณสามารถ
เห็นได้ง่ายขึ้นเล็ก ๆ น้อย ๆ ที่นี่

255
00:14:09,680 --> 00:14:12,131
>> และนี้โดยทั่วไปหมายถึงมี
ข้อมูลจำเพาะสำหรับ API ซึ่ง

256
00:14:12,131 --> 00:14:13,880
กำหนดสิ่งที่ทุก
พารามิเตอร์เหล่านี้หมายถึง

257
00:14:13,880 --> 00:14:17,150
และนั่นหมายความว่าเรากำลังจะ
ค้นหาทุกอย่างสำหรับโดนัท

258
00:14:17,150 --> 00:14:24,910
>> ดังนั้นรายการแรกที่นี่เรามี
คุณสามารถดูชื่อเป็นโดนัท,

259
00:14:24,910 --> 00:14:29,310
และมีคำบรรยายที่เรียกว่า
อเมริกันกิเลสซึ่งเป็นฉันเดา

260
00:14:29,310 --> 00:14:31,610
เหมาะสม

261
00:14:31,610 --> 00:14:36,134
มีจำนวนมากที่ต่างออกไปคือ

262
00:14:36,134 --> 00:14:38,050
เมื่อคุณได้รับไปยังจุด
ในการได้รับข้อมูลที่

263
00:14:38,050 --> 00:14:41,020
มีจำนวนมากที่แตกต่างกัน
รูปแบบที่คุณสามารถได้รับมันเป็น

264
00:14:41,020 --> 00:14:44,050
และมีจุดแข็งที่แตกต่างกัน
และจุดอ่อนสำหรับพวกเขาทั้งหมด

265
00:14:44,050 --> 00:14:49,000
ดังนั้นหนึ่งนี้คุณสามารถดู
ที่นี่เป็นแบบฟอร์มนี้รวยมาก

266
00:14:49,000 --> 00:14:51,946
และมันก็เป็นมาตรฐาน

267
00:14:51,946 --> 00:14:55,040
>> ดังนั้นจึงมีชื่อที่เฉพาะเจาะจง
เขตข้อมูลคำบรรยาย

268
00:14:55,040 --> 00:14:58,950
มีทางเลือกคือ
ชื่อเรื่องความรักของชาวอเมริกัน

269
00:14:58,950 --> 00:15:01,650
มีชื่อที่เกี่ยวข้องกับมันเป็น

270
00:15:01,650 --> 00:15:03,120
ประเภทของทรัพยากรเป็นข้อความ

271
00:15:03,120 --> 00:15:06,070
มีข้อมูลจำนวนมากเป็น
ที่นี่ในรูปแบบนี้

272
00:15:06,070 --> 00:15:09,480
>> แต่มีพวง
รูปแบบที่แตกต่างกันของ

273
00:15:09,480 --> 00:15:11,920
ดังนั้นสิ่งที่เราเป็นเพียงแค่
กำลังมองหาที่เป็นรูปแบบ

274
00:15:11,920 --> 00:15:17,700
เรียกว่า MODS ซึ่งย่อมาจาก
Metadata บริการคำอธิบายวัตถุ

275
00:15:17,700 --> 00:15:18,250
ที่อาจเกิดขึ้น

276
00:15:18,250 --> 00:15:23,030
ฉันจริงไม่แน่ใจเกี่ยวกับ
เอส แต่มันเป็นรูปแบบที่ค่อนข้างซับซ้อน

277
00:15:23,030 --> 00:15:24,240
มันเป็นรูปแบบเริ่มต้น

278
00:15:24,240 --> 00:15:30,260
>> แต่ก็เป็นหนึ่งที่ช่วยให้
ความอุดมสมบูรณ์ของข้อมูลทั้งหมด

279
00:15:30,260 --> 00:15:33,820
ที่ห้องสมุดมีเพราะ
มันใกล้มากกับสิ่งที่

280
00:15:33,820 --> 00:15:35,110
ห้องสมุดใช้ภายใน

281
00:15:35,110 --> 00:15:39,030
มันเป็นมาตรฐานที่เป็น
ที่ใช้ทั่วประเทศ

282
00:15:39,030 --> 00:15:40,944
ทั่วโลกในห้องสมุดวิชาการ

283
00:15:40,944 --> 00:15:42,110
และก็ทำงานร่วมกันมาก

284
00:15:42,110 --> 00:15:44,852
ดังนั้นถ้าคุณได้มีเอกสาร
ที่อยู่ในรูปแบบ MODS,

285
00:15:44,852 --> 00:15:47,560
คุณสามารถให้ที่ให้กับคนอื่น
มีระบบเข้าใจ MODS,

286
00:15:47,560 --> 00:15:48,518
และพวกเขาสามารถนำเข้า

287
00:15:48,518 --> 00:15:50,840
ดังนั้นจึงเป็นมาตรฐาน

288
00:15:50,840 --> 00:15:54,250
มันกำหนดไว้เป็นอย่างดีที่เฉพาะเจาะจงมาก

289
00:15:54,250 --> 00:15:58,980
และนั่นคือสิ่งที่ทำให้มัน
ทำงานร่วมกันเพราะถ้ามีคนบอกว่า

290
00:15:58,980 --> 00:16:04,930
นี้เป็นชื่ออื่นของ
บันทึกทุกคนรู้ว่าสิ่งที่หมายความว่า

291
00:16:04,930 --> 00:16:07,740
ในอีกด้านหนึ่งก็มีความซับซ้อนมาก

292
00:16:07,740 --> 00:16:13,160
>> ดังนั้นถ้าคุณจะดู
ที่บันทึกนี้ที่นี่

293
00:16:13,160 --> 00:16:15,320
ถ้าฉันเพียงแค่ต้องการที่จะได้รับ
ชื่อของเอกสารนี้

294
00:16:15,320 --> 00:16:21,150
ของหนังสือเล่มนี้ซึ่งน่าจะเป็นโดนัท,
กิเลสอเมริกันแยกมันออกมา

295
00:16:21,150 --> 00:16:22,940
เป็นเพียงเล็กน้อยที่เกี่ยวข้อง

296
00:16:22,940 --> 00:16:27,380
ในขณะที่มีอีก
รูปแบบที่เรียกว่าดับลินคอร์,

297
00:16:27,380 --> 00:16:29,730
ซึ่งเป็นมากในรูปแบบที่ง่ายมาก

298
00:16:29,730 --> 00:16:33,764
>> และเพื่อให้คุณดูที่นี่ไม่มี
ชื่อคำบรรยายชื่อสำรอง

299
00:16:33,764 --> 00:16:35,930
มีเพียงชื่อของ,
โดนัท, กิเลสอเมริกัน

300
00:16:35,930 --> 00:16:38,780
และชื่ออื่นกิเลสอเมริกัน

301
00:16:38,780 --> 00:16:42,907
ดังนั้นเมื่อคุณกำลังมองหาที่สิ่งที่รูปแบบ
คุณต้องการที่จะได้รับข้อมูลที่ออกมาจาก

302
00:16:42,907 --> 00:16:44,740
มากขึ้นอยู่กับวิธีการ
คุณกำลังจะใช้มัน

303
00:16:44,740 --> 00:16:46,573
ที่ใช้สำหรับ
การทำงานร่วมกันหรือไม่หรือคุณ

304
00:16:46,573 --> 00:16:49,970
ต้องการสิ่งง่ายๆที่
อาจจะง่ายต่อการทำงานด้วย?

305
00:16:49,970 --> 00:16:56,002
>> ด้านพลิกจำนวนมาก
รายละเอียดได้รับการจัดเรียงของ squished ลง

306
00:16:56,002 --> 00:16:58,460
คุณอาจสูญเสียความแตกต่างของ
สิ่งที่หมายถึงสาขาเฉพาะ

307
00:16:58,460 --> 00:17:02,960
ถ้าคุณกำลังติดต่อกับดับลินคอร์,
ซึ่งคุณจะไม่ได้รับกับ MODS

308
00:17:02,960 --> 00:17:06,462
ดังนั้นผู้มีสองรูปแบบ
คุณจะได้รับจาก API

309
00:17:06,462 --> 00:17:08,920
และโดยทั่วไปเราจะรักษา
มันอยู่เบื้องหลังใน MODS

310
00:17:08,920 --> 00:17:14,179
แต่เราสามารถให้คุณใน MODS และ
ดับลินคอและสิ่งอื่น ๆ ได้เป็นอย่างดี

311
00:17:14,179 --> 00:17:16,470
การพิจารณาอื่น ๆ เมื่อ
คุณกำลังมองหาในข้อมูล

312
00:17:16,470 --> 00:17:21,210
คุณจะได้รับมันเป็นทั้ง JSON ซึ่ง
ย่อมาจาก JavaScript Object สัญลักษณ์,

313
00:17:21,210 --> 00:17:24,720
หรือ XML ซึ่งย่อมาจาก
Extensible Markup Language

314
00:17:24,720 --> 00:17:30,080
และการแสดงข้อมูลเหล่านี้ทั้งสอง
ได้ว่าข้อมูลเดียวกันว่า

315
00:17:30,080 --> 00:17:31,080
สาขาเดียวกัน

316
00:17:31,080 --> 00:17:33,644
แต่พวกเขากำลังเพียง
ไวยากรณ์ที่แตกต่างกัน

317
00:17:33,644 --> 00:17:40,401
>> ดังนั้นนี่คือเเรก

318
00:17:40,401 --> 00:17:41,400
ดีขอเพียงแค่สลับ

319
00:17:41,400 --> 00:17:47,490
ดังนั้นนี่คือแบบสอบถามของเราสำหรับ
โดนัทในรูปแบบ XML

320
00:17:47,490 --> 00:17:53,470
ถ้าฉันเพียงแค่เปลี่ยนนี้จะเป็น JSON,
ฉันสามารถดูได้ลักษณะที่แตกต่างกัน

321
00:17:53,470 --> 00:17:58,580
ดังนั้นตอนนี้เป็นเนื้อหาเดียวกัน
แต่โครงสร้างที่แตกต่างกัน

322
00:17:58,580 --> 00:18:00,080
มีน้อยวงเล็บมุมเป็น

323
00:18:00,080 --> 00:18:02,530
มีน้อย verbose เป็น

324
00:18:02,530 --> 00:18:06,440
>> และนี่คือรูปแบบที่ถ้าคุณ
กำลังทำงานอยู่ในสภาพแวดล้อมที่เว็บ

325
00:18:06,440 --> 00:18:09,680
คุณจะมีโอกาสมากที่สุดที่จะ
เพื่อต้องการที่จะใช้เพราะหนึ่ง

326
00:18:09,680 --> 00:18:12,630
ในสิ่งที่ดีเกี่ยวกับ JSON เป็น
มันเข้ากันได้กับ JavaScript

327
00:18:12,630 --> 00:18:17,680
ดังนั้นถ้าผมเขียน app เว็บผมสามารถดึง
ใน JSON และเพียงแค่ทำงานกับมันโดยตรง

328
00:18:17,680 --> 00:18:20,187
ในขณะที่มี XML มัน
นิด ๆ หน่อย ๆ ที่ซับซ้อนมากขึ้น

329
00:18:20,187 --> 00:18:21,520
ดังนั้นอีกครั้งเหล่านี้มีทั้งที่มีประโยชน์

330
00:18:21,520 --> 00:18:26,387
พวกเขาก็มีกรณีการใช้งานที่แตกต่างกัน
ที่ผู้คนอาจต้องการที่จะใช้พวกเขา

331
00:18:26,387 --> 00:18:26,886
ตกลง

332
00:18:26,886 --> 00:18:29,810

333
00:18:29,810 --> 00:18:31,680
เพื่อกลับไป API

334
00:18:31,680 --> 00:18:32,900
ดังนั้นเราจึงสามารถค้นหา for--

335
00:18:32,900 --> 00:18:36,220
>> ผมให้ตัวอย่างของ
ค้นหาโดนัท

336
00:18:36,220 --> 00:18:39,330
นอกจากนี้เรายังสามารถค้นหาเพียงแค่ใน
โดยเฉพาะอย่างยิ่งข้อมูลภายในที่นี่

337
00:18:39,330 --> 00:18:41,310
ดังนั้นแทนที่จะค้นหา
บันทึกทั้งหมด

338
00:18:41,310 --> 00:18:43,870
ฉันเพียงแค่สามารถค้นหาข้อมูลชื่อ

339
00:18:43,870 --> 00:18:48,810
ดังนั้นตอนนี้มี 25 สิ่งที่
มีโดนัทในชื่อหนึ่งซึ่ง

340
00:18:48,810 --> 00:18:52,430
เป็นเรื่องเกี่ยวกับการฟื้นฟู
พื้นที่ชุ่มน้ำในการบริหารจัดการ

341
00:18:52,430 --> 00:18:54,990
ของหลุมในโดนัท
โปรแกรมซึ่งอาจเป็น

342
00:18:54,990 --> 00:18:58,970
ไม่จำเป็นต้องเป็นสิ่งที่เรากำลังมองหา
เมื่อเรากำลังมองหาโดนัท

343
00:18:58,970 --> 00:19:02,790

344
00:19:02,790 --> 00:19:05,490
>> คุณยังสามารถเมื่อคุณอยู่
จัดการกับ API--

345
00:19:05,490 --> 00:19:08,827
>> ส่วนหนึ่งของการมี API คือการให้
คนเข้าถึงชุดข้อมูลขนาดใหญ่

346
00:19:08,827 --> 00:19:11,410
และมีคู่ที่แตกต่างกัน
เครื่องมือที่คุณสามารถใช้ในการทำเช่นนั้น

347
00:19:11,410 --> 00:19:14,170
หนึ่งคือมากเพียงคุณ
สามารถหน้าผ่านข้อมูล

348
00:19:14,170 --> 00:19:17,340
ดังนั้นเช่นเดียวกับถ้าคุณทำแบบสอบถาม
ผ่านเว็บอินเตอร์เฟส,

349
00:19:17,340 --> 00:19:19,470
คุณสามารถดูที่หน้าหนึ่ง
หน้าสองหน้าสาม

350
00:19:19,470 --> 00:19:22,040
คุณสามารถทำเช่นเดียวกัน
สิ่งที่ผ่าน API

351
00:19:22,040 --> 00:19:24,150
คุณเพียงแค่จะต้องมีการ
อย่างชัดเจนในวิธีที่คุณทำมัน

352
00:19:24,150 --> 00:19:29,511
>> ดังนั้นสำหรับตัวอย่างเช่นถ้าฉันกำลังมองหา
ที่แบบสอบถามครั้งแรกของฉันที่นี่

353
00:19:29,511 --> 00:19:32,510
ที่ฉันทำค้นหาสำหรับสิ่งที่
กับโดนัทในชื่อเรื่องผมสามารถพูดได้ว่า

354
00:19:32,510 --> 00:19:35,415
และ จำกัด เท่ากับ 20 ซึ่งหมายความว่า
ให้ฉันแรก 20 บันทึกไม่ได้

355
00:19:35,415 --> 00:19:38,540
10 อันดับแรกซึ่งเป็นค่าเริ่มต้น
เพราะผมต้องการที่จะดูที่ 20 ในเวลา

356
00:19:38,540 --> 00:19:43,435
หรือฉันสามารถพูดได้ตั้งค่า
เริ่มต้นเท่ากับ 20 และขีด จำกัด

357
00:19:43,435 --> 00:19:47,150
เท่ากับ 20 ซึ่งจะให้
ฉันบันทึก 21 ถึง 40

358
00:19:47,150 --> 00:19:52,680
>> ดังนั้นผมคิดว่าสิ่งที่
ที่จะไปที่นี่

359
00:19:52,680 --> 00:19:57,290
ที่เรากำลังใช้สตริงแบบสอบถาม
การตั้งค่าพารามิเตอร์ในแบบสอบถาม

360
00:19:57,290 --> 00:20:02,760
และมันช่วยให้คุณควบคุม
สิ่งที่คุณจะได้รับกลับมา

361
00:20:02,760 --> 00:20:05,980
>> เป็นอีกเครื่องมือหนึ่งที่คุณสามารถใช้ -

362
00:20:05,980 --> 00:20:09,250
>> และนี่คือจริงๆเป็นประโยชน์ในการ
แง่ของการสำรวจข้อมูล

363
00:20:09,250 --> 00:20:10,840
>> --is สิ่งที่เรียกว่า Faceting

364
00:20:10,840 --> 00:20:15,530
ดังนั้น Faceting ระยะคือ
ไม่จำเป็นต้องร่วมกัน

365
00:20:15,530 --> 00:20:16,880
แต่คุณเคยเห็นมาก่อน

366
00:20:16,880 --> 00:20:18,630
ถ้าคุณดูที่
Amazon เช่น

367
00:20:18,630 --> 00:20:20,870
และคุณจะค้นหา
โดนัทในหนังสือ

368
00:20:20,870 --> 00:20:27,080
ที่นี่พวกเขาได้มีชุดของหนังสือ
และพวกเขากำลังจัดกลุ่มตามประเภท

369
00:20:27,080 --> 00:20:30,470
และคุณได้รับประเภทที่แตกต่างกัน
และวิธีการหลายเล่มในแต่ละประเภท

370
00:20:30,470 --> 00:20:31,330
แสดงขึ้นมา

371
00:20:31,330 --> 00:20:33,420
>> ดังนั้นนี่เป็นพื้นด้าน

372
00:20:33,420 --> 00:20:37,570
คุณจะใช้หนังสือของพวกเขาทั้งหมด 1,800
หนังสือที่ตรงกับโดนัทที่ Amazon

373
00:20:37,570 --> 00:20:39,820
12 ของพวกเขาใน
ประเภทอาหารเช้า

374
00:20:39,820 --> 00:20:43,100
21 ในขนมและเบเกอรี่
และอื่น ๆ และอื่น ๆ

375
00:20:43,100 --> 00:20:47,670
>> ดังนั้นนี้เป็นจริงที่มีประโยชน์
เครื่องมือสำหรับการสำรวจเนื้อหา

376
00:20:47,670 --> 00:20:53,260
ภายในห้องสมุดได้เป็นอย่างดี
เพราะเมื่อคุณมองไปที่ด้าน,

377
00:20:53,260 --> 00:20:56,520
มันจะช่วยให้คุณมีความคิดของสิ่งที่วิชา
ที่มีอยู่เช่นเดียวกับสิ่งที่ประเภทของอาสาสมัคร

378
00:20:56,520 --> 00:20:58,510
เป็นที่นิยมมากที่สุดภายในชุดคำค้นหาของคุณ

379
00:20:58,510 --> 00:21:00,950
และมันจะช่วยให้คุณขับรถออกไปและสำรวจ

380
00:21:00,950 --> 00:21:02,770
เพื่อให้เราสามารถทำสิ่งเดียวกัน

381
00:21:02,770 --> 00:21:05,940
>> ถ้าเราต้องการที่จะใช้
API และมองไปที่ทุกแง่มุม

382
00:21:05,940 --> 00:21:08,950
เราเพิ่มพารามิเตอร์ไปยังอีก
เพื่อนของเราสตริงแบบสอบถาม

383
00:21:08,950 --> 00:21:12,540
ดังนั้นแง่มุมเท่ากับคั่นด้วยเครื่องหมายจุลภาค
รายการของสิ่งที่เราต้องการที่จะด้านบน

384
00:21:12,540 --> 00:21:14,790
ดังนั้นหนึ่งในแง่มุมที่อาจมี

385
00:21:14,790 --> 00:21:16,565
อีกประการหนึ่งที่อาจจะเป็นภาษา

386
00:21:16,565 --> 00:21:19,665
ดังนั้นถ้าเราเรียกใช้แบบสอบถามที่เรา get--

387
00:21:19,665 --> 00:21:23,372

388
00:21:23,372 --> 00:21:24,830
มันดูสวยมากเหมือนกันที่นี่

389
00:21:24,830 --> 00:21:29,010
แต่เราได้เพิ่มเข้าไปในท้ายที่สุด
ของรายการชุดของแง่มุม

390
00:21:29,010 --> 00:21:34,060
ดังนั้นเราจึงมีแง่มุมที่เรียกว่าเรื่อง

391
00:21:34,060 --> 00:21:40,250
ดังนั้นนี่จะบอกเราว่าถ้าฉันมอง
ที่ 80 ผลของฉันจากแบบสอบถามโดนัท,

392
00:21:40,250 --> 00:21:42,100
13 ของพวกเขามี
เรื่องสหรัฐอเมริกา

393
00:21:42,100 --> 00:21:43,684
สามมีโดนัทเรื่อง

394
00:21:43,684 --> 00:21:45,600
มีสามเรื่อง
การฟื้นฟูพื้นที่ชุ่มน้ำ

395
00:21:45,600 --> 00:21:47,720
ซึ่งอาจจะเป็นหลุมของเราในโดนัท

396
00:21:47,720 --> 00:21:51,780
สองของพวกเขา, ซิมป์สัน,
และอื่น ๆ และอื่น ๆ

397
00:21:51,780 --> 00:21:59,211
>> ดังนั้นนี้จะมีประโยชน์ถ้าคุณ
ต้องการที่จะแคบลงการค้นหาของคุณ

398
00:21:59,211 --> 00:22:00,210
มันสามารถช่วยให้คุณทำ

399
00:22:00,210 --> 00:22:03,580
โดยเฉพาะอย่างยิ่งถ้าคุณมี
มากกว่าพูด, 80

400
00:22:03,580 --> 00:22:05,980
>> ในทำนองเดียวกันเรายังถาม
สำหรับแง่มุมเกี่ยวกับภาษา

401
00:22:05,980 --> 00:22:14,790
ดังนั้นถ้าเรามองไปที่ผลของเราเราจะเห็น 76
ของพวกเขาในอังกฤษสี่ในฝรั่งเศส

402
00:22:14,790 --> 00:22:19,620
สองในภาษาสเปนสองผมคิดว่าเป็น
ไม่ได้กำหนดหรือไม่ทราบดัตช์และภาษาลาติน

403
00:22:19,620 --> 00:22:22,830
ดังนั้นผมจึงคิดว่าละติน
ผลโดนัทอีกครั้ง

404
00:22:22,830 --> 00:22:24,922
มีอะไรจะทำอย่างไรกับขนมอบ

405
00:22:24,922 --> 00:22:25,630
แต่มีคุณไป

406
00:22:25,630 --> 00:22:31,420

407
00:22:31,420 --> 00:22:38,630
>> ดังนั้นนี้จะเรียงลำดับของการแสดงให้คุณเห็น
วิธีการที่คุณสามารถดึงเนื้อหากลับ

408
00:22:38,630 --> 00:22:41,270
จาก API เพียงแค่ผ่าน
เว็บเบราเซอร์ซึ่งเป็นที่ดี

409
00:22:41,270 --> 00:22:44,320
แต่มันไม่ได้จริงๆสิ่งที่คุณจะ
ปกติจะใช้ใน API สำหรับมัน

410
00:22:44,320 --> 00:22:48,710
ดังนั้นหนึ่งในตัวอย่างของวิธีการที่คุณ
จริงอาจทำเช่นนี้คือฉัน

411
00:22:48,710 --> 00:22:54,720
เขียนโปรแกรมขนาดเล็กสุด
ซึ่งอีกครั้งจะค้นหาโดนัทของฉัน

412
00:22:54,720 --> 00:22:59,010
และเลือกสาขาคู่
และแสดงไว้ในตาราง

413
00:22:59,010 --> 00:23:01,610
ดังนั้นนี้เป็นอย่างมาก
เนื้อหาเดียวกับที่เราเพียงแค่

414
00:23:01,610 --> 00:23:04,830
เลื่อยที่มีเขตข้อมูลไม่กี่ดึงออกมา

415
00:23:04,830 --> 00:23:12,090
ดังนั้นรายการชื่อเรื่อง
สถานที่ตั้งของสิ่งที่หนังสือเล่มนี้

416
00:23:12,090 --> 00:23:15,120
เป็นเรื่องเกี่ยวกับภาษา
และอื่น ๆ และอื่น ๆ

417
00:23:15,120 --> 00:23:20,480
>> ดังนั้นวิธีการนี​​้เกิดขึ้นจริงเนื่องจาก
ผมคิดว่าเราต้องมองไปที่รหัสบางอย่าง

418
00:23:20,480 --> 00:23:22,420
เท่าไหร่

419
00:23:22,420 --> 00:23:28,060
>> สิ่งที่เรามีที่นี่เป็น HTML ง่ายๆ
หน้าซึ่งจะแสดงข้อความ

420
00:23:28,060 --> 00:23:32,900
ยินดีต้อนรับสู่คลาวด์และห้องสมุด
แล้วแสดงตารางผล

421
00:23:32,900 --> 00:23:37,790
และมีผลอย่างเห็นได้ชัดใน
ตารางเมื่อเพจที่ได้รับการโหลด

422
00:23:37,790 --> 00:23:41,380
แต่สิ่งที่เรากำลังทำ
เป็นครั้งแรกของทั้งหมดเรา

423
00:23:41,380 --> 00:23:46,290
มีการโหลดห้องสมุดที่เรียกว่า
jQuery ซึ่งเป็นพื้น

424
00:23:46,290 --> 00:23:52,030
ห้องสมุด JavaScript, ซึ่งทำให้มัน
ง่ายมากที่จะจัดการกับ JavaScript

425
00:23:52,030 --> 00:23:58,780
กำเนิด, HTML และสร้างหน้าเว็บ
ตรรกะฝั่งไคลเอ็นต์และหน้าเว็บ

426
00:23:58,780 --> 00:24:01,595
>> ดังนั้นสิ่งที่เรามีที่นี่เป็น jQuery
มีวิธีการที่เรียกว่าได้รับ,

427
00:24:01,595 --> 00:24:05,270
ซึ่งเป็นหลักที่จะไป
URL ซึ่งในกรณีนี้

428
00:24:05,270 --> 00:24:09,070
นี่คือ URL มอง​​คุ้นเคย

429
00:24:09,070 --> 00:24:14,440
และจากนั้นก็จะได้รับข้อมูลจาก
URL ที่และเรียกใช้ฟังก์ชั่นที่มัน

430
00:24:14,440 --> 00:24:19,240
ดังนั้นเราจึงกล่าวไป api.lib.harvard / edu

431
00:24:19,240 --> 00:24:20,060
ค้นหาโดนัท

432
00:24:20,060 --> 00:24:21,300
ให้เรา 20 ระเบียน

433
00:24:21,300 --> 00:24:28,590
และเรียกใช้ฟังก์ชั่นนี้ซึ่ง
ฉันได้เลือกผ่านมันข้อมูล

434
00:24:28,590 --> 00:24:34,430
และข้อมูลที่เป็น JSON ที่
ได้กลับมาจาก API

435
00:24:34,430 --> 00:24:40,120
>> และจากนั้นเรากำลังจะบอกว่าภายในว่า
ข้อมูลที่มีข้อมูลที่เรียกว่ารายการ

436
00:24:40,120 --> 00:24:48,117
และถ้าเราไปใช้เวลามองย้อนกลับไปที่
หนึ่งในผลลัพธ์เหล่านี้ที่นี่

437
00:24:48,117 --> 00:24:49,200
มีอะไรบางอย่าง called--

438
00:24:49,200 --> 00:24:50,220
>> ดีก็เรียกว่ารายการ

439
00:24:50,220 --> 00:24:53,520
ดังนั้นที่อาจเป็นไปได้ว่า

440
00:24:53,520 --> 00:25:01,840
และสิ่งที่มันไม่ได้เป็น
ผ่านไปแต่ละรายการ

441
00:25:01,840 --> 00:25:05,300
แล้วเรียกอีก
ฟังก์ชั่นในแต่ละรายการ

442
00:25:05,300 --> 00:25:08,440
และฟังก์ชั่นที่พื้น
คือการค่า

443
00:25:08,440 --> 00:25:12,010
ของรายการซึ่งเป็น
เป็นหลักบันทึกของแต่ละบุคคล

444
00:25:12,010 --> 00:25:18,220
และช่วยให้เราสามารถดึงออกชื่อ
ความคุ้มครองและการใช้ภาษา

445
00:25:18,220 --> 00:25:21,640
>> ดังนั้นเราเรียกฟังก์ชั่นในทุก
รายการที่เราได้กลับมาจาก API

446
00:25:21,640 --> 00:25:25,397
และถ้าคุณเพียงแค่ใช้เวลาดู
ที่งานชิ้นนี้ได้ที่นี่

447
00:25:25,397 --> 00:25:27,230
สิ่งที่เรากำลังทำอยู่
เรากำลังสร้างสตริง

448
00:25:27,230 --> 00:25:31,810
ซึ่งเป็นหลักบางส่วนมาร์กอัป HTML
รอบโต๊ะกับ value.title,

449
00:25:31,810 --> 00:25:35,790
ซึ่งเป็นชื่อของ
วัตถุ value.coverage,

450
00:25:35,790 --> 00:25:36,790
ซึ่งเป็นความคุ้มครอง -

451
00:25:36,790 --> 00:25:38,225
>> และเรากำลังทำตรวจสอบ
ที่นี่เพื่อดูว่ามีใครที่ไม่ได้กำหนด

452
00:25:38,225 --> 00:25:40,570
และซ่อนมันถ้ามันบอกว่าไม่ได้กำหนด
เพราะเราไม่ได้สนใจจริงๆ

453
00:25:40,570 --> 00:25:41,600
ในการที่

454
00:25:41,600 --> 00:25:42,939
>> --and แล้วภาษา

455
00:25:42,939 --> 00:25:44,730
และแล้วสิ่งที่เรากำลัง
ทำคือการผนวกที่

456
00:25:44,730 --> 00:25:48,510
ไปที่โต๊ะที่มี
ระบุสตริงที่นี่

457
00:25:48,510 --> 00:25:50,790
และวิธีการทำงาน jQuery
นี้คือสิ่งที่จะพูด

458
00:25:50,790 --> 00:25:56,420
จะมองหาตารางที่มีความคิด
ผลและเพิ่มข้อความนี้ไป

459
00:25:56,420 --> 00:25:59,380
และนี่คือตารางที่มีผลความคิด

460
00:25:59,380 --> 00:26:04,998
ดังนั้นสิ่งที่คุณจะจบลง
กับเป็นหน้านี้ที่นี่

461
00:26:04,998 --> 00:26:06,206
และเพื่อที่จะดู source--

462
00:26:06,206 --> 00:26:11,310

463
00:26:11,310 --> 00:26:13,810
ดีที่มาไม่จริง
ปรับปรุงเมื่อที่เกิดขึ้น

464
00:26:13,810 --> 00:26:18,740
ดังนั้นคุณจะเห็นที่เกิดขึ้นจริง
ผลของตารางที่นี่ว่า

465
00:26:18,740 --> 00:26:24,770
>> ดังนั้นนี่เป็นเพียงตัวอย่างง่ายๆของ
การทำแบบสอบถามพื้นฐานมากกับ API

466
00:26:24,770 --> 00:26:29,020
และแสดงข้อมูลในบางอื่น ๆ
รูปแบบและไม่ได้ทำอะไรแฟนซีเกินไป

467
00:26:29,020 --> 00:26:36,370
ตอนนี้เป็นอีกตัวอย่างหนึ่งเช่น
การประยุกต์ใช้เขียนขึ้นโดยเดวิดไวน์เบอร์เกอร์

468
00:26:36,370 --> 00:26:39,120
เป็นตัวอย่างของนี้ซึ่ง
เป็นหลักแสดงให้คุณเห็น

469
00:26:39,120 --> 00:26:44,620
วิธีที่คุณสามารถป่นขึ้นผลลัพธ์ที่คุณกำลัง
ที่ได้รับจากห้องสมุดเมฆ API

470
00:26:44,620 --> 00:26:46,250
กับพูดว่า Google หนังสือ

471
00:26:46,250 --> 00:26:52,225
>> และความคิดที่นี่คือการที่ฉันสามารถ
เรียกใช้แบบสอบถามกับ Google หนังสือ,

472
00:26:52,225 --> 00:26:56,060
ได้รับการค้นหาข้อความเต็มรูปแบบได้รับผลบางอย่าง
ย้อนกลับไปหาที่ของรายการเหล่านั้น

473
00:26:56,060 --> 00:27:01,180
จริงที่มีอยู่ใน Hollis,
ระบบห้องสมุด

474
00:27:01,180 --> 00:27:03,200
แล้วให้ฉันเชื่อมโยง
กลับไปที่รายการเหล่านั้น

475
00:27:03,200 --> 00:27:12,730
ดังนั้นถ้าฉันค้นหาก็คือ
คืนที่มืดและมีพายุฉัน

476
00:27:12,730 --> 00:27:16,210
รับกลับพวงของผล
จาก Google และจากนั้นหนึ่งในผล

477
00:27:16,210 --> 00:27:19,460
ซึ่งเป็นริ้วรอยในเวลา

478
00:27:19,460 --> 00:27:29,330
และสิ่งเหล่านี้มีการเชื่อมโยงไปยังหนังสือที่มีอยู่
ในระบบห้องสมุดฮาร์วาร์

479
00:27:29,330 --> 00:27:32,160
>> ดังนั้นผมคิดว่าจุดที่นี่ไม่ได้
มากว่านี้อาจจะหรืออาจจะไม่

480
00:27:32,160 --> 00:27:34,118
เป็นวิธีการที่คุณต้องการ
เพื่อค้นหาห้องสมุด

481
00:27:34,118 --> 00:27:38,310
แต่มันเป็นเรื่องที่แตกต่างกันอย่างสิ้นเชิง
วิธีการที่ไม่สามารถใช้ได้กับคุณ

482
00:27:38,310 --> 00:27:42,884
ก่อนเช่นคุณมีวิธีการทำไม่
ค้นหาข้อความเต็มในหนังสือว่าแม้

483
00:27:42,884 --> 00:27:44,550
เป็นส่วนหนึ่งของระบบห้องสมุดฮาร์วาร์

484
00:27:44,550 --> 00:27:46,870
ดังนั้นตอนนี้เป็นวิธีที่
ที่คุณสามารถทำเช่นนั้นได้

485
00:27:46,870 --> 00:27:51,930
และคุณสามารถแสดงไว้ใน
สิ่งที่รูปแบบที่คุณต้องการ

486
00:27:51,930 --> 00:27:55,990
ดังนั้นจุดที่นี่เป็นพื้น
เรากำลังเปิดขึ้นวิธีการใหม่สำหรับคน

487
00:27:55,990 --> 00:27:59,080
ทำงานกับข้อมูล

488
00:27:59,080 --> 00:28:07,925
>> ชิ้นส่วนของเมฆห้องสมุดก็คือว่า
มันจะช่วยให้เปิดเผยบางส่วนของข้อมูลการใช้งาน

489
00:28:07,925 --> 00:28:08,800
ที่ห้องสมุดมี

490
00:28:08,800 --> 00:28:12,630
ดังนั้นถ้าคุณไปที่ห้องสมุด
และคุณกำลังมองหาหนังสือ

491
00:28:12,630 --> 00:28:15,770
คุณไม่จำเป็นต้อง
จริงมีความคิดของ,

492
00:28:15,770 --> 00:28:19,080
สำหรับรายการทั้งหมดใน
เรื่องโดยเฉพาะอย่างยิ่งสิ่งที่

493
00:28:19,080 --> 00:28:21,200
เป็นคนที่อยู่ใน
ชุมชนไม่ว่าจะเป็น

494
00:28:21,200 --> 00:28:24,890
กำหนดให้เป็นฮาร์วาร์หรือ
ประเทศหรือระดับของคุณ

495
00:28:24,890 --> 00:28:26,421
สิ่งที่พวกเขาพบว่ามีประโยชน์มากที่สุด?

496
00:28:26,421 --> 00:28:28,920
และห้องสมุดจริงมี
ตันของข้อมูลเกี่ยวกับสิ่งที่

497
00:28:28,920 --> 00:28:32,999
มีประโยชน์มากที่สุดเพราะถ้ามาก
ของคนที่ได้รับการตรวจสอบจากหนังสือ

498
00:28:32,999 --> 00:28:34,040
ที่จะบอกคุณบางสิ่งบางอย่าง

499
00:28:34,040 --> 00:28:36,498
ต้องมีเหตุผลบางอย่าง
พวกเขาต้องการที่จะตรวจสอบออก

500
00:28:36,498 --> 00:28:38,270
ผู้คนจำนวนมากใส่ไว้ในทุนสำรอง

501
00:28:38,270 --> 00:28:42,520
>> ถ้ามันอยู่ในรายชื่อสำรองสำหรับจำนวนมาก
ของการเรียนที่จะบอกคุณบางสิ่งบางอย่าง

502
00:28:42,520 --> 00:28:45,960
หากคณะกรรมการจะตรวจสอบมัน
ออกมากและนักศึกษาระดับปริญญาตรีไม่ได้

503
00:28:45,960 --> 00:28:47,200
ที่จะบอกอะไรบางอย่าง

504
00:28:47,200 --> 00:28:49,280
ในทางกลับกันที่ยัง
บอกคุณบางสิ่งบางอย่าง

505
00:28:49,280 --> 00:28:54,680
ดังนั้นมันจะน่าสนใจที่จะ
นำข้อมูลที่ออกมีและให้

506
00:28:54,680 --> 00:28:59,969
คนใช้มันเพื่อช่วยให้พวกเขาพบ
ทำงานภายในระบบห้องสมุด

507
00:28:59,969 --> 00:29:02,260
พลิกด้านนี้คือ
มีบางส่วนที่เป็นส่วนตัวอย่างจริงจัง

508
00:29:02,260 --> 00:29:07,854
ความกังวลเพราะหนึ่ง
หลักคำสอนหลักของห้องสมุด

509
00:29:07,854 --> 00:29:10,770
คือเราจะไม่บอก
คนสิ่งที่คนอื่นกำลังอ่าน

510
00:29:10,770 --> 00:29:17,360
และแม้ว่าคุณจะพูดนี้
หนังสือเล่มนี้ได้รับการตรวจสอบออกมาสี่ครั้ง

511
00:29:17,360 --> 00:29:20,070
ในเดือนที่โดยเฉพาะอย่างยิ่ง
ที่สามารถนำมาใช้

512
00:29:20,070 --> 00:29:25,252
ที่จะเชื่อมโยงกลับไปโดยเฉพาะอย่างยิ่ง
บุคคลโดยข้อมูล de anonymizing

513
00:29:25,252 --> 00:29:26,710
และหาว่าใครตรวจสอบออก

514
00:29:26,710 --> 00:29:30,792
ดังนั้นวิธีการที่เราสามารถ avoid--

515
00:29:30,792 --> 00:29:33,750
วิธีการที่เราสามารถพยายามที่จะดึง
สัญญาณจากข้อมูลทั้งหมด

516
00:29:33,750 --> 00:29:36,740
โดยไม่ละเมิด
ใครละเมิดความเป็นส่วนตัว

517
00:29:36,740 --> 00:29:42,150
เป็นหลักที่เรามอง
10 ปีของข้อมูลการใช้งาน -

518
00:29:42,150 --> 00:29:43,930
>> ดังนั้นจึงเป็นช่วงเวลาที่ยาวนานของเวลา

519
00:29:43,930 --> 00:29:50,639
>> --and บอกว่าโอเคเรามาดูวิธี
หลายครั้งที่งานนี้ถูกนำมาใช้

520
00:29:50,639 --> 00:29:52,930
และโดยที่ในช่วงนี้
ของเวลาและโดยทั่วไปแล้ว

521
00:29:52,930 --> 00:29:56,300
ให้กลับจำนวนที่เราเรียกว่า
คะแนนกองที่พื้น

522
00:29:56,300 --> 00:29:59,910
แสดงให้เห็นถึงวิธีการมากก็ถูกนำมาใช้

523
00:29:59,910 --> 00:30:01,084
และที่ number--

524
00:30:01,084 --> 00:30:03,250
จำนวนมากของการคำนวณที่แตกต่างกัน
ไปเป็นตัวเลขที่

525
00:30:03,250 --> 00:30:05,150
--but มันหยาบมาก
ตัวชี้วัดที่ช่วยให้คุณ

526
00:30:05,150 --> 00:30:11,300
ความคิดของวิธีบาง
ชุมชนอาจจะให้ความสำคัญกับการทำงานที่

527
00:30:11,300 --> 00:30:16,772
>> และเพื่อให้การจัดเรียงของแม้อื่น
เพิ่มเติมโป่งพองออกมาประยุกต์ใช้

528
00:30:16,772 --> 00:30:18,480
ที่ใช้ประโยชน์
นี้คือสิ่งที่

529
00:30:18,480 --> 00:30:24,000
เรียกว่า Stacklife ที่เป็นจริง
พร้อมใช้งานผ่านฮาร์วาร์หลัก

530
00:30:24,000 --> 00:30:24,880
พอร์ทัลห้องสมุด

531
00:30:24,880 --> 00:30:26,700
ดังนั้นคุณจะไป library.harvard.edu

532
00:30:26,700 --> 00:30:29,360
คุณจะเห็นจำนวนของที่แตกต่างกัน
วิธีการค้นหาห้องสมุด

533
00:30:29,360 --> 00:30:32,300
และหนึ่งในนั้นมีชื่อเรียกว่า Stacklife

534
00:30:32,300 --> 00:30:38,980
>> และนี่เป็นโปรแกรมที่
เรียกดูเนื้อหาของห้องสมุด

535
00:30:38,980 --> 00:30:43,490
แต่ถูกสร้างขึ้นอย่างสมบูรณ์
ด้านบนของ API เหล่านี้

536
00:30:43,490 --> 00:30:46,910
จึงไม่มีสิ่งที่พิเศษ
เกิดขึ้นเบื้องหลัง

537
00:30:46,910 --> 00:30:49,570
มีการเข้าถึงไม่ได้
ข้อมูลที่คุณจะได้ไม่ต้อง

538
00:30:49,570 --> 00:30:54,090
มันใช้ API ที่จะให้คุณ
กับการเรียกดูที่แตกต่างกันอย่างสิ้นเชิง

539
00:30:54,090 --> 00:30:55,480
ประสบการณ์

540
00:30:55,480 --> 00:30:58,570
>> ดังนั้นถ้าฉันค้นหาอลิซ
ในดินแดนมหัศจรรย์ในกรณีนี้

541
00:30:58,570 --> 00:31:02,600
ฉันจะได้รับผลที่มีลักษณะเช่น
นี้ซึ่งเป็น much-- สวย

542
00:31:02,600 --> 00:31:05,430

543
00:31:05,430 --> 00:31:10,870
>> มันคล้ายกับค้นหาอื่น ๆ
คุณอาจจะยกเว้นในกรณีนี้

544
00:31:10,870 --> 00:31:15,730
เรากำลังจัดอันดับรายการโดย
stackscore ซึ่งจะช่วยให้คุณ

545
00:31:15,730 --> 00:31:19,850
ความคิดของวิธียอดนิยมเหล่านี้บางส่วน
รายการที่อยู่ภายในชุมชน

546
00:31:19,850 --> 00:31:25,610
และเพื่อให้เห็นได้อย่างชัดเจน, อลิซในแดนมหัศจรรย์
โดยวอลท์ดิสนีย์ได้รับความนิยมอย่างสูง

547
00:31:25,610 --> 00:31:36,570
แต่คุณยังสามารถดูด้านบนสี่
ที่นี่จะเป็นคนที่คุณอาจไม่ได้ที่จริง

548
00:31:36,570 --> 00:31:39,220
>> สิ่งที่ถูกนำมาใช้อย่างมาก
แต่คุณอาจไม่ได้ทันที

549
00:31:39,220 --> 00:31:41,240
เชื่อมต่อกับอลิซในแดนมหัศจรรย์

550
00:31:41,240 --> 00:31:44,650
ดังนั้นเพื่อนเก่าของเรา
ข้อเขียนของอลิซอยู่ที่นี่

551
00:31:44,650 --> 00:31:46,350
ดังนั้นผมจึงสามารถดูที่มัน

552
00:31:46,350 --> 00:31:52,010
และตอนนี้สิ่งที่ฉันกำลังมองหา
ที่เป็นพื้นตั้งเเล้

553
00:31:52,010 --> 00:31:53,760
ฉันจะมีข้อเขียน
อลิซที่นี่

554
00:31:53,760 --> 00:31:56,700
ผมมีข้อมูลเกี่ยวกับเรื่องนี้

555
00:31:56,700 --> 00:32:00,230
และผมยังมี stackscore
ของในกรณีนี้, 26

556
00:32:00,230 --> 00:32:03,169
และนี่บอกฉันเรียงลำดับของประมาณ
วิธีการที่เราได้ไป stackscore นี้

557
00:32:03,169 --> 00:32:05,835
เช่นเดียวกับที่ตรวจสอบออกเช่นวิธี
หลายครั้งก็คือการตรวจสอบออก

558
00:32:05,835 --> 00:32:08,440
เช่นเดียวกับคณะนักศึกษาระดับปริญญาตรีหรือวิธี
หลายเล่มที่ห้องสมุดมี

559
00:32:08,440 --> 00:32:11,300
และอื่น ๆ และอื่น ๆ

560
00:32:11,300 --> 00:32:16,460
>> และคุณยังสามารถที่น่าสนใจพอ
ที่นี่เรียกดูกองจริง

561
00:32:16,460 --> 00:32:19,550
ดังนั้นข้อมูลที่นี่นี้
มีการแสดงคุณเรียงลำดับ

562
00:32:19,550 --> 00:32:23,547
ของการเป็นตัวแทนเสมือน
ของสิ่งที่อาจจะเก็บรักษา

563
00:32:23,547 --> 00:32:25,880
ลักษณะเช่นถ้าคุณจะใช้เวลา
ถือครองทั้งหมดของห้องสมุด

564
00:32:25,880 --> 00:32:28,940
และทำให้พวกเขาอยู่ด้วยกัน
บนหิ้งที่ไม่มีที่สิ้นสุดหนึ่ง

565
00:32:28,940 --> 00:32:30,990
และสิ่งที่ดีคือการที่เรา can--

566
00:32:30,990 --> 00:32:33,380
>> ครั้งแรกของทั้งหมด
เมตาดาต้าที่เกี่ยวกับหนังสือเหล่านี้

567
00:32:33,380 --> 00:32:35,627
มักจะบอกคุณเมื่อมันถูกตีพิมพ์

568
00:32:35,627 --> 00:32:37,085
มันจะบอกคุณกี่หน้าก็มี

569
00:32:37,085 --> 00:32:38,459
มันอาจจะบอกคุณขนาด

570
00:32:38,459 --> 00:32:42,930
ดังนั้นคุณจะเห็นที่สะท้อนให้เห็นที่นี่
ในแง่ของขนาดของหนังสือ

571
00:32:42,930 --> 00:32:46,740
>> แล้วเราสามารถใช้
สแต็คคะแนนที่จะเน้น

572
00:32:46,740 --> 00:32:49,170
หนังสือที่มีคะแนนสแต็คที่สูงขึ้น

573
00:32:49,170 --> 00:32:54,930
ดังนั้นถ้าหากมันเป็นสีเข้มก็หมายความว่า
สันนิษฐานว่ามันถูกใช้บ่อยครั้งมากขึ้น

574
00:32:54,930 --> 00:32:57,040
ดังนั้นในกรณีนี้ผม
จะเดาว่านี้

575
00:32:57,040 --> 00:33:03,226
เป็นรุ่นของ Alice in Wonderland
ที่เป็นที่นิยมใช้มากที่สุดและมากที่สุด

576
00:33:03,226 --> 00:33:05,100
เข้าถึงห้องสมุด
มีสำเนาที่สุดของ

577
00:33:05,100 --> 00:33:06,975
ดังนั้นหากคุณกำลังมองหา
อลิซในแดนมหัศจรรย์,

578
00:33:06,975 --> 00:33:10,220
นี้อาจจะเป็นสถานที่ที่ดีที่จะเริ่มต้น

579
00:33:10,220 --> 00:33:13,500
>> และแล้วที่นี่คุณยังสามารถเชื่อมโยงออก
ที่จะพูด, Amazon ที่จะซื้อหนังสือเล่มนี้

580
00:33:13,500 --> 00:33:15,182
และอื่น ๆ และอื่น ๆ

581
00:33:15,182 --> 00:33:17,140
จุดที่นี่อีกครั้ง
ไม่ได้มากว่านี้

582
00:33:17,140 --> 00:33:25,030
เป็นวิธีที่ดีที่สุดเพื่อเรียกดูห้องสมุด
หรือเครื่องมือที่เหมาะสมสำหรับทุกโอกาส

583
00:33:25,030 --> 00:33:28,400
แต่มันเป็นวิธีการที่จะทำมันอีก

584
00:33:28,400 --> 00:33:31,359
และโดยการทำข้อมูล
พร้อมใช้งานผ่าน API ซึ่ง

585
00:33:31,359 --> 00:33:34,650
ทำจากหน่วยการสร้างที่ง่ายมาก
ซึ่งจะช่วยให้คุณสามารถค้นหาเนื้อหา

586
00:33:34,650 --> 00:33:39,420
คุณสามารถสร้างบางสิ่งบางอย่าง
เช่นนี้ที่สามารถ

587
00:33:39,420 --> 00:33:41,520
เป็นพิเศษ
มีคุณค่าให้กับคนบางคน

588
00:33:41,520 --> 00:33:46,640

589
00:33:46,640 --> 00:33:51,860
>> นั่นคือการจัดเรียงของมากที่สุดเท่าที่ฉันต้องการ
ที่จะบอกว่าจริงๆเกี่ยวกับสิ่งที่ API เป็น

590
00:33:51,860 --> 00:33:56,070
และสิ่งที่มันก็หมายความว่ามีทั้ง
พวงของสิ่งที่อยู่เบื้องหลังซึ่ง

591
00:33:56,070 --> 00:33:59,480
ฉันแค่จะไปสัมผัสกับเวลาสั้น ๆ
เพียงเพราะการจัดเรียงของมานี้

592
00:33:59,480 --> 00:34:03,720
จากมุมที่แตกต่างกันอย่างสมบูรณ์ใน
แง่ของวิธีการทำอะไรบางอย่างเช่นนี้

593
00:34:03,720 --> 00:34:04,580
ได้รับการใส่ลงไปในสถานที่?

594
00:34:04,580 --> 00:34:10,820
>> ดังนั้น API เป็นมาตรฐาน
อินเตอร์เฟซให้กับทุกเนื้อหานี้

595
00:34:10,820 --> 00:34:13,820
แต่การที่จะได้รับมันที่นั่น
สิ่งแรกที่เราต้องทำ

596
00:34:13,820 --> 00:34:17,260
ถูกดึงข้อมูลร่วมกัน
หนังสือและภาพ

597
00:34:17,260 --> 00:34:21,580
และช่วยหาคอลเลกชัน
เอกสารจากระบบฮาร์วาร์ต่างๆ

598
00:34:21,580 --> 00:34:23,929
Aleph, VIA และ OASIS เป็น
ชื่อของระบบ

599
00:34:23,929 --> 00:34:28,820
และพวกเขาเป็นหลักไปสู่
ท่อท่อการประมวลผล

600
00:34:28,820 --> 00:34:33,230
>> ดังนั้นครั้งแรกของทั้งหมดที่เราได้รับการส่งออก
ไฟล์จากทั้งหมดของระบบเหล่านี้

601
00:34:33,230 --> 00:34:35,130
เราแบ่งออกเป็นแต่ละรายการ

602
00:34:35,130 --> 00:34:39,360
ดังนั้นเราจึงมีไฟล์ซึ่งเป็นกิกะไบต์,
ซึ่งมีล้านแผ่นในนั้น

603
00:34:39,360 --> 00:34:42,290
ดังนั้นเราจึงแบ่งมันออกเป็นแต่ละรายการ

604
00:34:42,290 --> 00:34:45,374
แล้วสำหรับแต่ละรายการเราแปลงเป็น
เป็น MODS เพราะบางส่วนของเหล่านี้

605
00:34:45,374 --> 00:34:47,040
มีกำเนิด MODS บางส่วนของพวกเขาไม่ได้

606
00:34:47,040 --> 00:34:49,204
ดังนั้นเราจึงได้รับพวกเขาทั้งหมด
จะอยู่ในรูปแบบเดียวกัน

607
00:34:49,204 --> 00:34:51,120
จากนั้นก็มีต่างๆ
ขั้นตอนการตกแต่งที่

608
00:34:51,120 --> 00:34:55,969
เราเพิ่มข้อมูลเพิ่มเติมข้อมูล
กว่าที่มีอยู่ในห้องสมุด

609
00:34:55,969 --> 00:34:59,750
ดังนั้นเราจึงจำเป็นต้องเพิ่มครั้งแรกของทั้งหมด
เรามีสิ่งที่ห้องสมุดถือมัน

610
00:34:59,750 --> 00:35:02,250
เราไปผ่านขั้นตอนของ
คำนวณ stackscore

611
00:35:02,250 --> 00:35:07,112
เราไปผ่านขั้นตอนของอีก
เพิ่มเมตาดาต้าที่มากขึ้นในแง่

612
00:35:07,112 --> 00:35:10,730
ของสิ่งที่คนคอลเลกชัน
อาจเพิ่มเจ้านี่

613
00:35:10,730 --> 00:35:12,532
>> คนกำลังสร้าง
คอลเลกชันของรายการ

614
00:35:12,532 --> 00:35:13,990
สิ่งที่คอลเลกชันที่ไม่ได้เป็นของใคร?

615
00:35:13,990 --> 00:35:17,220
มีวิธีการที่ผู้คนที่ติดแท็ก
เนื้อหานี้ในอดีต?

616
00:35:17,220 --> 00:35:20,750
แล้วคุณกรองและคุณ จำกัด
บันทึกเพราะที่ผมกล่าวถึง

617
00:35:20,750 --> 00:35:24,120
มีข้อมูลบางส่วนว่าเพราะ
เหตุผลที่มีลิขสิทธิ์เราไม่สามารถแสดง

618
00:35:24,120 --> 00:35:26,700
และจากนั้นเราโหลดพวกเขา
เป็นสิ่งที่เรียกว่า

619
00:35:26,700 --> 00:35:31,680
Solr ซึ่งไม่ได้สะกดผิด แต่
เป็นชื่อของชิ้นส่วนของซอฟต์แวร์

620
00:35:31,680 --> 00:35:35,710
ที่จะจัดทำดัชนีการค้นหาซึ่ง
ไดรฟ์ทั้งหมดการค้นหาที่อยู่เบื้องหลัง API

621
00:35:35,710 --> 00:35:40,110
และจากนั้นก็จะมีการ
API และคนที่สามารถใช้งานได้

622
00:35:40,110 --> 00:35:44,640
>> ดังนั้นนี้เป็นเหมือนอย่างเป็นธรรม
กระบวนการที่ซับซ้อน

623
00:35:44,640 --> 00:35:47,230
หนึ่งที่น่าสนใจ
สิ่งที่เกี่ยวกับมัน

624
00:35:47,230 --> 00:35:50,990
ที่เรากำลังเผชิญ
13 ล้านแผ่น

625
00:35:50,990 --> 00:35:53,820
และเรากำลังจะได้รับการติดต่อหรือมากกว่า

626
00:35:53,820 --> 00:36:01,260
และเราต้องการที่จะสามารถที่จะจัดการกับ
เหล่านี้ในแฟชั่นที่ค่อนข้างรวดเร็ว

627
00:36:01,260 --> 00:36:03,630
มันต้องใช้เวลานานในการ
ดำเนินการ 13 ล้านระเบียน

628
00:36:03,630 --> 00:36:09,529
>> ดังนั้นวิธีการที่ท่อนี้
ตั้งค่าคือการที่คุณ can--

629
00:36:09,529 --> 00:36:12,070
ผมคิดว่าประโยชน์จาก
ท่อปัญหาที่เรา

630
00:36:12,070 --> 00:36:15,580
พยายามที่จะแก้ปัญหาที่นี่คือ
แปลงทั้งหมดทั้งหมด

631
00:36:15,580 --> 00:36:18,729
ขั้นตอนเหล่านี้ในเรื่องนี้
ท่อจะแยกกันไม่ออก

632
00:36:18,729 --> 00:36:19,645
มีการพึ่งพาไม่ได้

633
00:36:19,645 --> 00:36:22,146
หากคุณกำลังประมวลผล
บันทึกของหนังสือเล่มหนึ่ง,

634
00:36:22,146 --> 00:36:24,270
มีการพึ่งพาไม่มี
ว่าระหว่างหนังสืออีกเล่มหนึ่ง

635
00:36:24,270 --> 00:36:27,760
>> ดังนั้นสิ่งที่เราสามารถทำได้คือโดยทั่วไป
ในขั้นตอนในท่อแต่ละ

636
00:36:27,760 --> 00:36:30,470
เราใส่มันลงไปในคิวในเมฆ

637
00:36:30,470 --> 00:36:32,250
ฉันเกิดขึ้นจะต้องอยู่บน Amazon Web Services

638
00:36:32,250 --> 00:36:35,140
ดังนั้นจึงมีรายชื่อ,
บอกว่า 10,000 รายการที่

639
00:36:35,140 --> 00:36:38,100
จะต้องมีความปกติและ
แปลงเป็นรูปแบบ MODS

640
00:36:38,100 --> 00:36:41,620
และเราหมุนเป็นเซิร์ฟเวอร์จำนวนมาก
ตามที่เราต้องการอาจจะ 10 เซิร์ฟเวอร์

641
00:36:41,620 --> 00:36:44,860
และแต่ละเซิร์ฟเวอร์เหล่านั้นเพียงแค่
นั่งอยู่ที่นั่นดูในคิวที่

642
00:36:44,860 --> 00:36:46,730
เห็นว่ามีสิ่งหนึ่งที่ต้อง
ต้องดำเนินการดึงมันออกคิว

643
00:36:46,730 --> 00:36:48,740
กระบวนการนั้นและ sticks
มันในคิวต่อไป

644
00:36:48,740 --> 00:36:54,200
>> ดังนั้นสิ่งที่ช่วยให้เรา
ทำคือการใช้เป็นหลัก

645
00:36:54,200 --> 00:36:58,110
เป็นฮาร์ดแวร์มากเท่าที่เราต้องการนี​​้
ปัญหาเป็นระยะเวลาที่สั้นมากของเวลา

646
00:36:58,110 --> 00:37:02,970
การประมวลผลข้อมูลได้อย่างรวดเร็ว
เป็นไปได้ซึ่งเป็นสิ่งที่เท่านั้น

647
00:37:02,970 --> 00:37:08,220
ขณะนี้อยู่ในโลกของคอมพิวเตอร์เมฆ
เราสามารถเซิร์ฟเวอร์บทบัญญัติหลัก

648
00:37:08,220 --> 00:37:09,890
ทันทีคือการที่มีประโยชน์

649
00:37:09,890 --> 00:37:12,260
ดังนั้นเราจึงไม่จำเป็นต้องมี
เซิร์ฟเวอร์ยักษ์นั่งรอบ

650
00:37:12,260 --> 00:37:16,700
ตลอดเวลาที่จะทำการประมวลผล
ที่อาจจะเกิดขึ้นเพียงสัปดาห์ละครั้ง

651
00:37:16,700 --> 00:37:21,440
>> เพื่อให้เป็นส่วนใหญ่มัน

652
00:37:21,440 --> 00:37:27,590
มีเอกสารที่มีอยู่เป็น
สำหรับห้องสมุดเมฆรายการ API

653
00:37:27,590 --> 00:37:31,960
ที่ URL นี้ซึ่งจะ
สามารถใช้ได้ในภายหลัง

654
00:37:31,960 --> 00:37:36,730
และกรุณ​​าไปดูที่
เพื่อดูว่ามีอะไร

655
00:37:36,730 --> 00:37:37,579
คุณมีความคิดใด ๆ

656
00:37:37,579 --> 00:37:38,120
เล่นกับมัน

657
00:37:38,120 --> 00:37:38,830
เกลือกกลั้ว

658
00:37:38,830 --> 00:37:42,800
และหวังว่าคุณสามารถเข้ามา
กับสิ่งที่ดี

659
00:37:42,800 --> 00:37:44,740
ขอบคุณ

660
00:37:44,740 --> 00:37:45,899