1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 JEFFREY Licht: Hi there. 3 00:00:12,370 --> 00:00:13,550 Tôi Jeffrey Licht. 4 00:00:13,550 --> 00:00:17,890 Và tôi ở đây để nói chuyện với bạn về Thư viện và xây dựng Harvard ngày mai 5 00:00:17,890 --> 00:00:20,870 thư viện ngày hôm nay, tôi đoán. 6 00:00:20,870 --> 00:00:23,040 Vì vậy, các nền ở đây, sân cho phần này 7 00:00:23,040 --> 00:00:26,930 về cơ bản là có là rất nhiều dữ liệu thư mục 8 00:00:26,930 --> 00:00:28,400 có sẵn trong thư viện Harvard. 9 00:00:28,400 --> 00:00:33,434 Và đó là một cơ hội, thông qua một số các công cụ 10 00:00:33,434 --> 00:00:36,350 và một dự án đang được phát triển, để có được quyền truy cập vào các thông tin 11 00:00:36,350 --> 00:00:42,430 và mang nó đến những nơi mà các Thư viện Harvard không phải là làm ngay bây giờ, 12 00:00:42,430 --> 00:00:45,460 làm công cụ mới với nó, thí nghiệm và chơi đùa với nó. 13 00:00:45,460 --> 00:00:52,413 >> Vì vậy, các điểm vào này là một API gọi là Thư viện Mây Harvard, mà 14 00:00:52,413 --> 00:00:57,650 là một máy chủ siêu dữ liệu mở, mà tôi sẽ nói về hiện tại. 15 00:00:57,650 --> 00:01:02,595 Vì vậy, nền là có một rất nhiều thứ trong thư viện Harvard. 16 00:01:02,595 --> 00:01:07,150 Chúng tôi có hơn 13 triệu thư mục hồ sơ, hàng triệu bức ảnh, 17 00:01:07,150 --> 00:01:11,090 và hàng ngàn việc tìm kiếm sự trợ giúp, mà cơ bản là tài liệu mô tả 18 00:01:11,090 --> 00:01:15,500 bộ sưu tập, nói gì ở trong đó, hộp giấy 19 00:01:15,500 --> 00:01:21,080 và vv, chiếm hơn một triệu tài liệu cá nhân. 20 00:01:21,080 --> 00:01:24,290 Và cũng có rất nhiều thông tin mà thư viện có 21 00:01:24,290 --> 00:01:28,180 về cách thức nội dung được sử dụng mà có thể có ích cho mọi người 22 00:01:28,180 --> 00:01:32,400 những người có thể muốn làm việc với nó. 23 00:01:32,400 --> 00:01:36,150 >> Vì vậy, tất cả các thông tin thư viện có siêu dữ liệu. 24 00:01:36,150 --> 00:01:39,500 Vì vậy, siêu dữ liệu là dữ liệu về dữ liệu. 25 00:01:39,500 --> 00:01:42,070 Vì vậy, khi chúng ta nói về các thông tin đó là 26 00:01:42,070 --> 00:01:44,890 có sẵn thông qua thư viện đám mây đó là có sẵn, 27 00:01:44,890 --> 00:01:47,760 nó không nhất thiết các tài liệu thực tế 28 00:01:47,760 --> 00:01:53,060 mình, không nhất thiết phải đầy đủ văn bản của cuốn sách hoặc các hình ảnh đầy đủ, 29 00:01:53,060 --> 00:01:54,890 mặc dù thực sự có thể là trường hợp. 30 00:01:54,890 --> 00:01:57,550 Nhưng nó thực sự thông tin về dữ liệu. 31 00:01:57,550 --> 00:02:00,909 >> Vì vậy, bạn có thể nghĩ về biên mục thông tin, số cuộc gọi, đối tượng, 32 00:02:00,909 --> 00:02:02,700 bao nhiêu bản sao của Cuốn sách có, những gì 33 00:02:02,700 --> 00:02:06,380 là phiên bản, là những gì định dạng, các tác giả, và vân vân. 34 00:02:06,380 --> 00:02:12,250 Vì vậy, có rất nhiều thông tin về các thông tin trong bộ sưu tập, 35 00:02:12,250 --> 00:02:14,400 trong chính nó, là loại vốn hữu ích. 36 00:02:14,400 --> 00:02:19,230 Và mặc dù nếu bạn làm nghiên cứu chuyên sâu, 37 00:02:19,230 --> 00:02:25,160 rõ ràng là bạn muốn để có được các thực tế Nội dung chính nó và nhìn vào các dữ liệu, 38 00:02:25,160 --> 00:02:30,140 các siêu dữ liệu là hữu ích trong việc cả hai phân tích ngữ liệu như một toàn thể, 39 00:02:30,140 --> 00:02:33,870 giống như những gì đang có trong bộ sưu tập. 40 00:02:33,870 --> 00:02:35,520 Làm thế nào họ có liên quan? 41 00:02:35,520 --> 00:02:39,482 Nó sẽ giúp bạn thực sự tìm thấy các công cụ khác, mà thực sự là mục đích chính của nó. 42 00:02:39,482 --> 00:02:41,190 Điểm quan trọng của siêu dữ liệu và các cửa hàng 43 00:02:41,190 --> 00:02:43,230 là để giúp bạn tìm thấy tất cả các thông tin đó là 44 00:02:43,230 --> 00:02:46,590 có sẵn trong bộ sưu tập. 45 00:02:46,590 --> 00:02:53,690 >> Vì vậy, đây là một ví dụ của siêu dữ liệu cho một cuốn sách trong thư viện Harvard. 46 00:02:53,690 --> 00:02:56,370 Vì vậy, nó có. 47 00:02:56,370 --> 00:02:59,850 Và bạn có thể thấy nó thực sự phức tạp vừa phải. 48 00:02:59,850 --> 00:03:04,610 Và một phần giá trị của siêu dữ liệu trong hệ thống thư viện Harvard 49 00:03:04,610 --> 00:03:09,320 được rằng nó được phân loại được xây dựng lên bởi người biên mục 50 00:03:09,320 --> 00:03:12,720 và lắp ráp bởi người nộp đơn xin rất nhiều về chuyên môn và kỹ năng 51 00:03:12,720 --> 00:03:20,030 và nghĩ đến nó theo thời gian, trong đó có rất nhiều giá trị. 52 00:03:20,030 --> 00:03:25,450 >> Vì vậy, nếu bạn có một cái nhìn tại hồ sơ này cho Các chú thích Alice, bạn có thể tìm hiểu 53 00:03:25,450 --> 00:03:32,590 bạn đã có danh hiệu, người đã viết nó, tác giả, và tất cả các đối tượng khác nhau 54 00:03:32,590 --> 00:03:35,380 mà người dân đã xếp vào mục lục vào. 55 00:03:35,380 --> 00:03:40,110 Và bạn có thể nhìn thấy ở đây cũng có, trong Ngoài rất nhiều thông tin tốt 56 00:03:40,110 --> 00:03:42,852 ở đây, có một số trùng lắp. 57 00:03:42,852 --> 00:03:45,560 Có rất nhiều sự phức tạp đó là phản ánh thông qua các siêu dữ liệu 58 00:03:45,560 --> 00:03:46,300 mà bạn có. 59 00:03:46,300 --> 00:03:50,320 >> Vì vậy, một tiêu đề của cuốn sách này là Cuộc phiêu lưu của Alice in Wonderland. 60 00:03:50,320 --> 00:03:53,880 Vì vậy, đây là một chú thích phiên bản của cuốn sách đó. 61 00:03:53,880 --> 00:03:56,380 Nhưng nó cũng được gọi là Các chú thích Alice, Alice của cuộc phiêu lưu 62 00:03:56,380 --> 00:03:58,570 in Wonderland vì nó là cái gì đó 63 00:03:58,570 --> 00:04:00,430 Martin Gardner đã viết và chú thích các cuốn sách. 64 00:04:00,430 --> 00:04:03,369 Và có rất nhiều thông tin tuyệt vời những câu đố logic và điều 65 00:04:03,369 --> 00:04:05,410 Alice trong đó bạn có lẽ không biết về. 66 00:04:05,410 --> 00:04:07,000 Vì vậy, bạn nên đi đọc nó. 67 00:04:07,000 --> 00:04:11,940 >> Nhưng bạn có thể nhìn thấy ở đây rất nhiều chi tiết ở đây, 68 00:04:11,940 --> 00:04:15,340 bao gồm cả các định danh, khi đó đã được tạo ra, nó đến từ đâu, 69 00:04:15,340 --> 00:04:17,420 trong điều khoản của Harvard hệ thống, và vân vân. 70 00:04:17,420 --> 00:04:20,350 Vì vậy, đây là một mẫu của các loại siêu dữ liệu 71 00:04:20,350 --> 00:04:24,340 mà bạn có thể nhìn thấy trong một cuốn sách các bộ sưu tập thư viện Harvard. 72 00:04:24,340 --> 00:04:26,680 >> Đây là một cái gì đó hoàn toàn khác nhau. 73 00:04:26,680 --> 00:04:32,610 Vì vậy, có một hệ thống gọi là VIA Harvard, mà cơ bản 74 00:04:32,610 --> 00:04:39,990 được biên mục hình ảnh và các đối tượng của nghệ thuật và những thứ hình ảnh trong suốt Harvard, 75 00:04:39,990 --> 00:04:44,010 và thêm một số siêu dữ liệu với họ, phân loại chúng, 76 00:04:44,010 --> 00:04:49,200 và, trong một số trường hợp, cung cấp hình ảnh thumbnail nhỏ 77 00:04:49,200 --> 00:04:51,250 mà bạn có thể mất một xem xét nếu bạn rất muốn. 78 00:04:51,250 --> 00:04:54,240 >> Vì vậy, đây là một ví dụ về các siêu dữ liệu mà bạn có cho một tấm 79 00:04:54,240 --> 00:04:57,840 từ, có lẽ, Alice in Wonderland. 80 00:04:57,840 --> 00:05:00,499 Và bạn có thể nhìn thấy ở đây ít siêu dữ liệu ở đây. 81 00:05:00,499 --> 00:05:02,040 Nó chỉ là một loại khác nhau của các đối tượng. 82 00:05:02,040 --> 00:05:03,425 Và do đó, có ít thông tin hơn. 83 00:05:03,425 --> 00:05:07,790 >> Bạn chủ yếu là có một thực tế rằng, một cuộc gọi số lượng, cơ bản đã tạo ra nó, - 84 00:05:07,790 --> 00:05:10,410 >> Chúng tôi không biết khi nào nó được tạo ra. 85 00:05:10,410 --> 00:05:13,320 >> --and một tiêu đề. 86 00:05:13,320 --> 00:05:14,300 >> Một ví dụ khác. 87 00:05:14,300 --> 00:05:16,380 Đây là một viện trợ phát hiện. 88 00:05:16,380 --> 00:05:19,030 Vì vậy, có một bộ sưu tập của Lewis Giấy tờ Carroll tại Harvard. 89 00:05:19,030 --> 00:05:23,601 Vì vậy, điều này mô tả những gì là trong bộ sưu tập. 90 00:05:23,601 --> 00:05:26,100 Vì vậy, một người đã trải qua và nhìn qua tất cả các hộp 91 00:05:26,100 --> 00:05:32,220 và mục lục đó, đưa ra một số nền, viết một bản tóm tắt về những gì ở đây. 92 00:05:32,220 --> 00:05:35,290 Và nếu bạn đã tìm hơn nữa lúc này, điều này 93 00:05:35,290 --> 00:05:39,620 đi trên các trang và các trang và các trang, nhưng sẽ cho bạn biết 94 00:05:39,620 --> 00:05:41,860 những lá thư và những gì ngày từ những gì hộp 95 00:05:41,860 --> 00:05:44,289 tồn tại trong suốt bộ sưu tập. 96 00:05:44,289 --> 00:05:46,330 Nhưng đây là một cái gì đó rằng, nếu bạn đang ở Harvard, 97 00:05:46,330 --> 00:05:50,720 bạn có thể đi và thực chất tìm và, có lẽ, hãy nhìn vào. 98 00:05:50,720 --> 00:05:53,440 >> Vì vậy, đây là tất cả tuyệt vời. 99 00:05:53,440 --> 00:05:54,450 Của siêu dữ liệu hữu ích này. 100 00:05:54,450 --> 00:05:56,327 Đó là trong các hệ thống thư viện Harvard. 101 00:05:56,327 --> 00:05:58,910 Có những công cụ trực tuyến, nơi bạn có thể đi và có một cái nhìn vào nó, 102 00:05:58,910 --> 00:05:59,993 và nhìn thấy nó, và tìm kiếm nó. 103 00:05:59,993 --> 00:06:02,810 Và bạn có thể cắt nó và xúc xắc nó trong nhiều cách khác nhau. 104 00:06:02,810 --> 00:06:06,920 >> Nhưng nó thực sự chỉ có sẵn nếu bạn là một con người ngồi xuống 105 00:06:06,920 --> 00:06:12,600 tại trình duyệt web của bạn hoặc một cái gì đó hoặc điện thoại và điều hướng thông qua nó bạn. 106 00:06:12,600 --> 00:06:16,730 Nó không thực sự sẵn trong bất kỳ loại thời trang có thể sử dụng 107 00:06:16,730 --> 00:06:19,520 cho các hệ thống khác hoặc các máy tính khác để sử dụng, 108 00:06:19,520 --> 00:06:21,500 không có hệ thống trong vòng Thư viện Harvard, 109 00:06:21,500 --> 00:06:24,890 nhưng hệ thống trong thế giới bên ngoài, chỉ những người khác nói chung. 110 00:06:24,890 --> 00:06:30,210 Vì vậy, câu hỏi là, làm thế nào chúng ta có thể làm cho nó có sẵn cho máy tính 111 00:06:30,210 --> 00:06:33,560 để chúng tôi có thể làm thú vị hơn thứ với nó hơn là chỉ 112 00:06:33,560 --> 00:06:36,550 duyệt nó chính mình? 113 00:06:36,550 --> 00:06:39,766 >> Vì vậy, tại sao bạn sẽ muốn làm điều này? 114 00:06:39,766 --> 00:06:41,140 Có rất nhiều khả năng. 115 00:06:41,140 --> 00:06:43,980 Một là bạn có thể xây dựng một hoàn toàn cách khác nhau của trình duyệt 116 00:06:43,980 --> 00:06:46,962 các nội dung có sẵn thông qua các thư viện Harvard. 117 00:06:46,962 --> 00:06:48,670 Tôi sẽ cho bạn thấy một sau này gọi là Stacklife, 118 00:06:48,670 --> 00:06:52,440 trong đó có một hoàn toàn khác nhau đưa vào tìm kiếm nội dung. 119 00:06:52,440 --> 00:06:54,560 >> Bạn có thể xây dựng một công cụ khuyến nghị. 120 00:06:54,560 --> 00:06:57,955 Vì vậy, Thư viện Harvard không phải là trong kinh doanh nói, bạn thích cuốn sách này. 121 00:06:57,955 --> 00:07:01,080 Sau đó, hãy có một cái nhìn tại các 17 khác sách mà bạn có thể quan tâm 122 00:07:01,080 --> 00:07:03,200 hoặc những 18 hình ảnh khác. 123 00:07:03,200 --> 00:07:06,040 Nhưng đó chắc chắn có thể là một tính năng có giá trị. 124 00:07:06,040 --> 00:07:09,272 Và cho các siêu dữ liệu, nó có thể có thể đặt cùng nhau. 125 00:07:09,272 --> 00:07:11,980 Bạn có thể có những nhu cầu khác nhau trong các điều khoản của việc tìm kiếm các nội dung, 126 00:07:11,980 --> 00:07:16,200 như có lẽ mặc dù các công cụ có sẵn mà làm cho thư viện 127 00:07:16,200 --> 00:07:18,450 có sẵn, bạn có thể muốn để tìm kiếm theo một cách khác 128 00:07:18,450 --> 00:07:21,847 hoặc tối ưu hóa cho một trường hợp sử dụng cụ thể, mà có lẽ nó rất đặc biệt. 129 00:07:21,847 --> 00:07:23,930 Có lẽ chỉ có một vài mọi người trong thế giới những người 130 00:07:23,930 --> 00:07:25,846 muốn tìm kiếm các nội dung theo cách này, nhưng nó 131 00:07:25,846 --> 00:07:28,985 sẽ là tuyệt vời nếu chúng tôi có thể cho phép họ làm điều đó. 132 00:07:28,985 --> 00:07:30,860 Có rất nhiều phân tích chỉ trong cách mọi người 133 00:07:30,860 --> 00:07:33,860 sử dụng các nội dung đó sẽ được thực sự thú vị để biết về, tìm hiểu 134 00:07:33,860 --> 00:07:37,280 những cuốn sách nào đang được sử dụng, những gì không phải là, và vân vân. 135 00:07:37,280 --> 00:07:41,670 Và sau đó có rất nhiều cơ hội để tích hợp 136 00:07:41,670 --> 00:07:45,210 với các thông tin khác đó là hiện có trên web. 137 00:07:45,210 --> 00:07:46,880 Vì vậy, chúng tôi have-- 138 00:07:46,880 --> 00:07:50,260 >> Ví dụ, có NPR một đoạn xem xét cuốn sách, 139 00:07:50,260 --> 00:07:53,090 nơi họ phỏng vấn tác giả về cuốn sách. 140 00:07:53,090 --> 00:07:56,837 Và do đó, nó sẽ là tuyệt vời nếu bạn là nhìn lên một cuốn sách trong các Harvard 141 00:07:56,837 --> 00:07:59,670 Thư viện, và bạn nói, OK, có được một cuộc phỏng vấn với tác giả. 142 00:07:59,670 --> 00:08:00,878 Hãy đi tham quan một cái nhìn lúc đó. 143 00:08:00,878 --> 00:08:05,461 Hoặc có một trang Wikipedia, như một thẩm quyền, tài liệu tham khảo học thuật 144 00:08:05,461 --> 00:08:07,710 về cuốn sách này mà bạn có thể muốn xem xét. 145 00:08:07,710 --> 00:08:12,600 >> Có những loại nguồn nằm rải rác khắp các trang web. 146 00:08:12,600 --> 00:08:16,555 Và đưa họ lại với nhau có thể được sử dụng tuyệt vời 147 00:08:16,555 --> 00:08:18,930 để ai đó nhìn vào nội dung, tìm kiếm một cái gì đó. 148 00:08:18,930 --> 00:08:20,180 Nhưng nó cũng không phải là loại điều bạn muốn 149 00:08:20,180 --> 00:08:23,205 muốn thư viện phải chịu trách nhiệm cho đi xuống và săn lùng 150 00:08:23,205 --> 00:08:25,455 tất cả các nguồn khác nhau và cắm chúng với nhau 151 00:08:25,455 --> 00:08:28,920 bởi vì chúng ta đang thay đổi liên tục. 152 00:08:28,920 --> 00:08:33,570 Và may quan trọng những gì họ nghĩ là không được những gì bạn nghĩ là quan trọng. 153 00:08:33,570 --> 00:08:36,929 >> Và thậm chí nhiều hơn như vậy, về cơ bản có một rất nhiều thứ chúng tôi đã không nghĩ đến chưa. 154 00:08:36,929 --> 00:08:42,222 Vì vậy, nếu chúng ta có thể mở này lên, nhiều hơn người bên cạnh một nửa tá hoặc hơn, 155 00:08:42,222 --> 00:08:45,174 người đang tìm kiếm điều này trên một thường xuyên có thể nghĩ về ý tưởng 156 00:08:45,174 --> 00:08:47,340 và xoa bóp các dữ liệu, và làm những gì họ muốn với nó. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> Vì vậy, chúng tôi muốn làm điều này dữ liệu có sẵn cho thế giới. 159 00:08:54,045 --> 00:08:55,670 Vâng, có một vài biến chứng. 160 00:08:55,670 --> 00:08:58,540 Một là siêu dữ liệu này là trong các hệ thống khác nhau. 161 00:08:58,540 --> 00:09:01,110 Đó là trong các định dạng khác nhau. 162 00:09:01,110 --> 00:09:04,719 Vì vậy, có một số bình thường mà cần phải xảy ra, 163 00:09:04,719 --> 00:09:08,010 mà bình thường là quá trình mang lại những điều từ các định dạng khác nhau 164 00:09:08,010 --> 00:09:12,940 và lập bản đồ chúng vào một định dạng duy nhất do đó các trường sẽ phù hợp lên. 165 00:09:12,940 --> 00:09:15,160 >> Có một số hạn chế bản quyền. 166 00:09:15,160 --> 00:09:21,010 Lạ lùng thay, mục catalog về một cuốn sách là chịu trách nhiệm về bản quyền. 167 00:09:21,010 --> 00:09:24,060 Vì vậy, mặc dù nó chỉ là thông tin thu được từ cuốn sách, 168 00:09:24,060 --> 00:09:25,330 nó có bản quyền. 169 00:09:25,330 --> 00:09:28,400 Và tùy thuộc vào những người thực sự tạo ra siêu dữ liệu, 170 00:09:28,400 --> 00:09:32,175 có thể có những hạn chế về người có thể phân phối, đối với: tương tự 171 00:09:32,175 --> 00:09:33,402 >> Tôi không biết. 172 00:09:33,402 --> 00:09:36,110 Nó có thể hoặc có thể không giống với tình hình của lời bài hát, 173 00:09:36,110 --> 00:09:36,610 cho ví dụ. 174 00:09:36,610 --> 00:09:38,560 Vì vậy, tất cả chúng ta biết làm thế nào mà chảo ra. 175 00:09:38,560 --> 00:09:40,450 Vì vậy, bạn cần để có được xung quanh vấn đề này. 176 00:09:40,450 --> 00:09:44,910 >> Và sau đó là một mảnh khác rằng có rất nhiều dữ liệu. 177 00:09:44,910 --> 00:09:52,420 Vì vậy, nếu tôi là một người muốn làm việc với các dữ liệu hoặc có một ý tưởng mát mẻ, 178 00:09:52,420 --> 00:09:55,350 đối phó với 14 triệu hồ sơ trên máy tính xách tay của tôi 179 00:09:55,350 --> 00:09:57,487 có thể là có vấn đề và khó quản lý. 180 00:09:57,487 --> 00:09:59,320 Vì vậy, chúng ta muốn giảm các rào cản đối với người 181 00:09:59,320 --> 00:10:02,130 để có thể làm việc với các dữ liệu. 182 00:10:02,130 --> 00:10:07,880 >> Vì vậy, phương pháp này mà hy vọng địa chỉ tất cả các mối quan tâm là hai phần. 183 00:10:07,880 --> 00:10:11,770 Một là xây dựng một nền tảng mà mất dữ liệu từ tất cả các nguồn khác nhau 184 00:10:11,770 --> 00:10:14,350 và làm trầm trọng thêm nó, bình thường hóa, làm phong phú nó, và làm cho 185 00:10:14,350 --> 00:10:16,650 nó có sẵn trong một địa điểm duy nhất. 186 00:10:16,650 --> 00:10:20,950 Và nó làm cho nó có sẵn thông qua một API công cộng mà mọi người có thể gọi. 187 00:10:20,950 --> 00:10:24,430 >> Vì vậy, một API là một ứng dụng Giao diện lập trình. 188 00:10:24,430 --> 00:10:28,930 Và về cơ bản đề cập đến một endpoint rằng một hệ thống hoặc công nghệ 189 00:10:28,930 --> 00:10:31,720 có thể gọi và nhận được dữ liệu trở lại một định dạng cấu trúc một cách 190 00:10:31,720 --> 00:10:32,900 nó có thể được sử dụng. 191 00:10:32,900 --> 00:10:36,060 Vì vậy, nó không phụ thuộc trên đi đến một trang web 192 00:10:36,060 --> 00:10:37,970 và cạo dữ liệu ra của nó, ví dụ. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> Vì vậy, đây là trang chủ của Thư viện Mây mục API, 195 00:10:45,010 --> 00:10:47,220 mà chủ yếu là hai phiên bản của nó. 196 00:10:47,220 --> 00:10:50,130 Vì vậy, nó là lặp thứ hai của cố gắng để làm cho tất cả các dữ liệu này 197 00:10:50,130 --> 00:10:53,280 bố với thế giới. 198 00:10:53,280 --> 00:10:59,560 Vì vậy, nó là http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 Và chỉ để phá vỡ này xuống một chút, điều này có nghĩa 200 00:11:03,830 --> 00:11:06,115 là đây là phiên bản hai của API. 201 00:11:06,115 --> 00:11:08,490 Có một phiên bản một, mà Tôi sẽ không nói về. 202 00:11:08,490 --> 00:11:09,750 Nhưng có một phiên bản một. 203 00:11:09,750 --> 00:11:14,740 >> Và nếu bạn đang gọi điện thoại này API, bạn đang nhận được vật phẩm. 204 00:11:14,740 --> 00:11:20,640 Và một phần của ý tưởng về một API là một API là một hợp đồng. 205 00:11:20,640 --> 00:11:23,440 Nó là cái gì đó là sẽ không thay đổi. 206 00:11:23,440 --> 00:11:24,850 Vì vậy, ví dụ, - 207 00:11:24,850 --> 00:11:27,410 >> Và lý do là nếu tôi xây dựng một số loại hệ thống 208 00:11:27,410 --> 00:11:33,210 sẽ sử dụng một API thư viện đám mây để hiển thị sách hay giúp mọi người tìm 209 00:11:33,210 --> 00:11:36,190 thông tin theo những cách độc đáo, những gì chúng ta không muốn xảy ra 210 00:11:36,190 --> 00:11:38,940 là để chúng ta đi thay đổi như thế nào API là công trình, và đột nhiên 211 00:11:38,940 --> 00:11:41,340 phá vỡ mọi thứ về phía người dùng cuối. 212 00:11:41,340 --> 00:11:46,710 Vì vậy, một phần của nếu bạn đang làm cho API bố với thế giới, đó là 213 00:11:46,710 --> 00:11:49,396 thực hành tốt để đặt một số phiên bản trong nó để mọi người 214 00:11:49,396 --> 00:11:51,020 biết những gì phiên bản mà họ đang làm việc với. 215 00:11:51,020 --> 00:11:54,300 >> Vì vậy, nếu chúng ta quyết định, chúng tôi tìm thấy một cách tốt hơn làm cho thông tin này có sẵn, 216 00:11:54,300 --> 00:11:57,295 chúng ta có thể thay đổi điều đó để gọi đó là phiên bản ba. 217 00:11:57,295 --> 00:11:59,920 Vì vậy, tất cả những người vẫn đang sử dụng phiên bản hai, điều đó vẫn sẽ làm việc. 218 00:11:59,920 --> 00:12:03,490 Nhưng phiên bản ba sẽ có tất cả những thứ mới. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> Vì vậy, đây là một API, nhưng điều này thực sự trông giống như một URL. 221 00:12:09,210 --> 00:12:11,680 Và vì vậy những gì này là một ví dụ là gì 222 00:12:11,680 --> 00:12:16,615 được gọi là một API còn lại, trong đó có sẵn trên chỉ là một trang web kết nối thường xuyên. 223 00:12:16,615 --> 00:12:19,680 Và bạn có thể thực sự đi đến nó trong một trình duyệt. 224 00:12:19,680 --> 00:12:28,550 >> Vì vậy, ở đây tôi vừa mới mở lên và Firefox đi api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 Và vì vậy những gì tôi nhận được ở đây là về cơ bản trang đầu tiên 226 00:12:31,560 --> 00:12:34,740 kết quả từ toàn bộ thiết lập các mục mà chúng ta có. 227 00:12:34,740 --> 00:12:37,460 Và nó ở đây dạng XML. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 Và nó cũng được tô đẹp bằng Firefox. 230 00:12:42,210 --> 00:12:45,850 Nó không thực sự có tất cả các nhỏ đang mở rộng và hợp đồng 231 00:12:45,850 --> 00:12:47,880 doohickeys đây. 232 00:12:47,880 --> 00:12:52,520 Đây là loại một đẹp hơn phiên bản cách để nhìn vào nó. 233 00:12:52,520 --> 00:12:57,040 >> Nhưng điều này là nói cho chúng tôi là Tôi đã yêu cầu tất cả các mặt hàng. 234 00:12:57,040 --> 00:13:03,120 Vì vậy, có 13.289.475 mục. 235 00:13:03,120 --> 00:13:06,150 Và tôi đang nhìn vào đầu tiên 10, bắt đầu từ vị trí số không 236 00:13:06,150 --> 00:13:09,760 bởi vì trong khoa học máy tính chúng tôi luôn luôn bắt đầu từ số không. 237 00:13:09,760 --> 00:13:15,150 Và những gì tôi có ở đây, nếu tôi chỉ sụp đổ này, bạn sẽ thấy tôi đã có 10 mặt hàng. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> Và nếu tôi có một cái nhìn tại một mục, tôi có thể thấy rằng tôi đã có thông tin về nó. 240 00:13:25,210 --> 00:13:27,400 Và đây là những gì được gọi là hình thức MODS. 241 00:13:27,400 --> 00:13:30,860 Và vì vậy tôi sẽ chuyển trở lại đây một lúc. 242 00:13:30,860 --> 00:13:33,750 OK. 243 00:13:33,750 --> 00:13:37,447 >> Vì vậy, hãy tìm kiếm một cái gì đó trong cụ thể vì mục đầu tiên 244 00:13:37,447 --> 00:13:40,030 xảy ra cho đến khi bạn nhìn toàn bộ sưu tập 245 00:13:40,030 --> 00:13:41,750 là, theo định nghĩa, ngẫu nhiên. 246 00:13:41,750 --> 00:13:44,550 Vì vậy, hãy tìm một số bánh rán. 247 00:13:44,550 --> 00:13:46,830 Oh. 248 00:13:46,830 --> 00:13:49,190 >> OK. 249 00:13:49,190 --> 00:13:49,940 Vì vậy, bánh rán. 250 00:13:49,940 --> 00:13:55,360 Vì vậy, chúng tôi thấy có 80 mục trong các bộ sưu tập mà tham khảo bánh rán. 251 00:13:55,360 --> 00:13:57,150 Chúng tôi đang tìm kiếm 10 người đầu tiên của họ. 252 00:13:57,150 --> 00:14:01,890 Bây giờ, bạn có thể thấy ở đây cách mà Tôi nói rằng tôi đang tìm bánh rán, 253 00:14:01,890 --> 00:14:04,400 Tôi chỉ cần thêm một cái gì đó để các chuỗi truy vấn của URL. 254 00:14:04,400 --> 00:14:09,680 Vì vậy, q bằng bánh rán, mà bạn có thể thấy một chút dễ dàng hơn ở đây. 255 00:14:09,680 --> 00:14:12,131 >> Và điều này về cơ bản có nghĩa là có một spec cho các API, mà 256 00:14:12,131 --> 00:14:13,880 xác định tất cả những gì các thông số này có ý nghĩa. 257 00:14:13,880 --> 00:14:17,150 Và điều này có nghĩa là chúng ta sẽ Tìm kiếm tất cả mọi thứ cho bánh rán. 258 00:14:17,150 --> 00:14:24,910 >> Vì vậy, mục đầu tiên ở đây chúng tôi có bạn có thể thấy tiêu đề là Donuts, 259 00:14:24,910 --> 00:14:29,310 và có một phụ đề gọi là An Passion Mỹ, đó là, tôi đoán, 260 00:14:29,310 --> 00:14:31,610 thích hợp. 261 00:14:31,610 --> 00:14:36,134 Có rất nhiều different-- 262 00:14:36,134 --> 00:14:38,050 Một khi bạn nhận được đến điểm nhận dữ liệu, 263 00:14:38,050 --> 00:14:41,020 có rất nhiều khác nhau các định dạng mà bạn có thể nhận được nó vào. 264 00:14:41,020 --> 00:14:44,050 Và có những thế mạnh khác nhau và điểm yếu đối với tất cả chúng. 265 00:14:44,050 --> 00:14:49,000 Vì vậy, một này, bạn có thể nhìn thấy ở đây, hình thức này rất phong phú. 266 00:14:49,000 --> 00:14:51,946 Và nó được chuẩn hóa. 267 00:14:51,946 --> 00:14:55,040 >> Vì vậy, có một tiêu đề cụ thể lĩnh vực, một lĩnh vực phụ đề. 268 00:14:55,040 --> 00:14:58,950 Có một thay thế tiêu đề, An Passion Mỹ. 269 00:14:58,950 --> 00:15:01,650 Có tên liên kết với nó. 270 00:15:01,650 --> 00:15:03,120 Loại tài nguyên là văn bản. 271 00:15:03,120 --> 00:15:06,070 Có rất nhiều thông tin ở đây dạng này. 272 00:15:06,070 --> 00:15:09,480 >> Nhưng có một bó các định dạng khác nhau. 273 00:15:09,480 --> 00:15:11,920 Vì vậy, những gì chúng tôi đã chỉ nhìn vào là một định dạng 274 00:15:11,920 --> 00:15:17,700 gọi MODS, viết tắt Metadata Object Mô tả dịch vụ, 275 00:15:17,700 --> 00:15:18,250 tiềm năng. 276 00:15:18,250 --> 00:15:23,030 Tôi thực sự không hoàn toàn chắc chắn về S. Nhưng đó là một định dạng khá phức tạp. 277 00:15:23,030 --> 00:15:24,240 Đó là định dạng mặc định. 278 00:15:24,240 --> 00:15:30,260 >> Nhưng đó là cái mà tiếp tục sự phong phú của tất cả các dữ liệu 279 00:15:30,260 --> 00:15:33,820 mà thư viện có vì nó rất gần với những gì 280 00:15:33,820 --> 00:15:35,110 thư viện sử dụng trong nội bộ. 281 00:15:35,110 --> 00:15:39,030 Đó là một tiêu chuẩn mà là sử dụng trên toàn quốc, 282 00:15:39,030 --> 00:15:40,944 trên toàn thế giới trong các thư viện học thuật. 283 00:15:40,944 --> 00:15:42,110 Và nó rất tương thích. 284 00:15:42,110 --> 00:15:44,852 Vì vậy, nếu bạn đã có một tài liệu mà là ở định dạng MODS, 285 00:15:44,852 --> 00:15:47,560 bạn có thể cho rằng để người khác hệ thống có hiểu MODS, 286 00:15:47,560 --> 00:15:48,518 và họ có thể nhập nó. 287 00:15:48,518 --> 00:15:50,840 Vì vậy, nó là một tiêu chuẩn. 288 00:15:50,840 --> 00:15:54,250 Nó rất tốt được định nghĩa, rất cụ thể. 289 00:15:54,250 --> 00:15:58,980 Và đó là những gì làm cho nó tương thích, vì nếu ai đó nói rằng, 290 00:15:58,980 --> 00:16:04,930 đây là tiêu đề của một thay thế kỷ lục, mọi người đều biết điều đó có nghĩa. 291 00:16:04,930 --> 00:16:07,740 Mặt bên kia, nó rất phức tạp. 292 00:16:07,740 --> 00:16:13,160 >> Vì vậy, nếu bạn có một cái nhìn ở mức kỷ lục này ở đây, 293 00:16:13,160 --> 00:16:15,320 nếu tôi chỉ muốn có được tiêu đề của tài liệu này, 294 00:16:15,320 --> 00:16:21,150 của cuốn sách này, mà có lẽ là Donuts, Một Passion Mỹ, phân tích nó ra 295 00:16:21,150 --> 00:16:22,940 là một chút liên quan. 296 00:16:22,940 --> 00:16:27,380 Trong khi có một định dạng được gọi Dublin Core, 297 00:16:27,380 --> 00:16:29,730 mà là một, nhiều định dạng đơn giản hơn nhiều. 298 00:16:29,730 --> 00:16:33,764 >> Và như vậy bạn thấy ở đây, không có tiêu đề, phụ đề, tiêu đề thay thế. 299 00:16:33,764 --> 00:16:35,930 Không chỉ là danh hiệu, Donuts, An Passion Mỹ, 300 00:16:35,930 --> 00:16:38,780 và danh hiệu, Passion Mỹ. 301 00:16:38,780 --> 00:16:42,907 Vì vậy, khi bạn đang tìm kiếm những hình thức bạn muốn để có được các dữ liệu ra khỏi, 302 00:16:42,907 --> 00:16:44,740 rất nhiều phụ thuộc vào cách bạn sẽ sử dụng nó. 303 00:16:44,740 --> 00:16:46,573 Bạn đang sử dụng cho khả năng tương tác hoặc làm bạn 304 00:16:46,573 --> 00:16:49,970 muốn một cái gì đó đơn giản mà có thể được dễ dàng hơn để làm việc với? 305 00:16:49,970 --> 00:16:56,002 >> Mặt bên kia, rất nhiều các Các chi tiết được loại squished xuống. 306 00:16:56,002 --> 00:16:58,460 Bạn có thể mất đi các sắc thái của những gì một phương tiện lĩnh vực cụ thể 307 00:16:58,460 --> 00:17:02,960 nếu bạn đang đối phó với Dublin Core, mà bạn sẽ không nhận được với MODS. 308 00:17:02,960 --> 00:17:06,462 Vì vậy, những người là hai trong số các định dạng bạn có thể nhận ra các API. 309 00:17:06,462 --> 00:17:08,920 Và về cơ bản, chúng tôi đang giữ nó đằng sau những cảnh quay trong MODS. 310 00:17:08,920 --> 00:17:14,179 Nhưng chúng tôi có thể cung cấp cho bạn nó MODS và Dublin Core và bất cứ điều gì khác là tốt. 311 00:17:14,179 --> 00:17:16,470 Việc xem xét khác khi bạn đang tìm kiếm trong dữ liệu 312 00:17:16,470 --> 00:17:21,210 là bạn có thể nhận được nó như là JSON, mà viết tắt của JavaScript Object Notation, 313 00:17:21,210 --> 00:17:24,720 hay XML, viết tắt Extensible Markup Language. 314 00:17:24,720 --> 00:17:30,080 Và các cơ quan đại diện dữ liệu cả có chính xác cùng một dữ liệu, chính xác 315 00:17:30,080 --> 00:17:31,080 các lĩnh vực tương tự. 316 00:17:31,080 --> 00:17:33,644 Nhưng họ chỉ cú pháp khác nhau. 317 00:17:33,644 --> 00:17:40,401 >> Vì vậy, đây là a-- 318 00:17:40,401 --> 00:17:41,400 Vâng, chúng ta hãy chỉ cần chuyển đổi. 319 00:17:41,400 --> 00:17:47,490 Vì vậy, đây là câu hỏi của chúng tôi cho bánh rán trong định dạng XML. 320 00:17:47,490 --> 00:17:53,470 Nếu tôi chỉ cần chuyển đổi này là JSON, Tôi có thể nhìn thấy nó có vẻ khác. 321 00:17:53,470 --> 00:17:58,580 Vì vậy, bây giờ điều này là cùng một nội dung, nhưng một cấu trúc khác nhau. 322 00:17:58,580 --> 00:18:00,080 Có dấu ngoặc vuông góc ít hơn. 323 00:18:00,080 --> 00:18:02,530 Có ít tiết. 324 00:18:02,530 --> 00:18:06,440 >> Và đây là một định dạng đó, nếu bạn được làm việc trong môi trường web, 325 00:18:06,440 --> 00:18:09,680 bạn có nhiều khả năng xảy ra muốn sử dụng vì một 326 00:18:09,680 --> 00:18:12,630 trong những điều tốt đẹp về JSON là nó tương thích với JavaScript. 327 00:18:12,630 --> 00:18:17,680 Vì vậy, nếu tôi đang viết ứng dụng web, tôi có thể kéo trong JSON và chỉ làm việc với nó trực tiếp. 328 00:18:17,680 --> 00:18:20,187 Trong khi với XML, đó là một chút ít phức tạp hơn. 329 00:18:20,187 --> 00:18:21,520 Vì vậy, một lần nữa, cả hai đều hữu ích. 330 00:18:21,520 --> 00:18:26,387 Họ chỉ là những trường hợp sử dụng khác nhau nơi mọi người có thể muốn sử dụng chúng. 331 00:18:26,387 --> 00:18:26,886 OK. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 Vì vậy, trở lại các API. 334 00:18:31,680 --> 00:18:32,900 Vì vậy, chúng ta có thể tìm kiếm for-- 335 00:18:32,900 --> 00:18:36,220 >> Tôi đưa ra một ví dụ về tìm kiếm cho bánh rán. 336 00:18:36,220 --> 00:18:39,330 Chúng tôi cũng có thể tìm kiếm chỉ trong một lĩnh vực cụ thể trong phạm vi ở đây. 337 00:18:39,330 --> 00:18:41,310 Vì vậy, thay vì tìm kiếm toàn bộ hồ sơ, 338 00:18:41,310 --> 00:18:43,870 Tôi chỉ có thể tìm kiếm các lĩnh vực tiêu đề. 339 00:18:43,870 --> 00:18:48,810 Và vì vậy bây giờ có 25 điều mà có bánh rán trong tiêu đề, một trong số đó 340 00:18:48,810 --> 00:18:52,430 là về phục hồi vùng đất ngập nước trong quản lý 341 00:18:52,430 --> 00:18:54,990 của lỗ trong donut chương trình, mà có lẽ là 342 00:18:54,990 --> 00:18:58,970 không nhất thiết những gì chúng tôi đang tìm kiếm khi chúng tôi đang tìm kiếm cho bánh rán. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> Bạn cũng có thể, khi bạn đối phó với một API-- 345 00:19:05,490 --> 00:19:08,827 >> Một phần của việc có một API được cho người truy cập vào các tập dữ liệu lớn. 346 00:19:08,827 --> 00:19:11,410 Và có một vài khác nhau công cụ bạn có thể sử dụng để làm điều đó. 347 00:19:11,410 --> 00:19:14,170 Một là, rất đơn giản, bạn có thể thông qua các trang dữ liệu. 348 00:19:14,170 --> 00:19:17,340 Vì vậy, cũng giống như khi bạn làm một truy vấn thông qua một giao diện web, 349 00:19:17,340 --> 00:19:19,470 bạn có thể xem tại trang một, trang hai, trang ba. 350 00:19:19,470 --> 00:19:22,040 Bạn có thể làm tương tự điều thông qua các API. 351 00:19:22,040 --> 00:19:24,150 Bạn chỉ cần để được rõ ràng trong cách bạn làm điều đó. 352 00:19:24,150 --> 00:19:29,511 >> Vì vậy, ví dụ, nếu tôi đang tìm ở câu hỏi đầu tiên của tôi ở đây, 353 00:19:29,511 --> 00:19:32,510 nơi tôi đang làm một tìm kiếm cho những thứ với bánh rán trong tiêu đề, tôi có thể nói, 354 00:19:32,510 --> 00:19:35,415 và giới hạn bằng 20, có nghĩa là cho tôi 20 hồ sơ đầu tiên, không 355 00:19:35,415 --> 00:19:38,540 10 người đầu tiên, đó là mặc định, bởi vì tôi muốn nhìn vào 20 tại một thời điểm. 356 00:19:38,540 --> 00:19:43,435 Hoặc tôi có thể nói, thiết lập bắt đầu bằng 20 và giới hạn 357 00:19:43,435 --> 00:19:47,150 bằng 20, mà sẽ cung cấp cho tôi ghi 21 đến 40. 358 00:19:47,150 --> 00:19:52,680 >> Vì vậy, tôi đoán điều để lấy đi ở đây là 359 00:19:52,680 --> 00:19:57,290 mà chúng ta đang sử dụng các chuỗi truy vấn để thiết lập các thông số trên các truy vấn. 360 00:19:57,290 --> 00:20:02,760 Và nó cho phép bạn kiểm soát những gì bạn nhận lại. 361 00:20:02,760 --> 00:20:05,980 >> Một công cụ mà bạn có thể sử dụng, - 362 00:20:05,980 --> 00:20:09,250 >> Và điều này là thực sự hữu ích trong về khai thác các dữ liệu. 363 00:20:09,250 --> 00:20:10,840 >> --is một cái gì đó gọi là faceting. 364 00:20:10,840 --> 00:20:15,530 Vì vậy, các faceting hạn là không nhất thiết phải phổ biến. 365 00:20:15,530 --> 00:20:16,880 Nhưng tất cả các bạn đã nhìn thấy nó trước. 366 00:20:16,880 --> 00:20:18,630 Nếu bạn có một cái nhìn tại Amazon, ví dụ, 367 00:20:18,630 --> 00:20:20,870 và bạn làm một tìm kiếm bánh rán trong những cuốn sách, 368 00:20:20,870 --> 00:20:27,080 ở đây họ đã có một loạt các cuốn sách, và họ đang theo nhóm, 369 00:20:27,080 --> 00:20:30,470 và bạn sẽ có được các loại khác nhau, và có bao nhiêu cuốn sách trong mỗi thể loại 370 00:20:30,470 --> 00:20:31,330 hiện. 371 00:20:31,330 --> 00:20:33,420 >> Vì vậy, đây là cơ bản một khía cạnh. 372 00:20:33,420 --> 00:20:37,570 Bạn lấy tất cả sách của họ, 1.800 cuốn sách khớp với bánh rán ở Amazon. 373 00:20:37,570 --> 00:20:39,820 12 trong số đó là trong thể loại sáng. 374 00:20:39,820 --> 00:20:43,100 21 trong bánh ngọt và bánh nướng, vv và vv. 375 00:20:43,100 --> 00:20:47,670 >> Vì vậy, đây thực sự là một hữu ích công cụ để khám phá nội dung 376 00:20:47,670 --> 00:20:53,260 trong thư viện cũng bởi vì khi bạn nhìn vào một khía cạnh, 377 00:20:53,260 --> 00:20:56,520 nó cung cấp cho bạn một ý tưởng về những gì môn tồn tại, giống như những gì loại của các đối tượng 378 00:20:56,520 --> 00:20:58,510 là phổ biến nhất trong tập hợp truy vấn của bạn. 379 00:20:58,510 --> 00:21:00,950 Và nó sẽ giúp bạn lái xe ra và khám phá. 380 00:21:00,950 --> 00:21:02,770 Vì vậy, chúng ta có thể làm điều tương tự. 381 00:21:02,770 --> 00:21:05,940 >> Nếu chúng ta muốn sử dụng API và nhìn vào khía cạnh, 382 00:21:05,940 --> 00:21:08,950 chúng ta thêm một tham số để bạn của chúng tôi các chuỗi truy vấn. 383 00:21:08,950 --> 00:21:12,540 Vì vậy, mặt bằng một dấu phẩy danh sách những gì chúng tôi muốn khía cạnh trên. 384 00:21:12,540 --> 00:21:14,790 Vì vậy, một trong những khía cạnh có thể phải áp. 385 00:21:14,790 --> 00:21:16,565 Khác có thể là ngôn ngữ. 386 00:21:16,565 --> 00:21:19,665 Và như vậy, nếu chúng ta chạy truy vấn đó, chúng tôi get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 Nó trông khá giống nhau ở đây. 389 00:21:24,830 --> 00:21:29,010 Nhưng chúng tôi đã thêm vào cuối cùng danh sách một loạt các khía cạnh. 390 00:21:29,010 --> 00:21:34,060 Vì vậy, chúng tôi có một khía cạnh được gọi là chủ đề. 391 00:21:34,060 --> 00:21:40,250 Vì vậy, đây là nói cho chúng ta biết rằng nếu tôi nhìn 80 của tôi kết quả từ các truy vấn donut, 392 00:21:40,250 --> 00:21:42,100 13 trong số họ có chịu United States. 393 00:21:42,100 --> 00:21:43,684 Ba có bánh rán chịu. 394 00:21:43,684 --> 00:21:45,600 Ba có chủ đề phục hồi đất ngập nước, 395 00:21:45,600 --> 00:21:47,720 đó có thể là lỗ của chúng tôi trong chiếc bánh rán. 396 00:21:47,720 --> 00:21:51,780 Hai trong số họ, Simpsons, vv và vv. 397 00:21:51,780 --> 00:21:59,211 >> Vì vậy, đây có thể hữu ích nếu bạn muốn thu hẹp tìm kiếm của bạn. 398 00:21:59,211 --> 00:22:00,210 Nó có thể giúp bạn làm điều đó. 399 00:22:00,210 --> 00:22:03,580 Đặc biệt là nếu bạn có hơn, nói, 80 kết quả. 400 00:22:03,580 --> 00:22:05,980 >> Tương tự như vậy, chúng tôi cũng hỏi cho các khía cạnh về ngôn ngữ. 401 00:22:05,980 --> 00:22:14,790 Vì vậy, nếu chúng ta nhìn vào kết quả của chúng tôi, chúng tôi nhìn thấy 76 trong số họ đều là tiếng Anh, bốn trong tiếng Pháp, 402 00:22:14,790 --> 00:22:19,620 hai ở Tây Ban Nha, hai, tôi nghĩ rằng đó là không xác định hoặc không biết, Hà Lan và tiếng Latin. 403 00:22:19,620 --> 00:22:22,830 Vì vậy, tôi nghĩ rằng Latin donut kết quả, một lần nữa, 404 00:22:22,830 --> 00:22:24,922 không có gì để làm với các sản phẩm nung. 405 00:22:24,922 --> 00:22:25,630 Nhưng có bạn đi. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> Vì vậy, đây là loại hiển thị cho bạn làm thế nào bạn có thể kéo các nội dung trở lại 408 00:22:38,630 --> 00:22:41,270 từ API chỉ qua trình duyệt web, đó là rất tốt. 409 00:22:41,270 --> 00:22:44,320 Nhưng nó không phải là thực sự những gì bạn sẽ thường được sử dụng trong API cho nó. 410 00:22:44,320 --> 00:22:48,710 Vì vậy, một ví dụ về cách bạn thực sự có thể làm được điều này là tôi đã 411 00:22:48,710 --> 00:22:54,720 viết một chương trình siêu nhỏ, trong đó, một lần nữa, không tìm kiếm donut của tôi 412 00:22:54,720 --> 00:22:59,010 và chọn một vài lĩnh vực và hiển thị chúng trong một bảng. 413 00:22:59,010 --> 00:23:01,610 Vì vậy, đây là rất nhiều cùng một nội dung mà chúng ta chỉ 414 00:23:01,610 --> 00:23:04,830 cưa với một vài lĩnh vực kéo ra. 415 00:23:04,830 --> 00:23:12,090 Vì vậy, danh sách các danh hiệu, các vị trí của những gì cuốn sách 416 00:23:12,090 --> 00:23:15,120 là về, ngôn ngữ, vv và vv. 417 00:23:15,120 --> 00:23:20,480 >> Vậy làm thế nào điều này thực sự xảy ra, kể từ khi Tôi nghĩ chúng ta phải nhìn vào một số mã, 418 00:23:20,480 --> 00:23:22,420 is-- 419 00:23:22,420 --> 00:23:28,060 >> Một HTML đơn giản những gì chúng tôi có ở đây là Trang này hiển thị văn bản, 420 00:23:28,060 --> 00:23:32,900 chào mừng bạn đến thư viện và đám mây sau đó sẽ hiển thị một bảng kết quả. 421 00:23:32,900 --> 00:23:37,790 Và rõ ràng là không có kết quả trong bảng khi trang được nạp. 422 00:23:37,790 --> 00:23:41,380 Nhưng những gì chúng tôi đang làm là, trước hết, chúng ta 423 00:23:41,380 --> 00:23:46,290 đang tải một thư viện được gọi jQuery, đó là cơ bản 424 00:23:46,290 --> 00:23:52,030 một thư viện JavaScript, mà làm cho nó rất dễ dàng để thao tác JavaScript 425 00:23:52,030 --> 00:23:58,780 nguyên bản, HTML, và tạo ra các trang web, client-side logic và các trang web. 426 00:23:58,780 --> 00:24:01,595 >> Vì vậy, những gì chúng tôi có ở đây là jQuery có một phương pháp gọi là Get, 427 00:24:01,595 --> 00:24:05,270 mà chủ yếu sẽ đi đến một URL, trong đó, trong trường hợp này, 428 00:24:05,270 --> 00:24:09,070 là tìm kiếm URL quen thuộc này. 429 00:24:09,070 --> 00:24:14,440 Và sau đó sẽ nhận được nội dung từ URL đó và sau đó chạy một chức năng trên đó. 430 00:24:14,440 --> 00:24:19,240 Vì vậy, chúng tôi đã nói đến api.lib.harvard / edu. 431 00:24:19,240 --> 00:24:20,060 Tìm bánh rán. 432 00:24:20,060 --> 00:24:21,300 Hãy cho chúng tôi 20 hồ sơ. 433 00:24:21,300 --> 00:24:28,590 Và sau đó chạy chức năng này, mà Tôi đã chọn, qua đó các dữ liệu. 434 00:24:28,590 --> 00:24:34,430 Và các dữ liệu là JSON mà đã trở về từ các API. 435 00:24:34,430 --> 00:24:40,120 >> Và sau đó, chúng tôi đang nói, trong đó dữ liệu có là một lĩnh vực được gọi là item. 436 00:24:40,120 --> 00:24:48,117 Và nếu tôi đi tham quan một cái nhìn lại một trong những kết quả đó là ở đây, 437 00:24:48,117 --> 00:24:49,200 có điều gì đó called-- 438 00:24:49,200 --> 00:24:50,220 >> Vâng, nó được gọi là item. 439 00:24:50,220 --> 00:24:53,520 Vì vậy, đó có thể là. 440 00:24:53,520 --> 00:25:01,840 Và những gì nó có phải nó là đi qua mỗi mục 441 00:25:01,840 --> 00:25:05,300 và sau đó gọi một chức năng theo từng hạng mục. 442 00:25:05,300 --> 00:25:08,440 Và chức năng cơ bản được lấy giá trị 443 00:25:08,440 --> 00:25:12,010 của mục, đó là về cơ bản hồ sơ cá nhân 444 00:25:12,010 --> 00:25:18,220 và cho phép chúng ta rút khỏi danh hiệu, vùng phủ sóng và các ngôn ngữ. 445 00:25:18,220 --> 00:25:21,640 >> Vì vậy, chúng tôi gọi một chức năng trên mỗi mục mà chúng tôi nhận lại từ các API. 446 00:25:21,640 --> 00:25:25,397 Và nếu bạn chỉ có một cái nhìn vào tác phẩm này ngay tại đây, 447 00:25:25,397 --> 00:25:27,230 những gì chúng ta đang làm là chúng tôi đang tạo ra một chuỗi, 448 00:25:27,230 --> 00:25:31,810 mà chủ yếu là một số đánh dấu HTML quanh một cái bàn, với value.title, 449 00:25:31,810 --> 00:25:35,790 đó là tiêu đề của đối tượng, value.coverage, 450 00:25:35,790 --> 00:25:36,790 đó là bảo hiểm, - 451 00:25:36,790 --> 00:25:38,225 >> Và chúng tôi đang làm một kiểm tra vào đây để xem ai là không xác định 452 00:25:38,225 --> 00:25:40,570 và ẩn nó nếu nó nói không xác định, bởi vì chúng tôi không thực sự quan tâm 453 00:25:40,570 --> 00:25:41,600 trong đó. 454 00:25:41,600 --> 00:25:42,939 >> --and đó ngôn ngữ. 455 00:25:42,939 --> 00:25:44,730 Và sau đó những gì chúng tôi làm được phụ thêm mà 456 00:25:44,730 --> 00:25:48,510 vào bảng đó là xác định bởi chuỗi này ở đây. 457 00:25:48,510 --> 00:25:50,790 Và làm thế nào jQuery làm việc là điều này được nói 458 00:25:50,790 --> 00:25:56,420 đang tìm kiếm các bảng với ý tưởng kết quả và thêm văn bản này vào nó. 459 00:25:56,420 --> 00:25:59,380 Và đây là bảng với kết quả ý tưởng. 460 00:25:59,380 --> 00:26:04,998 Vì vậy, những gì bạn kết thúc với là trang này ở đây. 461 00:26:04,998 --> 00:26:06,206 Và để xem source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 Vâng, các nguồn không phải là thực sự cập nhật khi điều đó xảy ra. 464 00:26:13,810 --> 00:26:18,740 Vì vậy, bạn có thể thấy thực tế kết quả của bảng ở đây mặc dù. 465 00:26:18,740 --> 00:26:24,770 >> Vì vậy, đó chỉ là một ví dụ đơn giản của làm một truy vấn rất cơ bản đối với các API 466 00:26:24,770 --> 00:26:29,020 và hiển thị các thông tin trong một số khác hình thành, và không phải làm bất cứ điều gì quá lạ mắt. 467 00:26:29,020 --> 00:26:36,370 Bây giờ, một ví dụ khác là giống như một ứng dụng được viết bởi David Weinberger 468 00:26:36,370 --> 00:26:39,120 như một bản demo này, mà cơ bản cho bạn 469 00:26:39,120 --> 00:26:44,620 làm thế nào bạn có thể ngâm lên những kết quả bạn nhận được từ các API thư viện đám mây 470 00:26:44,620 --> 00:26:46,250 với, nói, Google Books. 471 00:26:46,250 --> 00:26:52,225 >> Và những suy nghĩ ở đây là tôi có thể chạy một truy vấn đối với Google Books, 472 00:26:52,225 --> 00:26:56,060 được một tìm kiếm văn bản đầy đủ, nhận được một số kết quả trở lại, tìm ra được những mặt hàng 473 00:26:56,060 --> 00:27:01,180 thực sự tồn tại trong Hollis, hệ thống thư viện, 474 00:27:01,180 --> 00:27:03,200 và sau đó cung cấp cho tôi liên kết trở lại với những mục. 475 00:27:03,200 --> 00:27:12,730 Vì vậy, nếu tôi tìm kiếm, đó là một đêm tối và bão tố, tôi 476 00:27:12,730 --> 00:27:16,210 lấy lại một loạt các kết quả từ Google, và sau đó là một kết quả 477 00:27:16,210 --> 00:27:19,460 đó là A Wrinkle in Time. 478 00:27:19,460 --> 00:27:29,330 Và đây là những liên kết đến các cuốn sách mà tồn tại trong hệ thống thư viện Harvard. 479 00:27:29,330 --> 00:27:32,160 >> Vì vậy, tôi đoán là ở đây không phải là rất nhiều mà điều này có thể hoặc có thể không 480 00:27:32,160 --> 00:27:34,118 là cách mà bạn muốn để tìm kiếm các thư viện, 481 00:27:34,118 --> 00:27:38,310 nhưng nó là hoàn toàn khác nhau Cách đó không phải là có sẵn cho bạn 482 00:27:38,310 --> 00:27:42,884 trước, như bạn không có cách nào làm toàn văn tìm kiếm trên sách mà ngay cả 483 00:27:42,884 --> 00:27:44,550 là một phần của hệ thống Thư Viện Harvard. 484 00:27:44,550 --> 00:27:46,870 Vì vậy, bây giờ điều này là một cách mà bạn có thể làm điều đó. 485 00:27:46,870 --> 00:27:51,930 Và bạn có thể hiển thị chúng trong bất cứ định dạng nào bạn muốn. 486 00:27:51,930 --> 00:27:55,990 Vì vậy, các điểm ở đây là, về cơ bản, chúng tôi đang mở ra những cách thức mới cho người dân 487 00:27:55,990 --> 00:27:59,080 để làm việc với dữ liệu. 488 00:27:59,080 --> 00:28:07,925 >> Một mảnh mây thư viện là nó giúp phơi bày một số các dữ liệu sử dụng 489 00:28:07,925 --> 00:28:08,800 mà thư viện có. 490 00:28:08,800 --> 00:28:12,630 Vì vậy, nếu bạn đi đến thư viện, và bạn đang tìm kiếm sách, 491 00:28:12,630 --> 00:28:15,770 bạn không nhất thiết phải thực sự có một ý tưởng, 492 00:28:15,770 --> 00:28:19,080 cho tất cả các mục trong một vấn đề cụ thể, những gì 493 00:28:19,080 --> 00:28:21,200 những người trong cộng đồng, cho dù đó là 494 00:28:21,200 --> 00:28:24,890 định nghĩa như Harvard hay nước hoặc lớp học của bạn, 495 00:28:24,890 --> 00:28:26,421 những gì có họ tìm thấy hữu ích nhất? 496 00:28:26,421 --> 00:28:28,920 Và thư viện thực sự có một tấn thông tin về những gì 497 00:28:28,920 --> 00:28:32,999 là hữu ích nhất vì nếu nhiều người được kiểm tra ra một cuốn sách, 498 00:28:32,999 --> 00:28:34,040 mà nói với bạn điều gì đó. 499 00:28:34,040 --> 00:28:36,498 Có phải đã có một số lý do họ muốn kiểm tra xem nó ra. 500 00:28:36,498 --> 00:28:38,270 Rất nhiều người đặt nó vào dự trữ. 501 00:28:38,270 --> 00:28:42,520 >> Nếu nó trên danh sách dự phòng cho rất nhiều các lớp học, mà nói với bạn điều gì đó. 502 00:28:42,520 --> 00:28:45,960 Nếu giảng viên đang kiểm tra nó ra rất nhiều và đại học đều không, 503 00:28:45,960 --> 00:28:47,200 mà nói với tôi điều gì đó. 504 00:28:47,200 --> 00:28:49,280 Ngược lại, đó cũng nói với bạn điều gì đó. 505 00:28:49,280 --> 00:28:54,680 Vì vậy, nó sẽ thực sự thú vị đưa thông tin đó ra khỏi đó và để cho 506 00:28:54,680 --> 00:28:59,969 người sử dụng nó để giúp họ tìm làm việc trong hệ thống thư viện. 507 00:28:59,969 --> 00:29:02,260 Phía bên trái của điều này là có một số sự riêng tư nghiêm trọng 508 00:29:02,260 --> 00:29:07,854 mối quan tâm bởi vì một trong những nguyên lý cốt lõi của thư viện 509 00:29:07,854 --> 00:29:10,770 là chúng tôi sẽ không thể nói mọi người những gì người khác đang đọc. 510 00:29:10,770 --> 00:29:17,360 Và thậm chí nếu bạn đang nói đến này Cuốn sách đã được kiểm tra ra bốn lần 511 00:29:17,360 --> 00:29:20,070 trong một tháng cụ thể, mà có thể được sử dụng 512 00:29:20,070 --> 00:29:25,252 liên kết lại với một đặc biệt người bằng dữ liệu de-ẩn danh 513 00:29:25,252 --> 00:29:26,710 và tìm ra những người kiểm tra nó ra. 514 00:29:26,710 --> 00:29:30,792 Vì vậy, cách mà chúng ta có thể avoid-- 515 00:29:30,792 --> 00:29:33,750 Cách mà chúng ta có thể cố gắng để trích xuất một số tín hiệu từ tất cả các thông tin 516 00:29:33,750 --> 00:29:36,740 không xâm phạm mối quan tâm riêng tư của bất cứ ai 517 00:29:36,740 --> 00:29:42,150 về cơ bản là chúng ta nhìn vào 10 năm của dữ liệu sử dụng, - 518 00:29:42,150 --> 00:29:43,930 >> Vì vậy, nó đã qua một thời gian dài. 519 00:29:43,930 --> 00:29:50,639 >> --and nói, OK, chúng ta hãy xem làm thế nào nhiều lần làm việc này đã được sử dụng, 520 00:29:50,639 --> 00:29:52,930 và bởi những người trong giai đoạn này thời gian, và sau đó về cơ bản 521 00:29:52,930 --> 00:29:56,300 trả lại một số, mà chúng ta gọi là một số điểm stack, mà cơ bản 522 00:29:56,300 --> 00:29:59,910 đại diện cho bao nhiêu nó được sử dụng. 523 00:29:59,910 --> 00:30:01,084 Và rằng number-- 524 00:30:01,084 --> 00:30:03,250 Rất nhiều tính toán khác nhau đi vào con số đó. 525 00:30:03,250 --> 00:30:05,150 --but đó là một rất thô số liệu cung cấp cho bạn 526 00:30:05,150 --> 00:30:11,300 một số ý tưởng về cách cộng đồng có giá trị công việc đó. 527 00:30:11,300 --> 00:30:16,772 >> Và như vậy một loại thậm chí nhiều thịt ra khỏi ứng dụng 528 00:30:16,772 --> 00:30:18,480 mà lợi dụng của điều này là một cái gì đó 529 00:30:18,480 --> 00:30:24,000 gọi Stacklife, mà thực sự là có sẵn thông qua các Harvard chính 530 00:30:24,000 --> 00:30:24,880 Cổng thư viện. 531 00:30:24,880 --> 00:30:26,700 Vì vậy, bạn đi đến library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 Bạn sẽ thấy một số lượng khác nhau cách để tìm kiếm thư viện. 533 00:30:29,360 --> 00:30:32,300 Và một trong số họ được gọi là Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> Và đây là một ứng dụng duyệt các nội dung của thư viện, 535 00:30:38,980 --> 00:30:43,490 nhưng hoàn toàn xây dựng trên đầu trang của các API này. 536 00:30:43,490 --> 00:30:46,910 Vì vậy, không có công cụ đặc biệt xảy ra đằng sau hậu trường. 537 00:30:46,910 --> 00:30:49,570 Không có quyền truy cập vào dữ liệu mà bạn không có. 538 00:30:49,570 --> 00:30:54,090 Đó là sử dụng các API để cung cấp cho bạn với một trình duyệt hoàn toàn khác nhau 539 00:30:54,090 --> 00:30:55,480 kinh nghiệm. 540 00:30:55,480 --> 00:30:58,570 >> Vì vậy, nếu tôi tìm kiếm Alice in Wonderland trong trường hợp này, 541 00:30:58,570 --> 00:31:02,600 Tôi có được một kết quả mà trông giống như này, mà là khá much-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> Nó rất giống với bất kỳ tìm kiếm khác bạn có thể làm được, ngoại trừ trong trường hợp này 544 00:31:10,870 --> 00:31:15,730 chúng tôi đang xếp hạng các mục bằng cách stackscore, mang đến cho bạn 545 00:31:15,730 --> 00:31:19,850 một số ý tưởng về cách phổ biến những các mặt hàng đều nằm trong cộng đồng. 546 00:31:19,850 --> 00:31:25,610 Và như vậy rõ ràng, Alice in Wonderland bởi Walt Disney là rất phổ biến. 547 00:31:25,610 --> 00:31:36,570 Nhưng bạn cũng có thể nhìn thấy đỉnh bốn đây là những người bạn có thể không actually-- 548 00:31:36,570 --> 00:31:39,220 >> Những điều đó được đánh giá cao được sử dụng, nhưng bạn có thể không ngay lập tức 549 00:31:39,220 --> 00:31:41,240 kết nối với Alice in Wonderland. 550 00:31:41,240 --> 00:31:44,650 Vì vậy, người bạn cũ của chúng tôi Các Chú thích Alice là ở đây. 551 00:31:44,650 --> 00:31:46,350 Vì vậy, tôi có thể có một cái nhìn vào nó. 552 00:31:46,350 --> 00:31:52,010 Và bây giờ những gì tôi đang tìm kiếm tại về cơ bản là một thiết of-- 553 00:31:52,010 --> 00:31:53,760 Tôi có thể có Các chú thích Alice ở ngay đây. 554 00:31:53,760 --> 00:31:56,700 Tôi có thông tin về nó. 555 00:31:56,700 --> 00:32:00,230 Và tôi cũng có một stackscore của, trong trường hợp này, 26. 556 00:32:00,230 --> 00:32:03,169 Và điều này nói với tôi loại khoảng như thế nào chúng tôi đến stackscore này, 557 00:32:03,169 --> 00:32:05,835 như những người kiểm tra nó ra, như thế nào nhiều lần nó đã được kiểm tra ra, 558 00:32:05,835 --> 00:32:08,440 như giảng viên hay sinh viên làm việc, làm thế nào nhiều bản sao các thư viện có, 559 00:32:08,440 --> 00:32:11,300 vv và vv. 560 00:32:11,300 --> 00:32:16,460 >> Và bạn cũng có thể, đủ thú vị ở đây, trình duyệt các ngăn xếp ảo. 561 00:32:16,460 --> 00:32:19,550 Vì vậy, các dữ liệu ở đây, điều này được hiển thị cho bạn các loại 562 00:32:19,550 --> 00:32:23,547 của một đại diện ảo về những gì sức kệ 563 00:32:23,547 --> 00:32:25,880 trông như thế nào nếu bạn đã có tất cả các cổ phần của thư viện 564 00:32:25,880 --> 00:32:28,940 và đặt chúng lại với nhau trên một kệ vô hạn. 565 00:32:28,940 --> 00:32:30,990 Và điều tuyệt vời là chúng tôi can-- 566 00:32:30,990 --> 00:32:33,380 >> Trước hết, các siêu dữ liệu về những cuốn sách này 567 00:32:33,380 --> 00:32:35,627 thường nói với bạn khi nó được xuất bản. 568 00:32:35,627 --> 00:32:37,085 Nó sẽ cho bạn biết có bao nhiêu trang mà nó có. 569 00:32:37,085 --> 00:32:38,459 Nó có thể cho bạn biết kích thước. 570 00:32:38,459 --> 00:32:42,930 Vì vậy, bạn có thể thấy đó là phản ánh ở đây về kích thước của cuốn sách. 571 00:32:42,930 --> 00:32:46,740 >> Và sau đó chúng ta có thể sử dụng ngăn xếp điểm để làm nổi bật 572 00:32:46,740 --> 00:32:49,170 những cuốn sách mà có điểm số cao hơn chồng. 573 00:32:49,170 --> 00:32:54,930 Vì vậy, nếu nó tối hơn, nó có nghĩa là, có lẽ, nó được sử dụng thường xuyên hơn. 574 00:32:54,930 --> 00:32:57,040 Vì vậy, trong trường hợp này, tôi sẽ đoán rằng điều này 575 00:32:57,040 --> 00:33:03,226 là phiên bản của Alice in Wonderland đó là rất thường được sử dụng và hầu hết 576 00:33:03,226 --> 00:33:05,100 truy cập, thư viện có nhiều bản sao. 577 00:33:05,100 --> 00:33:06,975 Vì vậy, nếu bạn đang tìm kiếm Alice in Wonderland, 578 00:33:06,975 --> 00:33:10,220 này có thể là một nơi tốt để bắt đầu. 579 00:33:10,220 --> 00:33:13,500 >> Và sau đó ở đây bạn cũng có thể liên kết ra để, nói, Amazon để mua sách, 580 00:33:13,500 --> 00:33:15,182 vv và vv. 581 00:33:15,182 --> 00:33:17,140 Vấn đề ở đây, một lần nữa, là không quá nhiều mà này 582 00:33:17,140 --> 00:33:25,030 là cách tốt nhất để duyệt thư viện hoặc các công cụ thích hợp cho mỗi dịp. 583 00:33:25,030 --> 00:33:28,400 Nhưng đó là một cách khác để làm việc đó. 584 00:33:28,400 --> 00:33:31,359 Và bằng cách làm cho các dữ liệu có sẵn thông qua một API, mà 585 00:33:31,359 --> 00:33:34,650 được làm từ những khối xây dựng rất đơn giản, mà cho phép bạn tìm kiếm nội dung, 586 00:33:34,650 --> 00:33:39,420 bạn có thể xây dựng một cái gì đó như thế này mà có thể 587 00:33:39,420 --> 00:33:41,520 có đột có giá trị cho một số người. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> Vì vậy, đó là sắp xếp của, nhiều như tôi muốn nói thật về những gì các API là 590 00:33:51,860 --> 00:33:56,070 và những gì nó cho thấy, có một toàn bộ loạt các công cụ phía sau hậu trường, trong đó 591 00:33:56,070 --> 00:33:59,480 Tôi chỉ cần đi để chạm vào một thời gian ngắn chỉ vì nó loại đi kèm này 592 00:33:59,480 --> 00:34:03,720 từ một góc độ hoàn toàn khác nhau trong về cách làm một cái gì đó như thế này 593 00:34:03,720 --> 00:34:04,580 được đặt vào đúng vị trí? 594 00:34:04,580 --> 00:34:10,820 >> Vì vậy, một API là một tiêu chuẩn giao diện cho tất cả các nội dung này. 595 00:34:10,820 --> 00:34:13,820 Nhưng để có được nó ở đó, các Điều đầu tiên chúng tôi phải làm 596 00:34:13,820 --> 00:34:17,260 đã kéo nhau thông tin sách và hình ảnh 597 00:34:17,260 --> 00:34:21,580 và trợ việc tìm kiếm, thu thập tài liệu từ các hệ thống khác nhau Harvard. 598 00:34:21,580 --> 00:34:23,929 Aleph, VIA, và OASIS là tên của các hệ thống. 599 00:34:23,929 --> 00:34:28,820 Và họ chủ yếu đi vào một đường ống, đường ống xử lý. 600 00:34:28,820 --> 00:34:33,230 >> Vì vậy, trước hết, chúng ta có được xuất khẩu tập tin từ tất cả các hệ thống này. 601 00:34:33,230 --> 00:34:35,130 Chúng tôi chia chúng ra thành từng hạng mục. 602 00:34:35,130 --> 00:34:39,360 Vì vậy, chúng tôi có một tập tin, mà là một gigabyte, trong đó có một triệu bản ghi trong đó. 603 00:34:39,360 --> 00:34:42,290 Vì vậy, chúng tôi chia nó ra thành từng hạng mục. 604 00:34:42,290 --> 00:34:45,374 Sau đó, cho mỗi mục, chúng tôi chuyển đổi nó vào MODS, bởi vì một số trong những 605 00:34:45,374 --> 00:34:47,040 MODS là nguyên bản, một số trong số họ không. 606 00:34:47,040 --> 00:34:49,204 Vì vậy, chúng tôi nhận được tất cả để được định dạng tương tự. 607 00:34:49,204 --> 00:34:51,120 Sau đó, có khác nhau bước làm giàu, nơi 608 00:34:51,120 --> 00:34:55,969 chúng tôi thêm thông tin vào dữ liệu hơn là có sẵn trong thư viện. 609 00:34:55,969 --> 00:34:59,750 Vì vậy, chúng ta cần thêm, đầu tiên của tất cả các chúng tôi có những gì thư viện giữ nó. 610 00:34:59,750 --> 00:35:02,250 Chúng tôi đi qua một bước tính stackscore. 611 00:35:02,250 --> 00:35:07,112 Chúng tôi đi qua một bước bổ sung thêm siêu dữ liệu về 612 00:35:07,112 --> 00:35:10,730 bộ sưu tập của những gì mọi người có thể có thêm this-- 613 00:35:10,730 --> 00:35:12,532 >> Mọi người đang tạo bộ sưu tập của các mục. 614 00:35:12,532 --> 00:35:13,990 Những gì bộ sưu tập nào đó thuộc về? 615 00:35:13,990 --> 00:35:17,220 Làm thế nào có người được gắn thẻ nội dung này trong quá khứ? 616 00:35:17,220 --> 00:35:20,750 Sau đó, bạn lọc ra, và bạn hạn chế các hồ sơ, vì như tôi đã đề cập, 617 00:35:20,750 --> 00:35:24,120 có một số hồ sơ đó, vì lý do bản quyền, chúng tôi không thể hiển thị. 618 00:35:24,120 --> 00:35:26,700 Và sau đó chúng tôi nạp cho họ vào một cái gì đó gọi là 619 00:35:26,700 --> 00:35:31,680 Solr, đó không phải là một lỗi chính tả, nhưng là tên của một phần của phần mềm 620 00:35:31,680 --> 00:35:35,710 mà không lập chỉ mục tìm kiếm, hướng tất cả tìm kiếm phía sau API. 621 00:35:35,710 --> 00:35:40,110 Và sau đó nó trở nên có sẵn để các API, và mọi người có thể sử dụng nó. 622 00:35:40,110 --> 00:35:44,640 >> Vì vậy, điều này giống như một khá quá trình đơn giản. 623 00:35:44,640 --> 00:35:47,230 Một trong những thú vị thứ về nó là 624 00:35:47,230 --> 00:35:50,990 rằng chúng ta đang đối phó với 13 triệu bản 625 00:35:50,990 --> 00:35:53,820 và chúng ta sẽ được giao dịch trở lên. 626 00:35:53,820 --> 00:36:01,260 Và chúng tôi muốn để có thể xử lý này trong một thời trang tương đối nhanh. 627 00:36:01,260 --> 00:36:03,630 Phải mất một thời gian dài để xử lý 13 triệu hồ sơ. 628 00:36:03,630 --> 00:36:09,529 >> Vậy làm thế nào đường ống này là thiết lập là bạn can-- 629 00:36:09,529 --> 00:36:12,070 Tôi đoán các lợi thế của đường ống dẫn, các vấn đề mà chúng tôi 630 00:36:12,070 --> 00:36:15,580 cố gắng giải quyết ở đây, là tất cả các biến đổi, tất cả 631 00:36:15,580 --> 00:36:18,729 các bước trong này đường ống được phân chia. 632 00:36:18,729 --> 00:36:19,645 Không có phụ thuộc. 633 00:36:19,645 --> 00:36:22,146 Nếu bạn đang xử lý một kỷ lục của một cuốn sách, 634 00:36:22,146 --> 00:36:24,270 không có sự phụ thuộc vào rằng giữa cuốn sách khác. 635 00:36:24,270 --> 00:36:27,760 >> Vì vậy, những gì chúng ta có thể làm là về cơ bản, ở mỗi bước trong các đường ống, 636 00:36:27,760 --> 00:36:30,470 chúng ta đặt nó vào một hàng đợi trong các đám mây. 637 00:36:30,470 --> 00:36:32,250 Tôi tình cờ được trên Amazon Web Services. 638 00:36:32,250 --> 00:36:35,140 Vì vậy, có một danh sách, nói, 10.000 mặt hàng đó 639 00:36:35,140 --> 00:36:38,100 cần phải được chuẩn hóa và chuyển đổi sang định dạng MODS. 640 00:36:38,100 --> 00:36:41,620 Và chúng tôi quay lên như nhiều máy chủ như chúng ta muốn, có lẽ 10 máy chủ. 641 00:36:41,620 --> 00:36:44,860 Và mỗi người trong những máy chủ chỉ ngồi ở đó, trông đợi rằng, 642 00:36:44,860 --> 00:36:46,730 thấy rằng có một cần được xử lý, kéo nó ra khỏi hàng đợi, 643 00:36:46,730 --> 00:36:48,740 xử lý nó, và gậy nó vào hàng đợi tới. 644 00:36:48,740 --> 00:36:54,200 >> Và vì vậy những gì cho phép chúng tôi để làm được áp dụng, về cơ bản, 645 00:36:54,200 --> 00:36:58,110 càng nhiều phần cứng như chúng ta muốn này vấn đề trong một thời gian rất ngắn thời gian 646 00:36:58,110 --> 00:37:02,970 để xử lý các dữ liệu một cách nhanh chóng như có thể, đó là một cái gì đó mà chỉ, 647 00:37:02,970 --> 00:37:08,220 Hiện tại trong thế giới của điện toán đám mây chúng tôi có thể cung cấp các máy chủ cơ bản 648 00:37:08,220 --> 00:37:09,890 ngay lập tức, đó là hữu ích. 649 00:37:09,890 --> 00:37:12,260 Vì vậy, chúng tôi không cần phải có một máy chủ khổng lồ ngồi xung quanh 650 00:37:12,260 --> 00:37:16,700 tất cả các thời gian để làm việc xử lý có thể xảy ra chỉ một lần một tuần. 651 00:37:16,700 --> 00:37:21,440 >> Vì vậy, mà chủ yếu là nó. 652 00:37:21,440 --> 00:37:27,590 Có tài liệu hướng dẫn có sẵn cho Thư viện Mây mục API 653 00:37:27,590 --> 00:37:31,960 tại URL này, mà sẽ có sau này. 654 00:37:31,960 --> 00:37:36,730 Và xin hãy xem qua nó để xem nếu có bất cứ điều gì, 655 00:37:36,730 --> 00:37:37,579 bạn có bất kỳ ý tưởng. 656 00:37:37,579 --> 00:37:38,120 Chơi với nó. 657 00:37:38,120 --> 00:37:38,830 Đánh lừa xung quanh. 658 00:37:38,830 --> 00:37:42,800 Và hy vọng bạn có thể đến lên với một cái gì đó tuyệt vời. 659 00:37:42,800 --> 00:37:44,740 Cám ơn. 660 00:37:44,740 --> 00:37:45,899