1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 JEFFREY LICHT:こんにちは。 3 00:00:12,370 --> 00:00:13,550 私はジェフリーリヒトだ。 4 00:00:13,550 --> 00:00:17,890 そして、私はあなたに話をここにいる ハーバード大学図書館と建物明日の 5 00:00:17,890 --> 00:00:20,870 図書館今日、私は推測する。 6 00:00:20,870 --> 00:00:23,040 だからここ背景、 このセッションのピッチ 7 00:00:23,040 --> 00:00:26,930 本質的に存在することである 書誌データの多く 8 00:00:26,930 --> 00:00:28,400 ハーバードライブラリで利用できる。 9 00:00:28,400 --> 00:00:33,434 そして機会がある、 いくつかのツールを通じて 10 00:00:33,434 --> 00:00:36,350 と開発されているだプロジェクト、 情報へのアクセスを取得する 11 00:00:36,350 --> 00:00:42,430 や場所にそれを取る ハーバード大学図書館は、今はやっていません 12 00:00:42,430 --> 00:00:45,460 それで新しいものを行う、実験 そしてそれで遊んで。 13 00:00:45,460 --> 00:00:52,413 >> したがって、このへのエントリポイントは、APIである ハーバード大学図書館クラウド、と呼ばれる 14 00:00:52,413 --> 00:00:57,650 オープンメタデータサーバは、 その私が今について話します。 15 00:00:57,650 --> 00:01:02,595 そのように背景が存在することである ハーバードライブラリ内の多くのもの。 16 00:01:02,595 --> 00:01:07,150 私たちは、1300万の書誌を持っている レコードは、画像の何百万、 17 00:01:07,150 --> 00:01:11,090 とエイズを見つけるの数千、その 本質的に記述した文書である 18 00:01:11,090 --> 00:01:15,500 何を言ってコレクション、 論文の箱、その中にある 19 00:01:15,500 --> 00:01:21,080 などを介して表現すること 万人個々のドキュメント。 20 00:01:21,080 --> 00:01:24,290 そして、多くのもあります ライブラリが持っている情報 21 00:01:24,290 --> 00:01:28,180 コンテンツが使用されることについての方法 人々に興味がある可能性があり 22 00:01:28,180 --> 00:01:32,400 誰がそれで作業したい場合があります。 23 00:01:32,400 --> 00:01:36,150 >> だから、情報のすべて ライブラリーは、メタデータを有している。 24 00:01:36,150 --> 00:01:39,500 そのように、メタデータは、データに関するデータである。 25 00:01:39,500 --> 00:01:42,070 だから我々はについて話すとき さんについて 26 00:01:42,070 --> 00:01:44,890 図書館を通じて利用可能 利用できるのクラウド、 27 00:01:44,890 --> 00:01:47,760 それは必ずしもありません 実際のドキュメント 28 00:01:47,760 --> 00:01:53,060 自分自身、必ずしも完全ではない 本やフル画像のテキスト、 29 00:01:53,060 --> 00:01:54,890 そのかかわらず、実際に場合もある。 30 00:01:54,890 --> 00:01:57,550 しかし、それは本当にです データに関する情報。 31 00:01:57,550 --> 00:02:00,909 >> だから、カタログ作成を考えることができます 情報、コール番号、科目、 32 00:02:00,909 --> 00:02:02,700 どのように多くのコピー 著書があり、どのような 33 00:02:02,700 --> 00:02:06,380 エディションは何であり、 フォーマットは、著者等である。 34 00:02:06,380 --> 00:02:12,250 だからに関する多くの情報があります そのコレクション内の情報、 35 00:02:12,250 --> 00:02:14,400 それ自体が、一種の本質的に有用です。 36 00:02:14,400 --> 00:02:19,230 そして、あなたがしている場合でも 綿密な研究をして、 37 00:02:19,230 --> 00:02:25,160 あなたは明らかに実際に取得したい コンテンツ自体のデータを見て、 38 00:02:25,160 --> 00:02:30,140 メタデータは、の点で便利です 両方の全体としてのコーパスを分析し、 39 00:02:30,140 --> 00:02:33,870 のようなコレクションにどのようなものです。 40 00:02:33,870 --> 00:02:35,520 彼らはどのように関連していますか? 41 00:02:35,520 --> 00:02:39,482 それは、あなたが本当に他のものを見つけることができます その実際にそれの主な目的である。 42 00:02:39,482 --> 00:02:41,190 のポイント メタデータとカタログ 43 00:02:41,190 --> 00:02:43,230 あなたはすべてを見つける手助けをすることです さんについて 44 00:02:43,230 --> 00:02:46,590 コレクション内で利用可能。 45 00:02:46,590 --> 00:02:53,690 >> だから、これはメタデータの例です。 ハーバード図書館での本のために。 46 00:02:53,690 --> 00:02:56,370 だから、そこだ。 47 00:02:56,370 --> 00:02:59,850 そして、あなたはそれがだ見ることができます 実際に適度に複雑な。 48 00:02:59,850 --> 00:03:04,610 とメタデータの値の一部 ハーバード図書館システム内 49 00:03:04,610 --> 00:03:09,320 それがソートされてということです の目録により構築 50 00:03:09,320 --> 00:03:12,720 そして適用する人々によって組み立て 専門知識とスキルの多く 51 00:03:12,720 --> 00:03:20,030 そして、時間をかけてそれを考え その値をたくさん持っている。 52 00:03:20,030 --> 00:03:25,450 >> だから、あなたはこのレコードを見ると 注釈付きアリスは、あなたが見つけることができます 53 00:03:25,450 --> 00:03:32,590 あなたはそれを書いたタイトル、持っている 著者、およびすべての異なる被験者 54 00:03:32,590 --> 00:03:35,380 その人々がにそれをカタログ化している。 55 00:03:35,380 --> 00:03:40,110 そして、あなたはで、またあります見ることができます 良い多くの情報に加えて、 56 00:03:40,110 --> 00:03:42,852 ここでは、いくつかの重複があります。 57 00:03:42,852 --> 00:03:45,560 の複雑さがたくさんあり​​ます メタデータを介して反射した 58 00:03:45,560 --> 00:03:46,300 あなたが持っていること。 59 00:03:46,300 --> 00:03:50,320 >> だから、この本の1タイトルです 不思議の国のアリス。 60 00:03:50,320 --> 00:03:53,880 だから、これは注釈が付けられて その本のバージョン。 61 00:03:53,880 --> 00:03:56,380 しかし、それはまた、注釈付きを呼ばれています アリス、不思議の国のアリス 62 00:03:56,380 --> 00:03:58,570 不思議の理由 それはその何か 63 00:03:58,570 --> 00:04:00,430 マーティン·ガードナーは書い と本を注釈付き。 64 00:04:00,430 --> 00:04:03,369 そして、偉大な多くの情報があります ロジックパズルや物事について 65 00:04:03,369 --> 00:04:05,410 アリス以内にあなたのこと おそらく知らなかった。 66 00:04:05,410 --> 00:04:07,000 だから、それを読んで行く必要があります。 67 00:04:07,000 --> 00:04:11,940 >> しかし、あなたはあります見ることができます ここでは詳細の多くは、 68 00:04:11,940 --> 00:04:15,340 ときに、識別子を含む それはどこから来たのか、作成された、 69 00:04:15,340 --> 00:04:17,420 ハーバードの面で システム、など。 70 00:04:17,420 --> 00:04:20,350 だから、これはサンプルです。 メタデータの種類 71 00:04:20,350 --> 00:04:24,340 あなたは本の中のために表示される場合がありますことを ハーバード図書館コレクション。 72 00:04:24,340 --> 00:04:26,680 >> これは完全に異なるものです。 73 00:04:26,680 --> 00:04:32,610 だからと呼ばれるシステムがあります VIAハーバード、基本的にその 74 00:04:32,610 --> 00:04:39,990 画像やアートのオブジェクトをカタログされている とハーバード大学全体の視覚的なもの、 75 00:04:39,990 --> 00:04:44,010 そして、いくつかのメタデータを追加 彼らに、それらを分類し、 76 00:04:44,010 --> 00:04:49,200 そして、場合によっては、提供 小さなサムネイル画像 77 00:04:49,200 --> 00:04:51,250 あなたが取ることができる あなたがそうしたい場合を見てください。 78 00:04:51,250 --> 00:04:54,240 >> だから、これは一例です プレートのためのあなたが持っているメタデータ 79 00:04:54,240 --> 00:04:57,840 おそらく、から、不思議の国のアリス。 80 00:04:57,840 --> 00:05:00,499 そして、あなたはあります見ることができます ここに少ないメタデータ。 81 00:05:00,499 --> 00:05:02,040 これは、オブジェクトのだけ異なるようなものだ。 82 00:05:02,040 --> 00:05:03,425 だから少ない情報があります。 83 00:05:03,425 --> 00:05:07,790 >> あなたは主に呼び出し、その事実を持っている 数、本質的にそれを作成し、 - 84 00:05:07,790 --> 00:05:10,410 >> それが作成されたときに私たちは知りません。 85 00:05:10,410 --> 00:05:13,320 >> タイトルを - そして。 86 00:05:13,320 --> 00:05:14,300 >> 別の例。 87 00:05:14,300 --> 00:05:16,380 これは発見の援助である。 88 00:05:16,380 --> 00:05:19,030 だから、ルイスのコレクションがあります ハーバード大学のキャロルの論文。 89 00:05:19,030 --> 00:05:23,601 だから、これは何を記述 そのコレクションである。 90 00:05:23,601 --> 00:05:26,100 だから、誰かが経験してきたと すべてのボックスを通して見えた 91 00:05:26,100 --> 00:05:32,220 そして、いくつかの背景を考えると、それをカタログ ここに何の要約を書かれた。 92 00:05:32,220 --> 00:05:35,290 そして、あなたが見ていた場合、 さらにこの時、この 93 00:05:35,290 --> 00:05:39,620 ページとページのために行く とページは、しかし、あなたを教えてくれます 94 00:05:39,620 --> 00:05:41,860 何文字と何 何のボックスから日付 95 00:05:41,860 --> 00:05:44,289 コレクション全体に存在していた。 96 00:05:44,289 --> 00:05:46,330 しかし、これは何かある あなたはハーバード大学にいる場合には、その、 97 00:05:46,330 --> 00:05:50,720 あなたが行くと、実際に物理的に見ることができる UPと、おそらく、見てみましょう。 98 00:05:50,720 --> 00:05:53,440 >> だから、これはすべて素晴らしいです。 99 00:05:53,440 --> 00:05:54,450 このメタデータの便利。 100 00:05:54,450 --> 00:05:56,327 これは、ハーバード大学図書館システムにあります。 101 00:05:56,327 --> 00:05:58,910 ツールは、あなたがどこに来店中です 移動し、それを見てみることができ、 102 00:05:58,910 --> 00:05:59,993 そしてそれを見て、それを検索します。 103 00:05:59,993 --> 00:06:02,810 そして、あなたはそれをスライスし、サイコロができます それさまざまな方法で。 104 00:06:02,810 --> 00:06:06,920 >> しかし、もしそれが本当にのみ利用可能だ あなたは人間座っている 105 00:06:06,920 --> 00:06:12,600 ウェブブラウザか何かで、または お使いの携帯電話とそれをナビゲート。 106 00:06:12,600 --> 00:06:16,730 それは、本当に利用できない 使用可能なファッションの任意の種類 107 00:06:16,730 --> 00:06:19,520 他のシステムのために、または 使用するには、他のコンピュータ、 108 00:06:19,520 --> 00:06:21,500 しない内システムとの ハーバード大学図書館、 109 00:06:21,500 --> 00:06:24,890 外の世界ではなくシステム、 一般的にはちょうど他の人々。 110 00:06:24,890 --> 00:06:30,210 そこで問題は、どのように我々はできる、である コンピューターが利用できるようにする 111 00:06:30,210 --> 00:06:33,560 私たちはもっと面白いを行うことができますので、 単なるそれともの 112 00:06:33,560 --> 00:06:36,550 それを自分自身を閲覧? 113 00:06:36,550 --> 00:06:39,766 >> では、なぜあなたはこれをしたいのでしょうか? 114 00:06:39,766 --> 00:06:41,140 多くの可能性があります。 115 00:06:41,140 --> 00:06:43,980 一つは、あなたが完全に構築することができている ブラウジングの異なる方法 116 00:06:43,980 --> 00:06:46,962 利用できるの内容 ハーバード大学図書館を通して。 117 00:06:46,962 --> 00:06:48,670 私はあなたに1つを紹介します 後でStacklifeと呼ばれる、 118 00:06:48,670 --> 00:06:52,440 完全に異なるを有する コンテンツ探しに取る。 119 00:06:52,440 --> 00:06:54,560 >> あなたは、推奨エンジンを構築することができます。 120 00:06:54,560 --> 00:06:57,955 だから、ハーバード大学図書館ではありません と言うのビジネスは、あなたはこの本が好きです。 121 00:06:57,955 --> 00:07:01,080 そして、これらの17他のを見て行く あなたが興味があるかもしれない図書 122 00:07:01,080 --> 00:07:03,200 またはこれらの18他の画像。 123 00:07:03,200 --> 00:07:06,040 しかし、それは確かに可能性 貴重な特徴である。 124 00:07:06,040 --> 00:07:09,272 とメタデータを考えると、それはかもしれない 一緒にそれを置くことが可能である。 125 00:07:09,272 --> 00:07:11,980 あなたにはさまざまなニーズを持っているかもしれません コンテンツを検索する観点から、 126 00:07:11,980 --> 00:07:16,200 多分そのツールにもかかわらず、のような 図書館が行う利用可能です 127 00:07:16,200 --> 00:07:18,450 利用可能な、あなたがお勧めします 別の方法で検索する 128 00:07:18,450 --> 00:07:21,847 または特定のユースケースのために最適化し、 これ多分それは非常に特殊です。 129 00:07:21,847 --> 00:07:23,930 たぶん、わずか数がある 世界の人々誰 130 00:07:23,930 --> 00:07:25,846 コンテンツを検索する このように、それ 131 00:07:25,846 --> 00:07:28,985 我々あれば素晴らしいことだ 彼らがそれをやらせることができます。 132 00:07:28,985 --> 00:07:30,860 分析がたくさんあり​​ます どれだけの人で 133 00:07:30,860 --> 00:07:33,860 実際になるコンテンツを使用 見つける、知っているのは興味深い 134 00:07:33,860 --> 00:07:37,280 何本使用されている、 何ではない、など。 135 00:07:37,280 --> 00:07:41,670 そして、たくさんのがあります 統合する機会 136 00:07:41,670 --> 00:07:45,210 他の情報と それはそこにウェブ上です。 137 00:07:45,210 --> 00:07:46,880 だから我々はhave-- 138 00:07:46,880 --> 00:07:50,260 >> 例えば、NPRはあります 書評セグメント、 139 00:07:50,260 --> 00:07:53,090 どこにインタビュー 書籍に関する作者。 140 00:07:53,090 --> 00:07:56,837 あなたがいた場合、そしてそれは素晴らしいことだ ハーバード大学で本を検索する 141 00:07:56,837 --> 00:07:59,670 図書館、あなたが言う、OK、あります 著者とのインタビューされて。 142 00:07:59,670 --> 00:08:00,878 それではそのを見て行きましょう。 143 00:08:00,878 --> 00:08:05,461 またはWikipediaのページのように、あります 権威ある学術参照 144 00:08:05,461 --> 00:08:07,710 あなたこの本について を見てみることをお勧めします。 145 00:08:07,710 --> 00:08:12,600 >> 情報源のこれらの種類があります。 ウェブ全体に散在。 146 00:08:12,600 --> 00:08:16,555 そして、それらを一緒に持参 偉大な使用の可能性 147 00:08:16,555 --> 00:08:18,930 誰かに見て 内容は、何かを探して。 148 00:08:18,930 --> 00:08:20,180 しかし、それもありません ものの種類あなたがしたい 149 00:08:20,180 --> 00:08:23,205 ライブラリは責任になりたい 下って行くと追い詰めるために 150 00:08:23,205 --> 00:08:25,455 すべてのこれらの異なるソース それらを一緒に差し込む 151 00:08:25,455 --> 00:08:28,920 彼らは連続的に変化しているので。 152 00:08:28,920 --> 00:08:33,570 そして、彼らが考えることが重要おそれがある あなたが重要と思われるものではない。 153 00:08:33,570 --> 00:08:36,929 >> そして、それ以上に、基本的にあります 我々はまだ考えていないものがたくさん。 154 00:08:36,929 --> 00:08:42,222 だから、我々はこれを開くことができれば、より多くの 半ダースほどの他に人、 155 00:08:42,222 --> 00:08:45,174 誰にこのを見ている アイデアを考えることができ、定期的 156 00:08:45,174 --> 00:08:47,340 そして、データをマッサージし 彼らはそれでやりたい。 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> だから我々はこれを作りたい 世界に利用可能なデータ。 159 00:08:54,045 --> 00:08:55,670 さて、カップルの合併症があります。 160 00:08:55,670 --> 00:08:58,540 一つは、このメタデータです 異なるシステムである。 161 00:08:58,540 --> 00:09:01,110 これは、異なる形式でだ。 162 00:09:01,110 --> 00:09:04,719 だから、いくつかの正規化があります 発生する必要がある、 163 00:09:04,719 --> 00:09:08,010 その正規化の過程であること 異なるフォーマットから物事をもたらす 164 00:09:08,010 --> 00:09:12,940 単一のフォーマットにマッピング フィールドが一致するように、。 165 00:09:12,940 --> 00:09:15,160 >> いくつかの著作権の制限があります。 166 00:09:15,160 --> 00:09:21,010 奇妙なことに、カタログエントリ 本について、著作権のために責任を負う。 167 00:09:21,010 --> 00:09:24,060 だから、それだけだにもかかわらず、 本から得られた情報、 168 00:09:24,060 --> 00:09:25,330 それが著作権です。 169 00:09:25,330 --> 00:09:28,400 そして、実際に誰に応じて、 そのメタデータを作成し、 170 00:09:28,400 --> 00:09:32,175 に制限があるかもしれ それを配布することができ、同じようなto-- 171 00:09:32,175 --> 00:09:33,402 >> 私は知らない。 172 00:09:33,402 --> 00:09:36,110 それは、月かに似てないかもしれない 歌の歌詞の状況、 173 00:09:36,110 --> 00:09:36,610 例えば。 174 00:09:36,610 --> 00:09:38,560 だから我々はすべてそれが出てパン方法を知っている。 175 00:09:38,560 --> 00:09:40,450 だから、その問題を回避する必要があります。 176 00:09:40,450 --> 00:09:44,910 >> そして、もう一つの作品です 大量のデータがあることを。 177 00:09:44,910 --> 00:09:52,420 私は仕事したい人だのであれば データを持つか、クールなアイデアを持って、 178 00:09:52,420 --> 00:09:55,350 1400万を扱う 私のラップトップ上のレコード 179 00:09:55,350 --> 00:09:57,487 問題が発生する可能性が と管理が困難。 180 00:09:57,487 --> 00:09:59,320 だから我々は削減したい 人々のための障壁 181 00:09:59,320 --> 00:10:02,130 データを操作できるようにする。 182 00:10:02,130 --> 00:10:07,880 >> だから、アプローチはうまくいけばアドレス これらの問題の全ては、2つの部分である。 183 00:10:07,880 --> 00:10:11,770 一つは、かかるプラットフォームを構築しています すべてのこれらの異なるソースからのデータ 184 00:10:11,770 --> 00:10:14,350 そして、正規化し、それを悪化させる それを豊かに、そしてなります 185 00:10:14,350 --> 00:10:16,650 それつの場所で利用できる。 186 00:10:16,650 --> 00:10:20,950 そして、それはを通してそれを利用可能に 人々が呼び出すことができるパブリックAPI。 187 00:10:20,950 --> 00:10:24,430 >> だから、APIはアプリケーションである プログラミングインタフェース。 188 00:10:24,430 --> 00:10:28,930 そして、それは基本的に指し エンドポイントシステムや技術 189 00:10:28,930 --> 00:10:31,720 電話して、データを取り戻すことができます な方法で構造化されたフォーマット 190 00:10:31,720 --> 00:10:32,900 それは使用することができる。 191 00:10:32,900 --> 00:10:36,060 だから、依存ではありません ウェブサイトに行くに 192 00:10:36,060 --> 00:10:37,970 オフデータをこする 例えば、それは。 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> だから、これはのホームページです ライブラリクラウドアイテムAPI、 195 00:10:45,010 --> 00:10:47,220 本質的にそのバージョン2です。 196 00:10:47,220 --> 00:10:50,130 だから、の2回目の繰り返しだ このデータのすべてをしようとし 197 00:10:50,130 --> 00:10:53,280 世界に利用できる。 198 00:10:53,280 --> 00:10:59,560 だから、だ http://api.lib.harvard.edu/v2/items。 199 00:10:59,560 --> 00:11:03,830 そして、ちょうどこれを打破する これが何を意味するのか、少し、 200 00:11:03,830 --> 00:11:06,115 これはAPIのバージョン2であるということである。 201 00:11:06,115 --> 00:11:08,490 バージョン1は、あります 私はについて話をするつもりはありません。 202 00:11:08,490 --> 00:11:09,750 しかし、バージョン1があります。 203 00:11:09,750 --> 00:11:14,740 >> そして、あなたがこれを呼び出している場合は、 APIは、あなたがアイテムを得ている。 204 00:11:14,740 --> 00:11:20,640 との考え方の一部 APIは契約であるAPIです。 205 00:11:20,640 --> 00:11:23,440 それはあるものだ 変更するつもりはない。 206 00:11:23,440 --> 00:11:24,850 例えばそう、 - 207 00:11:24,850 --> 00:11:27,410 >> そして、その理由は、もし私がいることである システムのいくつかの種類を構築すること 208 00:11:27,410 --> 00:11:33,210 ライブラリクラウドAPIを使用しようとしている 本を表示したり、人々が見つけるのを助けるために 209 00:11:33,210 --> 00:11:36,190 ユニークな方法で情報、 我々が起こることをしたくないものを 210 00:11:36,190 --> 00:11:38,940 私たちはどのように変化しに行くためのものです そのAPIが働き、突然 211 00:11:38,940 --> 00:11:41,340 すべてが、エンドユーザ側で壊れる。 212 00:11:41,340 --> 00:11:46,710 あなたはAPIを作っている場合、のだから、一部 世界に利用できる、それはだ 213 00:11:46,710 --> 00:11:49,396 置くことをお勧め 人々ので、バージョン番号 214 00:11:49,396 --> 00:11:51,020 彼らが扱っているバージョンを知っている。 215 00:11:51,020 --> 00:11:54,300 >> 私たちが決めるのであれば私たちはより良い方法を見つける この情報を使用可能にする、 216 00:11:54,300 --> 00:11:57,295 我々はにそれを変更する場合があります そのバージョン3を呼び出します。 217 00:11:57,295 --> 00:11:59,920 まだ使用しているので、誰も バージョン2、それはまだ動作します。 218 00:11:59,920 --> 00:12:03,490 しかし、バージョンは3でしょう すべての新しいものを持っている。 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> これは、これはAPIであるが、 本当にURLのように見えます。 221 00:12:09,210 --> 00:12:11,680 だから何これは の例は何です 222 00:12:11,680 --> 00:12:16,615 使用可能な残りのAPIを、と呼ばれる ただ、通常のウェブ接続を介して。 223 00:12:16,615 --> 00:12:19,680 そして、あなたが実際にすることができます ブラウザでアクセスしてください。 224 00:12:19,680 --> 00:12:28,550 >> だからここに私はちょうどFirefoxを開けたし、 api.lib.harvard.edu/v2/itemsに行って。 225 00:12:28,550 --> 00:12:31,560 だから私はここに来ることはある 基本的には最初のページ 226 00:12:31,560 --> 00:12:34,740 全体の結果の 私たちが持っているアイテムのセット。 227 00:12:34,740 --> 00:12:37,460 そして、それは、XML形式でここに。 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 そしてそれはまたしてだ Firefoxが清書。 230 00:12:42,210 --> 00:12:45,850 これは、実際にこれらのすべてを持っていない 少し伸縮 231 00:12:45,850 --> 00:12:47,880 ここにdoohickeys。 232 00:12:47,880 --> 00:12:52,520 これはよりよいの一種である バージョンの方法は、それを見て。 233 00:12:52,520 --> 00:12:57,040 >> しかし、これは私たちに言っていることです。 私はすべての項目を要求してきた。 234 00:12:57,040 --> 00:13:03,120 だから、13289475項目があります。 235 00:13:03,120 --> 00:13:06,150 そして、私は最初は探しています 10、位置ゼロから始まる 236 00:13:06,150 --> 00:13:09,760 コンピュータサイエンスのため 我々は常にゼロから始まります。 237 00:13:09,760 --> 00:13:15,150 そして、私はちょうど崩壊した場合、私は、ここに持っているもの これが、私は10アイテムを持って表示されます。 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> 私はアイテムを見ると、私はすることができます 私はそれについての情報を持っていることがわかります。 240 00:13:25,210 --> 00:13:27,400 そして、これはMODSフォームと呼ばれるものである。 241 00:13:27,400 --> 00:13:30,860 そして私は切り替えるつもりだ ここに戻って一瞬。 242 00:13:30,860 --> 00:13:33,750 OK。 243 00:13:33,750 --> 00:13:37,447 >> それでは、で何かを検索してみましょう その最初の項目のための特定 244 00:13:37,447 --> 00:13:40,030 あなたが見たときに出てくることを起こる コレクション全体を 245 00:13:40,030 --> 00:13:41,750 ランダム、定義により、である。 246 00:13:41,750 --> 00:13:44,550 それでは、いくつかのドーナツを探してみましょう。 247 00:13:44,550 --> 00:13:46,830 ああ。 248 00:13:46,830 --> 00:13:49,190 >> OK。 249 00:13:49,190 --> 00:13:49,940 だから、ドーナツ。 250 00:13:49,940 --> 00:13:55,360 だから我々は80の項目がある発見 ドーナツを参照するコレクション。 251 00:13:55,360 --> 00:13:57,150 我々は彼らの最初の10を見ている。 252 00:13:57,150 --> 00:14:01,890 さて、あなたはここでその方法を見ることができます 私はドーナツを探していた、 253 00:14:01,890 --> 00:14:04,400 私はちょうどに何かを追加しました URLのクエリ文字列。 254 00:14:04,400 --> 00:14:09,680 だから、qはあなたができるドーナツを、等しい もう少し簡単にここを参照してください。 255 00:14:09,680 --> 00:14:12,131 >> そして、これは基本的にありませ意味 APIの仕様、その 256 00:14:12,131 --> 00:14:13,880 何すべての定義 これらのパラメータは意味。 257 00:14:13,880 --> 00:14:17,150 そして、これは私たちがしようとしていることを意味 ドーナツのためにすべてを検索します。 258 00:14:17,150 --> 00:14:24,910 >> だからここに最初の項目は、我々は持っている あなたは、タイトルがドーナツで見ることができます 259 00:14:24,910 --> 00:14:29,310 とAnと呼ばれる字幕がある 私は推測であり、アメリカの情熱、 260 00:14:29,310 --> 00:14:31,610 適切な。 261 00:14:31,610 --> 00:14:36,134 different--がたくさんあり​​ます 262 00:14:36,134 --> 00:14:38,050 あなたがポイントに到達したら データを取得する、 263 00:14:38,050 --> 00:14:41,020 異なるがたくさんあり​​ます あなたにそれを得ることができますフォーマット。 264 00:14:41,020 --> 00:14:44,050 そして、異なる強みがあります それらのすべてのための弱点。 265 00:14:44,050 --> 00:14:49,000 したがって、この1は、あなたが見ることができます ここでは、このフォームは非常に豊富です。 266 00:14:49,000 --> 00:14:51,946 そして、それは標準化されているの。 267 00:14:51,946 --> 00:14:55,040 >> だから、特定のタイトルがあります フィールド、サブタイトルフィールド。 268 00:14:55,040 --> 00:14:58,950 代替があります タイトル、アメリカの情熱。 269 00:14:58,950 --> 00:15:01,650 それに関連付けられた名前がある。 270 00:15:01,650 --> 00:15:03,120 リソースのタイプはテキストです。 271 00:15:03,120 --> 00:15:06,070 多くの情報があります ここにこの形式で。 272 00:15:06,070 --> 00:15:09,480 >> しかし、たくさんあり​​ます 異なるフォーマットの。 273 00:15:09,480 --> 00:15:11,920 だから我々はちょうど何であったか を見るとフォーマットです 274 00:15:11,920 --> 00:15:17,700 の略と呼ばれるMODS、 メタデータオブジェクトの説明サービス、 275 00:15:17,700 --> 00:15:18,250 潜在的に。 276 00:15:18,250 --> 00:15:23,030 私は実際には約全くわからないんだけど S.しかし、それはかなり複雑なフォーマットです。 277 00:15:23,030 --> 00:15:24,240 これは、デフォルトのフォーマットです。 278 00:15:24,240 --> 00:15:30,260 >> しかし、それは続け一つだ すべてのデータの豊富さ 279 00:15:30,260 --> 00:15:33,820 ライブラリがあるため持っていること それは何に非常に近いです 280 00:15:33,820 --> 00:15:35,110 ライブラリは、内部的に使用されます。 281 00:15:35,110 --> 00:15:39,030 それは標準だ 国全体で使用、 282 00:15:39,030 --> 00:15:40,944 大学図書館で世界中に。 283 00:15:40,944 --> 00:15:42,110 そして、それは非常に相互運用可能です。 284 00:15:42,110 --> 00:15:44,852 だから、文書を持っている場合は、 すなわち、MODSの形式である 285 00:15:44,852 --> 00:15:47,560 あなたが他の誰かにそれを与えることができます そのシステムは、MODSを理解する 286 00:15:47,560 --> 00:15:48,518 そして彼らはそれをインポートすることができます。 287 00:15:48,518 --> 00:15:50,840 だから、標準です。 288 00:15:50,840 --> 00:15:54,250 それは非常によく、非常に具体的に定義さだ。 289 00:15:54,250 --> 00:15:58,980 そして、それはそれを作るものです 相互運用可能な、誰かが言えば理由 290 00:15:58,980 --> 00:16:04,930 これは別のタイトルです 記録は、誰もがそれが何を意味するか知っている。 291 00:16:04,930 --> 00:16:07,740 フリップ側では、それは非常に複雑です。 292 00:16:07,740 --> 00:16:13,160 >> だから、見てみると ここでこのレコードでは、 293 00:16:13,160 --> 00:16:15,320 私はちょうど取得したい場合 このドキュメントのタイトル、 294 00:16:15,320 --> 00:16:21,150 おそらくドーナツで、この本、の、 アメリカの情熱、それを解析する 295 00:16:21,150 --> 00:16:22,940 少し複雑です。 296 00:16:22,940 --> 00:16:27,380 別がありますのに対して ダブリンコアと呼ばれるフォーマット、 297 00:16:27,380 --> 00:16:29,730 これは、はるかに簡単なフォーマットである。 298 00:16:29,730 --> 00:16:33,764 >> ここで見るとそう、ないあります タイトル、サブタイトル、代替のタイトル。 299 00:16:33,764 --> 00:16:35,930 単にタイトルがあります、 ドーナツ、アメリカン情熱、 300 00:16:35,930 --> 00:16:38,780 と別のタイトル、アメリカの情熱。 301 00:16:38,780 --> 00:16:42,907 だから、あなたがどの​​ような形を見ているとき あなたは、からデータを取得したい 302 00:16:42,907 --> 00:16:44,740 多くの方法によって異なります あなたはそれを使用するつもりだ。 303 00:16:44,740 --> 00:16:46,573 あなたが使用している 相互運用性またはあなたが行う 304 00:16:46,573 --> 00:16:49,970 そのシンプルな何かをしたい で動作するように簡単な場合があります? 305 00:16:49,970 --> 00:16:56,002 >> フリップ側では、たくさんの 詳細はソートの下に踏み付けう。 306 00:16:56,002 --> 00:16:58,460 あなたは、のニュアンスが失われる可能性があります 何特定のフィールド手段 307 00:16:58,460 --> 00:17:02,960 あなたはダブリンコアを扱っている場合には、 そのあなたがMODSで得ないだろう。 308 00:17:02,960 --> 00:17:06,462 だから、それらは、フォーマットの2である あなたは、APIから抜け出すことができます。 309 00:17:06,462 --> 00:17:08,920 そして、基本的に、我々は維持している それMODSで舞台裏。 310 00:17:08,920 --> 00:17:14,179 しかし、我々はMODSにあなたにそれを与えることができますし、 ダブリン·コアと同様に他の何か。 311 00:17:14,179 --> 00:17:16,470 その他の対価時 あなたがデータで探しています 312 00:17:16,470 --> 00:17:21,210 あなたは、JSON、そのいずれかとしてそれを得ることができている JavaScriptのオブジェクト表記の略で、 313 00:17:21,210 --> 00:17:24,720 の略やXML、 拡張マークアップ言語。 314 00:17:24,720 --> 00:17:30,080 これらのデータ表現の両方 正確に、正確に同じデータを持つ 315 00:17:30,080 --> 00:17:31,080 同じフィールド。 316 00:17:31,080 --> 00:17:33,644 しかし、彼らはただだ 構文的に異なる。 317 00:17:33,644 --> 00:17:40,401 >> だから、これはA--です 318 00:17:40,401 --> 00:17:41,400 さて、ちょうど切り替えてみましょう。 319 00:17:41,400 --> 00:17:47,490 だから、これは私たちのクエリです XML形式のドーナツ。 320 00:17:47,490 --> 00:17:53,470 私はちょうどこれをJSONであることに切り替えた場合、 私はそれが違って見える見ることができます。 321 00:17:53,470 --> 00:17:58,580 だから今、これは同じ内容で、 しかし異なる構造。 322 00:17:58,580 --> 00:18:00,080 より少ない角括弧があります。 323 00:18:00,080 --> 00:18:02,530 それほど冗長あります。 324 00:18:02,530 --> 00:18:06,440 >> そして、これは、あなたの場合形式です ウェブ環境で作業している、 325 00:18:06,440 --> 00:18:09,680 あなたが最も可能性が高いうとしている 1ので、使いたい 326 00:18:09,680 --> 00:18:12,630 JSONについての素晴らしい事のある それは、JavaScriptと互換性があります。 327 00:18:12,630 --> 00:18:17,680 私は、Webアプリを書いているのであれば、私が引っ張ることができる JSONに、ちょうど直接それに取り組む。 328 00:18:17,680 --> 00:18:20,187 XMLとのに対し、それはだ もう少し複雑。 329 00:18:20,187 --> 00:18:21,520 だから、再び、これらは両方とも便利です。 330 00:18:21,520 --> 00:18:26,387 彼らはただ異なるユースケースである どこの人々がそれらを使用したい場合があります。 331 00:18:26,387 --> 00:18:26,886 OK。 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 だから、戻ってAPIに。 334 00:18:31,680 --> 00:18:32,900 だから我々はfor--検索することができます 335 00:18:32,900 --> 00:18:36,220 >> 私は例を与える ドーナツを検索。 336 00:18:36,220 --> 00:18:39,330 我々はまた、単に検索することができます ここ内の特定のフィールド。 337 00:18:39,330 --> 00:18:41,310 だからではなく、検索の レコード全体、 338 00:18:41,310 --> 00:18:43,870 私はちょうどタイトルフィールドを検索することができます。 339 00:18:43,870 --> 00:18:48,810 だから今では25のものがあります タイトルにドーナツ、のいずれかを持っている 340 00:18:48,810 --> 00:18:52,430 復元についてです 経営における湿地 341 00:18:52,430 --> 00:18:54,990 ドーナツの穴の おそらく、プログラム、 342 00:18:54,990 --> 00:18:58,970 必ずしも私たちは、探しているもの 私たちは、ドーナツを探しているときのために。 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> あなたがいるときに、することもできます API--を扱う 345 00:19:05,490 --> 00:19:08,827 >> APIを持っていることの一部が与えている 人々は大規模なデータセットへのアクセスを。 346 00:19:08,827 --> 00:19:11,410 そして、異なるいくつかあります あなたはそれを行うために使用できるツール。 347 00:19:11,410 --> 00:19:14,170 一つは、非常に簡単に、あなたです データを通じて缶ページ。 348 00:19:14,170 --> 00:19:17,340 だから、クエリを実行するかのように ウェブインタフェースを介して、 349 00:19:17,340 --> 00:19:19,470 あなたは、ページ1を見ることができ、 ページ2、ページ3。 350 00:19:19,470 --> 00:19:22,040 あなたが同じことを行うことができます APIを介しての事。 351 00:19:22,040 --> 00:19:24,150 あなたはただである必要が あなたがそれを行う方法で明示的。 352 00:19:24,150 --> 00:19:29,511 >> したがって、たとえば、私が探していた場合 ここに私の最初のクエリでは、 353 00:19:29,511 --> 00:19:32,510 私は物事の検索をやっている場所 タイトルにドーナツと、私が言うことができ、 354 00:19:32,510 --> 00:19:35,415 と制限は意味し、20に等しい 私に最初の20レコードを与え、しない 355 00:19:35,415 --> 00:19:38,540 デフォルトで最初の10、、 私は一度に20を見てみたいから。 356 00:19:38,540 --> 00:19:43,435 それとも私が言うことができる、セット 20と限界に等しい開始 357 00:19:43,435 --> 00:19:47,150 与える等しい20、 私は40を介して21を記録します。 358 00:19:47,150 --> 00:19:52,680 >> だから私は事を推測 ここで離れて取ることです 359 00:19:52,680 --> 00:19:57,290 我々は、クエリ文字列を使用していること クエリでパラメータを設定します。 360 00:19:57,290 --> 00:20:02,760 そして、それはあなたがコントロールすることができます あなたは何を取り戻す。 361 00:20:02,760 --> 00:20:05,980 >> あなたが使用できる別のツール、 - 362 00:20:05,980 --> 00:20:09,250 >> そして、これは本当に便利です データを探索という点。 363 00:20:09,250 --> 00:20:10,840 >> ファセットと呼ばれるものを--is。 364 00:20:10,840 --> 00:20:15,530 そのため、長期的なファセットです 必ずしも一般的ではありません。 365 00:20:15,530 --> 00:20:16,880 しかし、あなたはすべての前にそれを見てきました。 366 00:20:16,880 --> 00:20:18,630 あなたが見てみた場合 アマゾン、例えば、 367 00:20:18,630 --> 00:20:20,870 あなたがのために検索を行う 書籍ドーナツ、 368 00:20:20,870 --> 00:20:27,080 ここで彼らは本のシリーズを持っている、 それらはカテゴリ別にグループ化している、 369 00:20:27,080 --> 00:20:30,470 あなたがさまざまなカテゴリを取得し、 とどのように多くの書籍、各カテゴリで 370 00:20:30,470 --> 00:20:31,330 現れる。 371 00:20:31,330 --> 00:20:33,420 >> だから、これは基本的にファセットです。 372 00:20:33,420 --> 00:20:37,570 あなたは、1800すべての彼らの本を取る アマゾンでドーナツと一致冊。 373 00:20:37,570 --> 00:20:39,820 それらの12をしている 朝食カテゴリ。 374 00:20:39,820 --> 00:20:43,100 ペストリーとベーキングで21、 などなど。 375 00:20:43,100 --> 00:20:47,670 >> だから、これは本当に便利です コンテンツを探索するためのツール 376 00:20:47,670 --> 00:20:53,260 ライブラリ内にも あなたは、ファセットを見たときのため、 377 00:20:53,260 --> 00:20:56,520 それはあなたの何科目のアイデアを提供します 被験者のどのような種類のように、存在する 378 00:20:56,520 --> 00:20:58,510 問合せセット内で最も人気があります。 379 00:20:58,510 --> 00:21:00,950 そして、それはあなたが追い出すと探るのに役立ちます。 380 00:21:00,950 --> 00:21:02,770 だから私たちは同じことを行うことができます。 381 00:21:02,770 --> 00:21:05,940 >> 我々は、使用したい場合 APIと小面を見て、 382 00:21:05,940 --> 00:21:08,950 我々は、別のパラメータを追加 私たちの友人クエリ文字列。 383 00:21:08,950 --> 00:21:12,540 だから、ファセットは、カンマ区切りに等しい 私たちは上のファセットに欲しいもののリスト。 384 00:21:12,540 --> 00:21:14,790 だから、ファセットの1は、対象となる可能性があります。 385 00:21:14,790 --> 00:21:16,565 もう一つは、言語かもしれません。 386 00:21:16,565 --> 00:21:19,665 私たちは、そのクエリを実行した場合とそう、私たちはget-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 ここはほとんど同じに見えます。 389 00:21:24,830 --> 00:21:29,010 しかし、我々は最後に追加した リストのファセットのセット。 390 00:21:29,010 --> 00:21:34,060 だから我々は、被写体と呼ばれるファセットを持つ。 391 00:21:34,060 --> 00:21:40,250 だから、これは私が見ればことを私たちに伝えている ドーナツクエリから私の80の結果では、 392 00:21:40,250 --> 00:21:42,100 それらの13を持っている 主題米国。 393 00:21:42,100 --> 00:21:43,684 三は、被写体ドーナツを持っている。 394 00:21:43,684 --> 00:21:45,600 三、被写体を持っている 湿地復元の、 395 00:21:45,600 --> 00:21:47,720 そのドーナツの私達の穴があります。 396 00:21:47,720 --> 00:21:51,780 彼ら二人、シンプソンズ、 などなど。 397 00:21:51,780 --> 00:21:59,211 >> あなたのであれば、これは便利です 検索を絞り込むたい。 398 00:21:59,211 --> 00:22:00,210 それはあなたがそれを行うことができます。 399 00:22:00,210 --> 00:22:03,580 あなたが持っている場合は特に 80その結果、たとえば、より多くの。 400 00:22:03,580 --> 00:22:05,980 >> 同様に、我々はまた尋ねた 言語上のファセットのために。 401 00:22:05,980 --> 00:22:14,790 我々は我々の結果を見ればそう、私たちは76を参照してください。 それらの英語、フランス語の4つである、 402 00:22:14,790 --> 00:22:19,620 スペイン語で2、2、私はそれがだと思う 未定義または未知の、オランダ語、ラテン語。 403 00:22:19,620 --> 00:22:22,830 だから私はラテン語だと思います ドーナツ結果、再び、 404 00:22:22,830 --> 00:22:24,922 焼き菓子とは何の関係もありません。 405 00:22:24,922 --> 00:22:25,630 しかし、そこに行く。 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> だから、これは一種のあなたを見せている どのようにコンテンツを引き戻すことができます 408 00:22:38,630 --> 00:22:41,270 APIからわずかを通して 素晴らしいですウェブブラウザ、。 409 00:22:41,270 --> 00:22:44,320 しかし、それは本当にありません何をだろう 通常はそれのためのAPIで使用している。 410 00:22:44,320 --> 00:22:48,710 どのようにあなたのだから、1例 実際にこれは私がしたある行うことができます 411 00:22:48,710 --> 00:22:54,720 スーパー小さなプログラムを書かれた、 これ、再び、私のドーナツの検索を行います 412 00:22:54,720 --> 00:22:59,010 と夫婦のフィールドを選択し、 テーブルに表示します。 413 00:22:59,010 --> 00:23:01,610 だから、これは非常にある 同じコンテンツ我々だけ 414 00:23:01,610 --> 00:23:04,830 いくつかのフィールドを引き出して見ました。 415 00:23:04,830 --> 00:23:12,090 タイトルのため、リスト、 何本の場所 416 00:23:12,090 --> 00:23:15,120 言語は、約、 などなど。 417 00:23:15,120 --> 00:23:20,480 >> だから、これは実際にあるので、起こったのか 私たちはいくつかのコードを見ていると思い、 418 00:23:20,480 --> 00:23:22,420 is-- 419 00:23:22,420 --> 00:23:28,060 >> 私たちがここに持っていることは、単純なHTMLです テキストを表示するページ、 420 00:23:28,060 --> 00:23:32,900 ライブラリクラウドに歓迎し、 その後、結果の表が表示されます。 421 00:23:32,900 --> 00:23:37,790 そして、明らかには結果ではありません ページがロードされる表。 422 00:23:37,790 --> 00:23:41,380 しかし、我々は何をやっている 我々は、まず、ある 423 00:23:41,380 --> 00:23:46,290 と呼ばれるライブラリをロードしている 基本的にはjQueryの、 424 00:23:46,290 --> 00:23:52,030 それを作るJavaScriptライブラリ、 JavaScriptを操作するのは非常に簡単 425 00:23:52,030 --> 00:23:58,780 ネイティブ、HTML、ウェブページの作成、 クライアントサイドのロジックやWebページ。 426 00:23:58,780 --> 00:24:01,595 >> だから、私たちはここに持っていることはjQueryはある 取得というメソッドを持って、 427 00:24:01,595 --> 00:24:05,270 本質的に移動します URL、この場合には、これ、 428 00:24:05,270 --> 00:24:09,070 このおなじみの見えるURLです。 429 00:24:09,070 --> 00:24:14,440 そしてからコンテンツを取得します そのURLとは、その上に関数を実行。 430 00:24:14,440 --> 00:24:19,240 だから我々はapi.lib.harvard / EDUに行くと述べた。 431 00:24:19,240 --> 00:24:20,060 ドーナツを検索する。 432 00:24:20,060 --> 00:24:21,300 私たちに20のレコードを与えます。 433 00:24:21,300 --> 00:24:28,590 そして、この関数を、実行する 私はそれをデータを渡す、選択した。 434 00:24:28,590 --> 00:24:34,430 そして、データはJSONです APIから返されてしまった。 435 00:24:34,430 --> 00:24:40,120 >> そして、我々はその中で、言っている データ項目と呼ばれるフィールドがあります。 436 00:24:40,120 --> 00:24:48,117 私が行けば、バックを見てみましょう ここにこれらの結果の1、 437 00:24:48,117 --> 00:24:49,200 何かがありますcalled-- 438 00:24:49,200 --> 00:24:50,220 >> まあ、それはアイテムと呼ばれています。 439 00:24:50,220 --> 00:24:53,520 だから、それをすることができる。 440 00:24:53,520 --> 00:25:01,840 そして、何それがないことは、それである 各項目を通過 441 00:25:01,840 --> 00:25:05,300 その後、別のを呼び出す 各項目の機能。 442 00:25:05,300 --> 00:25:08,440 基本的には、その関数 値を取っている 443 00:25:08,440 --> 00:25:12,010 ある項目の 基本的に個々の記録 444 00:25:12,010 --> 00:25:18,220 私たちは、タイトルを引き出すことを可能にする、 カバレッジと言語。 445 00:25:18,220 --> 00:25:21,640 >> だから我々はすべての上の関数を呼び出す 我々は戻っAPIから得たアイテム。 446 00:25:21,640 --> 00:25:25,397 そして、あなたはただ見てみると 右ここにこの作品では、 447 00:25:25,397 --> 00:25:27,230 私たちは何をやっているである 我々は、文字列を作成している、 448 00:25:27,230 --> 00:25:31,810 本質的にいくつかのHTMLマークアップです value.titleと、テーブルの周りに、 449 00:25:31,810 --> 00:25:35,790 これのタイトルです オブジェクト、value.coverage、 450 00:25:35,790 --> 00:25:36,790 その適用範囲は、ある - 451 00:25:36,790 --> 00:25:38,225 >> そして、我々はチェックをやっている ここで定義されていないの誰が見て 452 00:25:38,225 --> 00:25:40,570 それは未定義言えば、それを隠して、 私たちは本当に興味がないので、 453 00:25:40,570 --> 00:25:41,600 その中で。 454 00:25:41,600 --> 00:25:42,939 >> - そして、言語。 455 00:25:42,939 --> 00:25:44,730 そして、我々は何をしている やってはそれを追加している 456 00:25:44,730 --> 00:25:48,510 あるテーブルへ ここにこの文字列で識別。 457 00:25:48,510 --> 00:25:50,790 とjQueryがどのように動作するか これは言っていることです。 458 00:25:50,790 --> 00:25:56,420 アイデアを持つテーブルを探している 結果はそれにこのテキストを追加します。 459 00:25:56,420 --> 00:25:59,380 そして、これはアイデアの結果と表です。 460 00:25:59,380 --> 00:26:04,998 だから、結局何 このページはこちらです。 461 00:26:04,998 --> 00:26:06,206 そして、表示​​するためにsource-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 さて、ソースが実際にはありません それが起こったときに更新。 464 00:26:13,810 --> 00:26:18,740 だから、実際に見ることができます しかし、ここでテーブルの結果。 465 00:26:18,740 --> 00:26:24,770 >> だから、の単純な例です APIに対して非常に基本的なクエリを実行する 466 00:26:24,770 --> 00:26:29,020 いくつかの他の情報を表示する 形成しており、あまりにも派手な何もしていない。 467 00:26:29,020 --> 00:26:36,370 さて、もう一つの例は次のようである デビッド·ワインバーガーによって書かれたアプリケーション 468 00:26:36,370 --> 00:26:39,120 このデモとして、その 本質を示しています 469 00:26:39,120 --> 00:26:44,620 あなたがしている結果をマッシュアップできるか ライブラリクラウドAPIから取得 470 00:26:44,620 --> 00:26:46,250 で、Googleブックス言う。 471 00:26:46,250 --> 00:26:52,225 >> そして、ここで思考は私ができることです Googleブックスに対してクエリを実行し、 472 00:26:52,225 --> 00:26:56,060 フルテキスト検索を取得し、いくつかの結果を得る 背中、それらのアイテムのどれを見つける 473 00:26:56,060 --> 00:27:01,180 実際にホリスに存在し、 図書館システム、 474 00:27:01,180 --> 00:27:03,200 その後私にリンクを与える 戻ってそれらのアイテムに。 475 00:27:03,200 --> 00:27:12,730 私が検索するのであれば、それがあった 暗い嵐の夜、私は 476 00:27:12,730 --> 00:27:16,210 結果の束を取り戻す グーグル、その後つの結果から 477 00:27:16,210 --> 00:27:19,460 その時間の中でリンクルです。 478 00:27:19,460 --> 00:27:29,330 そして、これらが存在して図書へのリンクです ハーバード図書館システム内。 479 00:27:29,330 --> 00:27:32,160 >> だから私はここでのポイントではないと思います これがかなくてもよいことをそんなに 480 00:27:32,160 --> 00:27:34,118 あなたが望む方法であること ライブラリを検索するには、 481 00:27:34,118 --> 00:27:38,310 それは完全に異なっている あなたに利用できなかった方法 482 00:27:38,310 --> 00:27:42,884 前、あなたのようなことの方法がありませんでした でも、帳簿上のフルテキスト検索 483 00:27:42,884 --> 00:27:44,550 ハーバード図書館システムの一部であった。 484 00:27:44,550 --> 00:27:46,870 だから今、これは方法です あなたはそれを行うことができます。 485 00:27:46,870 --> 00:27:51,930 そして、あなたはそれらを表示することができます どんなフォーマットあなたが欲しい。 486 00:27:51,930 --> 00:27:55,990 だから、ここでのポイントは、基本的には、ある 私たちは人々のための新しい方法を開いている 487 00:27:55,990 --> 00:27:59,080 データを操作する。 488 00:27:59,080 --> 00:28:07,925 >> ライブラリクラウドのもう一つの作品は、ということです それは、使用状況データの一部を露出させるのに役立ち 489 00:28:07,925 --> 00:28:08,800 ライブラリが持っていること。 490 00:28:08,800 --> 00:28:12,630 だから、図書館に行けば、 あなたが本を探している、 491 00:28:12,630 --> 00:28:15,770 あなたは必ずしもない 実際のアイデアを持っている、 492 00:28:15,770 --> 00:28:19,080 内のすべての項目のために 特定の主題、何 493 00:28:19,080 --> 00:28:21,200 人々がしている コミュニティ、それはだかどうか 494 00:28:21,200 --> 00:28:24,890 ハーバードとして定義さ 国またはあなたのクラス、 495 00:28:24,890 --> 00:28:26,421 彼らが最も有用見つけたものがありますか? 496 00:28:26,421 --> 00:28:28,920 そして、ライブラリが実際にあります 何についての情報のトン 497 00:28:28,920 --> 00:28:32,999 多くの場合ために最も有用である 人々が本をチェックアウトするの、 498 00:28:32,999 --> 00:28:34,040 それはあなたに何かを伝えます。 499 00:28:34,040 --> 00:28:36,498 いくつかの理由があったに違いない 彼らはそれをチェックアウトしたい。 500 00:28:36,498 --> 00:28:38,270 多くの人が予備の上に置く。 501 00:28:38,270 --> 00:28:42,520 >> それは多くのために予備のリスト上にある場合 クラスの、それはあなたに何かを伝えます。 502 00:28:42,520 --> 00:28:45,960 教員はそれをチェックしている場合 たくさんと大学生ではないから、 503 00:28:45,960 --> 00:28:47,200 それは私に何かを伝えます。 504 00:28:47,200 --> 00:28:49,280 逆に、そのも あなたに何かを伝えます。 505 00:28:49,280 --> 00:28:54,680 だから、本当に興味深いものになるだろう そこにその情報を入れてみましょう 506 00:28:54,680 --> 00:28:59,969 人々は彼らが見つけるのを助けるためにそれを使用 図書館システム内で動作します。 507 00:28:59,969 --> 00:29:02,260 このフリップ側である いくつかの深刻なプライバシーがあります 508 00:29:02,260 --> 00:29:07,854 懸念の一つ理由 ライブラリのコア教義 509 00:29:07,854 --> 00:29:10,770 我々は言ってもするつもりはないさ 他の人が読んでいる何人。 510 00:29:10,770 --> 00:29:17,360 そして、あなたはこれを言っている場合であっても 本が4回確認した 511 00:29:17,360 --> 00:29:20,070 特定の月で、 それを使用することができる 512 00:29:20,070 --> 00:29:25,252 特定のリンクに戻る デ匿名化データによる人 513 00:29:25,252 --> 00:29:26,710 それをチェックアウトした人を見つける。 514 00:29:26,710 --> 00:29:30,792 我々はavoid--できるので、道 515 00:29:30,792 --> 00:29:33,750 私たちは抽出しようとすることができる方法 すべての情報からいくつかの信号 516 00:29:33,750 --> 00:29:36,740 侵害なし 誰のプライバシーの問題 517 00:29:36,740 --> 00:29:42,150 基本的に私たちは見ている 使用データの10年 - 518 00:29:42,150 --> 00:29:43,930 >> だから、長期間にわたってだ。 519 00:29:43,930 --> 00:29:50,639 >> - そしてOK、の方法を見てみましょう、と言う この作品が使用された何度も、 520 00:29:50,639 --> 00:29:52,930 とWHOがこの期間にわたって 時間の、その後は基本的に 521 00:29:52,930 --> 00:29:56,300 我々は呼んで番号を、お返し 基本的にスタックスコア 522 00:29:56,300 --> 00:29:59,910 それが使用されてだどのくらい表します。 523 00:29:59,910 --> 00:30:01,084 そして、そのnumber-- 524 00:30:01,084 --> 00:30:03,250 異なる計算たくさんの その数に入る。 525 00:30:03,250 --> 00:30:05,150 - しかし、それは非常に粗いのだ あなたを与えるメトリック 526 00:30:05,150 --> 00:30:11,300 どのようにいくつかのアイデア コミュニティはその仕事を大切にすることができる。 527 00:30:11,300 --> 00:30:16,772 >> とにものそのように別のソート より多くのアプリケーションを肉付け 528 00:30:16,772 --> 00:30:18,480 それが活用しています このようなものです 529 00:30:18,480 --> 00:30:24,000 実際に呼ばStacklife、 メインハーバードを通じて利用可能 530 00:30:24,000 --> 00:30:24,880 図書館ポータル。 531 00:30:24,880 --> 00:30:26,700 だから、library.harvard.eduに行く。 532 00:30:26,700 --> 00:30:29,360 あなたは、異なる数が表示されます ライブラリを検索する方法。 533 00:30:29,360 --> 00:30:32,300 そのうちの一つはStacklifeと呼ばれる。 534 00:30:32,300 --> 00:30:38,980 >> そして、これは、そのアプリケーションである ライブラリのコンテンツを閲覧し、 535 00:30:38,980 --> 00:30:43,490 しかし、完全に構築されています これらのAPIの上に。 536 00:30:43,490 --> 00:30:46,910 だから、特別なものはありません 舞台裏で起こって。 537 00:30:46,910 --> 00:30:49,570 へのアクセスはありません あなたが持っていないデータ。 538 00:30:49,570 --> 00:30:54,090 それはあなたを提供するために、APIを使っている 完全に異なるブラウジングと 539 00:30:54,090 --> 00:30:55,480 経験。 540 00:30:55,480 --> 00:30:58,570 >> だから私は、アリスを検索した場合 この場合のワンダーランドで、 541 00:30:58,570 --> 00:31:02,600 私は次のようになり、結果を得る かなりmuch--あるこの、 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> これは、任意の他の検索と非常に似ています あなたはこの場合を除き、行う可能性があります 544 00:31:10,870 --> 00:31:15,730 私たちはしてアイテムをランク付けしている あなたを与えるstackscore、 545 00:31:15,730 --> 00:31:19,850 どのように人気のあるこれらのいくつかのアイデア 項目は、コミュニティ内であった。 546 00:31:19,850 --> 00:31:25,610 だから明らかに、アリスでワンダーランド ウォルト·ディズニーによって非常に人気があります。 547 00:31:25,610 --> 00:31:36,570 しかし、あなたはまた、トップ4を見ることができます ここにあなたがactually--ない場合がありますものがある 548 00:31:36,570 --> 00:31:39,220 >> 高度に使用されている事柄、 しかし、あなたはすぐにではないかもしれない 549 00:31:39,220 --> 00:31:41,240 不思議の国のアリスで接続します。 550 00:31:41,240 --> 00:31:44,650 だから私たちの古くからの友人 注釈付きアリスはここにある。 551 00:31:44,650 --> 00:31:46,350 だから私はそれを見てみることができます。 552 00:31:46,350 --> 00:31:52,010 そして今、私が探しているものを 基本的にはof--設定されている時 553 00:31:52,010 --> 00:31:53,760 私は注釈を持つことができます 右ここアリス。 554 00:31:53,760 --> 00:31:56,700 私はそれについての情報を持っている。 555 00:31:56,700 --> 00:32:00,230 そして、私はまたstackscoreを持っている この場合、26で、の。 556 00:32:00,230 --> 00:32:03,169 そして、これはソートのおよそ私に語った どのように我々はこのstackscoreに着いた、 557 00:32:03,169 --> 00:32:05,835 どのように、それをチェックアウトした人のように それがチェックアウトされた何度も、 558 00:32:05,835 --> 00:32:08,440 教員や学部生のように、どのように 図書館が持っている多くのコピー、 559 00:32:08,440 --> 00:32:11,300 などなど。 560 00:32:11,300 --> 00:32:16,460 >> そして、あなたは、することもできます十分に面白い ここでは、事実上のスタックを参照します。 561 00:32:16,460 --> 00:32:19,550 だからここにデータ、この ソートあなたを見せている 562 00:32:19,550 --> 00:32:23,547 仮想表現の 何棚全力の 563 00:32:23,547 --> 00:32:25,880 あなたが取るした場合のように見える すべてのライブラリの保有 564 00:32:25,880 --> 00:32:28,940 と一緒にそれらを置く 1無限の棚の上。 565 00:32:28,940 --> 00:32:30,990 そして、良い点は、私たちがcan--ということです 566 00:32:30,990 --> 00:32:33,380 >> まず第一に、 これらの本についてのメタデータ 567 00:32:33,380 --> 00:32:35,627 それが公開された場合によくわかります。 568 00:32:35,627 --> 00:32:37,085 それは、それが持っているどのように多くのページがわかります。 569 00:32:37,085 --> 00:32:38,459 それはあなたの次元を伝えるかもしれません。 570 00:32:38,459 --> 00:32:42,930 だから、それがここに反映だ見ることができます 本のサイズの点で。 571 00:32:42,930 --> 00:32:46,740 >> そして、我々は使用することができます 強調するために得点を積み重ね 572 00:32:46,740 --> 00:32:49,170 高いスタックスコアを持っている図書。 573 00:32:49,170 --> 00:32:54,930 それは暗くだのであれば、それはそれを意味し、 おそらく、それは、より頻繁に使用される。 574 00:32:54,930 --> 00:32:57,040 この場合には、私は今 このことを推測するつもり 575 00:32:57,040 --> 00:33:03,226 不思議の国のアリスのバージョンがある それは非常に一般的に使用され、ほとんどの 576 00:33:03,226 --> 00:33:05,100 アクセスされ、図書館 ほとんどのコピーを有している。 577 00:33:05,100 --> 00:33:06,975 あなたが探しているのであれば 不思議の国のアリスのために、 578 00:33:06,975 --> 00:33:10,220 これは、開始するには良い場所かもしれません。 579 00:33:10,220 --> 00:33:13,500 >> そして、ここであなたはまたしてリンクすることができます 、と言って、Amazonは、本を購入する 580 00:33:13,500 --> 00:33:15,182 などなど。 581 00:33:15,182 --> 00:33:17,140 ここでのポイントは、再度、 このことをそんなにはない 582 00:33:17,140 --> 00:33:25,030 ライブラリを参照するための最良の方法です またはあらゆる機会のための適切なツール。 583 00:33:25,030 --> 00:33:28,400 しかし、それはそれを行うための別の方法です。 584 00:33:28,400 --> 00:33:31,359 データとすることで そのAPIを通じて利用可能 585 00:33:31,359 --> 00:33:34,650 非常に単純なビルディングブロックで構成され、 これは、コンテンツを検索することができ、 586 00:33:34,650 --> 00:33:39,420 あなたが何かを構築することができます そのことができますこのような 587 00:33:39,420 --> 00:33:41,520 並外れても 一部の人に貴重な。 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> だから、ソートの私が好きなだけだ APIとは何かについては本当に言って 590 00:33:51,860 --> 00:33:56,070 それが公開されるものをと、全体あります 舞台裏で原料の束、その 591 00:33:56,070 --> 00:33:59,480 私はちょうど簡単にに触れるつもりだ それは一種のこの時に来るという理由だけで 592 00:33:59,480 --> 00:34:03,720 中には完全に別の角度から このような何かを行う方法の観点から 593 00:34:03,720 --> 00:34:04,580 所定の場所に置くう? 594 00:34:04,580 --> 00:34:10,820 >> だから、APIが標準です このコンテンツのすべてへのインタフェース。 595 00:34:10,820 --> 00:34:13,820 しかし、そこにそれを得るために 私たちがしなければならなかった最初のこと 596 00:34:13,820 --> 00:34:17,260 情報を一緒に引っ張った。 書籍や映像の 597 00:34:17,260 --> 00:34:21,580 と見つけるエイズ、コレクション さまざまなハーバードシステムからの文書。 598 00:34:21,580 --> 00:34:23,929 アレフ、VIA、およびOASISは、 システムの名前。 599 00:34:23,929 --> 00:34:28,820 そして、彼らは本質的に入る パイプライン処理パイプライン。 600 00:34:28,820 --> 00:34:33,230 >> だから、まず第一に、私たちは輸出を取得する これらのシステムのすべてのファイル。 601 00:34:33,230 --> 00:34:35,130 私たちは、個々の項目にそれらを分割。 602 00:34:35,130 --> 00:34:39,360 だから我々は、GIGABYTEのファイルを、持っている それで万レコードを持っています。 603 00:34:39,360 --> 00:34:42,290 だから我々は個々の項目にそれを分割。 604 00:34:42,290 --> 00:34:45,374 そして、各項目ごとに、我々はそれを変換する MODSに、これらのいくつかの理由 605 00:34:45,374 --> 00:34:47,040 ネイティブMODSがあり、そのうちのいくつかはありません。 606 00:34:47,040 --> 00:34:49,204 だから我々は、それらすべてを取得 同じフォーマットである。 607 00:34:49,204 --> 00:34:51,120 その後、さまざまながあります 濃縮工程、ここで 608 00:34:51,120 --> 00:34:55,969 我々は、データへのより多くの情報を追加 よりは、ライブラリで提供されていた。 609 00:34:55,969 --> 00:34:59,750 だから我々は、すべての最初に、追加する必要があります 私たちは、図書館がそれを保持するものを持っています。 610 00:34:59,750 --> 00:35:02,250 私たちは、のステップを経る stackscoreを計算する。 611 00:35:02,250 --> 00:35:07,112 私たちは、別のステップを経る 面で多くのメタデータを追加する 612 00:35:07,112 --> 00:35:10,730 何のコレクション人の this--追加した可能性があります 613 00:35:10,730 --> 00:35:12,532 >> 人々は作成している アイテムのコレクション。 614 00:35:12,532 --> 00:35:13,990 どのようなコレクションにはに属していますか? 615 00:35:13,990 --> 00:35:17,220 どのように人々がタグ付けされています 過去にこのコンテンツ? 616 00:35:17,220 --> 00:35:20,750 その後、フィルタアウト、あなたが制限 レコードは、私が述べたように、なぜなら、 617 00:35:20,750 --> 00:35:24,120 、ためのいくつかのレコードがあります 著作権上の理由から、我々は表示できません。 618 00:35:24,120 --> 00:35:26,700 そして、我々はそれらをロード と呼ばれるものに 619 00:35:26,700 --> 00:35:31,680 スペルミスではないSolrの、しかし、 ソフトウェアの一部の名前である 620 00:35:31,680 --> 00:35:35,710 それは、検索インデックス作成を行います APIの背後にあるすべての検索をドライブします。 621 00:35:35,710 --> 00:35:40,110 そして、それが利用できるようになり API、人々はそれを使用することができます。 622 00:35:40,110 --> 00:35:44,640 >> だから、これはかなりのようなものです 簡単なプロセス。 623 00:35:44,640 --> 00:35:47,230 興味深いの一つ それは約物事 624 00:35:47,230 --> 00:35:50,990 我々は、扱っていること 1300万レコードを持つ 625 00:35:50,990 --> 00:35:53,820 そして我々は扱っ以上しようとしている。 626 00:35:53,820 --> 00:36:01,260 そして我々は、取り扱いができるようにする 比較的迅速な方法でこれらの。 627 00:36:01,260 --> 00:36:03,630 それは長い時間がかかります 1300万レコードを処理。 628 00:36:03,630 --> 00:36:09,529 >> したがって、このパイプラインがどのように セットアップあなたがcan--ということです 629 00:36:09,529 --> 00:36:12,070 私の利点を推測する パイプライン、我々はしている問題 630 00:36:12,070 --> 00:36:15,580 ここで解決しようとしていることである すべての変換、すべての 631 00:36:15,580 --> 00:36:18,729 この中でこれらの手順 パイプラインが分離可能である。 632 00:36:18,729 --> 00:36:19,645 依存関係はありません。 633 00:36:19,645 --> 00:36:22,146 あなたが処理している場合 1本の記録、 634 00:36:22,146 --> 00:36:24,270 には依存関係はありません 別の本の間の。 635 00:36:24,270 --> 00:36:27,760 >> だから我々は何ができるかは、基本的に パイプラインの各段階において、 636 00:36:27,760 --> 00:36:30,470 私たちは、クラウド内のキューに入れて。 637 00:36:30,470 --> 00:36:32,250 私は、Amazon Webサービスであることを起こった。 638 00:36:32,250 --> 00:36:35,140 だからのリストがあると、 万アイテム、言う 639 00:36:35,140 --> 00:36:38,100 正規化する必要があると MODS形式に変換。 640 00:36:38,100 --> 00:36:41,620 そして、私たちはできるだけ多くのサーバをスピンアップ 私たちが望むように、多分10台のサーバー。 641 00:36:41,620 --> 00:36:44,860 そして、それらの各サーバーだけ そのキュー内を検索し、そこに座って、 642 00:36:44,860 --> 00:36:46,730 する必要がある1があることを見ている 処理され、キューからそれを引っ張る、 643 00:36:46,730 --> 00:36:48,740 それを処理し、スティック それ次のキューに。 644 00:36:48,740 --> 00:36:54,200 >> そして、それは私たちを可能にするので、どのような 適用されるためには、本質的に、 645 00:36:54,200 --> 00:36:58,110 多くのハードウェアとして、私たちはこれにしたいように 非常に短い時間のために問題 646 00:36:58,110 --> 00:37:02,970 限り早くデータを処理する 可能、その唯一のものである、 647 00:37:02,970 --> 00:37:08,220 今、クラウドコンピューティングの世界では 基本的に我々はできるサーバのプロビジョニング 648 00:37:08,220 --> 00:37:09,890 瞬時に、その便利です。 649 00:37:09,890 --> 00:37:12,260 だから我々は持っている必要はありません 周りに座って巨大なサーバー 650 00:37:12,260 --> 00:37:16,700 処理を行うにはすべての時間 それは週に一度だけ発生する可能性があります。 651 00:37:16,700 --> 00:37:21,440 >> だから、それがほとんどです。 652 00:37:21,440 --> 00:37:27,590 利用可能なドキュメントがあります ライブラリクラウド項目APIの 653 00:37:27,590 --> 00:37:31,960 次のURLで、その意志 後で利用できるように。 654 00:37:31,960 --> 00:37:36,730 とを見てアクセスしてください それは何があるかどうかを確認するには、 655 00:37:36,730 --> 00:37:37,579 あなたが任意のアイデアを持っている。 656 00:37:37,579 --> 00:37:38,120 それで遊ぶ。 657 00:37:38,120 --> 00:37:38,830 浮気。 658 00:37:38,830 --> 00:37:42,800 そして、うまくいけばあなたが来ることができる 偉大な何かを。 659 00:37:42,800 --> 00:37:44,740 ありがとう。 660 00:37:44,740 --> 00:37:45,899