1 00:00:00,000 --> 00:00:03,416 >> [音楽再生] 2 00:00:03,416 --> 00:00:05,860 3 00:00:05,860 --> 00:00:08,180 >> 脳SCASSELLATI:ようこそ CS50のAIシリーズへ。 4 00:00:08,180 --> 00:00:12,600 私の名前はScassで、今日はつもりです 推薦システムについて話をします。 5 00:00:12,600 --> 00:00:15,780 今推薦システムの音 奇数名の一種のように。 6 00:00:15,780 --> 00:00:18,630 それは多分それが必要のように聞こえます 推薦システムとすることが、 7 00:00:18,630 --> 00:00:21,290 私は種類のあなたに同意。 8 00:00:21,290 --> 00:00:26,110 しかし、これらは役立つシステムです いつでも同じような物事を選択 9 00:00:26,110 --> 00:00:28,210 あなたがオンラインで何かを選択します。 10 00:00:28,210 --> 00:00:32,119 ネットフリックスは、例えば他の提案します あなたが見たいと思うかもしれない映画。 11 00:00:32,119 --> 00:00:36,660 または、パンドラは異なる提案します 聴きたい曲かもしれません。 12 00:00:36,660 --> 00:00:40,940 Amazonはどのような種類のを提案します 他の製品は、あなたが購入することをお勧めします。 13 00:00:40,940 --> 00:00:43,520 Facebookはあっても提案します 他の友人の何人か 14 00:00:43,520 --> 00:00:45,440 あなたが追加したいかもしれません。 15 00:00:45,440 --> 00:00:49,800 これらのシステムの各々は、使用して動作します アルゴリズムの同じ基本的な種類、 16 00:00:49,800 --> 00:00:52,520 それは私たちがしているものです 今日の話に行きます。 17 00:00:52,520 --> 00:00:56,860 >> 現在、これらのアルゴリズムは、 驚くほど大きなビジネス。 18 00:00:56,860 --> 00:01:01,130 数年前ではNetflix 2009 $ 1M(100万ドル)を提供しました 19 00:01:01,130 --> 00:01:07,240 賞品あなたはそれらを改善することができれば わずか10%の推薦システム。 20 00:01:07,240 --> 00:01:11,960 その10%が、しかし、表し 事業のかなりの量。 21 00:01:11,960 --> 00:01:15,330 見積もりはしにくいです で来るが、多くの人々 22 00:01:15,330 --> 00:01:19,050 これらの推奨事項と考えています オンライン購入のためのシステム 23 00:01:19,050 --> 00:01:25,729 どこかにアマゾンリードのようなシステム 10%〜25%の収益を増加させました。 24 00:01:25,729 --> 00:01:27,770 だから、想像することができます あなたがしているボリュームの種類 25 00:01:27,770 --> 00:01:32,860 我々が考えるときの話 でもこれらのほとんどのアルゴリズム。 26 00:01:32,860 --> 00:01:35,200 >> それでは、いくつかの例を取得してみましょう。 27 00:01:35,200 --> 00:01:38,460 それは、これらのことをどのように システムは、本当に仕事? 28 00:01:38,460 --> 00:01:40,773 基本的な2があります。 そのアルゴリズムの種類 29 00:01:40,773 --> 00:01:45,050 我々はについて話すときのプレイであります 推奨を生成します。 30 00:01:45,050 --> 00:01:48,650 最初のものが呼び出され コンテンツベースフィルタリング。 31 00:01:48,650 --> 00:01:53,410 そして、コンテンツベースフィルタリングは依存しています アイテム間の類似性に 32 00:01:53,410 --> 00:02:00,370 それ自体、それは、二つの映画の間にあります または2曲または2購入したアイテム。 33 00:02:00,370 --> 00:02:03,190 私たちは映画を使用するつもりです 例として、この 34 00:02:03,190 --> 00:02:07,850 いずれのタイプに、本当に、適用することができます 我々が探しているオブジェクトの。 35 00:02:07,850 --> 00:02:13,330 >> だから私はいくつかを考える場合 昨年から映画、 36 00:02:13,330 --> 00:02:16,799 私はインサイドアウトました 私の子供たちは、彼らはそれを愛しました。 37 00:02:16,799 --> 00:02:17,840 しかし、我々はまた、選択肢を持っていました。 38 00:02:17,840 --> 00:02:21,350 私たちは、手先を見に行っている可能性 我々はULTRONの時代を見たことができ、 39 00:02:21,350 --> 00:02:24,850 または私たちが見ている可能性が 劇場でのAntの男。 40 00:02:24,850 --> 00:02:27,580 >> これらのいずれかのために 映画は、我々が想像できます 41 00:02:27,580 --> 00:02:33,320 機能のリストを生成しますか、 これらの異なる映画についての資質。 42 00:02:33,320 --> 00:02:37,190 したがって、たとえば、私が検討することもでき それらの映画のどのアニメーション化されます。 43 00:02:37,190 --> 00:02:39,960 まあ、両方のインサイドアウト そして、手下をアニメーション化されます。 44 00:02:39,960 --> 00:02:44,140 ULTRONの時代どちらも Antの男がアニメーション映画です。 45 00:02:44,140 --> 00:02:47,040 そして、私は建物を想像することができ 構造、テーブルアップ 46 00:02:47,040 --> 00:02:49,440 これらの各プロパティを示しています。 47 00:02:49,440 --> 00:02:51,790 彼らはアニメーションやいませんか? 48 00:02:51,790 --> 00:02:54,780 私は、より多くを追加することができます この表の特徴 49 00:02:54,780 --> 00:02:58,380 この構造体に複数の行を追加します。 50 00:02:58,380 --> 00:03:00,970 私が求めることができるかどうか 彼らはマーベル映画だありません。 51 00:03:00,970 --> 00:03:04,010 まあ、インサイドアウトと手先 マーベル映画で​​はありません、 52 00:03:04,010 --> 00:03:06,715 ULTRONとAnt男の年齢は確かにありま​​す。 53 00:03:06,715 --> 00:03:09,100 >> そして、私は、任意の種類を求めることができます 異なる性質 54 00:03:09,100 --> 00:03:12,080 私が望んでいたことを、特徴の任意の種類 それは私にとって重要であるかもしれません。 55 00:03:12,080 --> 00:03:13,440 彼らは超悪役を持っていますか? 56 00:03:13,440 --> 00:03:16,700 まあ、内部には超悪役はありません アウトが、手下でものがあります 57 00:03:16,700 --> 00:03:19,990 そして、で、明らかに、 2スーパーヒーロー映画。 58 00:03:19,990 --> 00:03:23,900 >> 私も、よく、のようなものを求めることができます 彼らはBechdel試験に合格するのですか? 59 00:03:23,900 --> 00:03:27,280 名前の2つがあります 女性キャラクター誰 60 00:03:27,280 --> 00:03:30,550 いくつかのかなりの量を過ごします 時間会話をしています 61 00:03:30,550 --> 00:03:34,400 キャストの男性を必要としませんか? 62 00:03:34,400 --> 00:03:39,870 さて、この場合には、インサイドアウトは合格 ULTRONのテスト、手下が失敗し、年齢 63 00:03:39,870 --> 00:03:42,990 テストに合格し、Antの人が失敗します。 64 00:03:42,990 --> 00:03:45,020 これらの特徴のいずれか 私は考えることができ 65 00:03:45,020 --> 00:03:48,660 何人かの人々のために重要であるとして。 66 00:03:48,660 --> 00:03:52,000 >> 私はまた、アールのようなものを求めることができます そこに、これらの映画の中で任意の人々 67 00:03:52,000 --> 00:03:57,190 のは言わせてから卒業生、公園とは レクリエーション、私のお気に入りの番組の一つ。 68 00:03:57,190 --> 00:04:00,540 まあ、インサイドアウトは、エイミーがあります ポーラーは、それが卒業生です。 69 00:04:00,540 --> 00:04:01,530 それがカウントされます。 70 00:04:01,530 --> 00:04:04,110 ジョン・ハムは手下にありました。 71 00:04:04,110 --> 00:04:08,600 ポール・ラッドは、Antの男であったが、誰も ULTRONの時代に公園や必須でした 72 00:04:08,600 --> 00:04:10,150 同様に。 73 00:04:10,150 --> 00:04:12,990 だから私はこのリストを構築することができます 機能、そして、彼らは本当にできました 74 00:04:12,990 --> 00:04:14,710 映画について何もします。 75 00:04:14,710 --> 00:04:17,329 彼らは約何ができますか アスペクト比は、それらがで撮影されました、 76 00:04:17,329 --> 00:04:21,630 それは彼らがどのように多くの議席かもしれません そのオープニングの週末で販売。 77 00:04:21,630 --> 00:04:25,630 私がしたいすべての機能 私はこのテーブルに置くことができます生成されます。 78 00:04:25,630 --> 00:04:29,600 >> さて、このケースでは、私が構築しました 地金値のすべての並べ替え、 79 00:04:29,600 --> 00:04:33,700 yesまたはno、合否、 しかし、彼らは何でもかまいません。 80 00:04:33,700 --> 00:04:36,690 彼らは、任意の値である可能性があります。 81 00:04:36,690 --> 00:04:39,070 コンテンツベースフィルタリングについては、 私たちがやろうとしています 82 00:04:39,070 --> 00:04:42,810 我々が検討するつもりされています この表の2列 83 00:04:42,810 --> 00:04:45,660 彼らがどの程度似ているかを参照してください。 84 00:04:45,660 --> 00:04:48,640 例えば、もしだから私 インサイドアウトを見に行きました、 85 00:04:48,640 --> 00:04:53,640 私は他の映画は何、頼むかもしれません 私が見に行くことをいとわないかもしれないという。 86 00:04:53,640 --> 00:04:56,890 それは、どのように意思があります 見に行くために私のお金を費やしています。 87 00:04:56,890 --> 00:05:00,310 そして私はちょうど取ることによって、これを比較することができます 2列、インサイドアウトから1 88 00:05:00,310 --> 00:05:03,300 とのいずれかから1を 他の映画、とだけ見て 89 00:05:03,300 --> 00:05:06,210 どのように多くの彼らの特徴の試合の。 90 00:05:06,210 --> 00:05:09,660 だから私はインサイドアウトを比較した場合 手下で、よく、あります 91 00:05:09,660 --> 00:05:10,910 ここに三つのことに一致。 92 00:05:10,910 --> 00:05:16,200 これらは両方とも、それらのどちらもアニメ化しています マーベル映画があり、それらの両方 93 00:05:16,200 --> 00:05:18,420 公園や必須卒業生を持っています。 94 00:05:18,420 --> 00:05:20,420 だから私はどのようにカウントアップができました 多くの試合がありました 95 00:05:20,420 --> 00:05:22,640 この場合、3があると思います。 96 00:05:22,640 --> 00:05:26,450 >> 私は、インサイドアウトを比較すると 聞かせてのは、ULTRONの年齢を言います 97 00:05:26,450 --> 00:05:28,430 私はリストを下に見ることができます よく、そこだ、と言います 98 00:05:28,430 --> 00:05:30,140 そこに一致した一つだけ。 99 00:05:30,140 --> 00:05:34,560 彼らは両方のように、ベクテルテストに合格 それは、一つのスコアになるだろう。 100 00:05:34,560 --> 00:05:36,770 そして、インサイドアウトの間 Ant男、再び私は 101 00:05:36,770 --> 00:05:41,420 どのように多くの行ごとに比較することができます 物事はそれらのうちの2つの間に一致します。 102 00:05:41,420 --> 00:05:43,060 まあ、自分のアニメーション、1ではありません。 103 00:05:43,060 --> 00:05:44,970 一つは、一つではありません、マーベルの映画です。 104 00:05:44,970 --> 00:05:47,280 一つのスーパー悪役を持って、 他にはありません。 105 00:05:47,280 --> 00:05:49,480 一つは、ベクテルを渡します テストでは、人はそれを失敗し、 106 00:05:49,480 --> 00:05:54,450 しかし、彼らの両方が、公園や必須卒業生を持っています そう、再び、それは1のスコアを取得します。 107 00:05:54,450 --> 00:05:58,300 >> だから私は映画を探していた場合 それは、インサイドアウトと同様でした 108 00:05:58,300 --> 00:06:02,170 私は映画のためになります このコンテンツ内の最高スコア 109 00:06:02,170 --> 00:06:03,952 フィルタリング方式。 110 00:06:03,952 --> 00:06:05,660 私は、このケースでそう 手下を検討します 111 00:06:05,660 --> 00:06:08,330 近づくとよりなるように 何かである可能性が高いです 112 00:06:08,330 --> 00:06:13,250 私が見るためにお金を使うだろうと ULTRONまたはAnt人間の年齢よりも。 113 00:06:13,250 --> 00:06:16,150 >> これらのコンテンツベース フィルタリングシステムは、単に頼ります 114 00:06:16,150 --> 00:06:18,670 の特性に 映画、私 115 00:06:18,670 --> 00:06:21,930 ちょうど知ることによって、これらを構築​​することができます 製品について何か 116 00:06:21,930 --> 00:06:23,500 私が持っていること。 117 00:06:23,500 --> 00:06:26,050 私は、任意の種類を使用することができます 私が好きな機能、 118 00:06:26,050 --> 00:06:28,400 私はより多くを構築することができます 複雑な機能その 119 00:06:28,400 --> 00:06:33,060 より複雑なテストを必要とします 私が一緒に行くような品質の。 120 00:06:33,060 --> 00:06:39,080 実は、私もこのテーブルを表示することができます ない1静的オブジェクトであるとして、 121 00:06:39,080 --> 00:06:43,110 むしろ寸法であるとして 大きな状態空間内。 122 00:06:43,110 --> 00:06:46,295 そして、私はについて話し始めることができます 別の映画の間の距離。 123 00:06:46,295 --> 00:06:49,300 124 00:06:49,300 --> 00:06:51,050 これらは、すべてのものです 私たちはどのように知っています 125 00:06:51,050 --> 00:06:55,860 データ構造の種類を用いて行います 我々はすでにCS50で見てきたこと。 126 00:06:55,860 --> 00:06:59,180 だから私は建物を想像することができ 映画のためのデータ構造。 127 00:06:59,180 --> 00:07:02,390 私がきた構造があります 構築という映画、 128 00:07:02,390 --> 00:07:04,369 そして、それはそれで5ブールのエントリがあります。 129 00:07:04,369 --> 00:07:07,160 それがアニメーション化され、それは驚異です 映画は、それが超悪役を持っていません、 130 00:07:07,160 --> 00:07:11,047 それはBechdel試験に合格しないと、 公園や録音の卒業生は、その中にあるのですか? 131 00:07:11,047 --> 00:07:12,880 これらの各々は 私のデータ構造 132 00:07:12,880 --> 00:07:16,330 その特定の映画のために占有することができます。 133 00:07:16,330 --> 00:07:20,090 >> その後2かどうかを計算 同様のかそうでない映画、 134 00:07:20,090 --> 00:07:23,330 そのスコアが何であるか、私は可能性 擬似コードのセットを書き出すこと 135 00:07:23,330 --> 00:07:25,120 同じ関数を生成します。 136 00:07:25,120 --> 00:07:30,100 それは私がすることができ、いくつかの映画M1与え、あります それに最も類似動画を検索 137 00:07:30,100 --> 00:07:32,430 擬似コードを以下によります。 138 00:07:32,430 --> 00:07:37,040 私は、最適な検討します 私が見つけた得点システム、 139 00:07:37,040 --> 00:07:39,920 私が見つけた最高の比較。 140 00:07:39,920 --> 00:07:41,890 他のすべての映画のために 私は、通過するつもりです 141 00:07:41,890 --> 00:07:44,920 私は0に等しいマッチスコアを設定します。 142 00:07:44,920 --> 00:07:47,920 そして、私はそれを通って行きますよ 映画、M1、映画 143 00:07:47,920 --> 00:07:51,500 私がチェックします、で開始 一人ひとりの特徴 144 00:07:51,500 --> 00:07:53,650 彼らが見ていること 一致がある場合は。 145 00:07:53,650 --> 00:07:56,460 マッチがあれば、私はよ 試合のスコアを増加させます。 146 00:07:56,460 --> 00:08:00,480 そして、その末尾にマッチスコアの場合 私は現在のベストよりも優れています 147 00:08:00,480 --> 00:08:03,310 その後、私はよ、スコア その最高のスコアを覚えて、 148 00:08:03,310 --> 00:08:05,820 これは私が持っているベストマッチです。 149 00:08:05,820 --> 00:08:09,450 最後には、どのような映画 ベストマッチに座っています、 150 00:08:09,450 --> 00:08:12,580 それは近いです 私は来ることができました。 151 00:08:12,580 --> 00:08:14,890 したがって、これらの内容は、ベース フィルタリングシステム、 152 00:08:14,890 --> 00:08:16,900 それらはすべて、この基本的な構造を有しています。 153 00:08:16,900 --> 00:08:20,910 彼らは、アイテムに依存しています 質問と何もで 154 00:08:20,910 --> 00:08:24,590 ユーザーの好みのいずれかについて。 155 00:08:24,590 --> 00:08:29,010 >> 私たちが使用する他のメカニズム 推薦システムを構築するため 156 00:08:29,010 --> 00:08:31,790 協調フィルタリングと呼ばれています。 157 00:08:31,790 --> 00:08:36,520 協調フィルタリングはに依存しています オブジェクト自体のない資質、 158 00:08:36,520 --> 00:08:40,010 しかし、どのように人々、他の 彼らがきたか、あるユーザー 159 00:08:40,010 --> 00:08:43,370 これらの同じオブジェクトに反応しました。 160 00:08:43,370 --> 00:08:48,720 だから私の映画の例を続行し、 私は私の友人の束がかかる場合があります 161 00:08:48,720 --> 00:08:53,180 そしてかどうかについてのそれらを調査 彼らは、特定の映画が好きではありません。 162 00:08:53,180 --> 00:08:56,560 今、別の場所に生成されます。 さまざまな方法でこのデータ。 163 00:08:56,560 --> 00:08:59,630 あなたは直接調査することができます ユーザー、またはあなただけの可能性 164 00:08:59,630 --> 00:09:03,120 彼らがあれば選択内容を確認 あなたは、例えばNetflixのために、です。 165 00:09:03,120 --> 00:09:05,640 彼らは、どの映画を見たのですか? 166 00:09:05,640 --> 00:09:08,670 >> 私は自分の一部に疑問かもしれません ここで友人と見つけます 167 00:09:08,670 --> 00:09:12,910 ジェイソンは、すべての映画を気に入っていること 彼はそこに驚くべきことではない、見ました。 168 00:09:12,910 --> 00:09:15,590 アンディは、手下とおばさん男が好きでした。 169 00:09:15,590 --> 00:09:19,330 サラはインサイドアウトが好きで、 アベンジャーズ、アンディの反対。 170 00:09:19,330 --> 00:09:22,200 そして、サムは、よく、サムは言っています スーパーヒーロー映画のすべて、 171 00:09:22,200 --> 00:09:24,960 しかし、アニメーション映画のどれも。 172 00:09:24,960 --> 00:09:30,630 >> 私は、いくつかの新しいを照会することができ 個々の、私のようないくつかの他のユーザー 173 00:09:30,630 --> 00:09:34,520 私が好きならと、よく、頼みます これらの映画の一つ、 174 00:09:34,520 --> 00:09:38,600 あなたはについての予測を行うことができます これは私が好むかもしれない他の映画。 175 00:09:38,600 --> 00:09:41,890 私は内部好きならつまり、 アウト、これは他の映画 176 00:09:41,890 --> 00:09:48,460 私も見たいしそうです 同じような人が何をしたかに基づいて? 177 00:09:48,460 --> 00:09:51,640 つまり、私が通って行きますよ 私はこのリストをフィルタリングします 178 00:09:51,640 --> 00:09:54,520 ちょうど見つけます また、気に入った人 179 00:09:54,520 --> 00:09:57,680 私の好みにマッチしたアウト、インサイド。 180 00:09:57,680 --> 00:10:00,824 まあ、それはつまり、アンディと サムは、彼らが、インサイドアウト好きではなかったです 181 00:10:00,824 --> 00:10:02,240 私はそれらを考慮するつもりはありません。 182 00:10:02,240 --> 00:10:06,130 私は彼らを取り除くつもりです この比較のためのデータ。 183 00:10:06,130 --> 00:10:09,750 >> 私は、どのようなジェイソンで見ることができます そして、サラは考えて、タリー 184 00:10:09,750 --> 00:10:13,780 彼らが見た映画のどのアップ 私は、彼らが彼らが好きかどうか、しなかったこと 185 00:10:13,780 --> 00:10:15,150 か否か。 186 00:10:15,150 --> 00:10:17,820 私はちょうどのが票を言わせて、カウントアップ可能性があります。 187 00:10:17,820 --> 00:10:23,360 手下ので、例えば1を持っている可能性があります ジェイソンはそれが好きので、それに投票。 188 00:10:23,360 --> 00:10:27,170 ジェイソンとサラの両方がアベンジャーズを気に入って、 ので、2票を持っているでしょう。 189 00:10:27,170 --> 00:10:30,700 そして唯一のジェイソンは、Antの男が好き それは、一票になるだろう。 190 00:10:30,700 --> 00:10:34,870 だから私は、お勧めしていた場合 これらの映画の自分れます 191 00:10:34,870 --> 00:10:41,470 私はでしょう、見て最も可能性が高いかもしれません アベンジャーズ2を選択する必要があります。 192 00:10:41,470 --> 00:10:44,490 >> これらのいずれかのためにそう 今私が使用しているシステムでは、 193 00:10:44,490 --> 00:10:49,260 ではありません生成されたデータ 映画そのものではなく、環境設定について 194 00:10:49,260 --> 00:10:51,960 他のユーザから。 195 00:10:51,960 --> 00:10:54,150 これは、もちろん、いくつかの困難を有しています。 196 00:10:54,150 --> 00:10:55,920 あなたが他のユーザーを持っていない場合はどう? 197 00:10:55,920 --> 00:10:58,770 まあ、それは起動時の問題と呼ばれています。 198 00:10:58,770 --> 00:11:03,760 あなたはいくつかを持っている必要があります データの量、あなたがしている前に、 199 00:11:03,760 --> 00:11:07,560 作り始めることができます これらの推奨事項。 200 00:11:07,560 --> 00:11:10,940 それのフリップ側は一回です あなたは、データの収集を開始します 201 00:11:10,940 --> 00:11:13,870 あなたはより多くを収集することができる場合 そして、より多くのデータ、 202 00:11:13,870 --> 00:11:17,850 あなたは良くなるでしょう より良い提言。 203 00:11:17,850 --> 00:11:21,650 >> 今、私たちは翻訳することができ コー​​ドにこれも同様に。 204 00:11:21,650 --> 00:11:23,860 我々は、さまざまなを定義することができます 構造の種類、 205 00:11:23,860 --> 00:11:25,720 このケースでは、ユーザーにそれを呼ぶことにします。 206 00:11:25,720 --> 00:11:30,970 そして、それはについての特徴を持っています これは映画のこのユーザーが好きでした。 207 00:11:30,970 --> 00:11:34,560 彼らはインサイドアウトが好きでした、 手下、アベンジャーズ、とAntマン。 208 00:11:34,560 --> 00:11:36,660 それから、生成することができます 従うべきいくつかの擬似コード 209 00:11:36,660 --> 00:11:39,460 私が前に使用したのと同じ手順。 210 00:11:39,460 --> 00:11:43,460 すなわち、特定の与えられ ユーザX、の映画をお勧めしてみましょう 211 00:11:43,460 --> 00:11:46,107 そのxが好むかもしれません。 212 00:11:46,107 --> 00:11:47,940 我々は通過して行くことができます 映画のすべてのために、 213 00:11:47,940 --> 00:11:51,410 我々はスコアを初期化することができます その映画0であるために。 214 00:11:51,410 --> 00:11:54,080 そして、我々はすべてを見つけることができます 他のユーザーの誰 215 00:11:54,080 --> 00:11:57,630 xと同じ嗜好を持っています。 216 00:11:57,630 --> 00:11:59,990 そしてすべてのための 彼らは言っています映画、 217 00:11:59,990 --> 00:12:02,340 私たちは、その映画のスコアをインクリメントします。 218 00:12:02,340 --> 00:12:05,010 でどちらの映画 最後は最高のスコアを持っています、 219 00:12:05,010 --> 00:12:07,600 それは私がお勧めする必要があります一つです。 220 00:12:07,600 --> 00:12:09,890 >> これのどれも本当にあいまいではありません。 221 00:12:09,890 --> 00:12:11,600 これはいずれも困難でありません。 222 00:12:11,600 --> 00:12:15,810 これらは、すべての基本的なアルゴリズムであり、 あなたは今日実装できること。 223 00:12:15,810 --> 00:12:20,050 >> これからが本当の推薦システムと、 あなたはいくつかの問題に遭遇します。 224 00:12:20,050 --> 00:12:23,300 どのような誰もがない場合は誰 正確にあなたの好みにマッチしますか? 225 00:12:23,300 --> 00:12:27,170 ユーザーは何がある場合は誰 あなたの好みは正確であり、 226 00:12:27,170 --> 00:12:30,480 しかし、その後、急激にずれます あなたが好きなものから? 227 00:12:30,480 --> 00:12:36,210 私は古典的なゴジラが好き 映画、私の妻はしていません。 228 00:12:36,210 --> 00:12:39,430 私は、それらを見るのが好き Netflixのアカウントには、それらが含まれています。 229 00:12:39,430 --> 00:12:41,800 彼女のにはありません。 230 00:12:41,800 --> 00:12:45,230 私たちが起動したときに何が起こります このようなデータを混合? 231 00:12:45,230 --> 00:12:47,690 これらは、すべての課題です あなたが克服することができ、 232 00:12:47,690 --> 00:12:51,900 彼らはわずかに取ります より複雑なアルゴリズム。 233 00:12:51,900 --> 00:12:56,420 >> 今現実の世界では、これ 実際に動作しています、 234 00:12:56,420 --> 00:12:59,980 私たちは、コンテンツベースフィルタリングを使用するのですか 我々は協調フィルタリングを使用していますか? 235 00:12:59,980 --> 00:13:01,910 そして、その答えは、我々はそれらの両方を使用しています。 236 00:13:01,910 --> 00:13:06,350 ほぼすべての主要なユーザーの この場合、アマゾン、フェイスブック、ネットフリックス、 237 00:13:06,350 --> 00:13:11,200 パンドラ、それらはすべての組み合わせを使用 これらの異なる推薦システム。 238 00:13:11,200 --> 00:13:16,520 そして、我々はから選択を結合する場合 それぞれ、我々はハイブリッドシステムにそれらを呼び出します。 239 00:13:16,520 --> 00:13:20,750 彼らは何らかの形で依存します オブジェクト自体の特徴、 240 00:13:20,750 --> 00:13:24,710 そして、いくつかの点で彼らが依存します 他のユーザの嗜好。 241 00:13:24,710 --> 00:13:28,120 これらのハイブリッドシステム、 彼らはビッグビジネスです、 242 00:13:28,120 --> 00:13:30,830 彼らは今日現在何です。 243 00:13:30,830 --> 00:13:32,839 >> 私を結合するための非常に感謝しそう。 244 00:13:32,839 --> 00:13:35,380 私はあなたが少しを得ている願っています 何の理解のビット 245 00:13:35,380 --> 00:13:37,430 これらのシステムが動作させます。 246 00:13:37,430 --> 00:13:41,980 あなたがオンラインしている次回は、それを覚えています あなたはあなたの選択に影響を与えるだけでなく、 247 00:13:41,980 --> 00:13:44,680 しかし、潜在的に、誰も他の人のようにも。 248 00:13:44,680 --> 00:13:46,480 再度、感謝します。 249 00:13:46,480 --> 00:13:47,186