1
00:00:00,000 --> 00:00:03,416
>> [音楽再生]

2
00:00:03,416 --> 00:00:05,860

3
00:00:05,860 --> 00:00:08,180
>> 脳SCASSELLATI：ようこそ
CS50のAIシリーズへ。

4
00:00:08,180 --> 00:00:12,600
私の名前はScassで、今日はつもりです
推薦システムについて話をします。

5
00:00:12,600 --> 00:00:15,780
今推薦システムの音
奇数名の一種のように。

6
00:00:15,780 --> 00:00:18,630
それは多分それが必要のように聞こえます
推薦システムとすることが、

7
00:00:18,630 --> 00:00:21,290
私は種類のあなたに同意。

8
00:00:21,290 --> 00:00:26,110
しかし、これらは役立つシステムです
いつでも同じような物事を選択

9
00:00:26,110 --> 00:00:28,210
あなたがオンラインで何かを選択します。

10
00:00:28,210 --> 00:00:32,119
ネットフリックスは、例えば他の提案します
あなたが見たいと思うかもしれない映画。

11
00:00:32,119 --> 00:00:36,660
または、パンドラは異なる提案します
聴きたい曲かもしれません。

12
00:00:36,660 --> 00:00:40,940
Amazonはどのような種類のを提案します
他の製品は、あなたが購入することをお勧めします。

13
00:00:40,940 --> 00:00:43,520
Facebookはあっても提案します
他の友人の何人か

14
00:00:43,520 --> 00:00:45,440
あなたが追加したいかもしれません。

15
00:00:45,440 --> 00:00:49,800
これらのシステムの各々は、使用して動作します
アルゴリズムの同じ基本的な種類、

16
00:00:49,800 --> 00:00:52,520
それは私たちがしているものです
今日の話に行きます。

17
00:00:52,520 --> 00:00:56,860
>> 現在、これらのアルゴリズムは、
驚くほど大きなビジネス。

18
00:00:56,860 --> 00:01:01,130
数年前ではNetflix
2009 $ 1M（100万ドル）を提供しました

19
00:01:01,130 --> 00:01:07,240
賞品あなたはそれらを改善することができれば
わずか10％の推薦システム。

20
00:01:07,240 --> 00:01:11,960
その10％が、しかし、表し
事業のかなりの量。

21
00:01:11,960 --> 00:01:15,330
見積もりはしにくいです
で来るが、多くの人々

22
00:01:15,330 --> 00:01:19,050
これらの推奨事項と考えています
オンライン購入のためのシステム

23
00:01:19,050 --> 00:01:25,729
どこかにアマゾンリードのようなシステム
10％〜25％の収益を増加させました。

24
00:01:25,729 --> 00:01:27,770
だから、想像することができます
あなたがしているボリュームの種類

25
00:01:27,770 --> 00:01:32,860
我々が考えるときの話
でもこれらのほとんどのアルゴリズム。

26
00:01:32,860 --> 00:01:35,200
>> それでは、いくつかの例を取得してみましょう。

27
00:01:35,200 --> 00:01:38,460
それは、これらのことをどのように
システムは、本当に仕事？

28
00:01:38,460 --> 00:01:40,773
基本的な2があります。
そのアルゴリズムの種類

29
00:01:40,773 --> 00:01:45,050
我々はについて話すときのプレイであります
推奨を生成します。

30
00:01:45,050 --> 00:01:48,650
最初のものが呼び出され
コンテンツベースフィルタリング。

31
00:01:48,650 --> 00:01:53,410
そして、コンテンツベースフィルタリングは依存しています
アイテム間の類似性に

32
00:01:53,410 --> 00:02:00,370
それ自体、それは、二つの映画の間にあります
または2曲または2購入したアイテム。

33
00:02:00,370 --> 00:02:03,190
私たちは映画を使用するつもりです
例として、この

34
00:02:03,190 --> 00:02:07,850
いずれのタイプに、本当に、適用することができます
我々が探しているオブジェクトの。

35
00:02:07,850 --> 00:02:13,330
>> だから私はいくつかを考える場合
昨年から映画、

36
00:02:13,330 --> 00:02:16,799
私はインサイドアウトました
私の子供たちは、彼らはそれを愛しました。

37
00:02:16,799 --> 00:02:17,840
しかし、我々はまた、選択肢を持っていました。

38
00:02:17,840 --> 00:02:21,350
私たちは、手先を見に行っている可能性
我々はULTRONの時代を見たことができ、

39
00:02:21,350 --> 00:02:24,850
または私たちが見ている可能性が
劇場でのAntの男。

40
00:02:24,850 --> 00:02:27,580
>> これらのいずれかのために
映画は、我々が想像できます

41
00:02:27,580 --> 00:02:33,320
機能のリストを生成しますか、
これらの異なる映画についての資質。

42
00:02:33,320 --> 00:02:37,190
したがって、たとえば、私が検討することもでき
それらの映画のどのアニメーション化されます。

43
00:02:37,190 --> 00:02:39,960
まあ、両方のインサイドアウト
そして、手下をアニメーション化されます。

44
00:02:39,960 --> 00:02:44,140
ULTRONの時代どちらも
Antの男がアニメーション映画です。

45
00:02:44,140 --> 00:02:47,040
そして、私は建物を想像することができ
構造、テーブルアップ

46
00:02:47,040 --> 00:02:49,440
これらの各プロパティを示しています。

47
00:02:49,440 --> 00:02:51,790
彼らはアニメーションやいませんか？

48
00:02:51,790 --> 00:02:54,780
私は、より多くを追加することができます
この表の特徴

49
00:02:54,780 --> 00:02:58,380
この構造体に複数の行を追加します。

50
00:02:58,380 --> 00:03:00,970
私が求めることができるかどうか
彼らはマーベル映画だありません。

51
00:03:00,970 --> 00:03:04,010
まあ、インサイドアウトと手先
マーベル映画で​​はありません、

52
00:03:04,010 --> 00:03:06,715
ULTRONとAnt男の年齢は確かにありま​​す。

53
00:03:06,715 --> 00:03:09,100
>> そして、私は、任意の種類を求めることができます
異なる性質

54
00:03:09,100 --> 00:03:12,080
私が望んでいたことを、特徴の任意の種類
それは私にとって重要であるかもしれません。

55
00:03:12,080 --> 00:03:13,440
彼らは超悪役を持っていますか？

56
00:03:13,440 --> 00:03:16,700
まあ、内部には超悪役はありません
アウトが、手下でものがあります

57
00:03:16,700 --> 00:03:19,990
そして、で、明らかに、
2スーパーヒーロー映画。

58
00:03:19,990 --> 00:03:23,900
>> 私も、よく、のようなものを求めることができます
彼らはBechdel試験に合格するのですか？

59
00:03:23,900 --> 00:03:27,280
名前の2つがあります
女性キャラクター誰

60
00:03:27,280 --> 00:03:30,550
いくつかのかなりの量を過ごします
時間会話をしています

61
00:03:30,550 --> 00:03:34,400
キャストの男性を必要としませんか？

62
00:03:34,400 --> 00:03:39,870
さて、この場合には、インサイドアウトは合格
ULTRONのテスト、手下が失敗し、年齢

63
00:03:39,870 --> 00:03:42,990
テストに合格し、Antの人が失敗します。

64
00:03:42,990 --> 00:03:45,020
これらの特徴のいずれか
私は考えることができ

65
00:03:45,020 --> 00:03:48,660
何人かの人々のために重要であるとして。

66
00:03:48,660 --> 00:03:52,000
>> 私はまた、アールのようなものを求めることができます
そこに、これらの映画の中で任意の人々

67
00:03:52,000 --> 00:03:57,190
のは言わせてから卒業生、公園とは
レクリエーション、私のお気に入りの番組の一つ。

68
00:03:57,190 --> 00:04:00,540
まあ、インサイドアウトは、エイミーがあります
ポーラーは、それが卒業生です。

69
00:04:00,540 --> 00:04:01,530
それがカウントされます。

70
00:04:01,530 --> 00:04:04,110
ジョン・ハムは手下にありました。

71
00:04:04,110 --> 00:04:08,600
ポール・ラッドは、Antの男であったが、誰も
ULTRONの時代に公園や必須でした

72
00:04:08,600 --> 00:04:10,150
同様に。

73
00:04:10,150 --> 00:04:12,990
だから私はこのリストを構築することができます
機能、そして、彼らは本当にできました

74
00:04:12,990 --> 00:04:14,710
映画について何もします。

75
00:04:14,710 --> 00:04:17,329
彼らは約何ができますか
アスペクト比は、それらがで撮影されました、

76
00:04:17,329 --> 00:04:21,630
それは彼らがどのように多くの議席かもしれません
そのオープニングの週末で販売。

77
00:04:21,630 --> 00:04:25,630
私がしたいすべての機能
私はこのテーブルに置くことができます生成されます。

78
00:04:25,630 --> 00:04:29,600
>> さて、このケースでは、私が構築しました
地金値のすべての並べ替え、

79
00:04:29,600 --> 00:04:33,700
yesまたはno、合否、
しかし、彼らは何でもかまいません。

80
00:04:33,700 --> 00:04:36,690
彼らは、任意の値である可能性があります。

81
00:04:36,690 --> 00:04:39,070
コンテンツベースフィルタリングについては、
私たちがやろうとしています

82
00:04:39,070 --> 00:04:42,810
我々が検討するつもりされています
この表の2列

83
00:04:42,810 --> 00:04:45,660
彼らがどの程度似ているかを参照してください。

84
00:04:45,660 --> 00:04:48,640
例えば、もしだから私
インサイドアウトを見に行きました、

85
00:04:48,640 --> 00:04:53,640
私は他の映画は何、頼むかもしれません
私が見に行くことをいとわないかもしれないという。

86
00:04:53,640 --> 00:04:56,890
それは、どのように意思があります
見に行くために私のお金を費やしています。

87
00:04:56,890 --> 00:05:00,310
そして私はちょうど取ることによって、これを比較することができます
2列、インサイドアウトから1

88
00:05:00,310 --> 00:05:03,300
とのいずれかから1を
他の映画、とだけ見て

89
00:05:03,300 --> 00:05:06,210
どのように多くの彼らの特徴の試合の。

90
00:05:06,210 --> 00:05:09,660
だから私はインサイドアウトを比較した場合
手下で、よく、あります

91
00:05:09,660 --> 00:05:10,910
ここに三つのことに一致。

92
00:05:10,910 --> 00:05:16,200
これらは両方とも、それらのどちらもアニメ化しています
マーベル映画があり、それらの両方

93
00:05:16,200 --> 00:05:18,420
公園や必須卒業生を持っています。

94
00:05:18,420 --> 00:05:20,420
だから私はどのようにカウントアップができました
多くの試合がありました

95
00:05:20,420 --> 00:05:22,640
この場合、3があると思います。

96
00:05:22,640 --> 00:05:26,450
>> 私は、インサイドアウトを比較すると
聞かせてのは、ULTRONの年齢を言います

97
00:05:26,450 --> 00:05:28,430
私はリストを下に見ることができます
よく、そこだ、と言います

98
00:05:28,430 --> 00:05:30,140
そこに一致した一つだけ。

99
00:05:30,140 --> 00:05:34,560
彼らは両方のように、ベクテルテストに合格
それは、一つのスコアになるだろう。

100
00:05:34,560 --> 00:05:36,770
そして、インサイドアウトの間
Ant男、再び私は

101
00:05:36,770 --> 00:05:41,420
どのように多くの行ごとに比較することができます
物事はそれらのうちの2つの間に一致します。

102
00:05:41,420 --> 00:05:43,060
まあ、自分のアニメーション、1ではありません。

103
00:05:43,060 --> 00:05:44,970
一つは、一つではありません、マーベルの映画です。

104
00:05:44,970 --> 00:05:47,280
一つのスーパー悪役を持って、
他にはありません。

105
00:05:47,280 --> 00:05:49,480
一つは、ベクテルを渡します
テストでは、人はそれを失敗し、

106
00:05:49,480 --> 00:05:54,450
しかし、彼らの両方が、公園や必須卒業生を持っています
そう、再び、それは1のスコアを取得します。

107
00:05:54,450 --> 00:05:58,300
>> だから私は映画を探していた場合
それは、インサイドアウトと同様でした

108
00:05:58,300 --> 00:06:02,170
私は映画のためになります
このコンテンツ内の最高スコア

109
00:06:02,170 --> 00:06:03,952
フィルタリング方式。

110
00:06:03,952 --> 00:06:05,660
私は、このケースでそう
手下を検討します

111
00:06:05,660 --> 00:06:08,330
近づくとよりなるように
何かである可能性が高いです

112
00:06:08,330 --> 00:06:13,250
私が見るためにお金を使うだろうと
ULTRONまたはAnt人間の年齢よりも。

113
00:06:13,250 --> 00:06:16,150
>> これらのコンテンツベース
フィルタリングシステムは、単に頼ります

114
00:06:16,150 --> 00:06:18,670
の特性に
映画、私

115
00:06:18,670 --> 00:06:21,930
ちょうど知ることによって、これらを構築​​することができます
製品について何か

116
00:06:21,930 --> 00:06:23,500
私が持っていること。

117
00:06:23,500 --> 00:06:26,050
私は、任意の種類を使用することができます
私が好きな機能、

118
00:06:26,050 --> 00:06:28,400
私はより多くを構築することができます
複雑な機能その

119
00:06:28,400 --> 00:06:33,060
より複雑なテストを必要とします
私が一緒に行くような品質の。

120
00:06:33,060 --> 00:06:39,080
実は、私もこのテーブルを表示することができます
ない1静的オブジェクトであるとして、

121
00:06:39,080 --> 00:06:43,110
むしろ寸法であるとして
大きな状態空間内。

122
00:06:43,110 --> 00:06:46,295
そして、私はについて話し始めることができます
別の映画の間の距離。

123
00:06:46,295 --> 00:06:49,300

124
00:06:49,300 --> 00:06:51,050
これらは、すべてのものです
私たちはどのように知っています

125
00:06:51,050 --> 00:06:55,860
データ構造の種類を用いて行います
我々はすでにCS50で見てきたこと。

126
00:06:55,860 --> 00:06:59,180
だから私は建物を想像することができ
映画のためのデータ構造。

127
00:06:59,180 --> 00:07:02,390
私がきた構造があります
構築という映画、

128
00:07:02,390 --> 00:07:04,369
そして、それはそれで5ブールのエントリがあります。

129
00:07:04,369 --> 00:07:07,160
それがアニメーション化され、それは驚異です
映画は、それが超悪役を持っていません、

130
00:07:07,160 --> 00:07:11,047
それはBechdel試験に合格しないと、
公園や録音の卒業生は、その中にあるのですか？

131
00:07:11,047 --> 00:07:12,880
これらの各々は
私のデータ構造

132
00:07:12,880 --> 00:07:16,330
その特定の映画のために占有することができます。

133
00:07:16,330 --> 00:07:20,090
>> その後2かどうかを計算
同様のかそうでない映画、

134
00:07:20,090 --> 00:07:23,330
そのスコアが何であるか、私は可能性
擬似コードのセットを書き出すこと

135
00:07:23,330 --> 00:07:25,120
同じ関数を生成します。

136
00:07:25,120 --> 00:07:30,100
それは私がすることができ、いくつかの映画M1与え、あります
それに最も類似動画を検索

137
00:07:30,100 --> 00:07:32,430
擬似コードを以下によります。

138
00:07:32,430 --> 00:07:37,040
私は、最適な検討します
私が見つけた得点システム、

139
00:07:37,040 --> 00:07:39,920
私が見つけた最高の比較。

140
00:07:39,920 --> 00:07:41,890
他のすべての映画のために
私は、通過するつもりです

141
00:07:41,890 --> 00:07:44,920
私は0に等しいマッチスコアを設定します。

142
00:07:44,920 --> 00:07:47,920
そして、私はそれを通って行きますよ
映画、M1、映画

143
00:07:47,920 --> 00:07:51,500
私がチェックします、で開始
一人ひとりの特徴

144
00:07:51,500 --> 00:07:53,650
彼らが見ていること
一致がある場合は。

145
00:07:53,650 --> 00:07:56,460
マッチがあれば、私はよ
試合のスコアを増加させます。

146
00:07:56,460 --> 00:08:00,480
そして、その末尾にマッチスコアの場合
私は現在のベストよりも優れています

147
00:08:00,480 --> 00:08:03,310
その後、私はよ、スコア
その最高のスコアを覚えて、

148
00:08:03,310 --> 00:08:05,820
これは私が持っているベストマッチです。

149
00:08:05,820 --> 00:08:09,450
最後には、どのような映画
ベストマッチに座っています、

150
00:08:09,450 --> 00:08:12,580
それは近いです
私は来ることができました。

151
00:08:12,580 --> 00:08:14,890
したがって、これらの内容は、ベース
フィルタリングシステム、

152
00:08:14,890 --> 00:08:16,900
それらはすべて、この基本的な構造を有しています。

153
00:08:16,900 --> 00:08:20,910
彼らは、アイテムに依存しています
質問と何もで

154
00:08:20,910 --> 00:08:24,590
ユーザーの好みのいずれかについて。

155
00:08:24,590 --> 00:08:29,010
>> 私たちが使用する他のメカニズム
推薦システムを構築するため

156
00:08:29,010 --> 00:08:31,790
協調フィルタリングと呼ばれています。

157
00:08:31,790 --> 00:08:36,520
協調フィルタリングはに依存しています
オブジェクト自体のない資質、

158
00:08:36,520 --> 00:08:40,010
しかし、どのように人々、他の
彼らがきたか、あるユーザー

159
00:08:40,010 --> 00:08:43,370
これらの同じオブジェクトに反応しました。

160
00:08:43,370 --> 00:08:48,720
だから私の映画の例を続行し、
私は私の友人の束がかかる場合があります

161
00:08:48,720 --> 00:08:53,180
そしてかどうかについてのそれらを調査
彼らは、特定の映画が好きではありません。

162
00:08:53,180 --> 00:08:56,560
今、別の場所に生成されます。
さまざまな方法でこのデータ。

163
00:08:56,560 --> 00:08:59,630
あなたは直接調査することができます
ユーザー、またはあなただけの可能性

164
00:08:59,630 --> 00:09:03,120
彼らがあれば選択内容を確認
あなたは、例えばNetflixのために、です。

165
00:09:03,120 --> 00:09:05,640
彼らは、どの映画を見たのですか？

166
00:09:05,640 --> 00:09:08,670
>> 私は自分の一部に疑問かもしれません
ここで友人と見つけます

167
00:09:08,670 --> 00:09:12,910
ジェイソンは、すべての映画を気に入っていること
彼はそこに驚くべきことではない、見ました。

168
00:09:12,910 --> 00:09:15,590
アンディは、手下とおばさん男が好きでした。

169
00:09:15,590 --> 00:09:19,330
サラはインサイドアウトが好きで、
アベンジャーズ、アンディの反対。

170
00:09:19,330 --> 00:09:22,200
そして、サムは、よく、サムは言っています
スーパーヒーロー映画のすべて、

171
00:09:22,200 --> 00:09:24,960
しかし、アニメーション映画のどれも。

172
00:09:24,960 --> 00:09:30,630
>> 私は、いくつかの新しいを照会することができ
個々の、私のようないくつかの他のユーザー

173
00:09:30,630 --> 00:09:34,520
私が好きならと、よく、頼みます
これらの映画の一つ、

174
00:09:34,520 --> 00:09:38,600
あなたはについての予測を行うことができます
これは私が好むかもしれない他の映画。

175
00:09:38,600 --> 00:09:41,890
私は内部好きならつまり、
アウト、これは他の映画

176
00:09:41,890 --> 00:09:48,460
私も見たいしそうです
同じような人が何をしたかに基づいて？

177
00:09:48,460 --> 00:09:51,640
つまり、私が通って行きますよ
私はこのリストをフィルタリングします

178
00:09:51,640 --> 00:09:54,520
ちょうど見つけます
また、気に入った人

179
00:09:54,520 --> 00:09:57,680
私の好みにマッチしたアウト、インサイド。

180
00:09:57,680 --> 00:10:00,824
まあ、それはつまり、アンディと
サムは、彼らが、インサイドアウト好きではなかったです

181
00:10:00,824 --> 00:10:02,240
私はそれらを考慮するつもりはありません。

182
00:10:02,240 --> 00:10:06,130
私は彼らを取り除くつもりです
この比較のためのデータ。

183
00:10:06,130 --> 00:10:09,750
>> 私は、どのようなジェイソンで見ることができます
そして、サラは考えて、タリー

184
00:10:09,750 --> 00:10:13,780
彼らが見た映画のどのアップ
私は、彼らが彼らが好きかどうか、しなかったこと

185
00:10:13,780 --> 00:10:15,150
か否か。

186
00:10:15,150 --> 00:10:17,820
私はちょうどのが票を言わせて、カウントアップ可能性があります。

187
00:10:17,820 --> 00:10:23,360
手下ので、例えば1を持っている可能性があります
ジェイソンはそれが好きので、それに投票。

188
00:10:23,360 --> 00:10:27,170
ジェイソンとサラの両方がアベンジャーズを気に入って、
ので、2票を持っているでしょう。

189
00:10:27,170 --> 00:10:30,700
そして唯一のジェイソンは、Antの男が好き
それは、一票になるだろう。

190
00:10:30,700 --> 00:10:34,870
だから私は、お勧めしていた場合
これらの映画の自分れます

191
00:10:34,870 --> 00:10:41,470
私はでしょう、見て最も可能性が高いかもしれません
アベンジャーズ2を選択する必要があります。

192
00:10:41,470 --> 00:10:44,490
>> これらのいずれかのためにそう
今私が使用しているシステムでは、

193
00:10:44,490 --> 00:10:49,260
ではありません生成されたデータ
映画そのものではなく、環境設定について

194
00:10:49,260 --> 00:10:51,960
他のユーザから。

195
00:10:51,960 --> 00:10:54,150
これは、もちろん、いくつかの困難を有しています。

196
00:10:54,150 --> 00:10:55,920
あなたが他のユーザーを持っていない場合はどう？

197
00:10:55,920 --> 00:10:58,770
まあ、それは起動時の問題と呼ばれています。

198
00:10:58,770 --> 00:11:03,760
あなたはいくつかを持っている必要があります
データの量、あなたがしている前に、

199
00:11:03,760 --> 00:11:07,560
作り始めることができます
これらの推奨事項。

200
00:11:07,560 --> 00:11:10,940
それのフリップ側は一回です
あなたは、データの収集を開始します

201
00:11:10,940 --> 00:11:13,870
あなたはより多くを収集することができる場合
そして、より多くのデータ、

202
00:11:13,870 --> 00:11:17,850
あなたは良くなるでしょう
より良い提言。

203
00:11:17,850 --> 00:11:21,650
>> 今、私たちは翻訳することができ
コー​​ドにこれも同様に。

204
00:11:21,650 --> 00:11:23,860
我々は、さまざまなを定義することができます
構造の種類、

205
00:11:23,860 --> 00:11:25,720
このケースでは、ユーザーにそれを呼ぶことにします。

206
00:11:25,720 --> 00:11:30,970
そして、それはについての特徴を持っています
これは映画のこのユーザーが好きでした。

207
00:11:30,970 --> 00:11:34,560
彼らはインサイドアウトが好きでした、
手下、アベンジャーズ、とAntマン。

208
00:11:34,560 --> 00:11:36,660
それから、生成することができます
従うべきいくつかの擬似コード

209
00:11:36,660 --> 00:11:39,460
私が前に使用したのと同じ手順。

210
00:11:39,460 --> 00:11:43,460
すなわち、特定の与えられ
ユーザX、の映画をお勧めしてみましょう

211
00:11:43,460 --> 00:11:46,107
そのxが好むかもしれません。

212
00:11:46,107 --> 00:11:47,940
我々は通過して行くことができます
映画のすべてのために、

213
00:11:47,940 --> 00:11:51,410
我々はスコアを初期化することができます
その映画0であるために。

214
00:11:51,410 --> 00:11:54,080
そして、我々はすべてを見つけることができます
他のユーザーの誰

215
00:11:54,080 --> 00:11:57,630
xと同じ嗜好を持っています。

216
00:11:57,630 --> 00:11:59,990
そしてすべてのための
彼らは言っています映画、

217
00:11:59,990 --> 00:12:02,340
私たちは、その映画のスコアをインクリメントします。

218
00:12:02,340 --> 00:12:05,010
でどちらの映画
最後は最高のスコアを持っています、

219
00:12:05,010 --> 00:12:07,600
それは私がお勧めする必要があります一つです。

220
00:12:07,600 --> 00:12:09,890
>> これのどれも本当にあいまいではありません。

221
00:12:09,890 --> 00:12:11,600
これはいずれも困難でありません。

222
00:12:11,600 --> 00:12:15,810
これらは、すべての基本的なアルゴリズムであり、
あなたは今日実装できること。

223
00:12:15,810 --> 00:12:20,050
>> これからが本当の推薦システムと、
あなたはいくつかの問題に遭遇します。

224
00:12:20,050 --> 00:12:23,300
どのような誰もがない場合は誰
正確にあなたの好みにマッチしますか？

225
00:12:23,300 --> 00:12:27,170
ユーザーは何がある場合は誰
あなたの好みは正確であり、

226
00:12:27,170 --> 00:12:30,480
しかし、その後、急激にずれます
あなたが好きなものから？

227
00:12:30,480 --> 00:12:36,210
私は古典的なゴジラが好き
映画、私の妻はしていません。

228
00:12:36,210 --> 00:12:39,430
私は、それらを見るのが好き
Netflixのアカウントには、それらが含まれています。

229
00:12:39,430 --> 00:12:41,800
彼女のにはありません。

230
00:12:41,800 --> 00:12:45,230
私たちが起動したときに何が起こります
このようなデータを混合？

231
00:12:45,230 --> 00:12:47,690
これらは、すべての課題です
あなたが克服することができ、

232
00:12:47,690 --> 00:12:51,900
彼らはわずかに取ります
より複雑なアルゴリズム。

233
00:12:51,900 --> 00:12:56,420
>> 今現実の世界では、これ
実際に動作しています、

234
00:12:56,420 --> 00:12:59,980
私たちは、コンテンツベースフィルタリングを使用するのですか
我々は協調フィルタリングを使用していますか？

235
00:12:59,980 --> 00:13:01,910
そして、その答えは、我々はそれらの両方を使用しています。

236
00:13:01,910 --> 00:13:06,350
ほぼすべての主要なユーザーの
この場合、アマゾン、フェイスブック、ネットフリックス、

237
00:13:06,350 --> 00:13:11,200
パンドラ、それらはすべての組み合わせを使用
これらの異なる推薦システム。

238
00:13:11,200 --> 00:13:16,520
そして、我々はから選択を結合する場合
それぞれ、我々はハイブリッドシステムにそれらを呼び出します。

239
00:13:16,520 --> 00:13:20,750
彼らは何らかの形で依存します
オブジェクト自体の特徴、

240
00:13:20,750 --> 00:13:24,710
そして、いくつかの点で彼らが依存します
他のユーザの嗜好。

241
00:13:24,710 --> 00:13:28,120
これらのハイブリッドシステム、
彼らはビッグビジネスです、

242
00:13:28,120 --> 00:13:30,830
彼らは今日現在何です。

243
00:13:30,830 --> 00:13:32,839
>> 私を結合するための非常に感謝しそう。

244
00:13:32,839 --> 00:13:35,380
私はあなたが少しを得ている願っています
何の理解のビット

245
00:13:35,380 --> 00:13:37,430
これらのシステムが動作させます。

246
00:13:37,430 --> 00:13:41,980
あなたがオンラインしている次回は、それを覚えています
あなたはあなたの選択に影響を与えるだけでなく、

247
00:13:41,980 --> 00:13:44,680
しかし、潜在的に、誰も他の人のようにも。

248
00:13:44,680 --> 00:13:46,480
再度、感謝します。

249
00:13:46,480 --> 00:13:47,186