1 00:00:00,000 --> 00:00:03,416 >> [Musikwiedergabe] 2 00:00:03,416 --> 00:00:05,860 3 00:00:05,860 --> 00:00:08,180 >> BRAIN Scassellati: Willkommen auf den CS50 AI-Serie. 4 00:00:08,180 --> 00:00:12,600 Mein Name ist Scass, und heute werden wir über Empfehlungssysteme sprechen. 5 00:00:12,600 --> 00:00:15,780 Jetzt Empfehlungssysteme Sounds wie Art von einer ungeraden Namen. 6 00:00:15,780 --> 00:00:18,630 Es klingt wie es vielleicht sollte sein Empfehlungssysteme, 7 00:00:18,630 --> 00:00:21,290 und ich irgendwie einverstanden mit Ihnen. 8 00:00:21,290 --> 00:00:26,110 Aber das sind die Systeme, die helfen, Wählen Sie aus ähnlichen Dingen, wenn 9 00:00:26,110 --> 00:00:28,210 Sie etwas online zu wählen. 10 00:00:28,210 --> 00:00:32,119 Netflix, zum Beispiel werden andere vorschlagen Filme, die Sie vielleicht zu beobachten. 11 00:00:32,119 --> 00:00:36,660 Oder Pandora wird vorschlagen, verschiedene Songs, die Sie vielleicht zu hören. 12 00:00:36,660 --> 00:00:40,940 Amazon wird vorschlagen, welche Arten von andere Produkte möchten Sie vielleicht, um zu kaufen. 13 00:00:40,940 --> 00:00:43,520 Facebook wird sogar darauf hin, weitere Freunde 14 00:00:43,520 --> 00:00:45,440 dass Sie vielleicht hinzufügen. 15 00:00:45,440 --> 00:00:49,800 Jedes dieser Systeme arbeiten mit die gleiche grundlegende Art von Algorithmus, 16 00:00:49,800 --> 00:00:52,520 und das ist, was wir sind werde heute sprechen. 17 00:00:52,520 --> 00:00:56,860 >> Nun sind diese Algorithmen sind raschend großes Geschäft. 18 00:00:56,860 --> 00:01:01,130 Netflix vor einigen Jahren in 2009 bot eine $ 1.000.000 19 00:01:01,130 --> 00:01:07,240 Preis, wenn Sie verbessern könnten ihre Empfehlungssystem von nur 10%. 20 00:01:07,240 --> 00:01:11,960 Dass 10%, obwohl für einen beträchtliche Menge von Geschäft. 21 00:01:11,960 --> 00:01:15,330 Schätzungen sind schwer zu kommen durch, aber viele Leute 22 00:01:15,330 --> 00:01:19,050 glauben, dass diese Empfehlung Systeme für einen Online-Einkauf 23 00:01:19,050 --> 00:01:25,729 System wie Amazon Blei irgendwo zwischen 10% und 25% höhere Einnahmen. 24 00:01:25,729 --> 00:01:27,770 So können Sie das vorstellen, Art von Volumen, das Sie 25 00:01:27,770 --> 00:01:32,860 reden, wenn wir darüber nachdenken, sogar diese kleinen Algorithmen. 26 00:01:32,860 --> 00:01:35,200 >> Also lassen Sie uns einige Beispiele. 27 00:01:35,200 --> 00:01:38,460 Wie kommt es, dass diese Systeme wirklich funktionieren? 28 00:01:38,460 --> 00:01:40,773 Es gibt zwei grundlegende Arten von Algorithmen, 29 00:01:40,773 --> 00:01:45,050 im Spiel sind, wenn wir sprechen Erzeugungs Empfehlungen. 30 00:01:45,050 --> 00:01:48,650 Die ersten, die genannt werden der inhaltsbasierten Filterung. 31 00:01:48,650 --> 00:01:53,410 Und der inhaltsbasierten Filterung stützt auf Ähnlichkeiten zwischen den Einzelteile 32 00:01:53,410 --> 00:02:00,370 selbst ist zwischen zwei Filmen, dass oder zwei Songs oder zwei gekaufte Artikel. 33 00:02:00,370 --> 00:02:03,190 Wir werden Filme verwenden Als Beispiel, aber das 34 00:02:03,190 --> 00:02:07,850 könnte gelten, wirklich, für jede Art von Objekt, das wir suchen. 35 00:02:07,850 --> 00:02:13,330 >> Also, wenn ich über einige denken, Filme aus dem letzten Jahr, 36 00:02:13,330 --> 00:02:16,799 Ich sah Inside Out mit meine Kinder, sie liebten es. 37 00:02:16,799 --> 00:02:17,840 Aber wir hatten auch eine Wahl. 38 00:02:17,840 --> 00:02:21,350 Wir könnten gegangen, um Minions zu sehen haben, Wir Age of Ultron sehen konnte, 39 00:02:21,350 --> 00:02:24,850 oder wir gesehen haben könnte Ant Man in den Theatern. 40 00:02:24,850 --> 00:02:27,580 >> Für jede dieser Filme, die wir vorstellen kann 41 00:02:27,580 --> 00:02:33,320 Erzeugen einer Liste von Funktionen oder Eigenschaften über diese verschiedenen Filmen. 42 00:02:33,320 --> 00:02:37,190 So zum Beispiel, ich könnte in Erwägung ziehen welche dieser Filme animiert. 43 00:02:37,190 --> 00:02:39,960 Nun, beide Inside Out und Minions sind animiert. 44 00:02:39,960 --> 00:02:44,140 Weder Alter noch der Ultron Ant Man gibt animierte Filme. 45 00:02:44,140 --> 00:02:47,040 Und ich konnte Gebäudes vorstellen eine Struktur, eine Tabelle, 46 00:02:47,040 --> 00:02:49,440 listet jede dieser Eigenschaften. 47 00:02:49,440 --> 00:02:51,790 Werden sie animiert oder nicht? 48 00:02:51,790 --> 00:02:54,780 Ich konnte dann fügen Sie mehr Merkmale dieser Tabelle 49 00:02:54,780 --> 00:02:58,380 durch Hinzufügen von weiteren Zeilen in diese Struktur. 50 00:02:58,380 --> 00:03:00,970 Ich fragen konnte, ob nicht sie Marvel-Filme. 51 00:03:00,970 --> 00:03:04,010 Nun, Inside Out und Minions nicht Marvel-Filme, 52 00:03:04,010 --> 00:03:06,715 Age of Ultron und Ant Man sicherlich. 53 00:03:06,715 --> 00:03:09,100 >> Und ich konnte alle Arten Fragen verschiedener Qualitäten 54 00:03:09,100 --> 00:03:12,080 dass ich wollte, alle Arten von Funktionen das könnte mir wichtig zu sein. 55 00:03:12,080 --> 00:03:13,440 Haben sie ein Super-Bösewicht haben? 56 00:03:13,440 --> 00:03:16,700 Nun, es gibt keinen Superschurken in Inside Aus, aber es sind diejenigen, in Minions 57 00:03:16,700 --> 00:03:19,990 und natürlich der zwei Superhelden-Filme. 58 00:03:19,990 --> 00:03:23,900 >> Ich könnte auch Dinge wie, fragen, sie passieren die Bechdel Test? 59 00:03:23,900 --> 00:03:27,280 Gibt es zwei Namen weibliche Charaktere, die 60 00:03:27,280 --> 00:03:30,550 verbringen einige bedeutende Menge Zeit mit einem Gespräch, 61 00:03:30,550 --> 00:03:34,400 nicht um Menschen in der gegossenen? 62 00:03:34,400 --> 00:03:39,870 Nun, in diesem Fall geht Inside Out der Test scheitert Minions, Age of Ultron 63 00:03:39,870 --> 00:03:42,990 den Test und Ant Man scheitert. 64 00:03:42,990 --> 00:03:45,020 Eine dieser Funktionen Ich denken konnte 65 00:03:45,020 --> 00:03:48,660 als wichtig für einige Menschen. 66 00:03:48,660 --> 00:03:52,000 >> Ich könnte auch fragen, wie die Dinge sind, es Menschen in diesen Filmen, 67 00:03:52,000 --> 00:03:57,190 sind Alumni aus lassen Sie uns sagen, Parks und Erholung, einer meiner Lieblings-Shows. 68 00:03:57,190 --> 00:04:00,540 Nun, Inside Out Amy Poehler, das ist ein Alumni. 69 00:04:00,540 --> 00:04:01,530 Das zählt. 70 00:04:01,530 --> 00:04:04,110 Jon Hamm war in Minions. 71 00:04:04,110 --> 00:04:08,600 Paul Rudd war in Ant Man, aber niemand im Alter von Ultron war in Parks und Req 72 00:04:08,600 --> 00:04:10,150 auch. 73 00:04:10,150 --> 00:04:12,990 So kann ich bauen diese Liste Funktionen, und sie konnte wirklich 74 00:04:12,990 --> 00:04:14,710 alles über die Filme zu sein. 75 00:04:14,710 --> 00:04:17,329 Sie konnten zu sein, was Seitenverhältnis sie erschossen wurden, 76 00:04:17,329 --> 00:04:21,630 könnte es sein, wie viele Plätze sie auf ihrer Eröffnungswochenende verkauft. 77 00:04:21,630 --> 00:04:25,630 Jede Funktion, die ich will erzeugen kann ich in diese Tabelle zu setzen. 78 00:04:25,630 --> 00:04:29,600 >> Nun, in diesem Fall, ich gebaut haben alle Art von Bullion Werte, 79 00:04:29,600 --> 00:04:33,700 ja oder nein, bestehen oder nicht, aber sie könnte alles sein. 80 00:04:33,700 --> 00:04:36,690 Sie konnten beliebige Werte sein. 81 00:04:36,690 --> 00:04:39,070 Für der inhaltsbasierten Filterung, was wir tun werden 82 00:04:39,070 --> 00:04:42,810 wird wir werden prüfen, zwei Spalten dieser Tabelle 83 00:04:42,810 --> 00:04:45,660 und sehen, wie ähnlich sie sind. 84 00:04:45,660 --> 00:04:48,640 So zum Beispiel, wenn I ging zu Inside Out zu sehen, 85 00:04:48,640 --> 00:04:53,640 Ich könnte fragen, was sind die anderen Filme daß ich bereit zu gehen zu sehen. 86 00:04:53,640 --> 00:04:56,890 Das heißt, welche bereit sind, mein Geld zu gehen sehen. 87 00:04:56,890 --> 00:05:00,310 Und ich kann dies nur durch die Einnahme vergleichen die zwei Spalten, eine von innen nach außen 88 00:05:00,310 --> 00:05:03,300 und eine aus einem das andere Filme, und nur sehen, 89 00:05:03,300 --> 00:05:06,210 wie viele ihrer Merkmale übereinstimmen. 90 00:05:06,210 --> 00:05:09,660 Also, wenn ich vergleichen Inside Out mit Minions, na ja, es gibt 91 00:05:09,660 --> 00:05:10,910 drei Dinge, die hier zusammenpasst. 92 00:05:10,910 --> 00:05:16,200 Sie sind beide beseelt, keiner von ihnen sind Marvel Filme und beide 93 00:05:16,200 --> 00:05:18,420 haben Parks und Req Alumni. 94 00:05:18,420 --> 00:05:20,420 So konnte ich bis zählen, wie viele Spiele gab es, 95 00:05:20,420 --> 00:05:22,640 und in diesem Fall gäbe es drei sein. 96 00:05:22,640 --> 00:05:26,450 >> Wenn ich dann vergleichen Inside Out mit sagen wir mal, Alter der Ultron, 97 00:05:26,450 --> 00:05:28,430 Ich kann nach unten schauen die Liste und sagen, na ja, es gibt 98 00:05:28,430 --> 00:05:30,140 nur eine Sache, es passt. 99 00:05:30,140 --> 00:05:34,560 Beide passieren die Bechtel-Test, so das wird eine Punktzahl von eins sein. 100 00:05:34,560 --> 00:05:36,770 Und zwischen Inside Out und Ant Man, wieder ich 101 00:05:36,770 --> 00:05:41,420 kann Zeile für Zeile zu vergleichen, wie viele Dinge Match zwischen den beiden von ihnen. 102 00:05:41,420 --> 00:05:43,060 Nun, eines ist animiert, einer ist nicht. 103 00:05:43,060 --> 00:05:44,970 One ist ein Marvel-Film, einer nicht. 104 00:05:44,970 --> 00:05:47,280 Eines hat ein Super-Bösewicht, der andere nicht. 105 00:05:47,280 --> 00:05:49,480 Man geht die Bechtel Test fehlschlägt man es, 106 00:05:49,480 --> 00:05:54,450 aber sie haben beide Parks und Req schüler, Also noch einmal, wird es einen Score von einem. 107 00:05:54,450 --> 00:05:58,300 >> Also, wenn ich wurden für Filme suchen dass ähnelten Inside Out, 108 00:05:58,300 --> 00:06:02,170 Ich konnte für die Filme, die haben zu suchen die höchste Punktzahl in diesem Inhalt 109 00:06:02,170 --> 00:06:03,952 Filterschema. 110 00:06:03,952 --> 00:06:05,660 Also in diesem Fall, ich würde Minions betrachten 111 00:06:05,660 --> 00:06:08,330 engere und sein wahrscheinlich, etwas zu sein 112 00:06:08,330 --> 00:06:13,250 dass ich Geld ausgeben würde, um zu sehen, als Age of Ultron oder Ant Man. 113 00:06:13,250 --> 00:06:16,150 >> Diese Inhalte auf der Grundlage Filtersysteme verlassen sich nur 114 00:06:16,150 --> 00:06:18,670 auf die Eigenschaften des die Filme, und so habe ich 115 00:06:18,670 --> 00:06:21,930 Diese können nur durch das Wissen, zu bauen etwas über die Produkte 116 00:06:21,930 --> 00:06:23,500 das ich habe. 117 00:06:23,500 --> 00:06:26,050 Ich kann irgendwelche Arten verwenden Funktionen, die ich möchte, 118 00:06:26,050 --> 00:06:28,400 und ich kann mehr bauen Komplex verfügt, dass 119 00:06:28,400 --> 00:06:33,060 beinhalten komplexere Test von einer Qualität, wie ich entlang gehen. 120 00:06:33,060 --> 00:06:39,080 In der Tat, kann ich auch diese Tabelle anzeigen nicht als ein statisches Objekt, 121 00:06:39,080 --> 00:06:43,110 sondern als Dimensionen innerhalb eines größeren Zustandsraum. 122 00:06:43,110 --> 00:06:46,295 Und ich kann sprechen über die Abstände zwischen verschiedenen Filmen. 123 00:06:46,295 --> 00:06:49,300 124 00:06:49,300 --> 00:06:51,050 Das sind alles Dinge dass wir wissen, wie sie 125 00:06:51,050 --> 00:06:55,860 zu tun mit den Arten von Datenstrukturen dass wir bereits in CS50 gesehen. 126 00:06:55,860 --> 00:06:59,180 So konnte ich Gebäude vorstellen eine Datenstruktur für einen Film. 127 00:06:59,180 --> 00:07:02,390 Es gibt eine Struktur, die ich habe konstruiert genannt Film, 128 00:07:02,390 --> 00:07:04,369 und über fünf Boolean Einträge darin. 129 00:07:04,369 --> 00:07:07,160 Wird animiert, es ist ein Wunder- Film, hat es eine Super-Bösewicht, 130 00:07:07,160 --> 00:07:11,047 bedeutet es passieren die Bechdel-Test und gibt es Parks und Rec-Alumni in ihm? 131 00:07:11,047 --> 00:07:12,880 Und jedes von diesen ist ein Datenstruktur, die ich 132 00:07:12,880 --> 00:07:16,330 kann für diesen bestimmten Film zu besetzen. 133 00:07:16,330 --> 00:07:20,090 >> Dann berechnen, ob zwei Filme sind ähnlich oder nicht, 134 00:07:20,090 --> 00:07:23,330 was ihre Gäste ist, konnte ich schreiben Sie eine Reihe von Pseudo-Code, dass 135 00:07:23,330 --> 00:07:25,120 erzeugt die gleiche Funktion. 136 00:07:25,120 --> 00:07:30,100 Das ist, da einige Film M1, ich kann finden die ähnlichste Film, um ihn 137 00:07:30,100 --> 00:07:32,430 indem Sie dem Pseudocode. 138 00:07:32,430 --> 00:07:37,040 Ich halte welche ist die beste Scoring-System, das ich gefunden habe, 139 00:07:37,040 --> 00:07:39,920 der beste Vergleich, die ich gefunden habe. 140 00:07:39,920 --> 00:07:41,890 Für jeden anderen Film Ich werde zu durchlaufen, 141 00:07:41,890 --> 00:07:44,920 Ich werde einen Übereinstimmungswert gleich 0 gesetzt. 142 00:07:44,920 --> 00:07:47,920 Und ich werde durchmachen Film, ein M1, der Film 143 00:07:47,920 --> 00:07:51,500 Angefangen habe ich mit, ich werde überprüfen jede und jeder Funktion 144 00:07:51,500 --> 00:07:53,650 dass sie zu sehen, wenn es ein Spiel. 145 00:07:53,650 --> 00:07:56,460 Wenn es eine Übereinstimmung gibt, werde ich erhöhe den Übereinstimmungswert. 146 00:07:56,460 --> 00:08:00,480 Und wenn am Ende das Match-Score, Ich habe besser als die derzeit besten 147 00:08:00,480 --> 00:08:03,310 punkten, dann werde ich daran erinnern, dass beste Ergebnis, 148 00:08:03,310 --> 00:08:05,820 und dies ist das beste Spiel, das ich habe. 149 00:08:05,820 --> 00:08:09,450 Am Ende, welcher Film in beste Übereinstimmung sitzen, 150 00:08:09,450 --> 00:08:12,580 das ist die am nächsten Ich habe in der Lage zu kommen. 151 00:08:12,580 --> 00:08:14,890 So dass diese Inhalte auf der Grundlage Filtersysteme, 152 00:08:14,890 --> 00:08:16,900 sie alle haben diese Grundstruktur. 153 00:08:16,900 --> 00:08:20,910 Sie verlassen sich auf die Artikel in Frage und nichts 154 00:08:20,910 --> 00:08:24,590 über eine der Benutzereinstellungen. 155 00:08:24,590 --> 00:08:29,010 >> Der andere Mechanismus, die wir in bestellen Empfehlung Systeme zu bauen 156 00:08:29,010 --> 00:08:31,790 genannt Collaborative Filtering. 157 00:08:31,790 --> 00:08:36,520 Collaborative Filtering beruht auf nicht die Qualitäten des Objekts selbst, 158 00:08:36,520 --> 00:08:40,010 aber, wie die Menschen, andere Benutzer, die ist, wie sie haben 159 00:08:40,010 --> 00:08:43,370 reagierten auf diese gleichen Objekte. 160 00:08:43,370 --> 00:08:48,720 Also mit meinem Film Beispiel fortzusetzen, Ich könnte ein paar meiner Freunde nehmen 161 00:08:48,720 --> 00:08:53,180 und überblicken sie darüber, ob nicht sie wollten insbesondere Filme. 162 00:08:53,180 --> 00:08:56,560 Jetzt unterschiedlichen Stellen generiert Diese Daten können auf verschiedene Weise. 163 00:08:56,560 --> 00:08:59,630 Sie können direkt überblicken Ihre Benutzer, oder Sie könnten nur 164 00:08:59,630 --> 00:09:03,120 sehen, was sie wählen, wenn Sie, zum Beispiel Netflix. 165 00:09:03,120 --> 00:09:05,640 Welche Filme haben sie gesehen? 166 00:09:05,640 --> 00:09:08,670 >> Ich könnte einige meiner Frage Freunde hier und finden Sie heraus 167 00:09:08,670 --> 00:09:12,910 dass Jason liebte jeden Film er sah, nicht dort zu überraschen. 168 00:09:12,910 --> 00:09:15,590 Andy nur gefiel Minions und Tante Man. 169 00:09:15,590 --> 00:09:19,330 Sarah mochte Inside Out und Avengers, das Gegenteil von Andy. 170 00:09:19,330 --> 00:09:22,200 Und Sam, gut, mochte Sam alle Superhelden-Filme, 171 00:09:22,200 --> 00:09:24,960 aber keiner der animierten Filmen. 172 00:09:24,960 --> 00:09:30,630 >> Ich konnte dann für einige neue Abfrage Einzel, ein anderer Nutzer wie mich 173 00:09:30,630 --> 00:09:34,520 und fragen, gut, wenn ich mochte einer dieser Filme, 174 00:09:34,520 --> 00:09:38,600 können Sie eine Vorhersage über zu machen die anderen Filme, die ich vielleicht gefallen. 175 00:09:38,600 --> 00:09:41,890 Das heißt, wenn ich innen gefallen Out, das andere Filme 176 00:09:41,890 --> 00:09:48,460 Ich bin wahrscheinlich auch sehen wollen basierend auf, was ähnlich wie die Menschen getan haben? 177 00:09:48,460 --> 00:09:51,640 Das heißt, ich werde durch ein zu gehen Ich werde durch diese Liste zu filtern 178 00:09:51,640 --> 00:09:54,520 und finden Sie einfach die Personen, mochten auch 179 00:09:54,520 --> 00:09:57,680 Inside Out, die meine Vorlieben abgestimmt. 180 00:09:57,680 --> 00:10:00,824 Nun, das bedeutet, dass Andy und Sam, sie nicht mögen Inside Out, 181 00:10:00,824 --> 00:10:02,240 so werde ich nicht, um sie zu betrachten. 182 00:10:02,240 --> 00:10:06,130 Ich gehe, um loszuwerden, ihre Daten für diesen Vergleich. 183 00:10:06,130 --> 00:10:09,750 >> Ich kann dann an, was Jason schauen und Sarah dachte, und Tally 184 00:10:09,750 --> 00:10:13,780 up denen der Filme, die sie sahen, dass ich nicht, ob sie sie gern 185 00:10:13,780 --> 00:10:15,150 oder nicht. 186 00:10:15,150 --> 00:10:17,820 Ich habe gerade zu zählen könnte, sagen wir Stimmen. 187 00:10:17,820 --> 00:10:23,360 So Minions, zum Beispiel könnte man haben stimmen für sie, denn Jason hat es gefallen. 188 00:10:23,360 --> 00:10:27,170 Sowohl Jason und Sarah mochte Avengers, so wäre es zwei Stimmen. 189 00:10:27,170 --> 00:10:30,700 Und nur Jason gefallen Ant Man, so wäre es eine Stimme zu bekommen. 190 00:10:30,700 --> 00:10:34,870 Also, wenn ich musste dann empfehlen für mich selbst, welche dieser Filme 191 00:10:34,870 --> 00:10:41,470 Ich könnte wahrscheinlich sein zu beobachten, würde ich müssen Age of Ultron wählen: Avengers. 192 00:10:41,470 --> 00:10:44,490 >> So dass für jedes von diesen Systeme, jetzt bin ich mit 193 00:10:44,490 --> 00:10:49,260 Daten, die nicht über die generiert wurde Film selbst, sondern über die Präferenzen 194 00:10:49,260 --> 00:10:51,960 von anderen Usern. 195 00:10:51,960 --> 00:10:54,150 Dies hat einige Schwierigkeiten natürlich. 196 00:10:54,150 --> 00:10:55,920 Was passiert, wenn Sie nicht über andere Nutzer? 197 00:10:55,920 --> 00:10:58,770 Nun, das Startproblem genannt. 198 00:10:58,770 --> 00:11:03,760 Sie müssen einige haben Menge der Daten, bevor Sie 199 00:11:03,760 --> 00:11:07,560 in der Lage zu beginnen, diese Empfehlungen. 200 00:11:07,560 --> 00:11:10,940 Die Kehrseite davon ist, wenn Sie sammeln Daten, 201 00:11:10,940 --> 00:11:13,870 wenn Sie mehr sammeln und mehr und mehr Daten, 202 00:11:13,870 --> 00:11:17,850 Sie werden besser und besser und bessere Empfehlungen. 203 00:11:17,850 --> 00:11:21,650 >> Jetzt übersetzen wir könnten dies in Code auch. 204 00:11:21,650 --> 00:11:23,860 Wir können einen anderen zu definieren Art von Struktur, 205 00:11:23,860 --> 00:11:25,720 in diesem Fall werden wir es ein Benutzer anrufen. 206 00:11:25,720 --> 00:11:30,970 Und es geht um erhielt Funktionen die Filme dieser Benützer mag. 207 00:11:30,970 --> 00:11:34,560 Haben sie Lust Inside Out, Minions, Rächer und Ant Man. 208 00:11:34,560 --> 00:11:36,660 Wir könnten dann erzeugen einige Pseudocode zu folgen 209 00:11:36,660 --> 00:11:39,460 Die gleiche Vorgehensweise, die ich verwendet, bevor. 210 00:11:39,460 --> 00:11:43,460 Das heißt, bei einer bestimmten Benutzer x, lassen Sie uns empfehlen, einen Film 211 00:11:43,460 --> 00:11:46,107 daß x vielleicht gefallen. 212 00:11:46,107 --> 00:11:47,940 Wir können gehen durch und für alle Filme, 213 00:11:47,940 --> 00:11:51,410 können wir eine Punktzahl zu initialisieren für diesen Film 0 sein. 214 00:11:51,410 --> 00:11:54,080 Und dann können wir alle zu finden der andere Benutzer, 215 00:11:54,080 --> 00:11:57,630 haben die gleichen Einstellungen wie x. 216 00:11:57,630 --> 00:11:59,990 Und dann für jeden Film, dass sie wollten, 217 00:11:59,990 --> 00:12:02,340 wir werden die Partitur dieses Films zu erhöhen. 218 00:12:02,340 --> 00:12:05,010 Unabhängig davon, welche Film in die Ende die höchste Punktzahl, 219 00:12:05,010 --> 00:12:07,600 das ist der, den ich empfehlen sollte. 220 00:12:07,600 --> 00:12:09,890 >> Nichts davon ist wirklich dunkel. 221 00:12:09,890 --> 00:12:11,600 Nichts davon ist schwierig. 222 00:12:11,600 --> 00:12:15,810 Diese sind alle grundlegenden Algorithmen dass Sie heute implementieren könnte. 223 00:12:15,810 --> 00:12:20,050 >> Jetzt mit echten Empfehlungssysteme, Sie in einige Probleme laufen. 224 00:12:20,050 --> 00:12:23,300 Was passiert, wenn es ist niemand, der entspricht genau Ihren Wünschen? 225 00:12:23,300 --> 00:12:27,170 Was, wenn es Benutzern, sind genau Ihren Wünschen, 226 00:12:27,170 --> 00:12:30,480 aber dann drastisch abweichen von dem, was Sie wollen? 227 00:12:30,480 --> 00:12:36,210 Ich mag klassische Godzilla Filme, aber meine Frau nicht. 228 00:12:36,210 --> 00:12:39,430 Ich mag, sie zu beobachten, mein Netflix-Konto enthält sie. 229 00:12:39,430 --> 00:12:41,800 Ihr ist nicht. 230 00:12:41,800 --> 00:12:45,230 Was passiert, wenn wir anfangen, Mischen von Daten wie diese? 231 00:12:45,230 --> 00:12:47,690 Dies alles sind Herausforderungen dass Sie überwinden kann, 232 00:12:47,690 --> 00:12:51,900 sie nehmen Sie nur leicht komplexere Algorithmen. 233 00:12:51,900 --> 00:12:56,420 >> Jetzt in der realen Welt, die sind eigentlich Betriebs, 234 00:12:56,420 --> 00:12:59,980 verwenden wir der inhaltsbasierten Filterung oder verwenden wir Collaborative Filtering? 235 00:12:59,980 --> 00:13:01,910 Und die Antwort ist, dass wir von ihnen nutzen beides. 236 00:13:01,910 --> 00:13:06,350 Fast alle der wichtigsten Benutzer in Dieser Fall, Amazon, Facebook, Netflix, 237 00:13:06,350 --> 00:13:11,200 Pandora, sie alle eine Kombination aus verwenden diese verschiedenen Empfehlungssysteme. 238 00:13:11,200 --> 00:13:16,520 Und wenn wir kombinieren die Auswahl von jeder, wir nennen sie Hybridsysteme. 239 00:13:16,520 --> 00:13:20,750 Sie irgendwie hängen von der Merkmale des Objekts selbst, 240 00:13:20,750 --> 00:13:24,710 und in gewisser Weise sie davon abhängen, die Präferenzen anderer Nutzer. 241 00:13:24,710 --> 00:13:28,120 Diese Hybridsysteme, sie sind ein großes Geschäft, 242 00:13:28,120 --> 00:13:30,830 und sie sind, was aktuelle heute. 243 00:13:30,830 --> 00:13:32,839 >> Also vielen Dank für den Beitritt mich. 244 00:13:32,839 --> 00:13:35,380 Ich hoffe, dass Sie ein wenig bekommen haben bisschen ein Verständnis dessen, was 245 00:13:35,380 --> 00:13:37,430 macht diese Systeme. 246 00:13:37,430 --> 00:13:41,980 Nächstes Mal, wenn Sie online sind, daran erinnern, dass nicht nur Sie zu beeinträchtigen Auswahl 247 00:13:41,980 --> 00:13:44,680 aber potenziell allen anderen auch. 248 00:13:44,680 --> 00:13:46,480 Danke noch einmal. 249 00:13:46,480 --> 00:13:47,186