[MUSIC CHƠI] BRAIN SCASSELLATI: Chào mừng với hàng loạt CS50 AI. Tên tôi là Scass, và hôm nay chúng ta sẽ để nói về hệ thống tư. Bây giờ hệ thống âm thanh recommender loại giống như của một tên kỳ lạ. Nghe có vẻ như có lẽ nó nên được hệ thống đề nghị, và loại I đồng ý với bạn. Nhưng đó là những hệ thống giúp chọn ra những điều tương tự như bất cứ khi nào bạn chọn một cái gì đó trực tuyến. Netflix, ví dụ như sẽ đề nghị khác phim mà bạn có thể muốn xem. Hoặc Pandora sẽ đề xuất khác nhau bài hát mà bạn có thể muốn nghe. Amazon sẽ đề xuất những loại sản phẩm khác bạn có thể muốn mua. Facebook sẽ ngay cả một số người bạn khác mà bạn có thể muốn thêm vào. Mỗi hệ thống hoạt động bằng cách sử dụng loại cơ bản giống nhau của thuật toán, và đó là những gì chúng tôi sẽ nói chuyện về ngày hôm nay. Bây giờ những thuật toán là kinh doanh bất ngờ lớn. Netflix một vài năm trước ở 2009 cung cấp 1 triệu $ giải thưởng nếu bạn có thể cải thiện của họ Hệ thống khuyến nghị chỉ được 10%. Đó là 10%, tuy nhiên, đại diện cho một số lượng đáng kể của doanh nghiệp. Ước tính là khó đi qua, nhưng nhiều người tin rằng những khuyến nghị hệ thống cho một mua hàng trực tuyến hệ thống như Amazon dẫn đến một nơi nào đó giữa 10% và 25% tăng doanh thu. Vì vậy, bạn có thể tưởng tượng loại đĩa mà bạn đang nói về khi chúng ta suy nghĩ về ngay cả những thuật toán ít. Vì vậy, chúng ta hãy nhận được một số ví dụ. Làm thế nào mà những hệ thống thực sự làm việc? Có hai cơ bản các loại thuật toán được đưa ra khi chúng ta nói về kiến nghị tạo. Những người đầu tiên được gọi là nội dung dựa lọc. Và nội dung dựa lọc dựa khi tương đồng giữa các mục bản thân, đó là giữa hai bộ phim hoặc hai bài hát hoặc hai mặt hàng được mua. Chúng ta sẽ sử dụng phim là một ví dụ, nhưng điều này có thể áp dụng, thực sự, để bất kỳ loại của đối tượng mà chúng ta đang tìm kiếm. Vì vậy, nếu tôi nghĩ về một số phim từ năm ngoái, Tôi thấy Inside Out với trẻ em của tôi, họ yêu thích nó. Nhưng chúng tôi cũng đã có một sự lựa chọn. Chúng tôi có thể đã đi để xem Minions, chúng ta có thể nhìn thấy Age of ULTRON, hoặc chúng ta có thể đã thấy Ant Man trong rạp chiếu phim. Đối với bất kỳ của các phim ảnh, chúng ta có thể tưởng tượng tạo ra một danh sách các tính năng hoặc phẩm chất về những bộ phim khác nhau. Vì vậy, ví dụ, tôi có thể xem xét mà trong những phim hoạt hình được. Vâng, cả hai Inside Out và Minions đang hoạt hình. Cả Tuổi của ULTRON cũng không Ant Man là bộ phim hoạt hình. Và tôi có thể tưởng tượng được xây dựng lập một cấu trúc, một bảng liệt kê từng tài sản. Có phải họ hoạt hình hay không? Sau đó tôi có thể thêm nhiều hơn tính năng để bảng này bằng cách thêm nhiều hàng hơn vào cấu trúc này. Tôi có thể hỏi hay không phải là họ đang phim Marvel. Vâng, Inside Out và Minions không phải là phim Marvel, Tuổi của ULTRON và Ant Man chắc chắn được. Và tôi có thể yêu cầu bất kỳ loại phẩm chất khác nhau mà tôi muốn, bất kỳ loại tính năng đó có thể là quan trọng với tôi. Họ có một siêu nhân vật phản diện? Vâng, không có nhân vật phản diện siêu trong Inside Ra, nhưng có những người thân trong Minions và trong, rõ ràng, hai bộ phim siêu anh hùng. Tôi cũng có thể hỏi những câu như, tốt, Họ vượt qua các bài kiểm tra Bechdel? Có hai tên nhân vật nữ dành một số lượng đáng kể Hiện có một cuộc trò chuyện đó không liên quan đến những người đàn ông trong các diễn viên? Vâng, trong trường hợp này, Inside Out đi các kiểm tra, Minions không, Age of ULTRON vượt qua các bài kiểm tra, và Ant Man không. Bất kỳ một trong những tính năng Tôi có thể suy nghĩ về như là quan trọng đối với một số người. Tôi cũng có thể hỏi những câu như là Có bất kỳ người trong những bộ phim mà là cựu sinh viên từ hãy nói, Công viên và Vui chơi giải trí, một trong những chương trình yêu thích của tôi. Vâng, Inside Out có Amy Poehler, đó là một cựu sinh viên. Mà đếm. Jon Hamm là trong Minions. Paul Rudd là trong Ant Man, nhưng không có ai trong Age of ULTRON là trong công viên và Req cũng. Vì vậy, tôi có thể xây dựng danh sách này tính năng, và họ có thể thực sự được bất cứ điều gì về bộ phim. Họ có thể là về những gì tỉ lệ họ đã bị bắn trong, nó có thể là bao nhiêu chỗ họ bán trong tuần đầu của họ. Bất kỳ tính năng mà tôi muốn tạo ra tôi có thể đưa vào bảng này. Bây giờ, trong trường hợp này, tôi đã xây dựng tất cả các loại giá trị Bullion, có hay không, vượt qua hoặc thất bại, nhưng họ có thể là bất cứ điều gì. Họ có thể là các giá trị tùy ý. Đối với nội dung dựa lọc, những gì chúng ta đang đi làm là chúng ta sẽ xem xét hai cột trong bảng này và xem như thế nào giống nhau của chúng. Vì vậy, ví dụ, nếu tôi đi xem Inside Out, Tôi có thể hỏi, là những gì các phim khác mà tôi có thể sẵn sàng để đi xem. Đó là, những gì sẵn sàng tiêu tiền của tôi để đi xem. Và tôi có thể so sánh điều này bằng cách chỉ dùng hai cột, một từ trong ra ngoài và một từ bất kỳ bộ phim khác, và chỉ cần nhìn thấy bao nhiêu trong số các tính năng của trận đấu. Vì vậy, nếu tôi so sánh Inside Out với Minions, tốt, có ba điều ở đây trận đấu đó. Họ đang cả hoạt hình, không phải của họ phim Marvel, và cả hai người trong số họ có Công viên và cựu sinh viên Req. Vì vậy, tôi có thể đếm lên như thế nào nhiều trận đấu đã có, và trong trường hợp này có muốn được ba. Nếu tôi sau đó so sánh Inside Out với giả Tuổi của ULTRON, Tôi có thể nhìn xuống danh sách và nói, tốt, có chỉ có một điều mà phù hợp đó. Cả hai đều vượt qua được thử Bechtel, vì vậy đó là sẽ có một số điểm của một. Và giữa Inside Out và Ant Man, một lần nữa tôi có thể so sánh từng dòng bao nhiêu những điều phù hợp giữa hai người họ. Vâng, một của phim hoạt hình, một không. Một là một bộ phim Marvel, một là không. Một đã bị một siêu nhân vật phản diện, khác không. Một vượt qua Bechtel kiểm tra, một thất bại nó, nhưng cả hai đều có công viên và cựu sinh viên Req, vậy một lần nữa, nó được một điểm số một. Vì vậy, nếu tôi đang tìm kiếm phim mà là tương tự như trong ra ngoài, Tôi có thể tìm kiếm những bộ phim mà có số điểm cao nhất trong nội dung này Đề án lọc. Vì vậy, trong trường hợp này, tôi sẽ xem xét Minions để được gần gũi hơn và nhiều hơn nữa có khả năng là một cái gì đó rằng tôi sẽ dành tiền để xem hơn Tuổi của ULTRON hoặc Ant Man. Những nội dung dựa hệ thống lọc chỉ dựa vào tính chất của những bộ phim, và vì vậy tôi có thể xây dựng các chỉ bằng cách biết một cái gì đó về sản phẩm mà tôi có. Tôi có thể sử dụng bất kỳ các loại tính năng mà tôi muốn, và tôi có thể xây dựng thêm các tính năng phức tạp liên quan đến việc kiểm tra phức tạp hơn của một chất lượng như tôi đi cùng. Trong thực tế, tôi thậm chí có thể xem bảng này không như là một đối tượng tĩnh, mà như là kích thước trong một không gian nhà nước lớn hơn. Và tôi có thể bắt đầu nói về các khoảng cách giữa các bộ phim khác nhau. Đây là tất cả mọi thứ mà chúng ta biết làm thế nào họ làm bằng cách sử dụng các loại cấu trúc dữ liệu mà chúng ta đã thấy trong CS50. Vì vậy, tôi có thể tưởng tượng được xây dựng một cấu trúc dữ liệu cho một bộ phim. Có một cấu trúc mà tôi đã xây dựng được gọi là phim, và nó có năm mục Boolean trong đó. Là nó hoạt hình, nó là một Marvel bộ phim, nó có một siêu nhân vật phản diện, nó vượt qua được thử Bechdel, và đang có Công viên và cựu sinh viên Rec ở trong đó? Và mỗi người trong số này là một cấu trúc dữ liệu mà tôi có thể chiếm cho rằng bộ phim cụ thể. Sau đó tính toán cho dù hai phim tương tự hay không, điểm số của họ là gì, tôi có thể viết ra một tập hợp các giả mà tạo ra cùng một chức năng. Tức là, với một số bộ phim M1, tôi có thể tìm thấy những bộ phim tương tự nhất với nó bằng cách làm theo các mã giả. Tôi coi đó là tốt nhất hệ thống mà tôi đã tìm thấy ghi bàn, sự so sánh tốt nhất mà tôi đã tìm thấy. Đối với mỗi bộ phim khác Tôi sẽ đi qua, Tôi sẽ đặt một số trận đấu bằng 0. Và tôi sẽ đi qua đó bộ phim, một M1, bộ phim Tôi bắt đầu với, tôi sẽ kiểm tra mỗi và mọi tính năng rằng họ phải xem nếu có một trận đấu. Nếu có một trận đấu, tôi sẽ tăng tỷ số trận đấu. Và nếu vào kết thúc tỷ số trận đấu mà Tôi đã là tốt hơn so với hiện tại tốt nhất điểm số, sau đó tôi sẽ nhớ rằng điểm số tốt nhất, và đây là trận đấu tốt nhất mà tôi có. Cuối cùng, bất cứ phim đang ngồi trong trận đấu tốt nhất, đó là gần nhất Tôi đã có thể tới. Vì vậy, các nội dung dựa hệ thống lọc, tất cả đều có cấu trúc cơ bản này. Họ dựa vào các mục trong câu hỏi và không có gì về bất kỳ sở thích người dùng. Các cơ chế khác mà chúng tôi sử dụng trong đặt hàng để xây dựng hệ thống khuyến nghị được gọi là lọc cộng tác. Lọc cộng tác dựa trên không những phẩm chất của các đối tượng chính nó, nhưng làm thế nào mọi người, khác người sử dụng có nghĩa là, làm thế nào họ đã phản ứng với các đối tượng tương tự. Vì vậy, để tiếp tục với ví dụ bộ phim của tôi, Tôi có thể mất một loạt các bạn bè của tôi và khảo sát chúng về việc có hay họ không thích xem phim đặc biệt. Bây giờ nhiều nơi khác nhau sẽ tạo ra dữ liệu này theo những cách khác nhau. Bạn có thể quan sát trực tiếp của bạn người sử dụng, hoặc bạn có thể chỉ xem những gì họ chọn nếu bạn, ví dụ như Netflix. Mà phim nào họ xem? Tôi có thể hỏi một số của tôi bạn bè ở đây và tìm hiểu mà Jason thích tất cả các bộ phim ông nhìn thấy, không ngạc nhiên khi có. Andy chỉ thích Minions và dì Man. Sarah thích Inside Out và Avengers, đối diện của Andy. Và Sam, tốt, Sam thích tất cả những bộ phim siêu anh hùng, nhưng không ai trong số những bộ phim hoạt hình. Sau đó tôi có thể truy vấn cho một số mới cá nhân, một số người dùng khác như bản thân mình và yêu cầu, cũng, nếu tôi thích một trong những bộ phim này, bạn có thể làm cho một dự đoán về mà bộ phim tôi có thể thích khác. Đó là, nếu tôi thích Inside Out, mà phim khác tôi có thể cũng muốn xem dựa trên những gì người tương tự như đã làm? Đó là, tôi sẽ đi qua một Tôi sẽ lọc qua danh sách này và tìm thấy chỉ là cá nhân cũng thích Inside Out, người phù hợp sở thích của tôi. Vâng, điều đó có nghĩa rằng Andy và Sam, họ không thích Inside Out, vì vậy tôi sẽ không xem xét chúng. Tôi đang đi để thoát khỏi của họ dữ liệu để so sánh này. Sau đó tôi có thể nhìn vào những gì Jason và Sarah nghĩ và kiểm đếm lên mà trong những bộ phim mà họ nhìn thấy mà tôi thì không, cho dù họ thích họ Hay không. Tôi chỉ có thể đếm lên, chúng ta hãy nói votes. Vì vậy, Minions, ví dụ có thể có một bỏ phiếu cho nó, vì Jason thích nó. Cả Jason và Sarah thích Avengers, do đó, nó sẽ có hai phiếu. Và chỉ có Jason thích Ant Man, do đó, nó sẽ nhận được một phiếu bầu. Vì vậy, nếu phải thì khuyên cho bản thân mình mà của những bộ phim này Tôi có thể có nhiều khả năng để xem, tôi sẽ phải chọn Age of ULTRON: Avengers. Vì vậy, đối với bất kỳ của các hệ thống, bây giờ tôi đang sử dụng dữ liệu đã được tạo ra không phải về bản thân bộ phim, nhưng về các ưu đãi từ những người dùng khác. Điều này có một số khó khăn trong khóa học. Điều gì nếu bạn không có bất kỳ người dùng khác? Vâng, đó được gọi là vấn đề khởi động. Bạn phải có một số số lượng dữ liệu trước khi bạn có thể bắt đầu thực hiện các đề xuất này. Mặt trái của nó là một lần bạn bắt đầu thu thập dữ liệu, nếu bạn có thể thu thập thêm và ngày càng nhiều dữ liệu, bạn sẽ nhận được tốt hơn và tốt hơn và khuyến nghị tốt hơn. Bây giờ chúng ta có thể dịch này thành mã là tốt. Chúng tôi có thể xác định một khác nhau loại cấu trúc, trong trường hợp này, chúng tôi sẽ gọi nó là một người sử dụng. Và nó có những đặc điểm về mà phim này dùng thích. Họ có thích Inside Out, Minions, Avengers, và Ant Man. Sau đó chúng tôi có thể tạo ra một số giả để làm theo các thủ tục tương tự mà tôi đã sử dụng trước. Đó là, cho một cụ thể dùng x, hãy đề nghị một bộ phim mà x có thể thích. Chúng tôi có thể đi qua và cho tất cả các phim, chúng ta có thể khởi tạo một số điểm cho bộ phim đó là 0. Và sau đó chúng ta có thể tìm thấy tất cả của những người dùng khác có các ưu đãi như x. Và sau đó cho mỗi bộ phim mà họ thích, chúng tôi sẽ tăng số điểm của bộ phim đó. Cho dù bộ phim trong cuối cùng có số điểm cao nhất, đó là một trong tôi nên khuyên. Không ai trong số này là thực sự tối nghĩa. Không ai trong số này là một thách thức. Đây là tất cả các thuật toán cơ bản mà bạn có thể thực hiện ngày hôm nay. Bây giờ với hệ thống tư sản, bạn chạy vào một số vấn đề. Điều gì nếu không có ai người phù hợp với sở thích của bạn một cách chính xác? Nếu có những người dùng chính xác là sở thích của bạn, nhưng sau đó đi chệch mạnh từ những gì mà bạn thích? Tôi thích cổ điển Godzilla phim ảnh, nhưng vợ tôi thì không. Tôi thích xem chúng, tôi Tài khoản Netflix chứa chúng. Mình thì không. Điều gì xảy ra khi chúng ta bắt đầu trộn dữ liệu như thế này? Đây là tất cả những thách thức rằng bạn có thể vượt qua, họ chỉ cần đưa nhẹ các thuật toán phức tạp hơn. Bây giờ trong thế giới thực, mà thực sự hoạt động, Chúng tôi sử dụng nội dung dựa lọc hay chúng ta sử dụng lọc cộng tác? Và câu trả lời là chúng ta sử dụng cả hai. Hầu như tất cả những người sử dụng chủ yếu trong trường hợp này, Amazon, Facebook, Netflix, Pandora, họ đều sử dụng một sự kết hợp của các hệ thống khuyến nghị khác nhau. Và khi chúng ta kết hợp sự lựa chọn từ mỗi, chúng tôi gọi cho họ các hệ thống hybrid. Họ theo một cách nào phụ thuộc vào đặc điểm của các đối tượng chính nó, và trong một số cách thức mà họ phụ thuộc vào sở thích của người dùng khác. Những hệ thống hybrid, họ là những doanh nghiệp lớn, và họ gì ngày hôm nay là hiện tại. Vì vậy, cảm ơn rất nhiều vì đã tham gia tôi. Tôi hy vọng bạn đã nhận được một chút chút của một sự hiểu biết về những gì làm cho các hệ thống công trình. Tiếp theo thời gian bạn online, hãy nhớ rằng không chỉ ảnh hưởng đến bạn lựa chọn của bạn, nhưng có khả năng tất cả mọi người khác là là tốt. Cảm ơn lần nữa.