[Glazbom] SPEAKER: Dobrodošli natrag, svakoga. Ovo je CS50. I danas, imamo mnogo zanimljivosti o čemu razgovarati. Prvo, iako, moram podsjetiti ste od rijetkih upravnih stvari. Ovaj tjedan je kviz jedan, srijeda ili dijelu Yale utorkom i četvrtkom, u četvrtak. Postoji kviz recenzije Večeras na Yaleu, 5:30 do 7:00. Na Harvardu, snimili su jednu jučer. I svatko može gledati tu online. Također, ovaj tjedan ili početkom sljedećeg tjedna, imamo posljednju CS50 predavanje. [Uzdiše] Znam. Tako brzo je došao. Yale studenti će imati live predavanje ovdje u pravni fakultet Gledalište je u petak. Tu će biti kolač. Harvardski studenti će imati Posljednji predavanje u Sandersa u ponedjeljak. Tu će također biti torta. Također, ovaj tjedan u petak, za one od vas koji dolazite u New Havenu, imamo CS50 Expo. Imamo više od 30 registrirana različite skupine vam pokazati sve od autonomnih jedrilicama, sustava koje prepoznaju digitalne portreta, na računalu glazba i računalno proizvedene glazbe. Dakle, molimo Vas da nam se pridružite. Mislim da će to biti sjajna prilika. Danas, međutim, možemo doći do i dalje govorimo o AI, o umjetnoj inteligenciji. I jedna od stvari koje ćemo doći do danas je ideja kako koristiti AI za rješavanje problema. Sada, kao i uvijek, krenimo s nečim jednostavnim. A mi ćemo za početak s jednostavnom idejom. I to je pomoću pretraživanja. Pa zamislite na trenutak da sam imaju zadatak da trebam obaviti. I ja bih da se taj zadatak automatizirani neki programski agent. Zamislite da pokušavam rezervirati set letova iz, recimo, Boston u San Francisco. Mogao sam proći i sam mogao koristiti jedan od prekrasnih online pretraživanja alata, koji će učiniti u osnovi isti proces koji smo će prošetati do danas. Ali ako nisu imali da alat, što biste učinili? Pa, što bi moglo izgledati i vidjeti i reći, ja sam u Bostonu. Koji letovi su mi dostupni? Sad, možda imam tri Mogući letovi iz Bostona koji će stati vrijeme kad trebam otići. Mogao sam letjeti u Chicago. Ili bih mogao letjeti u Miamiju. Ili sam mogao odletjeti u New York. I onda mogao tražiti od svakog jedan od onih odredište gradova i razmišljati o tome što mjestima Ja eventualno mogao doći iz svake od tih pojedinih gradova. Dakle, možda iz Chicaga, mogu dobiti izravni let za San Francisco. To je izvrsno. Ili bih mogao dobiti let za Denver. Sad, možda je let za San Francisco je idealno rješenje za mene, ali možda i ne. Možda sam u potrazi za nečim to je malo jeftinije ili malo bolje za moj raspored. I tako sam mogao tražiti ono što drugima mogućnosti može biti vani. Tako sam mogao gledati u Denveru. I iz Denvera, dobro, možda Ja mogu dobiti let za Austinu. A iz Austina, možda ja mogu dobiti let u Phoenix, a iz Phoenixa u San Francisco. Sad, nisam još učinio. Jer možda postoji izravni let iz New Yorka San Francisco koji je savršen za mene. Ili možda postoji let iz Miamija kroz Denver je to puno jeftinije. Tako sam i dalje moram ići. I dalje morati gledati na sve one gradovi koji još nisam istražuju. Moram iscrpno provjeriti sve mogućnosti, da bi se. Dakle, iz New Yorka, možda ja mogu dobiti let u Nashville, a od Nashville Austinu. A onda znam gdje sam. I onda ja znam iz Austina, mogu letjeti u Phoenix, a iz Phoenixa u San Francisco. Ako sam letjeti prvi u Miami, ipak, možda mogu dobiti let iz Miamija u Nashville, ili iz Miamija u Austin. I sada sam pokušao sve od mogućnosti. Ja sam izgradio ovaj graf koji mi pokazuje sve moguće rute da ću biti u mogućnosti uzeti. Kada smo to predstavlja vrste problema, nećemo zastupati ih izričito kao ovaj graf, jer to graf ne predstavlja povijest, gdje smo otišli. Znajući da sam letio iz Phoenix u San Francisco ne mi reći da li sam došao preko Nashville, ili preko Denvera, ili putem Miamiju. Pa što ću učiniti umjesto toga je Ja ću uzeti ovaj isti problem, i ja ću ga predstavlja kao stablo. I u korijenu stabla, u top, ja ću staviti na mjesto koje sam započeo, Boston. A iz Bostona, ja ću gledati na sve moguće mjestima da mogu putovati u. Pa, u ovom slučaju, imao sam tri, Chicago, New York i Miami. A onda ću istražiti svaku od ta djeca u stablo. Iz Chicaga, vidio sam da sam imao dva leta. Mogao sam letjeti izravno San Francisco ili u Denver. Sada San Francisco, to je moj cilj. To je moje odredište. To će biti lista ovog drveta. To je, nikada neću otići negdje nakon San Francisca. Iz Denvera, ipak, Ja mogu letjeti iz Denvera Austin, od Austin u Phoenix, a od Phoenixa do San Francisca. I sada opet, ja sam dosegla list. I onda mogao vratiti na sljedeći grad koji nisam u potpunosti istraženi. To bi bilo u New Yorku, idite natrag na vrh mog stabla, doći u New York. Iz New Yorka, ja mogu letjeti Nashville, od Nashville u Austin, iz Austina u Phoenix, te iz Phoenixa do San Francisca. I na kraju, jedan grad sam nisu pogledao još, Miami. Pa, iz Miamija sam rekao imao sam dva mogućnosti, Nashville i Austin. Ako sam letjeti u Nashvilleu, i onda letim iz Nashvillea, Austinu, u Phoenix, u San Francisco. Ako sam letjeti u Austinu, letim Austin, u Phoenix, u San Franciscu. A sada imam stablo. To je potpuna stablo. To je sve mogućnosti i sve staze koje bih mogao poduzeti. To jest, ako sam početi na Korijen stabla na vrhu i ja ići dolje na jedan od ostavlja, on mi govori ne samo gdje ću završiti, San Francisco, ali to mi govori da je put Moram uzeti doći. Sad, što je jedan od njih je najbolji? Pa, ništa o tome Problem još mi kaže koji od njih je najbolje rješenje. Možda mi je stalo najviše o koliko vremena sam u zrak, ili udaljenost da letim. U tom slučaju, Chicago i San Francisco može biti najkraći broj od milja u zraku. Možda mi je stalo cijeni. A svi znamo izravne letove su obično skuplji. Dakle, možda ako mi se ovo vrsta unatrag rute preko Miamija, Nashville, Austin, Phoenix, možda onda JA dobiti nižu cijenu. Ali sam mogla optimizirati na bilo Kriteriji koje mi je stalo. Tko ima najbolje u leta Wi-Fi, ili koji Zračne luke imaju najbolja hrana dostupna. I svaki od onih koji bi mogli daj mi drugu rješenje da vidim kao najbolji. Ove vrste problema, kamo idemo izgraditi ovaj stablo mogućnosti, a potom pogled na svaku od onih pojedini putevi, i ispitati koji od tih ispunjava kriterij za nas, ćemo nazvati ti problemi pretraživanja. I mi imamo puno algoritama, od kojih su neki smo već vidjeli, ići i istraživati ​​one stabala. Mogli bismo to učiniti na način da upravo učinio, a dubina prvog pretragu, ide dolje koliko god možemo, dok ne hit list, a zatim vraća se, i ide natrag dolje. Ili bismo mogli učiniti ono što je zove širina prvo pretraživanja. Mogli bismo proširiti sve na vrhu, te sve jedan redak ispod toga, a onda sve jedan redak ispod toga. Ti drveće pretraživanje su temeljni za AI. Ali oni ne sasvim doći je u pravu. Zapravo, u mnogo slučajeva da mi stvarno stalo, želimo izgraditi stablo, ali zapravo ne doći da sve odluke. To su situacije nazivaju Neprijateljski pretraživanje, također poznat i kako napisati igranja sustavi i biti plaćen za to. No, to su vrste sustava gdje sam Možda ćete odabrati kad idem iz Boston, koji je grad idem dalje. Ali nakon toga, netko drugi može dobiti donijeti odluku o tome gdje sam letjeti. Dakle, za izgradnju tih vrste strukture, mi smo morati uzeti malo drugačiji pristup na njega. Nećemo biti u mogućnosti samo traži kroz stabla više, ne zato što smo onaj koji je u kontroli svakog od tih donositeljima bodova. Dakle, zamislimo jednostavna igra kao Tic-Tac-nožni prst. Mogao bih početi s potpuno prazan odbora. A u Tic-Tac-nožni prst, X dobiva igrati prvi. I tako sam mogao razmišljati o svim moguće poteze da X može napraviti. I ako sam onaj igranje X, to je super. Imam devet moguće potezi koji mogu napraviti. Mogao sam staviti X u bilo kojem tih devet pozicija. I onda iz svake od njih, ja mogao zamisliti što će se dogoditi sljedeći. Dakle, u ovom slučaju, druga Igrač će dobiti uzeti skretanje. O bi doći do skrenuti. I iz svakog od tih, tamo će biti osam različitih mjesta O da bi mogao staviti svoju oznaku. Recimo odlučio sam da sam bio će staviti X u sredini. To uvijek izgleda kao dobar otvaranje potez. Mogao bih pogledajte ispod toga, osam mogući potezi koje čini. O Sada, ako igram X, to je divno. JA dobiti da odaberete koji jedan I ići, onaj u sredini. Ali sada dobiva O odabrati. I nemam kontrolu preko te odluke. Ali iz svake od tih Mogući položaji odbora, postoji onda drugi skup mogućnosti. Kada je u pitanju bilo moj red opet bih doći do pokupiti i reći, dobro, ako O seli u, dobro, srednji mjesto na lijevoj strani, a zatim Imam set mogućnosti gdje mogu uzeti moj sljedeći potez. Od onih, mogao sam uzeti u obzir sve mogućnosti ispod njih. A onda će doći O odabrati među onima. A mogao sam držati izgradnju ovo Stablo se dok sam na mjestu Kada netko osvaja game-- koji je dobio bi se smatrati list node-- ili odbor je potpuno pun i nitko nije pobijedio. I to je također će biti čvor nultog stupnja. To će biti izjednačen. No, lukav stvar s ovim je ako ovo su samo redoviti pretragu Problem, ja bih biti u mogućnosti recimo, dobro, X bi trebao ići ovdje. A O trebao ići put tamo. A onda je X trebao ići ovdje. A onda O trebao ići put tamo. A onda je X može dobiti tri u redu, a ja pobijediti. I igra će biti više u pet poteza, tri za mene, dva za moj protivnik. Ali ne uvijek dobiti odabrati koji. Dakle, umjesto što smo će morati raditi se da ćemo imati da imaju novu strategiju. A strategija koja igra-igranje algoritmi često koriste je ono što se naziva minimax. Glavna ideja minimax je da smo će odabrati potez koji naš protivnik najgori mogući set poteza koji se mogu napraviti. To ne čini mi bilo dobro odabrati potez gdje Možda ću moći osvojiti nakon da, jer moj protivnik nije će mi dati tu priliku. Oni će izabrati neke strašno ishod za mene. Tako ću učiniti potez koji tjera suparnika učiniti nešto bolje za mene. U redu. Idemo vidjeti kako to se igra. Dakle, ovdje je naš algoritam u pseudokod. Idemo generirati cijela igra stablo. Idemo graditi cijela struktura. A onda ćemo proći. A na samom dnu, na svakom od terminalne čvorove, na svakoj od lišća, ćemo procijeniti koliko vrijedna je da je za mene? I mi ćemo vrijednost stvari koje su dobre za mene kao pozitivan. Stvari koje nisu dobre za mene će biti manje pozitivan ili nula, ili čak negativan. Tako je u Tic-Tac-nožni prst, možda win za mene je dobar. To je jedan. I kravata je nula. I nešto što je gubitak za ja, možda je to negativan. Sve što je bitno je da je bolje to je za mene, to je veći rezultat prima. Od tih mogućnosti Na dno, onda ćemo filtrirati prema gore. A kad je moja prilika da odaberete Među nizom alternativa, Ja ću izabrati onaj koji je dobio najvišu ocjenu. I kad god je moj Protivnici okrenuti odabrati, Ja ću pretpostaviti da oni će odaberite onaj s najmanjim brojem bodova. I ako ja to sve do vrha stabla, Ja ću izabrao put koji daje meni je najbolji rezultat da mogu dobiti, uz pretpostavku da je moj protivnik čini sve prave poteze. U redu, da vidimo to djelovanje na prvom mjestu. A onda ćemo se zapravo pogledajte kod za njega. Pa zamislite imam ovaj veliki stablo. I sad ja ne igram Tic-Tac-nožni prst. Htjela sam ti dati nešto malo bogatiji. Tako sam dobio neku igru ​​u kojoj postoji mnogo različitih rezultate da bih mogao imati na kraju. I tako sam izgraditi ovaj kompletnu stablo. I ja se presele na prvom mjestu. Ja sam na korijen stabla. I ja se birati that-- pa sam se kako bi se povećala preko tog prvog čvora. A onda je moj protivnik dobiva ići. A onda sam se ići još jednom. Tako se na dno, imam set mogućnosti koje se mogu izabrati iz, različite terminalne stanja u igri. Ako sam dolje da daleko lijevom kutu, i vidim da imam izbora između osam, sedam, i dva, dobro, ja sam taj koji dobiva odabrati. Zato ću odabrati najbolje jedan od onih. Idem izabrati osam. Pa znam da li sam ikada doći do te točke, Ja ću biti u mogućnosti da biste dobili da je osam bodova. Ako sam završiti na sljedećem mjestu više, sljedeći čvor više, devet, jedan ili šest, dobro, ja sam će odabrati najbolje od njih. Ja ću odabrati devet. Ako imam izbor između dva, četiri i, i on, Ja ću izabrati četiri, najviše. Sada, ako gledam na razini iznad toga, moj protivnik je jedan dobiva da bi taj izbor. Tako je moj protivnik dobiva birati, želim mu dati ono što se događa da bi mu osam bodova, ili ću mu dati stvar koja je će mu devet bodova, ili ono što se događa da će mu dati četiri boda? I moj protivnik, što je racionalna, ide odabrati najmanje onih, će izabrati četiri. I ja mogu učiniti kroz cijeli stabla. Ja mogu ići dolje da srednji set tri. I ja mogu birati između jedan, tri i pet. I ja se odabrati. Tako sam izabrati pet. Ja mogu izabrati tri, devet, ili dva. JA dobiti odabrati, pa sam se odlučio na devet. Šest, pet, ili dva, biram. JA dobiti odabrati šest. Razina iznad toga, tko će izabrati? Tko dobiva odabrati? Drugi tip, moj protivnik. Tako su odlučili pet, devet, ili šest, koji? PUBLIKA: pet. SPEAKER: Oni izabrati pet. Oni su dobili odabrati minimum. A onda zadnji, odabrati jedan, dva ili tri. JA dobiti odabrati, tako da biram tri. Devet, sedam, ili dva, biram devet. I 11, šest, ili četiri, biram 11. Moj protivnik zatim odabire tri, devet, odnosno 11, odabire minimum. On mi daje tri. I konačno na vrhu stablo, sam se ponovno birati. I ja se birati između četiri, pet ili tri. Tako sam uzeti pet. Ako moram kontrolirati sve, ja bih se put koji je vodio do 11. Ali ja ne bi da bi taj izbor. Ako odem dolje tom putu. Moj protivnik će me prisiliti na izbor koji vodi do tri. Tako je najbolje što mogu učiniti je da se taj srednji granu, bi taj izbor koji je na kraju će me dovesti do pet bodova. To je ono što minimax radi. U redu. Uzmimo pogled na to. Dakle ovdje u CS50 IRO je program koji provodi minimax igrati Tic-Tac-nožni prst. Idemo graditi do reprezentacije. Mi ćemo imati dva opponent-- ili dva igrača, naše računalo igrač i čovjek igrač. Igrač broj jedan će se igrati O. To će biti stroj igrač. Oni su dobili za kretanje drugo. A drugi igrač, naš ljudski igrač, bit će X. A da bi moj život malo jednostavan, idem označiti taj igrač negativan. Dakle, ja samo mogu razmnožavati negativne jedan swap između jednog igrača i druge. U redu, pa neka je pogledati ono što zapravo učiniti. Idemo definirati našu odbora. To će biti, dobro, idemo dopustiti da bude tri za tri, ili ćemo čak mogu igrati pet od pet ili sedam od sedam Tic-Tac-nožni prst ako želite kao što su, na temelju nekih dimenzija D. I mi ćemo imati par pomoćnih funkcija da će učiniti stvari kao što su inicijalizirati screen-- ili žao, inicijalizirati naše varijable, jasno zaslon, crtanje odbora na zaslonu, onaj koji provjerava odbor da li ili ne tu je pobjednik, onaj koji analizira kroz naredbenog retka, samo da pomogne, onaj koji čita u ulaz, a jedna funkcija zove minimax. I to je jedan ćemo stalo najviše o tome. Ali pogledajmo prvo na glavni. Što nam je činiti? Pa, idemo analizirati naše komandne linije, samo čitati i vidjeti što Dimenzija odbora bismo željeli imati. Mi ćemo inicijalizirati našu ploču. A onda ćemo ući jedno Velika divlja petlje, više puta prihvatiti poteze dok se igra osvojio, ili nema niti pomiče lijevo. Svaki put kad smo proći kroz to petlje, mi ćemo brisanje zaslona. Mi ćemo nacrtati ploču na zaslonu. I mi smo namjerno vrsta apstrahiranja to daleko kao potprograme, tako da ne morate brinuti previše o detaljima kako su se dogoditi. Vi ćete imati kôd kasnije danas. A ako želite gledati kroz i saznati, što ih sve može vidjeti. No, mi ćemo izvući ploču na zaslonu. A onda ćemo provjeriti i Vidite, imamo pobjednika? Je li netko osvojio ovu igru? Ako imaju, mi ćemo ispisati iz pobjedu poruke. A mi ćemo kraj igre. Također ćemo provjeriti i vidjeti ako postoji kravatu. To će biti lako vidjeti ako ima je kravata. To znači da su svi prostori su puni, ali nije bilo pobjednika još. Možemo proglasiti kravatu i biti učinjeno. Zatim pravi meat-- ako to je stroj igrač, ćemo dopustiti da Stroj igrač za pretraživanje kroz korištenje ove minimax algoritam, pronaći najbolji potez da se može. A onda ćemo staviti taj potez prema gore. Inače, ako je ljudski igrač, ćemo pročitati neke ulaz iz čovjeka. A onda je li to ljudski igrač ili stroj igrač, ćemo napraviti par malo komadići provjere pogreške, pobrinite se da ostane u granicama od stvarnih dimenzija ploče da imamo, pobrinite to da je prostor prazan, da nitko nije stavio komad tamo već. A onda ćemo samo staviti komad na ploči, promijenite uređaj na sljedeći sloj, a povećajte koliko poteza dogoditi. To je glavna petlja za naš Tic-Tac-Toe igre. Minimax, onda je točno algoritam koji smo i prije. Jedini prilagodbe koje smo napravili kako bismo Možete igrati više dimenzionalni zajednice je imamo držati ovaj dodatni parametar zvan dubine. I dubina samo govori, ako sam traži prema dolje kroz tog stabla i ja se tako duboko izvan neke dubine razini da ja jednostavno ne želim ići dalje, Idem da se zaustavi i jednostavno ocijeniti ploču na tom mjestu. Ja ću provjeriti i vidjeti ako ima je pobjednik. Ako postoji pobjednik, ja ih vratiti. Inače, ja ću proći kroz petlju. A ja ću reći, za sve moguće lokacije da sam mogla uzeti kao moj potez, ja ću izgraditi hipotetski odbora koji uključuje svoj potez na tom brodu, a onda rekurzivno poziva Minimax. Ako je moj potez, ja se nalaze onaj koji je dobio najveći broj bodova. Ako je moj protivnik potez, naći ćemo onaj koji je dobio minimalnu ocjenu. A sve ostalo je Samo vođenje evidencije. U redu, da vidimo taj rad. Zapravo, možda možemo dobili par volontera da se i igrati Tic-Tac-nožni prst. [Nečujan] jedan, a jedan više, dva, upravo tamo. Dođi gore. Dakle, idemo naprijed i ponovno pokretanje to u potpunosti. Dakle, hi. PUBLIKA: Bok. SPEAKER: Koje je vaše ime? PUBLIKA: Gorav. SPEAKER: Gorav. PUBLIKA: Ja sam Layla. SPEAKER: I Layla i Layla, ispričavam se. Dođi gore. Gorav, ćemo imati idete prvi. I ja ću vas da se ne Strašno dobro Tic-Tac-Toe igrač. U redu, tako da sve je pritisak off na vas. Da vidimo, ipak, da je naš stroj Igrač zapravo može učiniti nešto pametno. Pa ići naprijed. Ideš upisati u kojem koordinatnom želite staviti svoje X u. A0, u redu, a stroj je otišao odmah i staviti svoj pečat u A1. Stavite O na brodu. U redu, sada ići naprijed. Gdje biste željeli otići? C2. Naš stroj igrač uzima srednji kvadrat, blokirali vas. Tako da je dobar, pametna stvar za to učiniti. Vi ste ga blokirali. To je izvrsno. Potrebno crte tamo. I to će vas prisiliti da uzeti posljednji prostor, B0. A igra završava u kravatu. Ali to igrao razumna igra protiv tebe, zar ne? U redu, hvala vrlo velik, Gorav. [PLJESAK] U redu, Layla, idemo up igre na tebe ovdje. PUBLIKA: Oh, lijepo. SPEAKER: Idemo dati što četiri strane četiri Tic-Tac-nožni prst. Sada, u četiri po četiri, morate pobijediti s četiri u nizu, a ne tri u nizu. I to je sve tvoje. Dakle, Layla je D1. Sada ćemo pratiti naše računalo igrača ovdje. Tri od tri Tic-Tac-Toe je vrsta stvar koja je lako za sve nas. No, to je još uvijek lijepo vidjeti Računalo igrač čineći pametne poteze. Četiri od četiri dobiva biti malo trickier. Lijepo učinili. U redu, Layla je završio. Oh, i trebali smo završio tamo. Ali neka je učiniti još jedan ovdje. Dakle Layla, hvala. Lijepo učinili. [PLJESAK] Dakle, naš Tic-Tac-Toe igrač ide kroz i nađe mjesta, rješava ih koristeći ovaj Minimax. I ja sam imao postavke dubine na to da njega ne bi pokrenuti prebrzo, što je vjerojatno razlog zašto Layla je bio u mogućnosti ići naprijed lijepo kao što je učinio, a učinio je vrlo dobro. No, ti sustavi koji samo proći i silu ići dublje i dublje, i dublje, i držati pronalaženju rješenja da im je potrebno, te vrste sustava su vrlo uspješni u njih, dobro, standardne igre na ploči. A u stvari, ako gledamo tri za tri Tic-Tac-Toe igre, to je u osnovi riješeno problema. I to je divno dijagram od Randall Munroe na Xkcd, prikazuje koje se kreću trebali poduzeti, s obzirom protivnikove poteze. To je nešto što smo mogli jednostavno odrediti unaprijed. No, što se događa dok smo dobili više složene igre, više zamršen igre, gdje postoje veći zajednice više, mogućnosti, dublja strategija? Ispada da je ovaj silu traži dalje radi prilično dobro, osim kada dođete do točke gdje je to stablo je tako velik da se ne može sve to predstavlja. Ako ne možete izračunati cijeli stablo, kada ne možete ići naprijed i gurnite sebe do točke gdje ste dobivši cijeli stabla u memoriji, ili možete li ga dobiti u memoriji i da će samo odvesti put predug za pretraživanje to, što morate učiniti nešto pametnije. Da bi to postigli, te morate učiniti dvije stvari. Prvo, morate pronaći neke način ograničavati vašu dubinu. Pa, to je u redu. Možemo pronaći neke lijepe, minimum i reći, možete samo ići tako duboko. Ali kada to učinite, to vam znači su ove djelomično nepotpune glačanje. I morate birati, ne volim ovo je djelomično nepotpuna odbora, ili to djelomično nepotpuna odbora? A na naša četiri strane četiri Tic-Tac-Toe igre, naše računalo igrač dobio dolje na dno i to rekao, Imam dvije različite zajednice. Niti jedna pobjeda. Niti jedan gubitak. Ni jedna je kravata. Kako odabrati između njih? I to nije imati pametan način da radi. Vidimo ove vrste Procjena se dogoditi sve vrijeme kao što smo dobili u složenije igre. Šah je sjajan primjer. U šahu, imamo prvo od svega, veći odbora. Imamo daleko više komada. A pozicioniranje tih komada a način na koji su ti komadi premjestiti je kritički važno. Dakle, ako želim koristiti Minimax, Moram biti u mogućnosti odrediti i reći, ovaj forum, gdje nitko nije osvojio ili izgubio još, je nekako bolje od ovoga drugoga odbora, u kojem nitko nije pobijedio ili izgubio. Da biste to postigli, ja mogu učiniti stvari kao što ja mogu samo brojati koliko komada moram i koliko komada imate? Ili sam možda dati drugačiji komada različite točke. Moja kraljica vrijedi 20 bodova. Vaš pijun vrijedi jedan bod. Tko ima više bodova ukupno? Ili sam možda uzeti u obzir stvari kao što su, koji je dobio bolju poziciju na ploči? Čiji je to zaokret sljedeći, sve što mogu ne procijeniti točnije koji od tih mogućnosti Bolje je bez iscrpno obzirom svaki potez koji bi mogao doći nakon toga. Sada bi taj posao, jedna od stvari koje ih godina će postati jako važno za nas nije samo kreće ravno do određene dubine granica, ali biti u mogućnosti reći, jedna od tih ideja koje sam ima toliko loše da je to Ne vrijedi s obzirom na sve moguće načine da stvari mogu ići od zla na gore. Da biste to postigli, mi ćemo dodati u Minimax načelo naziva alph-P. I alfa-beta, kaže, ako imate loša ideja, nemojte gubiti vrijeme pokušavajući saznati točno koliko je to loše. Evo što ćemo učiniti. Idemo uzeti isti Principi koje smo imali prije, isti minimax tipa traženja, samo smo ide pratiti, ne samo od Stvarne vrijednosti koje imamo, ali ćemo pratiti najbolji mogući Vrijednost da sam mogao dobiti, a najgore moguće Ishod sam mogao. I svaki put najgore moguće stvar je u potrazi vjerojatno, Ja ću napustiti taj dio stabla. A neću ni zamarati gledajući ga više. U redu, zamislite da počnemo s tom istom točnim igre stabla. A sada ćemo ići opet dolje, sve na putu prema dolje u tom donjem lijevom kutu. I u tom donjem lijevom kutu, mi izgled i ocjenjujemo ovaj forum. Možda je četiri od četiri Tic-Tac-Toe odbora, ili možda je šahovskoj ploči. Ali mi gledamo na njega, a procjenjujemo da, i dobili smo vrijednost od osam. U tom trenutku, znamo da je ćemo dobiti barem osam bodova iz ovog dna odluke. Nije bitno što druga dva su, da je sedam i to dvije. Oni mogu biti bilo vrijednosti oni su htjeli da bude. Idemo dobiti na Najmanje osam bodova. U redu, ali smo mogli ići naprijed i provjeriti. Možda je jedan od njih je bolji od osam. Mi gledamo na sedam. Je li bolji od osam? Ne, to ne mijenja Mišljenja smo na sve. Mi gledamo na dva. Je li bolji od osam? Ne, to ne mijenja Mišljenja smo na sve. Dakle, sada znamo da smo iscrpili sve mogućnosti tamo. Nećemo dobiti ništa bolji od osam. Ćemo dobiti točno osam. I tako smo promijeniti taj čvor i recimo, da je sada sigurna. Idemo jednu razinu iznad toga. A sada znamo nešto O toj razini minimizacije. Znamo da nikada si idući u dobiti više od osam poena, ako idemo prema dolje tom smjeru. Jer, čak i ako oni druge dvije grane izadju biti fantastičan i vrijedan tisuće bodova svaki, naš protivnik će nam dati minimalno, i dati nam osam. Dobro, dobro, neka je vidjeti. Mi ćemo nastaviti niz taj put. Idemo do tog sredini s lijeve strane. Gledamo se i vidimo tamo je devet. Znamo da ćemo dobiti najmanje devet točaka po silazio da srednji put. I u ovom trenutku, možemo samo pauzirati. I možemo reći, sam znate u razini gore, Idem da se ne više od osam bodove ide dolje ovaj smjer. Ali, ako sam otišao dolje u sredini Put umjesto lijeve staze, Ja bih dobiti barem devet bodova. Moj protivnik nikada neće neka mi ići dolje da srednji put. Oni su dobili odabrati. I oni će izabrati Put u lijevo prema osam, umjesto po sredini prema što je najmanje devet bodova. Dakle, u tom trenutku, ja ću prestati. A ja ću reći, znate što? Ne morate tražiti više u tom smjeru. Jer ja nikada neću doći. Ja mogu preskočiti taj jedan, i ja mogu preskočiti tu šest, jer to nikada neće dogoditi. Dakle, ja ću otići dolje i ja ću razmislite sljedeći mogućnost. Idem dolje, a ja kažem, vidim dva. Znam da sam doći do ovdje, ja sam će dobiti najmanje dva. U REDU. Ja zadržati ide. Vidim četiri. Znam da ću dobiti barem četiri. Ima još puno između četiri i osam, ipak. Tako sam zadržati ide. Gledam dolje i vidim da postoji jedan. U redu, znam da ako Idem dolje ovaj put, Ja ću biti u mogućnosti odabrati četiri. Što je moj protivnik će učiniti? Između nešto što mi daje osam, nešto što mi daje četiri, i nešto što daje mi najmanje devet, dobro, on će mi dati četiri. I sada znam Na samom vrhu, idem biti u mogućnosti da biste dobili najmanje Četiri boda iz ove igre. Cijela ideja alfa-beta je odsječen dijelovima stabla tako da ja ne gledati u njih više. No, to još uvijek izgleda kao da sam bio gledajući puno drveta. Idemo nastaviti padati. Mi ćemo ići dolje sljedeći sada. Dolje na dnu, sam pronaći jedan. Znam da ću dobiti barem jednu. Ja držati obličje. Nađem tri. Znam da ću dobiti barem tri. Ja zadržati ide. Nađem pet. Znam da ću dobiti pet ako bi se u tom putu. I ja također znam onda da je moj protivnik, ako sam odabrati sredine tri velika izbori, on će mi dati nešto što je pet ili manje. U REDU. Ja mogu zadržati ide tamo. Ja mogu pogledati dolje i ja Može se reći, što ću dobiti ako idem po sredini staze? Idem dobiti, dobro, tri tamo. Idem nešto to je najmanje tri. Ima još stvari između tri i pet, pa sam držati obličje. Oh, devet, ja ću svakako uzeti preko tri. Idem dobiti najmanje devet ako idem dolje da srednji put. Sada moj protivnik zaustavlja i kaže: izgleda, nema smisla više. Znam da je moj minimizacija protivnik, on je će mi dati stvar koja je manji ili jednak do pet, nego stvar koja je veća od ili jednaka do devet. Ja zaustaviti. Ne gledati više na to. Ja zadržati ide. Gledam dolje na ovom jednom. Dolje na dnu, nađem šest. Znam da ću dobiti barem šest. I što mogu učiniti? Ja mogu zaustaviti. Budući da je izbor između nešto što je najmanje šest i nešto što je manje od pet, on je će mi dati ono to je manje od pet. A sada znam da ću da se upravo taj izbor. Idem dobiti taj pet izbora. Vraćam se na vrh. Što ću birati između nečega To je veće od ili jednako do četiri, ili nešto što je jednako pet? Idem uzeti nešto to je najmanje pet. Idem dolje zadnji put, sve put do dna. Postoji jedan. U redu, barem ću dobiti jedan bod. Ja zadržati ide. Dva, oh, to je bolje od jedne. Idem dobiti najmanje dva. Nađem tri. Znam da ću dobiti tri. I točka iznad toga, moj protivnik ide da mi daju nešto što je manji ili jednak do tri. I sad ja mogu zaustaviti. Budući da u izbor između mene se moći dobiti pet i moj protivnik da mi nešto manje od tri, Ja sam uvijek uzeti da je pet. Pa ja ne procjenjuju da je donji dio stabla na sve. Sada, to može činiti manje. Ali kad malo komadići aritmetika, veći od i manje od, Možete izrezati daleko čitave dijelove to eksponencijalno raste stablo, koji vodi u veliki iznos štednje, štednja koji su dovoljno veliki da sam Možete početi igrati natječe na više složenih igara. U redu, ako ćemo gledati na veličinu i složenost različitih igara, Tic-Tac-Toe je bio naš jednostavan primjer. Imamo malu ploču, tri od tri. Mi smo dobili, najviše, u prosjeku oko četiri različita izbora kao što smo proći kroz igru. Imamo negdje oko 10 do Peti mogući različiti lišće. I izgradnju Tic-Tac-nožni prst igrač, dobro, samo mi je to učinio. To je lako. Ako idemo do nešto više kompleks, kao Connect Four. Sjećate li se ove igra u kojoj ispadne malo žetona u? To je šest od sedam odbora, Ne da mnogo veći, još uvijek ima istu grananja faktor kao Tic-Tac-nožni prst. Imam oko četiri izbora gdje mogu staviti stvari u. Ali sada, imam puno više vodi, 10 do 21. snage. To je nešto što je lako dovoljno da ga riješiti odmah. Dama, više vas complex-- dobio osam od osam odbora. Ti si samo na pola ih u bilo koje vrijeme, ipak. Imaš grananje čimbenik koji je oko 2.8. Pa, imamo par potezi koje možete poduzeti. Imaš oko 10 do 31. lišća, veće i veće, a veće prostore. Kao Moram pretraživanje one veće i veće prostore, to je kad stvari poput alfa-beta i biti u mogućnosti odsjeći cijele grane postaje bitan. Sada, dame je lako u 1992. Računalni program pod nazivom Chinook pobijedio svjetske dame prvak, Marion Tinsley. I od tada, nema ljudski gospodar igrač bio u mogućnosti pobijediti najbolji računalne sustave. Ako gledamo nešto poput šaha, sada opet, imamo osam od osam odbora. No, imamo mnogo više kompleks komada, mnogo složenije pokrete. Imamo grananje faktor od oko 35, 35 mogućih poteza u prosjeku da ja mogu uzeti i stanje Prostor, broj listova koja je narasla na 10 do 123. vlasti, enorman broj mogućnosti. Svejedno moderni procesori su u mogućnosti to učiniti uspješno. U 1995., a zatim u 1997, računala Program pod nazivom Deep Blue sagradio je IBM koji je vodio na divovski superračunalo pobijediti trenutni svjetski prvak, Gari Kasparov. Ovo je bila prekretnica. Danas je, međutim, da je ista obrada Snaga sjedi na mom MacBook. Brzina obrade čuva sve brže i brže. Možemo procijeniti sve više i više odbori brže i brže. Ali što je još važnije, imamo bolje evaluacije funkcije i bolje obrezivanje metode. Tako možemo pretražiti Prostor složenije. Najveći uprave igre koje možemo sjetiti, nešto slično Idi to dobio 19 po 19 odbora, sada odjednom, mi smo iza točke gdje računalni sustavi mogu pobijediti. Nema računalna Sustav vani koji može pobijediti profesionalni Go igrača. Najbolji sustavi danas se svrstavaju oko vrsta dobre amaterskoj razini. Dakle, tu je još vrlo malo van nema da ne može doći do još. U redu, to tradicionalne igre na ploči, ove vrste sustava gdje smo izgraditi ovaj Minimax, bilo da je dobio alfa-beta ili ne, te algoritama rada jer postoje određena ograničenja. Imamo savršen informacije o svijetu. Mi znamo gdje su svi komadi su. Svijet je statična. Nitko ne dobiva za pomicanje komada oko dok sam sjedi tamo misleći, da je moj red. Postoji akcija prostor koji je diskretni. Ja mogu staviti moj pješaka ovdje ili mogu staviti moj pijun ovdje. Ne smijem staviti moje pješaka na crta između dva kvadrata. I konačno, akcije su deterministička. Znam da ako kažem, top na viteza tri, moja vrana će završiti na viteza tri, koliko god je to valjan potez. Nema neizvjesnost o tome. Sada, kao što sam ići na više različite vrste igara, moramo razbiti one pretpostavke. Što ako idem na nešto poput klasičnih video igara? Evo izbor video Igre iz Atari 2600. Što ja imam tamo? Imam Frogger, prostor Invaders, Zamka, i Pac-Man. Koje vrste okruženja moram sad ovdje? Koji od ovih pretpostavki moram razbiti? Pa, to ovisi o igri. Mogao sam igrati šah na 2600, a to bi bilo kao što je bio prije. Za većinu tih sustava, tu je cjelovito znanje o svijetu. Postoji potpunosti deterministički akcije. Ali obično, u svijetu više nije statična. To je, dok sam sjedio čekao, nešto se kreće. Duhovi dolaze po mene. Škorpion je mene ispod. The Space Invaders su dolazi bliže i bliže. Koliko dobro možemo učiniti protiv njih? Prije nekoliko godina, Google je projekt pod nazivom DeepMind, gdje su obučeni računala Program igrati Atari 2600 igre. A ako mislite da je to nije ozbiljna posao, rezultati njihove studije objavljeni su u časopisu Nature, tako samo oko kao dobar publikacija kao što eventualno mogu dobiti. A evo kako su se dobro izvedena. Oni imaju algoritam koji sjedi i gledao samo na zaslon ulaza. On je dobio nikakve upute god o pravilima igre. I to je trebao shvatiti, temelji svoju ocjenu, koliko dobro to radi. To je sustav koji se koristi nešto zove učenje pojačanje. To jest, ona je pogledala s rezultatom. A ako je dobio dobre ocjene, on je rekao: I nemojte zaboraviti te stvari. A ja trebao učiniti oni opet. A ako je dobio lošu ocjenu, on je rekao: Ne treba raditi one stvari opet. Ovo je predstava od onih obučenih sustava smiju igrati za nekoliko sati na svakoj utakmici, u odnosu na profesionalne igrače. Dakle, za sve igre koje su na lijevoj strani ove linije, Ovaj self-obučeni računalni program nadmašio profesionalne igrače. A za sve do pravo, profesionalni igrači su još uvijek najbolji. Za nešto što je znao ništa o pravilima, da je ništa o strukturi znali igre, to je impresivan nastup. I to je ono što smo u stanju učiniti danas. U redu, vi kažete, ali ako smo razmišljati o AI u igrama, obično mislimo o stvari koje možemo zapravo sjesti i igrati protiv. Ako sam sjesti i ja igram StarCraft, ili igram Besplatno sito, računalo protivnik je Osoba kontrolu Zerg, ili upravljanje drugu civilizaciju. Kako ti igrači zapravo pronaći njihove poteze? Pa, ove igre su strukturirane mnogo na isti način kao i naše igre na ploči, ove igre koje ćemo kolektivno nazivaju četiri X Games, istraživanje, expand-- zaboraviti one. Što su oni? Istražite, proširiti, i ugasiti, Mislim da je zadnji. Ali oni su u osnovi istraživanje i osvajanje igre. Tipično, računalo protivnika ima ima ograničene informacije. Oni ne znaju točno što je događa iza magle rata. Ne vidim kako bi dobili što imate u inventaru. Postoji okruženje koje je dinamičan. Sve se mijenja cijelo vrijeme. Ne ću sjediti i čekati da se vaš potez. No, većina stvari su još uvijek diskretna. Moram staviti moj grad ovdje. Ili moram staviti moj grad ovdje. I sve je deterministička. Kad kažem, premjestiti svoje jedinice ovdje, moje jedinice seli se ovdje, osim ako je prepreka odjednom dolazi u igru. Sada, to nije sve na računalu igre koje su tamo i danas. Ako idem i ja igrati prvi tip osobe igra, nešto poput lopov ili Fallout ili Skyrim, ili halo, sada Imam računalnih protivnika da su vani da imaju vrlo različite situacije. Oni su, opet, ograničene informacije. Oni mogu samo vidjeti sigurno vidno polje. Okoliš je uvijek dinamičan. Stvari se mijenjaju cijelo vrijeme. Ali sada imam puno više kontinuirano djelovanje prostor. Mogu biti samo vire malo izvan vrata. I neke igre, moj akcije su stohastički. Ja se pokušati skočiti preko tog zida, ali sam dobio priliku od neuspjeha. Ove vrste igara su sve bliže i bliže vrste kontrolera koje gradimo u robotici. U robotike, moramo pretpostaviti da imamo ograničen podatke. Imamo senzora koji recite nam o svijetu. Imamo uvijek mijenja, dinamično okruženje. Imamo svijet u kojem je prostor kontinuirano, a ne diskretni. I naše akcije, kada pokušavamo ih, imaju šanse nedostatku. A u stvari, moderna igra Regulatori za vaše Halo protivnika, ili za one NPC u Skyrim, u osnovi pokrenuti male robotske arhitekture. Osjete svijet. Oni izgraditi model svijeta. Oni izračunati na temelju skupa ciljevi koji bi željeli ostvariti. Oni planiraju akcije temeljene na ono što oni znaju. A one su točno iste vrste sustava koje gradimo u robotici. Tako ove arhitekture, na dovesti natrag zajedno, često su sasvim isti. Dakle, neka je vidjeti ako možemo vidjeti da. Vratimo se na naš tic-tac-toe primjer. A ja ću postaviti nekoliko mojih post-docs doći i pomoći mi. Tako Chen Ming, i Alessandro i Olivier, ako ti dečki će doći. I ja ću morati par volontera OK, vidio sam ruku pravo tamo u sredini. Dopustite mi da još jednom, netko dalje u leđima možda. U redu, tamo. Dođi gore. U redu. Tako ćemo uzeti da je poklopac. A ako ti dečki će doći u pravu natrag ovdje za mene, fantastično. Dakle, ovo je robot zove Baxter. A Baxter je robot koji je komercijalna platforma, osmišljen tvrtka zove promisliti. I ovaj robot je osmišljen za proizvodnju malih. No, danas ćemo ga koristiti za igranje Tic-Tac-nožni prst. Sada, ovaj robot je i nešto to je relativno jedinstven. Jer ako ja stajali nigdje u neposrednoj blizini standardnom tvornice automatizacije Sustav, ja bih se u samom grobu opasnost od ozljeda. Baxter, međutim, je dizajniran da bude relativno sigurno za interakciju s. I tako ja mogu gurati ovaj robota. I možete vidjeti da je malo malo fleksibilni dok se kreće oko. I mogu ga premjestiti gdje sam bih to ići. Sada u normalnom robotskom sustavu, bismo imali set zglobova ovdje kako bi se izravno reagirati na položaj naredbe. A oni ne bi nužno stalo ako su se kreće kroz otvorenom, ili ako su se kreće kroz moje prsnog koša. U REDU. I obično, ako ste bili ovdje s industrijskim sustavom, ti bi ići nigdje u blizini. Tu će biti žuta Sigurnost Traka sve oko nje. Ovaj sustav ima malo drugačiji dizajn biti prijateljski i lakše za ljude u interakciji s, u da u svakom zglobu, postoji proljeća. I umjesto da kontrolira točan položaj, kontroliramo određenu količinu moment, određenu količinu snage, kako bismo željeli da se na tom izvoru. U redu, pa mi dopustite uzeti naše volontere ovdje. Bok, kako se zoveš? PUBLIKA: Louis. SPEAKER: Louis. Lijepo vas je vidjeti. I? PUBLIKA: David. SPEAKER: David. Drago nam je. Ako ti dečki će čekati upravo ovdje na trenutak, Ja ću vam dati priliku da to učinite. Dakle, ovaj robot, ako dođe do a ako gurnuti lagano na njega, ti si idući u vidjeti da se kreće malo. A ako ga zgrabite pravo ovdje na zapešću jednostavno gore gdje su ti gumbi, to Izgleda da treba zgrabiti gumbe, ali iskoristite odmah iznad njega umjesto toga, vi ćete moći vrlo lagano manipulirati kroz prostor. Louis, želite dati ga probati? Tako ga dati samo malo guranje za početak. A onda, ako ste stavili svoje prste upravo tamo i zadržati na njemu, jer će se pomaknuti za vas onda. U redu, želite dati ga probati? Dođi gore. Tako ga dati samo nježna gurati tamo za početak. Možete osjetiti kako je to. I onda ako ga zgrabite pravo postoji, ćete biti u mogućnosti za manevriranje oko. U REDU. Tako obično, ova vrsta robota bi upotrijebiti za proizvodnju malih razmjera. I ja ću premjestiti ovu ruku samo dolje zabit malo ovdje. Ali danas, mi ćemo koristiti Isto Tic-Tac-Toe sustav reprodukcije na temelju Minimax da smo ranije izgradili. U REDU? Dakle, ti dečki su svaki će igrati igru. Louis, ti ćeš biti prvi. Dopustite mi da držite se ovdje na trenutak. Idem da stojite u redu ovdje, tako da svatko može vidjeti. Jeste li vi postaviti ovdje? ROBOT: Dobrodošli. Idemo igrati Tic-Tac-nožni prst. Nemojte shvatiti token prije Kažem da je tvoj red. Sam početak igre. To je moj red. Govornik: Sad, ako bi mogao uzeti jedan od Vaši komada i ići naprijed i stavite ga. ROBOT: To je tvoj red. [SMIJEH] To je moj red. [SMIJEH] [SMIJEH] To je tvoj red. SPEAKER: Ljudska rasa računaju na vas ovdje, Louis. ROBOT: To je moj red. SPEAKER: Pa Baxter uspješno blokiran ovdje. ROBOT: To je tvoj red. To je moj red. To je tvoj red. To je moj red. SPEAKER: I mi ćemo pustiti Baxter završiti izvan svoje zadnji potez ovdje. [SMIJEH] ROBOT: To je kravata. Ja ću osvojiti sljedeći put. [SMIJEH] Govornik: U redu, hvala vrlo velik, Louis. Hvala. Možete ići na ovaj način. ROBOT: Ja početak igre. SPEAKER: Pa neka mi objasni vam još jedan mali Malo prije nego što smo dobili naš revanš ovdje. Što se točno događa? Dakle, robot ima vrh fotoaparata ovdje. I to je izgleda dolje na brodu. I to je viđenje bilo to je dobio crveni O ili plava bijelo X. Kao one se stavljaju na odbora, koji je u osnovi isti ulaz da bi se čitanja iz naša struktura podataka iz našeg ekrana. To je trčanje isti minimax algoritam se mogućnosti pronaći gdje staviti dobar znak. I onda mi daju naredbu o gdje smo željeli token biti postavljeni. Ruka se kreće van. To je pomoću vakuumske hvataljku za primjenu neki usis na taj drveni dio, ga podići, to pomicanje udesno mjesto, a zatim otpustite usisavanje i ispustite ga. U redu, idemo da joj još jedan metak s malo pametniji igrač ovdje. Spreman? U redu, ako želite stajati desno gore ovdje i dati A- ispalo ovako tako da možete vidjeti sve. I onda [nečujan]. ROBOT: To je moj red. SPEAKER: Baxter će početi. To je tvoj red. To je moj red. To je tvoj red. To je moj red. [SMIJEH] SPEAKER: [šapće] Samo neka ide naprijed i pobijediti. ROBOT: To je tvoj red. SPEAKER: To je u redu. ROBOT: To je moj red. [SMIJEH] Pobijedim. [SMIJEH] Sam početak igre. Govornik: U redu, puno hvala. U redu, mislim da imamo vremena za još jedan izvrstan Tic-Tac-Toe igrač, netko tko može staviti ovu stvar na odgovarati, tko zna što radi. [SMIJEH] Tko će biti naš prvak ovdje? U redu, vaši prijatelji vas dobrovoljno. To je dovoljno dobar za mene. Reci mi svoje ime ponovno. PUBLIKA: Tamir. Govornik: Tamir, lijepo vas je vidjeti. U redu, opet, mi ćemo vas staviti sve do ovdje, pa svatko može vidjeti. Vi ste naš predstavnik u ovoj utakmici sada. Baxter je jedan i oh oh. Ili mi je, jedan oh i jedan. I to je do vas ovdje. Baxter će doći do premjestiti prvi, ipak. Tako. ROBOT: To je moj red. [SMIJEH] To je tvoj red. To je moj red. To je tvoj red. To je moj red. To je tvoj red. [SMIJEH] ROBOT: To je moj red. SPEAKER: To je puno teže kada stojiš ovdje, ljudi. [SMIJEH] ROBOT: Ti su ljudi tako lako pobijediti. [Smijeh i pljesak] SPEAKER: Hvala puno. ROBOT: pobijedim. Sam početak igre. Govornik: U redu, hvala vrlo mnogo Oliviera, i Alessandro, i Chen Ming. [PLJESAK] Želim da posljednji bod. Dakle Baxter na vrlo postoji kraj, varao. I to je bilo neočekivano. Jedan od fantastični stvari o AI je da smo rade u AI, tako da možemo izgraditi stvarno zanimljivo i inteligentno uređaji. Ali, mi također rade u AI jer nam govori nešto o tome kako su ljudi inteligentni. Jedan od favorita Studije iz mog laboratorija je gleda na ono što se događa kada strojevi neočekivano varati. Mi to učinio izvorno ne s Baxter igrati Tic-Tac-nožni prst, ali s manjim robota po imenu Nao, koji je igrao rock-papir-škare. A ponekad nakon igrati puno puno dosadno rock-papir-škare igre, robot bi baciti gestu, izgubiti, a onda odjednom promijeniti njegova gesta i reći, ja pobijediti. [SMIJEH] Sada, ponekad mi bismo također imaju robota, samo kao kontrola, baciti gestu, pobijediti, i promijeniti svoju gestu izgubiti, baciti utakmicu, varati kako bi se izgubiti. I to nije gotovo kao uvjerljiv. Robot koji vara kako bi se pobijediti ljudi reagiraju na kao što je kako bi ih dobili, kao što je to je aktivno traže njihovo uništenje. [SMIJEH] Ona postaje sredstvo. To je kao osoba. To je uvjerenje i namjere. I to nije dobro namjera. A robot koji baca Igra je jednostavno neispravan. To je samo slomljen uređaj. Dopustite mi da vam pokazati par primjera to iz nekoliko naših polaznika. Dakle ovdje je varanje kako bi se izgubiti. [VIDEO PLAYBACK] - [Nečujan] pobijediti. Igrajmo. -Čekaj, što? - [Nečujan] pobijediti. Igrajmo. [Nečujan] pobijediti. Igrajmo. SPEAKER: I ovdje je varanje osvojiti. -Da, Ja pobijediti. Igrajmo. -Ne Mogu to učiniti. [SMIJEH] -Da, Ja pobijediti. -Vi Varao. Varao si sada. -Da, Ja pobijediti. -Hej, Ti varalica. Možete varati, varati super. [END PLAYBACK] SPEAKER: Ovi različiti Reakcije brzo promijeniti našu percepciju uređaja. Znači li to da je namjerno graditi strojevi koji varaju jer je to najbolji inženjering što možemo učiniti? Ne, ali to nam govori nešto stvarno zanimljivo o ljudima. To je stvar koja vas i vara krade vaše pobjeda, to je nešto što je živ, to je animirati, to je na vas. To je mentalno stanje. To je uvjerenje. Ona ima namjeru. To što se rukama igra za vas, to nije. To je samo ispravno. To je u mnogočemu zašto je lako baciti igra s djecom. Ali ako ih pokušate prevariti i vrsta tvrde pobjedu kada je, znate, samo skratiti Igra, oni će vas uhvatiti odmah. Ove vrste učinaka koji vidimo dolaze iz AI, oni nas uče puno o sebi. U redu, to je to za danas. Hvala vrlo velik Davidu i proizvodnja tim s Harvarda došli. [PLJESAK] Vidimo se za kviz jedan, a onda za posljednji predavanje. Ugodan dan. [PLJESAK] [Glazbom] DAVID J Malan: Pa, vjerojatno trebamo uvesti neku vrstu enkripcije, pravo? Jer tada zaglavlja ovi HTTP zahtjevi će biti kodirani tako da svatko pokušavajući njuškanje prometa zapravo neće biti u mogućnosti da ih vidjeti. Pa što je rješenje za ovaj problem? Pa, moramo se zapravo uvesti šifriranje u formuli, tako da kada je ta osoba prijenos podataka od A do B, možemo sigurno send-- [SMIJEH] Informacije na način da je Protivnik ne može, u stvari, vidjeti.