[Glazbom] 

SPEAKER: DobrodoÅ¡li natrag, svakoga. Ovo je CS50. I danas, imamo mnogo zanimljivosti o Äemu razgovarati. Prvo, iako, moram podsjetiti ste od rijetkih upravnih stvari. Ovaj tjedan je kviz jedan, srijeda ili dijelu Yale utorkom i Äetvrtkom, u Äetvrtak. Postoji kviz recenzije VeÄeras na Yaleu, 5:30 do 7:00. Na Harvardu, snimili su jednu juÄer. I svatko moÅ¾e gledati tu online. 

TakoÄer, ovaj tjedan ili poÄetkom sljedeÄeg tjedna, imamo posljednju CS50 predavanje. [UzdiÅ¡e] Znam. Tako brzo je doÅ¡ao. Yale studenti Äe imati live predavanje ovdje u pravni fakultet GledaliÅ¡te je u petak. Tu Äe biti kolaÄ. Harvardski studenti Äe imati Posljednji predavanje u Sandersa u ponedjeljak. Tu Äe takoÄer biti torta. 

TakoÄer, ovaj tjedan u petak, za one od vas koji dolazite u New Havenu, imamo CS50 Expo. Imamo viÅ¡e od 30 registrirana razliÄite skupine vam pokazati sve od autonomnih jedrilicama, sustava koje prepoznaju digitalne portreta, na raÄunalu glazba i raÄunalno proizvedene glazbe. Dakle, molimo Vas da nam se pridruÅ¾ite. Mislim da Äe to biti sjajna prilika. 

Danas, meÄutim, moÅ¾emo doÄi do i dalje govorimo o AI, o umjetnoj inteligenciji. I jedna od stvari koje Äemo doÄi do danas je ideja kako koristiti AI za rjeÅ¡avanje problema. Sada, kao i uvijek, krenimo s neÄim jednostavnim. A mi Äemo za poÄetak s jednostavnom idejom. I to je pomoÄu pretraÅ¾ivanja. 

Pa zamislite na trenutak da sam imaju zadatak da trebam obaviti. I ja bih da se taj zadatak automatizirani neki programski agent. Zamislite da pokuÅ¡avam rezervirati set letova iz, recimo, Boston u San Francisco. Mogao sam proÄi i sam mogao koristiti jedan od prekrasnih online pretraÅ¾ivanja alata, koji Äe uÄiniti u osnovi isti proces koji smo Äe proÅ¡etati do danas. Ali ako nisu imali da alat, Å¡to biste uÄinili? 

Pa, Å¡to bi moglo izgledati i vidjeti i reÄi, ja sam u Bostonu. Koji letovi su mi dostupni? Sad, moÅ¾da imam tri MoguÄi letovi iz Bostona koji Äe stati vrijeme kad trebam otiÄi. Mogao sam letjeti u Chicago. Ili bih mogao letjeti u Miamiju. Ili sam mogao odletjeti u New York. I onda mogao traÅ¾iti od svakog jedan od onih odrediÅ¡te gradova i razmiÅ¡ljati o tome Å¡to mjestima Ja eventualno mogao doÄi iz svake od tih pojedinih gradova. 

Dakle, moÅ¾da iz Chicaga, mogu dobiti izravni let za San Francisco. To je izvrsno. Ili bih mogao dobiti let za Denver. Sad, moÅ¾da je let za San Francisco je idealno rjeÅ¡enje za mene, ali moÅ¾da i ne. MoÅ¾da sam u potrazi za neÄim to je malo jeftinije ili malo bolje za moj raspored. I tako sam mogao traÅ¾iti ono Å¡to drugima moguÄnosti moÅ¾e biti vani. Tako sam mogao gledati u Denveru. I iz Denvera, dobro, moÅ¾da Ja mogu dobiti let za Austinu. A iz Austina, moÅ¾da ja mogu dobiti let u Phoenix, a iz Phoenixa u San Francisco. Sad, nisam joÅ¡ uÄinio. Jer moÅ¾da postoji izravni let iz New Yorka San Francisco koji je savrÅ¡en za mene. Ili moÅ¾da postoji let iz Miamija kroz Denver je to puno jeftinije. Tako sam i dalje moram iÄi. I dalje morati gledati na sve one gradovi koji joÅ¡ nisam istraÅ¾uju. Moram iscrpno provjeriti sve moguÄnosti, da bi se. 

Dakle, iz New Yorka, moÅ¾da ja mogu dobiti let u Nashville, a od Nashville Austinu. A onda znam gdje sam. I onda ja znam iz Austina, mogu letjeti u Phoenix, a iz Phoenixa u San Francisco. Ako sam letjeti prvi u Miami, ipak, moÅ¾da mogu dobiti let iz Miamija u Nashville, ili iz Miamija u Austin. 

I sada sam pokuÅ¡ao sve od moguÄnosti. Ja sam izgradio ovaj graf koji mi pokazuje sve moguÄe rute da Äu biti u moguÄnosti uzeti. Kada smo to predstavlja vrste problema, neÄemo zastupati ih izriÄito kao ovaj graf, jer to graf ne predstavlja povijest, gdje smo otiÅ¡li. ZnajuÄi da sam letio iz Phoenix u San Francisco ne mi reÄi da li sam doÅ¡ao preko Nashville, ili preko Denvera, ili putem Miamiju. 

Pa Å¡to Äu uÄiniti umjesto toga je Ja Äu uzeti ovaj isti problem, i ja Äu ga predstavlja kao stablo. I u korijenu stabla, u top, ja Äu staviti na mjesto koje sam zapoÄeo, Boston. A iz Bostona, ja Äu gledati na sve moguÄe mjestima da mogu putovati u. Pa, u ovom sluÄaju, imao sam tri, Chicago, New York i Miami. A onda Äu istraÅ¾iti svaku od ta djeca u stablo. 

Iz Chicaga, vidio sam da sam imao dva leta. Mogao sam letjeti izravno San Francisco ili u Denver. Sada San Francisco, to je moj cilj. To je moje odrediÅ¡te. To Äe biti lista ovog drveta. To je, nikada neÄu otiÄi negdje nakon San Francisca. Iz Denvera, ipak, Ja mogu letjeti iz Denvera Austin, od Austin u Phoenix, a od Phoenixa do San Francisca. I sada opet, ja sam dosegla list. 

I onda mogao vratiti na sljedeÄi grad koji nisam u potpunosti istraÅ¾eni. To bi bilo u New Yorku, idite natrag na vrh mog stabla, doÄi u New York. Iz New Yorka, ja mogu letjeti Nashville, od Nashville u Austin, iz Austina u Phoenix, te iz Phoenixa do San Francisca. I na kraju, jedan grad sam nisu pogledao joÅ¡, Miami. 

Pa, iz Miamija sam rekao imao sam dva moguÄnosti, Nashville i Austin. Ako sam letjeti u Nashvilleu, i onda letim iz Nashvillea, Austinu, u Phoenix, u San Francisco. Ako sam letjeti u Austinu, letim Austin, u Phoenix, u San Franciscu. A sada imam stablo. To je potpuna stablo. To je sve moguÄnosti i sve staze koje bih mogao poduzeti. To jest, ako sam poÄeti na Korijen stabla na vrhu i ja iÄi dolje na jedan od ostavlja, on mi govori ne samo gdje Äu zavrÅ¡iti, San Francisco, ali to mi govori da je put Moram uzeti doÄi. 

Sad, Å¡to je jedan od njih je najbolji? Pa, niÅ¡ta o tome Problem joÅ¡ mi kaÅ¾e koji od njih je najbolje rjeÅ¡enje. MoÅ¾da mi je stalo najviÅ¡e o koliko vremena sam u zrak, ili udaljenost da letim. U tom sluÄaju, Chicago i San Francisco moÅ¾e biti najkraÄi broj od milja u zraku. 

MoÅ¾da mi je stalo cijeni. A svi znamo izravne letove su obiÄno skuplji. Dakle, moÅ¾da ako mi se ovo vrsta unatrag rute preko Miamija, Nashville, Austin, Phoenix, moÅ¾da onda JA dobiti niÅ¾u cijenu. Ali sam mogla optimizirati na bilo Kriteriji koje mi je stalo. Tko ima najbolje u leta Wi-Fi, ili koji ZraÄne luke imaju najbolja hrana dostupna. I svaki od onih koji bi mogli daj mi drugu rjeÅ¡enje da vidim kao najbolji. 

Ove vrste problema, kamo idemo izgraditi ovaj stablo moguÄnosti, a potom pogled na svaku od onih pojedini putevi, i ispitati koji od tih ispunjava kriterij za nas, Äemo nazvati ti problemi pretraÅ¾ivanja. I mi imamo puno algoritama, od kojih su neki smo veÄ vidjeli, iÄi i istraÅ¾ivati ââone stabala. Mogli bismo to uÄiniti na naÄin da upravo uÄinio, a dubina prvog pretragu, ide dolje koliko god moÅ¾emo, dok ne hit list, a zatim vraÄa se, i ide natrag dolje. Ili bismo mogli uÄiniti ono Å¡to je zove Å¡irina prvo pretraÅ¾ivanja. Mogli bismo proÅ¡iriti sve na vrhu, te sve jedan redak ispod toga, a onda sve jedan redak ispod toga. Ti drveÄe pretraÅ¾ivanje su temeljni za AI. Ali oni ne sasvim doÄi je u pravu. Zapravo, u mnogo sluÄajeva da mi stvarno stalo, Å¾elimo izgraditi stablo, ali zapravo ne doÄi da sve odluke. 

To su situacije nazivaju Neprijateljski pretraÅ¾ivanje, takoÄer poznat i kako napisati igranja sustavi i biti plaÄen za to. No, to su vrste sustava gdje sam MoÅ¾da Äete odabrati kad idem iz Boston, koji je grad idem dalje. Ali nakon toga, netko drugi moÅ¾e dobiti donijeti odluku o tome gdje sam letjeti. Dakle, za izgradnju tih vrste strukture, mi smo morati uzeti malo drugaÄiji pristup na njega. NeÄemo biti u moguÄnosti samo traÅ¾i kroz stabla viÅ¡e, ne zato Å¡to smo onaj koji je u kontroli svakog od tih donositeljima bodova. 

Dakle, zamislimo jednostavna igra kao Tic-Tac-noÅ¾ni prst. Mogao bih poÄeti s potpuno prazan odbora. A u Tic-Tac-noÅ¾ni prst, X dobiva igrati prvi. I tako sam mogao razmiÅ¡ljati o svim moguÄe poteze da X moÅ¾e napraviti. I ako sam onaj igranje X, to je super. Imam devet moguÄe potezi koji mogu napraviti. Mogao sam staviti X u bilo kojem tih devet pozicija. 

I onda iz svake od njih, ja mogao zamisliti Å¡to Äe se dogoditi sljedeÄi. Dakle, u ovom sluÄaju, druga IgraÄ Äe dobiti uzeti skretanje. O bi doÄi do skrenuti. I iz svakog od tih, tamo Äe biti osam razliÄitih mjesta O da bi mogao staviti svoju oznaku. 

Recimo odluÄio sam da sam bio Äe staviti X u sredini. To uvijek izgleda kao dobar otvaranje potez. Mogao bih pogledajte ispod toga, osam moguÄi potezi koje Äini. O Sada, ako igram X, to je divno. JA dobiti da odaberete koji jedan I iÄi, onaj u sredini. Ali sada dobiva O odabrati. I nemam kontrolu preko te odluke. 

Ali iz svake od tih MoguÄi poloÅ¾aji odbora, postoji onda drugi skup moguÄnosti. Kada je u pitanju bilo moj red opet bih doÄi do pokupiti i reÄi, dobro, ako O seli u, dobro, srednji mjesto na lijevoj strani, a zatim Imam set moguÄnosti gdje mogu uzeti moj sljedeÄi potez. Od onih, mogao sam uzeti u obzir sve moguÄnosti ispod njih. A onda Äe doÄi O odabrati meÄu onima. 

A mogao sam drÅ¾ati izgradnju ovo Stablo se dok sam na mjestu Kada netko osvaja game-- koji je dobio bi se smatrati list node-- ili odbor je potpuno pun i nitko nije pobijedio. I to je takoÄer Äe biti Ävor nultog stupnja. To Äe biti izjednaÄen. 

No, lukav stvar s ovim je ako ovo su samo redoviti pretragu Problem, ja bih biti u moguÄnosti recimo, dobro, X bi trebao iÄi ovdje. A O trebao iÄi put tamo. A onda je X trebao iÄi ovdje. A onda O trebao iÄi put tamo. A onda je X moÅ¾e dobiti tri u redu, a ja pobijediti. I igra Äe biti viÅ¡e u pet poteza, tri za mene, dva za moj protivnik. Ali ne uvijek dobiti odabrati koji. 

Dakle, umjesto Å¡to smo Äe morati raditi se da Äemo imati da imaju novu strategiju. A strategija koja igra-igranje algoritmi Äesto koriste je ono Å¡to se naziva minimax. Glavna ideja minimax je da smo Äe odabrati potez koji naÅ¡ protivnik najgori moguÄi set poteza koji se mogu napraviti. To ne Äini mi bilo dobro odabrati potez gdje MoÅ¾da Äu moÄi osvojiti nakon da, jer moj protivnik nije Äe mi dati tu priliku. Oni Äe izabrati neke straÅ¡no ishod za mene. Tako Äu uÄiniti potez koji tjera suparnika uÄiniti neÅ¡to bolje za mene. U redu. Idemo vidjeti kako to se igra. Dakle, ovdje je naÅ¡ algoritam u pseudokod. Idemo generirati cijela igra stablo. Idemo graditi cijela struktura. A onda Äemo proÄi. A na samom dnu, na svakom od terminalne Ävorove, na svakoj od liÅ¡Äa, Äemo procijeniti koliko vrijedna je da je za mene? I mi Äemo vrijednost stvari koje su dobre za mene kao pozitivan. Stvari koje nisu dobre za mene Äe biti manje pozitivan ili nula, ili Äak negativan. 

Tako je u Tic-Tac-noÅ¾ni prst, moÅ¾da win za mene je dobar. To je jedan. I kravata je nula. I neÅ¡to Å¡to je gubitak za ja, moÅ¾da je to negativan. Sve Å¡to je bitno je da je bolje to je za mene, to je veÄi rezultat prima. Od tih moguÄnosti Na dno, onda Äemo filtrirati prema gore. A kad je moja prilika da odaberete MeÄu nizom alternativa, Ja Äu izabrati onaj koji je dobio najviÅ¡u ocjenu. 

I kad god je moj Protivnici okrenuti odabrati, Ja Äu pretpostaviti da oni Äe odaberite onaj s najmanjim brojem bodova. I ako ja to sve do vrha stabla, Ja Äu izabrao put koji daje meni je najbolji rezultat da mogu dobiti, uz pretpostavku da je moj protivnik Äini sve prave poteze. 

U redu, da vidimo to djelovanje na prvom mjestu. A onda Äemo se zapravo pogledajte kod za njega. Pa zamislite imam ovaj veliki stablo. I sad ja ne igram Tic-Tac-noÅ¾ni prst. Htjela sam ti dati neÅ¡to malo bogatiji. Tako sam dobio neku igru ââu kojoj postoji mnogo razliÄitih rezultate da bih mogao imati na kraju. I tako sam izgraditi ovaj kompletnu stablo. I ja se presele na prvom mjestu. Ja sam na korijen stabla. 

I ja se birati that-- pa sam se kako bi se poveÄala preko tog prvog Ävora. A onda je moj protivnik dobiva iÄi. A onda sam se iÄi joÅ¡ jednom. Tako se na dno, imam set moguÄnosti koje se mogu izabrati iz, razliÄite terminalne stanja u igri. Ako sam dolje da daleko lijevom kutu, i vidim da imam izbora izmeÄu osam, sedam, i dva, dobro, ja sam taj koji dobiva odabrati. Zato Äu odabrati najbolje jedan od onih. Idem izabrati osam. 

Pa znam da li sam ikada doÄi do te toÄke, Ja Äu biti u moguÄnosti da biste dobili da je osam bodova. Ako sam zavrÅ¡iti na sljedeÄem mjestu viÅ¡e, sljedeÄi Ävor viÅ¡e, devet, jedan ili Å¡est, dobro, ja sam Äe odabrati najbolje od njih. Ja Äu odabrati devet. Ako imam izbor izmeÄu dva, Äetiri i, i on, Ja Äu izabrati Äetiri, najviÅ¡e. 

Sada, ako gledam na razini iznad toga, moj protivnik je jedan dobiva da bi taj izbor. Tako je moj protivnik dobiva birati, Å¾elim mu dati ono Å¡to se dogaÄa da bi mu osam bodova, ili Äu mu dati stvar koja je Äe mu devet bodova, ili ono Å¡to se dogaÄa da Äe mu dati Äetiri boda? I moj protivnik, Å¡to je racionalna, ide odabrati najmanje onih, Äe izabrati Äetiri. 

I ja mogu uÄiniti kroz cijeli stabla. Ja mogu iÄi dolje da srednji set tri. I ja mogu birati izmeÄu jedan, tri i pet. I ja se odabrati. Tako sam izabrati pet. Ja mogu izabrati tri, devet, ili dva. JA dobiti odabrati, pa sam se odluÄio na devet. Å est, pet, ili dva, biram. JA dobiti odabrati Å¡est. Razina iznad toga, tko Äe izabrati? Tko dobiva odabrati? Drugi tip, moj protivnik. Tako su odluÄili pet, devet, ili Å¡est, koji? 

PUBLIKA: pet. 

SPEAKER: Oni izabrati pet. Oni su dobili odabrati minimum. A onda zadnji, odabrati jedan, dva ili tri. JA dobiti odabrati, tako da biram tri. Devet, sedam, ili dva, biram devet. I 11, Å¡est, ili Äetiri, biram 11. Moj protivnik zatim odabire tri, devet, odnosno 11, odabire minimum. On mi daje tri. I konaÄno na vrhu stablo, sam se ponovno birati. I ja se birati izmeÄu Äetiri, pet ili tri. Tako sam uzeti pet. 

Ako moram kontrolirati sve, ja bih se put koji je vodio do 11. Ali ja ne bi da bi taj izbor. Ako odem dolje tom putu. Moj protivnik Äe me prisiliti na izbor koji vodi do tri. Tako je najbolje Å¡to mogu uÄiniti je da se taj srednji granu, bi taj izbor koji je na kraju Äe me dovesti do pet bodova. To je ono Å¡to minimax radi. 

U redu. Uzmimo pogled na to. Dakle ovdje u CS50 IRO je program koji provodi minimax igrati Tic-Tac-noÅ¾ni prst. Idemo graditi do reprezentacije. Mi Äemo imati dva opponent-- ili dva igraÄa, naÅ¡e raÄunalo igraÄ i Äovjek igraÄ. IgraÄ broj jedan Äe se igrati O. To Äe biti stroj igraÄ. Oni su dobili za kretanje drugo. A drugi igraÄ, naÅ¡ ljudski igraÄ, bit Äe X. 

A da bi moj Å¾ivot malo jednostavan, idem oznaÄiti taj igraÄ negativan. Dakle, ja samo mogu razmnoÅ¾avati negativne jedan swap izmeÄu jednog igraÄa i druge. U redu, pa neka je pogledati ono Å¡to zapravo uÄiniti. Idemo definirati naÅ¡u odbora. To Äe biti, dobro, idemo dopustiti da bude tri za tri, ili Äemo Äak mogu igrati pet od pet ili sedam od sedam Tic-Tac-noÅ¾ni prst ako Å¾elite kao Å¡to su, na temelju nekih dimenzija D. 

I mi Äemo imati par pomoÄnih funkcija da Äe uÄiniti stvari kao Å¡to su inicijalizirati screen-- ili Å¾ao, inicijalizirati naÅ¡e varijable, jasno zaslon, crtanje odbora na zaslonu, onaj koji provjerava odbor da li ili ne tu je pobjednik, onaj koji analizira kroz naredbenog retka, samo da pomogne, onaj koji Äita u ulaz, a jedna funkcija zove minimax. I to je jedan Äemo stalo najviÅ¡e o tome. Ali pogledajmo prvo na glavni. 

Å to nam je Äiniti? Pa, idemo analizirati naÅ¡e komandne linije, samo Äitati i vidjeti Å¡to Dimenzija odbora bismo Å¾eljeli imati. Mi Äemo inicijalizirati naÅ¡u ploÄu. A onda Äemo uÄi jedno Velika divlja petlje, viÅ¡e puta prihvatiti poteze dok se igra osvojio, ili nema niti pomiÄe lijevo. Svaki put kad smo proÄi kroz to petlje, mi Äemo brisanje zaslona. Mi Äemo nacrtati ploÄu na zaslonu. I mi smo namjerno vrsta apstrahiranja to daleko kao potprograme, tako da ne morate brinuti previÅ¡e o detaljima kako su se dogoditi. 

Vi Äete imati kÃ´d kasnije danas. A ako Å¾elite gledati kroz i saznati, Å¡to ih sve moÅ¾e vidjeti. No, mi Äemo izvuÄi ploÄu na zaslonu. A onda Äemo provjeriti i Vidite, imamo pobjednika? Je li netko osvojio ovu igru? Ako imaju, mi Äemo ispisati iz pobjedu poruke. A mi Äemo kraj igre. 

TakoÄer Äemo provjeriti i vidjeti ako postoji kravatu. To Äe biti lako vidjeti ako ima je kravata. To znaÄi da su svi prostori su puni, ali nije bilo pobjednika joÅ¡. MoÅ¾emo proglasiti kravatu i biti uÄinjeno. Zatim pravi meat-- ako to je stroj igraÄ, Äemo dopustiti da Stroj igraÄ za pretraÅ¾ivanje kroz koriÅ¡tenje ove minimax algoritam, pronaÄi najbolji potez da se moÅ¾e. A onda Äemo staviti taj potez prema gore. 

InaÄe, ako je ljudski igraÄ, Äemo proÄitati neke ulaz iz Äovjeka. A onda je li to ljudski igraÄ ili stroj igraÄ, Äemo napraviti par malo komadiÄi provjere pogreÅ¡ke, pobrinite se da ostane u granicama od stvarnih dimenzija ploÄe da imamo, pobrinite to da je prostor prazan, da nitko nije stavio komad tamo veÄ. A onda Äemo samo staviti komad na ploÄi, promijenite ureÄaj na sljedeÄi sloj, a poveÄajte koliko poteza dogoditi. 

To je glavna petlja za naÅ¡ Tic-Tac-Toe igre. Minimax, onda je toÄno algoritam koji smo i prije. Jedini prilagodbe koje smo napravili kako bismo MoÅ¾ete igrati viÅ¡e dimenzionalni zajednice je imamo drÅ¾ati ovaj dodatni parametar zvan dubine. I dubina samo govori, ako sam traÅ¾i prema dolje kroz tog stabla i ja se tako duboko izvan neke dubine razini da ja jednostavno ne Å¾elim iÄi dalje, Idem da se zaustavi i jednostavno ocijeniti ploÄu na tom mjestu. Ja Äu provjeriti i vidjeti ako ima je pobjednik. Ako postoji pobjednik, ja ih vratiti. InaÄe, ja Äu proÄi kroz petlju. A ja Äu reÄi, za sve moguÄe lokacije da sam mogla uzeti kao moj potez, ja Äu izgraditi hipotetski odbora koji ukljuÄuje svoj potez na tom brodu, a onda rekurzivno poziva Minimax. 

Ako je moj potez, ja se nalaze onaj koji je dobio najveÄi broj bodova. Ako je moj protivnik potez, naÄi Äemo onaj koji je dobio minimalnu ocjenu. A sve ostalo je Samo voÄenje evidencije. U redu, da vidimo taj rad. Zapravo, moÅ¾da moÅ¾emo dobili par volontera da se i igrati Tic-Tac-noÅ¾ni prst. [NeÄujan] jedan, a jedan viÅ¡e, dva, upravo tamo. DoÄi gore. 

Dakle, idemo naprijed i ponovno pokretanje to u potpunosti. Dakle, hi. 

PUBLIKA: Bok. 

SPEAKER: Koje je vaÅ¡e ime? 

PUBLIKA: Gorav. SPEAKER: Gorav. 

PUBLIKA: Ja sam Layla. 

SPEAKER: I Layla i Layla, ispriÄavam se. DoÄi gore. Gorav, Äemo imati idete prvi. I ja Äu vas da se ne StraÅ¡no dobro Tic-Tac-Toe igraÄ. U redu, tako da sve je pritisak off na vas. Da vidimo, ipak, da je naÅ¡ stroj IgraÄ zapravo moÅ¾e uÄiniti neÅ¡to pametno. Pa iÄi naprijed. IdeÅ¡ upisati u kojem koordinatnom Å¾elite staviti svoje X u. A0, u redu, a stroj je otiÅ¡ao odmah i staviti svoj peÄat u A1. 

Stavite O na brodu. U redu, sada iÄi naprijed. Gdje biste Å¾eljeli otiÄi? C2. NaÅ¡ stroj igraÄ uzima srednji kvadrat, blokirali vas. Tako da je dobar, pametna stvar za to uÄiniti. Vi ste ga blokirali. To je izvrsno. Potrebno crte tamo. 

I to Äe vas prisiliti da uzeti posljednji prostor, B0. A igra zavrÅ¡ava u kravatu. Ali to igrao razumna igra protiv tebe, zar ne? U redu, hvala vrlo velik, Gorav. 

[PLJESAK] 

U redu, Layla, idemo up igre na tebe ovdje. 

PUBLIKA: Oh, lijepo. 

SPEAKER: Idemo dati Å¡to Äetiri strane Äetiri Tic-Tac-noÅ¾ni prst. Sada, u Äetiri po Äetiri, morate pobijediti s Äetiri u nizu, a ne tri u nizu. I to je sve tvoje. Dakle, Layla je D1. Sada Äemo pratiti naÅ¡e raÄunalo igraÄa ovdje. Tri od tri Tic-Tac-Toe je vrsta stvar koja je lako za sve nas. No, to je joÅ¡ uvijek lijepo vidjeti RaÄunalo igraÄ ÄineÄi pametne poteze. Äetiri od Äetiri dobiva biti malo trickier. 

Lijepo uÄinili. U redu, Layla je zavrÅ¡io. Oh, i trebali smo zavrÅ¡io tamo. Ali neka je uÄiniti joÅ¡ jedan ovdje. Dakle Layla, hvala. Lijepo uÄinili. 

[PLJESAK] 

Dakle, naÅ¡ Tic-Tac-Toe igraÄ ide kroz i naÄe mjesta, rjeÅ¡ava ih koristeÄi ovaj Minimax. I ja sam imao postavke dubine na to da njega ne bi pokrenuti prebrzo, Å¡to je vjerojatno razlog zaÅ¡to Layla je bio u moguÄnosti iÄi naprijed lijepo kao Å¡to je uÄinio, a uÄinio je vrlo dobro. No, ti sustavi koji samo proÄi i silu iÄi dublje i dublje, i dublje, i drÅ¾ati pronalaÅ¾enju rjeÅ¡enja da im je potrebno, te vrste sustava su vrlo uspjeÅ¡ni u njih, dobro, standardne igre na ploÄi. 

A u stvari, ako gledamo tri za tri Tic-Tac-Toe igre, to je u osnovi rijeÅ¡eno problema. I to je divno dijagram od Randall Munroe na Xkcd, prikazuje koje se kreÄu trebali poduzeti, s obzirom protivnikove poteze. To je neÅ¡to Å¡to smo mogli jednostavno odrediti unaprijed. No, Å¡to se dogaÄa dok smo dobili viÅ¡e sloÅ¾ene igre, viÅ¡e zamrÅ¡en igre, gdje postoje veÄi zajednice viÅ¡e, moguÄnosti, dublja strategija? 

Ispada da je ovaj silu traÅ¾i dalje radi priliÄno dobro, osim kada doÄete do toÄke gdje je to stablo je tako velik da se ne moÅ¾e sve to predstavlja. Ako ne moÅ¾ete izraÄunati cijeli stablo, kada ne moÅ¾ete iÄi naprijed i gurnite sebe do toÄke gdje ste dobivÅ¡i cijeli stabla u memoriji, ili moÅ¾ete li ga dobiti u memoriji i da Äe samo odvesti put predug za pretraÅ¾ivanje to, Å¡to morate uÄiniti neÅ¡to pametnije. 

Da bi to postigli, te morate uÄiniti dvije stvari. Prvo, morate pronaÄi neke naÄin ograniÄavati vaÅ¡u dubinu. Pa, to je u redu. MoÅ¾emo pronaÄi neke lijepe, minimum i reÄi, moÅ¾ete samo iÄi tako duboko. Ali kada to uÄinite, to vam znaÄi su ove djelomiÄno nepotpune glaÄanje. I morate birati, ne volim ovo je djelomiÄno nepotpuna odbora, ili to djelomiÄno nepotpuna odbora? 

A na naÅ¡a Äetiri strane Äetiri Tic-Tac-Toe igre, naÅ¡e raÄunalo igraÄ dobio dolje na dno i to rekao, Imam dvije razliÄite zajednice. Niti jedna pobjeda. Niti jedan gubitak. Ni jedna je kravata. Kako odabrati izmeÄu njih? I to nije imati pametan naÄin da radi. 

Vidimo ove vrste Procjena se dogoditi sve vrijeme kao Å¡to smo dobili u sloÅ¾enije igre. Å ah je sjajan primjer. U Å¡ahu, imamo prvo od svega, veÄi odbora. Imamo daleko viÅ¡e komada. A pozicioniranje tih komada a naÄin na koji su ti komadi premjestiti je kritiÄki vaÅ¾no. Dakle, ako Å¾elim koristiti Minimax, Moram biti u moguÄnosti odrediti i reÄi, ovaj forum, gdje nitko nije osvojio ili izgubio joÅ¡, je nekako bolje od ovoga drugoga odbora, u kojem nitko nije pobijedio ili izgubio. 

Da biste to postigli, ja mogu uÄiniti stvari kao Å¡to ja mogu samo brojati koliko komada moram i koliko komada imate? Ili sam moÅ¾da dati drugaÄiji komada razliÄite toÄke. Moja kraljica vrijedi 20 bodova. VaÅ¡ pijun vrijedi jedan bod. Tko ima viÅ¡e bodova ukupno? Ili sam moÅ¾da uzeti u obzir stvari kao Å¡to su, koji je dobio bolju poziciju na ploÄi? Äiji je to zaokret sljedeÄi, sve Å¡to mogu ne procijeniti toÄnije koji od tih moguÄnosti Bolje je bez iscrpno obzirom svaki potez koji bi mogao doÄi nakon toga. 

Sada bi taj posao, jedna od stvari koje ih godina Äe postati jako vaÅ¾no za nas nije samo kreÄe ravno do odreÄene dubine granica, ali biti u moguÄnosti reÄi, jedna od tih ideja koje sam ima toliko loÅ¡e da je to Ne vrijedi s obzirom na sve moguÄe naÄine da stvari mogu iÄi od zla na gore. Da biste to postigli, mi Äemo dodati u Minimax naÄelo naziva alph-P. I alfa-beta, kaÅ¾e, ako imate loÅ¡a ideja, nemojte gubiti vrijeme pokuÅ¡avajuÄi saznati toÄno koliko je to loÅ¡e. 

Evo Å¡to Äemo uÄiniti. Idemo uzeti isti Principi koje smo imali prije, isti minimax tipa traÅ¾enja, samo smo ide pratiti, ne samo od Stvarne vrijednosti koje imamo, ali Äemo pratiti najbolji moguÄi Vrijednost da sam mogao dobiti, a najgore moguÄe Ishod sam mogao. I svaki put najgore moguÄe stvar je u potrazi vjerojatno, Ja Äu napustiti taj dio stabla. A neÄu ni zamarati gledajuÄi ga viÅ¡e. 

U redu, zamislite da poÄnemo s tom istom toÄnim igre stabla. A sada Äemo iÄi opet dolje, sve na putu prema dolje u tom donjem lijevom kutu. I u tom donjem lijevom kutu, mi izgled i ocjenjujemo ovaj forum. MoÅ¾da je Äetiri od Äetiri Tic-Tac-Toe odbora, ili moÅ¾da je Å¡ahovskoj ploÄi. Ali mi gledamo na njega, a procjenjujemo da, i dobili smo vrijednost od osam. 

U tom trenutku, znamo da je Äemo dobiti barem osam bodova iz ovog dna odluke. Nije bitno Å¡to druga dva su, da je sedam i to dvije. Oni mogu biti bilo vrijednosti oni su htjeli da bude. Idemo dobiti na Najmanje osam bodova. U redu, ali smo mogli iÄi naprijed i provjeriti. MoÅ¾da je jedan od njih je bolji od osam. 

Mi gledamo na sedam. Je li bolji od osam? Ne, to ne mijenja MiÅ¡ljenja smo na sve. Mi gledamo na dva. Je li bolji od osam? Ne, to ne mijenja MiÅ¡ljenja smo na sve. Dakle, sada znamo da smo iscrpili sve moguÄnosti tamo. NeÄemo dobiti niÅ¡ta bolji od osam. Äemo dobiti toÄno osam. 

I tako smo promijeniti taj Ävor i recimo, da je sada sigurna. Idemo jednu razinu iznad toga. A sada znamo neÅ¡to O toj razini minimizacije. Znamo da nikada si iduÄi u dobiti viÅ¡e od osam poena, ako idemo prema dolje tom smjeru. Jer, Äak i ako oni druge dvije grane izadju biti fantastiÄan i vrijedan tisuÄe bodova svaki, naÅ¡ protivnik Äe nam dati minimalno, i dati nam osam. Dobro, dobro, neka je vidjeti. Mi Äemo nastaviti niz taj put. Idemo do tog sredini s lijeve strane. Gledamo se i vidimo tamo je devet. Znamo da Äemo dobiti najmanje devet toÄaka po silazio da srednji put. I u ovom trenutku, moÅ¾emo samo pauzirati. I moÅ¾emo reÄi, sam znate u razini gore, Idem da se ne viÅ¡e od osam bodove ide dolje ovaj smjer. Ali, ako sam otiÅ¡ao dolje u sredini Put umjesto lijeve staze, Ja bih dobiti barem devet bodova. 

Moj protivnik nikada neÄe neka mi iÄi dolje da srednji put. Oni su dobili odabrati. I oni Äe izabrati Put u lijevo prema osam, umjesto po sredini prema Å¡to je najmanje devet bodova. Dakle, u tom trenutku, ja Äu prestati. A ja Äu reÄi, znate Å¡to? Ne morate traÅ¾iti viÅ¡e u tom smjeru. Jer ja nikada neÄu doÄi. 

Ja mogu preskoÄiti taj jedan, i ja mogu preskoÄiti tu Å¡est, jer to nikada neÄe dogoditi. Dakle, ja Äu otiÄi dolje i ja Äu razmislite sljedeÄi moguÄnost. Idem dolje, a ja kaÅ¾em, vidim dva. Znam da sam doÄi do ovdje, ja sam Äe dobiti najmanje dva. U REDU. Ja zadrÅ¾ati ide. Vidim Äetiri. Znam da Äu dobiti barem Äetiri. Ima joÅ¡ puno izmeÄu Äetiri i osam, ipak. Tako sam zadrÅ¾ati ide. Gledam dolje i vidim da postoji jedan. U redu, znam da ako Idem dolje ovaj put, Ja Äu biti u moguÄnosti odabrati Äetiri. Å to je moj protivnik Äe uÄiniti? IzmeÄu neÅ¡to Å¡to mi daje osam, neÅ¡to Å¡to mi daje Äetiri, i neÅ¡to Å¡to daje mi najmanje devet, dobro, on Äe mi dati Äetiri. I sada znam Na samom vrhu, idem biti u moguÄnosti da biste dobili najmanje Äetiri boda iz ove igre. 

Cijela ideja alfa-beta je odsjeÄen dijelovima stabla tako da ja ne gledati u njih viÅ¡e. No, to joÅ¡ uvijek izgleda kao da sam bio gledajuÄi puno drveta. Idemo nastaviti padati. Mi Äemo iÄi dolje sljedeÄi sada. Dolje na dnu, sam pronaÄi jedan. Znam da Äu dobiti barem jednu. Ja drÅ¾ati obliÄje. 

NaÄem tri. Znam da Äu dobiti barem tri. Ja zadrÅ¾ati ide. NaÄem pet. Znam da Äu dobiti pet ako bi se u tom putu. I ja takoÄer znam onda da je moj protivnik, ako sam odabrati sredine tri velika izbori, on Äe mi dati neÅ¡to Å¡to je pet ili manje. 

U REDU. Ja mogu zadrÅ¾ati ide tamo. Ja mogu pogledati dolje i ja MoÅ¾e se reÄi, Å¡to Äu dobiti ako idem po sredini staze? Idem dobiti, dobro, tri tamo. Idem neÅ¡to to je najmanje tri. Ima joÅ¡ stvari izmeÄu tri i pet, pa sam drÅ¾ati obliÄje. Oh, devet, ja Äu svakako uzeti preko tri. Idem dobiti najmanje devet ako idem dolje da srednji put. 

Sada moj protivnik zaustavlja i kaÅ¾e: izgleda, nema smisla viÅ¡e. Znam da je moj minimizacija protivnik, on je Äe mi dati stvar koja je manji ili jednak do pet, nego stvar koja je veÄa od ili jednaka do devet. Ja zaustaviti. Ne gledati viÅ¡e na to. Ja zadrÅ¾ati ide. 

Gledam dolje na ovom jednom. Dolje na dnu, naÄem Å¡est. Znam da Äu dobiti barem Å¡est. I Å¡to mogu uÄiniti? Ja mogu zaustaviti. BuduÄi da je izbor izmeÄu neÅ¡to Å¡to je najmanje Å¡est i neÅ¡to Å¡to je manje od pet, on je Äe mi dati ono to je manje od pet. A sada znam da Äu da se upravo taj izbor. Idem dobiti taj pet izbora. 

VraÄam se na vrh. Å to Äu birati izmeÄu neÄega To je veÄe od ili jednako do Äetiri, ili neÅ¡to Å¡to je jednako pet? Idem uzeti neÅ¡to to je najmanje pet. Idem dolje zadnji put, sve put do dna. Postoji jedan. U redu, barem Äu dobiti jedan bod. Ja zadrÅ¾ati ide. Dva, oh, to je bolje od jedne. Idem dobiti najmanje dva. NaÄem tri. Znam da Äu dobiti tri. 

I toÄka iznad toga, moj protivnik ide da mi daju neÅ¡to Å¡to je manji ili jednak do tri. I sad ja mogu zaustaviti. BuduÄi da u izbor izmeÄu mene se moÄi dobiti pet i moj protivnik da mi neÅ¡to manje od tri, Ja sam uvijek uzeti da je pet. Pa ja ne procjenjuju da je donji dio stabla na sve. 

Sada, to moÅ¾e Äiniti manje. Ali kad malo komadiÄi aritmetika, veÄi od i manje od, MoÅ¾ete izrezati daleko Äitave dijelove to eksponencijalno raste stablo, koji vodi u veliki iznos Å¡tednje, Å¡tednja koji su dovoljno veliki da sam MoÅ¾ete poÄeti igrati natjeÄe na viÅ¡e sloÅ¾enih igara. 

U redu, ako Äemo gledati na veliÄinu i sloÅ¾enost razliÄitih igara, Tic-Tac-Toe je bio naÅ¡ jednostavan primjer. Imamo malu ploÄu, tri od tri. Mi smo dobili, najviÅ¡e, u prosjeku oko Äetiri razliÄita izbora kao Å¡to smo proÄi kroz igru. Imamo negdje oko 10 do Peti moguÄi razliÄiti liÅ¡Äe. I izgradnju Tic-Tac-noÅ¾ni prst igraÄ, dobro, samo mi je to uÄinio. To je lako. 

Ako idemo do neÅ¡to viÅ¡e kompleks, kao Connect Four. SjeÄate li se ove igra u kojoj ispadne malo Å¾etona u? To je Å¡est od sedam odbora, Ne da mnogo veÄi, joÅ¡ uvijek ima istu grananja faktor kao Tic-Tac-noÅ¾ni prst. Imam oko Äetiri izbora gdje mogu staviti stvari u. Ali sada, imam puno viÅ¡e vodi, 10 do 21. snage. To je neÅ¡to Å¡to je lako dovoljno da ga rijeÅ¡iti odmah. 

Dama, viÅ¡e vas complex-- dobio osam od osam odbora. Ti si samo na pola ih u bilo koje vrijeme, ipak. ImaÅ¡ grananje Äimbenik koji je oko 2.8. Pa, imamo par potezi koje moÅ¾ete poduzeti. ImaÅ¡ oko 10 do 31. liÅ¡Äa, veÄe i veÄe, a veÄe prostore. Kao Moram pretraÅ¾ivanje one veÄe i veÄe prostore, to je kad stvari poput alfa-beta i biti u moguÄnosti odsjeÄi cijele grane postaje bitan. 

Sada, dame je lako u 1992. RaÄunalni program pod nazivom Chinook pobijedio svjetske dame prvak, Marion Tinsley. I od tada, nema ljudski gospodar igraÄ bio u moguÄnosti pobijediti najbolji raÄunalne sustave. Ako gledamo neÅ¡to poput Å¡aha, sada opet, imamo osam od osam odbora. No, imamo mnogo viÅ¡e kompleks komada, mnogo sloÅ¾enije pokrete. Imamo grananje faktor od oko 35, 35 moguÄih poteza u prosjeku da ja mogu uzeti i stanje Prostor, broj listova koja je narasla na 10 do 123. vlasti, enorman broj moguÄnosti. 

Svejedno moderni procesori su u moguÄnosti to uÄiniti uspjeÅ¡no. U 1995., a zatim u 1997, raÄunala Program pod nazivom Deep Blue sagradio je IBM koji je vodio na divovski superraÄunalo pobijediti trenutni svjetski prvak, Gari Kasparov. Ovo je bila prekretnica. Danas je, meÄutim, da je ista obrada Snaga sjedi na mom MacBook. 

Brzina obrade Äuva sve brÅ¾e i brÅ¾e. MoÅ¾emo procijeniti sve viÅ¡e i viÅ¡e odbori brÅ¾e i brÅ¾e. Ali Å¡to je joÅ¡ vaÅ¾nije, imamo bolje evaluacije funkcije i bolje obrezivanje metode. Tako moÅ¾emo pretraÅ¾iti Prostor sloÅ¾enije. NajveÄi uprave igre koje moÅ¾emo sjetiti, neÅ¡to sliÄno Idi to dobio 19 po 19 odbora, sada odjednom, mi smo iza toÄke gdje raÄunalni sustavi mogu pobijediti. Nema raÄunalna Sustav vani koji moÅ¾e pobijediti profesionalni Go igraÄa. Najbolji sustavi danas se svrstavaju oko vrsta dobre amaterskoj razini. Dakle, tu je joÅ¡ vrlo malo van nema da ne moÅ¾e doÄi do joÅ¡. 

U redu, to tradicionalne igre na ploÄi, ove vrste sustava gdje smo izgraditi ovaj Minimax, bilo da je dobio alfa-beta ili ne, te algoritama rada jer postoje odreÄena ograniÄenja. Imamo savrÅ¡en informacije o svijetu. Mi znamo gdje su svi komadi su. Svijet je statiÄna. Nitko ne dobiva za pomicanje komada oko dok sam sjedi tamo misleÄi, da je moj red. Postoji akcija prostor koji je diskretni. Ja mogu staviti moj pjeÅ¡aka ovdje ili mogu staviti moj pijun ovdje. Ne smijem staviti moje pjeÅ¡aka na crta izmeÄu dva kvadrata. 

I konaÄno, akcije su deterministiÄka. Znam da ako kaÅ¾em, top na viteza tri, moja vrana Äe zavrÅ¡iti na viteza tri, koliko god je to valjan potez. Nema neizvjesnost o tome. Sada, kao Å¡to sam iÄi na viÅ¡e razliÄite vrste igara, moramo razbiti one pretpostavke. 

Å to ako idem na neÅ¡to poput klasiÄnih video igara? Evo izbor video Igre iz Atari 2600. Å to ja imam tamo? Imam Frogger, prostor Invaders, Zamka, i Pac-Man. Koje vrste okruÅ¾enja moram sad ovdje? Koji od ovih pretpostavki moram razbiti? 

Pa, to ovisi o igri. Mogao sam igrati Å¡ah na 2600, a to bi bilo kao Å¡to je bio prije. Za veÄinu tih sustava, tu je cjelovito znanje o svijetu. Postoji potpunosti deterministiÄki akcije. Ali obiÄno, u svijetu viÅ¡e nije statiÄna. To je, dok sam sjedio Äekao, neÅ¡to se kreÄe. Duhovi dolaze po mene. Å korpion je mene ispod. The Space Invaders su dolazi bliÅ¾e i bliÅ¾e. Koliko dobro moÅ¾emo uÄiniti protiv njih? 

Prije nekoliko godina, Google je projekt pod nazivom DeepMind, gdje su obuÄeni raÄunala Program igrati Atari 2600 igre. A ako mislite da je to nije ozbiljna posao, rezultati njihove studije objavljeni su u Äasopisu Nature, tako samo oko kao dobar publikacija kao Å¡to eventualno mogu dobiti. A evo kako su se dobro izvedena. 

Oni imaju algoritam koji sjedi i gledao samo na zaslon ulaza. On je dobio nikakve upute god o pravilima igre. I to je trebao shvatiti, temelji svoju ocjenu, koliko dobro to radi. To je sustav koji se koristi neÅ¡to zove uÄenje pojaÄanje. To jest, ona je pogledala s rezultatom. A ako je dobio dobre ocjene, on je rekao: I nemojte zaboraviti te stvari. A ja trebao uÄiniti oni opet. A ako je dobio loÅ¡u ocjenu, on je rekao: Ne treba raditi one stvari opet. 

Ovo je predstava od onih obuÄenih sustava smiju igrati za nekoliko sati na svakoj utakmici, u odnosu na profesionalne igraÄe. Dakle, za sve igre koje su na lijevoj strani ove linije, Ovaj self-obuÄeni raÄunalni program nadmaÅ¡io profesionalne igraÄe. A za sve do pravo, profesionalni igraÄi su joÅ¡ uvijek najbolji. Za neÅ¡to Å¡to je znao niÅ¡ta o pravilima, da je niÅ¡ta o strukturi znali igre, to je impresivan nastup. I to je ono Å¡to smo u stanju uÄiniti danas. 

U redu, vi kaÅ¾ete, ali ako smo razmiÅ¡ljati o AI u igrama, obiÄno mislimo o stvari koje moÅ¾emo zapravo sjesti i igrati protiv. Ako sam sjesti i ja igram StarCraft, ili igram Besplatno sito, raÄunalo protivnik je Osoba kontrolu Zerg, ili upravljanje drugu civilizaciju. Kako ti igraÄi zapravo pronaÄi njihove poteze? 

Pa, ove igre su strukturirane mnogo na isti naÄin kao i naÅ¡e igre na ploÄi, ove igre koje Äemo kolektivno nazivaju Äetiri X Games, istraÅ¾ivanje, expand-- zaboraviti one. Å to su oni? IstraÅ¾ite, proÅ¡iriti, i ugasiti, Mislim da je zadnji. Ali oni su u osnovi istraÅ¾ivanje i osvajanje igre. TipiÄno, raÄunalo protivnika ima ima ograniÄene informacije. Oni ne znaju toÄno Å¡to je dogaÄa iza magle rata. Ne vidim kako bi dobili Å¡to imate u inventaru. 

Postoji okruÅ¾enje koje je dinamiÄan. Sve se mijenja cijelo vrijeme. Ne Äu sjediti i Äekati da se vaÅ¡ potez. No, veÄina stvari su joÅ¡ uvijek diskretna. Moram staviti moj grad ovdje. Ili moram staviti moj grad ovdje. I sve je deterministiÄka. Kad kaÅ¾em, premjestiti svoje jedinice ovdje, moje jedinice seli se ovdje, osim ako je prepreka odjednom dolazi u igru. Sada, to nije sve na raÄunalu igre koje su tamo i danas. 

Ako idem i ja igrati prvi tip osobe igra, neÅ¡to poput lopov ili Fallout ili Skyrim, ili halo, sada Imam raÄunalnih protivnika da su vani da imaju vrlo razliÄite situacije. Oni su, opet, ograniÄene informacije. Oni mogu samo vidjeti sigurno vidno polje. OkoliÅ¡ je uvijek dinamiÄan. Stvari se mijenjaju cijelo vrijeme. 

Ali sada imam puno viÅ¡e kontinuirano djelovanje prostor. Mogu biti samo vire malo izvan vrata. I neke igre, moj akcije su stohastiÄki. Ja se pokuÅ¡ati skoÄiti preko tog zida, ali sam dobio priliku od neuspjeha. Ove vrste igara su sve bliÅ¾e i bliÅ¾e vrste kontrolera koje gradimo u robotici. 

U robotike, moramo pretpostaviti da imamo ograniÄen podatke. Imamo senzora koji recite nam o svijetu. Imamo uvijek mijenja, dinamiÄno okruÅ¾enje. Imamo svijet u kojem je prostor kontinuirano, a ne diskretni. I naÅ¡e akcije, kada pokuÅ¡avamo ih, imaju Å¡anse nedostatku. A u stvari, moderna igra Regulatori za vaÅ¡e Halo protivnika, ili za one NPC u Skyrim, u osnovi pokrenuti male robotske arhitekture. 

Osjete svijet. Oni izgraditi model svijeta. Oni izraÄunati na temelju skupa ciljevi koji bi Å¾eljeli ostvariti. Oni planiraju akcije temeljene na ono Å¡to oni znaju. A one su toÄno iste vrste sustava koje gradimo u robotici. Tako ove arhitekture, na dovesti natrag zajedno, Äesto su sasvim isti. 

Dakle, neka je vidjeti ako moÅ¾emo vidjeti da. Vratimo se na naÅ¡ tic-tac-toe primjer. A ja Äu postaviti nekoliko mojih post-docs doÄi i pomoÄi mi. Tako Chen Ming, i Alessandro i Olivier, ako ti deÄki Äe doÄi. I ja Äu morati par volontera 

OK, vidio sam ruku pravo tamo u sredini. Dopustite mi da joÅ¡ jednom, netko dalje u leÄima moÅ¾da. U redu, tamo. DoÄi gore. U redu. Tako Äemo uzeti da je poklopac. A ako ti deÄki Äe doÄi u pravu natrag ovdje za mene, fantastiÄno. 

Dakle, ovo je robot zove Baxter. A Baxter je robot koji je komercijalna platforma, osmiÅ¡ljen tvrtka zove promisliti. I ovaj robot je osmiÅ¡ljen za proizvodnju malih. No, danas Äemo ga koristiti za igranje Tic-Tac-noÅ¾ni prst. Sada, ovaj robot je i neÅ¡to to je relativno jedinstven. Jer ako ja stajali nigdje u neposrednoj blizini standardnom tvornice automatizacije Sustav, ja bih se u samom grobu opasnost od ozljeda. 

Baxter, meÄutim, je dizajniran da bude relativno sigurno za interakciju s. I tako ja mogu gurati ovaj robota. I moÅ¾ete vidjeti da je malo malo fleksibilni dok se kreÄe oko. I mogu ga premjestiti gdje sam bih to iÄi. Sada u normalnom robotskom sustavu, bismo imali set zglobova ovdje kako bi se izravno reagirati na poloÅ¾aj naredbe. A oni ne bi nuÅ¾no stalo ako su se kreÄe kroz otvorenom, ili ako su se kreÄe kroz moje prsnog koÅ¡a. 

U REDU. I obiÄno, ako ste bili ovdje s industrijskim sustavom, ti bi iÄi nigdje u blizini. Tu Äe biti Å¾uta Sigurnost Traka sve oko nje. Ovaj sustav ima malo drugaÄiji dizajn biti prijateljski i lakÅ¡e za ljude u interakciji s, u da u svakom zglobu, postoji proljeÄa. I umjesto da kontrolira toÄan poloÅ¾aj, kontroliramo odreÄenu koliÄinu moment, odreÄenu koliÄinu snage, kako bismo Å¾eljeli da se na tom izvoru. U redu, pa mi dopustite uzeti naÅ¡e volontere ovdje. Bok, kako se zoveÅ¡? 

PUBLIKA: Louis. 

SPEAKER: Louis. Lijepo vas je vidjeti. I? 

PUBLIKA: David. 

SPEAKER: David. Drago nam je. Ako ti deÄki Äe Äekati upravo ovdje na trenutak, Ja Äu vam dati priliku da to uÄinite. Dakle, ovaj robot, ako doÄe do a ako gurnuti lagano na njega, ti si iduÄi u vidjeti da se kreÄe malo. A ako ga zgrabite pravo ovdje na zapeÅ¡Äu jednostavno gore gdje su ti gumbi, to Izgleda da treba zgrabiti gumbe, ali iskoristite odmah iznad njega umjesto toga, vi Äete moÄi vrlo lagano manipulirati kroz prostor. Louis, Å¾elite dati ga probati? Tako ga dati samo malo guranje za poÄetak. A onda, ako ste stavili svoje prste upravo tamo i zadrÅ¾ati na njemu, jer Äe se pomaknuti za vas onda. U redu, Å¾elite dati ga probati? DoÄi gore. Tako ga dati samo njeÅ¾na gurati tamo za poÄetak. MoÅ¾ete osjetiti kako je to. I onda ako ga zgrabite pravo postoji, Äete biti u moguÄnosti za manevriranje oko. 

U REDU. Tako obiÄno, ova vrsta robota bi upotrijebiti za proizvodnju malih razmjera. I ja Äu premjestiti ovu ruku samo dolje zabit malo ovdje. Ali danas, mi Äemo koristiti Isto Tic-Tac-Toe sustav reprodukcije na temelju Minimax da smo ranije izgradili. U REDU? Dakle, ti deÄki su svaki Äe igrati igru. Louis, ti ÄeÅ¡ biti prvi. Dopustite mi da drÅ¾ite se ovdje na trenutak. Idem da stojite u redu ovdje, tako da svatko moÅ¾e vidjeti. Jeste li vi postaviti ovdje? 

ROBOT: DobrodoÅ¡li. Idemo igrati Tic-Tac-noÅ¾ni prst. Nemojte shvatiti token prije KaÅ¾em da je tvoj red. Sam poÄetak igre. To je moj red. Govornik: Sad, ako bi mogao uzeti jedan od VaÅ¡i komada i iÄi naprijed i stavite ga. ROBOT: To je tvoj red. [SMIJEH] To je moj red. [SMIJEH] [SMIJEH] To je tvoj red. SPEAKER: Ljudska rasa raÄunaju na vas ovdje, Louis. 

ROBOT: To je moj red. 

SPEAKER: Pa Baxter uspjeÅ¡no blokiran ovdje. 

ROBOT: To je tvoj red. To je moj red. To je tvoj red. To je moj red. SPEAKER: I mi Äemo pustiti Baxter zavrÅ¡iti izvan svoje zadnji potez ovdje. 

[SMIJEH] 

ROBOT: To je kravata. Ja Äu osvojiti sljedeÄi put. 

[SMIJEH] 

Govornik: U redu, hvala vrlo velik, Louis. Hvala. MoÅ¾ete iÄi na ovaj naÄin. 

ROBOT: Ja poÄetak igre. SPEAKER: Pa neka mi objasni vam joÅ¡ jedan mali Malo prije nego Å¡to smo dobili naÅ¡ revanÅ¡ ovdje. Å to se toÄno dogaÄa? Dakle, robot ima vrh fotoaparata ovdje. I to je izgleda dolje na brodu. I to je viÄenje bilo to je dobio crveni O ili plava bijelo X. Kao one se stavljaju na odbora, koji je u osnovi isti ulaz da bi se Äitanja iz naÅ¡a struktura podataka iz naÅ¡eg ekrana. To je trÄanje isti minimax algoritam se moguÄnosti pronaÄi gdje staviti dobar znak. 

I onda mi daju naredbu o gdje smo Å¾eljeli token biti postavljeni. Ruka se kreÄe van. To je pomoÄu vakuumske hvataljku za primjenu neki usis na taj drveni dio, ga podiÄi, to pomicanje udesno mjesto, a zatim otpustite usisavanje i ispustite ga. U redu, idemo da joj joÅ¡ jedan metak s malo pametniji igraÄ ovdje. Spreman? U redu, ako Å¾elite stajati desno gore ovdje i dati A- ispalo ovako tako da moÅ¾ete vidjeti sve. I onda [neÄujan]. 

ROBOT: To je moj red. 

SPEAKER: Baxter Äe poÄeti. To je tvoj red. To je moj red. To je tvoj red. To je moj red. 

[SMIJEH] 

SPEAKER: [Å¡apÄe] Samo neka ide naprijed i pobijediti. ROBOT: To je tvoj red. SPEAKER: To je u redu. 

ROBOT: To je moj red. 

[SMIJEH] 

Pobijedim. 

[SMIJEH] 

Sam poÄetak igre. 

Govornik: U redu, puno hvala. U redu, mislim da imamo vremena za joÅ¡ jedan izvrstan Tic-Tac-Toe igraÄ, netko tko moÅ¾e staviti ovu stvar na odgovarati, tko zna Å¡to radi. 

[SMIJEH] 

Tko Äe biti naÅ¡ prvak ovdje? U redu, vaÅ¡i prijatelji vas dobrovoljno. To je dovoljno dobar za mene. Reci mi svoje ime ponovno. PUBLIKA: Tamir. Govornik: Tamir, lijepo vas je vidjeti. U redu, opet, mi Äemo vas staviti sve do ovdje, pa svatko moÅ¾e vidjeti. Vi ste naÅ¡ predstavnik u ovoj utakmici sada. Baxter je jedan i oh oh. Ili mi je, jedan oh i jedan. I to je do vas ovdje. Baxter Äe doÄi do premjestiti prvi, ipak. Tako. ROBOT: To je moj red. 

[SMIJEH] 

To je tvoj red. To je moj red. To je tvoj red. To je moj red. To je tvoj red. 

[SMIJEH] ROBOT: To je moj red. SPEAKER: To je puno teÅ¾e kada stojiÅ¡ ovdje, ljudi. [SMIJEH] ROBOT: Ti su ljudi tako lako pobijediti. [Smijeh i pljesak] SPEAKER: Hvala puno. ROBOT: pobijedim. Sam poÄetak igre. 

Govornik: U redu, hvala vrlo mnogo Oliviera, i Alessandro, i Chen Ming. 

[PLJESAK] 

Å½elim da posljednji bod. Dakle Baxter na vrlo postoji kraj, varao. I to je bilo neoÄekivano. Jedan od fantastiÄni stvari o AI je da smo rade u AI, tako da moÅ¾emo izgraditi stvarno zanimljivo i inteligentno ureÄaji. Ali, mi takoÄer rade u AI jer nam govori neÅ¡to o tome kako su ljudi inteligentni. 

Jedan od favorita Studije iz mog laboratorija je gleda na ono Å¡to se dogaÄa kada strojevi neoÄekivano varati. Mi to uÄinio izvorno ne s Baxter igrati Tic-Tac-noÅ¾ni prst, ali s manjim robota po imenu Nao, koji je igrao rock-papir-Å¡kare. A ponekad nakon igrati puno puno dosadno rock-papir-Å¡kare igre, robot bi baciti gestu, izgubiti, a onda odjednom promijeniti njegova gesta i reÄi, ja pobijediti. 

[SMIJEH] 

Sada, ponekad mi bismo takoÄer imaju robota, samo kao kontrola, baciti gestu, pobijediti, i promijeniti svoju gestu izgubiti, baciti utakmicu, varati kako bi se izgubiti. I to nije gotovo kao uvjerljiv. Robot koji vara kako bi se pobijediti ljudi reagiraju na kao Å¡to je kako bi ih dobili, kao Å¡to je to je aktivno traÅ¾e njihovo uniÅ¡tenje. 

[SMIJEH] 

Ona postaje sredstvo. To je kao osoba. To je uvjerenje i namjere. I to nije dobro namjera. A robot koji baca Igra je jednostavno neispravan. To je samo slomljen ureÄaj. Dopustite mi da vam pokazati par primjera to iz nekoliko naÅ¡ih polaznika. Dakle ovdje je varanje kako bi se izgubiti. 

[VIDEO PLAYBACK] - [NeÄujan] pobijediti. Igrajmo. 

-Äekaj, Å¡to? 

- [NeÄujan] pobijediti. Igrajmo. 

[NeÄujan] pobijediti. Igrajmo. 

SPEAKER: I ovdje je varanje osvojiti. 

-Da, Ja pobijediti. Igrajmo. 

-Ne Mogu to uÄiniti. 

[SMIJEH] 

-Da, Ja pobijediti. -Vi Varao. Varao si sada. 

-Da, Ja pobijediti. 

-Hej, Ti varalica. MoÅ¾ete varati, varati super. 

[END PLAYBACK] 

SPEAKER: Ovi razliÄiti Reakcije brzo promijeniti naÅ¡u percepciju ureÄaja. ZnaÄi li to da je namjerno graditi strojevi koji varaju jer je to najbolji inÅ¾enjering Å¡to moÅ¾emo uÄiniti? Ne, ali to nam govori neÅ¡to stvarno zanimljivo o ljudima. To je stvar koja vas i vara krade vaÅ¡e pobjeda, to je neÅ¡to Å¡to je Å¾iv, to je animirati, to je na vas. To je mentalno stanje. To je uvjerenje. Ona ima namjeru. 

To Å¡to se rukama igra za vas, to nije. To je samo ispravno. To je u mnogoÄemu zaÅ¡to je lako baciti igra s djecom. Ali ako ih pokuÅ¡ate prevariti i vrsta tvrde pobjedu kada je, znate, samo skratiti Igra, oni Äe vas uhvatiti odmah. Ove vrste uÄinaka koji vidimo dolaze iz AI, oni nas uÄe puno o sebi. 

U redu, to je to za danas. Hvala vrlo velik Davidu i proizvodnja tim s Harvarda doÅ¡li. 

[PLJESAK] 

Vidimo se za kviz jedan, a onda za posljednji predavanje. Ugodan dan. 

[PLJESAK] 

[Glazbom] DAVID J Malan: Pa, vjerojatno trebamo uvesti neku vrstu enkripcije, pravo? Jer tada zaglavlja ovi HTTP zahtjevi Äe biti kodirani tako da svatko pokuÅ¡avajuÄi njuÅ¡kanje prometa zapravo neÄe biti u moguÄnosti da ih vidjeti. Pa Å¡to je rjeÅ¡enje za ovaj problem? Pa, moramo se zapravo uvesti Å¡ifriranje u formuli, tako da kada je ta osoba prijenos podataka od A do B, moÅ¾emo sigurno send-- 

[SMIJEH] 

Informacije na naÄin da je Protivnik ne moÅ¾e, u stvari, vidjeti.