[Prehrávanie hudby] SPEAKER: Vitajte späť, všetci. To je CS50. A dnes, máme veľa zaujímavé veci hovoriť. Najprv však musím pripomenúť, vy z niekoľkých správnych vecí. Tento týždeň je jedným kvíz, streda alebo pre sekciu Yale v utorok a vo štvrtok, vo štvrtok. Existujú kvíz hodnotenie dnes večer na Yale, 5:30 až 7:00. Na Harvarde, že jeden včera zaznamenané. A každý môže sledovať že on-line. Aj tento týždeň, alebo začiatkom budúceho týždňa, máme náš posledný CS50 prednášku. [Stenu] Ja viem. To prišlo tak skoro. Yale študenti budú mať živý prednášať tu v právnickej fakulte hľadisko v piatok. K dispozícii bude tortu. Harvard študenti budú mať Posledná prednáška Sanders v pondelok. K dispozícii bude aj tortu. Aj tento týždeň v piatok, pre tých, ktorí z vás, ktorí sú na ceste do New Haven, máme CS50 Expo. Máme viac ako 30 rôzne skupiny registrované vám ukázať všetko, autonómnych plachetnice, pre systémy, ktoré uznávajú digitálne portréty, do počítača hudba a počítačovo produkoval hudbu. Takže prosím, pripojte sa k nám. Myslím, že to bude skvelý čas. Dnes sa však dostaneme k pokračovať v rozhovore o AI, o umelej inteligencii. A jedna z vecí, ktoré budeme sa dostať do dneška je predstava o tom, ako použiť AI riešiť problémy. A teraz, ako vždy, začnime s niečím jednoduchým. A ideme na začiatok s jednoduchej myšlienky. A to je pomocou vyhľadávania. Tak si predstavte na chvíľu, že som majú za úlohu, že musím hrať. A ja by som chcel mať túto úlohu automatizovaný nejaký softvérový agent. Predstavte si, že sa snažím si sadu letov z, povedzme, Boston do San Franciska. Mohol by som prejsť a ja som mohol použiť jeden z nádhernej on-line vyhľadávanie nástroja, ktorý sa chystá urobiť v podstate rovnaký proces, ktorý sme ísť na prechádzku do dneška. Ale ak ste nemali, že Nástroj, čo by ste urobil? No, mohol by ste vyzerať a vidieť a povedať, že som v Bostone. Aké lety sú k dispozícii? A teraz, možno mám tri Možné lety z Bostonu ktorý sa zmestí čas keď musím odísť. By som mohol letieť do Chicaga. Alebo by som mohol letieť do Miami. Alebo by som mohol letieť do New Yorku. Potom som mohol vyzerať z každého jeden z tých destinácie miest a premýšľať o tom, lokalitách Mohol by som možno dosiahnuť z každého z týchto jednotlivých miest. Takže možno z Chicaga, môžem dostať priamy let do San Franciska. To je skvelé. Alebo by som mohol dostať rokov do Denveru. Teraz, možno, že let do San Francisca je ideálnym riešením pre mňa, ale možno nie. Možno Hľadám niečo to je trochu niečo lacnejšie alebo trochu lepšie pre môj plán. A tak som sa mohol pozrieť na to, čo ostatní možnosti by mohlo byť vonku. Tak som sa mohol pozerať na Denver. A z Denveru, no, možno Môžem rokov do Austinu. A z Austinu, možno by som sa dostať Let do Phoenixu, a Phoenix do San Franciska. Teraz som neskončil. Vzhľadom k tomu, možno je tu priamy let z New Yorku do San Franciska, ktorý je ideálny pre mňa. Alebo možno je tu letu z Miami cez Denver, že je to oveľa lacnejšie. Takže som ešte musieť ísť. A stále sa pozrieť na všetky tie, mestá, ktoré som ešte preskúmaný. Musím vyčerpávajúcom skontrolovať všetky možnosti, že by som mohol mať. Takže z New Yorku, možno by som sa dostať Let do Nashvillu, a od Nashville do Austine. A potom viem, kde som. A potom viem, z Austinu, môžem pozrite sa na Phoenix a Phoenix do San Franciska. Ak by som letieť najprv do Miami, aj keď, Možno, že môžem dostať z Miami rokov do Nashvillu, alebo z Miami do Austinu. A teraz som sa snažil všetko z možností. Ja som vybudoval tento graf, ktorý Ukazuje mi všetky z možných ciest že by som mohol byť schopný prijať. Keď sme sa predstavujú títo druhy problémov, nebudeme reprezentovať je výslovne ako tento graf, preto, že graf nepredstavuje histórie, kde sme preč. S vedomím, že som letel z Phoenix do San Franciska sa mi to povedať, či som prišiel cez Nashville, alebo prostredníctvom Denveri, alebo cez Miami. Takže to, čo budem robiť, namiesto toho je Vezmem rovnaký problém, a budem zastupovať ju ako strom. A na koreň stromu, u top, dám miesto, ktoré som začal, Boston. A z Bostonu, pozriem sa na všetky možné umiestnenia že môžem cestovať. No, v tomto prípade, mal som tri, Chicago, New York, a Miami. A potom budem skúmať každý z tieto deti vo stromu. Z Chicaga, som videl, že som mal dva lety. Mohol by som letieť priamo do San Francisco alebo do Denveru. Teraz San Francisco, to je môj cieľ. To je môj cieľ. To bude list tohto stromu. To znamená, že ja nikdy ísť Niekde po San Francisco. Z Denveru, aj keď, Môžem letieť z Denveru Austin, Austin do Phoenixu, a z Phoenixu do San Franciska. A teraz zase, som dosiahol list. Mohol by som potom sa vrátiť na ďalšie mesto, ktoré som doteraz plne preskúmané. To by bolo v New Yorku, choďte späť na vrchol môjho stromu, zostúpil do New Yorku. Z New Yorku, môžem pozrite sa Nashville, Nashville do Austinu, Austin do Phoenixu, a z Phoenixu do San Franciska. A nakoniec, jedno mesto som neboli pozrel na doteraz, Miami. No, z Miami som povedal, že mal dva Možnosti, Nashville či Austin. Ak by som pozrite sa na Nashville, no a potom som sa lietať od Nashville, do Austinu, do Phoenixu, do San Franciska. Ak by som pozrite sa na Austin, Lietam Austin, do Phoenixu, do San Franciska. A teraz mám strom. Je to úplný strom. Je to všetko o možnostiach a všetky cesty, ktoré som mohol vziať. To znamená, že ak začnem u koreň stromu na vrchole a ja som šiel do jedného z odíde, to mi hovorí nielen kam idem do skončiť, San Francisco, ale to mi hovorí, trasu, Musím vziať sa tam dostať. Teraz, ktorý z nich je najlepší? No, nič o tom napriek tomu problém mi hovorí, ktoré z nich je najlepším riešením. Možno, že mi záleží najviac koľko času som vo vzduchu, alebo vzdialenosť, že lietam. V tomto prípade, Chicago do San Francisco môže byť najkratšia číslo mil vo vzduchu. Možno, že mi záleží cenu. A všetci vieme, priame lety sú zvyčajne drahšie. Takže možno, keby som to zobrať druh spätnú trasy cez Miami, Nashville, Austin, Phoenix, možno potom Mám za nižšiu cenu. Ale ja som mohol optimalizovať na niektorý kritériá, ktoré mi záleží. Kto má najlepší Rokov Wi-Fi, alebo ktoré letisko majú najlepšie jedlo k dispozícii. A každý z nich by mohol daj mi iné riešenie že vidím ako najlepší. Tieto druhy problémov, kam ideme postaviť túto strom Možnosti a potom pozrieť sa na každú z nich individuálne cesty, a preskúmať ktoré z týchto spĺňa kritériom pre nás, budeme nazývať tie problémy vyhľadávania. A máme veľa algoritmy, z ktorých niektoré sme videli už ísť a preskúmať tie stromy. Mohli by sme to urobiť tak, že som práve urobil, je prehľadávanie do hĺbky, ísť dole tak ďaleko, ako to pôjde, až kým hit list, a potom sa vráti hore, a ísť späť dole. Alebo by sme mohli robiť to, čo je volal prehľadávanie do šírky. Mohli by sme rozšíriť všetko v hornej časti, a potom všetko jeden riadok pod, že, a potom všetko jeden riadok pod to. Tieto vyhľadávacie stromy sú zásadné pre AI. Ale oni nemajú dosť dostať to právo po celú dobu. V skutočnosti, v mnohých prípadoch že nám naozaj záleží, chceme vybudovať strom, ale nie v skutočnosti dostať sa, aby všetky rozhodnutia. To sú situácie, nazývané Adversarial vyhľadávanie, tiež známy ako ako písať hranie hier systémy a dostať za to zaplatené. Ale to sú druhy systémov, kde som mohol dostať na výber, keď idem z Boston, ktorý mesto idem na ďalšie. Ale po tom, niekto iný mohol dostať k rozhodnutiu o tom, kde som sa lietať. Takže stavať tieto druhy konštrukcie, my sme bude musieť vziať mierne iný prístup k nemu. Nebudeme môcť len hľadať cez strom anymore, pretože nie sme ten, ktorý je pod kontrolou každej z týchto rozhodovacích bodov. Takže poďme si predstaviť jednoduchý Hra ako tic-tac-toe. Mohol by som začať s úplne prázdny doska. A v tic-tac-toe, X sa dostane do hry ako prvý. A tak som mohol myslieť na všetky možné pohyby, ktoré by mohli urobiť X. A keď ja som ten, hrajúci X, to je skvelé. Mám deviatich možných presunie, že môžem robiť. Mohol by som dať X v niektorom z týchto deviatich polôh. A potom sa z každého z tých, I si predstaviť, čo sa bude diať ďalej. No, v tomto prípade je druhá hráč by si, aby zase. O by si, aby zase. A z každého z tých, tam by bolo osem rôznych miest že by mohli O miesto ich značku. Povedzme, rozhodol som sa, že som bol chystá dať X v stredu. To vždy sa zdá, ako dobrý otvorenie ťah. Mohol by som sa na pod tým, že osem možných pohyby, ktoré robí. O A teraz, keď som hral X, to je úžasné. Mám si vybrať, ktorý z nich Aj ísť na, ten uprostred. Ale teraz O dostane na výber. A ja nemám kontrolu po tomto rozhodnutí. Ale z každého z tých možných pozícií doska, je tu potom ďalšie set možností. Pokiaľ ide o byť my sa znovu obrátiť, urobil by som to dostanete vybrať a povedať, dobre, ak O presunie do dobre, prostredný miesto na ľavej strane, potom Mám sadu možností kde môžem vziať moju ďalší ťah. Z tých, mohol by som do úvahy všetky možnosti pod nimi. A potom O dostane vybrať si medzi tie. A mohol by som udržať budovanie tejto strom, kým som sa dostal do bodu, kde buď niekto vyhráva game--, ktorý je musíš byť považovaný za list node-- alebo doska je úplne plná a nikto vyhral. A to tiež bude koncový uzol. Že to bude remíza. Ale ošemetná vec s týmto je, či to bola len pravidelné hľadanie problém, bol by som schopný povedzme, dobre, X by malo ísť sem. A O mal ísť cestou tam. A potom X mali ísť sem. A potom O mal ísť cestou tam. A potom sa môžete dostať tri X v rade, a ja som vyhral. A hra skončí v piatich pohybov, tri pre mňa, dva pre môj súper. Ale ja nie vždy si musíme vybrať, že. Takže namiesto toho, čo sme bude musieť urobiť sa budeme mať mať novú stratégiu. A stratégia, ktorá hra-hracie algoritmy často používajú je to, čo sa nazýva minimax. Ústrednou myšlienkou minimax je, že sme chystá vybrať ťah, ktorý dáva náš súper ten najhorší možný set pohybov, ktoré môžu robiť. To nerobí mi k ničomu zvoliť ťah kde Mohol by som vyhrať po že, pretože môj súper nie je chystá dať mi tú šancu. Chystajú sa zvoliť niektoré hrozný výsledok pre mňa. Takže som sa, aby sa presunúť, ktorá núti môj súper urobiť niečo pre mňa lepšie. Dobre. Poďme sa pozrieť, ako to dopadne. Tak tu je náš algoritmus v pseudokódu. Budeme vytvárať Celá hra strom. Chystáme sa stavať celá štruktúra. A potom pôjdeme prejsť. A na samom dne v každom z koncovými uzly, v každom z listov, budeme hodnotiť, ako cenná je to pre mňa? A budeme sa hodnota vecí, ktoré sú dobré pre mňa ako pozitívne. Veci, ktoré nie sú dobré pre mňa bude menej pozitívne, alebo nula, či dokonca záporná. Takže v tic-tac-toe, možno víťazstvo je pre mňa dobré. To je jeden. A kravata je nula. A niečo, čo je strata pre ma, možno, že je to negatívne. Všetko, na čom záleží, je, že lepšie je to pre mňa, tým vyššie skóre to prijme. Z týchto možností na dno, potom budeme filter smerom nahor. A keď je to moja šanca na výber medzi sadou alternatív, Vyberiem si ten, ktorý je dostal najvyššie skóre. A vždy, keď je to moja oponenti sa obrátiť na výber, Budem predpokladať, že sa chystáte vybrať ten s najnižším skóre. A keď som to celú cestu až na vrchol stromu, Budem si vybrali cestu, ktorá dáva me to najlepší výsledok, že môžem dostať, za predpokladu, že môj súper robí všetky správne kroky. Dobre, takže sa pozrime, to v akcii ako prvý. A potom sa vlastne pozrite sa na kód pre ňu. Tak si predstavte Mám veľký strom. A teraz som to hrať tic-tac-toe. Chcel som dať niečo, čo trochu bohatší. Tak som dostal nejakú hru, kde tam je veľa rôznych skóre že by som mohol mať na konci. A tak som sa stavať tento celý strom. A ja som si sa pohybovať ako prvý. Som na koreň stromu. A ja sa dostanete na výber that-- tak som si maximalizovať cez ktorú prvom uzla. A potom sa môj súper dostane ísť. A potom som si ísť ešte raz. Tak sa na dne, mám sadu možnosti, ktoré som si môžu vybrať z, rôzne koncové stavy hry. Ak som sa v tom, že ďaleko ľavom rohu, a vidím, že mám na výber medzi osem, v sedem, a dva, no, ja som ten, ktorý dostane na výber. Takže budem voliť jeden z tých najlepších. Idem si vybrať osem. Takže viem, že či som niekedy pustiť sa do tohto bodu, Budem mať možnosť sa dostať, že osem bodov. Keby som skončí na ďalší bod nad, ďalší uzol nad, deväť, jeden, alebo šesť, no, ja som bude vybrať tie najlepšie z nich. Vyberiem si deväť. Keď budem mať možnosť voľby medzi dva, a štyri, a jeden, Vyberiem si štyri, čo je najvyššia. A teraz, keď som sa na úrovni nad tým, môj súper je jeden dostane, aby túto voľbu. Takže môj súper sa dostáva do vybrať, nechcem, aby mu to, čo sa deje ho dostať osem bodov, alebo mám dať mu vec, ktorá sa dám mu deväť bodov, alebo to, čo sa deje dať mu štyri body? A môj súper, pričom racionálne, sa deje zvoliť minimálne tých, sa chystá vybrať štyri. A môžem to urobiť cez celý strom. Môžem ísť dole k tomu prostredný sada troch. A ja si môžu vybrať medzi jeden, tri a päť. A ja som si vybrať. Tak som si vybrať päť. Môžem si vybrať tri, deväť, alebo dva. Mám na výber, takže vybrať si deväť. Šesť, päť, alebo dva, vybrať. Mám si vybrať šesť. Level nad tým, kto sa dostáva do vybrať? Kto dostane na výber? Ten druhý chlap, môj súper. Takže oni si vyberú päť, deväť, alebo šesť, ktorý z nich? Divákov: Päť. SPEAKER: Oni si vybrať päť. Dostanú na výber minimum. A potom ten posledný, vybrať jednu, dve alebo tri. Mám na výber, takže vybrať tri. Deväť, sedem, alebo dva, vybrať deväť. A 11, šesť, alebo štyri, vybrať 11. Môj súper potom vyberie tri, deväť, alebo 11, zvolí minimálny. On mi dáva tri. A nakoniec v hornej časti strom, som si znovu zvoliť. A ja si musíme vybrať medzi štyri, päť, alebo tri. Tak som vziať päť. Či som mať všetko pod kontrolou, ja by som ísť cestou, ktorá viedla k 11. Ale ja nechápem, aby túto voľbu. Ak mám ísť touto cestou. Môj súper ma nútiť do voľba, ktorá vedie k tri. Takže to najlepšie, čo môžem urobiť, je aby podnikli stredná vetva, urobiť túto voľbu, ktorá je nakoniec ma vedú k piatich bodov. To je to, čo robí minimax. Dobre. Poďme sa pozrieť na to. Tak tu v CS50 IDE je program, ktorý implementuje minimax hrať tic-tac-toe. Chystáme sa stavať up reprezentácie. Budeme mať dva opponent-- alebo dvaja hráči, náš počítač prehrávač a človek hráč. Číslo hráča z nich bude hrať O. To bude hráč stroj. Dostanú sa pohybovať druhým. A ten druhý hráč, náš ľudský hráč, bude X. A aby svoj život trochu jednoduché, idem označiť tento hráč negatívny jeden. Tak som si len násobiť záporným jedným vymeniť Medzi jeden hráč a ďalšie. Dobre, takže sa poďme pozrieť na to, čo sme vlastne robiť. Budeme definovať našu dosku. Je to bude dobre, ideme aby mohla byť tri tri, alebo môžeme dokonca hrať Päť piatich alebo siedmich o sedem tic-tac-toe, keby ste ako je, na základe nejakého rozmeru D. A budeme mať pár pomocných funkcií že budem robiť veci, ako je inicializáciu screen-- alebo ľúto, inicializovať naše premenné, zrušte obrazovke, kresliť dosku na obrazovke, ten, ktorý kontroluje dosku či alebo nie tam je víťaz, ten, ktorý analyzuje prostredníctvom príkazového riadku, len pomoct, ten, ktorý číta v vstup, a jedna funkcia nazýva minimax. A to je ten, budeme záleží najviac. Ale pozrime sa najprv na hlavnej. Čo budeme robiť? No, budeme analyzovať našu príkazový riadok, len čítať v a uvidíme, čo rozmer tabule by sme chceli mať. Budeme inicializovať našu dosku. A potom budeme zadajte jeden veľký divoký premet, opakovane prijímajú sa pohybuje, kým je hra vyhral, ​​alebo je tam nie doľava, presunie. Zakaždým, keď sme sa prejsť, že slučka, budeme vyčistiť obrazovku. Budeme čerpať dosku na obrazovke. A my sme zámerne druh oddeliť tieto preč ako podprogramy, takže nemáme príliš starať o podrobnostiach, ako k nim dochádza. Budete mať kód ešte dnes. A ak si chcete pozrieť a zistiť, je môžete všetky vidieť. Ale budeme čerpať doska na obrazovke. A potom budeme kontrolovať a vidieť, máme víťaza? Má niekto vyhral túto hru? Ak majú, budeme tlačiť out správy víťazstvo. A budeme hru ukončiť. Budeme tiež skontrolovať a zistiť, či tam je remíza. Bude ľahké zistiť, či tam je remíza. To znamená, že všetky priestory sú plné, ale tam nebol ešte víťaz. Môžeme prehlásiť kravatu a hotovo. Potom skutočný meat-- pokiaľ je to stroj hráč, budeme dovoliť, aby Stroj hráč vyhľadávať cez použitie tohto algoritmus minimax, nájsť najlepší ťah, že to môže. A potom budeme dal, že sa posunú nahor. V opačnom prípade, ak je to človek hráč, budeme čítať nejaký vstup od človeka. A potom nech je to človek prehrávač alebo prehrávač stroj, urobíme pár málo kúsky kontrolu chýb, uistite sa, že zostane v medziach skutočných rozmerov dosky že máme, uistite sa, že tento priestor je prázdny, že nikoho dať kus tam už. A potom si len dať kus na doske, zmeňte hráča k ďalšej vrstve, a prírastok koľko ťahov sa stalo. To je hlavná slučka pre Naše tic-tac-toe hra. Minimax, potom, je presne to, algoritmus, ktorý sme predtým. Jediná úprava, ktorá sme urobili tak, že sme môže hrať vyššej rozmerné dosky je máme držal tento dodatočný parameter nazýva hĺbka. A hĺbka len hovorí, keď som vyhľadávanie smerom dole cez ten strom a ja som sa tak ďaleko dole za nejakú hĺbku úrovni že ja proste nechcem ísť ďalej, Idem sa zastaviť a len hodnotiť dosku v tomto bode. Pozriem sa a zistiť, či tam je víťaz. Ak je to víťaz, vráťte mi je. Inak, pôjdem cez slučku. A ja poviem, pre všetky možná miesta že by som mohol možno brať ako môj pohyb, budem vybudovať hypotetickú doska, ktoré zahŕňa môj pohyb na tejto doske, a potom rekurzívne zavolá minimax. Ak je to môj krok, som si nájsť ten, ktorý má najväčšie skóre. Ak je to môjho oponenta ťah, zistíme, ten, ktorý má minimálne skóre. A všetko ostatné je Stačí nahrať vedenie. Dobre, takže uvidíme tento beh. Vlastne, možno môžeme získať niekoľko dobrovoľníkov prísť a hrať tic-tac-toe. [Nepočuteľný] jedného, ​​a jeden viac, dva, práve tam. Poď hore. Tak poďme do toho a reštart to úplne. Takže, ahoj. Publikum: Dobrý deň. SPEAKER: Ako sa voláte? Divákov: Gorav. SPEAKER: Gorav. Divákov: Som Layla. SPEAKER: A Layla, a Layla, sorry. Poď hore. Gorav, budeme musieť ísť ako prvý. A ja vás požiadať, aby ste bol nie strašne dobré tic-tac-toe hráčom. OK, takže všetky tlak off na vás. Pozrime sa však, že náš stroj hráč môže skutočne urobiť niečo chytrého. Tak choďte do toho. Budeš typu, v ktorom súradníc by ste chceli, aby vaše X v. A0, OK, a stroj je preč hneď a dal svoju stopu v A1. Položte O na doske. Dobre, teraz choďte do toho. Kam by si chcel ísť? C2. Náš stroj hráč prijal prostredný námestie, zablokoval. Takže to bol dobrý, múdra vec pre to robiť. Vy ste ho zablokoval. To je skvelé. Trvá roh tam. A to bude vás nútiť vezmite poslednej priestor, B0. A hra končí remízou. Ale hral primeranú Hra proti vám, že jo? Dobre, ďakujem moc, Gorav. [APPLAUSE] Dobre, Layla, ideme up hry na vás tu. Publikum: Oh, skvelé. SPEAKER: Chystáme sa dať vy štyri štyrmi tic-tac-toe. Teraz, v štyroch štyrmi, musíte vyhrať s štyri v rade, nie tri v rade. A je to všetko tvoje. Takže Layla vzal D1. Sme teraz bude nasledovať náš počítač prehrávač tu. Tri tromi tic-tac-toe je druh vec, ktorá je ľahké pre nás všetkých. Ale je to stále pekné vidieť počítačový hráč robiť chytré ťahy. Štyri štyrmi dostáva do byť trochu zložitejšie. Dobrá práca. Dobre, takže Layla je zakončená. Jo, a my by sme mali skončiť tam. Ale poďme urobiť ešte jeden tady. Takže Layla, ďakujem. Dobrá práca. [APPLAUSE] Takže naše tic-tac-toe hráč ide až do konca a nájde miest, rieši je pomocou tohto minimax. A mal som nastavenie hĺbky na to tak, že by sa bežať príliš rýchlo, čo je pravdepodobne dôvod, prečo Layla bol schopný ísť pekne dopredu ako ona, a urobil veľmi dobre. Ale tieto systémy, ktoré práve prejsť a hrubou silou ísť hlbšie a hlbšie a hlbšie, a držať hľadanie riešení že je potrebné tieto druhy systémov sú celkom úspešní v nich dobre, štandardné stolové hry. A v skutočnosti, ak sa pozrieme na Tri tromi tic-tac-toe hra, toto je v podstate vyriešený problém. A to je skvelý diagram od Randall Munroe v XKCD, ukazujúci, z ktorého by ste mali presunúť trvať, vzhľadom k tomu, pohyby svojho súpera sa. To je niečo, čo sme mohli, ľahko určiť dopredu. Ale to, čo sa deje, keď sa dostaneme do viac komplexné hry, viac zložité hry, tam, kde sú väčšie dosky, viac Možnosti, hlbšie stratégie? Ukazuje sa, že tento hrubou silou vyhľadávania stále robí rozumne dobre, s výnimkou keď sa dostanete do bodu, kde ten strom je tak veľký že nie je možné reprezentovať všetko. Keď nemôžete vypočítať celý strom, keď nemôžete ísť dopredu a tlačiť si do bodu, kedy ste si dostal celý strom v pamäti, alebo či sa môžete dostať do pamäte, a to bude len trvať príliš dlho, aby prehľadávať to, čo musíte urobiť niečo múdrejší. Aby bolo možné urobiť, aby vám musíte urobiť dve veci. Po prvé, musíte nájsť nejaký spôsob, ako obmedziť hĺbku. No, to je v poriadku. Môžeme nájsť nejaké pekné, úplné minimum a hovoria, môžete ísť tak hlboko iba. Ale keď to urobíte, to znamená, že vám majú tieto čiastočne neúplné dosiek. A musíte si vybrať, mám rád Tento čiastočne neúplné doska, alebo to čiastočne neúplný doska? A o naše štyri by štyroch tic-tac-toe hra, náš počítač hráč dostal dole do spodnej časti, a to povedal, Mám dve rôzne dosky. Ani jeden je víťazstvo. Ani jeden je strata. Ani jeden je kravata. Ako si mám vybrať medzi nimi? A to nemalo mať šikovný spôsob, ako robiť to. Vidíme tento druh Vyhodnotenie sa stalo po celú dobu ako sme sa dostali do zložitejších hier. Šach je skvelým príkladom. V šachu, ktoré máme, najprv Zo všetkého, väčšie nastúpi. Máme oveľa viac kusov. A umiestnenie týchto kusov a spôsob, akým tieto kúsky pohybujú je kriticky dôležitá. Takže ak chcem použiť minimax, Musím byť schopný špecifikovať a hovoria, táto doska, kde nikto vyhrali alebo prehrali ešte, je trochu lepší ako ten druhý board, kde nikto vyhral alebo prehral. K tomu, by som mohol robiť veci, ako by som mohol len spočítať, koľko kusov musím a koľko kusov máte? Alebo by som mohol dať iný ks rôznych bodov. Moja kráľovná stojí 20 bodov. Tvoj pešiak stojí jeden bod. Kto má viac bodov celkovo? Alebo by som mohol uvažovať o veci, ako je, Kto má lepšiu pozíciu dosky? Čí je to na rade nabudúce, všetko, čo môžem to hodnotiť presnejšie , Ktorá z týchto možností je lepšie bez dôkladne zvažuje Každý krok, ktorý mohol prísť po tom. Teraz, aby túto prácu, jedna z vecí, ktorá je stane naozaj dôležité Pre nás nie je len v pohybe rovno až na určitú hĺbku limitu, ale je schopný povedať, jeden z týchto nápadov, ktoré som máme, je tak zlé, že je to nie je stojí za zváženie všetky možné spôsoby, ako že veci môžu ísť od desiatich k piatim. K tomu pridáme do minimax princíp tzv Alpha-beta. A alfa-beta hovorí, ak máte zlý nápad, Nestrácajte čas sa snaží presne zistiť, ako zlé to je. Tak tu je to, čo budeme robiť. Budeme trvať rovnaký zásady, ktoré sme mali predtým, rovnaký typ minimax vyhľadávania, len sme bude sledovať, a to nielen z Skutočné hodnoty, ktoré máme, ale my budeme sledovať najlepší možný hodnota, ktorú by som mohol dostať, a najhorší možný Výsledok som mohol mať. A kedykoľvek ten najhorší možný vec vyzerá pravdepodobné, Budem opustiť túto časť stromu. A ja sa ani obťažovať pri pohľade na to ešte. Dobre, tak si predstavte, že začneme s týmto istým presným hre stromu. A teraz sa chystáte ísť zase dole, celú cestu dole k tomuto ľavom dolnom rohu. A v tom ľavom dolnom rohu, sme vyzerať a vyhodnocujeme túto dosku. Možno je to štyri štyrmi tic-tac-toe doska, alebo možno je to šachovnicu. Ale my sa na to pozrieť, a budeme hodnotiť to, a dostaneme hodnotu osem. V tomto bode, my vieme, že budeme mať aspoň osem bodov z tohto spodného rozhodnutia. Nezáleží na tom, čo ten druhý dva sú, že sedem a že dvaja. Tie by mohli byť akékoľvek hodnoty oni chceli byť. Chystáme sa dostať najmenej osem bodov. Dobre, ale mohli by sme choďte do toho a skontrolovať. Možno, že jeden z nich je lepšia ako osem. Pozerali sme sa na sedem. Je to lepšie ako osem? Nie, že sa nemení Náš názor vôbec. Pozerali sme sa na dva. Je to lepšie ako osem? Nie, že sa nemení Náš názor vôbec. Takže teraz vieme, že sme vyčerpali všetci tam možnosti. Nebudeme sa dostať niečo lepšie než osem. Chystáme sa dostať presne to osem. A tak sme sa zmeniť túto uzol a povedzme, že je teraz isté. Sme prejsť o jednu úroveň vyššie, že. A teraz vieme niečo o tejto úrovni minimalizácie. Vieme, že sme nikdy dostať viac ako osem bodov, ak pôjdeme dole že smer. Vzhľadom k tomu, aj keď tí, Ďalšie dve vetvy dopadne aby bolo fantastické a stojí za to tisíce bodov každý, náš súper bude Daj nám minimum, a daj nám osem. Dobre, no, uvidíme. Budeme ďalej touto cestou. Ideme dole na túto stredu na ľavej strane. Pozeráme sa dole a vidíme tam je deväť. Vieme, že budeme mať aspoň deväť bodov tým, že ide dole že uprostred cesty. A v tomto bode, môžeme len pozastaviť. A môžeme povedať, pozrite, ja známymi v úrovni vyššie, Budem mať viac ako ôsmich body tým, že ide dole týmto smerom. Ale keď som išiel na polovicu cesta namiesto ľavej dráhy, Chcel by som získať aspoň deväť bodov. Môj súper sa nikdy nechaj ma ísť dole, že strednú cestu. Dostanú na výber. A idú zvoliť Cesta vľavo smerom k ôsmim, skôr než stredom smerom čo je najmenej deväť bodov. Takže na tom mieste, budem zastaviť. A ja poviem, že vieš, čo? Nechcem sa pozerať akýkoľvek viac sa v tomto smere. Pretože ja nikdy sa tam dostať. Môžem preskočiť, že jeden, a môžem preskočiť, že šesť, pretože to sa nikdy nestane. Takže ja pôjdem dole a budem uvažovať ďalšiu možnosť. Idem tam a hovorím, vidím dva. Viem, že keď dostanem až sem, ja som dostane aspoň dve. OK. Aj ďalej. Vidím štyri. Viem, že budem mať aspoň štyri. Je tu ešte veľa medzi štyri a osem, hoci. Tak som ďalej. Pozriem sa dolu a vidím, je tu ešte jedna. Tak jo, ja viem, ak Idem dole touto cestou, Budem mať možnosť vybrať si štyri. Čo sa môj súper bude robiť? Medzi niečo, čo mi dáva osem, niečo, čo mi dáva štyri, a niečo, čo mi dáva najmenej deväť, dobre, že to bude dať mi štyri. A ja teraz viem, u veľmi top, idem aby bolo možné získať minimálne štyri body z tejto hry. Celá myšlienka alfa-beta je odrezať diely strom tak, že nemám pozerať sa na ne už nie. Ale to stále vyzerá, ako som bol pri pohľade na veľa stromu. Poďme ďalej nadol. Pôjdeme dole ten budúci teraz. Dole na dne, nájdem jeden. Viem, že budem mať aspoň jednu. Som hľadať ďalej. Nájdem tri. Viem, že budem mať aspoň tri. Aj ďalej. Nájdem päť. Ja viem, že som sa dostať päť keď som si v tejto ceste. A tiež viem, potom že môj súper, ak I vyberte stred tri veľké možnosti, že to bude, aby mi niečo, čo je päť alebo menej. OK. Môžem pokračovať tam. Môžem sa pozrieť dole a ja Dá sa povedať, čo mám získať, keď idem po strednú cestu? Idem sa dostať, dobre, tri tam. Idem si pre niečo to je najmenej tri. Je tu ešte veci medzi tri a päť, tak som hľadať ďalej. Oh, deväť, budem určite prevziať, že viac ako tri. Chystám sa získať aspoň deväť keď pôjdem dole, že strednú cestu. A teraz môj súper zastaví a hovorí: vyzerať, že to nemá zmysel ešte. Viem, že môj minimalizácia súper, je to chystá dať mi vec, ktorá sa menšia alebo rovná piatimi, skôr než vec, ktorá sa väčší alebo rovný deväť. Aj zastaviť. Nechcem vyzerať viac sa na to. Aj ďalej. Pozriem sa dole na tento jeden. Až na dno, nájdem šesť. Ja viem, že som sa získať aspoň šesť. A čo mám robiť? Nemôžem prestať. Pretože je voľba medzi niečo, čo je najmenej šesť a niečo, čo je menej ako päť, on je chystá dať mi tú vec To je menej ako päť. A teraz viem, že idem ako dostať presne to, že voľba. Chystám sa dostať, že päť voľbu. Vrátim sa až na vrchol. Čo budem vybrať medzi niečím to je väčší alebo rovný štyrom, alebo niečo, čo je rovná piatich? Idem si niečo to je najmenej päť. Idem dole na poslednej ceste, všetky cesta dole na dno. Zaznie tam taky jeden. OK, aspoň budem mať jeden bod. Aj ďalej. Dva, ach, je to lepšie ako jeden. Chystám sa získať aspoň dva. Nájdem tri. Ja viem, že som sa dostať tri. A bod vyššie uvedeného vyplýva, môj súper sa deje aby mi dal niečo, čo je menšie ako alebo rovný trom. A teraz môžem zastaviť. Vzhľadom k tomu, v voľba medzi mnou bytia možnosť získať päť a môj súper to, že mi niečo menej ako tri, Ja som vždy bude trvať, že päť. Takže si nemyslím, že hodnotiť Spodná časť stromu vôbec. A teraz, sa to môže zdať menšie. Ale keď malé kúsky aritmetiky, väčšie ako a menšie ako, môže odrezať celej časti tento exponenciálne rastúci strom, ktorá vedie k obrovskej Množstvo sporenia, úspory ktoré sú dostatočne veľké, že som Môžete začať hrať konkurenčne u zložitejších hier. Dobre, ak sa pozrieme na veľkosti a zložitosti rôznych hier, tic-tac-toe bol náš jednoduchý príklad. Máme malú dosku, tri tromi. Dostávame, nanajvýš priemerne asi štyri rôzne voľby ako sme prejsť hru. Máme niekde okolo 10 k piatej možné rôzne listy. A budovanie tic-tac-toe hráč, dobre, len sme to urobili. Je to ľahké. Ak by sme ísť až na niečo viac komplexné, ako Connect Four. Spomínate si na túto hru, kde pustíte malé tokeny? Je to šesť od siedmich doska, Nie je to oveľa väčšie, stále má približne rovnakú rozvetvenie faktorom tic-tac-toe. Mám asi štyri možnosti kde môžem dať veci do. Ale teraz, mám oveľa viac vedie 10 k 21. moci. To je niečo, čo je ľahké natoľko, že sme riešiť to hneď. Dáma, viac complex-- vás Dostal osem osem palube. Si len na polovicu im kedykoľvek, hoci. Máte vetvenia faktorom, ktorý je asi 2,8. No, máme pár pohybuje si môžete vziať. Vy ste asi 10 dostal do 31. listy, väčšie a väčšie, a väčšie priestory. Ako som prehľadávať tie väčšie a väčšie priestory, to je, keď sa veci, ako je alfa-beta a budú môcť odrezať celé odvetvia stáva zásadný. Teraz, dáma bolo dosť ľahké v roku 1992. Počítačový program nazvaný Chinook porazil svetovej dáma šampiónov, Marion Tinsley. A od tej doby, no človek majster hráč má bol schopný poraziť tie najlepšie výpočtové systémy. Ak sa pozrieme na niečo ako šach, teraz zase, máme osem osem palube. Ale my máme oveľa zložitejšie kusy, oveľa zložitejšie pohyby. Máme vetvenia faktor o 35, 35 možných ťahov v priemere že môžem vziať, a stať priestor, počet listov ktorý vyrástol na 10 až 123. moci, obrovské množstvo možností. Dokonca stále, moderné procesory sú schopní to urobiť úspešne. V roku 1995 a potom v roku 1997, v počítači program s názvom Deep Blue postavený IBM ktorý bežal na obrie superpočítači porazil aktuálny majster sveta, Garry Kasparov. To bol zlom. Dnes sa však, že rovnaké spracovanie napájanie sedí na mojom MacBook. Rýchlosť spracovania udržuje stále rýchlejšie a rýchlejšie. Môžeme hodnotiť viac a viac dosky rýchlejší a rýchlejší. Ale ešte dôležitejšie je, že máme lepší vyhodnocovacie funkcie a lepšie prerezávanie metódy. Takže môžeme prehľadať priestor viac komplexne. Najväčší dosky hry, že môžeme myslieť, niečo ako Go to dostal 19 19 dosku, teraz zrazu, sme za bod kde výpočtových systémov vyhrať. Nie je výpočtovej Systém vonku , Ktorý môže poraziť profesionálnych hráčov Go. Najlepšie systémy dnes poradí ju o druh dobré amatérskej úrovni. Takže tam je ešte celkom trochu mimo tam, že sa nemôžete dostať do ešte. Dobre, tieto tradičné stolové hry, tieto druhy systémov, kde sme stavať tento minimax, či už je to tu alfa-beta, alebo nie, tieto algoritmy pracujú preto, že existujú určité obmedzenia. Máme dokonalé informácie o svete. Vieme, kde sú všetky diely sú. Svet je statické. Nikto sa presunúť kúsky okolo, zatiaľ čo ja som tam sedí myslenia, vzal ma príde rad. Je tu akčné priestor, ktorý je diskrétne. Môžem dať svoje pešiaka tu, alebo si dať svoje pešiaka tu. Ja nesmiem dať svoje pešiaka na čiara medzi dvoma štvorcov. A konečne, akcie sú deterministické. Viem, že keď poviem, veža na rytiera tri, moja veža sa chystá skončiť na rytiera tri, tak dlho, ako je to platný ťah. Neexistuje žiadna neistota o tom. Teraz, keď som ísť do viac rôzne druhy hier, musíme prelomiť tieto predpoklady. Čo keď pôjdem k niečomu ako klasických videohier? Tu je výber z videa hry z Atari 2600. Čo mám tam hore? Mám Frogger, Vesmírnej Invaders, Pitfall a Pac-Man. Aké druhy prostredia mám tu teraz? Ktorý z týchto predpokladov musím zlomiť? No, to záleží na hre. Mohol by som hrať šach na 2600, a by to bolo, rovnako ako tomu bolo predtým. Pre väčšinu z týchto systémov, je tu Kompletné vedomosti o svete. K dispozícii je kompletne deterministické akcie. Ale obvykle, svet je už nie je statická. To znamená, že zatiaľ čo ja som tam sedí čakanie, niečo sa pohybuje. Duchovia sú na ceste k mňa dostať. Škorpión je za mnou pod ním. Tieto Space Invaders sú príde bližšie a bližšie. Ako dobre môžeme urobiť proti nim? Pred niekoľkými rokmi, Google bol projekt s názvom DeepMind, kde trénoval počítač Program hrať Atari 2600 hier. A ak si myslíte, že to nie je vážne podnikania, výsledky ich štúdie boli publikované v Nature, tak len asi tak dobrý publikácia ako si môžeš získať. A tu je, ako dobre oni hrali. Majú algoritmus, ktorý sedel a díval sa len na obrazovke vstupy. To dostalo žiadne inštrukcie vôbec o pravidlách hry. A to malo prísť na to, na základe svojej skóre, ako dobre to robí. Jednalo sa o systém, ktorý používa niečo volal učenia zosilnenie. To znamená, že sa pozrel na svoje skóre. A či to mám dobré skóre, to povedal, Mal by som si tie veci. A ja som mal robiť tie znova. A či to mám zle, to povedal, Nemal by som urobiť znovu tie veci. To je výkon z týchto vyškolených systémov nechá hrať za Pár hodín na každú hru, porovnané s profesionálnymi hráčmi. Takže pre všetky hry, ktoré sú na ľavej strane tejto línie, Toto self-cvičil počítačový program prekonala profesionálnych hráčov. A za všetko do pravdu, profesionálnymi hráčmi boli stále najlepší. Za niečo, čo vedel nič o pravidlách, ktoré nevedel nič o štruktúre hry, to je pôsobivé predstavenie. A to je to, čo sme schopní urobiť dnes. OK, hovoríte, ale ak budeme premýšľať o tom, AI v hrách, normálne si myslíme, že o Veci, ktoré môžeme v skutočnosti sadnúť a hrať proti. Ak by som si sadnúť a ja hrať StarCraft, alebo hrám zadarmo Sito, počítač súper je osoba, ktorá kontroluje Zergov, alebo riadenie druhej civilizácie. Ako sa títo hráči skutočne nájsť svoj ťah? No, tieto hry sú štruktúrované veľa rovnaký cesta ako naše stolové hry, Tieto hry, ktoré budeme súhrnne nazývajú štyri na X Games, preskúmať, expand-- zabudnúť na tie. Čo sú zač? Preskúmať, rozširovať, a uhasiť, Myslím si, že je posledná. Ale sú v zásade prieskum a Conquer hry. Typicky, počítač súper tam má obmedzené informácie. Nevedia presne, čo je to deje za tej hmle vojny. Oni nie sú vidieť na vlastné oči, čo Máte vo vašom inventári. K dispozícii je prostredie, ktoré je dynamické. Všetko sa mení po celú dobu. Nemusíte dostať sedieť a dočkať, aby sa váš pohyb. Ale väčšina vecí sú stále diskrétne. Musím dať svoje mesto tu. Alebo musím dať moje mesto tu. A všetko je deterministický. Keď hovorím, pohnúť jednotkou tu, môj prístroj sa pohybuje tu, pokiaľ nie je prekážkou náhle vstúpi do hry. Teraz, že to nie je všetko počítač hry, ktoré sú tam dnes. Ak by som ísť a ja hrať prvá osoba typu hra, niečo ako zlodej alebo Falloutu alebo Skyrim, alebo Halo, teraz Mám počítačovým protivníkom že sú tam, že majú veľmi odlišná situácia. Majú opäť obmedzené informácie. Oni len možné uvidieť istá zorné pole. Životné prostredie je stále dynamický. Veci sa menia po celú dobu. Ale teraz mám oveľa viac kontinuálne akcie priestor. Môžem byť len pokukování trochu z dverí. A niektoré hry, my akcie sú stochastické. Mám sa pokúsiť preskočiť tú stenu, ale mám šancu na zlyhanie. Tieto typy hier sú stále bližšie a bližšie k druhom regulátorov že staviame v robotike. V robotike, musíme predpokladať, že máme obmedzené množstvo informácií. Máme senzory, ktoré povedzte nám o svete. Máme vždy sa meniace, dynamické prostredie. Máme svet, v ktorom je priestor kontinuálne, skôr než diskrétne. A naše akcie, kedy sa snažíme oni, majú šancu na zlyhanie. A v skutočnosti, moderné hra regulátory pre Vašu Halo súpera, alebo pre tých, NPC v Skyrim, v podstate spustiť malé robotiky architektúry. Vnímajú svet. Vychádzajú model na svete. Oni výpočtových založený na súbore cieľov, ktoré by chcel dosiahnuť. Plánujú akcie založené Na to, čo vedia. A to sú presne tie isté druhy systémov, ktoré budujeme v robotike. Takže tieto architektúry, aby priniesť to späť dohromady, sú často úplne rovnaké. Tak uvidíme, či môžeme vidieť, že. Poďme sa vrátiť k našej Príkladom tic-tac-toe. A ja som sa opýtať pár mojich post-docs prísť a pomôžte mi. Takže Chen Ming, a Alessandro a Olivier, či vy by prísť. A ja budem potrebovať pár dobrovoľníkov OK, som videl ruku právo tam uprostred. Dovoľte mi, aby som ešte raz, niekto ďalej v zadnej možná. Dobre, tamto. Poď hore. Dobre. Takže poďme prijať, že kryt dole. A ak by sa vy prísť hneď staré tu pre mňa fantastické. Takže toto je robot s názvom Baxter. A Baxter je robot, ktorý je obchodná platforma, navrhnutý spoločnosť s názvom Prehodnotiť. A tento robot je určený drobného spracovateľského priemyslu. Ale dnes budeme ju použiť hrať tic-tac-toe. Teraz, tento robot je tiež niečo to je pomerne unikátny. Pretože keď som stála kdekoľvek V jeho blízkosti je štandardná priemyselnej automatizácie systém, bol by som v samom hrobe Nebezpečenstvo poranenia. Baxter, však, je navrhnutý tak, aby relatívne bezpečné pre interakciu s. A tak som sa môžu tlačiť na tomto robota. A môžete vidieť, že je to trochu bit flexibilné, ako sa pohybuje okolo. A môžem premiestniť ju kde by som rád, aby to ísť. Teraz v normálnej robotického systému, budeme mať niekoľko spojov tu ktorý by bol priamo reakciu na príkazy polohy. A oni by nutne jedno, ak boli v pohybe po čerstvom vzduchu, alebo ak boli v pohybe cez môj hrudného koša. OK. A zvyčajne, ak ste boli tu sa priemyselných systémov, by si ísť nikde blízko toho. Tam by bol žltý Bezpečnostné pásky okolo neho. Tento systém má mierne odlišné konštrukcie byť priateľskejší a jednoduchšie pre ľudí, komunikovať s, v tom, že v každom kĺbe, je tu jar. A skôr než riadenie presná poloha, ovládame určité množstvo krútiaci moment, určité množstvo sily, že by sme chceli byť na tomto jar. Dobre, tak nech ma vziať našu dobrovoľníci tu. Ahoj ako sa voláš? Divákov: Louis. SPEAKER: Louis. Rád ťa vidím. A? Divákov: David. SPEAKER: David. Rád som ťa spoznal. Ak by si chlapci čakať tu na sekundu, Budem vám možnosť to urobiť. Takže tento robot, ak ste prišli a ak sa na ňu ľahko zatlačte, budete vidieť, že pohybuje sa trochu. A ak si to urvat pravdu tu na zápästie len nad miestom, kde sa tieto tlačidlá sú, to vyzerá, ako by ste mali chytiť tlačidiel, ale chytiť priamo nad ním namiesto toho, budete bolo možné veľmi jemne manipulovať vesmírom. Louis, chcete skúsiť to? Tak daj to len trochu tlačiť začať. A potom, keď dáte prsty tu a držať na to, pretože sa bude pohybovať na vás, potom. Dobre, chcete skúsiť to? Poď hore. Tak daj to len jemný tlačiť tam začať. Môžete cítiť, aké to je. A potom, ak ste to chytiť priamo tam, budete mať možnosť manévrovať okolo. OK. Takže väčšinou, by tento druh robota použiť na výrobu v malom meradle. A ja sa presunúť ruku len dole z cesty trochu tu. Ale dnes, budeme používať Rovnaký tic-tac-toe herný systém založené na minimax, že sme postavili skôr. OK? Takže, vy ste každý bude hrať hru. Louis, budete ako prvý. Dovoľte mi len držať tu na chvíľku. Budem mať stojíte pravdu tu, len tak môže každý vidieť. Vy ste chlapci nastavenia tu? ROBOT: Vitajte. Poďme si hrať tic-tac-toe. Nedržte token pred Ja hovorím, že je to na tebe. Aj spustiť hru. Je rad na mňa. SPEAKER: Teraz, keď mohol mať jednu z vaše kúsky a choďte do toho a umiestnite ju. ROBOT: Je to na tebe. [SMIECH] Je rad na mňa. [SMIECH] [SMIECH] Je to na tebe. SPEAKER: Ľudská rasa je Spolieham sa na teba, Louisovi. ROBOT: Je rad na mne. SPEAKER: Takže Baxter tu úspešne blokovaný. ROBOT: Je to na tebe. Je rad na mňa. Je to na tebe. Je rad na mňa. SPEAKER: A necháme Baxter dokončiť svoj posledný ťah tu. [SMIECH] ROBOT: To je kravatu. Ja vyhrá nabudúce. [SMIECH] SPEAKER: Dobre, Vďaka moc, Louis. Ďakujem. Môžete ísť touto cestou. ROBOT: I spustite hry. SPEAKER: Takže dovoľte mi vysvetliť pre vás ešte jeden malý bit než sa dostaneme naši odvetu tu. Čo presne sa deje? Takže robot má kamerový hore vrchol tu. A to je díval sa na doske. A je to vidieť, či je to tu červenou O alebo modrá a biela X. Rovnako ako tie, ktoré si umiestni na tabule, to je v podstate rovnaký vstup že budeme čítať od naša štruktúra dát z našej obrazovky. Je to beh rovnaké minimax algoritmus, ktorý bude schopní zistiť, kde sa umiestnite dobrou token. A potom dávame povel o kde by sme chceli token má byť umiestnená. Rameno sa pohybuje von. Je to pomocou vákuovej chápadlá aplikovať niektoré sacie uvedeného dreveného kusu, si to vyzdvihnúť, presuňte ho doprava miesto, a potom uvoľnite sania a umiestnite ho. Dobre, ideme dať mu ešte jednu ranu s mierne múdrejší prehrávača tu. Ste pripravení? Dobrá, ak by ste postaviť až tu a dať je-- dopadlo takhle takže môžete vidieť všetky. A potom [nepočuteľných]. ROBOT: Je rad na mne. SPEAKER: Baxter sa spustí. Je to na tebe. Je rad na mňa. Je to na tebe. Je rad na mňa. [SMIECH] SPEAKER: [šepká] Just ho nechať ísť dopredu a vyhrať. ROBOT: Je to na tebe. SPEAKER: To je v poriadku. ROBOT: Je rad na mne. [SMIECH] Vyhrám. [SMIECH] Aj spustiť hru. SPEAKER: Dobre, ďakujem moc. Dobre, myslím, že máme čas na ešte jeden vynikajúci tic-tac-toe player, niekto, kto môže dať túto vec zápas, kto vie, čo robia. [SMIECH] Kto to bude naším majstrom tu? Dobre, vaši priatelia vás prihlásil. To je dosť dobré pre mňa. Povedz mi znova svoje meno. Divákov: Tamir. SPEAKER: Tamir, rád vás vidím. Tak jo, zase budeme, aby vám a to až tu, takže každý môže vidieť. Ste náš zástupca V tomto stretnutí teraz. Baxter je jeden a oh oh a. Alebo Ospravedlňujem sa, jeden oh a jeden. A to je len na vás tu. Baxter dostane pohybovať ako prvý, hoci. So. ROBOT: Je rad na mne. [SMIECH] Je to na tebe. Je rad na mňa. Je to na tebe. Je rad na mňa. Je to na tebe. [SMIECH] ROBOT: Je rad na mne. SPEAKER: Je to oveľa ťažšie, keď stojíte tu, ľudí. [SMIECH] ROBOT: Vy ľudia ste tak ľahké poraziť. [Smiech a APPLAUSE] SPEAKER: Vďaka moc. ROBOT: Aj vyhrať. Aj spustiť hru. Prednášajúci: Dobre, takže vďaka veľmi veľa Olivier, a Alessandro, a Chen Ming. [APPLAUSE] Chcem, aby jeden posledný bod. Takže Baxter u veľmi nekončí, podvádzal. A to bolo nečakané. Jeden z fantastický veci, o AI je, že sme robiť prácu v AI tak, aby sme mohli budovať naozaj zaujímavé a inteligentné zariadení. Ale aj my robiť prácu v AI pretože nám to hovorí niečo o tom, ako ľudia sú inteligentné. Jeden z najobľúbenejších štúdie z mojej laboratóriu je pri pohľade na to, čo sa stane, keď stroja nečakane podvádzať. Urobili sme to pôvodne nie s Baxter hrať tic-tac-toe, ale s menším robot menom Nao, kto hral Kameň, papier, nožnice. A niekedy po hrať veľa a veľa nudné Kameň, papier, nožnice hry, robot bude hodiť gesto, stratiť, a potom náhle zmeniť jeho gesto a povedať, že som vyhral. [SMIECH] Teraz, niekedy by sme tiež robota, rovnako ako kontrola, hodiť gesto, vyhrať, a zmeniť jeho gesto stratiť, hádzať zápas, podvádzať, aby sa stratiť. A to nie je zďaleka tak presvedčivý. Robot, ktorý podvádza s cieľom vyhrať ľudí reagovať, ako keby to je , Aby ich dostať, to páči aktívne hľadá ich zničenie. [SMIECH] To sa stáva agent. Je to ako človek. To má vieru a zámer. A nie je to dobrý úmysel. A robot, ktorý hodí Hra je jednoducho nefunguje. Je to len rozbité zariadenia. Ukážem vám niekoľko príkladov z toho z niekoľkých našich účastníkov. Tak tu je podvádzanie, aby sa stratiť. [Videoprehrávanie] - [Nepočuteľný] vyhrať. Poďme hrať. -Počkaj čo? - [Nepočuteľný] vyhrať. Poďme hrať. [Nepočuteľný] vyhrať. Poďme hrať. SPEAKER: A tu je podvádzanie vyhrať. Áno, som vyhrať. Poďme hrať. -Nemůžeš Urobiť. [SMIECH] Áno, som vyhrať. -Ty Podvádzal. Teraz podvádzal. Áno, som vyhrať. Hej, ty podvodníčka. Môžete podvádzať, super podvádzať. [END Prehrávanie] SPEAKER: Tieto rozdielne Reakcia rýchlo zmeniť naše vnímanie zariadení. Znamená to, že sme zámerne budovať stroje, ktoré podvádzajú, pretože to je najlepšie inžinierstva, ktoré môžeme robiť? Nie, ale to nám hovorí niečo naozaj zaujímavé o ľuďoch. Tá vec, ktorá vás a podvádza kradne vaše víťazstvo, to je niečo, čo je nažive, to je animovať, že je von dostať vás. To má duševný stav. To má vieru. To má v úmysle. To, čo rukami Hra vám, že to nie je. To je jednoducho nefunguje. To je v mnohých ohľadoch, prečo je to ľahké hodiť hru s deťmi. Ale ak sa pokúsite podvádzať a druh tvrdí víťazstvo keď, viete, len aby skrátiť hra, oni ťa chytí hneď. Tieto typy účinkov, ktoré vidíme prichádza z AI, Učí nás veľa o sebe. Dobre, to je pre dnešok všetko. Vďaka moc Dávidovi a produkčný tím Harvard prišla dole. [APPLAUSE] Uvidíme sa za jeden kvíz, a potom na poslednú prednáške. Majú veľký deň. [APPLAUSE] [Prehrávanie hudby] DAVID J Malan: No, my pravdepodobne potrebovať zaviesť nejaký druh šifrovania, v poriadku? Pretože potom hlavičiek Tieto požiadavky HTTP budú miešaná tak, že niekto sa snaží čuchať váš prevádzku nebude v skutočnosti je môcť vidieť. Takže aké je riešenie tohto problému? No, musíme skutočne zaviesť šifrovanie do vzorca, tak, že keď táto osoba je prenášanie dát z A do B, môžeme bezpečne send-- [SMIECH] Informácie v tak, že protivník nemôže v skutočnosti vidieť.