[MUZIKO Ludante] 

Parolanto: Bonvenon reen, ĉiuj. Jen CS50. Kaj hodiaŭ, ni havas multe da interesajxoj paroli. Unue, tamen, mi devas memorigi vi de kelkaj administraj aferoj. Ĉi tiu semajno estas kvizo unu, merkredo aŭ por la Yale sekcio marde kaj ĵaŭde, ĵaŭdon. Ekzistas kvizo recenzoj ĉinokte ĉe Yale, 5:30 al 7:00. Ĉe Harvard, ili gravuris unu hieraŭ. Kaj ĉiu povas rigardi ke enreta. 

Ankaŭ, ĉi tiu semajno aŭ frue venontan semajnon, ni havos niajn lastajn CS50 prelego. [Ĝemoj] Mi scias. Ĝi venis tiel baldaŭ. Yale studentoj havos vivas prelegi tie en la jurstudo aŭditorio vendrede. Estos kuko. Harvard studentoj havos la lasta prelego en Sanders lunde. Ankaŭ estos kuko. 

Ankaŭ, ĉi tiu semajno en vendredo, por tiuj de vi kiu venas al New Haven, ni havas la CS50 Expo. Ni havas pli ol 30 malsamaj grupoj registris montri al vi ĉion el aŭtonomaj velŝipoj, al sistemoj kiuj rekonas ciferecajn portretoj, al komputilo muziko kaj komputila-produktita muziko. Do bonvolu aliĝi nin. Mi pensas ĝin estas iranta esti granda tempo. 

Hodiaŭ, tamen, ni atingos daŭrigi parolante pri AI, pri artefarita inteligenteco. Kaj unu el la aĵoj kiuj ni tuj atingos hodiaŭ estas la ideo de kiel uzi AI solvi problemojn. Nun, kiel ĉiam, ni komencu kun iu simpla. Kaj ni tuj komencas kun simpla ideo. Kaj tio estas uzanta serĉo. 

Do imagu por minuto, ke mi havas taskon ke mi bezonas fari. Kaj mi ŝatus havi tiun taskon aŭtomatigitaj per iu softvaro agento. Imagu ke mi provas rezervi aro de flugoj de, ni diru, Boston al Sankta Francisko. Mi povis iri tra kaj mi povus uzi unu el la mirindaj enreta serĉo iloj, kiu tuj faros esence la sama procezo kiun ni estas tuj trairu hodiaŭ. Sed se vi ne havas tiun ilo, kion vi farus? 

Nu, vi povus rigardi kaj vidi kaj diri, Mi estas en Bostono. Kio flugoj estas haveblaj al mi? Nun, eble mi havas tri eblaj flugoj el Bostono kiu persvadis la tempo kiam mi devas forlasi. Mi povis flugi al Chicago. Aŭ mi povus flugi al Miami. Aŭ mi povus flugi al Nov-Jorko. Mi povus tiam rigardu de ĉiu unu el tiuj destino urboj kaj pensas pri kion lokoj Mi eble povus atingi unuj el tiuj individuaj urboj. 

Do eble de Ĉikago, mi povas bone rekta flugo al San Francisko. Jen bonega. Aŭ mi povus akiri flugon al Denver. Nun, eble tio flugo al San Francisco estas la perfekta solvo por mi, sed eble ne. Eble mi serĉas ion ke estas iomete pli malmultekosta aŭ iomete pli bona por mia horaro. Kaj tiel mi povus serĉi kion aliaj eblecoj povus esti tie. Do mi povis rigardi Denvero. Kaj de Denvero, nu, eble Mi povas akiri flugon al Aŭstino. Kaj de Aŭstino, eble mi povas akiri flugon al Phoenix, kaj de Phoenix al Sankta Francisko. Nun, mi ne faris ankoraŭ. Ĉar eble ekzistas rekta flugo de Nov-Jorko al Sankta Francisko kiu estas perfekta por mi. Aŭ eble tie estas flugo de Miami tra Denvero Tio estas multe pli malmultekosta. Do mi ankoraŭ devos iri. Kaj mi ankoraŭ devas rigardi ĉiujn tiujn urboj, kiujn mi ne enketis ankoraŭ. Mi devas ĝisfunde kontroli ĉiujn la eblecojn ke mi havu. 

Do el Novjorko, eble mi povas akiri flugon al Naŝvilo, kaj de Naŝvilo al Aŭstino. Kaj tiam mi scias, kie mi estas. Kaj tiam mi scias el Aŭstino, mi povas flugi al Phoenix, kaj de Phoenix al Sankta Francisko. Se mi flugi unue al Miamo, kvankam, eble mi povas akiri flugo de Miami al Nashville, aŭ de Miami al Aŭstino. 

Kaj nun mi provis cxiujn de la ebloj. Mi rekonstruis tiun grafeo ke montras min ĉiuj la eblaj itineroj ke mi eble povos preni. Kiam ni reprezentas tiuj specojn de problemoj, ni ne tuj reprezenti ili eksplicite kiel tiu grafeo, ĉar tiu grafeo ne reprezentas la historio de kie ni iris. Sciante ke mi flugis de Fenikso al Sankta Francisko ne diru al mi, ĉu mi venis tra Naŝvilo, aŭ tra Denvero, aŭ tra Miamo. 

Do, kion mi faros anstataŭe estas Mi prenos tiun saman problemon, kaj mi reprezentas ŝin kiel arbo. Kaj ĉe la radiko de la arbo, ĉe la supro, mi metos la lokon, kiun mi komencis, Boston. Kaj de Boston, mi rigardas ĉiuj el la eblaj lokoj ke mi povas vojaĝi al. Nu, en tiu kazo, mi havis tri, Ĉikago, Nov-Jorko, kaj Miami. Kaj poste mi esplori ĉiun de tiuj infanoj en la arbo. 

De Ĉikago, mi vidis ke mi havis du flugoj. Mi povis flugi rekte al Sankta Francisko aŭ al Denver. Nun Sankta Francisko, estas mia celo. Tio estas mia celo. Tio tuj estos folio de tiu arbo. Tio estas, mi neniam iranta iri ie post Sankta Francisko. El Denver, kvankam, Mi povas flugi de Denvero al Aŭstino, de Aŭstino al Phoenix, kaj de Phoenix al San Francisko. Kaj nun denove, mi atingis folio. 

Mi povus tiam iru reen al la sekva urbo, kiu ne estis plene esplorita. Tio estus Novjorko, iru reen al la supro de mia arbo, venu malsupren al Nov-Jorko. El Novjorko, mi povas flugi al Naŝvilo, de Naŝvilo al Austin, de Aŭstino al Phoenix, kaj el Phoenix al San Francisko. Kaj fine, unu urbo mi ne rigardis tamen, Miami. 

Nu, de Miami mi diris ke mi havis du eblecoj, Naŝvilo aŭ Aŭstino. Se mi flugas al Nashville, bone tiam mi flugas el Naŝvilo, al Aŭstino, al Fenikso, al Sankta Francisko. Se mi flugas al Austin, mi flugas Austin, al Phoenix, al San Francisko. Kaj nun mi havas arbon. Ĝi estas kompleta arbo. Estas ĉio de la ebloj kaj ĉiuj la vojoj ke mi povis preni. Tio estas, se mi komencas ĉe la radiko de la arbo ĉe la supro Kaj Mi malsupreniris, por unu el la forlasas, ĝi diras min ne nur kie mi tuj fini, Sankta Francisko, sed rakontas al mi la vojon kiu Mi bezonas preni por atingi tien. 

Nun, kiu el tiuj estas la plej bona? Nu, nenion pri tio problemo ankoraŭ diras al mi, kiu el tiuj estas la plej bona solvo. Eble mi zorgas la plej pri kiom da tempo mi estas en la aero, aŭ la distanco kiu mi flugas. En tiu kazo, Ĉikago al Sankta Francisko eble estas la plej mallonga nombro da mejloj en la aero. 

Eble mi zorgas pri kosto. Kaj ni ĉiuj scias rektaj flugoj estas kutime pli altekosta. Do eble se mi prenas tiun ia malantaŭen itinero tra Miamo, Naŝvilo, Aŭstino, Phoenix, eble tiam Mi ricevas malaltan prezon. Sed mi povus optimizar sur ajna kriterioj kiuj interesas min. Kiu estas atingis la plej bona en flugo Wi-Fi, aŭ kiu flughavenoj havas la plej bona manĝaĵo havebla. Kaj ĉiu el tiuj povus donu al mi malsama solvo ke mi vidu kiel estante la plej bona. 

Tiuj specoj de problemoj, kie ni iras konstrui tiun arbon de ebloj, kaj poste rigardas unu el tiuj individuajn padojn, kaj ekzameni kiu el tiuj plenumas al kriterioj por ni, ni tuj voki tiuj serĉo problemojn. Kaj ni havas multajn algoritmojn, Kelkaj de kiu ni vidis jam, iri kaj esplori tiujn arbojn. Ni povus fari ĝin en la maniero ke mi nur faris, profundo-unua serĉo, subiro kiom ni povas ĝis ni batis folio, kaj tiam venas reen supren, kaj irinte rekte reen malsupren. Aŭ ni povus fari kio estas nomata largxo-unua serĉo. Ni povis vastigi ĉio ĉe la supro, kaj poste ĉiu unu linio sub tiu, kaj tiam ĉiu unu linion sub tio. Tiuj serĉo arboj estas fundamentaj al AI. Sed ili ne tute atingi gxuste tutan tempon. Fakte, en multaj kazoj ke ni vere zorgas pri, Ni volas konstrui arbo, sed ni ne vere atingi fari ĉiujn la decidoj. 

Tiuj estas situacioj nomata adversarial serĉo, ankaŭ konata kiel kiel skribi ludo ludado sistemoj kaj pagos por ĝi. Sed tiuj estas la specoj de sistemoj kie mi eble ricevos elekti kiam mi iros for Bostono, kiu urbo mi iros al proksima. Sed post tio, iu alia povus akiri fari la decidon pri kie mi flugas. Do konstrui tiujn specojn strukturoj, ni estas tuj devas preni iomete malsama alproksimiĝo al ĝi. Ni ne povi nur serĉu tra la arbo plu, ĉar ni ne kiu estas en kontrolo de ĉiu el tiuj punktoj de decido. 

Do ni imagu simpla ludo kiel tic-tac-piedfingro. Mi povus komenci per tute malplenan tabulo. Kaj en tic-tac-piedfingro, X ricevas ludi unue. Kaj tiel mi povus pensi pri ĉiuj eblaj movoj ke X povis fari. Kaj se mi estas la unu ludado la X, tio estas granda. Mi havas naŭ eblaj movas ke mi povas fari. Mi povus meti X en iu de tiuj naŭ pozicioj. 

Kaj tiam de ĉiu el tiuj, mi povis imagi kion okazas poste. Nu, en tiu kazo, la alia ludanto akirus preni turnon. Ho akirus preni turnon. Kaj de ĉiu el tiuj, ne estus ok malsamaj lokoj ke ho povus meti iliajn markilo. 

Diru mi decidis, ke mi tuj metos X en la centro. Kiu ĉiam ŝajnas kiel bonan malfermon movo. Mi povis rigardi sub tiu, la ok eblaj movoj ke O faras. Nun, se mi estas ludanta X, tio estas mirinda. Mi alvenas elekti kiu unu mi iru, la unu en la mezo. Sed nun O ricevas elekti. Kaj mi ne havas kontrolon super tiu decido. 

Sed de ĉiu el tiuj ebla tabulo pozicioj, ekzistas tiam alia aro de eblecoj. Kiam ĝi venas al esti Mia revenu, mi volus akiri por pluki kaj diri, nu, se O transloĝiĝas al la, nu, la meza punkto en la maldekstra, tiam Mi havas aron de ebloj Kie mi povas preni mian venontan movon. El tiuj, mi povus konsideri ĉiujn la ebloj sub ili. Kaj tiam ho akirus elekti inter tiuj. 

Kaj mi povus teni konstruado ĉi arbon ĝis mi alvenis al la punkto kie ĉu iu gajnas la game-- tio got esti konsiderata folio node-- aŭ la tabulo estas tute plena kaj neniu gajnis. Kaj tio ankaŭ tuj estos nodo folio. Tio tuj estu egaleco. 

Sed la delikata afero kun tio estas se tio estus nur regula serĉo problemo, mi povos diru, bone, X devus iri tien. Kaj ho iru vojon tien. Kaj tiam X devus iri tien. Kaj tiam ho iru vojon tien. Kaj tiam X povas akiri tri en vico, kaj mi gajnas. Kaj la ludo estus finita en kvin movadoj, tri por mi, du mian kontraŭulon. Sed mi ne ĉiam akiras elekti tion. 

Do anstataŭe, kion ni estas tuj devas fari estas ni tuj havos havi novan strategion. Kaj la strategio kiun ludo-ludado algoritmoj ofte uzas estas kio nomiĝas minimax. La centra ideo de minimax estas ke ni estas tuj elektu la movon kiu donas nia kontraŭulo la plej malbona ebla aro de movas ke ili povas fari. Ĝi ne faras min neniu bone elekti movo kie Mi eble povos gajni post ke, ĉar mia kontraŭulo ne tuj donu al mi ke hazardo. Ili tuj elektas iun teruran rezulton pro mi. Do mi tuj faru la movi kiu devigas mia kontraŭulo fari ion pli bone por mi. Bone. Vidu ke ludas ekstere. Do jen nia algoritmo en _pseudocode_. Ni tuj generos la tuta ludo arbo. Ni tuj konstrui la tutan strukturon. Kaj tiam ni iros tra. Kaj je la tre fundo ĉe ĉiu el la terminalo nodoj, ĉe ĉiu el la folioj, ni taksi kiom valora estas tio por mi? Kaj ni tuj valoro proprajxon estas bona por mi kiel estante pozitivaj. Aĵoj kiuj ne estas bonaj por mi estos malpli pozitiva, aŭ nul, aŭ eĉ negativa. 

Do en tic-tac-piedfingro, eble venko por mi estas bona. Tio estas unu. Kaj egaleco estas nulo. Kaj ion ke estas perdo por mi, eble tio estas negativa. Ĉiuj kiuj aferoj estas ke la bona ĝi estas por mi, la pli alta la partituro ricevas. El tiuj eblecoj ĉe la fundo, tiam ni filtri supren. Kaj kiam ĝi estas mia ŝancon elekti inter aro de alternativoj, Mi elektas la unu kiu estas ricevis la plej altan poentaron. 

Kaj kiam ĝi estas mia kontraŭuloj turni elekti, Mi supozas ke ili estas tuj elekti la unu kun la plej malalta partituro. Kaj se mi tion tute Supreniru sur la supron de la arbo, Mi elektis padon kiu donas mi la plej bona rezulto kiun mi povas atingi, supozante ke mia kontraŭulo faras ĉiujn rajtojn movojn. 

Bone, do ni vidu ĉi en ago unue. Kaj poste ni reale rigardi la kodon por ĝi. Do imagu mi havas ĉi granda arbo. Kaj nun Mi ne ludas tic-tac-piedfingro. Mi volis doni al vi ion iomete pli riĉa. Do mi havas kelkaj ludo kie ekzistas multaj malsamaj partituroj ke mi povus havi fine. Kaj tial mi konstruas ĉi kompleta arbo. Kaj mi alvenas al movi unue. Mi estas ĉe la radiko de la arbo. 

Kaj mi alvenas elekti that-- do mi ricevos maksimumigi trans tiu unua nodo. Kaj tiam mia kontraŭulo ricevas iri. Kaj tiam mi ricevas iri ree. Do malsupren al la fundo, mi havas aron de eblecoj ke mi povas elekti, malsamaj terminalo statoj de la ludo. Se mi estas sur tiu maldekstra mano angulo, kaj mi vidas ke mi havas elekton inter ok, sep, kaj du, bone, mi estas tiu kiu akiras por elekti. Do mi tuj elektos la bona de tiuj. Mi tuj elektos la ok. 

Do mi scias ke se mi iam akiri malsupren al tiu punkto, Mi estos kapabla akiri ke ok punktoj. Se mi finos je la sekva punkto super la sekva nodo super, naŭ, unu, aŭ ses, nu, mi iranta elekti la plej bona el tiuj. Mi elektas la naŭ. Se mi havas elekton inter du kaj kvar, kaj unu, Mi elektos la kvar, la plej altaj. 

Nun, se mi rigardas la nivelon super tiu, mia kontraŭulo estas la unu prenas por fari tiun elekton. Do mia kontraŭulo alvenas al elekti, do mi volas doni al li Jenon okazas akiri lin ok punktoj, aŭ mi donu al li la afero, ke estas tuj donos lin naŭ punktoj, aŭ kion okazas doni lin kvar punktoj? Kaj mia kontraŭulo, estante racia, tuj elekti la minimumo de tiuj, tuj elektos la kvar. 

Kaj mi povas fari tion tra la tuta arbo. Mi povas iri malsupren al tiu mezo aro de tri. Kaj mi povas elekti inter unu, tri, kvin. Kaj mi ricevas elekti. Do mi elektos kvin. Mi povas elekti tri, naŭ, aŭ du. Mi alvenas elekti, do mi elektas la naŭ. Ses, kvin, aŭ du, mi elektas. Mi alvenas elekti la ses. Nivelo super tiu, kiu alvenas al elekti? Kiuj rajtas elekti? La alia ulo, mia kontraŭulo. Do ili elektos kvin, naŭ, aŭ ses, kiu unu? 

Publiko: La kvin. 

Parolanto: Ili elektas la kvin. Ili akiras elekti la minimumo. Kaj tiam la lasta, elekti unu, du, aŭ tri. Mi alvenas elekti, do mi elektas tri. Naŭ, sep, aŭ du, mi elektas naŭ. Kaj 11, ses, aŭ kvar, mi elektas 11. Mia oponanto tiam elektas tri, naŭ, aŭ 11, ĝi elektas la minimumo. Li donas al mi tri. Kaj tiam finfine ĉe la supro de la arbo, mi ricevas por elekti denove. Kaj mi alvenas al elekti inter kvar, kvin, aŭ tri. Do mi prenas la kvin. 

Se mi devos kontroli ĉion, mi preferus preni la padon kiu kondukis al la 11. Sed mi ne alvenas al fari ke elekto. Se mi iras malsupren tiu pado. Mia oponanto devigos min en la elekto kiu kondukas al tri. Do la plej bona ke mi povas fari estas preni ke meza branĉo, fari tiun elekton tio eventuale tuj konduku min al kvin punktoj. Tion minimax faras. 

Bone. Ni rigardu tion. Do jen en la CS50 Ide estas programo kiu implementa minimax ludi tic-tac-piedfingro. Ni tuj konstrui supren reprezento. Ni tuj havos du opponent-- aŭ du ludantoj, nia komputilo ludanto kaj homa ludanto. Ludanto numero unu ludos la O. Tio estos la maŝino ludanto. Ili akiras movi dua. Kaj la alia ludanto, nia homa ludanto, estos X. 

Kaj fari mian vivon iom simpla, mi tuj etikedi ke ludanto negativa. Do mi nur povas multobligi per negativa interŝanĝi inter unu ludanto kaj la aliaj. Bone, do ni preni rigardi kion ni vere volas fari. Ni tuj difini nian tabulon. Ĝi tuj estos, nu, ni iras por permesi ĝin esti tri por tri, aŭ ni povas eĉ ludi kvin por kvin aŭ sep per sep tic-tac-piedfingro se oni kredus kiel, bazita sur iu dimensio D. 

Kaj ni havas paron de helpanto funkcioj ke tion faros aĵojn kiel pravalorizi la screen-- aŭ bedaŭras, pravalorizi niaj variabloj, malbari la ekrano, desegni la tabulo sur la ekrano, Kiu kontrolas tabulon vidi ĉu aŭ ne Tie estas venkinto, kiu parses tra la komandlinio, nur helpi ekstere, kiu legas en enigo, kaj unu funkcio nomita minimax. Kaj tio estas la ni zorgas pri plej. Sed ni unue rigardas la ĉefa. 

Kion ni faru? Nu, ni tuj analizi nian komandlinio, nur legis kaj vidi kion dimensio tabulo ni ŝatus havi. Ni pravalorizi niaj tabulo. Kaj poste ni eniri unu grandaj sovaĝaj buklo, ree akcepti movas ĝis la ludo estas gajnis, aŭ ekzistas neniu movoj lasis. Ĉiufoje ni iras tra tio buklo, ni malbari la ekranon. Ni desegni la tabulo sur la ekrano. Kaj ni estas intence ian Abstraktado tiuj for kiel subrutinoj, por ke ni ne devas maltrankviligi tro multe pri la detaloj de kiel ili okazas. 

Vi havos la kodon poste hodiaŭ. Kaj se vi volas rigardi tra kaj eltrovi, vi povas vidi cxiujn. Sed ni desegni tabulo sur la ekrano. Kaj poste ni kontrolu kaj vidi, ĉu ni havas gajnanto? Ĉu iu gajnis ĉi ludon? Se ili havas, ni devos presi eksteren venkon mesaĝo. Kaj ni devos fini la ludon. 

Ni ankaŭ kontroli kaj vidi se estas egaleco. Ĝi estos facile vidi se ekzistas kravato. Ĝi signifas ke ĉiuj spacoj estas plena, sed tie ne estis gajninto ankoraŭ. Ni povas deklari egaleco kaj farenda. Tiam la reala meat-- se ĝi estas maŝino ludanto, ni permesos ke maŝino ludanto serĉi tra uzanta ĉi minimax algoritmo, por trovi la plej bona movo kiu povas. Kaj tiam ni metos ke movo supren. 

Alie, se ĝi estas homa ludanto, ni legos iuj enigo de la homa. Kaj tiam ĉu ĝi estas la homa ludanto aŭ la maŝino ludanto, ni faros paron iom bitoj de eraro kontrolanta, certigi ĝi subtenas ene de la limoj de la faktaj dimensioj de la tabulo ke ni havas, certiĝu ke tiu spaco estas malplena, ke nenies meti peco en tie jam. Kaj tiam ni simple meti pecon sur la tabulon, ŝanĝi la ludanton al la venonta tavolo kaj pliigo kiom da movoj okazis. 

Tio estas la ĉefa buklo por nia tic-tac-piedfingro ludo. Minimax do estas ekzakte la algoritmo kiun ni antaŭe. La sola ĝustigu ke ni faris por ke ni povas ludi pli altaj dimensiaj tabuloj estas ni konservi kroman parametron nomata profundo. Kaj profundeco nur diras, se mi serĉanta malsupren tra tiu arbo kaj mi alvenas ĝis nun malsupren preter iu nivelo profundo ke mi simple ne volas iri pliajn, Mi tuj halti kaj nur taksi la tabulo ĉe tiu punkto. Mi kontrolu kaj vidi se estas gajnanto. Se tie estas venkinto, mi reveni ilin. Alie, mi iros tra buklo. Kaj mi diros, ĉar ĉiuj la eblaj lokoj ke mi eble povus prenu mian movon, mi konstrui hipoteza tabulon ke inkluzivas mian movon sur tiu tabulo, kaj tiam rekursie alvokoj minimax. 

Se ĝi estas mia movo, mi alvenas por trovi la Kiu estas atingis la plej grandan poentaron. Se ĝi estas mia kontraŭulo movado, ni trovas kiu estas atingis la minimuma partituro. Kaj ĉio alia estas nur rekordo prizorgado. Bone, do ni trovu tiun run. Fakte, eble ni povas akiri paron de volontuloj veni supren kaj ludi tic-tac-piedfingro. [Inaudible], kaj unu pli, du, prava. Venu supren. 

Do ni iru antaŭen kaj rekomenci ĉi tute. Do, hi. 

Publiko: Saluton. 

Parolanto: Kio estas via nomo? 

Publiko: Gorav. Parolanto: Gorav. 

Publiko: Mi estas Layla. 

Parolanto: Kaj Layla, kaj Layla, pardonon. Venu supren. Gorav, ni tuj devas vi iros unue. Kaj mi tuj demandos vin esti ne terure bona tic-tac-piedfingro ludanto. OK, Do ĉiuj la premo estas ekstere sur vi. Ni vidu, tamen, ke nia maŝino ludanto povas fakte fari ion lerte. Do iru antaŭen. Vi tuj tajpi en kiu kunordigos Vi ŝatus meti vian X en. A0, okej, kaj la maŝino iris tuj kaj meti lian markon en Al1. 

Metu la O sur la tabulo. Bone, nun antaŭeniri. Kie vi volas iri? C2. Nia maŝino ludanto prenis la meza kvadrato, blokis vin. Por ke estis bona, inteligenta afero por fari. Vi blokis gxin. Jen bonega. Ĝi prenas la angulo. 

Kaj ĝi tuj devigos vin preni la lastan spacon, B0. Kaj la ludo finiĝas en kravato. Sed ludis racian ludo kontraŭ vi, dekstra? Bone, dankon tre multe, Gorav. 

[Aplaŭdo] 

Bone, Layla, ni tuj ĝis la ludo sur vin tie. 

Publiko: Ho, granda. 

Parolanto: Ni tuj donu Vi kvar de kvar tic-tac-piedfingro. Nun, en kvar por kvar, Vi devi gajni kun kvar en vico, ne tri en vico. Kaj ĝi estas ĉiuj viaj. Do Layla prenis D1. Ni nun sekvos nia komputilo ludanto tie. Tri de tri tic-tac-piedfingro estas la speco de afero kiu estas facila por ni ĉiuj. Sed estas ankoraŭ bela vidi la komputila ludanto farante inteligenta movojn. Kvar de kvar alvenas al esti iom pli delikata. 

Bele farita. Bone, do Layla la ellaborita. Ho, kaj ni devus esti finita tie. Sed ni faru unu pli supre. Do Layla, dankon. Bele farita. 

[Aplaŭdo] 

Do nia tic-tac-piedfingro ludanto iras tra kaj trovas lokojn, solvas ilin per tiu minimax. Kaj mi havis profundon fikso sur kiu por ke ĝi ne kurus tro rapide, kio estas verŝajne kial Layla povis iri bele antaŭen Ĉar ŝi venis, kaj faris tre bone. Sed ĉi tiuj sistemoj kiuj ĵus iri tra kaj malpura forto profunda, kaj pli profunda kaj pli profunda, kaj teni trovanta la solvon ke ili bezonas, tiuj specoj de sistemoj estas sufiĉe prospera ĉe tiuj, nu, norma tabulludoj. 

Kaj fakte, se ni rigardas tri por tri tic-tac-piedfingro ludo, ĉi estas resume solvita problemo. Kaj ĉi tiu estas mirinda diagramo de Randall Munroe ĉe XKCD, montrado kiujn movas vin devus preni, donita via kontraŭulo moviĝas. Tiu estas iu kiu ni povis facile specifi antaŭ tempo. Sed kio okazas kiam ni atingos pli kompleksaj ludoj, pli komplika ludoj, kie estas grandaj tabuloj, pli eblecoj, profunda strategio? 

Ĝi rezultas ke ĉi malpura forto serĉado ankoraŭ faras sufiĉe bone, krom kiam vi akiras al la punkto kie tiu arbo estas tiel granda ke vi ne povas reprezenti ĉion. Kiam vi ne povas komputi la tuta arbo, kiam vi ne povas iri antaŭen kaj puŝo mem al la punkto kie vi havas akiris la tutan arbon en memoro, aŭ ĉu vi povas akiri ĝin en memoro kaj ĝi simple preni vin tro longa por traserĉi ĝin, vi devas fari ion pli inteligentan. 

Por fari tion, vi devas fari du aĵojn. Unue, vi devas trovi iun maniero limigi viajn profundo. Nu, tio estas bone. Ni povas trovi kelkajn belajn, nudajn minimumo kaj diru: vi povas nur iri tiom profunde. Sed kiam vi faras tion, tio signifas vin havas tiujn parte nekompleta tabuloj. Kaj vi devas elekti, do mi ŝatas tiu parte nekompleta estraro, aŭ ĉi parte nekompleta estraro? 

Kaj sur niaj kvar per kvar tic-tac-piedfingro ludo, nia komputilo ludanto deiris al la fundo kaj ĝi diris: Mi havas du malsamajn tabulojn. Nek unu estas venko. Nek unu estas perdo. Nek unu estas egaleco. Kiel mi elekti inter ili? Kaj ĝi ne havas inteligenta maniero fari tion. 

Ni vidos tiun specon de pritakso okazi tutan tempon kiel ni enir pli kompleksaj ludoj. Ŝako estas granda ekzemplo. En ŝako, ni havas, unua de ĉiuj, pli granda estraro. Ni havas multe pli pecojn. Kaj la posicionamiento de tiuj pecoj kaj la maniero kiun tiuj pecoj movas estas kritike grava. Do se mi volas uzi minimax, Mi bezonas por povi entajpi kaj diri, tiu tabulo, kie neniu gajnis aŭ perdis tamen, estas iel pli bona ol tiu alia tabulo, kie neniu gajnis aŭ perdis. 

Por fari tion, mi eble faros aĵoj kiel mi nur povus kalkuli kiom da pecojn mi devas kaj kiom da pecoj vi havas? Aŭ mi povus doni malsamajn pecoj malsamaj punktoj. Mia reĝino valoras 20 poentojn. Via peono valoras unu poenton. Kiu havas pli da poentoj entute? Aŭ mi povus konsideri aferojn ŝatas, Kiu estas atingis la bona tabulo pozicio? Kies vico estas proksima, ion ke mi povas ĉu taksi pli precize kiu el tiuj eblecoj Pli bone sen ĝisfunde konsiderante ĉiu movo kiu povus veni post tio. 

Nun fari tiun laboron, unu el la aĵoj kiuj estas tuj fariĝis vere grava por ni estas ne nur movi rekte malsupren al aparta profundo limo, sed povante diri, unu el tiuj ideoj kiuj mi havas estas tiel malbona ke ĝi estas Ne valoras konsiderante ĉiuj eblaj manieroj ke aĵoj povas iri malboniĝis. Por fari tion, ni devos aldoni en minimax principo nomita Alph-beta. Kaj alfa-beta diras, se vi havas malbona ideo, Ne malŝparu vian tempon provanta eltrovi ĝuste kiom malbona ĝi estas. 

Do jen kion ni tuj faros. Ni tuj prenos la sama principoj kiujn ni havis antaŭe, la sama minimax tipo de serĉo, nur ni iranta teni trako, ne nur de la efektivaj valoroj kiujn ni havas, sed ni sekvigi la plej bona ebla valoro ke mi povus akiri, kaj la plej malbonan eblan rezulton mi povus havi. Kaj iam la plej malbona ebla afero serĉas verŝajna, Mi forlasos tiun parton de la arbo. Kaj mi eĉ ne ĝeni rigardante tio plu. 

Bone, do imagu, ke ni komencu kun tiu sama ĝusta ludo arbo. Kaj nun ni tuj iru malsupren, la tuta vojo malsupren por ke malsupro maldekstra angulo. En tiu fundo forlasis angulon, ni rigardi kaj ni taksos ĉi tabulo. Eble estas kvar de kvar tic-tac-piedfingro estraro, aŭ eble estas ŝaka tabulo. Sed ni rigardu ĝin, kaj ni taksos ĝin, kaj ni preni valoron de ok. 

Je tiu punkto, ni scias ke ni ricevos almenaŭ ok poentoj de tiu fundo decido. Negrave kio la aliaj du estas, ke sep kaj ke du. Ili povus esti ajna valoroj ili volis esti. Ni tuj atingi Almenaŭ ok punktoj. Bone, sed ni povus antaŭeniri kaj kontroli. Eble unu el ili estas pli bonaj ol ok. 

Ni rigardas la sep. Ĉu bona ol ok? Ne, tio ne ŝanĝas nia opinio ajn. Ni rigardu la du. Ĉu bona ol ok? Ne, tio ne ŝanĝas nia opinio ajn. Do nun ni scias ke ni elĉerpita ĉiuj la eblecoj tie. Ni ne tuj akiri ion pli bonan ol ok. Ni tuj preni akurate ok. 

Kaj tiel ni ŝanĝi tiun nodon kaj diru, ke nun estas certeco. Ni iru unu nivelo supre. Nun ni scias ion pri kiuj minimumigo nivelo. Ni scias ke ni neniam ricevos pli ol ok punktoj se ni iros tiudirekten. Ĉar eĉ se tiuj aliaj du branĉoj rezulti esti fantazia kaj meritas miloj da poentoj ĉiu, nia kontraŭulo donos nin la minimuma, kaj doni al ni la ok. Bone, nu, ni vidos. Ni tenos subiro tian vojon. Ni iru al tiu mezo maldekstre. Ni rigardas malsupren kaj vidas ke estas naŭ. Ni scias ke ni tuj ricevas almenaŭ naŭ punktoj por subiro ke meza vojo. Kaj je tiu punkto, ni povas simple paŭzi. Kaj ni povas diri, rigardu, mi koni en la nivelo supre, Mi tuj akiras iun pli ol ok punktoj por subiro tiu direkto. Sed se mi venus sur la mezo padon anstataŭ la maldekstra vojo, Mi ricevus almenaŭ naŭ punktoj. 

Mia oponanto estas neniam iranta permesu al mi iri malsupren ke meza vojo. Ili akiras elekti. Kaj ili tuj elektas la pado al la maldekstra al la ok, prefere ol malsupren la mezo al kio estas almenaŭ naŭ punktoj. Do je tiu punkto, mi halti. Kaj mi diras, vi scias kion? Mi ne devas rigardi ajnan pli malsupren en tiu direkto. Ĉar mi neniam tuj alvenos tien. 

Mi povas salti super tiu, kaj mi povas salti super ke ses, ĉar tio neniam okazos. Do mi iros malsupren kaj mi konsideri la sekva ebleco. Mi iru tien kaj mi diras: Mi vidas du. Mi scias se mi atingos tien, mi ricevos almenaŭ du. BONE. Mi plu iri. Mi vidas kvar. Mi scias ke mi iros akiri almenaŭ kvar. Ekzistas ankoraŭ multaj inter kvar kaj ok, tamen. Do mi plu iri. Mi rigardas malsupren kaj mi vidas tie estas unu. Bone, mi scias se Mi iras malsupren tiu pado, Mi tuj povos elekti kvar. Kio mia kontraŭulo faros? Inter iu kiu donas al mi ok, iu kiu donas al mi kvar, kaj iu kiu donas al mi almenaŭ naŭ, nu, li tuj al mi la kvar. Kaj mi scias jam nun plejsupro, mi tuj povi akiri almenaŭ kvar punktoj el ĉi ludo. 

La tuta ideo de alfa-beta estas fortranĉi partojn la arbo tiel ke mi ne rigardas ilin anymore. Sed ĝi ankoraŭ aspektas kiel mi estis rigardante multa la arbo. Ni plu iri malsupren. Ni mallevigxu la venonta unu nun. Malsupren ĉe la malsupro, mi trovos unu. Mi scias ke mi iros akiri almenaŭ unu. Mi daŭre rigardante. 

Mi trovas tri. Mi scias ke mi iros akiri almenaŭ tri. Mi plu iri. Mi trovos kvin. Mi scias ke mi iros akiri kvin se mi malsupreniros en tiu pado. Kaj mi ankaŭ scias tiam ke mia kontraŭulo, se mi elekti la mezo de la tri grandaj elektoj, Li tuj donas al mi iu kiu estas kvin aŭ malpli. 

BONE. Mi povas plu iri tien. Mi povas subrigardi kaj mi povas diri, kion mi akiri ĉu mi iros malsupren la mezo vojon? Mi tuj akiri, nu, tri tie. Mi tuj prenos ion ke estas almenaŭ tri. Ekzistas ankoraŭ aferoj inter tri kaj kvin, do mi reserĉi. Ho, naŭ, mi definitive preni ke super tri. Mi tuj akiri almenaŭ naŭ se mi iru ke meza vojo. 

Nun mia kontraŭulo haltas kaj diras, rigardi, ne estas punkto plu. Mi scias ke mia minimumigo kontraŭulo, li estas tuj al mi la afero, ke estas malpli ol aŭ egala al kvin, anstataŭ la afero, ke estas pli granda ol aŭ egala al naŭ. Mi haltas. Mi ne rigardu plu ĉe tio. Mi plu iri. 

Mi rigardas malsupren sur ĉi tiu. Malsupren al la fundo, mi trovas ses. Mi scias ke mi iros akiri almenaŭ ses. Sed kion mi povas fari? Mi povas halti. Ĉar ne estas elekto inter iu kiu estas almenaŭ ses kaj iu kiu estas malpli ol kvin, li estas tuj al mi la afero Tio estas malpli ol kvin. Kaj nun mi scias mi iros akiri ĝuste tion preferatan. Mi tuj akiri ke kvin elekto. 

Mi iras reen ĝis la supro. Kiun mi povos elekti inter io jen granda ol aŭ egala al kvar, aŭ iu kiu estas egala al kvin? Mi tuj prenos ion ke estas almenaŭ kvin. Mi iras malsupren la lasta vojo, ĉiuj vojon malsupren al la fundo. Tie estas unu. OK, almenaŭ mi tuj ricevos unu poenton. Mi plu iri. Du, ho, tio estas pli bona ol tiu. Mi tuj akiri almenaŭ du. Mi trovas tri. Mi scias ke mi iros akiri tri. 

Kaj la punkto super tiu, mia kontraŭulo tuj doni al mi ion ke estas malpli ol aŭ egala al tri. Kaj nun mi povas halti. Ĉar en la elekto inter mi estanta kapabla akiri kvin kaj mia oponanto donante al mi ion malpli ol tri, Mi ĉiam tuj prenos ke kvin. Do mi ne taksas ke malsupran parton de la arbo ajn. 

Nun, ĉi eble ŝajnas negrava. Sed kiam iom bitoj de aritmetiko, pli granda ol kaj malpli ol, povas detrancxis tutaj partoj de tiu eksponente kreskanta arbo, kiu kondukas al grandega kvanto de ŝparadoj, ŝparadoj kiuj estas sufiĉe grandaj ke mi povas komenci ludi competitivamente ĉe pli kompleksaj ludoj. 

Bone, se ni rigardas la grandecon kaj komplekseco de malsamaj ludoj, tic-tac-piedfingro estis nia facila ekzemplo. Ni havas malgrandan tabulon, tri por tri. Ni ricevas, maksimume, mezumo de pri kvar malsamajn elektojn kiel ni iras tra la ludo. Ni havas ie ĉirkaŭ 10 al la kvina eblaj malsamaj folioj. Kaj konstruante tic-tac-piedfingro ludanto, nu, ni ĵus faris. Estas facile. 

Se ni supreniras al io pli kompleksa, kiel Konekti Kvar. Ĉu vi memoras tiun ludon kie vi faligi la eta ĵetonoj en? Estas ses por sep surŝipe, ne ke multe pli granda, ankoraŭ havas pri la sama disbranĉadon faktora kiel tic-tac-piedfingro. Mi havas kvar elektojn kie mi povas meti aferojn en. Sed nun, mi havas multe pli kondukas, 10 al la 21-a potenco. Tio estas iu kiu estas facile sufiĉas ke ni solvi ĝin tuj. 

Damludo, pli complex-- vi ricevis ok por ok surŝipe. Vi nur duonon de ilin en ajna momento, kvankam. Vi havas disbranĉadon faktoro kiu estas proksimume 2,8. Nu, ni havas kelkajn movas vi povas preni. Vi havas proksimume 10 al la 31 folioj, pli grandaj, kaj pli grandaj, kaj pli grandaj spacoj. Kiel mi devas traserĉi tiuj daŭre pli grandaj spacoj, tio estas kiam aferoj kiel alfa-beta kaj povante tranĉi for tutaj branĉoj iĝas esenca. 

Nun, kontroliloj estis sufiĉe facile en 1992. Komputila programo nomata Chinook batis la mondo kontroliloj ĉampiono Marion Tinsley. Kaj de tiam, neniu homa mastro ludanto havas povis venki la plej bonan komputa sistemoj. Se ni rigardas ion kiel ŝakon nun Denove, ni havas ok por ok surŝipe. Sed ni havas multe pli kompleksa pecoj, multe pli kompleksajn movadojn. Ni havas branĉanta faktoro de ĉirkaŭ 35, 35 eblaj movoj averaĝe ke mi povas kapti, kaj stato spaco, kelkaj folioj ke tio kreskis al 10 al la 123rd potenco, enormajn nombrojn da eblecoj. 

Eĉ ankoraŭ, modernaj procesoroj kapablas fari tion sukcese. En 1995 kaj poste en 1997, komputilo programo nomita Deep Blue konstruita fare de IBM kiuj kuris sur giganta superkomputilo batis la nuna mondĉampiono, Garry Kasparov. Tio estis turnopunkto. Hodiaŭ, tamen, tiu sama prilaborado potenco subigas mia MacBook. 

Prilaborado rapido tenas atingi pli kaj pli rapide. Ni povas taksi pli kaj pli tabuloj pli kaj pli rapide. Sed pli grave, ni havas bonan pritakso funkcioj kaj bona rikoltilojn metodoj. Do ni povas serĉi la spaco pli komplekse. La plej granda de la tabulo ludoj kiujn ni povas pensi, io kiel Go tio akiris 19 de la 19 surŝipe, nun subite, ni estas preter la punkto kie komputa sistemoj povas gajni. Mankas komputa sistemo tie kiu povas venki profesiulo Iru ludanto. La pli bonaj sistemoj hodiaŭ rangon ĝi alproksimigas la speco de bona amatora nivelo. Do ekzistas ankoraŭ sufiĉe eksteren tie ke vi ne atingos ankoraŭ. 

Bone, tiuj tradiciaj tabulludoj, tiuj specoj de sistemoj, kie ni konstruu tiun minimax, ĉu ĝi estas atingis alfa-beta aŭ ne, ĉi tiuj algoritmoj laboras ĉar ekzistas certaj limigoj. Ni havas perfektan informo pri la mondo. Ni scias kie ĉiuj la pecoj estas. La mondo estas statikaj. Neniu alvenas al movi la pecoj ĉirkaŭe dum mi estas tie sidis pensante, prenante mia vico. Ekzistas ago spaco kiu estas diskreta. Mi povas meti miajn peono tie, aŭ mi povas meti mian peono tie. Mi ne rajtas meti miajn peono sur la linio inter la du kvadratoj. 

Kaj fine, la agoj estas determinisma. Mi scias, ke se mi diras, frugilego al kavaliro tri, miaj frugilego tuj finos ĉe kavaliro tri, kiel longa kiel ĝi estas valida movo. Mankas necerteco pri tio. Nun, kiel mi foriras al pli malsamaj specoj de ludoj, ni devas rompi tiujn supozojn. 

Kio se mi iras al io kiel klasikaj videoludoj? Jen elekto de video ludoj de la Atari 2600. Kion mi havas tie? Mi havas Frogger, Spaco Invadintoj, Pitfall, kaj Pac-Man. Kio specoj de medioj mi havas ĉi tie nun? Kiu el tiuj supozoj mi devas rompi? 

Nu, tio dependas de la ludo. Mi povus ludi ŝakon en la 2600, kaj ĝi estus same kiel antauxe. Por plejparto de tiuj sistemoj, ekzistas kompleta scio pri la mondo. Ekzistas tute determina agoj. Sed kutime, la mondo plu statika. Tio estas, dum mi sidis tie atendante, io moviĝas. La fantomoj estas venantaj akiri min. La skorpio estas sekvanta min sub. La spaco invadantoj venas pli kaj pli proksimen. Kiel bone ni povas fari kontraŭ tiuj? 

Antaŭ kelkaj jaroj, Google estis nomita projekto DeepMind, kie ili trejnis komputilo programo por ludi Atari 2600 ludoj. Kaj se vi opinias ke tio estas ne grava negoco, la rezultoj de lia studo estis eldonita en Nature, tiel proksimume tiel bona publikaĵo kiel vi povus akiri. Kaj jen kiel bone ili rezultis. 

Ili havas algoritmon kiu sidis kaj rigardis nur la ekrano enigoj. Ĝi ne ricevis instrukciojn ajn pri la reguloj de la ludo. Oni supozis elkompreni, bazis lian poentaron, kiel bone ĝi faras. Ĉi estis sistemo kiu uzis ion vokis plifortigon lernado. Tio estas, ĝi rigardis lian poentaron. Kaj se ĝi havas bonan partituro, ĝi diris: Mi devus memori tiujn aĵojn. Kaj mi ne faru tiujn denove. Kaj se ĝi havas malbonan poentaron, ĝi diris: Mi devus ne fari tion denove. 

Tio estas la agado de tiuj trejnitaj sistemoj permesita ludi por malmultajn horojn en ĉiu ludo, komparitaj kontraŭ profesiaj ludantoj. Do por ĉiuj la ludoj kiuj estas al la maldekstra flanko de ĉi tiu linio, tiu memo-trejnita komputila programo superis la profesia gamers. Kaj por ĉiu al la Bone, la profesiaj ludantoj estis ankoraŭ la plej bona. Por iu kiu sciis nenion pri la reguloj, kiuj sciis nenion pri la strukturo de la ludoj, tiu estas impresa elfaro. Kaj ĉi tio estas kion ni povas fari hodiaŭ. 

OK, vi diras, sed se ni pensi pri AI en ludoj, kutime ni pensas pri la kion ni povas reale sidiĝi kaj ludi kontraŭ. Se mi sidiĝu kaj mi ludas StarCraft, aŭ mi ludas Liberaj Kribrilo, la komputilo kontraŭulo estas la persono kontrolanta la Zerg, aŭ kontroli la aliaj civilizacio. Ĉu al tiuj ludantoj reale trovi iliajn movojn? 

Nu, tiuj ludoj estas strukturita tre simile kiel niaj tabulludoj, tiuj ludoj kiujn ni kolektive nomas kvar X ludoj, esplori, expand-- forgesu tiujn. Kio estas ili? Esplori, ampleksigi kaj estingi, Mi pensas estas la lasta. Sed ili estas esence esplorado kaj Conquer ludoj. Tipe, la komputilo kontraŭulo tie havas limigitan informon. Ili ne scias ĝuste kio estas daŭriganta malantaŭ tiu nebulo de milito. Ili ne akiras vidi kion vi havas en via inventaro. 

Ekzistas medion kiu estas dinamika. Ĉio ŝanĝiĝas la tutan tempon. Vi ne ricevos sidi kaj atendi preni vian movon. Sed plej aferoj estas ankoraŭ diskreta. Mi devas meti mian urbon tie. Aŭ mi devos meti mian urbon tie. Kaj ĉio estas determinisma. Kiam mi diras, movi mian unuo tie, mia unuo movas tie, krom se obstaklo subite havas rolon. Nun, tio ne estas ĉiu komputilo ludoj kiu estas tie hodiaŭ. 

Se mi iros kaj mi ludos unua persono tipo ludo, io kiel Ŝtelisto aŭ Fallout aŭ Skyrim, aŭ Halo, nun Mi havas komputilon kontraŭuloj kiuj estas tie ke havas tre malsaman situacion. Ili havas, denove, limigita informo. Ili nur povas vidi certaj vida kampo. La medio estas ankoraŭ dinamika. Aĵoj ŝanĝas la tutan tempon. 

Sed nun mi havas multe pli kontinua ago spaco. Mi povas nur peeking a iom el la pordejo. Kaj iuj ludoj, mia agoj estas stokasta. Mi alvenas al provi salti super tiu muro, sed mi havas ŝancon de maltrafi. Tiuj tipoj de ludoj proksimiĝas kaj pli proksime al la specoj de regiloj ke ni konstruu en robótica. 

En robotiko, ni devas supozi ke ni havas limigitan informon. Ni havas sensores kiu informi nin pri la mondo. Ni havas ĉiam ŝanĝiĝanta, dinamika medio. Ni havas mondon en kiu spaco estas kontinua, prefere ol diskreta. Kaj niaj agoj, kiam oni provas ilin, havi ŝancon de maltrafi. Kaj fakte, moderna ludo regiloj por via Halo kontraŭulo, aŭ por tiuj NPCs en Skyrim, esence kuri malgrandan robótica arkitekturoj. 

Ili sentas la mondo. Ili konstruas modelon de la mondo. Ili komputi bazita sur aro de golojn kiuj ili ŝatus plenumi. Ili planas agojn bazita sur kion ili scias. Kaj tiuj estas precize la samaj specoj de sistemoj kiuj ni konstruas en robótica. Do tiuj arkitekturoj, al venigi ĉi reen kune, estas ofte tute sama. 

Do ni vidu se ni povas vidi tion. Ni reiru al nia tic-tac-piedfingro ekzemplo. Kaj mi tuj petos kelkaj miaj post-dokumentojn por antaŭvidi kaj helpi min. Do Chen Ming, kaj Alessandro, kaj Olivier, se vi infanoj estus alveninta. Kaj mi tuj bezonos kelkaj volontuloj 

OK, mi vidis manon supren dekstra tie en la mezo. Lasu min preni unu pli, iu plu en la dorso eble. Bone, tie. Venu supren. Bone. Do ni arangxas suben. Kaj se vi infanoj ĝustiĝus reen ĉirkaŭ tie por mi, fantazia. 

Do tiu estas roboto nomita Baxter. Kaj Baxter estas roboto kiu estas komerca platformo, desegnita por kompanio nomita Rethink. Kaj tiu roboto estas desegnita por malgrandskala fabrikado. Sed hodiaŭ ni tuj uzi ĝin por ludi tic-tac-piedfingro. Nun, ĉi tiu roboto estas ankaŭ iu jen relative unika. Ĉar se mi staris ie ajn proksiman al norma fabriko aŭtomatigo sistemo, mi estus en tre serioza danĝero de esti lezita. 

Baxter, tamen, estas desegnita por esti relative sekuraj por interagi kun. Kaj tial mi povas puŝi sur tiun roboton. Kaj vi povas vidi ĝin estas iom iom fleksebla kiam ĝi moviĝas ĉirkaŭe. Kaj mi povas fermi ŝin Kie mi ŝatus ŝin iri. Nun en normala robota sistemo, ni havus aron de artikoj tie tio estus rekte respondanta al pozicio komandojn. Kaj ili ne nepre gravas se ili moviĝis tra malferma aero, aŭ se ili movigxadis tra mia costillar. 

BONE. Kaj tipe, se vi estus tie kun industria sistemo, vi irus nenie proksime ĝi. Estus flava sekureco bendo cxirkauxe. Tiu sistemo havas iomete malsama dezajno esti pli amikaj kaj pli facila por homoj por interagi kun, en kiuj en ĉiu artiko, tie estas printempo. Kaj anstataŭ kontrolanta ĝusta pozicio, Ni kontrolas certa kvanto de torque, iu kvanto de forto, ke ni ŝatus esti en tiu printempo. Bone, do lasu min preni niaj volontuloj tie. Saluton, kio estas via nomo? 

Publiko: Louis. 

Parolanto: Louis. Bela vidi vin. Kaj? 

Publiko: Davido. 

Parolanto: Davido. Agrable renkonti vin. Se vi uloj atendus ĝuste ĉi tie por dua, Mi tuj donos al vi oportunon fari tion. Do tiu roboto, se vi iros! kaj se vi puŝas milde sur ĝi, vi tuj vidos ke ĝi moviĝas iomete. Kaj se vi ekpreni ĝin ĝuste tie sur la pojno nur supre kie tiuj butonoj estas, ĝi aspektas kiel vi devus ekpreni la butonoj, sed havigu rajton super ĝi anstataŭe, vi povos tre milde manipuli ĝin tra spaco. Louis, vi volas doni ĝin provo? Do donu ĝin iomete puŝi komence. Kaj tiam se vi metos viajn fingrojn Dekstre kaj tenos ĝin, ĉar ĝi moviĝas por vi tiam. Bone, vi volas doni ĝin provo? Venu supren. Do donu ĝin nur milda puŝi tie komenci. Vi povas senti kio ĝi estas kiel. Kaj tiam se vi ekpreni ĝin ĝuste tie, vi povos manovri en ĉirkaŭe. 

BONE. Do tipe, tiu speco de roboto estus esti uzata por malgranda skala fabrikado. Kaj mi tuj movas tiu brako ĵus malsupren de la vojo iomete tie. Sed hodiaŭ, ni tuj uzos la sama tic-tac-piedfingro ludado sistemo surbaze minimax ke ni konstruas pli frue. BONE? Do, vi uloj estas ĉiu iranta ludi ludon. Louis, vi tuj estos unuaj. Lasu min nur teni supren tie por dua. Mi tuj havos vi staras dekstre tie, nur tiel ĉiuj povas vidi vin. Ĉu vi uloj starigis tie? 

Roboto: Bonvenon. Ni ludas tic-tac-piedfingro. Ne ekkapti vian ĵetono antaŭ Mi diras ke estas via vico. Mi komencos la ludon. Sed mia vico. Parolanto: Nun, se vi povus preni unu el viaj pecoj kaj antaŭeniri kaj meti ĝin. Roboto: Estas via vico. [Ridado] Sed mia vico. [Ridado] [Ridado] Estas via vico. Parolanto: La homa raso estas havante vin tie, Louis. 

Roboto: Estas mia vico. 

Parolanto: Do ​​Baxter sukcese blokita tie. 

Roboto: Estas via vico. Sed mia vico. Estas via vico. Sed mia vico. Parolanto: Kaj ni lasu Baxter fini eksteren lian lastan movon tie. 

[Ridado] 

Roboto: Jen kravato. Mi gajnos venontfoje. 

[Ridado] 

Parolanto: Bone, dankon tre multa, Louis. Dankon. Vi povas iri tiun vojon. 

Roboto: mi komencos la ludon. Parolanto: Do ​​lasu min klarigi al vi pli malmulte iom antaŭ ol ni akiras nian rematĉon tie. Kion ekzakte okazas? Do la roboto havas fotilon supren supro tie. Kaj ĝin rigardante malsupren la tabulo. Kaj ĝin vidinte ĉu ĝi estas alvenis ruĝa O aŭ blua kaj blanka X. Pro tiuj akiras metita sur la tabulo, tio estas esence la sama eniga ke ni estus vocxlegis el nia datumstrukturo de nia ekrano. Ĝi estas kurante la sama minimax algoritmo esti kapabla trovi kie meti bonan signon. 

Kaj tiam ni donante komandon pri kie ni ŝatus signo meti. La brako estas movanta ekster. Oni uzas vakuo gripper apliki iuj suĉado al tiu ligna peco, repreni ĝin, kopii ĝin al la dekstra lokon, kaj tiam liberigas la suĉado kaj faligi ĝin. Bone, ni tuj doni ĝin unu pafon kun iomete pli lerta ludanto tie. Vi preta? Bone, se vi volas stari rekte tien tie kaj doni a-- rezulti tiun vojon Do vi povas vidi ĉiuj. Kaj tiam [inaudible]. 

Roboto: Estas mia vico. 

Parolanto: Baxter komencos. Estas via vico. Sed mia vico. Estas via vico. Sed mia vico. 

[Ridado] 

Parolanto: [WHISPERING] Nur lasu lin iri antaŭen kaj gajni. Roboto: Estas via vico. Parolanto: Tio estas BONE. 

Roboto: Estas mia vico. 

[Ridado] 

Mi gajnos. 

[Ridado] 

Mi komencos la ludon. 

Parolanto: Bone, dankon. Bone, mi kredas ke ni havas tempon por unu pli bonega tic-tac-piedfingro ludanto, iu kiu povas meti tion al kongrui, kiu scias, kion ili faras. 

[Ridado] 

Kiu tuj estos nia ĉampiono tie? Bone, viaj amikoj volontulis vi. Tio estas suficxe bona por mi. Diru al mi vian nomon denove. Publiko: Tamir. Parolanto: Tamir, agrable vidi vin. Bone, denove, ni tuj metos vin suprenvenu tie tiel ĉiuj povas vidi vin. Vi estas nia reprezentanto en tiu matĉo nun. Baxter estas unu kaj oh kaj io. Aŭ bedaŭras, unu oh kaj unu. Kaj lin tuŝas al vi tie. Baxter ricevos movi unua, kvankam. So. Roboto: Estas mia vico. 

[Ridado] 

Estas via vico. Sed mia vico. Estas via vico. Sed mia vico. Estas via vico. 

[Ridado] Roboto: Estas mia vico. Parolanto: Ĝi estas multe pli malfacila kiam vi staras tie, amikoj. [Ridado] Roboto: Vi homoj estas tiom facile venki. [Ridado kaj aplaŭdo] Parolanto: Dankonas tre multe. Roboto: mi venkos. Mi komencos la ludon. 

Parolanto: Bone, do dankon tre multe al Olivier kaj al Alessandro, kaj al Chen Ming. 

[Aplaŭdo] 

Mi volas fari unu lastan punkton. Do Baxter ĉe la tre finas tie, trompis. Kaj tio estis neatendita. Unu el la fantazia aferojn pri AI estas ke ni fari laboron en AI tiel ke ni povas konstrui vere interesa kaj inteligenta aparatoj. Sed ni ankaŭ faros laboron en AI ĉar ĝi rakontas al ni ion pri kiel la homoj estas inteligentaj. 

Unu el la preferataj studoj de mia laboratorio estas rigardi kion okazas kiam maŝinoj neatendite trompi. Ni faris ĉi origine ne kun Baxter ludanta tic-tac-piedfingro, sed kun pli malgranda roboto nomita Nao, kiu ludis rokon-papero-tijera. Kaj foje post ludanta multoj kaj terenoj de enuiga roko-papero-tondiloj ludoj, la roboto ĵetus gesto, perdos, kaj tiam subite ŝanĝi lia gesto kaj diru: Mi gajnos. 

[Ridado] 

Nun, foje ni ŝatus ankaŭ havas la roboton, nur kiel kontrolo, ĵeti gesto, venki, kaj ŝanĝi lia gesto perdi, ĵeti la matĉon, trompi por perdi. Kaj tio ne estas preskaŭ tiel konvinka. La roboto kiu cheats por gajni personoj respondi al kvazaŭ ĝi estas ekstere akiri ilin, kiel ĝi estas aktive serĉanta ilian detruon. 

[Ridado] 

Ĝi iĝas agento. Ĝi estas kiel persono. Ĝi havas kredon kaj intenco. Kaj ĝi ne estas bona intenco. Kaj la roboto kiu arroja la ludo estas simple panea. Estas nur rompitaj aparato. Lasu min montri al vi paron de ekzemploj de ke de kelkaj el niaj partoprenantoj. Do jen trompas por perdi. 

[VIDEO reprodukto] - [Inaudible] gajni. Ni Ludu. 

-Wait, Kio? 

- [Inaudible] gajni. Ni Ludu. 

[Inaudible] gajni. Ni Ludu. 

Parolanto: Kaj jen trompas por gajni. 

-Yes, Mi gajnas. Ni Ludu. 

-Vi Ne povas fari tion. 

[Ridado] 

-Yes, Mi gajnas. -You Trompis. Vi trompis nun. 

-Yes, Mi gajnas. 

-Hey, Vi tramposo. Vi cheat, súper trompanto. 

[FINO reprodukto] 

Parolanto: Tiuj malsamaj reagoj rapide ŝanĝi nian percepton de la aparato. Ĉu tio signifas ke ni intence konstrui maŝinoj ke cheat ĉar tio estas la bona inĝenierio ke ni povas fari? Ne, sed diras al ni ion vere interesa pri homoj. Tiu afero ke cheats vi kaj ŝtelas vian venkon, tio estas iu kiu estas vivanta, jen animi, jen ekstere akiri vin. Ĝi havas mensan staton. Ĝi havas kredon. Ĝi havas intencon. 

Tiu afero ke manoj la ludo al vi, tio ne. Tio estas nur panea. Tio estas multmaniere kial ĝi estas facile ĵeti la ludo kun infanoj. Sed se vi provas trompi ilin kaj ia pretendi venko kiam, sciu, nur mallongigi la ludo, ili kaptos vin tuj. Tiuj specoj de efikoj kiuj ni vidas eliranta de AI, Ili instruas al ni multon pri ni mem. 

Bone, tio estas ĝi por hodiaŭ. Danke tre multe al David kaj la Harvard produktteamo por suben. 

[Aplaŭdo] 

Ni vidos vin por kvizo unu, kaj tiam por lasta lekcio. Havu bonan tagon. 

[Aplaŭdo] 

[MUZIKO Ludante] DAVID J Malan: Bone, ni verŝajne bezonos enkonduki ian ĉifrado, dekstra? Ĉar tiam la titolaj de tiuj HTTP petojn estos grimpis por ke ĉiu provas flari vian trafiko ne vere povos vidi ilin. Do kio estas la solvo al ĉi tiu problemo? Nu, ni bezonas enkonduki reale ĉifrado en la formulo, tiel ke kiam tiu persono estas transdoni datumojn de A al B, ni povas sekure send-- 

[Ridado] 

La informo en maniero, ke la kontraŭulo ne povas, fakte, vidi ĝin.