[عزف الموسيقى] 

المتحدث: أهلا بكم من جديد، والجميع. هذا هو CS50. واليوم، لدينا الكثير من أشياء مثيرة للاهتمام للحديث عنها. أولا، على الرغم من أنني يجب أن أذكر لكم عدد قليل من الأشياء الإدارية. هذا الأسبوع هو مسابقة واحدة، الأربعاء أو لقسم ييل كل يوم ثلاثاء وخميس، يوم الخميس. هناك ملاحظات مسابقة الليلة في جامعة ييل، 5:30 حتي 07:00. في جامعة هارفارد، وقد سجل واحد أمس. ويمكن للجميع مشاهدة هذا على الانترنت. 

أيضا، هذا الأسبوع أو مطلع الأسبوع المقبل، لدينا مشاركة CS50 المحاضرة. [آهات] وأنا أعلم. وجاء ذلك في وقت قريب جدا. سوف طلبة جامعة ييل لديهم مباشرة محاضرة هنا في كلية الحقوق قاعة يوم الجمعة. سيكون هناك كعكة. سوف طلاب جامعة هارفارد لديها محاضرة مشاركة في ساندرز يوم الاثنين. سيكون هناك أيضا الكعكة. 

أيضا، هذا الأسبوع يوم الجمعة، بالنسبة لأولئك منكم الذين يأتون إلى نيو هيفن، لدينا معرض CS50. لدينا أكثر من 30 مجموعات مختلفة مسجلة لتظهر لك كل شيء من المراكب الشراعية مستقلة، على الأنظمة التي تعترف صور الرقمية، إلى جهاز الكمبيوتر الموسيقى والموسيقى التي ينتجها الكمبيوتر. لذا يرجى الانضمام إلينا. وأعتقد أنه سيكون وقت كبير. 

اليوم، على الرغم من أن نصل إلى مواصلة الحديث عن منظمة العفو الدولية، حول الذكاء الاصطناعي. واحدة من الأشياء التي ونحن في طريقنا للوصول الى اليوم هي فكرة عن كيفية استخدام AI لحل المشاكل. الآن، كما هو الحال دائما، لنبدأ مع شيء بسيط. ونحن في طريقنا للبدء مع فكرة بسيطة. وهذا باستخدام البحث. 

لذلك أتصور للحظة أنني لديك مهمة أنني بحاجة إلى القيام بها. وأود أن يكون هذا العمل الآلي عن بعض كيل البرمجيات. تخيل أن أحاول لحجز مجموعة الرحلات الجوية من، دعنا نقول، بوسطن إلى سان فرانسيسكو. يمكن أن يمر وأنا لا يمكن استخدام واحد من البحث على الانترنت رائع الأدوات، الذي تنوي القيام به في الأساس نفس العملية التي نحن الذهاب إلى المشي من خلال اليوم. ولكن إذا لم يكن لديك هذا لك أداة، ماذا كنت ستفعل؟ 

حسنا، هل يمكن أن ننظر و ترى وأقول، وأنا في بوسطن. ماهى الرحلات المتاحة لي؟ الآن، ربما لدي ثلاثة رحلات الممكنة للخروج من بوسطن التي تناسب الوقت عندما كنت في حاجة للمغادرة. الأول يمكن أن يطير إلى شيكاغو. أو أنا يمكن أن يطير إلى ميامي. أو أنا يمكن أن تطير إلى نيويورك. وبعد ذلك يمكن أن ننظر من كل واحدة من تلك المدن الوجهة والتفكير في ما المواقع أنا ربما يمكن أن تصل إلى من كل تلك المدن الفردية. 

ولذلك ربما يكون من شيكاغو، يمكنني الحصول على رحلة مباشرة إلى سان فرانسيسكو. هذا ممتاز. أو أتمكن من الحصول على رحلة إلى دنفر. الآن، ربما تلك الرحلة إلى سان فرانسيسكو هو الحل الأمثل بالنسبة لي، ولكن ربما لا. ربما أنا أبحث عن شيء هذا هو أرخص قليلا أو أفضل قليلا لبلدي الجدول الزمني. ولذا يمكن أن ننظر لماذا البعض الاحتمالات قد تكون هناك. حتى أتمكن من النظر في دنفر. ومن دنفر، حسنا، ربما يمكنني الحصول على رحلة إلى أوستن. ومن أوستن، ربما يمكنني الحصول على الرحلة إلى فينيكس، وفينيكس من إلى سان فرانسيسكو. الآن، وأنا لم تفعل حتى الآن. لأنه ربما هناك رحلة مباشرة من نيويورك إلى سان فرانسيسكو هذا مثاليا بالنسبة لي. أو ربما هناك رحلة من ميامي من خلال دنفر هذا أرخص كثيرا. لذلك أنا لا تزال لديها للذهاب. وأنا لا تزال لديها للنظر في كل من تلك مدن بأنني لم يتم التحقيق حتى الآن. لدي للتحقق باستفاضة كل من الاحتمالات أنني قد أضطر. 

لذا من نيويورك، ربما يمكنني الحصول على رحلة الى ناشفيل، ومن ناشفيل إلى أوستن. ثم أنا أعرف أين أنا. وبعد ذلك وأنا أعلم من أوستن، يمكنني يطير الى فينيكس، وفينيكس من إلى سان فرانسيسكو. إذا أطير أول من ميامي، على الرغم من ربما يمكنني الحصول على متن طائرة قادمة من ميامي الى ناشفيل، أو من ميامي إلى أوستن. 

والآن لقد حاولت كل من الاحتمالات. لقد تراكمت هذا الرسم البياني أن يظهر لي كل الطرق الممكنة أنني قد تكون قادرة على العطاء. عندما كنا تمثل هذه أنواع من المشاكل، نحن لن تمثل بشكل صريح لأن هذا الرسم البياني، لأنه لا يمثل ذلك الرسم البياني تاريخ حيث انتقلنا. مع العلم أن طرت من طائر الفينيق إلى سان فرانسيسكو لا تقولوا لي ما إذا جئت عبر ناشفيل، أو عن طريق دنفر، أو عن طريق ميامي. 

لذلك ماذا سأفعل بدلا من ذلك هو سآخذ نفس هذه المشكلة، وسوف يمثل ذلك مثل شجرة. وعند جذر الشجرة، في أعلى، وسوف أضع المكان الذي بدأت، بوسطن. ومن بوسطن، سوف ننظر في جميع المواقع المحتملة أستطيع أن يسافر إلى. حسنا، في هذه الحالة، كان لي ثلاثة، شيكاغو، نيويورك، وميامي. وبعد ذلك سوف استكشاف كل من هؤلاء الأطفال في الشجرة. 

من شيكاغو، ورأيت ان كان لي رحلتين. أنا يمكن أن تطير مباشرة إلى سان فرانسيسكو أو لدنفر. الآن سان فرانسيسكو، وهذا هو هدفي. هذا هو وجهتي. التي ستكون ورقة من هذه الشجرة. وهذا هو، أنا لن أذهب ل في مكان ما بعد سان فرانسيسكو. من دنفر، على الرغم من أنا يمكن أن تطير من دنفر إلى أوستن، من أوستن إلى فينيكس، ومن فينيكس إلى سان فرانسيسكو. والآن مرة أخرى، لقد وصلت ورقة. 

وبعد ذلك يمكن أن نعود إلى القادم المدينة بأنني لم تستكشف بالكامل. من شأنه أن يكون نيويورك، انتقل ما يصل الى أعلى شجرة بلدي، ينزل إلى نيويورك. من نيويورك، وأنا يمكن أن تطير ل ناشفيل، من ناشفيل الى أوستن، من أوستن الى فينيكس، و من فينيكس إلى سان فرانسيسكو. وأخيرا، مدينة واحدة I لم ينظر في ذلك، ميامي. 

حسنا، من ميامي قلت كان لي اثنين الاحتمالات، ناشفيل أو أوستن. إذا أطير الى ناشفيل، حسنا ثم أطير من ناشفيل، إلى أوستن، إلى فينيكس، إلى سان فرانسيسكو. إذا أطير إلى أوستن، أطير أوستن، لفينيكس، إلى سان فرانسيسكو. والآن لدي شجرة. انها شجرة كاملة. انها كل الاحتمالات و كل من المسارات التي يمكن أن أغتنم. وهذا هو، إذا كنت تبدأ في جذر الشجرة في الجزء العلوي وذهبت إلى واحد من يترك، فإنه يقول لي ليس فقط أين أنا ذاهب ل في نهاية المطاف، سان فرانسيسكو، ولكنه يقول لي الطريق الذي ولست بحاجة لاتخاذ للوصول إلى هناك. 

الآن، وهو واحد من هؤلاء هو الأفضل؟ حسنا، لا شيء عن هذا مشكلة بعد يخبرني أي من هؤلاء هو الحل الأفضل. ربما يهمني أكثر حول كم مرة وأنا في الهواء، أو المسافة التي أنا تحلق. في هذه الحالة، شيكاغو لسان فرانسيسكو قد يكون أقصر عدد الأميال في الهواء. 

ربما يهمني التكلفة. ونحن نعلم جميعا برحلات الطيران المباشر وعادة ما تكون أكثر تكلفة. ولذلك ربما إذا أخذت هذه نوع من الطريق إلى الوراء من خلال ميامي، ناشفيل، أوستن، وفينيكس، وربما بعد ذلك أحصل على أقل الأسعار. ولكن يمكنني أن أمثل على أي المعايير التي يهمني. الذي حصل على أفضل لاعب في رحلة واي فاي، أو التي مطارات لديها أفضل الأغذية المتاحة. ولكل من هذه قد تعطيني حلا مختلفا أن أرى بأنها أفضل. 

هذه الأنواع من المشاكل، أين نحن ذاهبون لبناء من هذه الشجرة من الاحتمالات، ثم ننظر في كل من تلك مسارات الفردية، ودراسة أي من تلك ينجز معايير بالنسبة لنا، ونحن في طريقنا للاتصال تلك المشاكل البحث. ولدينا الكثير من الخوارزميات، وبعضها لقد رأينا بالفعل، للذهاب واستكشاف تلك الأشجار. يمكننا أن نفعل ذلك بالطريقة التي I لم يفعلوا، والبحث المتعمق الأول، نزول بقدر ما نستطيع حتى نحن ضرب ورقة، ومن ثم الخروج مرة أخرى، والحق في الذهاب إلى أسفل. أو أننا يمكن أن نفعل ما هو دعا بحث اتساع الأول. نحن يمكن أن يتوسع كل شيء في الجزء العلوي، ومن ثم كل شيء سطر واحد تحت هذا، ثم كل شيء سطر واحد تحت ذلك. تلك الأشجار البحث تعتبر أساسية لمنظمة العفو الدولية. لكنها لا تحصل تماما ذلك الحق في كل وقت. في الواقع، في الكثير من الحالات أننا نهتم حقا، نحن نريد أن نبني شجرة، لكننا لا فعلا وصول الى جعل كل من القرارات. 

وهذه هي الحالات تسمى البحث الخصومة، والمعروفة أيضا كما كيفية كتابة عبة اللعب نظم والحصول على أموال مقابل ذلك. ولكن هذه هي أنواع نظم أين أنا قد تحصل على اختيار عندما أذهب من بوسطن، المدينة التي ذهبت إلى القادم. ولكن بعد ذلك، وشخص آخر قد تحصل لاتخاذ قرار حول مكان أطير. وذلك لبناء هذه أنواع الهياكل، ونحن ستكون لدينا لتأخذ قليلا مقاربة مختلفة لذلك. ونحن لن تكون قادرة على مجرد البحث من خلال شجرة بعد الآن، لأننا لسنا واحد وهذا في السيطرة كل من هذه النقاط القرار. 

لذلك دعونا نتخيل بسيطة لعبة مثل تيك تاك تو. أنا يمكن أن تبدأ مع مجلس فارغة تماما. وفي تيك تاك تو، X يحصل للعب لأول مرة. وحتى أتمكن من التفكير في كل التحركات المحتملة التي يمكن أن تجعل X. وإذا أنا اللعب احدة وX، هذا أمر عظيم. لدي تسعة الممكن يتحرك أستطيع أن تجعل. ويمكنني أن وضع X في أي واحد من تلك المواقف تسعة. 

ثم من كل من تلك، وأنا يمكن تخيل ما سيحدث بعد ذلك. حسنا، في هذه الحالة، والآخر سيكون لاعب يحصل على اتخاذ منعطف. سوف O الحصول على اتخاذ منعطف. ومن كل هؤلاء، هناك سيكون ثمانية اماكن مختلفة ان O يمكن أن يضع علامة بهم. 

دعنا نقول قررت أنني كان الذهاب لوضع X في المركز. الذي يبدو دائما مثل خطوة افتتاح جيدة. أنا يمكن أن ننظر تحت ذلك، ثمانية التحركات المحتملة التي تجعل O. الآن، إذا أنا لعب X، وهذا رائع. أحصل على اختيار واحد I انتقل إلى واحد في الوسط. ولكن الآن O يحصل في الاختيار. وأنا لا تملك السيطرة أكثر من ذلك القرار. 

ولكن من كل تلك مواقف مجلس ممكنة، هناك ثم آخر مجموعة من الاحتمالات. عندما يتعلق الأمر أن يكون دوري مرة أخرى، وأود أن الحصول على انتقاء وأقول، أيضا، إذا تحرك O في، حسنا، بقعة المتوسطة على اليسار، ثم لدي مجموعة من الاحتمالات أين يمكنني اتخاذ بلدي الخطوة التالية. من هؤلاء، أنا يمكن النظر في جميع الاحتمالات تحتها. وبعد ذلك الحصول O أن تختار من بين هؤلاء. 

وأنا لا يمكن الاستمرار في بناء قدرات هذه شجرة بها حتى وصلت إلى نقطة حيث إما شخص يفوز في game-- هذا حصلت على اعتبار ورقة node-- أو مجلس مليء تماما ولا أحد قد فاز. وهذا ما يحدث أيضا أن تكون عقدة ورقة. وهذا ما سيكون التعادل. 

ولكن الشيء صعبة مع هذا إذا كانت هذه مجرد البحث العادي المشكلة، ويهمني ان تكون قادرة على مثلا، حسنا، X يجب ان تذهب هنا. ويجب O يشق طريقه إلى هناك. ثم X يجب ان تذهب أكثر من هنا. ثم O يجب ان تذهب الطريق هناك. ثم X يمكن الحصول على ثلاثة في صف واحد، وفزت. واللعبة ستكون أكثر في خمس خطوات، ثلاثة بالنسبة لي، اثنان لخصمي. لكنني لا تحصل دائما على اختيار ذلك. 

بدلا من ذلك، ما نحن ستكون لدينا للقيام ونحن في طريقنا لديك لدينا استراتيجية جديدة. والاستراتيجية التي لعبة اللعب غالبا ما تستخدم خوارزميات هو ما يسمى مينيماكس. الفكرة المركزية لل مينيماكس هو أننا الذهاب لاختيار الخطوة التي تعطي خصمنا أسوأ مجموعة ممكنة من التحركات التي يمكن أن تقدمها. وهي لا تفعل لي أي خير لاختيار الخطوة حيث قد أكون قادرا على الفوز بعد ذلك، لأن خصمي ليس الذهاب لاعطائي هذه الفرصة. انهم ذاهبون الى اختيار بعض نتائج رهيبة بالنسبة لي. لذلك أنا ذاهب لجعل التحرك الذي يفرض خصمي أن نفعل شيئا أفضل بالنسبة لي. حسنا. دعونا نرى كيف أن يلعب بها. حتى هنا أنظمتنا في شبة الكود. ونحن في طريقنا لتوليد شجرة اللعبة بأكملها. ونحن في طريقنا لبناء هيكل كامل. ومن ثم سنذهب من خلال. وعلى الجزء السفلي جدا في كل من العقد الطرفية، في كل من الأوراق، سنقوم تقييم مدى قيمة غير ذلك بالنسبة لي؟ ونحن في طريقنا إلى الأشياء القيمة التي هي جيدة بالنسبة لي بأنها إيجابية. الأشياء التي ليست جيدة بالنسبة لي سيكون أقل إيجابية، أو الصفر، أو حتى سلبية. 

حتى في تيك تاك تو، ربما فوز بالنسبة لي هو جيد. هذا هو واحد. والتعادل هو صفر. وشيء أن يكون خسارة لل لي، وربما هذا هو واحد سلبي. كل ما يهم هو أن أفضل هو الحال بالنسبة لي، وكلما ارتفعت درجة التي تتلقاها. من تلك الاحتمالات في أسفل، ثم سنقوم تصفية التصاعدي. وعندما يكون فرصتي لاختيار بين مجموعة من البدائل، سأختار واحد وهذا حصلت على أعلى الدرجات. 

وكلما انها بلدي المعارضين بدوره أن تختار، سوف أفترض أنهم ذاهبون ل اختيار واحد مع أقل عدد من النقاط. وإذا كنت تفعل هذا على طول الطريق يصل إلى أعلى الشجرة، أنا قد اخترت المسار الذي يعطي لي أفضل النتائج التي يمكنني الحصول، على افتراض أن خصمي يجعل كل الحق في التحرك. 

كل الحق، لذلك دعونا نرى في هذا العمل لأول مرة. ثم سنقوم الواقع ننظر إلى رمز لذلك. حتى تخيل لدي هذه الشجرة الكبيرة. والآن انا لا العب تيك تاك تو. أردت أن أقدم لكم شيء أكثر ثراء قليلا. حتى لقد حصلت على بعض اللعبة حيث هناك العديد من درجات مختلفة أنني يمكن أن يكون في نهاية المطاف. ولذا فإنني بناء هذه الشجرة كاملة. وأحصل على التحرك أولا. أنا في جذر الشجرة. 

وأحصل على اختيار هكذا- يضرب حتى أحصل لتعظيم عبر تلك العقدة الأولى. ثم خصمي يحصل للذهاب. وبعد ذلك الحصول على الذهاب مرة أخرى. حتى في أسفل، ولدي مجموعة من الاحتمالات التي يمكنني اختيار من بينها، الدول الطرفية مختلفة من اللعبة. إذا أنا أسفل في ذلك أقصى اليسار الزاوية، وأرى أنني قد حصلت على الاختيار بين ثمانية، سبعة، واثنين، حسنا، أنا واحد أن يحصل على اختيار. لذلك أنا ذاهب لاختيار أفضل واحد من هؤلاء. انا ذاهب الى اختيار ثمانية. 

إذا كنت لا تعرف أنه إذا كنت من أي وقت مضى ننكب على هذه النقطة، سوف تكون قادرة على الحصول على ذلك ثماني نقاط. إذا كنت في نهاية المطاف في النقطة التالية انتهت، وعقدة القادمة أكثر، تسعة، واحدة، أو ستة، حسنا، أنا ذاهب لاختيار الأفضل منها. سأختار التسعة. إذا كان لدي الخيار بين اثنين، وأربعة، واحد، سأختار الأربعة، وهو أعلى مستوى. 

الآن، إذا نظرت إلى مستوى فوق ذلك، خصمي هو واحد يحصل لجعل هذا الخيار. حتى خصمي يحصل على اختيار، لا أريد أن أعطيه الشيء الذي يحدث للحصول عليه ثماني نقاط، أو لا أعطيه الشيء هذا الذهاب لمنحه تسع نقاط، أو شيء ما يجري لمنحه أربع نقاط؟ وخصمي، يجري عقلانية، يجري لاختيار الحد الأدنى من تلك، هو الذهاب الى اختيار أربعة. 

وأستطيع أن أفعل ذلك من خلال الشجرة بأكملها. أنا يمكن أن تنخفض إلى أن مجموعة الأوسط من ثلاثة. ويمكنني أن تختار بين واحد، ثلاثة، وخمسة. وأحصل على اختيار. ولذا فإنني اختيار خمسة. ويمكنني أن تختار ثلاثة، تسعة، أو اثنين. أحصل على اختيار، لذلك اخترت التسعة. ستة، خمسة، أو اثنين، وأنا اخترت. أحصل على اختيار ستة. فوق مستوى الذي يحصل لاختيار؟ الذي يحصل أن تختار؟ الرجل الآخر، خصمي. لذلك اختاروا خمسة، تسعة أو ستة، وهو واحد؟ 

الحضور: الخمسة. 

المتحدث: اختاروا الخمسة. أنها تحصل على اختيار الحد الأدنى. ثم آخر واحد، اختيار واحد أو اثنين أو ثلاثة. أحصل على اختيار، لذلك اخترت الثلاثة. تسعة، سبعة، أو اثنين، وأنا اخترت تسعة. و11، ستة، أو أربعة، وأنا اخترت 11. خصمي ثم يختار ثلاثة، تسعة أو 11، يختار الحد الأدنى. انه يعطيني ثلاثة. ثم أخيرا في الجزء العلوي من شجرة، وأحصل على اختيار مرة أخرى. وأحصل على الاختيار بين أربعة، خمسة، أو ثلاثة. لذلك أود أن أغتنم هذه الخمسة. 

إذا وصلت إلى السيطرة على كل شيء، فما استقاموا لكم فاستقيموا اتخاذ المسار الذي أدى إلى 11. لكنني لا تحصل على جعل هذا الخيار. إذا ذهبت في هذا الطريق. سوف خصمي يجبرني إلى الخيار الذي يؤدي إلى ثلاثة. وبالتالي فإن أفضل ما يمكنني القيام به هو لاتخاذ هذا الفرع الأوسط، جعل هذا الخيار وهذا في نهاية المطاف الذهاب إلى يقودني إلى خمس نقاط. هذا ما يفعله مينيماكس. 

حسنا. دعونا نلقي نظرة على ذلك. حتى هنا في CS50 IDE هو البرنامج الذي تنفذ أصغر القيم العظمى للعب تيك تاك تو. ونحن في طريقنا لبناء حتى التمثيل. ونحن في طريقنا لاثنين من opponent-- أو اثنين من اللاعبين، جهاز الكمبيوتر الخاص بنا لاعب ولاعب البشري. عدد اعب واحد سوف يلعب وO. هذا سوف يكون اللاعب الجهاز. أنها تحصل على التحرك ثانية. واللاعب الآخر، لدينا لاعب البشري، وسوف يكون X. 

وجعل حياتي ل قليلة بسيطة، وانا ذاهب لتسمية أن لاعب واحد سلبي. حتى أستطيع أن تتكاثر فقط من جانب واحد سلبي لمبادلة بين لاعب واحد والآخر. كل الحق، لذلك دعونا نلقي نظرة على ما نحن فعلا تنوي القيام به. ونحن في طريقنا لتحديد مجلسنا. انها سوف تكون، حسنا، نحن ذاهبون السماح لها أن تكون ثلاثة ثلاثة، أو أننا يمكن أن تقوم به حتى خمسة خمسة أو سبعة سبعة تيك تاك تو إذا كنت مثل، استنادا إلى بعض البعد D. 

وسيكون لدينا زوجين وظائف مساعد التي سوف تفعل أشياء مثل تهيئة screen-- أو آسف، تهيئة المتغيرات لدينا، مسح الشاشة، ورسم لوحة على الشاشة، واحد أن يتحقق لوحة لمعرفة ما إذا كان أو لا هناك فائز، واحد يوزع من خلال سطر الأوامر، فقط للمساعدة، واحد الذي يقرأ في المدخلات، وظيفة واحدة تسمى مينيماكس. وهذا هو واحد سنقوم نهتم حقا. ولكن دعونا ننظر أولا إلى الرئيسية. 

ماذا نفعل؟ حسنا، نحن في طريقنا لل تحليل سطر الأوامر لدينا، قرأت للتو في ونرى ما البعد مجلس نود أن يكون. سنقوم تهيئة مجلسنا. وبعد ذلك سوف يدخل واحد حلقة البرية الكبيرة، مرارا وتكرارا استعرض التحركات حتى اللعبة فاز أو لم يكن هناك تحركات نقاط. في كل مرة نذهب من خلال ذلك حلقة، سنقوم مسح الشاشة. سوف نستخلص المجلس على الشاشة. ونحن عمدا نوع من التلخيص هذه بعيدا عن الوظائف الفرعية، ذلك أننا لا داعي للقلق كثيرا حول تفاصيل كيفية حدوثها. 

سيكون لديك رمز في وقت لاحق اليوم. وإذا كنت تريد أن ننظر من خلال ومعرفة، ويمكنك ان ترى كل منهم. ولكننا سوف رسم لوحة على الشاشة. ومن ثم فإننا سوف تحقق و ترى، هل لدينا الفائز؟ وقد شخص فاز هذه اللعبة؟ إذا كان لديهم، ونحن سوف طباعة من رسالة النصر. وسنقوم في نهاية المباراة. 

ونحن سوف تحقق أيضا و معرفة ما إذا كان هناك التعادل. أنه سوف يكون من السهل معرفة ما إذا كان هناك التعادل. وهذا يعني أن جميع مساحات مليئة، ولكن لم يكن هناك فائز حتى الان. يمكن أن نعلن التعادل وينبغي القيام به. ثم meat-- حقيقية إذا إنه لاعب آلة، نحن سوف تسمح بأن لاعب آلة للبحث من خلال استخدام هذه الخوارزمية مينيماكس، العثور على أفضل تحرك ما في وسعها. وبعد ذلك سنقوم وضع هذا التحرك للاعلى. 

خلاف ذلك، إذا كان لاعب البشري، سنقوم قراءة بعض المدخلات من الإنسان. وبعد ذلك سواء كان ذلك في الإنسان لاعب أو لاعب آلة، سنفعل بضع قليلا بت من التحقق من الخطأ، تأكد من أنه يبقى ضمن حدود الأبعاد الفعلية للمجلس التي لدينا، تأكد أن هذا الفضاء فارغ، أن وضع لا أحد قطعة هناك بالفعل. وبعد ذلك سنقوم وضعت للتو قطعة على متن الطائرة، تغيير لاعب إلى الطبقة التالية، و زيادة كم من التحركات قد حدث. 

هذا هو الحلقة الرئيسية ل لدينا لعبة تيك تاك تو. مينيماكس، إذن، هو بالضبط الخوارزمية التي لدينا من قبل. التعديل الوحيد الذي قمنا بها حتى نتمكن يمكن أن تقوم به أعلى لوحات الأبعاد هي قمنا أبقى هذه المعلمة إضافية تسمى عمق. وعمق يقول فقط، إذا أنا البحث الأسفل من خلال تلك الشجرة وأحصل حتى الآن أسفل ما وراء بعض عمق مستوى أنا فقط لا أريد للذهاب إلى أبعد من ذلك، انا ذاهب الى وقف وفقط تقييم المجلس في تلك المرحلة. سوف تحقق ومعرفة ما إذا كان هناك فائز. إذا كان هناك فائز، I إعادتها. خلاف ذلك، وسوف تذهب من خلال حلقة. وأنا أقول، لجميع المواقع المحتملة ان استطعت ربما اتخاذ مثل هذه الخطوة بلدي، وأنا سوف بناء لوحة افتراضية أن يشمل انتقالي على أن المجلس، ثم يدعو متكرر مينيماكس. 

إذا كان انتقالي، لأحصل على العثور على واحد أن حصل على درجة أكبر. اذا كان التحرك خصمي، نجد تلك التي حصلت الحد الأدنى من الدرجات. وشيء آخر حفظ السجلات فقط. كل الحق، لذلك دعونا نرى هذا المدى. في الواقع، ربما نستطيع الحصول على بضعة من المتطوعين من أجل التوصل إلى ولعب تيك تاك تو. (غير مسموع) واحد، واحد أكثر من ذلك، اثنين، وهناك حق. تأتي على ما يصل. 

لذلك دعونا نمضي قدما و إعادة تشغيل هذا تماما. لذلك، مرحبا. 

الجمهور: مرحبا. 

رئيس مجلس النواب: ما اسمك؟ 

الحضور: Gorav. المتحدث: Gorav. 

الحضور: أنا ليلى. 

رئيس مجلس النواب: ويلى، وليلى، آسف. تأتي على ما يصل. Gorav، ونحن في طريقنا لتذهب أولا. وانا ذاهب ليطلب منك أن تكون لا جيد بشكل رهيب لاعب تيك تاك تو. OK، لذلك كل الضغوط هو خارج على لك. دعونا نرى، على الرغم من أن لدينا آلة لاعب يمكن أن تفعل شيئا في الواقع ذكية. فهيا. وأنت تسير لكتابة فيه تنسيق كنت ترغب في وضع X الخاصة بك في. A0، OK، وآلة قد ذهب وضع على الفور، وبصماته في A1. 

وضع O على متن الطائرة. كل الحق، اذهب الآن إلى الأمام. أين تريد أن تذهب؟ C2. وقد اتخذت لاعب لدينا آلة ساحة الأوسط، ومنعت لك. حتى أن كان جيدا، الشيء الذكية لأن تفعله. كنت قد حجبه. هذا ممتاز. فإنه يأخذ زاوية هناك. 

وانها سوف يجبرك على تأخذ مساحة واحد آخر، B0. وتنتهي المباراة بالتعادل. لكنها لعبت معقولة لعبة ضدك، أليس كذلك؟ كل الحق، شكرا جزيلا، Gorav. 

[تصفيق] 

كل الحق، ليلى، ونحن في طريقنا حتى لعبة على هنا. 

الحضور: يا عظيم. 

رئيس مجلس النواب: ونحن في طريقنا لإعطاء كنت أربعة أربعة تيك تاك تو. الآن، في أربعة أربعة، لديك للفوز مع أربعة في صف واحد، وليس ثلاثة في صف واحد. والأمر كله لك. فأخذ ليلى D1. نحن الآن بصدد متابعة لاعبنا الكمبيوتر هنا. ثلاثة ثلاثة تيك تاك تو هو نوع من الاشياء التي من السهل بالنسبة لنا جميعا. لكنه ما زال من الجميل أن نرى لاعب الكمبيوتر مما يجعل التحركات الذكية. أربعة أربعة يحصل على تكون اصعب قليلا. 

تم بإتقان. كل الحق، لذلك ليلى أجهز. أوه، ونحن يجب أن تنتهي هناك. ولكن دعونا نفعل أكثر واحد هنا. لذلك ليلى، وشكرا لكم. تم بإتقان. 

[تصفيق] 

لذلك لدينا لاعب تيك تاك تو يذهب من خلال ويجد المواقع، يحل لهم باستخدام هذا مينيماكس. وكان إعداد عمق على أن ذلك أنه لن يرشح نفسه بسرعة كبيرة، الذي هو على الارجح السبب كانت ليلى قادرة على الذهاب بشكل جيد قبل كما فعلت، وفعلت بشكل جيد للغاية. ولكن هذه الأنظمة التي فقط تذهب من خلال والقوة الغاشمة تذهب أعمق، وأكثر عمقا، وأكثر عمقا، والحفاظ على إيجاد الحل التي يحتاجون إليها، تلك الأنواع من الأنظمة هي ناجحة جدا في هذه، أيضا، ألعاب اللوح القياسية. 

وفي الواقع، إذا كنا ننظر إلى ثلاثة ثلاثة لعبة تيك تاك تو، هذا هو في الأساس حل المشكلة. وهذا هو الرسم البياني الرائع من راندال مونرو في XKCD، تظهر أي تحرك يجب عليك تتخذ، نظرا تحركات خصمك. هذا هو الشيء الذي نستطيع تحديد بسهولة في وقت مبكر. ولكن ماذا يحدث عندما نصل الى أكثر الألعاب المعقدة، ألعاب أكثر تعقيدا، حيث توجد لوحات أكبر، وأكثر الاحتمالات، استراتيجية أعمق؟ 

وتبين أن هذا القوة الغاشمة البحث لا يزال بشكل جيد إلى حد معقول، باستثناء عندما تحصل على نقطة حيث أن الشجرة هي كبيرة جدا أنه لا يمكن أن تمثل كل شيء. عندما لا يمكنك حساب الشجرة بأكملها، عندما كنت لا يمكن أن تذهب إلى الأمام ودفع نفسك إلى النقطة التي قمت حصلت على الشجرة بأكملها في الذاكرة، أو ما إذا كان يمكنك الحصول عليه في الذاكرة وأنها سوف فقط يأخذك الطريق طويل جدا للبحث عن طريق ذلك، لديك لتفعل شيئا أكثر ذكاء. 

من أجل القيام بذلك، عليك يجب أن تفعل شيئين. أولا، عليك أن تجد بعض طريقة للحد من عمق الخاص بك. حسنا، هذا ما يرام. يمكن أن نجد بعض الجميل، الحد الادنى ويقول: يمكنك الذهاب فقط عميق جدا. ولكن عندما تفعل ذلك، وهذا يعني انك لدينا هذه المجالس غير مكتملة جزئيا. وعليك أن تختار، هل تحب هذه اللوحة غير مكتملة جزئيا، أو هذا المجلس غير مكتمل جزئيا؟ 

وعلى موقعنا الأربعة أربع مباريات تيك تاك تو، لاعب جهاز الكمبيوتر الخاص بنا حصلت أسفل إلى أسفل وقالت انها، لقد حصلت على اثنين من لوحات مختلفة. لا احد هو الفوز. لا احد هو الخسارة. لا احد هو التعادل. كيف أختار بينهما؟ وأنه لم يكن لديك طريقة ذكية للقيام بذلك. 

ونحن نرى هذا النوع من تقييم يحدث في كل وقت ونحن ندخل في ألعاب أكثر تعقيدا. الشطرنج هو مثال عظيم. في لعبة الشطرنج، لدينا، لأول مرة قبل كل شيء، لوحة أكبر. لدينا أكثر بكثير القطع. وتحديد المواقع من هذه القطع والطريقة أن هذه القطع تتحرك من المهم بشكل حاسم. حتى لو كنت تريد استخدام مينيماكس، أنا بحاجة إلى أن تكون قادرة على تحديد ويقول هذا المجلس، حيث وقد فاز أحدا أو فقدت بعد، أفضل نوعا ما من هذا البعض مجلس، حيث لم يحصل أي واحد أو فقدت. 

للقيام بذلك، وأنا قد تفعل أشياء كأنني قد فقط إحصاء عدد القطع لا بد لي وكيف العديد من القطع التي لديك؟ أو أنا قد يعطي مختلفة قطع جهات النظر المختلفة. بلدي الملكة يستحق 20 نقطة. البيدق الخاص بك هو يستحق نقطة واحدة. الذي لديه مجموعه المزيد من النقاط؟ أو أنا قد تنظر في أشياء مثل، الذي حصل على وضع أفضل متن الطائرة؟ لمن الدور المقبل، كل ما يمكنني لا لتقييم أكثر دقة أي من هذه الاحتمالات أفضل دون النظر بشكل شامل كل خطوة يمكن أن تأتي بعد ذلك. 

الآن لجعل هذا العمل، واحدة من الأشياء التي ل ستصبح المهم حقا بالنسبة لنا ليست مجرد الانتقال مباشرة وصولا الى عمق معين الحد المسموح به، ولكن أن تكون قادرة على القول، واحدة من هذه الأفكار التي أنا يكون هو سيئة للغاية بحيث انها لا يستحق النظر جميع الطرق الممكنة أن الأمور يمكن أن تسير من سيء إلى أسوأ. للقيام بذلك، سنقوم بإضافة إلى مينيماكس دعا مبدأ ALPH بيتا. وتقول ألفا بيتا، إذا كان لديك فكرة سيئة، لا تضيعوا وقتكم في محاولة ل تعرف بالضبط كيف أنها سيئة. 

حتى هنا ما نحن ذاهبون للقيام به. ونحن في طريقنا إلى اتخاذ نفس المبادئ التي كان لدينا من قبل، نفس النوع MINIMAX البحث فقط نحن الذهاب تتبع، وليس فقط من القيم الفعلية التي لدينا، ولكننا سوف تتبع أفضل وجه ممكن قيمة أن أتمكن من الحصول، وأسوأ ممكن النتيجة كان يمكن أن يكون. وأي وقت أسوأ ممكن تبحث المرجح شيء، أنا التخلي عن ذلك الجزء من الشجرة. وأنا لن حتى عناء أبحث في ذلك بعد الآن. 

كل الحق، لذلك أتصور أن نبدأ مع نفس هذه الشجرة لعبة بالضبط. والآن ونحن في طريقنا للذهاب أسفل مرة أخرى، على طول الطريق لذلك أسفل الزاوية اليسرى. وفي ذلك أسفل الزاوية اليسرى، ونحن ننظر ونقيم هذا المجلس. ربما انها أربعة أربعة تيك تاك تو مجلس، أو ربما انها لوحة الشطرنج. ولكننا ننظر في الأمر، ونقيم ذلك، ونحصل على قيمة ثمانية. 

في تلك المرحلة، ونحن نعلم أن نحن ذاهبون للحصول على ما لا يقل عن ثماني نقاط من هذا القرار السفلي. لا يهم ما الآخر هما، أن سبعة وان اثنين. ويمكن أن تكون أي القيم أرادوا أن يكون. ونحن في طريقنا للحصول على أقل ثماني نقاط. كل الحق، ولكن استطعنا المضي قدما وتحقق. ربما واحد منهم أفضل من ثمانية. 

ننظر إلى سبعة. هل هذا أفضل من ثمانية؟ لا، هذا لا يغير رأينا على الإطلاق. ننظر إلى اثنين. هل هذا أفضل من ثمانية؟ لا، هذا لا يغير رأينا على الإطلاق. حتى الآن نحن نعلم أننا قد استنفدت كل الاحتمالات هناك. نحن لن تحصل أي شيء أفضل من ثمانية. ونحن في طريقنا للحصول على بالضبط ثمانية. 

وهكذا نغير تلك العقدة و مثلا، التي هي الآن على وجه اليقين. نحن صاعدون مستوى واحد فوق ذلك. ونحن الآن نعرف شيئا حول هذا المستوى الحد. ونحن نعلم أننا لن الحصول على أكثر من ثماني نقاط إذا كنا اذهب الى الأسفل هذا الاتجاه. لأنه حتى لو كانت تلك الفرعين الآخرين تتحول أن تكون رائعة وتستحق آلاف نقطة لكل منهما، وخصمنا تعطينا الحد الأدنى، وتعطينا الثمانية. كل الحق، حسنا، دعونا نرى. ونحن سوف نستمر في هذا الطريق. نذهب الى هذا الوسط على اليسار. نحن ننظر إلى أسفل، ونحن نرى هناك تسعة. نحن نعلم أننا ذاهبون للحصول على لا يقل عن تسعة نقاط من خلال الذهاب إلى أسفل هذا الطريق الأوسط. وعند هذه النقطة، يمكننا أن نتوقف فقط. ويمكننا القول، نظرة، I تعرف في مستوى أعلى، انا ذاهب الى الحصول على ما لا يزيد عن ثمانية يشير كتبها السير في هذا الاتجاه. ولكن إذا ذهبت إلى أسفل الوسط مسار بدلا من مسار اليسار، أود الحصول على تسع نقاط على الأقل. 

خصمي أبدا الذهاب الى اسمحوا لي أن تسلك هذا الطريق الوسط. أنها تحصل على اختيار. وانهم ذاهبون الى اختيار الطريق إلى اليسار نحو ثمانية، بدلا من أسفل منتصف نحو ما لا يقل عن تسعة نقاط. حتى في تلك المرحلة، سأتوقف عن اللعب. وأنا أقول، أنت تعرف لماذا؟ ليس لدي أي أن ننظر إلى أكثر بانخفاض في هذا الاتجاه. لأنني لن للوصول إلى هناك. 

يمكنني تجاوز ذلك واحد، ويمكنني أن تخطي ستة، لأن هذا لن يحدث. ولذا فإنني سوف تنخفض وسوف أكون النظر في إمكانية المقبلة. أنا أذهب إلى هناك وأنا أقول، وأنا أرى اثنين. أنا أعرف ما إذا كنت تحصل إلى هنا، وأنا الذهاب للحصول على اثنين على الأقل. حسنا. I الاستمرار. أرى الأربعة. أعرف أنني ذاهب للحصول على أربعة أشخاص على الأقل. لا يزال هناك الكثير بين أربعة وثمانية، وإن كان. لذلك أنا الاستمرار. أنا أنظر إلى أسفل وأرى أن هناك واحدة. كل الحق، وأنا أعلم إذا I السير في هذا الطريق، أنا ذاهب ليكون قادرا على اختيار الأربعة. ما خصمي تنوي القيام به؟ بين شيء يعطيني ثمانية، وهو الأمر الذي يعطيني أربعة، وشيء يعطيني تسعة على الأقل، حسنا، انه ذاهب الى أن تعطيني الأربعة. وأنا أعلم الآن في أعلى جدا، وانا ذاهب لتكون قادرة على الحصول على ما لا يقل عن أربع نقاط للخروج من هذه اللعبة. 

الفكرة كلها ألفا بيتا هو لقطع أجزاء الشجرة حتى أنني لا ننظر إليها بعد الآن. لكنه لا يزال يبدو وكأنه لقد كنت النظر في الكثير من الشجرة. دعونا نمضي إلى أسفل. سنذهب إلى أسفل واحد القادم الآن. في أسفل، والعثور على وظيفة. أعرف أنني ذاهب إلى الحصول على واحد على الأقل. وأظل أبحث. 

أجد الثلاثة. أعرف أنني ذاهب للحصول على ثلاثة على الأقل. I الاستمرار. أجد خمسة. أعرف أنني ذاهب للحصول على خمسة إذا كنت تحصل عليها في هذا الطريق. وأعرف أيضا ثم أن خصمي، إذا أنا اختيار منتصف الخيارات الثلاث الكبرى، انه ذاهب الى أن تعطيني شيء أن يكون خمسة أو أقل. 

حسنا. يمكنني الاستمرار هناك. أنا يمكن أن ننظر إلى أسفل وI يمكن القول، ما أنا ذاهب للحصول على إذا ذهبت إلى أسفل منتصف الطريق؟ انا ذاهب الى الحصول عليها، أيضا، ثلاثة هناك. انا ذاهب الى الحصول على شيء هذا على الأقل ثلاثة. لا يزال هناك أشياء بين ثلاثة وخمسة، ولذا فإنني مواصلة البحث. أوه، وتسعة، وسوف أكون بالتأكيد تأخذ ذلك على مدى ثلاثة. انا ذاهب الى الحصول على ما لا يقل عن تسعة إذا ذهبت في هذا الطريق الأوسط. 

الآن توقف خصمي ويقول: نظرة، لا يوجد أي نقطة بعد الآن. وأنا أعلم أن بلدي التقليل من الخصم، وانه الذهاب الى تعطيني شيء هذا أقل من أو يساوي خمسة، بدلا من الشيء هذا أكبر من أو يساوي تسعة. أتوقف. أنا لا تبدو أي أكثر في ذلك. I الاستمرار. 

أنا ننظر إلى أسفل على هذه الخطوة. إلى أسفل، أجد ستة. وأنا أعلم أنني ذاهب الى الحصول على ستة على الأقل. وماذا يمكنني أن أفعل؟ أنا يمكن أن تتوقف. لأنه لا يوجد خيار بين شيء أن يكون لا يقل عن ستة والشيء الذي هو أقل من خمسة، وانه الذهاب الى تعطيني شيء هذا أقل من خمسة. والآن وأنا أعلم أنني ذاهب للحصول بالضبط هذا الخيار. انا ذاهب للحصول على هذا الاختيار الخمسة. 

أعود تصل إلى أعلى. الذي أنا ذاهب ل الاختيار بين شيء هذا هو أكبر من أو يساوي أربعة، أو شيء من هذا يساوي خمسة؟ أنا ذاهب لتأخذ شيئا وهذا لا يقل عن خمسة. I السير في طريق آخر، كل الطريق إلى أسفل. هناك واحد. OK، على الأقل أنا ذاهب للحصول على نقطة واحدة. I الاستمرار. اثنين، أوه، هذا أفضل من واحد. انا ذاهب للحصول على اثنين على الأقل. أجد الثلاثة. أعرف أنني ذاهب للحصول على ثلاثة. 

ونقطة فوق ذلك، خصمي هو ذاهب أن تعطيني شيئا هذا أقل من أو يساوي ثلاثة. والآن أنا يمكن أن تتوقف. لأنه في الاختيار بين كوني قادرة على الحصول على خمس وخصمي إعطائي شيئا أقل من ثلاثة، انا ذاهب دائما لاتخاذ هذه الخمسة. لذلك أنا لا تقييم هذا الجزء السفلي من الشجرة على الإطلاق. 

الآن، وهذا قد يبدو طفيفة. ولكن عندما قطع صغيرة من الحساب، أكبر من وأقل من، يمكن قطع أجزاء كاملة من هذه الشجرة تنمو باطراد، الذي يؤدي إلى ضخمة مقدار التوفير والادخار التي تكون كبيرة بما يكفي أنني يمكن البدء في اللعب بشكل تنافسي في المزيد من الألعاب المعقدة. 

كل الحق، وإذا نظرنا إلى حجم وتعقد لعبة مختلفة، وكان تيك تاك تو مثالنا سهلا. لقد حصلنا على لوحة صغيرة، ثلاثة ثلاثة. نحصل على الأكثر، بمتوسط حوالي أربعة خيارات مختلفة ونحن نمضي من خلال اللعبة. لدينا في مكان ما حول 10 إلى الخامسة الأوراق المختلفة المحتملة. وبناء تيك تاك تو لاعب، حسنا، نحن فقط فعل ذلك. من السهل. 

إذا ذهبنا إلى ما هو أكثر مجمع، مثل ربط أربعة. هل تتذكر هذه اللعبة حيث قمت بإسقاط رموز صغيرة في؟ انها لوحة ستة سبعة، أليس هذا أكبر بكثير، لا يزال لديها تقريبا نفس المتفرعة عامل كما تيك تاك تو. لدي حوالي أربعة خيارات أين يمكنني وضع الأشياء في. ولكن الآن، لقد حصلت على الكثير من يؤدي، من 10 إلى قوة ال21. هذا شيء من السهل يكفي أن نتمكن من حل على الفور. 

لعبة الداما، أكثر complex-- لك حصلت على ثمانية ثمانية متنها. كنت فقط على نصف لهم في أي وقت، وإن كان. كنت قد حصلت على التفرع عامل ان حوالي 2.8. حسنا، لقد حصلت على زوجين التحركات التي يمكن أن تتخذ. كنت قد حصلت على حوالي 10 إلى الأوراق ال31، أكبر وأكبر، وأكبر المساحات. كما لا بد لي من البحث عن طريق تلك المساحات أكبر وأكبر، وذلك عندما أشياء مثل ألفا وبيتا و أن تكون قادرة على قطع فروع كامل يصبح ضروريا. 

الآن، وكانت لعبة الداما السهل بما فيه الكفاية في عام 1992. برنامج كمبيوتر يسمى فاز طراز شينوك في لعبة الداما العالم بطل، ماريون تينسلي. ومنذ ذلك الحين، لا لاعب رئيسي البشري لديه كان قادرا على الفوز على الأفضل نظم الحاسوبية. وإذا نظرنا إلى ما يشبه لعبة الشطرنج، الآن مرة أخرى، لدينا ثمانية ثمانية متنها. ولكن لدينا أكثر تعقيدا قطعة، حركات أكثر تعقيدا من ذلك بكثير. لدينا عامل المتفرعة من حول 35، 35 التحركات المحتملة في المتوسط أستطيع أن تتخذ، ودولة الفضاء، عددا من الأوراق وهذا ما نمت ل10 إلى قوة 123rd، أعداد هائلة من الاحتمالات. 

ما زالت حتى المعالجات الحديثة هي قادرة على القيام بذلك بنجاح. في عام 1995 ثم في عام 1997، كمبيوتر برنامج يسمى ديب بلو بنيت من قبل IBM أن ركض على العملاق العملاق الفوز على بطل العالم الحالي، غاري كاسباروف. وكانت هذه نقطة تحول. اليوم، على الرغم من أن معالجة نفسه السلطة يجلس على بلدي ماك بوك. 

سرعة المعالجة وتبقي الحصول على أسرع وأسرع. نستطيع أن نقيم أكثر وأكثر لوحات أسرع وأسرع. ولكن الأهم من ذلك، لدينا أفضل وظائف التقييم وأفضل التقليم الأساليب. حتى نتمكن من البحث في مساحة أكثر التعقيد. أكبر للمجلس الألعاب التي يمكن أن نفكر به، شيء من هذا القبيل العودة هذا حصلت على متنها 19 بنسبة 19، الآن فجأة، ونحن بعد نقطة حيث نظم حسابية يمكن أن يفوز. ليس هناك الحاسوبية النظام هناك يمكن أن تغلب على لاعب العودة المهنية. أفضل أنظمة رتبة اليوم أنه حول هذا النوع من مستوى الهواة جيد. لذلك لا يزال هناك قدرا كبيرا من هناك أنه لا يمكنك الحصول على بعد. 

كل الحق، وهذه ألعاب الطاولة التقليدية، هذه الأنواع من الأنظمة التي نقوم بناء هذا مينيماكس، سواء كان ذلك حصلت ألفا-بيتا أو لا، تعمل هذه الخوارزميات لأن هناك بعض القيود. لدينا معلومات كاملة حول العالم. نحن نعرف أين كل القطع. العالم هو ثابت. لا أحد يحصل على نقل القطع حول بينما أنا يجلس هناك تفكير، مع الأخذ دوري. هناك مساحة عمل هذا منفصلة. أستطيع أن أضع بيدق هنا، أو أستطيع أن أضع بيدق هنا. أنا لا يسمح لوضع بلدي بيدق على السطر الذي بين المربعات اثنين. 

وأخيرا، فإن الإجراءات هي حتمية. وأنا أعلم أنه إذا أقول، الغراب إلى فارس ثلاثة، بلدي الغراب هو الذهاب الى نهاية المطاف في فارس ثلاثة، طالما انها خطوة صحيحة. ليس هناك شك حول ذلك. الآن، وأنا أذهب إلى أكثر أنواع مختلفة من الألعاب، لدينا لكسر تلك الافتراضات. 

ماذا لو ذهبت إلى شيء مثل ألعاب الفيديو الكلاسيكية؟ وهنا مجموعة مختارة من الفيديو مباريات من أتاري 2600. ما لا بد لي من هناك؟ لقد حصلت عبة Frogger، الفضاء الغزاة، شرك، وباك مان. ما أنواع البيئات لا بد لي هنا الآن؟ أي من هذه الافتراضات لا بد لي من كسر؟ 

حسنا، ذلك يعتمد على اللعبة. أنا يمكن أن تلعب الشطرنج على 2600، و سيكون تماما كما كان من قبل. وبالنسبة لمعظم هذه الأنظمة، هناك معرفة كاملة حول العالم. هناك تماما الإجراءات القطعية. ولكن عادة، في العالم لم تعد ساكنة. وهذا هو، بينما أنا جالس هناك الانتظار، شيء يتحرك. أشباح يأتون للحصول على لي. العقرب يتابع لي تحتها. الغزاة الفضائية القادمة أوثق وأقرب. جيدا كيف يمكن أن نقوم به ضد هذه؟ 

وقبل بضع سنوات، وجوجل وقد دعا مشروع DeepMind، حيث قاموا بتدريب كمبيوتر برنامج للعب أتاري 2600 ألعاب. وإذا كنت تعتقد أن هذا غير جاد الأعمال التجارية، ونتائج دراستهم نشرت في الطبيعة، لذلك تقريبا جيدة كما والنشر كما كنت يمكن الحصول عليها. وهنا مدى حسن أداء. 

لديهم خوارزمية الجالس وشاهدت للتو المدخلات الشاشة. انها حصلت على أي تعليمات من أي نوع حول قواعد اللعبة. وكان من المفترض أن معرفة، استنادا رصيده، جيدا كيف كان يقوم به. وكان هذا النظام الذي يستخدم شيئا دعا تعزيز التعلم. وهذا هو، بدا في رصيده. وقال أنه إذا كان حصل على درجة جيد، وأود أن أذكر تلك الأشياء. ويجب أن أقوم به تلك مرة أخرى. وقال أنه إذا كان حصل على درجة سيئة، أنا لا ينبغي أن تفعل هذه الأشياء مرة أخرى. 

هذا هو الأداء من تلك النظم تدريب يسمح له باللعب ل ساعات قليلة على كل لعبة، مقارنة ضد اللاعبين المحترفين. وذلك لجميع المباريات التي ل إلى الجانب الأيسر من هذا الخط، هذا برنامج كمبيوتر الذاتي المدربين فاق أداء اللاعبين المحترفين. وعلى كل شيء ل الحق، واللاعبين المحترفين كانت لا تزال الأفضل. لشيء أن يعرف شيئا عن قواعد، أن لا يعرف شيئا عن هيكل الألعاب، وهذا هو الأداء الرائع. وهذا هو ما نحن قادرون على القيام به اليوم. 

OK، أقول لكم، ولكن إذا كنا التفكير منظمة العفو الدولية في المباريات، وعادة ما نفكر في أشياء ما في وسعنا في الواقع الجلوس ولعب ضد. إذا أجلس وألعب ستار كرافت، أو ألعب المنخل الحرة، الخصم الكمبيوتر هو الشخص السيطرة على الزرج، أو السيطرة على حضارة أخرى. كيف تفعل هؤلاء اللاعبين في الواقع تجد تحركاتها؟ 

حسنا، وتنظم هذه الألعاب بنفس الطريقة مباريات مجلسنا، هذه الألعاب التي سنقوم نداء جماعيا أربع مباريات X، استكشاف، expand-- ننسى تلك. ما هم؟ استكشاف وتوسيع واطفاء، أعتقد هو آخر واحد. ولكنها في الأساس استكشاف وقهر الألعاب. عادة، والخصم الكمبيوتر هناك لديها معلومات محدودة. انهم لا يعرفون بالضبط ما هو يجري وراء ذلك ضباب الحرب. أنها لا تحصل على رؤية ما لديك في المخزون الخاص بك. 

هناك بيئة ديناميكية. كل شيء يتغير في كل وقت. لم تحصل على الجلوس و الانتظار لاتخاذ خطوة الخاص بك. ولكن معظم الأمور لا تزال منفصلة. يجب أن أضع مدينتي هنا. أو يجب أن أضع مدينتي هنا. وكل شيء حتمي. عندما أقول، نقل وحدتي هنا، وحدتي يتحرك هنا، ما لم يكن عقبة فجأة يأتي دور. الآن، هذا ليس كل شيء كمبيوتر الألعاب التي يوجد بها اليوم. 

مضيت وأنا ألعب أول نوع الشخص لعبة، شيء مثل اللص أو تداعيات أو Skyrim، أو هالة، الآن لدي خصوم الكمبيوتر التي هي الى ان هناك وضعا مختلفا جدا. لديهم، مرة أخرى، معلومات محدودة. إلا أنها يمكن أن نرى مجال معين من الرأي. البيئة لا تزال حيوية. الأمور تتغير في كل وقت. 

ولكن الآن لدي أكثر من ذلك بكثير مساحة العمل المستمر. أنا يمكن فقط تطل على قليلا من المدخل. وبعض الألعاب، بلدي الإجراءات هي العشوائية. أحصل على محاولة للقفز فوق هذا الجدار، ولكني حصلت على فرصة للفشل. هذه الأنواع من الألعاب تقترب وأقرب إلى أنواع من وحدات التحكم أن نبني في مجال الروبوتات. 

في مجال الروبوتات، علينا أن نفترض ان لدينا معلومات محدودة. لدينا أجهزة الاستشعار التي اخبرنا عن العالم. لدينا المتغيرة دائما، بيئة ديناميكية. لدينا في العالم التي الفضاء مستمرة، وليس منفصلة. وأفعالنا، عندما نحاول منهم، لديهم فرصة للفشل. في واقع الأمر، لعبة حديثة أجهزة التحكم عن الخصم هالو الخاص بك، أو لأولئك الشخصيات في Skyrim، في الأساس تشغيل أبنية الروبوتات الصغيرة. 

شعروا العالم. يبنون نموذجا للعالم. يحسبون استنادا إلى مجموعة من الأهداف التي ترغب في تحقيقها. انهم يخططون الإجراءات تستند على ما يعرفونه. وتلك هي بالضبط نفس النوع نظم أن نبني في مجال الروبوتات. وبالتالي فإن هذه البنى، ل جلب هذا معا مرة أخرى، غالبا ما تكون تماما نفس الشيء. 

لذلك دعونا نرى ما اذا كنا نستطيع رؤية ذلك. دعونا نعود إلى موقعنا مثال تيك تاك تو. وانا ذاهب لطرح اثنين من بلدي مرحلة ما بعد الدكتوراه ليأتي ويساعدني. لذلك تشن مينغ، واليساندرو، و أوليفييه، إذا يا رفاق سوف يأتي. وانا ذاهب الى حاجة اثنين من المتطوعين 

OK، رأيت لها يد المساعدة الحق هناك في الوسط. اسمحوا لي أن تأخذ واحدة أكثر من ذلك، شخص ما كذلك في الظهر ربما. كل الحق، هناك. تأتي على ما يصل. حسنا. لذلك دعونا نلقي أن غطاء أسفل. وإذا كنت اللاعبين ستأتي الحق مرة أخرى حول هنا بالنسبة لي، رائعة. 

لذلك هذا هو الروبوت دعا باكستر. وباكستر هو الروبوت هذا هو منصة تجارية، تصميم من قبل شركة تدعى إعادة التفكير. وصمم هذا الروبوت لتصنيع على نطاق صغير. ولكن اليوم نحن في طريقنا لل استخدامه للعب تيك تاك تو. الآن، هذا الروبوت هو أيضا شيء هذا فريدة من نوعها نسبيا. لأنني لو كانوا يقفون في أي مكان بالقرب من أتمتة مصنع القياسية النظام، ويهمني أن يكون في القبر جدا خطر إصابة. 

باكستر، ومع ذلك، تم تصميمه ليكون آمنة نسبيا للتفاعل معها. وحتى أتمكن من المضي قدما هذا الروبوت. ويمكنك ان ترى انها قليلا مرونة قليلا وهو يتحرك حولها. وأستطيع أن موضعه حيث أود أن تذهب. الآن في النظام الآلي العادي، سيكون لدينا مجموعة من المفاصل هنا التي من شأنها أن تكون مباشرة الاستجابة إلى أوامر الموقف. وانهم لن يهتموا بالضرورة لو كانت تتحرك من خلال الهواء الطلق، أو إذا كانوا يتحركون من خلال بلدي القفص الصدري. 

حسنا. وعادة، إذا كنتم هنا مع النظام الصناعي، كنت تذهب إلى أي مكان بالقرب منه. سيكون هناك الأصفر الشريط سلامة كل من حوله. هذا النظام له تصميم مختلف قليلا أن تكون أكثر ودا وأسهل للناس للتفاعل مع، في ذلك في كل مشترك، وهناك فصل الربيع. وبدلا من السيطرة على وموقف دقيق، ونحن السيطرة على كمية معينة من عزم الدوران، وكمية معينة من القوة، التي نود أن تكون على هذا الربيع. كل الحق، لذلك اسمحوا لي اتخاذ متطوعينا هنا. مرحبا ما أسمك؟ 

الحضور: لويس. 

رئيس مجلس النواب: لويس. من الجميل أن أراك. و؟ 

الحضور: ديفيد. 

المتحدث: ديفيد. تشرفت بمقابلتك. إذا كنت اللاعبين ستنتظر هنا لثانية واحدة، انا ذاهب الى ان نعطيكم فرصة للقيام بذلك. لذلك هذا الروبوت، إذا كنت الخروج وإذا كنت دفع بلطف على ذلك، وأنت تسير أن نرى أن وهو يتحرك قليلا. وإذا كنت انتزاع ذلك الحق هنا على المعصم فقط أعلاه حيث تلك الأزرار هي، فإنه يبدو أنك يجب أن الاستيلاء على أزرار، لكن انتزاع الحق فوقه بدلا من ذلك، عليك تكون قادرة على التعامل برفق جدا عبر الفضاء. لويس، وتريد أن محاولة إعطائها؟ حتى تعطيه قليلا دفع لتبدأ. ثم إذا وضعت أصابعك هناك حق والتمسك به، لأنها سوف تتحرك بالنسبة لك، ثم. كل الحق، وتريد أن محاولة إعطائها؟ تأتي على ما يصل. حتى تعطيه مجرد طيف دفع هناك للبدء. يمكنك أن تشعر ما هو عليه. ثم إذا كنت انتزاع ذلك الحق هناك، عليك أن تكون قادرا على المناورة في جميع أنحاء. 

حسنا. لذلك عادة ما يكون هذا النوع من الروبوت سيكون استخدامها في التصنيع على نطاق صغير. وانا ذاهب الى تحريك هذه الذراع فقط أسفل للخروج من الطريق قليلا هنا. ولكن اليوم، ونحن في طريقنا إلى استخدام نفس نظام اللعب تيك تاك تو على أساس أصغر القيم العظمى التي بنيت في وقت سابق من نحن. موافق؟ لذلك، يا رفاق هم كل الذهاب للعب لعبة. لويس، وأنت تسير أن يكون أولا. اسمحوا لي أن تصمد هنا لفترة ثانية. أنا ذاهب ليكون لك الوقوف الصحيح هنا، فقط حتى يستطيع كل شخص أن أراك. يتم تعيين يا رفاق هنا؟ 

ROBOT: مرحبا بكم. دعونا لعب تيك تاك تو. لا فهم رمزك قبل أنا أقول أنه هو دورك. أبدأ اللعبة. إنه دوري. المتحدث: الآن، إذا كنت يمكن أن تتخذ واحدا من القطع والمضي قدما ووضعه. ROBOT: إنه دورك. [ضحك] إنه دوري. [ضحك] [ضحك] إنه دورك. المتحدث: إن الجنس البشري نعتمد عليكم هنا، لويس. 

ROBOT: هو دوري. 

المتحدث: حتى باكستر منعت بنجاح هنا. 

ROBOT: إنه دورك. إنه دوري. إنه دورك. إنه دوري. رئيس مجلس النواب: ونحن سوف تتيح باكستر الانتهاء من الخطوة الأخيرة لها هنا. 

[ضحك] 

ROBOT: وهذا التعادل. وسوف يفوز في المرة القادمة. 

[ضحك] 

المتحدث: كل الحق، شكرا جزيلا، لويس. شكرا. يمكنك السير في هذا الطريق. 

ROBOT: I بدء اللعبة. رئيس مجلس النواب: لذلك اسمحوا لي أن أشرح لك واحد أكثر قليلا قليلا قبل أن نصل مباراة العودة لدينا هنا. بالضبط ما الذي يحدث؟ وبالتالي فإن الروبوت لديه كاميرا تصل أعلى هنا. وانها تبحث في أسفل اللوحة. وانها رؤية ما إذا كان انها حصلت على O حمراء أو زرقاء وX. الأبيض وتلك الحصول على وضعها على مجلس، وهذا في الأساس نفس المدخلات أننا سوف قراءة في من هيكل البيانات المتوفرة لدينا من الشاشة لدينا. انها تعمل نفس خوارزمية أصغر القيم العظمى ليكون قادرة على العثور على مكان ل وضع عربون جيد. 

ومن ثم نقوم بإعطاء الأوامر حول حيث نود عربون إلى أن توضع. ذراع يتحرك بها. انها تستخدم القابض فراغ لتطبيق بعض الشفط لتلك القطعة الخشبية، يستلم، نقله إلى الحق بقعة، ثم حرر شفط وأسقطه. كل الحق، ونحن في طريقنا لتعطيه أكثر واحد طلقة مع لاعب أذكى قليلا هنا. هل انت مستعد؟ كل الحق، وإذا كنت تقف وصولا هنا وإعطاء a-- تتحول بهذه الطريقة حتى تتمكن من رؤية الجميع. ثم (غير مسموع). 

ROBOT: هو دوري. 

المتحدث: سيبدأ باكستر. إنه دورك. إنه دوري. إنه دورك. إنه دوري. 

[ضحك] 

المتحدث: [يهمس] فقط السماح له المضي قدما والفوز بها. ROBOT: إنه دورك. رئيس مجلس النواب: وهذا موافق. 

ROBOT: هو دوري. 

[ضحك] 

أنا أفوز. 

[ضحك] 

أبدأ اللعبة. 

المتحدث: حسنا، شكرا جزيلا لك. كل الحق، وأعتقد أن لدينا الوقت ل أحد أكثر لاعب ممتاز تيك تاك تو، شخص يمكن وضع هذا الشيء ل مباراة، من يدري ما يفعلونه. 

[ضحك] 

الذي يحدث أن تكون بطل لدينا هنا؟ كل الحق، أصدقائك تطوع لك. هذا امر جيد بما فيه الكفاية بالنسبة لي. قل لي اسمك مرة أخرى. الحضور: تامير. المتحدث: تمير، من الجميل أن نرى لك. كل الحق، مرة أخرى، ونحن في طريقنا لوضع لكم الحق هنا حتى يمكن للجميع أراك. أنت ممثلنا في هذه المباراة الآن. باكستر هي واحدة ويا ويا. أو آسف، يا واحد واحد. والامر متروك لكم هنا. سوف باكستر الحصول على التحرك أولا، وإن كان. هكذا. ROBOT: هو دوري. 

[ضحك] 

إنه دورك. إنه دوري. إنه دورك. إنه دوري. إنه دورك. 

[ضحك] ROBOT: هو دوري. المتحدث: انها اصعب كثيرا عندما كنت واقفا هنا، والناس. [ضحك] ROBOT: أنت إنسان من السهل جدا للفوز. [ضحك وتصفيق] المتحدث: شكرا جزيلا. ROBOT: فزت. أبدأ اللعبة. 

المتحدث: كل الحق، وذلك بفضل جدا الكثير لأوليفييه، واليساندرو، وتشن مينغ. 

[تصفيق] 

أريد أن أوضح نقطة أخيرة. حتى باكستر في غاية تنتهي عند هذا الحد، للغش. وكان ذلك غير متوقع. واحدة من رائعة أشياء عن منظمة العفو الدولية هي أننا قيام بعمل في منظمة العفو الدولية حتى نتمكن من بناء مثيرة للاهتمام حقا وذكية الأجهزة. ولكن علينا أيضا القيام بأعمال في منظمة العفو الدولية لأنه يقول لنا شيئا حول كيفية البشر أذكياء. 

واحدة من المفضلة دراسات من مختبري ل النظر في ما يحدث عندما آلات الغش بشكل غير متوقع. فعلنا هذا في الأصل ليس مع باكستر لعب تيك تاك تو، ولكن مع الروبوت أصغر يدعى ناو، الذي لعب الصخرة ورقة مقص. وأحيانا بعد لعب الكثير والكثير من حفر الصخر الورق مقص الألعاب، فإن الروبوت رمي ​​لفتة، تفقد، ثم تغير فجأة لفتة ولها يقول: فزت. 

[ضحك] 

الآن، وأحيانا كنا أيضا الروبوت، تماما كما تحكم، ورمي لفتة، الفوز، وتغيير لفتة لها أن يخسر، ورمي المباراة، الغش من أجل أن يخسر. وهذا ليس ما يقرب مقنعة كما. الروبوت تغش من أجل كسب تأييد الناس الرد على كما لو أنها إلى الحصول عليها، مثل ذلك تسعى بنشاط تدميرها. 

[ضحك] 

يصبح وكيلا. هو مثل شخص. كان لديه اعتقاد ونية. وانها ليست حسن النية. والروبوت الذي يلقي اللعبة هو مجرد خلل. انها مجرد جهاز كسر. اسمحوا لي أن تظهر لك بضعة أمثلة لذلك من عدد قليل من المشاركين لدينا. حتى هنا الغش من أجل أن يخسر. 

[تشغيل الفيديو] - [غير مسموع] الفوز. دعنا نلعب. 

-انتظر ماذا؟ 

- [غير مسموع] الفوز. دعنا نلعب. 

[غير مسموع] الفوز. دعنا نلعب. 

رئيس مجلس النواب: وهنا الغش للفوز. 

، نعم، أنا الفوز. دعنا نلعب. 

-ليس لا تستطيع أن تفعل ذلك. 

[ضحك] 

، نعم، أنا الفوز. -ليس للغش. هل خدع الآن. 

، نعم، أنا الفوز. 

-Hey، أنت الغشاش. كنت الغش، الغش عظمى. 

[END قراءة] 

المتحدث: هذه مختلفة ردود الفعل بسرعة تغيير مفهومنا للجهاز. هل يعني ذلك أن نحن نبني عمدا الآلات التي الغش لأن هذا هو أفضل الهندسية التي يمكننا القيام به؟ لا، ولكنها لا تخبرنا شيئا مثيرة للاهتمام حقا عن الناس. هذا الشيء الذي كنت تغش و يسرق نصركم، وهذا شيء أن يكون على قيد الحياة، وهذا هو تحريك، ان هذا الامر خارج لتحصل. لديه الحالة النفسية. كان لديه الاعتقاد. لديها النية. 

هذا الشيء الذي يسلم لل لعبة لكم، هذا ليس. هذا مجرد خلل. هذا هو في نواح كثيرة السبب في أنه من من السهل رمي اللعبة مع الاطفال. ولكن إذا كنت في محاولة لخداع لهم ونوع من ادعاء النصر عندما، كما تعلمون، لمجرد تقصير لعبة، وأنها سوف يمسك لك على الفور. هذه الأنواع من الآثار التي نراه يخرج من منظمة العفو الدولية، يعلمون لنا الكثير عن أنفسنا. 

كل الحق، وهذا كل شيء لهذا اليوم. شكرا جزيلا لديفيد و فريق الإنتاج هارفارد لنازلة. 

[تصفيق] 

سنرى لكم لمسابقة واحدة، ثم لمحاضرة أخيرة. أتمنى لك يوماً عظيماً. 

[تصفيق] 

[عزف الموسيقى] DAVID J مالان: حسنا، نحن ربما تحتاج لإدخال بعض النوع من التشفير، الصحيح؟ ثم لأن رؤوس وهذه الطلبات HTTP يكون سارعت بحيث يمكن لأي شخص يحاول شم حركة المرور الخاصة بك لن يكون في الواقع قادرا على رؤيتها. إذن ما هو الحل لهذه المشكلة؟ حسنا، نحتاج إلى التعريف فعلا التشفير في الصيغة، بحيث إذا كان ذلك الشخص هو نقل البيانات من A إلى B، نستطيع send-- آمن 

[ضحك] 

المعلومات الواردة في هذه الطريقة أن العدو لا يمكن، في الواقع، نرى ذلك.