[عزف الموسيقى] DAVID مالان: هذا هو CS50. هذا هو نهاية الأسبوع 10. والصبي، هل لدينا فئة جيدة بالنسبة لك اليوم. نحن سعداء جدا لدعوة اثنين من اصدقائنا من جامعة ييل تصل إلينا اليوم وللنظر في تقاطع الذكاء الاصطناعي والروبوتات، معالجة اللغة الطبيعية، وأكثر من ذلك. وبالفعل، على مدى خلال الأسابيع القليلة الماضية، لدينا بالتأكيد قضيت الكثير من الوقت، خاصة في psets في وقت سابق، مع التركيز على تفاصيل جدا على مستوى منخفض. وأنه من السهل جدا أن نغفل من الغابة للأشجار والحصول على التعلق على الحلقات والشروط والمؤشرات، وبالتأكيد، وما شابه ذلك. ولكن الواقع هو أن يكون لك اللاعبين الآن المكونات التي يمكنك حقا حل بعض المشاكل مثيرة للاهتمام، بين منها تلك التي أصدقائنا في جامعة ييل العمل على مقتربا من كامبردج. لذلك اسمحوا لي أولا أن أعرض رؤوسنا تدريس مساعد من جامعة ييل، أندي. [تصفيق] ANDY: أولا وقبل كل شيء، أشكر فقط لك لإتاحة الفرصة لYalies زوجين لموسيقى البوب ​​وصولا الى كامبريدج اليوم. نحن نقدر ذلك حقا. ثانيا، لدينا أصدقاء home-- العودة جيسون، شكرا لبقاء وتشغيل المحاضرة. آمل أن كل شيء جيد في نيو هافن. لذلك نعم، أنا متحمس السوبر لإدخال Scaz اليوم. Scaz يدير مختبر الروبوتات. انه أستاذ، مثل، خمسة أقسام مختلفة في جامعة ييل. في مختبره، لديه الكثير والكثير الروبوتات أنه يحب أن تلعب معه. لديه، مثل، أروع وظيفة في العالم. وقال انه يحصل على نوع من الفوضى حولها مع أن كل يوم منذ فترة طويلة والقيام ببعض الأعمال، كذلك. وهكذا جئنا في الواقع واحدة من عليهم معنا اليوم. ذلك دون مزيد من اللغط، هو Scaz الذهاب الى المضي قدما ويعرض لنا لصديقه الروبوت. [تصفيق] BRIAN SCASSELLATI: شكرا، ديفيد. شكرا، أندي. انه شيء رائع جدا أن تكون هنا مع الجميع اليوم. أريد أن أكون أول الواضح جدا أن الموظفين CS50 هنا في كامبريدج وقد مضياف لا يصدق بالنسبة لنا. نحن ممتنون جدا لكل شيء فعلوه لدعم لنا. وهكذا نود أن تكون قادرة للعودة اللطف. حتى اليوم، ونصل الى اعلان أننا ذاهبون لدينا الجديد، واحد من نوعها الحدث CS50 يحدث في نيو هيفن الاسبوع المقبل. وهذا هو المعرض البحوث CS50. لذلك نحن في طريقنا إلى دعوة everyone-- CS50 الطلاب، الموظفين من كلا هارفارد وYale-- ل ينزل وزيارة معنا يوم الجمعة. سيكون لدينا تشكيلة واسعة من أكثر من 30 أشخاص مختلفين تقديم وأوبيركلاسمين exhibiting-- تظهر من بعض من منتجات أبحاثهم. سيكون لدينا بعض الشركات الناشئة، وحتى، وتبحث لقليلا من التكنولوجيا الجديدة المواهب، الشركات الناشئة من كل من جامعة هارفارد وييل. وسيكون لدينا بعض الجماعات الطلابية تبحث عن بعض عضوية جديدة. انها سوف يكون وقتا مثيرا للغاية. نأمل أولئك منكم الذين هم نازلة لعبة هارفارد ييل سوف تكون قادرة على وقف عن طريق قليلا في وقت مبكر، الحق في وسط الحرم الجامعي، المكتبة التذكارية الاسترليني. ونحن في طريقنا لدينا مجموعة من المعروضات التي تتراوح من الحكم الذاتي المراكب الشراعية إلى طرق لاستخدام البرمجيات للحفاظ على المخطوطات في العصور الوسطى. ونحن في طريقنا لديك إعلان الشبكات المخصصة والناس تعليم برنامج الترميز في كيب تاون. سيكون لدينا كمبيوتر مظاهرات الموسيقى. وسيكون لدينا بالطبع المزيد من الروبوتات. لذلك نحن نأمل عليك الانضمام إلينا لهذا الحدث. يجب أن يكون هناك الكثير من متعة، وقليلا من الطعام، والكثير من اهتمام أشياء للحديث عن. حتى اليوم، ونحن في طريقنا للحديث حول معالجة اللغة الطبيعية. وهذه هي المحاولة بالنسبة لنا لبناء طريقة جديدة للتفاعل مع أجهزتنا ل خلال الأسابيع القليلة الماضية، كنت قد ركزت على كيف أن يمكنك كتابة التعليمات البرمجية، كتابة البرامج هذا هو وسيلة لتكون قادرة على القول ل آلة، وهذا هو ما أريد منك أن تفعل. ولكن لا ينبغي لنا أن تحتاج إلى نتوقع أن كل شيء هذا الى ان هناك انها تستخدم من قبل الجميع في العالم سوف يكون بارعا في هذا النوع من التعليم. لذلك علينا أن نميز بين الكمبيوتر اللغات وlanguages-- الطبيعية وهذا هو، والأشياء التي بشر استخدام للتواصل مع غيره من البشر. ونحن نحاول بناء الواجهات التي تستخدم هذه الآليات الاتصالات الطبيعية. الآن، تماما مثل كل موضوع آخر أننا قد بدأت مع في CS50، ونحن في طريقنا للبدء مع أبسط قليلا من معالجة اللغة الطبيعية يمكننا أن نتصور. ونحن في طريقنا للبدء مع الجزء التاريخي من اللغة الطبيعية. وبعد ذلك سنقوم بناء ما يصل الى المزيد والمزيد من أنظمة الأخيرة وبعض العروض الترفيهية على طول الطريق. لذلك نحن في طريقنا للبدء مع ما كان ربما أول اللغة الطبيعية نظام المعالجة. وكان هذا النظام البرامج المكتوبة في 1966 جوزيف Weizenbaum دعا ELIZA. وصمم ELIZA ل تكرار هذا النوع من التفاعل عملتم مع معالج نفسي روجرز. الآن، وRogerians، كان لديهم فكرة العلاج النفسي تشارك التمكن من العودة مرآة لمريض والتحدث معهم، في الأساس، من خلال منحهم فقط قليلا صغير جدا من المعالج. وهذا هو، كل شيء وقال الطبيب المعالج كان من المفترض أن يكون مجرد انعكاس ل ما كان المريض يقولون لهم. لذلك دعونا نحاول والتجريبي هذا. هل لدينا المتطوعين الذين تريد ان تكون على استعداد لتقاسم أعمق بهم، أحلك، و / أو أسرار وهمية مع ELIZA؟ بالتأكيد، لماذا لا تأتون على ما يصل. رائع. وإسمك؟ MILES: مايلز. BRIAN SCASSELLATI: مايلز. لطيف لمقابلتك، مايلز. إذا كنت التمسك ذلك. ونحن في طريقنا ل استخدام إصدار ELIZA بعد أن قمنا تكرارها داخل IDE CS50. وسوف نبحث في المصدر رمز لهذا في بعض الوقت. ولكن لفي الوقت الراهن، نحن فقط الذهاب إلى الاحتجاج عن طريق كتابة إليزا. وELIZA هو ذاهب الى ان نعطيكم الردود التي ستكون في كل العواصم. وسوف أطرح عليك بعض الأسئلة. وسوف نرد واكتب في الردود على ELIZA. لذلك فقد قال ELIZA، "مرحبا، أنا ELIZA. ما مشكلتك؟" ما تريد أن أقول ELIZA عن اليوم؟ MILES: I يمكن أن تقع إلا نائما إذا كان لدي النعال الارنب جرا. BRIAN SCASSELLATI: حسنا. حسنا. [ضحك] "أنا يمكن أن تقع إلا نائما مع النعال الارنب على ". ويقول ELIZA، "قل هل لديك أي مشاكل نفسية؟ ربما هذا يعد مؤشرا جيدا ". حسنا. فما تريد أن ترد على ذلك؟ MILES: نعم. BRIAN SCASSELLATI: نعم. رجل الكثير من الكلمات. انا استمتع بذلك. تقول إليزا "، يبدو أنك إيجابي للغاية." MILES: لا، أنا، في الواقع، إلكترون. BRIAN SCASSELLATI: "رقم في الواقع، أنا إلكترون ". "هل اتيت الى لأنك الإلكترون؟ " الآن، يمكننا أن نرى بعض وthings-- سأشارك وقفة لكم لثانية فقط، مايلز. لا تذهب إلى أي مكان. نحن لم تفعل معك حتى الان. ELIZA هو، في بعض النواحي، ردا على بعض الأمور أن يقوله ولكن من دون أي فهم حقيقي. وانها ترديد أيضا استعادة بعض من أجزاء من عقوبته. لذلك قلنا، "رقم في الواقع، أنا إلكترون ". رد إليزا الوراء، "هل جئت بالنسبة لي لأنك الإلكترون؟ " حسنا. دعونا إعطائها واحد أكثر استجابة هنا. تعطيه فكرة جيدة، مايلز. ميل: واحد جيد؟ نعم، الرجاء مساعدتي. BRIAN SCASSELLATI: "نعم. الرجاء مساعدتي "." هل أنت متأكد؟ " MILES: رقم BRIAN SCASSELLATI: رقم "ماذا توحي لك؟" MILES: قد لا أكون إلكترون. BRIAN SCASSELLATI: "I قد لا يكون إلكترون ". "أنت تقول لا لمجرد أن يكون سلبيا؟" حسنا. لذلك مايلز، شكرا جزيلا لك. MILES: شكرا لك. BRIAN SCASSELLATI: شكرا جزيلا. [تصفيق] لذلك هذا البرنامج ELIZA، بطرق عديدة، يستجيب فقط لالقطع اننا توفير بدون أي عمق فهم ما يحدث هنا. هذا هو نوع من النظام دعا مطابقة النقش، حيث نحن نبحث عن بعض أجزاء من النص الذي نحن ثم الذهاب لإخراج ما وقدمت كمدخل، تحويله، يحتمل أن تكون، في بعض الطريق، ثم يعيدها إلى المستخدم. هل أي من كنت تعتقد أن ELIZA هو في الواقع أداء التحليل النفسي صحيح هنا؟ شخص واحد، ربما. الحضور: (غير مسموع). BRIAN SCASSELLATI: وكيف يمكن أن تجعلك تشعر؟ نعم، في الواقع، فإنه لا. ونحن في طريقنا لنرى، في الواقع، و الكود لأنه في لحظة فقط. وهكذا كنت تريد الذهاب ليكون قادرة على القيام بذلك تماما. الآن، ELIZA هو أحد أشكال ما يمكن أن نسميه اليوم بوت الدردشة. وغني فقط من خلال النص الذي كنت توفير، يوفر الحد الأدنى من المبلغ عارية تفاهم أو التجهيز، ثم الببغاوات مرة أخرى لك. لذلك دعونا نلقي نظرة، من الناحية النظرية، والحديث عن ما هو أن ELIZA تقوم به فعلا. تتخذ ELIZA السماح sentence-- ل يقول: "أريد أن إقناع مدرب بلدي." وELIZA تبحث من خلال تلك الجملة وتحاول أن تجد و تطابق أنماط معينة. لذلك، على سبيل المثال، واحدة من أنماط أن ELIZA تبحث عن هي الكلمات "انا اريد." وأي وقت يرى شيئا الذي لديه "أريد" في ذلك، يصوغ استجابة. وهذا الرد هو سلسلة ثابتة. في هذه الحالة، هو "ماذا تريد؟" وأضع القليل من النجوم في نهاية لأن ذلك مجرد بداية ردنا. وتشير النجم الذي ونحن في طريقنا لاتخاذ بقية من utterance-- المستخدم "لإقناع مدرب بلدي" - ونحن في طريقنا إلى إلحاق ذلك إلى نهاية هذه السلسلة. وحتى الآن، بدلا من القول، "لماذا هل تريد إقناع مدرب بلدي " هناك قليلا من إضافية تجهيز أننا سوف نفعل. وهذا هو، سيكون لدينا ل تحويل بعض الضمائر هنا من "مدرب بلدي" إلى "رئيسك". وربما يكون هناك عدد قليل آخر التغييرات التي نحن بحاجة لجعل. وذلك بدلا من مجرد الشائكة مباشرة على النهاية، ما سنقوم به وسوف نأخذ بقية utterance-- المستخدم في here-- الأبيض ونحن سوف أعتبر قطعة واحدة في وقت وتحويل كل سلسلة رمز، كل كلمة، في الجملة. ولذا فإننا سوف تأخذ كلمة "ل". لا يوجد تحويل أننا بحاجة للقيام بذلك. "اعجاب." لا يوجد تحويل يتعين علينا القيام به هناك. "بلدي" سوف تتحول الى "بك". و "بوس" سنترك تماما كما "بوس". ثم أخيرا، أي شيء أن ينتهي بنقطة، سنقوم تحويله إلى سؤال. هذا مطابقة نمط بسيط جدا هو في الواقع ناجحة تماما. وعندما قدم هذا في 1966-- جوزيف Weizenbaum برمجة هذا على جهاز كمبيوتر. الآن، وأجهزة الكمبيوتر في ذلك الوقت لم تكن نماذج سطح المكتب. تم تقاسمها الموارد. وسوف طلابه اذهب وتحدث مع ELIZA. في نهاية المطاف، وقال انه كان ل تقييد الوصول إليها لطلابه لم تكن الحصول على أي عمل. كانت الدردشة فقط مع ELIZA. و، في الواقع، كان عليه أن اطلاق النار مساعديه، الذين قضى كل وقتها في الحديث مع ELIZA عنها مشاكل عميقة ومثيرة للقلق. كل شخص يستخدم هذه الأنظمة بدأت anthropomorphize لهم. بدأوا نفكر بها يجري الأرواح وأناس حقيقيين. بدأوا في التعرف على بعض من الأشياء التي كانوا يقولونه ويعود لهم. وكانت معرفة أشياء عن أنفسهم. و، في الواقع، حتى الخبراء، حتى الأطباء النفسيون، بدأت تقلق أنه، في الواقع، ربما ELIZA سيكون استبدالها. وحتى الكمبيوتر يخشى العلماء أن كنا على مقربة من حل اللغة الطبيعية. الآن، وهذا لم يكن في أي مكان قريب إلى true. ولكن هذه هي الطريقة للإعجاب يمكن أن يبدو هذه الأنظمة. لذلك دعونا نبدأ للنظر تحت ومحاولة للحصول على القليل من سؤال من حيث هذا الرمز يحدث في الواقع. لذلك نحن سوف تجعل هذا الرمز متوفرة بعد ذلك. وهذا هو غاية ميناء بسيط ومباشر تنفيذ ELIZA الأصلي. وحتى بعض من هذه الأسلوبية الأشياء التي سترى هنا لا أسلوبيا ما كنا نريد منك أن تفعل أو ما كنا تدريس لك أن تفعل. ولكن حاولنا الاحتفاظ بها نفسه عبر العديد من الموانئ أن هذا تمت زيارتها بحيث لديه نكهة الأصلي. لذلك نحن ذاهبون لتشمل مجموعة من الأشياء، ومن ثم سيكون لدينا مجموعة من الكلمات الرئيسية، أشياء أن ELIZA لن تعترف والرد على مباشرة. حتى إذا كان لديك كلمات مثل "يمكنك" أو "لا" أو "لا" أو "نعم" أو "الحلم" أو "مرحبا"، ثم ELIZA سترد بشكل انتقائي لهؤلاء. سيكون لدينا أيضا عدد معين من الأشياء هذا وسوف نقوم مبادلة، مثل تحويل "بي" إلى "الخاص". ومن ثم سيكون لدينا مجموعة من الردود أن لكل من هذه الكلمات، سنقوم من خلال تدوير هذه الاستجابات المختلفة. لذلك إذا قلت "نعم" ثلاث مرات على التوالي، I قد تحصل على ثلاثة مختلفة ردود من ELIZA. رمز لنا، إذن، هو في الواقع بسيط بشكل ملحوظ. إذا كنت انتقل لأسفل الماضي كل هذه ردود أننا قد برمجت في ونصل الى هدفنا الرئيسي، ونحن في طريقنا إلى تهيئة اثنين من المتغيرات المختلفة وتفعل قليلا من التدبير المنزلي في البداية. ولكن بعد ذلك هناك على الاطلاق مجموعة من التعليمات البرمجية التي تتمكن من فهم. واحد حلقة في حين الكبيرة التي يقول أنا الذهاب لتكرار هذا مرارا وتكرارا. سأقرأ في خط، وسوف أكون تخزين أنه في سلسلة الإدخال. سوف تحقق ومعرفة ما اذا كان ل الكلمة الخاصة "وداعا"، والتي يعني الخروج من البرنامج. وبعد ذلك سوف تحقق ومعرفة ما إذا كان شخص ما هو مجرد تكرار أنفسهم مرارا و تكرارا. وسوف تصيح عليهم إذا لم يفعلوا. أنا أقول "لا تكرر نفسك." طالما أيا من تلك يحدث، وسوف نقوم ثم مسح من خلال وحلقة من خلال، على خطوط 308-313 هنا، وفحص ومعرفة هي أي من تلك الكلمة العبارات الواردة في المدخلات ان كنت للتو؟ إذا كان هناك تطابق بالنسبة لهم، وأيضا ثم، سوف نتذكر هذا الموقع. سوف نتذكر هذه الكلمة. وسوف تكون قادرة على بناء استجابة. إذا كنت لا تجد واحد، بالاضافة الى ذلك الحين، آخر شيء في مجموعة كلماتي الرئيسية سوف تكون ردود الافتراضي الخاص بي، عندما لا يتطابق آخر. سأسأل أسئلة مثل "لماذا فعلت لك يأتون إلى هنا؟ "أو" كيف يمكنني مساعدتك؟ " التي تتناسب بشكل جزئي فقط بغض النظر عن ما هو الإدخال. سنقوم بعد ذلك بناء استجابة إليزا. ونحن سوف يكون قادرا على اتخاذ هذا الرد القاعدة، تماما كما فعلنا في ذلك "مدرب بلدي" مثلا. إذا كان هذا هو كل ما هناك is-- لو كان مجرد واحد سلسلة أنا من المفترض أن respond-- يمكنني فقط إرسالها مرة أخرى للخروج. إذا كان لديه علامة النجمة في نهاية لها، ثم سوف أكون أنا معالجة كل رمز فردي في بقية استجابة المستخدم وإضافة تلك الموجودة في مبادلة خارج كلمة كلمة وأنا في حاجة إليها. كل هذا على الاطلاق وهو الأمر الذي يمكن أن نبني. وفي الواقع، فإن الطرق التي نحن لدينا معالجتها وسائط سطر الأوامر، الطريقة التي لديك معالجتها من خلال طلبات HTTP اتبع نفس النوع من القواعد. انهم نمط مطابقة. لذلك كان ELIZA على أهمية نسبيا تأثير على اللغة الطبيعية لأنه جعل الأمر يبدو وكأنه كان هدف يمكن تحقيقه للغاية، مثل بطريقة ما نرغب تكون قادرة على حل هذه المشكلة مباشرة. الآن، وهذا لا يعني أن لا ELIZA كل ما كنا نريد القيام به. بالتاكيد لا. ولكن ينبغي أن نكون قادرين أن تفعل شيئا أكثر من ذلك. الخطوة الأولى بالنسبة لنا للذهاب ما وراء ELIZA يجري لتكون قادرة على النظر في لا النصوص التي يتم إدخالها في لوحة المفاتيح ولكن الكلام والفعلية سجلت خطاب عبر مكبر صوت. حتى ونحن ننظر إلى هذه قطع مختلفة، ونحن ستكون لدينا لبناء مجموعة من النماذج. ونحن في طريقنا لدينا لتكون قادرة للانتقال من المتكلمين على مستوى منخفض الملعب information--، السعة، frequency-- وتحويل ذلك إلى بعض الوحدات التي نحن قادرة على التعامل بسهولة أكبر وأخيرا، التلاعب بها في الكلمات والجمل. لذلك معظم التعرف على الكلام أنظمة الموجودة هناك اليوم اتباع الإحصائية نموذج الذي نبني ثلاثة تماثيل منفصلة ما يحتوي هذا إشارة الصوت في الواقع. نبدأ مع نموذج لفظي التي تتحدث عن مجرد قاعدة يبدو أنني المنتجة. أنا إنتاج شيء وB كما هو الحال في صبي أو D كما هو الحال في الكلب؟ كيف يمكنني التعرف على هذين مختلفة هواتف، منفصلة ومتميزة؟ وعلاوة على ذلك، وسوف نقوم بعد ذلك بناء نموذج نطق الكلمة، شيء يربط معا تلك الهواتف الفردية ويجمع بينهما في كلمة واحدة. وبعد ذلك، سوف نأخذ الكلمات وسنقوم تجميعها مع لغة نموذج في جملة كاملة. الآن، ونحن في طريقنا للحديث عن كل هذه بشكل مستقل ومنفصل. ولكن هذه النماذج الثلاثة كلها فقط ستكون الإحصاءات. وهذا يعني أننا عندما العمل معهم، وسوف نقوم تكون قادرة على العمل مع كل منهم في وقت واحد. حسنا. دعونا نبدأ مع نموذج لفظي لدينا. من النماذج الصوتية تعتمد على تقنية حسابية دعا نماذج ماركوف المخفية. هذه هي النماذج الرسومية التي I لديهم والتعرف على حالة العالم كما توصف من خلال مجموعة من الميزات. وتوضح أن الدولة جزء واحد من إجراء أنني شاركت في. حتى لو كنت تفكر في اتخاذ و"أماه" سليمة مثل الأم، هناك مختلفة المكونات لهذا الصوت. هناك جزء حيث أود أن ألفت في التنفس. وبعد ذلك محفظة شفتي. وأنا لفة شفتي الوراء قليلا بت لجعل هذا الصوت "أماه". ثم هناك بيان. شفتي تأتي على حدة. وطرد الهواء. "ما". ان هؤلاء الثلاثة أجزاء مختلفة يكون ممثلة الدول في هذا graph-- بداية، وسط، ونهاية. وأود أن التحولات التي سمح لي للسفر من دولة واحدة إلى أخرى مع وجود احتمال معين. لذلك، على سبيل المثال، أن M قد يكون لديك جدا سليمة، تناول قصير جدا في beginning-- "مم" - وبعد ذلك أطول، المرحلة اهتزازي حيث أنا أحبس الشفتين معا وhumming-- تقريبا "ش ش ش ش" - وبعد فترة قصيرة جدا الانفجاري حيث كنت طرد breath-- "أماه". في نموذج ماركوف المخفية صمم للقبض على حقيقة أن الطريقة التي أقوم هذا الصوت "أماه" يسير أن تكون مختلفة قليلا في توقيته، هو التردد، ومعالمه من الطريقة التي تجعل من أو الطريقة التي أنا قد جعله عندما أتحدث حول الاستخدامات المختلفة للحرف. "الأم" و "اسمحوا لي" سوف يبدو بشكل مختلف قليلا. حتى الاعتراف صوت معين، فإننا بناء نماذج ماركوف، هذه ماركوف المخفية نماذج من كل هاتف الممكن أن I قد ترغب في الاعتراف، كل صوت ممكن، وبعد ذلك ننظر في البيانات الصوتية التي لدي وتحديد إحصائيا واحد الذي هو على الارجح واحدة أنتجت هذا الصوت. حسنا. مع هذا النموذج، ونحن بعد ذلك البدء في بناء على أعلى من ذلك. نأخذ نموذجا النطق. الآن، وأحيانا النطق نماذج بسيطة وسهلة لأن هناك واحد فقط طريقة لنطق شيء. مرة أخرى، وانهم ل قليلا أكثر تعقيدا. وهنا دليل النطق لهذا الشيء الأحمر الذي هو الفاكهة التي تجريها الكاتشب من. الناس لا يعتقدون انها الفاكهة. الصحيح؟ الآن، هناك العديد من الطرق المختلفة أن الناس سوف نطق هذه الكلمة. سوف يقول البعض "إصبع مايو أخمص قدميه." سوف يقول البعض "إصبع القدم ماه أخمص قدميه." ويمكننا التقاط أنه مع واحدة من هذه النماذج الرسومية حيث، مرة أخرى، أننا نمثل التحولات وجود احتمال معين ويرتبط احتمال معهم. حتى في هذه الحالة، إذا كان لي أن اتبع الطريق أعلى من خلال هذا الرسم البياني بأكمله، وأود أن يكون ابتداء من الساعة الرسالة في أقصى اليسار، و "تا" سليمة. وأود أن أنتهز النصف العلوي، و"أوه،" وبعد ذلك "أماه" ثم "أ"، وبعد ذلك "تا"، و "يا". "تو-مايو أخمص قدميه." إذا أخذت المسار السفلي من خلال هذا، وسوف تحصل على "تا-ماه أخمص قدميه." وإذا ذهبت إلى أسفل ثم يصل، وأود أن الحصول على "تا-مايو أخمص قدميه." هذه النماذج التقاط هذه الخلافات لأنه كلما ننشر واحدة من هذه أنظمة التعرف، انها ستكون لدينا للعمل مع الكثير من أنواع مختلفة من الناس، الكثير من لهجات مختلفة، وحتى الاستخدامات المختلفة للنفس الكلمات. وأخيرا، وعلى رأس ذلك، سوف نبني شيئا التي تبدو معقدة حقا، دعا نموذج اللغة، ولكن في الواقع هو أبسط من الثلاثة لأن هذه تعمل على ما يسمى نماذج ن غرام. وفي هذه الحالة، أنا يظهر لك على جزئين نموذج ن غرام، وهو bigram. ونحن في طريقنا لجعل المادية فكرة أنه في بعض الأحيان، بعض الكلمات من المرجح أن يتبع نظرا كلمة من غيرها. إذا قلت للتو "الطقس" الكلمة التالية المحتمل يمكن أن يكون "اليوم" أو يمكن أن يكون "الطقس توقعات غدا ". لكن من غير المحتمل أن يكون " توقعات الطقس الخرشوف ". ما نموذجا اللغة لا غير فإنه يلتقط تلك إحصائيا عن طريق عد من بعض كبير جدا الإحضار، كل من الحالات في كلمة واحدة مما يلي آخر. حتى لو كنت تأخذ corpus-- كبيرة مثل كل وول ستريت جورنال التي تم إنتاجها منذ عام 1930، التي تعد واحدة من corpuses-- القياسية وأنا أتطلع من خلال جميع هذا النص، وأنا أعول يصل عدد المرات بعد "توقعات" أرى "اليوم" وكم مرة أرى "توقعات"، يليه "الخرشوف" أول واحد هو الذهاب أن تكون أكثر احتمالا بكثير. انها سوف تظهر أكثر كثيرا. وهكذا سيكون لديك أعلى احتمال المرتبطة به. إذا كنت ترغب في معرفة احتمال وقوع الكلام كله، ثم، أنا فقط الخروج عنه. وبالتالي فإن احتمال السمع الجملة "الفئران أكلت الجبن" هو احتمال كلمة "على" بدء الجملة، ومن ثم احتمال أن كلمة "فأر" بعد كلمة "على" واحتمال أن كلمة "أكل" التالي "الفئران" واحتمال أن "الجبن" يتبع "أكل". هذا يبدو مثل الكثير من الإحصاءات، والكثير من الاحتمالات. وهذا هو ما هو عليه. ولكن الشيء المدهش هو إذا قمت بذلك مع عينة كبيرة كافية من البيانات، إنها تعمل. ويعمل بشكل جيد جدا. نحن جميعا نعرف هذه التقنيات. معظم أنظمة التشغيل تأتي مع التعرف على الصوت في هذه المرحلة. نحن نستخدم سيري وCortana وصدى. وتستند هذه الأمور على هذا النوع من ثلاث طبقات model-- نموذج الصوتي في الجزء السفلي، ل نموذج النطق في الوسط، ونموذج لغة على رأسها. الآن، ما عليك القيام به قليلا أكثر من ذلك من أجل الإجابة على الأسئلة. ولكن الاعتراف ما كنت المثل يعتمد تماما على ذلك. لذلك دعونا نأخذ مثالا على ذلك هنا. لذلك ليس لدي هاتفي يجلس هنا تحت الكاميرا وثيقة. ونحن في طريقنا ليسأل سيري على بعض الأسئلة. حسنا؟ لذلك دعونا نستيقظ هاتفي هنا. سيري، ما هو الطقس كما هو الحال في نيو هافن اليوم؟ سيري: هنا الطقس ل نيو هيفن، كونيتيكت اليوم. BRIAN SCASSELLATI: OK. أولا حتى رأيت أن سيري المعترف بها كل الكلمات الفردية ثم أنتج رد. سوف نتحدث عن كيفية هذا الرد يأتي عنها في قليلا. لكن الآن بعد أن نعرف أن هذا قائم فقط على الإحصاءات الأولية، وهذا نمط نوع مطابقة النهج، يمكننا لعب بعض المباريات مع سيري. حتى أستطيع أن حاول مرة أخرى. سيري، ما هو الطقس فرس النهر نيو هافن بولاية اليوم؟ سيري: OK. وهنا الطقس في الجديدة هافن بولاية كونيكتيكت لهذا اليوم. BRIAN SCASSELLATI: في سيري لا نغرق في ذلك لأنها وجدت pattern-- "الطقس"، "اليوم"، "نيو هافن". هذا ما انها الاستجابة ل، تماما مثل ELIZA. حسنا. دعونا نعطي واحدة أكثر من ذلك أكثر المثال مثير للسخرية. سيري، الخرشوف الطقس أرماديلو فرس النهر نيو هافن؟ سيري: اسمحوا لي أن تحقق في هذا الشأن. وهنا ما وجدته على شبكة الإنترنت ما هي الخرشوف أرماديلو فرس النهر نيو هافن. BRIAN SCASSELLATI: OK. حتى لو كنت تذهب بعيدا بما فيه الكفاية بعيدا عن هذا النموذج، أنا قادرة على إرباك لأنه لا يوجد يعد يطابق النمط الذي لديه. وأن الإحصائية محرك هذا ما يقول، ما هو احتمال أن كنت قد حصلت الكلمات فرس النهر والخرشوف معا، وأرماديلو؟ وهذا ما يجب أن يكون شيئا جديدا. وبالتالي فإن هذه التقنيات التي نستخدمها كل يوم. إذا كنا نريد أن تأخذها خطوة واحدة أبعد من ذلك، على الرغم من ذلك، إذا كنا فعلا تريد أن تكون قادرا على التحدث حول ما غير أن هذه النظم تستجيب ل، علينا أن نتحدث، مرة أخرى، عن مجموعة أكثر جوهرية من الأسئلة. وهذا موضوع في الاتصالات التي نسميها مسألة الرد على المكالمات. وهذا هو، نحن نريد أن نكون قادرين to-- نعم؟ الحضور: (غير مسموع). BRIAN SCASSELLATI: هل نحصل إلى معالجة الدلالات الكامنة؟ لذا نعم. هناك الكثير من الأشياء التي هي يحدث تحت السطح مع سيري وفي بعض الأمثلة انا ذاهب الى تبين لكم المقبل حيث هناك قدرا كبيرا من حيث الهيكل ما تقوله هذا أمر مهم. و، في الواقع، وهذا هو عظيم السلائف عن الشريحة التالية بالنسبة لي. حتى في بنفس الطريقة التي لدينا بنيت التعرف على الكلام حتى من طبقات متعددة، إذا كنا نريد ل فهم ما هو عليه وهذا في الواقع يقال، ونحن في طريقنا للمرة أخرى الاعتماد على التحليل متعدد الطبقات النص الذي يتم التعرف عليه. لذلك عندما سيري هو في الواقع قادرة على مثلا، تبدو لقد وجدت هذه الكلمات. الآن ماذا أفعل معها؟ العنصر الأول هو في كثير من الأحيان ل من خلال الذهاب ومحاولة لتحليل هيكل الحكم. وفي ما رأيناه في المدارس الابتدائية، في كثير من الأحيان، كنوع من المخططات الجمل، ونحن في طريقنا أن ندرك أن بعض كلمات لها أدوار معينة. هذه هي الأسماء. هذه هي الضمائر. هذه هي الأفعال. ونحن في طريقنا إلى الاعتراف أن لقواعد معينة، في هذه الحالة قواعد اللغة الإنجليزية، وهناك طرق صالحة التي يمكنني الجمع بينهما وطرق أخرى غير صالحة. هذا الاعتراف، بأن هيكل، قد يكون كافيا للمساعدة في توجيه لنا قليلا. ولكنها ليست كافية تماما بالنسبة لنا أن تكون قادرة على إعطاء أي معنى لما يقال هنا. للقيام بذلك، ونحن سوف تضطر إلى الاعتماد على بعض كمية من تجهيز الدلالي. وهذا هو، ونحن في طريقنا إلى أن ننظر في ما تحت كل من هذه الكلمات يحمل في الواقع بمثابة المعنى. وأبسط طريقة للقيام بذلك، ونحن في طريقنا لربط مع كل كلمة ونحن نعلم وظيفة معينة، تحول المؤكد أنه يسمح بأن يحدث. في هذه الحالة، ونحن قد تسمية كلمة "جون" باعتباره الاسم الصحيح، أنه يحمل في طياته هوية. ونحن قد وصم "مريم" كما بنفس الطريقة. في حين أن الفعل مثل "يحب" أن يشكل علاقة خاصة أننا قادرون على تمثيل. الآن، وهذا لا يعني أن نفهم ما هو الحب ولكن فقط أن نفهم في الطريق من نظام رمزي. وهذا هو، يمكننا تسمية انها والتلاعب به. مع كل هذه الأنواع من النهج، أي نوع من المعالجة الدلالي هنا سوف يتطلب قليلا قليلا من المعرفة والكثير من العمل من جانبنا. نحن لم يعد في عالم حيث الإحصاءات عادي فقط سوف تكون كافية بالنسبة لنا. الآن، من أجل الذهاب من هذه النقطة إلى كونها قادرة على الحديث عن الداخل ما يحدث في الواقع هنا، لتكون قادرة على التعامل مع هذا هيكلة وفهم سؤال ويجري بعد ذلك قادرة للخروج والبحث، يتطلب أكثر نموذج المعرفي المعقد. الطريقة التي يتم بناؤها هذه الأنظمة هو بالنسبة للجزء الاكبر للغاية، والعمل جدا مكثفة. أنها تنطوي على البشر تنفق قدرا كبيرا الوقت هيكلة الطرق وهذا النوع من العقوبات يمكن أن تكون ممثلة في بعض المنطق. فإنه يحصل ولو قليلا أكثر تعقيدا، وبالرغم من ذلك. ولو مرة واحدة لقد تناولت مع معاني الكلمات، وسوف نقوم لا تزال لديها للنظر في البراغماتية ما يقال. وهذا هو، كيف يمكنني ربط الكلمات أن لا بد لي من شيء بدنيا بها هناك في العالم أو في أقل بعض المصادر المعلومات أستطيع أن التلاعب؟ في بعض الأحيان، وهذه تؤدي إلى بت رائعة من الغموض. "ملتهب نجمة للزواج الفلكي." حسنا. الآن، نقرأ أن مثل نوع مضحك من عنوان أننا سوف نرى في وقت متأخر من الليل TV لأننا لا نفسر "نجمة" أن يكون معناها جرم سماوي. ونحن نعلم أنه يعني أكثر الممثل شائعا أو الممثلة مع كميات عالية من وضوح الرؤية. "فرقة يساعد عضة كلب الضحية". غير أن الفريق هو في الواقع هناك مساعدة كلب في الالتفاف والعض الضحايا؟ ام ان هناك الفرد الذي كان عضات الكلب الذي بحاجة إلى بعض المساعدة؟ فقط من خلال النظر في بناء الجملة ودلالات الجمل، لا يمكننا تحديد ذلك. "هليكوبتر تعمل بالطاقة عن طريق الذباب الإنسان". هناك، في الواقع، فعلي الأشياء الصغيرة التي تحلق حولها الناس مع أجنحة المحرك مروحيات من أجل خير البشرية؟ أم أن هناك جهاز ميكانيكي واحد التي تستمد قوتها من شخص؟ عندما ننظر إلى المسألة نظم الإجابة، هذه هي الطبقات التي نحن بحاجة للتعامل معها. الآن، وأفضل وأكثر الفرز من انتشارا من هذه الأنظمة اليوم قادرون على القيام الأشياء في المستوى الذي هي أبعد ما كان لدينا قبل 10 عاما. هنا واحدة من أفضل أنظمة ان هذا الامر خارج هناك اليوم. وهذا هو نظام من IBM دعا واتسون. هذا هو من أصدقائنا في IBM. هذا هو البنوك كاثرين، جيا تشن، وبريسيلا مورايس إعطائنا مظاهرة واتسون أمس في IBM يورك تاون. [تشغيل الفيديو] -كيف حالك؟ -أنا بخير. أنا سعيد دائما عندما أكون التفكير، وخصوصا عندما كنت يمكن البقاء باردة في هذه الغرف الخادم. -من هي الممثلة المفضلة لديك؟ الممثلة المفضلة -My أنجلينا جولي لارا كروفت في تومب رايدر لأن إسمها كان شكل حرف الظاهري مثلي. -كيف يمكن اتسون مساعدة المرضى؟ -هل خطة للمرضى ل الحصول على واتسون مباشرة؟ الحصول على المشورة واتسون وتختلف التطبيقات عن طريق استخدام القضية. لكن في الوقت الراهن، واتسون توفر فقط التشخيص والعلاج الممكن الخيارات لالمهنية الطبية. حيثما كان ذلك مناسبا، والمرضى قد توفر المعلومات لواتسون، وربما من خلال واجهة البوابة الإلكترونية، قرص، أو حتى الهاتف المحمول. على سبيل المثال، قد يكون المريض طلب لوصف أعراضهم في اللغة الطبيعية مباشرة في حل واتسون، يسمح الطبيب للتركيز على التشخيص وليس جمع البيانات. -من اغتيال أبراهام لنكولن؟ -جون ويلكس بوث. -في أي عام فعل أريزونا دياموندباكس الفوز في بطولة العالم؟ -2001. [END قراءة] BRIAN SCASSELLATI: حتى هذه الأنواع من الأنظمة يجب أن تعتمد على أولا الاعتراف الكلام؛ ثانيا، تحويله إلى معنى الداخلية التمثيل؛ ومن ثم، ثالثا، أن تكون قادرة على الخروج والبحث عن مصدر المعلومات التي يسمح لهم الإجابة على هذا السؤال. هذا المستوى من التعقيد ينطوي نفس أنواع الأشياء البرنامجية ان كنت قد تعرضت القيام في مجموعات المشكلة. ونحن قادرون على تحليل طلبات HTTP في نفس النوع من نمط على مستوى منخفض المتطابقة التي ELIZA يمكن القيام به. ونحن قادرون على تحويل تلك إلى تمثيل داخلي، ومن ثم استخدامها لالاستعلام بعض قاعدة بيانات خارجية، ربما تستخدم SQL. جميع الأنظمة التي يجري بناؤها اليوم للقيام بهذا النوع من الطبيعية الاتصال اللغة يجري بناؤها على هذه المبادئ نفسها. الآن، وحتى نظام مثل واتسون ليست معقدة بما فيه الكفاية لتكون قادرة على الإجابة تعسفيا أسئلة حول أي موضوع. وفي الواقع، فإنها يجب أن تكون منظم ضمن مجال معين. لذلك يمكنك الذهاب على الانترنت ويمكنك أن تجد إصدارات واتسون التي تعمل بشكل جيد ضمن المعلوماتية الطبية. أو هناك واحد على الانترنت التي تتعامل فقط مع كيفية تقديم توصيات جيدة حول ما البيرة سوف تذهب مع أي طعام. وضمن تلك المجالات، ويمكن الإجابة على الأسئلة، العثور على المعلومات التي يحتاجها. ولكن لا يمكنك خلط ومطابقتها. والنظام الذي تم تدريب مع قاعدة بيانات من المواد الغذائية والبيرة لا يعمل بشكل جيد عند فجأة وضعها في مع المعلوماتية الطبية قاعدة البيانات. وذلك حتى أفضل أنظمتنا اليوم تعتمد على مستوى من التجهيز التي نحن ناحية الترميز و بناء في البنية التحتية من أجل لجعل هذا نظام تشغيل. الآن، والموضوع الأخير أريد لتكون قادرة للوصول الى اليوم هو حول التواصل غير اللفظي. كتلة كبيرة من المعلومات التي نتواصل مع بعضنا البعض لا يأتي عن طريق كلمات فردية أننا تطبيق. عليها أن تفعل مع أشياء مثل القرب، والبصر، نبرة صوتك، انعطاف الخاص بك. وأن التواصل هو أيضا شيء أن الكثير من واجهات مختلفة تهتم الكثير عن. انها ليست ما يهتم سيري عنه. يمكنني أن أسأل سيري شيء في صوت واحد أو بلهجة مختلفة من الصوت، ويجري سيري ل تعطيني الجواب نفسه. ولكن هذا ليس ما نحن نبني ل العديد من أنواع أخرى من واجهات. أريد أن أعرض لكم الآن إلى واحد من الروبوتات. وقد بنيت هذه ببلدي منذ فترة طويلة صديق وزميل سينثيا Breazeal وشركتها جى بو. وهذا robot-- ونحن في طريقنا لدينا المتطوعين زوجين الخروج للتفاعل مع هذا. لذلك يمكن أن لدي اثنين من الناس على استعداد للعب مع الروبوت بالنسبة لي؟ لماذا لا تأتون على ما يصل، ولماذا لا تأتون على ما يصل. إذا كنت الانضمام لي هنا من فضلك. وإذا كان يمكن أن يكون لك يأتي الحق أكثر من هنا. شكر. مرحبا. ALFREDO: لطيف لمقابلتك. ألفريدو. BRIAN SCASSELLATI: ألفريدو. راشيل: راشيل. BRIAN SCASSELLATI: راشيل. لطيف لمقابلتك على حد سواء. ألفريدو، وانا ذاهب لتذهب أولا. يأتي الحق هنا. انا ذاهب الى تقديم you-- ما اذا كان يمكنني الحصول على هذا الخروج دون يطرق microphone-- إلى little روبوت اسمه جى بو. موافق؟ الآن، تم تصميم جى بو إلى أن تكون تفاعلية. وعلى الرغم من أنه يمكن أن تعطيك الكلام، الكثير من التفاعل مع الروبوت غير شفهي. ألفريدو، وانا ذاهب ليطلب منك أقول شيئا لطيفا ومجاني للروبوت، من فضلك. ALFREDO: أعتقد أنك تبدو جذابة. [الطنين SOUND] BRIAN SCASSELLATI: OK. ردها ليست لفظية. وبعد ذلك قدم لكم على حد سواء اعتراف واضح ما قال أنه لم يسمع لك ويفهم أيضا بطريقة ما. موافق؟ خطوة الظهير الايمن هنا لثانية واحدة. شكرا. راشيل، لو تفضلتم. الآن، وانا ذاهب لإعطاء كنت المهمة أصعب بكثير. إذا كنت تقف هنا، عمل نسخة احتياطية فقط قليلا حتى نحن يمكن ان تحصل على الكاميرا وتبدو هذه الطريقة. أنا ذاهب لأطلب منك أن تقول شيئا يعني حقا وسيئة للروبوت. راشيل: ما يبدو فقط القيام به هو سخيف تماما. [أزيز SOUND] كان ذلك أكثر عبثية. ماذا بكى؟ فصيل عبد الواحد، لا تظن السوء. سأعطيك عناق. BRIAN SCASSELLATI: حسنا. شكرا، راشيل. ألفريدو، راشيل، وذلك بفضل الرجال كثيرا. [تصفيق] لذلك هذا النوع من التفاعل له في العديد من الطرق بعض القواعد نفسها وبعض من نفسه هيكل ما كنا قد يكون في التفاعل اللغوي. إلا أنه من غير التواصل و يخدم غرضا هاما. وهذا التفاعل، في طرق عديدة، تم تصميم أن يكون لها تأثير خاص على شخص التفاعل مع أو الاستماع لالروبوت. الآن، أنا محظوظ بما فيه الكفاية لديك جى بو هنا اليوم. سام سبولدينج هو مساعدة هنا لنا بها مع الروبوت. وانا ذاهب الى نسأل سام لإعطاء عرض لنا أحد لطيفة من جى بو الرقص التي يمكن أن نشاهد في نهاية هنا. فهيا، جى بو. SAM: OK، جى بو. تبين لنا خطوات الرقص الخاصة بك. [عزف الموسيقى] BRIAN SCASSELLATI: حسنا، الجميع. وبفضل أصدقائنا في جى بو. [تصفيق] وبفضل أصدقائنا في IBM لمساعدة من اليوم. التواصل هو شيء ان كنت تريد الذهاب لرؤية الخروج أكثر وأكثر كما نحن نبني واجهات أكثر تعقيدا. الاسبوع المقبل، سنتحدث حول كيفية التفاعل مع خصوم الكمبيوتر في المباريات. ولكن إذا كان لديك أسئلة حول هذا، سأكون حولها في ساعات العمل هذه الليلة. أنا سعيد أن أتحدث إليكم عن منظمة العفو الدولية موضوعات أو للوصول الى مزيد من التفاصيل. اتمنى لك نهايه اسبوع جميله. [تصفيق] [عزف الموسيقى]