[موسیقی] دیوید مالان: این CS50 است. این پایان هفته 10 است. و پسر، آیا ما کلاس خوب برای شما امروز. ما خیلی هیجان زده به دعوت دو از دوستان ما را از دانشگاه ییل تا به امروز با ما و در تقاطع نگاه هوش مصنوعی، رباتیک، پردازش زبان طبیعی، و بیشتر. و در واقع، بیش از چند هفته گذشته، ما قطعا صرف مقدار زیادی از زمان، به خصوص در psets قبل از آن، تمرکز بر جزئیات سطح بسیار پایین. و آن را بسیار آسان برای از دست دادن بینایی از برای درختان جنگل و بلند شدن آویزان بر روی حلقه ها و شرایط و اشاره گر، قطعا، و مانند آن. اما واقعیت این است که شما بچه ها در حال حاضر مواد تشکیل دهنده که شما واقعا می تواند حل برخی از مشکلات جالب توجه است، در میان آنها کسانی است که دوستان ما در دانشگاه ییل کار بر روی فقط خجالتی از کمبریج. بنابراین من اجازه می دهد اولین بار به معرفی سر ما دستیار آموزشی از دانشگاه ییل، اندی. [تشویق حضار] ANDY: اول از همه، فقط تشکر می کنم شما برای اجازه دادن یک زن و شوهر Yalies به موسیقی پاپ در پایین به کمبریج امروز. ما واقعا آن را درک. در مرحله دوم، به دوستان ما تماس home-- جیسون، برای ماندن و در حال اجرا سخنرانی. امیدوارم که این همه در نیوهیون خوب است. بنابراین من فوق العاده هیجان زده هستم را به شما معرفی Scaz امروز. Scaz اجرا می شود آزمایشگاه رباتیک. او استاد، مانند، پنج بخش های مختلف در دانشگاه ییل. در آزمایشگاه خود، او تا به بسیاری، بسیاری از روبات که او را دوست دارد به بازی با. او، مانند، جالبترین کار در جهان است. و او را به نوع ظرف غذا می شود با که تمام روز طولانی و انجام برخی از کارهای، و همچنین. و بنابراین ما در واقع به ارمغان آورد یکی از آنها را با ما امروز. بنابراین بدون ado بیشتر، Scaz است رفتن به جلو بروید و به ما معرفی به دوستان ربات خود را. [تشویق حضار] برایان SCASSELLATI: با تشکر، دیوید. با تشکر از اندی. پس از آن فوق العاده است به در اینجا با همه امروز. من می خواهم به اولین بسیار روشن است که می شود CS50 کارکنان در اینجا در کمبریج شده است فوق العاده به ما مهمان نواز. ما برای همه چیز خدا را شکر آنها به حمایت از ما انجام داده ام. و به این ترتیب ما می خواهم به قادر برای بازگشت به مهربانی. بنابراین، امروز، ما را وادار به اعلام که ما در حال رفتن به یک جدید، یکی از یک نوع رویداد CS50 اتفاق می افتد در نیوهیون در هفته آینده. و این نمایشگاه پژوهش CS50 است. بنابراین ما قصد داریم به دعوت شود everyone-- CS50 دانش آموزان، کارکنان از هر دو دانشگاه هاروارد و Yale-- به پایین آمده و در روز جمعه با ما باش. ما طیف گسترده ای از بیش از باید 30 افراد مختلف ارائه و جلوش exhibiting-- نشان دادن برخی از محصولات خود را پژوهش. ما برخی از راه اندازی باید، حتی، به دنبال برای کمی از استعداد های جدید فن آوری، راه اندازی از هر دو دانشگاههای هاروارد و ییل. و ما به برخی از گروههای دانشجویی به دنبال برخی از عضویت جدید. آن را به زمان بسیار هیجان انگیز است. امیدوارم کسانی از شما که می پایین آمدن برای بازی هاروارد دانشگاه ییل قادر خواهد بود برای متوقف کردن توسط یک کمی زود است، درست در مرکز محوطه دانشگاه، استرلینگ کتابخانه یادبود. ما در حال رفتن به یک مجموعه ای از نمایشگاه که از مستقل در محدوده بادبانی به راه استفاده از نرم افزار برای حفظ نسخه های خطی قرون وسطی است. ما در حال رفتن به آگهی شبکه های تک کاره و مردم آموزش برنامه نویسی نرم افزار در کیپ تاون. ما باید کامپیوتر تظاهرات موسیقی. و ما البته باید روبات های بیشتر. بنابراین ما امیدواریم که شما را خواهیم برای این رویداد به ما بپیوندید. باید مقدار زیادی از باشد سرگرم کننده، کمی از مواد غذایی، و بسیاری از جالب همه چیز به بحث در مورد. بنابراین، امروز، ما قصد داریم به بحث در مورد پردازش زبان طبیعی است. و این تلاش برای ما است برای ساخت یک راه جدید برای واسط با دستگاه های ما به دلیل برای چند هفته گذشته، شما بوده ام در مورد چگونگی آن است که تمرکز شما می توانید کد نوشتن، نوشتن نرم افزار که راهی که قادر به به یک است ماشین آلات، این چیزی است که من می خواهم شما را به انجام. اما ما باید به نیاز ندارد انتظار می رود که همه چیز که در خارج وجود دارد که مورد استفاده قرار توسط هر کس در جهان در حال رفتن به مهارت در این نوع از آموزش. بنابراین ما بین کامپیوتر تشخیص زبان و languages-- طبیعی است که، همه چیز است که انسان استفاده برای برقراری ارتباط با انسان های دیگر. و ما سعی برای ساخت رابط که با استفاده از این مکانیزم های ارتباطی طبیعی است. در حال حاضر، درست مثل هر موضوع دیگر که ما با در CS50 آغاز شده ام، ما قصد داریم به با ساده ترین شروع کمی از پردازش زبان طبیعی که ما می توانیم تصور کنید. ما قصد داریم تا با شروع بخش تاریخی زبان طبیعی است. و سپس ما را به ساخت تا سیستم های اخیر بیشتر و بیشتر و برخی از سرگرم کننده دموی در طول راه. بنابراین ما قصد داریم تا با آنچه بود شروع احتمالا اولین زبان طبیعی سیستم پردازش. این یک سیستم نرم افزار نوشته شده بود سال 1966 توسط جوزف Weizenbaum به نام ELIZA. و الیزا طراحی شده بود تکرار نوع تعامل شما می توانید با اند روان درمانگر Rogerian. در حال حاضر، Rogerians، آنها تا به حال یک ایده است که روان درمانی درگیر بودن قادر به آینه عقب به یک بیمار و صحبت کردن با آنها، در واقع، با تنها به آنها کمی کوچک از درمانگر. است که، همه چیز که درمانگر گفت قرار بود تنها بازتاب آنچه بیمار گفتن به آنها شد. بنابراین سعی کنید و نسخه ی نمایشی این. آیا ما باید یک داوطلب که می شود مایل به اشتراک گذاری عمیق ترین آنها، تاریک ترین، و / یا اسرار جعلی با ELIZA؟ مطمئنا، چرا شما در آمده است. خارق العاده. و نام خود را؟ مایل: مایل است. برایان SCASSELLATI: مایل است. از ملاقات شما، مایل است. اگر شما می روی که نگه دارید. و ما قصد داریم به استفاده از یک نسخه از ELIZA که ما را تکرار در IDE CS50 است. و ما نسبت به منبع کد این در حالی که کمی. اما در حال حاضر، ما فقط در حال رفتن به آن استناد با تایپ کردن الیزا. و الیزا است که به شما پاسخ می دهد که می رویم به در تمام مراکز باشد. و قصد دارم به شما چند سوال بپرسید. و ما پاسخ می دهند و نوع در پاسخ به ELIZA. بنابراین ELIZA گفته است، "سلام، من ELIZA هستم. مشکلت چیه؟" چه به دوست دارید ELIZA در مورد امروز بگویید؟ مایل: من فقط می توانم به خواب رفتن اگر من دمپایی اسم حیوان دست اموز است. برایان SCASSELLATI: بسیار خوب. خیلی خوب. [خنده حضار] "من فقط می توانم به خواب رفتن با دمپایی اسم حیوان دست اموز است. " و الیزا می گوید، "می گویند، شما انجام هر گونه مشکل روانی داشته باشد؟ شاید این یک شاخص خوب است. " باشه. پس چه می خواهید به پاسخ می دهند؟ مایل: بله. برایان SCASSELLATI: بله. مرد از بسیاری از کلمات. من لذت بردن از آن است. الیزا می گوید: "به نظر میرسد شما کاملا مثبت است." مایل: نه، من، در واقع، یک الکترون. برایان SCASSELLATI: "شماره در واقع، من یک الکترون هستم. " "آیا شما به من می آیند دلیل این که شما یک الکترون هستند؟ " در حال حاضر، ما می توانیم برخی از دید چیز من قصد دارم به شما مکث برای یک ثانیه، مایل است. آیا در هر نقطه نیست. ما با شما انجام نشده است. ELIZA است، در برخی از راه، پاسخ به بعضی چیزها که او گفت اما بدون درک واقعی. و آن را نیز تکرار طوطی وار برخی از از بخش هایی از حکم او. بنابراین ما گفت، "نه در واقع، من یک الکترون هستم. " الیزا پاسخ تماس، "آیا شما می آیند به من به خاطر شما یک الکترون هستند؟ " خیلی خوب. اجازه دهید آن را یک پاسخ در اینجا است. آن یکی خوب، مایلز می دهد. مایل: خوب؟ بله، لطفا به من کمک کند. برایان SCASSELLATI: "بله. لطفا به من کمک. "" آیا شما مطمئن هستید؟ " مایل: شماره برایان SCASSELLATI: شماره "چه که نشان می دهد به شما؟" مایل: من ممکن است یک الکترون است. برایان SCASSELLATI: "من ممکن است یک الکترون است. " "آیا شما گفت هیچ فقط به منفی؟" خیلی خوب. بنابراین مایلز، از شما بسیار متشکرم. مایل: با تشکر از شما. برایان SCASSELLATI: خیلی متشکرم. [تشویق حضار] بنابراین این برنامه ELIZA، در بسیاری جهات، پاسخ به قطعات که ما در حال ارائه بدون هیچ عمیق درک درستی از آنچه اینجا اتفاق می افتد. این یک نوع سیستم است نام تطبیق الگو، که در آن ما به دنبال خاص بیت از متن که ما پس از هستید رفتن به از آنچه به عنوان ورودی فراهم شده بود، تبدیل آن، به طور بالقوه، در برخی از راه، و سپس آن را به کاربر می دهد. آیا هر یک از شما فکر می کنم که ELIZA است که در واقع انجام روانکاوی معتبر است؟ یک نفر، شاید. مخاطبان: [نامفهوم]. برایان SCASSELLATI: و چگونه می کند که شما احساس؟ بله، در واقع، آن را ندارد. و ما قصد داریم برای دیدن، در واقع، کد منبع آن را در فقط یک لحظه. و بنابراین شما در حال رفتن به قادر به انجام دقیقا این است. در حال حاضر، ELIZA یک شکل از آن چیزی است که ما را امروز به یک ربات چت پاسخ. این فقط از طریق می رود متن است که شما در حال ارائه، حداقل مقدار لخت فراهم می کند درک یا پردازش، و سپس آن را طوطی وار به شما. بنابراین اجازه دهید نگاهی، مفهومی و بحث در مورد آنچه آن است که ELIZA است که در واقع انجام می دهند. ELIZA است که مصرف یک اجازه sentence-- است می گویند، "من می خواهم به تحت تاثیر قرار دادن رئیس من است." و الیزا است که به دنبال از طریق این جمله و تلاش برای پیدا کردن و با الگوی خاصی مطابقت. بنابراین، برای مثال، یکی از الگوهای که ELIZA است که به دنبال کلمات "من میخواهم." و هر زمان آن را می بیند چیزی است که "من می خواهم" در آن است، آن را فرموله پاسخ. و جواب یک رشته ثابت است. در این مورد، آن را "چرا می خواهید؟" و من یک ستاره کوچک در قرار پایان چرا که فقط آغاز پاسخ ما. و ستاره نشان می دهد که ما قصد داریم به استراحت از utterance-- کاربر "تحت تاثیر قرار دادن رئیس من" - و ما قصد داریم به اضافه که را به انتهای این رشته است. بنابراین در حال حاضر، به جای گفتن، "چرا آیا شما می خواهید به تحت تاثیر قرار دادن رئیس من، " یک کمی از اضافی وجود دارد پردازش که ما را انجام دهد. این است که، ما به تبدیل برخی از ضمایر در اینجا از "رئیس من" به "رئیس خود." و ممکن است وجود داشته باشد برخی دیگر از تغییراتی که ما نیاز به ایجاد. بنابراین به جای آن چسبیده فقط طور مستقیم بر روی پایان، آنچه ما انجام است ما بقیه را از utterance-- کاربر در here-- سفید و ما آن را یک قطعه در را یک زمان و تبدیل هر رشته رمز، هر کلمه، به جمله. بنابراین ما کلمه "به" را هیچ تبدیل وجود دارد که ما نیاز به انجام این کار. "تاثیر گذاشتن." هیچ تبدیل وجود دارد ما نیاز به انجام وجود دارد. "من" تبدیل به "خود را." و "رئیس" ما فقط به عنوان ترک "رئیس" و سپس در نهایت، هر چیزی که به پایان می رسد با یک دوره، ما آن را به یک سوال تبدیل کنید. این تطبیق الگو بسیار ساده است که در واقع کاملا موفق. و زمانی که این معرفی شد در 1966-- جوزف Weizenbaum این بر روی یک کامپیوتر برنامه ریزی شده. در حال حاضر، کامپیوتر که در آن زمان مدل های دسکتاپ نیست. آنها منابع به اشتراک گذاشته شده است. و دانش آموزان خود را رفتن و چت با ELIZA. در نهایت، او را به حال محدود کردن دسترسی به آن را چرا که دانش آموزان خود نیست گرفتن هر گونه کار انجام شده. آنها فقط چت با ELIZA شد. و، در واقع، او را به حال آتش دستیار او، که صرف تمام وقت خود را به صحبت کردن به ELIZA در مورد مشکلات عمیق و نگران کننده است. هر کس که این سیستم ها استفاده می شود آغاز شده به آنها انسانی برای خدا قائل. آنها شروع به آنها به عنوان بودن تحریک و تشجیع و مردم واقعی است. آنها شروع به تشخیص برخی از چیزهایی که آنها می گفتند برگشت به آنها را به آینده شد. و آنها پیدا کردن شد همه چیز در مورد خود. و، در واقع، حتی کارشناسان، حتی روان درمانی، آغاز شده که نگران باشید که، در واقع، شاید ELIZA می شود به جای آنها. و حتی کامپیوتر دانشمندان نگران است که ما بود بنابراین نزدیک به حل زبان طبیعی است. در حال حاضر، این بود که در هر نقطه به واقعی نزدیک نیست. اما این که چگونه قابل توجه این سیستم می تواند به نظر می رسد. بنابراین شروع به نگاه اجازه زیر و سعی کنید برای به دست آوردن یک کمی از یک سوال از جایی که این کد در واقع اتفاق می افتد. بنابراین ما این کد را در دسترس پس از آن. و این است که بسیار پورت ساده و مستقیم از اجرای اصلی ELIZA. بنابراین برخی از این سبک چیزهایی که شما در اینجا خواهید دید نه سبک چه ما می خواهیم شما را به انجام یا آنچه که ما تدریس شما را به انجام. اما ما تلاش کرده ایم به نگه داشتن آنها همان در بسیاری از بنادر که این تا به حال به طوری که آن دارای عطر و طعم از اصلی است. بنابراین ما در حال رفتن به شامل یک دسته از مسائل، و پس از آن خواهیم دارند مجموعه ای از کلمات کلیدی، همه چیز که ELIZA تشخیص خواهد و پاسخ به طور مستقیم. بنابراین اگر شما کلماتی مانند "می تواند به شما" یا "من نمی" یا "نه" و یا "بله" یا "رویا" و یا "سلام" و سپس ELIZA انتخابی به آن پاسخ خواهد داد. ما همچنین می خواهیم دارند تعداد معینی از همه چیز که ما مبادله، مانند تبدیل "من" به "خود را." و سپس ما را به مجموعه ای از پاسخ دارند که برای هر یک از این کلمات کلیدی، ما را از طریق شما چرخش این پاسخ متفاوت است. بنابراین اگر من می گویند "بله" سه بار در یک ردیف، من ممکن است سه متفاوت است پاسخ از ELIZA. کد ما، پس از آن، در واقع قابل ملاحظه ای ساده است. اگر من در پایین حرکت گذشته همه از این پاسخ که ما در برنامه ریزی و ما به اصلی ما، ما در حال رفتن به مقداردهی اولیه یک زن و شوهر از متغیرهای مختلف و انجام یک کمی از خانه در آغاز. اما پس از آن کاملا وجود دارد مجموعه ای از کد که شما می توانید درک کنید. یک حلقه در حالی که بزرگ است که می گوید من رفتن به تکرار این بارها و بارها. من در یک خط به عنوان خوانده شده، و من ذخیره که در یک رشته ورودی. من چک کنید و ببینید اگر آن را کلید واژه ویژه "خداحافظ"، که به معنی برنامه خارج شوید. و پس از آن من را بررسی کنید و اینکه آیا دیدن کسی تنها تکرار خود دوباره و دوباره. و من در آنها داد اگر این کار را. من می گویم "خودتان را تکرار نمی کند." تا زمانی که هیچ کدام از این اتفاق می افتد، ما سپس از طریق و حلقه را از طریق اسکن، در خطوط 308-313 در اینجا، و چک کنید و ببینید هستند هر یک از این کلمات کلیدی عبارات موجود در ورودی که من فقط به او داده شد. اگر یک بازی برای آنها وجود دارد، به خوبی پس از آن، من به یاد داشته باشید که محل. من که کلمه کلیدی به یاد داشته باشید. و من قادر به ساخت یک پاسخ. اگر من یکی را پیدا کند، و سپس، آخرین چیزی که در آرایه کلید واژه من خواهد بود به طور پیش فرض پاسخ من، وقتی هیچ چیز دیگری منطبق است. من سوال بپرسید مانند "چرا شما به اینجا می آیند؟ "یا" چگونه می توانم به شما کمک کنم؟ " که فقط تا حدی مناسب بدون توجه به آنچه ورودی است. سپس ما ساخت تا پاسخ الیزا. ما قادر خواهید بود به که پاسخ های پایه، همانطور که ما در این کار را "رئیس من" به عنوان مثال. در صورتی که همه وجود دارد که is-- اگر آن را فقط یک رشته ای که من قرار است به respond-- من فقط می توانید آن را ارسال کند. اگر آن را تا ستاره در در پایان از آن، پس از آن من پردازش هر نشانه های فردی در بقیه پاسخ کاربر و اضافه کردن آن در، تعویض کلمه به کلمه به عنوان من نیاز به. همه از این است که کاملا چیزی است که شما می توانید ساخت. و در واقع، راه هایی که ما دارند آرگومان های خط فرمان پردازش، روشی که در آن شما را مجبور پردازش از طریق درخواست های HTTP همان نوع از قوانین را دنبال کنید. آنها تطبیق الگو است. بنابراین ELIZA حال نسبتا مهم تاثیر بر زبان طبیعی به دلیل آن ساخته شده آن را به نظر می رسد مانند آن را یک بود هدف بسیار قابل دسترسی، مانند نوعی ما می خواهم قادر به حل این مشکل به طور مستقیم. در حال حاضر، این که می گویند نیست که ELIZA کند هر آنچه را که ما می خواهیم انجام دهیم. قطعا نه. اما ما باید قادر باشد به انجام چیزی بیشتر. اولین گام ما برای رفتن فراتر از ELIZA است که قادر به در نگاه کنید متن نیست وارد شدن به صفحه کلید اما گفتار، واقعی صدای ضبط شده را به یک میکروفون. بنابراین همانطور که ما در این نگاه تکه های مختلف، ما رفتن به ساخت مجموعه ای از مدل. ما در حال رفتن به قادر از آکوستیک سطح پایین رفتن زمین information--، دامنه، frequency-- و تبدیل که به برخی از واحدهای است که ما به راحتی قادر به دستکاری و، در نهایت، آنها را دستکاری به کلمات و جملات. به طوری که بسیاری از تشخیص گفتار سیستم هایی که در خارج وجود دارد امروز به دنبال یک آماری مدل که در آن ما ساخت سه نوع نمایش جداگانه ای از آنچه که سیگنال های صوتی در واقع شامل. ما با یک مدل شروع آوایی که مذاکرات در مورد فقط پایه برای تلفن های موبایل است که تولید کردم. من تولید چیزی است که ب در پسر و یا یک D در سگ؟ چگونه تشخیص این دو متفاوت است من تلفن به عنوان جداگانه و مجزا. در بالا از آن، ما پس از آن ساخت یک کلمه تلفظ مدل، چیزی که در پیوند با هم کسانی که گوشی های فردی و آنها را به یک کلمه است. و پس از آن، ما کلمات را و ما آنها را با یک زبان جمع آوری مدل را به یک جمله کامل. در حال حاضر، ما قصد داریم در مورد هر بحث از این به طور مستقل و به طور جداگانه. اما این سه مدل همه فقط برای رفتن به آمار. و این بدان معناست که ما کار با آنها، ما قادر به کار با همه به طور همزمان آنها. خیلی خوب. بیایید با استفاده از مدل آوایی ما شروع می شود. بنابراین مدل آوایی در تکیه می کنند یک تکنیک محاسباتی نام مدل پنهان مارکوف. این مدل گرافیکی که در آن من و به رسمیت شناختن یک دولت از جهان به عنوان مشخص توسط مجموعه ای از ویژگی های. و دولت توصیف یک بخش از یک عمل است که من درگیر در. بنابراین اگر من فکر می کنم در مورد ساخت صدای "کارشناسی ارشد" مثل مادر، مختلف وجود دارد قطعات به که صدا. یک بخشی که در آن من در نفس قرعه کشی وجود دارد. و بعد من لب های من کیف پول. و من رول لب های من به عقب کمی کمی را که "کارشناسی ارشد" صدا. و پس از آن آزادی وجود دارد. لب های من از هم جدا شده است. هوا اخراج شده است. "فوق لیسانس." این سه بخش های مختلف می شود توسط دولتها، در این graph-- نمایندگی شروع، وسط و پایان. و من می انتقال که به من اجازه داد از یک حالت سفر به بعد با احتمال معینی. بنابراین، برای مثال، M صدا ممکن است بسیار دارند، مصرف بسیار کوتاه در beginning-- "میلی متر" - و پس از آن دیگر، فاز ارتعاشی که در آن من من برگزاری لب با هم و تقریبا humming-- "بهت" - و پس از آن بسیار کوتاه به plosive که در آن من اخراج breath-- "MA." مدل مارکوف است طراحی شده برای ضبط این واقعیت این راه است که من را که صدای "کارشناسی ارشد" است که به در کمی متفاوت زمان آن، فرکانس آن، و ویژگی های آن از راه است که شما آن را و یا راه است که من ممکن است آن را که من صحبت کردن در در مورد استفاده های مختلف از این نامه. "مادر" و "ممکن است من" خواهد شد صدا کمی متفاوت است. بنابراین به رسمیت شناختن یک صدای خاص، ما را ساخت مدل های مارکوف، این مخفی مارکوف مدل، مدل ها از هر تلفن ممکن است که من ممکن است بخواهید به رسمیت شناختن، هر صدا ممکن است، و سپس در نگاه داده های صوتی که من آن را و تعیین آماری که یکی از یکی به احتمال زیاد است این صدا به تولید کرده اند. باشه. با این مدل، ما پس از آن شروع به ساخت در بالای آن. ما را یک مدل تلفظ. در حال حاضر، گاهی اوقات تلفظ مدل های ساده و آسان می باشد چرا که تنها یک وجود دارد راه چیزی را تلفظ کنید. بار دیگر، آنها یک کمی پیچیده تر است. در اینجا یک راهنمای تلفظ است برای چیزی که قرمز است که یک میوه است که شما را از سس گوجه فرنگی. مردم فکر نمی کنم آن را یک میوه است. درست؟ در حال حاضر، بسیاری از راه های مختلف وجود دارد که مردم این کلمه را تلفظ کنند. بعضی ها خواهند گفت "پا مه پا." بعضی ها خواهند گفت "پا-MAH پا." و ما می توانیم با گرفتن که یکی از این مدل های گرافیکی که در آن، دوباره، ما نمایندگی انتقال به عنوان داشتن یک احتمال معین و احتمال با آنها در ارتباط است. بنابراین در این مورد، اگر من به دنبال مسیر بالا را از طریق تمام این نمودار، من می شود در نامه شروع در سمت چپ، از "TA" صدا. من نیمه بالای را، از "اوه،" و سپس "کارشناسی ارشد" و سپس یک "یک"، و پس از آن یک "TA،" و "آه." "انگشت پا ممکن است پا." اگر من راه پایین از طریق زمان این، من خواهد شد "TA-MAH پا." و اگر من پایین و سپس تا، من دریافت "TA-ممکن است پا." این مدل گرفتن این تفاوت چرا که هر زمان اعزام یکی از این سیستم های تشخیص، آن را به مجبور به کار با تعداد زیادی از نوع دیگری از مردم، تعداد زیادی از لهجه های مختلف، و حتی استفاده های متفاوت از کلمات مشابه. در نهایت، در بالا از آن، ما چیزی خواهیم ساخت به نظر می رسد که واقعا پیچیده است، نام مدل زبان، اما در واقع ساده ترین است سه زیرا این عمل در چه مدل n-gram به نام. و در این مورد، من به شما نشان دو بخش مدل n-gram به یک bigram. ما در حال رفتن به فیزیکی ایده که گاهی اوقات، کلمات خاصی هستند بیشتر احتمال دارد به دنبال یک با توجه به کلمه از دیگران است. اگر من فقط گفت: "پیش بینی آب و هوا،" کلمه بعدی به احتمال زیاد می تواند "امروز" و یا می تواند "آب و هوا پیش بینی فردا. " اما بعید است به " پیش بینی آب و هوا کنگر فرنگی. " چه مدل زبانی می کند آن کسانی که قطاری آماری با شمارش، از برخی از بسیار بزرگ لاشه، همه از موارد که در آن یک کلمه زیر است. بنابراین اگر من یک corpus-- بزرگ مانند هر وال استریت ژورنال است که از سال 1930 تولید شده، که یکی از corpuses-- استاندارد است و من از طریق تمام نگاه که متن، و من به حساب تا چند بار بعد از "پیش بینی" انجام می بینم "امروز" و چند بار من را ببینید "پیش بینی" به دنبال "کنگر فرنگی،" یکی از اولین است که به احتمال بیشتری باشد. آن را به نظر می رسد به مراتب بیشتر غالبا. و پس از آن یک بالاتری دارند احتمال مرتبط با آن. اگر من می خواهم به شکل احتمال کل گفتار، پس از آن، من فقط آن شکستن. بنابراین احتمال شنوایی جمله "موش خوردند پنیر" احتمال از کلمه است "به" شروع یک جمله، و پس از آن احتمال این که کلمه "موش" به پیروی از کلمه "، به" و احتمال این که کلمه "خوردند" زیر "موش صحرایی،" و احتمال این که "پنیر" زیر "خوردند." این برای تلفن های موبایل مانند بسیاری از آمار، بسیاری از احتمالات. و این همه آن است که. اما چیزی که شگفت انگیز است اگر شما این کار را با یک نمونه به اندازه کافی بزرگ از داده ها، عمل می کند. و آن را فوق العاده خوب کار می کند. همه ما می دانیم این فن آوری. اکثر سیستم عامل ها با تشخیص صدا در این نقطه. ما با استفاده از سیری و کورتانا و اکو. و این چیزها بر اساس این نوع از سه لایه model-- یک مدل آوایی در پایین، یک تلفظ مدل در وسط، و یک مدل زبانی در بالا از آنها. در حال حاضر، آنها را به انجام یک کمی بیشتر که به منظور پاسخ به سوالات. اما به رسمیت شناختن آنچه شما گفت بستگی دارد که دقیقا در. بنابراین اجازه دهید یک مثال را در اینجا. بنابراین من گوشی من نشسته تا در اینجا زیر دوربین سند. و ما در حال رفتن به پرسد سیری چند سوال. خیلی خوب؟ بنابراین اجازه دهید از خواب بیدار تلفن من در اینجا. سیری، چه آب و هوا مانند در نیوهیون امروز؟ سیری اینجا آب و هوا برای این نیوهیون، کانتیکت امروز. برایان SCASSELLATI: OK. بنابراین برای اولین بار شما را دیدم که سیری به رسمیت شناخته شده هر یک از کلمات فردی و سپس یک پاسخ تولید می شود. ما در مورد چگونگی صحبت که پاسخ می آید در مورد در یک کمی. اما در حال حاضر که ما می دانیم که این فقط بر اساس در آمار خام و این الگوی نوع تطبیق رویکرد، ما می توانیم برخی از بازی با سیری بازی کند. بنابراین من دوباره می توانید امتحان کنید. سیری، چه آب و هوا کرگدن نیوهیون، امروز؟ سیری: OK. در اینجا آب و هوا برای جدید است نیوهیون، کانتیکت برای امروز. برایان SCASSELLATI: سیری که نه daunted به دلیل آن را پیدا pattern-- "آب و هوا"، "امروز"، "نیوهیون." این چیزی است که آن را پاسخ به، درست مثل ELIZA. خیلی خوب. اجازه دهید آن را یک حتی به به عنوان مثال مضحک تر. سیری، کنگر فرنگی آب و هوا نوعی حیوان گورکن کرگدن نیوهیون؟ سیری: اجازه بدهید که تیک بزنید. در اینجا چیزی است که در وب پیدا شده است برای چه هستند کنگر فرنگی نوعی حیوان گورکن کرگدن پناهگاه جدید. برایان SCASSELLATI: OK. بنابراین اگر من به اندازه کافی به دور از این مدل، من قادر به آن اشتباه به دلیل آن نیستم دیگر منطبق بر الگوی است که آن را دارد. و آماری موتور که گفت، چه احتمال است که شما کردم کرگدن کلمات و کنگر فرنگی با هم، و نوعی حیوان گورکن؟ که کردم به چیزی جدید. بنابراین این فن آوری که ما هر روز استفاده کنید. اگر ما می خواهیم آنها را یک گام بیشتر، هر چند، اگر ما در واقع می خواهم که قادر به در مورد آنچه آن صحبت این است که این سیستم در پاسخ به، ما باید به صحبت می کنید، دوباره، در مورد مجموعه ای بنیادی تر از سوالات. و این یک موضوع در ارتباط است که ما پرسش و پاسخ تماس بگیرید. است که، ما می خواهم که قادر to-- آره؟ مخاطبان: [نامفهوم]. برایان SCASSELLATI: آیا ما اجازه داریم به پردازش معنایی نهفته؟ درنتیجه بله. هستند بسیاری از چیزهایی که وجود اتفاق می افتد در زیر سطح با سیری و در برخی از نمونه های من قصد دارم به شما نشان می دهد بعدی که در آن است بسیار کمی وجود دارد از نظر ساختار از آنچه شما می گویید که مهم است. و، در واقع، که بزرگ پیش ماده برای اسلاید بعدی برای من. بنابراین در راه همان است که ما تشخیص گفتار ساخته شد از لایه های متعدد، اگر ما می خواهید درک آنچه در آن است که در واقع می شود گفت، ما قصد داریم به دوباره در تجزیه و تحلیل چند لایه تکیه از متن که در حال شناخته شده است. بنابراین، هنگامی که سیری است که در واقع قادر به می گویند، نگاه من این کلمات پیدا شده است. در حال حاضر چه می توانم با آنها انجام دهید؟ جزء اول است که اغلب به از طریق بروید و سعی کنید به تجزیه و تحلیل ساختار جمله. و در چه که ما دیده ایم در مدرسه، اغلب، مرتب کردن بر اساس رسم نمودار به عنوان جملات، ما قصد داریم به رسمیت شناختن است که برخی از کلمات نقش خاص است. این اسم هستند. این ضمایر هستند. این فعل هستند. و ما قصد داریم به رسمیت شناختن که برای یک دستور زبان خاص، در این مورد دستور زبان انگلیسی، وجود دارد راه معتبر که در آن من می توانید آنها را ترکیب و راه های دیگر که معتبر نیست. که به رسمیت شناختن، که ساختار، ممکن است به اندازه کافی برای کمک به هدایت ما کمی. اما آن را کاملا کافی نیست برای ما به قادر به هر معنی را به آنچه که در اینجا گفت. برای انجام این کار، ما باید با تکیه بر برخی از مقدار پردازش معنایی. است که، ما در حال رفتن به به نگاه در زیر هر یک از این کلمات چه در واقع به عنوان یک معنای حمل می کند. و در ساده ترین راه برای انجام این کار، ما در حال رفتن به معاشرت با هر کلمه که ما می دانیم یک تابع خاص، یک تغییر و تحول خاصی است که آن را اجازه می دهد تا به اتفاق می افتد. در این مورد، ما ممکن است برچسب کلمه "جان" به عنوان یک نام مناسب، که آن را با آن هویت حمل می کند. و ما ممکن است برچسب "مریم" را به عنوان همان شیوه. در حالی که یک فعل مانند "عشق" است که به منزله یک رابطه خاص که ما قادر به نشان است. در حال حاضر، این بدان معنا نیست که ما درک چه عشق است اما تنها که ما درک آن را در راه یک سیستم نمادین است. است که، ما می توانید برچسب آن و دستکاری آن. با هر یک از این رویکرد ها، هر نوع پردازش معنایی در اینجا است که نیاز به کمی کمی دانش و مقدار زیادی از کار از جانب ما. ما دیگر در قلمرو هستید که در آن آمار فقط ساده در حال رفتن به اندازه کافی برای ما باشد. در حال حاضر، به منظور رفتن از این نقطه به بودن قادر به در مورد داخل صحبت آنچه در واقع اتفاق می افتد در اینجا، به قادر بودن به دستکاری این ساختار و درک یک سوال و پس از آن قادر بودن به بیرون رفتن و جستجو، که نیاز به یک بیشتر مدل شناختی پیچیده است. روشی که در آن این سیستم ساخته شده است است در بیشتر قسمت ها بسیار بسیار کار فشرده. آنها شامل انسان صرف مقدار زیادی زمان ساختار راه در که این نوع از جملات را می توان در برخی از منطق، بیان کرد. این می شود حتی کمی پیچیده تر، هر چند. حتی زمانی که ما پرداخته ام با معانی، ما هنوز هم به در نگاه کاربرد از آنچه که گفت. این است که، چگونه می توانم کلمات مربوط من که من به چیزی از لحاظ جسمی را داشته باشد در جهان وجود دارد و یا در حداقل برخی از منبع اطلاعات که من می تواند دستکاری؟ گاهی اوقات، این منجر به بیت فوق العاده از ابهام است. "قرمز گرم ستاره به ازدواج ستاره شناس." باشه. در حال حاضر، ما به عنوان خوانده است که به عنوان نوع خنده دار از تیتر که ما را در اواخر شب را ببینید تلویزیون چرا که ما "ستاره" تفسیر نمی به معنای جسم آسمانی آن است. ما می دانیم که آن را به معنی بیشتر بازیگر امری عادی و یا بازیگر با مقادیر بالای دید. "پیراهن گزش سگ قربانی کمک می کند." آیا این که تیم ملی است که در واقع خارج وجود دارد کمک یک سگ در اطراف و گاز گرفتن قربانی؟ و یا آن را در آنجا بود که فردی که بود گاز گرفته شده توسط یک سگ که برخی از کمک مورد نیاز است؟ فقط از نگاه کردن به نحو و معانی از جملات، ما می توانیم تعیین نیست. "هلیکوپتر طراحی شده توسط مگس انسان است." وجود دارد، در واقع، واقعی چیزهای کوچک است که پرواز در اطراف مردم با بال تأمین انرژی هستند هلیکوپتر برای خوب از انسان ها؟ یا یک دستگاه مکانیکی وجود دارد که مشتق شده قدرت خود را از یک فرد؟ هنگامی که ما در سوال نگاه کنید سیستم های پاسخ، این لایه ها که ما نیاز به مقابله با. در حال حاضر، بهترین و بیشترین مرتب سازی بر از شایع از این سیستم ها امروز قادر به انجام همه چیز در یک سطح که فراتر از آنچه که ما 10 سال پیش بود. در اینجا یکی از بهترین سیستم های است که امروز وجود دارد. و این یک سیستم است از آی بی ام به نام واتسون. این است که از دوستان ما در IBM. این بانک کاترین است، جیا چن، و پریسیلا مورائز به ما تظاهرات واتسون دیروز در IBM یورک. [پخش ویدئو] -چطور هستید؟ -من خوبم. من همیشه وقتی که من هستم فکر کردن، به ویژه هنگامی که من می توانید سرد در این اتاق سرور باقی بماند. چه کسی بازیگر مورد علاقه شما؟ بازیگر مورد علاقه همسرم آنجلینا جولی به عنوان لارا باغچه در مهاجم مقبره اصلی خود را به دلیل فرم به عنوان یک شخصیت مجازی مثل من بود. چگونه می توانید واتسون بیماران کمک کند؟ -is طرح برای بیماران به دسترسی به واتسون به طور مستقیم؟ دسترسی به مشاوره واتسون برنامه های کاربردی به مورد استفاده متفاوت باشد. اما در حال حاضر، اما واتسون تنها ارائه خواهد تشخیص و درمان ممکن گزینه هایی برای حرفه ای پزشکی. مناسب از کجا، بیماران ممکن است اطلاعات ارائه به واتسون، شاید از طریق رابط وب پورتال، قرص، و یا حتی یک تلفن همراه. برای مثال، یک بیمار ممکن است برای توصیف علائم خود در زبان طبیعی به طور مستقیم به یک راه حل واتسون، اجازه می دهد که پزشک به تمرکز بر روی تشخیص و جمع آوری داده ها. چه کسی به قتل آبراهام لینکلن؟ جان ویلکس بوث. -در چه سال آریزونا دایاموند برنده سری جهانی؟ -2001. [END پخش] برایان SCASSELLATI: پس این نوع از سیستم باید به تکیه بر اول از همه به رسمیت شناختن آزادی بیان؛ دومین، تبدیل آن به یک معنی دار داخلی نمایندگی؛ و پس از آن، سوم، قادر بودن به بیرون رفتن و پیدا منبع اطلاعات که اجازه می دهد تا آنها را به پاسخ به این سوال. این سطح از پیچیدگی شامل همان نوع از همه چیز برنامه ریزی شده که به شما شده است انجام این کار در مجموعه مشکل. ما قادر به تجزیه درخواست های HTTP در آن هستید از همان نوع از الگوی سطح پایین تطبیق است که ELIZA توانید انجام دهید. ما قادر به تبدیل آن هستید به یک نمایندگی داخلی، و پس از آن به پرس و جو از برخی از آنها استفاده کنید پایگاه داده های خارجی، احتمالا با استفاده از SQL. همه از سیستم های که هستند که امروز ساخته شده است برای انجام این نوع طبیعی ارتباطات زبان در حال بر ساخته شده این اصول است. در حال حاضر حتی یک سیستم مانند واتسون است به اندازه کافی پیچیده نیست قادر به پاسخ دلخواه سوال در مورد هر موضوع. و در واقع، آنها باید ساختار در یک دامنه داده شده است. بنابراین شما می توانید آنلاین و شما می توانید پیدا نسخه واتسون که به خوبی عمل در انفورماتیک پزشکی. و یا یک فروشگاه وجود دارد که فقط با پردازد به توصیه های خوب در مورد چه آبجو خواهد که با آن غذا می رود. و در این حوزه ها، آن را می توانید سوالات پاسخ، پیدا کردن اطلاعات است که به آن نیاز دارد. اما شما نمی توانید ترکیب و مطابقت آنها. سیستم آموزش داده شده است که با پایگاه داده از مواد غذایی و آبجو خوبی کار نمی کند که شما به طور ناگهانی قرار داده و آن را با انفورماتیک پزشکی پایگاه داده است. بنابراین حتی بهترین سیستم ما امروز تکیه بر یک سطح پردازش که در آن ما در حال برنامه نویسی دست و ساخت و ساز در زیرساخت در به این سیستم اجرا شود. در حال حاضر، من می خواهم آخرین موضوع قادر به رسیدن به امروز است در مورد ارتباط غیر کلامی. توده بزرگی از اطلاعات است که ما با یکدیگر ارتباط برقرار در مورد از طریق آمده است کلمات فردی که ما در حال استفاده از. این است که با چیزهایی مانند نزدیکی، نگاه، تن خود را از صدا، عطف خود را. و ارتباطات است چیزی که بسیاری از رابط های مختلف مراقبت زیادی در مورد. این چیزی است که سیری در مورد مراقبت است. من می توانم سیری چیزی در یک صدای درخواست و یا در یک لحن های مختلف صدا، و سیری را به من همان جواب بدهد. اما این چیزی است که ما برای ساخت نیست بسیاری از دیگر انواع رابط. من می خواهم به شما معرفی در حال حاضر به یکی از روبات ها. این قدیمی من ساخته شده بود دوست و همکار سینتیا Breazeal از و شرکت او Jibo. و این robot-- ما در حال رفتن به یک زن و شوهر داوطلب تا به تعامل با این. بنابراین می تواند به من دو مردم حاضر با این ربات برای من بازی؟ چرا شما در می آیند تا، و چرا نمی میری در آمده است. اگر شما می خواهم به من تا اینجا ملحق، لطفا. و اگر من می تواند شما حق بر اینجا می آیند. با تشکر. سلام. ALFREDO: از ملاقات شما خوشبختم. آلفردو. برایان SCASSELLATI: آلفردو. راشل: راشل. برایان SCASSELLATI: راشل. از ملاقات شما هر دو. آلفردو، من قصد دارم به شما برای اولین بار. بیا اینجا. من قصد دارم به معرفی you-- اگر من می توانم این خاموش بدون ضربه زدن microphone-- به یک ربات کوچک به نام Jibo. باشه؟ در حال حاضر، Jibo طراحی شده است که تعاملی. و اگر چه آن می تواند به شما سخنرانی، بسیاری از تعامل با ربات غیر کلامی است. آلفردو، من قصد دارم به شما بخواهید به چیزی می گویند خوب و تعریف به ربات، لطفا. ALFREDO: من فکر می کنم شما نگاه زیبا. [وژ صدا] برایان SCASSELLATI: OK. پاسخ آن است کلامی نیست. و در عین حال آن را به شما داد هر دو اذعان روشن که آن را شنیده بود آنچه به شما گفت و همچنین به نحوی که درک. باشه؟ گام را دوباره به اینجا برای یک ثانیه. متشکرم. راشل، اگر شما می توانید. در حال حاضر، من قصد دارم به شما این کار بسیار سخت تر. اگر شما می خواهم ایستاده در اینجا، بازگشت به بالا فقط یک کمی تا ما می توانیم شما را در دوربین و نگاه در این راه. من قصد دارم به شما می خواهیم به چیزی می گویند واقعا معنی و تند و زننده به ربات. راشل: چه شما فقط به نظر می رسید به انجام کاملا پوچ بود. [زمزمه صدا] که حتی بیشتر پوچ بود. چت شده؟ اوه، احساس بد نیست. من شما را در آغوش بگیر. برایان SCASSELLATI: بسیار خوب. با تشکر، راشل. آلفردو، راشل، بچه ها با تشکر بسیار. [تشویق حضار] بنابراین این نوع از تعامل است در از بسیاری جهات برخی از همان قوانین و برخی از همان ساختار به عنوان آنچه ما ممکن است در تعامل زبانی داشته باشد. این هر دو ارتباطی و در خدمت هدف مهم است. و تعامل، در از بسیاری جهات، طراحی شده است به یک اثر خاص بر فرد در تعامل با و یا گوش دادن به ربات. در حال حاضر، من به اندازه کافی خوش شانس هستم به Jibo امروز در اینجا. سام اسپالدینگ است که در اینجا کمک ما را با ربات. و من قصد دارم به درخواست سام به ما یک نسخه ی نمایشی زیبا از رقص Jibo که ما می توانیم در پایان اینجا تماشا کنید. پس پیش بروید، Jibo. SAM: OK، Jibo. حرکات رقص خود را به ما نشان می دهد. [موسیقی] برایان SCASSELLATI: همه حق است، همه. با تشکر از دوستان ما در Jibo. [تشویق حضار] و با تشکر از دوستان ما در آی بی ام برای کمک به امروز. ارتباطات چیزی است که شما قصد برای دیدن آینده تا بیشتر و بیشتر به عنوان ما برای ساخت رابط های پیچیده تر است. هفته آینده، ما می شود صحبت کردن در مورد چگونه به رابط با مخالفان کامپیوتر در بازی ها. اما اگر شما سوالی در مورد این، من در اطراف در ساعات اداری امشب. من خوشحالم که به صحبت شما در مورد AI هستم موضوعات و یا به جزئیات بیشتری دریافت کنید. یک آخر هفته بزرگ است. [تشویق حضار] [موسیقی]