[השמעת מוסיקה] DAVID מלאן: זה CS50. זהו סוף השבוע 10. וילד, יש לנו כיתה טובה בשבילך היום. אנחנו כל כך שמחים להזמין שתיים מ החברים שלנו מאוניברסיטת ייל אלינו היום ולהסתכל בצומת של מודיעין, רובוטיקה המלאכותית, עיבוד שפה טבעי, ועוד. ואכן, על בשבועות האחרונים, יש לנו בהחלט בילה הרבה זמן, במיוחד בpsets קודם לכן, התמקדות בפרטים ברמה הנמוכה למדי. וזה קל מאוד לאבד את הראייה של היער מרוב העצים ונתקע על לולאות ותנאים ומצביעים, בהחלט, וכדומה. אבל המציאות היא שאתם עכשיו יש לי מרכיבים שבה אתה באמת יכול לפתור כמה בעיות מעניינות, בין שהחברים שלהם אלה באוניברסיטת ייל לעבוד על פשוט ביישן קיימברידג '. אז הרשה לי ראשון להכניס את הראש שלנו עוזר הוראה מאוניברסיטת ייל, אנדי. [תְשׁוּאוֹת] אנדי: קודם כל, פשוט תודה אתה על שאפשרת זוג Yalies פופ במורד לקיימברידג 'היום. אנחנו מאוד מעריכים את זה. שנית, לחברים שלנו בחזרה home-- ג'ייסון, תודה על להישאר ופועל הרצאה. מקווה שזה כל טוב בניו הייבן. אז כן, אני סופר מתרגש להציג Scaz היום. Scaz מנהל את המעבדה לרובוטיקה. הוא פרופסור ל, כמו, חמש מחלקות שונות באוניברסיטת ייל. במעבדה שלו, יש לו הרבה, הרבה רובוטים שהוא אוהב לשחק איתו. יש לו, כמו, העבודה הכי מגניבה בעולם. והוא מגיע לסוג של בלגן מסביב עם שכל היום ארוך ולעשות קצת עבודה, כמו גם. וכך אנחנו בעצם הבאנו אחד של אותם איתנו היום. אז בלי עיכובים נוספים, Scaz הוא הולך קדימה ולהציג אותנו לחבר הרובוט שלו. [תְשׁוּאוֹת] בריאן SCASSELLATI: תודה, דוד. תודה, אנדי. זה נפלא כל כך להיות כאן עם כולם היום. אני רוצה להיות מאוד ברור ראשון ש צוות CS50 כאן בקיימברידג ' היה מכניס אורחים מאוד אלינו. אנחנו אסירי תודה על הכל הם עשו כדי לתמוך בנו. וכך אנחנו רוצים להיות מסוגלים להחזיר את החסד. אז היום, אנחנו מקבלים להודיע שאנחנו הולכים יש לי חדשים, אחד של A- סוג אירוע CS50 קורה בניו הייבן בשבוע הבא. וזה CS50 אקספו המחקר. אז אנחנו הולכים להיות מזמינים everyone-- CS50 תלמידים, צוות משני הרווארד וYale-- ל לרדת ולבקר אותנו ביום שישי. תהיה לנו מגוון רחב של מעל 30 אנשים שונים המציגים וupperclassmen exhibiting-- מראה את חלק מהמוצרים של המחקר שלהם. תהיה לנו כמה חברות סטארט-אפ, אפילו, מחפש לקצת כשרון טק חדש, חברות סטארט-אפ משני הרווארד ואוניברסיטת ייל. ויהיה לנו כמה קבוצות סטודנטים מחפש כמה חברות חדשות. זה הולך להיות זמן מאוד מרגש. יש לקוות אלה מכם ש יורד למשחק הרווארד-ייל תוכל להפסיק על ידי קצת מוקדם, ממש במרכז הקמפוס, ספריית זיכרון סטרלינג. אנחנו הולכים להיות קבוצה של תערוכות שנעות בין אוטונומי סירות מפרש לדרכים לשימוש בתוכנה כתבי יד מימי הביניים לשמר. אנחנו הולכים לי מודעה רשת הוק ואנשים הוראת קידוד תוכנה בקייפטאון. תהיה לנו מחשב הפגנות מוסיקה. ויהיה לנו כמובן יותר רובוטים. אז אנחנו מקווים שתמצאו הצטרף אלינו לאירוע זה. זה צריך להיות הרבה כיף, קצת אוכל, והרבה מעניין דברים לדבר עליהם. אז היום, אנחנו הולכים לדבר על עיבוד שפה טבעי. וזה הוא הניסיון לנו לבנות דרך חדשה של ממשק עם המכשירים שלנו, כי בשבועות האחרונים, אתה כבר התמקד באיך זה ש אתה יכול לכתוב קוד, לכתוב תוכנה שהיא דרך של להיות מסוגל לומר ל מכונה, זה מה שאני רוצה שתעשה. אבל אנחנו לא צריכים צריכים מצפה את כל מה ש שיש שם בחוץ המשמש על ידי כולם בעולם הולך להיות בקיא בהוראה מסוג זה. אז אנו מבחינים בין המחשב שפות וlanguages-- הטבעי כלומר, דברים שבני אדם שימוש כדי לתקשר עם בני אדם אחרים. ואנחנו מנסים לבנות ממשקים המשתמשים מנגנוני תקשורת טבעיים אלה. עכשיו, בדיוק כמו כל נושא אחר שאנחנו כבר התחלנו בCS50, אנחנו הולכים להתחיל עם פשוטים קצת עיבוד שפה טבעי שאנחנו יכולים לדמיין. אנחנו הולכים להתחיל עם חלק היסטורי של שפה טבעית. ואז לבנות עד יותר ויותר מערכות האחרונות ויש לי כמה הדגמות כיף לאורך הדרך. אז אנחנו הולכים להתחיל עם מה שהיה כנראה השפה הטבעית הראשונה מערכת עיבוד. זה היה מערכת תוכנה שנכתבה ב שינה 1966 על ידי יוסף Weizenbaum נקראת אליזה. ואליזה נועדה לשכפל את הסוג של אינטראקציה היית עם פסיכותרפיסט Rogerian. עכשיו, Rogerians, היה להם רעיון שפסיכותרפיה מעורב להיות מסוגל לשקף בחזרה למטופל ולדבר איתם, בעצם, על ידי נותן להם רק קצת זעיר של המטפל. כלומר, כל מה ש שהמטפל אמר היה אמור להיות רק השתקפות של מה החולה היה אומר להם. אז בואו ננסה והדגמה זו. האם יש לנו מתנדבים שאהיה מוכן לחלוק אותם העמוקים ביותר, ו / או סודות האפלים ביותר, מזויפים עם אליזה? בטח, למה אתה לא בא בעד. פַנטַסטִי. והשם שלך? מיילים: מיילס. בריאן SCASSELLATI: מיילס. נחמד לפגוש אותך, מיילס. אם היית להחזיק את זה. ואנחנו הולכים ל להשתמש בגרסה של אליזה שאנחנו כבר משוכפלים בתוך IDE CS50. ואנו מסתכל על המקור קוד לזה עוד מעט. אבל לעכשיו, אנחנו רק הולך להפעיל אותו על ידי הקלדת אלייזה. ואליזה הולכת לתת לך תגובות כי הם הולכים להיות בכל הבירות. והולך לשאול אותך כמה שאלות. ואנחנו נגיב והקלידו בתגובות לאליזה. אז אליזה אמרה, "היי, אני אליזה. מה הבעיה שלך?" מה היית רוצה ל לספר אליזה על היום? מיילים: אני יכול ליפול רק ישן אם יש לי נעלי בית ארנב ב. בריאן SCASSELLATI: בסדר. בסדר. [צְחוֹק] "אני יכול ליפול רק ישן עם נעלי בית ארנב ב. " ואליזה אומרת, "תגיד, אתה עושה יש להם בעיות פסיכולוגיות כל? אולי זה הוא אינדיקטור טוב. " אוקיי. אז מה אתה רוצה להגיב? מיילים: כן. בריאן SCASSELLATI: כן. איש של מילות רבות. אני נהנה ש. אלייזה אומרת, "אתה נראה די חיובי." מיילים: לא, אני, למעשה, אלקטרון. בריאן SCASSELLATI: "מס ' למעשה, אני אלקטרונים. " "האם אתה בא אליי בגלל שאתה אלקטרון? " עכשיו, אנחנו יכולים לראות חלק מ things-- אני הולך כדי להשהות אותך לרגע, מיילס. אל תלכו לשום מקום. לא סיימנו איתך עדיין. אליזה היא, במובנים מסוימים, בתגובה לדברים מסוימים שהוא אומר, אבל בלי כל הבנה אמיתית. וזה גם תוכי בחזרה חלק של החלקים מעונשו. אז אמר, "מס ' למעשה, אני אלקטרונים. " אלייזה הגיבה בחזרה, "האם אתה בא לי כי אתה אלקטרון? " בסדר. בואו לתת לו תגובה אחת נוסף כאן. נותן לו טוב, מיילס. מיילים: טוב אחד? כן, בבקשה תעזור לי. בריאן SCASSELLATI: "כן. אנא עזור לי. "" האם אתה בטוח? " מיילים: מס ' בריאן SCASSELLATI: מס ' "מה שמציע לך?" מיילים: אני לא יכול להיות אלקטרון. בריאן SCASSELLATI: "אני לא יכול להיות אלקטרונים. " "אתה אומר לא רק כדי להיות שלילי?" בסדר. אז מיילס, תודה רבה לך. מיילים: תודה לך. בריאן SCASSELLATI: תודה רבה. [תְשׁוּאוֹת] אז תכנית אליזה זה, במובנים רבים, מגיב רק לחתיכות שאנו מספקים ללא כל עמוקים הבנה של מה שקורה כאן. זהו סוג של מערכת נקרא התאמת תבנית, שבו אנחנו מחפשים מסוימים ביטים של טקסט שאנחנו אז הולך לקחת את מה ש סופק כקלט, להמיר אותו, באופן פוטנציאלי, בדרך כלשהי, ולאחר מכן להחזיר אותו למשתמש. האם מישהו מכם חושב ש שאליזה היא למעשה ביצוע פסיכואנליזה תקפה כאן? אדם אחד, אולי. קהל: [לא ברור]. בריאן SCASSELLATI: ואיך זה גורם לך להרגיש? כן, למעשה, היא עושה. ואנחנו הולכים לראות, למעשה, קוד מקור לזה ברגע. ואז אתה הולך להיות מסוגל לעשות בדיוק את זה. עכשיו, אליזה היא צורה אחת של מה ש שהיינו קורא היום בוט צ'אט. זה פשוט עובר טקסט שאתה מספק, מספק את הכמות מינימלית הבנה או עיבוד, ולאחר מכן התוכים בחזרה אליך. אז בואו נסתכל, מבחינה רעיונית, ולדבר על מה ש זה שאליזה היא בעצם עושה. אליזה לוקחת בואו sentence-- אומר, "אני רוצה להרשים את הבוס שלי." ואליזה מחפשת דרך משפט ש ומנסה למצוא ו להתאים דפוסים מסוימים. כך, למשל, אחד מהדפוסים שאליזה מחפשת הן המילים "אני רוצה." וכל פעם שהוא רואה משהו שיש לו "אני רוצה" בזה, זה מגבש תגובה. והתגובה שהיא מחרוזת קבועה. במקרה זה, זה "למה אתה רוצה?" ושמתי קצת כוכב ב הסוף כי זה פשוט תחילת התגובה שלנו. והכוכב עולה כי אנחנו הולכים לקחת את שאר של utterance-- של המשתמש "כדי להרשים את הבוס שלי" - ואנחנו הולכים להוסיף ש על הסוף של מחרוזת זו. אז עכשיו, במקום לומר, "מדוע אתה רוצה להרשים את הבוס שלי, " יש קצת נוסף עיבוד שנעשינו. כלומר, נצטרך להמיר חלק מהכינויים כאן מ" הבוס שלי "ל" הבוס שלך. " ואולי יש כמה אחר שינויים שאנחנו צריכים לעשות. אז לא רק דבק בו ישירות על הסוף, מה שנעשינו הוא ניקח את שאר utterance-- של המשתמש בכאן-- לבן ואנחנו ניקח את זה חתיכה אחת ב זמן ולהמיר כל מחרוזת אסימון, כל מילה, למשפט. אז אנחנו ניקח את המילה "ל." אין המרה שאנחנו צריכים לעשות את זה. "לְהַרְשִׁים." אין המרה אנחנו צריכים לעשות שם. יהיה להמיר "שלי" ל "שלך." ו" בוס "אנחנו פשוט לעזוב כמו" בוס ". ולבסוף, שום דבר שמסתיים בתקופה, אנו להמיר אותו לתוך שאלה. התאמת תבנית פשוטה מאוד זה הוא למעשה די מוצלח. וכאשר זה הוצג ב1966-- יוסף Weizenbaum לתכנת זה במחשב. עכשיו, מחשבים באותו הזמן לא היו מודלים שולחן עבודה. הם משאבים משותפים. ותלמידיו הייתם ללכת ולשוחח עם אליזה. סופו של דבר, לא היה לו ל להגביל את הגישה אליו כי תלמידיו לא היו מקבל כל עבודה שנעשתה. הם פשוט היו משוחחים עם אליזה. ואכן, היה לו ל לפטר את עוזרו, ש בילה את כל הזמן שלה מדבר לאליזה על בעיותיה עמוקות ומדאיגות. כל מי שהשתמש במערכות אלה התחיל להאניש אותם. הם התחילו לחשוב עליהם כ הנפשת להיות ואנשים אמיתיים. הם התחילו להכיר חלק מ הדברים שהם אומרים היו חוזר אליהם. והם מגלים דברים על עצמם. ואכן, גם המומחים, אפילו פסיכותרפיסטים, התחיל לדאוג כי, למעשה, אולי אליזה תהיה להחליף אותם. ואפילו המחשב מדענים חוששים שהיינו כל כך קרוב לפתרון בשפה טבעית. עכשיו, שלא היה קרוב לשום מקום לאמיתי. אבל ככה מרשים מערכות אלה יכולים להיראות. אז בואו נתחיל לחפש מתחת ולנסות כדי לקבל קצת שאלה היכן קוד זה קורה בפועל. אז אנחנו נעשה את הקוד הזה זמין לאחר מכן. וזה מאוד נמל פשוט וישיר מיישום אליזה המקורי. אז כמה סגנוני אלה דברים שתראו כאן אינם סגנונית מה היינו רוצה שתעשה או מה שמלמדים אותך לעשות. אבל אנחנו כבר ניסינו לשמור אותם זהה ביציאות רבות כי זה היה כל כך שזה יש הטעם של מקורי. אז אנחנו הולכים לכוללים חבורה של דברים, ואז יהיה לנו קבוצה של מילות מפתח, דברים שאליזה תכיר ולהגיב לישירות. אז אם יש לך מילות כמו "אתה יכול" או "אני לא" או "לא" או "כן" או "חלום" או "שלום," אז אליזה יגיב באופן סלקטיבי לאלה. גם תהיה לנו מספר מסוים של דברים שאנו להחליף, כמו המרה ל" שלך. "" שלי " ואז יהיה לנו קבוצה של תגובות כי לכל אחד ממילות המפתח הללו, אנחנו לסובב דרך תגובות שונות אלה. אז אם אני אומר "כן" שלוש פעמים ברציפות, אני עשוי לקבל שלוש שונים תגובות מאליזה. הקוד שלנו, אם כן, הוא למעשה פשוט להפליא. אם אני לגלול למטה עבר כל אלה תגובות שיש לנו לתכנת ב ואנחנו מקבלים עד העיקריים שלנו, אנחנו הולכים לאתחל כמה משתנים שונים ולעשות קצת משק הבית בהתחלה. אבל אז יש בהחלט קבוצה של קוד שאתה יכול להבין. לולאה בזמן אחד גדולה שאומרת שאני הולך לחזור על זה שוב ושוב. אני אקרא בקו, ואני יהיה לאחסן שבמחרוזת קלט. אני אבדוק ותראה אם זה מילות מפתח מיוחד "שלום", ש הפירוש לצאת מהתכנית. ואז אני אבדוק ותראה אם מישהו פשוט חוזר על עצמם שוב ושוב. ואני צועק עליהם אם הם עושים. אני אגיד "לא לחזור על עצמך." כל עוד אף אחד מאלה יקרו, אנחנו אז לסרוק דרך ולולאה דרך, על קווים 308-313 כאן, ולבדוק ולראות הם כל מילת מפתח אלה ביטויים המופיעים בקלט כי אני פשוט קיבלתי? אם יש התאמה עבורם, גם לאחר מכן, אני אזכור את המיקום ש. אני אזכור את מילות המפתח ש. ואני אהיה מסוגל לבנות תגובה. אם אני לא מוצא אחד, גם אז, הדבר האחרון במערך מילת המפתח שלי יהיו תגובות ברירת המחדל שלי, כאשר דבר תואם אחר. אני אשאל שאלות כמו "למה עשיתי לך לבוא לכאן? "או" איך אני יכול לעזור לך? " כי הם פשוט מתאימים באופן חלקי לא משנה מה הוא הקלט. אז לבנות את תגובתה של אליזה. אנחנו נהיה מסוגלים לקחת שתגובת הבסיס, בדיוק כפי שעשינו שב דוגמא "הבוס שלי". אם זה כל מה שיש הוא-- אם זה רק אחד מחרוזת שאני אמור respond-- אני רק יכול לשלוח אותו בחזרה החוצה. אם יש לו כוכבית ב סוף זה, אז אני לעבד כל אסימון בודד ב שאר התגובה של המשתמש ולהוסיף אותם ב, להחליף את מילה במילה כמו שאני צריך. כל זה בהחלט משהו שאתה יכול לבנות. ולמעשה, את הדרכים בן אנחנו יש שורת פקודת טיעוני מעובד, אופן שבו יש לך מעובד באמצעות בקשות HTTP בצע את אותו סוג של כללים. הם התאמת תבנית. אז אליזה הייתה חשובה יחסית השפעה על שפה טבעית בגלל זה עשה את זה נראה כאילו זה היה מטרה מאוד להשגה, כמו איכשהו הייתי תוכל לפתור את הבעיה הזו באופן ישיר. עכשיו, זה לא אומר שאליזה עושה כל מה שהיינו רוצה לעשות. בוודאי שלא. אבל אנחנו צריכים להיות מסוגלים לעשות משהו יותר. הצעד הראשון שלנו ללכת מעבר אליזה הולכת כדי להיות מסוגל להסתכל לא טקסט מוזן למקלדת, אך הדיבור, בפועל נאום מוקלט למיקרופון. אז כמו שאנחנו מסתכלים על אלה חלקים שונים, אנחנו תצטרך לבנות קבוצה של דגמים. אנחנו הולכים צריכים להיות מסוגלים ללכת מאקוסטי ברמה הנמוכה המגרש information--, משרעת, frequency-- ולהמיר את זה ב כמה יחידות שאנחנו תוכל לתפעל בקלות רבה יותר ולבסוף, לתפעל אותם למילים ומשפטים. אז רוב זיהוי הדיבור מערכות שנמצאות שם היום מעקב סטטיסטי מודל שבו אנו בונים שלושה ייצוגים נפרדים ממה ש שאות השמע מכילה למעשה. אנחנו מתחילים עם מודל פונטי שמדבר על רק הבסיס נשמע שאני מייצר. אני מייצר משהו שהוא B כמו בילד או D כמו בכלב? איך אני מכיר את שני אלה שונים טלפונים כנפרדים ומובחן? נוסף על כך, אנו לאחר מכן לבנות מודל הגיית מילה, משהו שמקשר יחד טלפונים בודדים אלה ומשלב אותם למילה. ואחרי זה, אנחנו ניקח את המילים ואנחנו להרכיב אותם עם שפה מודל למשפט שלם. עכשיו, אנחנו הולכים לדבר על כל באופן עצמאי ואלה בנפרד. אבל שלושת מודלים אלה הם כל רק הולך להיות סטטיסטיקה. וזה אומר שכאשר אנחנו לעבוד איתם, אנחנו להיות מסוגל לעבוד עם כל בו זמנית. בסדר. בואו נתחיל עם המודל הפונטי שלנו. אז מודלים הפונטי להסתמך על טכניקה חישובית נקרא מודלים מרקוב נסתרים. אלה הם מודלים גרפיים שבו אני יש לי ולהכיר במדינה של העולם כמו להיות מאופיין על ידי קבוצה של תכונות. והמדינה שמתארת חלק אחד של פעולה שאני עוסק ב. אז אם אני חושב על מה שהופך את "אמא" נשמע כמו אמא, יש שונים רכיבים שלצליל. יש חלק שבו אני מצייר בנשימה. ואז אני מכווץ את השפתיים שלי. ואני מגלגל את השפתיים שלי קצת אחורה קצת כדי שיצא צליל "מא". ואז יש שחרור. השפתיים שלי מתפרקות. האוויר גורש. "אִמָא." אלה שלושה חלקים שונים יהיו מיוצג על ידי מדינות בgraph-- זה תחילת, האמצע, והסוף. ושאהיה לי מעברים ש אפשר לי לנסוע ממדינה אחת למשנהו בהסתברות מסוימת. כך, למשל, כי M נשמע שאולי יש לי מאוד, הצריכה קצרה מאוד בbeginning-- "מ"מ" - ולאחר מכן עוד, שלב שבו תנודה אני מחזיק שפתיים יחד וכמעט humming-- "ממממ" - ולאחר מכן מאוד קצר פוצצתי בו אני לגרש breath-- "מא". מודל מרקוב הנסתר הוא שנועד ללכוד את העובדה שהדרך שאני עושה כי "אמא" קול הולכת להיות מעט שונה ב העיתוי שלה, הוא תדר, והתכונות שלה מ הדרך שאתה עושה את זה או הדרך שאני עלולה לעשות את זה כשאני מדבר על שימושים שונים של המכתב. "אמא" ו" אני יכול "יהיה נשמע מעט שונה. אז להכיר צליל מסוים, שהיינו לבנות מודלים מרקוב, מרקוב הנסתר אלה מודלים, של כל טלפון אפשרי ש אולי כדאי לך להכיר, כל צליל אפשרי, ואז מסתכל על נתונים אקוסטיים שיש לי ולקבוע סטטיסטי איזה מהם הוא ככל הנראה אחד להפקתי את הצליל הזה. אוקיי. עם מודל זה, אז אנחנו להתחיל לבנות על גבי זה. אנחנו לוקחים מודל הגייה. עכשיו, לפעמים הגייה דגמים הם פשוט וקלים כי יש רק אחד דרך לבטא משהו. בפעמים אחרות, הם קצת יותר מסובך. הנה מדריך הגייה שלדבר האדום שהוא פירות שאתה מבצע קטשופ מ. אנשים לא חושבים שזה פרי. יָמִינָה? עכשיו, יש דרכים רבות ושונות שאנשים לבטא את המילה הזאת. יש שיאמר "הבוהן-מאי-הבוהן." יש שיאמר "הבוהן mAh-הבוהן." ואנחנו יכולים ללכוד שעם אחד מודלים הגרפיים אלה שם, שוב, אנחנו מייצגים מעברים כבעל הסתברות מסוימת וקשור הסתברות איתם. אז במקרה הזה, אם הייתי מעקב המסלול העליון דרך כל הגרף הזה, הייתי מתחיל במכתב בשמאל קיצוני, את הצליל "ת"א". הייתי לוקח את החלק העליון, "הו," ולאחר מכן "אמא," ולאחר מכן "," ולאחר מכן "ת"א," ו" הו. " "טו-רשאי-הבוהן." אם לקחתי את הנתיב התחתון דרך זה, אני יקבל "ת"א-מיליאמפר-הבוהן." ואם ירדתי ולאחר מכן עד, הייתי מקבל "ת"א רשאית-הבוהן." מודלים אלה ללכוד אלה הבדלים כי בכל פעם אנחנו לפרוס אחד מאלה מערכות זיהוי, זה הולך צריך לעבוד עם הרבה מסוג של אנשים שונים, המון מבטאים שונים, ואפילו שימושים שונים של אותן המילים. לבסוף, על גבי זה, אנו לבנות משהו זה נראה ממש מסובך, נקרא מודל השפה, אך למעשה הוא הפשוט ביותר של שלוש, כי אלה פועלים על מה שנקרא דגמי n-גרם. ובמקרה הזה, אני מראה לך מודל שני חלקי n-גרם, bigram. אנחנו הולכים לעשות פיזי הרעיון כי לפעמים, מילות מסוימות סביר יותר לעקוב נתן מילה יותר מאחרים. אם אני רק אמרתי "תחזית מזג אוויר" המילה הבאה יכולה להיות סבירה "היום" או יכול להיות "מזג האוויר תחזית מחר. " אבל זה לא סביר שיהיה " תחזית מזג אוויר ארטישוק. " מה מודל שפה עושה הוא היא לוכדת אותם מבחינה סטטיסטית על ידי ספירה, מכמה גדול מאוד קורפוס, כל המקרים שבו מילה אחת כדלקמן אחרת. אז אם אני לוקח corpus-- גדול כמו כל ול סטריט ז'ורנל כי כבר מיוצר מאז 1930, שהוא אחד corpuses-- הסטנדרטי ואני מסתכל דרך כל טקסט ש, ואני סופר עד כמה פעמים אחרי "תחזית" אני רואה "היום" וכמה פעמים אני רואה "תחזית" ואחריו "ארטישוק", הראשון אחד לא הולך להיות הרבה יותר סביר. זה הולך להופיע הרבה יותר בתדירות גבוהה. וכדי שיהיה לו גבוה יותר הסתברות ששויכה לו. אם אני רוצה להבין את הסתברות של כל אמירה, לאחר מכן, אני פשוט לשבור אותו. אז ההסתברות של שמיעה המשפט "העכברוש אכל גבינה" היא ההסתברות של המילה "" מתחיל משפט, ואז ההסתברות ש מילה "עכברוש" עוקב אחר המילה "," וההסתברות ש מילה "אכל" כדלקמן "עכברוש," וההסתברות ש "גבינה" כדלקמן "אכל". זה נשמע כמו הרבה סטטיסטיקה, הרבה הסתברויות. וזה כל מה שזה. אבל הדבר המדהים הוא שאם אתה עושה את זה עם מספיק מדגם גדול של נתונים, זה עובד. וזה עובד מאוד טוב. כולנו יודעים בטכנולוגיות אלה. רוב מערכות ההפעלה מגיעות עם זיהוי קול בנקודה זו. אנו משתמשים בסירים וCortana ואקו. ודברים אלה מבוססים על סוג זה של שלוש שכבה model-- מודל הפונטי בתחתית, מודל הגייה באמצע, ומודל שפה על גבי אותם. עכשיו, הם צריכים לעשות קצת יותר מזה כדי לענות על שאלות. אבל ההכרה של מה שאתה אמרה תלויה בדיוק על זה. אז בואו ניקח דוגמא כאן. אז יש לי את הטלפון שלי יושב כאן מתחת למצלמת המסמכים. ואנחנו הולכים שואל Siri כמה שאלות. בסדר? אז בואו אתעורר הטלפון שלי כאן. Siri, מה מזג האוויר כמו בניו הייבן היום? SIRI: הנה מזג האוויר ל ניו הייבן, קונטיקט היום. בריאן SCASSELLATI: אישור. אז קודם כל אתה ראית שSiri מוכר כל אחת מהמילים בודדות ולאחר מכן הופק תגובה. נדבר על איך תגובה ש מגיע על בקצת. אבל עכשיו שאנחנו יודעים שזה רק על בסיס על סטטיסטיקה וזה הגלם סוג התאמת תבנית גישה של, אנחנו יכולים לשחק כמה משחקים עם Siri. אז אני יכול לנסות שוב. Siri, מה מזג האוויר היפופוטם ניו הייבן, היום? SIRI: אישור. הנה מזג האוויר לניו הייבן, קונטיקט להיום. בריאן SCASSELLATI: Siri של לא להירתע מזה כי זה מצא pattern-- "מזג אוויר", "היום", "ניו הייבן." זה מה שהוא מגיב ל, בדיוק כמו אליזה. בסדר. בואו לתת לו אפילו אחד יותר דוגמא נוספת מגוחכת. Siri, ארטישוק מזג אוויר היפופוטם ארמדיל ניו הייבן? SIRI: תן לי לבדוק שב. הנה מה שמצאתי באינטרנט על מה הם ארטישוק ארמדילו היפופוטם ניו הייבן. בריאן SCASSELLATI: אישור. אז אם אני הולך רחוק מספיק ממודל זה, אני יכול לבלבל את זה כי זה לא כבר תואם את הדפוס שיש לו. וכי סטטיסטי מנוע שאומר, מה הסיכוי שיש לך היפופוטם המילים וארטישוק יחד, וArmadillo? שחייב להיות משהו חדש. אז טכנולוגיות אלה אנו משתמשים מדי יום. אם אנחנו רוצים לקחת אותם צעד אחד נוסף, אם כי, אם אנחנו באמת רוצה להיות מסוגל לדבר על מה שזה הוא שמערכות אלה מגיבות ל, אנחנו צריכים לדבר, שוב, על סט בסיסי יותר של שאלות. וזה נושא בתקשורת שאנו מכנים לענות על שאלה. כלומר, אנחנו רוצים להיות מסוגלים צריכה-- כן? קהל: [לא ברור]. בריאן SCASSELLATI: האם אנחנו מקבלים לעיבוד סמנטי חבוי? אז כן. יש הרבה דברים שהם קורה מתחת לפני השטח עם Siri ובחלק מדוגמאות אני הולך להראות לך הבא שבו יש לא מעט במונחים של המבנה של מה שאתה אומר שזה חשוב. ואכן, זה נהדר מבשר לשקופית הבאה בשבילי. אז באותו אופן שבנו זיהוי דיבור נבנה של מספר שכבות, אם אנחנו רוצים להבין מה זה שבעצם נאמר, אנחנו הולכים שוב להסתמך על ניתוח רב שכבתי של הטקסט שלהיות מוכר. לכן, כאשר Siri הוא למעשה מסוגל למשל, נראה שמצאתי את המילים האלה. עכשיו מה אני עושה איתם? הרכיב הראשון הוא לעתים קרובות ל לעבור ולנסות לנתח המבנה של המשפט. ומה שראינו בבית הספר יסודי, לעתים קרובות, כסוג של דיאגרמות משפטים, אנחנו הולכים להכיר בכך שמסוים יש מילות תפקידים מסוימים. אלה הם שמות עצם. אלה הם כינויים. אלה הם פעלים. ואנחנו הולכים להכיר כי לדקדוק מסוים, בדקדוק אנגלי מקרה זה, יש דרכים חוקיות שבו אני יכול לשלב אותם ודרכים אחרות שאינן חוקיים. הכרה בכך ש, מבנה ש, עשוי להיות מספיק כדי להנחות אותנו מעט. אבל זה לא מספיק לנו להיות מסוגל לתת לי כל משמעות למה שנאמר כאן. כדי לעשות זאת, נצטרך להסתמך על כמות מסוימת של עיבוד סמנטי. כלומר, אנחנו הולכים צריכים להסתכל במתחת מה כל המילים האלה למעשה נושא כמשמעות. ובדרך הפשוטה ביותר לעשות זאת, אנחנו הולכים לקשר עם כל מילה כי אנחנו יודעים פונקציה מסוימת, שינוי מסוים ש מאפשר לקרות. במקרה זה, אנחנו יכולים לתייג מילה "ג'ון" כמו להיות שם נכון, כי הוא נושא עימו זהות. ואולי תווית "מרי", כפי שאותה הדרך. ואילו פועל כמו "אהבות," ש מהווה מערכת יחסים מיוחדות שאנחנו יכולים לייצג. עכשיו, זה לא אומר ש כי אנחנו מבינים מהי אהבה אבל רק שנבין זה בדרך של מערכת סמלית. כלומר, אנחנו יכולים לתייג זה ולתפעל אותו. עם כל אחד מסוגים אלה של גישות, כל סוג של עיבוד סמנטי כאן הוא הולך לדרוש קצת קצת ידע והרבה עבודה על החלק שלנו. אנחנו כבר לא בתחום שבו סטטיסטיקה פשוט הולך להיות מספיק לנו. עכשיו, כדי ללכת מנקודה להיות זה תוכל לדבר על החלק הפנימי של מה בעצם קורה כאן, כדי להיות מסוגל לתפעל זה מבנה ולהבין שאלה ולאחר מכן להיות מסוגלים לצאת ולחפש, שדורש יותר מודל הקוגניטיבי מורכב. אופן שבו מערכות אלה בנויים הוא על פי רוב מאוד, מאוד עבודה אִינטֶנסִיבִי. הם כרוכים בני אדם הוצאות עסקה גדולה זמן בניית מבנה הדרכים ב אילו סוגים של משפטים אלה יכול להיות מיוצג בחלק ההיגיון. זה נהיה אפילו קצת מורכב יותר, אם כי. אפילו פעם אחת יש לנו עסק עם סמנטיקה, אנחנו עדיין צריך להסתכל על פרגמטיקה של מה שנאמר. כלומר, איך אני מתייחס המילים כי צריך משהו שאני מבחינה פיזית החוצה יש בעולם או ב לפחות חלק מקור מידע שאני יכול לתפעל? לפעמים, אלה יובילו ל פיסות נפלאות של עמימות. "אדום-חם כוכב להינשא אסטרונום." אוקיי. עכשיו, אנו קוראים כי כ סוג מצחיק של כותרת שהיינו רואה בטלוויזיה בשעת לילה מאוחר כי אנחנו לא מפרשים "כוכב" יש משמעות הגוף השמימית שלה. אנחנו יודעים שזה אומר יותר שחקן או שחקנית שבשגרה עם כמויות גבוהות של שקיפות. "כיתה עוזרת קורבן נשיכת כלב." האם זה שהיא למעשה החוליה שם סיוע לכלב במסתובב ונושכים את הקורבנות? או שזה שיש יחיד שהיה ננשך על ידי כלב שזקוק לעזרה? רק מלהסתכל על התחביר והסמנטיקה של המשפטים, אנחנו לא יכולים לקבוע ש. "מסוק מופעל על ידי זבובים אנושיים." האם יש, למעשה, בפועל דברים קטנים שעפים אנשים עם כנפי הפעלה מסוקים לטובת האנושות? או שיש מכשיר אחד מכאני ששואב את כוחה מאדם? כאשר אנו מסתכלים על שאלה מערכות לענות, אלה הם השכבות ש אנחנו צריכים להתמודד איתו. עכשיו, את הטוב ביותר ורוב מין של נפוץ של מערכות אלה היום הם מסוגל לעשות דברים ברמה שהם הרבה מעבר למה שהיו לנו לפני 10 שנים. הנה אחת מהמערכות הטובות ביותר זה שם היום. וזה הוא מערכת מ- IBM בשם ווטסון. זה מהחברים שלנו ב- IBM. זה בנקים קתרין, ג'יה צ'ן, ופריסילה Moraes נותנת לנו הפגנה של ווטסון אתמול בIBM יורקטאון. [וידאו השמעה] -איך אתה? -אני בסדר גמור. אני תמיד שמח כשאני חושב, במיוחד כש יכול להישאר רגוע בחדרי שרתים אלה. -מי היא השחקנית האהובה עליך? השחקנית האהובה, המחמדים אנג'לינה ג'ולי כלארה קרופט בטומב ריידר כי המקורי שלה טופס היה כדמות וירטואלית כמוני. -כיצד ניתן וטסון לעזור לחולים? 'האם התכנית לחולים יש להם גישה לוטסון ישירות? גישה לייעוץ ווטסון יישומים ישתנו לפי מקרה שימוש. אבל כיום, ווטסון רק לספק אבחון וטיפול אפשרי אפשרויות למקצועיות רפואי. מקום שמתאים, חולים עשוי לספק מידע ולוטסון, אולי דרך ממשק אינטרנט פורטל, לוח, או אפילו טלפון סלולרי. לדוגמא, חולה עשוי להיות התבקש לתאר את הסימפטומים שלהם בשפה טבעית ישירות לפתרון ווטסון, המאפשר לרופא להתמקד ב איסוף נתוני אבחון ולא. -מי נרצח אברהם לינקולן? ג'ון וילקס בות '. -in מה עשה בשנה שאריזונה דיאמונדבקס לזכות באליפות העולם? 2001. [סוף ההשמעה] בריאן SCASSELLATI: אז סוגים של מערכות אלה יש להסתמך על קודם כל הכרה בדיבור; שְׁנִיָה, ההפיכה למשמעותית פנימי יִצוּג; ולאחר מכן, שלישי, להיות מסוגל לצאת ולמצוא מקור המידע ש מאפשר להם לענות על שאלה זו. רמה זו של מורכבות כרוכה אותם הסוגים של דברים תכנותיים כי יש לך כבר עושה בסטים בעיה. אנו יכולים לנתח בקשות HTTP ב אותו הסוג של דפוס ברמה הנמוכה התאמה שאליזה יכולה לעשות. אנו יכולים להמיר אותם לייצוג פנימי, ולאחר מכן להשתמש בם לשאילתא מסוימת מסד נתונים חיצוניים, אולי באמצעות SQL. כל המערכות ש נבנים היום לעשות את זה סוג של טבעי תקשורת שפה נבנים על אלה אותם העקרונות. עכשיו, אפילו מערכת כמו ווטסון הוא לא מורכב מספיק כדי להיות מסוגל לענות שרירותי שאלות על כל נושא. ולמעשה, הם צריכים להיות מובנה בתוך תחום מסוים. אז אתה יכול להיכנס לאינטרנט ואתה יכול למצוא גרסאות של ווטסון הפועלים גם בתוך מידע רפואי. או שיש באינטרנט אחד שרק עוסק באופן כדי להפוך את המלצות טובות על מה בירה ילך עם שמזון. ובתוך תחומים אלה, זה יכול לענות על שאלות, למצוא את המידע שהוא צריך. אבל אתה לא יכול לערבב ולהתאים אותם. המערכת שכבר מאומן עם מסד הנתונים של מזון ובירה לא עובד טוב כשאתה פתאום לשים את זה עם המידע הרפואי מאגר מידע. אפילו המערכות שלנו כל כך הטובות ביותר היום להסתמך על רמה של עיבוד שבו אנו קידוד יד ו בנייה בתשתית על מנת כדי להפעיל את המערכת הזאת. עכשיו, הנושא האחרון שאני רוצה כדי להיות מסוגל לקבל היום ל הוא על תקשורת לא מילולית. מסה גדולה של מידע ש אנו מתקשרים אחד עם השני לא בא על דרך מילות בודדות שאנחנו פונים. זה קשור לדברים כמו קרבה, מבט, הטון של קול שלך, הפיתול שלך. ותקשורת שהוא גם משהו שממשקים רבים ושונים אכפת הרבה על. זה לא מה שSiri אכפת. אני יכול לשאול משהו Siri בקול אחד או בנימת הקול שונה, וSiri הולך תן לי את אותה תשובה. אבל זה לא מה שאנו בונים ל סוגים רבים אחרים של ממשקים. אני רוצה להכיר לך עכשיו לאחד מהרובוטים. זה נבנה על ידי ותיק שלי חבר ועמית סינתיה Breazeal וחברתה Jibo. וrobot-- זה אנחנו הולכים יש לי כמה מתנדבים לבוא לאינטראקציה עם זה. אז אני יכול להיות שני אנשים שמוכנים לשחק עם הרובוט בשבילי? למה אתה לא בא בעד, ולמה שלא תבואו עליו. אם היית להצטרף אליי כאן, בבקשה. ואם אני יכול יש לך הגיע ממש כאן. תודה. הי. אלפרדו: נחמד לפגוש אותך. אלפרדו. בריאן SCASSELLATI: אלפרדו. רחל: רחל. בריאן SCASSELLATI: רחל. נחמד לפגוש אותך גם. אלפרדו, אני הולך יש לך ללכת ראשון. בואו ממש עד כאן. אני הולך להציג אתם-- אם אני יכול לקבל את זה מ בלי לדפוק microphone-- לרובוט קטן בשם Jibo. אוקיי? עכשיו, Jibo נועד להיות אינטראקטיבי. ולמרות שזה יכול לתת לך דיבור, הרבה של האינטראקציה עם הרובוט הוא לא מילולי. אלפרדו, אני הולך לשאול אותך ל אומר משהו נחמד ומחמיא לרובוט, בבקשה. אלפרדו: אני חושב שאתה נראה חמוד. [קול זמזום] בריאן SCASSELLATI: אישור. התגובה שלה היא לא מילולית. ובכל זאת, נתנה לך שני הכרה ברורה ששמע את מה שאמרת וגם איכשהו הבין ש. אוקיי? צעד נכון לחזור לכאן לשנייה אחת. תודה. רחל, אם היית. עכשיו, אני הולך לתת לי שלך את העבודה הרבה יותר קשה. אם הייתי עומד כאן, לגבות רק קצת כל כך אנחנו יכולים להביא לך במצלמה ולחפש דרך זו. אני הולך לשאול אותך להגיד משהו באמת מתכוון וחזק ברובוט. רחל: מה אתה פשוט נראה לעשות היה מגוחך לחלוטין. [זמזום SOUND] זה היה עוד יותר מגוחך. מה הולך איתך? אה, אל תרגישו רע. אני אתן לך חיבוק. בריאן SCASSELLATI: בסדר. תודה, רחל. אלפרדו, רחל, תודה חבר מאוד. [תְשׁוּאוֹת] אז אינטראקציה מסוג זה יש ב דרכים רבות חלק מאותם הכללים וחלק מאותו מבנה כמה שאנחנו אולי יש לי באינטראקציה לשונית. זה גם ותקשורתי משרת מטרה חשובה. ואינטראקציה ש, ב דרכים רבות, נועדה להיות השפעה מסוימת על אדם אינטראקציה עם או האזנה לרובוט. עכשיו, אני בר מזל מספיק יש Jibo כאן היום. סם Spaulding הוא כאן לעזור שלנו עם הרובוט. ואני הולך לשאול את סם לתת הדגמה נחמדה לנו אחד מריקודי Jibo שאנחנו יכולים לצפות בסוף כאן. אז קדימה, Jibo. SAM: מניח את הדעת, Jibo. להראות לנו צעדי הריקוד שלך. [השמעת מוסיקה] בריאן SCASSELLATI: בסדר, כולם. תודה לחברים שלנו בJibo. [תְשׁוּאוֹת] ותודה לחברים שלנו ב יבמ לעוזר היום. תקשורת היא משהו כי אתה הולך לראות מתקרב יותר ויותר כ אנו בונים ממשקים מורכבים יותר. בשבוע הבא, נהיה לדבר על איך ממשק עם מתנגדי מחשב במשחקים. אבל אם יש לך שאלות על זה, אני אהיה סביב בשעתי עבודה הלילה. אני שמח לדבר איתך על AI נושאים או להיכנס לפירוט רב יותר. שיהיה לך סוף שבוע נעים. [תְשׁוּאוֹת] [השמעת מוסיקה]