1 00:00:00,000 --> 00:00:02,928 >> [השמעת מוסיקה] 2 00:00:02,928 --> 00:00:11,230 3 00:00:11,230 --> 00:00:12,790 >> DAVID מלאן: זה CS50. 4 00:00:12,790 --> 00:00:14,072 זהו סוף השבוע 10. 5 00:00:14,072 --> 00:00:16,030 וילד, יש לנו כיתה טובה בשבילך היום. 6 00:00:16,030 --> 00:00:20,040 אנחנו כל כך שמחים להזמין שתיים מ החברים שלנו מאוניברסיטת ייל אלינו היום 7 00:00:20,040 --> 00:00:23,920 ולהסתכל בצומת של מודיעין, רובוטיקה המלאכותית, 8 00:00:23,920 --> 00:00:25,710 עיבוד שפה טבעי, ועוד. 9 00:00:25,710 --> 00:00:27,090 >> ואכן, על בשבועות האחרונים, יש לנו 10 00:00:27,090 --> 00:00:29,714 בהחלט בילה הרבה זמן, במיוחד בpsets קודם לכן, 11 00:00:29,714 --> 00:00:31,560 התמקדות בפרטים ברמה הנמוכה למדי. 12 00:00:31,560 --> 00:00:34,520 וזה קל מאוד לאבד את הראייה של היער מרוב העצים 13 00:00:34,520 --> 00:00:38,170 ונתקע על לולאות ותנאים ומצביעים, בהחלט, וכדומה. 14 00:00:38,170 --> 00:00:41,770 אבל המציאות היא שאתם עכשיו יש לי מרכיבים שבה אתה באמת יכול 15 00:00:41,770 --> 00:00:45,300 לפתור כמה בעיות מעניינות, בין שהחברים שלהם אלה באוניברסיטת ייל 16 00:00:45,300 --> 00:00:48,790 לעבוד על פשוט ביישן קיימברידג '. 17 00:00:48,790 --> 00:00:52,410 >> אז הרשה לי ראשון להכניס את הראש שלנו עוזר הוראה מאוניברסיטת ייל, אנדי. 18 00:00:52,410 --> 00:00:55,182 >> [תְשׁוּאוֹת] 19 00:00:55,182 --> 00:00:57,030 20 00:00:57,030 --> 00:01:00,710 >> אנדי: קודם כל, פשוט תודה אתה על שאפשרת זוג Yalies 21 00:01:00,710 --> 00:01:02,700 פופ במורד לקיימברידג 'היום. 22 00:01:02,700 --> 00:01:05,299 אנחנו מאוד מעריכים את זה. 23 00:01:05,299 --> 00:01:07,090 שנית, לחברים שלנו בחזרה home-- ג'ייסון, 24 00:01:07,090 --> 00:01:09,670 תודה על להישאר ופועל הרצאה. 25 00:01:09,670 --> 00:01:12,970 מקווה שזה כל טוב בניו הייבן. 26 00:01:12,970 --> 00:01:15,720 >> אז כן, אני סופר מתרגש להציג Scaz היום. 27 00:01:15,720 --> 00:01:17,020 Scaz מנהל את המעבדה לרובוטיקה. 28 00:01:17,020 --> 00:01:19,690 הוא פרופסור ל, כמו, חמש מחלקות שונות באוניברסיטת ייל. 29 00:01:19,690 --> 00:01:23,159 במעבדה שלו, יש לו הרבה, הרבה רובוטים שהוא אוהב לשחק איתו. 30 00:01:23,159 --> 00:01:24,950 יש לו, כמו, העבודה הכי מגניבה בעולם. 31 00:01:24,950 --> 00:01:27,116 והוא מגיע לסוג של בלגן מסביב עם שכל היום 32 00:01:27,116 --> 00:01:29,090 ארוך ולעשות קצת עבודה, כמו גם. 33 00:01:29,090 --> 00:01:33,070 >> וכך אנחנו בעצם הבאנו אחד של אותם איתנו היום. 34 00:01:33,070 --> 00:01:36,900 אז בלי עיכובים נוספים, Scaz הוא הולך קדימה ולהציג אותנו 35 00:01:36,900 --> 00:01:38,660 לחבר הרובוט שלו. 36 00:01:38,660 --> 00:01:41,546 >> [תְשׁוּאוֹת] 37 00:01:41,546 --> 00:01:42,935 38 00:01:42,935 --> 00:01:44,310 בריאן SCASSELLATI: תודה, דוד. 39 00:01:44,310 --> 00:01:45,380 תודה, אנדי. 40 00:01:45,380 --> 00:01:50,050 זה נפלא כל כך להיות כאן עם כולם היום. 41 00:01:50,050 --> 00:01:56,490 אני רוצה להיות מאוד ברור ראשון ש צוות CS50 כאן בקיימברידג ' 42 00:01:56,490 --> 00:01:59,190 היה מכניס אורחים מאוד אלינו. 43 00:01:59,190 --> 00:02:02,130 אנחנו אסירי תודה על הכל הם עשו כדי לתמוך בנו. 44 00:02:02,130 --> 00:02:05,690 וכך אנחנו רוצים להיות מסוגלים להחזיר את החסד. 45 00:02:05,690 --> 00:02:09,370 >> אז היום, אנחנו מקבלים להודיע שאנחנו הולכים יש לי חדשים, 46 00:02:09,370 --> 00:02:15,240 אחד של A- סוג אירוע CS50 קורה בניו הייבן בשבוע הבא. 47 00:02:15,240 --> 00:02:18,040 וזה CS50 אקספו המחקר. 48 00:02:18,040 --> 00:02:21,300 אז אנחנו הולכים להיות מזמינים everyone-- CS50 תלמידים, 49 00:02:21,300 --> 00:02:26,510 צוות משני הרווארד וYale-- ל לרדת ולבקר אותנו ביום שישי. 50 00:02:26,510 --> 00:02:30,400 תהיה לנו מגוון רחב של מעל 30 אנשים שונים המציגים 51 00:02:30,400 --> 00:02:34,830 וupperclassmen exhibiting-- מראה את חלק מהמוצרים של המחקר שלהם. 52 00:02:34,830 --> 00:02:38,480 תהיה לנו כמה חברות סטארט-אפ, אפילו, מחפש לקצת כשרון טק חדש, 53 00:02:38,480 --> 00:02:40,460 חברות סטארט-אפ משני הרווארד ואוניברסיטת ייל. 54 00:02:40,460 --> 00:02:44,550 ויהיה לנו כמה קבוצות סטודנטים מחפש כמה חברות חדשות. 55 00:02:44,550 --> 00:02:46,357 >> זה הולך להיות זמן מאוד מרגש. 56 00:02:46,357 --> 00:02:49,190 יש לקוות אלה מכם ש יורד למשחק הרווארד-ייל 57 00:02:49,190 --> 00:02:51,360 תוכל להפסיק על ידי קצת מוקדם, 58 00:02:51,360 --> 00:02:54,060 ממש במרכז הקמפוס, ספריית זיכרון סטרלינג. 59 00:02:54,060 --> 00:02:58,040 אנחנו הולכים להיות קבוצה של תערוכות שנעות בין אוטונומי 60 00:02:58,040 --> 00:03:04,460 סירות מפרש לדרכים לשימוש בתוכנה כתבי יד מימי הביניים לשמר. 61 00:03:04,460 --> 00:03:07,860 >> אנחנו הולכים לי מודעה רשת הוק ואנשים 62 00:03:07,860 --> 00:03:11,230 הוראת קידוד תוכנה בקייפטאון. 63 00:03:11,230 --> 00:03:13,730 תהיה לנו מחשב הפגנות מוסיקה. 64 00:03:13,730 --> 00:03:16,020 ויהיה לנו כמובן יותר רובוטים. 65 00:03:16,020 --> 00:03:18,900 אז אנחנו מקווים שתמצאו הצטרף אלינו לאירוע זה. 66 00:03:18,900 --> 00:03:21,350 זה צריך להיות הרבה כיף, קצת אוכל, 67 00:03:21,350 --> 00:03:24,430 והרבה מעניין דברים לדבר עליהם. 68 00:03:24,430 --> 00:03:28,230 >> אז היום, אנחנו הולכים לדבר על עיבוד שפה טבעי. 69 00:03:28,230 --> 00:03:32,560 וזה הוא הניסיון לנו לבנות דרך חדשה של ממשק 70 00:03:32,560 --> 00:03:35,150 עם המכשירים שלנו, כי בשבועות האחרונים, 71 00:03:35,150 --> 00:03:40,800 אתה כבר התמקד באיך זה ש אתה יכול לכתוב קוד, לכתוב תוכנה 72 00:03:40,800 --> 00:03:47,110 שהיא דרך של להיות מסוגל לומר ל מכונה, זה מה שאני רוצה שתעשה. 73 00:03:47,110 --> 00:03:50,210 >> אבל אנחנו לא צריכים צריכים מצפה את כל מה ש 74 00:03:50,210 --> 00:03:53,760 שיש שם בחוץ המשמש על ידי כולם בעולם 75 00:03:53,760 --> 00:03:57,480 הולך להיות בקיא בהוראה מסוג זה. 76 00:03:57,480 --> 00:04:02,540 אז אנו מבחינים בין המחשב שפות וlanguages-- הטבעי 77 00:04:02,540 --> 00:04:06,720 כלומר, דברים שבני אדם שימוש כדי לתקשר עם בני אדם אחרים. 78 00:04:06,720 --> 00:04:12,270 ואנחנו מנסים לבנות ממשקים המשתמשים מנגנוני תקשורת טבעיים אלה. 79 00:04:12,270 --> 00:04:16,029 >> עכשיו, בדיוק כמו כל נושא אחר שאנחנו כבר התחלנו בCS50, 80 00:04:16,029 --> 00:04:19,589 אנחנו הולכים להתחיל עם פשוטים קצת עיבוד שפה טבעי 81 00:04:19,589 --> 00:04:21,269 שאנחנו יכולים לדמיין. 82 00:04:21,269 --> 00:04:24,940 אנחנו הולכים להתחיל עם חלק היסטורי של שפה טבעית. 83 00:04:24,940 --> 00:04:28,740 ואז לבנות עד יותר ויותר מערכות האחרונות 84 00:04:28,740 --> 00:04:31,450 ויש לי כמה הדגמות כיף לאורך הדרך. 85 00:04:31,450 --> 00:04:35,900 >> אז אנחנו הולכים להתחיל עם מה שהיה כנראה השפה הטבעית הראשונה 86 00:04:35,900 --> 00:04:38,210 מערכת עיבוד. 87 00:04:38,210 --> 00:04:45,080 זה היה מערכת תוכנה שנכתבה ב שינה 1966 על ידי יוסף Weizenbaum נקראת אליזה. 88 00:04:45,080 --> 00:04:49,640 ואליזה נועדה לשכפל את הסוג של אינטראקציה 89 00:04:49,640 --> 00:04:53,850 היית עם פסיכותרפיסט Rogerian. 90 00:04:53,850 --> 00:04:57,210 עכשיו, Rogerians, היה להם רעיון שפסיכותרפיה 91 00:04:57,210 --> 00:05:02,800 מעורב להיות מסוגל לשקף בחזרה למטופל ולדבר איתם, 92 00:05:02,800 --> 00:05:08,100 בעצם, על ידי נותן להם רק קצת זעיר של המטפל. 93 00:05:08,100 --> 00:05:09,920 כלומר, כל מה ש שהמטפל אמר 94 00:05:09,920 --> 00:05:16,500 היה אמור להיות רק השתקפות של מה החולה היה אומר להם. 95 00:05:16,500 --> 00:05:18,990 >> אז בואו ננסה והדגמה זו. 96 00:05:18,990 --> 00:05:22,820 האם יש לנו מתנדבים שאהיה מוכן לחלוק אותם העמוקים ביותר, 97 00:05:22,820 --> 00:05:26,650 ו / או סודות האפלים ביותר, מזויפים עם אליזה? 98 00:05:26,650 --> 00:05:29,680 בטח, למה אתה לא בא בעד. 99 00:05:29,680 --> 00:05:30,847 פַנטַסטִי. 100 00:05:30,847 --> 00:05:31,430 והשם שלך? 101 00:05:31,430 --> 00:05:32,000 >> מיילים: מיילס. 102 00:05:32,000 --> 00:05:33,041 >> בריאן SCASSELLATI: מיילס. 103 00:05:33,041 --> 00:05:34,270 נחמד לפגוש אותך, מיילס. 104 00:05:34,270 --> 00:05:36,270 אם היית להחזיק את זה. 105 00:05:36,270 --> 00:05:40,840 ואנחנו הולכים ל להשתמש בגרסה של אליזה 106 00:05:40,840 --> 00:05:44,640 שאנחנו כבר משוכפלים בתוך IDE CS50. 107 00:05:44,640 --> 00:05:47,140 ואנו מסתכל על המקור קוד לזה עוד מעט. 108 00:05:47,140 --> 00:05:49,910 אבל לעכשיו, אנחנו רק הולך להפעיל אותו על ידי הקלדת אלייזה. 109 00:05:49,910 --> 00:05:55,480 >> ואליזה הולכת לתת לך תגובות כי הם הולכים להיות בכל הבירות. 110 00:05:55,480 --> 00:05:57,950 והולך לשאול אותך כמה שאלות. 111 00:05:57,950 --> 00:06:02,130 ואנחנו נגיב והקלידו בתגובות לאליזה. 112 00:06:02,130 --> 00:06:04,310 אז אליזה אמרה, "היי, אני אליזה. 113 00:06:04,310 --> 00:06:05,462 מה הבעיה שלך?" 114 00:06:05,462 --> 00:06:08,092 מה היית רוצה ל לספר אליזה על היום? 115 00:06:08,092 --> 00:06:10,750 >> מיילים: אני יכול ליפול רק ישן אם יש לי נעלי בית ארנב ב. 116 00:06:10,750 --> 00:06:12,440 >> בריאן SCASSELLATI: בסדר. 117 00:06:12,440 --> 00:06:13,360 בסדר. 118 00:06:13,360 --> 00:06:15,300 >> [צְחוֹק] 119 00:06:15,300 --> 00:06:22,410 >> "אני יכול ליפול רק ישן עם נעלי בית ארנב ב. " 120 00:06:22,410 --> 00:06:29,000 ואליזה אומרת, "תגיד, אתה עושה יש להם בעיות פסיכולוגיות כל? 121 00:06:29,000 --> 00:06:30,450 אולי זה הוא אינדיקטור טוב. " 122 00:06:30,450 --> 00:06:30,780 >> אוקיי. 123 00:06:30,780 --> 00:06:32,245 אז מה אתה רוצה להגיב? 124 00:06:32,245 --> 00:06:36,110 125 00:06:36,110 --> 00:06:36,970 >> מיילים: כן. 126 00:06:36,970 --> 00:06:38,660 >> בריאן SCASSELLATI: כן. 127 00:06:38,660 --> 00:06:39,570 איש של מילות רבות. 128 00:06:39,570 --> 00:06:41,870 אני נהנה ש. 129 00:06:41,870 --> 00:06:50,200 אלייזה אומרת, "אתה נראה די חיובי." 130 00:06:50,200 --> 00:06:53,200 >> מיילים: לא, אני, למעשה, אלקטרון. 131 00:06:53,200 --> 00:06:55,150 >> בריאן SCASSELLATI: "מס ' 132 00:06:55,150 --> 00:07:02,240 למעשה, אני אלקטרונים. " "האם אתה בא אליי 133 00:07:02,240 --> 00:07:06,954 בגלל שאתה אלקטרון? " 134 00:07:06,954 --> 00:07:08,870 עכשיו, אנחנו יכולים לראות חלק מ things-- אני הולך 135 00:07:08,870 --> 00:07:10,200 כדי להשהות אותך לרגע, מיילס. 136 00:07:10,200 --> 00:07:11,010 אל תלכו לשום מקום. 137 00:07:11,010 --> 00:07:12,650 לא סיימנו איתך עדיין. 138 00:07:12,650 --> 00:07:16,490 אליזה היא, במובנים מסוימים, בתגובה לדברים מסוימים 139 00:07:16,490 --> 00:07:21,140 שהוא אומר, אבל בלי כל הבנה אמיתית. 140 00:07:21,140 --> 00:07:26,090 וזה גם תוכי בחזרה חלק של החלקים מעונשו. 141 00:07:26,090 --> 00:07:27,310 >> אז אמר, "מס ' 142 00:07:27,310 --> 00:07:29,090 למעשה, אני אלקטרונים. " 143 00:07:29,090 --> 00:07:34,190 אלייזה הגיבה בחזרה, "האם אתה בא לי כי אתה אלקטרון? " 144 00:07:34,190 --> 00:07:34,690 בסדר. 145 00:07:34,690 --> 00:07:36,050 בואו לתת לו תגובה אחת נוסף כאן. 146 00:07:36,050 --> 00:07:37,140 נותן לו טוב, מיילס. 147 00:07:37,140 --> 00:07:37,806 >> מיילים: טוב אחד? 148 00:07:37,806 --> 00:07:48,400 149 00:07:48,400 --> 00:07:49,570 >> כן, בבקשה תעזור לי. 150 00:07:49,570 --> 00:07:50,570 בריאן SCASSELLATI: "כן. 151 00:07:50,570 --> 00:07:58,010 אנא עזור לי. "" האם אתה בטוח? " 152 00:07:58,010 --> 00:07:58,510 מיילים: מס ' 153 00:07:58,510 --> 00:08:00,860 בריאן SCASSELLATI: מס ' 154 00:08:00,860 --> 00:08:03,562 "מה שמציע לך?" 155 00:08:03,562 --> 00:08:06,760 >> מיילים: אני לא יכול להיות אלקטרון. 156 00:08:06,760 --> 00:08:11,170 >> בריאן SCASSELLATI: "אני לא יכול להיות אלקטרונים. " 157 00:08:11,170 --> 00:08:13,790 "אתה אומר לא רק כדי להיות שלילי?" 158 00:08:13,790 --> 00:08:14,390 >> בסדר. 159 00:08:14,390 --> 00:08:16,030 אז מיילס, תודה רבה לך. 160 00:08:16,030 --> 00:08:16,860 >> מיילים: תודה לך. 161 00:08:16,860 --> 00:08:18,360 >> בריאן SCASSELLATI: תודה רבה. 162 00:08:18,360 --> 00:08:20,230 [תְשׁוּאוֹת] 163 00:08:20,230 --> 00:08:21,230 164 00:08:21,230 --> 00:08:26,700 >> אז תכנית אליזה זה, במובנים רבים, מגיב רק לחתיכות 165 00:08:26,700 --> 00:08:32,730 שאנו מספקים ללא כל עמוקים הבנה של מה שקורה כאן. 166 00:08:32,730 --> 00:08:36,640 זהו סוג של מערכת נקרא התאמת תבנית, שבו 167 00:08:36,640 --> 00:08:40,490 אנחנו מחפשים מסוימים ביטים של טקסט שאנחנו אז 168 00:08:40,490 --> 00:08:44,860 הולך לקחת את מה ש סופק כקלט, 169 00:08:44,860 --> 00:08:52,580 להמיר אותו, באופן פוטנציאלי, בדרך כלשהי, ולאחר מכן להחזיר אותו למשתמש. 170 00:08:52,580 --> 00:08:55,150 >> האם מישהו מכם חושב ש שאליזה היא למעשה 171 00:08:55,150 --> 00:08:58,230 ביצוע פסיכואנליזה תקפה כאן? 172 00:08:58,230 --> 00:08:59,250 אדם אחד, אולי. 173 00:08:59,250 --> 00:09:00,166 >> קהל: [לא ברור]. 174 00:09:00,166 --> 00:09:03,315 175 00:09:03,315 --> 00:09:05,440 בריאן SCASSELLATI: ואיך זה גורם לך להרגיש? 176 00:09:05,440 --> 00:09:06,530 כן, למעשה, היא עושה. 177 00:09:06,530 --> 00:09:10,890 ואנחנו הולכים לראות, למעשה, קוד מקור לזה ברגע. 178 00:09:10,890 --> 00:09:13,580 ואז אתה הולך להיות מסוגל לעשות בדיוק את זה. 179 00:09:13,580 --> 00:09:17,420 >> עכשיו, אליזה היא צורה אחת של מה ש שהיינו קורא היום בוט צ'אט. 180 00:09:17,420 --> 00:09:19,950 זה פשוט עובר טקסט שאתה מספק, 181 00:09:19,950 --> 00:09:24,030 מספק את הכמות מינימלית הבנה או עיבוד, 182 00:09:24,030 --> 00:09:26,790 ולאחר מכן התוכים בחזרה אליך. 183 00:09:26,790 --> 00:09:31,830 אז בואו נסתכל, מבחינה רעיונית, ולדבר על מה ש 184 00:09:31,830 --> 00:09:34,690 זה שאליזה היא בעצם עושה. 185 00:09:34,690 --> 00:09:42,000 >> אליזה לוקחת בואו sentence-- אומר, "אני רוצה להרשים את הבוס שלי." 186 00:09:42,000 --> 00:09:45,130 ואליזה מחפשת דרך משפט ש 187 00:09:45,130 --> 00:09:48,730 ומנסה למצוא ו להתאים דפוסים מסוימים. 188 00:09:48,730 --> 00:09:52,850 כך, למשל, אחד מהדפוסים שאליזה מחפשת הן המילים 189 00:09:52,850 --> 00:09:55,110 "אני רוצה." 190 00:09:55,110 --> 00:09:59,330 וכל פעם שהוא רואה משהו שיש לו "אני רוצה" בזה, 191 00:09:59,330 --> 00:10:01,770 זה מגבש תגובה. 192 00:10:01,770 --> 00:10:05,040 והתגובה שהיא מחרוזת קבועה. 193 00:10:05,040 --> 00:10:07,915 במקרה זה, זה "למה אתה רוצה?" 194 00:10:07,915 --> 00:10:11,330 ושמתי קצת כוכב ב הסוף כי זה פשוט 195 00:10:11,330 --> 00:10:13,310 תחילת התגובה שלנו. 196 00:10:13,310 --> 00:10:16,310 והכוכב עולה כי אנחנו הולכים לקחת את שאר 197 00:10:16,310 --> 00:10:19,850 של utterance-- של המשתמש "כדי להרשים את הבוס שלי" - 198 00:10:19,850 --> 00:10:24,500 ואנחנו הולכים להוסיף ש על הסוף של מחרוזת זו. 199 00:10:24,500 --> 00:10:28,990 >> אז עכשיו, במקום לומר, "מדוע אתה רוצה להרשים את הבוס שלי, " 200 00:10:28,990 --> 00:10:31,800 יש קצת נוסף עיבוד שנעשינו. 201 00:10:31,800 --> 00:10:34,440 כלומר, נצטרך להמיר חלק מהכינויים 202 00:10:34,440 --> 00:10:38,670 כאן מ" הבוס שלי "ל" הבוס שלך. " 203 00:10:38,670 --> 00:10:41,300 ואולי יש כמה אחר שינויים שאנחנו צריכים לעשות. 204 00:10:41,300 --> 00:10:44,990 אז לא רק דבק בו ישירות על הסוף, מה שנעשינו 205 00:10:44,990 --> 00:10:49,160 הוא ניקח את שאר utterance-- של המשתמש בכאן-- לבן 206 00:10:49,160 --> 00:10:54,090 ואנחנו ניקח את זה חתיכה אחת ב זמן ולהמיר כל מחרוזת 207 00:10:54,090 --> 00:10:58,180 אסימון, כל מילה, למשפט. 208 00:10:58,180 --> 00:10:59,580 >> אז אנחנו ניקח את המילה "ל." 209 00:10:59,580 --> 00:11:01,650 אין המרה שאנחנו צריכים לעשות את זה. 210 00:11:01,650 --> 00:11:02,340 "לְהַרְשִׁים." 211 00:11:02,340 --> 00:11:04,140 אין המרה אנחנו צריכים לעשות שם. 212 00:11:04,140 --> 00:11:06,670 יהיה להמיר "שלי" ל "שלך." 213 00:11:06,670 --> 00:11:10,070 ו" בוס "אנחנו פשוט לעזוב כמו" בוס ". 214 00:11:10,070 --> 00:11:12,740 ולבסוף, שום דבר שמסתיים בתקופה, 215 00:11:12,740 --> 00:11:16,640 אנו להמיר אותו לתוך שאלה. 216 00:11:16,640 --> 00:11:22,600 >> התאמת תבנית פשוטה מאוד זה הוא למעשה די מוצלח. 217 00:11:22,600 --> 00:11:27,260 וכאשר זה הוצג ב1966-- יוסף Weizenbaum 218 00:11:27,260 --> 00:11:28,986 לתכנת זה במחשב. 219 00:11:28,986 --> 00:11:31,110 עכשיו, מחשבים באותו הזמן לא היו מודלים שולחן עבודה. 220 00:11:31,110 --> 00:11:33,950 הם משאבים משותפים. 221 00:11:33,950 --> 00:11:39,090 ותלמידיו הייתם ללכת ולשוחח עם אליזה. 222 00:11:39,090 --> 00:11:41,570 סופו של דבר, לא היה לו ל להגביל את הגישה אליו 223 00:11:41,570 --> 00:11:43,890 כי תלמידיו לא היו מקבל כל עבודה שנעשתה. 224 00:11:43,890 --> 00:11:46,190 הם פשוט היו משוחחים עם אליזה. 225 00:11:46,190 --> 00:11:48,850 ואכן, היה לו ל לפטר את עוזרו, ש 226 00:11:48,850 --> 00:11:55,840 בילה את כל הזמן שלה מדבר לאליזה על בעיותיה עמוקות ומדאיגות. 227 00:11:55,840 --> 00:12:00,350 >> כל מי שהשתמש במערכות אלה התחיל להאניש אותם. 228 00:12:00,350 --> 00:12:04,490 הם התחילו לחשוב עליהם כ הנפשת להיות ואנשים אמיתיים. 229 00:12:04,490 --> 00:12:07,969 הם התחילו להכיר חלק מ הדברים שהם אומרים 230 00:12:07,969 --> 00:12:09,010 היו חוזר אליהם. 231 00:12:09,010 --> 00:12:12,120 והם מגלים דברים על עצמם. 232 00:12:12,120 --> 00:12:17,290 ואכן, גם המומחים, אפילו פסיכותרפיסטים, 233 00:12:17,290 --> 00:12:22,930 התחיל לדאוג כי, למעשה, אולי אליזה תהיה להחליף אותם. 234 00:12:22,930 --> 00:12:25,640 ואפילו המחשב מדענים חוששים שהיינו 235 00:12:25,640 --> 00:12:30,040 כל כך קרוב לפתרון בשפה טבעית. 236 00:12:30,040 --> 00:12:33,520 >> עכשיו, שלא היה קרוב לשום מקום לאמיתי. 237 00:12:33,520 --> 00:12:37,280 אבל ככה מרשים מערכות אלה יכולים להיראות. 238 00:12:37,280 --> 00:12:40,080 אז בואו נתחיל לחפש מתחת ולנסות 239 00:12:40,080 --> 00:12:46,190 כדי לקבל קצת שאלה היכן קוד זה קורה בפועל. 240 00:12:46,190 --> 00:12:48,170 אז אנחנו נעשה את הקוד הזה זמין לאחר מכן. 241 00:12:48,170 --> 00:12:50,880 וזה מאוד נמל פשוט וישיר 242 00:12:50,880 --> 00:12:53,240 מיישום אליזה המקורי. 243 00:12:53,240 --> 00:12:56,350 >> אז כמה סגנוני אלה דברים שתראו כאן 244 00:12:56,350 --> 00:12:59,360 אינם סגנונית מה היינו רוצה שתעשה 245 00:12:59,360 --> 00:13:01,480 או מה שמלמדים אותך לעשות. 246 00:13:01,480 --> 00:13:04,770 אבל אנחנו כבר ניסינו לשמור אותם זהה ביציאות רבות 247 00:13:04,770 --> 00:13:08,087 כי זה היה כל כך שזה יש הטעם של מקורי. 248 00:13:08,087 --> 00:13:09,920 אז אנחנו הולכים לכוללים חבורה של דברים, 249 00:13:09,920 --> 00:13:12,920 ואז יהיה לנו קבוצה של מילות מפתח, דברים 250 00:13:12,920 --> 00:13:16,460 שאליזה תכיר ולהגיב לישירות. 251 00:13:16,460 --> 00:13:20,780 אז אם יש לך מילות כמו "אתה יכול" או "אני לא" או "לא" 252 00:13:20,780 --> 00:13:24,680 או "כן" או "חלום" או "שלום," אז אליזה 253 00:13:24,680 --> 00:13:27,920 יגיב באופן סלקטיבי לאלה. 254 00:13:27,920 --> 00:13:30,010 גם תהיה לנו מספר מסוים של דברים 255 00:13:30,010 --> 00:13:34,940 שאנו להחליף, כמו המרה ל" שלך. "" שלי " 256 00:13:34,940 --> 00:13:39,920 >> ואז יהיה לנו קבוצה של תגובות כי לכל אחד ממילות המפתח הללו, 257 00:13:39,920 --> 00:13:42,580 אנחנו לסובב דרך תגובות שונות אלה. 258 00:13:42,580 --> 00:13:45,350 אז אם אני אומר "כן" שלוש פעמים ברציפות, אני 259 00:13:45,350 --> 00:13:50,429 עשוי לקבל שלוש שונים תגובות מאליזה. 260 00:13:50,429 --> 00:13:52,345 הקוד שלנו, אם כן, הוא למעשה פשוט להפליא. 261 00:13:52,345 --> 00:13:59,490 אם אני לגלול למטה עבר כל אלה תגובות שיש לנו לתכנת ב 262 00:13:59,490 --> 00:14:02,920 ואנחנו מקבלים עד העיקריים שלנו, אנחנו הולכים לאתחל 263 00:14:02,920 --> 00:14:06,540 כמה משתנים שונים ולעשות קצת משק הבית 264 00:14:06,540 --> 00:14:08,480 בהתחלה. 265 00:14:08,480 --> 00:14:11,760 אבל אז יש בהחלט קבוצה של קוד שאתה יכול להבין. 266 00:14:11,760 --> 00:14:15,820 לולאה בזמן אחד גדולה שאומרת שאני הולך לחזור על זה שוב ושוב. 267 00:14:15,820 --> 00:14:20,420 אני אקרא בקו, ואני יהיה לאחסן שבמחרוזת קלט. 268 00:14:20,420 --> 00:14:23,880 אני אבדוק ותראה אם ​​זה מילות מפתח מיוחד "שלום", ש 269 00:14:23,880 --> 00:14:26,199 הפירוש לצאת מהתכנית. 270 00:14:26,199 --> 00:14:29,240 ואז אני אבדוק ותראה אם מישהו פשוט חוזר על עצמם 271 00:14:29,240 --> 00:14:29,800 שוב ושוב. 272 00:14:29,800 --> 00:14:31,174 ואני צועק עליהם אם הם עושים. 273 00:14:31,174 --> 00:14:34,820 אני אגיד "לא לחזור על עצמך." 274 00:14:34,820 --> 00:14:40,500 >> כל עוד אף אחד מאלה יקרו, אנחנו אז לסרוק דרך ולולאה דרך, 275 00:14:40,500 --> 00:14:45,330 על קווים 308-313 כאן, ולבדוק ולראות 276 00:14:45,330 --> 00:14:49,090 הם כל מילת מפתח אלה ביטויים המופיעים בקלט 277 00:14:49,090 --> 00:14:50,620 כי אני פשוט קיבלתי? 278 00:14:50,620 --> 00:14:54,845 אם יש התאמה עבורם, גם לאחר מכן, אני אזכור את המיקום ש. 279 00:14:54,845 --> 00:14:57,050 אני אזכור את מילות המפתח ש. 280 00:14:57,050 --> 00:14:58,620 ואני אהיה מסוגל לבנות תגובה. 281 00:14:58,620 --> 00:15:03,150 >> אם אני לא מוצא אחד, גם אז, הדבר האחרון במערך מילת המפתח שלי 282 00:15:03,150 --> 00:15:08,070 יהיו תגובות ברירת המחדל שלי, כאשר דבר תואם אחר. 283 00:15:08,070 --> 00:15:14,160 אני אשאל שאלות כמו "למה עשיתי לך לבוא לכאן? "או" איך אני יכול לעזור לך? " 284 00:15:14,160 --> 00:15:19,710 כי הם פשוט מתאימים באופן חלקי לא משנה מה הוא הקלט. 285 00:15:19,710 --> 00:15:22,580 >> אז לבנות את תגובתה של אליזה. 286 00:15:22,580 --> 00:15:26,040 אנחנו נהיה מסוגלים לקחת שתגובת הבסיס, 287 00:15:26,040 --> 00:15:28,370 בדיוק כפי שעשינו שב דוגמא "הבוס שלי". 288 00:15:28,370 --> 00:15:30,970 289 00:15:30,970 --> 00:15:33,990 אם זה כל מה שיש הוא-- אם זה רק אחד 290 00:15:33,990 --> 00:15:36,860 מחרוזת שאני אמור respond-- אני רק יכול לשלוח אותו בחזרה החוצה. 291 00:15:36,860 --> 00:15:40,610 אם יש לו כוכבית ב סוף זה, אז אני 292 00:15:40,610 --> 00:15:45,710 לעבד כל אסימון בודד ב שאר התגובה של המשתמש 293 00:15:45,710 --> 00:15:51,590 ולהוסיף אותם ב, להחליף את מילה במילה כמו שאני צריך. 294 00:15:51,590 --> 00:15:56,100 >> כל זה בהחלט משהו שאתה יכול לבנות. 295 00:15:56,100 --> 00:15:59,230 ולמעשה, את הדרכים בן אנחנו יש שורת פקודת טיעוני מעובד, 296 00:15:59,230 --> 00:16:03,570 אופן שבו יש לך מעובד באמצעות בקשות HTTP 297 00:16:03,570 --> 00:16:05,510 בצע את אותו סוג של כללים. 298 00:16:05,510 --> 00:16:08,220 הם התאמת תבנית. 299 00:16:08,220 --> 00:16:15,170 >> אז אליזה הייתה חשובה יחסית השפעה על שפה טבעית 300 00:16:15,170 --> 00:16:21,620 בגלל זה עשה את זה נראה כאילו זה היה מטרה מאוד להשגה, כמו איכשהו הייתי 301 00:16:21,620 --> 00:16:25,550 תוכל לפתור את הבעיה הזו באופן ישיר. 302 00:16:25,550 --> 00:16:30,670 עכשיו, זה לא אומר שאליזה עושה כל מה שהיינו רוצה לעשות. 303 00:16:30,670 --> 00:16:33,710 בוודאי שלא. 304 00:16:33,710 --> 00:16:35,660 אבל אנחנו צריכים להיות מסוגלים לעשות משהו יותר. 305 00:16:35,660 --> 00:16:38,280 306 00:16:38,280 --> 00:16:41,490 >> הצעד הראשון שלנו ללכת מעבר אליזה הולכת 307 00:16:41,490 --> 00:16:44,840 כדי להיות מסוגל להסתכל לא טקסט מוזן 308 00:16:44,840 --> 00:16:53,750 למקלדת, אך הדיבור, בפועל נאום מוקלט למיקרופון. 309 00:16:53,750 --> 00:16:56,880 אז כמו שאנחנו מסתכלים על אלה חלקים שונים, אנחנו 310 00:16:56,880 --> 00:17:00,304 תצטרך לבנות קבוצה של דגמים. 311 00:17:00,304 --> 00:17:02,970 אנחנו הולכים צריכים להיות מסוגלים ללכת מאקוסטי ברמה הנמוכה 312 00:17:02,970 --> 00:17:07,180 המגרש information--, משרעת, frequency-- 313 00:17:07,180 --> 00:17:09,530 ולהמיר את זה ב כמה יחידות שאנחנו 314 00:17:09,530 --> 00:17:14,619 תוכל לתפעל בקלות רבה יותר ולבסוף, לתפעל אותם 315 00:17:14,619 --> 00:17:18,609 למילים ומשפטים. 316 00:17:18,609 --> 00:17:22,880 >> אז רוב זיהוי הדיבור מערכות שנמצאות שם היום 317 00:17:22,880 --> 00:17:26,069 מעקב סטטיסטי מודל שבו אנו בונים 318 00:17:26,069 --> 00:17:35,090 שלושה ייצוגים נפרדים ממה ש שאות השמע מכילה למעשה. 319 00:17:35,090 --> 00:17:38,640 אנחנו מתחילים עם מודל פונטי שמדבר על רק הבסיס 320 00:17:38,640 --> 00:17:41,250 נשמע שאני מייצר. 321 00:17:41,250 --> 00:17:46,900 אני מייצר משהו שהוא B כמו בילד או D כמו בכלב? 322 00:17:46,900 --> 00:17:53,220 איך אני מכיר את שני אלה שונים טלפונים כנפרדים ומובחן? 323 00:17:53,220 --> 00:17:56,600 >> נוסף על כך, אנו לאחר מכן לבנות מודל הגיית מילה, 324 00:17:56,600 --> 00:18:01,350 משהו שמקשר יחד טלפונים בודדים אלה 325 00:18:01,350 --> 00:18:04,724 ומשלב אותם למילה. 326 00:18:04,724 --> 00:18:07,890 ואחרי זה, אנחנו ניקח את המילים ואנחנו להרכיב אותם עם שפה 327 00:18:07,890 --> 00:18:13,010 מודל למשפט שלם. 328 00:18:13,010 --> 00:18:17,230 >> עכשיו, אנחנו הולכים לדבר על כל באופן עצמאי ואלה בנפרד. 329 00:18:17,230 --> 00:18:21,580 אבל שלושת מודלים אלה הם כל רק הולך להיות סטטיסטיקה. 330 00:18:21,580 --> 00:18:23,502 וזה אומר שכאשר אנחנו לעבוד איתם, אנחנו 331 00:18:23,502 --> 00:18:25,376 להיות מסוגל לעבוד עם כל בו זמנית. 332 00:18:25,376 --> 00:18:28,100 333 00:18:28,100 --> 00:18:28,600 בסדר. 334 00:18:28,600 --> 00:18:30,890 בואו נתחיל עם המודל הפונטי שלנו. 335 00:18:30,890 --> 00:18:34,470 אז מודלים הפונטי להסתמך על טכניקה חישובית 336 00:18:34,470 --> 00:18:37,320 נקרא מודלים מרקוב נסתרים. 337 00:18:37,320 --> 00:18:43,050 אלה הם מודלים גרפיים שבו אני יש לי ולהכיר במדינה של העולם 338 00:18:43,050 --> 00:18:46,500 כמו להיות מאופיין על ידי קבוצה של תכונות. 339 00:18:46,500 --> 00:18:51,960 והמדינה שמתארת ​​חלק אחד של פעולה שאני עוסק ב. 340 00:18:51,960 --> 00:19:00,190 >> אז אם אני חושב על מה שהופך את "אמא" נשמע כמו אמא, 341 00:19:00,190 --> 00:19:03,970 יש שונים רכיבים שלצליל. 342 00:19:03,970 --> 00:19:07,230 יש חלק שבו אני מצייר בנשימה. 343 00:19:07,230 --> 00:19:09,560 ואז אני מכווץ את השפתיים שלי. 344 00:19:09,560 --> 00:19:13,710 ואני מגלגל את השפתיים שלי קצת אחורה קצת כדי שיצא צליל "מא". 345 00:19:13,710 --> 00:19:15,340 ואז יש שחרור. 346 00:19:15,340 --> 00:19:17,020 השפתיים שלי מתפרקות. 347 00:19:17,020 --> 00:19:19,030 האוויר גורש. 348 00:19:19,030 --> 00:19:22,650 "אִמָא." 349 00:19:22,650 --> 00:19:29,250 >> אלה שלושה חלקים שונים יהיו מיוצג על ידי מדינות בgraph-- זה 350 00:19:29,250 --> 00:19:33,420 תחילת, האמצע, והסוף. 351 00:19:33,420 --> 00:19:38,060 ושאהיה לי מעברים ש אפשר לי לנסוע ממדינה אחת 352 00:19:38,060 --> 00:19:42,260 למשנהו בהסתברות מסוימת. 353 00:19:42,260 --> 00:19:47,250 כך, למשל, כי M נשמע שאולי יש לי מאוד, 354 00:19:47,250 --> 00:19:51,850 הצריכה קצרה מאוד בbeginning-- "מ"מ" - ולאחר מכן עוד, 355 00:19:51,850 --> 00:19:55,640 שלב שבו תנודה אני מחזיק שפתיים יחד וכמעט humming-- 356 00:19:55,640 --> 00:20:05,090 "ממממ" - ולאחר מכן מאוד קצר פוצצתי בו אני לגרש breath-- "מא". 357 00:20:05,090 --> 00:20:09,370 >> מודל מרקוב הנסתר הוא שנועד ללכוד את העובדה 358 00:20:09,370 --> 00:20:13,340 שהדרך שאני עושה כי "אמא" קול הולכת 359 00:20:13,340 --> 00:20:17,350 להיות מעט שונה ב העיתוי שלה, הוא תדר, 360 00:20:17,350 --> 00:20:21,030 והתכונות שלה מ הדרך שאתה עושה את זה 361 00:20:21,030 --> 00:20:23,300 או הדרך שאני עלולה לעשות את זה כשאני מדבר 362 00:20:23,300 --> 00:20:26,030 על שימושים שונים של המכתב. 363 00:20:26,030 --> 00:20:33,240 "אמא" ו" אני יכול "יהיה נשמע מעט שונה. 364 00:20:33,240 --> 00:20:36,800 >> אז להכיר צליל מסוים, שהיינו 365 00:20:36,800 --> 00:20:42,020 לבנות מודלים מרקוב, מרקוב הנסתר אלה מודלים, של כל טלפון אפשרי ש 366 00:20:42,020 --> 00:20:45,840 אולי כדאי לך להכיר, כל צליל אפשרי, 367 00:20:45,840 --> 00:20:49,750 ואז מסתכל על נתונים אקוסטיים שיש לי 368 00:20:49,750 --> 00:20:54,430 ולקבוע סטטיסטי איזה מהם הוא ככל הנראה אחד 369 00:20:54,430 --> 00:20:58,110 להפקתי את הצליל הזה. 370 00:20:58,110 --> 00:20:58,610 אוקיי. 371 00:20:58,610 --> 00:21:01,540 372 00:21:01,540 --> 00:21:06,750 עם מודל זה, אז אנחנו להתחיל לבנות על גבי זה. 373 00:21:06,750 --> 00:21:09,330 אנחנו לוקחים מודל הגייה. 374 00:21:09,330 --> 00:21:11,790 עכשיו, לפעמים הגייה דגמים הם פשוט וקלים 375 00:21:11,790 --> 00:21:14,440 כי יש רק אחד דרך לבטא משהו. 376 00:21:14,440 --> 00:21:17,990 בפעמים אחרות, הם קצת יותר מסובך. 377 00:21:17,990 --> 00:21:21,340 הנה מדריך הגייה שלדבר האדום שהוא 378 00:21:21,340 --> 00:21:25,210 פירות שאתה מבצע קטשופ מ. 379 00:21:25,210 --> 00:21:27,360 אנשים לא חושבים שזה פרי. 380 00:21:27,360 --> 00:21:27,860 יָמִינָה? 381 00:21:27,860 --> 00:21:30,880 382 00:21:30,880 --> 00:21:35,300 >> עכשיו, יש דרכים רבות ושונות שאנשים לבטא את המילה הזאת. 383 00:21:35,300 --> 00:21:37,780 יש שיאמר "הבוהן-מאי-הבוהן." 384 00:21:37,780 --> 00:21:40,880 יש שיאמר "הבוהן mAh-הבוהן." 385 00:21:40,880 --> 00:21:44,800 ואנחנו יכולים ללכוד שעם אחד מודלים הגרפיים אלה 386 00:21:44,800 --> 00:21:48,305 שם, שוב, אנחנו מייצגים מעברים כבעל הסתברות מסוימת 387 00:21:48,305 --> 00:21:51,360 וקשור הסתברות איתם. 388 00:21:51,360 --> 00:21:58,290 >> אז במקרה הזה, אם הייתי מעקב המסלול העליון דרך כל הגרף הזה, 389 00:21:58,290 --> 00:22:03,330 הייתי מתחיל במכתב בשמאל קיצוני, את הצליל "ת"א". 390 00:22:03,330 --> 00:22:07,570 הייתי לוקח את החלק העליון, "הו," ולאחר מכן "אמא," 391 00:22:07,570 --> 00:22:14,530 ולאחר מכן "," ולאחר מכן "ת"א," ו" הו. " "טו-רשאי-הבוהן." 392 00:22:14,530 --> 00:22:19,610 אם לקחתי את הנתיב התחתון דרך זה, אני יקבל "ת"א-מיליאמפר-הבוהן." 393 00:22:19,610 --> 00:22:26,810 ואם ירדתי ולאחר מכן עד, הייתי מקבל "ת"א רשאית-הבוהן." 394 00:22:26,810 --> 00:22:29,950 >> מודלים אלה ללכוד אלה הבדלים כי בכל פעם 395 00:22:29,950 --> 00:22:32,410 אנחנו לפרוס אחד מאלה מערכות זיהוי, 396 00:22:32,410 --> 00:22:35,340 זה הולך צריך לעבוד עם הרבה מסוג של אנשים שונים, 397 00:22:35,340 --> 00:22:39,295 המון מבטאים שונים, ואפילו שימושים שונים של אותן המילים. 398 00:22:39,295 --> 00:22:42,204 399 00:22:42,204 --> 00:22:44,120 לבסוף, על גבי זה, אנו לבנות משהו 400 00:22:44,120 --> 00:22:48,780 זה נראה ממש מסובך, נקרא מודל השפה, 401 00:22:48,780 --> 00:22:52,950 אך למעשה הוא הפשוט ביותר של שלוש, כי אלה פועלים 402 00:22:52,950 --> 00:22:56,041 על מה שנקרא דגמי n-גרם. 403 00:22:56,041 --> 00:23:02,270 ובמקרה הזה, אני מראה לך מודל שני חלקי n-גרם, bigram. 404 00:23:02,270 --> 00:23:08,910 אנחנו הולכים לעשות פיזי הרעיון כי לפעמים, מילות מסוימות 405 00:23:08,910 --> 00:23:14,680 סביר יותר לעקוב נתן מילה יותר מאחרים. 406 00:23:14,680 --> 00:23:25,210 אם אני רק אמרתי "תחזית מזג אוויר" המילה הבאה יכולה להיות סבירה "היום" 407 00:23:25,210 --> 00:23:31,510 או יכול להיות "מזג האוויר תחזית מחר. " 408 00:23:31,510 --> 00:23:38,870 אבל זה לא סביר שיהיה " תחזית מזג אוויר ארטישוק. " 409 00:23:38,870 --> 00:23:42,980 >> מה מודל שפה עושה הוא היא לוכדת אותם מבחינה סטטיסטית 410 00:23:42,980 --> 00:23:47,450 על ידי ספירה, מכמה גדול מאוד קורפוס, כל המקרים 411 00:23:47,450 --> 00:23:50,890 שבו מילה אחת כדלקמן אחרת. 412 00:23:50,890 --> 00:23:54,300 אז אם אני לוקח corpus-- גדול כמו כל ול סטריט ז'ורנל 413 00:23:54,300 --> 00:24:00,750 כי כבר מיוצר מאז 1930, שהוא אחד corpuses-- הסטנדרטי 414 00:24:00,750 --> 00:24:03,910 ואני מסתכל דרך כל טקסט ש, ואני סופר 415 00:24:03,910 --> 00:24:09,770 עד כמה פעמים אחרי "תחזית" אני רואה "היום" 416 00:24:09,770 --> 00:24:17,454 וכמה פעמים אני רואה "תחזית" ואחריו "ארטישוק", 417 00:24:17,454 --> 00:24:19,370 הראשון אחד לא הולך להיות הרבה יותר סביר. 418 00:24:19,370 --> 00:24:21,540 זה הולך להופיע הרבה יותר בתדירות גבוהה. 419 00:24:21,540 --> 00:24:24,610 וכדי שיהיה לו גבוה יותר הסתברות ששויכה לו. 420 00:24:24,610 --> 00:24:27,340 >> אם אני רוצה להבין את הסתברות של כל אמירה, 421 00:24:27,340 --> 00:24:29,940 לאחר מכן, אני פשוט לשבור אותו. 422 00:24:29,940 --> 00:24:35,990 אז ההסתברות של שמיעה המשפט "העכברוש אכל גבינה" 423 00:24:35,990 --> 00:24:39,110 היא ההסתברות של המילה "" מתחיל משפט, 424 00:24:39,110 --> 00:24:42,540 ואז ההסתברות ש מילה "עכברוש" עוקב אחר המילה "," 425 00:24:42,540 --> 00:24:44,910 וההסתברות ש מילה "אכל" כדלקמן "עכברוש," 426 00:24:44,910 --> 00:24:51,120 וההסתברות ש "גבינה" כדלקמן "אכל". 427 00:24:51,120 --> 00:24:55,160 >> זה נשמע כמו הרבה סטטיסטיקה, הרבה הסתברויות. 428 00:24:55,160 --> 00:24:57,510 וזה כל מה שזה. 429 00:24:57,510 --> 00:25:02,920 אבל הדבר המדהים הוא שאם אתה עושה את זה עם מספיק מדגם גדול של נתונים, 430 00:25:02,920 --> 00:25:03,670 זה עובד. 431 00:25:03,670 --> 00:25:05,250 וזה עובד מאוד טוב. 432 00:25:05,250 --> 00:25:07,810 433 00:25:07,810 --> 00:25:11,420 כולנו יודעים בטכנולוגיות אלה. 434 00:25:11,420 --> 00:25:16,500 רוב מערכות ההפעלה מגיעות עם זיהוי קול בנקודה זו. 435 00:25:16,500 --> 00:25:20,940 אנו משתמשים בסירים וCortana ואקו. 436 00:25:20,940 --> 00:25:25,070 ודברים אלה מבוססים על סוג זה של שלוש שכבה model-- 437 00:25:25,070 --> 00:25:30,620 מודל הפונטי בתחתית, מודל הגייה באמצע, 438 00:25:30,620 --> 00:25:33,690 ומודל שפה על גבי אותם. 439 00:25:33,690 --> 00:25:37,630 >> עכשיו, הם צריכים לעשות קצת יותר מזה כדי לענות על שאלות. 440 00:25:37,630 --> 00:25:43,000 אבל ההכרה של מה שאתה אמרה תלויה בדיוק על זה. 441 00:25:43,000 --> 00:25:45,700 אז בואו ניקח דוגמא כאן. 442 00:25:45,700 --> 00:25:52,020 אז יש לי את הטלפון שלי יושב כאן מתחת למצלמת המסמכים. 443 00:25:52,020 --> 00:25:56,110 ואנחנו הולכים שואל Siri כמה שאלות. 444 00:25:56,110 --> 00:25:57,150 בסדר? 445 00:25:57,150 --> 00:25:59,940 >> אז בואו אתעורר הטלפון שלי כאן. 446 00:25:59,940 --> 00:26:02,710 447 00:26:02,710 --> 00:26:05,000 Siri, מה מזג האוויר כמו בניו הייבן היום? 448 00:26:05,000 --> 00:26:07,670 449 00:26:07,670 --> 00:26:10,780 >> SIRI: הנה מזג האוויר ל ניו הייבן, קונטיקט היום. 450 00:26:10,780 --> 00:26:11,890 >> בריאן SCASSELLATI: אישור. 451 00:26:11,890 --> 00:26:16,720 אז קודם כל אתה ראית שSiri מוכר כל אחת מהמילים בודדות 452 00:26:16,720 --> 00:26:19,050 ולאחר מכן הופק תגובה. 453 00:26:19,050 --> 00:26:22,277 נדבר על איך תגובה ש מגיע על בקצת. 454 00:26:22,277 --> 00:26:24,110 אבל עכשיו שאנחנו יודעים שזה רק על בסיס 455 00:26:24,110 --> 00:26:28,880 על סטטיסטיקה וזה הגלם סוג התאמת תבנית גישה של, 456 00:26:28,880 --> 00:26:31,120 אנחנו יכולים לשחק כמה משחקים עם Siri. 457 00:26:31,120 --> 00:26:34,560 >> אז אני יכול לנסות שוב. 458 00:26:34,560 --> 00:26:38,864 Siri, מה מזג האוויר היפופוטם ניו הייבן, היום? 459 00:26:38,864 --> 00:26:39,810 >> SIRI: אישור. 460 00:26:39,810 --> 00:26:44,245 הנה מזג האוויר לניו הייבן, קונטיקט להיום. 461 00:26:44,245 --> 00:26:46,120 בריאן SCASSELLATI: Siri של לא להירתע מזה 462 00:26:46,120 --> 00:26:50,980 כי זה מצא pattern-- "מזג אוויר", "היום", "ניו הייבן." 463 00:26:50,980 --> 00:26:54,420 זה מה שהוא מגיב ל, בדיוק כמו אליזה. 464 00:26:54,420 --> 00:26:54,920 בסדר. 465 00:26:54,920 --> 00:26:59,390 בואו לתת לו אפילו אחד יותר דוגמא נוספת מגוחכת. 466 00:26:59,390 --> 00:27:03,075 Siri, ארטישוק מזג אוויר היפופוטם ארמדיל ניו הייבן? 467 00:27:03,075 --> 00:27:06,806 468 00:27:06,806 --> 00:27:08,400 >> SIRI: תן לי לבדוק שב. 469 00:27:08,400 --> 00:27:11,280 הנה מה שמצאתי באינטרנט על מה הם ארטישוק ארמדילו 470 00:27:11,280 --> 00:27:13,780 היפופוטם ניו הייבן. 471 00:27:13,780 --> 00:27:14,760 >> בריאן SCASSELLATI: אישור. 472 00:27:14,760 --> 00:27:20,400 אז אם אני הולך רחוק מספיק ממודל זה, 473 00:27:20,400 --> 00:27:24,365 אני יכול לבלבל את זה כי זה לא כבר תואם את הדפוס שיש לו. 474 00:27:24,365 --> 00:27:27,370 475 00:27:27,370 --> 00:27:29,390 וכי סטטיסטי מנוע שאומר, 476 00:27:29,390 --> 00:27:32,850 מה הסיכוי שיש לך היפופוטם המילים וארטישוק 477 00:27:32,850 --> 00:27:34,440 יחד, וArmadillo? 478 00:27:34,440 --> 00:27:36,050 שחייב להיות משהו חדש. 479 00:27:36,050 --> 00:27:38,840 480 00:27:38,840 --> 00:27:40,610 >> אז טכנולוגיות אלה אנו משתמשים מדי יום. 481 00:27:40,610 --> 00:27:43,670 482 00:27:43,670 --> 00:27:47,800 אם אנחנו רוצים לקחת אותם צעד אחד נוסף, אם כי, אם אנחנו באמת 483 00:27:47,800 --> 00:27:53,930 רוצה להיות מסוגל לדבר על מה שזה הוא שמערכות אלה מגיבות ל, 484 00:27:53,930 --> 00:28:00,630 אנחנו צריכים לדבר, שוב, על סט בסיסי יותר של שאלות. 485 00:28:00,630 --> 00:28:05,370 וזה נושא בתקשורת שאנו מכנים לענות על שאלה. 486 00:28:05,370 --> 00:28:07,028 כלומר, אנחנו רוצים להיות מסוגלים צריכה-- כן? 487 00:28:07,028 --> 00:28:07,944 קהל: [לא ברור]. 488 00:28:07,944 --> 00:28:10,789 489 00:28:10,789 --> 00:28:13,330 בריאן SCASSELLATI: האם אנחנו מקבלים לעיבוד סמנטי חבוי? 490 00:28:13,330 --> 00:28:14,070 אז כן. 491 00:28:14,070 --> 00:28:17,820 יש הרבה דברים שהם קורה מתחת לפני השטח עם Siri 492 00:28:17,820 --> 00:28:20,210 ובחלק מדוגמאות אני הולך להראות לך הבא 493 00:28:20,210 --> 00:28:22,610 שבו יש לא מעט במונחים של המבנה 494 00:28:22,610 --> 00:28:25,260 של מה שאתה אומר שזה חשוב. 495 00:28:25,260 --> 00:28:31,890 ואכן, זה נהדר מבשר לשקופית הבאה בשבילי. 496 00:28:31,890 --> 00:28:35,110 >> אז באותו אופן שבנו זיהוי דיבור נבנה 497 00:28:35,110 --> 00:28:39,620 של מספר שכבות, אם אנחנו רוצים להבין מה זה שבעצם 498 00:28:39,620 --> 00:28:44,620 נאמר, אנחנו הולכים שוב להסתמך על ניתוח רב שכבתי 499 00:28:44,620 --> 00:28:47,020 של הטקסט שלהיות מוכר. 500 00:28:47,020 --> 00:28:52,560 לכן, כאשר Siri הוא למעשה מסוגל למשל, נראה שמצאתי את המילים האלה. 501 00:28:52,560 --> 00:28:55,230 עכשיו מה אני עושה איתם? 502 00:28:55,230 --> 00:28:59,110 הרכיב הראשון הוא לעתים קרובות ל לעבור ולנסות לנתח 503 00:28:59,110 --> 00:29:03,010 המבנה של המשפט. 504 00:29:03,010 --> 00:29:05,410 ומה שראינו בבית הספר יסודי, לעתים קרובות, 505 00:29:05,410 --> 00:29:08,920 כסוג של דיאגרמות משפטים, אנחנו הולכים 506 00:29:08,920 --> 00:29:12,774 להכיר בכך שמסוים יש מילות תפקידים מסוימים. 507 00:29:12,774 --> 00:29:13,440 אלה הם שמות עצם. 508 00:29:13,440 --> 00:29:14,231 אלה הם כינויים. 509 00:29:14,231 --> 00:29:16,200 אלה הם פעלים. 510 00:29:16,200 --> 00:29:19,460 ואנחנו הולכים להכיר כי לדקדוק מסוים, 511 00:29:19,460 --> 00:29:24,700 בדקדוק אנגלי מקרה זה, יש דרכים חוקיות שבו אני יכול לשלב אותם 512 00:29:24,700 --> 00:29:26,280 ודרכים אחרות שאינן חוקיים. 513 00:29:26,280 --> 00:29:29,920 514 00:29:29,920 --> 00:29:33,870 >> הכרה בכך ש, מבנה ש, עשוי להיות מספיק כדי להנחות אותנו 515 00:29:33,870 --> 00:29:36,720 מעט. 516 00:29:36,720 --> 00:29:39,820 אבל זה לא מספיק לנו להיות מסוגל לתת לי 517 00:29:39,820 --> 00:29:43,290 כל משמעות למה שנאמר כאן. 518 00:29:43,290 --> 00:29:46,615 כדי לעשות זאת, נצטרך להסתמך על כמות מסוימת של עיבוד סמנטי. 519 00:29:46,615 --> 00:29:49,590 520 00:29:49,590 --> 00:29:55,080 כלומר, אנחנו הולכים צריכים להסתכל במתחת מה כל המילים האלה 521 00:29:55,080 --> 00:29:57,400 למעשה נושא כמשמעות. 522 00:29:57,400 --> 00:30:01,150 ובדרך הפשוטה ביותר לעשות זאת, אנחנו הולכים לקשר עם כל מילה 523 00:30:01,150 --> 00:30:06,930 כי אנחנו יודעים פונקציה מסוימת, שינוי מסוים ש 524 00:30:06,930 --> 00:30:09,300 מאפשר לקרות. 525 00:30:09,300 --> 00:30:14,470 >> במקרה זה, אנחנו יכולים לתייג מילה "ג'ון" כמו להיות שם נכון, 526 00:30:14,470 --> 00:30:18,160 כי הוא נושא עימו זהות. 527 00:30:18,160 --> 00:30:21,530 ואולי תווית "מרי", כפי שאותה הדרך. 528 00:30:21,530 --> 00:30:27,900 ואילו פועל כמו "אהבות," ש מהווה מערכת יחסים מיוחדות 529 00:30:27,900 --> 00:30:31,582 שאנחנו יכולים לייצג. 530 00:30:31,582 --> 00:30:33,290 עכשיו, זה לא אומר ש כי אנחנו מבינים 531 00:30:33,290 --> 00:30:37,680 מהי אהבה אבל רק שנבין זה בדרך של מערכת סמלית. 532 00:30:37,680 --> 00:30:40,480 כלומר, אנחנו יכולים לתייג זה ולתפעל אותו. 533 00:30:40,480 --> 00:30:44,230 534 00:30:44,230 --> 00:30:49,120 >> עם כל אחד מסוגים אלה של גישות, כל סוג של עיבוד סמנטי 535 00:30:49,120 --> 00:30:57,060 כאן הוא הולך לדרוש קצת קצת ידע והרבה עבודה 536 00:30:57,060 --> 00:30:59,020 על החלק שלנו. 537 00:30:59,020 --> 00:31:03,590 אנחנו כבר לא בתחום שבו סטטיסטיקה פשוט 538 00:31:03,590 --> 00:31:07,320 הולך להיות מספיק לנו. 539 00:31:07,320 --> 00:31:11,330 עכשיו, כדי ללכת מנקודה להיות זה 540 00:31:11,330 --> 00:31:15,520 תוכל לדבר על החלק הפנימי של מה בעצם קורה כאן, 541 00:31:15,520 --> 00:31:19,640 כדי להיות מסוגל לתפעל זה מבנה ולהבין שאלה 542 00:31:19,640 --> 00:31:23,160 ולאחר מכן להיות מסוגלים לצאת ולחפש, 543 00:31:23,160 --> 00:31:27,290 שדורש יותר מודל הקוגניטיבי מורכב. 544 00:31:27,290 --> 00:31:34,880 >> אופן שבו מערכות אלה בנויים הוא על פי רוב מאוד, מאוד עבודה 545 00:31:34,880 --> 00:31:36,350 אִינטֶנסִיבִי. 546 00:31:36,350 --> 00:31:39,490 הם כרוכים בני אדם הוצאות עסקה גדולה 547 00:31:39,490 --> 00:31:44,100 זמן בניית מבנה הדרכים ב אילו סוגים של משפטים אלה 548 00:31:44,100 --> 00:31:47,270 יכול להיות מיוצג בחלק ההיגיון. 549 00:31:47,270 --> 00:31:51,639 550 00:31:51,639 --> 00:31:53,430 זה נהיה אפילו קצת מורכב יותר, אם כי. 551 00:31:53,430 --> 00:31:56,400 552 00:31:56,400 --> 00:31:59,660 >> אפילו פעם אחת יש לנו עסק עם סמנטיקה, אנחנו 553 00:31:59,660 --> 00:32:03,860 עדיין צריך להסתכל על פרגמטיקה של מה שנאמר. 554 00:32:03,860 --> 00:32:08,620 כלומר, איך אני מתייחס המילים כי צריך משהו שאני מבחינה פיזית החוצה 555 00:32:08,620 --> 00:32:12,054 יש בעולם או ב לפחות חלק מקור מידע 556 00:32:12,054 --> 00:32:12,970 שאני יכול לתפעל? 557 00:32:12,970 --> 00:32:15,780 558 00:32:15,780 --> 00:32:20,790 >> לפעמים, אלה יובילו ל פיסות נפלאות של עמימות. 559 00:32:20,790 --> 00:32:24,470 "אדום-חם כוכב להינשא אסטרונום." 560 00:32:24,470 --> 00:32:25,630 אוקיי. 561 00:32:25,630 --> 00:32:28,540 עכשיו, אנו קוראים כי כ סוג מצחיק של כותרת 562 00:32:28,540 --> 00:32:34,690 שהיינו רואה בטלוויזיה בשעת לילה מאוחר כי אנחנו לא מפרשים "כוכב" 563 00:32:34,690 --> 00:32:38,630 יש משמעות הגוף השמימית שלה. 564 00:32:38,630 --> 00:32:43,390 אנחנו יודעים שזה אומר יותר שחקן או שחקנית שבשגרה 565 00:32:43,390 --> 00:32:45,240 עם כמויות גבוהות של שקיפות. 566 00:32:45,240 --> 00:32:47,770 567 00:32:47,770 --> 00:32:51,950 >> "כיתה עוזרת קורבן נשיכת כלב." 568 00:32:51,950 --> 00:32:55,550 האם זה שהיא למעשה החוליה שם סיוע לכלב 569 00:32:55,550 --> 00:32:59,620 במסתובב ונושכים את הקורבנות? 570 00:32:59,620 --> 00:33:02,380 או שזה שיש יחיד שהיה 571 00:33:02,380 --> 00:33:04,625 ננשך על ידי כלב שזקוק לעזרה? 572 00:33:04,625 --> 00:33:07,650 573 00:33:07,650 --> 00:33:11,480 רק מלהסתכל על התחביר והסמנטיקה של המשפטים, 574 00:33:11,480 --> 00:33:14,660 אנחנו לא יכולים לקבוע ש. 575 00:33:14,660 --> 00:33:22,000 >> "מסוק מופעל על ידי זבובים אנושיים." 576 00:33:22,000 --> 00:33:27,330 האם יש, למעשה, בפועל דברים קטנים שעפים 577 00:33:27,330 --> 00:33:34,510 אנשים עם כנפי הפעלה מסוקים לטובת האנושות? 578 00:33:34,510 --> 00:33:38,960 או שיש מכשיר אחד מכאני ששואב את כוחה מאדם? 579 00:33:38,960 --> 00:33:41,600 580 00:33:41,600 --> 00:33:46,500 >> כאשר אנו מסתכלים על שאלה מערכות לענות, 581 00:33:46,500 --> 00:33:51,110 אלה הם השכבות ש אנחנו צריכים להתמודד איתו. 582 00:33:51,110 --> 00:33:54,890 עכשיו, את הטוב ביותר ורוב מין של נפוץ של מערכות אלה 583 00:33:54,890 --> 00:34:00,640 היום הם מסוגל לעשות דברים ברמה שהם 584 00:34:00,640 --> 00:34:05,050 הרבה מעבר למה שהיו לנו לפני 10 שנים. 585 00:34:05,050 --> 00:34:08,210 הנה אחת מהמערכות הטובות ביותר זה שם היום. 586 00:34:08,210 --> 00:34:10,519 וזה הוא מערכת מ- IBM בשם ווטסון. 587 00:34:10,519 --> 00:34:13,040 588 00:34:13,040 --> 00:34:15,500 זה מהחברים שלנו ב- IBM. 589 00:34:15,500 --> 00:34:19,810 זה בנקים קתרין, ג'יה צ'ן, ופריסילה Moraes נותנת לנו 590 00:34:19,810 --> 00:34:26,323 הפגנה של ווטסון אתמול בIBM יורקטאון. 591 00:34:26,323 --> 00:34:26,989 [וידאו השמעה] 592 00:34:26,989 --> 00:34:27,690 -איך אתה? 593 00:34:27,690 --> 00:34:30,600 594 00:34:30,600 --> 00:34:31,980 >> -אני בסדר גמור. 595 00:34:31,980 --> 00:34:35,429 אני תמיד שמח כשאני חושב, במיוחד כש 596 00:34:35,429 --> 00:34:38,920 יכול להישאר רגוע בחדרי שרתים אלה. 597 00:34:38,920 --> 00:34:40,170 -מי היא השחקנית האהובה עליך? 598 00:34:40,170 --> 00:34:43,870 599 00:34:43,870 --> 00:34:47,555 >> השחקנית האהובה, המחמדים אנג'לינה ג'ולי כלארה קרופט 600 00:34:47,555 --> 00:34:54,800 בטומב ריידר כי המקורי שלה טופס היה כדמות וירטואלית כמוני. 601 00:34:54,800 --> 00:34:56,760 >> -כיצד ניתן וטסון לעזור לחולים? 602 00:34:56,760 --> 00:34:59,700 603 00:34:59,700 --> 00:35:03,755 >> 'האם התכנית לחולים יש להם גישה לוטסון ישירות? 604 00:35:03,755 --> 00:35:08,050 גישה לייעוץ ווטסון יישומים ישתנו לפי מקרה שימוש. 605 00:35:08,050 --> 00:35:12,630 אבל כיום, ווטסון רק לספק אבחון וטיפול אפשרי 606 00:35:12,630 --> 00:35:14,725 אפשרויות למקצועיות רפואי. 607 00:35:14,725 --> 00:35:17,680 מקום שמתאים, חולים עשוי לספק מידע 608 00:35:17,680 --> 00:35:21,210 ולוטסון, אולי דרך ממשק אינטרנט פורטל, לוח, 609 00:35:21,210 --> 00:35:23,500 או אפילו טלפון סלולרי. 610 00:35:23,500 --> 00:35:27,180 לדוגמא, חולה עשוי להיות התבקש לתאר את הסימפטומים שלהם 611 00:35:27,180 --> 00:35:30,460 בשפה טבעית ישירות לפתרון ווטסון, 612 00:35:30,460 --> 00:35:34,050 המאפשר לרופא להתמקד ב איסוף נתוני אבחון ולא. 613 00:35:34,050 --> 00:35:38,379 614 00:35:38,379 --> 00:35:42,716 >> -מי נרצח אברהם לינקולן? 615 00:35:42,716 --> 00:35:46,153 >> ג'ון וילקס בות '. 616 00:35:46,153 --> 00:35:52,373 >> -in מה עשה בשנה שאריזונה דיאמונדבקס לזכות באליפות העולם? 617 00:35:52,373 --> 00:35:55,295 >> 2001. 618 00:35:55,295 --> 00:35:58,710 >> [סוף ההשמעה] 619 00:35:58,710 --> 00:36:01,610 >> בריאן SCASSELLATI: אז סוגים של מערכות אלה 620 00:36:01,610 --> 00:36:07,430 יש להסתמך על קודם כל הכרה בדיבור; שְׁנִיָה, 621 00:36:07,430 --> 00:36:12,200 ההפיכה למשמעותית פנימי יִצוּג; ולאחר מכן, שלישי, 622 00:36:12,200 --> 00:36:17,090 להיות מסוגל לצאת ולמצוא מקור המידע ש 623 00:36:17,090 --> 00:36:21,140 מאפשר להם לענות על שאלה זו. 624 00:36:21,140 --> 00:36:27,320 רמה זו של מורכבות כרוכה אותם הסוגים של דברים תכנותיים 625 00:36:27,320 --> 00:36:31,790 כי יש לך כבר עושה בסטים בעיה. 626 00:36:31,790 --> 00:36:38,000 >> אנו יכולים לנתח בקשות HTTP ב אותו הסוג של דפוס ברמה הנמוכה 627 00:36:38,000 --> 00:36:40,810 התאמה שאליזה יכולה לעשות. 628 00:36:40,810 --> 00:36:45,070 אנו יכולים להמיר אותם לייצוג פנימי, 629 00:36:45,070 --> 00:36:50,360 ולאחר מכן להשתמש בם לשאילתא מסוימת מסד נתונים חיצוניים, אולי באמצעות SQL. 630 00:36:50,360 --> 00:36:53,530 631 00:36:53,530 --> 00:36:56,260 כל המערכות ש נבנים היום 632 00:36:56,260 --> 00:37:00,520 לעשות את זה סוג של טבעי תקשורת שפה 633 00:37:00,520 --> 00:37:04,100 נבנים על אלה אותם העקרונות. 634 00:37:04,100 --> 00:37:09,530 >> עכשיו, אפילו מערכת כמו ווטסון הוא לא מורכב מספיק 635 00:37:09,530 --> 00:37:14,820 כדי להיות מסוגל לענות שרירותי שאלות על כל נושא. 636 00:37:14,820 --> 00:37:20,060 ולמעשה, הם צריכים להיות מובנה בתוך תחום מסוים. 637 00:37:20,060 --> 00:37:24,440 אז אתה יכול להיכנס לאינטרנט ואתה יכול למצוא גרסאות של ווטסון הפועלים גם 638 00:37:24,440 --> 00:37:27,700 בתוך מידע רפואי. 639 00:37:27,700 --> 00:37:31,490 או שיש באינטרנט אחד שרק עוסק באופן 640 00:37:31,490 --> 00:37:34,540 כדי להפוך את המלצות טובות על מה בירה ילך עם שמזון. 641 00:37:34,540 --> 00:37:37,060 642 00:37:37,060 --> 00:37:41,870 ובתוך תחומים אלה, זה יכול לענות על שאלות, 643 00:37:41,870 --> 00:37:46,130 למצוא את המידע שהוא צריך. 644 00:37:46,130 --> 00:37:48,270 >> אבל אתה לא יכול לערבב ולהתאים אותם. 645 00:37:48,270 --> 00:37:53,150 המערכת שכבר מאומן עם מסד הנתונים של מזון ובירה 646 00:37:53,150 --> 00:37:56,830 לא עובד טוב כשאתה פתאום לשים את זה עם המידע הרפואי 647 00:37:56,830 --> 00:37:59,770 מאגר מידע. 648 00:37:59,770 --> 00:38:05,680 אפילו המערכות שלנו כל כך הטובות ביותר היום להסתמך על רמה של עיבוד 649 00:38:05,680 --> 00:38:11,570 שבו אנו קידוד יד ו בנייה בתשתית על מנת 650 00:38:11,570 --> 00:38:13,275 כדי להפעיל את המערכת הזאת. 651 00:38:13,275 --> 00:38:16,360 652 00:38:16,360 --> 00:38:20,710 >> עכשיו, הנושא האחרון שאני רוצה כדי להיות מסוגל לקבל היום ל 653 00:38:20,710 --> 00:38:23,960 הוא על תקשורת לא מילולית. 654 00:38:23,960 --> 00:38:29,290 מסה גדולה של מידע ש אנו מתקשרים אחד עם השני 655 00:38:29,290 --> 00:38:35,490 לא בא על דרך מילות בודדות שאנחנו פונים. 656 00:38:35,490 --> 00:38:40,290 זה קשור לדברים כמו קרבה, מבט, הטון של קול שלך, 657 00:38:40,290 --> 00:38:42,270 הפיתול שלך. 658 00:38:42,270 --> 00:38:46,620 ותקשורת שהוא גם משהו שממשקים רבים ושונים 659 00:38:46,620 --> 00:38:49,960 אכפת הרבה על. 660 00:38:49,960 --> 00:38:51,500 זה לא מה שSiri אכפת. 661 00:38:51,500 --> 00:38:56,250 אני יכול לשאול משהו Siri בקול אחד או בנימת הקול שונה, 662 00:38:56,250 --> 00:38:59,840 וSiri הולך תן לי את אותה תשובה. 663 00:38:59,840 --> 00:39:05,260 אבל זה לא מה שאנו בונים ל סוגים רבים אחרים של ממשקים. 664 00:39:05,260 --> 00:39:09,120 >> אני רוצה להכיר לך עכשיו לאחד מהרובוטים. 665 00:39:09,120 --> 00:39:12,720 זה נבנה על ידי ותיק שלי חבר ועמית סינתיה 666 00:39:12,720 --> 00:39:16,010 Breazeal וחברתה Jibo. 667 00:39:16,010 --> 00:39:20,090 וrobot-- זה אנחנו הולכים יש לי כמה מתנדבים 668 00:39:20,090 --> 00:39:22,520 לבוא לאינטראקציה עם זה. 669 00:39:22,520 --> 00:39:26,200 אז אני יכול להיות שני אנשים שמוכנים לשחק עם הרובוט בשבילי? 670 00:39:26,200 --> 00:39:29,936 למה אתה לא בא בעד, ולמה שלא תבואו עליו. 671 00:39:29,936 --> 00:39:31,310 אם היית להצטרף אליי כאן, בבקשה. 672 00:39:31,310 --> 00:39:36,520 673 00:39:36,520 --> 00:39:39,670 >> ואם אני יכול יש לך הגיע ממש כאן. 674 00:39:39,670 --> 00:39:40,170 תודה. 675 00:39:40,170 --> 00:39:40,480 הי. 676 00:39:40,480 --> 00:39:41,400 >> אלפרדו: נחמד לפגוש אותך. 677 00:39:41,400 --> 00:39:42,010 אלפרדו. 678 00:39:42,010 --> 00:39:42,520 >> בריאן SCASSELLATI: אלפרדו. 679 00:39:42,520 --> 00:39:43,146 >> רחל: רחל. 680 00:39:43,146 --> 00:39:44,228 בריאן SCASSELLATI: רחל. 681 00:39:44,228 --> 00:39:45,154 נחמד לפגוש אותך גם. 682 00:39:45,154 --> 00:39:46,820 אלפרדו, אני הולך יש לך ללכת ראשון. 683 00:39:46,820 --> 00:39:47,990 בואו ממש עד כאן. 684 00:39:47,990 --> 00:39:51,870 אני הולך להציג אתם-- אם אני יכול לקבל את זה מ 685 00:39:51,870 --> 00:39:58,450 בלי לדפוק microphone-- לרובוט קטן בשם Jibo. 686 00:39:58,450 --> 00:40:00,140 אוקיי? 687 00:40:00,140 --> 00:40:04,260 >> עכשיו, Jibo נועד להיות אינטראקטיבי. 688 00:40:04,260 --> 00:40:09,339 ולמרות שזה יכול לתת לך דיבור, הרבה של האינטראקציה עם הרובוט 689 00:40:09,339 --> 00:40:09,880 הוא לא מילולי. 690 00:40:09,880 --> 00:40:12,450 691 00:40:12,450 --> 00:40:17,070 אלפרדו, אני הולך לשאול אותך ל אומר משהו נחמד ומחמיא 692 00:40:17,070 --> 00:40:19,554 לרובוט, בבקשה. 693 00:40:19,554 --> 00:40:20,845 אלפרדו: אני חושב שאתה נראה חמוד. 694 00:40:20,845 --> 00:40:24,114 695 00:40:24,114 --> 00:40:25,611 >> [קול זמזום] 696 00:40:25,611 --> 00:40:26,192 697 00:40:26,192 --> 00:40:27,108 בריאן SCASSELLATI: אישור. 698 00:40:27,108 --> 00:40:30,110 699 00:40:30,110 --> 00:40:33,180 התגובה שלה היא לא מילולית. 700 00:40:33,180 --> 00:40:35,180 ובכל זאת, נתנה לך שני הכרה ברורה 701 00:40:35,180 --> 00:40:39,680 ששמע את מה שאמרת וגם איכשהו הבין ש. 702 00:40:39,680 --> 00:40:40,530 אוקיי? 703 00:40:40,530 --> 00:40:42,070 צעד נכון לחזור לכאן לשנייה אחת. 704 00:40:42,070 --> 00:40:43,130 תודה. 705 00:40:43,130 --> 00:40:44,090 >> רחל, אם היית. 706 00:40:44,090 --> 00:40:46,070 עכשיו, אני הולך לתת לי שלך את העבודה הרבה יותר קשה. 707 00:40:46,070 --> 00:40:48,361 אם הייתי עומד כאן, לגבות רק קצת כל כך 708 00:40:48,361 --> 00:40:50,280 אנחנו יכולים להביא לך במצלמה ולחפש דרך זו. 709 00:40:50,280 --> 00:40:56,840 אני הולך לשאול אותך להגיד משהו באמת מתכוון וחזק ברובוט. 710 00:40:56,840 --> 00:41:02,900 >> רחל: מה אתה פשוט נראה לעשות היה מגוחך לחלוטין. 711 00:41:02,900 --> 00:41:03,840 >> [זמזום SOUND] 712 00:41:03,840 --> 00:41:07,610 713 00:41:07,610 --> 00:41:09,030 >> זה היה עוד יותר מגוחך. 714 00:41:09,030 --> 00:41:10,120 מה הולך איתך? 715 00:41:10,120 --> 00:41:13,487 716 00:41:13,487 --> 00:41:16,207 אה, אל תרגישו רע. 717 00:41:16,207 --> 00:41:17,040 אני אתן לך חיבוק. 718 00:41:17,040 --> 00:41:19,882 719 00:41:19,882 --> 00:41:21,090 בריאן SCASSELLATI: בסדר. 720 00:41:21,090 --> 00:41:22,280 תודה, רחל. 721 00:41:22,280 --> 00:41:24,565 אלפרדו, רחל, תודה חבר מאוד. 722 00:41:24,565 --> 00:41:26,840 >> [תְשׁוּאוֹת] 723 00:41:26,840 --> 00:41:28,660 724 00:41:28,660 --> 00:41:34,470 >> אז אינטראקציה מסוג זה יש ב דרכים רבות חלק מאותם הכללים 725 00:41:34,470 --> 00:41:36,950 וחלק מאותו מבנה כמה שאנחנו 726 00:41:36,950 --> 00:41:39,950 אולי יש לי באינטראקציה לשונית. 727 00:41:39,950 --> 00:41:44,530 זה גם ותקשורתי משרת מטרה חשובה. 728 00:41:44,530 --> 00:41:48,590 ואינטראקציה ש, ב דרכים רבות, נועדה 729 00:41:48,590 --> 00:41:52,890 להיות השפעה מסוימת על אדם אינטראקציה עם או האזנה 730 00:41:52,890 --> 00:41:54,410 לרובוט. 731 00:41:54,410 --> 00:41:56,450 >> עכשיו, אני בר מזל מספיק יש Jibo כאן היום. 732 00:41:56,450 --> 00:42:00,550 סם Spaulding הוא כאן לעזור שלנו עם הרובוט. 733 00:42:00,550 --> 00:42:07,470 ואני הולך לשאול את סם לתת הדגמה נחמדה לנו אחד מריקודי Jibo 734 00:42:07,470 --> 00:42:09,720 שאנחנו יכולים לצפות בסוף כאן. 735 00:42:09,720 --> 00:42:10,590 אז קדימה, Jibo. 736 00:42:10,590 --> 00:42:11,550 >> SAM: מניח את הדעת, Jibo. 737 00:42:11,550 --> 00:42:14,430 להראות לנו צעדי הריקוד שלך. 738 00:42:14,430 --> 00:42:17,310 >> [השמעת מוסיקה] 739 00:42:17,310 --> 00:42:43,114 740 00:42:43,114 --> 00:42:44,780 בריאן SCASSELLATI: בסדר, כולם. 741 00:42:44,780 --> 00:42:46,865 תודה לחברים שלנו בJibo. 742 00:42:46,865 --> 00:42:49,426 >> [תְשׁוּאוֹת] 743 00:42:49,426 --> 00:42:50,140 744 00:42:50,140 --> 00:42:54,990 >> ותודה לחברים שלנו ב יבמ לעוזר היום. 745 00:42:54,990 --> 00:42:57,300 תקשורת היא משהו כי אתה הולך 746 00:42:57,300 --> 00:43:02,280 לראות מתקרב יותר ויותר כ אנו בונים ממשקים מורכבים יותר. 747 00:43:02,280 --> 00:43:05,760 בשבוע הבא, נהיה לדבר על איך ממשק 748 00:43:05,760 --> 00:43:08,890 עם מתנגדי מחשב במשחקים. 749 00:43:08,890 --> 00:43:12,950 אבל אם יש לך שאלות על זה, אני אהיה סביב בשעתי עבודה הלילה. 750 00:43:12,950 --> 00:43:17,610 אני שמח לדבר איתך על AI נושאים או להיכנס לפירוט רב יותר. 751 00:43:17,610 --> 00:43:18,927 שיהיה לך סוף שבוע נעים. 752 00:43:18,927 --> 00:43:21,409 >> [תְשׁוּאוֹת] 753 00:43:21,409 --> 00:43:21,909 754 00:43:21,909 --> 00:43:26,141 [השמעת מוסיקה] 755 00:43:26,141 --> 00:46:42,879