1 00:00:00,000 --> 00:00:08,364 2 00:00:08,364 --> 00:00:08,870 >> LUCAS فریتاس: سلام. 3 00:00:08,870 --> 00:00:09,980 هر کس خوش آمدید. 4 00:00:09,980 --> 00:00:11,216 نام من لوکاس فریتاس است. 5 00:00:11,216 --> 00:00:15,220 من یک تازه وارد در [نامفهوم] مطالعه هستم علوم کامپیوتر با تمرکز در 6 00:00:15,220 --> 00:00:16,410 زبان شناسی محاسباتی. 7 00:00:16,410 --> 00:00:19,310 بنابراین ثانویه من است در زبان و نظریه زبانی. 8 00:00:19,310 --> 00:00:21,870 من واقعا هیجان زده به شما یاد می دهد بچه ها کمی در مورد زمین میشه. 9 00:00:21,870 --> 00:00:24,300 این یک منطقه بسیار هیجان انگیز را به مطالعه است. 10 00:00:24,300 --> 00:00:27,260 همچنین با بسیاری از پتانسیل برای آینده است. 11 00:00:27,260 --> 00:00:30,160 بنابراین، من واقعا هیجان زده است که شما بچه ها با توجه به پروژه های در 12 00:00:30,160 --> 00:00:31,160 زبان شناسی محاسباتی. 13 00:00:31,160 --> 00:00:35,460 و من بیش از شاد برای توصیه می شود هر کدام از شما اگر شما تصمیم می گیرید 14 00:00:35,460 --> 00:00:37,090 به دنبال یکی از آن. 15 00:00:37,090 --> 00:00:40,010 >> پس اول از همه چه چیزی محاسباتی است زبان شناسی؟ 16 00:00:40,010 --> 00:00:44,630 زبان شناسی پس محاسباتی است تقاطع بین زبان شناسی و 17 00:00:44,630 --> 00:00:46,390 علوم کامپیوتر. 18 00:00:46,390 --> 00:00:47,415 بنابراین، آنچه زبان شناسی است؟ 19 00:00:47,415 --> 00:00:48,490 علوم کامپیوتر چیست؟ 20 00:00:48,490 --> 00:00:51,580 خب از زبان شناسی، چه ما را به زبان می باشد. 21 00:00:51,580 --> 00:00:54,960 پس زبان شناسی در واقع مطالعه از زبان طبیعی به طور کلی. 22 00:00:54,960 --> 00:00:58,330 زبان بنابراین طبیعی - ما در مورد صحبت زبانی که ما در واقع به استفاده از 23 00:00:58,330 --> 00:00:59,770 ارتباط با یکدیگر. 24 00:00:59,770 --> 00:01:02,200 بنابراین ما دقیقا صحبت نمی کنم در مورد C و یا جاوا. 25 00:01:02,200 --> 00:01:05,900 ما در حال صحبت کردن بیشتر در مورد زبان انگلیسی و چینی و دیگر زبان های است که ما 26 00:01:05,900 --> 00:01:07,780 استفاده برای برقراری ارتباط با یکدیگر. 27 00:01:07,780 --> 00:01:12,470 >> نکته چالش برانگیز در مورد آن این است که در حال حاضر ما تقریبا 7000 28 00:01:12,470 --> 00:01:14,260 زبان در جهان است. 29 00:01:14,260 --> 00:01:19,520 بنابراین کاملا انواع بالا وجود دارد از زبان که ما می توانیم مطالعه. 30 00:01:19,520 --> 00:01:22,600 و سپس شما فکر می کنم که آن را احتمالا بسیار سخت به انجام، به عنوان مثال، 31 00:01:22,600 --> 00:01:26,960 ترجمه از یک زبان به زبان دیگر، با توجه به اینکه شما 32 00:01:26,960 --> 00:01:28,240 تقریبا 7000 از آنها. 33 00:01:28,240 --> 00:01:31,450 بنابراین، اگر شما از انجام ترجمه فکر می کنم از یک زبان به زبان دیگر شما 34 00:01:31,450 --> 00:01:35,840 تقریبا بیش از یک میلیون ترکیبات مختلف که شما می توانید 35 00:01:35,840 --> 00:01:37,330 باید از زبانی به زبان. 36 00:01:37,330 --> 00:01:40,820 بنابراین آن را واقعا به چالش کشیدن برای انجام برخی از نوع سیستم به عنوان مثال برای ترجمه 37 00:01:40,820 --> 00:01:43,540 هر زبان واحد. 38 00:01:43,540 --> 00:01:47,120 >> بنابراین، زبان شناسی رفتار با نحو، معناشناسی، واقع بین. 39 00:01:47,120 --> 00:01:49,550 شما بچه ها دقیقا لازم نیست به دانستن آنچه که آنها می باشد. 40 00:01:49,550 --> 00:01:55,090 اما چیزی که بسیار جالب است این است که به عنوان یک زبان مادری، که یاد می گیرید 41 00:01:55,090 --> 00:01:59,010 زبان به عنوان فرزند، شما در واقع یادگیری همه کسانی که همه چیز - معناشناسی نحو 42 00:01:59,010 --> 00:02:00,500 و واقع بین - 43 00:02:00,500 --> 00:02:01,430 توسط خودتان. 44 00:02:01,430 --> 00:02:04,820 و هیچ کس به شما یاد می نحو برای شما را به درک چگونگی احکام 45 00:02:04,820 --> 00:02:05,290 ساختار. 46 00:02:05,290 --> 00:02:07,980 بنابراین، این واقعا جالب است زیرا آن چیزی که بسیار می آید 47 00:02:07,980 --> 00:02:10,389 به طور مستقیم. 48 00:02:10,389 --> 00:02:13,190 >> و آنچه از شما از مصرف علوم کامپیوتر؟ 49 00:02:13,190 --> 00:02:16,700 خوب، مهم ترین چیز این است که ما در علم کامپیوتر است اول 50 00:02:16,700 --> 00:02:19,340 همه، هوش مصنوعی و یادگیری ماشین. 51 00:02:19,340 --> 00:02:22,610 بنابراین، آنچه که ما در حال تلاش برای انجام زبان شناسی محاسباتی آموزش است 52 00:02:22,610 --> 00:02:26,990 کامپیوتر شما چگونه به انجام کاری با زبان. 53 00:02:26,990 --> 00:02:28,630 >> بنابراین، برای مثال، در دستگاه ترجمه. 54 00:02:28,630 --> 00:02:32,490 من در تلاش برای میآموزد که چگونه کامپیوتر من بدانید که چگونه برای انتقال از یک 55 00:02:32,490 --> 00:02:33,310 زبان به زبان دیگر. 56 00:02:33,310 --> 00:02:35,790 بنابراین، اساسا مانند آموزش یک کامپیوتر به دو زبان. 57 00:02:35,790 --> 00:02:38,870 اگر من انجام پردازش زبان طبیعی، است که در مورد به عنوان مثال از 58 00:02:38,870 --> 00:02:41,810 فیس بوک در گراف جستجو، شما یاد می دهد کامپیوتر شما چگونه به درک 59 00:02:41,810 --> 00:02:42,730 نمایش داده شد است. 60 00:02:42,730 --> 00:02:48,130 >> بنابراین، اگر شما می گویند "عکس های من دوستان. "فیس بوک را معالجه نمی کند که 61 00:02:48,130 --> 00:02:51,130 به عنوان یک رشته تمام است که فقط یک دسته از کلمات. 62 00:02:51,130 --> 00:02:56,020 این در واقع ارتباط را درک بین "عکس" و "دوستان من" و 63 00:02:56,020 --> 00:02:59,620 درک می کند که "عکس" می باشد اموال "دوستان من." 64 00:02:59,620 --> 00:03:02,350 >> بنابراین، آن بخش از است، به عنوان مثال، پردازش زبان طبیعی است. 65 00:03:02,350 --> 00:03:04,790 این تلاش برای درک آنچه رابطه بین است 66 00:03:04,790 --> 00:03:07,520 واژگان در یک جمله. 67 00:03:07,520 --> 00:03:11,170 و سوال بزرگ است، می تواند شما را آموزش کامپیوتر چگونه به صحبت می کنند 68 00:03:11,170 --> 00:03:12,650 یک زبان به طور کلی؟ 69 00:03:12,650 --> 00:03:17,810 که یک سوال بسیار جالب است فکر می کنم، تا اگر شاید در آینده، 70 00:03:17,810 --> 00:03:19,930 شما به قادر به صحبت کردن با تلفن همراه شما. 71 00:03:19,930 --> 00:03:23,290 نوع مانند آنچه که ما با سیری انجام دهید، اما چیزی شبیه به، شما در واقع می تواند 72 00:03:23,290 --> 00:03:25,690 می گویند هر آنچه می خواهید و تلفن رفتن به درک همه چیز. 73 00:03:25,690 --> 00:03:28,350 و آن را می توانید پیگیری سوال و صحبت. 74 00:03:28,350 --> 00:03:30,880 این چیزی است که واقعا هیجان انگیز است، به نظر من. 75 00:03:30,880 --> 00:03:33,070 >> بنابراین، چیزی در مورد زبان طبیعی است. 76 00:03:33,070 --> 00:03:36,220 چیزی واقعا در مورد جالب زبان طبیعی است که، و این است 77 00:03:36,220 --> 00:03:38,470 اعتبار به استاد زبان شناسی من، ماریا Polinsky. 78 00:03:38,470 --> 00:03:40,830 او به عنوان مثال می دهد و من فکر می کنم این واقعا جالب است. 79 00:03:40,830 --> 00:03:47,060 از آنجا که ما یادگیری زبان از زمانی که ما به دنیا آمد و پس از آن مادری ما 80 00:03:47,060 --> 00:03:49,170 زبان نوع در ما رشد می کند. 81 00:03:49,170 --> 00:03:52,570 >> و در واقع شما در یادگیری زبان از حداقل ورودی، درست است؟ 82 00:03:52,570 --> 00:03:56,700 شما فقط گرفتن ورودی از شما پدر و مادر از چه زبانی خود را برای تلفن های موبایل 83 00:03:56,700 --> 00:03:58,770 دوست دارم و شما فقط آن را یاد بگیرند. 84 00:03:58,770 --> 00:04:02,240 بنابراین، این جالب است زیرا اگر شما نگاه کنید در آن احکام، به عنوان مثال. 85 00:04:02,240 --> 00:04:06,980 شما نگاه کنید، "مری قرار می دهد بر روی کت هر زمان او به ترک خانه. " 86 00:04:06,980 --> 00:04:10,650 >> در این مورد، این امکان وجود دارد که کلمه "او" اشاره به مری، درست است؟ 87 00:04:10,650 --> 00:04:13,500 شما می توانید می گویند "مری قرار می دهد بر روی کت هر زمان مری برگ 88 00:04:13,500 --> 00:04:14,960 خانه. "به طوری که خوب است. 89 00:04:14,960 --> 00:04:19,370 اما پس از آن اگر شما در حکم نگاه "او در کت قرار می دهد در هر زمان مری 90 00:04:19,370 --> 00:04:22,850 ترک خانه. "شما می دانید آن را غیر ممکن است می گویند که "او" است 91 00:04:22,850 --> 00:04:24,260 با اشاره به مری. 92 00:04:24,260 --> 00:04:27,070 >> هیچ راهی برای گفتن این که "مری قرار می دهد وجود دارد در کت هر زمان مری برگ 93 00:04:27,070 --> 00:04:30,790 خانه. "پس از آن جالب است زیرا این نوع از شهود است 94 00:04:30,790 --> 00:04:32,890 که هر زبان مادری است. 95 00:04:32,890 --> 00:04:36,370 و هیچ کس آموزش داده شد که این راه است که به نحو کار می کند. 96 00:04:36,370 --> 00:04:41,930 و که فقط می توان این "او" دارند با اشاره به مری در این مورد اول، 97 00:04:41,930 --> 00:04:44,260 است و در واقع در این دیگر بیش از حد، اما در این یکی. 98 00:04:44,260 --> 00:04:46,500 اما همه نوع می شود به همان جواب. 99 00:04:46,500 --> 00:04:48,580 هر کس موافق است بر روی آن. 100 00:04:48,580 --> 00:04:53,280 پس از آن واقعا جالب است که چگونه هر چند شما همه قوانین را نمی دانم 101 00:04:53,280 --> 00:04:55,575 در زبان شما نوع درک چگونه زبان کار می کند. 102 00:04:55,575 --> 00:04:59,020 103 00:04:59,020 --> 00:05:01,530 >> بنابراین نکته جالب در مورد طبیعی زبان این است که شما لازم نیست که 104 00:05:01,530 --> 00:05:06,970 می دانم هر نحو می دانم که اگر یک جمله برای دستور زبان و یا ungrammatical است 105 00:05:06,970 --> 00:05:08,810 اکثر موارد. 106 00:05:08,810 --> 00:05:13,220 که باعث می شود شما فکر می کنم که شاید آنچه اتفاق می افتد این است که از طریق زندگی خود را، شما 107 00:05:13,220 --> 00:05:17,410 فقط حفظ شدن بیشتر و بیشتر جملات به شما گفته. 108 00:05:17,410 --> 00:05:19,800 و سپس شما را حفظ نگه دارید همه از جملات. 109 00:05:19,800 --> 00:05:24,230 و سپس وقتی که کسی به شما می گوید چیزی، شما که حکم گوش و 110 00:05:24,230 --> 00:05:27,040 شما در فرهنگ لغت خود نگاه جملات و اگر ببینید 111 00:05:27,040 --> 00:05:28,270 که حکم وجود دارد. 112 00:05:28,270 --> 00:05:29,830 و اگر وجود دارد و شما می گویند آن را دستوری. 113 00:05:29,830 --> 00:05:31,740 اگر آن را به شما می گویند آن را ungrammatical. 114 00:05:31,740 --> 00:05:35,150 >> بنابراین، در آن صورت، شما می گویند، آه، بنابراین شما باید یک لیست بزرگ از همه 115 00:05:35,150 --> 00:05:36,140 احکام امکان پذیر است. 116 00:05:36,140 --> 00:05:38,240 و پس از آن زمانی که شما یک جمله را بشنود، شما می دانید که اگر آن را دستوری و یا 117 00:05:38,240 --> 00:05:39,450 در که نه بر اساس. 118 00:05:39,450 --> 00:05:42,360 نکته این است که اگر شما در نگاه یک جمله، به عنوان مثال، " 119 00:05:42,360 --> 00:05:47,540 پنج سر CS50 TFS پخته شده کور هشت پا با استفاده از یک لیوان DAPA. "این 120 00:05:47,540 --> 00:05:49,630 قطعا نه یک جمله که شما قبل از شنیده می شود. 121 00:05:49,630 --> 00:05:52,380 اما در عین حال شما می دانید آن را تقریبا دستور زبان، درست است؟ 122 00:05:52,380 --> 00:05:55,570 هیچ اشتباهات دستوری وجود دارد و شما می توانید می گویند که 123 00:05:55,570 --> 00:05:57,020 آن یک جمله ممکن است. 124 00:05:57,020 --> 00:06:01,300 >> پس از آن باعث می شود ما فکر می کنم که در واقع راه است که ما زبان یاد بگیرید نه تنها 125 00:06:01,300 --> 00:06:07,090 با داشتن یک بانک اطلاعاتی عظیمی از امکان کلمات یا جملات، بلکه بیشتر از 126 00:06:07,090 --> 00:06:11,490 فهم رابطه کلمات در آن احکام. 127 00:06:11,490 --> 00:06:14,570 آیا این را حس؟ 128 00:06:14,570 --> 00:06:19,370 بنابراین، پس از آن سوال این است، می تواند کامپیوتر زبان یاد بگیرند؟ 129 00:06:19,370 --> 00:06:21,490 آیا ما می توانیم زبان تدریس به کامپیوتر؟ 130 00:06:21,490 --> 00:06:24,230 >> بنابراین، بیایید از تفاوت فکر می کنم بین زبان مادری زبان 131 00:06:24,230 --> 00:06:25,460 و کامپیوتر است. 132 00:06:25,460 --> 00:06:27,340 بنابراین، آنچه به سخنران اتفاقی می افتد؟ 133 00:06:27,340 --> 00:06:30,430 خوب، زبان مادری می آموزد زبان از قرار گرفتن در معرض آن است. 134 00:06:30,430 --> 00:06:34,200 معمولا سال دوران کودکی اولیه آن است. 135 00:06:34,200 --> 00:06:38,570 بنابراین، اساسا، شما فقط باید یک کودک، و شما در حفظ و صحبت کردن به آن، و آن را 136 00:06:38,570 --> 00:06:40,540 فقط می آموزد که چگونه به صحبت می کنند زبان، درست است؟ 137 00:06:40,540 --> 00:06:42,660 بنابراین، شما در واقع به ورودی به کودک. 138 00:06:42,660 --> 00:06:45,200 بنابراین، پس از آن شما می توانید استدلال می کنند که یک کامپیوتر می تواند همین کار را بکند، درست است؟ 139 00:06:45,200 --> 00:06:49,510 شما فقط می توانید زبان را به عنوان ورودی به کامپیوتر است. 140 00:06:49,510 --> 00:06:53,410 >> همانطور که برای مثال یک دسته از فایل ها که کتاب به زبان انگلیسی. 141 00:06:53,410 --> 00:06:56,190 شاید که یک راه این است که شما احتمالا می تواند آموزش 142 00:06:56,190 --> 00:06:57,850 کامپیوتر انگلیسی، درست است؟ 143 00:06:57,850 --> 00:07:01,000 و در واقع، اگر شما در مورد آن فکر می کنم، آن را به شما طول می کشد، شاید یک زن و شوهر 144 00:07:01,000 --> 00:07:02,680 روز تا خواندن یک کتاب. 145 00:07:02,680 --> 00:07:05,760 برای یک کامپیوتر طول می کشد دوم به در تمامی واژگان در کتاب نگاه کنید. 146 00:07:05,760 --> 00:07:10,810 بنابراین شما می توانید فکر می کنم که ممکن است فقط به این آرگومان ورودی از اطراف شما، 147 00:07:10,810 --> 00:07:15,440 که به اندازه کافی نیست که بگوییم که چیزی است که فقط انسان می تواند انجام دهد. 148 00:07:15,440 --> 00:07:17,680 شما می توانید کامپیوتر فکر می کنم همچنین می توانید ورودی دریافت کنید. 149 00:07:17,680 --> 00:07:21,170 >> نکته دوم این است که زبان مادری یک مغز است که همچنین 150 00:07:21,170 --> 00:07:23,870 قابلیت یادگیری زبان. 151 00:07:23,870 --> 00:07:27,020 اما اگر شما در مورد آن فکر می کنم، مغز یک چیز جامد است. 152 00:07:27,020 --> 00:07:30,450 هنگامی که شما به دنیا آمده، آن را در حال حاضر مجموعه - 153 00:07:30,450 --> 00:07:31,320 این مغز شما است. 154 00:07:31,320 --> 00:07:34,660 و همانطور که شما رشد می کنند، شما فقط شکلک های بیشتر از زبان و شاید مواد مغذی 155 00:07:34,660 --> 00:07:35,960 و چیزهای دیگر. 156 00:07:35,960 --> 00:07:38,170 اما تقریبا مغز شما یک چیز جامد است. 157 00:07:38,170 --> 00:07:41,290 >> بنابراین شما می توانید می گویند، خوب، شاید شما می توانید ساخت یک کامپیوتر که دارای یک دسته از 158 00:07:41,290 --> 00:07:45,890 توابع و روش ها است که فقط تقلید قابلیت یادگیری زبان. 159 00:07:45,890 --> 00:07:49,630 بنابراین در این معنا، می توان گفت، خوب، من می تواند یک کامپیوتر است که همه دارند 160 00:07:49,630 --> 00:07:52,270 چیزهایی که من نیاز به یادگیری زبان. 161 00:07:52,270 --> 00:07:56,200 و آخرین چیزی است که بومی سخنران از آزمون و خطا یاد می گیرد. 162 00:07:56,200 --> 00:08:01,090 بنابراین اساسا چیز دیگری که مهم در یادگیری زبان این است که شما نوع 163 00:08:01,090 --> 00:08:05,340 از چیزهایی یاد بگیرند با ساخت کلی از آنچه شما می شنوید. 164 00:08:05,340 --> 00:08:10,280 >> همانگونه که شما در حال رشد است تا به شما یاد بگیرند که برخی از کلمات مانند اسم هستند، 165 00:08:10,280 --> 00:08:11,820 برخی از آنهایی که دیگر صفت ها هستند. 166 00:08:11,820 --> 00:08:14,250 و شما لازم نیست که به هر گونه دانش زبان شناسی 167 00:08:14,250 --> 00:08:15,040 به درک که. 168 00:08:15,040 --> 00:08:18,560 اما تو فقط می دانم که برخی از واژه ها وجود دارد در بخشی از قرار 169 00:08:18,560 --> 00:08:22,570 حکم و برخی دیگر در سایر بخش هایی از جمله. 170 00:08:22,570 --> 00:08:26,110 >> و این زمانی که شما در انجام کاری است که مانند یک جمله است که درست نیست - 171 00:08:26,110 --> 00:08:28,770 شاید به دلیل تعمیم بیش از به عنوان مثال. 172 00:08:28,770 --> 00:08:32,210 شاید زمانی که شما رشد می کند، شما متوجه که جمع است که معمولا 173 00:08:32,210 --> 00:08:35,809 شکل با قرار دادن S در در پایان کلمه است. 174 00:08:35,809 --> 00:08:40,042 و پس از آن شما سعی می کنید برای انجام این کار جمع "گوزن" را به عنوان "ملت mellat" و یا "دندان" را به عنوان 175 00:08:40,042 --> 00:08:44,780 "tooths." بنابراین پس از آن پدر و مادر خود و یا کسی که شما را تصحیح می کند و می گوید: نه، 176 00:08:44,780 --> 00:08:49,020 جمع از "آهو" است "گوزن"، و جمع "دندان" "دندان" است. و پس از آن 177 00:08:49,020 --> 00:08:50,060 شما آن چیزهایی یاد بگیرند. 178 00:08:50,060 --> 00:08:51,520 بنابراین شما از آزمون و خطا یاد بگیرند. 179 00:08:51,520 --> 00:08:53,100 >> اما شما نیز می توانید انجام دهید که با کامپیوتر است. 180 00:08:53,100 --> 00:08:55,310 شما می توانید چیزی به نام یادگیری تقویتی. 181 00:08:55,310 --> 00:08:58,560 که در واقع مانند دادن کامپیوتر پاداش هر زمان که آن را ندارد 182 00:08:58,560 --> 00:08:59,410 چیزی به درستی. 183 00:08:59,410 --> 00:09:04,710 و دادن آن در مقابل پاداش و در آن هنگام که چیزی اشتباه است. 184 00:09:04,710 --> 00:09:07,410 شما می توانید در واقع ببینید که اگر شما به به ترجمه Google و شما را امتحان کنید 185 00:09:07,410 --> 00:09:10,220 ترجمه یک جمله، آن شما می پرسد برای بازخورد. 186 00:09:10,220 --> 00:09:13,240 بنابراین اگر شما می گویند، آه، یک بهتر وجود دارد برای ترجمه این جمله. 187 00:09:13,240 --> 00:09:18,140 شما می توانید آن را تایپ کنید و پس از آن اگر بسیاری از مردم در حفظ و گفت که بهتر است 188 00:09:18,140 --> 00:09:21,560 ترجمه، آن را فقط یاد می گیرد که آن را به باید که ترجمه به جای استفاده از 189 00:09:21,560 --> 00:09:22,960 یکی از آن ارائه شده است. 190 00:09:22,960 --> 00:09:28,830 >> بنابراین، این یک سوال بسیار فلسفی است برای دیدن اگر کامپیوتر در حال رفتن به 191 00:09:28,830 --> 00:09:30,340 قادر به صحبت یا نه در آینده. 192 00:09:30,340 --> 00:09:34,440 اما من امید زیادی که آنها می توانند فقط در آن دسته از استدلال است. 193 00:09:34,440 --> 00:09:38,570 اما این تنها بیشتر از یک فلسفی سوال. 194 00:09:38,570 --> 00:09:43,460 >> بنابراین در حالی که کامپیوتر هنوز نمی تواند صحبت می کنید، چیزهایی که ما می توانیم انجام چه هستند؟ 195 00:09:43,460 --> 00:09:47,070 بعضی چیزها واقعا سرد است طبقه بندی داده ها. 196 00:09:47,070 --> 00:09:53,210 بنابراین، برای مثال، شما بچه ها می دانید است که خدمات پست الکترونیک انجام دهید، برای 197 00:09:53,210 --> 00:09:55,580 به عنوان مثال، فیلتر هرزنامه. 198 00:09:55,580 --> 00:09:59,070 بنابراین هر زمان که شما اسپم دریافت، آن را به تلاش برای فیلتر کردن به جعبه دیگر. 199 00:09:59,070 --> 00:10:00,270 پس چگونه آن را انجام دهید؟ 200 00:10:00,270 --> 00:10:06,080 این مانند کامپیوتر فقط می داند آدرس ایمیل هایی را که در حال ارسال اسپم. 201 00:10:06,080 --> 00:10:09,130 بنابراین آن را بیشتر بر روی محتوای مبتنی بر پیام، یا شاید عنوان و یا 202 00:10:09,130 --> 00:10:11,310 شاید برخی از الگوی است که شما داشته باشد. 203 00:10:11,310 --> 00:10:15,690 >> بنابراین، اساسا، آنچه که شما می توانید انجام دهید این است که بسیاری از داده ها از ایمیل های اسپم، 204 00:10:15,690 --> 00:10:19,980 ایمیل که اسپم نیست، و یاد بگیرند چه نوع الگوهای شما در داشته باشد 205 00:10:19,980 --> 00:10:21,000 آنهایی که می اسپم. 206 00:10:21,000 --> 00:10:23,260 و این بخشی از محاسباتی است زبان شناسی. 207 00:10:23,260 --> 00:10:24,720 این طبقه بندی داده ها نامیده می شود. 208 00:10:24,720 --> 00:10:28,100 و ما در واقع رفتن به به عنوان مثال آن را در اسلاید بعدی. 209 00:10:28,100 --> 00:10:32,910 >> دومین چیزی که به زبان طبیعی است پردازش است که در آن چیزی است که 210 00:10:32,910 --> 00:10:36,580 نمودار جستجو در حال انجام است از اجازه دادن به شما ارسال در یک جمله. 211 00:10:36,580 --> 00:10:38,690 و این اعتماد شما را در درک آنچه معنی می دهد و 212 00:10:38,690 --> 00:10:39,940 شما در نتیجه بهتر است. 213 00:10:39,940 --> 00:10:43,880 در واقع، اگر شما به گوگل و یا بینگ به و شما چیزی شبیه به بانوی جستجو 214 00:10:43,880 --> 00:10:47,060 ارتفاع دل شکسته، شما در واقع رفتن برای به دست آوردن 5 '1 "به جای اطلاعات 215 00:10:47,060 --> 00:10:50,170 از او دلیل آن را در واقع می فهمد آنچه که شما در حال صحبت کردن در مورد. 216 00:10:50,170 --> 00:10:52,140 به طوری که بخشی از طبیعی است پردازش زبان. 217 00:10:52,140 --> 00:10:57,000 >> و یا همچنین هنگامی که شما با استفاده از سیری، برای اولین بار شما یک الگوریتم است که تلاش می کند به 218 00:10:57,000 --> 00:11:01,130 ترجمه آنچه شما می گویید به کلمه، در متن. 219 00:11:01,130 --> 00:11:03,690 و پس از آن تلاش می کند برای ترجمه که به معنای. 220 00:11:03,690 --> 00:11:06,570 به طوری که همه بخشی از طبیعی است پردازش زبان. 221 00:11:06,570 --> 00:11:08,320 >> سپس شما باید ترجمه ماشینی - 222 00:11:08,320 --> 00:11:10,300 است که در واقع یک از مورد علاقه های من - 223 00:11:10,300 --> 00:11:14,060 است که فقط ترجمه از زبان به زبان دیگر. 224 00:11:14,060 --> 00:11:17,950 بنابراین شما می توانید فکر می کنم که هنگامی که شما در حال انجام ترجمه ماشینی، شما باید 225 00:11:17,950 --> 00:11:19,750 امکانات بی نهایت جملات. 226 00:11:19,750 --> 00:11:22,960 بنابراین هیچ راهی تنها ذخیره سازی وجود دارد هر ترجمه تنها. 227 00:11:22,960 --> 00:11:27,440 بنابراین شما باید آمد تا با جالب الگوریتم قادر به 228 00:11:27,440 --> 00:11:30,110 ترجمه هر جمله در برخی از راه. 229 00:11:30,110 --> 00:11:32,483 >> شما هر گونه سوال تا کنون؟ 230 00:11:32,483 --> 00:11:34,450 هیچ؟ 231 00:11:34,450 --> 00:11:34,830 OK. 232 00:11:34,830 --> 00:11:36,900 >> پس چه می خواهیم برای دیدن امروز؟ 233 00:11:36,900 --> 00:11:39,300 اول از همه، من قصد دارم به بحث در مورد مشکل طبقه بندی. 234 00:11:39,300 --> 00:11:41,440 بنابراین یکی که من بود گفت: در مورد اسپم. 235 00:11:41,440 --> 00:11:46,820 چه من قصد دارم برای انجام این کار است، شعر داده شده به یک آهنگ می تواند شما سعی می کنید به کشف کردن 236 00:11:46,820 --> 00:11:49,810 با احتمال بالا که خواننده است؟ 237 00:11:49,810 --> 00:11:53,590 اجازه دهید بگویم که من آهنگ از بانو گاگا و کتی پری، اگر من شما را 238 00:11:53,590 --> 00:11:58,130 آهنگ جدید، می تواند شما را شکل اگر این کتی پری و یا لیدی گاگا؟ 239 00:11:58,130 --> 00:12:01,490 >> دوم، من فقط رفتن به صحبت در مورد مشکل تقسیم بندی می شود. 240 00:12:01,490 --> 00:12:05,780 بنابراین من نمی دانم اگر شما بچه ها می دانم، اما چینی، ژاپنی، دیگر شرق آسیا 241 00:12:05,780 --> 00:12:08,090 زبان، و زبان های دیگر به طور کلی، لازم نیست 242 00:12:08,090 --> 00:12:09,830 فاصله بین کلمات. 243 00:12:09,830 --> 00:12:13,540 و پس از آن اگر شما در مورد راه که فکر می کنم نوع کامپیوتر شما را از تلاش می کند تا 244 00:12:13,540 --> 00:12:18,600 درک پردازش زبان طبیعی، آن را در واژه ها به نظر می رسد و 245 00:12:18,600 --> 00:12:21,500 تلاش می کند تا درک روابط بین آنها، درست است؟ 246 00:12:21,500 --> 00:12:25,440 اما پس از آن اگر شما چینی، و شما صفر فاصله، آن را واقعا سخت است 247 00:12:25,440 --> 00:12:28,360 پیدا کردن آنچه که رابطه بین است کلمات، چرا که آنها هیچ ندارد 248 00:12:28,360 --> 00:12:29,530 کلمات در ابتدا. 249 00:12:29,530 --> 00:12:32,600 بنابراین شما باید برای انجام کاری به نام تقسیم بندی که فقط به معنی قرار دادن 250 00:12:32,600 --> 00:12:36,490 فاصله ای که بین آنچه ما می خواهم تماس بگیرید کلمات در این زبان. 251 00:12:36,490 --> 00:12:37,740 را حس؟ 252 00:12:37,740 --> 00:12:39,680 253 00:12:39,680 --> 00:12:41,540 >> و پس از آن ما قصد داریم به در مورد نحو صحبت کنید. 254 00:12:41,540 --> 00:12:44,050 پس فقط کمی در مورد طبیعی پردازش زبان. 255 00:12:44,050 --> 00:12:45,420 این خواهد بود فقط یک مرور کلی. 256 00:12:45,420 --> 00:12:50,700 بنابراین، امروز، اساسا چیزی است که من می خواهم به انجام است شما بچه ها کمی از را 257 00:12:50,700 --> 00:12:53,930 در داخل از فرصت چه می باشد که شما می توانید با محاسباتی انجام 258 00:12:53,930 --> 00:12:54,960 زبان شناسی. 259 00:12:54,960 --> 00:13:00,410 و سپس شما می توانید ببینید چه چیزی شما فکر می کنم در میان کسانی که همه چیز سرد است. 260 00:13:00,410 --> 00:13:02,270 و شاید شما می توانید از یک پروژه فکر می کنم و آمد با من صحبت کنی. 261 00:13:02,270 --> 00:13:05,260 و من می تواند به شما مشاوره بدهند در مورد چگونگی پیاده سازی آن. 262 00:13:05,260 --> 00:13:09,060 >> بنابراین ترکیب نحوی است برای رفتن به یک کمی در مورد جستجو در نمودار و ماشین 263 00:13:09,060 --> 00:13:09,670 ترجمه. 264 00:13:09,670 --> 00:13:13,650 من فقط رفتن به یک مثال از چگونگی شما می توانید، برای مثال، ترجمه 265 00:13:13,650 --> 00:13:16,020 چیزی از پرتغالی به انگلیسی. 266 00:13:16,020 --> 00:13:17,830 به نظر می رسد خوب است؟ 267 00:13:17,830 --> 00:13:19,293 >> پس اول، مشکل طبقه بندی. 268 00:13:19,293 --> 00:13:23,590 من می گویم که این بخش از سمینار در حال رفتن به چالش برانگیزترین 269 00:13:23,590 --> 00:13:27,560 یکی فقط به خاطر رفتن وجود دارد به برخی از برنامه نویسی. 270 00:13:27,560 --> 00:13:29,470 اما برای رفتن به پایتون. 271 00:13:29,470 --> 00:13:34,380 من می دانم که شما بچه ها نمی پایتون دانم، پس من فقط رفتن به در بالا توضیح 272 00:13:34,380 --> 00:13:35,750 سطح کار من. 273 00:13:35,750 --> 00:13:40,900 و شما لازم نیست که واقعا اهمیت بیش از حد زیاد در مورد نحو چرا که 274 00:13:40,900 --> 00:13:42,140 چیزی است که شما بچه ها می توانند یاد بگیرند. 275 00:13:42,140 --> 00:13:42,540 OK؟ 276 00:13:42,540 --> 00:13:43,580 به نظر می رسد خوب است. 277 00:13:43,580 --> 00:13:46,020 >> پس چه مشکل طبقه بندی است؟ 278 00:13:46,020 --> 00:13:49,140 بنابراین شما برخی از اشعار داده شده در حال یک آهنگ، و شما می خواهید به حدس زدن 279 00:13:49,140 --> 00:13:50,620 که به آواز خواندن آن. 280 00:13:50,620 --> 00:13:54,045 و این می تواند برای هر نوع است از مشکلات دیگر. 281 00:13:54,045 --> 00:13:59,980 بنابراین می توان آن را، به عنوان مثال، شما یک انتخابات ریاست جمهوری و شما باید یک 282 00:13:59,980 --> 00:14:02,610 بیان، و شما می خواهید برای پیدا کردن اگر آن بود، به عنوان مثال، 283 00:14:02,610 --> 00:14:04,470 اوباما و میت رامنی. 284 00:14:04,470 --> 00:14:07,700 یا شما می توانید یک دسته از ایمیل ها و شما می خواهید برای کشف کردن در صورتی که 285 00:14:07,700 --> 00:14:08,890 اسپم یا نه. 286 00:14:08,890 --> 00:14:11,440 پس این فقط طبقه بندی برخی از داده ها بر اساس کلمات 287 00:14:11,440 --> 00:14:13,790 که شما وجود دارد. 288 00:14:13,790 --> 00:14:16,295 >> بنابراین برای انجام این کار، شما را به برخی از مفروضات. 289 00:14:16,295 --> 00:14:20,570 پس زیادی در مورد زبان شناسی. در حال مفروضات، 290 00:14:20,570 --> 00:14:24,100 مفروضات معمولا هوشمند، به طوری که شما می توانید نتایج خوبی دریافت کنید. 291 00:14:24,100 --> 00:14:26,670 تلاش برای ایجاد یک مدل برای آن. 292 00:14:26,670 --> 00:14:31,290 و سپس آن را امتحان کنید و ببینید که اگر آن کار می کند، اگر آن را به شما می دهد دقت خوب است. 293 00:14:31,290 --> 00:14:33,940 و اگر آن را ندارد، پس از آن شما سعی در بهبود آن. 294 00:14:33,940 --> 00:14:37,640 اگر آن را ندارد، شما مانند، OK، هستید شاید من باید فرض متفاوت. 295 00:14:37,640 --> 00:14:44,030 >> بنابراین این فرض که ما قصد داریم به این است که یک هنرمند معمولا آواز می خواند 296 00:14:44,030 --> 00:14:49,220 در مورد یک موضوع چندین بار، و شاید با استفاده از کلمات چند بار فقط 297 00:14:49,220 --> 00:14:50,270 چرا که آنها به آن استفاده می شود. 298 00:14:50,270 --> 00:14:51,890 شما فقط می توانید از دوستان خود فکر می کنم. 299 00:14:51,890 --> 00:14:57,350 من مطمئن هستم که شما بچه ها همه دوستان هستم که می گویند عبارت امضای خود، 300 00:14:57,350 --> 00:14:59,260 به معنای واقعی کلمه برای هر جمله تنها - 301 00:14:59,260 --> 00:15:02,660 مانند برخی از کلمه خاص یا خاص عبارت که آنها را برای می گویند 302 00:15:02,660 --> 00:15:04,020 هر جمله تنها. 303 00:15:04,020 --> 00:15:07,920 >> و چه می توان گفت این است که اگر شما می بینید یک جمله است که یک امضا 304 00:15:07,920 --> 00:15:11,450 عبارت، شما می توانید حدس می زنم که احتمالا دوست شما است 305 00:15:11,450 --> 00:15:13,310 یکی از آن گفت، درست است؟ 306 00:15:13,310 --> 00:15:18,410 بنابراین شما را به این فرض و پس از آن این که چگونه یک مدل را ایجاد می کنید. 307 00:15:18,410 --> 00:15:24,440 >> به عنوان مثال که من قصد دارم به در است چگونه بانوی دل شکسته، به عنوان مثال، مردم 308 00:15:24,440 --> 00:15:27,430 می گویند که او استفاده می کند "کودک" برای همه او را شماره یک آهنگ می باشد. 309 00:15:27,430 --> 00:15:32,270 و در واقع این یک ویدیو است که نشان می دهد او گفت کلمه "کودک" برای 310 00:15:32,270 --> 00:15:33,410 آهنگ های مختلف. 311 00:15:33,410 --> 00:15:33,860 >> [پخش ویدئو] 312 00:15:33,860 --> 00:15:34,310 >> - (آواز خواندن) کودک. 313 00:15:34,310 --> 00:15:36,220 کودک. 314 00:15:36,220 --> 00:15:37,086 کودک. 315 00:15:37,086 --> 00:15:37,520 کودک. 316 00:15:37,520 --> 00:15:37,770 کودک. 317 00:15:37,770 --> 00:15:38,822 شخص ساده و معصوم. 318 00:15:38,822 --> 00:15:39,243 کودک. 319 00:15:39,243 --> 00:15:40,085 کودک. 320 00:15:40,085 --> 00:15:40,510 کودک. 321 00:15:40,510 --> 00:15:40,850 کودک. 322 00:15:40,850 --> 00:15:41,090 >> [VIDEO END پخش، 323 00:15:41,090 --> 00:15:44,020 >> LUCAS فریتاس: پس وجود دارد، من فکر می کنم، 40 آهنگ در اینجا که در آن او می گوید: 324 00:15:44,020 --> 00:15:48,690 کلمه "عزیزم." بنابراین شما اساسا می توانید حدس بزنید که اگر شما یک آهنگ است که ببینید 325 00:15:48,690 --> 00:15:52,180 کلمه "عزیزم،" برخی از بالا وجود دارد احتمال که این بانوی دل شکسته. 326 00:15:52,180 --> 00:15:56,450 اما اجازه دهید سعی کنید برای توسعه این بیشتر به طور رسمی تر. 327 00:15:56,450 --> 00:16:00,470 >> پس این شعر به آهنگ های می باشد لیدی گاگا و کتی پری. 328 00:16:00,470 --> 00:16:04,120 بنابراین شما در لیدی گاگا نگاه کنید، شما آنها را مشاهده کنید تعداد زیادی از تکرار "کودک" 329 00:16:04,120 --> 00:16:07,710 بسیاری از تکرار "راه." و پس از آن کتی پری تا به بسیاری از وقوع 330 00:16:07,710 --> 00:16:10,360 "،" بسیاری از تکرار "آتش است." 331 00:16:10,360 --> 00:16:14,560 >> بنابراین اساسا آنچه که ما به خواهید انجام شده است، شما شعر را دریافت کنید. 332 00:16:14,560 --> 00:16:20,480 اجازه دهید بگویم که شما یک شعر برای دریافت آهنگ این است که "عزیزم،" فقط "عزیزم." اگر 333 00:16:20,480 --> 00:16:24,750 شما فقط کلمه "کودک"، و این تمام داده هایی را که شما را از داشته است 334 00:16:24,750 --> 00:16:27,880 لیدی گاگا و کتی پری، که می خواهند شما حدس می زنم شخص 335 00:16:27,880 --> 00:16:29,370 که آهنگ آواز می خواند؟ 336 00:16:29,370 --> 00:16:32,360 لیدی گاگا و کتی پری؟ 337 00:16:32,360 --> 00:16:33,150 بانوی دل شکسته، درست است؟ 338 00:16:33,150 --> 00:16:37,400 از آنجا که او تنها کسی بود که می گوید است "عزیزم." این برای تلفن های موبایل و نرم افزار، درست است؟ 339 00:16:37,400 --> 00:16:38,760 OK، این واقعا آسان است. 340 00:16:38,760 --> 00:16:41,860 من فقط به دنبال در دو آهنگ و البته، او تنها کسی است که به این 341 00:16:41,860 --> 00:16:42,660 "عزیزم." 342 00:16:42,660 --> 00:16:44,740 >> اما اگر شما یک دسته از کلمات؟ 343 00:16:44,740 --> 00:16:50,900 اگر شما از یک شعر واقعی، چیزی مثل، "عزیزم، من فقط 344 00:16:50,900 --> 00:16:51,610 رفتم برای دیدن [؟ CFT؟] 345 00:16:51,610 --> 00:16:54,020 سخنرانی، "و یا چیزی شبیه به آن، و پس از آن شما در واقع باید به شکل از - 346 00:16:54,020 --> 00:16:55,780 بر اساس همه این واژه ها - 347 00:16:55,780 --> 00:16:58,350 که هنرمندی که احتمالا است این آهنگ خواند؟ 348 00:16:58,350 --> 00:17:01,860 بنابراین اجازه دهید سعی کنید برای توسعه این کمی بیشتر. 349 00:17:01,860 --> 00:17:05,630 >> OK، بنابراین فقط بر روی داده ها بر اساس است که ما رو، به نظر می رسد که دل شکسته است که احتمالا 350 00:17:05,630 --> 00:17:06,260 خواننده. 351 00:17:06,260 --> 00:17:07,904 اما چگونه می توان از ارسال این به طور رسمی تر؟ 352 00:17:07,904 --> 00:17:10,579 353 00:17:10,579 --> 00:17:13,140 و وجود دارد برای رفتن به یک کمی کمی از آمار. 354 00:17:13,140 --> 00:17:15,880 بنابراین اگر شما از دست داده، فقط سعی کنید برای درک مفهوم. 355 00:17:15,880 --> 00:17:18,700 مهم نیست که اگر شما را در درک معادلات به خوبی. 356 00:17:18,700 --> 00:17:22,150 این همه رفتن به صورت آنلاین. 357 00:17:22,150 --> 00:17:25,490 >> بنابراین اساسا آنچه که من محاسبه است احتمال این که این آهنگ توسط 358 00:17:25,490 --> 00:17:28,040 بانوی دل شکسته با توجه به اینکه - 359 00:17:28,040 --> 00:17:30,660 پس این بار با توجه به معنی که - 360 00:17:30,660 --> 00:17:33,680 من کلمه را دیدم "عزیزم." آیا این را حس؟ 361 00:17:33,680 --> 00:17:35,540 بنابراین من در تلاش برای محاسبه که احتمال. 362 00:17:35,540 --> 00:17:38,540 >> پس این قضیه به نام وجود دارد قضیه بیز است که می گوید که 363 00:17:38,540 --> 00:17:43,330 احتمال B داده شده است، احتمال B داده شده A، برابر 364 00:17:43,330 --> 00:17:47,660 احتمال A، بیش از احتمال از B. این یک معادله طولانی است. 365 00:17:47,660 --> 00:17:51,970 اما آنچه شما باید از درک که این است که این چیزی است که من می خواهم 366 00:17:51,970 --> 00:17:52,830 محاسبه، درست است؟ 367 00:17:52,830 --> 00:17:56,570 بنابراین احتمال این که این آهنگ است بانوی دل شکسته با توجه به اینکه من کلمه دیدم 368 00:17:56,570 --> 00:17:58,230 "عزیزم." 369 00:17:58,230 --> 00:18:02,960 >> و در حال حاضر آنچه که من گرفتن است احتمال از کلمه "کودک" داده شده 370 00:18:02,960 --> 00:18:04,390 که من آن را بانوی دل شکسته. 371 00:18:04,390 --> 00:18:07,220 و چه چیزی است که اساسا؟ 372 00:18:07,220 --> 00:18:10,500 این بدان معناست، آنچه که احتمال دیدن کلمه "کودک" 373 00:18:10,500 --> 00:18:12,130 در شعر دل شکسته؟ 374 00:18:12,130 --> 00:18:16,240 اگر من می خواهم برای محاسبه است که در بسیار راه ساده، آن را فقط به تعداد است 375 00:18:16,240 --> 00:18:23,640 بار من "کودک" را ببینید بیش از تعداد کل از کلمات در شعر دل شکسته، درست است؟ 376 00:18:23,640 --> 00:18:27,600 فرکانس که من می بینم چیست که کلمه در کار دل شکسته؟ 377 00:18:27,600 --> 00:18:30,530 را حس؟ 378 00:18:30,530 --> 00:18:33,420 >> دوره دوم است احتمال دل شکسته. 379 00:18:33,420 --> 00:18:34,360 به چه معنا است؟ 380 00:18:34,360 --> 00:18:38,550 که اساسا بدان معنی است، آنچه که احتمال طبقه بندی 381 00:18:38,550 --> 00:18:40,690 برخی از اشعار به عنوان دل شکسته؟ 382 00:18:40,690 --> 00:18:45,320 و این نوع از عجیب و غریب، اما اجازه دهید یک مثال فکر می کنم. 383 00:18:45,320 --> 00:18:49,230 بنابراین اجازه دهید بگویم که احتمال داشتن "کودک" در یک آهنگ یکسان است 384 00:18:49,230 --> 00:18:51,760 برای دل شکسته و بریتنی اسپیرز. 385 00:18:51,760 --> 00:18:54,950 اما بریتنی اسپیرز دو برابر است آهنگ بیشتر از بانوی دل شکسته. 386 00:18:54,950 --> 00:19:00,570 بنابراین اگر کسی فقط به طور تصادفی به شما می دهد شعر از: "عزیزم،" اولین چیزی که شما 387 00:19:00,570 --> 00:19:04,710 نگاه است، چه احتمال است داشتن "کودک" در یک آهنگ دل شکسته، "کودک" 388 00:19:04,710 --> 00:19:05,410 در یک آهنگ بریتنی؟ 389 00:19:05,410 --> 00:19:06,460 و این همان چیزی است. 390 00:19:06,460 --> 00:19:10,040 >> بنابراین دومین چیزی که شما خواهید دید است، خب، چه احتمال است 391 00:19:10,040 --> 00:19:13,770 این شعر توسط خود را به عنوان یک شعر دل شکسته، و چه احتمال است 392 00:19:13,770 --> 00:19:15,380 بودن شعر بریتنی؟ 393 00:19:15,380 --> 00:19:18,950 پس از بریتنی تا به بسیاری از اشعار از دل شکسته، شما را احتمالا 394 00:19:18,950 --> 00:19:21,470 می گویند، خوب، این است که احتمالا شعر بریتنی. 395 00:19:21,470 --> 00:19:23,340 به همین دلیل ما باید این اصطلاح حق در اینجا. 396 00:19:23,340 --> 00:19:24,670 احتمال دل شکسته. 397 00:19:24,670 --> 00:19:26,950 را حس می کند؟ 398 00:19:26,950 --> 00:19:28,660 آیا آن؟ 399 00:19:28,660 --> 00:19:29,370 OK. 400 00:19:29,370 --> 00:19:33,500 >> و یکی از آخرین تنها احتمال است از "کودک" که نمی کند 401 00:19:33,500 --> 00:19:34,810 واقعا مهم نیست که بسیار. 402 00:19:34,810 --> 00:19:39,940 اما این احتمال است دیدن "کودک" به زبان انگلیسی. 403 00:19:39,940 --> 00:19:42,725 ما معمولا اهمیتی نمی دهند که بسیار در مورد آن مدت است. 404 00:19:42,725 --> 00:19:44,490 آیا این را حس؟ 405 00:19:44,490 --> 00:19:48,110 بنابراین احتمال دل شکسته به نام احتمال قبل 406 00:19:48,110 --> 00:19:49,530 دل شکسته کلاس. 407 00:19:49,530 --> 00:19:53,840 از آنجا که این فقط بدان معناست که، آنچه که احتمال داشتن آن کلاس - 408 00:19:53,840 --> 00:19:55,520 که دل شکسته - 409 00:19:55,520 --> 00:19:59,350 فقط به طور کلی، فقط با شرایط. 410 00:19:59,350 --> 00:20:02,560 >> و پس از آن زمانی که من احتمال داشته باشد دل شکسته داده شده "عزیزم،" ما آن را به اضافه 411 00:20:02,560 --> 00:20:06,160 پر از اشک احتمال به خاطر آن احتمال داشتن 412 00:20:06,160 --> 00:20:08,300 دل شکسته برخی از شواهد داده شده است. 413 00:20:08,300 --> 00:20:11,050 بنابراین من به شما دادن شواهد که من کلمه کودک را دیدم و 414 00:20:11,050 --> 00:20:12,690 این آهنگ را حس؟ 415 00:20:12,690 --> 00:20:15,960 416 00:20:15,960 --> 00:20:16,410 OK. 417 00:20:16,410 --> 00:20:22,400 >> بنابراین اگر من محاسبه شده است که برای هر یک از از آهنگ را برای بانوی دل شکسته، 418 00:20:22,400 --> 00:20:25,916 آنچه که خواهد بود - 419 00:20:25,916 --> 00:20:27,730 ظاهرا، من می توانم این حرکت نمی کند. 420 00:20:27,730 --> 00:20:31,850 421 00:20:31,850 --> 00:20:36,920 احتمال گاگا خواهد بود چیزی شبیه به، 2 بیش از 24 بار 1/2، 422 00:20:36,920 --> 00:20:38,260 بیش از 2 بیش از 53. 423 00:20:38,260 --> 00:20:40,640 مهم نیست که اگر شما بدانید چه این اعداد می آیید. 424 00:20:40,640 --> 00:20:44,750 اما این فقط یک شماره است که رفتن است به بیش از 0، درست است؟ 425 00:20:44,750 --> 00:20:48,610 >> و پس از آن زمانی که من کتی پری، احتمال "کودک" داده شده کتی است 426 00:20:48,610 --> 00:20:49,830 در حال حاضر 0، درست است؟ 427 00:20:49,830 --> 00:20:52,820 از آنجا که هیچ "کودک" وجود دارد در کتی پری. 428 00:20:52,820 --> 00:20:56,360 بنابراین پس از این می شود 0 و دل شکسته برنده، به این معنی که دل شکسته 429 00:20:56,360 --> 00:20:57,310 احتمالا خواننده. 430 00:20:57,310 --> 00:20:58,560 آیا این را حس؟ 431 00:20:58,560 --> 00:21:00,700 432 00:21:00,700 --> 00:21:01,950 OK. 433 00:21:01,950 --> 00:21:04,160 434 00:21:04,160 --> 00:21:11,750 >> پس اگر من می خواهم این رسمی تر، من در واقع می توانید انجام دهید یک مدل 435 00:21:11,750 --> 00:21:12,700 چند کلمه. 436 00:21:12,700 --> 00:21:14,610 بنابراین اجازه دهید بگویم که من چیزی مثل، "عزیزم، من هستم 437 00:21:14,610 --> 00:21:16,030 در آتش، "و یا چیزی. 438 00:21:16,030 --> 00:21:17,760 پس از آن تا چند کلمه. 439 00:21:17,760 --> 00:21:20,880 و در این مورد، شما می توانید ببینید که "کودک" است در دل شکسته، 440 00:21:20,880 --> 00:21:21,710 اما در کتی نیست. 441 00:21:21,710 --> 00:21:24,940 و "آتش" است در کتی، اما آن را در دل شکسته، درست است؟ 442 00:21:24,940 --> 00:21:27,200 بنابراین آن را گرفتن سختتر، درست است؟ 443 00:21:27,200 --> 00:21:31,440 از آنجا که به نظر می رسد که شما تقریبا یک رابطه بین این دو. 444 00:21:31,440 --> 00:21:36,980 >> بنابراین آنچه شما باید انجام دهید این است فرض استقلال در میان کلمات. 445 00:21:36,980 --> 00:21:41,210 بنابراین اساسا آنچه که بدان معنی است که من فقط محاسبه چه است 446 00:21:41,210 --> 00:21:44,330 احتمال دیدن "عزیزم،" چه چیزی است احتمال دیدن "I"، و 447 00:21:44,330 --> 00:21:46,670 "هستم"، و "در" و "آتش" همه به طور جداگانه. 448 00:21:46,670 --> 00:21:48,670 سپس من ضرب همه آنها. 449 00:21:48,670 --> 00:21:52,420 و من از دیدن آنچه احتمال است دیدن تمام جمله. 450 00:21:52,420 --> 00:21:55,210 را حس؟ 451 00:21:55,210 --> 00:22:00,270 >> بنابراین اساسا، اگر من فقط یک کلمه داشته باشد، چه من می خواهم برای پیدا کردن حداکثر ارگ است، 452 00:22:00,270 --> 00:22:05,385 که بدان معنی است، چه طبقه است که به من بالاترین احتمال؟ 453 00:22:05,385 --> 00:22:10,010 پس چه طبقه است که دادن است من بیشترین احتمال برای 454 00:22:10,010 --> 00:22:11,940 احتمال کلاس داده شده کلمه است. 455 00:22:11,940 --> 00:22:17,610 بنابراین در این مورد، دل شکسته داده شده "عزیزم." یا کتی داده شده "عزیزم." را حس؟ 456 00:22:17,610 --> 00:22:21,040 >> و فقط از بیز، که معادله I نشان داد، 457 00:22:21,040 --> 00:22:24,780 ما ایجاد این بخش. 458 00:22:24,780 --> 00:22:28,750 تنها چیزی است که شما می بینید که احتمال کلمه داده شده 459 00:22:28,750 --> 00:22:31,370 تغییرات کلاس بسته در کلاس، درست است؟ 460 00:22:31,370 --> 00:22:34,260 تعداد "کودک" است که من در گاگا متفاوت از کتی است. 461 00:22:34,260 --> 00:22:37,640 احتمال از کلاس نیز تغییرات زیرا تنها تعداد است 462 00:22:37,640 --> 00:22:39,740 از آهنگ های هر یک از آنها است. 463 00:22:39,740 --> 00:22:43,980 >> اما احتمال از خود کلمه می در حال رفتن به همان برای همه 464 00:22:43,980 --> 00:22:44,740 هنرمندان، درست است؟ 465 00:22:44,740 --> 00:22:47,150 بنابراین احتمال از کلمه است فقط، آنچه را که احتمال است 466 00:22:47,150 --> 00:22:49,820 دیدن آن کلمه در زبان انگلیسی؟ 467 00:22:49,820 --> 00:22:51,420 پس از آن همین کار را برای همه آنها. 468 00:22:51,420 --> 00:22:55,790 پس از این ثابت است، ما فقط می تواند رها از این و در مورد آن اهمیتی نمی دهند. 469 00:22:55,790 --> 00:23:00,230 بنابراین این در واقع خواهد شد معادله ما به دنبال. 470 00:23:00,230 --> 00:23:03,360 >> و اگر من چند کلمه، من هستم هنوز هم به قبل 471 00:23:03,360 --> 00:23:04,610 احتمال در اینجا. 472 00:23:04,610 --> 00:23:06,980 تنها چیزی است که من ضرب احتمال 473 00:23:06,980 --> 00:23:08,490 همه عبارت دیگر. 474 00:23:08,490 --> 00:23:10,110 پس من ضرب همه آنها. 475 00:23:10,110 --> 00:23:12,610 را حس؟ 476 00:23:12,610 --> 00:23:18,440 به نظر می رسد عجیب و غریب اما اساسا بدان معنی است، محاسبه قبل از کلاس، و 477 00:23:18,440 --> 00:23:22,100 پس از آن احتمال هر ضرب از کلمات که در آن کلاس. 478 00:23:22,100 --> 00:23:24,620 479 00:23:24,620 --> 00:23:29,150 >> و شما می دانید که احتمال کلمه داده شده یک کلاس است برای رفتن به 480 00:23:29,150 --> 00:23:34,520 چند بار آن کلمه را در آن کلاس، تقسیم بر تعداد 481 00:23:34,520 --> 00:23:37,020 کلمات شما در آن داشته کلاس به طور کلی. 482 00:23:37,020 --> 00:23:37,990 را حس؟ 483 00:23:37,990 --> 00:23:41,680 این فقط چگونگی "کودک" 2 تمام شد تعداد کلماتی را که 484 00:23:41,680 --> 00:23:43,020 من در شعر بود. 485 00:23:43,020 --> 00:23:45,130 پس فقط از فرکانس. 486 00:23:45,130 --> 00:23:46,260 >> اما یک چیز وجود دارد. 487 00:23:46,260 --> 00:23:51,250 به یاد داشته باشید که چگونه من بود که نشان می دهد احتمال "کودک" که اشعار 488 00:23:51,250 --> 00:23:56,350 از کتی پری 0 بود فقط به خاطر کتی پری به "کودک" در تمام نیست؟ 489 00:23:56,350 --> 00:24:04,900 اما این مساله یک کمی سخت به تنها به سادگی می گویند که شعر نمی تواند از است 490 00:24:04,900 --> 00:24:10,040 یک هنرمند فقط به خاطر اینکه آنها لازم نیست این کلمه به طور خاص در هر زمان. 491 00:24:10,040 --> 00:24:13,330 >> بنابراین شما فقط می گفت: خوب، اگر شما این کلمه را نداشته باشند، من قصد دارم 492 00:24:13,330 --> 00:24:15,640 شما با احتمال کمتر را، اما من فقط رفتن به نمی 493 00:24:15,640 --> 00:24:17,420 شما 0 به سمت راست دور می دهد. 494 00:24:17,420 --> 00:24:21,040 از آنجا که شاید چیزی شبیه به، بود "آتش، آتش، آتش، آتش" است که 495 00:24:21,040 --> 00:24:21,990 کاملا کتی پری. 496 00:24:21,990 --> 00:24:26,060 و پس از آن "کودک"، و آن را فقط به می رود 0 از حق دور به دلیل وجود می داشت 497 00:24:26,060 --> 00:24:27,250 "عزیزم." 498 00:24:27,250 --> 00:24:31,440 >> بنابراین اساسا آنچه که ما انجام کاری است به نام صاف لاپلاس صدق میکند. 499 00:24:31,440 --> 00:24:36,260 و این فقط بدان معناست که من به برخی از احتمال حتی به کلمات 500 00:24:36,260 --> 00:24:37,850 که وجود ندارد. 501 00:24:37,850 --> 00:24:43,170 پس آنچه که من انجام دهید این است که زمانی که من هستم محاسبه این، من همیشه 1 اضافه به 502 00:24:43,170 --> 00:24:44,180 صورت کسر. 503 00:24:44,180 --> 00:24:48,060 بنابراین حتی اگر کلمه وجود ندارد، در در این صورت، اگر این 0 است، من هنوز هستم 504 00:24:48,060 --> 00:24:51,250 محاسبه این به عنوان 1 در طول تعداد کل کلمات. 505 00:24:51,250 --> 00:24:55,060 در غیر این صورت، من چگونه بسیاری از واژه ها من و من اضافه کردن 1. 506 00:24:55,060 --> 00:24:58,300 پس من شمارش برای هر دو مورد. 507 00:24:58,300 --> 00:25:00,430 را حس؟ 508 00:25:00,430 --> 00:25:03,060 >> پس به انجام برخی از برنامه نویسی. 509 00:25:03,060 --> 00:25:06,440 من قصد دارم به آن را انجام دهد بسیار سریع، اما این فقط مهم است که شما 510 00:25:06,440 --> 00:25:08,600 بچه ها درک مفاهیم. 511 00:25:08,600 --> 00:25:13,450 بنابراین آنچه ما در حال تلاش برای انجام دقیقا این اجرا 512 00:25:13,450 --> 00:25:14,330 چیزی که من فقط می گفت - 513 00:25:14,330 --> 00:25:19,110 من می خواهم شما را برای قرار دادن اشعار لیدی گاگا و کتی پری. 514 00:25:19,110 --> 00:25:22,980 و برنامه است که قادر به می گویند اگر این شعر جدید از دل شکسته است 515 00:25:22,980 --> 00:25:24,170 یا کتی پری. 516 00:25:24,170 --> 00:25:25,800 را حس؟ 517 00:25:25,800 --> 00:25:27,530 OK. 518 00:25:27,530 --> 00:25:30,710 >> بنابراین من این برنامه من قصد داشته به classify.py تماس بگیرید. 519 00:25:30,710 --> 00:25:31,970 بنابراین این پایتون است. 520 00:25:31,970 --> 00:25:34,210 این یک زبان برنامه نویسی جدید است. 521 00:25:34,210 --> 00:25:38,020 این در برخی بسیار مشابه است راه هایی برای C و PHP. 522 00:25:38,020 --> 00:25:43,180 این شبیه به این دلیل اگر شما می خواهید پایتون یاد می گیرند پس از دانستن C، آن را 523 00:25:43,180 --> 00:25:46,270 واقعا که خیلی از چالش نیست فقط به خاطر اینکه پایتون بسیار ساده تر است 524 00:25:46,270 --> 00:25:47,520 از C، اول از همه. 525 00:25:47,520 --> 00:25:49,370 و بسیاری از مسائل در حال حاضر اجرا برای شما. 526 00:25:49,370 --> 00:25:56,820 پس فقط چگونه مانند PHP توابع که مرتب سازی یک لیست، و یا چیزی اضافه 527 00:25:56,820 --> 00:25:58,780 به یک آرایه، و یا، اه، اه، اه. 528 00:25:58,780 --> 00:26:00,690 پایتون است همه از آن نیز هست. 529 00:26:00,690 --> 00:26:05,960 >> بنابراین من فقط رفتن برای توضیح به سرعت چگونه ما می تواند طبقه بندی انجام 530 00:26:05,960 --> 00:26:07,860 مشکل در اینجا. 531 00:26:07,860 --> 00:26:13,230 بنابراین اجازه دهید بگویم که در این مورد، من شعر از گاگا و کتی پری. 532 00:26:13,230 --> 00:26:21,880 راه است که من آن اشعار این است که اولین کلمه شعر است 533 00:26:21,880 --> 00:26:25,250 نام هنرمند، و بقیه اشعار است. 534 00:26:25,250 --> 00:26:29,470 بنابراین اجازه دهید بگویم که من این لیست در که یکی از اولین اشعار دل شکسته. 535 00:26:29,470 --> 00:26:31,930 بنابراین در اینجا من در مسیر صحیح است. 536 00:26:31,930 --> 00:26:35,270 و یک بعدی کتی است، و آن را نیز اشعار. 537 00:26:35,270 --> 00:26:38,040 >> پس این است که چگونه شما اعلام یک متغیر در پایتون. 538 00:26:38,040 --> 00:26:40,200 شما لازم نیست به نوع داده. 539 00:26:40,200 --> 00:26:43,150 شما فقط ارسال "شعر" نوع در PHP می خواهم. 540 00:26:43,150 --> 00:26:44,890 را حس؟ 541 00:26:44,890 --> 00:26:47,770 >> پس چه چیز است که من باید می محاسبه می شود قادر به محاسبه 542 00:26:47,770 --> 00:26:49,360 احتمال؟ 543 00:26:49,360 --> 00:26:55,110 من برای محاسبه "priors" هر یک از مختلف 544 00:26:55,110 --> 00:26:56,710 کلاس های که من دارم. 545 00:26:56,710 --> 00:27:06,680 من برای محاسبه "posteriors،" یا خیلی احتمالات 546 00:27:06,680 --> 00:27:12,150 هر یک از کلمات مختلف که من می توانم برای هر هنرمند داشته باشد. 547 00:27:12,150 --> 00:27:17,210 پس در دل شکسته، به عنوان مثال، من قصد دارم به یک لیست از چند بار من را ببینید 548 00:27:17,210 --> 00:27:19,250 هر یک از کلمات. 549 00:27:19,250 --> 00:27:20,760 را حس؟ 550 00:27:20,760 --> 00:27:25,370 >> و در نهایت، من فقط رفتن به یک فهرست نام "کلمات" است که فقط رفتن 551 00:27:25,370 --> 00:27:29,780 به چه تعداد کلمه I برای هر هنرمند داشته باشد. 552 00:27:29,780 --> 00:27:33,760 بنابراین برای دل شکسته، به عنوان مثال، وقتی که من نگاه به شعر، من تا به حال، من فکر می کنم، 24 553 00:27:33,760 --> 00:27:34,750 کلمات در کل. 554 00:27:34,750 --> 00:27:38,970 بنابراین این لیست فقط رفتن به دل شکسته 24، و کتی شماره دیگر. 555 00:27:38,970 --> 00:27:40,130 را حس؟ 556 00:27:40,130 --> 00:27:40,560 OK. 557 00:27:40,560 --> 00:27:42,530 >> بنابراین در حال حاضر، در واقع، اجازه دهید رفتن به برنامه نویسی. 558 00:27:42,530 --> 00:27:45,270 بنابراین در پایتون، شما در واقع می تواند بازگشت یک دسته از مختلف 559 00:27:45,270 --> 00:27:46,630 همه چیز از یک تابع. 560 00:27:46,630 --> 00:27:50,810 من می خواهم برای ایجاد این تابع به نام "مشروط" است که رفتن 561 00:27:50,810 --> 00:27:53,890 برای بازگشت به تمام کسانی که همه چیز، "priors،" "احتمال" و 562 00:27:53,890 --> 00:28:05,690 "کلمه است." بنابراین "مشروط" و آن را رفتن به تماس توان به "شعر." 563 00:28:05,690 --> 00:28:11,510 >> بنابراین در حال حاضر من می خواهم شما را به واقع ارسال این تابع. 564 00:28:11,510 --> 00:28:17,750 بنابراین راهی که من می توانم این ارسال تابع من فقط این تعریف 565 00:28:17,750 --> 00:28:20,620 کار با "دف." بنابراین من "دف مشروط، "و آن را گرفتن 566 00:28:20,620 --> 00:28:28,700 "اشعار." و آنچه در این است که به انجام است، اول از همه، من priors من 567 00:28:28,700 --> 00:28:31,030 که من می خواهم برای محاسبه. 568 00:28:31,030 --> 00:28:34,330 >> پس راه که من می توانم این کار، ایجاد یک دیکشنری در پایتون، که 569 00:28:34,330 --> 00:28:37,320 تقریبا همان چیزی که به عنوان یک مخلوط است جدول، یا آن را مانند یک تکرار است 570 00:28:37,320 --> 00:28:40,480 آرایه در PHP. 571 00:28:40,480 --> 00:28:44,150 این است که چگونه من یک فرهنگ لغت اعلام کنند. 572 00:28:44,150 --> 00:28:53,580 و اساسا این بدان معنی است که priors دل شکسته 0.5 است، به عنوان مثال، اگر 573 00:28:53,580 --> 00:28:57,200 50٪ از اشعار می باشد دل شکسته، 50٪ از کتی می باشد. 574 00:28:57,200 --> 00:28:58,450 را حس؟ 575 00:28:58,450 --> 00:29:00,680 576 00:29:00,680 --> 00:29:03,680 بنابراین من باید به شکل از چگونه برای محاسبه priors. 577 00:29:03,680 --> 00:29:07,120 >> آنهایی بعدی که من باید انجام دهید، همچنین، احتمالات و کلمات می باشد. 578 00:29:07,120 --> 00:29:17,100 بنابراین احتمال گاگا در لیست است از همه احتمال است که من 579 00:29:17,100 --> 00:29:19,160 برای هر یک از کلمات برای دل شکسته داشته باشد. 580 00:29:19,160 --> 00:29:23,880 بنابراین اگر من به احتمال گاگا بروید "کودک"، به عنوان مثال، آن را به من بدهد 581 00:29:23,880 --> 00:29:28,750 چیزی شبیه به 2 بیش از 24 در آن صورت. 582 00:29:28,750 --> 00:29:30,070 را حس؟ 583 00:29:30,070 --> 00:29:36,120 بنابراین من به "احتمال" به "دل شکسته" سطل است که یک لیست از تمام 584 00:29:36,120 --> 00:29:40,550 کلمات دل شکسته، پس از آن من به "کودک" و من احتمال را ببینید. 585 00:29:40,550 --> 00:29:45,940 >> و در نهایت من این را "کلمات" فرهنگ لغت. 586 00:29:45,940 --> 00:29:53,620 بنابراین در اینجا، "احتمال" و پس از آن "کلمه است." بنابراین اگر من "کلمات"، "دل شکسته،" 587 00:29:53,620 --> 00:29:58,330 آنچه قرار است رخ دهد این است که آن به من 24 را، و گفت که من 588 00:29:58,330 --> 00:30:01,990 دارای 24 عبارت در شعر از دل شکسته. 589 00:30:01,990 --> 00:30:04,110 را حس می کند؟ 590 00:30:04,110 --> 00:30:07,070 بنابراین در اینجا، "عبارت" برابر با ده ده ده. 591 00:30:07,070 --> 00:30:07,620 خوب 592 00:30:07,620 --> 00:30:12,210 >> پس چه من قصد دارم برای انجام این کار است من قصد دارم تکرار بیش از هر یک از ترانه ها، تا 593 00:30:12,210 --> 00:30:14,490 هر یک از رشته ها که من در لیست است. 594 00:30:14,490 --> 00:30:18,040 و من قصد دارم برای محاسبه آن چیزهایی است برای هر یک از نامزدها. 595 00:30:18,040 --> 00:30:19,950 را حس می کند؟ 596 00:30:19,950 --> 00:30:21,700 بنابراین من مجبور به انجام برای حلقه. 597 00:30:21,700 --> 00:30:26,300 >> بنابراین در پایتون آنچه که من می تواند انجام دهد این است که "برای خط در شعر. "همان چیزی را به عنوان یک 598 00:30:26,300 --> 00:30:28,000 "برای هر یک از" بیانیه ای در PHP. 599 00:30:28,000 --> 00:30:33,420 به یاد داشته باشید که چگونه اگر آن را PHP بود من می توانم می گویند: "برای هر شعر به عنوان 600 00:30:33,420 --> 00:30:35,220 خط "را حس می کند؟ 601 00:30:35,220 --> 00:30:38,900 بنابراین من می گیرم هر یک از خطوط، در این مورد، این رشته و بعدی 602 00:30:38,900 --> 00:30:44,540 رشته بنابراین برای هر یک از خطوط آنچه که من هستم رفتن به انجام آن برای اولین بار، من قصد دارم 603 00:30:44,540 --> 00:30:49,150 تقسیم این خط را به یک لیست از کلمات هم جدا شده توسط فاصله است. 604 00:30:49,150 --> 00:30:53,730 >> بنابراین نکته جالب در مورد پایتون است که شما می توانید فقط گوگل مانند "چگونه می توانم 605 00:30:53,730 --> 00:30:58,220 تقسیم یک رشته به کلمات؟ "و آن را رفتن به شما بگویم که چگونه آن را انجام دهد. 606 00:30:58,220 --> 00:31:04,890 و راه را برای انجام این کار، آن را فقط "خط است = line.split () "و آن را اساسا 607 00:31:04,890 --> 00:31:08,640 قصد دارم به شما یک لیست با را هر یک از کلمات در اینجا. 608 00:31:08,640 --> 00:31:09,620 را حس می کند؟ 609 00:31:09,620 --> 00:31:15,870 بنابراین در حال حاضر که من که من می خواهم بدانم که خواننده از این آهنگ است. 610 00:31:15,870 --> 00:31:20,130 و برای این کار من فقط باید برای دریافت اولین عنصر از آرایه، درست است؟ 611 00:31:20,130 --> 00:31:26,390 بنابراین من فقط می توانم بگویم که من "خواننده = خط (0) "را حس می کند؟ 612 00:31:26,390 --> 00:31:32,010 >> و پس از آن چیزی است که من باید انجام دهید، اول از همه، من قصد دارم برای به روز رسانی چگونه بسیاری از 613 00:31:32,010 --> 00:31:36,130 کلمات I تحت دارند "دل شکسته." بنابراین من فقط رفتن به محاسبه بسیاری از واژه ها I 614 00:31:36,130 --> 00:31:38,690 باید در این لیست، درست است؟ 615 00:31:38,690 --> 00:31:41,910 از آنجا که این است که چگونه بسیاری از کلمات من در اشعار و من فقط رفتن به 616 00:31:41,910 --> 00:31:44,120 آن را به "دل شکسته" آرایه اضافه کنید. 617 00:31:44,120 --> 00:31:47,090 آیا این را حس؟ 618 00:31:47,090 --> 00:31:49,010 آیا در نحو تمرکز بیش از حد. 619 00:31:49,010 --> 00:31:50,430 فکر می کنم بیشتر در مورد مفاهیم. 620 00:31:50,430 --> 00:31:52,400 که مهم ترین بخش است. 621 00:31:52,400 --> 00:31:52,720 OK. 622 00:31:52,720 --> 00:32:00,260 >> پس آنچه که من می تواند آن را انجام دهد این است که اگر "دل شکسته" است در حال حاضر در این لیست، پس "اگر خواننده در 623 00:32:00,260 --> 00:32:03,190 عبارت "به این معنی که من در حال حاضر کلمات توسط دل شکسته. 624 00:32:03,190 --> 00:32:06,640 من فقط می خواهم برای اضافه کردن اضافی کلمات به آن. 625 00:32:06,640 --> 00:32:15,810 پس "کلمه (خواننده) آنچه که من انجام شده است + = لن (خط) - 1 ". 626 00:32:15,810 --> 00:32:18,250 و پس از آن من فقط می توانید انجام دهید طول خط. 627 00:32:18,250 --> 00:32:21,860 پس چگونه بسیاری از عناصر I در آرایه داشته باشد. 628 00:32:21,860 --> 00:32:27,060 و من را مجبور به انجام منهای 1 فقط به خاطر اولین عنصر از آرایه است فقط 629 00:32:27,060 --> 00:32:29,180 یک خواننده و کسانی که شعر نیست. 630 00:32:29,180 --> 00:32:31,420 را حس می کند؟ 631 00:32:31,420 --> 00:32:32,780 OK. 632 00:32:32,780 --> 00:32:35,820 >> "دیگری"، به این معنی است که من می خواهم به واقع درج گاگا به لیست. 633 00:32:35,820 --> 00:32:45,990 بنابراین من فقط "کلمات (خواننده) = لن (خط) - 1، "متاسفم. 634 00:32:45,990 --> 00:32:49,200 بنابراین تنها تفاوت بین این دو خطوط این است که این یکی، آن را نمی کند 635 00:32:49,200 --> 00:32:51,080 وجود داشته باشد در عین حال، پس من فقط مقدار دهی اولیه آن. 636 00:32:51,080 --> 00:32:53,820 این یکی که من در واقع با اضافه کردن. 637 00:32:53,820 --> 00:32:55,570 OK. 638 00:32:55,570 --> 00:32:59,480 بنابراین این اضافه کردن به کلمات بود. 639 00:32:59,480 --> 00:33:03,040 >> حالا من می خواهم برای اضافه کردن به priors. 640 00:33:03,040 --> 00:33:05,480 پس چگونه priors را حساب کنم؟ 641 00:33:05,480 --> 00:33:11,580 priors را می توان محاسبه با چند بار. 642 00:33:11,580 --> 00:33:15,340 بنابراین چند بار که خواننده را مشاهده می کنید در میان همه خوانندگان که شما 643 00:33:15,340 --> 00:33:16,380 داشته باشد، درست است؟ 644 00:33:16,380 --> 00:33:18,810 بنابراین برای گاگا و کتی پری، در این مورد، من دل شکسته را ببینید 645 00:33:18,810 --> 00:33:20,570 یک بار، کتی پری یک بار. 646 00:33:20,570 --> 00:33:23,320 >> بنابراین اساسا priors برای دل شکسته و کتی پری را 647 00:33:23,320 --> 00:33:24,390 فقط یکی، درست است؟ 648 00:33:24,390 --> 00:33:26,500 شما فقط چند بار من هنرمند را ببینید. 649 00:33:26,500 --> 00:33:28,740 بنابراین این بسیار آسان است برای محاسبه. 650 00:33:28,740 --> 00:33:34,100 من فقط می تواند چیزی شبیه به مانند "اگر خواننده در priors، "من فقط رفتن 651 00:33:34,100 --> 00:33:38,970 برای اضافه کردن 1 به جعبه priors خود. 652 00:33:38,970 --> 00:33:51,000 بنابراین، "priors (آواز خواندن)" + = 1 "و سپس" دیگری " من قصد دارم به انجام "priors (خواننده) 653 00:33:51,000 --> 00:33:55,000 = 1 "را حس می کند؟ 654 00:33:55,000 --> 00:34:00,080 >> بنابراین اگر آن وجود ندارد من فقط با قرار دادن به عنوان 1، در غیر این صورت من فقط اضافه کردن 1. 655 00:34:00,080 --> 00:34:11,280 OK، بنابراین در حال حاضر همه که من را ترک کرده اند به انجام همچنین هر یک از کلمات به اضافه 656 00:34:11,280 --> 00:34:12,290 احتمال. 657 00:34:12,290 --> 00:34:14,889 بنابراین من باید به تعداد چند بار I هر یک از کلمات را ببینید. 658 00:34:14,889 --> 00:34:18,780 پس من فقط باید به دیگری انجام حلقه for در خط. 659 00:34:18,780 --> 00:34:25,190 >> بنابراین اولین چیزی که من قصد دارم برای انجام شده است چک کنید اگر خواننده در حال حاضر دارای 660 00:34:25,190 --> 00:34:26,969 آرایه احتمالات. 661 00:34:26,969 --> 00:34:31,739 پس من دارم اگر خواننده نمی کند یک آرایه احتمالات، من فقط هستم 662 00:34:31,739 --> 00:34:34,480 رفتن به مقداردهی اولیه یک برای آنها. 663 00:34:34,480 --> 00:34:36,400 این حتی یک آرایه نیست، با عرض پوزش، آن است که یک فرهنگ لغت است. 664 00:34:36,400 --> 00:34:43,080 بنابراین احتمال از خواننده است که به عنوان یک فرهنگ لغت باز است، بنابراین من 665 00:34:43,080 --> 00:34:45,830 فقط مقدار دهی اولیه یک فرهنگ لغت برای آن. 666 00:34:45,830 --> 00:34:46,820 OK؟ 667 00:34:46,820 --> 00:34:58,330 >> و در حال حاضر من در واقع می توانید انجام دهید برای حلقه برای محاسبه هر یک از کلمات ' 668 00:34:58,330 --> 00:35:00,604 احتمال. 669 00:35:00,604 --> 00:35:01,540 OK. 670 00:35:01,540 --> 00:35:04,160 پس چه می توانم انجام دهم یک حلقه for. 671 00:35:04,160 --> 00:35:06,590 بنابراین من فقط رفتن به تکرار بیش از آرایه. 672 00:35:06,590 --> 00:35:15,320 بنابراین در راهی که می توانید انجام دهید که در پایتون "برای من در محدوده." از 1 673 00:35:15,320 --> 00:35:19,200 چون من می خواهم برای شروع در دوم عنصر چرا که یکی از اولین است 674 00:35:19,200 --> 00:35:20,260 نام خواننده. 675 00:35:20,260 --> 00:35:24,990 پس از یک تا طول خط. 676 00:35:24,990 --> 00:35:29,760 و هنگامی که من در محدوده آن را در واقع از به مثل اینجا از 1 به لن از 677 00:35:29,760 --> 00:35:30,740 خط منهای 1. 678 00:35:30,740 --> 00:35:33,810 پس از آن در حال حاضر می کند که چیزی از انجام N منهای 1 برای آرایه است که بسیار 679 00:35:33,810 --> 00:35:35,500 راحت است. 680 00:35:35,500 --> 00:35:37,850 را حس می کند؟ 681 00:35:37,850 --> 00:35:42,770 >> بنابراین برای هر یک از این، چیزی است که من قصد دارم به انجام شده است، درست مثل در یک دیگر، 682 00:35:42,770 --> 00:35:50,320 من قصد دارم به بررسی در صورتی که کلمه در این موقعیت در خط در حال حاضر در 683 00:35:50,320 --> 00:35:51,570 احتمال. 684 00:35:51,570 --> 00:35:53,400 685 00:35:53,400 --> 00:35:57,260 و بعد همانطور که گفتم در اینجا، احتمال واژه ها، به عنوان در من قرار داده 686 00:35:57,260 --> 00:35:58,400 "احتمال (خواننده)". 687 00:35:58,400 --> 00:35:59,390 پس به نام خواننده. 688 00:35:59,390 --> 00:36:03,450 بنابراین اگر آن را در حال حاضر در "probabilit (خواننده)"، به این معنی است که من 689 00:36:03,450 --> 00:36:11,960 می خواهید برای اضافه کردن 1 به آن، بنابراین من قصد دارم انجام "احتمال (خواننده)"، و 690 00:36:11,960 --> 00:36:14,100 کلمه است به نام "خط (من)". 691 00:36:14,100 --> 00:36:22,630 من قصد دارم به اضافه 1 و "دیگری" من فقط رفتن به مقداردهی اولیه آن به 1. 692 00:36:22,630 --> 00:36:23,880 "خط (من)". 693 00:36:23,880 --> 00:36:26,920 694 00:36:26,920 --> 00:36:28,420 را حس می کند؟ 695 00:36:28,420 --> 00:36:30,180 >> بنابراین، من به محاسبه تمام آرایه ها. 696 00:36:30,180 --> 00:36:36,580 بنابراین، در حال حاضر همه که من باید برای انجام این یکی فقط "بازگشت priors، 697 00:36:36,580 --> 00:36:43,230 احتمالات و کلمات. "در اجازه ببینید که آیا هیچ وجود دارد، OK. 698 00:36:43,230 --> 00:36:45,690 به نظر می رسد همه چیز در حال کار تا کنون. 699 00:36:45,690 --> 00:36:46,900 بنابراین، آن را حس می کند؟ 700 00:36:46,900 --> 00:36:47,750 در برخی از راه؟ 701 00:36:47,750 --> 00:36:49,280 OK. 702 00:36:49,280 --> 00:36:51,980 بنابراین در حال حاضر من همه احتمالات. 703 00:36:51,980 --> 00:36:55,100 بنابراین در حال حاضر تنها چیزی که من را ترک کرده اند است فقط به آن چیزی است که 704 00:36:55,100 --> 00:36:58,650 محاسبه محصول از تمام احتمالات وقتی که من شعر. 705 00:36:58,650 --> 00:37:06,270 >> بنابراین اجازه دهید بگویم که من می خواهم به حال تماس بگیرید این تابع "طبقه بندی ()" و 706 00:37:06,270 --> 00:37:08,880 چیزی که تابع طول می کشد فقط یک آرگومان است. 707 00:37:08,880 --> 00:37:13,170 بیایید می گویند "عزیزم، من در آتش هستم" و آن را رفتن به کشف کردن آنچه است 708 00:37:13,170 --> 00:37:14,490 احتمال این که این دل شکسته؟ 709 00:37:14,490 --> 00:37:16,405 احتمال چیست که این کتی است؟ 710 00:37:16,405 --> 00:37:19,690 به نظر می رسد خوب است؟ 711 00:37:19,690 --> 00:37:25,750 پس من فقط باید به ایجاد یک عملکرد جدید به نام "طبقه بندی ()" و 712 00:37:25,750 --> 00:37:29,180 آن را به برخی از شعر نیز هست. 713 00:37:29,180 --> 00:37:31,790 714 00:37:31,790 --> 00:37:36,160 و علاوه بر این شعر من هم برای ارسال priors، 715 00:37:36,160 --> 00:37:37,700 احتمالات و کلمات. 716 00:37:37,700 --> 00:37:44,000 من می خواهم به ارسال شعر، priors، احتمالات، کلمات. 717 00:37:44,000 --> 00:37:51,840 >> پس این است که شعر، priors، احتمالات، کلمات. 718 00:37:51,840 --> 00:37:53,530 بنابراین، چه آن را انجام دهد؟ 719 00:37:53,530 --> 00:37:57,180 این اساسا در حال رفتن به از طریق تمام بروید نامزدها ممکن است که شما 720 00:37:57,180 --> 00:37:58,510 به عنوان یک خواننده داشته باشد. 721 00:37:58,510 --> 00:37:59,425 و که در آن کسانی که نامزد هستند؟ 722 00:37:59,425 --> 00:38:01,020 آنها در priors هستید، درست است؟ 723 00:38:01,020 --> 00:38:02,710 بنابراین من همه از آن وجود دارد. 724 00:38:02,710 --> 00:38:07,870 من می خواهم به یک فرهنگ لغت از همه نامزدها امکان پذیر است. 725 00:38:07,870 --> 00:38:14,220 و پس از آن برای هر نامزد در priors، پس از آن بدان معنی است که آن را به 726 00:38:14,220 --> 00:38:17,740 است دل شکسته، کتی اگر من تا به حال تر از آن خواهد بود بیشتر است. 727 00:38:17,740 --> 00:38:20,410 من قصد دارم برای شروع محاسبه این احتمال. 728 00:38:20,410 --> 00:38:28,310 احتمال که ما در دیدم پاورپوینت زمان قبل است 729 00:38:28,310 --> 00:38:30,800 محصول هر یک از دیگر احتمالات. 730 00:38:30,800 --> 00:38:32,520 >> بنابراین من در اینجا می توانید همین کار را. 731 00:38:32,520 --> 00:38:36,330 من فقط می توانید انجام دهید احتمال است در ابتدا فقط قبل. 732 00:38:36,330 --> 00:38:40,340 بنابراین priors از نامزد. 733 00:38:40,340 --> 00:38:40,870 درست است؟ 734 00:38:40,870 --> 00:38:45,360 و در حال حاضر من به تکرار بیش از همه کلماتی را که من در شعر باید 735 00:38:45,360 --> 00:38:48,820 قادر به اضافه کردن احتمال برای هر یک از آنها، OK؟ 736 00:38:48,820 --> 00:38:57,900 بنابراین، "به کلمه در شعر" آنچه که من قصد دارم برای انجام این کار است، در صورتی که کلمه در است 737 00:38:57,900 --> 00:39:01,640 "احتمال (نامزد)"، که بدان معنی است که آن یک کلمه است که 738 00:39:01,640 --> 00:39:03,640 کاندیدا در اشعار خود - 739 00:39:03,640 --> 00:39:05,940 به عنوان مثال، "کودک" برای دل شکسته - 740 00:39:05,940 --> 00:39:11,710 آنچه من قصد دارم برای انجام این کار این است که احتمال رفتن به ضرب شود 741 00:39:11,710 --> 00:39:22,420 1 به علاوه احتمال نامزد برای آن کلمه. 742 00:39:22,420 --> 00:39:25,710 و آن را به نام "کلمه". 743 00:39:25,710 --> 00:39:32,440 این تقسیم شده توسط تعدادی از کلمات که من در آن نامزد داشته باشد. 744 00:39:32,440 --> 00:39:37,450 تعداد کل کلمات که من آن را برای خواننده است که من به دنبال. 745 00:39:37,450 --> 00:39:40,290 >> "دیگری است." به این معنی یک کلمه جدید پس از آن می مانند به عنوان مثال می شود 746 00:39:40,290 --> 00:39:41,860 "آتش" را برای بانوی دل شکسته. 747 00:39:41,860 --> 00:39:45,760 بنابراین من فقط می خواهم به انجام بیش از 1 "کلمه (نامزد)". 748 00:39:45,760 --> 00:39:47,710 بنابراین من نمی خواهم برای قرار دادن این واژه در اینجا. 749 00:39:47,710 --> 00:39:50,010 >> بنابراین آن را به اساسا شود کپی کردن و چسباندن این. 750 00:39:50,010 --> 00:39:54,380 751 00:39:54,380 --> 00:39:56,000 اما من قصد دارم این بخش را حذف کنید. 752 00:39:56,000 --> 00:39:57,610 پس این فقط برای رفتن به 1 بیش از آن. 753 00:39:57,610 --> 00:40:00,900 754 00:40:00,900 --> 00:40:02,150 به نظر می رسد خوب است؟ 755 00:40:02,150 --> 00:40:03,980 756 00:40:03,980 --> 00:40:09,700 و در حال حاضر در پایان، من فقط رفتن به چاپ نام نامزد و 757 00:40:09,700 --> 00:40:15,750 احتمال این که شما از داشتن S در شعر خود. 758 00:40:15,750 --> 00:40:16,200 را حس می کند؟ 759 00:40:16,200 --> 00:40:18,390 و من در واقع حتی نمی نیاز به این فرهنگ لغت. 760 00:40:18,390 --> 00:40:19,510 را حس می کند؟ 761 00:40:19,510 --> 00:40:21,810 >> بنابراین، بیایید ببینید در صورتی که این در واقع کار می کند. 762 00:40:21,810 --> 00:40:24,880 بنابراین اگر من در این اجرا، آن کار نمی کند. 763 00:40:24,880 --> 00:40:26,130 صبر کن دوم. 764 00:40:26,130 --> 00:40:28,870 765 00:40:28,870 --> 00:40:31,720 "واژه (نامزد)"، "کلمات (نامزد)"، که 766 00:40:31,720 --> 00:40:33,750 نام آرایه می شود. 767 00:40:33,750 --> 00:40:41,435 OK بنابراین، آن را می گوید در برخی از اشکال وجود دارد برای نامزد در priors. 768 00:40:41,435 --> 00:40:46,300 769 00:40:46,300 --> 00:40:48,760 اجازه بدهید من فقط لرز کمی. 770 00:40:48,760 --> 00:40:50,360 OK. 771 00:40:50,360 --> 00:40:51,305 بیایید امتحان کنید. 772 00:40:51,305 --> 00:40:51,720 OK. 773 00:40:51,720 --> 00:40:58,710 >> بنابراین آن را می دهد کتی پری دارد این احتمال این بار 10 به 774 00:40:58,710 --> 00:41:02,200 منهای 7 و دل شکسته تا به این بار 10 منهای 6 به. 775 00:41:02,200 --> 00:41:05,610 پس می بینید نشان می دهد که دل شکسته یک احتمال بالاتر است. 776 00:41:05,610 --> 00:41:09,260 بنابراین "عزیزم، من در آتش هستم" است احتمالا یک آهنگ دل شکسته. 777 00:41:09,260 --> 00:41:10,580 را حس می کند؟ 778 00:41:10,580 --> 00:41:12,030 پس این چیزی است که ما انجام داد. 779 00:41:12,030 --> 00:41:16,010 >> این کد در حال رفتن به آنلاین ارسال شود، بنابراین شما بچه ها می توانید آن را از تیک بزنید. 780 00:41:16,010 --> 00:41:20,720 شاید استفاده از برخی از آن را برای اگر شما می خواهید انجام یک پروژه و یا چیزی مشابه آن. 781 00:41:20,720 --> 00:41:22,150 OK. 782 00:41:22,150 --> 00:41:25,930 این بود فقط برای نشان دادن چه محاسباتی 783 00:41:25,930 --> 00:41:27,230 کد زبان شناسی به نظر می رسد. 784 00:41:27,230 --> 00:41:33,040 اما اکنون اجازه دهید به بیشتر بروید مسائل سطح بالا است. 785 00:41:33,040 --> 00:41:33,340 OK. 786 00:41:33,340 --> 00:41:35,150 >> بنابراین مشکلات دیگر من صحبت کردن در مورد - 787 00:41:35,150 --> 00:41:37,550 مشکل تقسیم بندی اولین از آنها است. 788 00:41:37,550 --> 00:41:40,820 بنابراین شما باید در اینجا ژاپنی است. 789 00:41:40,820 --> 00:41:43,420 و پس از آن شما می بینید که هیچ فاصله وجود دارد. 790 00:41:43,420 --> 00:41:49,110 پس این است که اساسا بدان معنی است که آن را بالای صندلی، درست است؟ 791 00:41:49,110 --> 00:41:50,550 شما ژاپنی صحبت می کنند؟ 792 00:41:50,550 --> 00:41:52,840 این بالای صندلی است، درست است؟ 793 00:41:52,840 --> 00:41:54,480 >> STUDENT: من نمی دانم چه کانجی بیش از وجود دارد. 794 00:41:54,480 --> 00:41:57,010 >> LUCAS فریتاس: این [صحبت ژاپن] 795 00:41:57,010 --> 00:41:57,950 OK. 796 00:41:57,950 --> 00:42:00,960 پس از آن اساسا به معنای صندلی از بالا. 797 00:42:00,960 --> 00:42:03,620 بنابراین اگر شما تا به حال برای قرار دادن یک فضای آن را در اینجا خواهد بود. 798 00:42:03,620 --> 00:42:05,970 و سپس شما را [؟ Ueda از سان. ؟] 799 00:42:05,970 --> 00:42:09,040 که اساسا به معنی آقای Ueda از. 800 00:42:09,040 --> 00:42:13,180 و شما می بینید که "اوئدا" و شما یک فضا و پس از آن "سان". پس می بینید که 801 00:42:13,180 --> 00:42:15,470 در اینجا شما "UE" مانند خود به خود است. 802 00:42:15,470 --> 00:42:17,750 و در اینجا آن را به یک شخصیت در کنار آن. 803 00:42:17,750 --> 00:42:21,720 >> بنابراین آن را در آن زبان ها را دوست ندارد حرف به این معنی یک کلمه آن، بنابراین شما 804 00:42:21,720 --> 00:42:23,980 فقط با قرار دادن بسیاری از فضاهای. 805 00:42:23,980 --> 00:42:25,500 شخصیت های مربوط به هر یک از دیگر. 806 00:42:25,500 --> 00:42:28,680 و آنها با هم می تواند باشد مانند دو، سه، یک. 807 00:42:28,680 --> 00:42:34,520 بنابراین شما در واقع به ایجاد نوعی از راه قرار دادن آن فاصله است. 808 00:42:34,520 --> 00:42:38,850 >> و این چیزی است که هر زمان که شما داده ها از آن زبان های آسیایی، 809 00:42:38,850 --> 00:42:40,580 همه چیز می آید unsegmented. 810 00:42:40,580 --> 00:42:45,940 از آنجا که هیچ کسی است که ژاپن می نویسد: و یا چینی را با فاصله می نویسد. 811 00:42:45,940 --> 00:42:48,200 هر زمان که شما در حال نوشتن چینی، ژاپنی شما فقط همه چیز را ارسال 812 00:42:48,200 --> 00:42:48,710 بدون فاصله. 813 00:42:48,710 --> 00:42:52,060 این کار نه حتی معنی برای قرار دادن فاصله است. 814 00:42:52,060 --> 00:42:57,960 پس هنگامی که شما داده ها را از، برخی از زبان های شرق آسیا، اگر شما می خواهید 815 00:42:57,960 --> 00:43:00,760 در واقع انجام کاری با آن شما را به بخش اول را داشته باشد. 816 00:43:00,760 --> 00:43:05,130 >> فکر می کنم از انجام این کار از یک مثال از اشعار بدون فاصله. 817 00:43:05,130 --> 00:43:07,950 بنابراین تنها شعر است که شما را خواهد بود احکام، درست است؟ 818 00:43:07,950 --> 00:43:09,470 جدا شده اند. 819 00:43:09,470 --> 00:43:13,930 اما پس از آن که در آن جمله خواهد شد واقعا در دادن اطلاعات کمک 820 00:43:13,930 --> 00:43:17,760 از کسانی که اشعار می باشد. 821 00:43:17,760 --> 00:43:18,120 درست است؟ 822 00:43:18,120 --> 00:43:20,010 بنابراین شما باید فضاهای اولین قرار می دهد. 823 00:43:20,010 --> 00:43:21,990 پس چگونه می تواند به شما انجام این کار؟ 824 00:43:21,990 --> 00:43:24,920 >> پس این ایده از یک زبان می آید مدل چیزی است که واقعا 825 00:43:24,920 --> 00:43:26,870 برای محاسباتی مهم زبان شناسی. 826 00:43:26,870 --> 00:43:32,790 بنابراین یک مدل زبان اساسا یک جدول از احتمال است که نشان می دهد 827 00:43:32,790 --> 00:43:36,260 اول از همه چه احتمال است داشتن کلمه در یک زبان؟ 828 00:43:36,260 --> 00:43:39,590 بنابراین نشان دادن مکرر یک کلمه است. 829 00:43:39,590 --> 00:43:43,130 و پس از آن نیز نشان دادن رابطه بین کلمات در یک جمله. 830 00:43:43,130 --> 00:43:51,500 >> بنابراین ایده اصلی این است، اگر یک غریبه آمد به شما و گفت: یک جمله به 831 00:43:51,500 --> 00:43:55,600 شما، چه احتمال این است که، برای به عنوان مثال، "این خواهر من است [؟ GTF"؟] 832 00:43:55,600 --> 00:43:57,480 این حکم که شخص گفت؟ 833 00:43:57,480 --> 00:44:00,380 بنابراین بدیهی است که برخی از احکام شایع تر از دیگران است. 834 00:44:00,380 --> 00:44:04,450 به عنوان مثال، "صبح به خیر" یا "خوب است شب، "و یا" با سلام وجود دارد، "خیلی بیشتر 835 00:44:04,450 --> 00:44:08,260 شایع تر از بسیاری از احکام که ما باید زبان انگلیسی. 836 00:44:08,260 --> 00:44:11,060 پس چرا آن جمله می بیشتر؟ 837 00:44:11,060 --> 00:44:14,060 >> اول از همه، آن را دلیل این که شما کلماتی را که بیشتر می باشد. 838 00:44:14,060 --> 00:44:20,180 بنابراین، برای مثال، اگر شما می گویند، سگ است بزرگ و سگ غول پیکر است، شما 839 00:44:20,180 --> 00:44:23,880 معمولا احتمالا شنیدن سگ بزرگ است اغلب به دلیل "بزرگ" است 840 00:44:23,880 --> 00:44:27,260 مکرر در انگلیسی از "غول پیکر." بنابراین، یکی از 841 00:44:27,260 --> 00:44:30,100 چیزهای فراوانی کلمه است. 842 00:44:30,100 --> 00:44:34,490 >> نکته دوم این است که واقعا مهم است فقط 843 00:44:34,490 --> 00:44:35,490 منظور از کلمه است. 844 00:44:35,490 --> 00:44:39,500 بنابراین، این مشترک است که می گویند "گربه است در داخل جعبه. "اما شما معمولا نمی 845 00:44:39,500 --> 00:44:44,250 در نگاه کنید به "جعبه در داخل گربه است." پس شما می بینید که برخی از اهمیت وجود دارد 846 00:44:44,250 --> 00:44:46,030 در ترتیب کلمات. 847 00:44:46,030 --> 00:44:50,160 شما نه تنها می توان گفت که این دو جملات به احتمال قوی همان 848 00:44:50,160 --> 00:44:53,010 فقط به خاطر اینکه آنها کلمات مشابه. 849 00:44:53,010 --> 00:44:55,550 در واقع شما باید به مراقبت در مورد منظور نیز هست. 850 00:44:55,550 --> 00:44:57,650 را حس؟ 851 00:44:57,650 --> 00:44:59,490 >> پس چه کنیم؟ 852 00:44:59,490 --> 00:45:01,550 پس آنچه که من ممکن است سعی کنید برای شما؟ 853 00:45:01,550 --> 00:45:04,400 من دارم تلاش می کنم شما چیزی است که ما مدل های n-گرم تماس بگیرید. 854 00:45:04,400 --> 00:45:09,095 بنابراین مدل N-گرم اساسا فرض که برای هر کلمه ای که 855 00:45:09,095 --> 00:45:10,960 شما در یک جمله داشته باشد. 856 00:45:10,960 --> 00:45:15,020 این احتمال داشتن است که کلمه بستگی دارد نه تنها در وجود دارد 857 00:45:15,020 --> 00:45:18,395 فراوانی آن کلمه در زبان، بلکه در کلمات است که 858 00:45:18,395 --> 00:45:19,860 از آن اطراف. 859 00:45:19,860 --> 00:45:25,810 >> بنابراین برای مثال، معمولا زمانی که می بینید چیزی شبیه به در و یا در تو 860 00:45:25,810 --> 00:45:28,040 احتمالا رفتن به دیدن یک اسم بعد از آن، درست است؟ 861 00:45:28,040 --> 00:45:31,750 از آنجا که زمانی که شما یک حرف اضافه معمولا طول می کشد اسم بعد از آن. 862 00:45:31,750 --> 00:45:35,540 و یا اگر شما یک فعل است که متعدی شما معمولا در حال رفتن به 863 00:45:35,540 --> 00:45:36,630 یک عبارت اسم. 864 00:45:36,630 --> 00:45:38,780 بنابراین آن را به اسم در جایی در اطراف آن. 865 00:45:38,780 --> 00:45:44,950 >> بنابراین، اساسا، آنچه در آن می کند این است که آن احتمال داشتن در نظر 866 00:45:44,950 --> 00:45:47,960 کلمات در کنار یکدیگر، زمانی که شما در حال محاسبه 867 00:45:47,960 --> 00:45:49,050 احتمال یک جمله. 868 00:45:49,050 --> 00:45:50,960 و این چیزی است که یک زبان است مدل اساسا. 869 00:45:50,960 --> 00:45:54,620 تنها گفتن چه احتمال است داشتن یک خاص 870 00:45:54,620 --> 00:45:57,120 جمله در زبان؟ 871 00:45:57,120 --> 00:45:59,110 پس چرا آنچه سودمند، اساسا؟ 872 00:45:59,110 --> 00:46:02,390 و اول از همه چه چیزی است یک مدل N-گرم، پس از آن؟ 873 00:46:02,390 --> 00:46:08,850 >> بنابراین یک مدل N-گرم بدان معنی است که هر کلمه بستگی به 874 00:46:08,850 --> 00:46:12,700 N بعدی منهای 1 کلمه است. 875 00:46:12,700 --> 00:46:18,150 بنابراین، اساسا، به این معنی که اگر من نگاه کنید، به عنوان مثال، در TF CS50 زمانی 876 00:46:18,150 --> 00:46:21,500 من محاسبه احتمال این حکم را، به شما خواهم " 877 00:46:21,500 --> 00:46:25,280 احتمال داشتن کلمه "" زمان محلی شما با احتمال داشتن " 878 00:46:25,280 --> 00:46:31,720 CS50 "برابر احتمال داشتن "TF CS50." بنابراین، اساسا، من تعداد 879 00:46:31,720 --> 00:46:35,720 تمام راه های ممکن از کشش آن است. 880 00:46:35,720 --> 00:46:41,870 >> و پس از آن معمولا زمانی که شما انجام این کار، همانطور که در یک پروژه، شما را N می شود 881 00:46:41,870 --> 00:46:42,600 یک مقدار کم است. 882 00:46:42,600 --> 00:46:45,930 بنابراین، معمولا bigrams یا trigrams داشته باشد. 883 00:46:45,930 --> 00:46:51,090 به طوری که شما فقط به تعداد دو واژه، گروه از دو کلمه و یا سه کلمه، 884 00:46:51,090 --> 00:46:52,620 فقط برای مسائل مربوط به عملکرد. 885 00:46:52,620 --> 00:46:56,395 و همچنین به این دلیل شاید اگر شما چیزی شبیه به "TF CS50." هنگامی که شما 886 00:46:56,395 --> 00:47:00,510 باید "TF،" این بسیار مهم است که "CS50" در کنار آن است، درست است؟ 887 00:47:00,510 --> 00:47:04,050 این دو چیز معمولا در کنار یکدیگر. 888 00:47:04,050 --> 00:47:06,410 >> اگر شما فکر می کنم "TF"، آن را احتمالا رفتن به آنچه 889 00:47:06,410 --> 00:47:07,890 کلاس آن را برای TF'ing. 890 00:47:07,890 --> 00:47:11,330 همچنین "" واقعا مهم است برای TF CS50. 891 00:47:11,330 --> 00:47:14,570 اما اگر شما چیزی مانند "CS50 TF به کلاس رفت و به آنها 892 00:47:14,570 --> 00:47:20,060 دانش آموزان برخی از آب نبات. "" آب نبات "و" " هیچ رابطه واقعا، درست است؟ 893 00:47:20,060 --> 00:47:23,670 آنها خیلی از هم دور هستیم که آن واقعا مهم نیست که چه 894 00:47:23,670 --> 00:47:25,050 کلمات شما. 895 00:47:25,050 --> 00:47:31,210 >> بنابراین با انجام یک bigram یا مدلهای پنهان مارکوف آن فقط بدان معناست که شما محدود 896 00:47:31,210 --> 00:47:33,430 خودتان را به برخی از واژه ها که در اطراف می باشد. 897 00:47:33,430 --> 00:47:35,810 را حس؟ 898 00:47:35,810 --> 00:47:40,630 بنابراین، هنگامی که شما می خواهید به انجام تقسیم بندی، اساسا، آنچه شما می خواهید برای انجام شده است را ببینید 899 00:47:40,630 --> 00:47:44,850 تمام راههای ممکن چه که شما می توانید بخشی از حکم. 900 00:47:44,850 --> 00:47:49,090 >> چنین است که شما ببینید چه چیزی است احتمال هر یک از این احکام 901 00:47:49,090 --> 00:47:50,880 موجود در زبان؟ 902 00:47:50,880 --> 00:47:53,410 بنابراین آنچه انجام می دهید مانند، خوب، اجازه دهید من سعی کنید برای قرار دادن یک فضای اینجا. 903 00:47:53,410 --> 00:47:55,570 بنابراین شما یک فضای قرار داده وجود دارد و شما ببینید چه چیزی است 904 00:47:55,570 --> 00:47:57,590 احتمال حکم؟ 905 00:47:57,590 --> 00:48:00,240 سپس شما مانند، OK، شاید می که بود که خوب نیست. 906 00:48:00,240 --> 00:48:03,420 بنابراین من یک فضای شود وجود دارد و یک فضای وجود دارد، و شما را محاسبه 907 00:48:03,420 --> 00:48:06,240 احتمال در حال حاضر، و شما می بینید که این یک احتمال است. 908 00:48:06,240 --> 00:48:12,160 >> بنابراین این الگوریتم به نام TANGO است الگوریتم تقسیم بندی، که است 909 00:48:12,160 --> 00:48:14,990 در واقع چیزی است که واقعا خواهد بود خنک برای یک پروژه، که 910 00:48:14,990 --> 00:48:20,860 در واقع طول می کشد متن unsegmented که می تواند ژاپنی یا چینی و یا شاید 911 00:48:20,860 --> 00:48:26,080 انگلیسی بدون فاصله و تلاش می کند برای قرار دادن فاصله بین کلمات و آن را 912 00:48:26,080 --> 00:48:29,120 که با استفاده از یک مدل زبان و تلاش برای دیدن آنچه که بالاترین است 913 00:48:29,120 --> 00:48:31,270 احتمال شما می توانید دریافت کنید. 914 00:48:31,270 --> 00:48:32,230 OK. 915 00:48:32,230 --> 00:48:33,800 بنابراین این تقسیم بندی است. 916 00:48:33,800 --> 00:48:35,450 >> حالا نحو. 917 00:48:35,450 --> 00:48:40,940 بنابراین، نحو است که برای استفاده چیزهای بسیاری در حال حاضر. 918 00:48:40,940 --> 00:48:44,880 بنابراین برای نمودار های جست و جو، برای سیری برای تقریبا از هر نوع طبیعی 919 00:48:44,880 --> 00:48:46,490 پردازش زبان شما داشته باشد. 920 00:48:46,490 --> 00:48:49,140 پس چه مهم است همه چیز در مورد نحو؟ 921 00:48:49,140 --> 00:48:52,390 بنابراین، حکم به طور کلی آنچه که ما در ترکیبات تماس بگیرید. 922 00:48:52,390 --> 00:48:57,080 که نوع مانند گروه از کلمات که تابع در جمله. 923 00:48:57,080 --> 00:49:02,220 و آنها واقعا نمی تواند باشد جدا از یکدیگر. 924 00:49:02,220 --> 00:49:07,380 >> بنابراین، اگر من می گویم، به عنوان مثال، "لورن را دوست دارد میلو. "من می دانم که" لورن "است 925 00:49:07,380 --> 00:49:10,180 تشکیل و پس از آن "را دوست دارد میلو "نیز یکی دیگر. 926 00:49:10,180 --> 00:49:16,860 از آنجا که شما نمی تواند مانند "لورن میلو می گویند دوست دارد "به همان معنی. 927 00:49:16,860 --> 00:49:18,020 این نخواهیم داشت. همان معنی. 928 00:49:18,020 --> 00:49:22,500 و یا من نمی توانم مثل "میلو لورن می گویند را دوست دارد. "همه چیز است، همان 929 00:49:22,500 --> 00:49:25,890 به این معنی که انجام آن. 930 00:49:25,890 --> 00:49:31,940 >> بنابراین دو چیز مهم تر در مورد نحو هستند که انواع واژگانی است که 931 00:49:31,940 --> 00:49:35,390 اساسا تابع شما که برای کلمات به خودی خود. 932 00:49:35,390 --> 00:49:39,180 بنابراین شما باید بدانید که "لورن" و "میلو" اسم هستند. 933 00:49:39,180 --> 00:49:41,040 "عشق" یک فعل است. 934 00:49:41,040 --> 00:49:45,660 و نکته مهم دیگر این است که آنها انواع چند قسمتی است. 935 00:49:45,660 --> 00:49:48,990 بنابراین شما می دانید که "دوست دارد میلو" است که در واقع یک عبارت کلامی. 936 00:49:48,990 --> 00:49:52,390 بنابراین، هنگامی که من می گویم "لورن،" من می دانم که لورن در حال انجام چیزی. 937 00:49:52,390 --> 00:49:53,620 آنچه که او انجام می دهد؟ 938 00:49:53,620 --> 00:49:54,570 او دوست میلو. 939 00:49:54,570 --> 00:49:56,440 پس از آن تمام چیزی است. 940 00:49:56,440 --> 00:50:01,640 اما اجزاء آن است یک اسم و یک فعل. 941 00:50:01,640 --> 00:50:04,210 اما با هم، آنها را که عبارت است از فعل. 942 00:50:04,210 --> 00:50:08,680 >> بنابراین، آنچه می تواند ما در واقع با انجام زبان شناسی محاسباتی؟ 943 00:50:08,680 --> 00:50:13,810 بنابراین، اگر من چیزی به عنوان مثال "دوستان آلیسون." من را ببینید اگر من فقط 944 00:50:13,810 --> 00:50:17,440 یک درخت نحوی من می دانم که "دوستان" که عبارت است اسم آن است 945 00:50:17,440 --> 00:50:21,480 اسم و پس از آن "از آلیسون" است حرف اضافه است که در آن "از" است 946 00:50:21,480 --> 00:50:24,810 پیشنهاد و "آلیسون" یک اسم است. 947 00:50:24,810 --> 00:50:30,910 چیزی که من می تواند انجام دهد این است که آموزش کامپیوتر من که زمانی که من یک عبارت اسمی یک و 948 00:50:30,910 --> 00:50:33,080 پس از آن یک عبارت گزاره. 949 00:50:33,080 --> 00:50:39,020 بنابراین در این مورد، "دوستان" و سپس "از میلو "من می دانم که این بدان معنی است که 950 00:50:39,020 --> 00:50:43,110 NP2، دوم، صاحب NP1. 951 00:50:43,110 --> 00:50:47,680 >> بنابراین من می توانید از برخی از انواع رابطه ایجاد، نوعی از تابع برای آن. 952 00:50:47,680 --> 00:50:52,370 بنابراین هر زمان که من این ساختار را مشاهده کنید، که دقیقا با "دوستان 953 00:50:52,370 --> 00:50:56,030 آلیسون، "من می دانم که آلیسون صاحب دوستان. 954 00:50:56,030 --> 00:50:58,830 پس دوستان چیزی که آلیسون است. 955 00:50:58,830 --> 00:50:59,610 را حس می کند؟ 956 00:50:59,610 --> 00:51:01,770 پس این است که اساسا چه نمودار جستجو می کند. 957 00:51:01,770 --> 00:51:04,360 این فقط ایجاد قوانین برای بسیاری از مسائل. 958 00:51:04,360 --> 00:51:08,190 بنابراین "دوستان آلیسون"، "دوستان من که در کمبریج "زندگی می کنند،" دوستان من 959 00:51:08,190 --> 00:51:12,970 که به دانشگاه هاروارد رفت. "آن را ایجاد قوانین برای همه کسانی که همه چیز. 960 00:51:12,970 --> 00:51:14,930 >> در حال حاضر ترجمه ماشینی. 961 00:51:14,930 --> 00:51:18,850 بنابراین، ترجمه ماشینی است چیزی آماری. 962 00:51:18,850 --> 00:51:21,340 و در واقع اگر شما درگیر در زبان شناسی محاسباتی، بسیاری از 963 00:51:21,340 --> 00:51:23,580 مسائل خود را در حال رفتن به آمار. 964 00:51:23,580 --> 00:51:26,670 پس که من انجام شده بود به عنوان مثال با بسیاری از احتمالات بود که من 965 00:51:26,670 --> 00:51:30,540 محاسبه، و سپس شما را به این را دریافت کنید تعداد بسیار کمی که به فینال 966 00:51:30,540 --> 00:51:33,180 به احتمال قوی، و این چیزی است که به شما پاسخ دهد. 967 00:51:33,180 --> 00:51:37,540 ترجمه ماشینی نیز استفاده می کند یک مدل آماری. 968 00:51:37,540 --> 00:51:44,790 و اگر می خواهید از دستگاه فکر می کنم ترجمه در ساده ترین ممکن 969 00:51:44,790 --> 00:51:48,970 راه، چیزی که شما می توانید از فکر می کنم فقط ترجمه کلمه به کلمه، درست است؟ 970 00:51:48,970 --> 00:51:52,150 >> هنگامی که شما در حال یادگیری زبان برای اولین بار، که معمولا چه 971 00:51:52,150 --> 00:51:52,910 شما انجام دهید، درست است؟ 972 00:51:52,910 --> 00:51:57,050 اگر شما می خواهم به شما یک جمله ترجمه در زبان خود را به زبان 973 00:51:57,050 --> 00:52:00,060 شما در حال یادگیری، معمولا برای اولین بار، شما ترجمه هر یک از کلمات 974 00:52:00,060 --> 00:52:03,180 به صورت جداگانه، و پس از آن شما سعی می کنید برای قرار دادن کلمات را به محل. 975 00:52:03,180 --> 00:52:07,100 >> پس اگر من می خواستم برای ترجمه این، [صحبت پرتغالی] 976 00:52:07,100 --> 00:52:10,430 که به معنی "گربه سفید فرار کرد." اگر من می خواستم به آن را ترجمه از 977 00:52:10,430 --> 00:52:13,650 پرتغالی به انگلیسی، چیزی که من می تواند انجام دهید، برای اولین بار، من فقط 978 00:52:13,650 --> 00:52:14,800 ترجمه واژه به واژه. 979 00:52:14,800 --> 00:52:20,570 بنابراین "ای" "،" "گاتو"، "گربه" است "برانکو"، "سفید،" و سپس "fugio" است 980 00:52:20,570 --> 00:52:21,650 "فرار کرد." 981 00:52:21,650 --> 00:52:26,130 >> پس من تمام کلمات را در اینجا، اما آنها به منظور نیست. 982 00:52:26,130 --> 00:52:29,590 این مانند "سفید گربه فرار" ungrammatical است. 983 00:52:29,590 --> 00:52:34,490 بنابراین، پس از آن من می تواند یک گام دوم، باید که برای رفتن به پیدا کردن ایده آل 984 00:52:34,490 --> 00:52:36,610 موقعیت را برای هر یک از کلمات. 985 00:52:36,610 --> 00:52:40,240 بنابراین من می دانم که من در واقع می خواهم به "گربه سفید" به جای "گربه سفید." پس 986 00:52:40,240 --> 00:52:46,050 آنچه که من می تواند انجام دهد، روش ساده و بی تکلف ترین خواهد بود برای ایجاد تمام 987 00:52:46,050 --> 00:52:49,720 جایگشت های ممکن است از کلمات، از مواضع. 988 00:52:49,720 --> 00:52:53,300 و بعد ببینید که کدام یک است بیشترین احتمال بر اساس 989 00:52:53,300 --> 00:52:54,970 مدل زبان من. 990 00:52:54,970 --> 00:52:58,390 و سپس هنگامی که یکی است که پیدا کردن من بالاترین احتمال آن است که 991 00:52:58,390 --> 00:53:01,910 احتمالا "گربه سفید فرار کرد،" که ترجمه من است. 992 00:53:01,910 --> 00:53:06,710 >> و این یک روش ساده توضیح است چگونه بسیاری از ترجمه ماشینی 993 00:53:06,710 --> 00:53:07,910 الگوریتم های کار می کنند. 994 00:53:07,910 --> 00:53:08,920 آیا این را حس؟ 995 00:53:08,920 --> 00:53:12,735 این هم چیزی است که واقعا هیجان انگیز که شما بچه ها شاید می تواند برای کشف 996 00:53:12,735 --> 00:53:13,901 پروژه نهایی، آره؟ 997 00:53:13,901 --> 00:53:15,549 >> STUDENT: خوب، می گفت که راه ساده و بی تکلف، پس چه 998 00:53:15,549 --> 00:53:17,200 راه های غیر ساده و بی تکلف؟ 999 00:53:17,200 --> 00:53:18,400 >> LUCAS فریتاس: راه های غیر ساده و بی تکلف؟ 1000 00:53:18,400 --> 00:53:19,050 OK. 1001 00:53:19,050 --> 00:53:22,860 بنابراین اولین چیزی است که در مورد بد این روش این است که من فقط ترجمه 1002 00:53:22,860 --> 00:53:24,330 کلمات، کلمه به کلمه. 1003 00:53:24,330 --> 00:53:30,570 اما گاهی اوقات شما باید کلماتی را که می توانید ترجمه های متعدد داشته باشد. 1004 00:53:30,570 --> 00:53:32,210 من قصد دارم به تلاش برای فکر می کنم از چیزی. 1005 00:53:32,210 --> 00:53:37,270 به عنوان مثال، "مانگا" می تواند در پرتغالی یا می شود "شکستن" و یا "آستین." پس 1006 00:53:37,270 --> 00:53:40,450 هنگامی که شما تلاش برای ترجمه کلمه کلمه، آن را ممکن است به شما 1007 00:53:40,450 --> 00:53:42,050 چیزی که باعث می شود هیچ حس. 1008 00:53:42,050 --> 00:53:45,770 >> بنابراین شما در واقع می خواهم به شما نگاه کنید در تمام ترجمه ها ممکن است از 1009 00:53:45,770 --> 00:53:49,840 کلمات و ببینید، اول از همه، چه منظور است. 1010 00:53:49,840 --> 00:53:52,000 ما در مورد permutating صحبت می کردند چیزهایی؟ 1011 00:53:52,000 --> 00:53:54,150 برای دیدن تمام دستورات ممکن است و یکی با بالاترین را انتخاب کنید 1012 00:53:54,150 --> 00:53:54,990 احتمال؟ 1013 00:53:54,990 --> 00:53:57,860 شما همچنین می توانید همه ممکن را انتخاب کنید ترجمه برای هر 1014 00:53:57,860 --> 00:54:00,510 کلمه و سپس ببینید - 1015 00:54:00,510 --> 00:54:01,950 همراه با جایگشت - 1016 00:54:01,950 --> 00:54:03,710 که یکی دارای بالاترین احتمال. 1017 00:54:03,710 --> 00:54:08,590 >> به علاوه، شما همچنین می توانید نه در نگاه فقط کلمات اما عبارات. 1018 00:54:08,590 --> 00:54:11,700 بنابراین شما می توانید روابط بین تجزیه و تحلیل کلمات و سپس یک 1019 00:54:11,700 --> 00:54:13,210 ترجمه بهتر است. 1020 00:54:13,210 --> 00:54:16,690 همچنین چیز دیگری است، بنابراین این ترم من در واقع انجام پژوهش در 1021 00:54:16,690 --> 00:54:19,430 چینی به انگلیسی ترجمه ماشینی، بنابراین ترجمه از 1022 00:54:19,430 --> 00:54:20,940 چینی به انگلیسی. 1023 00:54:20,940 --> 00:54:26,760 >> و چیزی است که ما انجام شده است، علاوه بر این با استفاده از یک مدل آماری است که فقط 1024 00:54:26,760 --> 00:54:30,570 دیدن احتمال دیدن برخی از موقعیت در یک جمله، من هستم 1025 00:54:30,570 --> 00:54:35,360 در واقع همچنین اضافه کردن برخی از نحو به من مدل و گفت: آه، اگر من این نوع را ببینید 1026 00:54:35,360 --> 00:54:39,420 ساخت و ساز، این چیزی است که من می خواهم آن را تغییر دهید تا وقتی که من ترجمه کنید. 1027 00:54:39,420 --> 00:54:43,880 بنابراین شما همچنین می توانید نوعی از اضافه عنصر نحو به 1028 00:54:43,880 --> 00:54:47,970 ترجمه کارآمد تر و دقیق تر. 1029 00:54:47,970 --> 00:54:48,550 OK. 1030 00:54:48,550 --> 00:54:51,010 >> پس چگونه می تواند به شما برای شروع، اگر شما می خواهید برای انجام کاری در محاسبات 1031 00:54:51,010 --> 00:54:51,980 زبان شناسی؟ 1032 00:54:51,980 --> 00:54:54,560 >> اول، شما یک پروژه را انتخاب کنید که شامل زبان. 1033 00:54:54,560 --> 00:54:56,310 بنابراین، بسیاری از خارج وجود دارد وجود دارد. 1034 00:54:56,310 --> 00:54:58,420 در بسیاری از چیزهایی که شما می توانید انجام دهید وجود دارد. 1035 00:54:58,420 --> 00:55:00,510 و پس از آن می توانید از یک مدل فکر می کنم که شما می توانید استفاده کنید. 1036 00:55:00,510 --> 00:55:04,710 معمولا این بدان معناست که تفکر مفروضات، به عنوان مثل، آه، وقتی که من بود 1037 00:55:04,710 --> 00:55:05,770 مانند فکر کردن متن. 1038 00:55:05,770 --> 00:55:09,510 من دوست دارم، خوب، بود اگر من می خواهم به شکل از کسانی که از این نوشت، من احتمالا می خواهید 1039 00:55:09,510 --> 00:55:15,400 به کلمات نگاه شخص استفاده می شود و ببینید که با استفاده از آن کلمه اغلب. 1040 00:55:15,400 --> 00:55:18,470 بنابراین سعی کنید به مفروضات و سعی کنید از مدل های فکر می کنم. 1041 00:55:18,470 --> 00:55:21,395 و سپس شما همچنین می توانید آنلاین جستجوی نوع مشکل است که شما را، 1042 00:55:21,395 --> 00:55:24,260 و آن را نشان می دهد به شما مدل که شاید 1043 00:55:24,260 --> 00:55:26,560 مدل سازی است که چیزی که هست. 1044 00:55:26,560 --> 00:55:29,080 >> و همچنین شما همیشه می توانید به من ایمیل. 1045 00:55:29,080 --> 00:55:31,140 me@lfreitas.com. 1046 00:55:31,140 --> 00:55:34,940 و من فقط می توانید سوالات خود را پاسخ دهد. 1047 00:55:34,940 --> 00:55:38,600 ما حتی می توانیم به ملاقات، بنابراین من می تواند نظر خواهی و پیشنهادات در مورد راه از 1048 00:55:38,600 --> 00:55:41,490 اجرای پروژه شما. 1049 00:55:41,490 --> 00:55:45,610 و من اگر شما درگیر با زبان شناسی محاسباتی، این رفتن 1050 00:55:45,610 --> 00:55:46,790 به بزرگ است. 1051 00:55:46,790 --> 00:55:48,370 شما به وجود دارد پتانسیل بسیار زیادی است. 1052 00:55:48,370 --> 00:55:52,060 و صنعت می خواهد به استخدام شما بد چون از آن. 1053 00:55:52,060 --> 00:55:54,720 بنابراین من امیدوارم که شما بچه ها این لذت می برد. 1054 00:55:54,720 --> 00:55:57,030 اگر شما هر گونه سوال، شما می توانید به من بعد از این سوال. 1055 00:55:57,030 --> 00:55:58,280 اما شما تشکر می کنم. 1056 00:55:58,280 --> 00:56:00,150