1 00:00:00,000 --> 00:00:08,364 2 00:00:08,364 --> 00:00:08,870 >> LUCAS Freitas: హే. 3 00:00:08,870 --> 00:00:09,980 అందరికీ స్వాగతం. 4 00:00:09,980 --> 00:00:11,216 నా పేరు లుకాస్ ఫ్రీటస్ ఉంది. 5 00:00:11,216 --> 00:00:15,220 నేను అధ్యయనం [వినబడని] వద్ద ఒక జూనియర్ ఉన్నాను లో దృష్టితో కంప్యూటర్ సైన్స్ 6 00:00:15,220 --> 00:00:16,410 కంప్యుటేషనల్ లింగ్విస్టిక్స్. 7 00:00:16,410 --> 00:00:19,310 నా ద్వితీయ భాషలో ఉంది మరియు భాషా సిద్ధాంతం. 8 00:00:19,310 --> 00:00:21,870 నేను నిజంగా మీరు అబ్బాయిలు నేర్పిన సంతోషిస్తున్నాము చేస్తున్నాను రంగంలో గురించి కొద్దిగా. 9 00:00:21,870 --> 00:00:24,300 ఇది అధ్యయనం చాలా అద్భుతమైన ప్రాంత. 10 00:00:24,300 --> 00:00:27,260 అలాగే సంభావ్య చాలా తో భవిష్యత్తులో కోసం. 11 00:00:27,260 --> 00:00:30,160 కాబట్టి, నేను నిజంగా సంతోషిస్తున్నాము చేస్తున్నాను మీరు అబ్బాయిలు ప్రాజెక్టులు ఆలోచిస్తున్నాయి 12 00:00:30,160 --> 00:00:31,160 కంప్యుటేషనల్ లింగ్విస్టిక్స్. 13 00:00:31,160 --> 00:00:35,460 నేను సలహా కంటే ఎక్కువ సంతోషంగా ఉంటాం మీరు ఏ మీరు నిర్ణయించుకుంటే 14 00:00:35,460 --> 00:00:37,090 ఆ ఒకటి ఎంచుకుంది. 15 00:00:37,090 --> 00:00:40,010 >> గణన ఏమిటో అన్ని కాబట్టి మొదటి భాషాశాస్త్రం? 16 00:00:40,010 --> 00:00:44,630 కాబట్టి కంప్యుటేషనల్ లింగ్విస్టిక్స్ ఉంది సాధకబాధకాలు మధ్య విభజన 17 00:00:44,630 --> 00:00:46,390 కంప్యూటర్ సైన్స్. 18 00:00:46,390 --> 00:00:47,415 కాబట్టి, భాషాశాస్త్రం ఏమిటి? 19 00:00:47,415 --> 00:00:48,490 కంప్యూటర్ సైన్స్ ఏమిటి? 20 00:00:48,490 --> 00:00:51,580 బాగా భాషా, ఏమి మేము భాషలు పడుతుంది. 21 00:00:51,580 --> 00:00:54,960 కాబట్టి భాషాశాస్త్రం నిజానికి అధ్యయనం సాధారణంగా సహజ భాష. 22 00:00:54,960 --> 00:00:58,330 కాబట్టి సహజ భాష - మాట్లాడుకోవడంగానీ మేము నిజంగా ఉపయోగించే భాష 23 00:00:58,330 --> 00:00:59,770 ప్రతి ఇతర కమ్యూనికేట్. 24 00:00:59,770 --> 00:01:02,200 కాబట్టి మేము ఖచ్చితంగా మాట్లాడుకోవటలేదు సి లేదా జావా గురించి. 25 00:01:02,200 --> 00:01:05,900 మేము ఇంగ్లీష్ గురించి మరింత మాట్లాడటం చేస్తున్నారు చైనీస్ మరియు ఇతర భాషలు మేము 26 00:01:05,900 --> 00:01:07,780 ప్రతి ఇతర సంభాషించడానికి ఉపయోగించే. 27 00:01:07,780 --> 00:01:12,470 >> గురించి సవాలు విషయం ప్రస్తుతం మేము దాదాపు 7,000 28 00:01:12,470 --> 00:01:14,260 ప్రపంచంలో భాషలు. 29 00:01:14,260 --> 00:01:19,520 కాబట్టి చాలా అధిక వివిధ ఉన్నాయి మేము అధ్యయనం చేయవచ్చు భాషలు. 30 00:01:19,520 --> 00:01:22,600 ఆపై మీరు అది ఉంది అని అనుకుంటున్నాను చాలా కష్టం, ఉదాహరణకు, 31 00:01:22,600 --> 00:01:26,960 ఒక భాష నుండి అనువాదం ఇతర, మీరు పరిగణించడం 32 00:01:26,960 --> 00:01:28,240 దాదాపు 7,000 వాటిలో. 33 00:01:28,240 --> 00:01:31,450 కాబట్టి, మీకు అనువాదం చేయడం అనుకుంటే ఒక భాష నుండి ఇతర మిమ్మల్ని 34 00:01:31,450 --> 00:01:35,840 దాదాపు మిలియన్ కంటే వివిధ కలయికలు మీరు చెయ్యవచ్చు 35 00:01:35,840 --> 00:01:37,330 భాష నుండి భాషకు కలిగి. 36 00:01:37,330 --> 00:01:40,820 కనుక ఇది నిజంగా కొన్ని చేయడానికి సవాలు యొక్క ఉదాహరణకు అనువాద వ్యవస్థ యొక్క రకం కోసం 37 00:01:40,820 --> 00:01:43,540 ప్రతి భాష. 38 00:01:43,540 --> 00:01:47,120 >> కాబట్టి, సిన్టాక్సుతో భాషాశాస్త్రం విందులు, అర్థాలు, సంయోగ ప్రయోగ. 39 00:01:47,120 --> 00:01:49,550 మీరు అబ్బాయిలు ఖచ్చితంగా అవసరం లేదు వారు ఏవి తెలుసుకోవటానికి. 40 00:01:49,550 --> 00:01:55,090 కానీ చాలా ఆసక్తికరమైన విషయం ఉంది మీరు తెలుసుకోవడం ఒక స్థానిక స్పీకర్, వంటి 41 00:01:55,090 --> 00:01:59,010 చిన్నప్పుడు భాష, మీరు నిజంగా తెలుసుకోవడానికి ఆ విషయాలు అన్ని - సింటాక్స్ అర్థాలను 42 00:01:59,010 --> 00:02:00,500 మరియు వ్యవహారజ్ఞాన వాదం - 43 00:02:00,500 --> 00:02:01,430 మీ ద్వారా. 44 00:02:01,430 --> 00:02:04,820 మరియు ఎవరూ మీరు వాక్యనిర్మాణం నేర్పిన ఉంది మీరు వాక్యాలు అర్థం చేసుకునేందుకు 45 00:02:04,820 --> 00:02:05,290 నిర్మాణాత్మక. 46 00:02:05,290 --> 00:02:07,980 కాబట్టి, అది నిజంగా ఆసక్తికరమైన ఎందుకంటే ఇది చాలా వచ్చే విషయం ఉంది 47 00:02:07,980 --> 00:02:10,389 అకారణంగా. 48 00:02:10,389 --> 00:02:13,190 >> మరియు మీరు నుండి ఏమి తీసుకున్నట్లు కంప్యూటర్ సైన్స్? 49 00:02:13,190 --> 00:02:16,700 బాగా, అతి ముఖ్యమైన విషయం మేము కంప్యూటర్ సైన్స్ లో మొదటి ఉంది 50 00:02:16,700 --> 00:02:19,340 అన్ని, కృత్రిమ మేధస్సు మరియు యంత్ర అభ్యాస. 51 00:02:19,340 --> 00:02:22,610 కాబట్టి, మేము చేస్తున్న ప్రయత్నిస్తున్న ఏమి కంప్యుటేషనల్ లింగ్విస్టిక్స్ టీచ్ ఉంది 52 00:02:22,610 --> 00:02:26,990 ఏదో ఒకటి ఎలా మీ కంప్యూటర్ భాషతో. 53 00:02:26,990 --> 00:02:28,630 >> కాబట్టి, ఉదాహరణకు, యంత్రం లో అనువాద. 54 00:02:28,630 --> 00:02:32,490 నా కంప్యూటర్ ఎలా నేర్పిన ప్రయత్నిస్తున్నాను ఒక నుండి బదిలీ ఎలా 55 00:02:32,490 --> 00:02:33,310 ఇతర భాష. 56 00:02:33,310 --> 00:02:35,790 కాబట్టి, ప్రాథమికంగా టీచింగ్ ఇష్టం ఒక కంప్యూటర్ రెండు భాషలు. 57 00:02:35,790 --> 00:02:38,870 నేను సహజ భాషా సంవిధానం చేస్తే, ఉదాహరణకు విషయంలో ఇది 58 00:02:38,870 --> 00:02:41,810 Facebook యొక్క గ్రాఫ్ శోధన, మీరు నేర్పుతుంది అర్థం ఎలా మీ కంప్యూటర్ 59 00:02:41,810 --> 00:02:42,730 ప్రశ్నలు బాగా. 60 00:02:42,730 --> 00:02:48,130 >> కాబట్టి, మీరు "ఫోటోలు చెప్పుకోవాలంటే నా స్నేహితులు. "ఫేస్బుక్ చికిత్స లేదు 61 00:02:48,130 --> 00:02:51,130 ఒక సంపూర్ణ స్ట్రింగ్ వంటి పదాల కేవలం కొంత. 62 00:02:51,130 --> 00:02:56,020 ఇది నిజానికి సంబంధించి అర్థం "ఫోటోలు" మరియు "నా స్నేహితులు" మరియు మధ్య 63 00:02:56,020 --> 00:02:59,620 "ఫోటోలు" అని అర్థం ఆస్తి "నా స్నేహితులు." 64 00:02:59,620 --> 00:03:02,350 >> కనుక, ఆ, ఉదాహరణకు, భాగం సహజ భాషా సంవిధానం. 65 00:03:02,350 --> 00:03:04,790 ఇది అర్థం ప్రయత్నిస్తున్నాడు మధ్య సంబంధం ఉంది 66 00:03:04,790 --> 00:03:07,520 ఒక వాక్యంలో పదాలు. 67 00:03:07,520 --> 00:03:11,170 మరియు పెద్ద ప్రశ్న, మీరు ఉంది మాట్లాడటం ఒక కంప్యూటర్ బోధించడానికి 68 00:03:11,170 --> 00:03:12,650 సాధారణంగా ఒక భాష? 69 00:03:12,650 --> 00:03:17,810 ఒక ఆసక్తికరమైన ప్రశ్న ఇది , ఉంటే వంటి బహుశా భవిష్యత్తులో, అనుకుంటున్నాను 70 00:03:17,810 --> 00:03:19,930 మీరు చేయగలరు చూడాలని మీ సెల్ ఫోన్ మాట్లాడటానికి. 71 00:03:19,930 --> 00:03:23,290 రకమైన మేము సిరి తో ఏమి వంటి కానీ మరింత ఏదో వంటి, మీరు నిజంగా చేయవచ్చు 72 00:03:23,290 --> 00:03:25,690 మీకు కావలసిన చెప్పగలదు మరియు ఫోన్ ప్రతి విషయం అన్నారు. 73 00:03:25,690 --> 00:03:28,350 మరియు అది ప్రశ్నలు అనుసరించాల్సి ఉండవచ్చు తీసుకునేది కాదు. 74 00:03:28,350 --> 00:03:30,880 ఆ, నిజంగా అద్భుతమైన ఏదో ఉంది నా అభిప్రాయం లో. 75 00:03:30,880 --> 00:03:33,070 >> కాబట్టి, సహజ భాషల గురించి ఏదో. 76 00:03:33,070 --> 00:03:36,220 గురించి నిజంగా ఆసక్తికరమైన ఏదో సహజ భాషలు ఉంది, మరియు ఈ ఉంది 77 00:03:36,220 --> 00:03:38,470 నా భాషాశాస్త్రం ప్రొఫెసర్ అప్పు, మరియా Polinsky. 78 00:03:38,470 --> 00:03:40,830 ఆమె ఒక ఉదాహరణ ఇస్తుంది మరియు నేను ఇది నిజంగా ఆసక్తికరంగా. 79 00:03:40,830 --> 00:03:47,060 మేము ఉన్నప్పుడు నుండి భాష నేర్చుకోవడానికి ఎందుకంటే మేము మా స్థానిక అప్పుడు పుట్టి చేస్తున్నారు 80 00:03:47,060 --> 00:03:49,170 భాష రకమైన మాకు పెరుగుతుంది. 81 00:03:49,170 --> 00:03:52,570 >> మరియు ప్రధానంగా మీకు భాష నేర్చుకోవడానికి తక్కువ ఇన్పుట్ను నుండి, కుడి? 82 00:03:52,570 --> 00:03:56,700 మీరు నుండి ఇన్ పుట్ చేస్తున్నారు మీ మీ భాషను ధ్వనులు ఏమి తల్లిదండ్రులు 83 00:03:56,700 --> 00:03:58,770 ఇష్టం మీరు కేవలం అది తెలుసుకోవడానికి. 84 00:03:58,770 --> 00:04:02,240 మీరు చూస్తే ఎందుకంటే కాబట్టి, ఇది ఆసక్తికరంగా ఆ వాక్యాలు వద్ద, ఉదాహరణకు. 85 00:04:02,240 --> 00:04:06,980 మీరు చూడండి, "మేరీ ప్రతి ఒక కోటు పుట్స్ సమయం ఆ ఇల్లు, ఆకులు. " 86 00:04:06,980 --> 00:04:10,650 >> ఈ సందర్భంలో, ఇది కలిగి అవకాశం పదం "ఆమె" కుడి, మేరీ చూడండి? 87 00:04:10,650 --> 00:04:13,500 మీరు "మేరీ ఒక కోటు పుట్స్ చెప్పగలను మేరీ ఆకులు ప్రతిసారీ 88 00:04:13,500 --> 00:04:14,960 హౌస్. "కాబట్టి ఆ మంచిది. 89 00:04:14,960 --> 00:04:19,370 కానీ మీరు వాక్యం చూడండి "ఆమె మేరీ ఒక కోటు అయినా ఉంచుతుంది 90 00:04:19,370 --> 00:04:22,850 ఇల్లు వదిలి. "మీరు తెలుసు "ఆమె" అని చెప్పడానికి అసాధ్యం 91 00:04:22,850 --> 00:04:24,260 మేరీ సూచిస్తూ. 92 00:04:24,260 --> 00:04:27,070 >> "మేరీ ఉంచుతుంది చెప్పి మార్గం ఉంది ఒక కోటు న మేరీ ఆకులు ప్రతిసారీ 93 00:04:27,070 --> 00:04:30,790 హౌస్. "కనుక ఇది ఆసక్తికరమైన ఎందుకంటే ఈ ఊహ యొక్క రకం 94 00:04:30,790 --> 00:04:32,890 ప్రతి స్థానిక స్పీకర్ కలిగి. 95 00:04:32,890 --> 00:04:36,370 మరియు ఎవరూ ఈ అని బోధించాడు వాక్యనిర్మాణం పనిచేసే విధంగా. 96 00:04:36,370 --> 00:04:41,930 మరియు మీరు మాత్రమే ఈ "ఆమె" కలిగి , ఈ మొదటి సందర్భంలో మేరీ సూచిస్తూ 97 00:04:41,930 --> 00:04:44,260 మరియు నిజానికి ఈ ఇతర లో చాలా, కానీ ఈ ఒక లో. 98 00:04:44,260 --> 00:04:46,500 కానీ అందరూ రకమైన గెట్స్ అదే సమాధానం. 99 00:04:46,500 --> 00:04:48,580 అందరూ ఆ అంగీకరిస్తుంది. 100 00:04:48,580 --> 00:04:53,280 కనుక ఇది ఎలా అయితే నిజంగా ఆసక్తికరంగా మీరు అన్ని నియమాలను తెలియదు 101 00:04:53,280 --> 00:04:55,575 మీ భాషలో మీరు రకమైన అర్థం భాష ఎలా పని. 102 00:04:55,575 --> 00:04:59,020 103 00:04:59,020 --> 00:05:01,530 >> కాబట్టి సహజ గురించి ఆసక్తికరమైన విషయం భాషను మీకు లేని ఉంది 104 00:05:01,530 --> 00:05:06,970 తెలుసుకునే వాక్యనిర్మాణం తెలిస్తే ఒక వాక్యం వ్యాకరణ లేదా వ్యాకరణం ఉంది 105 00:05:06,970 --> 00:05:08,810 చాలా సందర్భాలలో. 106 00:05:08,810 --> 00:05:13,220 మీరు అనుకుంటున్నాను చేస్తుంది అని బహుశా ఏ జరుగుతుందని మీరు, మీ జీవితం ద్వారా ఉంది 107 00:05:13,220 --> 00:05:17,410 కేవలం మరింత ఉంచేందుకు వాక్యాలు మీకు చెప్పారు. 108 00:05:17,410 --> 00:05:19,800 ఆపై మీరు గుర్తుంచుకోవడం ఉంచడానికి వాక్యాలు అన్ని. 109 00:05:19,800 --> 00:05:24,230 ఆపై దా ఏదో, మీరు ఆ వాక్యం వింటే 110 00:05:24,230 --> 00:05:27,040 మీరు మీ పదజాలం చూడండి వాక్యాలు మరియు ఒకవేళ చూడండి 111 00:05:27,040 --> 00:05:28,270 ఆ వాక్యంలో ఉంది. 112 00:05:28,270 --> 00:05:29,830 మరియు అది అక్కడ మీరు ఉంటే ఇది వ్యాకరణ చెప్పాలి. 113 00:05:29,830 --> 00:05:31,740 అలా కాకపోతే మీరు చెప్పాలి వ్యాకరణం. 114 00:05:31,740 --> 00:05:35,150 >> కాబట్టి, ఆ సందర్భంలో, మీరు, OH, చెబుతా కాబట్టి మీరు అన్ని భారీ జాబితా కలిగి 115 00:05:35,150 --> 00:05:36,140 సాధ్యం వాక్యాలు. 116 00:05:36,140 --> 00:05:38,240 ఆపై మీరు ఒక వాక్యం విన్నప్పుడు, ఇది వ్యాకరణ లేదా మీకు 117 00:05:38,240 --> 00:05:39,450 ఆధారంగా కాదు. 118 00:05:39,450 --> 00:05:42,360 విషయం మీరు చూడండి ఒక వాక్యం, ఉదాహరణకు, " 119 00:05:42,360 --> 00:05:47,540 ఐదు తలల CS50 TFS బ్లైండ్ వండిన ఒక డాపా కప్పులో ఉపయోగించి ఆక్టోపస్. "ఇది 120 00:05:47,540 --> 00:05:49,630 ఖచ్చితంగా కాదు ఒక వాక్యం మీరు ముందు విన్న. 121 00:05:49,630 --> 00:05:52,380 కానీ అదే సమయంలో మీరు తెలుసు కుడి, వ్యాకరణ చాలా చక్కని? 122 00:05:52,380 --> 00:05:55,570 ఎటువంటి వ్యాకరణ తప్పులు ఉన్నాయి మరియు మీరు చెప్పగలదు 123 00:05:55,570 --> 00:05:57,020 ఇది సాధ్యమయ్యే వాక్యం ఉంది. 124 00:05:57,020 --> 00:06:01,300 >> కనుక ఇది వలెనే చేస్తుంది నిజానికి మేము భాష నేర్చుకోవడానికి ఆ విధంగా మాత్రమే ఉంది 125 00:06:01,300 --> 00:06:07,090 సాధ్యం భారీ డేటాబేస్ ద్వారా పదాలు లేదా వాక్యాలు, కానీ మరింత 126 00:06:07,090 --> 00:06:11,490 మధ్య చేసుకోవడం ఆ వాక్యాలు పదాలు. 127 00:06:11,490 --> 00:06:14,570 అర్ధవంతం లేదు? 128 00:06:14,570 --> 00:06:19,370 కాబట్టి, అప్పుడు ఆ ప్రశ్న, అనేది కంప్యూటర్లు భాషలను నేర్చుకోవడానికి? 129 00:06:19,370 --> 00:06:21,490 మేము కంప్యూటర్లకు భాషను బోధించడానికి? 130 00:06:21,490 --> 00:06:24,230 >> కాబట్టి, యొక్క తేడా అనుకుంటున్నాను తెలియజేయండి ఒక భాష యొక్క స్థానిక స్పీకర్ మధ్య 131 00:06:24,230 --> 00:06:25,460 మరియు ఒక కంప్యూటర్. 132 00:06:25,460 --> 00:06:27,340 కాబట్టి, ఏ స్పీకర్ ఏమవుతుంది? 133 00:06:27,340 --> 00:06:30,430 బాగా, స్థానిక స్పీకర్ ఒక తెలుసుకుంటాడు ఇది బహిర్గతం నుండి భాష. 134 00:06:30,430 --> 00:06:34,200 సాధారణంగా దాని ప్రారంభ బాల్య. 135 00:06:34,200 --> 00:06:38,570 కాబట్టి, ప్రాథమికంగా, మీరు ఒక శిశువు కలిగి మరియు మీరు మాట్లాడుతూ ఉంచండి, మరియు అది 136 00:06:38,570 --> 00:06:40,540 కేవలం మాట్లాడటం ఎలా తెలుసుకుంటాడు భాష, కుడి? 137 00:06:40,540 --> 00:06:42,660 కాబట్టి, మీరు ప్రధానంగా ఇవ్వడం చేస్తున్నారు బిడ్డకు ఇన్పుట్. 138 00:06:42,660 --> 00:06:45,200 కాబట్టి, మీరు వాదిస్తారు ఒక కంప్యూటర్ కుడి, ఇదే? 139 00:06:45,200 --> 00:06:49,510 మీరు భాష ఇస్తుంది కంప్యూటర్కు ఇన్పుట్గా. 140 00:06:49,510 --> 00:06:53,410 >> ఉదాహరణకు వంటి ఫైళ్లను కొంత ఆంగ్ల పుస్తకాలు కలిగి. 141 00:06:53,410 --> 00:06:56,190 బహుశా ఒక మార్గం మీరు ఆ బహుశా ఒక నేర్పే 142 00:06:56,190 --> 00:06:57,850 కంప్యూటర్ ఇంగ్లీష్, కుడి? 143 00:06:57,850 --> 00:07:01,000 నిజానికి, మీరు దాని గురించి అనుకుంటే, ఇది బహుశా రెండు వెళ్తుంది 144 00:07:01,000 --> 00:07:02,680 ఒక పుస్తకం చదవడానికి రోజుల. 145 00:07:02,680 --> 00:07:05,760 ఒక కంప్యూటర్, దీనిని రెండవ పడుతుంది ఒక పుస్తకంలో అన్ని పదాలు చూడండి. 146 00:07:05,760 --> 00:07:10,810 కాబట్టి మీరు ఆ ఉండవచ్చు ఆలోచించవచ్చు ఈ మీరు చుట్టూ నుండి ఇన్పుట్ వాదన, 147 00:07:10,810 --> 00:07:15,440 ఆ ఆ వజిరిస్తాన్ కాదు మానవుల చేయవచ్చు ఏదో. 148 00:07:15,440 --> 00:07:17,680 మీరు కంప్యూటర్లు ఆలోచించవచ్చు ముడిసరకుల పొందవచ్చు. 149 00:07:17,680 --> 00:07:21,170 >> రెండవ విషయం స్థానిక స్పీకర్లు కూడా ఒక మెదడు కలిగి 150 00:07:21,170 --> 00:07:23,870 భాష, శిక్షణ సామర్ధ్యం. 151 00:07:23,870 --> 00:07:27,020 కానీ మీరు దాని గురించి అనుకుంటే, ఒక మెదడు ఘన విషయం. 152 00:07:27,020 --> 00:07:30,450 మీరు పుట్టినప్పుడు, ఇది ఇప్పటికే సెట్ - 153 00:07:30,450 --> 00:07:31,320 ఈ మీ మెదడు ఉంది. 154 00:07:31,320 --> 00:07:34,660 మీరు అప్ పెరుగుతాయి మరియు, మీరు కేవలం మరింత భాష యొక్క ఇన్పుట్ మరియు ఉండవచ్చు పోషకాలు 155 00:07:34,660 --> 00:07:35,960 మరియు ఇతర విషయాలను. 156 00:07:35,960 --> 00:07:38,170 కానీ చాలా చక్కని మీ మెదడు ఘన విషయం. 157 00:07:38,170 --> 00:07:41,290 >> కాబట్టి మీరు అదే, బహుశా మీరు చెయ్యవచ్చు, చెప్పగలను ఒక బంచ్ కలిగి కంప్యూటర్ నిర్మించడానికి 158 00:07:41,290 --> 00:07:45,890 విధులు మరియు కేవలం అనుకరించే పద్ధతులు భాష, శిక్షణ సామర్ధ్యం. 159 00:07:45,890 --> 00:07:49,630 ఈ కోణంలో, మీరు నేను, బాగా, చెప్పగల్గినవి అన్ని కలిగి ఒక కంప్యూటర్ కలిగి 160 00:07:49,630 --> 00:07:52,270 నేను భాష నేర్చుకోవడానికి అవసరం విషయాలు. 161 00:07:52,270 --> 00:07:56,200 మరియు చివరి విషయం ఒక స్థానిక స్పీకర్ విచారణ మరియు లోపం తెలుసుకుంటాడు. 162 00:07:56,200 --> 00:08:01,090 కాబట్టి ప్రాథమికంగా మరొక ముఖ్యమైన విషయం లో భాష, శిక్షణ అని మీరు రకమైన 163 00:08:01,090 --> 00:08:05,340 యొక్క ద్వారా విషయాలు తెలుసుకోవడానికి మీరు విన్నది సాధారణీకరణలుగా. 164 00:08:05,340 --> 00:08:10,280 >> మీరు పెరుగుతూ ఉంటాయి వంటి మీరు తెలుసుకొని కొన్ని పదాలు నామవాచకాలు వంటి ఉంటాయి, 165 00:08:10,280 --> 00:08:11,820 కొన్ని ఇతర వాటిని నిఘంటువు ఉంటాయి. 166 00:08:11,820 --> 00:08:14,250 మరియు మీరు ఏ కలిగి లేదు భాషాశాస్త్ర జ్ఞానం 167 00:08:14,250 --> 00:08:15,040 అర్థం. 168 00:08:15,040 --> 00:08:18,560 కానీ మీరు కొన్ని పదాలు ఉంది తెలుసు కొంత స్థానము 169 00:08:18,560 --> 00:08:22,570 వాక్యం మరియు ఇతర కొన్ని ఇతరులు వాక్యం భాగాలు. 170 00:08:22,570 --> 00:08:26,110 >> మరియు మీరు అని ఏదో చేసినప్పుడు సరైన కాదని ఒక వాక్యం వంటి - 171 00:08:26,110 --> 00:08:28,770 ఎందుకంటే ఒక ఓవర్ పర్యవసానం యొక్క ఉదాహరణకు. 172 00:08:28,770 --> 00:08:32,210 మీరు అప్ పెరుగుతున్న చేసినప్పుడు బహుశా, మీరు గమనించి బహువచనం సాధారణంగా అని 173 00:08:32,210 --> 00:08:35,809 వద్ద ఒక S పెడతాడు ఏర్పాటు పదం యొక్క చివరి. 174 00:08:35,809 --> 00:08:40,042 ఆపై మీరు బహువచన చేయడానికి ప్రయత్నించండి "Deers" లేదా "టూత్" వంటి "జింక" 175 00:08:40,042 --> 00:08:44,780 "Tooths." కాబట్టి అప్పుడు మీ తల్లిదండ్రులు లేదా ఎవరైనా మీరు సరిచేస్తున్న మరియు, ఏ, 176 00:08:44,780 --> 00:08:49,020 "జింక" యొక్క బహువచన ", జింక" మరియు "టూత్" యొక్క బహువచన "పళ్ళు." ఉంది ఆపై 177 00:08:49,020 --> 00:08:50,060 ఆ విషయాలను తెలుసుకోవడానికి. 178 00:08:50,060 --> 00:08:51,520 కాబట్టి మీరు విచారణ మరియు లోపం నుండి తెలుసుకోవడానికి. 179 00:08:51,520 --> 00:08:53,100 >> కానీ మీరు కూడా చేసే ఒక కంప్యూటర్ తో. 180 00:08:53,100 --> 00:08:55,310 మీరు అని ఏదైనా కలిగి చేయవచ్చు బల అభ్యాసం. 181 00:08:55,310 --> 00:08:58,560 ఒక ఇవ్వడం వంటి రప్పించింది ఏ అది చేసినప్పుడు కంప్యూటర్ బహుమానంగా 182 00:08:58,560 --> 00:08:59,410 సరిగ్గా ఏదో. 183 00:08:59,410 --> 00:09:04,710 మరియు అది ఒక బహుమతి వ్యతిరేకం ఇవ్వడం మరియు అది ఏదో చేస్తుంది. 184 00:09:04,710 --> 00:09:07,410 మీరు నిజంగా చూడగలరు మీరు ఉంటే Google Translate మరియు మీరు ప్రయత్నించండి 185 00:09:07,410 --> 00:09:10,220 ఒక వాక్యం అనువాదం, ఇది చూడు కోసం అడుగుతుంది. 186 00:09:10,220 --> 00:09:13,240 మీరు చెప్పే చేస్తే, OH ఒక మంచి ఉంది ఈ వాక్యం కోసం అనువాద. 187 00:09:13,240 --> 00:09:18,140 అప్పుడు మీరు దానిని టైపు ఉంటే చాలా ప్రజలు ఒక మంచి ఉంది కలియ 188 00:09:18,140 --> 00:09:21,560 అనువాద, ఇది కేవలం నేర్చుకునే ఇది బదులుగా అనువాద ఉపయోగించాలి 189 00:09:21,560 --> 00:09:22,960 ఇది ఇవ్వడం జరిగినది ఒక. 190 00:09:22,960 --> 00:09:28,830 >> కాబట్టి, ఇది చాలా తాత్విక ప్రశ్న కంప్యూటర్లు ఉంటాయని చూడటానికి 191 00:09:28,830 --> 00:09:30,340 భవిష్యత్తులో మాట్లాడటానికి లేదా సామర్థ్యం. 192 00:09:30,340 --> 00:09:34,440 కానీ నేను ఎంతో విశ్వాసం కలిగి చేయవచ్చు కేవలం ఆ వాదనలు ఆధారంగా. 193 00:09:34,440 --> 00:09:38,570 కానీ ఒక తాత్విక కేవలం మరింత ప్రశ్న. 194 00:09:38,570 --> 00:09:43,460 >> కంప్యూటర్లు ఇప్పటికీ మాట్లాడను అయితే కాబట్టి, మేము చేయగల విషయాలు? 195 00:09:43,460 --> 00:09:47,070 కొన్ని నిజంగా మంచి విషయాలు ఉన్నాయి డేటా వర్గీకరణ. 196 00:09:47,070 --> 00:09:53,210 కాబట్టి, ఉదాహరణకు, మీరు అబ్బాయిలు తెలుసు ఆ ఇమెయిల్ సేవలకు, చేయండి 197 00:09:53,210 --> 00:09:55,580 ఉదాహరణకు, స్పామ్ ఫిల్టరింగ్. 198 00:09:55,580 --> 00:09:59,070 మీరు స్పామ్ అందుకుంటారు అలా చేసినప్పుడు, ఇది మరొక బాక్స్ పరిశీలించినపుడు ప్రయత్నిస్తుంది. 199 00:09:59,070 --> 00:10:00,270 కాబట్టి ఎలా ఆ చేస్తుంది? 200 00:10:00,270 --> 00:10:06,080 ఇది కంప్యూటర్ తెలుసు ఇష్టం లేదు ఏ ఇమెయిల్ చిరునామాలను స్పామ్ పంపుతున్నారు. 201 00:10:06,080 --> 00:10:09,130 కనుక ఇది మరింత కంటెంట్ ఆధారంగా సందేశం, లేదా బహుశా శీర్షిక లేదా 202 00:10:09,130 --> 00:10:11,310 బహుశా మీరు కొన్ని నమూనా. 203 00:10:11,310 --> 00:10:15,690 >> కాబట్టి, ప్రాథమికంగా, మీరు చేయవచ్చు పొందండి ఉంది ఒక స్పామ్ ఇమెయిళ్ళు డేటా చాలా, 204 00:10:15,690 --> 00:10:19,980 స్పామ్ కాదు, మరియు తెలుసుకోవడానికి ఇమెయిళ్ళను ఏమి మీరు కలిగి విధానాల రకం 205 00:10:19,980 --> 00:10:21,000 స్పామ్ అని వాటిని. 206 00:10:21,000 --> 00:10:23,260 మరియు ఈ గణన భాగం భాషాశాస్త్రం. 207 00:10:23,260 --> 00:10:24,720 ఇది డేటా వర్గీకరణ అని. 208 00:10:24,720 --> 00:10:28,100 మరియు మేము నిజంగా చూడండి చూడాలని ఒక తదుపరి స్లయిడ్లను ఆ ఉదాహరణకు. 209 00:10:28,100 --> 00:10:32,910 >> రెండవ విషయం సహజ భాష విషయం ఇది ప్రాసెసింగ్ ఆ 210 00:10:32,910 --> 00:10:36,580 గ్రాఫ్ శోధన తెలియజేసినందుకు చేస్తోంది మీరు ఒక వాక్యం రాయడం. 211 00:10:36,580 --> 00:10:38,690 మరియు మీరు అర్థం ట్రస్ట్స్ ఏమి అర్థం మరియు ఇస్తుంది 212 00:10:38,690 --> 00:10:39,940 మీరు ఉత్తమ ఫలితాన్ని. 213 00:10:39,940 --> 00:10:43,880 అసలైన, మీరు Google లేదా Bing వెళ్ళండి ఉంటే మరియు మీరు లేడీ లాగ అన్వేషణ 214 00:10:43,880 --> 00:10:47,060 గాగా యొక్క ఎత్తు, మీరు నిజంగా చూడాలని బదులుగా సమాచార 5 '1 "ను 215 00:10:47,060 --> 00:10:50,170 నిజానికి అర్థం ఎందుకంటే ఆమె నుండి మీరు గురించి మాట్లాడటం ఏమి. 216 00:10:50,170 --> 00:10:52,140 కాబట్టి ఆ సహజ భాగం భాష ప్రాసెసింగ్. 217 00:10:52,140 --> 00:10:57,000 >> లేదా కూడా మీరు మొదటి, సిరి ఉపయోగించి చేసినప్పుడు మీరు ప్రయత్నిస్తుంది ఒక అల్గోరిథం 218 00:10:57,000 --> 00:11:01,130 మీరు చెబుతున్న ఏ అనువదించు పదాలు, టెక్స్ట్ లో. 219 00:11:01,130 --> 00:11:03,690 అది అనువదించడానికి ప్రయత్నిస్తుంది ఆ అర్థంపై. 220 00:11:03,690 --> 00:11:06,570 కాబట్టి అన్ని సహజ భాగం భాష ప్రాసెసింగ్. 221 00:11:06,570 --> 00:11:08,320 >> అప్పుడు మీరు యాంత్రిక అనువాద కలిగి - 222 00:11:08,320 --> 00:11:10,300 నిజానికి ఒకటి ఇది నా ఇష్టాలు - 223 00:11:10,300 --> 00:11:14,060 కేవలం నుండి అందించడంలో నాయకత్వం మరొక ఒక భాష. 224 00:11:14,060 --> 00:11:17,950 కాబట్టి మీరు మీరు చేస్తున్న ఆ ఆలోచించవచ్చు యంత్ర అనువాదం, మీరు 225 00:11:17,950 --> 00:11:19,750 శిక్షల అనంతం అవకాశాలు. 226 00:11:19,750 --> 00:11:22,960 కాబట్టి కేవలం నిల్వ మార్గమే లేదు ప్రతి అనువాద. 227 00:11:22,960 --> 00:11:27,440 కాబట్టి మీరు ఆసక్తికరమైన ఆలోచన ఉంటుంది అల్గోరిథంలు చెయ్యడానికి 228 00:11:27,440 --> 00:11:30,110 ప్రతి అనువాదం కొన్ని విధంగా వాక్యం. 229 00:11:30,110 --> 00:11:32,483 >> మీరు అబ్బాయిలు ఇప్పటివరకు ఏ ప్రశ్నలు? 230 00:11:32,483 --> 00:11:34,450 ఏ? 231 00:11:34,450 --> 00:11:34,830 OK. 232 00:11:34,830 --> 00:11:36,900 >> కాబట్టి మనం ఈ రోజు చూస్తున్నది వెళ్తున్నారు? 233 00:11:36,900 --> 00:11:39,300 అన్ని మొదటి, నేను గురించి చర్చ వెళుతున్న వర్గీకరణ సమస్య. 234 00:11:39,300 --> 00:11:41,440 నేను అని ఒక స్పామ్ గురించి మాట్లాడుతూ. 235 00:11:41,440 --> 00:11:46,820 నా వెళుతున్న ఇచ్చిన సాహిత్యం, ఉంది ఒక పాట, మీరు గుర్తించడానికి ప్రయత్నించవచ్చు 236 00:11:46,820 --> 00:11:49,810 అధిక సంభావ్యత తో గాయకుడు ఎవరు? 237 00:11:49,810 --> 00:11:53,590 యొక్క నేను లేడీ నుండి పాటలు అని చెప్పారు ఆ గాగా మరియు కాటి పెర్రీ, నేను మీరు ఒక ఇవ్వాలని ఉంటే 238 00:11:53,590 --> 00:11:58,130 కొత్త పాట, మీరు గుర్తించడానికి లేదో ఇది కాటి పెర్రీ లేదా లేడీ గాగా ఉంది? 239 00:11:58,130 --> 00:12:01,490 >> రెండవ, నేను చర్చ వెళుతున్న విభజన సమస్య గురించి. 240 00:12:01,490 --> 00:12:05,780 నేను మీరు అబ్బాయిలు తెలుసు తెలుసు, కానీ లేదు , చైనీస్ జపనీస్, ఇతర తూర్పు ఆసియా 241 00:12:05,780 --> 00:12:08,090 భాషలు, మరియు ఇతర భాషలు సాధారణంగా, లేదు 242 00:12:08,090 --> 00:12:09,830 పదాల మధ్య స్పేస్. 243 00:12:09,830 --> 00:12:13,540 ఆపై మీరు ఆ విధంగా గురించి అనుకుంటే ప్రయత్నాలు మీ కంప్యూటర్ రకమైన 244 00:12:13,540 --> 00:12:18,600 సహజ భాషా సంవిధానం అర్థం, ఇది పదాలు చూసి 245 00:12:18,600 --> 00:12:21,500 సంబంధాలు అర్థం చేసుకునేందుకు ప్రయత్నించే వాటి మధ్య, కుడి? 246 00:12:21,500 --> 00:12:25,440 కానీ మీరు చైనీస్, మరియు ఉంటే సున్నా ఖాళీలు, ఇది కష్టం నిజంగా ఉంది 247 00:12:25,440 --> 00:12:28,360 మధ్య సంబంధం ఏమిటి కనుగొనేందుకు పదాలు, ఎందుకంటే వారు ఏ లేదు 248 00:12:28,360 --> 00:12:29,530 మొదటి వద్ద పదాలు. 249 00:12:29,530 --> 00:12:32,600 కాబట్టి మీరు అని ఏదో ఒకటి ఉంటుంది కేవలం ఉంచడం అంటే సెగ్మెంటేషన్ 250 00:12:32,600 --> 00:12:36,490 మేము కాల్ భావిస్తున్న ఏ మధ్య స్పేస్ ఆయా భాషలలో పదాలు. 251 00:12:36,490 --> 00:12:37,740 సమంజసం? 252 00:12:37,740 --> 00:12:39,680 253 00:12:39,680 --> 00:12:41,540 >> మరియు తర్వాత మేము చూడాలని వాక్యనిర్మాణం గురించి మాట్లాడటానికి. 254 00:12:41,540 --> 00:12:44,050 సహజ గురించి కాబట్టి కేవలం కొద్దిగా భాష ప్రాసెసింగ్. 255 00:12:44,050 --> 00:12:45,420 ఇది కేవలం ఒక అవలోకనం చేస్తాడు. 256 00:12:45,420 --> 00:12:50,700 కనుక ఈ రోజు, ప్రధానంగా నేను మీరు ఏమి అబ్బాయిలు మీరు ఒక యొక్క కొద్దిగా ఇవ్వాలని ఉంది 257 00:12:50,700 --> 00:12:53,930 అవకాశాలను ఏమిటో లోపలి మీరు గణన తో చేసే 258 00:12:53,930 --> 00:12:54,960 భాషాశాస్త్రం. 259 00:12:54,960 --> 00:13:00,410 మరియు మీరు ఏమనుకుంటున్నారో చూడగలరు ఆ విషయాలు బాగుంది. 260 00:13:00,410 --> 00:13:02,270 మరియు ఉండవచ్చు మీరు ఒక ప్రాజెక్ట్ ఆలోచించవచ్చు నాకు మాట్లాడిన వస్తాయి. 261 00:13:02,270 --> 00:13:05,260 నేను మీరు సలహాను ఇది అమలు ఎలా. 262 00:13:05,260 --> 00:13:09,060 >> కాబట్టి వాక్యనిర్మాణం కొద్దిగా అన్నారు గ్రాఫ్ శోధన మరియు యంత్రం గురించి 263 00:13:09,060 --> 00:13:09,670 అనువాద. 264 00:13:09,670 --> 00:13:13,650 నేను ఎలా ఒక ఉదాహరణ ఇవ్వాలని వెళుతున్న మీరు, ఉదాహరణకు, అనువదించు కాలేదు 265 00:13:13,650 --> 00:13:16,020 ఇంగ్లీష్ పోర్చుగీసు ఏదో. 266 00:13:16,020 --> 00:13:17,830 మంచిది? 267 00:13:17,830 --> 00:13:19,293 >> కాబట్టి మొదటి, వర్గీకరణ సమస్య. 268 00:13:19,293 --> 00:13:23,590 నేను చెప్పడానికి మేము సదస్సు యొక్క ఈ భాగం చాలా సవాలు అన్నారు 269 00:13:23,590 --> 00:13:27,560 ఒక జరగబోతోంది కనుక కొన్ని కోడింగ్ ఉండాలి. 270 00:13:27,560 --> 00:13:29,470 కానీ పైథాన్ చేస్తాడు. 271 00:13:29,470 --> 00:13:34,380 నేను మీరు అబ్బాయిలు పైథాన్ తెలుసు, కాబట్టి లేదు తెలుసు నేను హై వివరించడానికి వెళుతున్న 272 00:13:34,380 --> 00:13:35,750 నేను ఏ స్థాయి. 273 00:13:35,750 --> 00:13:40,900 మరియు మీరు చాలా నిజంగా లేదు ఆ ఎందుకంటే సింటాక్స్ గురించి చాలా 274 00:13:40,900 --> 00:13:42,140 మీరు అబ్బాయిలు తెలుసుకోవచ్చు ఏదో. 275 00:13:42,140 --> 00:13:42,540 OK? 276 00:13:42,540 --> 00:13:43,580 మంచిది. 277 00:13:43,580 --> 00:13:46,020 >> కాబట్టి వర్గీకరణ సమస్య ఏమిటి? 278 00:13:46,020 --> 00:13:49,140 కాబట్టి మీరు కొన్ని సాహిత్యం ఇచ్చిన చేస్తున్నారు ఒక పాట, మరియు మీరు అంచనా కావలసిన 279 00:13:49,140 --> 00:13:50,620 ఎవరు గానాన్ని. 280 00:13:50,620 --> 00:13:54,045 మరియు ఈ ఎలాంటి ఉంటుంది ఇతర సమస్యలు. 281 00:13:54,045 --> 00:13:59,980 కనుక ఇది, ఉదాహరణకు, మీరు ఒక కలిగి చేయవచ్చు అధ్యక్ష ప్రచారం మరియు మీరు ఒక కలిగి 282 00:13:59,980 --> 00:14:02,610 ప్రసంగం, మరియు మీరు కావలసిన ఇది బయటకు ఉంటే, ఉదాహరణకు, 283 00:14:02,610 --> 00:14:04,470 ఒబామా లేదా మిట్ రోమ్నీ. 284 00:14:04,470 --> 00:14:07,700 లేదా మీరు ఇమెయిళ్ళు కొంత వెళ్లిపోతున్నారు మీరు వారు ఉంటే గుర్తించడానికి కావలసిన 285 00:14:07,700 --> 00:14:08,890 స్పామ్ లేదా. 286 00:14:08,890 --> 00:14:11,440 కనుక ఇది కొన్ని వర్గీకరించడం లో పదాలు ఆధారంగా డేటా 287 00:14:11,440 --> 00:14:13,790 మీరు అక్కడ ఆ. 288 00:14:13,790 --> 00:14:16,295 >> కాబట్టి ఆ చేయడానికి, మీరు ఉంటుంది కొన్ని అంచనాలు తయారు. 289 00:14:16,295 --> 00:14:20,570 కాబట్టి కంప్యుటేషనల్ లింగ్విస్టిక్స్ గురించి చాలా అంచనాలు తయారు, 290 00:14:20,570 --> 00:14:24,100 సాధారణంగా స్మార్ట్ అంచనాలు, కాబట్టి మీరు మంచి ఫలితాలను పొందవచ్చు. 291 00:14:24,100 --> 00:14:26,670 ఇది ఒక మోడల్ సృష్టించడానికి ప్రయత్నిస్తున్నప్పుడు. 292 00:14:26,670 --> 00:14:31,290 ఆపై, దీనిని ప్రయత్నించి ఇది పని చేస్తే చూడండి మీరు మంచి ఖచ్చితత్వము ఇస్తుంది. 293 00:14:31,290 --> 00:14:33,940 మరియు అది ఉంటే, అప్పుడు మీరు ఇది మెరుగుపరచడానికి ప్రయత్నించండి. 294 00:14:33,940 --> 00:14:37,640 ఇది, మీరు, OK, వంటి ఉన్నాము పోతే నేను వేరే ఊహ ఉండాలి. 295 00:14:37,640 --> 00:14:44,030 >> కాబట్టి మేము చూడాలని ఆ భావన తయారు ఒక కళాకారుడు సాధారణంగా పాడాడు ఉంది 296 00:14:44,030 --> 00:14:49,220 బహుశా గురించి ఒక అంశం అనేకసార్లు మరియు పదాలు అనేకసార్లు ఉపయోగించే కేవలం 297 00:14:49,220 --> 00:14:50,270 అవి ఉపయోగించే ఎందుకంటే. 298 00:14:50,270 --> 00:14:51,890 మీరు కేవలం మీ స్నేహితుడికి ఆలోచించవచ్చు. 299 00:14:51,890 --> 00:14:57,350 నేను మీరు అబ్బాయిలు అన్ని స్నేహితులు ఖచ్చితంగా అనుకుంటున్నాను , వారి సంతకం పదబంధం పేర్కొన్నట్లు 300 00:14:57,350 --> 00:14:59,260 అక్షరాలా ప్రతి వాక్యం కోసం - 301 00:14:59,260 --> 00:15:02,660 కొన్ని నిర్దిష్ట పదం లేదా కొన్ని నిర్దిష్ట వంటి వారు పేర్కొన్నట్లు పదబంధం 302 00:15:02,660 --> 00:15:04,020 ప్రతి వాక్యం. 303 00:15:04,020 --> 00:15:07,920 >> మరియు మీరు చెప్పగలను అని మీరు చూసినట్లయితే ఒక సంతకం గల ఒక వాక్యం 304 00:15:07,920 --> 00:15:11,450 పదబంధం, మీరు అంచనా బహుశా మీ స్నేహితుడు 305 00:15:11,450 --> 00:15:13,310 ఒక కుడి, చెప్పడం? 306 00:15:13,310 --> 00:15:18,410 కాబట్టి మీరు ఆ ఊహ మరియు మీరు ఒక నమూనా సృష్టించడానికి ఎలా. 307 00:15:18,410 --> 00:15:24,440 >> నేను ఇవ్వాలని వెళుతున్న ఉదాహరణకు ఉంది ఎలా లేడీ గాగా, ఉదాహరణకు, ప్రజలు 308 00:15:24,440 --> 00:15:27,430 ఆమె కోసం "బేబీ" ఉపయోగించే చెప్పటానికి అన్ని ఆమె ప్రథమ పాటలు. 309 00:15:27,430 --> 00:15:32,270 మరియు వాస్తవానికి ఈ ఒక వీడియో అని ప్రదర్శనలు ఆమె పదం "బేబీ" చెప్పడం 310 00:15:32,270 --> 00:15:33,410 వివిధ పాటలు. 311 00:15:33,410 --> 00:15:33,860 >> [వీడియో ప్లేబ్యాక్] 312 00:15:33,860 --> 00:15:34,310 >> - (SINGING) బేబీ. 313 00:15:34,310 --> 00:15:36,220 బేబీ. 314 00:15:36,220 --> 00:15:37,086 బేబీ. 315 00:15:37,086 --> 00:15:37,520 బేబీ. 316 00:15:37,520 --> 00:15:37,770 బేబీ. 317 00:15:37,770 --> 00:15:38,822 బేబ్. 318 00:15:38,822 --> 00:15:39,243 బేబీ. 319 00:15:39,243 --> 00:15:40,085 బేబీ. 320 00:15:40,085 --> 00:15:40,510 బేబీ. 321 00:15:40,510 --> 00:15:40,850 బేబీ. 322 00:15:40,850 --> 00:15:41,090 >> [END వీడియో ప్లేబ్యాక్- 323 00:15:41,090 --> 00:15:44,020 >> LUCAS Freitas: కాబట్టి, నేను, ఉన్నాయి ఆమె చెప్పారు దీనిలో ఇక్కడ 40 పాటలు 324 00:15:44,020 --> 00:15:48,690 పదం "బేబీ." కాబట్టి మీరు ప్రధానంగా అంచనా మీరు కలిగి ఒక పాట చూడండి 325 00:15:48,690 --> 00:15:52,180 పదం "బేబీ," కొన్ని అధిక ఉంది ఇది లేడీ గాగా ఉంది సంభావ్యత. 326 00:15:52,180 --> 00:15:56,450 కానీ యొక్క ఈ అభివృద్ధి ప్రయత్నించండి మరింత అధికారికంగా. 327 00:15:56,450 --> 00:16:00,470 >> కాబట్టి ఈ ద్వారా పాటలకు సాహిత్యాన్ని ఉంటాయి లేడీ గాగా మరియు కాటి పెర్రీ. 328 00:16:00,470 --> 00:16:04,120 కాబట్టి మీరు లేడీ గాగా చూడండి, మీరు వారు చూడండి సంఘటనలు చాలా ఉన్నాయి "బేబీ," ఒక 329 00:16:04,120 --> 00:16:07,710 ఏర్పడడం చాలా "మార్గం." ఆపై కాటి పెర్రీ ఏర్పడడం చాలా ఉంది 330 00:16:07,710 --> 00:16:10,360 "," ఏర్పడడం చాలా "అగ్ని." 331 00:16:10,360 --> 00:16:14,560 >> ప్రధానంగా మేము ఏమి మీరు ఒక గీత పొందండి. 332 00:16:14,560 --> 00:16:20,480 యొక్క మీరు ఒక కోసం ఒక గీత పొందుటకు చెప్తారు లెట్ ", బేబీ" కేవలం "బేబీ." అని పాట అయితే 333 00:16:20,480 --> 00:16:24,750 మీరు పదం "బేబీ," మరియు ఈ పొందండి మీరు నుండి అన్ని డేటా ఉంది 334 00:16:24,750 --> 00:16:27,880 లేడీ గాగా మరియు కాటి పెర్రీ, ఎవరు మీరు అంచనా ఉంది వ్యక్తి 335 00:16:27,880 --> 00:16:29,370 ఎవరు పాట పాడాడు? 336 00:16:29,370 --> 00:16:32,360 లేడీ గాగా లేదా కాటి పెర్రీ? 337 00:16:32,360 --> 00:16:33,150 లేడీ గాగా, కుడి? 338 00:16:33,150 --> 00:16:37,400 ఆమె చెప్పింది మాత్రమే ఒకటి ఎందుకంటే "బిడ్డ." ఈ కుడి, గ్రీన్ టీ? 339 00:16:37,400 --> 00:16:38,760 సరే, ఈ నిజంగా సులభం. 340 00:16:38,760 --> 00:16:41,860 నేను కేవలం రెండు పాటలు మరియు యొక్క చూస్తున్నాను అయితే, ఆమె కలిగిన మాత్రమే ఒకటి 341 00:16:41,860 --> 00:16:42,660 "బిడ్డ." 342 00:16:42,660 --> 00:16:44,740 >> కానీ మీరు పదాల కొంత కలిగి ఉంటే? 343 00:16:44,740 --> 00:16:50,900 మీరు ఒక వాస్తవిక గీత, ఏదైనా కలిగి ఉంటే వంటి, "అమ్మాయిలూ కేవలం 344 00:16:50,900 --> 00:16:51,610 ఒక [చూడటానికి వెళ్ళాను? CFT?] 345 00:16:51,610 --> 00:16:54,020 ఉపన్యాసం, "లేదా అలాంటిదే, మరియు అప్పుడు మీరు నిజంగా గుర్తించడానికి కలిగి - 346 00:16:54,020 --> 00:16:55,780 అన్ని ఆ పదాలు ఆధారంగా - 347 00:16:55,780 --> 00:16:58,350 కళాకారుల అయిన బహుశా ఈ పాట పాడారు? 348 00:16:58,350 --> 00:17:01,860 కాబట్టి యొక్క అభివృద్ధి ప్రయత్నించండి కొద్దిగా మరింత ఈ. 349 00:17:01,860 --> 00:17:05,630 >> OK, కాబట్టి కేవలం డేటా ఆధారంగా మేము వచ్చింది, ఇది గాగా బహుశా అని తెలుస్తోంది 350 00:17:05,630 --> 00:17:06,260 గాయకుడు. 351 00:17:06,260 --> 00:17:07,904 కానీ మేము ఎలా వ్రాయగలవు ఈ అధికారికంగా? 352 00:17:07,904 --> 00:17:10,579 353 00:17:10,579 --> 00:17:13,140 కొంతసేపైన ఉన్నట్లు జరగబోతోంది గణాంకాలు బిట్. 354 00:17:13,140 --> 00:17:15,880 కాబట్టి మీరు కోల్పోతాయి ఉంటే, కేవలం ప్రయత్నించండి భావన అర్థం. 355 00:17:15,880 --> 00:17:18,700 మీరు అర్థం ఉంటే అది పెద్ద విషయం కాదు సమీకరణాలు చక్కగా. 356 00:17:18,700 --> 00:17:22,150 ఈ అన్ని ఆన్లైన్ అన్నారు. 357 00:17:22,150 --> 00:17:25,490 >> కాబట్టి ప్రాథమికంగా నేను లెక్క వెబ్ ఉంది ఈ పాట ద్వారా ఉంటుంది సంభావ్యత 358 00:17:25,490 --> 00:17:28,040 లేడీ గాగా ఇచ్చిన - 359 00:17:28,040 --> 00:17:30,660 ఈ బార్ ఇచ్చిన అర్థం - 360 00:17:30,660 --> 00:17:33,680 నేను పదం చూసిన "బేబీ." అర్ధవంతం లేదు? 361 00:17:33,680 --> 00:17:35,540 నేను లెక్కించేందుకు ప్రయత్నిస్తున్నాను సంభావ్యత. 362 00:17:35,540 --> 00:17:38,540 >> కాబట్టి అని ఈ సిద్ధాంతం ఉంది అని చెప్పాడు బేయిస్ సిద్ధాంతం 363 00:17:38,540 --> 00:17:43,330 ఇవ్వబడిన B యొక్క సంభావ్యత, ఉంది ఒక, సార్లు ఇవ్వబడిన B యొక్క సంభావ్యత 364 00:17:43,330 --> 00:17:47,660 సంభావ్యత కంటే సంభావ్యత, B. ఈ సుదీర్ఘ సమీకరణం ఉంది. 365 00:17:47,660 --> 00:17:51,970 కానీ మీరు నుండి అర్థం ఉంటుంది ఈ నేను మీరు ఏమి ఉంది 366 00:17:51,970 --> 00:17:52,830 కుడి, లెక్కించేందుకు? 367 00:17:52,830 --> 00:17:56,570 ఆ పాట ద్వారా కాబట్టి సంభావ్యత లేడీ గాగా నేను పదం చూసిన ఇచ్చిన 368 00:17:56,570 --> 00:17:58,230 "బిడ్డ." 369 00:17:58,230 --> 00:18:02,960 >> ఇప్పుడు నేను పొందుతున్నాను ఉంది ఇచ్చిన పదం "బేబీ" సంభావ్యత 370 00:18:02,960 --> 00:18:04,390 నేను లేడీ గాగా కలిగి. 371 00:18:04,390 --> 00:18:07,220 మరియు ప్రాథమికంగా ఏమిటి? 372 00:18:07,220 --> 00:18:10,500 సాధనాలు ఏమిటి, ఏమిటి పదం "బేబీ" చూసిన సంభావ్యత 373 00:18:10,500 --> 00:18:12,130 గాగా సాహిత్యం లో? 374 00:18:12,130 --> 00:18:16,240 నేను చాలా ఆ లెక్కించేందుకు సాధారణ మార్గం, ఇది కేవలం సంఖ్య ఉంది 375 00:18:16,240 --> 00:18:23,640 సార్లు నేను మొత్తం మీద "బేబీ" చూడండి గాగా సాహిత్యం పదాలు, కుడి? 376 00:18:23,640 --> 00:18:27,600 నేను చూసే ఫ్రీక్వెన్సీ ఏమిటి గాగా యొక్క పని లో ఆ పదం? 377 00:18:27,600 --> 00:18:30,530 సమంజసం? 378 00:18:30,530 --> 00:18:33,420 >> రెండవ పదం గాగా సంభావ్యత. 379 00:18:33,420 --> 00:18:34,360 ఆ అర్థం ఏమిటి? 380 00:18:34,360 --> 00:18:38,550 ప్రాథమికంగా అర్థం, ఏమిటి వర్గీకరించడం సంభావ్యత 381 00:18:38,550 --> 00:18:40,690 గాగా వంటి కొన్ని సాహిత్యం? 382 00:18:40,690 --> 00:18:45,320 మరియు ఆ రకమైన అసహజ, కానీ యొక్క ఒక ఉదాహరణ అనుకుంటున్నాను తెలియజేయండి. 383 00:18:45,320 --> 00:18:49,230 కాబట్టి యొక్క అని పిలవబడు ఆ సంభావ్యత ఒక పాట లో "బేబీ" కలిగి ఉంటుంది 384 00:18:49,230 --> 00:18:51,760 గాగా మరియు బ్రిట్నీ స్పియర్స్ కోసం. 385 00:18:51,760 --> 00:18:54,950 కానీ బ్రిట్నీ స్పియర్స్ రెండుసార్లు లేడీ గాగా కంటే ఎక్కువ పాటలు. 386 00:18:54,950 --> 00:19:00,570 కాబట్టి ఎవరైనా కేవలం యాదృచ్ఛికంగా మీరు ఇస్తుంది మొదటి విషయం ", బిడ్డ" సాహిత్యం మీరు 387 00:19:00,570 --> 00:19:04,710 ఉంటుంది వద్ద చూడండి, సంభావ్యత ఏమిటి ఒక గాగా పాట "బేబీ" కలిగి, "బేబీ" 388 00:19:04,710 --> 00:19:05,410 ఒక బ్రిట్నీ పాట? 389 00:19:05,410 --> 00:19:06,460 మరియు అదే విషయం. 390 00:19:06,460 --> 00:19:10,040 >> కాబట్టి మీరు చూస్తారు రెండవ విషయం, ఉంది బాగా, సంభావ్యత ఏమిటి 391 00:19:10,040 --> 00:19:13,770 ద్వారా ఈ గీత, ఒక గాగా గీత ఉండటం మరియు సంభావ్యత ఏమిటి 392 00:19:13,770 --> 00:19:15,380 ఒక బ్రిట్నీ గీత ఉండటం? 393 00:19:15,380 --> 00:19:18,950 కాబట్టి బ్రిట్నీని చాలా సాహిత్యం నుంచి గాగా కంటే, మీరు బహుశా ఆ 394 00:19:18,950 --> 00:19:21,470 సే, బాగా, ఈ బహుశా ఉంది ఒక బ్రిట్నీ గీత. 395 00:19:21,470 --> 00:19:23,340 మేము ఈ కలిగి ఎందుకు కాబట్టి ఆ ఇక్కడే ఇచ్చారు. 396 00:19:23,340 --> 00:19:24,670 గాగా సంభావ్యత. 397 00:19:24,670 --> 00:19:26,950 అర్ధమే? 398 00:19:26,950 --> 00:19:28,660 అది? 399 00:19:28,660 --> 00:19:29,370 OK. 400 00:19:29,370 --> 00:19:33,500 >> మరియు చివరి కేవలం సంభావ్యత ఉంది "బిడ్డ" ఇది లేదు 401 00:19:33,500 --> 00:19:34,810 నిజంగా చాలా. 402 00:19:34,810 --> 00:19:39,940 కానీ సంభావ్యత ఉంది ఇంగ్లీష్ లో "బేబీ" చూసిన. 403 00:19:39,940 --> 00:19:42,725 మేము సాధారణంగా పట్టించుకోను ఆ పదం గురించి చాలా. 404 00:19:42,725 --> 00:19:44,490 అర్ధవంతం లేదు? 405 00:19:44,490 --> 00:19:48,110 కాబట్టి గాగా సంభావ్యత ఉంది ముందస్తు సంభావ్యత అని 406 00:19:48,110 --> 00:19:49,530 తరగతి గాగా యొక్క. 407 00:19:49,530 --> 00:19:53,840 ఇది కేవలం అర్థం ఎందుకంటే, ఏమిటి తరగతి కలిగి సంభావ్యత - 408 00:19:53,840 --> 00:19:55,520 గాగా ఇది - 409 00:19:55,520 --> 00:19:59,350 కేవలం సాధారణంగా, కేవలం ఏ పరిస్థితులు తో. 410 00:19:59,350 --> 00:20:02,560 >> ఆపై నేను సంభావ్యత ఉన్నప్పుడు "బిడ్డ," మేము కాల్ ప్లస్ ఇచ్చిన గాగా 411 00:20:02,560 --> 00:20:06,160 ఇది ఎందుకంటే ఒక సంభావ్యత Teary కలిగి సంభావ్యత 412 00:20:06,160 --> 00:20:08,300 గాగా కొన్ని ఆధారాలు ఇచ్చిన. 413 00:20:08,300 --> 00:20:11,050 నేను మీరు సాక్ష్యం ఇవ్వడం వెబ్ నేను పదం బేబీ చూసిన ఆ 414 00:20:11,050 --> 00:20:12,690 పాట తెలుస్తుంది? 415 00:20:12,690 --> 00:20:15,960 416 00:20:15,960 --> 00:20:16,410 OK. 417 00:20:16,410 --> 00:20:22,400 >> నేను లెక్కించిన అలా అయితే ప్రతి కోసం లేడీ గాగా కోసం పాటలు, 418 00:20:22,400 --> 00:20:25,916 ఆ ఉంటుంది ఏమి - 419 00:20:25,916 --> 00:20:27,730 స్పష్టంగా, నేను ఈ తరలించలేరు. 420 00:20:27,730 --> 00:20:31,850 421 00:20:31,850 --> 00:20:36,920 గాగా సంభావ్యత ఉంటుంది ఏదో వంటి, 2 24 పైగా, సార్లు 1/2, 422 00:20:36,920 --> 00:20:38,260 53 2. 423 00:20:38,260 --> 00:20:40,640 మీరు తెలిస్తే ఇది పట్టింపు లేదు ఏమి ఈ సంఖ్యలు నుండి వస్తున్నాయి. 424 00:20:40,640 --> 00:20:44,750 ఇది జరుగుతుందో కేవలం ఒక సంఖ్య కుడి, 0 కంటే ఎక్కువ ఉండాలి? 425 00:20:44,750 --> 00:20:48,610 >> ఆపై నేను కాటి పెర్రీ, చేసినప్పుడు కాటి ఇచ్చిన "బేబీ" సంభావ్యత ఉంది 426 00:20:48,610 --> 00:20:49,830 ఇప్పటికే 0, కుడి? 427 00:20:49,830 --> 00:20:52,820 ఏ "బేబీ" ఎందుకంటే కాటి పెర్రీ లో. 428 00:20:52,820 --> 00:20:56,360 కాబట్టి ఈ 0 అవుతుంది, మరియు గాగా విజయాలు, ఇది గాగా అర్థం 429 00:20:56,360 --> 00:20:57,310 బహుశా గాయకుడు. 430 00:20:57,310 --> 00:20:58,560 అర్ధవంతం లేదు? 431 00:20:58,560 --> 00:21:00,700 432 00:21:00,700 --> 00:21:01,950 OK. 433 00:21:01,950 --> 00:21:04,160 434 00:21:04,160 --> 00:21:11,750 >> నేను ఈ మరింత అధికారిక అనుకుంటే, నిజానికి ఒక మోడల్ చేయవచ్చు 435 00:21:11,750 --> 00:21:12,700 బహుళ పదాలకు. 436 00:21:12,700 --> 00:21:14,610 కాబట్టి యొక్క నేను ఏదైనా కలిగి అని పిలవబడు వంటి, "అమ్మాయిలూ am 437 00:21:14,610 --> 00:21:16,030 నిప్పు, "లేదా ఏదో. 438 00:21:16,030 --> 00:21:17,760 కనుక ఇది బహుళ పదాలు ఉంది. 439 00:21:17,760 --> 00:21:20,880 మరియు ఈ సందర్భంలో, మీరు చూడగలరు ఆ "బేబీ", గాగా లో ఉంది 440 00:21:20,880 --> 00:21:21,710 కానీ కాటి లో కాదు. 441 00:21:21,710 --> 00:21:24,940 మరియు "ఫైర్" కాటి లో ఉంది, కానీ ఇది కుడి, గాగా లో కాదు? 442 00:21:24,940 --> 00:21:27,200 కాబట్టి అది కుడి, trickier సంతరించుకోనుంది? 443 00:21:27,200 --> 00:21:31,440 అది కనిపిస్తుంది ఎందుకంటే మీరు దాదాపు రెండు మధ్య ఒక వ్యక్తి. 444 00:21:31,440 --> 00:21:36,980 >> కాబట్టి మీరు ఏమి ఉంటుంది న్యూట్రాన్ను పదాలు మధ్య స్వాతంత్ర్యం. 445 00:21:36,980 --> 00:21:41,210 కాబట్టి ప్రాథమికంగా అర్థం ఏమి ఉంది నేను ఏమి కేవలం గణన వెబ్ 446 00:21:41,210 --> 00:21:44,330 చూసిన సంభావ్యత "బేబీ," ఏమిటి చూసిన సంభావ్యత "నేను," మరియు 447 00:21:44,330 --> 00:21:46,670 ", అగ్ని" "am" మరియు "న," మరియు వేరువేరుగా. 448 00:21:46,670 --> 00:21:48,670 అప్పుడు నేను వాటిని అన్ని గుణించడం వెబ్. 449 00:21:48,670 --> 00:21:52,420 నేను సంభావ్యత ఏమిటి చూసిన వెబ్ మొత్తం వాక్యం చూసిన. 450 00:21:52,420 --> 00:21:55,210 సమంజసం? 451 00:21:55,210 --> 00:22:00,270 >> కాబట్టి ప్రాథమికంగా, నేను కేవలం ఒక పదం కలిగి అయితే, నేను కావలసిన అయింది మాక్స్ ఉంది, 452 00:22:00,270 --> 00:22:05,385 అంటే, అని తరగతి ఏమిటి నాకు అత్యధిక సంభావ్యత ఇవ్వడం? 453 00:22:05,385 --> 00:22:10,010 కాబట్టి ఇవ్వడం తరగతి ఏమిటి నాకు అత్యధిక సంభావ్యత 454 00:22:10,010 --> 00:22:11,940 తరగతి సంభావ్యత వాక్యమిచ్చి. 455 00:22:11,940 --> 00:22:17,610 కాబట్టి ఈ విషయంలో, గాగా "బేబీ." ఇచ్చిన లేదా కాటి "బేబీ." ఇచ్చిన సమంజసం? 456 00:22:17,610 --> 00:22:21,040 >> మరియు కేవలం బయేస్ నుండి, ఆ నేను చూపించారు సమీకరణం, 457 00:22:21,040 --> 00:22:24,780 మేము ఈ భిన్నం సృష్టించడానికి. 458 00:22:24,780 --> 00:22:28,750 మాత్రమే విషయం మీరు ఆ చూసే ఉంది ఇచ్చిన పదం సంభావ్యత 459 00:22:28,750 --> 00:22:31,370 ఆధారపడి తరగతి మార్పులు క్లాస్పై కుడి? 460 00:22:31,370 --> 00:22:34,260 నేను కలిగి "బేబీ" లు సంఖ్య గాగా లో కాటి భిన్నంగా ఉంటుంది. 461 00:22:34,260 --> 00:22:37,640 తరగతి సంభావ్యత ఇది కేవలం సంఖ్య ఉంది అని చెప్పింది 462 00:22:37,640 --> 00:22:39,740 వాటిలో పాటలు ప్రతి ఉన్నాయి. 463 00:22:39,740 --> 00:22:43,980 >> కానీ పదం సంభావ్యత అన్ని కోసం అదే అన్నారు 464 00:22:43,980 --> 00:22:44,740 కళాకారులు, కుడి? 465 00:22:44,740 --> 00:22:47,150 కాబట్టి పదం సంభావ్యత ఉంది కేవలం, సంభావ్యత ఏమిటి 466 00:22:47,150 --> 00:22:49,820 లో ఆ పదం చూసిన ఆంగ్ల భాష? 467 00:22:49,820 --> 00:22:51,420 కనుక ఇది అన్నిటిలో సేమ్. 468 00:22:51,420 --> 00:22:55,790 ఈ స్థిరంగా ఉంది కాబట్టి నుండి, మేము కేవలం ఈ డ్రాప్ మరియు దాని గురించి పట్టించుకోను. 469 00:22:55,790 --> 00:23:00,230 కాబట్టి ఈ వాస్తవానికి ఉంటుంది మేము చూస్తున్న సమీకరణం. 470 00:23:00,230 --> 00:23:03,360 >> నేను బహుళ పదాలు, నేను ఉన్నాను ఇప్పటికీ ముందు పొందబోతున్నారు 471 00:23:03,360 --> 00:23:04,610 ఇక్కడ సంభావ్యత. 472 00:23:04,610 --> 00:23:06,980 మాత్రమే విషయం నేను గుణించడం వెబ్ ఉంది సంభావ్యత 473 00:23:06,980 --> 00:23:08,490 అన్ని ఇతర పదాలు. 474 00:23:08,490 --> 00:23:10,110 నేను వాటిని అన్ని గుణించడం వెబ్. 475 00:23:10,110 --> 00:23:12,610 సమంజసం? 476 00:23:12,610 --> 00:23:18,440 , అదృష్టము కనిపిస్తోంది కానీ ప్రాథమికంగా అర్థం తరగతి ముందు, మరియు లెక్కించేందుకు 477 00:23:18,440 --> 00:23:22,100 అప్పుడు ప్రతి సంభావ్యత ద్వారా గుణిస్తారు తరగతి ఉండటం పదాల. 478 00:23:22,100 --> 00:23:24,620 479 00:23:24,620 --> 00:23:29,150 >> మరియు మీరు తెలిసిన ఒక సంభావ్యత ఒక తరగతి ఇచ్చిన పదం అన్నారు 480 00:23:29,150 --> 00:23:34,520 మీరు ఆ పదం చూసే సంఖ్యని సంఖ్య ద్వారా విభజించబడింది తరగతి, 481 00:23:34,520 --> 00:23:37,020 పదాలు మీరు ఆ లో కలిగి సాధారణంగా తరగతి. 482 00:23:37,020 --> 00:23:37,990 సమంజసం? 483 00:23:37,990 --> 00:23:41,680 ఇది 2 ఎంత "బేబీ" ప్రదర్శించటం పదాల సంఖ్య అని 484 00:23:41,680 --> 00:23:43,020 నేను సాహిత్యం లో. 485 00:23:43,020 --> 00:23:45,130 కాబట్టి కేవలం ఫ్రీక్వెన్సీ. 486 00:23:45,130 --> 00:23:46,260 >> కానీ ఒక విషయం ఉంది. 487 00:23:46,260 --> 00:23:51,250 జయ ఎలా గుర్తుంచుకోండి "బేబీ" ఉండటం సాహిత్యం సంభావ్యత 488 00:23:51,250 --> 00:23:56,350 కాటి పెర్రీ నుండి 0 కనుక కాటి పెర్రీ అన్ని వద్ద "బేబీ" లేదు? 489 00:23:56,350 --> 00:24:04,900 కానీ కేవలం ఒక చిన్న కఠినమైన ధ్వనులు కేవలం సాహిత్యం నుండి కాదు అని చెప్పటానికి 490 00:24:04,900 --> 00:24:10,040 వారు లేదు కనుక ఒక కళాకారుడు ఏ సమయంలో ముఖ్యంగా ఆ పదం. 491 00:24:10,040 --> 00:24:13,330 >> మీరు చేస్తే మీరు కేవలం, బాగా, చెప్పగల్గినవి ఈ పదం లేదు, నేను వెళుతున్న 492 00:24:13,330 --> 00:24:15,640 మీరు ఒక తక్కువ ఇస్తుంది సంభావ్యత, కానీ నేను వెళ్ళడం లేదు 493 00:24:15,640 --> 00:24:17,420 వెంటనే మీరు 0 ఇస్తుంది. 494 00:24:17,420 --> 00:24:21,040 బహుశా అది ఏదో, వంటి ఎందుకంటే ఇది "అగ్ని, అగ్ని, అగ్ని, అగ్ని," 495 00:24:21,040 --> 00:24:21,990 పూర్తిగా కాటి పెర్రీ. 496 00:24:21,990 --> 00:24:26,060 ఆపై "బేబీ," అది వెళుతుంది 0 వెంటనే ఒక అందడంతో 497 00:24:26,060 --> 00:24:27,250 "బిడ్డ." 498 00:24:27,250 --> 00:24:31,440 >> కాబట్టి ప్రధానంగా మేము వాటి ఉంది లాప్లేస్ మార్పిడి అని. 499 00:24:31,440 --> 00:24:36,260 మరియు ఈ కేవలం నేను ఇవ్వడం వెబ్ అర్థం కూడా పదాలు కొన్ని సంభావ్యత 500 00:24:36,260 --> 00:24:37,850 ఉనికిలో లేదు. 501 00:24:37,850 --> 00:24:43,170 నేను ఏమి అని నేను ఉన్నపుడు ఈ లెక్క, నేను ఎల్లప్పుడూ 1 జోడించండి 502 00:24:43,170 --> 00:24:44,180 లవము. 503 00:24:44,180 --> 00:24:48,060 పదం లో, లేదు కాబట్టి కూడా ఈ 0 ఉంటే ఈ సందర్భంలో,, నేను ఇప్పటికీ ఉన్నాను 504 00:24:48,060 --> 00:24:51,250 పైగా 1 ఈ గణన పదాల సంఖ్య. 505 00:24:51,250 --> 00:24:55,060 లేకపోతే, నేను ఎంత అనేక పదాలు నేను కలిగి మరియు నేను 1 జోడించండి. 506 00:24:55,060 --> 00:24:58,300 నేను రెండు సందర్భాలలో కోసం లెక్కింపు వెబ్. 507 00:24:58,300 --> 00:25:00,430 సమంజసం? 508 00:25:00,430 --> 00:25:03,060 >> కాబట్టి ఇప్పుడు యొక్క కొన్ని కోడింగ్ తెలియజేసేలా. 509 00:25:03,060 --> 00:25:06,440 నేను, చాలా ఫాస్ట్ దీన్ని కలిగి వెళుతున్న కానీ కేవలం ముఖ్యం మీరు ఆ 510 00:25:06,440 --> 00:25:08,600 అబ్బాయిలు భావనలు అర్థం. 511 00:25:08,600 --> 00:25:13,450 కాబట్టి మేము ఏమి ప్రయత్నిస్తున్న ఖచ్చితంగా ఈ అమలు ఉంది 512 00:25:13,450 --> 00:25:14,330 నేను చెప్పినమాట నీ - 513 00:25:14,330 --> 00:25:19,110 నేను మీరు నుండి సాహిత్యం ఉంచాలి కావలసిన లేడీ గాగా మరియు కాటి పెర్రీ. 514 00:25:19,110 --> 00:25:22,980 మరియు కార్యక్రమం చేయగలరు అన్నారు ఈ కొత్త సాహిత్యం గాగా నుండి ఉంటే చెప్పడానికి 515 00:25:22,980 --> 00:25:24,170 లేదా కాటి పెర్రీ. 516 00:25:24,170 --> 00:25:25,800 సమంజసం? 517 00:25:25,800 --> 00:25:27,530 OK. 518 00:25:27,530 --> 00:25:30,710 >> కాబట్టి నేను వెళుతున్న ఈ ప్రోగ్రామ్ను classify.py కాల్. 519 00:25:30,710 --> 00:25:31,970 కాబట్టి ఈ పైథాన్ ఉంది. 520 00:25:31,970 --> 00:25:34,210 అది ఒక న్యూ ప్రోగ్రామింగ్ భాష. 521 00:25:34,210 --> 00:25:38,020 ఇది కొన్ని చాలా పోలి ఉంటుంది సి మరియు PHP మార్గాలను. 522 00:25:38,020 --> 00:25:43,180 మీరు ఎందుకంటే ఇది పోలి ఉంది సి తెలుసుకోవడం తర్వాత పైథాన్ తెలుసుకోవడానికి, అది 523 00:25:43,180 --> 00:25:46,270 ఒక సవాలు నిజంగా చాలా కాదు పైథాన్ చాలా సులభం కనుక 524 00:25:46,270 --> 00:25:47,520 కంటే C, మొదటి అన్ని యొక్క. 525 00:25:47,520 --> 00:25:49,370 మరియు విషయాలు చాలా ఇప్పటికే మీరు అమలు. 526 00:25:49,370 --> 00:25:56,820 కాబట్టి ఎంత PHP వంటి పనులు చేసే జాబితా క్రమం, లేదా ఏదో కలపవచ్చు 527 00:25:56,820 --> 00:25:58,780 వ్యూహం, లేదా, బ్లా, బ్లా కు. 528 00:25:58,780 --> 00:26:00,690 పైథాన్ అదే ఆ అన్ని. 529 00:26:00,690 --> 00:26:05,960 >> కాబట్టి నేను వెంటనే వివరించడానికి వెళుతున్న మేము వర్గీకరణ అలా ఏ విధంగా 530 00:26:05,960 --> 00:26:07,860 ఇక్కడ సమస్య. 531 00:26:07,860 --> 00:26:13,230 కాబట్టి యొక్క ఈ సందర్భంలో, నేను కలిగి అని పిలవబడు గాగా మరియు కాటి పెర్రీ నుండి సాహిత్యం. 532 00:26:13,230 --> 00:26:21,880 నేను ఆ సాహిత్యం కలిగి మార్గం సాహిత్యం మొదటి పదం 533 00:26:21,880 --> 00:26:25,250 కళాకారుని పేరు, మరియు మిగిలిన సాహిత్యం ఉంది. 534 00:26:25,250 --> 00:26:29,470 కాబట్టి యొక్క నేను ఈ జాబితాలో ఉన్నాయి అని పిలవబడు ఇది మొదటి ఒక గాగా ద్వారా సాహిత్యం ఉంది. 535 00:26:29,470 --> 00:26:31,930 ఇక్కడ నేను ట్రాక్ ఉన్నాను. 536 00:26:31,930 --> 00:26:35,270 మరియు తదుపరి కాటి, మరియు అది కూడా సాహిత్యం ఉంది. 537 00:26:35,270 --> 00:26:38,040 >> కాబట్టి ఈ మీరు డిక్లేర్ ఎలా ఉంది పైథాన్ ఒక వేరియబుల్. 538 00:26:38,040 --> 00:26:40,200 మీరు డేటా రకం ఇవ్వాలని లేదు. 539 00:26:40,200 --> 00:26:43,150 మీరు "సాహిత్యం," రాయడానికి రకమైన PHP లో ఇష్టం. 540 00:26:43,150 --> 00:26:44,890 సమంజసం? 541 00:26:44,890 --> 00:26:47,770 >> కాబట్టి నేను కలిగి విషయాలు ఏమి ఉన్నాయి లెక్కించేందుకు చెయ్యడానికి లెక్కించేందుకు 542 00:26:47,770 --> 00:26:49,360 సంభావ్యత? 543 00:26:49,360 --> 00:26:55,110 నేను "Priors" లెక్కించేందుకు ఉంటుంది వివిధ ప్రతి 544 00:26:55,110 --> 00:26:56,710 నేను కలిగి తరగతులు. 545 00:26:56,710 --> 00:27:06,680 నేను "పృష్ఠ," లెక్కించేందుకు ఉంటుంది లేదా చాలా చక్కని సంభావ్యత 546 00:27:06,680 --> 00:27:12,150 వివిధ పదాలు ప్రతి అని నేను ప్రతి కళాకారుడు కోసం ఉండవచ్చు. 547 00:27:12,150 --> 00:27:17,210 కాబట్టి గాగా లోపల, ఉదాహరణకు, నేను వెళుతున్న నేను చూడండి ఎన్ని సార్లు జాబితా కలిగి 548 00:27:17,210 --> 00:27:19,250 పదాల్లోని. 549 00:27:19,250 --> 00:27:20,760 సమంజసం? 550 00:27:20,760 --> 00:27:25,370 >> చివరకు, నేను కలిగి వెళుతున్న ఒక కేవలం అన్నారు "పదాలు" అని జాబితా 551 00:27:25,370 --> 00:27:29,780 ఎంతమంది పదాలు నేను ప్రతి కళాకారుడు కోసం కలిగి. 552 00:27:29,780 --> 00:27:33,760 కాబట్టి గాగా కోసం, ఉదాహరణకు, నేను చూడండి సాహిత్యం, నేను, నేను భావిస్తున్నాను చేసింది, 24 553 00:27:33,760 --> 00:27:34,750 మొత్తం పదాలు. 554 00:27:34,750 --> 00:27:38,970 కాబట్టి ఈ జాబితాలో కేవలం కలిగి అన్నారు గాగా 24 మరియు కాటి మరొక సంఖ్య. 555 00:27:38,970 --> 00:27:40,130 సమంజసం? 556 00:27:40,130 --> 00:27:40,560 OK. 557 00:27:40,560 --> 00:27:42,530 >> కాబట్టి ఇప్పుడు, నిజానికి, లెట్స్ కోడింగ్ వెళ్ళండి. 558 00:27:42,530 --> 00:27:45,270 కాబట్టి పైథాన్ లో, మీరు నిజంగా చేయవచ్చు వివిధ కొంత తిరిగి 559 00:27:45,270 --> 00:27:46,630 ఫంక్షన్ నుండి విషయాలు. 560 00:27:46,630 --> 00:27:50,810 నేను ఈ ఫంక్షన్ను రూపొందించడానికి వెళుతున్న అన్నారు ఇది ", నియత" అని 561 00:27:50,810 --> 00:27:53,890 , ఆ విషయాలు అన్ని తిరిగి "Priors," "సంభావ్యత," మరియు 562 00:27:53,890 --> 00:28:05,690 "పదాలు." కాబట్టి ", నియత" మరియు అది లోకి కాల్ కావడం "సాహిత్యం." 563 00:28:05,690 --> 00:28:11,510 >> కాబట్టి ఇప్పుడు నేను మీరు నిజంగా కావలసిన ఈ ఫంక్షన్ వ్రాయండి. 564 00:28:11,510 --> 00:28:17,750 నేను ఈ రాయగలగాలి మార్గం ఫంక్షన్ నేను ఈ నిర్వచిస్తారు 565 00:28:17,750 --> 00:28:20,620 తో పని "డెఫ్." నేను డెఫ్ "చేసింది నియత, "మరియు దానిని తీసుకొని 566 00:28:20,620 --> 00:28:28,700 "సాహిత్యం." మరియు ఈ చేయబోవడం , మొదటి అన్ని యొక్క, నేను నా Priors కలిగి ఉంది 567 00:28:28,700 --> 00:28:31,030 నేను లెక్కించేందుకు కావలసిన. 568 00:28:31,030 --> 00:28:34,330 >> కాబట్టి నేను ఈ చేయవచ్చు ఆ విధంగా సృష్టించడానికి ఉంది పైథాన్, లో ఒక నిఘంటువు ఇది 569 00:28:34,330 --> 00:28:37,320 ఒక హాష్ చాలా చక్కని అదే విషయం పట్టిక, లేదా పునరుత్థాన వంటిది 570 00:28:37,320 --> 00:28:40,480 PHP లో శ్రేణి. 571 00:28:40,480 --> 00:28:44,150 ఈ నేను ఒక నిఘంటువు డిక్లేర్ ఎలా ఉంది. 572 00:28:44,150 --> 00:28:53,580 మరియు ప్రధానంగా అంటే ఉంది గాగా యొక్క Priors ఉంటే, ఉదాహరణకు, 0.5 573 00:28:53,580 --> 00:28:57,200 సాహిత్యం 50% నుండి గాగా, 50% కాటి నుండి. 574 00:28:57,200 --> 00:28:58,450 సమంజసం? 575 00:28:58,450 --> 00:29:00,680 576 00:29:00,680 --> 00:29:03,680 నేను గుర్తించడానికి కలిగి ఎలా Priors లెక్కించేందుకు. 577 00:29:03,680 --> 00:29:07,120 >> నేను కలిగి తదుపరి వాటికి,, సంభావ్యత మరియు పదాలు. 578 00:29:07,120 --> 00:29:17,100 కాబట్టి గాగా యొక్క సంభావ్యత జాబితా అన్ని సంభావ్యత యొక్క నేను 579 00:29:17,100 --> 00:29:19,160 గాగా కోసం పదాల్లోని కోసం కలిగి. 580 00:29:19,160 --> 00:29:23,880 నేను గాగా యొక్క సంభావ్యత వెళ్ళండి అయితే "బిడ్డ," ఉదాహరణకు, అది నాకు ఇస్తాము 581 00:29:23,880 --> 00:29:28,750 2 ఆ సందర్భంలో 24 పైగా లాగ. 582 00:29:28,750 --> 00:29:30,070 సమంజసం? 583 00:29:30,070 --> 00:29:36,120 నేను "సంభావ్యత," కు వెళ్ళండి అన్ని జాబితాను కలిగి "గాగా" బకెట్ 584 00:29:36,120 --> 00:29:40,550 గాగా పదాలు, అప్పుడు నేను ", బేబీ" వెళ్ళండి మరియు నేను సంభావ్యత చూడండి. 585 00:29:40,550 --> 00:29:45,940 >> చివరకు నేను ఈ ఉంటాయి "పదాలు" నిఘంటువు. 586 00:29:45,940 --> 00:29:53,620 ఇక్కడ, "సంభావ్యత." ఆపై "పదాలు." నేను "పదాలు," "గాగా," లేకపోతే 587 00:29:53,620 --> 00:29:58,330 ఏ జరిగే అన్నారు ఇది అని ఉంది , నాకు 24 ఇవ్వాలని అన్నారు చెప్పడం నేను 588 00:29:58,330 --> 00:30:01,990 గాగా నుండి సాహిత్యం లోపల 24 పదాలు ఉంటాయి. 589 00:30:01,990 --> 00:30:04,110 అర్ధమే? 590 00:30:04,110 --> 00:30:07,070 ఇక్కడ, "పదాలు" డా-dah-dah సమానం. 591 00:30:07,070 --> 00:30:07,620 OK 592 00:30:07,620 --> 00:30:12,210 >> నేను ఏమి వెళుతున్న నేను వెళుతున్న ఉంది కాబట్టి, సాహిత్యం ప్రతి పైగా iterate 593 00:30:12,210 --> 00:30:14,490 తీగలను ప్రతి యొక్క నేను జాబితాలో కలిగి. 594 00:30:14,490 --> 00:30:18,040 నేను ఆ విషయాలు లెక్కించేందుకు వెళుతున్న అభ్యర్థులు ప్రతి. 595 00:30:18,040 --> 00:30:19,950 అర్ధమే? 596 00:30:19,950 --> 00:30:21,700 నేను లూప్ ఒక చేయాల్సిందల్లా. 597 00:30:21,700 --> 00:30:26,300 >> కాబట్టి పైథాన్ లో నేను చేయవచ్చు లైన్ కోసం "ఉంది సాహిత్యం లో. "ఒక అదే విషయం 598 00:30:26,300 --> 00:30:28,000 PHP లో ప్రకటన "ప్రతి". 599 00:30:28,000 --> 00:30:33,420 ఇది PHP ఉంటే ఎలా నేను గుర్తుంచుకో ప్రతి సాహిత్యం కోసం " 600 00:30:33,420 --> 00:30:35,220 లైన్. "రాడు? 601 00:30:35,220 --> 00:30:38,900 నేను ఈ లో, పంక్తులు ప్రతి తీసుకుని చేస్తున్నాను కేసు ఈ స్ట్రింగ్ మరియు తదుపరి 602 00:30:38,900 --> 00:30:44,540 స్ట్రింగ్ నేను రెడీ పంక్తులు ప్రతి చేయబోవడం నేను వెళుతున్న, మొదటి ఉంది 603 00:30:44,540 --> 00:30:49,150 జాబితా ఈ లైన్ విభజించబడింది ఖాళీలతో వేరు పదాలు. 604 00:30:49,150 --> 00:30:53,730 >> కాబట్టి పైథాన్ గురించి చల్లని విషయం ఉంది మీరు Google వంటి "ఎలా చెయ్యవచ్చు కాలేదు నేను 605 00:30:53,730 --> 00:30:58,220 పదాలు స్ట్రింగ్ విభజించబడింది? "మరియు అది ఉంది ఎలా దీన్ని మీరు చెప్పడం వెళ్తున్నారు. 606 00:30:58,220 --> 00:31:04,890 మరియు దీన్ని మార్గం, ఇది కేవలం "లైన్ = Line.split () "మరియు ప్రధానంగా ఉంది 607 00:31:04,890 --> 00:31:08,640 మీరు జాబితా ఇవ్వాలని అన్నారు ఇక్కడ పదాల్లోని. 608 00:31:08,640 --> 00:31:09,620 అర్ధమే? 609 00:31:09,620 --> 00:31:15,870 కాబట్టి ఇప్పుడు నేను చేయాలనుకున్న అని ఆ పాట గాయకుడు ఎవరు. 610 00:31:15,870 --> 00:31:20,130 మరియు నేను పొందడానికి కలిగి చేయడానికి శ్రేణి యొక్క మొదటి మూలకం, కుడి? 611 00:31:20,130 --> 00:31:26,390 కాబట్టి నేను చెప్పగలను నేను "గాయకుడు = లైన్ (0) "భావన చేస్తుంది? 612 00:31:26,390 --> 00:31:32,010 >> మరియు తర్వాత నేను చెయ్యాల్సిన మొదటి యొక్క, అన్ని, నేను అప్డేట్ వెళుతున్న ఎన్ని 613 00:31:32,010 --> 00:31:36,130 పదాలు నేను క్రింద కలిగి "గాగా." కాబట్టి నేను కేవలం లెక్కించేందుకు ఎన్ని పదాలు నేను 614 00:31:36,130 --> 00:31:38,690 కుడి, ఈ జాబితాలో ఉన్నాయి? 615 00:31:38,690 --> 00:31:41,910 ఈ నేను ఎన్ని పదాలు ఎందుకంటే సాహిత్యం లో మరియు నేను వెళుతున్న 616 00:31:41,910 --> 00:31:44,120 "గాగా" శ్రేణి జోడించి. 617 00:31:44,120 --> 00:31:47,090 అర్ధవంతం లేదు? 618 00:31:47,090 --> 00:31:49,010 వాక్యనిర్మాణం చాలా దృష్టి లేదు. 619 00:31:49,010 --> 00:31:50,430 భావనలు గురించి మరింత భావిస్తే. 620 00:31:50,430 --> 00:31:52,400 ఆ అతి ముఖ్యమైన భాగం. 621 00:31:52,400 --> 00:31:52,720 OK. 622 00:31:52,720 --> 00:32:00,260 >> "గాగా" ఉంటే కాబట్టి నేను దీన్ని చెయ్యవచ్చు ఉంది ఇప్పటికే ఆ జాబితాలో, కాబట్టి "గాయకుడు లో ఉంటే 623 00:32:00,260 --> 00:32:03,190 పదాలు "అంటే నేను ఇప్పటికే గాగా ద్వారా పదాలు ఉంటాయి. 624 00:32:03,190 --> 00:32:06,640 నేను అదనపు జోడించాలనుకుంటే ఆ పదాలు. 625 00:32:06,640 --> 00:32:15,810 నేను ఏమి "పదాలు (గాయకుడు) ఉంది + = లెన్ (లైన్) - 1 ". 626 00:32:15,810 --> 00:32:18,250 మరియు తర్వాత నేను చేయవచ్చు లైన్ పొడవు. 627 00:32:18,250 --> 00:32:21,860 కాబట్టి ఎన్ని అంశాలు నేను శ్రేణి లో కలిగి. 628 00:32:21,860 --> 00:32:27,060 నేను చేయాల్సిందల్లా 1 మైనస్ కనుక శ్రేణి యొక్క మొదటి మూలకం కేవలం ఉంది 629 00:32:27,060 --> 00:32:29,180 ఒక గాయకుడు మరియు ఆ సాహిత్యం కాదు. 630 00:32:29,180 --> 00:32:31,420 అర్ధమే? 631 00:32:31,420 --> 00:32:32,780 OK. 632 00:32:32,780 --> 00:32:35,820 >> "ఎల్స్," ఇది నేను కావలసిన అర్థం వాస్తవానికి జాబితాలో గాగా ఇన్సర్ట్. 633 00:32:35,820 --> 00:32:45,990 నేను కేవలం పదాలు (గాయకుడు) "చేయండి = లెన్ (లైన్) - 1, "క్షమించండి. 634 00:32:45,990 --> 00:32:49,200 రెండు మధ్య తేడా పంక్తులు ఈ ఒక, ఇది లేదని ఉంటుంది 635 00:32:49,200 --> 00:32:51,080 వికీలో, నేను ఉన్నాను కేవలం ప్రారంభించడం. 636 00:32:51,080 --> 00:32:53,820 ఈ ఒక నిజానికి పదమూ. 637 00:32:53,820 --> 00:32:55,570 OK. 638 00:32:55,570 --> 00:32:59,480 కాబట్టి ఈ పదాలు కు జోడించారు. 639 00:32:59,480 --> 00:33:03,040 >> ఇప్పుడు నేను Priors జోడించండి కావలసిన. 640 00:33:03,040 --> 00:33:05,480 కాబట్టి నేను Priors లెక్కిస్తాము? 641 00:33:05,480 --> 00:33:11,580 Priors లెక్కించవచ్చు ఎన్ని సార్లు ద్వారా. 642 00:33:11,580 --> 00:33:15,340 మీరు ఆ గాయకుడు చూడండి కాబట్టి ఎన్ని సార్లు మీరు గాయకులు అన్ని మధ్య 643 00:33:15,340 --> 00:33:16,380 కుడి, ఉన్నాయి? 644 00:33:16,380 --> 00:33:18,810 , గాగా మరియు కాటి పెర్రీ కోసం కాబట్టి ఈ సందర్భంలో, నేను గాగా చూడండి 645 00:33:18,810 --> 00:33:20,570 ఒకసారి, కాటి పెర్రీ ఒకసారి. 646 00:33:20,570 --> 00:33:23,320 >> గాగా కోసం ప్రధానంగా Priors మరియు కాటి పెర్రీ కోసం ఆ 647 00:33:23,320 --> 00:33:24,390 సరైన, ఒకటిగా? 648 00:33:24,390 --> 00:33:26,500 మీరు ఎన్ని సార్లు నేను కళాకారుడు చూడండి. 649 00:33:26,500 --> 00:33:28,740 కాబట్టి ఈ లెక్కించేందుకు చాలా సులభం. 650 00:33:28,740 --> 00:33:34,100 నేను ఇలాంటి ఏదో వంటి "ఉంటే వంటి Priors లో గాయకుడు, "నేను వెళుతున్న 651 00:33:34,100 --> 00:33:38,970 వారి Priors బాక్స్ 1 జోడించడానికి. 652 00:33:38,970 --> 00:33:51,000 "కాబట్టి," అప్పుడు మరియు "" Priors (పాడటానికి) "+ = 1 వేరే నేను "Priors (గాయకుడు) చేయ బోతున్నాను 653 00:33:51,000 --> 00:33:55,000 = 1. "భావన చేస్తుంది? 654 00:33:55,000 --> 00:34:00,080 >> కాబట్టి అది లేదు ఉంటే నేను చాలు 1 వంటి, లేకపోతే నేను 1 జోడించండి. 655 00:34:00,080 --> 00:34:11,280 OK, కాబట్టి ఇప్పుడు అన్ని నేను వదలి కూడా పదాల్లోని జోడించండి ఉంది 656 00:34:11,280 --> 00:34:12,290 సంభావ్యత. 657 00:34:12,290 --> 00:34:14,889 నేను లెక్కించాలి ఎన్నిసార్లు నేను పదాలు ప్రతి చూడండి. 658 00:34:14,889 --> 00:34:18,780 నేను మరొక చేయాల్సిందల్లా లైన్ లో లూప్. 659 00:34:18,780 --> 00:34:25,190 >> నేను వెళుతున్న కాబట్టి మొదటి విషయం గాయకుడు ఇప్పటికే ఒక కలిగి ఉంటే తనిఖీ 660 00:34:25,190 --> 00:34:26,969 సంభావ్యత శ్రేణి. 661 00:34:26,969 --> 00:34:31,739 గాయకుడు లేదు చేస్తే నేను తనిఖీ చేస్తున్నాను ఒక సంభావ్యత శ్రేణి కలిగి, నేను ఉన్నాను 662 00:34:31,739 --> 00:34:34,480 వారికి ఒక ప్రారంభించడం వెళుతున్న. 663 00:34:34,480 --> 00:34:36,400 ఇది కూడా వ్యూహం కాదు, క్షమించాలి, ఇది ఒక సృష్టించారు. 664 00:34:36,400 --> 00:34:43,080 కాబట్టి గాయకుడు సంభావ్యత అన్నారు బహిరంగ నిఘంటువు ఉండాలి, నేను ఉన్నాను 665 00:34:43,080 --> 00:34:45,830 దానికోసం ఒక నిఘంటువు ప్రారంభించడం. 666 00:34:45,830 --> 00:34:46,820 OK? 667 00:34:46,820 --> 00:34:58,330 >> తనని నా లూప్ ఒక చేయవచ్చు పదాల్లోని 'లెక్కించేందుకు 668 00:34:58,330 --> 00:35:00,604 సంభావ్యత. 669 00:35:00,604 --> 00:35:01,540 OK. 670 00:35:01,540 --> 00:35:04,160 నేను ఏమి చేయవచ్చు లూప్ ఒక ఉంది. 671 00:35:04,160 --> 00:35:06,590 కాబట్టి నేను iterate వెళుతున్న శ్రేణి మీద. 672 00:35:06,590 --> 00:35:15,320 నేను పైథాన్ లో చేయగలమని కాబట్టి మార్గం "పరిధిలో నేను కోసం." ఉంది 1 నుండి 673 00:35:15,320 --> 00:35:19,200 నేను రెండవ ప్రారంభమవుతుంది కావలసిన ఎందుకంటే మొదటి ఒకటి మూలకం ఎందుకంటే 674 00:35:19,200 --> 00:35:20,260 గాయకుడు పేరు. 675 00:35:20,260 --> 00:35:24,990 కాబట్టి ఒక నుండి వరకు లైన్ పొడవు. 676 00:35:24,990 --> 00:35:29,760 నేను ఉంటాయి లేనప్పుడు నిజానికి నుంచి ఇక్కడ వంటి 1 నుండి యొక్క లెన్ కు 677 00:35:29,760 --> 00:35:30,740 లైన్ మైనస్ 1. 678 00:35:30,740 --> 00:35:33,810 కాబట్టి ఇది ఇప్పటికే చేయడం ఆ విషయం చేస్తుంది చాలా ఇది శ్రేణుల కోసం n మైనస్ 1 679 00:35:33,810 --> 00:35:35,500 సౌకర్యవంతంగా. 680 00:35:35,500 --> 00:35:37,850 అర్ధమే? 681 00:35:37,850 --> 00:35:42,770 >> కాబట్టి ఈ ప్రతి, నేను వెళుతున్న అలా, ఇతర ఒక లో వంటి, ఉంది 682 00:35:42,770 --> 00:35:50,320 నేను తనిఖీ వెళుతున్న ఉంటే ఈ పదం లైన్ లో స్థానం ఉంది 683 00:35:50,320 --> 00:35:51,570 సంభావ్యత. 684 00:35:51,570 --> 00:35:53,400 685 00:35:53,400 --> 00:35:57,260 ఆపై నేను సంభావ్యత, ఇక్కడ చెప్పారు వంటి పదాలు, లో వంటి నేను చాలు 686 00:35:57,260 --> 00:35:58,400 "సంభావ్యత (గాయకుడు)". 687 00:35:58,400 --> 00:35:59,390 కాబట్టి గాయకుడు యొక్క పేరు. 688 00:35:59,390 --> 00:36:03,450 కనుక ఇది ఇప్పటికే ఉంటే "Probabilit (గాయకుడు)", ఇది అంటే నేను 689 00:36:03,450 --> 00:36:11,960 దానికి 1 జోడించాలనుకుంటే, నేను వెళుతున్న "సంభావ్యత (గాయకుడు)", మరియు 690 00:36:11,960 --> 00:36:14,100 పదం "లైన్ (i)" అంటారు. 691 00:36:14,100 --> 00:36:22,630 నేను 1 జోడించండి వెళ్ళి మరియు "మిగతా" నేను కేవలం 1 కు ప్రారంభించడం అన్నారు. 692 00:36:22,630 --> 00:36:23,880 "లైన్ (i)". 693 00:36:23,880 --> 00:36:26,920 694 00:36:26,920 --> 00:36:28,420 అర్ధమే? 695 00:36:28,420 --> 00:36:30,180 >> కాబట్టి, నేను శ్రేణుల యొక్క అన్ని లెక్కించిన. 696 00:36:30,180 --> 00:36:36,580 కాబట్టి, ఇప్పుడు అన్ని నేను కోసం చేయడానికి కలిగి ఈ ఒక కేవలం ", Priors తిరిగి ఉంది 697 00:36:36,580 --> 00:36:43,230 సంభావ్యత మరియు పదాలు. "లెట్ యొక్క OK, ఏ ఉన్నాయి లేదో. 698 00:36:43,230 --> 00:36:45,690 ఇది ఇప్పటివరకు ప్రతిదీ పని తెలుస్తోంది. 699 00:36:45,690 --> 00:36:46,900 కాబట్టి, అర్ధమే? 700 00:36:46,900 --> 00:36:47,750 కొన్ని విధంగా? 701 00:36:47,750 --> 00:36:49,280 OK. 702 00:36:49,280 --> 00:36:51,980 కాబట్టి ఇప్పుడు నేను అన్ని సంభావ్యత. 703 00:36:51,980 --> 00:36:55,100 కాబట్టి ఇప్పుడు నేను వదలి మాత్రమే విషయం ఆ విషయం కలిగి అని 704 00:36:55,100 --> 00:36:58,650 అన్ని యొక్క ఉత్పత్తి లెక్కిస్తుంది నేను సాహిత్యం వచ్చినప్పుడు సంభావ్యత. 705 00:36:58,650 --> 00:37:06,270 >> కాబట్టి యొక్క నేను ఇప్పుడు కాల్ కావలసిన సే ఈ ఫంక్షన్ ") (వర్గీకరించడానికి" మరియు 706 00:37:06,270 --> 00:37:08,880 విషయం ఆ ఫంక్షన్ పడుతుంది కేవలం ఒక వాదన ఉంది. 707 00:37:08,880 --> 00:37:13,170 యొక్క "బేబీ, నేను నిప్పు am"! మరియు అది ఏమిటి గుర్తించడానికి అన్నారు 708 00:37:13,170 --> 00:37:14,490 ఈ గాగా ఉంటుంది సంభావ్యత? 709 00:37:14,490 --> 00:37:16,405 సంభావ్యత ఏమిటి ఈ కేటీ అని? 710 00:37:16,405 --> 00:37:19,690 మంచిది? 711 00:37:19,690 --> 00:37:25,750 కాబట్టి నేను సృష్టించడానికి కలిగి వెళుతున్న ఒక అని కొత్త ఫంక్షన్ ") (వర్గీకరించడానికి" మరియు 712 00:37:25,750 --> 00:37:29,180 అది కొన్ని తీసుకుని వెళుతున్న ఒదిగిపోయారు. 713 00:37:29,180 --> 00:37:31,790 714 00:37:31,790 --> 00:37:36,160 మరియు సాహిత్యం పాటు నేను కూడా Priors పంపేందుకు, 715 00:37:36,160 --> 00:37:37,700 సంభావ్యత మరియు పదాలు. 716 00:37:37,700 --> 00:37:44,000 నేను సాహిత్యం, Priors పంపడం వెళుతున్న, సంభావ్యత, పదాలు. 717 00:37:44,000 --> 00:37:51,840 >> కాబట్టి ఈ సాహిత్యం, Priors తీసుకుంటోంది, సంభావ్యత, పదాలు. 718 00:37:51,840 --> 00:37:53,530 కాబట్టి, ఇది ఏమి చేస్తుంది? 719 00:37:53,530 --> 00:37:57,180 ఇది ప్రాథమికంగా అన్ని ద్వారా వెళ్ళి అన్నారు సాధ్యం అభ్యర్థులు మీరు 720 00:37:57,180 --> 00:37:58,510 గాయనిగా కలిగి. 721 00:37:58,510 --> 00:37:59,425 మరియు ఆ అభ్యర్ధులు? 722 00:37:59,425 --> 00:38:01,020 వారు Priors ఉన్నామని, కుడి? 723 00:38:01,020 --> 00:38:02,710 కాబట్టి అక్కడ ఆ అన్ని. 724 00:38:02,710 --> 00:38:07,870 నేను ఒక నిఘంటువు కలిగి వెళుతున్న అన్ని సాధ్యం అభ్యర్థుల. 725 00:38:07,870 --> 00:38:14,220 ఆపై లో ప్రతి అభ్యర్థి Priors, ఇది అది వెళుతున్న అర్థం కాబట్టి 726 00:38:14,220 --> 00:38:17,740 నేను కలిగి ఉంటే గాగా, కేటీ ఉంటుంది మరింత వేడి ఉంటుంది. 727 00:38:17,740 --> 00:38:20,410 నేను లెక్క మొదలు వెళుతున్న ఈ సంభావ్యత. 728 00:38:20,410 --> 00:38:28,310 మేము చూసిన వంటి సంభావ్యత PowerPoint ముందు సార్లు ఉంది 729 00:38:28,310 --> 00:38:30,800 ప్రతి ఉత్పత్తి ఇతర సంభావ్యత. 730 00:38:30,800 --> 00:38:32,520 >> నేను ఇక్కడ కలగొచ్చు. 731 00:38:32,520 --> 00:38:36,330 నేను సంభావ్యత ఉంది చేయవచ్చు ప్రారంభంలో ముందు. 732 00:38:36,330 --> 00:38:40,340 అభ్యర్థి కాబట్టి Priors. 733 00:38:40,340 --> 00:38:40,870 కుడి? 734 00:38:40,870 --> 00:38:45,360 ఇప్పుడు నేను అన్ని పైగా iterate ఉంటుంది నేను సాహిత్యాన్ని కలిగి పదాలు 735 00:38:45,360 --> 00:38:48,820 సంభావ్యత జోడించడానికి OK, వాటిని ప్రతి? 736 00:38:48,820 --> 00:38:57,900 కాబట్టి, "సాహిత్యం లో పదం కోసం" నేను వెళుతున్న పదం లో ఉంటే చేయడానికి, ఉంది 737 00:38:57,900 --> 00:39:01,640 "సంభావ్యత (అభ్యర్థి)", ఇది ఇది ఒక పదం అర్థం 738 00:39:01,640 --> 00:39:03,640 అభ్యర్థి వారి సాహిత్యం లో ఉంది - 739 00:39:03,640 --> 00:39:05,940 గాగా కోసం ఉదాహరణకు, "బేబీ" - 740 00:39:05,940 --> 00:39:11,710 నేను చేయ బోతున్నాను అని సంభావ్యత వారిని అన్నారు 741 00:39:11,710 --> 00:39:22,420 ప్లస్ సంభావ్యత 1 ద్వారా ఆ పదం అభ్యర్థి. 742 00:39:22,420 --> 00:39:25,710 మరియు అది "పదం" అని. 743 00:39:25,710 --> 00:39:32,440 ఈ పదాల సంఖ్య ద్వారా విభజించబడింది నేను ఆ అభ్యర్థి కోసం కలిగి. 744 00:39:32,440 --> 00:39:37,450 నేను కలిగి పదాల సంఖ్య నేను చూస్తున్నాను ఆ గాయకుడు కోసం. 745 00:39:37,450 --> 00:39:40,290 >> "ఎల్స్." అది ఒక కొత్త పదం అర్థం కాబట్టి ఉదాహరణకు ఇలా అంటాను 746 00:39:40,290 --> 00:39:41,860 లేడీ గాగా కోసం "అగ్ని". 747 00:39:41,860 --> 00:39:45,760 నేను కేవలం 1 చేయాలనుకుంటున్నారా "పదం (అభ్యర్థి)". 748 00:39:45,760 --> 00:39:47,710 నేను ఇక్కడ ఈ పదం ఉంచాలి లేదు. 749 00:39:47,710 --> 00:39:50,010 >> కాబట్టి ఇది ప్రధానంగా చేస్తాడు కాపీ మరియు ఈ పేస్ట్. 750 00:39:50,010 --> 00:39:54,380 751 00:39:54,380 --> 00:39:56,000 కానీ నేను ఈ భాగం తొలగించండి వెళుతున్న. 752 00:39:56,000 --> 00:39:57,610 కాబట్టి అది కేవలం ఆ పైగా 1 చేస్తాడు. 753 00:39:57,610 --> 00:40:00,900 754 00:40:00,900 --> 00:40:02,150 మంచిది? 755 00:40:02,150 --> 00:40:03,980 756 00:40:03,980 --> 00:40:09,700 ఇప్పుడు ముగింపు, నేను వెళుతున్న అభ్యర్థి పేరు మరియు ప్రింట్ 757 00:40:09,700 --> 00:40:15,750 మీరు కలిగి సంభావ్యత వారి సాహిత్యం ఎస్ కలిగి. 758 00:40:15,750 --> 00:40:16,200 అర్ధమే? 759 00:40:16,200 --> 00:40:18,390 నేను నిజానికి కూడా చేయండి ఈ నిఘంటువు అవసరం. 760 00:40:18,390 --> 00:40:19,510 అర్ధమే? 761 00:40:19,510 --> 00:40:21,810 >> కాబట్టి, ఈ పనిచేస్తుంది ఉంటే యొక్క చూసేలా. 762 00:40:21,810 --> 00:40:24,880 నేను ఈ అమలు చేస్తే, అది పని చేయలేదు. 763 00:40:24,880 --> 00:40:26,130 ఒక రెండవ వేచి. 764 00:40:26,130 --> 00:40:28,870 765 00:40:28,870 --> 00:40:31,720 "పదాలు (అభ్యర్థి)", "పదాలు (అభ్యర్థి)", ఆ 766 00:40:31,720 --> 00:40:33,750 శ్రేణి పేరు. 767 00:40:33,750 --> 00:40:41,435 OK కాబట్టి, ఇది కొన్ని బగ్ ఉంది అన్నారు Priors లో అభ్యర్థిని. 768 00:40:41,435 --> 00:40:46,300 769 00:40:46,300 --> 00:40:48,760 నాకు కేవలం కొద్దిగా చల్లదనాన్ని లెట్. 770 00:40:48,760 --> 00:40:50,360 OK. 771 00:40:50,360 --> 00:40:51,305 యొక్క ప్రయత్నించండి లెట్. 772 00:40:51,305 --> 00:40:51,720 OK. 773 00:40:51,720 --> 00:40:58,710 >> కనుక ఇది కాటి పెర్రీ ఈ ఉంది ఇస్తుంది ఈ సార్లు 10 సంభావ్యత 774 00:40:58,710 --> 00:41:02,200 మైనస్ 7 మరియు గాగా ఈ ఉంది సార్లు మైనస్ 6 10. 775 00:41:02,200 --> 00:41:05,610 కాబట్టి మీరు చూపిస్తుంది చూసే గాగా అధిక సంభావ్యతను కలిగి ఉంటుంది. 776 00:41:05,610 --> 00:41:09,260 కాబట్టి ఉంది "బేబీ, నేను యామ్ ఆన్ ఫైర్" బహుశా ఒక గాగా పాట. 777 00:41:09,260 --> 00:41:10,580 అర్ధమే? 778 00:41:10,580 --> 00:41:12,030 ఈ మేము ఏమి ఉంది. 779 00:41:12,030 --> 00:41:16,010 >> ఈ కోడ్ ఆన్లైన్ పోస్ట్ అన్నారు, మీరు అబ్బాయిలు ఇది తనిఖీ చేయవచ్చు. 780 00:41:16,010 --> 00:41:20,720 మీరు అనుకుంటే బహుశా అది కొన్ని ఉపయోగించండి ఒక ప్రాజెక్ట్ లేదా ఇలాంటి ఏదో. 781 00:41:20,720 --> 00:41:22,150 OK. 782 00:41:22,150 --> 00:41:25,930 ఇది చూపించడానికి ఉంది ఏమి గణన 783 00:41:25,930 --> 00:41:27,230 భాషాశాస్త్రం కోడ్ కనిపిస్తోంది. 784 00:41:27,230 --> 00:41:33,040 కానీ ఇప్పుడు యొక్క మరింత వినుడు అధిక స్థాయి అంశాలను. 785 00:41:33,040 --> 00:41:33,340 OK. 786 00:41:33,340 --> 00:41:35,150 >> కాబట్టి ఇతర సమస్యలు నేను మాట్లాడుతున్న - 787 00:41:35,150 --> 00:41:37,550 విభజన సమస్య వాటిని మొదటి ఉంది. 788 00:41:37,550 --> 00:41:40,820 కాబట్టి మీరు జపనీస్ కలిగి. 789 00:41:40,820 --> 00:41:43,420 ఆపై మీరు ఆ చూడండి ఖాళీలు ఉన్నాయి. 790 00:41:43,420 --> 00:41:49,110 కాబట్టి ఈ ప్రాథమికంగా ఇది అర్థం ఉంది కుర్చీ పైన, కుడి? 791 00:41:49,110 --> 00:41:50,550 మీరు జపనీస్ మాట్లాడటం? 792 00:41:50,550 --> 00:41:52,840 ఇది కుడి, కుర్చీ అగ్ర ఉంది? 793 00:41:52,840 --> 00:41:54,480 >> STUDENT: నేను తెలియదు కంజి పైగా ఉంది. 794 00:41:54,480 --> 00:41:57,010 >> LUCAS Freitas: ఇది [జాపనీస్ మాట్లాడే] యొక్క 795 00:41:57,010 --> 00:41:57,950 OK. 796 00:41:57,950 --> 00:42:00,960 కాబట్టి ఇది ప్రధానంగా టాప్ కుర్చీ అంటే. 797 00:42:00,960 --> 00:42:03,620 మీరు ఒక ఖాళీ వచ్చింది కాబట్టి ఉంటే ఇది ఇక్కడ ఉంటుంది. 798 00:42:03,620 --> 00:42:05,970 ఆపై మీరు [ఉందా? Ueda-san. ?] 799 00:42:05,970 --> 00:42:09,040 ప్రధానంగా మిస్టర్ Ueda అర్థం. 800 00:42:09,040 --> 00:42:13,180 మరియు మీరు ఆ "Ueda" చూడండి మరియు మీరు ఒక స్పేస్ ఆపై "san." కాబట్టి మీరు ఆ చూడండి 801 00:42:13,180 --> 00:42:15,470 ఇక్కడ మీరు "UE" ద్వారా వంటిది. 802 00:42:15,470 --> 00:42:17,750 మరియు ఇక్కడ ఒక పాత్ర ఉంది అది ప్రక్కన. 803 00:42:17,750 --> 00:42:21,720 >> కనుక ఇది ఆయా భాషలలో ఇష్టం లేదు ఒక పదం దానిని మీరు అర్థం అక్షరాలు 804 00:42:21,720 --> 00:42:23,980 కేవలం ఖాళీలు చాలా ఉంచండి. 805 00:42:23,980 --> 00:42:25,500 అక్షరాలు ప్రతి ఇతర సంబంధించి. 806 00:42:25,500 --> 00:42:28,680 మరియు వారు కలిసి ఉంటుంది వంటి రెండు, మూడు, ఒక. 807 00:42:28,680 --> 00:42:34,520 కాబట్టి మీరు నిజంగా రకమైన సృష్టించడానికి కలిగి మార్గాన్ని ఆ ఖాళీలు ఉంచడం. 808 00:42:34,520 --> 00:42:38,850 >> మరియు ఈ విషయం మీరు చేసినప్పుడు ఆ ఆసియా భాషలు నుండి డేటా, 809 00:42:38,850 --> 00:42:40,580 ప్రతిదీ unsegmented వస్తుంది. 810 00:42:40,580 --> 00:42:45,940 ఎందుకంటే జపనీస్ వ్రాస్తాడు ఎవరూ లేదా చైనీస్ ఖాళీలతో రాశారు. 811 00:42:45,940 --> 00:42:48,200 మీరు చైనీస్ రాస్తున్నాం ఎప్పుడు, జపనీస్ మీరు ప్రతిదీ రాయడానికి 812 00:42:48,200 --> 00:42:48,710 ఖాళీలు తో. 813 00:42:48,710 --> 00:42:52,060 ఇది కూడా సమంజసం స్పేస్ ఉంచాలి. 814 00:42:52,060 --> 00:42:57,960 కాబట్టి మీరు కొన్ని, నుండి డేటా వచ్చినప్పుడు తూర్పు ఆసియా భాష, మీరు అనుకుంటే 815 00:42:57,960 --> 00:43:00,760 నిజానికి ఆ ఏదో ఒకటి మీరు మొదటి విభాగంలో ఉంటుంది. 816 00:43:00,760 --> 00:43:05,130 >> ఉదాహరణ విధంగా అనుకుంటున్నారో స్పేస్ లేకుండా సాహిత్యం. 817 00:43:05,130 --> 00:43:07,950 కాబట్టి మీరు కలిగి మాత్రమే సాహిత్యం కుడి, వాక్యాలు ఉంటుంది? 818 00:43:07,950 --> 00:43:09,470 కాలాలు వేరు. 819 00:43:09,470 --> 00:43:13,930 కానీ కేవలం వాక్యం కలిగి రెడీ నిజంగా సమాచారం ఇవ్వడం న సహకరించదు 820 00:43:13,930 --> 00:43:17,760 ఆ సాహిత్యం ద్వారా వారు. 821 00:43:17,760 --> 00:43:18,120 కుడి? 822 00:43:18,120 --> 00:43:20,010 కాబట్టి మీరు తప్పక మొదటి స్పేస్ ఉంచుతుంది. 823 00:43:20,010 --> 00:43:21,990 మీరు కనుక ఎలా చేయవచ్చు? 824 00:43:21,990 --> 00:43:24,920 >> కాబట్టి అప్పుడు ఒక భాషా ఆలోచన వస్తుంది నిజంగా ఏదో ఇది మోడల్ 825 00:43:24,920 --> 00:43:26,870 గణన కోసం ముఖ్యమైన భాషాశాస్త్రం. 826 00:43:26,870 --> 00:43:32,790 కాబట్టి ఒక భాషను మోడల్ రప్పించింది ఒక సంభావ్యత పట్టిక కార్యక్రమాలు 827 00:43:32,790 --> 00:43:36,260 సంభావ్యత ఏమిటి అన్ని మొదటి ఒక భాషలో పదం కలిగి? 828 00:43:36,260 --> 00:43:39,590 కాబట్టి ఒక పదం ఎంత తరచుగా చూపిస్తున్న. 829 00:43:39,590 --> 00:43:43,130 మరియు తర్వాత కూడా సంబంధించి చూపిస్తున్న ఒక వాక్యంలో పదాల మధ్య. 830 00:43:43,130 --> 00:43:51,500 >> వాడిగా వచ్చారు కాబట్టి, ప్రధాన ఆలోచన, ఉంది మీరు మరియు ఒక వాక్యం అన్నారు 831 00:43:51,500 --> 00:43:55,600 మీరు, సంభావ్యత అని, కోసం ఏమిటి ఉదాహరణకు, "ఈ నా చెల్లెలని [? GTF"?] 832 00:43:55,600 --> 00:43:57,480 వ్యక్తి అని వాక్యం? 833 00:43:57,480 --> 00:44:00,380 కాబట్టి స్పష్టంగా కొన్ని వాక్యాలు ఉన్నాయి ఇతరులు సాధారణమై. 834 00:44:00,380 --> 00:44:04,450 ఉదాహరణకు, ", ఉదయం మంచి" లేదా "మంచి రాత్రి, "లేదా" అక్కడ హే, "ఎక్కువ 835 00:44:04,450 --> 00:44:08,260 చాలా వాక్యాలు కంటే సాధారణ మేము ఒక ఆంగ్ల కలిగి. 836 00:44:08,260 --> 00:44:11,060 ఎందుకు ఆ వాక్యాలు ఉన్నాయి తరచుగా? 837 00:44:11,060 --> 00:44:14,060 >> మీరు ఎందుకంటే అన్ని మొదటి, అది మరింత తరచుగా పదాలు. 838 00:44:14,060 --> 00:44:20,180 మీరు చెప్పే చేస్తే, ఉదాహరణకు,, కుక్క ఉంది పెద్ద, మరియు కుక్క మీరు, అతిపెద్ద ఉంది 839 00:44:20,180 --> 00:44:23,880 సాధారణంగా బహుశా కుక్క పెద్దది వినడానికి "పెద్ద" ఎక్కువ తరచుగా ఎందుకంటే 840 00:44:23,880 --> 00:44:27,260 "పెద్ద." కంటే ఇంగ్లీష్ లో తరచుగా సో, ఒక 841 00:44:27,260 --> 00:44:30,100 విషయాలు పదం పౌనఃపున్యం. 842 00:44:30,100 --> 00:44:34,490 >> నిజంగా ఇది రెండవ విషయం ముఖ్యం కేవలం 843 00:44:34,490 --> 00:44:35,490 పదాలు క్రమాన్ని. 844 00:44:35,490 --> 00:44:39,500 కాబట్టి, ఇది "పిల్లి చెప్పటానికి సాధారణ వార్తలు . బాక్స్ లోపల "కానీ మీరు అలా సాధారణంగా 845 00:44:39,500 --> 00:44:44,250 లో చూడండి "బాక్స్ లోపల పిల్లి." ఈ విధంగా మీరు ముఖ్యమైన ఉందని చూడండి 846 00:44:44,250 --> 00:44:46,030 పదాల క్రమంలో. 847 00:44:46,030 --> 00:44:50,160 మీరు చెప్పలేము ఆ రెండు వాక్యాలు అదే సంభావ్యత కలిగి 848 00:44:50,160 --> 00:44:53,010 వారు అదే పదాలు కనుక. 849 00:44:53,010 --> 00:44:55,550 మీరు నిజంగా పట్టించుకోనట్లు ఆర్డర్ గురించి అలాగే. 850 00:44:55,550 --> 00:44:57,650 సమంజసం? 851 00:44:57,650 --> 00:44:59,490 >> కాబట్టి మేము ఏమి చేస్తారు? 852 00:44:59,490 --> 00:45:01,550 సో నేను మీరు పొందడానికి ప్రయత్నించండి? 853 00:45:01,550 --> 00:45:04,400 నేను మీరు మేము ప్రయత్నిస్తున్నాను n-గ్రామ నమూనాలు కాల్. 854 00:45:04,400 --> 00:45:09,095 కాబట్టి n-గ్రామ నమూనాలు ప్రధానంగా ఊహించుకోవటం ప్రతి పదం కోసం ఆ 855 00:45:09,095 --> 00:45:10,960 మీరు ఒక వాక్యంలో కలిగి. 856 00:45:10,960 --> 00:45:15,020 ఇది కలిగి సంభావ్యత అని మాటను మాత్రమే ఆధారపడుతుంది 857 00:45:15,020 --> 00:45:18,395 భాషలో ఆ పదం యొక్క ఫ్రీక్వెన్సీ, కానీ పదాలు ఆ 858 00:45:18,395 --> 00:45:19,860 దాని చుట్టూ ఉంటాయి. 859 00:45:19,860 --> 00:45:25,810 >> ఉదాహరణకు, సాధారణంగా మీరు చూసినప్పుడు లేదా మీరు వంటి ఏదో 860 00:45:25,810 --> 00:45:28,040 బహుశా ఒక చూడటానికి వెళ్లి ఇది తరువాత నామవాచకం, కుడి? 861 00:45:28,040 --> 00:45:31,750 ఎందుకంటే మీరు ఒక విభక్తి ఉన్నప్పుడు సాధారణంగా అది దాని తరువాత ఒక నామవాచకం పడుతుంది. 862 00:45:31,750 --> 00:45:35,540 లేదా మీరు సకర్మక అని క్రియ ఉంటే మీరు సాధారణంగా వెళ్తున్నారు 863 00:45:35,540 --> 00:45:36,630 నామవాచకం పదబంధం కలిగి. 864 00:45:36,630 --> 00:45:38,780 కనుక ఇది ఒక నామవాచకం కలిగి జరగబోతోంది ఇది చుట్టూ ఎక్కడా. 865 00:45:38,780 --> 00:45:44,950 >> కాబట్టి, ప్రాథమికంగా, ఏ అది ఉంది అది కలిగి సంభావ్యత భావించింది 866 00:45:44,950 --> 00:45:47,960 పదాలు ఒకదాని తరువాత, ఉన్నప్పుడు మీరు గణన చేస్తున్నారు 867 00:45:47,960 --> 00:45:49,050 ఒక వాక్యం యొక్క సంభావ్యత. 868 00:45:49,050 --> 00:45:50,960 మరియు ఆ ఒక భాష మోడల్ రప్పించింది. 869 00:45:50,960 --> 00:45:54,620 కేవలం సంభావ్యత ఏది మాట్లాడుతూ ఒక నిర్దిష్ట కలిగి 870 00:45:54,620 --> 00:45:57,120 ఒక భాషలో వాక్యం? 871 00:45:57,120 --> 00:45:59,110 ఎందుకు ప్రాథమికంగా, ఉపయోగపడుతుంది? 872 00:45:59,110 --> 00:46:02,390 మరియు అన్ని మొదటి ఏమిటి ఒక n-గ్రామ మోడల్, అప్పుడు? 873 00:46:02,390 --> 00:46:08,850 >> కాబట్టి ఒక n-గ్రామ మోడల్ అంటే ప్రతి పదం ఆధారపడి 874 00:46:08,850 --> 00:46:12,700 తదుపరి N మైనస్ 1 పదాలు. 875 00:46:12,700 --> 00:46:18,150 కాబట్టి, ప్రాథమికంగా,, నేను చూస్తే అర్థం ఉదాహరణకు, CS50 TF ఉన్నప్పుడు 876 00:46:18,150 --> 00:46:21,500 నేను సంభావ్యత గణన వెబ్ వాక్యం, మీరు వంటి ఉంటాం " 877 00:46:21,500 --> 00:46:25,280 పదం "" కలిగి సంభావ్యత కలిగి సార్లు సంభావ్యత " 878 00:46:25,280 --> 00:46:31,720 కలిగి CS50 "సార్లు సంభావ్యత "CS50 TF." కాబట్టి, ప్రాథమికంగా, నేను పరిగణించబడుతుంది 879 00:46:31,720 --> 00:46:35,720 సాగతీత యొక్క అన్ని విధాలుగా. 880 00:46:35,720 --> 00:46:41,870 >> ఆపై సాధారణంగా మీరు, ఈ చేస్తున్నా ఒక ప్రాజెక్ట్ లో వంటి, మీరు ఉండాలి N చాలు 881 00:46:41,870 --> 00:46:42,600 ఒక తక్కువ విలువ. 882 00:46:42,600 --> 00:46:45,930 కాబట్టి, సాధారణంగా bigrams లేదా ట్రైగ్రామ్స్ కలిగి. 883 00:46:45,930 --> 00:46:51,090 మీరు రెండు పదాలు, ఒక కౌంట్ కాబట్టి రెండు పదాలు, లేదా మూడు పదాల సమూహం, 884 00:46:51,090 --> 00:46:52,620 కేవలం ప్రదర్శన సమస్యలకు. 885 00:46:52,620 --> 00:46:56,395 మరియు కూడా ఎందుకంటే బహుశా మీరు కలిగి ఉంటే లాగ "CS50 TF." మీరు 886 00:46:56,395 --> 00:47:00,510 కలిగి "TF," ఇది చాలా ముఖ్యమైన "CS50" కుడి, దాని ప్రక్కన ఉంది? 887 00:47:00,510 --> 00:47:04,050 ఆ రెండు విషయాలు ఉంటాయి ఒకదాని తరువాత. 888 00:47:04,050 --> 00:47:06,410 >> మీరు భావిస్తే "TF," అది ఉంది పొందబోతున్నారు ఏమి 889 00:47:06,410 --> 00:47:07,890 ఇది కోసం TF'ing యొక్క తరగతి. 890 00:47:07,890 --> 00:47:11,330 అలాగే "" నిజంగా ముఖ్యం CS50 TF కోసం. 891 00:47:11,330 --> 00:47:14,570 కానీ మీరు "CS50 వంటి ఏదైనా కలిగి ఉంటే TF తరగతి వెళ్లి ఇచ్చాడు 892 00:47:14,570 --> 00:47:20,060 విద్యార్థులు కొన్ని క్యాండీ. "" కాండీ "మరియు" " కుడి, నిజంగా ఎటువంటి సంబంధం? 893 00:47:20,060 --> 00:47:23,670 వారు ప్రతి ఇతర నుండి దూరంగా అని ఇది నిజంగా ఏమి పట్టింపు లేదు 894 00:47:23,670 --> 00:47:25,050 పదాలు మీ. 895 00:47:25,050 --> 00:47:31,210 >> కాబట్టి ఒక bigram లేదా ఒక trigram చేయడం ద్వారా, ఇది కేవలం మీరు పరిమితం చేస్తున్న అర్థం 896 00:47:31,210 --> 00:47:33,430 మీ కొన్ని పదాలకు చుట్టూ ఉండే. 897 00:47:33,430 --> 00:47:35,810 సమంజసం? 898 00:47:35,810 --> 00:47:40,630 కాబట్టి మీరు ఈ విభాగీకరణ చేయాలనుకుంటున్నారా ఉన్నప్పుడు, ప్రధానంగా, మీరు చేయాలనుకుంటున్నారా చూడండి ఉంది 899 00:47:40,630 --> 00:47:44,850 అన్ని విధాలుగా ఏ అని మీరు విభాగంలో వాక్యం చెయ్యవచ్చు. 900 00:47:44,850 --> 00:47:49,090 >> మీరు చూడటానికి అలాంటి ఆ వాక్యాలు ప్రతి సంభావ్యత 901 00:47:49,090 --> 00:47:50,880 భాషలో ఉన్న? 902 00:47:50,880 --> 00:47:53,410 కాబట్టి మీరు ఏమి వంటి, బాగా, వీలు ఉంది నాకు ఇక్కడ ఖాళీ ఉంచాలి ప్రయత్నించండి. 903 00:47:53,410 --> 00:47:55,570 కాబట్టి మీరు అక్కడ ఖాళీ ఉంచాలి మరియు మీరు ఏమి చూడండి 904 00:47:55,570 --> 00:47:57,590 ఆ వాక్యం యొక్క సంభావ్యత? 905 00:47:57,590 --> 00:48:00,240 అప్పుడు మీరు OK, వంటి, బహుశా ఆ లేదు. 906 00:48:00,240 --> 00:48:03,420 నేను ఒక స్థలం ఖాళీ ఉంచాలి మరియు అక్కడ, మరియు మీరు లెక్కించేందుకు 907 00:48:03,420 --> 00:48:06,240 సంభావ్యత ఇప్పుడు, మరియు మీరు చూడండి ఇది ఒక అధిక సంభావ్యత ఉంది. 908 00:48:06,240 --> 00:48:12,160 >> కాబట్టి ఈ TANGO అని ఒక అల్గోరిథం సెగ్మెంటేషన్ అల్గోరిథం, ఇది 909 00:48:12,160 --> 00:48:14,990 నిజానికి నిజంగా ఉంటుంది అని ఏదో ఒక ప్రాజెక్ట్, చల్లని ఇది 910 00:48:14,990 --> 00:48:20,860 ప్రాథమికంగా unsegmented టెక్స్ట్ పడుతుంది జపనీస్ లేదా చైనీస్ లేదా బహుశా ఉంటుంది 911 00:48:20,860 --> 00:48:26,080 ఇంగ్లీష్ స్పేస్ లేకుండా మరియు ఉంచేందుకు ప్రయత్నిస్తుంది పదాలు మరియు అది మధ్య స్పేస్ 912 00:48:26,080 --> 00:48:29,120 ఒక భాష మోడల్ ఉపయోగించి మరియు ద్వారా అత్యధిక చూడటానికి ప్రయత్నిస్తున్న 913 00:48:29,120 --> 00:48:31,270 మీరు పొందవచ్చు సంభావ్యత. 914 00:48:31,270 --> 00:48:32,230 OK. 915 00:48:32,230 --> 00:48:33,800 కాబట్టి ఈ విభజన ఉంది. 916 00:48:33,800 --> 00:48:35,450 >> ఇప్పుడు సింటాక్స్. 917 00:48:35,450 --> 00:48:40,940 కాబట్టి, సింటాక్స్ కోసం వాడుతున్నారు ప్రస్తుతం చాలా విషయాలు. 918 00:48:40,940 --> 00:48:44,880 గ్రాఫ్ శోధన కోసం, సిరి కోసం కోసం కాబట్టి సహజ అందంగా చాలా ఎలాంటి 919 00:48:44,880 --> 00:48:46,490 భాష ప్రాసెసింగ్ మీరు. 920 00:48:46,490 --> 00:48:49,140 కాబట్టి ముఖ్యమైన ఏవి వాక్యనిర్మాణం గురించి విషయాలు? 921 00:48:49,140 --> 00:48:52,390 కాబట్టి, సాధారణంగా వాక్యాలు మేము భాగాలు పిలుస్తాము. 922 00:48:52,390 --> 00:48:57,080 ఏ రకమైన పదాల సమూహాలు వలె ఉంటాయి వాక్యంలో ఒక ఫంక్షన్ కలిగి. 923 00:48:57,080 --> 00:49:02,220 మరియు వారు నిజంగా ఉండకూడదు కాక ప్రతి ఇతర నుండి. 924 00:49:02,220 --> 00:49:07,380 >> నేను చేస్తే,, ఉదాహరణకు, "లారెన్ ప్రేమించే మీలో. లారెన్ "ఉంది" అందట "ఒక 925 00:49:07,380 --> 00:49:10,180 రాజ్యాంగ ఆపై "ఇష్టపడతారు మీలో "కూడా మరొక ఒకటి. 926 00:49:10,180 --> 00:49:16,860 మీరు "లారెన్ మీలో వంటి చెప్పలేను ఎందుకంటే అదే అర్ధం కలిగి "ఇష్టపడతారు. 927 00:49:16,860 --> 00:49:18,020 ఇది కలిగి మాత్రం కాదు అదే అర్థం. 928 00:49:18,020 --> 00:49:22,500 లేదా నేను "మీలో లారెన్ వంటి చెప్పలేను ఇష్టపడతారు. "ప్రతిదీ అదే ఉంది 929 00:49:22,500 --> 00:49:25,890 ఆ చేయడం అంటే. 930 00:49:25,890 --> 00:49:31,940 >> గురించి రెండు ముఖ్యమైన విషయాలు వాక్యనిర్మాణం ఇది నిఘంటు రకాలు 931 00:49:31,940 --> 00:49:35,390 ప్రధానంగా, పనితీరు మీరు తాము పదాలతో కలిగి. 932 00:49:35,390 --> 00:49:39,180 కాబట్టి మీరు తెలుసు కలిగి "లారెన్" మరియు "మీలో" నామవాచకాలు. 933 00:49:39,180 --> 00:49:41,040 "లవ్" ఒక క్రియా. 934 00:49:41,040 --> 00:49:45,660 మరియు రెండవ ముఖ్యమైన విషయం వారు పదబంధ రకాల అని. 935 00:49:45,660 --> 00:49:48,990 కాబట్టి మీరు "మీలో ప్రేమించే" తెలుసు నిజానికి ఒక శబ్ద ఫ్రేజ్. 936 00:49:48,990 --> 00:49:52,390 నేను సే "లారెన్," నేను తెలుసు లారెన్ ఏదో చేస్తోంది. 937 00:49:52,390 --> 00:49:53,620 ఆమె ఏమి ఉంది? 938 00:49:53,620 --> 00:49:54,570 ఆమె మీలో loving ఉంది. 939 00:49:54,570 --> 00:49:56,440 కనుక ఇది మొత్తం విషయం. 940 00:49:56,440 --> 00:50:01,640 కానీ దాని భాగాలు నామవాచకం, ఒక క్రియ. 941 00:50:01,640 --> 00:50:04,210 కానీ కలిసి, వారు క్రియ పదబంధం తయారు. 942 00:50:04,210 --> 00:50:08,680 >> కాబట్టి, మేము నిజంగా తో చేయవచ్చు కంప్యుటేషనల్ లింగ్విస్టిక్స్? 943 00:50:08,680 --> 00:50:13,810 కాబట్టి, నేను ఉదాహరణకు ఏదైనా కలిగి ఉంటే "అల్లిసన్ యొక్క స్నేహితులు." నేను చూడండి ఉంటే నేను 944 00:50:13,810 --> 00:50:17,440 ఒక వాక్యనిర్మాణ చెట్టు నేను తెలుస్తుంది లేదని "స్నేహితులు" ఇది ఒక నామవాచకం ఫ్రేజ్ ఒక 945 00:50:17,440 --> 00:50:21,480 "అల్లిసన్ యొక్క" నామవాచకం మరియు ఒక ఉంది "యొక్క" దీనిలో విభక్తి ఫ్రేజ్ 946 00:50:21,480 --> 00:50:24,810 ఒక ప్రతిపాదనను మరియు "అల్లిసన్" నామవాచకం. 947 00:50:24,810 --> 00:50:30,910 నేను చేయగలిగే నా కంప్యూటర్ బోధించడానికి ఉంది నేను ఒక నామవాచకం పదబంధం ఒకటి మరియు ఉన్నప్పుడు 948 00:50:30,910 --> 00:50:33,080 అప్పుడు విభక్తి పదబంధం. 949 00:50:33,080 --> 00:50:39,020 యొక్క "ఈ సందర్భంలో," స్నేహితులు "కాబట్టి మరియు మీలో "నేను ఈ అర్థం తెలుసు 950 00:50:39,020 --> 00:50:43,110 NP2, రెండవ, NP1 కలిగి. 951 00:50:43,110 --> 00:50:47,680 >> నేను సంబంధించి రకమైన సృష్టించవచ్చు, ఇది కోసం ఫంక్షన్ రకమైన. 952 00:50:47,680 --> 00:50:52,370 నేను ఈ నిర్మాణం చేసినప్పుడు, ఇది స్నేహితులు "తో ఖచ్చితంగా మ్యాచ్ 953 00:50:52,370 --> 00:50:56,030 అల్లిసన్, "నేను తెలుసు అల్లిసన్ స్నేహితులు కలిగి. 954 00:50:56,030 --> 00:50:58,830 కాబట్టి స్నేహితులు ఏదో ఉంటాయి అల్లిసన్ కలిగి. 955 00:50:58,830 --> 00:50:59,610 అర్ధమే? 956 00:50:59,610 --> 00:51:01,770 కాబట్టి ఈ ప్రాథమికంగా ఏమిటి గ్రాఫ్ శోధన చేస్తుంది. 957 00:51:01,770 --> 00:51:04,360 ఇది కేవలం నియమాలు సృష్టిస్తుంది విషయాలు చాలా కోసం. 958 00:51:04,360 --> 00:51:08,190 కాబట్టి "అల్లిసన్ యొక్క స్నేహితులు," "నా స్నేహితులు "", కేంబ్రిడ్జ్ లో నా స్నేహితులు నివసించే 959 00:51:08,190 --> 00:51:12,970 హార్వర్డ్ వెళ్ళండి. "ఇది నిబంధనల సృష్టిస్తుంది ఆ విషయాలు అన్ని కోసం. 960 00:51:12,970 --> 00:51:14,930 >> ఇప్పుడు యంత్ర అనువాదం. 961 00:51:14,930 --> 00:51:18,850 కాబట్టి, యంత్ర అనువాదం కూడా ఉంది గణాంక ఏదో. 962 00:51:18,850 --> 00:51:21,340 మరియు నిజానికి మీరు పాలు ఉంటే కంప్యుటేషనల్ లింగ్విస్టిక్స్, చాలా 963 00:51:21,340 --> 00:51:23,580 మీ అంశాలు సంఖ్యాశాస్త్రం అన్నారు. 964 00:51:23,580 --> 00:51:26,670 నేను ఉదాహరణకు చేస్తున్న కనుక నేను అని సంభావ్యత చాలా 965 00:51:26,670 --> 00:51:30,540 గణన, ఆపై మీరు ఈ ను చివరి అని చాలా చిన్న సంఖ్య 966 00:51:30,540 --> 00:51:33,180 సంభావ్యత, మరియు ఆ ఏది మీరు సమాధానం ఇస్తుంది. 967 00:51:33,180 --> 00:51:37,540 యంత్ర అనువాదం కూడా ఉపయోగిస్తుంది ఒక గణాంక నమూనా. 968 00:51:37,540 --> 00:51:44,790 మరియు మీరు యంత్రం యొక్క అనుకుంటే సరళమైన అనువాదం 969 00:51:44,790 --> 00:51:48,970 మార్గం, మీరు భావిస్తారు వాటిని ఉంది కుడి, పదం ద్వారా పదం అనువాదం? 970 00:51:48,970 --> 00:51:52,150 >> మీరు ఒక భాష నేర్చుకుంటున్నారు మొదటిసారి, సాధారణంగా ఏమిటి 971 00:51:52,150 --> 00:51:52,910 మీరు కుడి? 972 00:51:52,910 --> 00:51:57,050 మీకు కావాలంటే మీరు ఒక వాక్యం అనువాదం భాషలోకి మీ భాషలో 973 00:51:57,050 --> 00:52:00,060 మీరు, సాధారణంగా మొదటి, నేర్చుకుంటున్నారు పదాల్లోని అనువాదం 974 00:52:00,060 --> 00:52:03,180 వ్యక్తిగతంగా, ఆపై మీరు ప్రయత్నించండి స్థానంలో పదాలు ఉంచాలి. 975 00:52:03,180 --> 00:52:07,100 >> , నేను ఈ అనువదించడానికి కోరుకుంటే కాబట్టి [మాట్లాడే పోర్చుగీస్] 976 00:52:07,100 --> 00:52:10,430 "తెలుపు పిల్లి దూరంగా నడిచింది." అంటే నేను నుండి అనువదిస్తుంది కోరుకుంటే 977 00:52:10,430 --> 00:52:13,650 ఇంగ్లీష్ పోర్చుగీస్, నేను చేయగల నేను, మొదటి, ఉంది 978 00:52:13,650 --> 00:52:14,800 పదం ద్వారా పదం అనువాదం. 979 00:52:14,800 --> 00:52:20,570 కాబట్టి "o" "," "కృతజ్ఞతతో," "పిల్లి," ఉంది "తెలుపు," "వైట్", ఆపై "fugio" ఉంది 980 00:52:20,570 --> 00:52:21,650 "దూరంగా నడిచింది." 981 00:52:21,650 --> 00:52:26,130 >> కాబట్టి నేను, ఇక్కడ అన్ని పదాలు కానీ వారు క్రమంలో లేదు. 982 00:52:26,130 --> 00:52:29,590 "పిల్లి తెలుపు నడిచింది" వంటిది ఇది వ్యాకరణం ఉంది. 983 00:52:29,590 --> 00:52:34,490 కాబట్టి, నేను రెండో దశ కలిగిన ఆదర్శ కనుగొనడంలో అన్నారు 984 00:52:34,490 --> 00:52:36,610 పదాల్లోని కోసం స్థానం. 985 00:52:36,610 --> 00:52:40,240 కనుక నేను నిజంగా కావాలి తెలుసు బదులుగా "తెలుపు పిల్లి" "పిల్లి తెలుపు." ఈ విధంగా 986 00:52:40,240 --> 00:52:46,050 నేను చేయవచ్చు అత్యంత సరళ పద్ధతి, సృష్టించడానికి ఉంటుంది అన్ని 987 00:52:46,050 --> 00:52:49,720 సాధ్యం ప్రస్తారణల స్థానాలు పదాలు,. 988 00:52:49,720 --> 00:52:53,300 తరువాత ఒక కలిగి చూడండి అత్యధిక సంభావ్యత ప్రకారం 989 00:52:53,300 --> 00:52:54,970 నా భాష మోడల్. 990 00:52:54,970 --> 00:52:58,390 ఆపై నేను ఉంది చూసినప్పుడు ఇది అత్యధిక సంభావ్యత ఇది, 991 00:52:58,390 --> 00:53:01,910 బహుశా "తెలుపు పిల్లి, దూరంగా నడిచింది" నా అనువాద వార్తలు. 992 00:53:01,910 --> 00:53:06,710 >> మరియు వివరించటానికి ఒక సాధారణ మార్గం యంత్ర అనువాదం చాలా 993 00:53:06,710 --> 00:53:07,910 అల్గోరిథంలు పని. 994 00:53:07,910 --> 00:53:08,920 అర్ధవంతం లేదు? 995 00:53:08,920 --> 00:53:12,735 ఇది నిజంగా అద్భుతమైన విషయం మీరు అబ్బాయిలు బహుశా ఒక అన్వేషించవచ్చు ఆ 996 00:53:12,735 --> 00:53:13,901 చివరి ప్రాజెక్టు, అవును? 997 00:53:13,901 --> 00:53:15,549 >> STUDENT: సరే, మీరు అది చెప్పాడు సరళ మార్గం, కాబట్టి ఏమిటి 998 00:53:15,549 --> 00:53:17,200 కాని సరళ మార్గం? 999 00:53:17,200 --> 00:53:18,400 >> LUCAS Freitas: కాని సరళ మార్గం? 1000 00:53:18,400 --> 00:53:19,050 OK. 1001 00:53:19,050 --> 00:53:22,860 గురించి తప్పుగా ఉంది కాబట్టి మొదటి విషయం ఈ పద్ధతి నేను అనువాదం ఉంది 1002 00:53:22,860 --> 00:53:24,330 పదాలు, పదం ద్వారా పదం. 1003 00:53:24,330 --> 00:53:30,570 కానీ కొన్నిసార్లు మీరు పదాలు అని బహుళ అనువాదాలు ఉండవచ్చు. 1004 00:53:30,570 --> 00:53:32,210 నేను ప్రయత్నించండి వెళుతున్న ఏదో. 1005 00:53:32,210 --> 00:53:37,270 పోర్చుగీస్ చెయ్యవచ్చు ఉదాహరణకు, "మాంగా" ఉంటుంది "చించు" లేదా "స్లీవ్." గాని ఈ విధంగా 1006 00:53:37,270 --> 00:53:40,450 మీరు పదం అనువదించడానికి ప్రయత్నిస్తున్న ఉన్నప్పుడు పదం ద్వారా, మీరు ఇచ్చే ఉండవచ్చు 1007 00:53:40,450 --> 00:53:42,050 ఏ చేస్తుంది ఏదో. 1008 00:53:42,050 --> 00:53:45,770 >> మీరు చూడండి మీరు నిజంగా సాధ్యం అనువాదాలు 1009 00:53:45,770 --> 00:53:49,840 పదాలు మరియు వీక్షించ మొదటి, క్రమంలో ఏమిటి. 1010 00:53:49,840 --> 00:53:52,000 మేము permutating గురించి మాట్లాడుతూ విషయాలు? 1011 00:53:52,000 --> 00:53:54,150 అన్ని ఆదేశాలు చూడండి మరియు అత్యధిక తో ఎంచుకోవచ్చు 1012 00:53:54,150 --> 00:53:54,990 సంభావ్యత? 1013 00:53:54,990 --> 00:53:57,860 మీరు కూడా అన్ని ఎంచుకోవచ్చు ప్రతి కోసం అనువాదాలు 1014 00:53:57,860 --> 00:54:00,510 తరువాత పదం మరియు చూడండి - 1015 00:54:00,510 --> 00:54:01,950 ప్రస్తారణల కలిపి - 1016 00:54:01,950 --> 00:54:03,710 ఇది ఒక అత్యధిక అవకాశం ఉంది. 1017 00:54:03,710 --> 00:54:08,590 >> మీరు కూడా కాదు చూడవచ్చు కేవలం పదాల కానీ మాటలను. 1018 00:54:08,590 --> 00:54:11,700 కాబట్టి మీరు మధ్య సంబంధాలు విశ్లేషిస్తుంది పదాలు ఆపై ఒక పొందండి 1019 00:54:11,700 --> 00:54:13,210 మంచి అనువాదం. 1020 00:54:13,210 --> 00:54:16,690 అలాగే ఏదో, ఈ సెమిస్టర్ నిజానికి పరిశోధన చేయడం వెబ్ 1021 00:54:16,690 --> 00:54:19,430 చైనీస్-ఇంగ్లీష్ యంత్ర అనువాదం, కాబట్టి నుండి అనువాదం 1022 00:54:19,430 --> 00:54:20,940 ఆంగ్లంలోకి చైనీస్. 1023 00:54:20,940 --> 00:54:26,760 >> మరియు మేము ఏదో ఉపయోగించి పాటు, ఉంది కేవలం ఇది ఒక గణాంక నమూనా, 1024 00:54:26,760 --> 00:54:30,570 చూసిన సంభావ్యత చూసిన ఒక వాక్యంలో కొన్ని స్థానం, నేను ఉన్నాను 1025 00:54:30,570 --> 00:54:35,360 వాస్తవానికి కొన్ని సింటాక్స్ జోడించడం నా నేను ఈ విధమైన చూడండి ఉంటే మోడల్, OH, మాట్లాడుతూ 1026 00:54:35,360 --> 00:54:39,420 నిర్మాణం, ఈ నేను ఏమి ఉంది నేను అనువదించడానికి దానిని మార్చడానికి. 1027 00:54:39,420 --> 00:54:43,880 కాబట్టి మీరు కూడా రకమైన జోడించవచ్చు చేయడానికి సింటెక్స్ మూలకం 1028 00:54:43,880 --> 00:54:47,970 అనువాద మరింత సమర్థవంతంగా మరియు మరింత ఖచ్చితమైన. 1029 00:54:47,970 --> 00:54:48,550 OK. 1030 00:54:48,550 --> 00:54:51,010 >> మీరు అనుకుంటే కాబట్టి మీరు, ఎలా మొదలు చేయవచ్చు గణన చేయాలని 1031 00:54:51,010 --> 00:54:51,980 భాషాశాస్త్రం? 1032 00:54:51,980 --> 00:54:54,560 >> మొదట, మీరు ఒక ప్రాజెక్ట్ ఎంచుకోండి భాషలను ఉంటుంది. 1033 00:54:54,560 --> 00:54:56,310 కాబట్టి, అక్కడ చాలా ఉంది. 1034 00:54:56,310 --> 00:54:58,420 మీరు చేయవచ్చు చాలా విషయాలు ఉన్నాయి. 1035 00:54:58,420 --> 00:55:00,510 ఆపై ఒక మోడల్ ఆలోచించవచ్చు మీరు ఉపయోగించే. 1036 00:55:00,510 --> 00:55:04,710 సాధారణంగా ఆ ఆలోచన అర్థం అంచనాలు, నేను, OH వంటి వంటి 1037 00:55:04,710 --> 00:55:05,770 పాటలలో ఆలోచన వంటి. 1038 00:55:05,770 --> 00:55:09,510 నేను దొరుకుతుందని కావాలా నేను, బాగా నచ్చింది, ఈ రాశాడు ఒక అవ్ట్, నేను బహుశా కావలసిన 1039 00:55:09,510 --> 00:55:15,400 పదాలు చూడండి ఉపయోగించి మరియు చాలా తరచుగా ఆ పదం ఉపయోగిస్తుంది చూడండి. 1040 00:55:15,400 --> 00:55:18,470 కాబట్టి అంచనాలు తయారు ప్రయత్నించండి మరియు నమూనాలు ఆలోచించడానికి ప్రయత్నించండి. 1041 00:55:18,470 --> 00:55:21,395 ఆపై మీరు కూడా ఆన్లైన్ శోధించవచ్చు మీరు కలిగి సమస్య రకం, 1042 00:55:21,395 --> 00:55:24,260 మరియు అది సూచిస్తున్నాయి వెళుతున్న మీరు నమూనాలు ఆ బహుశా 1043 00:55:24,260 --> 00:55:26,560 ఆ విషయం మోడల్గా. 1044 00:55:26,560 --> 00:55:29,080 >> మరియు మీరు ఎల్లప్పుడూ నాకు ఇమెయిల్ చేయవచ్చు. 1045 00:55:29,080 --> 00:55:31,140 me@lfreitas.com. 1046 00:55:31,140 --> 00:55:34,940 మరియు నేను మీ ప్రశ్నలకు. 1047 00:55:34,940 --> 00:55:38,600 మేము కూడా నేను 'అప్ కలిసే ఉండవచ్చు చేయవచ్చు మార్గాలపై సూచనలు ఇవ్వాలని 1048 00:55:38,600 --> 00:55:41,490 మీ ప్రాజెక్టును అమలు. 1049 00:55:41,490 --> 00:55:45,610 మీరు సంబంధం ఉంటే నేను అర్థం కంప్యుటేషనల్ లింగ్విస్టిక్స్, ఏమైందా 1050 00:55:45,610 --> 00:55:46,790 గొప్పదని. 1051 00:55:46,790 --> 00:55:48,370 మీరు అక్కడ చూడండి చూడాలని చాలా శక్తివంతమైన ఉంది. 1052 00:55:48,370 --> 00:55:52,060 మరియు పరిశ్రమ తీసుకోవాలని కోరుకుంటున్నారు ఎందుకంటే యొక్క మీరు చెడు. 1053 00:55:52,060 --> 00:55:54,720 నేను మీరు అబ్బాయిలు ఈ ఆనందించారు ఆశిస్తున్నాము. 1054 00:55:54,720 --> 00:55:57,030 మీరు అబ్బాయిలు ఏవైనా ప్రశ్నలు ఉంటే, మీరు ఈ తర్వాత నాకు అడగవచ్చు. 1055 00:55:57,030 --> 00:55:58,280 సినిమాల్లో. 1056 00:55:58,280 --> 00:56:00,150