لوکاس Freitas میں: ارے. سب کا استقبال ہے. میرا نام لوکاس Freitas میں ہے. میں تعلیم [اشراوی] میں ایک جونیئر ہوں میں خصوصی توجہ کے ساتھ کمپیوٹر سائنس کمپیوٹیشنل لسانیات. تو میری ثانوی زبان میں ہے اور لسانی اصول. میں واقعی تم لوگوں کو سکھانے کے لئے حوصلہ افزائی ہوں میدان بارے میں تھوڑا سا. اس کا مطالعہ کرنے کے لئے ایک بہت دلچسپ علاقہ ہے. بھی ممکنہ کے بہت سے مستقبل کے لئے. تو، میں بہت حوصلہ افزائی کر رہا ہوں کہ تم لوگ منصوبوں میں غور کر رہے ہیں کمپیوٹیشنل لسانیات. اور میں مشورہ کرنے سے زیادہ خوش ہو جائے گا تم میں سے کوئی آپ کے لئے فیصلہ کرتے ہیں تو ان میں سے ایک کا پیچھا. کمپیوٹیشنل ہیں تو سب سے پہلے لسانیات؟ تو کمپیوٹیشنل لسانیات ہے لسانیات کے درمیان تعلق کمپیوٹر سائنس. تو، لسانیات کیا ہے؟ کمپیوٹر سائنس کیا ہے؟ ویسے لسانیات سے، کیا ہم زبانیں ہیں لے. تو لسانیات اصل مطالعہ ہے جنرل میں قدرتی زبان کی. تو قدرتی زبان - ہم کے بارے میں بات ہم اصل میں کرنے کے لئے استعمال کرتے ہیں کہ زبان بدلیں ایک دوسرے کے ساتھ بات چیت. تو ہم بالکل بات نہیں کر رہے C یا جاوا بارے میں. ہم نے انگریزی کے بارے میں مزید بات کر اور کر رہے ہیں چینی اور دیگر زبانوں میں ہے کہ ہم ایک دوسرے کے ساتھ بات چیت کرنے کے لئے استعمال. اس کے بارے میں چیلنج بات یہ ہے کہ اب ہم تقریبا 7،000 دنیا میں زبانوں. تو بہت اعلی قسم ہے ہم مطالعہ کر سکتے ہیں کہ زبانوں کی. اور پھر آپ کو شاید یہ ہے کہ لگتا ہے ایسا کرنے کے لئے بہت مشکل ہے، مثال کے طور پر، ایک زبان سے ترجمہ دیگر، ہے کہ آپ غور تقریبا 7،000 ان میں سے. تو، آپ کو ترجمہ کر کے سوچتے ہیں ایک زبان سے دوسرے کے لئے آپ کو ہے تقریبا ایک ملین سے زیادہ مختلف مجموعہ ہے کہ آپ کر سکتے ہیں زبان سے زبان کے لئے ہے. تو یہ واقعی کچھ کرنے کے لئے چیلنج ہے مثال کے طور پر ترجمہ کے نظام کی قسم کے لئے ہر ایک زبان. تو، نحو کے ساتھ لسانیات کا علاج کرتا ہے، semantics کے، معنویات. آپ لوگ بالکل ضرورت نہیں ہے وہ کیا ہیں جاننا. لیکن بہت دلچسپ بات یہ ہے کہ آپ کو جاننے کے جب ایک مقامی اسپیکر، کے طور پر بچے کے طور پر زبان، آپ اصل میں جاننے کے ان چیزوں میں سے تمام - نحو میں semantics اور معنویات - خود کی طرف سے. اور کسی کے لئے آپ نحو کے پڑھانے کے لئے ہے آپ سزائیں ہیں کہ کس طرح سمجھنے کے لئے ڈھانچہ. تو، یہ واقعی دلچسپ ہے کیونکہ یہ بہت آتا ہے کہ کچھ ہے intuitively. اور تم سے کیا لے رہے ہیں کمپیوٹر سائنس؟ ٹھیک ہے، سب سے اہم بات یہ کہ ہم کمپیوٹر سائنس میں سب سے پہلے ہے تمام، مصنوعی ذہانت اور مشین لرننگ. تو، ہم کیا کر کرنے کی کوشش کر رہے ہیں کمپیوٹیشنل لسانیات سکھانے ہے کچھ کرنے کے لئے کس طرح آپ کے کمپیوٹر زبان کے ساتھ. تو، مثال کے طور پر، مشین میں ترجمہ. میں اپنے کمپیوٹر کو کس طرح پڑھانے کے لئے کوشش کر رہا ہوں ایک سے منتقلی کے لئے کس طرح جاننا دوسرے زبان. تو بنیادی طور پر تعلیم کی طرح ایک کمپیوٹر دو زبانوں. میں قدرتی زبان کی پروسیسنگ کرتے ہیں، مثال کے طور پر معاملہ ہے جس میں فیس بک کے گراف تلاش، تمہیں سکھاتا سمجھنے کے لئے کس طرح آپ کے کمپیوٹر سوالات کے ساتھ ساتھ. تو، آپ "کی تصاویر کا کہنا ہے کہ اگر میری دوست. "فیس بک کا علاج نہیں ہے ہے کہ ایک مکمل سٹرنگ کے طور پر الفاظ کی صرف ایک گروپ. یہ اصل میں کے سلسلے سمجھتا "فوٹو" اور "میرا دوست" اور کے درمیان "فوٹو" ہیں سمجھتا ہے کہ کی ملکیت "میرے دوست." تو، یہ ہے کہ، مثال کے طور پر، کا حصہ ہے قدرتی زبان کی پروسیسنگ. یہ سمجھنے کی کوشش کر رہا ہے کے درمیان کیا تعلق ہے ایک جملے میں الفاظ. اور بڑا سوال، آپ کر سکتے ہیں ہے بات کرنے کے لئے کس طرح ایک کمپیوٹر سکھانے عام طور پر ایک زبان؟ ایک بہت دلچسپ سوال ہے جو ، کے طور پر اگر شاید مستقبل میں، لگتا ہے کہ آپ کرنے کے قابل ہو جا رہے ہیں اپنے سیل فون سے بات. قسم کی ہم سری کے ساتھ کیا کرتے ہیں کی طرح لیکن کچھ کی طرح، آپ اصل میں کر سکتے ہیں آپ چاہتے ہیں جو کچھ بھی کہتے ہیں اور فون سب کچھ سمجھنے کے لئے کی جا رہی ہے. اور اس سوال کی پیروی کر سکتے ہیں اور بات کر رکھیں. یہ، واقعی دلچسپ کچھ ہے میری رائے میں. تو، قدرتی زبانوں کے بارے میں کچھ. کے بارے میں واقعی دلچسپ کچھ قدرتی زبانوں ہے، اور یہ ہے میری لسانیات پروفیسر کریڈٹ، ماریا Polinsky. وہ ایک مثال دیتا ہے اور مجھے لگتا ہے یہ واقعی دلچسپ ہے. ہم جب سے زبان سیکھتے ہیں کیونکہ ہم اپنے آ تو پیدا ہوا اور کر رہے ہیں زبان بدلیں قسم کی ہم پر اگتا ہے. اور بنیادی طور پر آپ کو زبان سیکھنے کے لئے کم سے کم ان پٹ کی طرف سے، ٹھیک ہے؟ آپ کو صرف کی طرف سے ان پٹ حاصل کر رہے ہیں آپ آپ کی زبان لگتا ہے کے والدین پسند ہے اور آپ کو صرف یہ جاننے کے. آپ کو نظر آتے ہیں، کیونکہ تو، یہ دلچسپ ہے ان جملوں میں، مثال کے طور پر. تمہیں دیکھ، "مریم ہر ایک کوٹ پر رکھتا ہے وقت وہ گھر چھوڑ دیتا ہے. " اس صورت میں، یہ ممکن ہے لفظ "وہ" حق، مریم کا حوالہ دیتے ہیں؟ آپ "مریم کوٹ پر رکھتا ہے کا کہنا ہے کہ کر سکتے ہیں، مریم چھوڑ دیتا ہے ہر وقت گھر. "تو ٹھیک ہے. لیکن پھر آپ کی سزا میں نظر آتے ہیں "وہ مریم کوٹ پر ہر وقت رکھتا ہے گھر چھوڑ دیتا ہے. "آپ کو یہ ہے "وہ" کا کہنا ہے کہ ناممکن مریم کا حوالہ دیتے ہوئے. "مریم رکھتا ہے کہنے کا کوئی راستہ نہیں ہے ایک کوٹ پر مریم چھوڑ دیتا ہے ہر وقت گھر. "تو یہ دلچسپ ہے کیونکہ اس انترجشتھان کی طرح ہے ہر مقامی اسپیکر ہے. اور کوئی بھی یہ ہے کہ سکھایا گیا تھا نحو کام کرتا ہے اس طرح. اور آپ کو صرف یہ "وہ" کر سکتے ہیں ، اس پہلی صورت میں مریم کا حوالہ دیتے ہوئے اور اصل میں اس دوسرے میں بھی، لیکن اس میں سے ایک میں. لیکن ہر قسم کے ہو جاتا ہے ایک ہی جواب. ہر کوئی اس پر اتفاق کرتے ہیں. تو یہ کس طرح اگرچہ واقعی دلچسپ ہے آپ تمام قوانین نہیں جانتے آپ کی زبان میں اس قسم کی آپ کو سمجھ زبان کس طرح کام کرتا. تو قدرتی بارے میں دلچسپ بات زبان آپ کو کرنے کی ضرورت نہیں ہے معلوم کرنے کے لئے کسی بھی نحو جانتے ہیں ایک سزا کے لئے گرائمر یا ungrammatical ہے زیادہ تر مقدمات. آپ کو لگتا ہے کہ جو ہو سکتا ہے کیا ہوتا ہے کہ آپ، آپ کی زندگی کے ذریعے ہے صرف زیادہ سے زیادہ ہو رہی رکھنے کے جملوں آپ کو بتایا. اور پھر آپ حفظ رکھنے جملوں کے تمام. اور پھر اگر کوئی آپ کو بتاتا ہے جب کچھ، آپ کو اس کی سزا سنا اور آپ اپنے الفاظ پر نظر سزائیں اور تو دیکھ اس کی سزا ہے. اور یہ وہاں ہے یہ گرائمر کا کہنا ہے کہ. یہ نہیں ہے تو آپ کو یہ کہنا ungrammatical. تو، اس صورت میں، آپ، اوہ، کہیں گے تو تم سب کی ایک بڑی فہرست ہے ممکن سزائیں. اور پھر آپ کو ایک جملہ سنتے ہیں، یہ گرائمر کی ہے یا اگر آپ کو معلوم ہے اس کی بنیاد پر نہیں. بات یہ ہے کہ آپ کو نظر آتے ہیں ایک جملہ، مثال کے طور پر، " پانچ سربراہی CS50 کی TFs اندھے پکا ایک DAPA پیالا کا استعمال کرتے ہوئے وکٹپس. "یہ یقینی طور پر نہیں ایک سزا تم سے پہلے سنا ہے کہ. لیکن ایک ہی وقت میں آپ کو یہ ہے حق، گرائمر کی بہت؟ کوئی گرائمر کی غلطیاں تو نہیں ہیں اور آپ کہہ سکتے ہیں کہ یہ ایک ممکنہ سزا ہے. تو اس نے ہمیں لگتا ہے کہ اصل میں ہم زبان سیکھنے کے اس طرح سے نہیں ہے ممکن کی ایک بڑی ڈیٹا بیس کی طرف سے الفاظ یا جملے، لیکن زیادہ کے درمیان تعلق کو سمجھنے ان جملوں میں الفاظ. احساس ہے کہ ہے؟ تو، پھر سوال، کر سکتے ہیں کمپیوٹر زبانوں کو سیکھنے؟ ہم کمپیوٹر زبان کو سکھانے کر سکتے ہیں؟ تو، کے فرق کے بارے میں سوچتے ہیں ایک زبان کے ایک مقامی اسپیکر کے درمیان اور ایک کمپیوٹر. تو، کیا اسپیکر ہوتا ہے؟ ٹھیک ہے، مقامی اسپیکر ایک سیکھتا ہے اس نمائش سے بدلیں. عام طور پر اس ابتدائی بچپن سال. تو، بنیادی طور پر، آپ کو صرف، ایک بچہ ہے اور آپ اس سے بات رکھنے کے، اور یہ صرف بات کرنے کے لئے کس طرح سیکھتا ہے زبان، ٹھیک ہے؟ تو، آپ بنیادی طور پر دے رہے ہیں بچے کو ان پٹ. تو، تو آپ بحث کر سکتے ہیں کہ ایک کمپیوٹر حق، ایک ہی بات کر سکتے ہیں؟ آپ کو صرف زبان دے سکتے ہیں کمپیوٹر پر ان پٹ کے طور پر. مثال کے طور پر کے طور پر فائلوں کا ایک گروپ انگریزی میں کتابوں ہے کہ. ہو سکتا ہے کہ ایک طریقہ ہے کہ آپ اس ممکنہ طور پر ایک سکھا سکتے ہیں کمپیوٹر انگریزی، ٹھیک ہے؟ اور حقیقت میں، آپ اس کے بارے میں کیا سوچتے ہیں، یہ ہو سکتا ہے کہ ایک جوڑے لیتا ہے ایک کتاب کو پڑھنے کے لئے دن. ایک کمپیوٹر کے لئے یہ ایک دوسرے لیتا ہے ایک کتاب میں تمام الفاظ پر نظر. تو آپ ہو سکتا ہے کہ میں سوچ سکتے ہیں صرف اس آپ کے ارد گرد کی طرف سے ان پٹ کی دلیل، یہ ہے کا کہنا ہے کہ کافی نہیں ہے صرف انسانوں کر سکتے ہیں کہ کچھ. آپ کو کمپیوٹر میں سوچ سکتے ہیں یہ بھی ان پٹ حاصل کر سکتے ہیں. دوسری بات یہ ہے کہ بولنے یہ بھی ہے کہ ایک دماغ ہے زبان سیکھنے کی صلاحیت. لیکن آپ کو اس کے بارے میں لگتا ہے کہ اگر، ایک دماغ ایک ٹھوس چیز ہے. تم پیدا کر رہے ہیں، یہ پہلے سے ہی قائم ہے - یہ آپ کے دماغ ہے. آپ بڑے ہو جاتے ہیں اور کے طور پر، آپ کو صرف حاصل زبان کی ان پٹ اور شاید غذائی اجزاء اور دیگر چیزیں. لیکن بہت زیادہ آپ کے دماغ ایک ٹھوس چیز ہے. تو آپ کو اچھی طرح سے، ہو سکتا ہے کہ آپ کر سکتے ہیں، کا کہنا ہے کہ کر سکتے ہیں، ایک گروپ کی ہے کہ ایک کمپیوٹر کے کی تعمیر کام کرتا ہے اور صرف نقل ہے کہ طریقوں زبان سیکھنے کی صلاحیت. تو اس معنی میں، آپ میں، اچھی طرح سے، کہہ سکتے ہیں تمام ہے کہ ایک کمپیوٹر ہو سکتا ہے میں زبان سیکھنے کے لئے چیزوں کی ضرورت ہے. اور آخری بات یہ ہے کہ ایک مقامی اسپیکر کے مقدمے کی سماعت اور غلطی سے سیکھتا ہے. تو بنیادی طور پر ایک اور اہم بات یہ ہے کہ میں زبان سیکھنے ہے کہ آپ کی قسم کے بنانے کی طرف سے چیزیں سیکھنے تم نے سنا ہے کی عمومی. آپ کو بڑھ رہے ہیں کے طور پر تو آپ کو جاننے کے کہ کچھ الفاظ زیادہ اسم کی طرح ہیں، کچھ دوسرے لوگوں کے صفت ہیں. اور آپ کسی بھی کرنے کی ضرورت نہیں ہے لسانیات کا علم سمجھتے ہیں کہ. لیکن آپ صرف کچھ الفاظ وہاں ہے کے کچھ حصے میں پوزیشن میں ہیں سزا اور دوسرے میں کچھ دوسروں سزا کے مختلف حصوں. اور یہ کہ آپ ہے کہ کچھ کرتے ہیں جب صحیح نہیں ہے کہ ایک سزا کی طرح - ہو سکتا ہے کیونکہ ایک سے زیادہ سامانییکرن کے مثال کے طور پر. آپ کو بڑھتی ہوئی کر رہے ہیں جب شاید، آپ کو نوٹس جمع عام طور پر ہے میں ایک S ڈال کی طرف سے قائم لفظ کے آخر. اور پھر آپ کی جمع کرنے کی کوشش کریں "deers" یا "دانت" کے طور پر "ہرن" "tooths." تو پھر اپنے والدین یا اگر کوئی آپ corrects اور، کا کہنا ہے کہ نہیں، "ہرن" کی جمع "، ہرن" ہے اور "دانت" کی جمع "دانت" ہے. اور پھر آپ کو ان چیزوں کو جاننے کے. تو آپ کو مقدمے کی سماعت اور غلطی سے سیکھنے. لیکن آپ یہ بھی کر سکتے ہیں کہ ایک کمپیوٹر کے ساتھ. آپ کو کچھ نام نہاد کر سکتے ہیں کمک سیکھنا. ایک دینے کی طرح بنیادی طور پر ہے جو یہ کرتا ہے جب بھی کمپیوٹر انعام صحیح طریقے سے کچھ. اور یہ ایک اجر کے برعکس دے اور یہ کچھ غلط کرتا ہے. تم واقعی میں دیکھ سکتے ہیں کہ آپ تو Google Translate کے اور آپ کو کرنے کی کوشش کریں ایک جملہ کا ترجمہ، اس رائے کے لئے آپ سے کہتا ہے. آپ کا کہنا ہے اگر ایسا ہے تو، اوہ، ایک بہتر ہے اس جملے کے لئے ترجمہ. اس کے بعد آپ اسے ٹائپ کریں اور کر سکتے ہیں کی ایک بہت لوگ اس کو ایک بہتر ہے کہ کو برقرار رکھنے کے ترجمہ، یہ صرف سیکھتا ہے کہ یہ بجائے اس کے کہ ترجمہ کا استعمال کرنا چاہئے یہ دے رہا تھا ایک. تو، یہ ایک بہت ہی فلسفیانہ سوال ہے کمپیوٹر جا رہے ہیں تو دیکھنے کے لئے مستقبل میں بات کریں یا نہ کرنے کے قابل. لیکن مجھے بہت امید ہے کہ وہ کر سکتے ہیں صرف ان دلائل کی بنیاد پر. لیکن یہ ایک فلسفیانہ صرف زیادہ ہے سوال. کمپیوٹر اب بھی بات نہیں کر سکتے ہیں تو، ہم کر سکتے ہیں وہ چیزیں کیا ہیں؟ کچھ واقعی ڈاؤن لوڈ، اتارنا چیزیں ہیں ڈیٹا کی درجہ بندی. تو، مثال کے طور پر، کیا تم لوگ جانتے ہو اس ای میل کی خدمات کے لئے، کر مثال کے طور پر، سپیم فلٹرنگ. آپ سپیم وصول تو جب بھی، یہ ایک اور باکس پر فلٹر کرنے کے لئے کی کوشش کرتا ہے. تو یہ کس طرح ہے کہ ہے؟ یہ کمپیوٹر صرف جانتا ہے کہ نہیں ہے کیا ای میل پتوں سپیم بھیج رہے ہیں. تو اس سے زیادہ کے مواد کی بنیاد پر ہے پیغام، یا شاید عنوان، یا شاید آپ کو ضرورت ہے کہ کچھ پیٹرن. تو، بنیادی طور پر، کیا آپ کر سکتے ہیں حاصل کرنے کے لئے ہے سپیم ہے کہ ای میلز کے اعداد و شمار کے بہت سے، سپیم کے نہیں ہیں، اور سیکھنے ہے کہ ای میلز کیا آپ میں پیٹرن کی قسم فضول ہیں کہ لوگ. اور یہ کمپیوٹیشنل کا حصہ ہے لسانیات. یہ اعداد و شمار کے درجہ بندی کے کہا جاتا ہے. اور ہم اصل کو دیکھنے کے لئے جا رہے ہیں ایک اگلا سلائڈ میں اس کی مثال. دوسری بات یہ قدرتی زبان ہے بات یہ ہے، جس کی پروسیسنگ ہے کہ گراف تلاش دے کے کر رہا ہے آپ کو ایک جملہ لکھتے ہیں. اور یہ آپ کو سمجھ اعتماد کیا معنی اور دیتا ہے آپ کو ایک بہتر نتیجہ. اصل میں، آپ گوگل یا بنگ پر جاتے ہیں اور آپ کو لیڈی کی طرح کچھ تلاش مورھ کی اونچائی، آپ اصل میں جا رہے ہیں بجائے اس کے بارے میں معلومات کی 5 '1 "حاصل کرنے کے لئے یہ اصل میں سمجھتا کیونکہ اس سے آپ کے بارے میں بات کر رہے ہیں کیا. تو یہ قدرتی کا حصہ ہے زبان کی پروسیسنگ. یا بھی آپ سب سے پہلے، سری کا استعمال کرتے ہوئے کر رہے ہیں جب آپ کے لئے کوشش کرتا ہے کہ ایک الگورتھم ہے تم کیا کہہ رہے ترجمہ الفاظ میں، متن میں. اور پھر اس کا ترجمہ کرنے کی کوشش کرتا ہے کہ معنی میں. تو یہ تمام قدرتی کا حصہ ہے زبان کی پروسیسنگ. اس کے بعد آپ کی مشین ترجمہ ہے - اصل میں ایک ہے جس میں میرے پسندیدہ میں سے - صرف کی طرف سے ترجمہ کیا ہے جس میں دوسرے ایک زبان. تو آپ کر رہے ہیں لگتا ہے کہ کر سکتے ہیں، مشینی ترجمہ، آپ کے پاس سزائیں کی لامحدود امکانات. تو ذخیرہ کرنے کا کوئی راستہ نہیں ہے ہر ایک ترجمہ. تو آپ کو دلچسپ کے ساتھ آنے کے لئے ہے الگورتھم کرنے کے قابل ہو ہر ایک ترجمہ کسی طرح کی سزا. تم لوگوں کو اب تک کوئی سوال ہے؟ کوئی؟ ٹھیک ہے. تو کیا آج ہم کو دیکھنے کے لئے جا رہے ہیں؟ سب سے پہلے، میں نے کے بارے میں بات کرنے جا رہا ہوں درجہ بندی مسئلہ. تو میں تھا کہ ایک سپیم کے بارے میں کہہ رہے ہیں. میں کیا کرنے جا رہا ہوں دیا غزلیں، ہے ایک گیت کے لئے، آپ کو جاننے کی کوشش کر سکتے ہیں زیادہ امکان کے ساتھ گلوکار کون ہے؟ کی میں لیڈی سے گانے، نغمے ہے کہ کہتے ہیں گاگا اور کیٹی پیری، میں آپ کو ایک دے نیا گیت، آپ اعداد و شمار کر سکتے ہیں یہ کیٹی پیری یا لیڈی مورھ ہے؟ دوسرا، میں نے صرف بات کرنے کے لئے جا رہا ہوں انقطاع مسئلہ کے بارے میں. تو میں نے تم لوگوں کو جانتے ہیں جانتے ہیں، لیکن نہیں ہے ، چینی جاپانی، دیگر مشرقی ایشیائی زبانوں، اور دیگر زبانوں میں عام طور پر، کی ضرورت نہیں ہے الفاظ کے درمیان خالی جگہوں. اور پھر آپ کو اس طرح کے بارے میں کیا سوچتے ہیں کوشش کرتا ہے کے آپ کے کمپیوٹر قسم قدرتی زبان کی پروسیسنگ کو سمجھنے، اس کے الفاظ میں لگتا ہے اور تعلقات کو سمجھنے کی کوشش کرتا ہے ان کے درمیان، ٹھیک ہے؟ لیکن اس وقت آپ کو آپ کے چینی ہے، اور اگر صفر خالی جگہوں ہے، یہ مشکل واقعی ہے کے درمیان کیا تعلق ہے حاصل الفاظ، کیونکہ وہ کسی بھی ضرورت نہیں ہے پہلے الفاظ. تو آپ کو کہا جاتا ہے کچھ کرنا پڑے صرف ڈال، جس کا مطلب انقطاع ہم فون کروں گا کیا کے درمیان خالی جگہوں ان زبانوں میں الفاظ. احساس ہے؟ اور پھر ہم جا رہے ہیں نحو کے بارے میں بات. قدرتی بارے میں تو صرف تھوڑا سا زبان کی پروسیسنگ. یہ صرف ایک جائزہ ہو رہا ہے. تو آج، بنیادی طور پر میں کیا کرنا چاہتے ہیں لوگ آپ کو ایک کا ایک تھوڑا سا دینے کے ہے امکانات کیا ہیں کے اندر آپ کمپیوٹیشنل کے ساتھ کیا کر سکتے ہیں لسانیات. اور پھر آپ کو آپ کے خیال میں کیا دیکھ سکتے ہیں ان چیزوں کے علاوہ ٹھنڈا ہے. اور شاید آپ کو ایک منصوبہ کے بارے میں سوچ کر سکتے ہیں اور مجھ سے بات آئے. اور میں آپ کو مشورہ دے سکتے ہیں اسے لاگو کرنے کے لئے کس طرح. تو نحو تھوڑا سا ہونے جا رہا ہے گراف تلاش اور مشین کے بارے میں ترجمہ. میں کس طرح کی ایک مثال دینے جا رہا ہوں آپ، مثال کے طور پر، کا ترجمہ کر سکتے انگریزی پرتگالی سے کچھ. اچھا لگتا ہے؟ تو سب سے پہلے، درجہ بندی کا مسئلہ. میں کہونگا کہ سیمینار کا یہ حصہ سب سے زیادہ مشکل ہو جا رہا ہے وہاں جا رہا ہے صرف اس وجہ سے کچھ کوڈنگ ہو. لیکن یہ ازگر جا رہا ہے. میں تم لوگوں ازگر جانتے ہیں، ایسا نہیں جانتے میں صرف اعلی پر وضاحت کرنے کے لئے جا رہا ہوں میں کیا کر رہا ہوں سطح. اور آپ بھی واقعی پرواہ نہیں ہے کہ ہے کیونکہ نحو کے بارے میں زیادہ تم لوگ سیکھ سکتے ہیں کچھ. ٹھیک ہے؟ اچھا لگتا ہے. تو درجہ بندی کیا مسئلہ ہے؟ تو آپ کے لئے کچھ کی غزلیں دے رہے ہیں ایک گیت، اور آپ کو لگتا ہے کرنا چاہتے ہیں یہ کون گا رہا ہے. اور یہ کسی بھی قسم کی کے لئے ہو سکتا ہے دیگر مسائل کے. تو یہ، مثال کے طور پر، آپ کو ایک ہے کیا جا سکتا ہے صدارتی مہم اور آپ کو ایک ہے تقریر، اور آپ تلاش کرنا چاہتے ہیں یہ تھا اگر، مثال کے طور پر، اوبامہ یا مٹ رومنی. یا آپ کے ای میلز کا ایک گروپ ہے کر سکتے ہیں اور آپ کو وہ ہیں معلوم کرنا چاہتے ہیں سپیم یا نہیں. تو یہ صرف کچھ درجہ بندی ہے الفاظ کی بنیاد پر اعداد و شمار کے آپ وہاں ہے. تو ایسا کرنے کے لئے، آپ کی ضرورت کچھ مفروضات. تو کمپیوٹیشنل لسانیات کے بارے میں بہت کچھ مفروضات کر رہا ہے، عام طور پر ہوشیار مفروضات، تاکہ آپ کو اچھے نتائج حاصل کر سکتے ہیں. اس کے لئے ایک ماڈل بنانے کی کوشش. اور پھر، اسے باہر کرنے کی کوشش کریں اور یہ کام کرتا ہے کو دیکھنے کے یہ آپ کو اچھی صحت سے متعلق فراہم کرتا ہے تو. اور یہ کرتا ہے، تو آپ اس کو بہتر بنانے کے لئے کوشش کریں. یہ آپ، ٹھیک ہے، کی طرح ہو نہیں ہے، تو شاید میں ایک مختلف مفروضہ کرنا چاہئے. تو ہم جا رہے ہیں کہ مفروضہ بنانے کے ایک فنکار عام طور پر گاتی ہے شاید کے بارے میں ایک موضوع ایک سے زیادہ بار، اور الفاظ ایک سے زیادہ بار استعمال کرتا ہے صرف وہ اس کے لئے استعمال کیا جاتا رہے ہیں. آپ کو صرف اپنے دوست کے بارے میں سوچ کر سکتے ہیں. میں تم لوگوں کے تمام دوستوں کو یقین ، ان کے دستخط کے جملہ کا کہنا ہے کہ لفظی ہر ایک کی سزا کے لئے - کچھ مخصوص لفظ یا کچھ مخصوص کی طرح وہ کہتے ہیں کہ جملہ ہر ایک کی سزا. اور آپ کو کیا کہہ سکتے ہیں ہے کہ آپ دیکھتے ہیں دستخط ہے کہ ایک سزا جملہ، آپ اندازہ لگا سکتے ہیں کہ شاید آپ کا دوست ہے ایک صحیح، یہ کہہ؟ تو آپ کو پھر اس مفروضے بنانے اور کہ آپ کو ایک ماڈل بنانے کے کس طرح ہے. میں دینے جا رہا ہوں کہ مثال کے طور پر ہے کس طرح لیڈی مورھ، مثال کے طور پر، لوگوں کو وہ کے لئے "بچے" کا استعمال کرتا ہے کا کہنا ہے کہ اس کے تمام نمبر ایک گانے، نغمے. اور اصل میں یہ ایک ویڈیو ہے کہ ظاہر کرتا ہے اس لفظ "بچے" کے لئے کہہ رہے ہیں مختلف گانے، نغمے. [ویڈیو پلے بیک] - (گانا) بچے. بچے. بچے. بچے. بچے. بیبی. بچے. بچے. بچے. بچے. [END ویڈیو پلے بیک، لوکاس Freitas میں: تو، مجھے لگتا ہے کہ، ہیں وہ کہتی ہیں جس میں 40 گانے، نغمے لفظ "بچے." تو آپ بنیادی طور پر اندازہ لگا سکتے ہیں کہ آپ کو ہے کہ ایک گانا دیکھتے ہیں لفظ "بچے،" کچھ اعلی ہے اس لیڈی مورھ ہے کہ امکان. لیکن اس کی ترقی کرنے کی کوشش کریں مزید رسمی طور پر. تو ان کی طرف سے گانے، نغمے کی غزلیں ہیں لیڈی گاگا اور کیٹی پیری. تو آپ لیڈی مورھ کی طرف دیکھو، آپ کو وہ دیکھتے ہیں کے واقعات کی ایک بہت ہے "بچے،" ایک کے واقعات کی بہت "جس طرح." اور پھر کیٹی پیری کے واقعات کی ایک بہت ہے "،" کے واقعات کی ایک بہت "آگ." تو بنیادی طور پر ہم چاہتے ہیں آپ کو ایک گیت کو حاصل، ہے. آپ کو ایک کے لئے ایک گیت ہے کہ کہتے ہیں "، بچے" صرف "بچے." ہے کہ نغمہ تو آپ کو صرف لفظ "بچے،" اور یہ حاصل آپ کی طرف سے ہے کہ تمام اعداد و شمار ہے لیڈی گاگا اور کیٹی پیری، جو کہ آپ کو اندازہ ہے شخص جو گیت گاتی ہے؟ لیڈی مورھ یا کیٹی پیری؟ لیڈی مورھ، ٹھیک ہے؟ وہ کہتی ہیں جو صرف ایک ہی ہے کیونکہ "بچے." یہ درست، بیوکوف لگتا ہے؟ ٹھیک ہے، یہ واقعی آسان ہے. میں نے صرف دو گانے، نغمے اور کی تلاش کر رہا ہوں کورس کے، وہ کیا ہے جو صرف ایک ہے "بچے." لیکن آپ کے الفاظ کی ایک گروپ کیا ہے؟ آپ کو ایک حقیقی گیت، کچھ ہے تو کی طرح، "بچے، میں صرف ایک [دیکھنے کے لئے گئے تھے؟ CFT؟] لیکچر، "یا اس طرح کچھ، اور تو آپ کو اصل اعداد و شمار کے لئے ہے - ان تمام الفاظ کی بنیاد پر - جو آرٹسٹ ہے جو شاید یہ گانا گایا؟ تو ترقی کرنے کی کوشش کریں ایک چھوٹا سا مزید. ٹھیک ہے، تو صرف اعداد و شمار کی بنیاد پر کہ ہم ہے، یہ مورھ شاید ہے کہ لگتا ہے گلوکار. لیکن ہم کس طرح لکھ سکتے ہیں اس سے زیادہ باضابطہ طور پر؟ اور ایک چھوٹا سا ہو جا رہا ہے اعداد و شمار کے سا. تو کیا تم کھو تو، صرف کی کوشش تصور کو سمجھنے کے لئے. آپ سمجھ تو یہ کوئی فرق نہیں پڑتا مساوات بالکل اچھی طرح سے. یہ تمام آن لائن کی جا رہی ہے. تو بنیادی طور پر جو میں نے حساب رہا ہوں اس گیت کی طرف سے ہے کہ امکان لیڈی مورھ کہ دیا - تو اس بار دی ہے کہ کا مطلب ہے - میں لفظ دیکھا "بچے." احساس ہے کہ ہے؟ تو میں حساب کرنے کے لئے کوشش کر رہا ہوں امکان ہے کہ. نام نہاد اس قضیہ ہے کا کہنا ہے کہ Bayes پرمیئ ایک دیا بی کا امکان ہے، ایک، بار دی بی کے امکانات امکانات پر ایک کے امکانات، بی کی یہ ایک طویل مساوات ہے. لیکن کیا تم سے سمجھنے کی ہے کہ اس میں کرنا چاہتے ہیں کیا ہے حق، کا حساب؟ اس گانے کی طرف سے ہے تو امکان لیڈی مورھ میں لفظ دیکھا کہ دیا "بچے." اور اب کیا ہو رہا ہے دیئے گئے لفظ "بچے" کے امکانات میں لیڈی مورھ ہے. اور یہ کہ بنیادی طور پر کیا ہے؟ اس کا مطلب کیا ہے، کیا ہے لفظ "بچے" دیکھ کے امکانات مورھ کی غزلیں میں؟ میں نے ایک بہت میں حساب کرنے کے لئے چاہتے ہیں تو آسان طریقہ، اس کی صرف تعداد ہے بار میں نے کل تعداد پر "بچے" دیکھ مورھ کی غزلیں میں الفاظ کی، ٹھیک ہے؟ میں دیکھ رہا ہوں کہ تعدد کیا ہے مورھ کے کام میں اس لفظ؟ احساس ہے؟ دوسری اصطلاح ہے مورھ کے امکانات. اس کا کیا مطلب ہے؟ یہ بنیادی طور پر مطلب ہے، کیا ہے درجہ بندی کے امکانات مورھ کے طور پر کچھ غزلیں؟ اور اس قسم کے عجیب ہے، لیکن کی ایک مثال کے بارے میں سوچتے ہیں. تو چلو کا کہنا ہے کہ کے امکانات ایک گیت میں "بچے" ہونے کے ایک ہی ہے گاگا اور برٹنی سپیئرز کے لئے. لیکن برٹنی سپیئرز دو بار ہے لیڈی گاگا سے زیادہ گانے، نغمے. تو کسی کو صرف تصادفی آپ کو دیتا ہے تو سب سے پہلی چیز "، بچے" کی غزلیں تم میں ہے نظر، کا امکان ہے ایک مورھ گیت میں "بچے" ہونے، "بچے" ایک برٹنی گیت میں؟ اور یہ ایک ہی بات ہے. تو آپ دیکھیں گے کہ دوسری بات یہ ہے، ٹھیک ہے، کے امکانات کیا ہے خود کی طرف سے اس کے گیت، ایک مورھ گیت ہونے اور امکان ہے ایک برٹنی گیت جا رہے ہیں؟ تو برٹنی بہت سے مزید دھن نہیں ہے کے بعد سے مورھ سے، آپ کو شاید گے کا کہنا ہے کہ، اچھی طرح سے، شاید یہ ہے ایک برٹنی گیت. ہم اس کی ہے یہی وجہ ہے کہ یہاں اصطلاح. مورھ کے امکانات. سمجھ میں آتا ہے؟ یہ کیا ہے؟ ٹھیک ہے. اور گزشتہ ایک صرف امکان ہے "بچے" کی جس نہیں کرتا واقعی کوئی فرق اتنا. لیکن اس کا امکان ہے انگریزی میں "بچے" دیکھ کر. ہم عام طور پر اس کی پرواہ نہیں ہے اس اصطلاح کے بارے میں زیادہ. احساس ہے کہ ہے؟ تو گاگا کا امکان ہے پہلے احتمال کہا جاتا ہے کلاس مورھ کی. یہ صرف کا مطلب ہے کہ اس کی وجہ کیا ہے، کہ کلاس ہونے کا امکان - مورھ، جس میں ہے - صرف عام طور پر، صرف کوئی حالات کے ساتھ. اور پھر میں نے کا امکان ہے جب "بچے،" ہم یہ کہتے ہیں کے علاوہ دی مورھ یہ ہے کیونکہ ایک امکان teary ہونے کا امکان مورھ کچھ ثبوت دیا. تو میں تمہیں ثبوت دے رہا ہوں میں لفظ کے بچے کو دیکھا اور یہ کہ نغمہ مطلب ہے؟ ٹھیک ہے. میں حساب اگر ایسا ہے تو یہ ہے کہ ہر ایک کے لئے لیڈی گاگا کے لئے گانے، نغمے، کہ کیا ہو گا - بظاہر، میں نے اس کو منتقل نہیں کر سکتے ہیں. گاگا کا امکان ہو جائے گا کچھ کی طرح، 2 24 بار 1/2، 53 سے زیادہ 2 پر. اگر تم جانتے ہو اس سے کوئی فرق نہیں ہے ان کی تعداد سے آ رہے ہیں. لیکن یہ جا رہا ہے کہ صرف ایک نمبر ہے حق، 0 سے زیادہ ہو؟ اور پھر میں کیٹی پیری، جب کیٹی دیا "بچے" کا امکان ہے پہلے ہی 0، ٹھیک ہے؟ کوئی "بچے" نہیں ہے کیونکہ کیٹی پیری میں. تو اس 0 ہو جاتا ہے، اور مورھ جیت، جس میں مورھ مطلب یہ ہے کہ شاید گلوکار. احساس ہے کہ ہے؟ ٹھیک ہے. تو میں نے اس سے زیادہ سرکاری بنانا چاہتے ہیں، میں اصل میں ایک ماڈل کر سکتے ہیں ایک سے زیادہ الفاظ کے لئے. تو میں کچھ ہے کہ کہتے ہیں کی طرح، "بچے، میں ہوں آگ پر، "یا کچھ اور. تو یہ ایک سے زیادہ الفاظ ہیں. اور اس معاملے میں، آپ دیکھ سکتے ہیں کہ "بچے"، مورھ میں ہے لیکن یہ کیٹی میں نہیں ہے. اور "آگ" کیٹی میں ہے، لیکن یہ درست ہے، مورھ میں نہیں ہے؟ تو یہ درست ہے، trickier ہو رہا ہے؟ ایسا لگتا ہے کہ اس کی وجہ سے آپ کو تقریبا دونوں کے درمیان ٹائی ہے. تو کیا تمہیں کیا کرنا ہے فرض ہے الفاظ کے درمیان آزادی. تو بنیادی طور پر اس کا مطلب یہ ہے کہ میں صرف کیا ہے حساب کر رہا ہوں دیکھ کے امکانات "بچے،" کیا ہے دیکھ کے امکانات "میں،" اور "آگ" "ہوں"، اور "پر،" اور تمام علیحدہ علیحدہ. پھر میں نے ان سب کو ضرب کر رہا ہوں. اور میں امکان ہے کیا دیکھ رہا ہوں کی پوری سزا دیکھ کر. احساس ہے؟ تو بنیادی طور پر، میں نے صرف ایک لفظ ہے تو، میں کیا تلاش کرنے کے لئے چاہتے ہیں ARG زیادہ سے زیادہ ہے، جس کا مطلب ہے، ہے کہ کلاس کیا ہے مجھے سب سے زیادہ امکان دے؟ تو دے رہا ہے کہ کلاس کیا ہے میرے لئے سب سے زیادہ امکان کلاس کے امکانات لفظ دیا. تو اس صورت میں، مورھ "بچے." دیا یا کیٹی "بچے." دیا احساس ہے؟ اور صرف Bayes سے، کہ میں ظاہر ہوتا ہے کہ مساوات، ہم اس حصہ بنانے کے. صرف ایک چیز آپ دیکھتے ہیں کہ یہ ہے کہ دیئے گئے لفظ کا امکان کے لحاظ سے کلاس تبدیلیاں کلاس پر، ٹھیک ہے؟ میں ہے کہ "بچے" S کی تعداد مورھ میں کیٹی سے مختلف ہے. کلاس کے امکانات بھی یہ صرف تعداد ہے تبدیلیوں کی وجہ سے ان کے گانے، نغمے میں سے ہر ایک ہے. لیکن لفظ خود کا امکان سب کے لئے ایک ہی کی جا رہی ہے فنکاروں، ٹھیک ہے؟ تو لفظ کا امکان ہے صرف، کا امکان ہے میں اس لفظ کو دیکھ کر انگریزی زبان میں؟ تو یہ ان میں سے سب کے لئے ایک ہی ہے. اس مسلسل جاری ہے تو، ہم کر سکتے ہیں اس کمی اور اس کے بارے میں پرواہ نہیں. تو یہ اصل میں ہو جائے گا ہم کے لئے تلاش کر رہے ہیں، مساوات. میں ایک سے زیادہ الفاظ ہیں اور اگر، مجھے اب بھی پہلے کی ضرورت کے لئے جا یہاں امکان. صرف ایک چیز مجھے ضرب رہا ہے کا امکان دیگر تمام الفاظ. تو میں نے ان سب کو ضرب کر رہا ہوں. احساس ہے؟ یہ عجیب لگتا ہے لیکن بنیادی طور پر مطلب کلاس کے پہلے، اور حساب پھر ہر ایک کے امکان کی طرف سے ضرب کہ کلاس میں کیا جا رہا ہے کے الفاظ کی. اور کیا تمہیں پتہ ہے کہ ایک کا امکان ایک کلاس دیئے گئے لفظ کی جا رہی ہے آپ میں اس لفظ کو دیکھنے کی تعداد کی تعداد کی طرف سے تقسیم ہے کہ کلاس، الفاظ آپ کو اس میں ہے عام طور پر کلاس. احساس ہے؟ اس پر 2 کس طرح "بچے" تھا ہے الفاظ کی تعداد ہے میں کی غزلیں میں تھا. تو تعدد. لیکن ایک بات ہے. مجھے دکھا رہا تھا کہ کس طرح یاد رکھیں کہ "بچے" ہونے کی غزلیں کا امکان کیٹی پیری 0 تھا صرف اس وجہ سے کیٹی پیری بالکل "بچے" کی ضرورت نہیں تھی؟ لیکن یہ صرف ایک چھوٹا سا سخت آواز بس کی غزلیں سے نہیں ہو سکتا ہے کا کہنا ہے کہ وہ نہیں ہے صرف اس وجہ سے ایک فنکار کسی بھی وقت خاص طور پر اس لفظ. اگر تو آپ کو صرف، اچھی طرح سے، کہہ سکتے ہیں اس لفظ کی ضرورت نہیں ہے، میں جا رہا ہوں آپ ایک کم احتمال دے، لیکن میں صرف کرنے کے لئے نہیں جا رہا ہوں فورا آپ 0 دے. شاید یہ کچھ، کی طرح تھا کیونکہ ہے جو "آگ، آگ، آگ، آگ،" مکمل طور پر کیٹی پیری. اور پھر "بچے،" اور یہ صرف پر جاتا ہے 0 فورا وہاں تھا کیونکہ "بچے." تو بنیادی طور پر ہم کیا کچھ ہے Laplace smoothing کے کہا جاتا ہے. اور یہ صرف میں دے رہا ہوں کہ اس کا مطلب یہاں تک کہ الفاظ کے لئے کچھ امکان اس کا کوئی وجود نہیں ہے. تو مجھے کیا ہے کہ میں ہوں جب اس حساب، میں نے ہمیشہ کے لئے 1 کا اضافہ شمار کنندہ. لفظ میں، موجود نہیں ہے تو بھی اگر اس 0 ہے تو اس صورت،، میں اب بھی ہوں پر 1 کے طور پر اس کا حساب الفاظ کی کل تعداد. دوسری صورت میں، میں نے کس طرح بہت سے الفاظ میں ہے اور میں 1 کا اضافہ. تو میں دونوں صورتوں کے لئے گنتی کر رہا ہوں. احساس ہے؟ تو اب کچھ کوڈنگ کرتے ہیں. میں، بہت تیزی سے ایسا کرنے کے لئے جا رہا ہوں لیکن یہ صرف اہم ہے کہ آپ اس لوگ تصورات کو سمجھنے. تو کیا ہم کیا کرنے کی کوشش کر رہے ہیں بالکل اس پر عمل درآمد کیا جاتا ہے میں صرف کہا کہ بات - میں نے آپ سے کی غزلیں ڈال کرنا چاہتے ہیں لیڈی گاگا اور کیٹی پیری. اور پروگرام کرنے کے قابل ہونے جا رہا ہے ان نئے غزلیں مورھ طرف سے ہیں تو کہتے ہیں کہ یا کیٹی پیری. احساس ہے؟ ٹھیک ہے. تو میں جا رہا ہوں، اس پروگرام ہے classify.py فون کرنے کے لئے. تو اس ازگر ہے. یہ ایک نئی پروگرامنگ زبان ہے. یہ کچھ میں بہت اسی طرح ہے سی اور پی ایچ پی کے طریقوں پر. آپ کرنا چاہتے ہیں کیونکہ اگر یہ اسی طرح ہے سی جاننے کے بعد ازگر میں جاننے کے، یہ ایک چیلنج کی واقعی ہے کہ زیادہ نہیں ازگر بہت آسان ہے صرف اس وجہ سے سے سی، سب سے پہلے. اور چیزوں کی ایک بہت پہلے سے ہی ہیں آپ کے لئے لاگو کیا. تو کس طرح پی ایچ پی کی طرح کام کرتا ہے ایک فہرست ترتیب، یا کچھ شامل ایک صف، یا بلاہ، بلاہ، بلاہ پر. ازگر کے ساتھ ساتھ ان میں سے سب ہے. تو میں نے صرف فوری طور پر وضاحت کرنے کے لئے جا رہا ہوں ہم درجہ بندی کر سکتے ہیں کس طرح یہاں کے لئے مسئلہ. تو اس صورت میں، میں ہے کہ کہتے ہیں گاگا اور کیٹی پیری سے کی غزلیں. میں ان کی غزلیں ہے کہ طریقہ ہے کی غزلیں کا پہلا لفظ ہے آرٹسٹ کے نام، اور باقی کی غزلیں ہے. تو میں اس فہرست میں ہے کہ کہتے ہیں جس میں سب سے پہلے ایک مورھ کی طرف سے کی غزلیں ہے. تو یہاں میں صحیح راستے پر ہوں. اور اگلے ایک کیٹی ہے، اور یہ بھی دھن نہیں ہے. تو یہ آپ کا اعلان ہے ازگر میں ایک متغیر. آپ کے اعداد و شمار کی قسم دینے کے لئے کی ضرورت نہیں ہے. آپ کو صرف "غزلیں،" لکھنا قسم کے پی ایچ پی میں پسند. احساس ہے؟ تو میں ہے کہ چیزیں کیا ہیں حساب کرنے کے لئے کے قابل ہو جائے کا حساب امکانات؟ میں "priors" کا حساب کرنے کے لئے ہے مختلف سے ہر ایک کی میں ہے کہ کلاس. میں "posteriors،" کا حساب کرنے کے لئے ہے یا بہت زیادہ امکانات کے مختلف الفاظ میں سے ہر ایک ہے میں ہر آرٹسٹ کے لئے کر سکتے ہیں. تو مورھ کے اندر اندر، مثال کے طور پر، میں جا رہا ہوں میں دیکھ کتنی بار کی ایک فہرست حاصل کرنے کی الفاظ میں سے ہر ایک. احساس ہے؟ اور آخر میں، میں نے صرف ضرورت کے لئے جا رہا ہوں صرف کی جا رہی ہے کہ "الفاظ" کہا جاتا فہرست ہے کس طرح بہت سے الفاظ میں ہر آرٹسٹ کے لئے ہے. تو مورھ کے لئے، مثال کے طور پر، جب میں نے نظر غزلیں، میں، مجھے لگتا ہے کہ تھا، 24 کل میں الفاظ. تو اس فہرست میں صرف کی جا رہی ہے مورھ 24، اور کیٹی دوسرے نمبر. احساس ہے؟ ٹھیک ہے. تو اب، اصل میں، چلو کوڈنگ کے لئے جانا. تو ازگر میں، آپ اصل میں کر سکتے ہیں مختلف کے ایک گروپ واپس ایک تقریب سے چیزیں. تو میں نے اس تقریب کے پیدا کرنے کے لئے جا رہا ہوں کی جا رہی ہے "، مشروط" کہا جاتا ، ان چیزوں میں سے سب کو واپس "priors،" "امکانات،" اور "کے الفاظ." تو "، مشروط" اور یہ ہے میں بلا رکھا جائے جا "کی غزلیں." تو اب میں آپ کو اصل میں کرنا چاہتے ہیں اس تقریب لکھیں. میں نے یہ لکھ سکتے ہیں تو طریقہ تقریب میں صرف یہ بیان کیا جاتا ہے کے ساتھ کام "تحفظ." تو میں تحفظ "کیا مشروط، "اور یہ لے جا رہا ہے "کی غزلیں." اور کیا ایسا کرنے کی جا رہی ہے ، سب سے پہلے، میں نے اپنے priors ہے ہے میں حساب کرنے کے لئے چاہتے ہیں. لہذا میں نے یہ کر سکتے ہیں کہ جس طرح تخلیق ہے ازگر، میں ایک لغت ہے جس میں ایک ہیش کے طور پر بہت زیادہ ایک ہی بات ہے میز، یا یہ تکراری کی طرح ہے پی ایچ پی میں صف. اس میں ایک ڈکشنری کا اعلان ہے. اور بنیادی طور پر اس کا مطلب کیا ہے مورھ کی priors اگر، مثال کے طور پر، 0.5 ہے کی غزلیں کا 50٪ سے ہیں مورھ، 50٪ کیٹی سے ہیں. احساس ہے؟ تو میں نے جاننے کی ہے کس طرح priors حساب کرنے کے لئے. مجھے کیا ہے کہ اگلے ہیں، بھی، امکانات اور الفاظ ہیں. تو مورھ کی امکانات فہرست ہے تمام امکانات کا کہ میں مورھ کے لئے الفاظ میں سے ہر ایک کے لئے ہے. میں مورھ کی امکانات پر جانا تو اگر "بچے،" مثال کے طور پر، اس نے مجھے دے دیں گے 2 اس صورت میں 24 کی طرح کچھ. احساس ہے؟ تو میں نے "امکانات،" جانے کے لئے جانا تمام کی ایک فہرست ہے کہ "مورھ" بالٹی مورھ الفاظ، تو میں "، بچے" کرنے کے لئے جانا اور میں امکان دیکھ. اور آخر میں یہ ہے "الفاظ" ڈکشنری. تو یہاں، "امکانات." اور پھر "کے الفاظ." تو میں نے "کے الفاظ،" "مورھ،" اگر کیا ہونے جا رہا ہے یہ ہے یہ ہے کہ ، مجھے 24 دینے کے لئے جا کہہ کہ میں مورھ سے کی غزلیں اندر اندر 24 الفاظ ہیں. سمجھ میں آتا ہے؟ تو یہاں، "الفاظ" داہ داہ داہ برابر. ٹھیک ہے تو مجھے کیا کرنے جا رہا ہوں میں جا رہا ہوں تو، کی غزلیں سے ہر ایک پر iterate ڈور میں سے ہر ایک ہے میں کی فہرست میں ہے. اور میں ان چیزوں کا حساب کرنے کے لئے جا رہا ہوں امیدواروں میں سے ہر ایک کے لئے. سمجھ میں آتا ہے؟ تو میں لوپ کے لئے کیا کرنا ہے. تو ازگر میں میں کیا کر سکتے ہیں، لائن کے لئے ہے " غزلیں میں. "ایک کے طور پر ایک ہی بات ہے پی ایچ پی میں بیان "ہر ایک کے لئے". یہ پی ایچ پی تھا تو کس طرح میں کر سکتا ہوں یاد رکھیں کے طور پر ہر غزلیں لئے "کا کہنا ہے کہ لائن. "سمجھ میں آتا ہے؟ تو میں نے اس میں، لائنوں میں سے ہر ایک لے جا رہا ہوں کیس، اس سٹرنگ اور اگلا سٹرنگ تو میں ہوں کیا لائنوں میں سے ہر ایک کے لئے کیا جا رہا میں کرنے جا رہا ہوں، سب سے پہلے ہے کی فہرست میں اس لائن تقسیم خالی جگہوں کی طرف سے الگ الفاظ. تو ازگر کے بارے میں ٹھنڈی چیز یہ ہے کہ آپ کو صرف گوگل کی طرح "کس طرح کر سکتے ہیں کر سکتے ہیں میں الفاظ میں ایک تار تقسیم؟ "اور یہ ہے کس طرح ایسا کرنے کے لئے آپ کو بتانے جا رہا. اور ایسا کرنے کا طریقہ، یہ صرف "لائن ہے = line.split () "اور یہ بنیادی طور پر ہے آپ کے ساتھ ایک فہرست دینے کے لئے جا یہاں الفاظ میں سے ہر ایک. سمجھ میں آتا ہے؟ تو اب میں جاننا چاہتے ہیں کہ کیا ہے کہ اس گانے کے گلوکار کون ہے. اور میں صرف حاصل کرنے کے لئے ہے کہ ایسا کرنے کے لئے صف کے پہلے عنصر، ٹھیک ہے؟ تو میں صرف کہہ سکتے ہیں کہ میں "گلوکار = لائن (0) "سمجھ میں آتا ہے؟ اور پھر مجھے کیا کرنے کی ضرورت ہے سب سے پہلے ہے، تمام، میں اپ ڈیٹ کرنے کے لئے جا رہا ہوں کتنے الفاظ کے تحت ہے "مورھ." تو میں ہوں صرف حساب کرنے کے لئے کس طرح بہت سے الفاظ میں حق، اس فہرست میں ہے؟ اس میں کتنے الفاظ ہے غزلیں میں اور میں کرنے جا رہا ہوں "مورھ" کی صف میں شامل. احساس ہے کہ ہے؟ نحو پر بہت زیادہ توجہ مرکوز نہیں کرتے. تصورات کے بارے میں مزید کے بارے میں سوچو. کہ سب سے اہم حصہ ہے. ٹھیک ہے. "گاگا" ہے تو کیا میں یہ کر سکتا ہے پہلے سے ہی اس فہرست میں، تو "گلوکار میں تو الفاظ "جس کا مطلب ہے کہ میں نے پہلے ہی مورھ کی طرف سے الفاظ ہیں. میں نے صرف اضافی شامل کرنا چاہتے ہیں اس کے الفاظ. تو مجھے کیا "کے الفاظ (گلوکار) ہے + = لین (لائن) - 1 ". اور پھر میں کیا کر سکتے ہیں لائن کی لمبائی. تو کس طرح بہت سے عناصر میں صف میں ہے. اور مجھے کیا کرنا ہے 1 مائنس صرف اس وجہ سے صف کے پہلے عنصر صرف ہے ایک گلوکار اور ان غزلیں نہیں ہیں. سمجھ میں آتا ہے؟ ٹھیک ہے. "اور،" یہ میں چاہتا ہوں کہ اس کا مطلب اصل میں فہرست میں مورھ ڈالیں. تو میں صرف الفاظ (گلوکار) "کیا = لین (لائن) - 1، "معاف کیجئے گا. تو ان دونوں کے درمیان فرق صرف لائنوں یہ ایک، یہ نہیں ہے ابھی تک موجود ہے، تو میں ہوں صرف یہ ابتدا. یہ ایک میں اصل میں اضافہ کر رہا ہوں. ٹھیک ہے. تو اس کے الفاظ میں اضافہ کیا گیا تھا. اب میں priors پر شامل کرنا چاہتے ہیں. تو کس طرح میں priors حساب ہیں؟ priors حساب کیا جا سکتا کتنی بار کی طرف سے. آپ اس گلوکار دیکھ تو کتنی بار کہ آپ گلوکاروں کے درمیان حق، ہے؟ ، گاگا اور کیٹی پیری کے لئے بہت اس صورت میں، میں مورھ دیکھ ایک بار، کیٹی پیری ایک بار. مورھ کے لئے تو بنیادی طور پر priors اور کیٹی پیری کے لئے کرے گا صرف صحیح، ایک ہو؟ آپ کو صرف کتنی بار میں آرٹسٹ کو دیکھنے کے. تو اس حساب کرنے کے لئے بہت آسان ہے. میں کر سکتا ہوں اسی طرح کچھ کی طرح "کے طور پر اگر priors میں گلوکار، "میں صرف جا رہا ہوں ان priors باکس 1 شامل کرنے کے لئے. "تو،" اور پھر "" priors (گانا) "+ = 1 اور میں "priors (گلوکار) کرنے جا رہا ہوں = 1. "سمجھ میں آتا ہے؟ تو یہ موجود نہیں ہے تو میں نے صرف ڈال 1 کے طور پر، دوسری صورت میں صرف 1 کا اضافہ. ٹھیک ہے، تو اب سب مجھے کیا کرنا چھوڑ دیا ہے بھی الفاظ میں سے ہر ایک کو شامل ہے امکانات. تو میں شمار کرنے کے لئے کتنی بار میں الفاظ میں سے ہر ایک کو دیکھنے کے. تو میں صرف ایک کرنا ہے لائن میں لوپ کے لئے. میں کرنے جا رہا ہوں تو سب سے پہلی چیز ہے گلوکار نے پہلے ہی ایک ہے تو چیک امکانات صف. گلوکار نہیں کرتا تو تو میں کر رہا ہوں. ایک امکانات صف ہے، میں صرف ہوں ان کے لئے ایک ابتدا ہو رہا. یہ بھی ایک صف نہیں ہے، معذرت، یہ ایک لغت ہے. تو گلوکار کے امکانات کی جا رہی ہے ایک کھلی ڈکشنری ہو، تو میں ہوں صرف اس کے لئے ایک ڈکشنری ابتدا. ٹھیک ہے؟ اور اب میں اصل میں لوپ کے لئے کیا کر سکتے ہیں الفاظ کی ہر 'کا حساب کرنے امکانات. ٹھیک ہے. تو مجھے کیا کر سکتے ہیں لوپ کے لئے ایک ہے. تو میں صرف iterate کرنے کے لئے جا رہا ہوں صف پر. میں ازگر میں ایسا کر سکتے ہیں طریقہ "کی حد میں میں نے کے لئے" ہے. 1 سے میں نے دوسری میں شروع کرنے کے لئے چاہتے ہیں کیونکہ سب سے پہلے میں سے ایک ہے عنصر کی وجہ سے گلوکار نام. تو ایک سے اپ لائن کی لمبائی. اور میں تک جب یہ اصل میں سے چلے جاؤ یہاں کی طرح 1 سے لین کرنے کے لئے لائن مائنس 1. تو یہ پہلے سے ہی کر کے اس بات کرتا ہے بہت ہے جو arrays کے لئے (ن) مائنس 1 آسان. سمجھ میں آتا ہے؟ تو ان میں سے ہر ایک کے لئے، میں کیا کرنے جا رہا ہوں کرتے، صرف ایک دوسرے کی طرح ہے، میں چیک کرنے کے لئے جا رہا ہوں تو اس میں لفظ لائن میں پوزیشن میں پہلے سے ہی ہے امکانات. اور پھر میں امکانات، یہاں نے کہا کہ الفاظ میں، کے طور پر میں ڈال دیا "امکانات (گلوکار)". تو گلوکار نام. تو اس میں پہلے سے ہی ہے "probabilit (گلوکار)"، اس کا مطلب یہ ہے کہ میں اس پر 1 شامل کرنا چاہتے ہیں، تو میں جا رہا ہوں "امکانات (گلوکار)"، اور کیا لفظ "لائن (I)" کہا جاتا ہے. میں 1 کا اضافہ کرنے جا رہا ہوں اور "اور" میں ہوں صرف 1 اس کی ابتدا کرنے کے لئے جا. "لائن (میں)". سمجھ میں آتا ہے؟ لہذا، میں arrays کے تمام حساب. تو، اب مجھے کیا کرنا ہے اس سے صرف "، priors واپسی ہے امکانات اور الفاظ. "چلو ٹھیک ہے، اگر کوئی ہیں کو دیکھنے کے. یہ سب کچھ اب تک کام کر رہا ہے لگتا ہے. تو، اس معنی ہے؟ کسی طرح میں؟ ٹھیک ہے. تو اب میں تمام امکانات ہے. تو اب میں چھوڑ دیا ہے صرف ایک ہی چیز صرف اس بات کی ہے کہ سب سے مصنوعات کا حساب لگاتا ہے میں کی غزلیں جب امکانات. تو اب میں فون کرنا چاہتے ہیں کا کہنا ہے کہ دو اس تقریب ") (کی درجہ بندی" اور بات یہ ہے کہ تقریب میں لیتا ہے صرف ایک دلیل ہے. کی "بچے، میں نے آگ پر ہوں" کہتے ہیں اور یہ ہے اعداد و شمار کیا جا رہا اس مورھ ہے کہ امکان؟ امکان کیا ہے اس کیٹی ہے؟ اچھا لگتا ہے؟ تو میں صرف بنانے کے لئے جا رہا ہوں ایک کہا جاتا ہے نئے تقریب ") (کی درجہ بندی" اور یہ کچھ لے جا رہا ہے کی غزلیں کے ساتھ ساتھ. اور دھن کے علاوہ میں نے بھی priors بھیجنے کے لئے ہے، امکانات اور الفاظ. تو میں نے غزلیں، priors بھیجنے کے لئے جا رہا ہوں، امکانات، الفاظ. تو اس غزلیں، priors لے جا رہا ہے، امکانات، الفاظ. تو، یہ کیا کرتا ہے؟ یہ بنیادی طور پر تمام کے ذریعے جا رہا ہے ممکنہ امیدواروں ہے کہ آپ ایک گلوکار کے طور ہے. اور جہاں ان امیدواروں ہیں؟ وہ priors میں ہیں، ٹھیک ہے؟ تو میں نے وہاں ان تمام. تو میں نے ایک لغت ہے کرنے کے لئے جا رہا ہوں تمام ممکنہ امیدواروں کی. اور پھر میں ہر امیدوار کے لئے priors، یہ جا رہا ہے کہ اس کا مطلب تو میں نے تو گاگا، کیٹی ہو مزید اس سے زیادہ ہو جائے گا. میں حساب شروع کرنے کے لئے جا رہا ہوں اس امکان. ہم نے دیکھا کے طور پر امکان پاورپوائنٹ پہلے بار ہے میں سے ہر ایک کی مصنوعات دیگر امکانات. تو میں یہاں بھی ایسا ہی کر سکتے ہیں. میں صرف احتمال ہے کر سکتے ہیں ابتدائی طور پر صرف پہلے. امیدوار کی تو priors. ٹھیک ہے نا؟ اور اب میں تمام iterate کرنے کے لئے ہے میں بننا غزلیں میں ہے کہ الفاظ امکان شامل کرنے کے قابل ٹھیک ہے، ان میں سے ہر ایک کے لئے؟ تو، "کی دھن میں لفظ کے لئے" کیا میں جا رہا ہوں لفظ میں ہے اگر ایسا کرنے کی، ہے "امکانات (امیدوار)"، جس میں یہ ایک لفظ ہے کہ اس کا مطلب ہے کہ امیدوار ان کے دھن میں ہے - مورھ کے لئے مثال کے طور پر، "بچے" - جو میں کرنے جا رہا ہوں یہ ہے کہ امکانات میں کئی گنا اضافہ کیا جا رہا ہے علاوہ امکانات کے 1 اس لفظ کے امیدوار. اور یہ "لفظ" کہا جاتا ہے. یہ الفاظ کی تعداد کی طرف سے تقسیم میں اس امیدوار کے لئے ہے. میں ہے کہ الفاظ کی کل تعداد میں دیکھ رہا ہوں کہ گلوکار کے لئے. "اور." یہ ایک نیا لفظ کا مطلب ہے تو یہ مثال کے طور پر کی طرح ہو جائے گا لیڈی گاگا کے لئے "آگ". تو میں نے صرف 1 کرنا چاہتے ہیں "لفظ (امیدوار)". تو میں یہاں اس اصطلاح ڈال نہیں کرنا چاہتا. تو یہ بنیادی طور پر جا رہا ہے کاپی اور اس چسپاں. لیکن میں نے اس حصہ کو حذف کرنے جا رہا ہوں. تو یہ صرف اس پر 1 جا رہا ہے. اچھا لگتا ہے؟ اور اب آخر میں، میں صرف کرنے جا رہا ہوں امیدوار کا نام اور پرنٹ تم میں سے ہے کہ امکان ان کی غزلیں پر S ہونے. سمجھ میں آتا ہے؟ اور میں واقعی میں بھی نہیں کرتے اس لغت کی ضرورت ہے. سمجھ میں آتا ہے؟ تو، یہ اصل میں کام کرتا ہے چلو دیکھتے ہیں اگر. میں اس چلاتے ہیں تو، یہ کام نہیں کیا. ایک منٹ رکو. "کے الفاظ (امیدوار)"، "کے الفاظ (امیدوار)"، ہے صف کے نام. ٹھیک ہے تو، اس میں کچھ مسئلے سے ہے کا کہنا ہے کہ priors میں امیدوار کے لئے. مجھے صرف تھوڑا سا چل دو. ٹھیک ہے. کی کوشش کرتے ہیں. ٹھیک ہے. تو یہ کیٹی پیری اس ہے دیتا ہے کرنے کے لئے اس بار کے 10 کے امکانات مائنس 7، اور مورھ یہ ہے اوقات مائنس 6 10. تو آپ کو یہ ظاہر کرتا ہے دیکھتے ہیں کہ مورھ ایک اعلی امکان ہے. تو ہے "بچے، میں آگ میں ہوں" شاید ایک مورھ نغمہ کی. سمجھ میں آتا ہے؟ تو یہ ہم نے کیا کیا ہے. اس کوڈ سے آن لائن پوسٹ کیا جا رہا ہے، تو تم لوگ اسے چیک کر سکتے ہیں. آپ کرنا چاہتے ہیں تو ہو سکتا ہے کے لئے اس میں سے کچھ کا استعمال کرتے ہیں ایک منصوبہ یا اسی طرح کچھ کرنا. ٹھیک ہے. یہ صرف دکھانے کے لئے تھا کیا کمپیوٹیشنل لسانیات کوڈ کی طرح لگتا ہے. لیکن اب زیادہ جانا اعلی سطح کی چیزیں. ٹھیک ہے. تو دوسرے مسائل میں کے بارے میں بات کر رہا تھا - انقطاع مسئلہ ان میں سے سب سے پہلے ہے. تو آپ یہاں جاپانی ہے. اور پھر آپ دیکھتے ہیں کہ کوئی خالی جگہ موجود ہیں. تو یہ بنیادی طور پر یہ ہے کہ اس کا مطلب ہے کرسی کے سب سے اوپر، ٹھیک ہے؟ آپ جاپانی بولتے ہیں؟ یہ درست، کرسی کے اوپر ہے؟ طالب علم: میں نہیں جانتا کہ کیا کانجی سے زیادہ ہے. لوکاس Freitas میں: یہ [جاپانی زبان میں بات کرتے ہوئے ہے] ٹھیک ہے. تو یہ بنیادی طور پر سب سے اوپر کی کرسی کا مطلب ہے. آپ کو ایک خلائی ڈال دیا تھا تو اگر یہ یہاں ہو جائے گا. اور پھر آپ [ہے؟ یوادا سان. ؟] جس میں بنیادی طور مسٹر یوادا کا مطلب ہے. اور آپ کہ "یوادا" دیکھتے ہیں اور آپ کے پاس ایک جگہ اور پھر "سان." تو آپ دیکھتے ہیں کہ یہاں آپ کو "UE" خود ہی کی طرح ہے. اور یہاں یہ ایک کردار ہے یہ کرنے کے لئے اگلے. تو یہ ان زبانوں میں نہیں ہے ایک لفظ یہ تو آپ کا مطلب ہے حروف صرف خالی جگہوں کا ایک بہت ڈال. حروف ایک دوسرے سے متعلق. اور وہ ایک دوسرے کے ساتھ ہو سکتا ہے کی طرح دو، تین، ایک. تو اگر آپ اصل میں کسی قسم کے پیدا کرنے کے لئے ہے کے راستے سے ان لوگوں کے خالی جگہوں ڈال. اور یہ بات یہ ہے کہ آپ کو ملتا ہے جب بھی ان ایشیائی زبانوں سے اعداد و شمار، سب کچھ unsegmented آتا ہے. کیونکہ جاپانی لکھتے ہیں جو کوئی بھی یا چینی خالی جگہوں کے ساتھ لکھتے ہیں. آپ کو چینی لکھ رہے ہیں جب بھی، جاپانی آپ کو صرف سب کچھ لکھنا کوئی خالی جگہوں کے ساتھ. یہ بھی مطلب نہیں ہے خالی جگہوں ڈال. تو پھر آپ کو کچھ، کے اعداد و شمار حاصل کرنے کے لئے جب وسطی ایشیائی زبان، اگر تم چاہو تو اصل میں اس کے ساتھ کچھ کرنا آپ سب سے پہلے طبقہ کے لئے ہے. مثال کے طور پر کر رہے ہیں کے بارے میں سوچو خالی جگہوں کے بغیر کی غزلیں. تو آپ کے پاس صرف کی غزلیں حق، سزائیں ہو جائے گا؟ ادوار کی طرف سے الگ. لیکن اس وقت صرف سزا ہونے گے واقعی معلومات دینے پر مدد نہیں کے ان غزلیں طرف سے ہیں. ٹھیک ہے نا؟ تو آپ کو چاہئے سب سے پہلی خالی جگہ رکھتا ہے. آپ کو تو ہے کہ کس طرح کر سکتے ہیں؟ تو پھر ایک زبان کا خیال آتا ہے واقعی کچھ ہے جو ماڈل کمپیوٹیشنل کے لئے اہم لسانیات. تو ایک زبان بدلیں ماڈل بنیادی طور پر ہے ایک امکانات کی میز ظاہر ہوتا ہے کہ امکان کیا ہے سب سے پہلے کی زبان میں لفظ ہو رہی ہے؟ تو ایک لفظ ہے کس طرح بار بار دکھا. اور پھر بھی سلسلے دکھا ایک جملے میں الفاظ کے درمیان. ایک اجنبی آئے تو مرکزی خیال، ہے آپ اور ایک جملہ کہا کرنے کے لئے آپ، امکان ہے کہ، کے لئے کیا ہے مثال کے طور پر، "یہ میری بہن ہے [؟ GTF"؟] اس شخص نے کہا کہ اس کی سزا تھی؟ تو ظاہر ہے کچھ سزائیں ہیں دوسروں کے مقابلے میں زیادہ عام. مثال کے طور پر، "، صبح اچھا" یا "اچھا رات، "یا" وہاں ہے، "زیادہ ہے سب سے زیادہ سزائیں سے عام ہم ایک انگریزی ہے. تو کیوں ان لوگوں کو سزائیں ہیں زیادہ بار بار؟ آپ کو کیونکہ سب سے پہلے، یہ ہے زیادہ بار بار کر رہے ہیں کہ الفاظ. آپ کا کہنا ہے اگر ایسا ہے تو، مثال کے طور پر،، کتا ہے بڑی، اور کتے آپ کو، بہت بڑا ہے عام طور پر شاید کتے بڑا ہے سن "بڑے" زیادہ ہے زیادہ کثرت کی وجہ "بہت بڑا." سے انگریزی میں بار بار تو، ایک چیزوں لفظ تعدد ہے. واقعی ہے جو دوسری بات یہ ہے ضروری ہے صرف الفاظ کی ترتیب. لہذا، یہ "بلی کا کہنا ہے کہ عام ہے . باکس کے اندر "لیکن آپ کو عام طور پر نہیں میں دیکھ "باکس کے اندر بلی ہے." تو آپ کو کچھ اہمیت ہے کہ وہاں دیکھتے الفاظ کی ترتیب میں. آپ کو صرف نہیں کہہ سکتا ہے کہ ان دو سزائیں ہی امکان ہے وہ ایک ہی الفاظ ہیں صرف اس وجہ سے. تم واقعی میں دیکھ بھال کرنے کے لئے ہے حکم کے بارے میں اس کے ساتھ ساتھ. احساس ہے؟ تو ہم کیا کرتے ہیں؟ تو کیا میں آپ کو حاصل کرنے کی کوشش کر سکتے ہیں؟ میں نے تم سے جو ہم حاصل کرنے کے لئے کوشش کر رہا ہوں N-گرام ماڈل کال. تو N-گرام ماڈل بنیادی طور پر فرض ہے کہ ہر لفظ کے لئے ہے آپ ایک جملے میں ہے. یہ ہونے کا امکان ہے لفظ پر نہ صرف وہاں انحصار کرتا ہے زبان میں اس لفظ کی فریکوئنسی، بلکہ الفاظ پر کہ اس کے ارد گرد ہیں. تو مثال کے طور پر، عام طور پر آپ کو دیکھ کر جب یا تم پر کی طرح کچھ شاید دیکھنے کے لئے جا اس کے بعد سنجشتھا، ٹھیک ہے؟ کیونکہ آپ کو ایک حرف ربط ہے جب عام طور پر اس کے بعد ایک سنجشتھا لیتا ہے. یا آپ ترسیلی ہے کہ ایک فعل ہے، تو آپ عام طور پر لئے جا رہے ہیں ایک سنجشتھا کے جملہ ہے. تو یہ ایک سنجشتھا جا رہا ہے اس کے ارد گرد کہیں. تو، بنیادی طور پر، کیا اس سے فرق پڑتا ہے کہ یہ ہونے کے امکان پر غور الفاظ ایک دوسرے، جب آپ حساب کر رہے ہیں ایک سزا کا امکان. اور یہ کہ کیا ایک زبان ہے ماڈل بنیادی طور پر ہے. بس امکان ہے کیا کہہ کی ایک مخصوص ہونے کے ایک زبان میں سزا؟ تو یہی وجہ ہے کہ بنیادی طور پر، کے لئے مفید ہے؟ اور سب سے پہلے کیا ہے ایک ن گرام ماڈل، تو؟ تو ایک ن گرام ماڈل کا مطلب ہے کہ ہر لفظ پر انحصار کرتا ہے اگلا ن مائنس 1 الفاظ. تو، بنیادی طور پر، یہ، میں نظر آتے ہیں کا مطلب ہے کہ مثال کے طور پر، CS50 TF میں جب میں نے کے امکانات کے حساب کر رہا ہوں سزا، آپ کی طرح ہو جائے گا " لفظ "" ہونے کا امکان ہونے کے اوقات امکان " ہونے کے CS50 "ٹائمز امکان "CS50 TF." تو، بنیادی طور پر، میں شمار یہ ھیںچ کے تمام ممکنہ طریقے. اور پھر عام طور پر آپ یہ کر رہے ہیں جب ایک پروجیکٹ کے طور پر، آپ کی ن ڈال ایک کم قیمت. تو، عام طور پر bigrams یا trigrams ہے. آپ کو صرف دو الفاظ، شمار تو ہے کہ دو الفاظ، یا تین الفاظ کے گروپ، صرف کارکردگی کے مسائل کے لئے. اور وجہ سے بھی ہو سکتا ہے اگر آپ کی طرح کچھ "CS50 TF." جب آپ ہے "TF،" یہ بہت ضروری ہے کہ "CS50" صحیح، یہ کرنے کے لئے اگلے ہے؟ ان دو چیزوں کو عام طور پر ہیں ایک دوسرے کے. آپ کے بارے میں سوچتے ہیں تو "TF،" یہ شاید ہے ضرورت کے لئے جا کیا اس کے لئے TF'ing کی کلاس. اس کے علاوہ "" بہت ضروری ہے CS50 TF کے لئے. لیکن آپ کو "CS50 کی طرح کچھ ہے تو TF طبقے کے پاس گیا اور دی ان طالب علموں کو کچھ کینڈی. "" کینڈی "اور" " صحیح، واقعی کوئی تعلق نہیں ہے؟ وہ ایک دوسرے سے بہت دور ہیں یہ واقعی کوئی فرق نہیں کیا الفاظ آپ کے پاس. تو ایک bigram یا trigram کر کے، یہ صرف آپ کو محدود کر رہے ہیں کا مطلب ہے کہ اپنے آپ کو کچھ الفاظ کے ارد گرد ہیں. احساس ہے؟ تو آپ انقطاع کرنا چاہتے ہیں جب، بنیادی طور پر، کیا آپ کرنا چاہتے ہیں دیکھنے ہے ہر ممکن طریقے کیا ہیں آپ طبقہ کی سزا کر سکتے ہیں. تم کیا دیکھتے ہیں کہ اس طرح کے ان جملوں میں سے ہر ایک کا امکان کی زبان میں موجودہ؟ تو کیا آپ کی طرح، اچھی طرح سے، دو ہے مجھے یہاں ایک جگہ ڈال کرنے کی کوشش. تو تم وہاں ایک جگہ میں ڈال دیا اور آپ کو کیا ہے دیکھتے ہیں اس کی سزا کا امکان؟ تو پھر آپ ٹھیک، طرح، شاید ہیں کہ اچھا نہیں تھا. تو میں نے ایک جگہ ایک جگہ ڈال دیا اور وہاں، اور آپ کا حساب امکان اب، اور آپ دیکھتے ہیں کہ یہ ایک اعلی امکان ہے. تو اس ٹینگو نامی ایک الگورتھم ہے انقطاع الگورتھم، جو اصل میں واقعی ہو جائے گا کہ کچھ ایک منصوبے کے، ڈاؤن لوڈ، اتارنا، جس میں بنیادی طور پر unsegmented متن لیتا ہے جاپانی یا چینی یا شاید ہو سکتا ہے انگریزی خالی جگہوں کے بغیر اور ڈال کرنے کے لئے کی کوشش کرتا ہے الفاظ اور یہ کرتا ہے کے درمیان خالی جگہوں ایک زبان ہے کہ ماڈل کا استعمال کرتے ہوئے کی طرف سے سب سے زیادہ ہے کیا دیکھنے کے لئے کی کوشش کر رہے آپ حاصل کر سکتے امکان. ٹھیک ہے. تو اس انقطاع ہے. اب نحو. تو، نحو کے لئے استعمال کیا جا رہا ہے اب اتنی ساری چیزیں. گراف کے لئے تلاش کریں، سری کے لئے تو قدرتی کی بہت زیادہ کسی بھی قسم کی زبان کی پروسیسنگ آپ ہے. اتنا ضروری کیا ہیں نحو کے بارے میں ہے؟ تو، عام طور پر سزائیں ہم اجزاء کو فون کیا. جس قسم کے الفاظ کے گروپ کی طرح ہیں جملے میں ایک تقریب ہے. اور وہ واقعی نہیں کر سکتے ہیں کے علاوہ ایک دوسرے سے. میں کہتا ہوں کہ اگر ایسا ہے تو،، مثال کے طور پر، "لارین سے محبت کرتا ہے ملو. لارین "ہے" میں جانتا ہوں کہ "ایک اتحادی اور پھر "سے محبت کرتا ہے ملو "بھی ایک ہے. آپ "لارین ملو طرح نہیں کہہ سکتے کیونکہ ایک ہی مطلب ہے کے لئے "سے محبت کرتا ہے. یہ کرنے کے لئے نہیں جا رہا ہے ایک ہی معنی. یا میں "ملو لارین کی طرح نہیں کہہ سکتے سے محبت کرتا ہے. "نہیں سب کچھ ایک ہی ہے کہ کر مطلب. کے بارے میں تو دو زیادہ اہم چیزیں نحو ہے جو لغوی اقسام ہیں بنیادی طور پر تقریب میں ہے کہ آپ خود کی طرف سے الفاظ کے لئے ہے. تو آپ کو پتہ ہے کہ "لارین" اور "ملو" اسم ہیں. "محبت" ایک فعل ہے. اور دوسری اہم بات یہ ہے وہ phrasal اقسام ہیں. تو آپ "ملو محبت کرتا ہے" معلوم ہے کہ اصل میں ایک زبانی جملہ ہے. جب میں کہتا ہوں تو "لارین،" مجھے معلوم ہے کہ لارین کچھ کر رہی ہے. وہ کیا کر رہی ہے؟ وہ ملو محبت ہے. تو یہ ایک پوری بات ہے. لیکن اس کے اجزاء ہیں ایک سنجشتھا اور فعل. لیکن ساتھ مل کر، وہ ایک فعل جملہ بنانے کے. تو، ہم اصل کے ساتھ کیا کر سکتے ہیں کمپیوٹیشنل لسانیات؟ لہذا، میں مثال کے طور پر کچھ ہے تو "یلیسن کی دوست." میں دیکھ رہا ہوں تو میں نے صرف ایک syntactic درخت میں پتہ چلے گا کیا ہے "دوست" یہ ایک سنجشتھا کے جملہ ہے "یلیسن کی" پھر سنجشتھا اور ایک ہے "کے" جس میں prepositional جملہ ہے ایک تجویز اور "یلیسن" ایک سنجشتھا ہے. میں کیا کر سکتا ہے میرے کمپیوٹر سکھانے ہے کہ میں ایک سنجشتھا کے جملہ ایک ہے اور جب پھر ایک prepositional جملہ. کے "اس کے بعد اس معاملے میں،" دوست "تو اور ملو "میں اس کا مطلب ہے کہ معلوم ہے کہ NP2، دوسرا، NP1 کا مالک ہے. تو میں سلسلے کے کچھ قسم کی تشکیل دے سکتے ہیں، اس کے لئے تقریب کے کچھ قسم کی. تو میں نے اس کی ساخت دیکھ جب بھی، جس کے دوست "کے ساتھ بالکل میل کھاتا ہے یلیسن، "میں جانتا ہوں کہ یلیسن دوست کا مالک ہے. تو دوست کچھ ہیں یلیسن ہے. سمجھ میں آتا ہے؟ تو یہ بنیادی طور پر کیا ہے گراف کی تلاش کرتا ہے. یہ صرف قوانین کی تخلیق چیزوں کی ایک بہت کچھ کے لئے. تو "یلیسن کے دوست،" "میرے دوست ""، کیمبرج میں اپنے دوستوں کے رہنے والے ہارورڈ جانے والے. "اس کے قوانین کی تخلیق ان چیزوں میں سے سب کے لئے. اب مشینی ترجمہ. تو، مشینی ترجمہ بھی ہے اعداد و شمار کے کچھ. اور اصل میں تم میں شامل ہو تو کمپیوٹیشنل لسانیات، کی ایک بہت اپنا سامان کے اعداد و شمار کی جا رہی ہے. میں نے مثال کے طور پر کر رہے تھے تو کے طور پر میں تھا کہ امکانات کی ایک بہت حساب، اور پھر آپ کو اس کے حاصل کرنے کے آخری فیصلہ ہے کہ بہت چھوٹی سی تعداد امکان، اور یہ کہ کیا ہے آپ کو جواب دیتا ہے. مشینی ترجمہ بھی استعمال کرتا ہے ایک شماریاتی ماڈل. اور آپ کی مشین کے بارے میں سوچنا چاہتے ہیں تو آسان ممکن میں ترجمہ راستہ، کیا آپ کو لگتا ہے کر سکتے ہیں ہے حق، لفظ کی طرف سے لفظ کا ترجمہ؟ آپ کے لئے ایک زبان سیکھنے کر رہے ہیں پہلی بار، جو عام طور پر کیا ہے تم ٹھیک، ہے؟ اگر آپ چاہتے ہیں تو آپ کو ایک جملہ کا ترجمہ زبان کے لئے آپ کی زبان میں آپ، عام طور پر سب سے پہلے، سیکھ رہے ہیں الفاظ میں سے ہر ایک کا ترجمہ انفرادی طور پر، اور پھر آپ کو کرنے کی کوشش کریں جگہ میں الفاظ ڈال. ، میں نے اس کا ترجمہ کرنے کے لئے کرنا چاہتا تھا تو [خطاب کرتے ہوئے پرتگالی] "سفید بلی بھاگ گیا." جس کا مطلب ہے میں سے اس کا ترجمہ کرنا چاہتے تھے انگریزی پرتگالی، کیا مجھے کر سکتے ہیں میں نے صرف، پہلی، ہے لفظ سے لفظ کا ترجمہ. تو "اے" "،" "گاتو،" "بلی، ہے" "وائٹ"، "سفید" اور پھر "fugio ہے" "بھاگ گیا." تو پھر میں، تمام الفاظ لیکن وہ ترتیب میں نہیں ہیں. "بلی سفید بھاگ گیا" کی طرح ہے جس ungrammatical ہے. تو میں نے ایک دوسرا مرحلہ، کر سکتے ہیں جس میں مثالی تلاش کرنے جا رہا ہے الفاظ میں سے ہر ایک کے لئے پوزیشن. تو میں نے اصل میں کرنا چاہتے ہیں معلوم ہے کہ کی بجائے "سفید بلی" "بلی سفید." تو میں کیا کر سکتے ہیں سب سے زیادہ بولی طریقہ، ہے پیدا کرنے کے لئے ہو جائے گا تمام کے ممکنہ ترتیب عہدوں کے الفاظ،. اور پھر ایک ہے جس کو دیکھنے کے سب سے زیادہ امکان کے مطابق میری زبان ماڈل. اور پھر میں ہے کہ ایک جب ہے جو سب سے زیادہ امکان یہ، شاید "سفید بلی، بھاگ گیا" کہ میرے ترجمہ ہے. اور اس کی وضاحت کا ایک آسان طریقہ ہے کس طرح مشینی ترجمہ کی ایک بہت یلگوردمز کام. احساس ہے کہ ہے؟ یہ بھی واقعی دلچسپ کچھ ہے تم لوگ شاید ایک کے لئے کی کر سکتے ہیں حتمی منصوبے، جی ہاں؟ طالب علم: ٹھیک ہے، اگر آپ کو یہ کہا تھا کہ بولی کا طریقہ، تو کیا ہے غیر بولی طریقہ ہے؟ لوکاس Freitas میں: غیر بولی طریقہ ہے؟ ٹھیک ہے. کے بارے میں برا ہے تو سب سے پہلی چیز اس طریقہ کار میں صرف ترجمہ یہ ہے کہ الفاظ، لفظ سے لفظ. لیکن کبھی کبھی آپ کے الفاظ ہیں کہ ایک سے زیادہ ترجمہ کر سکتے ہیں. مجھے لگتا ہے کرنے کی کوشش کرنے جا رہا ہوں کچھ کے. پرتگالی کر سکتے ہیں میں مثال کے طور پر، "منگا" ہو "نوروز" یا "آستین." یا تو تو آپ لفظ کا ترجمہ کرنے کی کوشش کر رہے ہیں لفظ کی طرف سے، یہ آپ کو دینے جا سکتا ہے کوئی احساس نہیں کرتا کہ کچھ. آپ سب کو دیکھنے کے لئے تو آپ کو اصل میں چاہتے ہیں کے ممکنہ ترجمہ الفاظ اور دیکھ، سب سے پہلے، حکم کیا ہے. ہم permutating کے بارے میں بات کر رہے تھے ہے؟ ہر ممکن احکامات کو دیکھنے اور کرنے کے لئے سب سے زیادہ کے ساتھ ایک کا انتخاب کرتے ہیں امکان؟ تم نے بھی تمام ممکنہ منتخب کر سکتے ہیں ہر ایک کے لئے ترجمہ پھر لفظ اور دیکھ - ترتیب کے ساتھ مل کر - جس میں سے ایک سب سے زیادہ امکان ہے. پلس، آپ کو یہ بھی نہیں دیکھ سکتے ہیں صرف الفاظ لیکن جملے. تو آپ کے درمیان تعلقات تجزیہ کر سکتے ہیں الفاظ اور پھر ایک حاصل بہتر ترجمہ. اس کے علاوہ کچھ اور، تو اس سمسٹر میں اصل میں تحقیق کر رہا ہوں چینی انگریزی مشینی ترجمہ، چنانچہ ترجمہ انگریزی میں چینی. اور ہم کچھ کا استعمال کرتے ہوئے کے علاوہ، ہے صرف ہے جس میں ایک اعداد و شمار کے ماڈل، دیکھ کے امکانات کو دیکھ کر ایک جملہ میں کچھ پوزیشن، میں ہوں اصل میں میں بھی کچھ نحو انہوں نے مزید کہا میری میں اس قسم کے دیکھتے ہیں ماڈل،، اوہ، کہہ تعمیر کی، اس میں کیا چاہتا ہے میں ترجمہ جب اسے تبدیل کرنے کی. تو تم بھی کسی قسم کے شامل کر سکتے ہیں بنانے کے لئے نحو کے عنصر ترجمہ زیادہ موثر اور زیادہ عین مطابق. ٹھیک ہے. اگر آپ چاہتے ہیں تو آپ کو، کس طرح شروع کرنے کے لئے کر سکتے ہیں کمپیوٹیشنل میں کچھ کرنا لسانیات؟ سب سے پہلے، آپ کو ایک منصوبہ منتخب زبانوں شامل ہیں. تو، وہاں بہت سے ہے. آپ کر سکتے ہیں بہت ساری چیزیں ہے. اور پھر ایک ماڈل کے بارے میں سوچ کر سکتے ہیں آپ استعمال کر سکتے ہیں. عام طور پر اس کی سوچ کا مطلب مفروضات، میں تھا جب، اوہ، طرح کی غزلیں کی سوچ کی طرح. میں اعداد و شمار کے لئے چاہتے ہیں میں، کے ساتھ ساتھ، کی طرح تھا جو اس نے لکھا ایک باہر، میں شاید چاہتے ہیں الفاظ کو دیکھنے کے لئے اس شخص کو استعمال کیا اور بہت اکثر اس لفظ کا استعمال کرتا ہے جو دیکھنے کے. تو مفروضات بنانے کے لئے کوشش کرتے ہیں اور ماڈل کے بارے میں سوچنا کرنے کی کوشش کریں. اور پھر تم نے بھی کے لئے آن لائن تلاش کر سکتے ہیں ہے کہ آپ کے مسئلہ کی طرح، اور یہ مشورہ ہے جا رہا ہے آپ کو ماڈل پر کہ شاید کے ساتھ ساتھ اس چیز کو ماڈلنگ کی. اور بھی آپ کو ہمیشہ مجھے ای میل کر سکتے ہیں. me@lfreitas.com. اور میں صرف آپ کے سوالات کا جواب کر سکتے ہیں. ہم بھی تو میں کر سکتے ہیں کو پورا کر سکتے ہیں کر سکتے ہیں کے طریقوں پر تجاویز دے آپ کے منصوبے پر عمل درآمد. آپ کے ساتھ شامل ہو اور اگر میرا مطلب کمپیوٹیشنل لسانیات، یہ جا رہا ہے بہت اچھا ہو گا. تم وہاں دیکھنے کے لئے جا رہے ہیں اتنی صلاحیت ہے. اور صنعت کی خدمات حاصل کرنے کے لئے چاہتا ہے اس کی وجہ سے آپ کو اتنا برا. تو میں نے تم لوگوں کو اس سے لطف اندوز امید ہے. تم لوگوں کو کوئی سوال ہے تو، اس کے بعد تم مجھ سے پوچھ سکتے ہیں. لیکن آپ کا شکریہ.