LUCAS Freitas: আরে. সবাই স্বাগতম. আমার নাম লুকাস Freitas হয়. আমি অধ্যয়নরত [শ্রবণাতীত] এ জুনিয়র আছি একটি ফোকাস সঙ্গে কম্পিউটার বিজ্ঞান গণনীয় ভাষাতত্ত্ব. তাই আমার দ্বিতীয় ভাষায় হয় এবং ভাষাগত তত্ত্ব. আমি সত্যিই আপনি না শেখান উত্তেজিত ক্ষেত্র সম্পর্কে অল্প. এটি অধ্যয়ন একটি খুব উত্তেজনাপূর্ণ এলাকা এর. এছাড়াও সম্ভাব্য অনেক সঙ্গে ভবিষ্যতের জন্য. সুতরাং, সত্যিই আমি উত্তেজিত যে আপনাকে বলছি প্রকল্পে বিবেচনা করা হয় গণনীয় ভাষাতত্ত্ব. এবং আমি উপদেশ খুশি বেশী থাকব আপনি কোনো আপনাকে সিদ্ধান্ত নিতে হলে যারা এক খোঁজেন. গণনীয় কি সব সুতরাং প্রথম ভাষাতত্ত্ব? সুতরাং গণনীয় ভাষাতত্ত্ব হয় ভাষাতত্ত্ব এবং এর মধ্যে ছেদ কম্পিউটার বিজ্ঞান. সুতরাং, ভাষাতত্ত্ব কি? কম্পিউটার বিজ্ঞান কি? ওয়েল ভাষাতত্ত্ব থেকে, কি আমরা ভাষা নিতে. সুতরাং ভাষাতত্ত্ব আসলে গবেষণা সাধারণ প্রাকৃতিক ভাষার. তাই প্রাকৃতিক ভাষা - আমরা কথা বলার আসলে আমরা ব্যবহার করে যে ভাষা একে অপরের সঙ্গে যোগাযোগ. তাই আমরা ঠিক কথা বলা করছি না সি বা জাভা সম্পর্কে. আমরা ইংরেজি সম্পর্কে আরো কথা বলা এবং করছি চীনা ও অন্যান্য ভাষার যে আমরা একে অপরের সাথে যোগাযোগের জন্য ব্যবহার. যে সম্পর্কে চ্যালেঞ্জিং ব্যাপার হল এই মুহূর্তে আমরা আছে প্রায় 7,000 বিশ্বের ভাষার. তাই বেশ উচ্চ বৈচিত্র্য আছে আমরা অধ্যয়ন করতে পারেন যে ভাষার. এবং তারপর আপনি এটি সম্ভবত মনে করেন যে, কি খুব কঠিন, যেমন, এক ভাষা থেকে অনুবাদ অন্যান্য, আপনি যে বিবেচনায় প্রায় 7,000 তাদের. সুতরাং, আপনি অনুবাদ করছেন মনে হলে এক ভাষা থেকে অন্য আপনাকে আছে প্রায় আরো মিলিয়ন তুলনায় বিভিন্ন সমন্বয় যে আপনি যা করতে পারেন ভাষা থেকে ভাষা আছে. তাই এটি সত্যিই কিছু করতে প্রতিদ্বন্দ্বিতা হচ্ছে উদাহরণস্বরূপ অনুবাদ ব্যবস্থার ধরনের জন্য প্রতি একক ভাষা. সুতরাং, বাক্য গঠন সঙ্গে ভাষাতত্ত্ব একইরূপে, শব্দার্থবিদ্যা, তিনি যা. আপনি না ঠিক হবে না তারা কি করছেন জানতে. কিন্তু খুব আকর্ষণীয় জিনিস যে হয় আপনি শিখতে যখন একটি নেটিভ স্পিকার, হিসাবে শিশু হিসাবে ভাষা, আপনি আসলে জানতে সেগুলো সব - বাক্য গঠন শব্দার্থবিদ্যা এবং তিনি যা - নিজের দ্বারা. আর কেউ জন্য আপনি বাক্য গঠন শেখানো হয়েছে আপনি বাক্য কিভাবে বুঝতে গঠিত. সুতরাং, এটা সত্যিই আকর্ষণীয়, কারণ এটা খুব যে আসে কিছু intuitively. আর আপনার কাছ থেকে কি গ্রহণ করা হয় কম্পিউটার বিজ্ঞান? ভাল, সবচেয়ে গুরুত্বপূর্ণ বিষয় যে আমরা কম্পিউটার বিজ্ঞান মধ্যে আছে প্রথম হল সব, কৃত্রিম বুদ্ধিমত্তা এবং মেশিন লার্নিং. সুতরাং, আমরা কাজ করার চেষ্টা করছি গণনীয় ভাষাতত্ত্ব শেখান হয় কিছু করতে কিভাবে আপনার কম্পিউটার ভাষা দিয়ে. সুতরাং, উদাহরণস্বরূপ, মেশিনের মধ্যে অনুবাদ. আমি আমার কম্পিউটারে কিভাবে শেখান চেষ্টা করছি এক থেকে রূপান্তরটি জানতে অন্য ভাষা. সুতরাং, মূলত শিক্ষণ পছন্দ একটি কম্পিউটার দুটি ভাষায়. আমি প্রাকৃতিক ভাষা প্রক্রিয়াকরণ না, এর উদাহরণস্বরূপ ক্ষেত্রে যা ফেসবুক এর গ্রাফ অনুসন্ধান, আপনি পড়ান বুঝতে কিভাবে আপনার কম্পিউটার প্রশ্ন ভাল. সুতরাং, আপনি "ফটো বলতে যদি আমার বন্ধু. "ফেসবুক আচরণ না যে একটি সম্পূর্ণ পংক্তি হিসেবে শব্দ মাত্র একটি গুচ্ছ. এটা আসলে সম্পর্ক বোঝে "ছবি" এবং "আমার বন্ধু" এবং এর মধ্যে "ছবি" যে বোঝে সম্পত্তি "আমার বন্ধু." সুতরাং, যে, যেমন, অংশ প্রাকৃতিক ভাষা প্রক্রিয়াকরণ. এটা বোঝার চেষ্টা কি মধ্যে সম্পর্ক হয় একটি বাক্যে শব্দের. আর বড় প্রশ্ন, আপনি যা করতে পারেন হয় কথা বলতে, কিভাবে একটি কম্পিউটার পড়ান সাধারণভাবে একটি ভাষা? একটি খুব আকর্ষণীয় প্রশ্নের কোনটি , যদি হয়তো ভবিষ্যতে, মনে আপনি পাবে যাচ্ছেন আপনার সেল ফোন থেকে কথা বলুন. কাইন্ড অফ আমরা Siri সাথে কি মত কিন্তু আরো কিছু মত, আসলে আপনি যা করতে পারেন যাহা চান বলে এবং ফোন সবকিছু বুঝতে হবে. এবং এটা প্রশ্ন অনুসরণ থাকতে পারে এবং কথা বলা রাখা. যে, সত্যিই উত্তেজনাপূর্ণ কিছু আমার মতে. সুতরাং, প্রাকৃতিক ভাষায় সম্পর্কে কিছু. সম্পর্কে সত্যিই আকর্ষণীয় কিছু প্রাকৃতিক ভাষায় যে, এবং এই হল আমার ভাষাবিদ্যা অধ্যাপক ঋণ, মারিয়া Polinsky. তিনি একটি উদাহরণ দেয় এবং আমি মনে করি এটি সত্যিই আকর্ষণীয়. আমরা যখন থেকে ভাষা শিখতে কারণ আমরা আমাদের স্থানীয় তারপর জন্মগ্রহণ করেন এবং করছেন ভাষা ধরনের আমাদের উপর বৃদ্ধি. এবং মূলত আপনি ভাষা শিখতে সংক্ষিপ্ত ইনপুট থেকে, ডান? আপনি শুধুমাত্র থেকে ইনপুট পেয়ে থাকেন আপনার আপনার ভাষা শোনাচ্ছে কি বাবা পছন্দ এবং আপনি শুধু এটা জানার জন্য. আপনি তাকান কারণ যদি তাই, এটা আকর্ষণীয় সেই বাক্য এ, উদাহরণস্বরূপ. আপনি তাকান, "মেরি প্রতি একটি কোট উপর রাখে সময় তিনি বাড়ির বাইরে যায়. " এই ক্ষেত্রে, এটা সম্ভব শব্দ "সে" অধিকার, মেরি পড়ুন? আপনি "মেরি একটি কোট উপর রাখে বলতে পারেন মেরি পাতার প্রতি সময় ঘর. "তাই যে সূক্ষ্ম. কিন্তু তারপর আপনি বাক্য তাকান "তিনি মেরি একটি কোট নেভিগেশন প্রত্যেক সময় রাখে ঘর ছেড়ে. "আপনি কি এটা জানি "সে" বলতে অসম্ভব মেরি উল্লেখ. "মেরি রাখে বলে যে কোন উপায় আছে একটি কোট নেভিগেশন মেরি পাতার প্রতি সময় ঘর. "তাই এটা আকর্ষণীয় কারণ এই অনুভূতি ধরনের প্রতি নেটিভ স্পিকার আছে. আর কেউ এই যে শেখানো হয় সিনট্যাক্স কাজ করে যে ভাবে. এবং আপনি শুধুমাত্র এই "সে" থাকতে পারে এই প্রথম ক্ষেত্রে মেরি উল্লেখ এবং প্রকৃতপক্ষে এই অন্য মধ্যে খুব, কিন্তু না এই এক. কিন্তু সবাই ধরনের পায় একই উত্তর দিতে. প্রত্যেকেরই যে উপর সম্মত. সুতরাং কিভাবে, যদিও সত্যিই আকর্ষণীয় আপনি সব নিয়ম জানি না আপনার ভাষায় আপনি ধরনের বোঝেন ভাষা কিভাবে কাজ করে. তাই প্রাকৃতিক সম্পর্কে আকর্ষণীয় বিষয় ভাষা আপনাকে করতে হবে না হয় জানা কোনো সিনট্যাক্স যদি জানেন একটি বাক্য জন্য ব্যাকরণগত বা ব্যাকরণ বহির্ভূত হয় অধিকাংশ ক্ষেত্রে. আপনি কি মনে করেন যার ফলে যে হয়তো কি এরকম যে আপনি, আপনার জীবনের মাধ্যমে হয় শুধু আরও পেয়ে রাখা বাক্য তোমাদের কাছে বলা. এবং তারপর আপনি memorizing রাখা বাক্যের সব. এবং তারপর কেউ আপনি বলে যখন কিছু, আপনি যে বাক্য শুনতে এবং আপনি আপনার শব্দভান্ডার তাকান বাক্যের এবং দেখুন যে বাক্য আছে. এবং এটা সেখানে আপনি যদি এটি ব্যাকরণগত বলতে. এটা না হলে আপনি তা বলতে ব্যাকরণ বহির্ভূত. সুতরাং, সেই ক্ষেত্রে, আপনি, ওহ, বলতে হবে তাই আপনি সব বিপুল তালিকা আছে সম্ভব বাক্য. এবং তারপর আপনি একটি বাক্য শুনতে যখন, এটি ব্যাকরণগত বা যদি আপনি কি জানেন যে উপর ভিত্তি করে না. জিনিস যে আপনি তাকান একটি বাক্য, যেমন, " পাঁচটি কেশ CS50 টিএফএস অন্ধ রান্না একটি DAPA মগ ব্যবহার অক্টোপাস. "এটা স্পষ্টভাবে না একটি বাক্য আপনি আগে শুনেছেন যে. কিন্তু একই সময়ে আপনি তা জানি অধিকার, ব্যাকরণগত প্রায় কাছাকাছি? কোন ব্যাকরণগত ভুল আছে এবং আপনি বলতে পারেন যে এটি একটি সম্ভাব্য বাক্য এর. সুতরাং এটা আমাদের মনে যে আসলে আমরা ভাষা শিখতে যে পথ হয় না শুধুমাত্র সম্ভাব্য বিপুল ডাটাবেস থাকার শব্দ বা বাক্য, কিন্তু আরও মধ্যে সম্পর্ক অন্তর্দৃষ্টিসম্পন্ন সেই বাক্য শব্দ. যে জানার জন্য? সুতরাং, তারপর প্রশ্ন করতে পারেন হয় কম্পিউটারের ভাষা শিখতে? আমরা কম্পিউটারের ভাষা শেখান করতে পারেন? সুতরাং, এর পার্থক্য মনে করা যাক একটি ভাষার একটি নেটিভ স্পিকার মধ্যে এবং একটি কম্পিউটার. সুতরাং, কি স্পিকার করতে হবে? ওয়েল, নেটিভ স্পিকার একটি learns এটা মরেছে থেকে ভাষা. সাধারণত তার শৈশবের বছর. তাই, মূলত, আপনি শুধু একটি বাচ্চা আছে এবং আপনি তা করার কথা রাখা, এবং এটা শুধু কথা বলতে, কিভাবে learns ভাষা, ডান? সুতরাং, আপনি মূলত প্রদান করছি শিশুর ইনপুট. সুতরাং, তাহলে আপনি তর্ক করতে পারেন যে একটি কম্পিউটার ডান, একই জিনিস করতে পারেন? আপনি শুধুমাত্র ভাষা দিতে পারে কম্পিউটারে ইনপুট হিসেবে. উদাহরণস্বরূপ হিসেবে ফাইল একটি গুচ্ছ ইংরেজি বই আছে. হয়তো এক যে উপায় আপনি যে সম্ভবত একটি শেখান পারে কম্পিউটার ইংরেজি, ডান? এবং সত্য, আপনি এটি আমার মনে হয়, এটা হয়ত কয়েক প্রদর্শিত একটি বই পড়তে দিন. একটি কম্পিউটার জন্য এটি একটি দ্বিতীয় লাগে একটি বইয়ে সব শব্দ তাকান. সুতরাং আপনি যে হতে পারে মনে করতে পারেন শুধু এই আপনি বিশ্ব থেকে ইনপুট যুক্তি, যে যে বলতে যথেষ্ট না শুধুমাত্র মানুষের কাজ করতে পারেন এমন কিছু বিষয়. আপনি কম্পিউটারের মনে করতে পারেন এছাড়াও ইনপুট পেতে পারেন. দ্বিতীয় ব্যাপার হল নেটিভ স্পিকার এছাড়াও আছে একটি মস্তিষ্ক আছে ভাষা শেখার সামর্থ্য. কিন্তু আপনি কি এটা আমার মনে হয়, একটি মস্তিষ্কের একটি কঠিন জিনিস. আপনি জন্ম হয়, এটা আগে থেকেই সেট করে - এই আপনার মস্তিষ্ক হল. আপনি বড় হিসাবে, আপনি শুধু আরো পাবেন ভাষার ইনপুট এবং হয়ত পুষ্টি এবং অন্যান্য উপাদান. কিন্তু প্রায় কাছাকাছি আপনার মস্তিষ্ক একটি কঠিন জিনিস. তাই আপনি ভাল হয়ত, আপনি যা করতে পারেন, বলতে পারেন একটি গুচ্ছ আছে একটি কম্পিউটার নির্মাণ ফাংশন এবং শুধু অনুকরণমূলক যে পদ্ধতি ভাষা শেখার সামর্থ্য. সুতরাং অর্থে যে, আপনি আমি, ভাল, বলতে পারে সব আছে যে একটি কম্পিউটার আছে আমি ভাষা শেখা প্রয়োজন জিনিষ. এবং শেষ জিনিস যে একটি নেটিভ স্পিকার শুদ্ধাশুদ্ধি থেকে learns. তাই মূলত আরেকটি গুরুত্বপূর্ণ বিষয় এ ভাষা শেখার যে আপনি ধরনের হাজার করে জিনিস জানতে আপনি শুনতে কি সাধারণীকরণের. আপনি উদ্ভিন্ন হিসাবে সুতরাং আপনি যে জানতে কিছু শব্দ আরো বিশেষ্য মত, কিছু অন্যান্য বেশী বিশেষণ হয়. এবং যদি আপনি কোনো আছে করতে হবে না ভাষাতত্ত্ব জ্ঞান বুঝতে. তবে আপনি যদি না কিছু কিছু শব্দ আছে জানি কিছু অংশে স্থান হয় বাক্য এবং অন্যান্য কিছু অন্যদের বাক্যের অংশ. এবং যে আপনি যে কিছু করতে হলে সঠিক নয় যে একটি বাক্য মত - হয়ত কারণ একটি ওভার সামান্যীকরণ এর উদাহরণস্বরূপ. আপনি উদ্ভিন্ন যখন হয়তো, আপনি বিজ্ঞপ্তি বহুবচন সাধারণত যে এ এস নির্বাণ দ্বারা গঠিত শব্দের শেষে. এবং তারপর আপনি এর বহুবচন করতে চেষ্টা "Deers" বা "দাঁত" মতই "হরিণ" "Tooths." আমি তখন আপনার বাবা বা কেউ আপনাকে সংশোধন ও বলছেন না, "হরিণ" এর বহুবচন "হরিণ" এবং "দাঁত" এর বহুবচন "দাঁত." হয় এবং তারপর আপনি সেগুলো শিখতে. সুতরাং আপনি শুদ্ধাশুদ্ধি থেকে শিখতে. কিন্তু আপনার কি করতে পারেন যে একটি কম্পিউটারের সাথে. আপনি কিছু বলা থাকতে পারে শক্তিবৃদ্ধি শেখার. একটি দেবার মত মূলত কোনটি এটা আছে যখনই কম্পিউটারের একটি পুরস্কার সঠিকভাবে কিছু. এবং এটি একটি পুরস্কার বিপরীত প্রদান এবং এটা কিছু ভুল আছে যখন. আপনি আসলে দেখতে পারেন যে আপনি যান Google Translate এবং আপনি চেষ্টা একটি বাক্য অনুবাদ, এটা প্রতিক্রিয়ার জন্য অনুরোধ জানাবে. যদি আপনি বলে তাই, ওহ, ভালো আছে এই বাক্য জন্য অনুবাদ. এর পরে তা টাইপ করুন এবং যদি অনেক মানুষ যে একটি ভাল বলছে রাখা অনুবাদ, এটা জানতে যে এটি পরিবর্তে যে অনুবাদ ব্যবহার করা উচিত এটা দেবার ছিল এক. সুতরাং, এটি একটি খুব দার্শনিক প্রশ্ন কম্পিউটার হতে যাচ্ছে কিনা দেখতে ভবিষ্যতে কথা বলার বা না করতে সক্ষম. কিন্তু আমি উচ্চ আশা আছে তারা করতে পারেন যে শুধু ঐ যুক্তির উপর ভিত্তি করে. কিন্তু এটা একটি দার্শনিক শুধু আরো প্রশ্ন. কম্পিউটার এখনও কথা বলতে পারেন না, যখন সুতরাং, আমরা কি করতে পারেন যে কি হয়? কিছু সত্যিই দুর্দান্ত জিনিস আছে তথ্য শ্রেণীবিভাগ. সুতরাং, উদাহরণস্বরূপ, আপনি না জানি যে ইমেইল পরিষেবার জন্য, কি উদাহরণস্বরূপ, স্প্যাম ফিল্টারিং. আপনি স্প্যাম প্রাপ্ত সুতরাং যখনই এটি অন্য বাক্স থেকে ফিল্টার করার চেষ্টা করে. সুতরাং কিভাবে এটা যে কি করে? এটি কম্পিউটার শুধু জানে না মত কি ইমেইল ঠিকানা স্প্যাম পাঠানো হয়. সুতরাং এটা আরো বিষয়বস্তুর উপর ভিত্তি করে এর বার্তা, হয়তো বা শিরোনাম বা হতে পারে আপনি যে কিছু প্যাটার্ন. তাই, মূলত, আপনি কি কি করতে পারেন পেতে হয় একটি স্প্যাম যে ইমেইলের তথ্য অনেক, স্প্যাম নয়, এবং জানতে যে ইমেল কি আপনি মধ্যে আছে নিদর্শন ধরনের স্প্যাম যে ওগুলো. এবং এই গণনীয় অংশ ভাষাতত্ত্ব. এটি তথ্য শ্রেণীবিভাগ বলা হচ্ছে. এবং আমরা আসলে দেখতে চলুন একটি পরবর্তী স্লাইড মধ্যে যে উদাহরণ. দ্বিতীয় যে জিনিসটি প্রাকৃতিক ভাষা জিনিস যা প্রক্রিয়াকরণ যে গ্রাফ অনুসন্ধান লেট করছে আপনি একটি বাক্য লিখুন. এবং এটা আপনি বুঝতে ট্রাস্ট কি অর্থ ও দেয় আপনি একটি ভাল ফলাফল. বাস্তবিক, যদি আপনি গুগল বা বিং যেতে হলে এবং আপনি লেডি ভালো কিছু অনুসন্ধান গাগা এর উচ্চতা, আপনি আসলে চলুন পরিবর্তে তথ্যের 5 '1 "পেতে এটি আসলে বুঝতে পারে, কারণ তার থেকে আপনি যে বিষয়ে কথা বলছি. সুতরাং যে প্রাকৃতিক অংশ ভাষা প্রক্রিয়াকরণ. অথবা আপনি প্রথম, Siri ব্যবহার করছেন যখন আপনি চেষ্টা করে যে একটি অ্যালগরিদম আছে কি বলছে তা অনুবাদ শব্দের মধ্যে, টেক্সট. এবং তারপর এটি অনুবাদ করার চেষ্টা করে যে অর্থ মধ্যে. সুতরাং যে সব প্রাকৃতিক অংশ ভাষা প্রক্রিয়াকরণ. তারপর আপনি মেশিনের অনুবাদ আছে - আসলে এক যা আমার পছন্দের - শুধু থেকে অনুবাদ করা হয়, যা অন্য একটি ভাষা. তাই আপনি আপনি করছেন যখন যে মনে করতে পারেন মেশিনে অনুবাদ, আপনার আছে বাক্যের অসীম সম্ভাবনার. তাই শুধু জমা করার কোন উপায় আছে প্রতি একক অনুবাদ. তাই আপনি যদি আকর্ষণীয় চিন্তা করতে হবে আলগোরিদিম পাবে প্রতি একক অনুবাদ কিছু উপায় বাক্য. আপনি না এ পর্যন্ত কোন প্রশ্ন থাকে? কোন? ঠিক আছে. তাই আমরা আজ দেখতে যাচ্ছে? প্রথম সব, আমি সম্পর্কে কথা বলতে যাচ্ছি শ্রেণীবিভাগ সমস্যা. তাই আমি যে এক স্প্যাম সম্পর্কে বলছেন. আমি কি করতে যাচ্ছি দেওয়া গান, হয় একটি গান করার জন্য, আপনি চিন্তা করার চেষ্টা করতে পারেন উচ্চ সম্ভাবনা সঙ্গে গায়িকা কে? এর আমি লেডি থেকে গান আছে বলে যাক গাগা এবং পেরি Katy, আমি আপনাকে একটা দিতে হলে নতুন গান, আপনি চিন্তা করতে পারেন যদি এটি পেরি Katy বা লেডি গাগা কি? দ্বিতীয় এক, আমি কথা বলতে যাচ্ছি সেগমেন্টেশন সমস্যা সম্পর্কে. তাই আমি আপনাকে বলছি যদি জানেন জানি না কিন্তু , চীনা জাপানি, অন্যান্য পূর্ব এশিয়ার ভাষা, এবং অন্যান্য ভাষায় সাধারণভাবে, হবে না শব্দের মধ্যে স্পেস. এবং তারপর আপনি যে ভাবে আমার মনে হয়, যদি চেষ্টা করুন আপনার কম্পিউটার ধরনের প্রাকৃতিক ভাষা প্রক্রিয়াকরণ বুঝতে, এটা শব্দ দেখে এবং সম্পর্ক বুঝতে চেষ্টা করে তাদের মধ্যে, ডান? কিন্তু তারপর আপনি চীনা আছে, এবং যদি শূন্য স্পেস আছে, এটা বলা কঠিন সত্যিই মধ্যে সম্পর্ক কি জানতে শব্দ, কারণ তারা কোনো না থাকে প্রথম শব্দ. সুতরাং আপনি কিছু বলা যা করতে হবে শুধু নির্বাণ যার মানে সেগমেন্টেশন আমরা কল চাই কি মাঝখানে খালি জায়গা ঐ ভাষায় শব্দ. জানার জন্য? এবং তারপর আমরা চলুন বাক্য গঠন সম্পর্কে কথা বলুন. প্রাকৃতিক সম্পর্কে তাই অল্পমাত্র বিট ভাষা প্রক্রিয়াকরণ. এটি শুধু একটি সংক্ষিপ্ত হতে যাচ্ছে. তাই আজ, মূলত আমি কি করতে চান বলছি আপনি একটি সামান্য বিট দিতে হয় সম্ভাবনার কি ভেতরে আপনি গণনীয় করতে পারেন যে ভাষাতত্ত্ব. এবং তারপর আপনি কি আপনি মনে দেখতে পারেন ঐ বিষয়ের মধ্যে শান্ত. এবং হতে পারে আপনি একটি প্রকল্পের মনে করতে পারেন ও আমার সাথে কথা বলতে আসা. এবং আমি আপনাকে পরামর্শ দিতে পারেন এটি বাস্তবায়ন কিভাবে. সুতরাং বাক্য গঠন সামান্য বিট হতে যাচ্ছে গ্রাফ অনুসন্ধান এবং মেশিন সম্পর্কে অনুবাদ. আমি ঠিক কিভাবে একটি উদাহরণ দিতে যাচ্ছি আপনি, যেমন, অনুবাদ পারে ইংরেজি থেকে পর্তুগিজ থেকে কিছু. শব্দগুলি ভালো? সুতরাং প্রথম, শ্রেণীবিভাগ সমস্যা. আমি বলবো যে সেমিনারে এই অংশ সবচেয়ে চ্যালেঞ্জিং হতে যাচ্ছে এক আছে এর ঠিক কারণ কিছু কোডিং করা. কিন্তু এটা পাইথন হতে যাচ্ছে. আমি আপনাকে বলছি পাইথন জানেন, তাই না জানি আমি শুধু উচ্চ নেভিগেশন ব্যাখ্যা করা যাচ্ছে না কি আমি করছি শ্রেনী. এবং আপনি খুব সত্যিই যত্ন করতে হবে না কারণ যে বাক্য গঠন সম্পর্কে অনেক কিছু আপনি না জানতে পারেন কিছু. ঠিক আছে? শব্দগুলি ভালো. সুতরাং শ্রেণীবিভাগ সমস্যা কি? সুতরাং আপনি কিছু গানের দেওয়া করছি একটি গান, এবং আপনি অনুমান করতে ইচ্ছুক যারা এটি গাওয়া হয়. এবং এই কোন ধরণের জন্য হতে পারে অন্যান্য সমস্যার. সুতরাং, উদাহরণস্বরূপ, যদি আপনি একটি আছে করা যাবে রাষ্ট্রপতি প্রচার এবং আপনি একটি আছে বক্তৃতা, এবং আপনি খুঁজতে চান এটি ছিল আউট যদি, উদাহরণস্বরূপ, ওবামা বা অভ্যর্থনা Romney. অথবা আপনি ইমেল একটি গুচ্ছ আছে এবং পারে আপনি যদি তারা চিন্তা করতে চান স্প্যাম বা না. তাই এটি শুধু কিছু classifying হচ্ছে শব্দের উপর ভিত্তি করে তথ্য আপনি সেখানে আছে. সুতরাং যে কি, আপনি করতে হবে কিছু অনুমানের করুন. সুতরাং গণনীয় ভাষাতত্ত্ব সম্পর্কে অনেক কিছু অনুমানের করছে, সাধারণত স্মার্ট অনুমিতি, যাতে আপনি ভাল ফলাফল পেতে পারেন. এটি জন্য একটি মডেল তৈরি করার চেষ্টা করছে. এবং তারপর, এটা চেষ্টা এবং এটি কাজ করে দেখতে এটা আপনি ভাল স্পষ্টতা দেয় না. এবং এটা আছে, তাহলে আপনি আরও উন্নত করার চেষ্টা করুন. তা, আপনি, ঠিক আছে, ভালো থাকেন না হয়তো আমি একটি ভিন্ন পরিগ্রহ করা উচিত. সুতরাং আমরা চলুন যে ধৃষ্টতা করতে একজন শিল্পী সাধারণত sings হয় হয়তো আমার একটি বিষয় একাধিক বার, এবং শব্দের একাধিক বার ব্যবহার করে মাত্র তারা এটি ব্যবহার করতেন কারণ. আপনি শুধু আপনার বন্ধুর মনে করতে পারেন. আমি আপনাকে বলছি সব বন্ধু আছে নিশ্চিত তাদের স্বাক্ষর ফ্রেজ বলে যে আক্ষরিক প্রতি একক বাক্য জন্য - কিছু নির্দিষ্ট শব্দ বা কিছু নির্দিষ্ট মত তারা জন্য বলে যে শব্দগুচ্ছ প্রতি একক বাক্য. এবং কি আপনি বলতে পারেন যে আপনি দেখতে হলে একটি স্বাক্ষর আছে একটি বাক্য শব্দগুচ্ছ, আপনি অনুমান করতে পারেন যে সম্ভবত আপনার বন্ধু এক অধিকার, এটা বলার অপেক্ষা রাখে? তাই এর পরে যে ধৃষ্টতা করতে এবং যে আপনি একটি মডেল তৈরি কিভাবে. আমি দিতে যাচ্ছি যে যেমন হয় কিভাবে লেডি গাগা, যেমন, মানুষ সে জন্য "শিশুর" ব্যবহার করে বলে যে সব তার এক নম্বর গান. এবং প্রকৃতপক্ষে এই একটি ভিডিও দেখায় যে তার শব্দ "শিশুর" জন্য বলছে বিভিন্ন গান. [ভিডিও প্লেব্যাক] - (জন্য গান গাওয়া) ঢাকা. ঢাকা. ঢাকা. ঢাকা. ঢাকা. খোকামনি. ঢাকা. ঢাকা. ঢাকা. ঢাকা. [END টি ভিডিও প্লেব্যাক, LUCAS Freitas: তাই, আমি মনে করি, সেখানে সে বলল যা এখানে 40 গান শব্দ "শিশুর." সুতরাং আপনি মূলত অনুমান করতে পারেন যে আপনি যে একটি গান দেখতে হলে শব্দ "শিশুর," কিছু উচ্চ আছে এটি লেডি গাগা এর যে সম্ভাবনা. কিন্তু এর এই বিকাশ চেষ্টা করুন আরও আরও আনুষ্ঠানিকভাবে. সুতরাং এই দ্বারা গান গান আছে লেডি গাগা এবং পেরি Katy. সুতরাং আপনি লেডি গাগা তাকান, আপনি তারা দেখতে এর ঘটনার অনেক আছে "শিশুর," একটি এর ঘটনার অনেক "পথ." এবং তারপর পেরি Katy এর ঘটনার অনেক আছে "," এর ঘটনার অনেক "ফায়ার." তাই মূলত আমরা চাই কি আপনি একটি গীতধর্মী পেতে হয়. এর যদি আপনি একটি জন্য একটি গীতধর্মী পেতে বলতে যাক "শিশুর" শুধু "শিশুর." যে গান যদি আপনি শুধু শব্দ "শিশুর," এবং এই পেতে আপনার কাছ থেকে যে সব তথ্য থাকে লেডি গাগা এবং পেরি Katy, যারা would আপনি অনুমান হয় ব্যক্তি যারা গান sings? লেডি গাগা বা পেরি Katy? লেডি গাগা, ডান? সে বলল, যারা শুধুমাত্র একটি কারণ "শিশুর." এই অধিকার, মূঢ় শোনাচ্ছে? ঠিক আছে, এই সত্যিই সহজ. আমি শুধু দুটি গান এ এবং এর খুঁজছি অবশ্যই, সে আছে যারা শুধুমাত্র এক "শিশুর." তবে আপনি যদি শব্দের একটি গুচ্ছ কি আছে? আপনি একটি প্রকৃত গীতি, কিছু আছে যেমন, "বেবি, আমি একটি [দেখতে গিয়েছিলাম? CFT?] বক্তৃতা, "বা যে ভালো কিছু, এবং তারপর আপনি আসলে চিন্তা করতে হবে - সমস্ত শব্দের উপর ভিত্তি করে - যারা শিল্পী যিনি সম্ভবত এই গান গেয়েছিলেন? সুতরাং আসুন বিকাশ চেষ্টা করুন একটু আরো এই. ঠিক আছে, তাই ঠিক তথ্য উপর ভিত্তি করে যে আমরা পেয়েছেন, এটা গাগা সম্ভবত যে মনে হচ্ছে গায়ক. কিন্তু কিভাবে আমরা লিখতে পারেন এই আরো আনুষ্ঠানিকভাবে? আর একটু করা আছে যাচ্ছে পরিসংখ্যান বিট. তাই আপনি যদি হারিয়ে, শুধু চেষ্টা ধারণা বুঝতে. আপনি বুঝতে যদি এটা কোন ব্যাপার না সমীকরণ পুরোপুরি ভাল. এই সব অনলাইন হবে. তাই মূলত কি আমি গণক করছি হয় এই গান করে যে সম্ভাবনা লেডি গাগা প্রদত্ত যে - তাই এই বার যে দেওয়া মানে - আমি শব্দ দেখেছি "শিশুর." যে জানার জন্য? তাই আমি গণনা করতে চেষ্টা করছি যে সম্ভাবনা. সুতরাং বলা এই উপপাদ্য আছে বলছেন যে যে Bayes উপপাদ্য একটি প্রদত্ত বি হওয়ার সম্ভাবনা, হয় এ, বার দেওয়া বি হওয়ার সম্ভাবনা সম্ভাবনা উপর একটি সম্ভাবনা, বি এই দীর্ঘ সমীকরণ হয়. কিন্তু কি আপনার কাছ থেকে বুঝতে আছে যে এই আমি চাই কি যে হয় অধিকার, নিরূপণ? যে গান করে যে তাই সম্ভাবনা লেডি গাগা আমি শব্দ দেখেছি যে দেওয়া "শিশুর." এবং এখন কি আমি পেয়ে করছি হয় প্রদত্ত শব্দ "শিশুর" সম্ভাবনা আমি লেডি গাগা আছে. এবং যে মূলত কি? যে মানে কি, কি শব্দ "শিশুর" এইজন্য সম্ভাবনা গাগা গান? আমি খুব যে গণনা করতে চান, সহজ উপায়, এটা শুধু সংখ্যা না বার আমি মোট সংখ্যা বেশি "শিশুর" দেখতে গাগা গানের শব্দের, ডান? আমি দেখতে যে ফ্রিকোয়েন্সি কি গাগা এর কাজের মধ্যে যে শব্দ? জানার জন্য? দ্বিতীয় শব্দ হয় গাগা হওয়ার সম্ভাবনা. যে এর অর্থ কি? এটা মূলত মানে, কি classifying সম্ভাবনা গাগা হিসাবে কিছু গান? এবং যে অদ্ভুত ধরনের, কিন্তু এর একটি উদাহরণ মনে করা যাক. সুতরাং এর কথা বলা যাক যে সম্ভাবনা একটি গান মধ্যে "শিশুর" হচ্ছে একই গাগা এবং Britney Spears জন্য. কিন্তু Britney Spears দুবার হয়েছে লেডি গাগা বেশী গান. সুতরাং কেউ ঠিক এলোমেলোভাবে আপনি দেয় যদি প্রথম জিনিস ", বাচ্চা" এর গান আপনি এ হয় চেহারা, সম্ভাবনা কি একটি গাগা গান "শিশুর" হচ্ছে, "শিশুর" একটি Britney গান? এবং এটা একই জিনিস. সুতরাং আপনি দেখতে পাবেন যে দ্বিতীয় বিষয় হল ওয়েল, সম্ভাবনা কি নিজে এই গীতি, একটি গাগা গীতধর্মী হচ্ছে এবং এর সম্ভাবনা কি একটি Britney গীতধর্মী হচ্ছে? সুতরাং Britney আরো অনেক গান আছে সাল গাগা তুলনায়, সম্ভবত আপনি would বলতে ভাল, এটা সম্ভবত হয় একটি Britney গীতধর্মী. আমরা এই আছে সুতরাং যে কেন অধিকার এখানে শব্দটি. গাগা এর সম্ভাব্যতা. জ্ঞান করে তোলে? এটা কি? ঠিক আছে. আর গত এক শুধু সম্ভাব্যতা "শিশুর" যা না সত্যিই ব্যাপার যে অনেক. কিন্তু তা হওয়ার সম্ভাবনা আছে ইংরেজিতে "শিশুর" দেখতে পান. আমরা সাধারণত যত্ন না যে যে শব্দটি সম্পর্কে অনেক. যে জানার জন্য? তাই গাগা হওয়ার সম্ভাবনা থাকে এর আগে সম্ভাব্যতা বলা বর্গ গাগা এর. এটা ঠিক যে মানে না, কি হয় যে শ্রেণীর থাকার সম্ভাবনা - গাগা যা হয় - শুধু সাধারণভাবে, শুধু কোন অবস্থার সঙ্গে. এবং তারপর আমি সম্ভাবনা আছে "শিশুর," আমরা একে বলতে প্লাস দেওয়া গাগা এটা কারণ একটি সম্ভাবনা teary থাকার সম্ভাবনা গাগা কিছু প্রমাণ দেওয়া. তাই আমি আপনাকে সাক্ষ্য প্রদান করছি আমি শব্দ শিশুর দেখেছি এবং যে গান জানার জন্য? ঠিক আছে. আমি হিসাব যদি তাই হয় যে প্রতিটি জন্য লেডি গাগা জন্য গান, যে হবে - দৃশ্যত, আমি এই সরানো যাবে না. গাগা হওয়ার সম্ভাবনা থাকবে কিছু মত, 2 24 ওভার, বার 1/2, 53 ওভার 2 বেশী. আপনি যদি জানেন না ব্যাপার কি এই সংখ্যা থেকে আসছে. কিন্তু যাচ্ছে যে মাত্র একটি সংখ্যা আছে অধিকার, 0 বেশী হতে? এবং তারপর আমি পেরি Katy, যখন Katy দেওয়া "শিশুর" হওয়ার সম্ভাবনা থাকে ইতিমধ্যে 0, ডান? কোন "শিশুর" আছে কারণ পেরি Katy মধ্যে. আমি তখন এই 0 হয়ে, এবং গাগা জয়ী, যা গাগা যে মানে সম্ভবত গায়ক. যে জানার জন্য? ঠিক আছে. তাই আমি এই আরও অফিসিয়াল করতে চান, আমি আসলে একটি মডেল কি করতে পারেন একাধিক শব্দের জন্য. সুতরাং আসুন আর কিছু আছে যে বলা যাক যেমন, "বেবি, আমি কোথায় আগুন, "বা কিছু. সুতরাং এটি একাধিক শব্দ আছে. এবং এই ক্ষেত্রে, আপনি দেখতে পারেন যে "শিশুর", গাগা হয় কিন্তু এটি পেরি মধ্যে নয়. এবং "অগ্নি" পেরি হয়, কিন্তু এটা সঠিক, গাগা নাই? সুতরাং এটি অধিকার, trickier হচ্ছে? মনে হয় কারণ যে আপনি প্রায় দুই মধ্যে টাই আছে. তাই আপনাকে যা করতে হবে অনুমান হয় শব্দের মধ্যে স্বাধীনতা. তাই মূলত যে মানে হল যে আমি ঠিক কি গণক করছি এইজন্য হওয়ার সম্ভাবনা "শিশুর," কি এইজন্য হওয়ার সম্ভাবনা "আমি" এবং "আগুন" "না", এবং "উপর," এবং সব আলাদাভাবে. তারপর আমি তাদের সব গুন করছি. এবং আমি সম্ভাবনা কি এইজন্য করছি পুরো বাক্য দেখছি. জানার জন্য? তাই মূলত, আমি শুধু একটা শব্দ আছে, কি আমি খুঁজতে চান ARG সর্বোচ্চ হয়, যার মানে, যে বর্গ কি আমার সর্বোচ্চ সম্ভাবনা দেবার? সুতরাং দেবার যে বর্গ কি আমার জন্য সর্বোচ্চ সম্ভাবনা বর্গ সম্ভাবনা শব্দ দেওয়া. তাই এই ক্ষেত্রে, গাগা "শিশুর." দেওয়া অথবা Katy "শিশুর." দেওয়া জানার জন্য? এবং শুধুমাত্র Bayes থেকে, যে আমি দেখিয়েছি যে সমীকরণ, আমরা এই ভগ্নাংশ তৈরি. শুধু আপনি দেখতে হয় প্রদত্ত শব্দের সম্ভাবনা নির্ভর বর্গ পরিবর্তন ক্লাসে প্রথম, ডান? আমি যে "শিশুর" র সংখ্যা গাগা মধ্যে পেরি থেকে ভিন্ন. ক্লাস হওয়ার সম্ভাবনা রয়েছে এটা শুধু সংখ্যা না পরিবর্তনের কারণ তাদের গান প্রতিটি আছে. কিন্তু শব্দ নিজেই সম্ভাবনা সব জন্য একই হতে যাচ্ছে শিল্পী, ডান? তাই শব্দের সম্ভাব্যতা শুধু, সম্ভাবনা কি যে শব্দ এইজন্য ইংরেজি ভাষা? সুতরাং তাদের সব জন্য একই. এই ধ্রুবক সুতরাং যেহেতু আমরা করতে পারেন মাত্র এই ড্রপ এবং এটি যত্নশীল না. তাই এই আসলে হবে আমরা খুঁজছেন সমীকরণ. আমি একাধিক শব্দ আছে, আমি আছি এখনও পূর্বে আছে যাচ্ছে এখানে সম্ভাবনা. শুধু আমি গুন করছি অনুপস্থিত সম্ভাবনা সব অন্য কথায়. তাই আমি তাদের সব গুন করছি. জানার জন্য? এটা অদ্ভুত মনে হচ্ছে কিন্তু মূলত মানে ক্লাসের পূর্বে, এবং নিরূপণ তারপর একে সম্ভাবনা দ্বারা সংখ্যাবৃদ্ধি যে ক্লাসে হচ্ছে শব্দের. এবং আপনি কি জানেন যে একটি সম্ভাবনা একটি বর্গ প্রদত্ত শব্দ হতে যাচ্ছে আপনি যে শব্দ দেখতে কতবার সংখ্যা দ্বারা বিভক্ত যে বর্গ, শব্দ আপনি যে আছে সাধারণ শ্রেণীর. জানার জন্য? এটা ওভার 2 ঠিক কিভাবে "শিশুর" ছিল এর শব্দের সংখ্যা যে আমি গানের মধ্যে ছিল. তাই শুধু ফ্রিকোয়েন্সি. কিন্তু এক জিনিস আছে. আমি দেখাচ্ছে কিভাবে মনে রাখবেন যে "শিশুর" হচ্ছে গানের সম্ভাবনা পেরি থেকে 0 ছিল মাত্র কারণ পেরি পেরি সব সময়ে "শিশুর" আছে কি না? কিন্তু এটা ঠিক করতে একটু কঠোর শোনাচ্ছে কেবল গান থেকে হতে পারে না বলে তারা না থেকে শুধুমাত্র এই কারণে একজন শিল্পী যে কোনো সময়ে বিশেষ করে যে শব্দ. আপনি যদি তাই আপনি শুধু ভাল,, বলতে পারে এই শব্দ আছে না, আমি যাচ্ছি আপনি একটি নিম্ন সম্ভাবনা দিতে, কিন্তু আমি যাচ্ছি না এখুনি আপনি 0 দিন. হয়তো এটা কিছু, ভালো ছিল কারণ যা "অগ্নি, অগ্নি, অগ্নি, অগ্নি," সম্পূর্ণ পেরি Katy. এবং তারপর "শিশুর," এবং এটা ঠিক যায় 0 এখুনি এক ছিল কারণ "শিশুর." তাই মূলত আমরা কি কিছু Laplace মসৃণকরণ বলা. এবং এই মাত্র আমি প্রদান করছি যে মানে এমনকি শব্দ কিছু সম্ভাবনা যে কোন অস্তিত্ব নেই. তাই আমি না যে আমি যখন এই হিসাবী, আমি সবসময় থেকে 1 যোগ লব. শব্দ, অস্তিত্ব নেই সুতরাং এমনকি যদি এই 0 যদি এই ক্ষেত্রে,, আমি এখনও আছি উপর 1 হিসাবে এই গণক শব্দের মোট সংখ্যা. অন্যথা, আমি পেতে কতগুলি শব্দ আমি আছে এবং আমি 1 যোগ করুন. তাই আমি উভয় ক্ষেত্রেই জন্য গণনা করছি. জানার জন্য? তাই এখন আমি কি কিছু কোডিং করতে দেওয়া. আমি প্রশংসনীয় দ্রুত এটা করতে আছে যাচ্ছি কিন্তু এটা খুবই গুরুত্বপূর্ণ যে আপনি যে বলছি ধারণা বুঝতে. তাই কি আমরা করতে চেষ্টা করছেন ঠিক এই বাস্তবায়ন হয় আমি ঠিক বলেন যে বিষয় - আমি আপনার কাছ থেকে গানের লাগাতে চান লেডি গাগা এবং পেরি Katy. এবং প্রোগ্রাম পাবে যাচ্ছে এই নতুন গানের গাগা থেকে যদি বলতে বা পেরি Katy. জানার জন্য? ঠিক আছে. তাই আমি আমি যাচ্ছি এই প্রোগ্রাম আছে classify.py কল. তাই এই পাইথন হয়. এটি একটি নতুন প্রোগ্রামিং ভাষা নয়. এটা কিছু ক্ষেত্রে অনুরূপ C এবং পিএইচপি উপায়. আপনি চান, কারণ যদি এটা অনুরূপ সি বুদ্ধিমান পরে পাইথন শিখতে, এটা একটি চ্যালেঞ্জের সত্যিই যে অনেক না পাইথন অনেক সহজ শুধুমাত্র এই কারণে আর সি, প্রথম সব. আর একটা অনেক আগে থেকেই আছেন আপনার জন্য প্রয়োগ. তাই ঠিক কিভাবে পিএইচপি মত ফাংশন আছে যে একটি তালিকা বাছাই, বা কিছু লিখবেন একটি অ্যারের, বা বাজে কথা, বাজে কথা, বাজে কথা থেকে. পাইথন পাশাপাশি ঐ সব আছে. তাই আমি শুধু দ্রুত ব্যাখ্যা করা যাচ্ছে না আমরা শ্রেণীবিভাগ যেত না কিভাবে এখানে জন্য সমস্যা. তাই আসুন এই ক্ষেত্রে, আমি যে বলা যাক গাগা এবং পেরি Katy থেকে গান. আমি ঐ গান আছে যে উপায় যে গানের প্রথম শব্দ শিল্পী নাম, এবং বাকি গান হয়. সুতরাং আসুন আর এই তালিকা আছে যে বলা যাক যা প্রথম এক গাগা করে গান করে. তাই এখানে আমি ঠিক দিকে যাচ্ছে না. এবং পরবর্তী এক পেরি, এবং এটা এমন একটা গান আছে. তাই এই আপনি ডিক্লেয়ার কিভাবে পাইথন মধ্যে একটি পরিবর্তনশীল. আপনি ডাটা টাইপ দিতে হবে না. আপনি শুধু "গান," লিখুন ধরনের পিএইচপি চাই. জানার জন্য? তাই আমি যে জিনিস কি আছে নিরূপণ পাবে নিরূপণ probabilities? আমি "গতকাল দেশের সর্বোচ্চ তাপমাত্রা" নিরূপণ করতে হবে বিভিন্ন প্রতিটি আমি যে ক্লাস. আমি "পোঁদ," নিরূপণ করতে হবে বা প্রায় কাছাকাছি probabilities র বিভিন্ন শব্দের প্রতিটি যে আমি প্রতিটি শিল্পী জন্য থাকতে পারে. তাই গাগা মধ্যে, উদাহরণস্বরূপ, আমি যাচ্ছি আমি দেখতে কতবার একটি তালিকা আছে শব্দের প্রতিটি. জানার জন্য? এবং পরিশেষে, আমি ঠিক আছে যাচ্ছি একটি শুধু যাচ্ছে যে "শব্দ" বলা তালিকা আছে কিভাবে অনেক শব্দ আমি প্রতিটি শিল্পী জন্য আছে. তাই গাগা জন্য, যেমন, যখন আমি বর্ণন গান করতে, আমি, আমি মনে করি ছিল, 24 মোট মধ্যে শব্দ. তাই এই তালিকা ঠিক আছে যাচ্ছে গাগা 24, এবং পেরি অন্য নম্বর. জানার জন্য? ঠিক আছে. সুতরাং এখন, আসলে, এর যাক কোডিং যান. তাই পাইথন, আপনি আসলে যা করতে পারেন ভিন্ন একটি গুচ্ছ ফিরে একটি ফাংশন থেকে জিনিষ. তাই আমি এই ফাংশন তৈরি করা যাচ্ছে না যাচ্ছে যা ", শর্তাধীন" বলা , সেগুলো সব ফেরত "গতকাল দেশের সর্বোচ্চ তাপমাত্রা," "probabilities," এবং "শব্দ." সুতরাং ", শর্তাধীন" এবং এটি মধ্যে আহ্বান করা যাচ্ছে "গান." তাই এখন আমি আসলে আপনি চান এই ফাংশন লিখতে. আমি এই লিখতে পারেন যে তাই উপায় ফাংশন আমি এই সংজ্ঞায়িত করা হয় সাথে ফাংশন "Def." তাই আমি Def "কি শর্তাধীন, "এবং এটি গ্রহণ এর "গান." এবং কি এটা করতে যাচ্ছে , প্রথম সব, আমি আমার গতকাল দেশের সর্বোচ্চ তাপমাত্রা থাকতে হয় আমি গণনা করতে চান. তাই আমি এটা করতে পারেন যে পথ তৈরি হয় পাইথন, একটি অভিধান যা একটি হ্যাশ হিসাবে প্রায় কাছাকাছি একই জিনিস টেবিল, বা এটি একটি পুনরাবৃত্ত মত পিএইচপি অ্যারে. এই আমি একটি অভিধান ডিক্লেয়ার না. এবং মূলত কি এই মানে হল যে হয় গাগা এর গতকাল দেশের সর্বোচ্চ তাপমাত্রা যদি, উদাহরণস্বরূপ, 0.5 হল গান 50% থেকে হয় গাগা, 50% পেরি থেকে. জানার জন্য? তাই আমি চিন্তা করতে হবে কিভাবে গতকাল দেশের সর্বোচ্চ তাপমাত্রা নিরূপণ করা. আমি যা করতে হবে যে পরের বেশী, এছাড়াও, সম্ভাব্যতা এবং শব্দ হয়. তাই গাগা এর probabilities তালিকা সব probabilities যে আমি গাগা জন্য শব্দের প্রতিটি জন্য আছে. আমি গাগা এর probabilities যেতে তাই যদি "শিশুর," উদাহরণস্বরূপ, এটি আমার দেব 2 সেই ক্ষেত্রে 24 ওভার মত কিছু. জানার জন্য? তাই আমি "probabilities," যেতে যেতে সব একটি তালিকা রয়েছে "গাগা" বালতি গাগা শব্দ, তারপর আমি ", বাচ্চা" এ যান এবং আমি সম্ভাবনা দেখতে. এবং পরিশেষে আমি এই আছে "শব্দ" অভিধান. তাই এখানে, "probabilities." এবং তারপর "শব্দ." তাই আমি "শব্দ," "গাগা," যদি কি ঘটতে যাচ্ছে তা যে হয় , আমার 24 দিতে যাচ্ছে এই বলে যে আমি গাগা থেকে গানের মধ্যে 24 শব্দ আছে. জ্ঞান করে তোলে? তাই এখানে, "শব্দ" Dah-Dah-Dah সমান. ঠিক আছে সুতরাং আমি কি করতে যাচ্ছি আমি যাচ্ছি হয় তাই, গানের প্রতিটি পুনরুক্তি স্ট্রিং প্রতিটি যে আমি তালিকায় আছে. এবং আমি সেগুলো নিরূপণ করা যাচ্ছে না প্রার্থীদের প্রতিটি জন্য. জ্ঞান করে তোলে? তাই আমি লুপ জন্য যা করতে হবে. তাই পাইথন মধ্যে কি আমি কি করতে পারি লাইন জন্য "হয় গান. "একটি হিসাবে একই জিনিস পিএইচপি স্টেটমেন্ট "প্রতিটি জন্য". এটি পিএইচপি ছিল কিভাবে আমি করতে পারে মনে রাখুন হিসাবে প্রতিটি গানের জন্য "বলার লাইন. "অর্থে করে? তাই আমি এই মধ্যে, লাইনের প্রতিটি গ্রহণ করছি কেস, এই স্ট্রিং এবং পরবর্তী স্ট্রিং তাই আমি আছি কি লাইনের প্রতিটি জন্য কি করতে যাচ্ছি আমি যাচ্ছি, প্রথম একটি তালিকা মধ্যে এই লাইনে বিভক্ত শূণ্যস্থান দ্বারা পৃথক শব্দ. তাই পাইথন সম্পর্কে শীতল জিনিস হল যে আপনি শুধু গুগল মত "কিভাবে পারেন পারে আমি শব্দের মধ্যে একটি পংক্তি বিভক্ত? "এবং এটি কিভাবে এটি করতে আপনাকে জানানো যাচ্ছে. এবং এটা কি ভাবে, এটা "লাইন = Line.split () "এবং এটি মূলত এর আপনার সাথে একটি তালিকা দিতে যাচ্ছে এখানে শব্দের প্রতিটি. জ্ঞান করে তোলে? তাই এখন আমি জানতে চাই যে যে যে গানের গায়ক কে. আর আমি শুধু পেতে আছে যে কি অ্যারের প্রথম উপাদান, ডান? তাই আমি শুধু বলতে পারেন যে আমি "গায়ক = লাইন (0) "অর্থে করে? এবং তারপর কি আমি যা করতে হবে প্রথম, হয় সব, আমি আপডেট করা যাচ্ছে না কত শব্দ আমি অধীনে আছে "গাগা." তাই আমি আছি শুধু নিরূপণ করা যাচ্ছে কতগুলি শব্দ আমি ঠিক আছে, এই তালিকার মধ্যে আছে? এই আমি কতগুলি শব্দ কারণ গান এবং আমি যাচ্ছি "গাগা" অ্যারে এটি যোগ করুন. যে জানার জন্য? বাক্য গঠন উপর খুব বেশী ফোকাস না. ধারণা সম্পর্কে আরো চিন্তা করুন. এটা সবচেয়ে গুরুত্বপূর্ণ অংশ. ঠিক আছে. "গাগা" যদি তাই আমি এটা করতে পারেন হয় ইতিমধ্যে যে তালিকায়, তাই "গায়ক মধ্যে যদি শব্দ "যার অর্থ যে ইতিমধ্যে আমি গাগা দ্বারা শব্দ আছে. আমি শুধু অতিরিক্ত যোগ করতে চান যে শব্দ. তাই আমি না "শব্দ (গায়ক) হয় + + = Len (লাইন) - 1 ". এবং তারপর আমি ঠিক কি করতে পারেন লাইনের দৈর্ঘ্য. সুতরাং কিভাবে অনেক উপাদান আমি অ্যারের মধ্যে আছে. এবং আমি যা করতে হবে 1 বিয়োগ ঠিক কারণ অ্যারের প্রথম উপাদান ঠিক হয় একটি গায়ক এবং যারা গান নয়. জ্ঞান করে তোলে? ঠিক আছে. "অন্যথায়," এটা আমি চাই যে মানে আসলে তালিকায় গাগা সন্নিবেশ. তাই আমি শুধু শব্দ (গায়ক) "না = Len (লাইন) - 1, "দুঃখিত. তাই দুই মধ্যে একমাত্র পার্থক্য লাইনের এই এক, না হয় অনুপস্থিত এখনো বিদ্যমান, তাই আমি আছি শুধু এটি আরম্ভ করা. এই এক আমি আসলে যোগ করছি. ঠিক আছে. তাই এই শব্দ যোগ করা হয়েছিল. এখন আমি গতকাল দেশের সর্বোচ্চ তাপমাত্রা যোগ করতে চান. সুতরাং কিভাবে আমি গতকাল দেশের সর্বোচ্চ তাপমাত্রা নিরূপণ করব? গতকাল দেশের সর্বোচ্চ তাপমাত্রা: গণনা করা যাবে কতবার দ্বারা. আপনি যে গায়ক দেখতে তাই কতবার যে আপনি গায়ক সব মধ্যে অধিকার, আছে? , গাগা এবং পেরি Katy জন্য তাই এই ক্ষেত্রে, আমি গাগা দেখুন একবার, পেরি Katy একবার. গাগা জন্য তাই মূলত গতকাল দেশের সর্বোচ্চ তাপমাত্রা এবং পেরি Katy জন্য would সঠিক, এক হতে? আপনি ঠিক কতবার আমি শিল্পী দেখতে. তাই এই নিরূপণ করা খুবই সহজ. আমি করতে হলে শুধু কিছু মত "হিসাবে যদি গতকাল দেশের সর্বোচ্চ তাপমাত্রা গায়ক, "আমি যাচ্ছি তাদের গতকাল দেশের সর্বোচ্চ তাপমাত্রা বক্স থেকে 1 যোগ করুন. "তাই," তারপর এবং "" গতকাল দেশের সর্বোচ্চ তাপমাত্রা (sing) "+ + = 1 অন্য আমি "গতকাল দেশের সর্বোচ্চ তাপমাত্রা (গায়ক) করতে যাচ্ছি = 1. "অর্থে করে? সুতরাং বিদ্যমান নেই তাহলে আমি ঠিক রাখা 1 হিসাবে, অন্যথায় আমি 1 যোগ করুন. ঠিক আছে, তাই এখন সব আমি কি বাকি আছে যে এছাড়াও শব্দের প্রতিটি যোগ হয় probabilities. তাই আমি গণনা করতে কতবার আমি শব্দের প্রতিটি দেখুন. তাই আমি শুধু আরেকটি যা করতে হবে লাইনে লুপ জন্য. আমি যা করতে যাচ্ছি যে সুতরাং প্রথম জিনিস গায়ক ইতিমধ্যে একটি আছে কিনা probabilities অ্যারে. গায়ক না হলে তাই আমি চেক করছি একটি probabilities অ্যারে আছে, আমি ঠিক আছি তাদের জন্য এক আরম্ভ যাচ্ছে. এটি এমনকি একটি অ্যারের না, দুঃখিত, এটি একটি অভিধান এর. সুতরাং গায়ক probabilities যাচ্ছে একটি খোলা অভিধান হতে, তাই আমি আছি শুধু তার জন্য একটি অভিধান আরম্ভ. ঠিক আছে? এবং এখন আমি আসলে লুপ জন্য কি করতে পারেন শব্দের প্রতিটি 'নিরূপণ probabilities. ঠিক আছে. তাই কি আমি কি করতে পারি লুপ জন্য একটি হল. তাই আমি ঠিক পুনরুক্তি করা যাচ্ছে না অ্যারের উপর. আমি পাইথন মধ্যে তা করতে পারে যাতে উপায় "সীমার মধ্যে আমি." হয় 1 থেকে আমি দ্বিতীয় মধ্যে শুরু করতে চান, কারণ প্রথম এক উপাদান কারণ গায়ক নাম. তাই এক থেকে আপ লাইনের দৈর্ঘ্য. এবং আমি বিস্তৃত হতে যখন এটি আসলে থেকে যান এখানে যেমন 1 থেকে এর Len যাও লাইন বিয়োগ 1. সুতরাং এটি ইতিমধ্যেই করছেন যে জিনিস আছে খুব যা অ্যারে জন্য এন বিয়োগ 1 সুবিধাজনক. জ্ঞান করে তোলে? সুতরাং এই প্রতিটি জন্য, কি আমি যাচ্ছি না, শুধু অন্য এক মত, হয় আমি চেক চলেছি যদি এই শব্দ সঙ্গতিপূর্ণ অবস্থানে ইতিমধ্যে probabilities. এবং তারপর আমি probabilities, এখানে বলেন হিসাবে শব্দ, হিসাবে আমি রাখা "Probabilities (গায়ক)". সুতরাং গায়ক নামে. সুতরাং আগে থেকেই যদি "Probabilit (গায়ক)", এটা মানে হল যে আমি এটি করার জন্য 1 যোগ করতে চান, তাই আমি চলেছি "probabilities (গায়ক)", এবং না শব্দ "লাইন (ঝ)" বলা হয়. আমি 1 যোগ চলেছি এবং "অন্য" আমি আছি শুধু 1 থেকে এটি আরম্ভ করতে যাচ্ছি. "লাইন (ঝ)". জ্ঞান করে তোলে? সুতরাং, আমি অ্যারে সব হিসাব করা. সুতরাং, এখন সব আমি যা করতে হবে যে এই এক মাত্র ", গতকাল দেশের সর্বোচ্চ তাপমাত্রা ফিরে হয় সম্ভাব্যতা ও শব্দ. "যাক এর ঠিক আছে, কোনো আছে কিনা দেখতে. এটা সবকিছু এ পর্যন্ত কাজ করছে বলে মনে হয়. সুতরাং, যে জ্ঞান করে তোলে? কিছু ভাবে? ঠিক আছে. তাই এখন আমি সব probabilities আছে. তাই এখন আমি বাকি আছে শুধু ঠিক যে জিনিস আছে যা সব পণ্যের হিসাব আমি গান যখন probabilities. সুতরাং আসুন আর এখন কল করতে চান যে বলা যাক এই ফাংশন ") (শ্রেণীভুক্ত" এবং জিনিস যে ফাংশন লাগে শুধু একটি যুক্তি. এর "হ্যালো, আমি আগুন am" বলে এবং এটা কি চিন্তা করা যাচ্ছে এই গাগা যে সম্ভাবনা? সম্ভাবনা কি এই Katie যে? শব্দগুলি ভালো? তাই আমি ঠিক তৈরি আছে চলেছি একটি নামক নতুন ফাংশন ") (শ্রেণীভুক্ত" এবং এটা কিছু নিতে যাচ্ছে গানের পাশাপাশি. আর গানের পাশাপাশি আমি গতকাল দেশের সর্বোচ্চ তাপমাত্রা প্রেরণ করা আছে, সম্ভাব্যতা ও শব্দ. তাই আমি গান, গতকাল দেশের সর্বোচ্চ তাপমাত্রা পাঠাতে চলেছি, probabilities, শব্দ. তাই এই গান, গতকাল দেশের সর্বোচ্চ তাপমাত্রা গ্রহণ করা হয়, probabilities, শব্দ. সুতরাং, এটা কি করে? এটি মূলত সব দিয়ে যেতে হবে সম্ভাব্য প্রার্থী যে আপনি একটি গায়ক হিসাবে আছে. এবং যেখানে ঐ প্রার্থী? তারা গতকাল দেশের সর্বোচ্চ তাপমাত্রা ইন করছি, ডান? তাই আমি সেখানে ঐ সব আছে. তাই আমি একটি অভিধান আছে যাচ্ছি সম্ভাব্য সব প্রার্থীর. এবং তারপর প্রতিটি প্রার্থী জন্য গতকাল দেশের সর্বোচ্চ তাপমাত্রা, এটা যাচ্ছে মানে হল তাই আমি ছিল গাগা, Katie করা আরো এটা আরো হবে. আমি গণক শুরু করা যাচ্ছে না এই সম্ভাবনা. আমরা দেখেছি হিসাবে সম্ভাবনা পাওয়ার পয়েন্ট এর আগে বার প্রতিটি পণ্যের অন্যান্য probabilities. তাই আমি এখানে একই কাজ করতে পারেন. আমি শুধু সম্ভাব্যতা কি করতে পারেন প্রথমে ঠিক পূর্বে. প্রার্থী তাই গতকাল দেশের সর্বোচ্চ তাপমাত্রা. রাইট? এবং এখন আমি সব পুনরুক্তি উপর আছে আমি হতে গানের মধ্যে আছে যে শব্দ সম্ভাবনা যুক্ত করতে সক্ষম ঠিক আছে, তাদের মধ্যে প্রত্যেকের জন্য? সুতরাং, "গানের শব্দ জন্য" কি আমি যাচ্ছি শব্দ যদি কাজ করতে হয়, "Probabilities (প্রার্থী)", যা এটি একটি শব্দ যে এর মানে হল যে প্রার্থী তাদের গানের মধ্যে আছে - গাগা জন্য উদাহরণস্বরূপ, "শিশুর" - আমি কি করতে যাচ্ছি যে সম্ভাবনা গুন করা যাচ্ছে প্লাস probabilities 1 দ্বারা যে শব্দ জন্য প্রার্থী. এবং এটা "শব্দ" বলা হচ্ছে. এই শব্দের সংখ্যা দ্বারা বিভক্ত আমি যে প্রার্থী জন্য আছে. আমি যে শব্দের মোট সংখ্যা আমি এ খুঁজছি যে গায়ক জন্য. "অন্য." এটি এটি একটি নতুন শব্দ এর মানে তাই এটা যেমন ভালো হতে চাই লেডি গাগা জন্য "আগুন". তাই আমি ঠিক 1 কাজ করতে চান "শব্দ (প্রার্থী)". তাই আমি এখানে এই শব্দটি রাখতে চাই না. সুতরাং এটি মূলত হতে যাচ্ছে অনুলিপি করা ও এই পেস্ট. কিন্তু আমি এই অংশ মুছে যাচ্ছি. সুতরাং এটি ঠিক যে ওভার 1 হতে যাচ্ছে. শব্দগুলি ভালো? এবং এখন শেষে, আমি যাচ্ছি প্রার্থীর নাম ও প্রিন্ট আপনাদের মধ্যে আছে যে সম্ভাবনা তাদের গানের নেভিগেশন এস হচ্ছে. জ্ঞান করে তোলে? আর আমি আসলে না এমনকি না এই অভিধান প্রয়োজন. জ্ঞান করে তোলে? সুতরাং, আসলে এই কাজ করে যদি এর দেখতে দিন. আমি এই রান সুতরাং, যদি এটা কাজ করে নি. এক সেকেন্ড অপেক্ষা করুন. "শব্দ (প্রার্থী)", "শব্দ (প্রার্থী)", যে অ্যারে নাম. ঠিক তাই, এটা কিছু বাগ আছে বলেছেন গতকাল দেশের সর্বোচ্চ তাপমাত্রা এ প্রার্থী জন্য. আমার অল্পমাত্র বিট হোন যাক. ঠিক আছে. এর চেষ্টা করুন. ঠিক আছে. সুতরাং এটি পেরি Katy এই আছে দেয় এই বার 10 হওয়ার সম্ভাবনা বিয়োগ 7, এবং গাগা এই আছে বার বিয়োগ থেকে 6 10. তাই আপনি যদি এটা দেখায় দেখতে যে গাগা একটি উচ্চ সম্ভাবনা আছে. সুতরাং হয় "হ্যালো, আমি ফায়ার উপর আছি" সম্ভবত একটি গাগা গান. জ্ঞান করে তোলে? তাই এই আমরা কি কি. এই কোড অনলাইনে পোস্ট করা যাচ্ছে, তাই আপনাকে বলছি তা পরীক্ষা করতে পারেন. আপনি করতে চান তাহলে হয়তো জন্য এটা কিছু ব্যবহার একটি প্রকল্প বা অনুরূপ কিছু করতে. ঠিক আছে. এই মাত্র দেখাতে ছিল কি গণনীয় ভাষাতত্ত্ব কোড মত দেখাচ্ছে. কিন্তু এখন এর বেশি যেতে দেওয়া উচ্চ পর্যায়ের স্টাফ. ঠিক আছে. তাই অন্যান্য সমস্যা আমি সম্পর্কে কথা ছিল - সেগমেন্টেশন সমস্যা তাদের মধ্যে প্রথম. সুতরাং আপনি এখানে জাপানি আছে. এবং তারপর আপনি দেখতে কোন স্পেস আছে. তাই এই মূলত এটা মানে হল যে হয় চেয়ার উপরে, ডান? আপনি জাপানি কথা বলতে? এটা ঠিক, চেয়ার উপরে আছে? ছাত্র: আমি জানি না কি কাঞ্জি ধরে আছে. LUCAS Freitas: এটা [জাপানি কথা বলছে] এর ঠিক আছে. সুতরাং এটি মূলত শীর্ষ চেয়ার মানে. আপনি একটি স্থান রাখা ছিল তাই যদি এটা এখানে করা হবে. এবং তারপর আপনি [আছে? Ueda-সান. ?] যা মূলত জনাব Ueda মানে. এবং আপনি যে "Ueda" দেখুন এবং আপনার আছে একটি স্থান এবং তারপর "সান". সুতরাং আপনি যে দেখতে এখানে আপনি "Ue" নিজে ভালো হয়. এবং এখানে এটি একটি চরিত্র আছে এটা পাশে. সুতরাং ঐ ভাষায় চাই না একটি শব্দ এটা যাতে আপনি অর্থাত অক্ষর শুধু জায়গার অনেক করা. অক্ষর একে অপরের সঙ্গে সম্পর্কযুক্ত. এবং তারা একসাথে হতে পারে যেমন দুই, তিন, এক. সুতরাং আপনি আসলে কোন ধরণের তৈরি আছে পথে যারা শূণ্যস্থান নির্বাণ. এবং এই জিনিস যে আপনি পেতে যখনই ঐ এশিয়ান ভাষা থেকে তথ্য, সবকিছু unsegmented আসে. কারণ জাপানি লিখেছেন যারা কোন এক বা চীনা স্পেস দিয়ে লিখেছেন. আপনি চীনা লেখার যখনই, জাপানি আপনি শুধু সবকিছু লিখুন কোন স্পেস দিয়ে. এটি এমনকি অর্থে দেখা যায় না শূণ্যস্থান রাখা. আমি তখন আপনি কিছু, থেকে তথ্য পেতে হলে ইস্ট এশিয়ান ভাষা, আপনি চান আসলে যে সঙ্গে কিছু করতে আপনি প্রথম সেগমেন্ট আছে. উদাহরণ করছেন চিন্তা করুন স্পেস ছাড়া গান. সুতরাং আপনি যে শুধু গান ঠিক আছে, বাক্য হবে? সময়কাল দ্বারা বিচ্ছিন্ন. কিন্তু তারপর মাত্র বাক্য থাকার ইচ্ছাশক্তি সত্যিই তথ্য দেবার নেভিগেশন সাহায্য না যারা গান করে যারা. রাইট? তাই আপনি যদি উচিত প্রথম স্থানে রাখে. আপনি যে সুতরাং কিভাবে করতে পারি? আমি তখন একটি ভাষা ধারণা আসে সত্যিই যা কিছু মডেল গণনীয় জন্য গুরুত্বপূর্ণ ভাষাতত্ত্ব. সুতরাং একটি ভাষা মডেল মূলত একটি সম্ভাব্যতা টেবিল যে অনুষ্ঠানগুলি সম্ভাবনা কি প্রথম সব একটি ভাষায় শব্দ হচ্ছে? সুতরাং একটি শব্দ কত ঘন দেখাচ্ছে. এবং তারপর এছাড়াও সম্পর্কিত দেখাচ্ছে একটি বাক্যে শব্দের মধ্যে. একটি নবজাতক এসেছেন তাই আপনি যদি মূল ধারণা, হয় আপনি এবং একটি বাক্য বললেন করার আপনি, সম্ভাবনা যে, এর জন্য কি যেমন, "এই আমার বোন হয় [? GTF"?] ব্যক্তি বলেন যে বাক্য ছিল? তাই সম্ভবত কিছু বাক্য হয় অন্যদের তুলনায় আরো সাধারণ. উদাহরণস্বরূপ, "সকালে ভাল" বা "ভাল রাতে, "অথবা" আছে হেই, "অনেক বেশী সবচেয়ে বাক্যের চেয়ে সাধারণ আমরা একটি ইংরেজি আছে. সুতরাং কেন ঐ বাক্য হয় আরো ঘন? আপনি কারণ প্রথম সব, এটি আরো ঘন হয় শব্দ. যদি আপনি বলে তাই, উদাহরণস্বরূপ,, কুকুর বড়, এবং কুকুর আপনি, রাক্ষুসে হয় সাধারণত সম্ভবত কুকুর বড় শুনতে "বড়" আরো আরো প্রায়ই কারণ "রাক্ষুসে." আর ইংরেজিতে ঘন তাই, এক জিনিষ শব্দ ফ্রিকোয়েন্সি হয়. সত্যিই যা দ্বিতীয় জিনিসটি গুরুত্বপূর্ণ ঠিক শব্দের ক্রম. সুতরাং, এটি "বিড়াল বলে সাধারণ . বাক্সের ভিতর "কিন্তু আপনি কি না সাধারণত দেখতে "বক্সের ভিতরে বিড়াল." সুতরাং আপনি কিছু গুরুত্ব আছে দেখতে শব্দের ক্রম. আপনি ঠিক বলতে পারবে না যে ঐ দুটি বাক্য একই সম্ভাবনা আছে তারা একই শব্দ আছে মাত্র কারণ. আপনি আসলে যত্ন আছে যাতে প্রায় হিসাবে ভাল. জানার জন্য? তাই আমরা কি করব? তাই আমি আপনাকে পেতে চেষ্টা হতে পারে? আমি আপনাকে কি আমরা পেতে চেষ্টা করছি N-টি গ্রাম মডেল কল. সুতরাং N-টি গ্রাম মডেলের মূলত অনুমান যে প্রতিটি শব্দ জন্য যে আপনি একটি বাক্যে আছে. এটা থাকার সম্ভাবনা যে শব্দ না শুধুমাত্র সেখানে নির্ভর করে ভাষায় যে শব্দ ফ্রিকোয়েন্সি, কিন্তু শব্দের উপর যে এটি পার্শ্ববর্তী হয়. সুতরাং উদাহরণস্বরূপ, সাধারণত আপনি দেখতে হলে অথবা আপনি হন এ মত কিছু সম্ভবত একটি দেখতে যাচ্ছি এটা পরে বিশেষ্য, ডান? কারণ আপনি একটি অব্যয় আছে সাধারণত এটা পরে একটি বিশেষ্য লাগে. অথবা আপনি সকর্মক যে একটি ক্রিয়া আছে আপনি সাধারণত যাচ্ছে একটি বিশেষ্য ফ্রেজ আছে. সুতরাং এটি একটি বিশেষ্য আছে যাচ্ছে এটি প্রায় কোথাও. সুতরাং, মূলত: এটি কী জন্য যে এটা থাকার সম্ভাবনা বিবেচনায় শব্দের পরবর্তী প্রতিটি অন্যান্য, যখন আপনি গণক করছি একটি বাক্য সম্ভাবনা. এবং যে কি একটা ভাষা আছে মডেল মূলত. শুধু সম্ভাবনা কি বলছে একটি নির্দিষ্ট হচ্ছে একটি ভাষায় বাক্য? তাই কেন যে মূলত, দরকারী? আর সব থেকে প্রথম কি একটি N-টি গ্রাম মডেল, তারপর? সুতরাং একটি N-টি গ্রাম মডেল মানে প্রতিটি শব্দের উপর নির্ভর করে পরের এন বিয়োগ 1 শব্দ. তাই, মূলত, এটা, আমি যদি এর মানে হল উদাহরণস্বরূপ, CS50 TF এ যখন আমি হওয়ার সম্ভাবনা হিসাবী করছি বাক্য, আপনার মত হবেন " শব্দ "" থাকার সম্ভাবনা থাকার বার সম্ভাবনা " থাকার CS50 "বার সম্ভাবনা "CS50 TF." তাই, মূলত, আমি গণনা এটি stretching সব সম্ভাব্য উপায়. এবং তারপর সাধারণত আপনি এই কাজ করছি একটি প্রকল্প হিসাবে, আপনি হতে এন করা একটি কম মূল্য. সুতরাং, সাধারণত bigrams বা Trigrams আছে. আপনি শুধু দুটি শব্দ, একটি গণনা যাতে দুটি শব্দ, বা তিনটি শব্দের গ্রুপ, শুধু কর্মক্ষমতা সমস্যার জন্য. এবং এটাও একটা কারণ হতে পারে আপনি যদি ভালো কিছু "CS50 TF." যখন আপনি আছে "TF," এটা খুবই গুরুত্বপূর্ণ যে "CS50" ঠিক আছে, এটা পরবর্তী কি? সেগুলো হল দুটি জিনিস সাধারণত পরবর্তী প্রতিটি অন্যান্য. আপনি মনে করেন "TF," এটি সম্ভবত আছে যাচ্ছে কি এটি জন্য TF'ing এর বর্গ. এছাড়াও "" সত্যিই গুরুত্বপূর্ণ CS50 TF জন্য. কিন্তু আপনি "CS50 মত কিছু আছে TF বর্গ গিয়েছিলাম এবং দিয়েছিলেন তাদের ছাত্র কিছু মিছরি. "" ক্যান্ডি "এবং" " ডান, সত্যিই কোনও সম্পর্ক আছে? তারা একে অপরের থেকে তাই দূরবর্তী যে এটি সত্যিই কি কোন ব্যাপার না শব্দ আছে. সুতরাং একটি Bigram অথবা একটি trigram করে, এটা শুধুমাত্র আপনার সীমিত করছি যে মানে নিজেকে কিছু শব্দ প্রায় যে. জানার জন্য? সুতরাং আপনি সেগমেন্টেশন কাজ করতে চান যখন, মূলত, আপনি কি কাজ করতে চান দেখতে হয় সম্ভাব্য সব উপায়ে কি যে আপনি সেগমেন্ট বাক্য পারেন. আপনি কি দেখতে যে এই ধরনের ঐ বাক্যের প্রতিটি সম্ভাবনা ভাষায় বিদ্যমান? তাই আপনাকে যা চাই, ভাল, যাক হয় আমাকে এখানে একটি স্থান লাগাতে চেষ্টা করুন. সুতরাং আপনি আছে একটি স্থান রাখা এবং আপনি কি দেখতে যে বাক্য সম্ভাবনা? তারপর আপনি ঠিক আছে, মত, হয়তো হয় যে যে ভাল ছিল না. তাই আমি একটি স্থান আছে একটি স্থান রাখা এবং আছে, এবং আপনি নিরূপণ সম্ভাবনা এখন, এবং আপনি দেখতে এটি একটি উচ্চ সম্ভাবনা আছে. তাই এই TANGO নামক একটি অ্যালগরিদম হয় সেগমেন্টেশন আলগোরিদিম, যা হয় আসলে সত্যিই হবে এমন কিছু বিষয় একটি প্রকল্পের জন্য শীতল যা মূলত unsegmented টেক্সট যা লাগে জাপানি বা চীনা বা হয়তো হতে পারে ইংরেজি স্পেস ছাড়া এবং রাখতে চেষ্টা করে শব্দ এবং এটি আছে মাঝখানে খালি জায়গা একটি ভাষা যে মডেল ব্যবহার করে এবং এর দ্বারা সর্বোচ্চ কি দেখতে চেষ্টা আপনি পেতে পারেন সম্ভাবনা. ঠিক আছে. তাই এই সেগমেন্টেশন হয়. এখন সিনট্যাক্স. সুতরাং, বাক্য গঠন জন্য ব্যবহার করা হচ্ছে এই মুহূর্তে এতো কিছু. গ্রাফ অনুসন্ধান জন্য, Siri জন্য জন্য তাই প্রাকৃতিক এর প্রায় কাছাকাছি কোন ধরনের ভাষা প্রক্রিয়াকরণ আপনার আছে. তাই গুরুত্বপূর্ণ কি বাক্য গঠন সম্পর্কে জিনিস? সুতরাং, সাধারণ বাক্য আমরা সংগঠকদের কি কল. কোন ধরনের শব্দের গ্রুপ এর মত বাক্যে একটি ফাংশন আছে. এবং তারা সত্যিই হতে পারে না বাদে একে অপরের থেকে. আমি বলতে সুতরাং, যদি, উদাহরণস্বরূপ, "Lauren ভালবাসে Milo. Lauren "হল" আমি জানি যে "একটি সংবিধান এবং তারপর "ভালবাসে Milo "এছাড়াও অন্য এক. আপনি "Lauren Milo ভালো বলতে পারবে না কারণ একই অর্থ আছে "ভালবাসে. এটা আছে যাচ্ছে না একই অর্থ. অথবা আমি "Milo Lauren ভালো বলতে পারবে না ভালবাসে. "নেই সবকিছু একই আছে যে করছেন, যার অর্থ. সম্পর্কে তাই আরো দুটি গুরুত্বপূর্ণ বিষয় সিনট্যাক্স যা আভিধানিক ধরনের মূলত ফাংশন যে আপনি নিজেরাই শব্দ আছে. তাই আপনি যদি জানা আছে যে "Lauren" এবং "Milo" বিশেষ্য হয়. "প্রেমের" একটি ক্রিয়া করে. আর দ্বিতীয় গুরুত্বপূর্ণ বিষয় তারা ফ্রেজাল ধরনের করছি. সুতরাং আপনি "Milo ভালবাসে" জানি আসলে একটি মৌখিক ফ্রেজ হয়. আমি বলতে সুতরাং যখন "Lauren," আমি জানি যে Lauren কিছু করছেন না. সে কি করছে? তিনি Milo প্রেমময় এর. সুতরাং এটি একটি সম্পূর্ণ জিনিস. কিন্তু তার উপাদান আছে একটি বিশেষ্য ও ক্রিয়া. কিন্তু একসাথে, তারা একটি ক্রিয়া ফ্রেজ করা. সুতরাং, আমরা আসলে সাথে কি করতে পারি গণনীয় ভাষাতত্ত্ব? সুতরাং, আমি যেমন কিছু আছে "Allison এর বন্ধু." আমি দেখতে যদি আমি একটি অন্বিত গাছ আমি জানতে চাই যে "বন্ধু" এটা একটি বিশেষ্য ফ্রেজ হয় একটি "Allison এর" তারপর বিশেষ্য এবং একটি হল "এর" যা পদান্বয়ী ফ্রেজ হয় একটি প্রস্তাব এবং "Allison" একটি বিশেষ্য হয়. আমি কি যেত না আমার কম্পিউটার শেখানো হয় যে আমি একটি বিশেষ্য ফ্রেজ আছে এবং কখন তারপর একটি পদান্বয়ী ফ্রেজ. এর "তাহলে এই ক্ষেত্রে," বন্ধু "তাই এবং Milo "আমি এই মানে জানি যে NP2, দ্বিতীয় এক, NP1 মালিক. তাই আমি সম্পর্ক কোন ধরণের তৈরি করতে পারেন, এটি জন্য ফাংশন কিছু. তাই আমি এই কাঠামো দেখতে যখনই, যা এর বন্ধু "সঙ্গে হুবহু মিল Allison, "আমি জানি যে Allison বন্ধু মালিক. তাই বন্ধু কিছু আছে Allison আছে. জ্ঞান করে তোলে? তাই এই মূলত কি গ্রাফ অনুসন্ধান করে. এটা ঠিক নিয়ম তৈরি করে জিনিস অনেক জন্য. সুতরাং "Allison এর বন্ধু," "আমার বন্ধু "", কেমব্রিজের আমার বন্ধুদের যারা বাস হার্ভার্ড যেতে হয়. "এটা নিয়ম তৈরি করে সেগুলো সব জন্য. এখন মেশিন অনুবাদ. সুতরাং, মেশিন অনুবাদ হয় পরিসংখ্যানগত কিছু. এবং প্রকৃতপক্ষে আপনি জড়িত হলে গণনীয় ভাষাতত্ত্ব, অনেক আপনার কাপড় পরিসংখ্যান হতে যাচ্ছে. আমি উদাহরণ করছেন সুতরাং হিসাবে আমি যে probabilities অনেক গণক, এবং তারপর আপনি এই পেতে ফাইনালে যে খুব অল্প সংখ্যক সম্ভাবনা, এবং যে কি আপনি উত্তর আপনি. মেশিন অনুবাদ এও ব্যবহার একটি পরিসংখ্যানগত মডেল. এবং আপনি মেশিনের মনে করতে চান সহজ সম্ভাব্য অনুবাদ ভাবে, কি আপনি মনে করতে পারেন, ঠিক হয় ডান, শব্দ করে শব্দ অনুবাদ? আপনার জন্য একটি ভাষা শেখার হয়ে গেলে প্রথমবার, যে সাধারণত কি আপনি ডান, না? আপনি যদি চান আপনি একটি বাক্য অনুবাদ ভাষা থেকে আপনার ভাষায় আপনি সাধারণত প্রথম, শিখছে শব্দের প্রতিটি অনুবাদ স্বতন্ত্রভাবে, এবং তারপর আপনি চেষ্টা করুন জায়গা করে শব্দ করা. , আমি এই অনুবাদ করতে চেয়েছিলেন তাই [কথা বলছে পর্তুগীজ] "সাদা বিড়াল দূরে স্থাপিত হয়." যার মানে আমি থেকে এটি অনুবাদ করতে চেয়েছিলেন ইংরেজি থেকে পর্তুগিজ, তা আমি যেত না আমি, প্রথম, হয় শব্দ করে শব্দ অনুবাদ করুন. সুতরাং "ণ" "," "Gato," "বিড়াল," হয় "Branco," "হোয়াইট" এবং তারপর "fugio" হয় "দূরে স্থাপিত হয়." আমি তখন এখানে সব শব্দ আছে কিন্তু তারা যাতে না হন. "বিড়াল সাদা দূরে স্থাপিত" মত এটা যা ব্যাকরণ বহির্ভূত হয়. সুতরাং, তারপর আমি একটি দ্বিতীয় ধাপে, থাকতে পারে যা আদর্শ খুঁজে পাওয়া যাচ্ছে শব্দ প্রতিটি জন্য অবস্থান. তাই আমি আমি আসলে আছে সেটি জানি পরিবর্তে "সাদা বিড়াল" "বিড়াল সাদা." সুতরাং কি আমি কি করতে পারি সবচেয়ে সাদাসিধা পদ্ধতি, হয় তৈরি করতে হবে সব সম্ভাব্য permutations অবস্থানের শব্দ,. এবং তারপর এক হয়েছে যা দেখতে সর্বোচ্চ সম্ভাবনা অনুযায়ী আমার ভাষা মডেল. এবং তারপর আমি যে এক খুঁজে যখন যা সর্বোচ্চ সম্ভাবনা তা, সম্ভবত "সাদা বিড়াল, দূরে স্থাপিত" যে আমার অনুবাদ এর. এবং এই ব্যাখ্যা একটি সহজ উপায় কিভাবে মেশিন অনুবাদ অনেক অ্যালগোরিদম কাজ. যে জানার জন্য? এটি সত্যিই উত্তেজনাপূর্ণ কিছু বিষয় আপনাকে বলছি হয়তো একটি জন্য অনুসন্ধান করতে পারেন যে চূড়ান্ত প্রকল্প, হাঁ? ছাত্র: হ্যাঁ, আপনি এটা ছিল সাদাসিধা ভাবে, তাই কি অ সাদাসিধা ভাবে? LUCAS Freitas: অ সাদাসিধা ভাবে? ঠিক আছে. সম্পর্কে খারাপ যে তাই প্রথম জিনিস এই পদ্ধতি আমি শুধু অনুবাদ অনুপস্থিত শব্দ, শব্দ করে শব্দ. তবে কখনও কখনও আপনি শব্দ আছে একাধিক অনুবাদের থাকতে পারে. আমি ভাবতে চেষ্টা যাচ্ছি কিছু. পর্তুগিজ পারেন মধ্যে উদাহরণস্বরূপ, "কমিকস" হতে "ছিন্ন করা" বা "হাতা." হয় সুতরাং আপনি শব্দ অনুবাদ করতে চেষ্টা করছি শব্দ দ্বারা, এটা আপনি প্রদান করা হতে পারে কোন মানে তোলে এমন কিছু বিষয়. আপনি এ সব চেহারা তাই আপনি আসলে চান সম্ভাব্য অনুবাদের শব্দ এবং দেখুন, প্রথম সব, যাতে করে. আমরা permutating বিষয়ে কথা হয়েছিল জিনিষ? সব সম্ভব আদেশ দেখতে এবং করতে সর্বোচ্চ সঙ্গে একটি বেছে নিন সম্ভাবনা? আপনি সব সম্ভব নির্বাচন করতে পারবেন প্রতিটি জন্য অনুবাদের তারপর শব্দ এবং দেখুন - permutations সঙ্গে মিলিত - যা এক সর্বোচ্চ সম্ভাবনা আছে. প্লাস, তবে আপনাকে না তাকান পারেন শুধুমাত্র শব্দ কিন্তু বাক্যাংশ. যাতে আপনি মধ্যে সম্পর্ক বিশ্লেষণ করতে পারে শব্দ এবং তারপর একটি পেতে ভাল অনুবাদ. এছাড়াও অন্য কিছু, তাই এই সেমিস্টারে আমি আসলে এ গবেষণা করছি চীনা ইংরেজি মেশিনে অনুবাদ, তাই থেকে অনুবাদ ইংরেজি মধ্যে চীনা. এবং আমরা কি কিছু ব্যবহার ছাড়াও, হল শুধু যা একটি পরিসংখ্যানগত মডেল, এইজন্য probabilities এইজন্য একটি বাক্যে কিছু অবস্থান, আমি আছি আসলে এছাড়াও কিছু বাক্য গঠন যোগ আমার আমি এই ধরনের দেখতে হলে মডেল,, ওহ, বলার অপেক্ষা রাখে না নির্মাণ, এই আমি চাই কি আমি অনুবাদ যখন এটি পরিবর্তন করতে. সুতরাং আপনি কিছু ধরনের যোগ করতে পারেন করা বাক্য গঠন উপাদান অনুবাদ আরো দক্ষ এবং আরও ভালো. ঠিক আছে. যদি আপনি চান তাই আপনি যদি, কিভাবে শুরু করতে পারেন গণনীয় মধ্যে কিছু করতে ভাষাতত্ত্ব? প্রথমত, আপনি একটি প্রকল্প চয়ন যে ভাষায় জড়িত থাকে. সুতরাং, সেখানে আউট তাই অনেক আছে. আপনি কি করতে পারেন তাই অনেক কিছু আছে. এবং তারপর একটি মডেল মনে করতে পারেন আপনি ব্যবহার করতে পারেন. সাধারণত যে চিন্তা মানে অনুমিতি, আমি যখন, ওহ, মত হিসাবে গান চিন্তা মত. আমি চিন্তা করতে চান তাহলে আমি ভাল,, ভালো ছিল এই লিখেছে যিনি আউট, আমি সম্ভবত চাই শব্দ তাকান ব্যক্তির ব্যবহার করা হয় এবং খুব প্রায়ই যে শব্দ ব্যবহার করে দেখুন. তাই অনুমানের করতে চেষ্টা এবং মডেল মনে করার চেষ্টা করুন. এবং তারপর আপনার কাছে অনলাইন অনুসন্ধান করতে পারেন আপনি যে সমস্যার ধরনের, এবং এটি সুপারিশ করে যাচ্ছে আপনি মডেলের যে হয়তো ভাল জিনিস যে স্থাপিত. এবং এছাড়াও আপনি সবসময় আমাকে ইমেইল করতে পারেন. me@lfreitas.com. এবং আমি শুধুমাত্র আপনার প্রশ্নের উত্তর দিতে পারেন. আমরা এমনকি তাই আমি করতে হঠাৎ দেখা হতে পারে পারে উপায় নেভিগেশন পরামর্শ দিতে আপনার প্রকল্পের বাস্তবায়ন. আপনার সাথে জড়িত এবং যদি আমি বলতে চাচ্ছি গণনীয় ভাষাতত্ত্ব, এটা যাচ্ছে মহান হতে. আপনি সেখানে দেখতে যাচ্ছেন এত সম্ভাবনাময় হয়. আর শিল্পের ভাড়া চায় কারণ যে আপনি এত খারাপ. তাই আমি তোমাদের বলছি এই আস্বাদিত আশা করি. আপনাকে বলছি যে কোনো প্রশ্ন থাকে, আপনি এই পর আমার অনুরোধ করতে পারেন. কিন্তু আপনাকে ধন্যবাদ.