1 00:00:00,000 --> 00:00:00,750 2 00:00:00,750 --> 00:00:09,800 >> [پخش موسیقی] 3 00:00:09,800 --> 00:00:13,014 4 00:00:13,014 --> 00:00:13,680 داستین ترنسپاندر: سلام. 5 00:00:13,680 --> 00:00:14,980 داستین نام من است. 6 00:00:14,980 --> 00:00:18,419 پس من ارائه تجزیه و تحلیل داده در R. 7 00:00:18,419 --> 00:00:19,710 فقط کمی در مورد خودم. 8 00:00:19,710 --> 00:00:24,320 من در حال حاضر دانشجوی کارشناسی ارشد در هستم علوم مهندسی و کاربردی. 9 00:00:24,320 --> 00:00:28,330 من مطالعه تقاطع یادگیری ماشین و آمار 10 00:00:28,330 --> 00:00:31,375 بنابراین تجزیه و تحلیل داده ها در R است واقعا اساسی به آنچه 11 00:00:31,375 --> 00:00:33,790 من به صورت روزانه انجام دهد. 12 00:00:33,790 --> 00:00:35,710 >> و R به ویژه خوب برای تجزیه و تحلیل داده ها 13 00:00:35,710 --> 00:00:39,310 زیرا این بسیار خوبی برای نمونه سازی. 14 00:00:39,310 --> 00:00:43,590 و معمولا، هنگامی که شما در حال انجام برخی از مرتب کردن بر اساس از تجزیه و تحلیل داده ها، بسیاری از مشکلات 15 00:00:43,590 --> 00:00:44,920 در حال رفتن به شناختی. 16 00:00:44,920 --> 00:00:48,700 و بنابراین شما فقط می خواهم به برخی از زبان واقعا خوب است که 17 00:00:48,700 --> 00:00:53,770 فقط برای انجام خوب ساخته شده در توابع، به عنوان مخالف 18 00:00:53,770 --> 00:00:57,430 به داشتن برای مقابله با چیزهایی سطح پایین. 19 00:00:57,430 --> 00:01:01,040 بنابراین در آغاز، من فقط رفتن به معرفی آنچه R است، چرا 20 00:01:01,040 --> 00:01:04,540 شما می خواهید به استفاده از آن، و پس از آن بیش از رفتن به برخی از نسخه ی نمایشی، 21 00:01:04,540 --> 00:01:07,060 و فقط در از وجود دارد بروید. 22 00:01:07,060 --> 00:01:08,150 >> پس چه R است؟ 23 00:01:08,150 --> 00:01:11,180 R فقط یک زبان توسعه یافته برای محاسبات آماری 24 00:01:11,180 --> 00:01:12,450 و تجسم. 25 00:01:12,450 --> 00:01:16,000 بنابراین این بدان معنی است که آن یک زبان بسیار عالی است 26 00:01:16,000 --> 00:01:22,400 برای هر نوع از چیزی که با معاملات عدم قطعیت و یا تجسم داده. 27 00:01:22,400 --> 00:01:24,850 بنابراین شما باید تمام این توزیع های احتمال. 28 00:01:24,850 --> 00:01:27,140 در حال رفتن وجود دارد به ساخته شده در توابع. 29 00:01:27,140 --> 00:01:31,650 شما همچنین می خواهید عالی داشته توطئه بسته. 30 00:01:31,650 --> 00:01:34,110 >> پایتون یکی دیگر از رقابت زبان برای داده ها. 31 00:01:34,110 --> 00:01:40,020 و یک چیز که پیدا کنم که R خیلی بهتر است در تجسم است. 32 00:01:40,020 --> 00:01:45,200 پس چه شما در نسخه ی نمایشی به عنوان ببینید همچنین فقط یک زبان بسیار شهودی است 33 00:01:45,200 --> 00:01:48,050 که فقط کار می کند بسیار خوب. 34 00:01:48,050 --> 00:01:53,140 این نیز رایگان و منبع باز است، به عنوان هر زبان دیگر خوب من حدس می زنم. 35 00:01:53,140 --> 00:01:55,440 >> و در اینجا، یک دسته از فقط کلمات کلیدی در شما پرتاب می شود. 36 00:01:55,440 --> 00:02:00,450 این پویا، به این معنی که اگر شما یک نوع خاصی اختصاص یافته به یک شی 37 00:02:00,450 --> 00:02:02,025 از آن فقط آن را در پرواز را تغییر دهید. 38 00:02:02,025 --> 00:02:05,670 این تنبل پس از آن هوشمند مورد چگونه آن را ندارد محاسبات. 39 00:02:05,670 --> 00:02:12,250 عملکرد معنی آن واقعا می تواند کار کردن از توابع تا anything-- 40 00:02:12,250 --> 00:02:16,910 هر نوع دستکاری شما انجام می دهند، از آن خواهد شد بر مبنای توابع. 41 00:02:16,910 --> 00:02:20,162 >> اپراتورهای بنابراین باینری، به عنوان مثال، توابع فقط ذاتا هستند. 42 00:02:20,162 --> 00:02:21,870 و هر آنچه را که شما در حال رفتن به انجام است 43 00:02:21,870 --> 00:02:24,690 رفتن به اجرا کردن توابع خود را. 44 00:02:24,690 --> 00:02:27,140 و پس از آن شیء گرا نیز هست. 45 00:02:27,140 --> 00:02:30,930 >> بنابراین در اینجا طرح XKCD است. 46 00:02:30,930 --> 00:02:34,350 نه تنها به خاطر من مثل احساس XKCD اساسی برای هر نوع است 47 00:02:34,350 --> 00:02:37,770 ارائه، اما به دلیل من این احساس واقعا 48 00:02:37,770 --> 00:02:42,160 چکش نقطه که بسیاری از زمانی که شما در حال انجام نوعی از داده 49 00:02:42,160 --> 00:02:46,570 تجزیه و تحلیل، مشکل این است که نمی خیلی با چه سرعتی آن اجرا می شود، 50 00:02:46,570 --> 00:02:49,850 اما چه مدت آن را به شما را به برنامه کار. 51 00:02:49,850 --> 00:02:54,112 بنابراین در اینجا تنها تجزیه و تحلیل اینکه آیا استراتژی A یا B کارآمد تر است. 52 00:02:54,112 --> 00:02:55,820 این است برای رفتن به چیزی است که شما هستید 53 00:02:55,820 --> 00:02:58,290 رفتن به مقابله زیادی با در مرتب کردن بر اساس زبان سطح پایین 54 00:02:58,290 --> 00:03:03,440 که در آن شما با خرید و فروش گسل SEG، تخصیص حافظه، initializations، 55 00:03:03,440 --> 00:03:05,270 حتی ساخت توابع ساخته شده در. 56 00:03:05,270 --> 00:03:09,920 و این مسائل است که همه به کار گرفته بسیار بسیار زیبایی در R. 57 00:03:09,920 --> 00:03:12,839 >> پس فقط به چکش این نقطه، بزرگترین تنگنا 58 00:03:12,839 --> 00:03:13,880 در حال رفتن به شناختی. 59 00:03:13,880 --> 00:03:17,341 بنابراین تجزیه و تحلیل داده ها یک مشکل بسیار سخت است. 60 00:03:17,341 --> 00:03:19,340 این که آیا شما در حال انجام یادگیری ماشین یا شما 61 00:03:19,340 --> 00:03:22,550 انجام این کار نوعی از اکتشاف داده های اولیه، 62 00:03:22,550 --> 00:03:25,290 شما نمی خواهید به را به یک سند 63 00:03:25,290 --> 00:03:27,440 و سپس کامپایل چیزی در هر زمان شما 64 00:03:27,440 --> 00:03:31,010 می خواهید برای دیدن آنچه که یک ستون به نظر می رسد مانند، چه مطالب خاص در یک ماتریس 65 00:03:31,010 --> 00:03:32,195 به نظر می رسد مانند. 66 00:03:32,195 --> 00:03:34,320 بنابراین شما فقط می خواهم به برخی از رابط واقعا خوب 67 00:03:34,320 --> 00:03:37,740 شما می توانید یک تابع ساده اجرا که شاخص به هر 68 00:03:37,740 --> 00:03:41,870 شما می خواهم و فقط آن را از وجود دارد را اجرا کنید. 69 00:03:41,870 --> 00:03:44,190 و شما نیاز دامنه زبان خاص برای این. 70 00:03:44,190 --> 00:03:51,750 و R واقعا کمک خواهد کرد تعریف شما مشکل و حل آن به این شیوه. 71 00:03:51,750 --> 00:03:58,690 >> بنابراین در اینجا برنامه نویسی نشان طرح است محبوبیت R به عنوان آن را در طول زمان رفته است. 72 00:03:58,690 --> 00:04:04,060 بنابراین همانطور که می بینید، مانند 2013 یا پس از آن فقط منفجر فوق العاده. 73 00:04:04,060 --> 00:04:09,570 و این است فقط به خاطر اینکه از آن بوده است روند بزرگ در صنعت فن آوری 74 00:04:09,570 --> 00:04:10,590 اطلاعات در مورد بزرگ است. 75 00:04:10,590 --> 00:04:13,010 همچنین، نه فقط تکنولوژی صنعت، اما واقعا 76 00:04:13,010 --> 00:04:16,490 هر that-- صنعت به دلیل بسیاری از صنایع 77 00:04:16,490 --> 00:04:20,589 مرتب کردن بر اساس اساسی به تلاش برای حل این مشکلات. 78 00:04:20,589 --> 00:04:24,590 و معمولا، شما می توانید برخی از خوب راه اندازه گیری این مشکلات 79 00:04:24,590 --> 00:04:29,720 و یا حتی آنها را تعریف و یا حل آنها را با استفاده از داده ها. 80 00:04:29,720 --> 00:04:35,430 بنابراین من فکر می کنم در حال حاضر R در 11th است ترین زبان محبوب در TIOBE 81 00:04:35,430 --> 00:04:38,200 و آن را از سال پس از آن در حال رشد. 82 00:04:38,200 --> 00:04:40,740 83 00:04:40,740 --> 00:04:43,080 >> بنابراین در اینجا برخی بیشتر ویژگی های R. این 84 00:04:43,080 --> 00:04:46,900 تعداد زیادی از بسته های و برای همه این چیزها متفاوت است. 85 00:04:46,900 --> 00:04:52,470 بنابراین هر زمان که شما یک مشکل خاص، ترین 86 00:04:52,470 --> 00:04:55,060 زمان R خواهد شد که تابع را برای شما. 87 00:04:55,060 --> 00:04:58,520 بنابراین آیا شما می خواهید ساخت نوعی از ماشین 88 00:04:58,520 --> 00:05:02,770 الگوریتم یادگیری نامیده می شود تصادفی جنگل و یا درختان تصمیم گیری، 89 00:05:02,770 --> 00:05:07,530 و یا حتی تلاش برای گرفتن میانگین یک تابع و یا هر یک از این مسائل، 90 00:05:07,530 --> 00:05:10,000 R خواهد شد که. 91 00:05:10,000 --> 00:05:14,190 >> و اگر شما برای شما مهم بهینه سازی، یک چیز است که مشترک 92 00:05:14,190 --> 00:05:17,430 است که پس از شما نمونه سازی انجام می شود نوعی از زبان سطح بالا، 93 00:05:17,430 --> 00:05:19,810 شما in-- پرتاب که شما فقط پورت خواهد شد که بیش از 94 00:05:19,810 --> 00:05:21,550 به برخی از زبان سطح پایین. 95 00:05:21,550 --> 00:05:26,090 چه خوب است در مورد R است که هنگامی که شما هستید انجام نمونه سازی آن، شما می توانید C اجرا ++، 96 00:05:26,090 --> 00:05:29,510 و یا فرترن، و یا هر یک از این آنهایی که سطح پایین تر به طور مستقیم به R. 97 00:05:29,510 --> 00:05:32,320 به طوری که یکی واقعا از ویژگی های جالب در مورد R، 98 00:05:32,320 --> 00:05:35,930 اگر شما واقعا در مورد مراقبت نقطه بهینه سازی. 99 00:05:35,930 --> 00:05:39,490 >> و آن را نیز واقعا خوب برای تجسم وب. 100 00:05:39,490 --> 00:05:43,530 بنابراین D3.js، برای مثال، من حدس می زنم سمینار دیگر 101 00:05:43,530 --> 00:05:45,130 که ما امروز معرفی شده اند. 102 00:05:45,130 --> 00:05:48,510 و این است که واقعا عالی برای انجام تصویری تعاملی. 103 00:05:48,510 --> 00:05:54,460 و D3.js فرض می شود که شما باید نوعی از داده ها را به رسم شود 104 00:05:54,460 --> 00:05:58,080 و R یک راه بسیار خوبی از بودن قادر به انجام است تجزیه و تحلیل داده ها قبل از شما آن صادرات 105 00:05:58,080 --> 00:06:04,220 به D3.js و یا حتی فقط اجرا دستورات D3.js به R خود را، 106 00:06:04,220 --> 00:06:08,240 و همچنین تمام این کتابخانه های دیگر نیز هست. 107 00:06:08,240 --> 00:06:13,041 >> به طوری که فقط معرفی شد چه R و به همین دلیل شما ممکن است استفاده از آن است. 108 00:06:13,041 --> 00:06:14,790 بنابراین امیدوارم، من چیزی متقاعد شما 109 00:06:14,790 --> 00:06:18,460 درباره تنها در تلاش برای دیدن آنچه آن را مانند است. 110 00:06:18,460 --> 00:06:23,930 بنابراین من قصد دارم به جلو بروید و از طریق رفتن برخی از اصول در مورد اشیاء R 111 00:06:23,930 --> 00:06:26,150 و آنچه شما واقعا می توانید انجام دهید. 112 00:06:26,150 --> 00:06:29,690 >> بنابراین در اینجا فقط یک دسته از دستورات ریاضی. 113 00:06:29,690 --> 00:06:35,000 بنابراین می گویند you're-- شما می خواهید برای ایجاد خود زبان و شما فقط می خواهید 114 00:06:35,000 --> 00:06:38,080 به یک دسته از ابزار های مختلف. 115 00:06:38,080 --> 00:06:42,520 هر نوع عمل شما فکر می کنم شما می خواهم می خواهم خیلی رفتن به در آر است 116 00:06:42,520 --> 00:06:44,150 >> بنابراین در اینجا 2 به اضافه 2 است. 117 00:06:44,150 --> 00:06:46,090 در اینجا 2 بار PI است. 118 00:06:46,090 --> 00:06:51,870 R دارای یک دسته از ساخته شده است در ثابت که شما اغلب خواهید مانند PI، E استفاده کنید. 119 00:06:51,870 --> 00:06:56,230 >> و پس از آن، در اینجا 7 به علاوه است runif، بنابراین runif، از مجموع 1 120 00:06:56,230 --> 00:07:02,450 این یک تابع که تولید یکی یکنواخت تصادفی از 0 به 1. 121 00:07:02,450 --> 00:07:04,400 و سپس 3 وجود دارد به قدرت 4. 122 00:07:04,400 --> 00:07:06,430 این ریشه مربع وجود دارد. 123 00:07:06,430 --> 00:07:07,270 >> در ورود وجود دارد. 124 00:07:07,270 --> 00:07:14,500 بنابراین ورود به سیستم خواهد پایه انجام نمایی های خود را. 125 00:07:14,500 --> 00:07:18,337 و پس از آن، اگر شما یک پایگاه را مشخص، و سپس شما می توانید انجام هر کاری پایه شما می خواهید. 126 00:07:18,337 --> 00:07:19,920 و سپس در اینجا برخی از دستورات دیگر می باشد. 127 00:07:19,920 --> 00:07:22,180 بنابراین شما باید 23 وزارت دفاع 2. 128 00:07:22,180 --> 00:07:24,910 سپس شما باید باقی مانده. 129 00:07:24,910 --> 00:07:27,110 سپس شما باید علمی نماد اگر شما نیز 130 00:07:27,110 --> 00:07:34,060 می خواهید برای انجام درست تر و همه چیز پیچیده تر است. 131 00:07:34,060 --> 00:07:37,320 >> بنابراین در اینجا تکلیف است. 132 00:07:37,320 --> 00:07:40,830 تکالیف پس معمولی در R است با فلش انجام 133 00:07:40,830 --> 00:07:43,440 پس از آن کمتر از و پس از آن خط تیره است. 134 00:07:43,440 --> 00:07:47,250 بنابراین در اینجا من فقط اختصاص 3 به وال متغیر. 135 00:07:47,250 --> 00:07:50,160 >> و پس از آن من چاپ کردن وال و سپس آن را چاپ سه. 136 00:07:50,160 --> 00:07:53,920 به طور پیش فرض در مترجم R، آن خواهد همه چیز را برای شما چاپ 137 00:07:53,920 --> 00:07:57,280 بنابراین شما لازم نیست که مشخص چاپ وال هر زمان که شما می خواهید برای چاپ چیزی. 138 00:07:57,280 --> 00:08:00,200 شما فقط می توانید انجام دهید وال و سپس آن را برای شما انجام دهد. 139 00:08:00,200 --> 00:08:04,380 >> همچنین شما می توانید معادل فنی استفاده به عنوان یک عملگر انتساب. 140 00:08:04,380 --> 00:08:07,190 هستند پیچیدگی های خاص اندکی وجود دارد بین با استفاده از فلش 141 00:08:07,190 --> 00:08:10,730 اپراتور و برابر اپراتور برای تکالیف. 142 00:08:10,730 --> 00:08:15,470 عمدتا توسط کنوانسیون، هر کس فقط استفاده از فلش اپراتور. 143 00:08:15,470 --> 00:08:21,850 >> و در اینجا، من اختصاص این نماد مایل به نام 1 روده بزرگ 6. 144 00:08:21,850 --> 00:08:26,010 این تولید یک بردار 1 تا 6. 145 00:08:26,010 --> 00:08:29,350 و این واقعا خوب چون شما فقط بردار به وال اختصاص 146 00:08:29,350 --> 00:08:34,270 و کار به خودی خود. 147 00:08:34,270 --> 00:08:37,799 >> پس این است که در حال حاضر از رفتن single-- داده بسیار شهودی 148 00:08:37,799 --> 00:08:41,070 ساختار فقط دو از برخی از نوع از نوع به یک بردار 149 00:08:41,070 --> 00:08:45,670 و که همه را جمع آوری خواهد شد ارزش عددی برای شما. 150 00:08:45,670 --> 00:08:50,770 بنابراین پس از رفتن از اسکالر، شما اشیاء R و این یک بردار است. 151 00:08:50,770 --> 00:08:55,610 بردار هر نوع است مجموعه ای از همان نوع. 152 00:08:55,610 --> 00:08:58,150 بنابراین در اینجا یک دسته از بردار. 153 00:08:58,150 --> 00:08:59,800 >> بنابراین این عددی است. 154 00:08:59,800 --> 00:09:02,440 عددی راه R از گفت دو برابر شده است. 155 00:09:02,440 --> 00:09:07,390 و به این ترتیب به طور پیش فرض، هر تعداد خواهد بود دو برابر شود. 156 00:09:07,390 --> 00:09:13,150 >> بنابراین اگر شما C از 1.1، 3 دارند، منفی 5.7، C یک تابع است. 157 00:09:13,150 --> 00:09:16,760 این concatenates هر سه تعداد به یک بردار. 158 00:09:16,760 --> 00:09:19,619 و این پس اگر be-- خواهد شما متوجه 3 به خودی خود، 159 00:09:19,619 --> 00:09:21,910 به طور معمول شما می توانید فرض که این مثل این است که یک عدد صحیح، 160 00:09:21,910 --> 00:09:25,050 اما به دلیل تمام بردارها همان نوع، 161 00:09:25,050 --> 00:09:28,660 این یک بردار از دو برابر است یا عددی در این مورد. 162 00:09:28,660 --> 00:09:34,920 >> rnorm یک تابع است که به تولید است variables-- نرمال استاندارد 163 00:09:34,920 --> 00:09:36,700 و یا مقادیر نرمال استاندارد. 164 00:09:36,700 --> 00:09:38,360 و من مشخص دو نفر از آنها. 165 00:09:38,360 --> 00:09:43,840 بنابراین من انجام rnorm 2، اختصاص که به سامانه رویدادهای گسسته، و پس از آن من چاپ کردن سامانه رویدادهای گسسته. 166 00:09:43,840 --> 00:09:47,350 بنابراین این فقط دو هستند مقادیر نرمال تصادفی. 167 00:09:47,350 --> 00:09:50,060 >> و سپس وقفه اگر شما شما در مورد اعداد صحیح مراقبت. 168 00:09:50,060 --> 00:09:54,650 پس این است که فقط در مورد حافظه تخصیص و صرفه جویی در اندازه حافظه. 169 00:09:54,650 --> 00:10:01,460 بنابراین شما مجبور به اضافه شماره های پایتخت L. 170 00:10:01,460 --> 00:10:04,170 >> به طور کلی، این است نماد تاریخی R را 171 00:10:04,170 --> 00:10:06,940 برای چیزی به نام عدد صحیح بلند. 172 00:10:06,940 --> 00:10:09,880 بنابراین بسیاری از زمان، شما خرید و فروش با دو برابر. 173 00:10:09,880 --> 00:10:15,180 و اگر شما همیشه بعد خواهد شد در بهینه سازی کد خود را، 174 00:10:15,180 --> 00:10:18,110 شما فقط می توانید اضافه کردن این L'بازدید کنندگان پس از آن و یا در طول آن 175 00:10:18,110 --> 00:10:22,280 اگر شما مانند وابسته به اطلاع یا الهام قبلی در مورد آنچه شما در حال رفتن برای انجام این متغیر. 176 00:10:22,280 --> 00:10:25,340 177 00:10:25,340 --> 00:10:26,890 >> بنابراین در اینجا یک بردار شخصیت است. 178 00:10:26,890 --> 00:10:31,440 پس، دوباره، من الحاق سه رشته این زمان. 179 00:10:31,440 --> 00:10:36,230 توجه کنید که رشته های دو جداره و رشته های تک در همان R. هستند 180 00:10:36,230 --> 00:10:41,000 بنابراین من آرتور و ماروین و غیره زمانی که من آن را چاپ، همه آنها 181 00:10:41,000 --> 00:10:43,210 در حال رفتن به نشان رشته دو برابر شود. 182 00:10:43,210 --> 00:10:45,880 و اگر شما هم می خواهید که شامل رشته دو و یا تک 183 00:10:45,880 --> 00:10:50,070 در شخصیت خود را، و سپس شما می توانید یا رشته خود را متناوب. 184 00:10:50,070 --> 00:10:53,540 >> بنابراین ماروین برای عنصر دوم، این است که 185 00:10:53,540 --> 00:10:56,380 رفتن به شما show-- فقط باید رشته دو 186 00:10:56,380 --> 00:10:59,050 و سپس یک رشته منفرد بنابراین این متناوب است. 187 00:10:59,050 --> 00:11:04,040 در غیر این صورت، اگر شما می خواهید به استفاده از دو اپراتور رشته در یک رشته دو 188 00:11:04,040 --> 00:11:07,090 زمانی که شما آن را اعلام، و سپس شما فقط استفاده از عملگر فرار. 189 00:11:07,090 --> 00:11:10,600 بنابراین شما رشته دو بک اسلش. 190 00:11:10,600 --> 00:11:13,330 >> و در نهایت، ما نیز دارای بردار منطقی است. 191 00:11:13,330 --> 00:11:15,890 بنابراین logical-- تا TRUE و FALSE، و آنها 192 00:11:15,890 --> 00:11:18,880 رفتن به تمام حروف بزرگ. 193 00:11:18,880 --> 00:11:22,370 و پس از آن، دوباره، من الحاق آنها را و سپس آنها را اختصاص به bools. 194 00:11:22,370 --> 00:11:24,590 بنابراین bools است که برای نشان دادن شما درست، غلط، و درست است. 195 00:11:24,590 --> 00:11:28,280 196 00:11:28,280 --> 00:11:31,620 >> بنابراین در اینجا نمایه سازی بردار است. 197 00:11:31,620 --> 00:11:34,870 بنابراین در ابتدا من هستم در نظر گرفتن یک function-- 198 00:11:34,870 --> 00:11:39,230 این است sequence-- نام دنباله 2 تا 12. 199 00:11:39,230 --> 00:11:42,490 و من در نظر گرفتن دنباله های 2. 200 00:11:42,490 --> 00:11:46,660 بنابراین آن را به انجام 2، 4، 6، 8، 10 و 12. 201 00:11:46,660 --> 00:11:50,080 و پس از آن، من نمایه سازی هستم برای به دست آوردن عنصر سوم. 202 00:11:50,080 --> 00:11:55,770 >> بنابراین یک چیز در ذهن داشته باشیم است که شاخص R با شروع از 1. 203 00:11:55,770 --> 00:12:00,550 بنابراین والس 3 است که به دادن شما عنصر سوم. 204 00:12:00,550 --> 00:12:04,580 این است نوع متفاوت از سایر زبان که در آن از صفر شروع می شود. 205 00:12:04,580 --> 00:12:09,780 بنابراین در C یا C ++، به عنوان مثال، شما رفتن به عنصر چهارم. 206 00:12:09,780 --> 00:12:13,280 >> و در اینجا والس از 3 تا 5 است. 207 00:12:13,280 --> 00:12:16,030 بنابراین چیزی که واقعا سرد است که شما 208 00:12:16,030 --> 00:12:20,410 می تواند متغیر موقت در داخل تولید و سپس فقط آنها را در پرواز استفاده کنید. 209 00:12:20,410 --> 00:12:21,960 بنابراین در اینجا است 3 تا 5. 210 00:12:21,960 --> 00:12:25,070 بنابراین من ایجاد یک بردار 3، 4، و 5 و سپس 211 00:12:25,070 --> 00:12:29,700 من نمایه سازی برای دریافت سوم، چهارم، و پنجم عناصر. 212 00:12:29,700 --> 00:12:32,280 >> بنابراین به طور مشابه، شما می توانید چکیده: در این فقط انجام 213 00:12:32,280 --> 00:12:35,280 هر نوع بردار است که به شما نمایه سازی. 214 00:12:35,280 --> 00:12:40,050 بنابراین در اینجا والس و سپس است عناصر اول، سوم، و ششم. 215 00:12:40,050 --> 00:12:42,800 و پس از آن، اگر شما می خواهید برای انجام یک مکمل، 216 00:12:42,800 --> 00:12:45,210 بنابراین شما فقط انجام منهای پس از آن و که خواهم 217 00:12:45,210 --> 00:12:48,600 شما همه چیز را که نمی دهد اول، سوم، و یا عنصر ششم. 218 00:12:48,600 --> 00:12:51,590 بنابراین این خواهد بود که 4، 8، و 10. 219 00:12:51,590 --> 00:12:54,380 >> و اگر شما می خواهید برای دریافت حتی پیشرفته تر، 220 00:12:54,380 --> 00:12:57,610 شما می توانید بردار بولی الحاق. 221 00:12:57,610 --> 00:13:05,210 بنابراین این شاخص در حال رفتن به شما بدهد این بردار بولی طول 6. 222 00:13:05,210 --> 00:13:07,280 بنابراین هرزه کاما TRUE 3. 223 00:13:07,280 --> 00:13:09,680 این درست سه بار تکرار کنید. 224 00:13:09,680 --> 00:13:12,900 پس این به شما می دهد بردار درست است، درست، درست است. 225 00:13:12,900 --> 00:13:17,470 >> هرزه FALSE 4-- این است رفتن به شما بدهد یک بردار از FALSE، FALSE، FALSE، FALSE. 226 00:13:17,470 --> 00:13:21,280 و پس از آن C است رفتن به الحاق این دو Booleans با هم. 227 00:13:21,280 --> 00:13:24,090 بنابراین شما به دریافت سه TRUEs و پس از آن چهار FALSEs. 228 00:13:24,090 --> 00:13:28,460 >> به طوری که وقتی شما والس شاخص، شما رفتن به درست است، درست، درست است. 229 00:13:28,460 --> 00:13:31,420 به طوری که رفتن به می گویند بله، من می خواهم آن سه عنصر. 230 00:13:31,420 --> 00:13:33,520 و پس از آن FALSE، FALSE، FALSE، نادرست است رفتن 231 00:13:33,520 --> 00:13:37,140 نه گفتن، من آن عناصر را نمی خواهم پس از آن به قصد ندارم به آنها بازگشت. 232 00:13:37,140 --> 00:13:41,490 >> و من حدس می زنم در واقع وجود دارد تایپی در اینجا چرا که این می گوید تکرار TRUE 3 233 00:13:41,490 --> 00:13:47,990 و تکرار FALSE 4، و از لحاظ فنی، شما تنها شش عناصر بنابراین تکرار FALSE، 234 00:13:47,990 --> 00:13:50,470 باید آن را تکرار FALSE 3 باشد. 235 00:13:50,470 --> 00:13:55,260 من فکر می کنم R نیز به اندازه کافی از جمله هوشمند که اگر شما فقط مشخص 4 در اینجا، سپس 236 00:13:55,260 --> 00:13:56,630 و حتی آن را نمی خواهد خطا است. 237 00:13:56,630 --> 00:13:58,480 این فقط به شما این مقدار را. 238 00:13:58,480 --> 00:14:00,970 پس از آن فقط که FALSE چهارم را نادیده گرفت. 239 00:14:00,970 --> 00:14:05,310 240 00:14:05,310 --> 00:14:09,270 >> بنابراین در اینجا انتساب بردار است. 241 00:14:09,270 --> 00:14:15,480 بنابراین set.seed-- این فقط مجموعه دانه برای اعداد شبه تصادفی. 242 00:14:15,480 --> 00:14:20,110 بنابراین من تنظیم دانه به 42، به این معنی که اگر تولید من 243 00:14:20,110 --> 00:14:22,950 سه تصادفی نرمال ارزش ها، و پس از آن اگر شما 244 00:14:22,950 --> 00:14:27,400 اجرا بر روی خود set.seed کامپیوتر با استفاده از همان مقدار 42، 245 00:14:27,400 --> 00:14:30,990 سپس شما نیز می توانید از همان سه نرمال تصادفی. 246 00:14:30,990 --> 00:14:33,411 >> پس این است که واقعا خوب برای تکرارپذیری. 247 00:14:33,411 --> 00:14:35,910 معمولا، هنگامی که شما در حال انجام برخی از مرتب کردن بر اساس تجزیه و تحلیل علمی، 248 00:14:35,910 --> 00:14:37,230 شما می خواهید به مجموعه ای از دانه. 249 00:14:37,230 --> 00:14:41,270 به این ترتیب دیگر دانشمندان فقط می توانید تولید مثل همان کد دقیق اید 250 00:14:41,270 --> 00:14:44,790 انجام می شود چون آنها بخصوص متغیرهای تصادفی همان that-- یا تصادفی 251 00:14:44,790 --> 00:14:47,270 ارزش هایی که شما گرفته اید را به عنوان به خوبی. 252 00:14:47,270 --> 00:14:49,870 253 00:14:49,870 --> 00:14:53,910 >> و به این ترتیب انتساب بردار در اینجا نشان والس شماره 1 تا 2. 254 00:14:53,910 --> 00:14:59,290 پس از آن طول می کشد دو عنصر اول از والس و سپس آنها را به 0 اختصاص می دهد. 255 00:14:59,290 --> 00:15:03,940 و پس از آن، شما همچنین می توانید فقط انجام چیزی مشابه با Booleans. 256 00:15:03,940 --> 00:15:09,340 >> بنابراین والس است برابر نیست به 0-- این اراده شما FALSE بردار را، FALSE، TRUE 257 00:15:09,340 --> 00:15:10,350 در این مورد. 258 00:15:10,350 --> 00:15:13,770 و پس از آن، آن را به می گویند هر از آن شاخص که درست بود، 259 00:15:13,770 --> 00:15:15,270 سپس آن را به او واگذار که به 5. 260 00:15:15,270 --> 00:15:18,790 پس از آن طول می کشد عنصر سوم در اینجا و سپس آن را به 5 اختصاص می دهد. 261 00:15:18,790 --> 00:15:22,300 >> و این واقعا خوب در مقایسه با زبان سطح پایین 262 00:15:22,300 --> 00:15:25,560 که در آن شما را مجبور به استفاده از حلقه برای انجام تمام این مسائل بردار 263 00:15:25,560 --> 00:15:30,281 به دلیل آن را فقط بسیار شهودی و آن را یک مزاح است. 264 00:15:30,281 --> 00:15:32,030 و آنچه در مورد بزرگ نماد بردار 265 00:15:32,030 --> 00:15:37,020 این است که در R، این نوع هستند ساخته شده در به طوری که آنها تقریبا به همان سرعتی هستید 266 00:15:37,020 --> 00:15:42,490 به عنوان انجام در یک زبان سطح پایین به عنوان مخالف ساخت یک حلقه for در R 267 00:15:42,490 --> 00:15:46,317 و پس از آن داشتن آن را به انجام نمایه سازی پویا است. 268 00:15:46,317 --> 00:15:48,900 و این خواهید بود آهسته تر از انجام این نوع از چیزی بردار 269 00:15:48,900 --> 00:15:55,950 که در آن می توانید آن را به صورت موازی، که در آن انجام آن را انجام آن را در نخ اساسا. 270 00:15:55,950 --> 00:15:58,650 >> بنابراین در اینجا است عملیات بردار. 271 00:15:58,650 --> 00:16:04,920 بنابراین من تولید یک مقدار 1 تا 3، اختصاص که به vec1، 3 تا 5، vec2، 272 00:16:04,920 --> 00:16:05,950 اضافه کردن آنها را با هم. 273 00:16:05,950 --> 00:16:11,490 این آنها را جزء عاقلانه می افزاید تا آن 1 به علاوه 3، 2 به علاوه 4، و غیره. 274 00:16:11,490 --> 00:16:13,330 >> vec1 بار vec2. 275 00:16:13,330 --> 00:16:16,110 این ضرب دو ارزش جزء عاقلانه. 276 00:16:16,110 --> 00:16:21,830 پس از آن 1 بار 3، 2 بار 4، و سپس 3 بار 5. 277 00:16:21,830 --> 00:16:28,250 >> و پس از آن، به طور مشابه شما همچنین می توانید انجام comparisons-- مقایسه های منطقی. 278 00:16:28,250 --> 00:16:33,640 پس از آن کاذب واقعی در این است مورد دلیل 1 است نه بیشتر از 3، 279 00:16:33,640 --> 00:16:35,920 2 نمی باشد بزرگتر از 4. 280 00:16:35,920 --> 00:16:41,160 این است، من حدس می زنم، تایپی دیگر، 3 قطعا بیشتر از 5. 281 00:16:41,160 --> 00:16:41,660 آره. 282 00:16:41,660 --> 00:16:45,770 و به این ترتیب شما فقط می توانید انجام تمام این عملیات ساده 283 00:16:45,770 --> 00:16:48,350 چون به ارث برده خود از کلاس های خود. 284 00:16:48,350 --> 00:16:51,110 285 00:16:51,110 --> 00:16:52,580 >> به طوری که فقط بردار بود. 286 00:16:52,580 --> 00:16:56,530 و این نوعی از اساسی ترین است R شی چون با توجه به بردار، 287 00:16:56,530 --> 00:16:59,170 شما می توانید اشیاء پیشرفته تر ساخت. 288 00:16:59,170 --> 00:17:00,560 >> بنابراین در اینجا یک ماتریس است. 289 00:17:00,560 --> 00:17:05,030 این است که اساسا انتزاع از آنچه یک ماتریس خود است. 290 00:17:05,030 --> 00:17:10,099 بنابراین در این مورد، آن را سه مختلف بردار، که در آن هر یک ستون است، 291 00:17:10,099 --> 00:17:12,710 و یا شما می توانید آن را در نظر به عنوان هر یک یک ردیف است. 292 00:17:12,710 --> 00:17:18,250 >> بنابراین من ذخیره سازی یک ماتریس از 1 تا 9 و سپس من مشخص 3 ردیف. 293 00:17:18,250 --> 00:17:23,364 بنابراین 1 تا 9 را به شما یک بردار 1 را، 2، 3، 4، 5، 6، و تمام راه را به 9. 294 00:17:23,364 --> 00:17:29,250 >> یک چیز به ذهن نیز باشید این است که فروشگاه R ارزش ها در فرمت ستون-بزرگ. 295 00:17:29,250 --> 00:17:34,160 بنابراین به عبارت دیگر، هنگامی که می بینید 1 تا 9، آن را به ذخیره them-- 296 00:17:34,160 --> 00:17:36,370 آن را به 1، 2، 3 در ستون اول، 297 00:17:36,370 --> 00:17:38,510 و سپس آن را انجام 4، 5، 6 در ستون دوم، 298 00:17:38,510 --> 00:17:41,440 و پس از آن 7، ​​8، 9 در ستون سوم. 299 00:17:41,440 --> 00:17:45,570 >> و در اینجا برخی از دیگر هستند توابع معمول شما می توانید استفاده کنید. 300 00:17:45,570 --> 00:17:49,650 بنابراین حصیر کم، این شما را ابعاد ماتریس. 301 00:17:49,650 --> 00:17:52,620 آن را به شما بازگشت یک بردار از بعد. 302 00:17:52,620 --> 00:17:55,580 بنابراین در این مورد، به دلیل ماتریس ما 3 توسط 3 است، 303 00:17:55,580 --> 00:18:01,900 آن را به شما بدهد بردار عددی که 3 3. 304 00:18:01,900 --> 00:18:05,270 >> و در اینجا تنها نشان دادن ضرب ماتریس. 305 00:18:05,270 --> 00:18:11,970 بنابراین معمولا، اگر شما فقط انجام asterisk-- تا حصیر ستاره mat-- 306 00:18:11,970 --> 00:18:15,380 این است برای رفتن به عملیات جزء عاقلانه 307 00:18:15,380 --> 00:18:17,300 و یا چه چیزی به نام محصول هادامارد. 308 00:18:17,300 --> 00:18:21,310 بنابراین آن را به انجام هر عنصر جزء عاقلانه. 309 00:18:21,310 --> 00:18:23,610 با این حال، اگر شما می خواهید multiplication-- ماتریس 310 00:18:23,610 --> 00:18:29,380 تا ضرب بار سطر اول ستون اول ماتریس دوم 311 00:18:29,380 --> 00:18:34,510 و به همین ترتیب on-- شما می استفاده این درصد عملیات. 312 00:18:34,510 --> 00:18:38,110 >> و T از حصیر است فقط یک عملیات برای ترانهاده. 313 00:18:38,110 --> 00:18:42,590 بنابراین من ادعا را ترانهاده در ماتریس، آن ضرب ماتریس 314 00:18:42,590 --> 00:18:43,090 خود را. 315 00:18:43,090 --> 00:18:45,006 و سپس آن را به بازگشت به شما 3 دیگر 316 00:18:45,006 --> 00:18:50,700 3 نمایش ماتریس محصول شما می خواهم می خواهم. 317 00:18:50,700 --> 00:18:53,750 >> و به طوری که ماتریس بود. 318 00:18:53,750 --> 00:18:56,020 در اینجا چیزی است که به نام یک قاب داده ها. 319 00:18:56,020 --> 00:19:00,780 قاب داده ها شما می توانید به عنوان فکر می کنم یک ماتریس، اما خود را هر ستون 320 00:19:00,780 --> 00:19:02,990 در حال رفتن به یک نوع متفاوت باشد. 321 00:19:02,990 --> 00:19:07,320 >> پس چه واقعا جالب در مورد داده فریم است که در تجزیه و تحلیل داده های خود، 322 00:19:07,320 --> 00:19:11,260 شما در حال رفتن به این همه داده های ناهمگون و تمام این واقعا 323 00:19:11,260 --> 00:19:15,640 همه چیز کثیف که در آن هر یک از ستون خود می تواند از انواع مختلف باشد. 324 00:19:15,640 --> 00:19:21,460 بنابراین در اینجا من گفت: ایجاد یک قاب داده ها، انجام داده int از 1 تا 3، 325 00:19:21,460 --> 00:19:24,750 و پس از آن نیز یک بردار شخصیت داشته باشد. 326 00:19:24,750 --> 00:19:28,470 بنابراین من می تواند شاخص از طریق هر یک از این ستون ها 327 00:19:28,470 --> 00:19:30,930 و پس از آن من ارزش خود را دریافت کنید. 328 00:19:30,930 --> 00:19:34,370 و شما همچنین می توانید برخی از مرتب سازی بر انجام عملیات در فریم های داده. 329 00:19:34,370 --> 00:19:38,040 و بیشتر از آن زمان هنگامی که شما هستید انجام تجزیه و تحلیل داده ها و یا برخی از مرتب کردن بر اساس 330 00:19:38,040 --> 00:19:42,042 از پیش پردازش، شما خواهید بود کار با این ساختمان داده 331 00:19:42,042 --> 00:19:44,250 که در آن هر ستون است که به یک نوع متفاوت باشد. 332 00:19:44,250 --> 00:19:47,880 333 00:19:47,880 --> 00:19:52,970 >> در نهایت، به طوری که این اساسا فقط می چهار اشیاء ضروری در فهرست R. 334 00:19:52,970 --> 00:19:55,820 فقط جمع آوری هر اشیاء دیگر شما می خواهید. 335 00:19:55,820 --> 00:20:00,130 پس از آن خواهد این را به یکی از ذخیره متغیر است که شما به راحتی می توانید دسترسی داشته باشید. 336 00:20:00,130 --> 00:20:02,370 >> بنابراین در اینجا، من گرفتن یک لیست. 337 00:20:02,370 --> 00:20:04,460 من ادعا چیزهای برابر 3. 338 00:20:04,460 --> 00:20:08,060 بنابراین من قصد دارم به یک عنصر در لیست، و این است که به نام مسائل، 339 00:20:08,060 --> 00:20:10,570 و آن را به ارزش 3. 340 00:20:10,570 --> 00:20:13,140 >> من همچنین می توانید یک ماتریس ایجاد کنید. 341 00:20:13,140 --> 00:20:17,970 پس این 1 به 4 و ردیف پایان برابر 2 است، بنابراین 2 توسط 2 ماتریس. 342 00:20:17,970 --> 00:20:20,270 همچنین در لیست و آن را با حصیر پوشاندن نامیده می شود. 343 00:20:20,270 --> 00:20:24,690 moreStuff، یک رشته کاراکتر، و حتی یک لیست دیگر را در خود. 344 00:20:24,690 --> 00:20:27,710 >> بنابراین این یک لیست که 5 و خرس است. 345 00:20:27,710 --> 00:20:30,990 بنابراین از آن است که ارزش 5 و دارای خرس رشته کاراکتر 346 00:20:30,990 --> 00:20:32,710 و آن یک لیست در داخل یک لیست است. 347 00:20:32,710 --> 00:20:35,965 بنابراین شما می توانید این را دارند همه چیز بازگشتی که در آن 348 00:20:35,965 --> 00:20:38,230 شما another-- نوع در نوع. 349 00:20:38,230 --> 00:20:41,420 بنابراین به طور مشابه، شما می توانید یک ماتریس دارند در داخل ماتریس دیگر و غیره. 350 00:20:41,420 --> 00:20:44,264 و یک لیست فقط یک راه خوب است جمع آوری و جمع آوری 351 00:20:44,264 --> 00:20:45,430 تمام این اشیاء متفاوت است. 352 00:20:45,430 --> 00:20:50,210 353 00:20:50,210 --> 00:20:57,150 >> و در نهایت، در اینجا فقط در مورد کمک این تنها بیش از رفته بود بسیار به سرعت. 354 00:20:57,150 --> 00:21:01,350 بنابراین در هر زمان شما اشتباه هستید در مورد برخی از مرتب کردن بر اساس عملکرد، 355 00:21:01,350 --> 00:21:03,510 شما می توانید کمک که تابع انجام دهد. 356 00:21:03,510 --> 00:21:07,120 بنابراین شما می توانید ماتریس کمک انجام و یا یک ماتریس علامت سوال. 357 00:21:07,120 --> 00:21:11,430 و کمک و علامت سوال هستند فقط برای همان چیزی که مختصر 358 00:21:11,430 --> 00:21:13,040 به طوری که آنها نام مستعار است. 359 00:21:13,040 --> 00:21:16,820 >> LM یک تابع است که فقط یک مدل خطی. 360 00:21:16,820 --> 00:21:20,340 اما اگر شما فقط هیچ ایده چگونه است که آثار، شما فقط می توانید انجام دهید کمک LM 361 00:21:20,340 --> 00:21:24,610 و است که شما را برخی از را مرتب کردن بر اساس اسناد و مدارک که 362 00:21:24,610 --> 00:21:27,960 به نظر می رسد نوع مانند صفحه مرد در یونیکس، که در آن 363 00:21:27,960 --> 00:21:34,210 شما یک توضیح کوتاه از آنچه آن را ندارد، همچنین آنچه استدلال آن است، 364 00:21:34,210 --> 00:21:38,850 آنچه در آن باز می گرداند، و فقط راهنمایی در مورد چگونگی برای استفاده از آن، و برخی از نمونه های نیز هست. 365 00:21:38,850 --> 00:21:41,680 366 00:21:41,680 --> 00:21:52,890 >> بنابراین، اجازه دهید پیش رو را نشان دهد و به برخی از نسخه ی نمایشی استفاده از R. OK. 367 00:21:52,890 --> 00:21:55,470 بنابراین من بیش از بسیار رفت سرعت فقط داده 368 00:21:55,470 --> 00:21:59,440 ساختار و نوعی از op-- برخی از عملیات. 369 00:21:59,440 --> 00:22:02,960 در اینجا برخی از توابع است. 370 00:22:02,960 --> 00:22:06,750 >> بنابراین در اینجا من فقط رفتن برای تعریف یک تابع. 371 00:22:06,750 --> 00:22:09,970 بنابراین من هم با استفاده از عملگر انتساب در اینجا، 372 00:22:09,970 --> 00:22:12,610 و پس از آن من گفت: اعلام آن را به عنوان یک تابع. 373 00:22:12,610 --> 00:22:14,140 و آن طول می کشد ارزش X. 374 00:22:14,140 --> 00:22:18,210 پس این هر مقدار که شما می خواهید است و من قصد دارم برای بازگشت به X است. 375 00:22:18,210 --> 00:22:20,840 بنابراین این تابع هویت است. 376 00:22:20,840 --> 00:22:23,670 >> و چه جالب در مورد این در مقایسه با زبان های دیگر 377 00:22:23,670 --> 00:22:26,330 و یکی دیگر از سطح پایین زبان که X است 378 00:22:26,330 --> 00:22:29,350 می توانید از هر نوع خود است و آن را که از نوع بازگشت. 379 00:22:29,350 --> 00:22:35,251 بنابراین شما می توانید imagine-- بنابراین اجازه دهید من فقط این سرعت اجرا شود. 380 00:22:35,251 --> 00:22:35,750 متأسفم. 381 00:22:35,750 --> 00:22:40,300 >> بنابراین یک چیز من هم باید ذکر این است که این ویرایشگر من با استفاده از 382 00:22:40,300 --> 00:22:41,380 است rstudio نامیده می شود. 383 00:22:41,380 --> 00:22:44,389 این همان چیزی است که یک IDE نامیده می شود. 384 00:22:44,389 --> 00:22:46,180 و یک چیز که واقعا خوب در مورد این 385 00:22:46,180 --> 00:22:51,500 است که آن را شامل بسیاری از چیزهایی که می خواهید در R انجام شده توسط خود 386 00:22:51,500 --> 00:22:53,180 فقط بسیار به طور مستقیم. 387 00:22:53,180 --> 00:22:55,550 >> بنابراین در اینجا کنسول مترجم است. 388 00:22:55,550 --> 00:23:02,160 بنابراین به طور مشابه، شما همچنین می توانید از این دریافت خام کنسول فقط با انجام یک R. سرمایه 389 00:23:02,160 --> 00:23:05,630 و این دقیقا همان همان چیزی که به عنوان کنسول. 390 00:23:05,630 --> 00:23:12,210 بنابراین من فقط می توانید انجام دهید شناسه تابع X، X، X. 391 00:23:12,210 --> 00:23:16,130 و then-- و پس از آن که خوب خود خواهد بود. 392 00:23:16,130 --> 00:23:19,200 393 00:23:19,200 --> 00:23:21,740 >> بنابراین rstudio بزرگ است به دلیل آن است که کنسول. 394 00:23:21,740 --> 00:23:25,360 این شهر همچنین دارای اسناد شما می خواهم به اجرا در. 395 00:23:25,360 --> 00:23:28,629 و سپس آن را تا به برخی از متغیرهای که شما می توانید در محیط های را ببینید. 396 00:23:28,629 --> 00:23:30,420 و پس از آن، اگر شما به انجام توطئه، و سپس شما 397 00:23:30,420 --> 00:23:33,730 فقط می توانید آن را در اینجا مشاهده کنید، به عنوان مخالف مدیریت همه این ویندوز های مختلف 398 00:23:33,730 --> 00:23:35,940 توسط خود. 399 00:23:35,940 --> 00:23:40,530 >> من در واقع شخصا استفاده VIM، اما من احساس می کنم مثل rstudio بسیار عالی است فقط 400 00:23:40,530 --> 00:23:44,640 برای گرفتن یک ایده خوب از نحوه استفاده از R. معمولا، 401 00:23:44,640 --> 00:23:47,040 هنگامی که شما در حال تلاش برای یادگیری برخی از کار جدید، 402 00:23:47,040 --> 00:23:49,590 شما نمی خواهید که مسئولیت رسیدگی به همه چیز بیش از حد بسیاری در یک بار. 403 00:23:49,590 --> 00:23:53,120 بنابراین R فقط یک rstudio very-- است یک راه بسیار خوبی از R یادگیری است 404 00:23:53,120 --> 00:23:56,760 بدون نیاز به مقابله با همه این چیزهای دیگر. 405 00:23:56,760 --> 00:23:58,600 >> بنابراین در اینجا من در حال اجرا شناسه سلام. 406 00:23:58,600 --> 00:24:00,090 این گرداند سلام. 407 00:24:00,090 --> 00:24:01,740 شناسه 123. 408 00:24:01,740 --> 00:24:04,610 در اینجا یک بردار از اعداد صحیح است. 409 00:24:04,610 --> 00:24:08,620 بنابراین به طور مشابه، زیرا شما می توانید هر نوعی از ارزش، 410 00:24:08,620 --> 00:24:16,060 شما می توانید انجام دهید از بازگشت شناسه X تا آن را برمی گرداند 1234 و 5. 411 00:24:16,060 --> 00:24:22,210 >> و به من اجازه فقط به شما نشان دهد که این در واقع یک عدد صحیح. 412 00:24:22,210 --> 00:24:28,800 و به همین ترتیب، اگر شما کلاس شناسه X، این رفتن به عدد صحیح. 413 00:24:28,800 --> 00:24:34,170 و پس از آن، شما همچنین می توانید مقایسه دو و درست است. 414 00:24:34,170 --> 00:24:38,350 بنابراین من چک کردن اگر شناسه X برابر برابر x و اطلاع 415 00:24:38,350 --> 00:24:39,760 که آن را به شما می دهد دو TRUEs. 416 00:24:39,760 --> 00:24:44,280 پس این است که نمی گویم هستند دو جسم یکسان، 417 00:24:44,280 --> 00:24:46,845 اما هر یک از مطالب در بردار یکسان. 418 00:24:46,845 --> 00:24:50,000 419 00:24:50,000 --> 00:24:52,090 >> در اینجا bounded.compare است. 420 00:24:52,090 --> 00:24:58,470 پس این است که کمی پیچیده تر در آن است که اگر شرایط و دیگری 421 00:24:58,470 --> 00:25:00,960 و سپس آن را طول می کشد دو استدلال در یک زمان. 422 00:25:00,960 --> 00:25:02,640 بنابراین X است از هر نوع. 423 00:25:02,640 --> 00:25:06,280 و من گفت: این آرگومان دوم است. 424 00:25:06,280 --> 00:25:08,380 این می تواند هر چیزی نیز هست. 425 00:25:08,380 --> 00:25:12,490 اما به طور پیش فرض، این رفتن به 5 اگر شما هیچ چیز را مشخص نمی کند. 426 00:25:12,490 --> 00:25:16,730 >> بنابراین در اینجا من قصد دارم برای گفتن اگر x بزرگتر از است. 427 00:25:16,730 --> 00:25:19,220 بنابراین اگر من مشخص نیست، آن را می گوید اگر x بزرگتر از 5 باشد، 428 00:25:19,220 --> 00:25:20,470 سپس من قصد دارم تا به راست. 429 00:25:20,470 --> 00:25:23,230 دیگری، من قصد دارم به بازگشت FALSE. 430 00:25:23,230 --> 00:25:24,870 بنابراین، اجازه دهید به جلو و تعریف این. 431 00:25:24,870 --> 00:25:30,600 432 00:25:30,600 --> 00:25:34,550 >> و در حال حاضر من قصد دارم به اجرا bounded.compare 3. 433 00:25:34,550 --> 00:25:39,150 بنابراین آن را می گوید است 3 کمتر than-- است 3 بیشتر از 5. 434 00:25:39,150 --> 00:25:41,830 نه، آن چنان FALSE نیست. 435 00:25:41,830 --> 00:25:46,550 >> و bounded.compare 3 و من قصد دارم برای مقایسه آن با استفاده از یک برابر 2. 436 00:25:46,550 --> 00:25:50,700 بنابراین در حال حاضر من گفت: بله، در حال حاضر من می خواهید یک به چیز دیگری. 437 00:25:50,700 --> 00:25:52,750 بنابراین من قصد دارم برای گفتن، شما باید 2. 438 00:25:52,750 --> 00:25:56,640 >> من هم می تواند این کار را انجام مرتب کردن بر اساس نماد یا من می گویم برابر 2. 439 00:25:56,640 --> 00:25:58,720 این یک خواناتر در آن هنگام شما 440 00:25:58,720 --> 00:26:01,450 نگاه کردن به این واقعا توابع پیچیده که 441 00:26:01,450 --> 00:26:08,110 را arguments-- متعدد و این می تواند ده ها oftentimes-- فقط گفت 442 00:26:08,110 --> 00:26:11,140 که برابر 2 خواناتر است شما به طوری که بعد ها در آینده 443 00:26:11,140 --> 00:26:13,020 شما می دانید آنچه شما انجام می دهند. 444 00:26:13,020 --> 00:26:17,120 >> بنابراین در این مورد، من هستم ضرب المثل است 3 بیشتر از 2. 445 00:26:17,120 --> 00:26:18,270 بله آن است. 446 00:26:18,270 --> 00:26:22,350 و به همین ترتیب، من فقط می تواند حذف این و می گویند، است 3 بیشتر از 2 447 00:26:22,350 --> 00:26:23,440 که در آن یک برابر 2. 448 00:26:23,440 --> 00:26:26,230 و این هم درست است. 449 00:26:26,230 --> 00:26:26,730 بله؟ 450 00:26:26,730 --> 00:26:29,670 >> رسید: آیا شما اجرای خط به خط؟ 451 00:26:29,670 --> 00:26:30,670 >> داستین ترنسپاندر: بله من هستم. 452 00:26:30,670 --> 00:26:33,900 بنابراین آنچه من در اینجا انجام است مصرف این متن document-- 453 00:26:33,900 --> 00:26:39,825 و چه بزرگ در مورد rstudio است که من فقط می توانید یک کلید میانبر اجرا short--. 454 00:26:39,825 --> 00:26:41,820 بنابراین من انجام کنترل وارد کنید. 455 00:26:41,820 --> 00:26:44,850 >> و پس از آن، من می گیرم خط در متن سند 456 00:26:44,850 --> 00:26:46,710 و سپس قرار دادن در کنسول. 457 00:26:46,710 --> 00:26:50,800 بنابراین در اینجا من گفت، bounded.compare و من انجام کنترل-X. 458 00:26:50,800 --> 00:26:52,540 بنابراین من فقط می تواند کار اجرا در اینجا نیز هست. 459 00:26:52,540 --> 00:26:54,920 و پس از آن که شما را به خط و سپس آن را در اینجا. 460 00:26:54,920 --> 00:26:57,900 و پس از آن به طور مشابه، می توانم انجام دهم اینجا را اجرا کنید. 461 00:26:57,900 --> 00:27:04,630 و سپس آن را فقط حفظ تعریف خطوط به کنسول مانند آن. 462 00:27:04,630 --> 00:27:10,690 >> و اگر شما نیز متوجه مجعد پرانتز فقط مثل در نحو C وجود دارد. 463 00:27:10,690 --> 00:27:13,910 x-- اگر اگر شرایط نیز رفتن به استفاده از پرانتز و سپس 464 00:27:13,910 --> 00:27:15,350 شما می توانید دیگری استفاده کنید. 465 00:27:15,350 --> 00:27:17,496 یکی دیگر دیگری اگر باشد. 466 00:27:17,496 --> 00:27:21,440 پس این است برای رفتن به X برابر برابر، به عنوان مثال. 467 00:27:21,440 --> 00:27:24,190 468 00:27:24,190 --> 00:27:26,350 و پس از آن من قصد دارم به چیزی به اینجا برگردید. 469 00:27:26,350 --> 00:27:29,490 >> توجه کنید که دو مختلف وجود دارد همه چیز در اینجا است که اتفاق افتاده است. 470 00:27:29,490 --> 00:27:34,360 یکی این است که در اینجا من مشخص بازگشت ارزش واقعی. 471 00:27:34,360 --> 00:27:35,950 در اینجا من فقط گفت X. 472 00:27:35,950 --> 00:27:39,970 بنابراین R معمولا به طور پیش فرض خواهد شد را به آخرین arguments-- 473 00:27:39,970 --> 00:27:43,510 و یا در آخرین خط از کد، و خواهد شد که آنچه در آن بازگشت. 474 00:27:43,510 --> 00:27:46,920 بنابراین در اینجا این همان است چیزی که به عنوان انجام بازگشت X. 475 00:27:46,920 --> 00:27:49,450 476 00:27:49,450 --> 00:27:50,540 >> و فقط به شما نشان دهد. 477 00:27:50,540 --> 00:27:54,000 478 00:27:54,000 --> 00:27:57,052 و پس از آن، آن را فقط می خواهم که کار خواهد کرد. 479 00:27:57,052 --> 00:27:58,260 بنابراین، اجازه دهید با این ادامه خواهد داد. 480 00:27:58,260 --> 00:28:00,630 >> بنابراین دیگری اگر. 481 00:28:00,630 --> 00:28:04,060 و واقعا، من می توانم بازگشت هر چیزی من می خواهم. 482 00:28:04,060 --> 00:28:06,680 بنابراین من حتی نمی به بازگشت Booleans تمام وقت، 483 00:28:06,680 --> 00:28:08,410 من فقط می تواند چیز دیگری گشت. 484 00:28:08,410 --> 00:28:10,670 بنابراین من می تواند خرس بازگشت انجام دهد. 485 00:28:10,670 --> 00:28:12,989 >> بنابراین اگر x برابر برابر، آن را به بازگشت به خرس. 486 00:28:12,989 --> 00:28:14,530 در غیر این صورت، آن را تا به راست. 487 00:28:14,530 --> 00:28:19,310 من همچنین می توانید یک بردار انجام یا واقعا هر چیزی. 488 00:28:19,310 --> 00:28:22,210 >> و به طور معمول در آماری زبان تایپ، 489 00:28:22,210 --> 00:28:23,840 شما می خواهم که برای مشخص کردن یک نوع در اینجا. 490 00:28:23,840 --> 00:28:25,750 و توجه کنید که این فقط می تواند هر چیزی باشد. 491 00:28:25,750 --> 00:28:32,400 و R به اندازه کافی هوشمند است که آن را فقط این کار را انجام و آن را خوب کار خواهد کرد. 492 00:28:32,400 --> 00:28:33,620 >> بنابراین اجازه دهید این تعریف من. 493 00:28:33,620 --> 00:28:39,460 494 00:28:39,460 --> 00:28:41,230 Unexpected-- آه متاسفم. 495 00:28:41,230 --> 00:28:44,336 این باید یک آکولاد اینجا باشد. 496 00:28:44,336 --> 00:28:44,836 باشه. 497 00:28:44,836 --> 00:28:45,336 سرد. 498 00:28:45,336 --> 00:28:52,580 499 00:28:52,580 --> 00:28:54,530 خیلی خوب. 500 00:28:54,530 --> 00:28:58,250 بنابراین در حال حاضر در مقایسه 3 اجازه و برابر 3. 501 00:28:58,250 --> 00:29:01,860 پس از آن باید return-- yeah-- خرس ارزش. 502 00:29:01,860 --> 00:29:06,740 >> بنابراین در حال حاضر یک چیز کلی تر است مانند آنچه در مورد دیگر ساختمان داده. 503 00:29:06,740 --> 00:29:09,110 بنابراین شما باید این تابع. 504 00:29:09,110 --> 00:29:15,360 این است که به کار بر روی هر نوع ارزش مانند 3 یا هر عددی، 505 00:29:15,360 --> 00:29:17,500 به عبارت دیگر، دو برابر شود. 506 00:29:17,500 --> 00:29:19,330 >> اما آنچه در مورد چیزی شبیه به یک بردار. 507 00:29:19,330 --> 00:29:27,750 پس چه اتفاقی می افتد اگر شما do-- بنابراین من هستم رفتن به اختصاص وال، می گویند، 4 تا 6. 508 00:29:27,750 --> 00:29:31,640 بنابراین اگر من بازگشت این، این یک بردار از 4، 5، 6 است. 509 00:29:31,640 --> 00:29:34,935 >> حالا ببینید چه اتفاقی می افتد اگر من bounded.compare وال. 510 00:29:34,935 --> 00:29:37,680 511 00:29:37,680 --> 00:29:42,450 پس این است رفتن به شما 15 1251 می دهد. 512 00:29:42,450 --> 00:29:46,440 بنابراین به عبارت دیگر، آن را گفت اگر شما در این وضعیت نگاه 513 00:29:46,440 --> 00:29:50,040 بنابراین آن را می گوید X کمتر است از یک یا چیزی. 514 00:29:50,040 --> 00:29:51,880 پس این است که کمی گیج کننده به دلیل در حال حاضر 515 00:29:51,880 --> 00:29:53,379 شما فقط نمی دانم چه خبر است. 516 00:29:53,379 --> 00:29:58,690 بنابراین من حدس می زنم چیزی است که واقعا خوب در مورد تنها در تلاش برای اشکال زدایی 517 00:29:58,690 --> 00:30:04,600 این است که شما فقط می توانید انجام دهید وال بیشتر است از یک و ببینید چه چیزی وجود دارد اتفاق می افتد. 518 00:30:04,600 --> 00:30:09,720 >> بنابراین val-- است به طور پیش فرض 5 تا اجازه دهید فقط وال بیشتر از 5. 519 00:30:09,720 --> 00:30:14,280 پس این است که کاذب بردار درست است. 520 00:30:14,280 --> 00:30:17,206 بنابراین در حال حاضر زمانی که شما به دنبال در این، آن را به می گویند اگر، 521 00:30:17,206 --> 00:30:20,080 و سپس آن را به شما این را یک بردار کاذب درست است. 522 00:30:20,080 --> 00:30:23,450 >> بنابراین، هنگامی که شما این عبور را به R، R هیچ ایده چه چیزی شما انجام. 523 00:30:23,450 --> 00:30:26,650 از آنجا که آن انتظار یک تک ارزش است، که یک بولی، و در حال حاضر 524 00:30:26,650 --> 00:30:29,420 شما در حال دادن آن یک بردار از Booleans. 525 00:30:29,420 --> 00:30:31,970 بنابراین به طور پیش فرض، R است فقط رفتن به آنچه هک، 526 00:30:31,970 --> 00:30:35,440 من قصد دارم به فرض کنیم که شما هستید رفتن به اولین عنصر در اینجا. 527 00:30:35,440 --> 00:30:38,320 بنابراین من قصد دارم به say-- من قصد دارم به فرض که این غلط است. 528 00:30:38,320 --> 00:30:40,890 بنابراین آن را می گویند نه، این درست نیست. 529 00:30:40,890 --> 00:30:45,246 >> به طور مشابه، آن را به شود وال برابر برابر. 530 00:30:45,246 --> 00:30:47,244 نه، متاسفم 5. 531 00:30:47,244 --> 00:30:48,910 و آن را نیز رفتن به نادرست نیز هست. 532 00:30:48,910 --> 00:30:52,410 بنابراین آن را می گویند نه، این درست نیست و همچنین پس از آن 533 00:30:52,410 --> 00:30:53,680 رفتن به بازگشت این یکی از آخرین. 534 00:30:53,680 --> 00:30:56,420 535 00:30:56,420 --> 00:31:01,360 >> بنابراین این یا یک چیز خوب یا بد است چیز، بسته به اینکه چگونه مشاهده آن شما. 536 00:31:01,360 --> 00:31:05,104 از آنجا که زمانی که شما هستید ایجاد این توابع، 537 00:31:05,104 --> 00:31:06,770 شما در واقع نمی دانند چه خبر است. 538 00:31:06,770 --> 00:31:10,210 بنابراین گاهی اوقات شما می خواهید یک خطا، یا شاید شما فقط می خواهید یک هشدار. 539 00:31:10,210 --> 00:31:12,160 در این مورد، R می کند انجام این کار نیست. 540 00:31:12,160 --> 00:31:14,300 بنابراین واقعا تا شما را از بر چه 541 00:31:14,300 --> 00:31:17,310 شما فکر می کنم زبان باید در این مورد انجام 542 00:31:17,310 --> 00:31:22,920 اگر شما در یک بردار از Booleans عبور هنگامی که شما در حال انجام در صورت وضعیت. 543 00:31:22,920 --> 00:31:31,733 >> بنابراین اجازه دهید بگویم که شما تا به حال اصلی یکی با دیگری اگر درست بازگشت و شما 544 00:31:31,733 --> 00:31:34,190 رفتن به بازگشت FALSE. 545 00:31:34,190 --> 00:31:39,300 بنابراین یکی از راه های چکیده این است که به من می گویند 546 00:31:39,300 --> 00:31:41,530 حتی نمی نیاز به این چیزی که مشروط. 547 00:31:41,530 --> 00:31:47,220 چیز دیگری که می توانید انجام دهید این است که فقط بازگشت به ارزش های خود را. 548 00:31:47,220 --> 00:31:53,240 بنابراین اگر شما متوجه، اگر شما انجام وال بزرگتر از 5 باشد، 549 00:31:53,240 --> 00:31:56,350 این است که به بازگشت بردار کاذب درست است. 550 00:31:56,350 --> 00:31:58,850 >> شاید این همان چیزی است که شما می خواهید برای bounded.compare. 551 00:31:58,850 --> 00:32:02,940 شما می خواهید به بازگشت بردار از Booleans که در آن هر یک از مقادیر مقایسه 552 00:32:02,940 --> 00:32:04,190 به خود را دارند. 553 00:32:04,190 --> 00:32:11,165 بنابراین شما فقط می توانید انجام bounded.compare تابع X، برابر با 5. 554 00:32:11,165 --> 00:32:13,322 555 00:32:13,322 --> 00:32:15,363 و پس از آن به جای انجام این اگر شرایط دیگری، 556 00:32:15,363 --> 00:32:21,430 من فقط رفتن به بازگشت X بزرگتر از 5 باشد. 557 00:32:21,430 --> 00:32:23,620 بنابراین اگر این درست است، پس از آن آن را تا به راست. 558 00:32:23,620 --> 00:32:26,830 و سپس اگر آن را ندارد، آن را رفتن به بازگشت FALSE. 559 00:32:26,830 --> 00:32:30,880 >> و این برای کار خواهد کرد هر یک از این سازه ها. 560 00:32:30,880 --> 00:32:41,450 بنابراین من می توانم ج 1 6 یا 9 bounded.compare و پس از آن من قصد دارم برای گفتن برابر 6، 561 00:32:41,450 --> 00:32:42,799 برای مثال. 562 00:32:42,799 --> 00:32:44,840 و سپس آن را به شما بولی راست را 563 00:32:44,840 --> 00:32:48,240 بردار که شما طراحی. 564 00:32:48,240 --> 00:32:50,660 >> بنابراین کسانی که تنها توابع و در حال حاضر من اجازه فقط 565 00:32:50,660 --> 00:32:54,980 شما برخی از تصاویری تعاملی نشان می دهد. 566 00:32:54,980 --> 00:32:59,700 من فکر نمی کنم من در واقع از Wi-Fi در اینجا پس بذار پیش بروید 567 00:32:59,700 --> 00:33:01,970 و جست و خیز این یکی من حدس می زنم. 568 00:33:01,970 --> 00:33:05,260 >> اما یک چیز که سرد هر چند این است که اگر شما فقط 569 00:33:05,260 --> 00:33:09,600 می خواهم به آزمون یک دسته از دستورات داده های مختلف، 570 00:33:09,600 --> 00:33:13,320 است یک دسته از مجموعه داده های مختلف وجود دارد که در حال حاضر به R. قبل نصب شده 571 00:33:13,320 --> 00:33:15,770 بنابراین یکی از آنها است نام مجموعه داده iris. 572 00:33:15,770 --> 00:33:18,910 این یکی از شناخته شده ترین است آنهایی که در یادگیری ماشین. 573 00:33:18,910 --> 00:33:23,350 شما معمولا فقط برخی از مرتب کردن بر اساس موارد آزمون برای دیدن اگر کد شما اجرا می شود. 574 00:33:23,350 --> 00:33:27,520 بنابراین اجازه دهید فقط چک عنبیه است. 575 00:33:27,520 --> 00:33:33,130 >> بنابراین این چیزی است که به یک قاب داده ها. 576 00:33:33,130 --> 00:33:36,000 و این نوع از طولانی به دلیل من فقط چاپ عنبیه. 577 00:33:36,000 --> 00:33:38,810 این چاپ از تمام چیز. 578 00:33:38,810 --> 00:33:42,830 پس از آن تا به تمام این نام های مختلف. 579 00:33:42,830 --> 00:33:45,505 بنابراین عنبیه مجموعه است گل های مختلف. 580 00:33:45,505 --> 00:33:48,830 در این مورد، این گفتن شما گونه از آن، 581 00:33:48,830 --> 00:33:54,760 تمام این عرض های مختلف و طول کاسبرگ و گلبرگ. 582 00:33:54,760 --> 00:33:58,880 >> و به این ترتیب به طور معمول اگر، شما می خواهید برای چاپ عنبیه، 583 00:33:58,880 --> 00:34:03,680 به عنوان مثال، شما نمی خواهید به آن را دارند انجام تمام این به این دلیل است که می تواند بیش از 584 00:34:03,680 --> 00:34:05,190 کل کنسول خود را. 585 00:34:05,190 --> 00:34:09,280 بنابراین چیزی که واقعا خوب تابع سر است. 586 00:34:09,280 --> 00:34:12,929 بنابراین اگر شما فقط سر عنبیه، این شما را 587 00:34:12,929 --> 00:34:17,389 پنج ردیف اول، و یا شش من حدس می زنم. 588 00:34:17,389 --> 00:34:19,909 و پس از آن به خوبی شما، فقط می توانید در اینجا مشخص کنید. 589 00:34:19,909 --> 00:34:22,914 بنابراین 20-- این خواهد داد شما 20 ردیف اول است. 590 00:34:22,914 --> 00:34:24,830 و من در واقع مهربان بود از تعجب است که این 591 00:34:24,830 --> 00:34:28,770 به من شش تا به من اجازه پیش بروید و بررسی iris-- یا سر، متاسفم. 592 00:34:28,770 --> 00:34:31,699 593 00:34:31,699 --> 00:34:34,960 و در اینجا آن خواهد داد شما مستندات 594 00:34:34,960 --> 00:34:37,960 از آنچه سر ارزش می کند. 595 00:34:37,960 --> 00:34:40,839 بنابراین آن را می گرداند اولین یا آخرین از یک شی. 596 00:34:40,839 --> 00:34:42,630 و پس از آن من قصد دارم به در صورت پیش فرض است. 597 00:34:42,630 --> 00:34:47,340 و سپس آن را می گوید به طور پیش فرض روش X سر و N برابر 6L. 598 00:34:47,340 --> 00:34:50,620 بنابراین این گرداند شش عامل اول. 599 00:34:50,620 --> 00:34:55,050 و به همین ترتیب اگر شما متوجه اینجا، من نداشت مشخص N برابر 6. 600 00:34:55,050 --> 00:34:56,840 به طور پیش فرض آن استفاده می کند شش، من حدس می زنم. 601 00:34:56,840 --> 00:35:00,130 و پس از آن، اگر من می خواهم برای مشخص کردن یک خاص ارزش، پس من می تواند به عنوان به خوبی مشاهده است. 602 00:35:00,130 --> 00:35:02,970 603 00:35:02,970 --> 00:35:10,592 >> به طوری که برخی از دستورات ساده است و در اینجا یکی دیگر که just-- خوبی است، 604 00:35:10,592 --> 00:35:12,550 من can-- این است که در واقع کمی پیچیده تر، 605 00:35:12,550 --> 00:35:17,130 اما این فقط کلاس را از هر ستون از مجموعه داده iris. 606 00:35:17,130 --> 00:35:20,910 بنابراین این شما هر یک از این چه نشان می دهد ستون در نظر انواع آنها هستند. 607 00:35:20,910 --> 00:35:23,665 بنابراین طول کاسبرگ عددی است، عرض کاسبرگ عددی است. 608 00:35:23,665 --> 00:35:26,540 همه این ارزش ها فقط عددی زیرا شما می توانید از این داده ها بگویید 609 00:35:26,540 --> 00:35:29,440 ساختار این هستند همه به عددی رفتن. 610 00:35:29,440 --> 00:35:34,310 >> و ستون گونه در حال رفتن به یک عامل. 611 00:35:34,310 --> 00:35:37,270 بنابراین به طور معمول، شما فکر می کنم که این مثل این است که یک رشته کاراکتر. 612 00:35:37,270 --> 00:35:48,830 اما اگر شما فقط انجام irisSpecies، و پس از آن من قصد دارم به انجام سر 5، 613 00:35:48,830 --> 00:35:51,820 و این است که رفتن به چاپ از پنج مقدار اول. 614 00:35:51,820 --> 00:35:54,150 >> و پس از آن متوجه این سطح. 615 00:35:54,150 --> 00:35:58,870 پس این است که saying-- این راه R است داشتن متغیرهای قطعی. 616 00:35:58,870 --> 00:36:03,765 بنابراین به جای فقط داشتن رشته کاراکتر، 617 00:36:03,765 --> 00:36:06,740 آن را تا به سطح مشخص که از این چیزها هستند. 618 00:36:06,740 --> 00:36:12,450 >> بنابراین اجازه دهید بگویم irisSpecies 1. 619 00:36:12,450 --> 00:36:17,690 پس چه می خواهید انجام دهید در اینجا این است من subsetting به این ستون گونه. 620 00:36:17,690 --> 00:36:21,480 پس این طول می کشد ستون گونه و سپس 621 00:36:21,480 --> 00:36:23,820 شاخص آن برای به دست آوردن عنصر اول است. 622 00:36:23,820 --> 00:36:27,140 بنابراین این باید به شما setosa می دهد. 623 00:36:27,140 --> 00:36:28,710 و آن را نیز به شما می دهد سطح در اینجا. 624 00:36:28,710 --> 00:36:32,812 >> بنابراین شما همچنین می توانید مقایسه این به setosa شخصیت 625 00:36:32,812 --> 00:36:34,645 و این است که نمی درست است به خاطر یکی 626 00:36:34,645 --> 00:36:37,940 است از یک نوع متفاوت از دیگری است. 627 00:36:37,940 --> 00:36:40,590 یا من حدس می زنم آن به دلیل واقعی R است آگاهی بیشتر از آن است. 628 00:36:40,590 --> 00:36:45,420 و آن را در این و پس از آن به نظر می رسد می گوید، شاید این همان چیزی است که شما می خواهید. 629 00:36:45,420 --> 00:36:51,860 بنابراین آن را می گویند شخصیت setosa رشته همان این یکی است. 630 00:36:51,860 --> 00:37:01,290 و پس از آن به طور مشابه، شما می توانید همچنین فقط این شتاب مانند غیره. 631 00:37:01,290 --> 00:37:05,580 >> به طوری که فقط برخی از مرتب کردن بر اساس است دستورات سریع از مجموعه داده. 632 00:37:05,580 --> 00:37:08,030 بنابراین در اینجا برخی از اکتشاف داده است. 633 00:37:08,030 --> 00:37:11,360 پس این است که کمی بیشتر درگیر با تجزیه و تحلیل داده ها. 634 00:37:11,360 --> 00:37:18,340 و این از برخی گرفته Bootcamp در R برای در برکلی. 635 00:37:18,340 --> 00:37:20,790 >> بنابراین کتابخانه خارجی است. 636 00:37:20,790 --> 00:37:24,880 بنابراین من قصد دارم برای بار در کتابخانه که خارجی نامیده می شود. 637 00:37:24,880 --> 00:37:32,460 پس این است که به من می دهد read.dta بنابراین فرض کنیم که من این مجموعه داده را داشته باشد. 638 00:37:32,460 --> 00:37:39,000 این است که در حال حاضر ذخیره شده دایرکتوری از کنسول من کار. 639 00:37:39,000 --> 00:37:42,190 بنابراین اجازه دهید فقط ببینید چه دایرکتوری است. 640 00:37:42,190 --> 00:37:44,620 >> بنابراین در اینجا شاخه من است. 641 00:37:44,620 --> 00:37:50,040 و خواندن داده ها نقطه، این چیزی، می گوید این فایل 642 00:37:50,040 --> 00:37:54,650 در پوشه داده از واقع این دایرکتوری جاری. 643 00:37:54,650 --> 00:38:00,520 و read.dta این است که یک دستور به طور پیش فرض. 644 00:38:00,520 --> 00:38:02,760 من حدس می زنم که من آن را در حال حاضر لود می شود. 645 00:38:02,760 --> 00:38:04,750 IEI فرض من این در حال حاضر لود می شود. 646 00:38:04,750 --> 00:38:08,115 >> اما تا read.dta است که نمی به یک دستور به طور پیش فرض. 647 00:38:08,115 --> 00:38:11,550 و به همین دلیل شما در حال رفتن به برای بارگذاری در این کتابخانه package-- 648 00:38:11,550 --> 00:38:14,500 این بسته به نام خارجی است. 649 00:38:14,500 --> 00:38:16,690 و اگر شما لازم نیست بسته بندی شده، من فکر می کنم 650 00:38:16,690 --> 00:38:19,180 خارجی یکی از ساخته شده است در آنهایی است. 651 00:38:19,180 --> 00:38:31,150 در غیر این صورت، شما همچنین می توانید انجام install.packages هر 652 00:38:31,150 --> 00:38:33,180 و این بسته را نصب کنید. 653 00:38:33,180 --> 00:38:36,878 و این به شما R. آه، را ندارد. 654 00:38:36,878 --> 00:38:39,830 655 00:38:39,830 --> 00:38:43,140 و پس از آن من فقط رفتن برای متوقف کردن این به این دلیل من در حال حاضر آن را داشته باشد. 656 00:38:43,140 --> 00:38:46,920 >> اما آنچه واقعا خوب در مورد R این است که مدیریت بسته 657 00:38:46,920 --> 00:38:48,510 سیستم بسیار ظریف است. 658 00:38:48,510 --> 00:38:52,470 از آنجا که آن همه چیز را ذخیره واقعا خوبی را برای شما. 659 00:38:52,470 --> 00:38:59,780 بنابراین در این مورد، آن را به ذخیره آن را در، به اعتقاد من، این کتابخانه در اینجا. 660 00:38:59,780 --> 00:39:02,390 >> بنابراین هر زمان که شما می خواهید نصب بسته های جدید، 661 00:39:02,390 --> 00:39:04,980 آن را فقط به عنوان ساده به عنوان انجام install.packages هر 662 00:39:04,980 --> 00:39:07,500 و R تمام مدیریت خواهد شد بسته برای شما. 663 00:39:07,500 --> 00:39:12,900 بنابراین شما لازم نیست برای انجام کاری در پایتون، که در آن شما باید بسته خارجی 664 00:39:12,900 --> 00:39:15,330 مدیران مانند کاغذ آناکوندا که در آن شما هستید 665 00:39:15,330 --> 00:39:18,310 doing-- شما نصب بسته های خارج از پایتون 666 00:39:18,310 --> 00:39:20,940 و پس از آن شما سعی می کنید به آنها را خودتان اجرا کنید. 667 00:39:20,940 --> 00:39:22,210 بنابراین این است که واقعا راه خوب. 668 00:39:22,210 --> 00:39:25,590 >> و install.packages هر نیاز به اینترنت. 669 00:39:25,590 --> 00:39:31,950 این طول می کشد از یک سرور و مخزن که 670 00:39:31,950 --> 00:39:33,960 جمع آوری تمام بسته نامیده می شود CRAN. 671 00:39:33,960 --> 00:39:40,690 و شما می توانید که مرتب سازی بر اساس آینه مشخص شما می خواهید برای دانلود بسته های از. 672 00:39:40,690 --> 00:39:43,420 >> بنابراین در اینجا من از این مجموعه داده ام. 673 00:39:43,420 --> 00:39:46,240 من آن را می خوانید در استفاده از این تابع. 674 00:39:46,240 --> 00:39:49,360 بنابراین، اجازه دهید به جلو و انجام این کار. 675 00:39:49,360 --> 00:39:52,900 >> بنابراین اجازه دهید فرض کنیم که شما این مجموعه داده 676 00:39:52,900 --> 00:39:55,550 و شما باید مطلقا هیچ ایده آنچه در آن است. 677 00:39:55,550 --> 00:39:58,560 و این در واقع می آید تا نسبتا اغلب در صنعت 678 00:39:58,560 --> 00:40:00,910 که در آن شما فقط این را دارند تن و تن از چیزهای کثیف 679 00:40:00,910 --> 00:40:02,890 و آنها فوق العاده بدون برچسب است. 680 00:40:02,890 --> 00:40:06,380 بنابراین در اینجا من این را دارند مجموعه داده و من نمی دانم 681 00:40:06,380 --> 00:40:08,400 آنچه در آن است، بنابراین من فقط هستم نشان دادن آن را به اتمام. 682 00:40:08,400 --> 00:40:10,620 >> بنابراین من قصد دارم برای اولین بار به انجام سر. 683 00:40:10,620 --> 00:40:14,190 بنابراین من بررسی برای اولین بار شش ستون از آنچه این مجموعه داده است. 684 00:40:14,190 --> 00:40:21,730 بنابراین این دولت، pres04، و پس از آن است تمام این مرتب کردن متفاوتی از ستون. 685 00:40:21,730 --> 00:40:25,612 و چه جالب در اینجا، من حدس می زنم، این است که شما 686 00:40:25,612 --> 00:40:27,945 فرض کنیم که این به نظر می رسد مانند نوعی از انتخابات. 687 00:40:27,945 --> 00:40:30,482 688 00:40:30,482 --> 00:40:32,190 و من فقط از حدس می زنم به دنبال در فایل 689 00:40:32,190 --> 00:40:41,070 نام این نوعی از مجموعه است از اطلاعات در مورد نامزد یا رای دهندگان 690 00:40:41,070 --> 00:40:44,920 که برای رئیس جمهور خاص رای دادند یا نامزد رئيس جمهور 691 00:40:44,920 --> 00:40:46,550 برای انتخابات سال 2004. 692 00:40:46,550 --> 00:40:52,920 >> بنابراین در اینجا ارزش 1، 2 است بنابراین یکی از راه های ذخیره سازی 693 00:40:52,920 --> 00:40:56,540 نامزدهای رئيس جمهور نام خود هستند. 694 00:40:56,540 --> 00:40:59,780 در این مورد، آن را مانند به نظر می رسد آنها ارزش فقط عدد صحیح است. 695 00:40:59,780 --> 00:41:04,030 بنابراین سال 2004، آن بوش بود در مقابل کری به اعتقاد من. 696 00:41:04,030 --> 00:41:09,010 و در حال حاضر، اجازه دهید بگویم شما فقط نمی دانم آیا 1 مربوط به بوش و یا 2 697 00:41:09,010 --> 00:41:11,703 مربوط به کری یا و به همین ترتیب و غیره، درست است؟ 698 00:41:11,703 --> 00:41:15,860 >> و این است، فقط به من، یک مشکل نسبتا رایج است. 699 00:41:15,860 --> 00:41:18,230 پس چه می تواند شما را در این مورد انجام دهید؟ 700 00:41:18,230 --> 00:41:20,000 بنابراین اجازه دهید بررسی تمام این چیزهای دیگر. 701 00:41:20,000 --> 00:41:22,790 >> دولت، من فرض این می آید از کشورهای مختلف. 702 00:41:22,790 --> 00:41:25,100 partyid، درآمد. 703 00:41:25,100 --> 00:41:27,710 بیایید در partyid نگاه کنید. 704 00:41:27,710 --> 00:41:32,800 بنابراین شاید یک چیز شما می توانید انجام دهید این است در هر یک از مشاهدات نگاه 705 00:41:32,800 --> 00:41:36,250 که یک partyid از حزب جمهوری خواه و یا دموکرات و یا چیزی. 706 00:41:36,250 --> 00:41:38,170 بنابراین اجازه دهید فقط در چه partyid است نگاه کنید. 707 00:41:38,170 --> 00:41:41,946 >> بنابراین من قصد دارم به DAT و سپس من قصد دارم 708 00:41:41,946 --> 00:41:47,960 برای انجام این علامت دلار اپراتور که من قبلا انجام 709 00:41:47,960 --> 00:41:50,770 و این است که رفتن به زیر مجموعه به ستون. 710 00:41:50,770 --> 00:41:57,760 و پس از آن من قصد دارم به سر این در 20، فقط برای دیدن آنچه که این به نظر می رسد مانند. 711 00:41:57,760 --> 00:42:00,170 >> بنابراین این فقط یک دسته از ناس است. 712 00:42:00,170 --> 00:42:02,800 بنابراین به عبارت دیگر، شما باید گم شده داده در مورد این بچه ها. 713 00:42:02,800 --> 00:42:08,100 اما شما همچنین متوجه این DAT partyid یک عامل است 714 00:42:08,100 --> 00:42:10,030 بنابراین این به شما می دهد دسته های مختلف. 715 00:42:10,030 --> 00:42:14,170 بنابراین به عبارت دیگر، partyid می کنند حزب دموکرات، جمهوری خواه، مستقل، 716 00:42:14,170 --> 00:42:16,640 یا چیز دیگری. 717 00:42:16,640 --> 00:42:23,940 >> بنابراین اجازه دهید پیش بروید و اجازه دهید ببینید که از این is-- آه، OK. 718 00:42:23,940 --> 00:42:28,480 بنابراین من قصد دارم به زیر مجموعه به partyid و سپس 719 00:42:28,480 --> 00:42:32,780 نگاه که در آن هستند حزب دموکرات، به عنوان مثال. 720 00:42:32,780 --> 00:42:37,150 این است رفتن به شما بولی را، بولی عظیمی از TRUEs و FALSEs. 721 00:42:37,150 --> 00:42:41,630 >> و در حال حاضر، اجازه دهید بگویم من می خواهم به زیر مجموعه به این بچه ها. 722 00:42:41,630 --> 00:42:47,260 پس این است که رفتن به DAT من و زیر مجموعه به هر کدام مشاهدات 723 00:42:47,260 --> 00:42:48,910 باید برابر partyid برابر دموکرات. 724 00:42:48,910 --> 00:42:52,830 725 00:42:52,830 --> 00:42:55,180 و این است بسیار طولانی به دلیل در بسیاری از آنها وجود دارد. 726 00:42:55,180 --> 00:42:59,060 بنابراین در حال حاضر، من قصد دارم به سر این در 20. 727 00:42:59,060 --> 00:43:05,690 728 00:43:05,690 --> 00:43:11,270 >> و به عنوان شما متوجه، برابر برابر جالب است که در شما است 729 00:43:11,270 --> 00:43:13,250 already-- شما نیز از جمله ناس. 730 00:43:13,250 --> 00:43:19,010 بنابراین در این حالت، شما هنوز هم می تواند نمی کنید هر گونه اطلاعات به دلیل در حال حاضر شما گفتار 731 00:43:19,010 --> 00:43:22,650 و شما فقط می خواهید برای دیدن که از مشاهده به حزب دموکرات دارد 732 00:43:22,650 --> 00:43:24,670 و نه این از دست رفته خود ارزش. 733 00:43:24,670 --> 00:43:27,680 بنابراین چگونه می خواهید می توانید از این گفتار خلاص شدن از شر؟ 734 00:43:27,680 --> 00:43:36,410 >> بنابراین در اینجا من فقط با استفاده از کلید بر روی من مکان نما و پس از آن گفت: در حال حرکت در اطراف. 735 00:43:36,410 --> 00:43:39,778 و سپس در اینجا من فقط رفتن می گویند is.na datpartyid. 736 00:43:39,778 --> 00:43:48,970 737 00:43:48,970 --> 00:43:52,720 بنابراین این و و را دو بردار بولی مختلف 738 00:43:52,720 --> 00:43:57,160 و می گویند آن را برای رفتن به درست و نادرست به عنوان مثال. 739 00:43:57,160 --> 00:43:59,190 بنابراین آن را برای انجام این کار جزء عاقلانه. 740 00:43:59,190 --> 00:44:02,910 بنابراین در اینجا من ادعا را قاب داده ها، زیر مجموعه 741 00:44:02,910 --> 00:44:10,170 به آنهایی که به حزب دموکرات دارد، و حذف هر کدام از آنها که NA نیست. 742 00:44:10,170 --> 00:44:13,540 >> بنابراین این will-- باید شما چیزی را. 743 00:44:13,540 --> 00:44:16,540 744 00:44:16,540 --> 00:44:17,600 بیایید ببینید is.na. 745 00:44:17,600 --> 00:44:24,670 746 00:44:24,670 --> 00:44:27,690 بیایید datpartyid is.na امتحان کنید. 747 00:44:27,690 --> 00:44:36,290 748 00:44:36,290 --> 00:44:45,290 و این باید به you-- sorry-- فقط یک بردار بولی. 749 00:44:45,290 --> 00:44:49,260 و پس از آن، به دلیل آن را بسیار طولانی، من قصد دارم به زیر مجموعه به 20. 750 00:44:49,260 --> 00:44:49,760 باشه. 751 00:44:49,760 --> 00:44:51,570 بنابراین این باید کار کند. 752 00:44:51,570 --> 00:44:54,700 >> و این یکی نیز TRUEs باشد. 753 00:44:54,700 --> 00:45:01,830 آه، پس خطا من در اینجا این است که I'm-- من استفاده از C ++ و R به جای یکدیگر، بنابراین من را 754 00:45:01,830 --> 00:45:03,590 این اشتباه تمام وقت. 755 00:45:03,590 --> 00:45:05,807 و اپراتور است در واقع یکی از شما می خواهم. 756 00:45:05,807 --> 00:45:08,140 شما نمی خواهید به استفاده از دو آمپرسندهای کاربردی، فقط یک واحد. 757 00:45:08,140 --> 00:45:14,970 758 00:45:14,970 --> 00:45:17,010 باشه. 759 00:45:17,010 --> 00:45:18,140 >> بنابراین اجازه دهید. 760 00:45:18,140 --> 00:45:20,930 761 00:45:20,930 --> 00:45:23,920 بنابراین ما به subsetted partyid جایی که آنها دموکرات هستند 762 00:45:23,920 --> 00:45:25,300 و آنها ارزش از دست رفته نیست. 763 00:45:25,300 --> 00:45:27,690 و در حال حاضر اجازه دهید نگاه آنهایی که رای دادند. 764 00:45:27,690 --> 00:45:31,530 بنابراین آن را مانند به نظر می رسد بیشتر از آنها برای 1 رای دادند. 765 00:45:31,530 --> 00:45:36,090 بنابراین من قصد دارم به جلو بروید و می گویند که کری است. 766 00:45:36,090 --> 00:45:39,507 >> و به همین ترتیب، شما می توانید همچنین به جمهوری خواه به 767 00:45:39,507 --> 00:45:41,090 و امیدوارم، این باید به شما 2 را. 768 00:45:41,090 --> 00:45:49,730 769 00:45:49,730 --> 00:45:51,770 این فقط یک دسته از ستون های مختلف است. 770 00:45:51,770 --> 00:45:53,070 و در واقع، آن را 2. 771 00:45:53,070 --> 00:45:55,750 بنابراین partyid تمام جمهوریخواه، بسیاری از آنها رای دادن برای 2. 772 00:45:55,750 --> 00:45:58,390 >> بنابراین به نظر می رسد مانند، فقط با نگاه کردن به این، 773 00:45:58,390 --> 00:46:00,600 جمهوری خواه است برای رفتن به very-- یا partyid 774 00:46:00,600 --> 00:46:02,790 است برای رفتن به یک بسیار عامل مهمی در تعیین 775 00:46:02,790 --> 00:46:05,420 که نامزد آنها برای رفتن به رای دادن. 776 00:46:05,420 --> 00:46:07,120 و این واضح است که به طور کلی درست است. 777 00:46:07,120 --> 00:46:10,139 و این مسابقات خود را شهود، البته. 778 00:46:10,139 --> 00:46:11,930 بنابراین به نظر می رسد مانند من در حال اجرا خارج از زمان تا 779 00:46:11,930 --> 00:46:17,040 اجازه دهید من فقط باید پیش بروید و نشان می دهد برخی از تصاویر سریع است. 780 00:46:17,040 --> 00:46:21,120 بنابراین در اینجا چیزی است که کمی است با تجسم پیچیده است. 781 00:46:21,120 --> 00:46:26,450 بنابراین در این مورد، این است که بسیار تجزیه و تحلیل ساده از فقط چک کردن چه 782 00:46:26,450 --> 00:46:28,500 رئيس جمهور از '04 است. 783 00:46:28,500 --> 00:46:33,920 >> بنابراین در این مورد، اجازه دهید به شما می گویند می خواستم به پاسخ به این سوال. 784 00:46:33,920 --> 00:46:38,540 بنابراین فرض کنید ما می خواستند بدانند رای گیری رفتار در انتخابات سال 2004 رئيس جمهور 785 00:46:38,540 --> 00:46:41,170 و چگونه است که متفاوت است با نژاد. 786 00:46:41,170 --> 00:46:44,380 بنابراین نه تنها شما می خواهید رفتار رای گیری، 787 00:46:44,380 --> 00:46:47,860 اما شما می خواهید به زیر مجموعه ای از هر نژاد و نوع خلاصه که. 788 00:46:47,860 --> 00:46:50,770 و شما فقط می توانید بگویید این نماد پیچیده 789 00:46:50,770 --> 00:46:52,580 که این نوع از گرفتن مبهم و مه آلود. 790 00:46:52,580 --> 00:46:56,390 >> بنابراین یکی از پیشرفته تر R بسته هایی که هم نوع اخیر 791 00:46:56,390 --> 00:47:00,070 است dplyr نامیده می شود. 792 00:47:00,070 --> 00:47:03,060 پس از آن این حق در اینجا است. 793 00:47:03,060 --> 00:47:08,080 و ggplot2 ggg-- است فقط خوب راه انجام تصویری بهتر 794 00:47:08,080 --> 00:47:09,400 از ساخته شده است در یکی از. 795 00:47:09,400 --> 00:47:11,108 >> بنابراین من قصد دارم برای بار این دو کتابخانه. 796 00:47:11,108 --> 00:47:13,200 797 00:47:13,200 --> 00:47:16,950 و پس از آن، من قصد دارم برای رفتن پیش رو و این دستور را اجرا کنید. 798 00:47:16,950 --> 00:47:19,050 شما فقط می توانید این درمان به عنوان یک جعبه سیاه و سفید. 799 00:47:19,050 --> 00:47:23,460 >> آنچه اتفاق می افتد این است که این لوله عملگر عبور در این بحث 800 00:47:23,460 --> 00:47:24,110 به اینجا. 801 00:47:24,110 --> 00:47:28,070 بنابراین من گروه گفت: DAT مسابقه و پس از آن رئيس جمهور 04. 802 00:47:28,070 --> 00:47:31,530 و پس از آن، همه این دستورات دیگر در حال فیلتر و سپس خلاصه 803 00:47:31,530 --> 00:47:34,081 که در آن من انجام شمارش و پس از آن من آن را توطئه در اینجا. 804 00:47:34,081 --> 00:47:39,980 805 00:47:39,980 --> 00:47:42,500 OK سرد. 806 00:47:42,500 --> 00:47:44,620 بنابراین اجازه دهید پیش بروید و ببینید چه چیزی این به نظر می رسد مانند. 807 00:47:44,620 --> 00:47:52,280 808 00:47:52,280 --> 00:47:57,290 >> پس چه در اینجا اتفاق می افتد که من است فقط هر یک از نژادها و سپس رسم 809 00:47:57,290 --> 00:47:59,670 آنهایی که رای دادند. 810 00:47:59,670 --> 00:48:03,492 و این دو متفاوت ارزش به 2 و 1 مطابقت دارد. 811 00:48:03,492 --> 00:48:05,325 اگر می خواهید به تر زیبا، شما همچنین می توانید 812 00:48:05,325 --> 00:48:11,770 فقط مشخص است که 2 Kerry-- یا است 2 بوش است، و پس از آن 1 کری است. 813 00:48:11,770 --> 00:48:13,700 و شما همچنین می توانید از که در افسانه های خود را. 814 00:48:13,700 --> 00:48:17,410 >> و شما همچنین می توانید از این گراف تقسیم می شود. 815 00:48:17,410 --> 00:48:19,480 از آنجا که یک چیز است که، اگر شما متوجه، 816 00:48:19,480 --> 00:48:24,560 این است که بسیار آسان برای شناسایی نمی کدام یک از این دو مقدار بزرگتر هستند. 817 00:48:24,560 --> 00:48:27,920 بنابراین یک چیز شما می خواهم می خواهم انجام شده است را به این منطقه آبی 818 00:48:27,920 --> 00:48:31,855 و فقط آن را حرکت بیش از اینجا، بنابراین شما می توانید از این دو در کنار هم مقایسه کنید. 819 00:48:31,855 --> 00:48:34,480 و من حدس می زنم که چیزی است که من را وقت ندارد برای انجام در حال حاضر، 820 00:48:34,480 --> 00:48:36,660 اما این نیز بسیار آسان برای انجام دهد. 821 00:48:36,660 --> 00:48:40,310 شما فقط می توانید به نگاه صفحات مرد از ggplot. 822 00:48:40,310 --> 00:48:47,170 بنابراین شما فقط می توانید مانند ggplot که و به این صفحه مرد به عنوان خوانده شده. 823 00:48:47,170 --> 00:48:51,920 >> بنابراین من اجازه فقط به سرعت شما برخی از کارهای جالب نشان می دهد. 824 00:48:51,920 --> 00:48:57,610 بیایید پیش بروید و to-- درست استفاده از یادگیری ماشین. 825 00:48:57,610 --> 00:49:02,450 بنابراین اجازه دهید بگویم که ما باید این سه بسته بنابراین من قصد دارم برای بار این در. 826 00:49:02,450 --> 00:49:05,500 827 00:49:05,500 --> 00:49:09,170 بنابراین این فقط چاپ برخی از اطلاعات پس از من در چیزی که لود می شود. 828 00:49:09,170 --> 00:49:15,220 بنابراین من و گفت این read.csv، این مجموعه داده، و در حال حاضر 829 00:49:15,220 --> 00:49:18,940 من قصد دارم به جلو بروید و نگاه کنید و ببینید چه چیزی در داخل این مجموعه داده. 830 00:49:18,940 --> 00:49:22,080 >> بنابراین 20 مشاهدات برای اولین بار. 831 00:49:22,080 --> 00:49:27,190 بنابراین من فقط X1، X2، و Y. دارند پس از آن به نظر می رسد مانند یک دسته از این ارزش ها 832 00:49:27,190 --> 00:49:31,640 از شاید 20 تا 80 و یا پس گرفته. 833 00:49:31,640 --> 00:49:37,700 و پس از آن به طور مشابه برای X2 و سپس این Y به نظر می رسد برچسب 0 و 1. 834 00:49:37,700 --> 00:49:49,500 >> برای بررسی این، من می توانم فقط X1 خلاصه داده ها. 835 00:49:49,500 --> 00:49:51,660 و پس از آن به طور مشابه برای همه این ستون دیگر. 836 00:49:51,660 --> 00:49:55,300 بنابراین خلاصه یک راه سریع از است فقط به شما نشان مقادیر سریع است. 837 00:49:55,300 --> 00:49:56,330 آه ببخشید. 838 00:49:56,330 --> 00:49:58,440 این یکی باید Y. شود 839 00:49:58,440 --> 00:50:03,420 >> بنابراین در این مورد، می دهد quantiles، مادها، maxes نیز هست. 840 00:50:03,420 --> 00:50:07,130 در این مورد، dataY، شما می توانید ببینید که آن را فقط برای رفتن به 0 و 1. 841 00:50:07,130 --> 00:50:10,100 همچنین میانگین است گفت: 0.6، فقط بدان معناست که آن 842 00:50:10,100 --> 00:50:13,380 به نظر می رسد مثل من 1S بیشتر از 0s و. 843 00:50:13,380 --> 00:50:16,160 >> بنابراین، اجازه دهید پیش رو را نشان دهد و به شما چه این به نظر می رسد مانند. 844 00:50:16,160 --> 00:50:17,470 بنابراین من فقط رفتن به رسم این. 845 00:50:17,470 --> 00:50:22,852 846 00:50:22,852 --> 00:50:24,636 بیایید ببینید که چگونه به پاک کردن این. 847 00:50:24,636 --> 00:50:30,492 848 00:50:30,492 --> 00:50:31,468 اوه OK. 849 00:50:31,468 --> 00:50:35,840 850 00:50:35,840 --> 00:50:36,340 باشه. 851 00:50:36,340 --> 00:50:37,590 >> پس این همان چیزی است که آن را مانند به نظر می رسد. 852 00:50:37,590 --> 00:50:46,310 بنابراین آن را مانند زرد من مشخص به نظر می رسد به عنوان 0، و سپس قرمز من به عنوان 1S مشخص شده است. 853 00:50:46,310 --> 00:50:52,190 بنابراین در اینجا آن را مانند به نظر می رسد نقاط برچسب و آن 854 00:50:52,190 --> 00:50:56,410 به نظر می رسد مثل شما فقط برخی از خواست مرتب کردن بر اساس خوشه بندی در این. 855 00:50:56,410 --> 00:51:01,020 >> و اجازه دهید من فقط جلو و نشان می دهد به شما برخی از این توابع ساخته شده در. 856 00:51:01,020 --> 00:51:03,580 بنابراین در اینجا LM است. 857 00:51:03,580 --> 00:51:06,060 پس این است که تنها در تلاش به جا یک خط به این. 858 00:51:06,060 --> 00:51:08,640 پس چه بهترین راه است که من می توانم جا یک خط مانند 859 00:51:08,640 --> 00:51:14,020 که آن بهترین از هم جدا خواهد شد این نوع از خوشه. 860 00:51:14,020 --> 00:51:21,790 و در حالت ایده آل، شما فقط می توانید ببینید که من فقط اجرا تمام این دستورات 861 00:51:21,790 --> 00:51:25,450 و پس از آن، من قصد دارم جلو و خط اضافه کنید. 862 00:51:25,450 --> 00:51:28,970 >> بنابراین به نظر می رسد مانند بهترین حدس. 863 00:51:28,970 --> 00:51:34,150 این در نظر گرفتن یکی از بهترین که به حداقل می رساند خطا در تلاش برای سازگاری این خط. 864 00:51:34,150 --> 00:51:40,000 بدیهی است، این به نظر می رسد نوع خوب است، اما این بهترین نیست. 865 00:51:40,000 --> 00:51:43,130 و مدل های خطی، در به طور کلی، در حال رفتن به 866 00:51:43,130 --> 00:51:46,811 واقعا بزرگ برای تئوری و فقط مرتب سازی بر اصول ساختمان ماشین 867 00:51:46,811 --> 00:51:47,310 یادگیری. 868 00:51:47,310 --> 00:51:50,330 اما در عمل، شما در حال رفتن به می خواهید برای انجام کاری به طور کلی تر. 869 00:51:50,330 --> 00:51:54,280 >> بنابراین شما فقط می توانید سعی کنید در حال اجرا چیزی به نام شبکه های عصبی. 870 00:51:54,280 --> 00:51:57,110 این چیزها هستند به طور فزاینده بیشتر رایج است. 871 00:51:57,110 --> 00:52:00,530 و آنها فقط کار فوق العاده برای مجموعه داده های بزرگ. 872 00:52:00,530 --> 00:52:07,080 بنابراین در این مورد، ما تنها have-- اجازه دهید see-- ما nrow. 873 00:52:07,080 --> 00:52:09,010 بنابراین nrow است فقط گفت تعداد سطرها. 874 00:52:09,010 --> 00:52:11,790 بنابراین در این مورد، من 100 مشاهدات. 875 00:52:11,790 --> 00:52:15,010 >> بنابراین، اجازه دهید پیش بروید و ایجاد یک شبکه عصبی. 876 00:52:15,010 --> 00:52:18,620 پس این است که واقعا خوب چرا که من فقط می توانم بگویم nnet 877 00:52:18,620 --> 00:52:21,767 و پس از آن من رگرسیون Y. بنابراین Y که ستون است. 878 00:52:21,767 --> 00:52:23,850 و سپس رگرسیون آن را در دو متغیر دیگر. 879 00:52:23,850 --> 00:52:27,360 بنابراین این کوتاه تر است نماد برای X1 و X2. 880 00:52:27,360 --> 00:52:29,741 >> بنابراین اجازه دهید پیش بروید و اجرای این. 881 00:52:29,741 --> 00:52:30,240 آه ببخشید. 882 00:52:30,240 --> 00:52:32,260 من نیاز به اجرای کل این چیز. 883 00:52:32,260 --> 00:52:37,500 و این تنها چاپ نماد برای چگونه به سرعت یا نه به سرعت آن را 884 00:52:37,500 --> 00:52:38,460 همگرا. 885 00:52:38,460 --> 00:52:41,420 بنابراین به نظر می رسد مانند آن را همگرا بود. 886 00:52:41,420 --> 00:52:44,970 بنابراین، اجازه دهید پیش رو و چاپ به از آنچه این به نظر می رسد مانند. 887 00:52:44,970 --> 00:52:51,260 >> مشاهده اینجا تصویر و اینجا است کانتور نشان میدهد که چگونه به خوبی آن را متناسب. 888 00:52:51,260 --> 00:52:56,380 و این است just-- شما می توانید ببینید این است که این بسیار، بسیار زیباست. 889 00:52:56,380 --> 00:52:59,400 حتی می تواند بیشبرازش، اما شما همچنین می توانید 890 00:52:59,400 --> 00:53:03,390 برای این با دیگر تکنیک های مانند اعتبار متقاطع. 891 00:53:03,390 --> 00:53:06,180 و این نیز به R. ساخته شده است 892 00:53:06,180 --> 00:53:09,170 >> و به من اجازه فقط به شما نشان دهد ماشین بردار پشتیبان. 893 00:53:09,170 --> 00:53:12,470 این دیگر واقعا شایع است روش در یادگیری ماشین. 894 00:53:12,470 --> 00:53:18,550 این بسیار شبیه به مدل خطی است، اما آن استفاده می کند چه یک روش هسته نامیده می شود. 895 00:53:18,550 --> 00:53:22,790 و بیایید ببینید که چگونه به خوبی نشان می دهد که. 896 00:53:22,790 --> 00:53:26,430 پس این یکی بسیار شبیه به چگونه است همچنین یک شبکه عصبی انجام، 897 00:53:26,430 --> 00:53:27,900 اما آن را خیلی بیشتر نرم و صاف. 898 00:53:27,900 --> 00:53:35,740 و این بر مبنای از what-- چگونه کار SVM ها. 899 00:53:35,740 --> 00:53:40,250 >> بنابراین این فقط یک بسیار دید کلی از برخی 900 00:53:40,250 --> 00:53:43,822 از توابع ساخته شده در شما می توانید انجام دهید و همچنین برخی از اکتشاف داده. 901 00:53:43,822 --> 00:53:45,905 بنابراین اجازه دهید من فقط به جلو و بازگشت به اسلاید. 902 00:53:45,905 --> 00:53:50,290 903 00:53:50,290 --> 00:53:53,670 >> بنابراین بدیهی است، این است بسیار جامع نیست. 904 00:53:53,670 --> 00:53:57,140 و این است که واقعا فقط یک تیزر به شما نشان آنچه شما واقعا می تواند در R. انجام 905 00:53:57,140 --> 00:53:59,100 بنابراین اگر شما می خواهم درست مثل برای کسب اطلاعات بیشتر، اینجا 906 00:53:59,100 --> 00:54:01,210 یک دسته از منابع مختلف است. 907 00:54:01,210 --> 00:54:06,890 >> بنابراین اگر شما علاقه کتاب های درسی هستید و یا شما فقط علاقه به خواندن چیزهایی آنلاین، 908 00:54:06,890 --> 00:54:09,670 پس از آن این است که فوق العاده یک هدلی ویکهام، 909 00:54:09,670 --> 00:54:13,010 که او نیز ایجاد تمام این بسته های واقعا سرد. 910 00:54:13,010 --> 00:54:17,420 اگر شما علاقه از فیلم هستید، پس از آن برکلی دارای یک اردوی آموزشی عالی 911 00:54:17,420 --> 00:54:21,060 که several-- که نوع طولانی است. 912 00:54:21,060 --> 00:54:24,210 و آن را به شما تقریبا آموزش همه چیز شما می خواهم در مورد R. دانم 913 00:54:24,210 --> 00:54:27,770 >> و به همین ترتیب، در Codeacademy وجود دارد و همه این مرتب سازی بر دیگر 914 00:54:27,770 --> 00:54:29,414 وب سایت های تعاملی. 915 00:54:29,414 --> 00:54:31,580 آنها همچنین گرفتن common-- بیشتر و بیشتر رایج است. 916 00:54:31,580 --> 00:54:33,749 پس این است که بسیار شبیه به Codeacademy. 917 00:54:33,749 --> 00:54:35,790 و در نهایت، اگر شما فقط می خواهید جامعه و کمک به، 918 00:54:35,790 --> 00:54:38,800 این یک دسته از چیزهایی که شما می توانید برای رفتن. 919 00:54:38,800 --> 00:54:40,880 بدیهی است، ما هنوز استفاده از لیست های پستی، فقط 920 00:54:40,880 --> 00:54:44,860 مانند تقریبا در هر دیگر جامعه زبان های برنامه نویسی. 921 00:54:44,860 --> 00:54:47,880 و #rstats، این است جامعه ما توییتر. 922 00:54:47,880 --> 00:54:49,580 که در واقع کاملا رایج است. 923 00:54:49,580 --> 00:54:50,850 و پس از آن کاربر! 924 00:54:50,850 --> 00:54:52,340 آیا فقط کنفرانس ما. 925 00:54:52,340 --> 00:54:55,390 >> و پس از آن، البته، شما می توانید استفاده از تمام این پرسش و پاسخ چیزهای دیگر، 926 00:54:55,390 --> 00:54:57,680 مانند سرریز پشته، گوگل، و سپس گیتهاب. 927 00:54:57,680 --> 00:55:00,490 از آنجا که اکثر این بسته و بسیاری از جامعه 928 00:55:00,490 --> 00:55:03,420 خواهد شد در اطراف در حال توسعه محور کد چرا که آن را منبع باز است. 929 00:55:03,420 --> 00:55:05,856 و آن را فقط واقعا خوب در گیتهاب. 930 00:55:05,856 --> 00:55:08,730 و در نهایت، شما می توانید به من اگر تماس شما فقط هر گونه سوال سریع داشته باشد. 931 00:55:08,730 --> 00:55:13,530 بنابراین شما می توانید من در توییتر اینجا پیدا کنید، وب سایت من، و فقط ایمیل من. 932 00:55:13,530 --> 00:55:17,840 بنابراین امیدوارم، که بود something-- فقط یک تیزر کوتاه 933 00:55:17,840 --> 00:55:20,900 از آنچه R واقعا قادر به انجام است. 934 00:55:20,900 --> 00:55:23,990 و امیدوارم، شما فقط اتمام این سه لینک 935 00:55:23,990 --> 00:55:25,760 و ببینید چه چیزی شما می توانید بیشتر انجام دهد. 936 00:55:25,760 --> 00:55:28,130 و من حدس می زنم که فقط در مورد آن. 937 00:55:28,130 --> 00:55:28,630 با تشکر. 938 00:55:28,630 --> 00:55:30,780 >> [تشویق حضار] 939 00:55:30,780 --> 00:55:31,968