1 00:00:00,000 --> 00:00:00,750 2 00:00:00,750 --> 00:00:09,800 >> [Muzikos grojimo] 3 00:00:09,800 --> 00:00:13,014 4 00:00:13,014 --> 00:00:13,680 Dustin TRAN: Sveiki. 5 00:00:13,680 --> 00:00:14,980 Mano vardas Dustin. 6 00:00:14,980 --> 00:00:18,419 Taigi aš pristatys Duomenų analizė R. 7 00:00:18,419 --> 00:00:19,710 Tiesiog šiek tiek apie save. 8 00:00:19,710 --> 00:00:24,320 Aš šiuo metu studijuoja mechanikų ir Taikomieji mokslai. 9 00:00:24,320 --> 00:00:28,330 Aš studijuoti sankirtos mašina mokymo ir statistika 10 00:00:28,330 --> 00:00:31,375 taip duomenų analizė R yra tikrai esminis ką 11 00:00:31,375 --> 00:00:33,790 Darau kasdien. 12 00:00:33,790 --> 00:00:35,710 >> Ir R yra ypač geras duomenų analizė 13 00:00:35,710 --> 00:00:39,310 nes tai labai gera prototipų. 14 00:00:39,310 --> 00:00:43,590 Ir paprastai, kai jūs darote kai rūšiuoti duomenų analizę, kad problemų daug 15 00:00:43,590 --> 00:00:44,920 ketinate pažinimo. 16 00:00:44,920 --> 00:00:48,700 Ir todėl jūs tiesiog norite turėti kai tikrai gera kalba, 17 00:00:48,700 --> 00:00:53,770 yra tik gera daro built-in funkcijos, o ne 18 00:00:53,770 --> 00:00:57,430 , turintys spręsti žemo lygio dalykus. 19 00:00:57,430 --> 00:01:01,040 Taigi iš pradžių, aš tik ketina pristatyti, kas yra R, kodėl 20 00:01:01,040 --> 00:01:04,540 norite jį naudoti, ir tada eiti per į kai demo 21 00:01:04,540 --> 00:01:07,060 ir tiesiog eiti iš ten. 22 00:01:07,060 --> 00:01:08,150 >> Taigi, kas yra R? 23 00:01:08,150 --> 00:01:11,180 R yra tik kalbos sukūrė statistinei skaičiavimo 24 00:01:11,180 --> 00:01:12,450 ir vizualizacija. 25 00:01:12,450 --> 00:01:16,000 Taigi, ką tai reiškia, kad tai labai puikus kalba 26 00:01:16,000 --> 00:01:22,400 bet kokio dalykas rūšiuoti, kad kalbama neapibrėžtumas ar duomenų vizualizacija. 27 00:01:22,400 --> 00:01:24,850 Taigi jūs turite visus šiuos skirstinys. 28 00:01:24,850 --> 00:01:27,140 Yra bus įmontuotą funkcijų. 29 00:01:27,140 --> 00:01:31,650 Jūs taip pat turite puikus braižymo paketus. 30 00:01:31,650 --> 00:01:34,110 >> Python yra kita konkuruoja kalbos duomenų. 31 00:01:34,110 --> 00:01:40,020 Ir vienas dalykas, kad man atrodo, kad R yra daug geriau yra vizualizacija. 32 00:01:40,020 --> 00:01:45,200 Taigi, ką jūs pamatysite demo kaip gerai yra tik labai intuityvus kalba 33 00:01:45,200 --> 00:01:48,050 kad tik veikia labai gerai. 34 00:01:48,050 --> 00:01:53,140 Taip pat yra laisvas ir atviro kodo, kaip yra kitas geras kalba I guess. 35 00:01:53,140 --> 00:01:55,440 >> Ir čia, tiesiog krūva Raktiniai žodžiai išmesti į tave. 36 00:01:55,440 --> 00:02:00,450 Tai dinamiška, o tai reiškia, jei turite specifinis tipas, priskirtas prie objekto 37 00:02:00,450 --> 00:02:02,025 nei jis bus tiesiog pakeisti jį skristi. 38 00:02:02,025 --> 00:02:05,670 Tai tingus, kad tai protingas apie kaip tai daro skaičiavimus. 39 00:02:05,670 --> 00:02:12,250 Funkcinis reiškia, kad ji tikrai gali veikti pagrįsta ne funkcijų taip anything-- 40 00:02:12,250 --> 00:02:16,910 bet manipuliacijos rūšiuoti esate darydama ji bus pagrįsta ne funkcijas. 41 00:02:16,910 --> 00:02:20,162 >> Taigi, dvejetainiai operatoriai, pavyzdžiui, yra tik iš prigimties funkcijos. 42 00:02:20,162 --> 00:02:21,870 Ir viskas, jūs ketinate padaryti, tai 43 00:02:21,870 --> 00:02:24,690 bus nubėgti pati funkcijas. 44 00:02:24,690 --> 00:02:27,140 Ir tada Objektinis taip pat. 45 00:02:27,140 --> 00:02:30,930 >> Taigi čia yra XKCD sklypas. 46 00:02:30,930 --> 00:02:34,350 Ne tik todėl, kad aš jaučiuosi kaip XKCD yra esminis bet kokios rūšies 47 00:02:34,350 --> 00:02:37,770 pateikimo, bet todėl, Jaučiu, tai tikrai 48 00:02:37,770 --> 00:02:42,160 plaktukai mintį, kad iš daug laikas, kai jūs darote kai duomenų rūšiuoti 49 00:02:42,160 --> 00:02:46,570 analizė, problema yra ne tiek daug, kaip greitai ji veikia, 50 00:02:46,570 --> 00:02:49,850 bet kaip ilgai jis ketina jus programuoti užduotį. 51 00:02:49,850 --> 00:02:54,112 Taigi čia yra tik analizuojant, ar strategija arba b yra efektyvesnis. 52 00:02:54,112 --> 00:02:55,820 Tai bus kažkas, kad jūs esate 53 00:02:55,820 --> 00:02:58,290 susitvarkys daug su į Rūšiuoti žemo lygio kalbos 54 00:02:58,290 --> 00:03:03,440 kur jūs susiduriame su SEG gedimus, atminties paskirstymas, Initializations, 55 00:03:03,440 --> 00:03:05,270 net padaryti įmontuotą funkcijų. 56 00:03:05,270 --> 00:03:09,920 Ir ši medžiaga yra viskas tvarkoma labai, labai elegantiškai R. 57 00:03:09,920 --> 00:03:12,839 >> Taigi tik plaktukas tai taškas, didžiausia kliūtimi 58 00:03:12,839 --> 00:03:13,880 bus pažinimo. 59 00:03:13,880 --> 00:03:17,341 Taigi, duomenų analizė yra labai sunku problema. 60 00:03:17,341 --> 00:03:19,340 Nesvarbu, ar jūs darote mašina mokymosi ar esate 61 00:03:19,340 --> 00:03:22,550 daro tik kažkokia Pagrindiniai duomenys žvalgyba, 62 00:03:22,550 --> 00:03:25,290 jūs nenorite turėti imtis dokumentą 63 00:03:25,290 --> 00:03:27,440 ir tada kaupia kažkas kaskart 64 00:03:27,440 --> 00:03:31,010 norite pamatyti, ką stulpelis atrodo, kas ypač įrašai į matricą 65 00:03:31,010 --> 00:03:32,195 atrodo. 66 00:03:32,195 --> 00:03:34,320 Taigi jūs tiesiog norite turėti kai tikrai gražus sąsaja 67 00:03:34,320 --> 00:03:37,740 galite paleisti paprastą funkciją kad indeksus kokia 68 00:03:37,740 --> 00:03:41,870 norite ir tiesiog paleisti jį iš ten. 69 00:03:41,870 --> 00:03:44,190 Ir jūs turite domeną specialūs kalbos už tai. 70 00:03:44,190 --> 00:03:51,750 Ir R tikrai padės jums apibrėžti problema ir ją išspręsti tokiu būdu. 71 00:03:51,750 --> 00:03:58,690 >> Taigi čia yra sklypas, kuriame programavimas populiarumas R, kaip jis dingo per tam tikrą laiką. 72 00:03:58,690 --> 00:04:04,060 Taigi, kaip jūs galite pamatyti, kaip 2013 arba todėl tiesiog susprogdintas labai. 73 00:04:04,060 --> 00:04:09,570 Ir tai buvo tik dėl to, kad didžiulis tendencija technologijų pramonės 74 00:04:09,570 --> 00:04:10,590 apie dideli duomenų. 75 00:04:10,590 --> 00:04:13,010 Be to, ne tik technologijos pramonės, bet tikrai 76 00:04:13,010 --> 00:04:16,490 bet pramonė that-- nes iš pramonės aikštelė 77 00:04:16,490 --> 00:04:20,589 yra tarsi pagrindas bando spręsti šias problemas. 78 00:04:20,589 --> 00:04:24,590 Ir paprastai, jūs galite turėti kai geras matavimo būdas šių problemų 79 00:04:24,590 --> 00:04:29,720 ar net apibrėžti juos arba sprendžiant juos naudojant duomenis. 80 00:04:29,720 --> 00:04:35,430 Taigi, manau, dabar R 11 Populiariausias kalba apie TIOBE 81 00:04:35,430 --> 00:04:38,200 ir jis augo nuo tada. 82 00:04:38,200 --> 00:04:40,740 83 00:04:40,740 --> 00:04:43,080 >> Taigi čia šiek tiek daugiau bruožai R. Jis turi 84 00:04:43,080 --> 00:04:46,900 milžiniškas pakuočių skaičius ir dėl visų šių skirtingų dalykų. 85 00:04:46,900 --> 00:04:52,470 Taigi bet kuriuo metu jūs turite tikra problema, dauguma 86 00:04:52,470 --> 00:04:55,060 laikas R turės kad funkcija jums. 87 00:04:55,060 --> 00:04:58,520 Taigi, ar norite sukurti tam tikrą mašiną rūšiuoti 88 00:04:58,520 --> 00:05:02,770 mokymosi algoritmas vadinamas Atsitiktinės miško arba Decision Trees, 89 00:05:02,770 --> 00:05:07,530 ar net bando imtis vidurkio funkcija ar šios medžiagos, 90 00:05:07,530 --> 00:05:10,000 R turės tai. 91 00:05:10,000 --> 00:05:14,190 >> Ir jei jūs rūpi optimizavimas, vienas dalykas, kad bendra 92 00:05:14,190 --> 00:05:17,430 yra tai, kad po to, kai baigsite prototipų kai aukšto lygio kalba rūšiuoti, 93 00:05:17,430 --> 00:05:19,810 jums mesti, kad in-- jums tiesiog uosto, kad per 94 00:05:19,810 --> 00:05:21,550 tam tikru žemo lygio kalba. 95 00:05:21,550 --> 00:05:26,090 Kas gero apie R yra tai, kad, kai jūs padaryti ją prototipų, galite paleisti C ++ 96 00:05:26,090 --> 00:05:29,510 arba Fortran, arba bet kuris iš šių žemesnio lygio tie tiesiai į R. 97 00:05:29,510 --> 00:05:32,320 Taigi, kad iš tikrųjų cool funkcija apie R, 98 00:05:32,320 --> 00:05:35,930 jei tikrai rūpi optimizavimas taškas. 99 00:05:35,930 --> 00:05:39,490 >> Ir jis taip pat tikrai gera žiniatinklio vizualizacijos. 100 00:05:39,490 --> 00:05:43,530 Taigi, D3.js, pavyzdžiui, yra Manau, kitą seminarą 101 00:05:43,530 --> 00:05:45,130 kad šiandien pristatėme. 102 00:05:45,130 --> 00:05:48,510 Ir tai tikrai awesome daro interaktyvių vizualizacijas. 103 00:05:48,510 --> 00:05:54,460 Ir D3.js daroma prielaida, kad jūs turite kai duomenų rūšiuoti būti brėžiamas 104 00:05:54,460 --> 00:05:58,080 ir R yra puikus būdas galėtų padaryti duomenų analizė prieš eksportuoti 105 00:05:58,080 --> 00:06:04,220 perkelti į D3.js ar net tiesiog paleisti D3.js komandas į mokslinius tyrimus pati, 106 00:06:04,220 --> 00:06:08,240 taip pat visa tai kiti bibliotekos, taip pat. 107 00:06:08,240 --> 00:06:13,041 >> Taigi, kad buvo tiesiog įvedimas kas R ir kodėl jums gali jį naudoti. 108 00:06:13,041 --> 00:06:14,790 Taigi tikiuosi, aš įsitikinęs, jums kažką 109 00:06:14,790 --> 00:06:18,460 apie tiesiog bando pamatyti, ką ji reiškia. 110 00:06:18,460 --> 00:06:23,930 Taigi, aš ruošiuosi eiti į priekį ir eiti per kai apie R objektų pagrindai 111 00:06:23,930 --> 00:06:26,150 ir tai, ką tikrai gali padaryti. 112 00:06:26,150 --> 00:06:29,690 >> Taigi čia yra tik krūva matematikos komandas. 113 00:06:29,690 --> 00:06:35,000 Taigi sako you're-- norite sukurti kalba sau, ir jūs tiesiog norite 114 00:06:35,000 --> 00:06:38,080 turėti įvairių įrankių krūva. 115 00:06:38,080 --> 00:06:42,520 Bet operacijos rūšiuoti manote jūs norima gana daug bus R. 116 00:06:42,520 --> 00:06:44,150 >> Taigi čia yra 2 plius 2. 117 00:06:44,150 --> 00:06:46,090 Čia yra 2 kartus Pi. 118 00:06:46,090 --> 00:06:51,870 R turi built-in konstantų krūva kad jūs dažnai naudoja kaip pi, e. 119 00:06:51,870 --> 00:06:56,230 >> Ir tada, čia 7 plius runif, todėl runif 1. 120 00:06:56,230 --> 00:07:02,450 Tai funkcija, kuri yra susidaro vienas atsitiktinis vienoda nuo 0 iki 1. 121 00:07:02,450 --> 00:07:04,400 Ir tada ten 3 iki 4 galia. 122 00:07:04,400 --> 00:07:06,430 Yra kvadratinių šaknų. 123 00:07:06,430 --> 00:07:07,270 >> Yra žurnalas. 124 00:07:07,270 --> 00:07:14,500 Taigi prisijunkite darys bazę eksponentinis savaime. 125 00:07:14,500 --> 00:07:18,337 Ir tada, jei nurodysite bazę, tada galite daryti ką norite bazė. 126 00:07:18,337 --> 00:07:19,920 Ir tada čia yra keletas kitų komandų. 127 00:07:19,920 --> 00:07:22,180 Taigi jūs turite 23 mod 2. 128 00:07:22,180 --> 00:07:24,910 Tada jūs turite likusią dalį. 129 00:07:24,910 --> 00:07:27,110 Tada jūs turite mokslinė žymėjimas, jei jums taip pat 130 00:07:27,110 --> 00:07:34,060 nori padaryti tiesiog daugiau ir daugiau sudėtingų dalykų. 131 00:07:34,060 --> 00:07:37,320 >> Taigi čia yra priskyrimas. 132 00:07:37,320 --> 00:07:40,830 Taigi tipiškas užduotys R yra daroma su rodykle 133 00:07:40,830 --> 00:07:43,440 todėl mažiau nei tada brūkšnelį. 134 00:07:43,440 --> 00:07:47,250 Taigi čia aš tiesiog priskirdami 3 kintamojo val. 135 00:07:47,250 --> 00:07:50,160 >> Ir tada aš spausdinti val ir tada jis spausdina trys. 136 00:07:50,160 --> 00:07:53,920 Pagal nutylėjimą R vertėjo, ją spausdinti dalykų už jus 137 00:07:53,920 --> 00:07:57,280 todėl jūs neturite nurodyti spausdinti val bet kuriuo metu norite spausdinti kažką. 138 00:07:57,280 --> 00:08:00,200 Jūs galite tiesiog padaryti val ir tada jis bus padaryti tai už jus. 139 00:08:00,200 --> 00:08:04,380 >> Be to, galite naudoti lygu techniškai kaip priskyrimo operatorius. 140 00:08:04,380 --> 00:08:07,190 Yra šiek tiek subtilybes tarp naudojant rodyklę 141 00:08:07,190 --> 00:08:10,730 operatorius ir lygiosios operatorius užduotis. 142 00:08:10,730 --> 00:08:15,470 Daugiausia pagal susitarimą visiems tiesiog naudokite rodyklių operatorių. 143 00:08:15,470 --> 00:08:21,850 >> Ir čia aš priskiriant tai įstrižai žymėjimas vadinamas 1 dvitaškis 6. 144 00:08:21,850 --> 00:08:26,010 Šis generuoja vektorių 1-6. 145 00:08:26,010 --> 00:08:29,350 Ir tai tikrai gražus, nes tada jūs tiesiog priskirti Val vektorių 146 00:08:29,350 --> 00:08:34,270 ir kad veikia savaime. 147 00:08:34,270 --> 00:08:37,799 >> Taigi tai jau vyksta nuo single-- labai intuityvi duomenis 148 00:08:37,799 --> 00:08:41,070 struktūra vos dvigubai kai kurie iš tipo tipo į vektorių 149 00:08:41,070 --> 00:08:45,670 ir kuri rinks visus Skaliarinė vertės jumis. 150 00:08:45,670 --> 00:08:50,770 Taigi, po vyksta nuo skaliaro, jūs turėti R objektus, ir tai yra vektorius. 151 00:08:50,770 --> 00:08:55,610 Vektorius yra bet kurį iš rūšiuoti kolekcija yra tokio paties tipo. 152 00:08:55,610 --> 00:08:58,150 Taigi čia yra vektorių krūva. 153 00:08:58,150 --> 00:08:59,800 >> Taigi tai yra skaitmeninis. 154 00:08:59,800 --> 00:09:02,440 Skaitinė yra R "būdas pasakyti dvigubai. 155 00:09:02,440 --> 00:09:07,390 Ir taip pagal nutylėjimą, bet skaičius bus dvigubai. 156 00:09:07,390 --> 00:09:13,150 >> Taigi, jei turite c 1,1, 3, neigiamas 5.7, c yra funkcijos. 157 00:09:13,150 --> 00:09:16,760 Tai concatenates visi trys numeriai į vektorių. 158 00:09:16,760 --> 00:09:19,619 Ir tai bus be-- todėl, jei Pastebėjus 3 savaime, 159 00:09:19,619 --> 00:09:21,910 paprastai jums būtų manyti, , kad tai yra, kaip sveikasis skaičius, 160 00:09:21,910 --> 00:09:25,050 bet todėl, kad visų vektorių yra tokio paties tipo, 161 00:09:25,050 --> 00:09:28,660 tai dviviečiai vektorius arba skaitmeninis šiuo atveju. 162 00:09:28,660 --> 00:09:34,920 >> rnorm yra funkcija, kuri generuoja standartinio normaliojo variables-- 163 00:09:34,920 --> 00:09:36,700 arba standartinių normaliųjų verčių. 164 00:09:36,700 --> 00:09:38,360 Ir aš nurodant du iš jų. 165 00:09:38,360 --> 00:09:43,840 Taigi darau rnorm 2, paskiriant, kad į Devs, tada aš spausdinti DEVS. 166 00:09:43,840 --> 00:09:47,350 Taigi tai yra tik du Atsitiktinės normaliosios vertės. 167 00:09:47,350 --> 00:09:50,060 >> Ir tada int, jei jūs jums rūpi sveikieji skaičiai. 168 00:09:50,060 --> 00:09:54,650 Taigi tai yra tik apie atminties paskirstymo ir taupymo atminties dydis. 169 00:09:54,650 --> 00:10:01,460 Taigi jums reikės pridėti savo numerius pagal kapitalo L. 170 00:10:01,460 --> 00:10:04,170 >> Apskritai, tai yra R istorinis žymėjimas 171 00:10:04,170 --> 00:10:06,940 kažko vadinamas ilgas sveikasis skaičius. 172 00:10:06,940 --> 00:10:09,880 Taigi didžiąją dalį laiko, jums būti susijusios su dvejetų. 173 00:10:09,880 --> 00:10:15,180 Ir jei jūs kada nors bus vėliau nuo optimizuoti savo kodą, 174 00:10:15,180 --> 00:10:18,110 galite tiesiog pridėti šie L'ai vėliau arba per jį 175 00:10:18,110 --> 00:10:22,280 jei jūs kaip ir precognitive apie tai, ką jūs ketinate daryti šiuos kintamuosius. 176 00:10:22,280 --> 00:10:25,340 177 00:10:25,340 --> 00:10:26,890 >> Taigi čia yra simbolis vektorius. 178 00:10:26,890 --> 00:10:31,440 Taigi, dar kartą, aš concatenating trys stygos šiuo metu. 179 00:10:31,440 --> 00:10:36,230 Atkreipkite dėmesį, kad dviguba eilutes ir vieniši stygos R. pats 180 00:10:36,230 --> 00:10:41,000 Taigi turiu arthur ir Marvin ir taip kai aš spausdinti jį, visi iš jų 181 00:10:41,000 --> 00:10:43,210 ketiname parodyti dviviečiai eilutes. 182 00:10:43,210 --> 00:10:45,880 Ir jei taip pat norite įtraukti dvigubai ar vieno styginių 183 00:10:45,880 --> 00:10:50,070 Jūsų personažai, tada jūs galite arba pakaitomis savo eilutes. 184 00:10:50,070 --> 00:10:53,540 >> Taigi Marvin už antrasis elementas, tai yra 185 00:10:53,540 --> 00:10:56,380 ketina show-- jus tiesiog dvigubas stygas 186 00:10:56,380 --> 00:10:59,050 ir tada vieną eilutę todėl tai yra kintamos. 187 00:10:59,050 --> 00:11:04,040 Priešingu atveju, jei norite naudoti dvigubai styginių operatorius dviguba eilutę 188 00:11:04,040 --> 00:11:07,090 kai jūs skelbiantis, tada jūs tiesiog naudoti pabėgti operatorių. 189 00:11:07,090 --> 00:11:10,600 Taigi jūs padaryti backslash dvigubo eilutę. 190 00:11:10,600 --> 00:11:13,330 >> Ir, galiausiai, mes taip pat turi loginius vektorius. 191 00:11:13,330 --> 00:11:15,890 Taigi logical-- taip teisinga ir FALSE, ir jie 192 00:11:15,890 --> 00:11:18,880 bus didžiosiomis raidėmis. 193 00:11:18,880 --> 00:11:22,370 Ir tada vėl, aš concatenating juos ir tada priskirti juos bools. 194 00:11:22,370 --> 00:11:24,590 Taigi bools ketina parodyti Jūs true, false, ir tiesa. 195 00:11:24,590 --> 00:11:28,280 196 00:11:28,280 --> 00:11:31,620 >> Taigi čia yra vektorizuoti indeksavimo. 197 00:11:31,620 --> 00:11:34,870 Taigi, iš pradžių, I esu atsižvelgiant function-- 198 00:11:34,870 --> 00:11:39,230 tai yra vadinama sequence-- seka 2-12. 199 00:11:39,230 --> 00:11:42,490 Ir aš atsižvelgiant seką 2. 200 00:11:42,490 --> 00:11:46,660 Taigi jis ketina daryti 2, 4, 6, 8, 10 ir 12. 201 00:11:46,660 --> 00:11:50,080 Ir tada, aš indeksavimo gauti trečią elementą. 202 00:11:50,080 --> 00:11:55,770 >> Taigi vienas dalykas, reikia nepamiršti, yra kad R indeksai pagal nuo 1 d. 203 00:11:55,770 --> 00:12:00,550 Taigi intervalais 3 ketina duoti Jūs Trečiasis elementas. 204 00:12:00,550 --> 00:12:04,580 Tai tarsi skiriasi nuo kitų kalbos, kur jis prasideda nuo nulio. 205 00:12:04,580 --> 00:12:09,780 Taigi C arba C ++, pavyzdžiui, esate ketinate gauti ketvirtą elementą. 206 00:12:09,780 --> 00:12:13,280 >> Ir čia yra Vals nuo 3 iki 5. 207 00:12:13,280 --> 00:12:16,030 Taigi vienas dalykas, kad tikrai cool, kad jūs 208 00:12:16,030 --> 00:12:20,410 gali generuoti laikinus kintamuosius viduje ir tada tiesiog naudokite juos skristi. 209 00:12:20,410 --> 00:12:21,960 Taigi čia yra 3-5. 210 00:12:21,960 --> 00:12:25,070 Taigi, aš generuoti vektorių 3, 4, ir 5, ir tada 211 00:12:25,070 --> 00:12:29,700 Aš indeksavimo gauti trečdalį, ketvirta, ir penkta elementai. 212 00:12:29,700 --> 00:12:32,280 >> Taigi panašiai, galite abstrakti tai tiesiog padaryti 213 00:12:32,280 --> 00:12:35,280 bet kurį iš vektoriumi, rūšiuoti kuri suteikia jums indeksavimo. 214 00:12:35,280 --> 00:12:40,050 Taigi čia yra Vals ir tada pirma, trečia ir šešta elementai. 215 00:12:40,050 --> 00:12:42,800 Ir tada, jei norite padaryti papildyti, 216 00:12:42,800 --> 00:12:45,210 todėl jūs tiesiog padaryti minuso vėliau, ir kad bus 217 00:12:45,210 --> 00:12:48,600 suteikia jums viską, tai nėra pirma, trečia, ar šeštasis elementas. 218 00:12:48,600 --> 00:12:51,590 Taigi, tai bus 4, 8, ir 10. 219 00:12:51,590 --> 00:12:54,380 >> Ir jei norite gauti net labiau pažengusios, 220 00:12:54,380 --> 00:12:57,610 galite Jungiant Bulio vektorius. 221 00:12:57,610 --> 00:13:05,210 Taigi šis rodiklis ketina suteikti jums tai Bulio vektorius ilgis 6 d. 222 00:13:05,210 --> 00:13:07,280 Taigi REP TIKROJI kablelis 3. 223 00:13:07,280 --> 00:13:09,680 Tai bus pakartoti TRUE tris kartus. 224 00:13:09,680 --> 00:13:12,900 Taigi, tai suteiks jums vektorius TRUE TRUE TRUE. 225 00:13:12,900 --> 00:13:17,470 >> REP FALSE 4-- tai norėčiau duoti jums suklastotų, FALSE, FALSE, FALSE vektorius. 226 00:13:17,470 --> 00:13:21,280 Ir tada c ketina Jungiant šie du loginę kartu. 227 00:13:21,280 --> 00:13:24,090 Taigi, jūs ketinate gauti trys TRUEs ir tada keturis FALSEs. 228 00:13:24,090 --> 00:13:28,460 >> Taigi, kad, kai jūs index Vals, jūs ketinate gauti TRUE TRUE TRUE. 229 00:13:28,460 --> 00:13:31,420 Taigi, kad ketina pasakyti "taip", Noriu šiuos tris elementus. 230 00:13:31,420 --> 00:13:33,520 Ir tada FALSE, FALSE, NETIESA FALSE vyksta 231 00:13:33,520 --> 00:13:37,140 pasakyti "ne, aš nenoriu tuos elementus, todėl jis nesiruošia grąžinti juos. 232 00:13:37,140 --> 00:13:41,490 >> Ir aš manau, ten tikrai klaidos čia nes tai yra suprantama, pakartokite TIKROJI 3 233 00:13:41,490 --> 00:13:47,990 ir pakartokite FALSE 4, ir techniškai, jums tik šešios elementai taip pakartoti FALSE, 234 00:13:47,990 --> 00:13:50,470 ji turėtų būti pakartokite FALSE 3. 235 00:13:50,470 --> 00:13:55,260 Manau, R yra taip pat pakankamai protingas, pavyzdžiui kad jei jūs tiesiog nurodyti 4 čia, tada 236 00:13:55,260 --> 00:13:56,630 jis net ne klaida iš. 237 00:13:56,630 --> 00:13:58,480 Tai bus tiesiog suteikti jums šią vertę. 238 00:13:58,480 --> 00:14:00,970 Taigi jis bus tiesiog ignoruoti, kad ketvirtą FALSE. 239 00:14:00,970 --> 00:14:05,310 240 00:14:05,310 --> 00:14:09,270 >> Taigi čia yra vektorizuoti užduotis. 241 00:14:09,270 --> 00:14:15,480 Taigi set.seed-- tai tik nustato sėkla pseudo numerius. 242 00:14:15,480 --> 00:14:20,110 Taigi, aš nustatyti sėklos 42, tai reiškia, kad jei aš generuoti 243 00:14:20,110 --> 00:14:22,950 trijų atsitiktinių normalu vertės, ir tada, jei jus 244 00:14:22,950 --> 00:14:27,400 paleisti set.seed dėl savo kompiuteris, naudojant tą patį vertę 42, 245 00:14:27,400 --> 00:14:30,990 tada jūs taip pat gausite tie patys trys atsitiktiniai asmenimis. 246 00:14:30,990 --> 00:14:33,411 >> Taigi tai tikrai geras už pasikartojimu. 247 00:14:33,411 --> 00:14:35,910 Paprastai, kai jūs darote kai Rūšiuoti mokslinės analizės, 248 00:14:35,910 --> 00:14:37,230 jūs norite nustatyti sėklos. 249 00:14:37,230 --> 00:14:41,270 Tokiu būdu kiti mokslininkai gali tik atkurti tą patį kodą, jūs 250 00:14:41,270 --> 00:14:44,790 padaryti, nes jie turi tiksliai patys atsitiktiniai kintamieji that-- ar atsitiktinai 251 00:14:44,790 --> 00:14:47,270 vertės, kad jūs atlikote, kaip gerai. 252 00:14:47,270 --> 00:14:49,870 253 00:14:49,870 --> 00:14:53,910 >> Ir taip vektorizuoti perleidimas čia rodantis Vals nuo 1 iki 2. 254 00:14:53,910 --> 00:14:59,290 Todėl užtrunka pirmuosius du elementus, nuo intervalais ir tada priskiria juos 0. 255 00:14:59,290 --> 00:15:03,940 Ir tada, taip pat galite tiesiog padaryti panašus dalykas su loginę. 256 00:15:03,940 --> 00:15:09,340 >> Taigi Vals nėra lygus 0-- šį valią jums vektoriaus FALSE, FALSE, TRUE 257 00:15:09,340 --> 00:15:10,350 ir šiuo atveju. 258 00:15:10,350 --> 00:15:13,770 Ir tada, jis ketina pasakyti bet Šių indeksų kad būtų tiesa, 259 00:15:13,770 --> 00:15:15,270 tada jis ketina perleisti, kad iki 5. 260 00:15:15,270 --> 00:15:18,790 Todėl jis užima trečią elementą čia ir tada priskiria jį iki 5. 261 00:15:18,790 --> 00:15:22,300 >> Ir tai tikrai gražus lyginant su žemo lygio kalbomis 262 00:15:22,300 --> 00:15:25,560 kur jūs turite naudoti kilpomis padaryti visą šį vektorizuoti stuff 263 00:15:25,560 --> 00:15:30,281 nes tai tik labai intuityvus ir tai vieną kartą, linijinės. 264 00:15:30,281 --> 00:15:32,030 Ir kas daug apie vektorizuoti žymėjimas 265 00:15:32,030 --> 00:15:37,020 yra tai, kad R, tai yra rūšiuoti built-in, kad jie beveik taip pat greitai 266 00:15:37,020 --> 00:15:42,490 kaip daro žemo lygio kalba, kaip ne todėl už linijos R 267 00:15:42,490 --> 00:15:46,317 ir po to jis daryti dinamiška indeksavimo pati. 268 00:15:46,317 --> 00:15:48,900 Ir tai bus lėtesnis, nei tai daro šis vektorizuoti dalykai 269 00:15:48,900 --> 00:15:55,950 kur ji gali tai padaryti lygiagrečiai, kur ji tai daro sriegimo esmės. 270 00:15:55,950 --> 00:15:58,650 >> Taigi čia yra vektorizuoti operacijas. 271 00:15:58,650 --> 00:16:04,920 Taigi, aš generuoti vertę nuo 1 iki 3, priskyrimo, kad į vec1, 3-5, vec2, 272 00:16:04,920 --> 00:16:05,950 pridedant juos kartu. 273 00:16:05,950 --> 00:16:11,490 Ji priduria, jiems komponentas-protingas, kad tai 1 plius 3, 2 + 4, ir taip toliau. 274 00:16:11,490 --> 00:16:13,330 >> vec1 kartų vec2. 275 00:16:13,330 --> 00:16:16,110 Tai daugina du vertės komponentas išmintingas. 276 00:16:16,110 --> 00:16:21,830 Taigi, tai 1 kartus 3, 2 kartus 4, ir po to 3 kartus 5. 277 00:16:21,830 --> 00:16:28,250 >> Ir tada, panašiai taip pat galite padaryti comparisons-- loginius palyginimų. 278 00:16:28,250 --> 00:16:33,640 Taigi, tai false false true šiame atvejis, nes 1 yra ne didesnis nei 3, 279 00:16:33,640 --> 00:16:35,920 2 yra ne didesnis nei 4. 280 00:16:35,920 --> 00:16:41,160 Tai, manau, dar typo 3 tikrai ne didesnis kaip 5. 281 00:16:41,160 --> 00:16:41,660 Taip. 282 00:16:41,660 --> 00:16:45,770 Ir todėl galite tiesiog padaryti viską Šie paprasti veiksmai 283 00:16:45,770 --> 00:16:48,350 nes jų paveldėjo iš pačių klasių. 284 00:16:48,350 --> 00:16:51,110 285 00:16:51,110 --> 00:16:52,580 >> Taigi, tai buvo tik vektorius. 286 00:16:52,580 --> 00:16:56,530 Ir tai tarsi svarbiausias R objektas, nes atsižvelgiant į vektorių, 287 00:16:56,530 --> 00:16:59,170 galite statyti daugiau pažangių objektų. 288 00:16:59,170 --> 00:17:00,560 >> Taigi čia matrica. 289 00:17:00,560 --> 00:17:05,030 Tai iš esmės abstrakcija kas matrica pati. 290 00:17:05,030 --> 00:17:10,099 Taigi šiuo atveju, tai trys skirtingi vektoriai, kur kiekviena iš jų yra kolonėlė, 291 00:17:10,099 --> 00:17:12,710 arba galite apsvarstyti ją kaip kiekviena iš jų yra eilutė. 292 00:17:12,710 --> 00:17:18,250 >> Taigi, aš laikyti matrica nuo 1 iki 9 ir tada aš nurodant 3 eilutes. 293 00:17:18,250 --> 00:17:23,364 Taigi nuo 1 iki 9 duos jums vektorių 1, 2, 3, 4, 5, 6, ir visi būdas 9. 294 00:17:23,364 --> 00:17:29,250 >> Vienas dalykas, taip pat turėkite omenyje tai, kad R parduotuvės vertės stulpelyje-dur formatu. 295 00:17:29,250 --> 00:17:34,160 Taigi, kitaip tariant, kai jūs matote 1 9, jis ketina laikyti them-- 296 00:17:34,160 --> 00:17:36,370 tai bus 1, 2, 3 pirmoje skiltyje, 297 00:17:36,370 --> 00:17:38,510 ir tada jis bus padaryti 4, 5, 6 antrojoje skiltyje, 298 00:17:38,510 --> 00:17:41,440 ir tada 7, 8, 9 trečioje skiltyje. 299 00:17:41,440 --> 00:17:45,570 >> Ir čia yra keletas kitų bendros funkcijos, kurias galite naudoti. 300 00:17:45,570 --> 00:17:49,650 Taigi automatinės kilimėlis, tai suteiks jums matricos matmenys. 301 00:17:49,650 --> 00:17:52,620 Jis ketina grįžti jus matmens vektorius. 302 00:17:52,620 --> 00:17:55,580 Taigi, šiuo atveju, nes mūsų matrica 3 3, 303 00:17:55,580 --> 00:18:01,900 jis ketina duoti jums skaitmeninis vektorinis tai 3 3. 304 00:18:01,900 --> 00:18:05,270 >> Ir čia yra tiesiog rodo matrica daugyba. 305 00:18:05,270 --> 00:18:11,970 Taigi paprastai, jei jūs tiesiog padaryti asterisk-- tiek motina Žvaigždutė mat-- 306 00:18:11,970 --> 00:18:15,380 tai bus komponentas išmintingas veikimas 307 00:18:15,380 --> 00:18:17,300 ar tai, kas vadinama Hadamarda produktas. 308 00:18:17,300 --> 00:18:21,310 Taigi jis ketina padaryti kiekvienas elementas komponentas išmintingas. 309 00:18:21,310 --> 00:18:23,610 Tačiau, jei norite matrica multiplication-- 310 00:18:23,610 --> 00:18:29,380 taip dauginant pirmoje eilėje kartus antrosios matricos pirmasis stulpelis 311 00:18:29,380 --> 00:18:34,510 ir taip on-- norite naudoti ši operacija proc. 312 00:18:34,510 --> 00:18:38,110 >> Ir t motina yra tik operacija perkelti. 313 00:18:38,110 --> 00:18:42,590 Taigi aš sakau imtis perkelti į matrica, padauginkite jį iš matricos 314 00:18:42,590 --> 00:18:43,090 pati. 315 00:18:43,090 --> 00:18:45,006 Ir tada jis ketina grįžti į jums dar 3 316 00:18:45,006 --> 00:18:50,700 3 matricos rodyti produktas, kurį norėtumėte. 317 00:18:50,700 --> 00:18:53,750 >> Ir taip buvo matrica. 318 00:18:53,750 --> 00:18:56,020 Čia yra tai, kas vadinama duomenų rėmas. 319 00:18:56,020 --> 00:19:00,780 Duomenų rėmas jūs galite galvoti, kaip matrica, tačiau pati kiekviename stulpelyje 320 00:19:00,780 --> 00:19:02,990 bus kitokio tipo. 321 00:19:02,990 --> 00:19:07,320 >> Taigi, kas yra tikrai cool apie duomenų rėmai yra tai, kad pačios duomenų analizę, 322 00:19:07,320 --> 00:19:11,260 jūs ketinate turėti visa tai nevienalyčių duomenų ir visa tai tikrai 323 00:19:11,260 --> 00:19:15,640 nepatogus dalykų, kur kiekvienas iš stulpelių patys gali būti įvairių tipų. 324 00:19:15,640 --> 00:19:21,460 Taigi čia aš sakau sukurti duomenų rėmo, padaryti ints 1-3, 325 00:19:21,460 --> 00:19:24,750 ir tada taip pat turi simbolių vektorių. 326 00:19:24,750 --> 00:19:28,470 Taigi aš galiu indeksą per kiekviena iš šių stulpelių 327 00:19:28,470 --> 00:19:30,930 ir tada aš gausiu patys vertybes. 328 00:19:30,930 --> 00:19:34,370 Ir jūs taip pat galite padaryti kai kuriuos rūšiuoti iš operacijų duomenų kadrų. 329 00:19:34,370 --> 00:19:38,040 Ir didžiąją dalį laiko, kai esate daro duomenų analizę arba tam tikros rūšies 330 00:19:38,040 --> 00:19:42,042 nuo pirminio apdorojimo, jūs būsite dirbti su šių duomenų struktūrų 331 00:19:42,042 --> 00:19:44,250 kur kiekvienas stulpelis vyksta būti skirtingo tipo. 332 00:19:44,250 --> 00:19:47,880 333 00:19:47,880 --> 00:19:52,970 >> Galiausiai, tai yra iš esmės tik keturi pagrindiniai objektai R. sąrašas 334 00:19:52,970 --> 00:19:55,820 tiesiog rinkti bet kiti objektai norite. 335 00:19:55,820 --> 00:20:00,130 Taigi, jie bus saugomi į vieną tai kintamasis, kad jūs galite lengvai pasiekti. 336 00:20:00,130 --> 00:20:02,370 >> Taigi čia aš atsižvelgiant sąrašą. 337 00:20:02,370 --> 00:20:04,460 Aš sakau Daiktai lygus 3. 338 00:20:04,460 --> 00:20:08,060 Taigi, aš ruošiuosi turėti vieną elementą sąrašas ir tai vadinama medžiaga, 339 00:20:08,060 --> 00:20:10,570 ir jis ketina turėti vertę 3. 340 00:20:10,570 --> 00:20:13,140 >> Taip pat galiu sukurti matrica. 341 00:20:13,140 --> 00:20:17,970 Taigi, tai yra 1-4 ir galutinio eilės lygus 2, taip, 2 2 matricoje. 342 00:20:17,970 --> 00:20:20,270 Taip pat į sąrašą ir ji vadinama motina. 343 00:20:20,270 --> 00:20:24,690 moreStuff, simbolių, ir net dar savaime sąrašas. 344 00:20:24,690 --> 00:20:27,710 >> Taigi tai yra sąrašas, kurį 5 ir lokys. 345 00:20:27,710 --> 00:20:30,990 Taigi, ji turi vertę 5 ir jį turi simbolių lokys 346 00:20:30,990 --> 00:20:32,710 ir tai viduje sąrašą. 347 00:20:32,710 --> 00:20:35,965 Taigi jūs galite turėti juos Rekurentiniai dalykų, kur 348 00:20:35,965 --> 00:20:38,230 turite another-- A tipo per tipą. 349 00:20:38,230 --> 00:20:41,420 Taigi panašiai, jūs galite turėti matrica viduje kitą matricoje, ir taip toliau. 350 00:20:41,420 --> 00:20:44,264 Ir sąrašas yra tik geras būdas surinkimo ir kaupiant 351 00:20:44,264 --> 00:20:45,430 visi šie skirtingi objektai. 352 00:20:45,430 --> 00:20:50,210 353 00:20:50,210 --> 00:20:57,150 >> Ir, pagaliau, čia tik padėti, jei tai buvo tiesiog dingo per labai greitai. 354 00:20:57,150 --> 00:21:01,350 Taigi bet kuriuo esate supainioti apie kai funkcija rūšiuoti, 355 00:21:01,350 --> 00:21:03,510 jūs galite padaryti padedant šią funkciją. 356 00:21:03,510 --> 00:21:07,120 Taigi jūs galite padaryti pagalbos matrica arba klaustukas matrica. 357 00:21:07,120 --> 00:21:11,430 Ir pagalba ir klaustukas yra tik sutrumpinta už tą patį 358 00:21:11,430 --> 00:21:13,040 todėl jie slapyvardžius. 359 00:21:13,040 --> 00:21:16,820 >> LM yra funkcija, kuri tiesiog daro linijinį modelį. 360 00:21:16,820 --> 00:21:20,340 Tačiau, jei jūs tiesiog neįsivaizduoju, kaip kad darbai, galite tiesiog padaryti pagalbos LM 361 00:21:20,340 --> 00:21:24,610 ir kad duosiu jums keletą rūšiuoti dokumentus, 362 00:21:24,610 --> 00:21:27,960 atrodo lyg vyras puslapis Unix, kur 363 00:21:27,960 --> 00:21:34,210 turite trumpą aprašymą, ką ji, ir tai, ką jos argumentai, 364 00:21:34,210 --> 00:21:38,850 ką jis grįžta, ir tik patarimų, kaip jį naudoti, ir kai kurie pavyzdžiai, taip pat. 365 00:21:38,850 --> 00:21:41,680 366 00:21:41,680 --> 00:21:52,890 >> Taigi leiskite man eiti į priekį ir šou kai naudojant R. Gerai Demo. 367 00:21:52,890 --> 00:21:55,470 Taigi, nuėjau per labai greitai tik duomenys 368 00:21:55,470 --> 00:21:59,440 struktūros ir kai rūšiuoti op-- kai operacijas. 369 00:21:59,440 --> 00:22:02,960 Štai kai kurios funkcijos. 370 00:22:02,960 --> 00:22:06,750 >> Taigi čia aš tik ketina apibrėžti funkciją. 371 00:22:06,750 --> 00:22:09,970 Taigi, aš taip pat naudojant priskyrimo operatorius čia 372 00:22:09,970 --> 00:22:12,610 ir tada aš sakau deklaruoti kaip funkcija. 373 00:22:12,610 --> 00:22:14,140 Ir tai trunka x vertę. 374 00:22:14,140 --> 00:22:18,210 Taigi tai yra bet kokia vertė norite ir aš ruošiuosi grįžti x savaime. 375 00:22:18,210 --> 00:22:20,840 Taigi, tai yra tapatybės funkcija. 376 00:22:20,840 --> 00:22:23,670 >> Ir kas kietas apie tai palyginti su kitomis kalbomis 377 00:22:23,670 --> 00:22:26,330 ir dar žemo lygio kalbos yra tai, kad X 378 00:22:26,330 --> 00:22:29,350 gali būti bet kokios paties tipo ir jis bus grįžti tą tipą. 379 00:22:29,350 --> 00:22:35,251 Taigi galite imagine-- tad man tiesiog paleisti tai greitai. 380 00:22:35,251 --> 00:22:35,750 Atsiprašau. 381 00:22:35,750 --> 00:22:40,300 >> Taigi vienas dalykas, aš taip pat reikėtų paminėti yra tai, kad aš tai redaktorius naudoju 382 00:22:40,300 --> 00:22:41,380 vadinamas rstudio. 383 00:22:41,380 --> 00:22:44,389 Tai, kas vadinama IDE. 384 00:22:44,389 --> 00:22:46,180 Ir vienas dalykas, kad tikrai malonu apie tai 385 00:22:46,180 --> 00:22:51,500 yra tai, kad ji apima daug daug dalykų, kuriuos noriu padaryti R pats 386 00:22:51,500 --> 00:22:53,180 tik labai intuityviai. 387 00:22:53,180 --> 00:22:55,550 >> Taigi čia yra vertėjas konsolės. 388 00:22:55,550 --> 00:23:02,160 Taigi panašiai, taip pat galite gauti šią Konsolės žaliavos tiesiog daro kapitalo R. 389 00:23:02,160 --> 00:23:05,630 Ir tai yra tiksliai tas pats, kaip konsolėje. 390 00:23:05,630 --> 00:23:12,210 Taigi aš galiu tik daryti ID funkcija x, x, x. 391 00:23:12,210 --> 00:23:16,130 Ir then-- ir tada, kad bus gerai pati. 392 00:23:16,130 --> 00:23:19,200 393 00:23:19,200 --> 00:23:21,740 >> Taigi rstudio yra puikus nes jis turi konsolės. 394 00:23:21,740 --> 00:23:25,360 Ji taip pat turi dokumentus norite paleisti. 395 00:23:25,360 --> 00:23:28,629 Ir tada ji turi keletą kintamųjų, kad jūs galite pamatyti aplinkoje. 396 00:23:28,629 --> 00:23:30,420 Ir tada, jei turite daryti sklypus, tada jums 397 00:23:30,420 --> 00:23:33,730 galite tiesiog pamatyti čia, o ne valdyti visus šiuos skirtingus langus 398 00:23:33,730 --> 00:23:35,940 patys. 399 00:23:35,940 --> 00:23:40,530 >> Aš iš tikrųjų asmeniškai naudoti Vim, bet aš jaustis kaip rstudio yra puikus tik 400 00:23:40,530 --> 00:23:44,640 gauti gerą idėją kaip naudoti R. Paprastai, 401 00:23:44,640 --> 00:23:47,040 kai bandote išmokti naują užduotį, 402 00:23:47,040 --> 00:23:49,590 Jūs nenorite dirbti per daug dalykų vienu metu. 403 00:23:49,590 --> 00:23:53,120 Taigi R yra tik very-- rstudio yra labai geras būdas mokytis R 404 00:23:53,120 --> 00:23:56,760 be susidoroti su visi šie kiti dalykai. 405 00:23:56,760 --> 00:23:58,600 >> Taigi čia Bėgu ID labas. 406 00:23:58,600 --> 00:24:00,090 Tai grąžina labas. 407 00:24:00,090 --> 00:24:01,740 ID 123. 408 00:24:01,740 --> 00:24:04,610 Čia yra sveikųjų skaičių vektorius. 409 00:24:04,610 --> 00:24:08,620 Taigi panašiai, nes galite imtis bet kokių nors vertės rūšiuoti, 410 00:24:08,620 --> 00:24:16,060 jūs galite padaryti grįžimas id x todėl grįžta 1234 ir 5. 411 00:24:16,060 --> 00:24:22,210 >> Ir leiskite man tiesiog parodyti jums, kad tai iš tiesų sveikasis skaičius. 412 00:24:22,210 --> 00:24:28,800 Ir panašiai, jei jūs klasė ID x, ji ketina būti sveikasis skaičius. 413 00:24:28,800 --> 00:24:34,170 Ir tada, taip pat galite palyginti du, ir tai tiesa. 414 00:24:34,170 --> 00:24:38,350 Taigi, aš patikrinti, jei id x lygus lygus x ir pranešimą 415 00:24:38,350 --> 00:24:39,760 kad ji suteikia jums du TRUEs. 416 00:24:39,760 --> 00:24:44,280 Taigi tai nesakau, yra du objektai identiški, 417 00:24:44,280 --> 00:24:46,845 tačiau yra kiekvienas iš įrašų, per vektoriai tapačios. 418 00:24:46,845 --> 00:24:50,000 419 00:24:50,000 --> 00:24:52,090 >> Čia yra bounded.compare. 420 00:24:52,090 --> 00:24:58,470 Taigi, tai yra šiek tiek sudėtingesnis tuo, kad ji turi, jei būklę ir kitur 421 00:24:58,470 --> 00:25:00,960 ir tada ji užima du argumentai metu. 422 00:25:00,960 --> 00:25:02,640 Taigi, x yra bet kokio tipo. 423 00:25:02,640 --> 00:25:06,280 Ir aš tai sakau Antrasis argumentas yra. 424 00:25:06,280 --> 00:25:08,380 Tai gali būti bet kas, taip pat. 425 00:25:08,380 --> 00:25:12,490 Tačiau pagal nutylėjimą, jis ketina imtis 5, jei nenurodysite nieko. 426 00:25:12,490 --> 00:25:16,730 >> Taigi čia aš ruošiuosi pasakyti jei x yra didesnis nei. 427 00:25:16,730 --> 00:25:19,220 Taigi, jei aš nenurodysite, ją teigia, jei x yra didesnis nei 5, 428 00:25:19,220 --> 00:25:20,470 tada aš ruošiuosi grįžti tiesa. 429 00:25:20,470 --> 00:25:23,230 kitur, aš ruošiuosi grįžti FALSE. 430 00:25:23,230 --> 00:25:24,870 Taigi leiskite man eiti į priekį ir nustatyti tai. 431 00:25:24,870 --> 00:25:30,600 432 00:25:30,600 --> 00:25:34,550 >> Ir dabar aš ruošiuosi paleisti bounded.compare 3. 433 00:25:34,550 --> 00:25:39,150 Taigi ji sako yra 3 mažiau than-- yra 3 didesnės nei 5. 434 00:25:39,150 --> 00:25:41,830 Ne, tai ne taip neteisinga. 435 00:25:41,830 --> 00:25:46,550 >> Ir bounded.compare 3 ir aš ruošiuosi palyginti ją naudojant lygus 2. 436 00:25:46,550 --> 00:25:50,700 Taigi, dabar aš sakau taip, dabar aš nori, kad būtų kažkas. 437 00:25:50,700 --> 00:25:52,750 Taigi, aš ruošiuosi pasakyti, jums turėtų būti 2. 438 00:25:52,750 --> 00:25:56,640 >> Galiu arba padaryti šį rūšiuoti notacijos arba sakau lygus 2. 439 00:25:56,640 --> 00:25:58,720 Tai yra daugiau nuskaitoma tuo, kad, kai esate 440 00:25:58,720 --> 00:26:01,450 Žvelgiant į šiuos tikrai sudėtingų funkcijų, 441 00:26:01,450 --> 00:26:08,110 imtis kelis arguments-- ir tai gali būti dešimtys oftentimes-- tiesiog pasakyti 442 00:26:08,110 --> 00:26:11,140 lygu 2 yra suprantamesnis žmogui už Jums taip, kad vėliau ateityje 443 00:26:11,140 --> 00:26:13,020 jūs žinote, ką darote. 444 00:26:13,020 --> 00:26:17,120 >> Taigi šiuo atveju, aš posakis yra 3 didesnis nei 2. 445 00:26:17,120 --> 00:26:18,270 Taip, tai yra. 446 00:26:18,270 --> 00:26:22,350 Ir panašiai, aš tiesiog galima pašalinti tai ir sako, yra 3 didesnis kaip 2 447 00:26:22,350 --> 00:26:23,440 kur lygus 2. 448 00:26:23,440 --> 00:26:26,230 Ir tai taip pat tiesa. 449 00:26:26,230 --> 00:26:26,730 Taip? 450 00:26:26,730 --> 00:26:29,670 >> AUDITORIJA: Ar jums vykdyti pagal kiekvieną eilutę? 451 00:26:29,670 --> 00:26:30,670 >> Dustin TRAN: Taip, aš esu. 452 00:26:30,670 --> 00:26:33,900 Taigi, ką aš darau čia pradėdami vartoti šį tekstą document-- 453 00:26:33,900 --> 00:26:39,825 ir kas daug apie rstudio yra tai, kad Galiu tik paleisite short-- pagrindinį nuorodą. 454 00:26:39,825 --> 00:26:41,820 Taigi darau kontrolės Enter. 455 00:26:41,820 --> 00:26:44,850 >> Ir tada, aš atsižvelgiant linija teksto dokumente 456 00:26:44,850 --> 00:26:46,710 ir tada išleidimą į konsolę. 457 00:26:46,710 --> 00:26:50,800 Taigi čia aš sakau, bounded.compare ir darau Control-X. 458 00:26:50,800 --> 00:26:52,540 Taigi aš tiesiog gali padaryti paleisti čia taip pat. 459 00:26:52,540 --> 00:26:54,920 Ir tada, kad priimsime linija ir tada įdėti jį čia. 460 00:26:54,920 --> 00:26:57,900 Ir tada panašiai, galiu paleisti čia. 461 00:26:57,900 --> 00:27:04,630 Ir tada jis tiesiog laikyti apibrėžti linijos į panašaus konsolės. 462 00:27:04,630 --> 00:27:10,690 >> Ir jei jūs taip pat pastebėsite, kad garbanotas petnešos yra ten kaip ir C sintaksė. 463 00:27:10,690 --> 00:27:13,910 x-- jei jei sąlyga yra taip pat ketinate naudoti skliaustus ir tada 464 00:27:13,910 --> 00:27:15,350 galite naudoti kitur. 465 00:27:15,350 --> 00:27:17,496 Dar vienas yra kitas, jei. 466 00:27:17,496 --> 00:27:21,440 Taigi, tai bus x lygus lygus, pavyzdžiui. 467 00:27:21,440 --> 00:27:24,190 468 00:27:24,190 --> 00:27:26,350 Ir tada aš ruošiuosi grįžti kažką čia. 469 00:27:26,350 --> 00:27:29,490 >> Atkreipkite dėmesį, kad yra du skirtingi viskas čia, kad vyksta. 470 00:27:29,490 --> 00:27:34,360 Vienas iš jų yra, kad čia aš nurodant grįžti vertės tiesa. 471 00:27:34,360 --> 00:27:35,950 Čia aš tiesiog pasakyti, x. 472 00:27:35,950 --> 00:27:39,970 Taigi R paprastai pagal nutylėjimą imtis paskutinį arguments-- 473 00:27:39,970 --> 00:27:43,510 arba imtis paskutinę eilutę kodą, ir kad bus ką jis grįžo. 474 00:27:43,510 --> 00:27:46,920 Taigi čia tai yra tas pats dalyko, kaip daro grąžinimo data. 475 00:27:46,920 --> 00:27:49,450 476 00:27:49,450 --> 00:27:50,540 >> Ir tik parodyti jums. 477 00:27:50,540 --> 00:27:54,000 478 00:27:54,000 --> 00:27:57,052 Ir tada ji veiks tik patinka. 479 00:27:57,052 --> 00:27:58,260 Taigi leiskite man toliau tai. 480 00:27:58,260 --> 00:28:00,630 >> Taigi kitas, jei. 481 00:28:00,630 --> 00:28:04,060 Ir tikrai, aš galiu grįžti ką aš norėčiau. 482 00:28:04,060 --> 00:28:06,680 Taigi, aš net ne turi grąžinimo loginę visą laiką, 483 00:28:06,680 --> 00:28:08,410 Galiu tik grąžinti ką nors kita. 484 00:28:08,410 --> 00:28:10,670 Taigi aš galiu padaryti grąžinimo lokys. 485 00:28:10,670 --> 00:28:12,989 >> Taigi, jei x yra lygus lygus, jis ketina grįžti lokys. 486 00:28:12,989 --> 00:28:14,530 Priešingu atveju, jis ketina grįžti tiesa. 487 00:28:14,530 --> 00:28:19,310 Taip pat galiu padaryti vektorių ar tikrai nieko. 488 00:28:19,310 --> 00:28:22,210 >> Ir paprastai statiškai įvedėte kalbos, 489 00:28:22,210 --> 00:28:23,840 jūs turite nurodyti rūšį čia. 490 00:28:23,840 --> 00:28:25,750 Ir pranešimas, kad ji gali būti tik ką. 491 00:28:25,750 --> 00:28:32,400 Ir R yra pakankamai protinga, kad ją tiesiog tai padaryti ir jis veiks gerai. 492 00:28:32,400 --> 00:28:33,620 >> Taigi leiskite man apibrėžti tai. 493 00:28:33,620 --> 00:28:39,460 494 00:28:39,460 --> 00:28:41,230 Unexpected-- oh atsiprašau. 495 00:28:41,230 --> 00:28:44,336 Ji turėtų būti garbanotas petnešomis čia. 496 00:28:44,336 --> 00:28:44,836 Gerai. 497 00:28:44,836 --> 00:28:45,336 Nemokama. 498 00:28:45,336 --> 00:28:52,580 499 00:28:52,580 --> 00:28:54,530 Gerai. 500 00:28:54,530 --> 00:28:58,250 Taigi, dabar tegul palyginti 3 ir lygus 3. 501 00:28:58,250 --> 00:29:01,860 Taigi jis turėtų return-- yeah-- vertės lokys. 502 00:29:01,860 --> 00:29:06,740 >> Taigi dabar bendresnis dalykas yra kaip ką apie kitų duomenų struktūras. 503 00:29:06,740 --> 00:29:09,110 Taigi, jūs turite šią funkciją. 504 00:29:09,110 --> 00:29:15,360 Tai vyksta dirbti bet kokio pobūdžio vertės kaip 3 ar skaitmeninis, 505 00:29:15,360 --> 00:29:17,500 Kitaip tariant, du kartus. 506 00:29:17,500 --> 00:29:19,330 >> Bet kas apie kažką panašaus į vektorių. 507 00:29:19,330 --> 00:29:27,750 Taigi, kas atsitiks, jei do-- todėl aš ketina priskirti val, tarkim, 4 ir 6. 508 00:29:27,750 --> 00:29:31,640 Taigi, jei aš grįžti tai šis yra nuo 4, 5, 6 vektorius. 509 00:29:31,640 --> 00:29:34,935 >> Dabar pažiūrėkime, kas atsitinka, jei aš bounded.compare val. 510 00:29:34,935 --> 00:29:37,680 511 00:29:37,680 --> 00:29:42,450 Taigi, tai yra norėčiau duoti jums 15 1251. 512 00:29:42,450 --> 00:29:46,440 Taigi, kitaip tariant, tai sakydamas jei peržvelgsite šią sąlygą 513 00:29:46,440 --> 00:29:50,040 todėl sako x yra mažiau nei ar kažką. 514 00:29:50,040 --> 00:29:51,880 Taigi, tai yra šiek tiek paini, nes dabar 515 00:29:51,880 --> 00:29:53,379 jūs tiesiog nežinote, kas vyksta. 516 00:29:53,379 --> 00:29:58,690 Taigi, manau, vienas dalykas, kad tikrai gerai apie tiesiog bando derinti 517 00:29:58,690 --> 00:30:04,600 yra tai, kad jūs galite tiesiog padaryti val didesnis nei ir pamatyti, kas atsitiks ten. 518 00:30:04,600 --> 00:30:09,720 >> Taigi val-- pagal nutylėjimą yra 5 panašiai tegul tiesiog VAL didesnis nei 5. 519 00:30:09,720 --> 00:30:14,280 Taigi tai yra vektorius klaidingas klaidingas tiesa. 520 00:30:14,280 --> 00:30:17,206 Taigi dabar, kai jūs ieškote tai, ketina pasakyti, jei 521 00:30:17,206 --> 00:30:20,080 ir tada jis ketina duoti jums tai yra klaidingas klaidingas vektorius tiesa. 522 00:30:20,080 --> 00:30:23,450 >> Taigi, kai pereisite į R, R tai neturi jokios idėjos, ką jūs darote. 523 00:30:23,450 --> 00:30:26,650 Nes ji tikisi vieną vertė, kuri yra Būlio, ir dabar 524 00:30:26,650 --> 00:30:29,420 jūs suteikiant jai apie loginę vektorių. 525 00:30:29,420 --> 00:30:31,970 Taigi pagal nutylėjimą, R yra tik ketinate pasakyti ką gi, 526 00:30:31,970 --> 00:30:35,440 Aš ruošiuosi daryti prielaidą, kad jūs esate ketina imtis pirmąjį elementą čia. 527 00:30:35,440 --> 00:30:38,320 Taigi, aš ruošiuosi say-- aš ruošiuosi daryti prielaidą, kad tai yra neteisinga. 528 00:30:38,320 --> 00:30:40,890 Taigi jis ketina pasakyti ne, tai nėra teisinga. 529 00:30:40,890 --> 00:30:45,246 >> Be to, jis ketina būti Val lygus lygus. 530 00:30:45,246 --> 00:30:47,244 Ne, atsiprašau 5. 531 00:30:47,244 --> 00:30:48,910 Ir jis taip pat bus klaidinga, taip pat. 532 00:30:48,910 --> 00:30:52,410 Taigi jis ketina pasakyti "ne", tai ne tiesa, taip pat todėl 533 00:30:52,410 --> 00:30:53,680 ketina grįžti į šį paskutinį vieną. 534 00:30:53,680 --> 00:30:56,420 535 00:30:56,420 --> 00:31:01,360 >> Taigi tai yra tiek geras dalykas ar blogas dalykas, priklausomai nuo to, kaip jūs jį peržiūrėti. 536 00:31:01,360 --> 00:31:05,104 Nes kai esate kurti šias funkcijas, 537 00:31:05,104 --> 00:31:06,770 jūs neturite iš tikrųjų žino, kas vyksta. 538 00:31:06,770 --> 00:31:10,210 Taigi kartais jūs norėtumėte klaidą, o gal tiesiog norite įspėjimą. 539 00:31:10,210 --> 00:31:12,160 Šiuo atveju, R nėra padaryti, kad. 540 00:31:12,160 --> 00:31:14,300 Taigi tai tikrai ne Jūs pagrįsta ne kas 541 00:31:14,300 --> 00:31:17,310 manote kalbą turėtų daryti šiuo atveju 542 00:31:17,310 --> 00:31:22,920 jei vežami iš loginę vektoriaus kai jūs darote, jei sąlyga. 543 00:31:22,920 --> 00:31:31,733 >> Taigi tarkime, kad jūs turėjote originalus viena, jei dar grąžina true, ir jūs 544 00:31:31,733 --> 00:31:34,190 ketina grįžti FALSE. 545 00:31:34,190 --> 00:31:39,300 Taigi vienas iš būdų atsiribotų tai yra pasakyti, I 546 00:31:39,300 --> 00:31:41,530 net nereikia šį sąlyginį dalyką. 547 00:31:41,530 --> 00:31:47,220 Kitas dalykas, aš galiu padaryti, tai tiesiog grąžinimo patys vertybes. 548 00:31:47,220 --> 00:31:53,240 Taigi, jei pastebėjote, jei jūs do val yra didesnis nei 5, 549 00:31:53,240 --> 00:31:56,350 tai vyksta grįžti vektorius klaidingas klaidingas tiesa. 550 00:31:56,350 --> 00:31:58,850 >> Gal tai, ką nori už bounded.compare. 551 00:31:58,850 --> 00:32:02,940 Jūs norite grįžti į loginę vektorių kur ji palygina kiekviena iš reikšmių 552 00:32:02,940 --> 00:32:04,190 sau. 553 00:32:04,190 --> 00:32:11,165 Taigi, galite tiesiog bounded.compare funkcija x, lygus 5. 554 00:32:11,165 --> 00:32:13,322 555 00:32:13,322 --> 00:32:15,363 Ir tada užuot tai, jei dar sąlyga, 556 00:32:15,363 --> 00:32:21,430 Aš tik ketina grįžti x yra didesnis nei 5. 557 00:32:21,430 --> 00:32:23,620 Taigi, jei tai tiesa, tada jis ketina grįžti tiesa. 558 00:32:23,620 --> 00:32:26,830 Ir tada, jei tai ne, tai ketina grįžti FALSE. 559 00:32:26,830 --> 00:32:30,880 >> Ir tai bus dirbti bet kuris iš šių struktūrų. 560 00:32:30,880 --> 00:32:41,450 Taigi aš galiu bounded.compare C1 6 arba 9 ir tada aš ruošiuosi pasakyti lygus 6, 561 00:32:41,450 --> 00:32:42,799 Pavyzdžiui. 562 00:32:42,799 --> 00:32:44,840 Ir tada jis ketina Jums tinkamą Būlio 563 00:32:44,840 --> 00:32:48,240 vektorius, kad jūs kuriate. 564 00:32:48,240 --> 00:32:50,660 >> Taigi tie, kurie vos funkcijos o dabar leiskite man tiesiog 565 00:32:50,660 --> 00:32:54,980 parodyti jums keletą interaktyvių vizualizacijomis. 566 00:32:54,980 --> 00:32:59,700 Aš nemanau, kad aš iš tikrųjų turi "Wi-Fi" čia todėl leiskite man tiesiog eiti į priekį 567 00:32:59,700 --> 00:33:01,970 ir praleisti šį vieną I guess. 568 00:33:01,970 --> 00:33:05,260 >> Tačiau vienas dalykas, kad kietas nors tai, kad, jei jūs tiesiog 569 00:33:05,260 --> 00:33:09,600 norite išbandyti krūva skirtingų duomenų komandas, 570 00:33:09,600 --> 00:33:13,320 yra iš skirtingų duomenų rinkinių krūva kad jau pakrautų į R. 571 00:33:13,320 --> 00:33:15,770 Taigi, vienas iš jų yra vadinamas rainelės duomenų rinkinys. 572 00:33:15,770 --> 00:33:18,910 Tai yra viena iš labiausiai žinomų tie mašininio mokymosi. 573 00:33:18,910 --> 00:33:23,350 Jūs paprastai tik padaryti kažkokia bandymų atvejus, norėdami pamatyti, jei jūsų kodas veikia. 574 00:33:23,350 --> 00:33:27,520 Taigi tegul tiesiog patikrinti, kas rainelė. 575 00:33:27,520 --> 00:33:33,130 >> Taigi šis dalykas vyksta būti duomenų rėmo. 576 00:33:33,130 --> 00:33:36,000 Ir tai tipo ilgai, nes Aš tiesiog atspausdinti rainelę. 577 00:33:36,000 --> 00:33:38,810 Tai spausdinti visą dalykas. 578 00:33:38,810 --> 00:33:42,830 Taigi ji turi visas šias skirtingas pavardes. 579 00:33:42,830 --> 00:33:45,505 Taigi rainelė kolekcija Skirtingų gėlės. 580 00:33:45,505 --> 00:33:48,830 Šiuo atveju, tai sakau užtikrina jums jį rūšys, 581 00:33:48,830 --> 00:33:54,760 Visi šie skirtingų pločių ir ilgių Sepal ir vainiklapis. 582 00:33:54,760 --> 00:33:58,880 >> Ir taip paprastai, jei norite spausdinti rainelę, 583 00:33:58,880 --> 00:34:03,680 Pavyzdžiui, jūs nenorite, kad jis būtų visa tai, nes tai gali perimti 584 00:34:03,680 --> 00:34:05,190 Visa jūsų konsolės. 585 00:34:05,190 --> 00:34:09,280 Taigi vienas dalykas, kad tikrai gražus yra galva funkcija. 586 00:34:09,280 --> 00:34:12,929 Taigi, jei jūs tiesiog padaryti galvą Iris, tai suteiks jums 587 00:34:12,929 --> 00:34:17,389 Pirmieji penki eilutės, arba šešių I guess. 588 00:34:17,389 --> 00:34:19,909 Ir tada gerai, jums galite tiesiog nurodyti čia. 589 00:34:19,909 --> 00:34:22,914 Taigi 20-- tai duos Jūs pirmieji 20 eilutės. 590 00:34:22,914 --> 00:34:24,830 Ir aš iš tikrųjų buvo natūra nustebino, kad ši 591 00:34:24,830 --> 00:34:28,770 man šešių todėl leiskite man eiti į priekį ir patikrinkite iris-- arba galvą, atsiprašau. 592 00:34:28,770 --> 00:34:31,699 593 00:34:31,699 --> 00:34:34,960 Ir čia jis duos Jūs dokumentacija 594 00:34:34,960 --> 00:34:37,960 kas vertė vadovas daro. 595 00:34:37,960 --> 00:34:40,839 Taigi jis grįžta pirmas arba paskutinis objektas. 596 00:34:40,839 --> 00:34:42,630 Ir tada aš ruošiuosi pažvelgti į pradinę padėtį. 597 00:34:42,630 --> 00:34:47,340 Ir tada ji sako nutylėjimą metodas vadovas X ir n yra lygus 6L. 598 00:34:47,340 --> 00:34:50,620 Taigi, tai grįžta pirmuosius šešis elementus. 599 00:34:50,620 --> 00:34:55,050 Ir panašiai, jei pastebėsite čia, aš neturėjo nurodyti, n yra lygus 6. 600 00:34:55,050 --> 00:34:56,840 Pagal nutylėjimą ji naudoja šešių, I guess. 601 00:34:56,840 --> 00:35:00,130 Ir tada, jei noriu patikslinti tam tikras vertė, tada aš gali peržiūrėti, kad taip pat. 602 00:35:00,130 --> 00:35:02,970 603 00:35:02,970 --> 00:35:10,592 >> Taigi, kad yra keletas paprastų komandų ir čia dar vienas, kad just-- gerai, 604 00:35:10,592 --> 00:35:12,550 Aš can-- iš tikrųjų tai yra šiek tiek daugiau sudėtinga, 605 00:35:12,550 --> 00:35:17,130 bet tai tiesiog klasę Kiekvieno rainelės rinkinį kolonėlę. 606 00:35:17,130 --> 00:35:20,910 Taigi, tai jums parodysiu, ką kiekvienas iš jų stulpeliai yra požiūriu jų tipus. 607 00:35:20,910 --> 00:35:23,665 Taigi SEPAL ilgis yra skaitmeninis, SEPAL plotis yra skaitmeninis. 608 00:35:23,665 --> 00:35:26,540 Visos šios vertės yra tik skaitmeninis nes galite pasakyti iš šio duomenų 609 00:35:26,540 --> 00:35:29,440 struktūruoti tai yra visi ketina skaitmeninis. 610 00:35:29,440 --> 00:35:34,310 >> Ir Rūšis kolonėlės bus veiksnys. 611 00:35:34,310 --> 00:35:37,270 Taigi paprastai, jūs manote, kad tai yra, kaip simbolių eilutę. 612 00:35:37,270 --> 00:35:48,830 Tačiau, jei jūs tiesiog padaryti irisSpecies, ir tada aš ruošiuosi daryti galvą 5, 613 00:35:48,830 --> 00:35:51,820 ir tai vyksta spausdinti iš pirmųjų penkių verčių. 614 00:35:51,820 --> 00:35:54,150 >> Ir tada pastebėsite šiuos lygius. 615 00:35:54,150 --> 00:35:58,870 Taigi tai yra saying-- tai R "būdas turėti kategoriški kintamuosius. 616 00:35:58,870 --> 00:36:03,765 Taigi, o ne tik turintys simbolių eilutes, 617 00:36:03,765 --> 00:36:06,740 ji turi lygiai nurodant kuris iš šių dalykų yra. 618 00:36:06,740 --> 00:36:12,450 >> Taigi tarkime irisSpecies 1. 619 00:36:12,450 --> 00:36:17,690 Taigi, ką jūs norite daryti čia yra aš Skaidymo į šios rūšies skiltyje. 620 00:36:17,690 --> 00:36:21,480 Taigi tai užtrunka Rūšis kolonėlės ir tada 621 00:36:21,480 --> 00:36:23,820 IT indeksai gauti pirmąjį elementą. 622 00:36:23,820 --> 00:36:27,140 Taigi, tai turėtų suteikti jums setosa. 623 00:36:27,140 --> 00:36:28,710 Ir jis taip pat suteikia jums lygius čia. 624 00:36:28,710 --> 00:36:32,812 >> Taigi jūs galite palyginti tai simbolių setosa 625 00:36:32,812 --> 00:36:34,645 ir tai nebus kad būtų tiesa, nes vienas 626 00:36:34,645 --> 00:36:37,940 yra kitokio tipo nei kitos. 627 00:36:37,940 --> 00:36:40,590 Arba aš manau, kad jis yra tiesa, nes R yra daugiau pažangių nei tai. 628 00:36:40,590 --> 00:36:45,420 Ir atrodo ne tai, o tada sako, gal tai, ko norite. 629 00:36:45,420 --> 00:36:51,860 Taigi jis ketina pasakyti simbolį styginių setosa yra toks pat, kaip šis. 630 00:36:51,860 --> 00:37:01,290 Ir tada panašiai, galite taip pat tik patraukti juos kaip pan. 631 00:37:01,290 --> 00:37:05,580 >> Taigi tai tik kažkokia greitai komandas iš rinkinio. 632 00:37:05,580 --> 00:37:08,030 Taigi čia kai duomenys žvalgyba. 633 00:37:08,030 --> 00:37:11,360 Taigi, tai yra šiek tiek daugiau dalyvauja su duomenų analizę. 634 00:37:11,360 --> 00:37:18,340 Ir šis yra paimtas iš kai Bootcamp R už Berkeley. 635 00:37:18,340 --> 00:37:20,790 >> Taigi biblioteka užsienio. 636 00:37:20,790 --> 00:37:24,880 Taigi, aš ruošiuosi įkelti į biblioteka, vadinama užsienio. 637 00:37:24,880 --> 00:37:32,460 Taigi, tai ketina duoti man read.dta taip manyti, kad turiu šį rinkinį. 638 00:37:32,460 --> 00:37:39,000 Šis yra saugomi srovė darbo katalogą mano konsolėje. 639 00:37:39,000 --> 00:37:42,190 Taigi tegul tiesiog pamatyti, kas darbo katalogą. 640 00:37:42,190 --> 00:37:44,620 >> Taigi čia mano darbinis katalogas. 641 00:37:44,620 --> 00:37:50,040 Ir skaityti dot duomenys, dalykas, sako šį failą 642 00:37:50,040 --> 00:37:54,650 yra duomenų aplanką Ši srovė darbo katalogas. 643 00:37:54,650 --> 00:38:00,520 Ir read.dta tai ne komanda nutylėjimą. 644 00:38:00,520 --> 00:38:02,760 Spėju, kad pakrautas jį jau. 645 00:38:02,760 --> 00:38:04,750 IEI prielaida aš pakrauta tai jau. 646 00:38:04,750 --> 00:38:08,115 >> Bet taip read.dta nesiruošia būti pagal nutylėjimą komanda. 647 00:38:08,115 --> 00:38:11,550 Ir štai kodėl jūs ketinate turėti įkelti į šį bibliotekoje package-- 648 00:38:11,550 --> 00:38:14,500 šis paketas vadinamas užsienio. 649 00:38:14,500 --> 00:38:16,690 Ir jei jūs neturite paketas, manau, 650 00:38:16,690 --> 00:38:19,180 Užsienio yra vienas iš built-in aktuose. 651 00:38:19,180 --> 00:38:31,150 Priešingu atveju, jūs taip pat galite padaryti install.packages 652 00:38:31,150 --> 00:38:33,180 ir tai bus įdiegti paketą. 653 00:38:33,180 --> 00:38:36,878 Ir tai jums duos R. Uh, ne. 654 00:38:36,878 --> 00:38:39,830 655 00:38:39,830 --> 00:38:43,140 Ir tada aš tik ketina nutraukti tai, nes aš jau turiu ją. 656 00:38:43,140 --> 00:38:46,920 >> Bet kas tikrai malonu apie R yra tai, kad pakuotės valdymo 657 00:38:46,920 --> 00:38:48,510 sistema yra labai elegantiška. 658 00:38:48,510 --> 00:38:52,470 Nes jis bus laikyti viską tikrai gražiai už jus. 659 00:38:52,470 --> 00:38:59,780 Taigi šiuo atveju, jis ketina laikyti jį, manau, ši biblioteka čia. 660 00:38:59,780 --> 00:39:02,390 >> Taigi bet kuriuo metu norite įdiegti naujus paketus, 661 00:39:02,390 --> 00:39:04,980 tai tiesiog taip paprasta, kaip daro install.packages 662 00:39:04,980 --> 00:39:07,500 ir R valdys visas už jus paketai. 663 00:39:07,500 --> 00:39:12,900 Taigi jūs neturite daryti kažką Python, kur jūs turite išorinį paketą 664 00:39:12,900 --> 00:39:15,330 vadovai, pavyzdžiui, popieriaus Anakonda, kur esate 665 00:39:15,330 --> 00:39:18,310 doing-- įdiegsite paketai ne Python 666 00:39:18,310 --> 00:39:20,940 ir tada bandote paleisti patys. 667 00:39:20,940 --> 00:39:22,210 Taigi tai tikrai gražus būdas. 668 00:39:22,210 --> 00:39:25,590 >> Ir install.packages reikalauja interneto. 669 00:39:25,590 --> 00:39:31,950 Tai trunka jį iš serverio ir saugykla kad 670 00:39:31,950 --> 00:39:33,960 surenka visi paketai yra vadinamas Cran. 671 00:39:33,960 --> 00:39:40,690 Ir jūs galite nurodyti kokios rūšies veidrodis norite atsisiųsti paketais. 672 00:39:40,690 --> 00:39:43,420 >> Taigi čia aš pradėdami vartoti šį rinkinį. 673 00:39:43,420 --> 00:39:46,240 Skaitau jį naudojant šią funkciją. 674 00:39:46,240 --> 00:39:49,360 Taigi leiskite man eiti į priekį ir daryti. 675 00:39:49,360 --> 00:39:52,900 >> Taigi tarkime, kad turite šią rinkinį 676 00:39:52,900 --> 00:39:55,550 ir jūs turite absoliučiai Neįsivaizduoju, kas tai yra. 677 00:39:55,550 --> 00:39:58,560 Ir tai iš tikrųjų ateina gana dažnai pramonėje 678 00:39:58,560 --> 00:40:00,910 kur jūs tiesiog turite tai tonų ir tonų nepatogus dalykų 679 00:40:00,910 --> 00:40:02,890 ir jie neįtikėtinai etiketė. 680 00:40:02,890 --> 00:40:06,380 Taigi čia aš turiu tai rinkinys, ir aš nežinau 681 00:40:06,380 --> 00:40:08,400 kas tai yra, kad aš tiesiog rodo, check it out. 682 00:40:08,400 --> 00:40:10,620 >> Taigi, aš ruošiuosi daryti galvos pirmasis. 683 00:40:10,620 --> 00:40:14,190 Taigi, aš patikrinti pirmuosius šešis kolonos, ką šis rinkinys yra. 684 00:40:14,190 --> 00:40:21,730 Taigi tai yra valstybė, pres04, tada Visų šių skirtingų rūšiuoti stulpelių. 685 00:40:21,730 --> 00:40:25,612 Ir kas įdomu Čia, manau, yra tai, kad jums 686 00:40:25,612 --> 00:40:27,945 būtų manyti, kad tai atrodo kaip kai kurie rinkimų rūšiuoti. 687 00:40:27,945 --> 00:40:30,482 688 00:40:30,482 --> 00:40:32,190 Ir aš manau, tik iš žiūri į failą 689 00:40:32,190 --> 00:40:41,070 pavadinimas tai kai surinkimo rūšiuoti Duomenų apie kandidatų arba rinkėjų 690 00:40:41,070 --> 00:40:44,920 kurie balsavo už konkrečių prezidentai pirmininkas arba kandidatai 691 00:40:44,920 --> 00:40:46,550 2004 rinkimus. 692 00:40:46,550 --> 00:40:52,920 >> Taigi čia yra vertės 1, 2 Taigi vienas iš būdų saugoti 693 00:40:52,920 --> 00:40:56,540 Pirmininkas kandidatai jų vardai. 694 00:40:56,540 --> 00:40:59,780 Šiuo atveju, atrodo, jie tiesiog sveikąsias reikšmes. 695 00:40:59,780 --> 00:41:04,030 Taigi 2004 metais, tai buvo Bušas prieš Kerry manau. 696 00:41:04,030 --> 00:41:09,010 Ir dabar, tarkime, jūs tiesiog nežinau ar 1 atitinka Bush arba 2 697 00:41:09,010 --> 00:41:11,703 atitinka Kerry ar ir tt ir tt, tiesa? 698 00:41:11,703 --> 00:41:15,860 >> Ir tai, tik man, gana dažna problema. 699 00:41:15,860 --> 00:41:18,230 Taigi, ką jūs galite padaryti šiuo atveju? 700 00:41:18,230 --> 00:41:20,000 Taigi leiskite patikrinti visus šiuos kitus dalykus. 701 00:41:20,000 --> 00:41:22,790 >> valstybė, aš darant prielaidą, tai ateina iš skirtingų valstybių narių. 702 00:41:22,790 --> 00:41:25,100 partyid pajamos. 703 00:41:25,100 --> 00:41:27,710 Pažvelkime partyid. 704 00:41:27,710 --> 00:41:32,800 Tai gal vienas dalykas, kurį galite padaryti, tai pažvelgti kiekvienas pastabas 705 00:41:32,800 --> 00:41:36,250 kad turime respublikonų partyid ar demokratas ar kažką. 706 00:41:36,250 --> 00:41:38,170 Taigi tegul tiesiog pažvelgti, kas partyid yra. 707 00:41:38,170 --> 00:41:41,946 >> Taigi, aš ruošiuosi imtis Dat ir tada aš ruošiuosi 708 00:41:41,946 --> 00:41:47,960 tai padaryti dolerio ženklas operatorius, kad aš anksčiau 709 00:41:47,960 --> 00:41:50,770 ir tai vyksta subset to skiltyje. 710 00:41:50,770 --> 00:41:57,760 Ir tada aš ruošiuosi į galvą tai 20, tik pamatyti, ką tai atrodo. 711 00:41:57,760 --> 00:42:00,170 >> Taigi tai tik nano krūva. 712 00:42:00,170 --> 00:42:02,800 Taigi, kitaip tariant, jūs turite trūkstamų duomenų apie šių vaikinai. 713 00:42:02,800 --> 00:42:08,100 Bet jūs taip pat pastebėsite, tai Dat partyid yra veiksnys, 714 00:42:08,100 --> 00:42:10,030 todėl tai suteikia jums įvairių kategorijų. 715 00:42:10,030 --> 00:42:14,170 Taigi, kitaip tariant, partyid gali priimti Demokratas, Respublikinė, nepriklausoma, 716 00:42:14,170 --> 00:42:16,640 ar kažkas kitas. 717 00:42:16,640 --> 00:42:23,940 >> Taigi eikime į priekį ir tegul pamatyti, kuris iš jų is-- oh, gerai. 718 00:42:23,940 --> 00:42:28,480 Taigi, aš ruošiuosi subset į partyid ir tada 719 00:42:28,480 --> 00:42:32,780 pažvelgti, kurie iš jų yra Democrat, pavyzdžiui. 720 00:42:32,780 --> 00:42:37,150 Tai ketina duoti jums Būlio, didžiulis Būlio iš TRUEs ir FALSEs. 721 00:42:37,150 --> 00:42:41,630 >> Ir dabar, tarkim noriu į subset šių vaikinai. 722 00:42:41,630 --> 00:42:47,260 Taigi, tai ketina imtis savo dat ir poaibis, kad priklausomai nuo to, pastabos 723 00:42:47,260 --> 00:42:48,910 turi partyid kaip lygių lygi demokratų. 724 00:42:48,910 --> 00:42:52,830 725 00:42:52,830 --> 00:42:55,180 Ir tai yra gana ilgas, nes ten tiek daug iš jų. 726 00:42:55,180 --> 00:42:59,060 Taigi, dabar aš ruošiuosi į galvą tai 20. 727 00:42:59,060 --> 00:43:05,690 728 00:43:05,690 --> 00:43:11,270 >> Ir kaip jūs pastebėjote, kaip lygių lygi yra įdomus tuo, kad esate 729 00:43:11,270 --> 00:43:13,250 already-- jūs taip pat įskaitant NAS. 730 00:43:13,250 --> 00:43:19,010 Taigi šiuo atveju, jūs vis dar negali gauti bet kokia informacija, nes dabar jūs turite NAS 731 00:43:19,010 --> 00:43:22,650 ir jūs tiesiog norite pamatyti, kuris iš stebėjimas atitinka demokratų 732 00:43:22,650 --> 00:43:24,670 o ne tai trūkstamas reikšmes patys. 733 00:43:24,670 --> 00:43:27,680 Taigi, kaip jūs atsikratyti šių NA? 734 00:43:27,680 --> 00:43:36,410 >> Taigi čia aš tik naudojant iki rakto ant mano žymeklį ir tada sako juda. 735 00:43:36,410 --> 00:43:39,778 Ir tada čia aš tik ketina pasakyti is.na datpartyid. 736 00:43:39,778 --> 00:43:48,970 737 00:43:48,970 --> 00:43:52,720 Taigi tai ir ir imsis du skirtingi Būlio vektoriai 738 00:43:52,720 --> 00:43:57,160 ir pasakyti, kad tai bus TRUE ir FALSE, pvz. 739 00:43:57,160 --> 00:43:59,190 Taigi jis ketina padaryti šį komponentą-protingas. 740 00:43:59,190 --> 00:44:02,910 Taigi čia aš sakau imk duomenų rėmas, subset 741 00:44:02,910 --> 00:44:10,170 į tuos, kurie atitinka demokratų, ir pašalinti bet kurį iš jų, kurie yra ne NP. 742 00:44:10,170 --> 00:44:13,540 >> Taigi tai will-- turėtų suteikti jums kažką. 743 00:44:13,540 --> 00:44:16,540 744 00:44:16,540 --> 00:44:17,600 Pažiūrėkime is.na. 745 00:44:17,600 --> 00:44:24,670 746 00:44:24,670 --> 00:44:27,690 Pabandykime is.na datpartyid. 747 00:44:27,690 --> 00:44:36,290 748 00:44:36,290 --> 00:44:45,290 Ir tai turėtų suteikti you-- sorry-- tik Būlio vektorių. 749 00:44:45,290 --> 00:44:49,260 Ir tada, nes jis taip ilgai, Aš ruošiuosi subset 20. 750 00:44:49,260 --> 00:44:49,760 Gerai. 751 00:44:49,760 --> 00:44:51,570 Taigi tai turėtų veikti. 752 00:44:51,570 --> 00:44:54,700 >> Ir tai vienas bus TRUEs. 753 00:44:54,700 --> 00:45:01,830 Ak, taip, mano klaida, kad čia yra I'm-- aš naudoti C ++ ir R sinonimiškai, todėl aš padaryti 754 00:45:01,830 --> 00:45:03,590 ši klaida visą laiką. 755 00:45:03,590 --> 00:45:05,807 Ir operatorius iš tikrųjų vienas norite. 756 00:45:05,807 --> 00:45:08,140 Jūs nenorite naudoti du jungimo ženklus, tik vieną. 757 00:45:08,140 --> 00:45:14,970 758 00:45:14,970 --> 00:45:17,010 Gerai. 759 00:45:17,010 --> 00:45:18,140 >> Taigi pažiūrėkime. 760 00:45:18,140 --> 00:45:20,930 761 00:45:20,930 --> 00:45:23,920 Taigi, mes subsetted į partyid kur jie demokratas 762 00:45:23,920 --> 00:45:25,300 ir jie nėra trūkstamų verčių. 763 00:45:25,300 --> 00:45:27,690 O dabar pažvelkime į tuos, kurie balsavo už. 764 00:45:27,690 --> 00:45:31,530 Taigi atrodo, kad dauguma iš jų balsavo už 1 d. 765 00:45:31,530 --> 00:45:36,090 Taigi, aš ruošiuosi eiti į priekį ir pasakyti, kad yra Kerry. 766 00:45:36,090 --> 00:45:39,507 >> Ir panašiai, galite taip pat eiti į respublikonų 767 00:45:39,507 --> 00:45:41,090 ir tikiuosi, tai turėtų suteikti jums 2. 768 00:45:41,090 --> 00:45:49,730 769 00:45:49,730 --> 00:45:51,770 Tai tiesiog iš skirtingų stulpelių krūva. 770 00:45:51,770 --> 00:45:53,070 Ir iš tiesų, tai 2. 771 00:45:53,070 --> 00:45:55,750 Taigi partyid visą respublikonų, dauguma jų balsuoja už 2. 772 00:45:55,750 --> 00:45:58,390 >> Taigi atrodo, kad tik žiūri tai, 773 00:45:58,390 --> 00:46:00,600 Respublikonų bus very-- arba partyid 774 00:46:00,600 --> 00:46:02,790 bus labai didelis veiksnys, lemiantis 775 00:46:02,790 --> 00:46:05,420 kuris kandidatas jie ketina balsuoti už. 776 00:46:05,420 --> 00:46:07,120 Ir tai, žinoma tiesa apskritai. 777 00:46:07,120 --> 00:46:10,139 Ir tai atitinka jūsų intuicija, žinoma. 778 00:46:10,139 --> 00:46:11,930 Taigi atrodo, kad aš bėga laikas, kad 779 00:46:11,930 --> 00:46:17,040 leiskite man tiesiog reikia eiti į priekį ir parodyti keletą greitų vaizdų. 780 00:46:17,040 --> 00:46:21,120 Taigi čia kažkas, kad yra šiek tiek daugiau sudėtinga su vizualizacija. 781 00:46:21,120 --> 00:46:26,450 Taigi, šiuo atveju, tai yra labai paprasta analizė tiesiog patikrinti, kas 782 00:46:26,450 --> 00:46:28,500 nuo '04 prezidentas. 783 00:46:28,500 --> 00:46:33,920 >> Taigi šiuo atveju, tarkim jus norėjau atsakyti į šį klausimą. 784 00:46:33,920 --> 00:46:38,540 Taigi manau, mes norėjome sužinoti balsavimo elgesys 2004 prezidento rinkimus 785 00:46:38,540 --> 00:46:41,170 ir kaip, kad priklauso nuo rasės. 786 00:46:41,170 --> 00:46:44,380 Taigi ne tik jūs norite matyti balsavimo elgesį, 787 00:46:44,380 --> 00:46:47,860 tačiau norite sutrumpinti kiekvieną rasės ir tarsi apibendrina, kad. 788 00:46:47,860 --> 00:46:50,770 Ir jūs galite tik pasakyti, šio sudėtingo žymėjimo 789 00:46:50,770 --> 00:46:52,580 kad tai yra natūra gauti miglotas. 790 00:46:52,580 --> 00:46:56,390 >> Taigi, viena iš daugiau pažangiosios R paketai, taip pat rūšies neseniai 791 00:46:56,390 --> 00:47:00,070 vadinamas dplyr. 792 00:47:00,070 --> 00:47:03,060 Taigi tai viena čia. 793 00:47:03,060 --> 00:47:08,080 Ir ggg-- ggplot2 yra tik gražus būdas tai geriau vizualizacijas 794 00:47:08,080 --> 00:47:09,400 nei pastatytas-viename. 795 00:47:09,400 --> 00:47:11,108 >> Taigi, aš ruošiuosi įkelti šios dvi bibliotekos. 796 00:47:11,108 --> 00:47:13,200 797 00:47:13,200 --> 00:47:16,950 Ir tada aš ruošiuosi eiti į priekį ir paleisti šią komandą. 798 00:47:16,950 --> 00:47:19,050 Jūs galite tiesiog laikyti tai juodosios dėžės. 799 00:47:19,050 --> 00:47:23,460 >> Kas vyksta, kad tai vamzdžio operatorius artimųjų šiame argumente 800 00:47:23,460 --> 00:47:24,110 į čia. 801 00:47:24,110 --> 00:47:28,070 Taigi aš sakau grupę Dat rasės ir tada prezidentas 04. 802 00:47:28,070 --> 00:47:31,530 Ir tada, visi šie kitas komandas yra filtravimo ir tada apibendrinant 803 00:47:31,530 --> 00:47:34,081 kur aš darau skaičių ir tada aš pasuko jį čia. 804 00:47:34,081 --> 00:47:39,980 805 00:47:39,980 --> 00:47:42,500 Gerai kietas. 806 00:47:42,500 --> 00:47:44,620 Taigi eikime į priekį ir pamatyti, kas tai atrodo. 807 00:47:44,620 --> 00:47:52,280 808 00:47:52,280 --> 00:47:57,290 >> Taigi, kas vyksta čia, yra tai, kad aš tiesiog nubrėžta kiekviena iš lenktynėse ir po to 809 00:47:57,290 --> 00:47:59,670 tuos, kurie balsavo už. 810 00:47:59,670 --> 00:48:03,492 Ir tai du skirtingi reikšmės atitinka 2 ir 1. 811 00:48:03,492 --> 00:48:05,325 Jei norite būti daugiau Elegantiškas, taip pat galite 812 00:48:05,325 --> 00:48:11,770 tik nurodo, kad 2 yra Kerry-- arba 2 yra Bušas, o tada 1 yra Kerry. 813 00:48:11,770 --> 00:48:13,700 Ir jūs taip pat gali turėti kad savo legendą. 814 00:48:13,700 --> 00:48:17,410 >> Ir jūs taip pat galite padalinti šias baras grafikus. 815 00:48:17,410 --> 00:48:19,480 Nes vienas dalykas yra kad jei pastebėjote, 816 00:48:19,480 --> 00:48:24,560 tai nėra labai lengvai identifikuoti , kuri iš šių dviejų reikšmių, yra didesnis. 817 00:48:24,560 --> 00:48:27,920 Taigi vienas dalykas, kurį norėtumėte padaryti, tai priimti šį mėlyną plotą 818 00:48:27,920 --> 00:48:31,855 ir tiesiog perkelti jį per čia, kad jums galima lyginti šias dvi viena šalia kitos. 819 00:48:31,855 --> 00:48:34,480 Ir aš manau, kad tai, ką aš neturi laiko padaryti dabar, 820 00:48:34,480 --> 00:48:36,660 bet tai taip pat labai lengva padaryti. 821 00:48:36,660 --> 00:48:40,310 Jūs galite tiesiog pažvelgti į MAN puslapių ggplot. 822 00:48:40,310 --> 00:48:47,170 Taigi, galite tiesiog ggplot kaip kad ir skaityti į šį žinyno puslapyje. 823 00:48:47,170 --> 00:48:51,920 >> Taigi leiskite man tiesiog greitai parodyti jums keletą įdomių dalykų. 824 00:48:51,920 --> 00:48:57,610 Vykime į priekį ir eiti to-- tik taikymas mašina mokymo. 825 00:48:57,610 --> 00:49:02,450 Taigi tarkime, mes turime šiuos tris paketai, todėl aš ruošiuosi įkelti juos į. 826 00:49:02,450 --> 00:49:05,500 827 00:49:05,500 --> 00:49:09,170 Taigi, tai tik spausdina kai informacija, kai aš įdėtas dalykas. 828 00:49:09,170 --> 00:49:15,220 Taigi aš sakau, tai read.csv, tai rinkinys, o dabar 829 00:49:15,220 --> 00:49:18,940 Aš ruošiuosi eiti į priekį ir atrodo ir pamatyti, kas viduje šis rinkinį. 830 00:49:18,940 --> 00:49:22,080 >> Taigi pirmuosius 20 stebėjimų. 831 00:49:22,080 --> 00:49:27,190 Taigi, aš tiesiog x1, x2, ir Y. Taigi atrodo šių vertybių krūva 832 00:49:27,190 --> 00:49:31,640 svyruoja nuo gal 20-80 ar panašiai. 833 00:49:31,640 --> 00:49:37,700 Ir tada panašiai X2 ir tada šis Y, atrodo, kad būtų etiketės 0 ir 1. 834 00:49:37,700 --> 00:49:49,500 >> Norėdami tai patikrinti, galiu just do santrauka duomenų X1. 835 00:49:49,500 --> 00:49:51,660 Ir tada panašiai visi šie kitų stulpelių. 836 00:49:51,660 --> 00:49:55,300 Taigi santrauka yra greitas būdas tik rodo jums greitai vertybes. 837 00:49:55,300 --> 00:49:56,330 Oi, atsiprašau. 838 00:49:56,330 --> 00:49:58,440 Tai vienas turėtų būti Y. 839 00:49:58,440 --> 00:50:03,420 >> Taigi, šiuo atveju, suteikia quantiles, vidurkiai, maxes taip pat. 840 00:50:03,420 --> 00:50:07,130 Šiuo atveju dataY, jūs galite pamatyti kad tai tik bus 0 ir 1. 841 00:50:07,130 --> 00:50:10,100 Taip pat vidurkis sako, 0,6, tiesiog reiškia, kad jį 842 00:50:10,100 --> 00:50:13,380 Atrodo, turiu daugiau nei 1s 0s. 843 00:50:13,380 --> 00:50:16,160 >> Taigi leiskite man eiti į priekį ir šou Jūs ką šis atrodo. 844 00:50:16,160 --> 00:50:17,470 Taigi, aš tik ketina sklypas tai. 845 00:50:17,470 --> 00:50:22,852 846 00:50:22,852 --> 00:50:24,636 Pažiūrėkime, kaip išvalyti tai. 847 00:50:24,636 --> 00:50:30,492 848 00:50:30,492 --> 00:50:31,468 O Gerai. 849 00:50:31,468 --> 00:50:35,840 850 00:50:35,840 --> 00:50:36,340 Gerai. 851 00:50:36,340 --> 00:50:37,590 >> Taigi tai, kaip jis atrodo. 852 00:50:37,590 --> 00:50:46,310 Taigi atrodo, kad geltonos Aš nurodytų kaip 0, tada raudona Aš nurodytas kaip 1s. 853 00:50:46,310 --> 00:50:52,190 Taigi čia atrodo etikečių taškai ir jis 854 00:50:52,190 --> 00:50:56,410 Atrodo, ką tik norėjo kai rūšiuoti grupavimo apie tai. 855 00:50:56,410 --> 00:51:01,020 >> Ir leiskite man tiesiog eiti į priekį ir šou Jūs kai kurie iš šių built-in funkcijos. 856 00:51:01,020 --> 00:51:03,580 Taigi čia yra LM. 857 00:51:03,580 --> 00:51:06,060 Taigi tai yra tiesiog bando kad tilptų liniją tai. 858 00:51:06,060 --> 00:51:08,640 Taigi, kas yra geriausias būdas kad aš gali tilpti linija tokia 859 00:51:08,640 --> 00:51:14,020 kad ji bus geriausiai atskirti šis grupavimo rūšiuoti. 860 00:51:14,020 --> 00:51:21,790 Ir geriausia, ką tik galima pamatyti kad aš tiesiog paleisti visas šias komandas 861 00:51:21,790 --> 00:51:25,450 ir tada aš ruošiuosi į priekį ir pridėkite eilutę. 862 00:51:25,450 --> 00:51:28,970 >> Taigi, tai atrodo, kad geriausias spėjimas. 863 00:51:28,970 --> 00:51:34,150 Tai atsižvelgiant geriausią, kuris sumažina bando, kad tilptų šią eilutę klaida. 864 00:51:34,150 --> 00:51:40,000 Akivaizdu, kad tai atrodo rūšies gerai, bet tai ne geriausias. 865 00:51:40,000 --> 00:51:43,130 Ir tiesiniai modeliai, visų Apskritai, ketiname būti 866 00:51:43,130 --> 00:51:46,811 tikrai puikus teorijos ir tiesiog tarsi Statybinių pagrindų mašina 867 00:51:46,811 --> 00:51:47,310 mokymosi. 868 00:51:47,310 --> 00:51:50,330 Tačiau praktikoje, jūs ketinate nori padaryti kažką bendresnio pobūdžio. 869 00:51:50,330 --> 00:51:54,280 >> Taigi, galite tiesiog pabandyti kažkas vadinamas neuronų tinklą. 870 00:51:54,280 --> 00:51:57,110 Šie dalykai yra vis dažniau. 871 00:51:57,110 --> 00:52:00,530 Ir jie tiesiog dirba fantastiškai didelių duomenų rinkinių. 872 00:52:00,530 --> 00:52:07,080 Taigi, šiuo atveju, mes tik have-- tegul see-- turime nrow. 873 00:52:07,080 --> 00:52:09,010 Taigi nrow yra tiesiog pasakyti eilučių skaičių. 874 00:52:09,010 --> 00:52:11,790 Taigi šiuo atveju, aš turime 100 pastabų. 875 00:52:11,790 --> 00:52:15,010 >> Taigi leiskite man eiti į priekį ir padaryti neuronų tinklą. 876 00:52:15,010 --> 00:52:18,620 Taigi tai tikrai gražus nes aš galiu tik pasakyti, nnet 877 00:52:18,620 --> 00:52:21,767 ir tada aš regresiją Y. Taigi, Y yra tai, kad kolonėlė. 878 00:52:21,767 --> 00:52:23,850 Ir tada regresiją jį kiti du kintamieji. 879 00:52:23,850 --> 00:52:27,360 Taigi, šis yra trumpesnis žymėjimas X1 ir X2. 880 00:52:27,360 --> 00:52:29,741 >> Taigi eikime į priekį ir paleisti tai. 881 00:52:29,741 --> 00:52:30,240 Oi, atsiprašau. 882 00:52:30,240 --> 00:52:32,260 Man reikia paleisti visą šį dalyką. 883 00:52:32,260 --> 00:52:37,500 Ir tai tik spausdinant notacijos už tai, kaip greitai ar ne greitai ji 884 00:52:37,500 --> 00:52:38,460 susiliejęs. 885 00:52:38,460 --> 00:52:41,420 Taigi atrodo, kad ji susilieja. 886 00:52:41,420 --> 00:52:44,970 Taigi leiskite man eiti į priekį ir spausdinti , kas tai atrodo. 887 00:52:44,970 --> 00:52:51,260 >> Žiūrėti čia vaizdas ir čia yra kontūras rodo, kaip gerai ji tinka. 888 00:52:51,260 --> 00:52:56,380 Ir tai just-- matote tai, kad tai yra labai, labai gražus. 889 00:52:56,380 --> 00:52:59,400 Jis netgi gali būti overfitting, bet jūs taip pat gali 890 00:52:59,400 --> 00:53:03,390 sudaro tai su kita metodai, pavyzdžiui, kryžminio patvirtinimo. 891 00:53:03,390 --> 00:53:06,180 Ir jie taip pat pastatė į R. 892 00:53:06,180 --> 00:53:09,170 >> Ir leiskite man tiesiog parodyti jums, remti vektoriaus mašina. 893 00:53:09,170 --> 00:53:12,470 Tai dar tikrai bendra technika, mašina mokymo. 894 00:53:12,470 --> 00:53:18,550 Jis yra labai panašus į linijinių modelių, bet ji naudoja tai, kas vadinama branduolio metodas. 895 00:53:18,550 --> 00:53:22,790 Ir tegul pamatyti, kaip gerai, kad nėra. 896 00:53:22,790 --> 00:53:26,430 Taigi, šis vienas yra labai panašios į tai, kaip gerai neuroninių tinklų atlieka, 897 00:53:26,430 --> 00:53:27,900 bet tai daug sklandžiau. 898 00:53:27,900 --> 00:53:35,740 Ir tai yra pagrįsta ne nuo what--, kaip SVMs darbą. 899 00:53:35,740 --> 00:53:40,250 >> Taigi tai yra tik labai Greita apžvalga kai 900 00:53:40,250 --> 00:53:43,822 iš built-in funkcijos galite padaryti ir taip pat kai duomenų tirti. 901 00:53:43,822 --> 00:53:45,905 Taigi leiskite man tiesiog eiti į priekį ir grįžti į skaidres. 902 00:53:45,905 --> 00:53:50,290 903 00:53:50,290 --> 00:53:53,670 >> Taigi, akivaizdu, kad tai yra nėra labai išsamus. 904 00:53:53,670 --> 00:53:57,140 Ir tai tikrai tik kibinimas parodyti jums, ką jūs tikrai galite padaryti R. 905 00:53:57,140 --> 00:53:59,100 Taigi, jei norite tiesiog kaip Norėdami sužinoti daugiau, čia 906 00:53:59,100 --> 00:54:01,210 Yra įvairių išteklių krūva. 907 00:54:01,210 --> 00:54:06,890 >> Taigi, jei esate mėgsta vadovėlių ar esate tiesiog mėgstu skaityti dalykų internete, 908 00:54:06,890 --> 00:54:09,670 tai yra fantastiška vienas po Hadley Wickham, 909 00:54:09,670 --> 00:54:13,010 kuris taip pat sukūrė visa tai tikrai cool paketai. 910 00:54:13,010 --> 00:54:17,420 Jei esate mėgsta video, tada Berklis turi awesome Bootcamp 911 00:54:17,420 --> 00:54:21,060 tai several-- tai rūšies ilgai. 912 00:54:21,060 --> 00:54:24,210 Ir tai bus išmokyti jus, beveik viskas, ko jums reikia sužinoti apie R. 913 00:54:24,210 --> 00:54:27,770 >> Ir panašiai, ten Codeacademy ir visa tai kitos rūšies 914 00:54:27,770 --> 00:54:29,414 interaktyvių svetainių. 915 00:54:29,414 --> 00:54:31,580 Jie taip pat gauti common-- daugiau ir dažniau. 916 00:54:31,580 --> 00:54:33,749 Taigi, šis yra labai panašus į Codeacademy. 917 00:54:33,749 --> 00:54:35,790 Ir pagaliau, jei jūs tiesiog nori bendrijos ir padėti, 918 00:54:35,790 --> 00:54:38,800 tai yra krūva dalykų, kuriuos galite vykti. 919 00:54:38,800 --> 00:54:40,880 Akivaizdu, kad mes vis dar naudoti sąrašus, tiesiog 920 00:54:40,880 --> 00:54:44,860 kaip beveik kas antrą programavimo kalba, bendruomenė. 921 00:54:44,860 --> 00:54:47,880 Ir #rstats, tai mūsų bendruomenės Twitter. 922 00:54:47,880 --> 00:54:49,580 Tai tikrai gana dažnos. 923 00:54:49,580 --> 00:54:50,850 Ir tada vartotoją! 924 00:54:50,850 --> 00:54:52,340 Ar tik mūsų konferencija. 925 00:54:52,340 --> 00:54:55,390 >> Ir tada, žinoma, galite naudoti visus šiuos kitus Q & A dalykų, 926 00:54:55,390 --> 00:54:57,680 kaip Stack overflow, "Google", tada GitHub. 927 00:54:57,680 --> 00:55:00,490 Kadangi dauguma šių paketų ir bendruomenės daug 928 00:55:00,490 --> 00:55:03,420 bus orientuota plėtoti kodas nes tai atviro kodo. 929 00:55:03,420 --> 00:55:05,856 Ir tai tik tikrai gražiai GitHub. 930 00:55:05,856 --> 00:55:08,730 Ir, pagaliau, galite susisiekti su manimi, jei jūs tiesiog turite trumpus klausimus. 931 00:55:08,730 --> 00:55:13,530 Taigi, galite rasti mane Twitter čia mano svetainės, ir tik mano el. 932 00:55:13,530 --> 00:55:17,840 Taigi tikiuosi, kad buvo something-- tik trumpas anonsas 933 00:55:17,840 --> 00:55:20,900 apie ką R yra tikrai pajėgi daryti. 934 00:55:20,900 --> 00:55:23,990 Ir tikiuosi, jūs tiesiog patikrinkite šiuos tris nuorodos 935 00:55:23,990 --> 00:55:25,760 ir pamatyti, ką jūs galite padaryti daugiau. 936 00:55:25,760 --> 00:55:28,130 Ir aš manau, kad tai tik apie tai. 937 00:55:28,130 --> 00:55:28,630 Ačiū. 938 00:55:28,630 --> 00:55:30,780 >> [Plojimai] 939 00:55:30,780 --> 00:55:31,968