1 00:00:00,000 --> 00:00:05,691 2 00:00:05,691 --> 00:00:07,690 CONNOR HARRIS: Still I domāju, ka dažas aizraujošas video 3 00:00:07,690 --> 00:00:12,570 ražo profesionālu konsultāciju kas izmanto R daudz savā darbā. 4 00:00:12,570 --> 00:00:16,329 >> Teicējs: Kas ir aiz statistiku, Analytics, un vizualizācijas 5 00:00:16,329 --> 00:00:19,770 ka šodienas spožāko datu zinātnieki un biznesa līderiem paļauties uz 6 00:00:19,770 --> 00:00:22,012 lai padarītu spēcīgu lēmumus? 7 00:00:22,012 --> 00:00:23,540 Jūs ne vienmēr var redzēt. 8 00:00:23,540 --> 00:00:24,790 Bet tas ir tur. 9 00:00:24,790 --> 00:00:29,460 To sauc R, open source R-- statistiskā programmēšanas valoda 10 00:00:29,460 --> 00:00:32,630 ka datu eksperti pasaulē vairāk izmantot par visu 11 00:00:32,630 --> 00:00:35,350 no kartēšanas plašā sociālā un mārketinga tendences tiešsaistes 12 00:00:35,350 --> 00:00:39,210 attīstīt finanšu un klimatu modeļi, kas palīdzēs virzīt mūsu ekonomiku 13 00:00:39,210 --> 00:00:40,780 un kopienām. 14 00:00:40,780 --> 00:00:44,910 >> Bet kas īsti ir R un kur bija R sākt? 15 00:00:44,910 --> 00:00:48,620 Nu sākotnēji, R sākās šeit ar diviem profesoriem 16 00:00:48,620 --> 00:00:51,950 kurš vēlējās labāks statistikas platforma saviem studentiem. 17 00:00:51,950 --> 00:00:56,030 Tāpēc viņi radīja viens modelēts Pēc statistikas valodā S. 18 00:00:56,030 --> 00:01:00,480 Tie, kopā ar daudziem citiem, tur strādā un, izmantojot R, 19 00:01:00,480 --> 00:01:05,489 radot instrumentus R un atrast jaunus pieteikumus par R katru dienu. 20 00:01:05,489 --> 00:01:07,750 >> Pateicoties tam, ir pasaules kopiena pūles, 21 00:01:07,750 --> 00:01:11,850 R tur pieaug ar tūkstošiem lietotāju radīts bibliotēkām būvēts 22 00:01:11,850 --> 00:01:15,500 lai uzlabotu R funkcionalitāti un pūļa izcelsmes kvalitātes validēšana 23 00:01:15,500 --> 00:01:19,740 un atbalstu no visvairāk atzīta nozares līderi visās jomās, kas 24 00:01:19,740 --> 00:01:25,040 izmanto R. Kura ir liels, jo R ir labākais, ko tā dara. 25 00:01:25,040 --> 00:01:28,540 Topošos speciālistus ātri un viegli interpretēt, mijiedarboties ar, 26 00:01:28,540 --> 00:01:33,790 un vizualizēt datus parādot savu strauji augošs kopiena R lietotāju visā pasaulē 27 00:01:33,790 --> 00:01:36,380 un redzēt, kā open source R turpina veidot 28 00:01:36,380 --> 00:01:39,340 nākotne statistikas analīze un datu zinātne. 29 00:01:39,340 --> 00:01:44,660 30 00:01:44,660 --> 00:01:47,710 >> CONNOR HARRIS: Labi, lieliski. 31 00:01:47,710 --> 00:01:50,360 Tātad mana prezentācija būs nedaudz vairāk prātīgs. 32 00:01:50,360 --> 00:01:54,380 Tas nav saistīts, ka daudz aizraujošu fona mūziku. 33 00:01:54,380 --> 00:01:59,160 Bet kā jūs redzēju video, R ir sava vispārēja mērķis programmas valodā. 34 00:01:59,160 --> 00:02:03,720 Bet tas tika izveidots galvenokārt par statistikas darba. 35 00:02:03,720 --> 00:02:07,980 >> Tātad, tas ir paredzēts pēc statistikas, datu analīzi, datu ieguves. 36 00:02:07,980 --> 00:02:12,420 Un lai jūs varētu redzēt to daudz projektēšanas izvēles, ka veidotāji R 37 00:02:12,420 --> 00:02:13,320 veikts. 38 00:02:13,320 --> 00:02:15,472 Tas ir paredzēts, lai lielā mērā, cilvēki, kuri nav 39 00:02:15,472 --> 00:02:17,930 eksperti plānošanu, kas ir tikai pacelt programmēšana 40 00:02:17,930 --> 00:02:23,460 pusē, lai viņi varētu veikt savu darbu sociālajās zinātnēs vai statistikā 41 00:02:23,460 --> 00:02:25,440 vai neatkarīgi. 42 00:02:25,440 --> 00:02:27,850 >> Tas ir daudz ļoti nozīmīgas atšķirības no C. 43 00:02:27,850 --> 00:02:33,200 Bet sintakse un paradigmas ka tā izmanto kopumā tas pats. 44 00:02:33,200 --> 00:02:36,830 Un jums vajadzētu justies diezgan daudz mājās tiesības pie nūja. 45 00:02:36,830 --> 00:02:38,520 Tas ir svarīgi, valoda. 46 00:02:38,520 --> 00:02:40,260 >> Neuztraucieties pārāk daudz par to Ja jūs nezināt termiņu. 47 00:02:40,260 --> 00:02:42,676 Bet tur ir atšķirība starp nepieciešamību, deklaratīvs, 48 00:02:42,676 --> 00:02:43,810 un funkcionāls. 49 00:02:43,810 --> 00:02:47,600 Obligāti, vienkārši nozīmē, ka jūs darīt paziņojumi, kas būtībā komandas. 50 00:02:47,600 --> 00:02:52,340 Un tad tulks vai dators šādi tos pa vienam. 51 00:02:52,340 --> 00:02:56,630 Tas ir vāji drukāti, ir nav tipa deklarācijas R. 52 00:02:56,630 --> 00:02:59,130 >> Un pēc tam līnijas starp dažādiem 53 00:02:59,130 --> 00:03:03,920 ir mazliet vairāk nekā brīvs tie ir C, piemēram. 54 00:03:03,920 --> 00:03:06,450 Un kā jau es teicu, ka ir ļoti plašas iespējas 55 00:03:06,450 --> 00:03:15,610 par grafikus, lai statistikas analīze, datu ieguves. 56 00:03:15,610 --> 00:03:19,540 Tie ir gan iebūvēts valodu un, kā video teica, 57 00:03:19,540 --> 00:03:23,680 tūkstošiem trešo personu bibliotēkām, ka Jūs varat lejupielādēt un izmantot bez maksas 58 00:03:23,680 --> 00:03:25,340 ar ļoti vaļēju licences nosacījumiem. 59 00:03:25,340 --> 00:03:28,800 60 00:03:28,800 --> 00:03:31,500 >> Tātad kopumā, es gribētu ieteikt ka paskatās šīm divām grāmatām 61 00:03:31,500 --> 00:03:34,610 ja jūs gatavojas strādāt pie R. One no tiem ir oficiālais R iesācēja 62 00:03:34,610 --> 00:03:35,110 guide. 63 00:03:35,110 --> 00:03:38,660 Tas, ko uztur galvenie attīstītāji R. 64 00:03:38,660 --> 00:03:42,400 Jūs varat lejupielādēt to no jauna, bez maksas un juridiski tajā saiti tur. 65 00:03:42,400 --> 00:03:45,430 66 00:03:45,430 --> 00:03:49,869 Visi šie slaidi gatavojas doties līdzi internetā, par CS50 mājas lapā 67 00:03:49,869 --> 00:03:50,660 Pēc tas tiek darīts. 68 00:03:50,660 --> 00:03:53,690 Tāpēc nav nepieciešams, lai kopētu lietas leju izmisīgi. 69 00:03:53,690 --> 00:03:56,800 >> Otrs ir mācību grāmata ar Cosma Shalizi, 70 00:03:56,800 --> 00:04:00,100 kas ir statistika profesors Carnegie Mellon, ko sauc Advanced Data 71 00:04:00,100 --> 00:04:02,160 Analīze, raugoties no Elementary viedokļa. 72 00:04:02,160 --> 00:04:04,010 Tas nav principiāli R grāmata. 73 00:04:04,010 --> 00:04:07,130 Tā ir statistika grāmatu un tas ir datu analīze grāmata. 74 00:04:07,130 --> 00:04:11,990 Bet tas ir ļoti pieejama cilvēkiem, kas ir mazumiņš statistikas zināšanas. 75 00:04:11,990 --> 00:04:13,750 >> Es nekad neesmu pieņēmusi oficiālu kursu. 76 00:04:13,750 --> 00:04:17,269 Es tikai zinu, bitiem un gabali no dažādiem sabiedroto priekšmetos 77 00:04:17,269 --> 00:04:18,579 ka es esmu pieņemts kursus. 78 00:04:18,579 --> 00:04:21,839 Un man bija iespēja saprast tas ļoti labi. 79 00:04:21,839 --> 00:04:25,630 >> Visi skaitļi ir doti R. Tie ir izgatavoti R 80 00:04:25,630 --> 00:04:30,280 un viņi arī ir koda sarakstiem Turpmāk katru skaitlis, kas pateiks, 81 00:04:30,280 --> 00:04:33,270 kā jūs veicat katru skaitli ar R kodu. 82 00:04:33,270 --> 00:04:37,400 Un tas ir ļoti noderīgi, ja jūs mēģināt līdzināties 83 00:04:37,400 --> 00:04:38,650 daži skaitlis redzat grāmatā. 84 00:04:38,650 --> 00:04:47,840 >> Un atkal bezmaksas lejuplādēt stat.cmu.edu/cshalizi/ Atvainojiet, 85 00:04:47,840 --> 00:04:50,230 kas būtu slash tildes cshalizi. 86 00:04:50,230 --> 00:04:53,150 Es pārliecinieties, lai labotu, ka kad oficiālās slaidi iet uz augšu. 87 00:04:53,150 --> 00:04:57,000 / ADAfaEPoV kas ir tikai akronīms no grāmatas nosaukuma. 88 00:04:57,000 --> 00:04:59,850 89 00:04:59,850 --> 00:05:02,500 >> Tātad kopumā caveats-- R ir daudz iespējas. 90 00:05:02,500 --> 00:05:05,331 Es esmu tikai gatavojas, lai varētu segt virsma daudz lietas. 91 00:05:05,331 --> 00:05:08,580 Arī pirmā daļa Semināra būs kaut kas no datu izgāztuves. 92 00:05:08,580 --> 00:05:11,437 Es esmu diezgan atvainojos par to. 93 00:05:11,437 --> 00:05:13,770 Būtībā, es esmu gatavojas jūs iepazīstināt ar daudz lietas 94 00:05:13,770 --> 00:05:15,350 tiesības pie nūja, dodoties cik ātri vien iespējams. 95 00:05:15,350 --> 00:05:17,058 Un tad mēs nokļūt jautri daļa, kas ir 96 00:05:17,058 --> 00:05:20,570 demo, kur es varu jums parādīt visu ka mēs esam runājuši par ekrānā. 97 00:05:20,570 --> 00:05:23,321 Un jūs varat spēlēt aptuveni par savu. 98 00:05:23,321 --> 00:05:26,070 Tātad tur būs daudz tehniskā sīkumi izmet līdzi šeit. 99 00:05:26,070 --> 00:05:28,060 Neuztraucieties par kopēšanu visu, kas uz leju. 100 00:05:28,060 --> 00:05:31,740 Jo, jūs varat iegūt visu sīkumi par CS50 mājaslapā vēlāk. 101 00:05:31,740 --> 00:05:37,780 Un B, tas nav reāli, ka svarīgi iegaumēt šo no slaidiem. 102 00:05:37,780 --> 00:05:40,462 Tas ir vairāk svarīgi, ka jūs saņemsiet daži intuitīvu iekārta ar to 103 00:05:40,462 --> 00:05:44,220 un kas nāk no tikai spēlēšanās. 104 00:05:44,220 --> 00:05:45,720 >> Tātad, kāpēc izmantot R? 105 00:05:45,720 --> 00:05:49,440 Būtībā, ja jums ir projekts, kas ietver ieguves lielas datu kopas, datu 106 00:05:49,440 --> 00:05:52,664 vizualizācija, jūs jāizmanto R. Ja esat 107 00:05:52,664 --> 00:05:55,830 darot sarežģīta statistikas analīzi, ka būtu grūti Excel, 108 00:05:55,830 --> 00:05:58,010 piemēram, tas būtu arī good-- arī 109 00:05:58,010 --> 00:06:00,506 ja jūs darāt statistical analīze, kas ir automatizēta. 110 00:06:00,506 --> 00:06:02,130 Pieņemsim, ka jūs esat uzturēt tīmekļa vietni. 111 00:06:02,130 --> 00:06:06,320 Un jūs vēlaties lasīt servera log katru dienu un apkopot daži saraksts, 112 00:06:06,320 --> 00:06:10,320 kā top valstīm, lietotāji nāk no, 113 00:06:10,320 --> 00:06:15,100 daži statistikas kopsavilkumu par to, kā ilgi viņi pavada uz jūsu mājas lapā vai neatkarīgi. 114 00:06:15,100 --> 00:06:16,910 Un jūs vēlaties, lai palaistu to katru dienu. 115 00:06:16,910 --> 00:06:20,280 >> Tagad, ja jūs darāt to Excel, jūs jādodas uz Jūsu servera žurnālu, 116 00:06:20,280 --> 00:06:23,490 importēt kas stājas Excel datu izklājlapu, 117 00:06:23,490 --> 00:06:24,910 palaist visu analīzi manuāli. 118 00:06:24,910 --> 00:06:27,100 Ar R, jūs varat vienkārši uzrakstīt vienu skriptu. 119 00:06:27,100 --> 00:06:29,520 Ieplānojiet tā katru dienu no jūsu operētājsistēmu. 120 00:06:29,520 --> 00:06:33,657 Un tad katru nakti pie 2:00, vai tad, kad jūs ieplānojiet tā, 121 00:06:33,657 --> 00:06:35,990 tas izskatās caur jūsu interneta satiksmes šajā dienā. 122 00:06:35,990 --> 00:06:39,010 Un tad jau nākamajā dienā, jums ir šī spīdīgu, jaunu ziņojumu 123 00:06:39,010 --> 00:06:41,710 vai kāds ar visi informāciju jūs lūdza. 124 00:06:41,710 --> 00:06:44,960 125 00:06:44,960 --> 00:06:50,217 >> Tātad būtībā R ir Cisco programmēšana pret Cisco analīzi. 126 00:06:50,217 --> 00:06:51,050 Iepriekšēja tiek darīts. 127 00:06:51,050 --> 00:06:53,104 Iesim uz reālajām lietām. 128 00:06:53,104 --> 00:06:55,020 Tātad ir trīs reāls veidi valodā. 129 00:06:55,020 --> 00:06:56,120 Tur ir ciparu tips. 130 00:06:56,120 --> 00:07:01,250 Tur ir sava veida atšķirība starp veseli skaitļi un peldošās punkti, 131 00:07:01,250 --> 00:07:02,769 bet nav īsti. 132 00:07:02,769 --> 00:07:04,560 Tur ir raksturs tips, kas ir virknes. 133 00:07:04,560 --> 00:07:07,100 Un tur ir loģisks tips, kas ir Booleans. 134 00:07:07,100 --> 00:07:11,080 >> Un jūs varat konvertēt starp tipiem izmantojot šīs funkcijas, kā ciparu, 135 00:07:11,080 --> 00:07:15,220 kā raksturs, kā loģiski. 136 00:07:15,220 --> 00:07:17,510 Ja jums zvanīt, piemēram, kā skaitlisku par string, 137 00:07:17,510 --> 00:07:20,030 tā centīsies lasīt, ka string kā vairāki, tāpat 138 00:07:20,030 --> 00:07:25,897 ka A2I un scanf darīt, un C. Ja tu sauc kā skaitlisku par patiess vai nepatiess 139 00:07:25,897 --> 00:07:26,980 tas būs konvertēt uz 1 vai 0. 140 00:07:26,980 --> 00:07:29,110 Ja jums zvana kā raksturs par kaut ko tas būs 141 00:07:29,110 --> 00:07:32,550 pārvērst kas stājas string pārstāvība. 142 00:07:32,550 --> 00:07:34,990 >> Un tad tur ir vektori un matricas. 143 00:07:34,990 --> 00:07:37,580 Tātad vektori ir būtībā 1 dimensiju masīvi. 144 00:07:37,580 --> 00:07:40,600 Tie ir tas, ko mēs saucam masīvus C. Matricas, 2 dimensiju masīvi. 145 00:07:40,600 --> 00:07:42,350 Un tad augstāku dimensiju masīvi jūs varat 146 00:07:42,350 --> 00:07:48,560 ir 3, 4, 5 izmērus, vai kāds no skaitliskām vērtībām, Stīgu, 147 00:07:48,560 --> 00:07:52,860 loģiskās vērtības. 148 00:07:52,860 --> 00:07:55,380 >> Jums ir arī saraksti, kas ir sava veida asociatīvo masīvu. 149 00:07:55,380 --> 00:07:57,390 Es nopirkšu vērā, ka mazliet. 150 00:07:57,390 --> 00:07:59,390 Tātad viena svarīga lieta ka braucieni cilvēkus pētniecībā 151 00:07:59,390 --> 00:08:01,470 ir tā, ka nav reālas, tīra atomu veidi. 152 00:08:01,470 --> 00:08:05,870 Nav aktuālā atšķirība starp numuru, kā skaitlisku vērtību, 153 00:08:05,870 --> 00:08:07,920 un sarakstu skaitliskām vērtībām. 154 00:08:07,920 --> 00:08:12,370 Skaitliskās vērtības ir faktiski pats kā vektoru garumu 1. 155 00:08:12,370 --> 00:08:14,959 Un tas ir vairākas svarīgas sekas. 156 00:08:14,959 --> 00:08:17,500 Viens, tas nozīmē, ka jūs varat darīt lietas, ir ļoti viegli, kas ietver 157 00:08:17,500 --> 00:08:21,037 piemēram, pievienojot vairākus vektorā. 158 00:08:21,037 --> 00:08:23,120 R būs pamatā skaitlis out Ko tu ar to domā. 159 00:08:23,120 --> 00:08:24,610 Un es nopirkšu ka sekundē. 160 00:08:24,610 --> 00:08:27,930 Tas arī nozīmē, ka tur nav veids veidam checker--, ciktāl 161 00:08:27,930 --> 00:08:30,530 ka kaut kas tamlīdzīgs pastāv R-- pateikt 162 00:08:30,530 --> 00:08:33,780 kad esat izturējis vienotajā vērtībā kad tas sagaida masīva vai otrādi. 163 00:08:33,780 --> 00:08:39,159 Un tas var radīt dažas nepāra nepatikšanām, kas man uzbrauca, kad 164 00:08:39,159 --> 00:08:42,252 Man bija, izmantojot R laikā mana vasaras darbu. 165 00:08:42,252 --> 00:08:43,710 Un nav jaukta tipa bloki. 166 00:08:43,710 --> 00:08:46,543 Tātad, jūs nevarat būt masīvs bija Pirmie elementi ir, es nezinu, 167 00:08:46,543 --> 00:08:49,332 string "Jānis" un Otrais elements ir numur 42. 168 00:08:49,332 --> 00:08:52,540 Ja jūs mēģināt to darīt, tad jūs saņemsiet viss vienkārši pārvērš virkni. 169 00:08:52,540 --> 00:08:54,760 Tāpēc mums ir virkne John, stīgu 42. 170 00:08:54,760 --> 00:08:58,250 171 00:08:58,250 --> 00:09:02,025 >> Tik neparasti sintaktisko features-- visvairāk R sintakse ir ļoti līdzīga C. 172 00:09:02,025 --> 00:09:04,690 Ir dažas būtiskas atšķirības. 173 00:09:04,690 --> 00:09:05,620 Rakstīt ir ļoti vāja. 174 00:09:05,620 --> 00:09:07,360 Tātad nav mainīgo deklarācijas. 175 00:09:07,360 --> 00:09:12,670 Pielietojums izmanto dīvaini kļūda operators mazāk nekā defisi. 176 00:09:12,670 --> 00:09:15,340 Komentāri ir ar hash zīmi. 177 00:09:15,340 --> 00:09:19,230 Es domāju, tagad dienas mēs to saucam hashtag lai gan tas nav īsti accurate-- nav 178 00:09:19,230 --> 00:09:21,810 dubultā slīpsvītra. 179 00:09:21,810 --> 00:09:24,710 >> Moduļu atliekas ar %% zīmēm. 180 00:09:24,710 --> 00:09:30,172 Integer sadalījums ir ar% /%, kas ir ļoti grūti lasīt, kad tas ir prognozēts 181 00:09:30,172 --> 00:09:30,880 up uz ekrāna. 182 00:09:30,880 --> 00:09:34,150 183 00:09:34,150 --> 00:09:37,200 Jūs varat saņemt diapazonu skaitļu ar kolu. 184 00:09:37,200 --> 00:09:41,840 Tātad 2,5 dos jums vektors visiem skaitļiem no 2 līdz 5. 185 00:09:41,840 --> 00:09:44,530 >> Masīvi ir viena indeksētas, kas skrūves daudz cilvēku 186 00:09:44,530 --> 00:09:47,540 augšu, ja viņi no vairāk tipiski programmēšanas valodas, 187 00:09:47,540 --> 00:09:50,450 piemēram, C, kur lielākā daļa lietas ir nulle indeksētas. 188 00:09:50,450 --> 00:09:54,420 Atkal, tas ir, ja R mantojumu kā valodu, piemēram, nav 189 00:09:54,420 --> 00:09:56,560 profesionāli programmētāji nāk. 190 00:09:56,560 --> 00:09:59,680 Ja esat sociologs vai ekonomists vai kaut kas 191 00:09:59,680 --> 00:10:01,980 un jūs mēģināt izmantot R būtībā kā papildinājums 192 00:10:01,980 --> 00:10:03,832 jūsu svarīgāka profesionāls darbs, 193 00:10:03,832 --> 00:10:06,040 jūs gatavojas atrast one-indeksācija nedaudz vairāk dabas. 194 00:10:06,040 --> 00:10:09,890 Tāpēc, ka jūs sākat skaitīšana pēc 1 ikdienas dzīvē, nevis 0. 195 00:10:09,890 --> 00:10:13,260 >> For-cilpas, tas ir līdzīgs foreach būvēt PHP, 196 00:10:13,260 --> 00:10:17,090 ko jūs saņemsiet, lai mācīties in-- diezgan drīz. 197 00:10:17,090 --> 00:10:22,540 Kas ir par vērtību vektoru un tad jūs varat darīt lietas ar vērtību. 198 00:10:22,540 --> 00:10:24,040 Mērķauditorija: Tas ir jānāk klajā ar lekciju. 199 00:10:24,040 --> 00:10:26,248 CONNOR HARRIS: Ak, tas ir nākt klajā lekciju, lielisks. 200 00:10:26,248 --> 00:10:29,815 Mērķauditorija: Uzdevums, tas ir vajadzēja norādīt, no labās uz kreiso? 201 00:10:29,815 --> 00:10:31,440 CONNOR HARRIS: No labās uz kreiso pusi, jā. 202 00:10:31,440 --> 00:10:34,720 Jūs varat domāt par to kā vērtību par pareizais shoved uz mainīgo 203 00:10:34,720 --> 00:10:36,240 pa kreisi. 204 00:10:36,240 --> 00:10:36,781 Mērķauditorija: OK. 205 00:10:36,781 --> 00:10:39,770 206 00:10:39,770 --> 00:10:42,330 >> CONNOR HARRIS: Un visbeidzot funkcija sintakse ir mazliet dīvaini. 207 00:10:42,330 --> 00:10:48,460 Jums ir funkcija nosaukums foo, kas piešķirts ar šo atslēgvārdu funkciju, kam seko 208 00:10:48,460 --> 00:10:51,530 ar visiem argumentiem, un pēc tam, ka korpuss funkciju pēc tā. 209 00:10:51,530 --> 00:10:53,280 Atkal šīs lietas var likties mazliet dīvaini. 210 00:10:53,280 --> 00:10:57,181 Tie būs kļuvusi par otro dabu pēc Jūs strādājat ar valodu mazliet. 211 00:10:57,181 --> 00:10:58,930 Tātad vektori, ceļš jūs būvēt vektoru 212 00:10:58,930 --> 00:11:04,550 ir jums tips C, kas ir atslēgvārds, tad visi skaitļi vēlaties vai stīgas 213 00:11:04,550 --> 00:11:06,490 vai neatkarīgi. 214 00:11:06,490 --> 00:11:07,995 Argumenti arī vektori. 215 00:11:07,995 --> 00:11:09,620 Bet rezultātā masīvs izpaužas saplacināts. 216 00:11:09,620 --> 00:11:14,385 Tātad, jūs nevarat būt masīvi vajadzības daži elementi ir vienvietīgas numuri 217 00:11:14,385 --> 00:11:17,010 un daži elementi ir paši bloki. 218 00:11:17,010 --> 00:11:20,010 >> Tātad, ja jūs mēģināt būvēt masīvs bija pirmais elements ir 4 219 00:11:20,010 --> 00:11:22,370 un otrais elements ir masīvs 3,5 jūs 220 00:11:22,370 --> 00:11:25,890 tikai iegūt trīs blokam, 4,3,5. 221 00:11:25,890 --> 00:11:27,760 Tie var būt jaukta tipa. 222 00:11:27,760 --> 00:11:32,290 Ja jūs mēģināt lasīt vai rakstīt ārpus robežas vektors 223 00:11:32,290 --> 00:11:36,640 jūs saņemsiet šo vērtību sauc NA kas apzīmē pazudušu vērtību. 224 00:11:36,640 --> 00:11:39,900 Un tas ir paredzēts, lai piemēram, statistiķi, kuri 225 00:11:39,900 --> 00:11:43,080 strādā ar nepilnīgu datu kopām. 226 00:11:43,080 --> 00:11:46,460 >> Ja jūs pieteikties funkciju, kas ir paredzēts veikt tikai vienu numuru masīva 227 00:11:46,460 --> 00:11:49,220 tad ko jūs saņemsiet, jo funkcija vēros pa masīva. 228 00:11:49,220 --> 00:11:52,130 Tātad, ja jūsu funkcija teiksim aizņem numuru un nosūta to atpakaļ laukumā. 229 00:11:52,130 --> 00:11:58,170 Jūs pieteikties ka uz masīva 2,3,5 Ko jūs saņemsiet, ir masīvs 4,9,25. 230 00:11:58,170 --> 00:12:00,010 >> Un tas ir ļoti noderīgi jo tas nozīmē, ka jūs 231 00:12:00,010 --> 00:12:03,374 nav rakstīt cilpas dara ļoti vienkāršas lietas, piemēram, piemērojot 232 00:12:03,374 --> 00:12:05,040 funkcija visiem datu kopas dalībniekiem. 233 00:12:05,040 --> 00:12:08,557 Kas, ja jūs strādājat ar lielu datu kopas, kas Jums jādara daudz. 234 00:12:08,557 --> 00:12:10,390 Binary funkcijas Lietišķā ieraksts ar ierakstu. 235 00:12:10,390 --> 00:12:12,430 Es nopirkšu par to. 236 00:12:12,430 --> 00:12:16,750 Jūs varat tiem piekļūt ar masīviem vai vektori ar kvadrātiekavās. 237 00:12:16,750 --> 00:12:22,300 Tātad vektors nosaukums kvadrātiekavas 1 dos jums pirmo elementu. 238 00:12:22,300 --> 00:12:25,510 Vector nosaukums kvadrātiekavas 2 dos jums uz otro elementu. 239 00:12:25,510 --> 00:12:27,530 >> Jūs varat iet uz vektoru indeksu un jūs 240 00:12:27,530 --> 00:12:29,640 dabūt atpakaļ, būtībā sub faktors. 241 00:12:29,640 --> 00:12:34,990 Tātad jūs varat darīt, vektora nosaukums stiprinājumus C, 2,4 un jūs saņemsiet no vektoru, kas satur 242 00:12:34,990 --> 00:12:38,804 otrais un ceturtais elementi masīva. 243 00:12:38,804 --> 00:12:40,720 Un, ja jūs vēlaties, tikai Ātrā kopsavilkums statistika 244 00:12:40,720 --> 00:12:47,529 no vektora, piemēram, interkartilais plīts, vidējais, maksimālais, neatkarīgi, 245 00:12:47,529 --> 00:12:49,820 Jūs varat vienkārši ierakstiet kopsavilkumu vektors vārds un saņemt, ka ārā. 246 00:12:49,820 --> 00:12:52,680 Tas nav īsti noderīgs programmēšana, bet, ja jūs spēlējat 247 00:12:52,680 --> 00:12:55,990 ap datu kopas, tas ir ērts. 248 00:12:55,990 --> 00:12:58,650 >> Matrices-- būtībā augstākas dimensiju masīvi. 249 00:12:58,650 --> 00:13:01,190 Viņi ir šo īpašo notācija sintaksi. 250 00:13:01,190 --> 00:13:07,620 Matrix ar masīvu, kas izpaužas piepildīts in-- Atvainojiet, matrica ar datiem, 251 00:13:07,620 --> 00:13:09,780 rindu skaits, kolonnu skaitu. 252 00:13:09,780 --> 00:13:13,180 Ja jums ir daži dati, tas aizpilda masīvs būtībā gatavojas augšas uz leju 253 00:13:13,180 --> 00:13:13,380 pirmais. 254 00:13:13,380 --> 00:13:14,190 Tad kreisās uz labo pusi. 255 00:13:14,190 --> 00:13:15,030 Tātad, piemēram, ka. 256 00:13:15,030 --> 00:13:17,809 257 00:13:17,809 --> 00:13:19,600 Un R ir iebūvēts Matrix reizināšanas, 258 00:13:19,600 --> 00:13:24,310 spektrālo sadalīšanās, diagonalization, daudzas lietas. 259 00:13:24,310 --> 00:13:27,785 Ja vēlaties augstāku dimensiju bloki, tā 3, 4, 5, 260 00:13:27,785 --> 00:13:29,410 vai kāds izmēri jūs varat darīt. 261 00:13:29,410 --> 00:13:34,400 Sintakse ir masīvs dim vienāds C, tad saraksts izmēriem. 262 00:13:34,400 --> 00:13:38,620 Tātad, ja jūs vēlaties, 4 dimensiju masīvs ar izmēriem, 4., 7., 8., 9., masīva, 263 00:13:38,620 --> 00:13:45,470 dim vienāds c (4,7,8,9). 264 00:13:45,470 --> 00:13:51,180 >> Jūs piekļūt vienvietīgas vērtības ar iekavām Pirmais ieraksts komatu otrais ieraksts. 265 00:13:51,180 --> 00:13:54,870 Jūs varat iegūt visu šķēles rindu vai kolonnu. 266 00:13:54,870 --> 00:13:59,900 Ar šo nepilnīgu sintaksi tas ir tikai rinda numuru komats vai komatu kolonnu 267 00:13:59,900 --> 00:14:00,400 numurs. 268 00:14:00,400 --> 00:14:02,874 269 00:14:02,874 --> 00:14:04,540 Tātad saraksti ir sava veida saistītā masīvs. 270 00:14:04,540 --> 00:14:06,360 Viņiem ir savs sintakse šeit. 271 00:14:06,360 --> 00:14:08,320 Atkal nav izmisīgi kopēt visu šo leju. 272 00:14:08,320 --> 00:14:11,370 Tas ir tikai tāpēc, ka cilvēki iet caur slaidiem vēlāk 273 00:14:11,370 --> 00:14:13,089 ir tas viss jaukā atsauci. 274 00:14:13,089 --> 00:14:16,130 Un tas būs ļoti dabiska reizi Es tiešām iet cauri demos. 275 00:14:16,130 --> 00:14:19,295 276 00:14:19,295 --> 00:14:20,920 Tātad ir uzskaitīta būtībā saistīti bloki. 277 00:14:20,920 --> 00:14:27,040 Jūs varat piekļūt vērtības ar saraksta nosaukums, dolāra zīmi, atslēgu. 278 00:14:27,040 --> 00:14:31,370 Tātad, ja jūsu saraksts ir nosaukta foo, tad jūs varat piekļūt, piemēram, ka. 279 00:14:31,370 --> 00:14:37,032 Jūs varat saņemt visu atslēgu vērtības pāri pārejot uz kvadrātiekava indeksu. 280 00:14:37,032 --> 00:14:39,240 Ja jūs lasīt no neeksistējošu galvenais, jūs saņemsiet null. 281 00:14:39,240 --> 00:14:41,150 Tas nebūs kļūda. 282 00:14:41,150 --> 00:14:43,590 Lieta ir, R darīs, kā daudz ar nulli, kā tas ir iespējams. 283 00:14:43,590 --> 00:14:46,580 Un tas var nozīmēt, ka, ja jūs esat nav gaidījis, lai saņemtu null out 284 00:14:46,580 --> 00:14:51,840 dažu saraksta lasīt, jūs saņemsiet dažas neparedzamas kļūdas lejup 285 00:14:51,840 --> 00:14:52,620 līnija. 286 00:14:52,620 --> 00:14:54,890 >> Tas notika ar mani vasaras darbs, kad es biju, izmantojot R 287 00:14:54,890 --> 00:14:58,410 kur es mainīts, kā zināms saraksts tika noteikts vienas vietas 288 00:14:58,410 --> 00:15:05,410 bet nemainījās vēlāk par kods, kas lasa vērtības no tā. 289 00:15:05,410 --> 00:15:10,190 Un tā, kas notika, bija es biju lasījums Null vērtības no šī saraksta, 290 00:15:10,190 --> 00:15:13,090 iet tos funkcijām, un ir ļoti sajaukt 291 00:15:13,090 --> 00:15:16,000 kad es saņēmu visādas izlases infinities augkopība up 292 00:15:16,000 --> 00:15:16,790 Šajā funkciju. 293 00:15:16,790 --> 00:15:20,730 Jo, ja jūs pieteikties pārliecināts maksimālais vai minimālās funkcijas null, 294 00:15:20,730 --> 00:15:22,570 jūs saņemsiet bezgalīgu vērtības out. 295 00:15:22,570 --> 00:15:26,400 296 00:15:26,400 --> 00:15:29,180 >> Dati rāmji, viņi apakšklase saraksta. 297 00:15:29,180 --> 00:15:31,170 Katru vērtība ir vektors vienāda garuma. 298 00:15:31,170 --> 00:15:34,220 Un viņi izmanto, lai iesniegtu, būtībā, datu tabulas. 299 00:15:34,220 --> 00:15:36,175 Tur ir šī inicializācijas sintakse. 300 00:15:36,175 --> 00:15:38,800 Tas viss, atkal, ir daudz skaidrāks, ja jums uz demo. 301 00:15:38,800 --> 00:15:42,240 302 00:15:42,240 --> 00:15:44,240 Un jauka lieta par datu rāmji ir tas, ka jums 303 00:15:44,240 --> 00:15:49,380 var dot nosaukumus visām kolonnām un nosaukumus visiem rindām. 304 00:15:49,380 --> 00:15:53,890 Un tā tas padara piekļuvi viņiem mazliet draudzīgāku. 305 00:15:53,890 --> 00:15:59,130 Arī tas ir, kā vairums funkcijas, kas lasot datus no Excel izklājlapas 306 00:15:59,130 --> 00:16:03,820 vai no teksta failiem, piemēram, lasīs viņu datus. 307 00:16:03,820 --> 00:16:07,555 Tie būs nodot to daži datu rāmja veida. 308 00:16:07,555 --> 00:16:09,680 Tātad functions-- funkcijas sintakse ir mazliet dīvaini. 309 00:16:09,680 --> 00:16:16,160 Atkal tas ir nosaukums funkciju, piešķirt, šo atslēgvārdu funkciju un pēc tam 310 00:16:16,160 --> 00:16:17,900 argumentu sarakstā. 311 00:16:17,900 --> 00:16:24,080 Tātad ir dažas jaukas lietas par to, kā darbojas šeit strādāt. 312 00:16:24,080 --> 00:16:28,170 Attiecībā uz vienu, jūs faktiski var piešķirt standartvērtības uz dažiem argumentiem. 313 00:16:28,170 --> 00:16:32,910 Tātad jūs varat teikt R1 equals-- jūs varat teikt foo 314 00:16:32,910 --> 00:16:38,290 ir funkcija, kur R1 ir vienāds kaut pēc noklusējuma, ja lietotājs norāda 315 00:16:38,290 --> 00:16:39,090 nekādi argumenti. 316 00:16:39,090 --> 00:16:41,932 Pretējā gadījumā, tas ir kāds viņš likt. 317 00:16:41,932 --> 00:16:44,140 Un tas ir ļoti ērts jo daudz mūsu funkcijas 318 00:16:44,140 --> 00:16:47,910 ir bieži desmitiem vai simtiem argumentiem. 319 00:16:47,910 --> 00:16:51,210 Piemēram tie skicēšanai grafiki vai uzzīmējot izkliedes zemes gabalu 320 00:16:51,210 --> 00:16:54,430 ir argumenti, kas kontrolē viss no nosaukuma un asi 321 00:16:54,430 --> 00:16:59,512 uzlīmes uz krāsu regresijas līnijas. 322 00:16:59,512 --> 00:17:01,470 Un tāpēc, ja jūs nevēlaties lai cilvēki precizēt 323 00:17:01,470 --> 00:17:04,050 katrs no šiem simtiem argumentu 324 00:17:04,050 --> 00:17:07,674 kontrolē katru aspektu gabals vai regresijas vai kāds, 325 00:17:07,674 --> 00:17:09,299 tas ir jauki, ir šīs standartvērtības. 326 00:17:09,299 --> 00:17:12,700 327 00:17:12,700 --> 00:17:19,146 >> Un tad jūs varat faktiski rakstīt kā redzējāt atpakaļ šeit. 328 00:17:19,146 --> 00:17:22,869 Vai atrast labāku piemēru. 329 00:17:22,869 --> 00:17:28,690 Kad jūs zvanu funkciju jūs varat faktiski viņiem piezvanīt, izmantojot Arguments nosaukumiem. 330 00:17:28,690 --> 00:17:33,919 Tātad, šeit ir piemērs matrica konstruktors. 331 00:17:33,919 --> 00:17:34,960 Tas aizņem trīs argumentus. 332 00:17:34,960 --> 00:17:36,760 Parasti jums ir dati, kas ir vektors. 333 00:17:36,760 --> 00:17:38,920 Jums ir N rindu, kas ir rindu skaits. 334 00:17:38,920 --> 00:17:41,160 Jums ir N cols-- kolonnu skaitu. 335 00:17:41,160 --> 00:17:43,920 Šī lieta ir, ja jūs tipa N rinda vienāds neatkarīgi 336 00:17:43,920 --> 00:17:46,520 un N col vienāds jebko, kad tas jūs aicināt šo funkciju, 337 00:17:46,520 --> 00:17:47,770 jūs faktiski var mainīt tos. 338 00:17:47,770 --> 00:17:51,590 Tātad jūs varat likt N col pirmais un N rinda otrais un tas neko nemainītu. 339 00:17:51,590 --> 00:17:54,660 Tātad tas ir jauki maz iezīme. 340 00:17:54,660 --> 00:17:56,260 >> Vai importu un eksportu. 341 00:17:56,260 --> 00:18:00,010 To var izdarīt, būtībā. 342 00:18:00,010 --> 00:18:03,816 Ir arī iespējas izrakstīt patvaļīga R iebilst pret bināro failu 343 00:18:03,816 --> 00:18:05,190 un pēc tam lasīt tos atpakaļ vēlāk. 344 00:18:05,190 --> 00:18:08,030 Kas ir ērts, ja jūs darāt liels interaktīva sesija R 345 00:18:08,030 --> 00:18:12,850 un jums ir nepieciešams, lai saglabātu lietas ļoti ātri. 346 00:18:12,850 --> 00:18:16,460 Pēc noklusējuma R ir darba direktoriju ka failus saņemt rakstīts ārā 347 00:18:16,460 --> 00:18:19,410 un lasīt atpakaļ no. 348 00:18:19,410 --> 00:18:22,350 Jūs varat redzēt, ka ar getwg, nomainiet to ar setdw. 349 00:18:22,350 --> 00:18:25,630 Nekas īpaši interesants šeit 350 00:18:25,630 --> 00:18:28,270 >> Tātad tagad faktiskie statistika stuff-- multilinear regresiju. 351 00:18:28,270 --> 00:18:30,960 352 00:18:30,960 --> 00:18:34,910 Tik ierastās sintakse ir mazliet sarežģīta. 353 00:18:34,910 --> 00:18:37,260 Šis modelis ir liels objekts būtībā. 354 00:18:37,260 --> 00:18:39,910 Tas izpaužas piešķirts LM, kas ir funkcija zvanu. 355 00:18:39,910 --> 00:18:43,840 Pirmais elements, y tilde x1 plus neatkarīgi. 356 00:18:43,840 --> 00:18:46,574 357 00:18:46,574 --> 00:18:47,990 Mans sintakse šeit ir mazliet mulsinoša. 358 00:18:47,990 --> 00:18:49,490 Es esmu diezgan žēl, šis ir standarta veids 359 00:18:49,490 --> 00:18:50,990 ka datorzinātnes grāmatas izdarīt. 360 00:18:50,990 --> 00:18:54,890 Bet tas ir mazliet dīvaini. 361 00:18:54,890 --> 00:18:58,200 >> Vārdu sakot, tas ir lm iekavas, pirmais elements 362 00:18:58,200 --> 00:19:06,730 ir variable-- sorry, atkarīgs mainīgs tilde x1 x2 plus plus 363 00:19:06,730 --> 00:19:10,910 Tomēr daudziem neatkarīgiem mainīgie jums ir. 364 00:19:10,910 --> 00:19:14,240 Un tad tie var būt vai nu vektori, visi vienāda garuma. 365 00:19:14,240 --> 00:19:16,220 Vai arī viņi var būt sleja galvenes datu rāmi 366 00:19:16,220 --> 00:19:18,553 ka jūs vienkārši norādīt In Otrs arguments datu rāmi. 367 00:19:18,553 --> 00:19:23,270 368 00:19:23,270 --> 00:19:26,380 >> Jūs varat arī norādīt sarežģītāka formula 369 00:19:26,380 --> 00:19:31,990 tāpēc jums nav lineāri regresēt viens atkarīgais mainīgais, 370 00:19:31,990 --> 00:19:34,440 vai viens vektors uz iepriekš esošas vektors. 371 00:19:34,440 --> 00:19:38,070 To var izdarīt, piemēram, vektora komponentam y brusas plus 1 372 00:19:38,070 --> 00:19:42,100 un regress, ka pret log dažu citu vektors. 373 00:19:42,100 --> 00:19:45,200 Jūs varat izdrukāt kopsavilkumi modelis ar šo komandu sauc 374 00:19:45,200 --> 00:19:48,607 summary-- tikai kopsavilkums parens modeli. 375 00:19:48,607 --> 00:19:50,190 Atkal kaut kas cits man vajadzētu noskaidrot. 376 00:19:50,190 --> 00:19:55,407 377 00:19:55,407 --> 00:19:58,615 Kaut kas cits, kas saņems labots kad slaidi iet līdzi internetā. 378 00:19:58,615 --> 00:20:01,127 379 00:20:01,127 --> 00:20:03,210 Ja jūs vienkārši vēlaties, lai aprēķinātu vienkāršs korelācija 380 00:20:03,210 --> 00:20:09,170 Jūs varat izmantot korelācijas vektoru 1 vektors 2 funkcija kodols. 381 00:20:09,170 --> 00:20:11,856 Metode ir pēc noklusējuma Pearson sakarības. 382 00:20:11,856 --> 00:20:13,480 Tie ir standarta tie jūs varat darīt. 383 00:20:13,480 --> 00:20:15,990 Tur arī Spearman un Kendell sakarības 384 00:20:15,990 --> 00:20:19,530 kas ir dažas šķirnes rank pasūtījums korelācija. 385 00:20:19,530 --> 00:20:23,600 Nu tie nav aprēķināt produktu brīži starp pašām vektoriem, 386 00:20:23,600 --> 00:20:28,511 bet vektora rangu pasūtījumiem. 387 00:20:28,511 --> 00:20:29,510 Es paskaidrošu, ka vēlāk. 388 00:20:29,510 --> 00:20:30,120 >> Mērķauditorija: Quick jautājums 389 00:20:30,120 --> 00:20:30,360 >> Conner HARRIS: Protams. 390 00:20:30,360 --> 00:20:33,151 >> Mērķauditorija: Tātad, ja jūs aprēķinot par vienkāršu sakarības do 391 00:20:33,151 --> 00:20:37,655 jūs pieņemt, ka tur ir statistiskā nozīme uz korelāciju? 392 00:20:37,655 --> 00:20:39,030 Conner HARRIS: Jums nav. 393 00:20:39,030 --> 00:20:41,840 394 00:20:41,840 --> 00:20:43,960 LM ir būtībā tikai mašīna. 395 00:20:43,960 --> 00:20:47,690 Tas prasīs divas lietas un tas būs izspļaut 396 00:20:47,690 --> 00:20:49,770 koeficienti vispiemērotāko līnijas. 397 00:20:49,770 --> 00:20:52,310 Tā arī ziņo standarts kļūdas šiem koeficientiem. 398 00:20:52,310 --> 00:20:55,865 Un tas jums pateiks, piemēram, ir krustošanās statistiski nozīmīga 399 00:20:55,865 --> 00:20:56,740 vai atšķirība no 0. 400 00:20:56,740 --> 00:20:59,400 Vai slīpums no labākajiem fit line statistiski 401 00:20:59,400 --> 00:21:01,510 atšķiras no nulles, un tā tālāk. 402 00:21:01,510 --> 00:21:06,260 Tātad tas uzņemas neko, es domāju, ka ir labākā atbilde uz jūsu jautājumu. 403 00:21:06,260 --> 00:21:07,410 LABI. 404 00:21:07,410 --> 00:21:14,650 >> Plotting-- tāpēc galvenais iemesls, jums vajadzētu Izmanto R, tāpat multilinear regresiju. 405 00:21:14,650 --> 00:21:17,320 Būtībā katrs valoda ir dažas mehānismu, kas. 406 00:21:17,320 --> 00:21:21,365 Un godīgi R sintakse regresijas ir mazliet Arcane. 407 00:21:21,365 --> 00:21:22,990 Bet, uzzīmējot ir, ja tā tiešām spīd. 408 00:21:22,990 --> 00:21:28,090 >> Darbarīku funkcija ir gabals un tas aizņem divus vektorus, x un y. 409 00:21:28,090 --> 00:21:33,010 Un tad elipses apzīmē ļoti liels skaits izvēles argumentiem, kas 410 00:21:33,010 --> 00:21:39,190 kontrolēt visu, sākot no sadaļām ar krāsām Dažādu līnijām vai dažādās vietās, 411 00:21:39,190 --> 00:21:40,200 uz zemes gabala veida. 412 00:21:40,200 --> 00:21:42,250 Jūs varat būt izkliedi gabali vai līniju gabali. 413 00:21:42,250 --> 00:21:47,900 414 00:21:47,900 --> 00:21:49,710 >> [Dzirdams] 2 vektori vienāda garuma. 415 00:21:49,710 --> 00:21:53,780 Jūs varat pirms šo ar pievienotu datu rāmi jūsu skriptu. 416 00:21:53,780 --> 00:22:01,220 Un tas ļaus jums tikai izmantot kolonnu galvenes, nevis atsevišķu slimību pārnēsātājiem. 417 00:22:01,220 --> 00:22:05,410 Jūs varat pievienot atbilstošākās līnijas un vietējā regresijas līknes uz jūsu grafikā. 418 00:22:05,410 --> 00:22:09,390 >> Šīs komandas uzskaitīti šeit, ab line un līnijas, 419 00:22:09,390 --> 00:22:11,640 pēc noklusējuma tie nokļūt iestrādātas pop up logiem 420 00:22:11,640 --> 00:22:15,560 jo tā pieņem, ka jūs izmantojat R interaktīvi. 421 00:22:15,560 --> 00:22:17,310 Ja jūs neesat jūs varat rakstīt divus failus, kas 422 00:22:17,310 --> 00:22:21,600 ir tiešām jebkurā formātā vēlaties. 423 00:22:21,600 --> 00:22:25,410 Atvainojiet, man ir typo es tikko sapratu. 424 00:22:25,410 --> 00:22:30,887 425 00:22:30,887 --> 00:22:32,720 Ja jūs vēlaties, lai atvērtu cits grafisks ierīce 426 00:22:32,720 --> 00:22:39,200 Jūs varat izmantot šo funkciju sauc PNG vai JPEG vai daudz citu attēlu formātus. 427 00:22:39,200 --> 00:22:42,319 Un jūs varat rakstīt grafikus, lai kāds faila nosaukums norādāt. 428 00:22:42,319 --> 00:22:45,110 Lai atceltu, ka jums ir use-- Man nav rakstīt to uz slide-- 429 00:22:45,110 --> 00:22:49,650 bet tur ir funkcija sauc dev dot off ka aizņem ne argumentus. 430 00:22:49,650 --> 00:22:51,517 >> Tad ir iespējas 3D uzzīmējot 431 00:22:51,517 --> 00:22:53,350 un par kontūru uzzīmējot ja jūs vēlaties, lai 432 00:22:53,350 --> 00:22:55,700 grafiki diviem neatkarīgiem mainīgajiem. 433 00:22:55,700 --> 00:22:57,150 Es ne iekļuvuši tie tieši tagad. 434 00:22:57,150 --> 00:22:59,130 >> Ir arī daži iekārtas animācijas 435 00:22:59,130 --> 00:23:01,300 tie parasti ir uztur trešajām personām. 436 00:23:01,300 --> 00:23:06,330 Es esmu darījis animācijas ar R grafikus, bet man nav izmantoti šo trešo pusi 437 00:23:06,330 --> 00:23:06,940 bibliotēkām. 438 00:23:06,940 --> 00:23:09,929 Tāpēc es nevaru īsti apliecināt lai cik labi viņi ir. 439 00:23:09,929 --> 00:23:12,220 Ko es ieteiktu, ja vēlaties padarīt animācijas, izmantojot R 440 00:23:12,220 --> 00:23:16,480 tiek jūs varat rakstīt visu rāmji par animācijas 441 00:23:16,480 --> 00:23:18,470 un tad jūs varat izmantot trešā persona program-- 442 00:23:18,470 --> 00:23:23,630 tipiski tie tiek saukti par FFmpeg vai ImageMagick-- dūriens 443 00:23:23,630 --> 00:23:26,540 visiem jūsu rāmjiem iekļaušanu vienā animāciju. 444 00:23:26,540 --> 00:23:28,380 >> Tātad laika demo. 445 00:23:28,380 --> 00:23:31,030 446 00:23:31,030 --> 00:23:37,189 Tātad, ja jūs izmantojat jebkuru Unix līdzīgu sistēmu kas ir Linux BSD bet kurš izmanto BSD. 447 00:23:37,189 --> 00:23:39,730 OS X atvērt termināla logu un ierakstiet R pie komandrindas. 448 00:23:39,730 --> 00:23:42,820 Ja jums ir R studijā vai tamlīdzīgi, ka arī darbojas. 449 00:23:42,820 --> 00:23:46,270 Windows lietotājiem, jums vajadzētu būt iespēja atrast R jūsu Start izvēlnē. 450 00:23:46,270 --> 00:23:50,390 Būtu sauc par kaut ko tāpat R x64 3. kāds punkts. 451 00:23:50,390 --> 00:23:53,110 Atvērt ka tur augšā. 452 00:23:53,110 --> 00:23:58,850 >> Tāpēc tagad ļaujiet man tikai atvērt termināla logu. 453 00:23:58,850 --> 00:24:02,562 Labi, meklēt. 454 00:24:02,562 --> 00:24:03,520 Mērķauditorija: Command-Space 455 00:24:03,520 --> 00:24:06,675 Conner HARRIS: Command-Space, paldies. 456 00:24:06,675 --> 00:24:10,030 Man nav parasti izmanto Mac. 457 00:24:10,030 --> 00:24:13,310 Terminal, parādīt jaunu logu. 458 00:24:13,310 --> 00:24:18,120 Jauns logs ir iestatījumi pamata, R. Tātad jums vajadzētu saņemt 459 00:24:18,120 --> 00:24:22,230 apsveicams ziņa, kaut kas līdzīgs šim. 460 00:24:22,230 --> 00:24:31,060 >> Tāpēc es esmu, izmantojot R interaktīvi. 461 00:24:31,060 --> 00:24:32,719 Jūs varat arī rakstīt R skriptus, protams. 462 00:24:32,719 --> 00:24:34,510 Būtībā skripti palaist tieši tāpat kā 463 00:24:34,510 --> 00:24:40,250 ja tu sēdēja pie datora ierakstot katrā rindā pa vienam. 464 00:24:40,250 --> 00:24:42,660 Tāpēc sāksim izdarot vektoru. 465 00:24:42,660 --> 00:24:46,230 Arrow C 1, 2. 466 00:24:46,230 --> 00:24:49,400 1, 2, 4. 467 00:24:49,400 --> 00:24:50,050 Labi, protams. 468 00:24:50,050 --> 00:24:51,630 Es varu darīt fonta izmērs lielāks. 469 00:24:51,630 --> 00:24:53,030 >> Mērķauditorija: Command-Plus 470 00:24:53,030 --> 00:24:53,650 >> Conner HARRIS: Command-Plus. 471 00:24:53,650 --> 00:24:54,191 Command-Plus. 472 00:24:54,191 --> 00:24:57,610 473 00:24:57,610 --> 00:25:00,370 Visas tiesības, kā tas ir? 474 00:25:00,370 --> 00:25:00,870 Labs? 475 00:25:00,870 --> 00:25:01,551 LABI. 476 00:25:01,551 --> 00:25:03,300 Tāpēc sāksim ar atzīst vektora sarakstu. 477 00:25:03,300 --> 00:25:08,710 Vai, bultiņas, C 1.2.4. 478 00:25:08,710 --> 00:25:11,181 Mēs varam redzēt. 479 00:25:11,181 --> 00:25:12,680 Neuztraucieties par kronšteinu tur. 480 00:25:12,680 --> 00:25:18,590 Iekavās ir tādēļ, ja jums izdrukāt ļoti ilgi bloki, mēs varam, kur jūs esat. 481 00:25:18,590 --> 00:25:26,987 Viens piemērs būtu, ja es vienkārši vēlaties diapazons 2 200. 482 00:25:26,987 --> 00:25:28,820 Ja es drukāts ļoti garš masīvs, kronšteini 483 00:25:28,820 --> 00:25:31,060 ir tikai, lai es varētu saglabāt dziesmu no kuriem indekss 484 00:25:31,060 --> 00:25:33,250 mēs esam par, ja es esmu meklē caur šo vizuāli. 485 00:25:33,250 --> 00:25:36,570 486 00:25:36,570 --> 00:25:38,280 Tātad jebkurā gadījumā, mums ir. 487 00:25:38,280 --> 00:25:43,326 >> Tāpēc es teicu iepriekš, ka masīvi mijiedarboties ļoti labi ar, piemēram, 488 00:25:43,326 --> 00:25:44,450 unary darbības, piemēram, šis. 489 00:25:44,450 --> 00:25:46,500 Tātad, ko jūs domājat, ka es ņemšu iegūt, ja es ierakstiet plus 1? 490 00:25:46,500 --> 00:25:49,630 491 00:25:49,630 --> 00:25:51,140 Yep. 492 00:25:51,140 --> 00:25:54,250 Labais tagad es ņemšu veikt Tas atšķiras masīvs. 493 00:25:54,250 --> 00:26:01,650 Teiksim b c 20,40, 80. 494 00:26:01,650 --> 00:26:03,400 Tātad, ko jūs domājat šī komanda būs darīt? 495 00:26:03,400 --> 00:26:09,962 496 00:26:09,962 --> 00:26:10,670 Pievieno elementus. 497 00:26:10,670 --> 00:26:14,950 Un tā būtībā tas, ko tā dara. 498 00:26:14,950 --> 00:26:16,740 Tātad tas ir diezgan ērti. 499 00:26:16,740 --> 00:26:23,800 Tāpēc es kā par man darīt. c ir, teiksim, 6 reizes no 1 līdz 10. 500 00:26:23,800 --> 00:26:26,789 501 00:26:26,789 --> 00:26:28,830 Tātad, ko darīt, es gribu redzēt ietverts, jūs domājat? 502 00:26:28,830 --> 00:26:37,110 503 00:26:37,110 --> 00:26:38,110 Tātad viss daudzkārtņi seši. 504 00:26:38,110 --> 00:26:42,170 Tagad, ko jūs domājat notiks, ja es to varu darīt? 505 00:26:42,170 --> 00:26:48,090 Es ņemšu padara šo mazliet skaidrāku, C, C. 506 00:26:48,090 --> 00:26:50,365 Tātad, kas notiek, vai ne domāju, ja man darīt? 507 00:26:50,365 --> 00:26:51,488 plus c. 508 00:26:51,488 --> 00:26:55,550 509 00:26:55,550 --> 00:26:56,050 [Dzirdams] 510 00:26:56,050 --> 00:26:58,552 511 00:26:58,552 --> 00:27:02,350 >> Mērķauditorija: nu kļūda, vai tas tikai piebilst, pirmos trīs elementus. 512 00:27:02,350 --> 00:27:04,510 >> Conner HARRIS: Ne gluži. 513 00:27:04,510 --> 00:27:05,522 Tas ir tas, ko mēs saņēmām. 514 00:27:05,522 --> 00:27:08,910 Kas notiek, ir īsāks masīvs, a, got iestatīti. 515 00:27:08,910 --> 00:27:13,990 Tātad, mēs saņēmām 124, 124, 124. 516 00:27:13,990 --> 00:27:15,710 Jā. 517 00:27:15,710 --> 00:27:18,940 Un būtībā, jūs varat apskatīt Šī uzvedība pirms, plus 1, 518 00:27:18,940 --> 00:27:22,190 kā apakšklase šo rīcību, ja īsākais masīvs ir tikai skaitlis 519 00:27:22,190 --> 00:27:25,410 1, kas ir viens elements masīvs. 520 00:27:25,410 --> 00:27:27,740 Es vienkārši pasakot vektors visu laiks, nevis masīvs, 521 00:27:27,740 --> 00:27:30,290 jo tas ir tas, ko r dokumentācija parasti dara. 522 00:27:30,290 --> 00:27:33,070 Tas ir iesakņojusies c ieradums. 523 00:27:33,070 --> 00:27:37,590 >> Labi, tāpēc tagad mums ir šī masīvs. 524 00:27:37,590 --> 00:27:38,830 Tāpēc mums ir šī masīvs, c. 525 00:27:38,830 --> 00:27:41,380 Mēs varam iegūt kopsavilkumu statistiku par C, kopsavilkuma c. 526 00:27:41,380 --> 00:27:46,920 527 00:27:46,920 --> 00:27:48,280 Un tas ir jauki. 528 00:27:48,280 --> 00:27:51,070 529 00:27:51,070 --> 00:27:52,670 Tāpēc tagad pieņemsim darīt dažas matricas lietas. 530 00:27:52,670 --> 00:27:56,160 Teiksim m ir matrica. 531 00:27:56,160 --> 00:27:57,780 Veidosim to trīs ar trīs vienā. 532 00:27:57,780 --> 00:28:01,630 Tātad nrows vienāds 3, un ncols vienāds ar 3. 533 00:28:01,630 --> 00:28:04,190 534 00:28:04,190 --> 00:28:10,710 Un datiem pieņemsim do-- lai to, ko Vai jūs domājat, ka tas ir gatavojas darīt? 535 00:28:10,710 --> 00:28:15,310 536 00:28:15,310 --> 00:28:16,580 >> Pareizi, tas ir nākamais. 537 00:28:16,580 --> 00:28:17,970 Tas ir nrow un ncolumn. 538 00:28:17,970 --> 00:28:22,164 539 00:28:22,164 --> 00:28:24,580 Tātad, ko es esmu darījis, ir es esmu pasludināja trīs ar trīs matrica 540 00:28:24,580 --> 00:28:26,950 un es esmu pieņemts deviņu elementu masīvu. 541 00:28:26,950 --> 00:28:30,530 Tātad logaritmu visu elementi viens līdz deviņi. 542 00:28:30,530 --> 00:28:33,400 543 00:28:33,400 --> 00:28:37,285 Un visi šie lielumi aizpildīt up array-- žēl? 544 00:28:37,285 --> 00:28:38,660 Mērķauditorija: Tie ir parastie 10 žurnāli? 545 00:28:38,660 --> 00:28:41,284 Conner HARRIS: Nē, žurnāls ir naturālie logaritmi, tā bāze e. 546 00:28:41,284 --> 00:28:44,886 547 00:28:44,886 --> 00:28:47,010 Jā, ja jūs vēlētos bāze 10 log, es domāju, ka jūs ir 548 00:28:47,010 --> 00:28:51,620 lai pieteiktos kāds, kas dalīts ar log 10. 549 00:28:51,620 --> 00:28:56,750 Un tik datiem [nedzirdama] vienkārši aizpilda masīvu, tāpēc augšas uz leju, 550 00:28:56,750 --> 00:28:59,490 tad kreisās uz labo. 551 00:28:59,490 --> 00:29:06,890 Un, ja jūs vēlētos darīt kādu citu masīvs, teiksim n ir matrica. 552 00:29:06,890 --> 00:29:10,317 Darīsim, es nezinu, no 2 līdz 13. 553 00:29:10,317 --> 00:29:11,900 Vai es darīšu kaut ko vairāk interesantu. 554 00:29:11,900 --> 00:29:13,770 Es darīšu 2 līdz 4. 555 00:29:13,770 --> 00:29:15,780 nrow vienāds, teiksim, 3. 556 00:29:15,780 --> 00:29:18,992 ncol vienāds 4. 557 00:29:18,992 --> 00:29:20,360 n. 558 00:29:20,360 --> 00:29:22,090 Tātad, mēs esam ieguvuši to. 559 00:29:22,090 --> 00:29:26,130 >> Un tagad, ja mēs gribam vairoties tiem, mēs darītu n procentiem reizes procentiem, 560 00:29:26,130 --> 00:29:27,680 jo tas ir n. 561 00:29:27,680 --> 00:29:30,234 562 00:29:30,234 --> 00:29:31,400 Un mums ir matricas produktus. 563 00:29:31,400 --> 00:29:33,970 564 00:29:33,970 --> 00:29:37,810 Līdz viņi veidā, jūs redzēt, kā kad es atzīts par N, tad 2. līdz 4. 565 00:29:37,810 --> 00:29:43,570 vektors got iestatīti līdz tas piepilda visas n? 566 00:29:43,570 --> 00:29:45,710 Ja jūs vēlētos, lai ņemtu eigenvalue sadalīšanās, 567 00:29:45,710 --> 00:29:46,960 Tas ir kaut kas, mēs varam izdarīt ļoti viegli. 568 00:29:46,960 --> 00:29:47,709 Mēs varam darīt EIGEN n. 569 00:29:47,709 --> 00:29:52,290 570 00:29:52,290 --> 00:29:54,600 Un tā tas ir mūsu pirmais sastopas ar sarakstu. 571 00:29:54,600 --> 00:29:57,000 >> Tātad Eigen n ir saraksts ar divām atslēgām. 572 00:29:57,000 --> 00:29:58,430 Vērtības, kas ir šis masīvs šeit. 573 00:29:58,430 --> 00:30:01,030 Un vektori, kas ir šī masīvs šeit. 574 00:30:01,030 --> 00:30:08,240 Tātad, ja jūs vēlaties iegūt, teiksim, šis trešais sleja 575 00:30:08,240 --> 00:30:13,080 No eigenvectors matricas, jo tad eigenvectors ir kolonnu vektori. 576 00:30:13,080 --> 00:30:24,400 Tātad, mēs varam darīt VEC EIGEN n dolāra zīmi vektori, komats 3, no [nedzirdama]. 577 00:30:24,400 --> 00:30:29,800 578 00:30:29,800 --> 00:30:30,900 VEC. 579 00:30:30,900 --> 00:30:34,100 Vai tas, kā jūs varētu gaidīt. 580 00:30:34,100 --> 00:30:39,210 >> Tad saka n reizes procenti reizes VEC. 581 00:30:39,210 --> 00:30:42,610 582 00:30:42,610 --> 00:30:48,320 Tātad rezultāts šeit, protams, izskatās ja mēs ņēmām trešo eigenvalue šeit, 583 00:30:48,320 --> 00:30:50,390 kas atbilst trešais Eigenvector. 584 00:30:50,390 --> 00:30:53,190 Tas tikai reizināts viss Tas Eigenvector, komponents, gudrs, 585 00:30:53,190 --> 00:30:53,990 ko eigenvalue. 586 00:30:53,990 --> 00:30:57,760 Un tas, ko mēs varētu sagaidīt, jo tas, ko īpašvērtības ir. 587 00:30:57,760 --> 00:31:00,890 Vai kāds šeit nav ņemti lineārā algebra? 588 00:31:00,890 --> 00:31:02,530 Pāris cilvēki, OK. 589 00:31:02,530 --> 00:31:04,030 Just savukārt jūsu smadzenes off mazliet. 590 00:31:04,030 --> 00:31:07,490 591 00:31:07,490 --> 00:31:20,720 Un tiešām, ja mēs ņemam EIGEN n dolāra zīmi vērtības 3 reizes VEC, 592 00:31:20,720 --> 00:31:21,810 labi saņemt to pašu. 593 00:31:21,810 --> 00:31:24,726 Tas ir formatēta savādāk kā pēc kārtas vektors tā vietā, lai kolonnas vektora, 594 00:31:24,726 --> 00:31:25,640 bet īpašs. 595 00:31:25,640 --> 00:31:29,430 596 00:31:29,430 --> 00:31:35,170 Un tā tie būtībā ir jauki lietas, ko mēs varam darīt ar matricām, 597 00:31:35,170 --> 00:31:36,489 pierādīja sarakstus. 598 00:31:36,489 --> 00:31:39,030 Es būtu jāpierāda jauki lietas par funkcijām, kā arī. 599 00:31:39,030 --> 00:31:41,750 >> Tātad pieņemsim say-- [nedzirdama] funkcija, sauksim 600 00:31:41,750 --> 00:31:51,960 tas func pret funkciju n n squared-- patiesībā, tas nav īsti labākais. 601 00:31:51,960 --> 00:31:55,632 a, B, A kvadrātā plus b. 602 00:31:55,632 --> 00:31:58,547 603 00:31:58,547 --> 00:32:00,380 Tātad viena lieta par funkcijas, atkal, ir tie 604 00:32:00,380 --> 00:32:01,963 nav nepieciešams skaidri atgriešanās paziņojumus. 605 00:32:01,963 --> 00:32:04,250 Tātad jūs varat just-- pēdējais apgalvojums novērtēts 606 00:32:04,250 --> 00:32:07,502 būs paziņojumu atpakaļ, vai vērtība atgriezās. 607 00:32:07,502 --> 00:32:10,460 Tātad šajā gadījumā, mēs esam tikai izvērtējot vienu pārskatu, kvadrātā plus b. 608 00:32:10,460 --> 00:32:12,043 Tas būs noklusējuma atgriešanās vērtība. 609 00:32:12,043 --> 00:32:14,530 Tā nekad sāp, lai nodrošinātu, atgriešanās vērtības skaidri, 610 00:32:14,530 --> 00:32:16,880 it īpaši, ja jums ir darīšana ar funkcija ir ļoti sarežģīta loģika 611 00:32:16,880 --> 00:32:17,380 plūst. 612 00:32:17,380 --> 00:32:18,450 Bet jums nav nepieciešams. 613 00:32:18,450 --> 00:32:24,890 Tāpēc tagad mēs varam darīt FUNC 5, 1, un Tas ir būtībā tas, ko jūs gaidījāt. 614 00:32:24,890 --> 00:32:29,146 615 00:32:29,146 --> 00:32:31,270 Kaut kas cits, mēs varam darīt, mēs faktiski var darīt lē B 616 00:32:31,270 --> 00:32:33,260 ir vienāds ar 1, A ir vienāds ar 5. 617 00:32:33,260 --> 00:32:36,870 618 00:32:36,870 --> 00:32:40,770 Tātad, ja mēs norādīt, cik daudz šeit, kas arguments iet uz kuru arguments 619 00:32:40,770 --> 00:32:44,680 in funkciju, mēs varam uzsist apkārt Šīs vērtības kur mēs gribam. 620 00:32:44,680 --> 00:32:48,405 >> Mērķauditorija: Vai ir iemesls rakstīt to veic ar b 621 00:32:48,405 --> 00:32:52,404 vienāds, nevis tikai, izmantojot numuri un komats? 622 00:32:52,404 --> 00:32:54,820 Conner HARRIS: Jā, parasti darīt, ja jums ir funkcijas 623 00:32:54,820 --> 00:32:58,540 ar daudz argumentu. 624 00:32:58,540 --> 00:33:00,690 Tas bieži vien var būt, piemēram, karogi, ka jūs tikai 625 00:33:00,690 --> 00:33:03,130 vēlaties izmantot retos gadījumos. 626 00:33:03,130 --> 00:33:06,740 Un šādā veidā jūs varat only-- jums var atsaukties uz konkrētiem argumentiem 627 00:33:06,740 --> 00:33:09,110 ka jūs vēlaties izmantot non-standartvērtības, 628 00:33:09,110 --> 00:33:14,470 un jums nav izrakstīt ķekars karogi vienāds nepatiesa pēc tiem. 629 00:33:14,470 --> 00:33:19,710 Vai es varu uzrakstīt šo atkal noklusējuma vērtība, piemēram, b atbilst 2. 630 00:33:19,710 --> 00:33:26,289 Un tad es varētu darīt f FUNC, Es darīšu 4, 1 šoreiz. 631 00:33:26,289 --> 00:33:28,580 Un 17, kas ir par 4 brusas plus 1, kā jūs varētu gaidīt. 632 00:33:28,580 --> 00:33:34,290 >> Bet es varētu arī vienkārši saucam ar FUNC 4, 633 00:33:34,290 --> 00:33:36,970 un es nopirkšu 18, jo Man nav norādīts b. 634 00:33:36,970 --> 00:33:38,550 Tātad b izpaužas noklusēto vērtību 2. 635 00:33:38,550 --> 00:33:41,700 636 00:33:41,700 --> 00:33:47,200 >> Labi, tāpēc tagad, ja jūs esat pēc kopā ar demo, 637 00:33:47,200 --> 00:33:51,010 ierakstiet šo līniju jūsu komandu ātri un redzēt, kas nāk uz augšu. 638 00:33:51,010 --> 00:33:52,090 Patiesībā, nedari to. 639 00:33:52,090 --> 00:33:52,590 Ierakstiet šo. 640 00:33:52,590 --> 00:33:57,780 641 00:33:57,780 --> 00:34:01,000 Jums vajadzētu saņemt kaut kas līdzīgs šim. 642 00:34:01,000 --> 00:34:04,780 Tātad mtcars ir iebūvēts datu noteikti šīs demonstrācijas 643 00:34:04,780 --> 00:34:13,550 mērķiem, kas nāk with-- kas nāk pēc noklusējuma ar savu r izplatīšanu. 644 00:34:13,550 --> 00:34:19,211 Tas ir apkopojums par statistiku 1974 jautājums Motor Trend žurnālā 645 00:34:19,211 --> 00:34:20,710 par vairākiem dažādiem auto modeļiem. 646 00:34:20,710 --> 00:34:28,270 >> Tātad tur ir jūdzes uz vienu galonu, cylinders-- Es aizmirst to, ko disp is-- zirgspēku. 647 00:34:28,270 --> 00:34:31,610 648 00:34:31,610 --> 00:34:32,420 Droši vien. 649 00:34:32,420 --> 00:34:36,920 Ja jūs vienkārši Google MT automašīnām, tad viens no pirmajiem rezultātiem 650 00:34:36,920 --> 00:34:38,730 būs no oficiāls r dokumentācija 651 00:34:38,730 --> 00:34:41,080 un tas izskaidros Visi šie datu lauki. 652 00:34:41,080 --> 00:34:47,020 Tātad svars is-- WT ir automobiļa svars tonnās. 653 00:34:47,020 --> 00:34:48,880 Q sek ir ceturksnis jūdžu laiks. 654 00:34:48,880 --> 00:34:52,409 655 00:34:52,409 --> 00:34:55,850 Tāpēc tagad mēs varam darīt dažas jautras lietas Par MT automašīnām ir datu lauks. 656 00:34:55,850 --> 00:35:01,640 >> Tātad, mēs varam darīt lietas piemēram, rindu nosaukumiem, MT automašīnām. 657 00:35:01,640 --> 00:35:05,490 Un tas ir saraksts ar visiem rindas noteiktie dati, kas ir vārdi automašīnām. 658 00:35:05,490 --> 00:35:10,780 Mēs varam darīt colnames, MT automašīnas šo. 659 00:35:10,780 --> 00:35:15,500 Ja jūs mt automašīnas, sub-skaitliskā indekss, piemēram, 2. 660 00:35:15,500 --> 00:35:18,177 mēs otro kolonnu no Tas, kas būtu balonus. 661 00:35:18,177 --> 00:35:19,370 >> Mērķauditorija: Ko jūs darījāt? 662 00:35:19,370 --> 00:35:21,570 >> Conner HARRIS: es drukāti mt automašīnas, kronšteini e, 663 00:35:21,570 --> 00:35:24,180 kas deva man otro kolonna no mt automašīnām. 664 00:35:24,180 --> 00:35:34,501 665 00:35:34,501 --> 00:35:38,110 Vai, ja mēs gribam pēc kārtas, es varu rakstīt mtcars Comma 2, piemēram. 666 00:35:38,110 --> 00:35:41,850 667 00:35:41,850 --> 00:35:46,390 Cita apaļas 2 komats, piemēram, ka. 668 00:35:46,390 --> 00:35:48,880 Un, kas iet jūsu rindā. 669 00:35:48,880 --> 00:35:54,680 Tas šeit tikai dod jums kolonna, bet kolonna kā vektors. 670 00:35:54,680 --> 00:36:04,634 671 00:36:04,634 --> 00:36:06,425 Es tikko sapratu, tagad es aizmirsu demonstrēt 672 00:36:06,425 --> 00:36:09,150 dažas labas lietas par vektoriem ka jūs varat darīt ar indeksiem. 673 00:36:09,150 --> 00:36:10,480 Tāpēc ļaujiet man darīt tieši tagad. 674 00:36:10,480 --> 00:36:17,130 Tātad, pieņemsim do c gets-- liekot šo par pause-- 2 reizes 1 līdz 10. 675 00:36:17,130 --> 00:36:21,360 Tātad c ir tikai būs vektors 2 līdz 20. 676 00:36:21,360 --> 00:36:24,640 Es varu ņemt elementus, piemēram, tas, C2. 677 00:36:24,640 --> 00:36:30,942 Es varu iet ar vektoru piemēram, tas, C- let me 678 00:36:30,942 --> 00:36:34,470 izmantot citu nosaukumu nekā c, tāpat VEC c. 679 00:36:34,470 --> 00:36:37,591 680 00:36:37,591 --> 00:36:39,340 Būtībā, es esmu dara šo, lai jūs nesaņemat 681 00:36:39,340 --> 00:36:45,010 sajaukt starp C kā vektors būvniecība funkcija, 682 00:36:45,010 --> 00:36:48,800 un tad c kā mainīgā nosaukums. 683 00:36:48,800 --> 00:36:53,120 VEC kronšteini c 4, 5, 7. 684 00:36:53,120 --> 00:36:56,540 Tas saņemsiet mani ceturto, piekto, un septiņi elementi masīva. 685 00:36:56,540 --> 00:37:01,740 Es varu darīt VEC, ielieciet negatīva indekss, piemēram, negatīva 4. 686 00:37:01,740 --> 00:37:06,500 Ka saņems mani tas ar ceturtais elements noņemts. 687 00:37:06,500 --> 00:37:10,140 Tad, ja es gribēju darīt šķēles, Es varu darīt VEC 2 līdz 6. 688 00:37:10,140 --> 00:37:15,480 2 resnās 6 ir tikai vēl viens vektors, kas ir 2, 3, 4, 5, 6. 689 00:37:15,480 --> 00:37:18,230 Atklepo ka. 690 00:37:18,230 --> 00:37:20,770 >> Tātad jebkurā gadījumā, atpakaļ pie mt automašīnām. 691 00:37:20,770 --> 00:37:26,650 692 00:37:26,650 --> 00:37:28,450 Tātad, pieņemsim darīt dažas regresiju. 693 00:37:28,450 --> 00:37:34,240 Teiksim modelis gets-- pieņemsim lineāri regress-- Es nezinu. 694 00:37:34,240 --> 00:37:41,780 Pirmkārt Darīsim pievienot mtcars, protams. 695 00:37:41,780 --> 00:37:44,870 696 00:37:44,870 --> 00:38:00,010 Tātad [dzirdams] Modelis LM, pieņemsim regress jūdzes uz vienu galonu uz Tilde svaru. 697 00:38:00,010 --> 00:38:03,300 Un tad dati rāmis ir mtcars. 698 00:38:03,300 --> 00:38:06,830 Tātad kopsavilkums modelis. 699 00:38:06,830 --> 00:38:12,900 700 00:38:12,900 --> 00:38:15,595 >> Labi, tāpēc tas izskatās mazliet sarežģītāk. 701 00:38:15,595 --> 00:38:19,380 Bet būtībā, redzot, kā tad, ja mēs mēģināt izteikt jūdzes uz vienu galonu 702 00:38:19,380 --> 00:38:23,970 kā lineāru funkciju no svara, tad mēs saņēmām šo līniju šeit, 703 00:38:23,970 --> 00:38:28,730 kas pārtver at 37.28. 704 00:38:28,730 --> 00:38:33,830 37,28 būtu teorētiskie jūdzes vienu galonu auto, kas sver nulli. 705 00:38:33,830 --> 00:38:41,210 Un tad par katru papildu tonnu, jūs pieklauvēt apmēram piecas jūdzes uz vienu galonu 706 00:38:41,210 --> 00:38:42,440 off no tā. 707 00:38:42,440 --> 00:38:45,120 Abi šie koeficienti jums var redzēt, standarta kļūdas tur. 708 00:38:45,120 --> 00:38:47,870 Un tie ir ļoti statistiski nozīmīga. 709 00:38:47,870 --> 00:38:55,740 >> Tātad, mēs varam būt ļoti noteikti 1 e 10 uz negatīvo 10. 710 00:38:55,740 --> 00:38:59,510 Tātad 1 reizes kaut ko negatīvu 10, ka, ja jūs veicat smagāks auto, 711 00:38:59,510 --> 00:39:01,440 tas būs sliktāks jūdzes uz vienu galonu. 712 00:39:01,440 --> 00:39:04,940 713 00:39:04,940 --> 00:39:07,250 Vai arī mēs varam pārbaudīt kādu citu modeli. 714 00:39:07,250 --> 00:39:09,230 Tāpat vietā regresē šo par svaru, 715 00:39:09,230 --> 00:39:12,600 pieņemsim regresēt to uz žurnāla svara, jo varbūt efektīvai svara 716 00:39:12,600 --> 00:39:15,690 gada nobraukums ir kaut kā nav lineāra. 717 00:39:15,690 --> 00:39:18,540 >> Tas deva mums r brusas no 0.7528. 718 00:39:18,540 --> 00:39:19,610 Tātad, pieņemsim mēģināt šo. 719 00:39:19,610 --> 00:39:21,485 Šoreiz pieņemsim darīt atšķirīgs mainīgs, too. 720 00:39:21,485 --> 00:39:22,500 Model2. 721 00:39:22,500 --> 00:39:24,800 Tātad kopsavilkums, model2. 722 00:39:24,800 --> 00:39:28,200 723 00:39:28,200 --> 00:39:31,390 Labi, tāpēc atkal mēs saņēmām mūsu atbilstošāko līniju šeit. 724 00:39:31,390 --> 00:39:36,160 Un tas LAIKU_ tas ir saprotams, būtībā, ka katru reizi, kad 725 00:39:36,160 --> 00:39:38,090 palielināt svaru auto ar koeficientu e 726 00:39:38,090 --> 00:39:40,580 jūs zaudējat šo vairākas jūdzes uz vienu galonu. 727 00:39:40,580 --> 00:39:43,210 728 00:39:43,210 --> 00:39:50,326 >> Un tā šoreiz mūsu atlikušo standarts kļūda it-- ka nav svarīgi, tiešām. 729 00:39:50,326 --> 00:39:53,540 Atlikušais standarta kļūda ir būtībā tikai standarta kļūda 730 00:39:53,540 --> 00:39:57,760 kas jums ir pa kreisi pēc tam, kad atņemt tendence līniju. 731 00:39:57,760 --> 00:40:02,805 Un mūsu r šeit brusas ir 0.81, kas ir nedaudz labāk nekā tas, ko 732 00:40:02,805 --> 00:40:07,640 mums bija pirms 0.52. 733 00:40:07,640 --> 00:40:09,750 >> Un tāpēc tagad pieņemsim pievienot Termins šo regresu. 734 00:40:09,750 --> 00:40:13,020 Tātad pieņemsim regresēt jūdzes uz vienu galonu gan uz žurnāla svaru 735 00:40:13,020 --> 00:40:21,130 un, pieņemsim darīt, Q jūdzes, ceturtdaļa jūdžu laiks. 736 00:40:21,130 --> 00:40:26,190 OK, tai jābūt the-- visas tiesības, qsec. 737 00:40:26,190 --> 00:40:26,690 Qsec. 738 00:40:26,690 --> 00:40:30,630 739 00:40:30,630 --> 00:40:35,000 Actually-- žēl, ko? 740 00:40:35,000 --> 00:40:37,000 Ļaujiet man nosaukt šo kaut ko cits bez model2. 741 00:40:37,000 --> 00:40:38,000 Ļaujiet man nosaukt šo model3. 742 00:40:38,000 --> 00:40:40,860 743 00:40:40,860 --> 00:40:42,900 Un tāpēc tagad mēs varam darīt kopsavilkuma model3. 744 00:40:42,900 --> 00:40:46,850 745 00:40:46,850 --> 00:40:49,100 Un tā atkal, tas ir pamatā ko jūs varētu sagaidīt. 746 00:40:49,100 --> 00:40:51,750 Jums ir pozitīva pārtvert. 747 00:40:51,750 --> 00:40:54,550 Efektīva palielinot svars ir negatīvs. 748 00:40:54,550 --> 00:40:58,490 Un efektīva palielinot ceturksnis jūdze laiks 749 00:40:58,490 --> 00:41:02,420 ir pozitīva, bet gan mazāk nekā svara. 750 00:41:02,420 --> 00:41:06,010 Tagad intuitīvi, jūs varat veikt sajūtu sakot domāt par sporta automašīnām. 751 00:41:06,010 --> 00:41:08,950 Tur ir ļoti liela paātrinājuma, Ļoti īsā ceturtdaļjūdzi reizes. 752 00:41:08,950 --> 00:41:13,729 Viņi arī gatavojas izmantot vairāk gāzes, tā kā vairāk saprātīgi automašīnas dodas 753 00:41:13,729 --> 00:41:16,020 ir lēnāka paātrinājumu, augstākas ceturtdaļjūdzi reizes, 754 00:41:16,020 --> 00:41:20,890 un patērē mazāk gāzes ,, tāpēc augstākas jūdzes uz vienu galonu. 755 00:41:20,890 --> 00:41:21,390 Liels. 756 00:41:21,390 --> 00:41:23,431 Un tāpēc tagad ir pienācis laiks gabals kaut kas līdzīgs šim. 757 00:41:23,431 --> 00:41:27,810 Tātad pieņemsim do-- tik tukša kauli mēs varam darīt plots-- 758 00:41:27,810 --> 00:41:35,280 jo es esmu pievienots šo informāciju rāmi before-- mēs varam vienkārši darīt gabalu, WT mpg. 759 00:41:35,280 --> 00:41:38,762 760 00:41:38,762 --> 00:41:39,720 Padarīt šo mazliet lielāks. 761 00:41:39,720 --> 00:41:55,050 762 00:41:55,050 --> 00:41:57,350 Tur, mēs būtībā have a izbārstīt gabals, bet punkti 763 00:41:57,350 --> 00:41:58,690 ir sava veida grūti saprast, par šo. 764 00:41:58,690 --> 00:42:04,860 765 00:42:04,860 --> 00:42:10,900 >> Es neatceros nesagatavots ko sintakse ir mainīt zemes gabalu. 766 00:42:10,900 --> 00:42:14,100 Tāpēc es domāju, ka tas būs labs laiks audzināt, 767 00:42:14,100 --> 00:42:18,000 tur ir ļoti jauks Iebūvēts palīdzība iezīme, palīdzība pēdiņām funkcijas nosaukums. 768 00:42:18,000 --> 00:42:21,690 Mēs audzināt būtībā kaut kas jūs vēlaties. 769 00:42:21,690 --> 00:42:28,010 770 00:42:28,010 --> 00:42:32,730 Es domāju, ka es tiešām to izdarītu tips vienāds p punktiem gabaliem. 771 00:42:32,730 --> 00:42:34,369 Vai tas kaut ko mainīt? 772 00:42:34,369 --> 00:42:35,160 Un nē, nav īsti. 773 00:42:35,160 --> 00:42:39,160 774 00:42:39,160 --> 00:42:39,660 Viss kārtībā. 775 00:42:39,660 --> 00:42:46,760 776 00:42:46,760 --> 00:42:49,580 >> Kādu iemeslu dēļ, kad man bija šis manā datorā, kamēr atpakaļ, 777 00:42:49,580 --> 00:42:52,080 visi izbārstīt punkti bija daudz skaidrāks. 778 00:42:52,080 --> 00:43:06,390 779 00:43:06,390 --> 00:43:13,970 Jebkurā gadījumā, ir izkliedes veida redzams? 780 00:43:13,970 --> 00:43:15,124 Tur ir viens tur. 781 00:43:15,124 --> 00:43:16,165 Daži tur, daži tur. 782 00:43:16,165 --> 00:43:18,860 783 00:43:18,860 --> 00:43:21,185 Jūs varat kārtot redzēt, vai ne? 784 00:43:21,185 --> 00:43:24,310 Tātad, ja mēs gribam, lai pievienotu atbilstošāko līniju uz šo zemes gabalu šeit, kas ir nedaudz tukša 785 00:43:24,310 --> 00:43:29,290 bones-- ļaujiet man to mazliet jaukāku. 786 00:43:29,290 --> 00:43:38,075 Galvenais ir vienāds pret svaru. 787 00:43:38,075 --> 00:43:46,322 788 00:43:46,322 --> 00:43:49,740 Jūdzes uz vienu galonu. 789 00:43:49,740 --> 00:43:53,570 Atkal, jūs varat redzēt, cik noderīgs izvēles argumenti šeit ar arī 790 00:43:53,570 --> 00:43:58,090 kam nav likt lietas noteiktā secībā ar tastatūras argumentiem 791 00:43:58,090 --> 00:44:01,600 ja Jums ir zemes gabalu, jo tie aizņemt daudz argumentu. 792 00:44:01,600 --> 00:44:07,490 >> Xlab vienāds svars, svars, tonnas. 793 00:44:07,490 --> 00:44:10,091 794 00:44:10,091 --> 00:44:10,590 Viss kārtībā. 795 00:44:10,590 --> 00:44:17,340 796 00:44:17,340 --> 00:44:21,480 Labi, jā, šī ierīce tiek mazliet kaitinošas. 797 00:44:21,480 --> 00:44:30,160 Bet jūs varat redzēt veida tur augšā, tur ir diagramma nosaukums pusē. 798 00:44:30,160 --> 00:44:35,260 Vairāk nekā šeit there's-- uz grunts šeit ir ass etiķetes. 799 00:44:35,260 --> 00:44:37,700 Es neatceros nesagatavots ko komandas ars-- 800 00:44:37,700 --> 00:44:41,000 kādi funkcijas ir palielināt lielums šīm uzlīmēm un nosaukumiem, 801 00:44:41,000 --> 00:44:43,110 bet viņi tur. 802 00:44:43,110 --> 00:44:46,625 >> Un tāpēc, ja mēs gribam, lai pievienojiet atbilstošāko līniju, 803 00:44:46,625 --> 00:44:49,250 mēs varētu darīt kaut ko like-- I ir sintakse rakstīts šeit. 804 00:44:49,250 --> 00:44:52,280 805 00:44:52,280 --> 00:45:11,130 Tik atceros, mēs vienkārši pievienojiet modeli bija mpg, svars, mtcars. 806 00:45:11,130 --> 00:45:16,470 Un tāpēc, ja es gribēju, lai pievienotu atbilstošāko line, es varētu darīt, b līnijas modeli. 807 00:45:16,470 --> 00:45:18,556 Un boom, mums ir atbilstošāko līniju. 808 00:45:18,556 --> 00:45:19,970 Tas ir sava veida grūti redzēt vēlreiz. 809 00:45:19,970 --> 00:45:22,178 Es esmu diezgan atvainojos par tehnoloģiskās grūtības. 810 00:45:22,178 --> 00:45:25,230 Bet tas darbojas būtībā augšas pa kreisi uz leju pa labi. 811 00:45:25,230 --> 00:45:27,550 >> Un, ja mērogs būtu lielāks, jūs varētu redzēt 812 00:45:27,550 --> 00:45:31,260 ka krustošanās ir tas, ko jūs varat atrast no kopsavilkuma statistiku 813 00:45:31,260 --> 00:45:34,790 ja jūs tipa kopsavilkuma modeli. 814 00:45:34,790 --> 00:45:40,130 Labi, tāpēc es ceru, ka visi saņem kaut sajūtu par to, kas 815 00:45:40,130 --> 00:45:42,030 R ir, kas tas ir labs. 816 00:45:42,030 --> 00:45:45,520 Jūs varētu darīt daudz nicer gabalus nekā tas par savu laiku, ja vēlaties. 817 00:45:45,520 --> 00:45:50,100 818 00:45:50,100 --> 00:45:53,950 >> Tātad ārvalstu funkciju saskarni. 819 00:45:53,950 --> 00:46:00,330 Tas ir kaut kas nav tipiski ietverts ievadā lekcijās 820 00:46:00,330 --> 00:46:03,560 vai ievada kaut par r. 821 00:46:03,560 --> 00:46:05,584 Tas nav iespējams, jūs gatavojas to vajag. 822 00:46:05,584 --> 00:46:08,000 Tomēr, es atklāju, ka noderīgi mana projekti pagātnē. 823 00:46:08,000 --> 00:46:10,984 Un tur nav labs apmācība par to tiešsaistē. 824 00:46:10,984 --> 00:46:12,900 Tāpēc es esmu tikai gatavojas skriešanās jūs visus ar šo 825 00:46:12,900 --> 00:46:16,606 un tad jūs esat brīvi atstāt. 826 00:46:16,606 --> 00:46:18,480 Un tā ārzemju funkcija saskarne ir kas 827 00:46:18,480 --> 00:46:23,130 Jūs varat izmantot, lai izsauktu, lai redzētu funkcijas ar R. iekšēji, 828 00:46:23,130 --> 00:46:29,850 R ir veidota uz C. R aritmētiskais ir tikai C ir 64-bitu peldošā komata aritmētika, 829 00:46:29,850 --> 00:46:32,852 kas ir tipa double [nedzirdama]. 830 00:46:32,852 --> 00:46:35,060 Un jūs varētu vēlēties darīt šis ķekars iemeslu dēļ. 831 00:46:35,060 --> 00:46:39,250 Attiecībā uz vienu, R tiek interpretēts, tas ir nav apkopoti uz leju, lai mašīnu kodu. 832 00:46:39,250 --> 00:46:42,170 Tātad jūs varat pārrakstīt savu iekšējās cilpas C un pēc tam iegūt 833 00:46:42,170 --> 00:46:45,920 priekšrocības, izmantojot R. sajūta tas ir mazliet ērtāk nekā C. 834 00:46:45,920 --> 00:46:48,899 Tas ir labāk grafikus iekārtas un plauktiņš. 835 00:46:48,899 --> 00:46:51,690 Un, kamēr vēl ir iespēja saņemt maksimālais ātrums no iekšējās cilpas, 836 00:46:51,690 --> 00:46:53,650 kas ir, ja jūs tiešām to vajag. 837 00:46:53,650 --> 00:46:56,330 >> Atkārtoti esošās C bibliotēkas, tas ir arī svarīgi. 838 00:46:56,330 --> 00:47:00,320 Ja jums ir kāda C bibliotēku, piemēram, Es nezinu, Furjē pārveido, 839 00:47:00,320 --> 00:47:05,190 vai kādu ļoti Archean statistika procedūra izmantota 840 00:47:05,190 --> 00:47:09,470 augstas enerģijas astrofizikā vai kaut ko, es nezinu. 841 00:47:09,470 --> 00:47:13,058 Augstas enerģijas astrofizika nav pat domāju, es domāju. 842 00:47:13,058 --> 00:47:16,480 Bet jūs varat darīt, ka tā vietā, uzrakstīt dzimtā R ostā no tiem. 843 00:47:16,480 --> 00:47:22,725 Un the-- un atkal, tāpat kā tad, ja jūs izskatās vairumā R noklusējuma bibliotēkās, 844 00:47:22,725 --> 00:47:25,600 par iekšējās, tad iekšējie ir gatavojas izmantot ārvalstu funkciju 845 00:47:25,600 --> 00:47:26,724 saskarne ir ļoti plaši. 846 00:47:26,724 --> 00:47:31,630 Tās būs lietas, piemēram, Furjē pārveido vai skaitļošanas korelācija 847 00:47:31,630 --> 00:47:34,890 koeficienti rakstīts C, un tie būs vienkārši ir R ietinēji ap tiem. 848 00:47:34,890 --> 00:47:38,230 Saskarne ir mazliet grūti. ES domāju 849 00:47:38,230 --> 00:47:43,750 tās grūtības ir pārspīlēta in instrukciju jūs atradīsiet daudz. 850 00:47:43,750 --> 00:47:46,200 Bet tomēr, tas ir mazliet mulsinoša. 851 00:47:46,200 --> 00:47:48,650 Un man nav bijusi iespēja atrast labu pamācību par to, 852 00:47:48,650 --> 00:47:51,980 tāpēc tas ir to tieši tagad. 853 00:47:51,980 --> 00:47:55,360 Atkal, tas viss segments ir vairāk par vēlāk. 854 00:47:55,360 --> 00:47:57,687 Neuztraucieties par kopēšanu viss uz leju tiesības tagad. 855 00:47:57,687 --> 00:48:00,020 Tāpēc šādus norādījumus ir par Unix līdzīgu sistēmu, 856 00:48:00,020 --> 00:48:05,150 Linux, BSD, OS X. Es nezinu kā tas darbojas uz Windows, 857 00:48:05,150 --> 00:48:08,280 bet, lūdzu, vienkārši nav darīt savu galīgais projekts par Windows. 858 00:48:08,280 --> 00:48:10,790 859 00:48:10,790 --> 00:48:12,460 Jūs tiešām nevēlos. 860 00:48:12,460 --> 00:48:14,770 Unix ir daudz labāks komplekts up ikdienas plānošanu. 861 00:48:14,770 --> 00:48:19,320 862 00:48:19,320 --> 00:48:21,390 Tātad, būtībā ārvalstu funkcija interfeisu. 863 00:48:21,390 --> 00:48:24,420 Ja jūs vēlaties rakstīt C funkcija izmantošanai ar R, 864 00:48:24,420 --> 00:48:27,250 tas ir veikt visus argumenti kā norādes. 865 00:48:27,250 --> 00:48:30,666 >> Tātad vientuļajiem vērtībām, šis nozīmē tas norādīja uz vērtību. 866 00:48:30,666 --> 00:48:33,040 Par bloki, tas ir rādītājs uz pirmā elementa, kas 867 00:48:33,040 --> 00:48:36,750 ir tas, kas masīvs vārdi patiesībā nozīmē. 868 00:48:36,750 --> 00:48:40,140 Atkal, tas ir kaut kas jums vajadzētu būt diezgan pilnīgi noteikti pēc lpp noteikti pieci. 869 00:48:40,140 --> 00:48:43,334 Array nosaukumi ir tikai norādes pirmajam elementam, 870 00:48:43,334 --> 00:48:44,750 Tipa peldošā komata ir dubultā. 871 00:48:44,750 --> 00:48:47,310 Un jūsu uzdevums ir atgriezties spēkā neesošu. 872 00:48:47,310 --> 00:48:50,810 Vienīgais veids, ka tā var faktiski pateikt R, kas ir noticis 873 00:48:50,810 --> 00:48:54,410 ir grozot atmiņu, R deva to caur ārvalstu funkcijas 874 00:48:54,410 --> 00:48:54,910 interfeiss. 875 00:48:54,910 --> 00:48:58,180 876 00:48:58,180 --> 00:49:00,127 >> Tāpēc es esmu uzrakstījis šo Piemēram šeit, tas ir 877 00:49:00,127 --> 00:49:02,460 funkcija, kas skaitļo izmantošanu dot produkts no diviem vektoriem. 878 00:49:02,460 --> 00:49:05,060 Tas aizņem divus argumentus, vec1, vec2, kas ir paši vektori, 879 00:49:05,060 --> 00:49:06,934 un pēc tam n, kas ir garums, jo atkal, 880 00:49:06,934 --> 00:49:12,630 R ir celta [dzirdams], lai noskaidrotu garums vektoru, bet C nav. 881 00:49:12,630 --> 00:49:16,182 In C, vektori ir patvaļīgs norobežota rieciens atmiņas. 882 00:49:16,182 --> 00:49:17,890 Tātad, kā jūs varat aprēķināt DOT produktus 883 00:49:17,890 --> 00:49:23,470 ir tikai noteikt šo out parametrs līdz nullei, un tad atkārtot, izmantojot 884 00:49:23,470 --> 00:49:28,760 no 1 līdz star n, jo n ir rādītājs ar garumu, 885 00:49:28,760 --> 00:49:32,929 vienkārši pievienot kaut ko šo out parametrs. 886 00:49:32,929 --> 00:49:34,970 Un tas var būt laba prakse ja jūs gatavojas darīt 887 00:49:34,970 --> 00:49:37,270 Tas uzrakstīt divas atsevišķas C funkcijas. 888 00:49:37,270 --> 00:49:41,970 Viens no tiem has-- viens no viņiem vienkārši ņem argumentus un veidi 889 00:49:41,970 --> 00:49:43,970 ka viņi parasti būs C 890 00:49:43,970 --> 00:49:47,780 >> Tātad tas aizņem masīvs argumenti kā norādes. 891 00:49:47,780 --> 00:49:57,090 Bet viena vērtība argumenti, piemēram, n, tā vienkārši ņem par vērtībām, kopēt, 892 00:49:57,090 --> 00:49:57,917 bez norādes. 893 00:49:57,917 --> 00:49:59,750 Un tad tas nav [Dzirdams] out rādītājs. 894 00:49:59,750 --> 00:50:01,290 Un tad jūs varat būt atšķirīgs, galvenokārt, 895 00:50:01,290 --> 00:50:03,623 iesaiņojuma funkcija, kas būtībā rokturi prasības 896 00:50:03,623 --> 00:50:07,740 no ārvalstu funkcijas interfeiss jums. 897 00:50:07,740 --> 00:50:11,840 >> Kā jūs aicinu šo pētniecībā ir, kad jums ir jūsu uzdevums rakstīts C, 898 00:50:11,840 --> 00:50:17,770 Rakstot R cmd shlib, R komandu dalīta bibliotēka, 899 00:50:17,770 --> 00:50:20,110 foo dot c, vai kāds Jūsu faila nosaukums ir, 900 00:50:20,110 --> 00:50:23,020 un OS apvalks nav R terminālī. 901 00:50:23,020 --> 00:50:25,200 Un tas radīs bibliotēka sauc foo dot tik. 902 00:50:25,200 --> 00:50:28,180 Un tad jūs varat ielādēt to Mūsu skripts vai interaktīvi 903 00:50:28,180 --> 00:50:32,310 ar komandu dyn dot slodzi. 904 00:50:32,310 --> 00:50:35,720 Pēc tam, ka ir funkcija R sauc dot c. 905 00:50:35,720 --> 00:50:39,310 >> Tas aizņem argumentus, kas ir vispirms nosaukums funkciju C 906 00:50:39,310 --> 00:50:40,970 ka jūs vēlaties, lai izsauktu. 907 00:50:40,970 --> 00:50:43,920 Un tad visi parametri šai funkcijai, 908 00:50:43,920 --> 00:50:45,420 tie ir jābūt pareizai kārtībā. 909 00:50:45,420 --> 00:50:48,580 Jums ir izmantot šos veida piespiešana funkcijas kā skaitlim, kā 910 00:50:48,580 --> 00:50:52,050 dubultā, jo raksturs, un kā loģisks. 911 00:50:52,050 --> 00:50:54,710 Un tad, kad tas atgriež saraksts, kas atkal ir tikai 912 00:50:54,710 --> 00:50:57,550 asociētā masīvs no parametru nosaukumi un vērtības 913 00:50:57,550 --> 00:51:00,950 pēc tam, kad funkcija ir darbojies. 914 00:51:00,950 --> 00:51:08,520 >> Tātad, šajā gadījumā, jo punkts prod ir argumentus vec1, vec2, un int n, n ārā. 915 00:51:08,520 --> 00:51:11,980 Lai dot c mums ir dot prod, nosaukums funkcijas 916 00:51:11,980 --> 00:51:16,250 mēs aicinām, vec1, vec2, tips piespiest. 917 00:51:16,250 --> 00:51:20,060 Par nu vektora garums, Es tikko izvēlējos vec1 patvaļīgi. 918 00:51:20,060 --> 00:51:25,479 Tas būtu stabila teikt s skaitlim min garums vec1, garums vec2. 919 00:51:25,479 --> 00:51:27,520 Tad tikpat dubulto nullei, jo mums nav īsti 920 00:51:27,520 --> 00:51:29,644 aprūpi, ko tērēta out parametra, jo mēs esam 921 00:51:29,644 --> 00:51:32,270 nosakot to līdz nullei anyway. 922 00:51:32,270 --> 00:51:37,560 >> Un tad rezultāti būs liels saistīta masīvs būtībā 923 00:51:37,560 --> 00:51:42,090 vec1 ir kāds, vec2 ir neatkarīgi. 924 00:51:42,090 --> 00:51:44,330 Bet mēs esam ieinteresēti ārā, lai mēs varētu iegūt, ka out. 925 00:51:44,330 --> 00:51:47,780 Tas ir atkal, ļoti rotaļlieta piemērs no ārvalstu funkciju saskarni. 926 00:51:47,780 --> 00:51:54,160 Bet, ja jums ir, lai aprēķinātu dot produkti masveida vektoru cilpas, 927 00:51:54,160 --> 00:51:56,960 vai ja jums ir jādara kaut kas cits pa apli, 928 00:51:56,960 --> 00:51:59,850 un jūs nevēlaties, lai paļauties uz R, kas tas ir mazliet virs galvas 929 00:51:59,850 --> 00:52:02,830 iebūvēts tā, tas var būt noderīgs. 930 00:52:02,830 --> 00:52:05,870 >> Atkal, tas parasti nav ievada temats R. 931 00:52:05,870 --> 00:52:08,571 Tas nav ļoti labi dokumentēta. 932 00:52:08,571 --> 00:52:11,070 Es esmu tikai iekļaujot to tāpēc, ka Es atklāju, ka ir lietderīgi pagātnē. 933 00:52:11,070 --> 00:52:13,654 Tātad, slikta prakse. 934 00:52:13,654 --> 00:52:15,820 Es minēju, ka tur ir cilpa ar funkciju. 935 00:52:15,820 --> 00:52:21,150 Parasti jums nevajadzētu, jo valoda, nevis to izmantot. 936 00:52:21,150 --> 00:52:26,100 Pamatojoties uz to, kā R īsteno atkārtojuma iekšēji, tas var būt lēns. 937 00:52:26,100 --> 00:52:28,540 Viņi vienkārši arī izskatās neglīti. 938 00:52:28,540 --> 00:52:32,410 >> R rokturi vektoriem ļoti labi, tāpēc nereti jums nav nepieciešams, lai izmantotu to. 939 00:52:32,410 --> 00:52:35,050 940 00:52:35,050 --> 00:52:38,900 Tad jūs varat parasti aizstāt vektoru bieži 941 00:52:38,900 --> 00:52:42,490 ar šīm funkcijām, ko sauc par augstu pasūtīt funkcijas, Karte, samazināt, 942 00:52:42,490 --> 00:52:44,404 Atrast, vai Filter. 943 00:52:44,404 --> 00:52:46,320 Es ņemšu tikai dot dažus piemēri par to, ko tie dara. 944 00:52:46,320 --> 00:52:49,957 Karte ir lielāks pasūtījums funkcija, jo tā veic funkciju kā argumentu. 945 00:52:49,957 --> 00:52:52,290 Tātad jūs varat dot to funkciju, Jūs varat arī tā masīvs, 946 00:52:52,290 --> 00:52:54,640 un tā piemēros funkcija uz katru masīva elementa 947 00:52:54,640 --> 00:52:55,681 un atgriezties jauno masīvu. 948 00:52:55,681 --> 00:52:58,035 949 00:52:58,035 --> 00:53:00,160 Samazināt, būtībā jūs piešķirat tas masīvs, jūs arī tā 950 00:53:00,160 --> 00:53:02,930 funkcija, kas aizņem divus argumentus. 951 00:53:02,930 --> 00:53:07,100 To piemēros funkcija, pirmkārt, Pirmais arguments ar kādu starteris vērtību. 952 00:53:07,100 --> 00:53:09,440 Tad ar šo rezultātu otrajā. 953 00:53:09,440 --> 00:53:12,590 Tad ar šo rezultātu trešajā, pēc tam uz kuras rezultātā dod ceturto. 954 00:53:12,590 --> 00:53:14,870 Un pēc tam atgriezties, kad tas kļūst līdz beigām. 955 00:53:14,870 --> 00:53:17,620 Tā, piemēram, ja jūs vēlaties, lai aprēķināt visu elementu summa 956 00:53:17,620 --> 00:53:23,240 masīvā, nekā jūs varētu aicināt samazināt ar [dzirdams] samazināt summēšanu 957 00:53:23,240 --> 00:53:26,620 funkcija, tāpat FUNC a, b, atgrieztu plus b. 958 00:53:26,620 --> 00:53:28,960 Un tad sākt vērtību 0. 959 00:53:28,960 --> 00:53:32,950 >> Un visiem šiem, jūs varat atrast tos aprakstīts R dokumentācijā, 960 00:53:32,950 --> 00:53:35,720 jebkurā mācību grāmata par funkcionālā programmēšana. 961 00:53:35,720 --> 00:53:38,330 Tur ir arī šīs klases funkcijas sauktie pieteikties funkcijas, 962 00:53:38,330 --> 00:53:42,807 ko es don't-- viņi mazliet grūti izskaidrot, 963 00:53:42,807 --> 00:53:45,640 bet, ja jūs meklēt [nedzirdama] rezervēts ka es citēts sākumā, 964 00:53:45,640 --> 00:53:48,615 Viņš skaidro, tos diezgan labi viņa pielikums par R plānošanu. 965 00:53:48,615 --> 00:53:51,599 966 00:53:51,599 --> 00:53:53,390 Vairāk par praksi, pievienojot to vektoriem. 967 00:53:53,390 --> 00:53:57,570 968 00:53:57,570 --> 00:53:58,070 Yeah? 969 00:53:58,070 --> 00:54:01,651 970 00:54:01,651 --> 00:54:02,900 Es domāju, ka man vajadzētu labot to. 971 00:54:02,900 --> 00:54:07,450 Šajā pirmajā rindā, VEC bultiņa, ka arrow nevajadzētu būt tur. 972 00:54:07,450 --> 00:54:10,920 Jūs varat piešķirt uz vektoru, atkal, ko pieņem garumu plus 1 973 00:54:10,920 --> 00:54:13,220 un piešķirot kādu vērtību, kas. 974 00:54:13,220 --> 00:54:18,970 Tas paplašinās vektoru, vai jūs var darīt VEC vienāds C, VEC newvalue. 975 00:54:18,970 --> 00:54:21,540 Atkal, ja jūs izmantojat C ar viens arguments kā vektors, 976 00:54:21,540 --> 00:54:23,300 iegūtais hierarhija tiek saplacināts. 977 00:54:23,300 --> 00:54:27,160 Tātad jūs tikai iegūt vektors kas ir pagarināts līdz 1.. 978 00:54:27,160 --> 00:54:30,410 Nekad to izdarītu. 979 00:54:30,410 --> 00:54:33,330 >> Iemesls, kāpēc jūs nevajadzētu darīt, tas ir tas. 980 00:54:33,330 --> 00:54:37,430 Kad jūs piešķirt vektoru, to piešķir tai zināmu rieciens atmiņas. 981 00:54:37,430 --> 00:54:40,680 Ja jūs palielināt šo vektora lielumu, tas ir pārdalīt vektoru 982 00:54:40,680 --> 00:54:43,820 kaut kur citur. 983 00:54:43,820 --> 00:54:46,980 Un tā pārdale ir diezgan dārgi. 984 00:54:46,980 --> 00:54:50,530 Es negribu iedziļināties sīkāk par to, kā atmiņas sadalītāji tiek īstenoti 985 00:54:50,530 --> 00:54:57,280 uz operētājsistēmas līmenī, bet tas aizņem daudz laika 986 00:54:57,280 --> 00:54:58,962 atrast jaunu rieciens atmiņas. 987 00:54:58,962 --> 00:55:00,920 Un arī, ja esat pārdalīt partijām un partijām 988 00:55:00,920 --> 00:55:03,500 no pakāpeniski lielāks gabalos, jūs galu galā 989 00:55:03,500 --> 00:55:06,420 ar kaut ko sauc atmiņas fragmentācija, 990 00:55:06,420 --> 00:55:09,390 kur pieejamā atmiņa ir sadalīts daudz maz blokiem 991 00:55:09,390 --> 00:55:11,500 atmiņā sadalītāji viedokļa. 992 00:55:11,500 --> 00:55:15,340 Un tas kļūst grūtāk un grūtāk atrast atmiņas citām lietām. 993 00:55:15,340 --> 00:55:19,455 Tā vietā, ja jums ir nepieciešams, lai to izdarītu, ja Jums ir nepieciešams, lai augt vektoru no viena gala 994 00:55:19,455 --> 00:55:24,240 uz nākamo, tā vietā, pievienojot tam pastāvīgi, jums vajadzētu iepriekš piešķirt to. 995 00:55:24,240 --> 00:55:29,310 VEC bultiņa, vektora garums vienāds 1000, vai neatkarīgi. 996 00:55:29,310 --> 00:55:33,200 >> Un tad jūs varat vienkārši piešķirt uz slimības izraisītāja vērtībām vienā 997 00:55:33,200 --> 00:55:36,000 laiks, kad esat piešķirti to vienu reizi. 998 00:55:36,000 --> 00:55:40,140 Man uzbrauca tas, atkal, mans vasaras darbu kad es rakstīju VPI diferenciālis 999 00:55:40,140 --> 00:55:42,120 vienādojums solver. 1000 00:55:42,120 --> 00:55:43,180 Ne simbolisks skaitliskais. 1001 00:55:43,180 --> 00:55:49,290 Ideja ir tāda, ka pēc tam, kad esat vienu vērtību savu risinājumu, 1002 00:55:49,290 --> 00:55:51,240 jūs izmantojat, ka, lai aprēķinātu nākamo. 1003 00:55:51,240 --> 00:55:53,700 Tāpēc mans dabas naivs slīpums bija teikt OK, 1004 00:55:53,700 --> 00:55:56,930 tāpēc es ņemšu sākt ar vektoru tas ir ievērojama vērtība. 1005 00:55:56,930 --> 00:56:01,260 Aprēķināt no šīs nākamās vērtības kas iet uz manu risinājumu vektors, 1006 00:56:01,260 --> 00:56:02,630 un pievienot to. 1007 00:56:02,630 --> 00:56:05,290 >> Izveidot kaut kas cits, pievienot to. 1008 00:56:05,290 --> 00:56:08,120 Tā gāja ļoti, ļoti lēni. 1009 00:56:08,120 --> 00:56:11,540 Un, kad es sapratu, tas un es mainīja manu sistēmu 1010 00:56:11,540 --> 00:56:16,020 no pievienojot šim vektoru tāpat kā 10,000 līdz 100,000 reizes, 1011 00:56:16,020 --> 00:56:18,910 tikai iepriekš piešķirot vektoru un tikai darbojas ar to. 1012 00:56:18,910 --> 00:56:22,100 Es saņēmu vairāk nekā 1000 reizes ātrumu augšu. 1013 00:56:22,100 --> 00:56:26,280 Tātad tas ir ļoti bieži lamatas R programmēšanu. 1014 00:56:26,280 --> 00:56:31,560 Ja jums ir nepieciešams, lai izveidotu vektoru gabalā gabals, iepriekš piešķirt to. 1015 00:56:31,560 --> 00:56:35,360 1016 00:56:35,360 --> 00:56:40,240 >> Vēl viena kopīga ceļojums up-- šis ir mans pēdējais slide, nav worry-- ir kļūdu apstrādi. 1017 00:56:40,240 --> 00:56:42,890 R, lai būtu atklāti, nav patiešām ļoti labi. 1018 00:56:42,890 --> 00:56:45,010 Ir daudz problēmas, kas var rasties. 1019 00:56:45,010 --> 00:56:48,360 Piemēram, ja jums masīvs vai vektors no funkciju 1020 00:56:48,360 --> 00:56:52,377 ka jūs gaidījām viens vērtība nāk no, vai otrādi, 1021 00:56:52,377 --> 00:56:55,460 un jūs iet, ka uz funkciju, kas jūs rakstījāt gaidījis vienu vērtību, 1022 00:56:55,460 --> 00:56:57,270 kas var būt problēma. 1023 00:56:57,270 --> 00:57:01,440 >> Dažas funkcijas atgriezties null tāpat kā, teiksim, 1024 00:57:01,440 --> 00:57:05,560 lasot no neeksistējošā atslēga sarakstā. 1025 00:57:05,560 --> 00:57:08,527 Bet null nav līdzīgs C kur, ja jūs mēģināt lasīt 1026 00:57:08,527 --> 00:57:11,360 no vecās rādītājs, [nedzirdama] null rādītāju, tas tikai SEG kļūdas 1027 00:57:11,360 --> 00:57:14,109 un ja tu esi savā atkļūdotājs tas stāsta jums, kur tieši jums ir. 1028 00:57:14,109 --> 00:57:17,080 1029 00:57:17,080 --> 00:57:20,772 Tā vietā, null būs do-- funkcijas darīs neprognozējamas lietas 1030 00:57:20,772 --> 00:57:21,730 ja viņi roku null. 1031 00:57:21,730 --> 00:57:24,575 Tāpat, ja jūs pārņēma max null, tā došu jums negatīvu bezgalību. 1032 00:57:24,575 --> 00:57:27,230 1033 00:57:27,230 --> 00:57:28,190 Un tā, jā. 1034 00:57:28,190 --> 00:57:30,880 1035 00:57:30,880 --> 00:57:32,630 Un tā tas notika man vienreiz, kad man bija 1036 00:57:32,630 --> 00:57:34,771 mainījies ķekars laukiem manā sarakstā struktūrā 1037 00:57:34,771 --> 00:57:37,520 reiz nemainot tos citur kad es lasīju no tiem. 1038 00:57:37,520 --> 00:57:40,670 Un tad es saņēmu visādas izlases Infinity rezultāti augkopība up 1039 00:57:40,670 --> 00:57:43,080 un es ne jausmas, kur tie nāca no. 1040 00:57:43,080 --> 00:57:45,310 Un diemžēl, tur ir nav reālu R stingrs režīms 1041 00:57:45,310 --> 00:57:48,940 kur jūs varat pateikt, ja kaut kas Izskatās, ka tas varētu būt kļūda, 1042 00:57:48,940 --> 00:57:51,960 vienkārši apstāties tur, lai es varētu būt disciplinēti un noteikt, ka. 1043 00:57:51,960 --> 00:57:55,282 1044 00:57:55,282 --> 00:57:57,240 Tomēr ir kaut kas sauc stop ja ne. 1045 00:57:57,240 --> 00:58:00,480 Tas ir līdzvērtīgs C s apgalvot, ja jūs esat runājuši par to. 1046 00:58:00,480 --> 00:58:02,690 Es nedomāju, ka C apgalvot ir lekcija temats, 1047 00:58:02,690 --> 00:58:06,370 bet jūsu daļas vadītāja varētu būt devusies pār to. 1048 00:58:06,370 --> 00:58:10,393 Un pārtraukt, ja nav būtībā aizņem kādu predikatīvu, tāpēc jebkurš paziņojums, ka 1049 00:58:10,393 --> 00:58:11,824 var būt patiess vai nepatiess. 1050 00:58:11,824 --> 00:58:13,490 Un, ja tas ir nepatiesa, tas apstājas savu programmu. 1051 00:58:13,490 --> 00:58:18,260 Tā stāsta jums tieši to, kas jums līnija bija un kādā stāvoklī neizdevās. 1052 00:58:18,260 --> 00:58:21,910 >> Un šī ļoti noderīgs, piemēram, vesels saprāts pārbaudi, funkciju ieejas. 1053 00:58:21,910 --> 00:58:25,110 Tātad, ja jums ir funkcija un jūs sagaida, teiksim, 1054 00:58:25,110 --> 00:58:29,640 ja jums ir jāsniedz man datumu, es gribu datumi būt tikai vektors garums 1 1055 00:58:29,640 --> 00:58:31,735 un kaut kur starp 1 un 31. 1056 00:58:31,735 --> 00:58:34,420 1057 00:58:34,420 --> 00:58:36,170 Un, ja ne, es zinu kaut kas ir nogājis greizi. 1058 00:58:36,170 --> 00:58:40,280 Un es izvēlos, lai apturētu tur pirms tam ir izlases atsitiena efektu ar kodu 1059 00:58:40,280 --> 00:58:44,190 ka tas ir grūtāk izsekot cauri. 1060 00:58:44,190 --> 00:58:47,170 Tātad tas ir viens no iespējamiem izmantot pieturas, ja ne. 1061 00:58:47,170 --> 00:58:48,660 >> Jebkurā gadījumā, OK. 1062 00:58:48,660 --> 00:58:49,690 Tā ka ir beigas. 1063 00:58:49,690 --> 00:58:51,290 Paldies jums tik daudz par ierašanos. 1064 00:58:51,290 --> 00:58:53,710 Esmu rangs amatieru pie šī. 1065 00:58:53,710 --> 00:58:57,270 Tik žēl, ja jūs esat garlaicīgi vai sajaukt vai ko jūs esat. 1066 00:58:57,270 --> 00:59:01,670 Es esmu laimīgs, lai jautājumus pa e-pastu at connorharris@college.harvard.edu~~pobj. 1067 00:59:01,670 --> 00:59:07,230 Tas attiecas arī uz visiem skatoties šo dzīvo vai vēlāk. 1068 00:59:07,230 --> 00:59:10,190 Turklāt, lai gan es neesmu TF, es esmu arī ļoti 1069 00:59:10,190 --> 00:59:13,900 gatavi kalpot kā neoficiāls padomdevējs ikvienam, kurš ir 1070 00:59:13,900 --> 00:59:15,460 izmantojot R gala projektā. 1071 00:59:15,460 --> 00:59:19,900 >> Ja jūs vēlaties, ka, tad tikai runāt ar savu TF 1072 00:59:19,900 --> 00:59:23,750 un tad rakstiet man e-pastu, lai Es zinu, ko jūs strādājat 1073 00:59:23,750 --> 00:59:26,680 un lai es varētu izveidot tikšanos reizes ar jums, ja jūs vēlaties. 1074 00:59:26,680 --> 00:59:27,990 Tātad vēlreiz, liels paldies. 1075 00:59:27,990 --> 00:59:28,960 Es ceru, ka jums patika. 1076 00:59:28,960 --> 00:59:29,450 >> Mērķauditorija: [nedzirdama]. 1077 00:59:29,450 --> 00:59:30,617 >> Conner HARRIS: Protams. 1078 00:59:30,617 --> 00:59:34,910 >> Mērķauditorija: Kādu projektu būtu CS students izmanto R? 1079 00:59:34,910 --> 00:59:37,427 1080 00:59:37,427 --> 00:59:40,510 Conner HARRIS: Tātad, ja jūs nevar darīt kaut kas ir tīri datu ieguves, 1081 00:59:40,510 --> 00:59:43,790 piemēram, un tur Ir daudz lietas 1082 00:59:43,790 --> 00:59:46,692 jūs varētu darīt ar to ar datiem ieguves rūpniecība un mašīna mācīšanās. 1083 00:59:46,692 --> 00:59:48,900 Jūs varētu vēlēties izmantot R sastāvdaļa kaut ko. 1084 00:59:48,900 --> 00:59:52,022 Es audzināja, Sākotnēji piemēru no tā, ja jūs esat rakstiski mājas lapā 1085 00:59:52,022 --> 00:59:54,730 un jūs vēlaties, lai palaistu automatizētu statistiskā analīze servera 1086 00:59:54,730 --> 00:59:57,990 logs noteiktā laikā katru dienu, kas varētu būt kaut kas ir 1087 00:59:57,990 --> 01:00:01,260 ļoti viegli darīt tikai īss R skripts, ka jūs varat ieplānot 1088 01:00:01,260 --> 01:00:04,200 palaist katru nakti, piemēram. 1089 01:00:04,200 --> 01:00:06,550 >> Un es esmu pārliecināts, ja tur ir kāds iemesls, jūs vēlaties 1090 01:00:06,550 --> 01:00:11,520 gribu statistiku vai grafikus iespējas un automātiski vietā ir šo skrējienu 1091 01:00:11,520 --> 01:00:13,790 par pienākumu sadarboties ar lietām Excel, 1092 01:00:13,790 --> 01:00:16,750 Piemēram, tas ir kaut kas jūs varētu vēlēties izmantot R. 1093 01:00:16,750 --> 01:00:21,190 Tātad vairs jautāt pirms es atstāt? 1094 01:00:21,190 --> 01:00:21,690 Nē? 1095 01:00:21,690 --> 01:00:24,960 Labi, labi, atkal, paldies Jūs ļoti daudz nāk. 1096 01:00:24,960 --> 01:00:29,417