1 00:00:00,000 --> 00:00:00,750 2 00:00:00,750 --> 00:00:09,800 >> [Музике може чути] 3 00:00:09,800 --> 00:00:13,014 4 00:00:13,014 --> 00:00:13,680 ДУСТИН ТРАН: Здраво. 5 00:00:13,680 --> 00:00:14,980 Моје име је Дастин. 6 00:00:14,980 --> 00:00:18,419 Тако ћу представити Анализа података у Р. 7 00:00:18,419 --> 00:00:19,710 Само мало о себи. 8 00:00:19,710 --> 00:00:24,320 Ја сам тренутно апсолвент у су Енгинееринг анд Апплиед Сциенцес. 9 00:00:24,320 --> 00:00:28,330 Ја студирам један пресек учење и статистика машина 10 00:00:28,330 --> 00:00:31,375 тако Анализа података у Р је стварно основно за шта 11 00:00:31,375 --> 00:00:33,790 Ја радим на дневној бази. 12 00:00:33,790 --> 00:00:35,710 >> И Р је посебно добар за анализу података 13 00:00:35,710 --> 00:00:39,310 јер је врло добро за израду прототипа. 14 00:00:39,310 --> 00:00:43,590 И обично, када радите неку врсту анализе података, много проблема 15 00:00:43,590 --> 00:00:44,920 ће когнитивних. 16 00:00:44,920 --> 00:00:48,700 И тако само желите да имате стварно добра језик који 17 00:00:48,700 --> 00:00:53,770 је само добар за то уграђених функција, за разлику 18 00:00:53,770 --> 00:00:57,430 да морају да се баве ниским стварима нивоа. 19 00:00:57,430 --> 00:01:01,040 Дакле, у почетку, ја ћу да се уведе оно што је Р, зашто би 20 00:01:01,040 --> 00:01:04,540 желите да га користите, и онда иди у неку демо, 21 00:01:04,540 --> 00:01:07,060 и само иди на одатле. 22 00:01:07,060 --> 00:01:08,150 >> Па шта је Р? 23 00:01:08,150 --> 00:01:11,180 Р је само језик развијен за статистичку цомпутинг 24 00:01:11,180 --> 00:01:12,450 и визуелизација. 25 00:01:12,450 --> 00:01:16,000 Па шта то значи да је то је врло одличан језик 26 00:01:16,000 --> 00:01:22,400 за било какве ствари које се бави неизвесност или визуелизација података. 27 00:01:22,400 --> 00:01:24,850 Тако да имате све ово вероватноћа. 28 00:01:24,850 --> 00:01:27,140 Ту ће бити уграђених функција. 29 00:01:27,140 --> 00:01:31,650 Такође ћете имати одличан цртања пакете. 30 00:01:31,650 --> 00:01:34,110 >> Питхон је још једна такмиче језик за податке. 31 00:01:34,110 --> 00:01:40,020 И једна ствар коју сам наћи тај Р је много бољи у је визуелизација. 32 00:01:40,020 --> 00:01:45,200 Па шта ћете видети у демо као добро је само врло интуитиван језик 33 00:01:45,200 --> 00:01:48,050 да само ради веома добро. 34 00:01:48,050 --> 00:01:53,140 Такође је бесплатан и отвореног кода, као је било који други добар језик ваљда. 35 00:01:53,140 --> 00:01:55,440 >> И овде, гомила само кључне речи бачен на вас. 36 00:01:55,440 --> 00:02:00,450 То је динамичан, што значи ако имате специфична врста добио објекат 37 00:02:00,450 --> 00:02:02,025 него што ћу га променити у ходу. 38 00:02:02,025 --> 00:02:05,670 То је лењ тако да је паметно о како то ради израчунавања. 39 00:02:05,670 --> 00:02:12,250 Функционалном смислу то заиста може да ради базирано на основу функција тако све-- 40 00:02:12,250 --> 00:02:16,910 свака врста манипулације си раде, то ће бити засновани на функције. 41 00:02:16,910 --> 00:02:20,162 >> Дакле бинарни оператера, на пример, су само по себи функционише. 42 00:02:20,162 --> 00:02:21,870 И све то ћеш да урадиш је 43 00:02:21,870 --> 00:02:24,690 Биће побегне функције сама. 44 00:02:24,690 --> 00:02:27,140 А онда објектно оријентисано као добро. 45 00:02:27,140 --> 00:02:30,930 >> Дакле овде је КСКЦД парцела. 46 00:02:30,930 --> 00:02:34,350 Не само зато што се осећам као КСКЦД је фундаментално за било какве 47 00:02:34,350 --> 00:02:37,770 презентације, али зато Осећам се као ово стварно 48 00:02:37,770 --> 00:02:42,160 чекиће поенту да много Време када радиш неку врсту података 49 00:02:42,160 --> 00:02:46,570 Анализа, проблем није толико колико брзо се стартовао, 50 00:02:46,570 --> 00:02:49,850 али колико дуго ће то одвести за програмирање задатак. 51 00:02:49,850 --> 00:02:54,112 Дакле овде је само да ли анализира Стратегија или б је ефикаснији. 52 00:02:54,112 --> 00:02:55,820 Ово ће бити нешто што си 53 00:02:55,820 --> 00:02:58,290 ће се носити са доста у врсту језика на ниском нивоу 54 00:02:58,290 --> 00:03:03,440 где имате посла са сег грешака, алокација меморије, инитиализатионс, 55 00:03:03,440 --> 00:03:05,270 чак прављење уграђених функција. 56 00:03:05,270 --> 00:03:09,920 И ове ствари се све рукује Веома, веома елегантно у Р. 57 00:03:09,920 --> 00:03:12,839 >> Дакле, само да закуца ово тачка, највећи уско грло 58 00:03:12,839 --> 00:03:13,880 ће бити когнитивне. 59 00:03:13,880 --> 00:03:17,341 Дакле анализа података је веома тежак проблем. 60 00:03:17,341 --> 00:03:19,340 Било да радите машинско учење или сте 61 00:03:19,340 --> 00:03:22,550 ради само неку врсту Основни подаци истраживања, 62 00:03:22,550 --> 00:03:25,290 не желите да имате да се документ 63 00:03:25,290 --> 00:03:27,440 и онда саставити нешто сваки пут када 64 00:03:27,440 --> 00:03:31,010 Желим да видим шта колона изгледа, шта конкретно уноси у матрици 65 00:03:31,010 --> 00:03:32,195 изгледа. 66 00:03:32,195 --> 00:03:34,320 Тако да само желим да имам неки стварно лепо интерфејс 67 00:03:34,320 --> 00:03:37,740 можете покренути једноставну функцију да индекси на год 68 00:03:37,740 --> 00:03:41,870 желите и само га покренете одатле. 69 00:03:41,870 --> 00:03:44,190 И ти треба домен специфични језици за ово. 70 00:03:44,190 --> 00:03:51,750 И Р ће заиста помоћи да дефинишете Проблем и реши га на овај начин. 71 00:03:51,750 --> 00:03:58,690 >> Дакле овде је дијаграм који показује програмирање популарност Р као нестало је током времена. 72 00:03:58,690 --> 00:04:04,060 Дакле, као што видите, као 2013. или па то само дигнута страховито. 73 00:04:04,060 --> 00:04:09,570 И ово је само због тога Огроман тренд у технолошкој индустрији 74 00:04:09,570 --> 00:04:10,590 о биг подаци. 75 00:04:10,590 --> 00:04:13,010 Такође, не само технологија индустрија, али стварно 76 00:04:13,010 --> 00:04:16,490 свака индустрија то-- јер много индустрије 77 00:04:16,490 --> 00:04:20,589 су некако фундаментална за покушавајући да реши ове проблеме. 78 00:04:20,589 --> 00:04:24,590 И обично, можете имати неке добре начин мерења тих проблема 79 00:04:24,590 --> 00:04:29,720 или чак да их дефинише или њихово решавање користећи податке. 80 00:04:29,720 --> 00:04:35,430 Тако да мислим да сада је Р 11. најпопуларнија језика на ТИОБЕ 81 00:04:35,430 --> 00:04:38,200 и то је у порасту од тада. 82 00:04:38,200 --> 00:04:40,740 83 00:04:40,740 --> 00:04:43,080 >> Дакле, ево још мало карактеристике Р. Има 84 00:04:43,080 --> 00:04:46,900 огроман број пакета и за све ове различите ствари. 85 00:04:46,900 --> 00:04:52,470 Дакле, сваки пут када имате одређени проблем, већина 86 00:04:52,470 --> 00:04:55,060 време Р ће имати да функција за вас. 87 00:04:55,060 --> 00:04:58,520 Дакле да ли желите да изгради неку врсту машине 88 00:04:58,520 --> 00:05:02,770 учење алгоритам зове Случајна шума или стабла одлучивања, 89 00:05:02,770 --> 00:05:07,530 или чак покушавају да преузму средњу функција или било коју од ових ствари, 90 00:05:07,530 --> 00:05:10,000 Р ће имати то. 91 00:05:10,000 --> 00:05:14,190 >> А ако урадите ти је стало оптимизација, једна ствар која је заједничка 92 00:05:14,190 --> 00:05:17,430 се да када завршите израду прототипова нека врста високом нивоу језика, 93 00:05:17,430 --> 00:05:19,810 ви ћете бацити да у-- само ће порта да преко 94 00:05:19,810 --> 00:05:21,550 то неком језику ниског нивоа. 95 00:05:21,550 --> 00:05:26,090 Шта је добро у вези Р је да када сте урађено је прототипова, можете покренути Ц ++, 96 00:05:26,090 --> 00:05:29,510 ор Фортран, или било од њих нижим директно у Р. левел 97 00:05:29,510 --> 00:05:32,320 Дакле, то је један стварно Цоол опција о Р, 98 00:05:32,320 --> 00:05:35,930 ако ти је стварно стало оптимизација тачка. 99 00:05:35,930 --> 00:05:39,490 >> И то је такође јако добар за веб визуализације. 100 00:05:39,490 --> 00:05:43,530 Тако Д3.јс, на пример, Ваљда још један семинар 101 00:05:43,530 --> 00:05:45,130 да смо представили данас. 102 00:05:45,130 --> 00:05:48,510 А ово је заиста сјајно за радиш интерактивне визуелизације. 103 00:05:48,510 --> 00:05:54,460 И Д3.јс претпоставља да имате нека врста података који се исцртани 104 00:05:54,460 --> 00:05:58,080 и Р је сјајан начин да се буде у стању да уради Анализа података пре него што га извозимо 105 00:05:58,080 --> 00:06:04,220 преко да Д3.јс или чак само покретање Д3.јс команде у самој Р, 106 00:06:04,220 --> 00:06:08,240 као и све то друге библиотеке такође. 107 00:06:08,240 --> 00:06:13,041 >> Дакле, то је био само увод у шта је Р и зашто би га користите. 108 00:06:13,041 --> 00:06:14,790 Дакле надам се, ја сам увјерен ти нешто 109 00:06:14,790 --> 00:06:18,460 о само покушавам да видим како то изгледа. 110 00:06:18,460 --> 00:06:23,930 Зато ћу ићи напред и проћи неке основе о Р објеката 111 00:06:23,930 --> 00:06:26,150 а шта стварно може да уради. 112 00:06:26,150 --> 00:06:29,690 >> Дакле овде је само гомила математичких команди. 113 00:06:29,690 --> 00:06:35,000 Тако кажу Ваши-- желите да градите Језик себе и само желите 114 00:06:35,000 --> 00:06:38,080 да имају гомилу различитих алата. 115 00:06:38,080 --> 00:06:42,520 Свака врста операције мислиш да бих желим је прилично ће бити у Р. 116 00:06:42,520 --> 00:06:44,150 >> Дакле овде је 2 плус 2. 117 00:06:44,150 --> 00:06:46,090 Овде је 2 пута пи. 118 00:06:46,090 --> 00:06:51,870 Р има гомилу уграђених константи које често ћете користити као пи, е. 119 00:06:51,870 --> 00:06:56,230 >> А онда, ту је 7 плус руниф, тако руниф 1. 120 00:06:56,230 --> 00:07:02,450 Ово је функција која је генерише један случајни униформу од 0 до 1. 121 00:07:02,450 --> 00:07:04,400 А ту је 3 до 4 снагом. 122 00:07:04,400 --> 00:07:06,430 Има квадратних корени. 123 00:07:06,430 --> 00:07:07,270 >> Има дневник. 124 00:07:07,270 --> 00:07:14,500 Дакле лог ће учинити базу експоненцијално по себи. 125 00:07:14,500 --> 00:07:18,337 А онда, ако наведете базу онда, можете да урадите шта год хоћеш база. 126 00:07:18,337 --> 00:07:19,920 А онда ево и неких других команди. 127 00:07:19,920 --> 00:07:22,180 Тако да имате 23 мод 2. 128 00:07:22,180 --> 00:07:24,910 Онда имате остатак. 129 00:07:24,910 --> 00:07:27,110 Онда имате научни нотација ако вас такође 130 00:07:27,110 --> 00:07:34,060 Желим да радим само још и компликованије ствари. 131 00:07:34,060 --> 00:07:37,320 >> Дакле овде је задатак. 132 00:07:37,320 --> 00:07:40,830 Дакле типични задаци у Р је урађено са стрелом 133 00:07:40,830 --> 00:07:43,440 тако да је мање од а затим цртица. 134 00:07:43,440 --> 00:07:47,250 Па ево ја само додељивање 3 на варијабилни вал. 135 00:07:47,250 --> 00:07:50,160 >> И онда се ја одштампа вал и онда исписује три. 136 00:07:50,160 --> 00:07:53,920 По дефаулту у Р преводиоца, ит ће одштампати ствари за вас 137 00:07:53,920 --> 00:07:57,280 тако да не морате да наведете одштампате вал сваки пут када желите да одштампате нешто. 138 00:07:57,280 --> 00:08:00,200 Можете само да до Вал и онда ће то урадити за вас. 139 00:08:00,200 --> 00:08:04,380 >> Такође, можете користити једнако технички као оператора доделе. 140 00:08:04,380 --> 00:08:07,190 Постоје мале финесе између користећи стрелицу 141 00:08:07,190 --> 00:08:10,730 оператер и једнакима оператер за задатке. 142 00:08:10,730 --> 00:08:15,470 Углавном по конвенцији, свима ће само користите оператор стрелице. 143 00:08:15,470 --> 00:08:21,850 >> И овде, ја је за то коси нотација зове 1 Колон 6. 144 00:08:21,850 --> 00:08:26,010 Ово генерише вектор од 1 до 6. 145 00:08:26,010 --> 00:08:29,350 И зато ово стварно лепо онда само доделите вектор Вал 146 00:08:29,350 --> 00:08:34,270 и који функционише по себи. 147 00:08:34,270 --> 00:08:37,799 >> Дакле, ово је већ иде из сингле-- врло интуитивно податке 148 00:08:37,799 --> 00:08:41,070 структура само контре на нека врста типа у вектор 149 00:08:41,070 --> 00:08:45,670 и који ће прикупити све Скаларна вредности за вас. 150 00:08:45,670 --> 00:08:50,770 Дакле после одласка из скалар, ви имају Р објеката и ово је вектор. 151 00:08:50,770 --> 00:08:55,610 Вектор је било која врста наплата истог типа. 152 00:08:55,610 --> 00:08:58,150 Дакле овде су гомила вектора. 153 00:08:58,150 --> 00:08:59,800 >> Дакле, ово је нумерички. 154 00:08:59,800 --> 00:09:02,440 Бројни је Р-ов начин да се каже дупло. 155 00:09:02,440 --> 00:09:07,390 И тако по дефаулту, било број ће бити дупло. 156 00:09:07,390 --> 00:09:13,150 >> Дакле, ако имате ц 1.1, 3, негативан 5.7, ц је функција. 157 00:09:13,150 --> 00:09:16,760 Ово цонцатенатес све три Бројеви у вектор. 158 00:09:16,760 --> 00:09:19,619 И то ће тако ако бити-- приметите 3 по себи, 159 00:09:19,619 --> 00:09:21,910 нормално је да преузме да је ово као цео број, 160 00:09:21,910 --> 00:09:25,050 али зато све векторе су иста врста, 161 00:09:25,050 --> 00:09:28,660 ово је вектор дублу или нумерички у овом случају. 162 00:09:28,660 --> 00:09:34,920 >> рнорм је функција која генерише стандардни нормални вариаблес-- 163 00:09:34,920 --> 00:09:36,700 или стандардне нормалне вредности. 164 00:09:36,700 --> 00:09:38,360 И ја наводећи двојицу. 165 00:09:38,360 --> 00:09:43,840 Тако радим рнорм 2, додељивање то струцњаци и онда ја одштампа девс. 166 00:09:43,840 --> 00:09:47,350 Дакле, то су само два рандом нормалне вредности. 167 00:09:47,350 --> 00:09:50,060 >> А онда интс ако урадите ти је стало целих бројева. 168 00:09:50,060 --> 00:09:54,650 Дакле, ово је само о меморији алокација и штеди величина меморије. 169 00:09:54,650 --> 00:10:01,460 Тако да би морао да приложи Ваши бројеви од главног града Л. 170 00:10:01,460 --> 00:10:04,170 >> Генерално, ово је Историјска нотација Р-ов 171 00:10:04,170 --> 00:10:06,940 за нешто што се зове дуго цео број. 172 00:10:06,940 --> 00:10:09,880 Тако већину времена, ви ћете бе бави дублу. 173 00:10:09,880 --> 00:10:15,180 И ако икада касније о оптимизацији код, 174 00:10:15,180 --> 00:10:18,110 можете само додати ово Л'с након тога или током њега 175 00:10:18,110 --> 00:10:22,280 ако сте као прекогнитивних шта ћеш да урадиш ове променљиве. 176 00:10:22,280 --> 00:10:25,340 177 00:10:25,340 --> 00:10:26,890 >> Дакле овде је вектор карактер. 178 00:10:26,890 --> 00:10:31,440 Дакле, опет, ја се спајају три жице ово време. 179 00:10:31,440 --> 00:10:36,230 Приметите да дупле траке те појединачни жице су исти у Р. 180 00:10:36,230 --> 00:10:41,000 Тако да имам Артур и Марвин и тако кад сам га одштампа, сви они 181 00:10:41,000 --> 00:10:43,210 ће показати дупле жице. 182 00:10:43,210 --> 00:10:45,880 А ако желите и да укључи двострука или стринг 183 00:10:45,880 --> 00:10:50,070 у својим ликовима, онда можете или мењате своје конце. 184 00:10:50,070 --> 00:10:53,540 >> Тако Марвин за други елемент, ово је 185 00:10:53,540 --> 00:10:56,380 да те схов-- Само имају дупле стрингс 186 00:10:56,380 --> 00:10:59,050 а затим један стринг па ово је наизменично. 187 00:10:59,050 --> 00:11:04,040 У супротном, ако желите да користите дупли оператер стринг у двоструком низу 188 00:11:04,040 --> 00:11:07,090 кад га прогласи онда, ви само користите оператор за бекство. 189 00:11:07,090 --> 00:11:10,600 Па ти косе црте двоструку жицу. 190 00:11:10,600 --> 00:11:13,330 >> И на крају, ми такође имају логичке векторе. 191 00:11:13,330 --> 00:11:15,890 Тако логицал-- со труе и ЛАЖ и они су 192 00:11:15,890 --> 00:11:18,880 Биће све великим словима. 193 00:11:18,880 --> 00:11:22,370 А онда, опет, ја се спајају их, а затим их распоредити у Боолс. 194 00:11:22,370 --> 00:11:24,590 Дакле Боолс ће показати Ви ТРУЕ, ФАЛСЕ, и ИСТИНА. 195 00:11:24,590 --> 00:11:28,280 196 00:11:28,280 --> 00:11:31,620 >> Дакле овде је вецторизед индексирање. 197 00:11:31,620 --> 00:11:34,870 Дакле, у почетку, ја узимам фунцтион-- 198 00:11:34,870 --> 00:11:39,230 то се зове секуенце-- секвенца од 2 до 12. 199 00:11:39,230 --> 00:11:42,490 И узимам секвенцу од 2. 200 00:11:42,490 --> 00:11:46,660 Тако ће то урадити 2, 4, 6, 8, 10 и 12. 201 00:11:46,660 --> 00:11:50,080 И онда, ја сам индексирање добити трећи елемент. 202 00:11:50,080 --> 00:11:55,770 >> Дакле једна ствар треба имати на уму је да Р индекси по почев од 1. 203 00:11:55,770 --> 00:12:00,550 Дакле валс 3 ће дати ти трећи елемент. 204 00:12:00,550 --> 00:12:04,580 Ово је врста разликује од другог језици где почиње од нуле. 205 00:12:04,580 --> 00:12:09,780 Дакле, у Ц или Ц ++, на пример, ти си ће добити четвртог елемента. 206 00:12:09,780 --> 00:12:13,280 >> И овде је валс од 3 до 5. 207 00:12:13,280 --> 00:12:16,030 Дакле, једна ствар која је стварно кул је то ти 208 00:12:16,030 --> 00:12:20,410 може генерисати привремене променљиве унутра и онда само их користе у ходу. 209 00:12:20,410 --> 00:12:21,960 Дакле, овде је 3 до 5. 210 00:12:21,960 --> 00:12:25,070 Тако сам генерише вектор 3, 4, и 5 и потом 211 00:12:25,070 --> 00:12:29,700 Ја индексирање да добије трећину, четвртом и петом елементи. 212 00:12:29,700 --> 00:12:32,280 >> Дакле слично, можете апстрактна то само ради 213 00:12:32,280 --> 00:12:35,280 било каква вектора да даје вам индексирање. 214 00:12:35,280 --> 00:12:40,050 Дакле овде је валс а затим Прво, трећи, и шести елементи. 215 00:12:40,050 --> 00:12:42,800 А онда, ако желите да уради комплемент, 216 00:12:42,800 --> 00:12:45,210 тако да вас још више минус након тога и да ћу 217 00:12:45,210 --> 00:12:48,600 дати вам све што је не први, трећи, или шести елемент. 218 00:12:48,600 --> 00:12:51,590 Тако ће ово бити 4, 8, и 10. 219 00:12:51,590 --> 00:12:54,380 >> А ако желите да добијете чак напреднији, 220 00:12:54,380 --> 00:12:57,610 можете цонцатенате Булове векторе. 221 00:12:57,610 --> 00:13:05,210 Дакле, ово индекс ће вам дати ово Булова вектор дужине 6. 222 00:13:05,210 --> 00:13:07,280 Дакле реп ТАЧНО зарез 3. 223 00:13:07,280 --> 00:13:09,680 Ово ће поновити ТРУЕ три пута. 224 00:13:09,680 --> 00:13:12,900 Дакле, ово ће вам дати нове вектор труе, труе, ИСТИНА. 225 00:13:12,900 --> 00:13:17,470 >> реп ЛАЖНА 4-- ово ће вам дати вектор ЛАЖ ЛАЖ ЛАЖ ЛАЖ. 226 00:13:17,470 --> 00:13:21,280 А затим ц ће спојите та два Боолеанс заједно. 227 00:13:21,280 --> 00:13:24,090 Значи да ћеш добити три Труес а затим четири ФАЛСЕс. 228 00:13:24,090 --> 00:13:28,460 >> Тако да када индексних Валс, ти си ће добити труе, труе, ИСТИНА. 229 00:13:28,460 --> 00:13:31,420 Тако да ће рећи да, Желим те три елемента. 230 00:13:31,420 --> 00:13:33,520 А онда ЛАЖ ЛАЖ ЛАЖ лаж се дешава 231 00:13:33,520 --> 00:13:37,140 рећи не, ја не желим те елементе па то неће да их врате. 232 00:13:37,140 --> 00:13:41,490 >> И претпостављам заправо постоји грешка у куцању овде јер ово говори понављање ТАЧНО 3 233 00:13:41,490 --> 00:13:47,990 и поновите нетачно 4, и технички, вас само шест елемената тако поновите ЛАЖ 234 00:13:47,990 --> 00:13:50,470 требало би да буде поновити ФАЛСЕ 3. 235 00:13:50,470 --> 00:13:55,260 Мислим Р је такође довољно паметан што да ако само наведете 4 овде, онда 236 00:13:55,260 --> 00:13:56,630 неће ни грешкама ван. 237 00:13:56,630 --> 00:13:58,480 Само ће вам дати ову вредност. 238 00:13:58,480 --> 00:14:00,970 Тако да ћу игнорисати ту четврту ФАЛСЕ. 239 00:14:00,970 --> 00:14:05,310 240 00:14:05,310 --> 00:14:09,270 >> Дакле овде је вецторизед задатак. 241 00:14:09,270 --> 00:14:15,480 Дакле сет.сеед-- ово само поставља семе за псеудослучајних бројева. 242 00:14:15,480 --> 00:14:20,110 Тако сам постављање семе на 42, што значи да ако ја генерира 243 00:14:20,110 --> 00:14:22,950 три случајна нормално вредности, а затим ако вас 244 00:14:22,950 --> 00:14:27,400 рун сет.сеед сами рачунар користећи исту вредност 42, 245 00:14:27,400 --> 00:14:30,990 онда добијате иста три рандом нормале. 246 00:14:30,990 --> 00:14:33,411 >> Дакле, ово је стварно добро фор репродуктивности. 247 00:14:33,411 --> 00:14:35,910 Обично, када радиш нешто некако научне анализе, 248 00:14:35,910 --> 00:14:37,230 што би желели да подесите семе. 249 00:14:37,230 --> 00:14:41,270 На тај начин други научници могу само репродукују потпуно исту шифру сте 250 00:14:41,270 --> 00:14:44,790 учињено јер ће имати тачан Исти случајне променљиве то-- или случајни 251 00:14:44,790 --> 00:14:47,270 Вредности које сте снимили отпуштен. 252 00:14:47,270 --> 00:14:49,870 253 00:14:49,870 --> 00:14:53,910 >> И тако вецторизед задатак Овде се показује Валс 1 до 2. 254 00:14:53,910 --> 00:14:59,290 Тако да предузима прве два елемента од валс а затим их додељује на 0. 255 00:14:59,290 --> 00:15:03,940 А онда, можете такође јуст до Слична ствар са логичке. 256 00:15:03,940 --> 00:15:09,340 >> Дакле валс није једнак 0-- ову вољу дати вам векторску фалсе, ЛАЖ ТРУЕ 257 00:15:09,340 --> 00:15:10,350 у овом случају. 258 00:15:10,350 --> 00:15:13,770 И онда, то ће рећи било од тих индекса је то истина, 259 00:15:13,770 --> 00:15:15,270 онда ће то одредити који до 5. 260 00:15:15,270 --> 00:15:18,790 Тако да је на трећем елемент овде и онда га додељује до 5. 261 00:15:18,790 --> 00:15:22,300 >> А ово је заиста лепо у односу на језике ниским 262 00:15:22,300 --> 00:15:25,560 где морате да користите за петље да урадите све ове ствари Вецторизед 263 00:15:25,560 --> 00:15:30,281 јер то је само врло интуитиван и то је једна једина-Линер. 264 00:15:30,281 --> 00:15:32,030 А шта је добро у вецторизед нотација 265 00:15:32,030 --> 00:15:37,020 је да у Р, су врста уграђени тако да су скоро једнако брзо 266 00:15:37,020 --> 00:15:42,490 како раде у језику ниског нивоа као насупрот томе да за петљу у Р 267 00:15:42,490 --> 00:15:46,317 а затим да се уради динамичан сама индексирање. 268 00:15:46,317 --> 00:15:48,900 И то ће бити спорији него ради ова врста Вецторизед ствари 269 00:15:48,900 --> 00:15:55,950 где може да га уради паралелно, где она то ради у тхреадинг основи. 270 00:15:55,950 --> 00:15:58,650 >> Дакле овде је Вецторизед операције. 271 00:15:58,650 --> 00:16:04,920 Тако сам генерише вредност од 1 до 3, додељивање то вец1, 3 до 5, вец2, 272 00:16:04,920 --> 00:16:05,950 додајући их заједно. 273 00:16:05,950 --> 00:16:11,490 То им додаје компонента питању тако то је 1 плус 3, 2 плус 4, и тако даље. 274 00:16:11,490 --> 00:16:13,330 >> вец1 пута вец2. 275 00:16:13,330 --> 00:16:16,110 Ово повећава два Вредности компоненту мудар. 276 00:16:16,110 --> 00:16:21,830 Тако да је 1 пута 3, 2 пута 4, а онда 3 пута 5. 277 00:16:21,830 --> 00:16:28,250 >> А онда, на сличан начин можете да урадите и цомпарисонс-- логичких поређења. 278 00:16:28,250 --> 00:16:33,640 Тако да је фалсе фалсе труе у ово Случај јер 1 није већи од 3, 279 00:16:33,640 --> 00:16:35,920 2 није већа од 4. 280 00:16:35,920 --> 00:16:41,160 Ово је, претпостављам, још један куцању, 3 дефинитивно није већи од 5. 281 00:16:41,160 --> 00:16:41,660 Да. 282 00:16:41,660 --> 00:16:45,770 И тако можете само учинити све ове једноставне операције 283 00:16:45,770 --> 00:16:48,350 јер њихов наследио од самих класа. 284 00:16:48,350 --> 00:16:51,110 285 00:16:51,110 --> 00:16:52,580 >> Дакле, то је био само вектор. 286 00:16:52,580 --> 00:16:56,530 И то је нека врста најосновнији Р објекат јер дат вектор, 287 00:16:56,530 --> 00:16:59,170 можете изградити напредније објекте. 288 00:16:59,170 --> 00:17:00,560 >> Дакле, ево матрица. 289 00:17:00,560 --> 00:17:05,030 Ово је у суштини апстракција шта матрица сама је. 290 00:17:05,030 --> 00:17:10,099 Дакле, у овом случају, то је три различита вектори, где свако је колона, 291 00:17:10,099 --> 00:17:12,710 или га можете размотрити као сваки од њих је ред. 292 00:17:12,710 --> 00:17:18,250 >> Тако сам чување матрицу од 1 до 9 и онда ја прецизирајући 3 реда. 293 00:17:18,250 --> 00:17:23,364 Дакле 1 до 9 ће вам дати вектор 1, 2, 3, 4, 5, 6, па све до 9. 294 00:17:23,364 --> 00:17:29,250 >> Једно је такође имати на уму да је Р продавнице вредности у колони-мајор формату. 295 00:17:29,250 --> 00:17:34,160 Другим речима, када видите 1 до 9, то ће складиштити томе-- 296 00:17:34,160 --> 00:17:36,370 то ће бити 1, 2, 3 у првој колони, 297 00:17:36,370 --> 00:17:38,510 а онда ћу 4, 5, 6 у другој колони, 298 00:17:38,510 --> 00:17:41,440 и онда 7, 8, 9 у трећој колони. 299 00:17:41,440 --> 00:17:45,570 >> А ево и неких других заједничке функције које можете користити. 300 00:17:45,570 --> 00:17:49,650 Дакле дим простирка, ово ће вам дати димензије матрице. 301 00:17:49,650 --> 00:17:52,620 То ће вас вратити вектор димензије. 302 00:17:52,620 --> 00:17:55,580 Дакле, у овом случају, јер наша матрица је 3 за 3, 303 00:17:55,580 --> 00:18:01,900 то ће вам дати нумерички вектор то је 3 3. 304 00:18:01,900 --> 00:18:05,270 >> И овде је управо показује матрица множење. 305 00:18:05,270 --> 00:18:11,970 Дакле обично, ако само урадите астериск-- тако мат звездицом мат-- 306 00:18:11,970 --> 00:18:15,380 ово ће бити компонента питању операција 307 00:18:15,380 --> 00:18:17,300 или шта се зове Хадамард производ. 308 00:18:17,300 --> 00:18:21,310 Тако ће то учинити сваки Елемент компонента-мудар. 309 00:18:21,310 --> 00:18:23,610 Међутим, ако желите матрица мултиплицатион-- 310 00:18:23,610 --> 00:18:29,380 тако множењем прве пута редова Прва колона друге матрице је 311 00:18:29,380 --> 00:18:34,510 и тако ајде-- би користили ово одсто операција. 312 00:18:34,510 --> 00:18:38,110 >> И т мат је само Операција за транспонована. 313 00:18:38,110 --> 00:18:42,590 Тако ја кажем узети транспоновања у матрица, помножите по матрици 314 00:18:42,590 --> 00:18:43,090 Сама. 315 00:18:43,090 --> 00:18:45,006 А онда ће то враћа код Вас друго 3 316 00:18:45,006 --> 00:18:50,700 од 3 матрице приказивања производ да желиш. 317 00:18:50,700 --> 00:18:53,750 >> И тако је било матрица. 318 00:18:53,750 --> 00:18:56,020 Ево шта се зове оквир података. 319 00:18:56,020 --> 00:19:00,780 Подаци рам можете мислити као о матрица, али свака сама колона 320 00:19:00,780 --> 00:19:02,990 ће бити различитог типа. 321 00:19:02,990 --> 00:19:07,320 >> Па шта је стварно кул о подацима оквири је да у самом анализи података, 322 00:19:07,320 --> 00:19:11,260 ћеш имати све ово хетерогених података и све то заиста 323 00:19:11,260 --> 00:19:15,640 Месси ствари где сваки од колона сами могу бити различитих типова. 324 00:19:15,640 --> 00:19:21,460 Па ево ја кажем створити фраме подаци, до интс од 1 до 3, 325 00:19:21,460 --> 00:19:24,750 и онда имају и вектор карактера. 326 00:19:24,750 --> 00:19:28,470 Тако да могу индекс кроз сваки од ових колона 327 00:19:28,470 --> 00:19:30,930 а онда ћу добити саме вредности. 328 00:19:30,930 --> 00:19:34,370 И можете да урадите неку врсту операција на фрејмова података. 329 00:19:34,370 --> 00:19:38,040 И већину времена када сте ради анализе података или неку врсту 330 00:19:38,040 --> 00:19:42,042 од предпроцесирања, бићете рад са овим структурама података 331 00:19:42,042 --> 00:19:44,250 где свака колона иде да буде од различитог типа. 332 00:19:44,250 --> 00:19:47,880 333 00:19:47,880 --> 00:19:52,970 >> Коначно, тако да су у суштини само четири битне објекти у Р. Лист 334 00:19:52,970 --> 00:19:55,820 ће само прикупљати било други објекти желите. 335 00:19:55,820 --> 00:20:00,130 Тако да ће сачувати ово у један променљива да лако можете приступити. 336 00:20:00,130 --> 00:20:02,370 >> Дакле овде, ја узимам листу. 337 00:20:02,370 --> 00:20:04,460 Кажем ствари једнако 3. 338 00:20:04,460 --> 00:20:08,060 Тако ћу имати један елемент у Листа, и то се зове ствар, 339 00:20:08,060 --> 00:20:10,570 и то ће имати вредност 3. 340 00:20:10,570 --> 00:20:13,140 >> Такође можете да креирате матрицу. 341 00:20:13,140 --> 00:20:17,970 Дакле, ово је 1 до 4 и крај реда једнако 2, па 2 би 2 матрице. 342 00:20:17,970 --> 00:20:20,270 Такође на листи и то се зове мат. 343 00:20:20,270 --> 00:20:24,690 мореСтуфф, низ карактера, и чак још један списак по себи. 344 00:20:24,690 --> 00:20:27,710 >> Дакле, ово је листа која је 5 и медведа. 345 00:20:27,710 --> 00:20:30,990 Тако да има вредност 5 и то има карактер стринг сносити 346 00:20:30,990 --> 00:20:32,710 и то је списак унутар листе. 347 00:20:32,710 --> 00:20:35,965 Тако да можете имати ове рекурзивне ствари где 348 00:20:35,965 --> 00:20:38,230 имате анотхер-- А укуцајте у оквиру типа. 349 00:20:38,230 --> 00:20:41,420 Дакле слично, можете имати матрицу унутар другог матрице и тако даље. 350 00:20:41,420 --> 00:20:44,264 И листа је само добар начин прикупљања и агрегирања 351 00:20:44,264 --> 00:20:45,430 сви ти различити предмети. 352 00:20:45,430 --> 00:20:50,210 353 00:20:50,210 --> 00:20:57,150 >> И на крају, ту је само помогне у случају ово је само нестао изнад веома брзо. 354 00:20:57,150 --> 00:21:01,350 Значи било када си збуњен о некаквој функцији, 355 00:21:01,350 --> 00:21:03,510 можете да урадите помоћ те функције. 356 00:21:03,510 --> 00:21:07,120 Тако можете да урадите за помоћ матрицу или матрица знак питања. 357 00:21:07,120 --> 00:21:11,430 И помоћ и знак питања су само скраћеница за исту ствар 358 00:21:11,430 --> 00:21:13,040 тако да су језик. 359 00:21:13,040 --> 00:21:16,820 >> лм је функција која Само ради линеарни модел. 360 00:21:16,820 --> 00:21:20,340 Али ако само немате појма како се то Радови, можете само да урадите помоћ за ЛМ 361 00:21:20,340 --> 00:21:24,610 и да ћу вам дати неке врста документације која 362 00:21:24,610 --> 00:21:27,960 Изгледа некако као човек страна у Уник, где 363 00:21:27,960 --> 00:21:34,210 имате кратак опис онога што то ради, и шта његови аргументи су, 364 00:21:34,210 --> 00:21:38,850 оно што се враћа, а само савете о томе како да га користи, а неки од примера као добро. 365 00:21:38,850 --> 00:21:41,680 366 00:21:41,680 --> 00:21:52,890 >> Тако да ме само напред и шоу неке демо коришћења Р. ОК. 367 00:21:52,890 --> 00:21:55,470 Тако сам отишао веома брзо само подаци 368 00:21:55,470 --> 00:21:59,440 структуре и нека врста оп-- неке од операција. 369 00:21:59,440 --> 00:22:02,960 Ево неке функције. 370 00:22:02,960 --> 00:22:06,750 >> Па ево ја само идем дефинисати функцију. 371 00:22:06,750 --> 00:22:09,970 Тако сам и користим оператор додељивања овде, 372 00:22:09,970 --> 00:22:12,610 и онда ја кажем прогласи га као функција. 373 00:22:12,610 --> 00:22:14,140 И то узима вредност к. 374 00:22:14,140 --> 00:22:18,210 Дакле, ово је било вредност желите и ја ћу да се вратим к себе. 375 00:22:18,210 --> 00:22:20,840 Дакле, ово је функција идентитет. 376 00:22:20,840 --> 00:22:23,670 >> А шта је кул о томе у поређењу са другим језицима 377 00:22:23,670 --> 00:22:26,330 и друго лов-левел језици је да је к 378 00:22:26,330 --> 00:22:29,350 могу бити било ког типа самог и то ће вратити тај тип. 379 00:22:29,350 --> 00:22:35,251 Тако да можете имагине-- тако пустити Само да покренете ово брзо. 380 00:22:35,251 --> 00:22:35,750 Извините. 381 00:22:35,750 --> 00:22:40,300 >> Тако једна ствар коју треба поменути је да је овај уредник ја користим 382 00:22:40,300 --> 00:22:41,380 назива Рстудио. 383 00:22:41,380 --> 00:22:44,389 То је оно што се зове ИДЕ. 384 00:22:44,389 --> 00:22:46,180 И једна ствар која је стварно лепо о томе 385 00:22:46,180 --> 00:22:51,500 је да садржи доста ствари које желите да урадите у Р по себи 386 00:22:51,500 --> 00:22:53,180 Само врло интуитивно. 387 00:22:53,180 --> 00:22:55,550 >> Дакле овде је преводилац конзола. 388 00:22:55,550 --> 00:23:02,160 Дакле слично, можете добити ово конзола сирова само на тај капитални Р. 389 00:23:02,160 --> 00:23:05,630 А то је управо исто што и конзоле. 390 00:23:05,630 --> 00:23:12,210 Тако да сам само да урадим Функција к, к, к. 391 00:23:12,210 --> 00:23:16,130 И онда и онда да ће бити у реду сама. 392 00:23:16,130 --> 00:23:19,200 393 00:23:19,200 --> 00:23:21,740 >> Дакле Рстудио је супер јер има конзолу. 394 00:23:21,740 --> 00:23:25,360 Такође има документи желите да покренете на. 395 00:23:25,360 --> 00:23:28,629 А онда она има неке варијабле да можете да видите у срединама. 396 00:23:28,629 --> 00:23:30,420 А онда, ако имате да уради парцела, онда вам 397 00:23:30,420 --> 00:23:33,730 могу само да видим овде, за разлику од управљање све ове различите прозоре 398 00:23:33,730 --> 00:23:35,940 сами. 399 00:23:35,940 --> 00:23:40,530 >> Ја стварно лично користим Вим, али ја осећате као Рстудио је одличан само 400 00:23:40,530 --> 00:23:44,640 за добијање добру идеју како да користи Р. Обично, 401 00:23:44,640 --> 00:23:47,040 кад покушаваш да леарн неки нови задатак, 402 00:23:47,040 --> 00:23:49,590 Ви не желите да руковање превише ствари одједном. 403 00:23:49,590 --> 00:23:53,120 Дакле Р је само вери-- Рстудио је веома добар начин учења Р 404 00:23:53,120 --> 00:23:56,760 без потребе да се баве све те остале ствари. 405 00:23:56,760 --> 00:23:58,600 >> Па ево ја водим ид здраво. 406 00:23:58,600 --> 00:24:00,090 Ово враћа здраво. 407 00:24:00,090 --> 00:24:01,740 ИД 123. 408 00:24:01,740 --> 00:24:04,610 Ево вектор целих бројева. 409 00:24:04,610 --> 00:24:08,620 Дакле слично, јер можете преузима никакву неку врсту вредности, 410 00:24:08,620 --> 00:24:16,060 можете да урадите повратку ид од к тако да враћа 1234 и 5. 411 00:24:16,060 --> 00:24:22,210 >> И нека ми само ти покажем да ово је заиста цео број. 412 00:24:22,210 --> 00:24:28,800 И слично, ако урадите класу ИД Кс, то ће бити цео број. 413 00:24:28,800 --> 00:24:34,170 А онда, можете такође упореди два и то је истина. 414 00:24:34,170 --> 00:24:38,350 Тако да гледам да ли ид од к једнако једнако је Кс и обавештење 415 00:24:38,350 --> 00:24:39,760 да вам даје два Труес. 416 00:24:39,760 --> 00:24:44,280 Дакле, ово не говори се два објекти идентичне, 417 00:24:44,280 --> 00:24:46,845 али су сваки од уноса у вектори идентични. 418 00:24:46,845 --> 00:24:50,000 419 00:24:50,000 --> 00:24:52,090 >> Ево боундед.цомпаре. 420 00:24:52,090 --> 00:24:58,470 Дакле, ово је мало компликованије у томе што има ако стање и друго 421 00:24:58,470 --> 00:25:00,960 и онда потребно двоје аргументи у једном тренутку. 422 00:25:00,960 --> 00:25:02,640 Дакле, к је било ког типа. 423 00:25:02,640 --> 00:25:06,280 И ја кажем ово Други аргумент је. 424 00:25:06,280 --> 00:25:08,380 То може бити било као добро. 425 00:25:08,380 --> 00:25:12,490 Али по дефаулту, то ће узети 5 ако не наведете ништа. 426 00:25:12,490 --> 00:25:16,730 >> Па ево ја ћу да кажем ако је к већа од. 427 00:25:16,730 --> 00:25:19,220 Дакле, ако ја не прецизира, то каже да ако је к већи од 5, 428 00:25:19,220 --> 00:25:20,470 онда ћу да врати ИСТИНА. 429 00:25:20,470 --> 00:25:23,230 друго, ја ћу да врати ЛАЖ. 430 00:25:23,230 --> 00:25:24,870 Тако да ме само напред и дефинисати ово. 431 00:25:24,870 --> 00:25:30,600 432 00:25:30,600 --> 00:25:34,550 >> И сад ћу да рун боундед.цомпаре 3. 433 00:25:34,550 --> 00:25:39,150 Тако пише се 3 мање тхан-- је 3 већи од 5. 434 00:25:39,150 --> 00:25:41,830 Не, то није тако ЛАЖ. 435 00:25:41,830 --> 00:25:46,550 >> И боундед.цомпаре 3 и идем да га поредите користећи једнака 2. 436 00:25:46,550 --> 00:25:50,700 Тако сада ја кажем да, сад сам Желим да будем нешто друго. 437 00:25:50,700 --> 00:25:52,750 Зато ћу да кажем, требало би да буде 2. 438 00:25:52,750 --> 00:25:56,640 >> Ја могу да урадим било овакво нотација или кажем једнака 2. 439 00:25:56,640 --> 00:25:58,720 Ово је још читљив у које кад си 440 00:25:58,720 --> 00:26:01,450 лоокинг ат ово стварно компликоване функције које 441 00:26:01,450 --> 00:26:08,110 узети мултипле аргументс-- и ово може бити десетине офтентимес-- Само кажем 442 00:26:08,110 --> 00:26:11,140 једнако 2 је још читљив за Ви тако да касније у будућности 443 00:26:11,140 --> 00:26:13,020 знаћете шта радите. 444 00:26:13,020 --> 00:26:17,120 >> Дакле, у овом случају, ја сам изрека је 3 већи од 2. 445 00:26:17,120 --> 00:26:18,270 Да је то. 446 00:26:18,270 --> 00:26:22,350 И слично, могу само да уклоните ово и кажу, је већи од 3 2 447 00:26:22,350 --> 00:26:23,440 где једнако 2. 448 00:26:23,440 --> 00:26:26,230 И то је такође истина. 449 00:26:26,230 --> 00:26:26,730 Да? 450 00:26:26,730 --> 00:26:29,670 >> ПУБЛИКА: Јеси ли извршава линију по линију? 451 00:26:29,670 --> 00:26:30,670 >> ДУСТИН Тран: Да сам. 452 00:26:30,670 --> 00:26:33,900 Па шта ја радим овде је узимајући овај текст доцумент-- 453 00:26:33,900 --> 00:26:39,825 и то супер ствари Рстудио је да Само могу покренути схорт-- кључну пречицу. 454 00:26:39,825 --> 00:26:41,820 Тако радим Контрола-Ентер. 455 00:26:41,820 --> 00:26:44,850 >> И онда, узимам линија у тексту документа 456 00:26:44,850 --> 00:26:46,710 а затим стављање у конзоли. 457 00:26:46,710 --> 00:26:50,800 Па ево ја кажем, боундед.цомпаре и ја радим Цонтрол-Кс. 458 00:26:50,800 --> 00:26:52,540 Тако да сам само да ми покренути и овде. 459 00:26:52,540 --> 00:26:54,920 А онда да ћу се линија и онда га стави овде. 460 00:26:54,920 --> 00:26:57,900 А онда на сличан начин, ја могу да покренути овде. 461 00:26:57,900 --> 00:27:04,630 И онда ће само наставите да дефинисање линије у конзолу тако. 462 00:27:04,630 --> 00:27:10,690 >> А ако се примети витичасте протеза постоје баш као у Ц синтакси. 463 00:27:10,690 --> 00:27:13,910 к-- ако ако услов је такође ће користити заграде и онда 464 00:27:13,910 --> 00:27:15,350 можете користити друго. 465 00:27:15,350 --> 00:27:17,496 Друга је иначе, ако. 466 00:27:17,496 --> 00:27:21,440 Дакле, ово ће бити к једнако једнако, на пример. 467 00:27:21,440 --> 00:27:24,190 468 00:27:24,190 --> 00:27:26,350 А онда ћу да Овде се врате нешто. 469 00:27:26,350 --> 00:27:29,490 >> Обратите пажњу да постоје два различита ствари овде које се дешава. 470 00:27:29,490 --> 00:27:34,360 Једна је да овде сам наводећи ретурн вредност ТРУЕ. 471 00:27:34,360 --> 00:27:35,950 Ево ја само кажем к. 472 00:27:35,950 --> 00:27:39,970 Дакле Р ће обично подразумевано узети последњу аргументс-- 473 00:27:39,970 --> 00:27:43,510 или узети последњу линију кода, и да ће бити оно што је вратио. 474 00:27:43,510 --> 00:27:46,920 Па ево ово је иста ствар као раде ретурн к. 475 00:27:46,920 --> 00:27:49,450 476 00:27:49,450 --> 00:27:50,540 >> И само да ти покажем. 477 00:27:50,540 --> 00:27:54,000 478 00:27:54,000 --> 00:27:57,052 А онда, она ће радити само тако. 479 00:27:57,052 --> 00:27:58,260 Па нека ми наставимо са овим. 480 00:27:58,260 --> 00:28:00,630 >> Тако иф. 481 00:28:00,630 --> 00:28:04,060 И заиста, ја могу да се врате нешто што бих. 482 00:28:04,060 --> 00:28:06,680 Тако да не морате чак ни да ретурн Боолеанс све време, 483 00:28:06,680 --> 00:28:08,410 Могу само да се врати нешто друго. 484 00:28:08,410 --> 00:28:10,670 Тако да могу да урадим повратну медведа. 485 00:28:10,670 --> 00:28:12,989 >> Дакле, ако је к једнако једнако, то ће да се врате медведа. 486 00:28:12,989 --> 00:28:14,530 У супротном, то ће вратити ИСТИНУ. 487 00:28:14,530 --> 00:28:19,310 Такође, могу да урадим вектор или стварно ништа. 488 00:28:19,310 --> 00:28:22,210 >> И нормално у статички откуцани језици, 489 00:28:22,210 --> 00:28:23,840 морао би да наведете овде тип. 490 00:28:23,840 --> 00:28:25,750 И приметио да само може бити било шта. 491 00:28:25,750 --> 00:28:32,400 И Р је интелигентан довољно да њега ће само учинити и то ће радити добро. 492 00:28:32,400 --> 00:28:33,620 >> Па нека ми дефинисати ово. 493 00:28:33,620 --> 00:28:39,460 494 00:28:39,460 --> 00:28:41,230 Унекпецтед-- ох жао. 495 00:28:41,230 --> 00:28:44,336 То би требало да буде коврџава браће овде. 496 00:28:44,336 --> 00:28:44,836 У реду. 497 00:28:44,836 --> 00:28:45,336 Цоол. 498 00:28:45,336 --> 00:28:52,580 499 00:28:52,580 --> 00:28:54,530 У реду. 500 00:28:54,530 --> 00:28:58,250 Па сада да упоредимо 3 и једнака 3. 501 00:28:58,250 --> 00:29:01,860 Тако да би требало да ретурн-- Да-- корисног медведа. 502 00:29:01,860 --> 00:29:06,740 >> Тако сада више уопште ствар је као шта је са другим структурама података. 503 00:29:06,740 --> 00:29:09,110 Тако да имате ову функцију. 504 00:29:09,110 --> 00:29:15,360 Ово ће радити на било које врсте од вредности попут 3 или било које Нумериц, 505 00:29:15,360 --> 00:29:17,500 другим речима, дупло. 506 00:29:17,500 --> 00:29:19,330 >> Али шта је са нешто попут вектора. 507 00:29:19,330 --> 00:29:27,750 Па шта се дешава ако Па-- сам ће доделити вал до, рецимо, од 4 до 6. 508 00:29:27,750 --> 00:29:31,640 Дакле, ако се вратим ово, ово је вектор из 4, 5, 6. 509 00:29:31,640 --> 00:29:34,935 >> Сада да видимо шта ће се десити ако урадим боундед.цомпаре вал. 510 00:29:34,935 --> 00:29:37,680 511 00:29:37,680 --> 00:29:42,450 Дакле, ово ће вам дати 15 1251. 512 00:29:42,450 --> 00:29:46,440 Другим речима, она каже ако погледате овај услов 513 00:29:46,440 --> 00:29:50,040 тако пише к је мање него или нешто. 514 00:29:50,040 --> 00:29:51,880 Дакле, ово је благо јер збуњујуће сада 515 00:29:51,880 --> 00:29:53,379 само не знам шта се дешава. 516 00:29:53,379 --> 00:29:58,690 Па претпостављам једну ствар која је заиста добро о само покушавам да дебуг 517 00:29:58,690 --> 00:30:04,600 је да можете само до Вал већа него и види шта се дешава тамо. 518 00:30:04,600 --> 00:30:09,720 >> Дакле вал-- је подразумевано 5 СО хајде да до Вал већи од 5. 519 00:30:09,720 --> 00:30:14,280 Дакле, ово је вектор фалсе фалсе труе. 520 00:30:14,280 --> 00:30:17,206 Тако да сада када гледате ово, то ће рећи ако, 521 00:30:17,206 --> 00:30:20,080 а онда ће вам дати ово је вектор фалсе фалсе труе. 522 00:30:20,080 --> 00:30:23,450 >> Дакле, када се прође ово у Р, Р нема појма шта радиш. 523 00:30:23,450 --> 00:30:26,650 Јер очекује један сингл вредност, која је Булова, и сад 524 00:30:26,650 --> 00:30:29,420 ви дајући јој вектор логичке. 525 00:30:29,420 --> 00:30:31,970 Тако се уобичајено, Р је само рећи за име бога, 526 00:30:31,970 --> 00:30:35,440 Идем да претпоставимо да сте Биће потребно први елемент овде. 527 00:30:35,440 --> 00:30:38,320 Зато ћу прицала- Идем претпоставити да је ова лажна. 528 00:30:38,320 --> 00:30:40,890 Тако ће то рећи Не, то није у реду. 529 00:30:40,890 --> 00:30:45,246 >> Слично, то ће бе Вал једнака једнака. 530 00:30:45,246 --> 00:30:47,244 Не, извини 5. 531 00:30:47,244 --> 00:30:48,910 И то је такође ће бити лажна као добро. 532 00:30:48,910 --> 00:30:52,410 Тако да ће рећи не, Није тачно, као да је то 533 00:30:52,410 --> 00:30:53,680 ће вратити овај последњи. 534 00:30:53,680 --> 00:30:56,420 535 00:30:56,420 --> 00:31:01,360 >> Дакле, ово је било добро или лоше ствар, у зависности од тога колико сте је видели. 536 00:31:01,360 --> 00:31:05,104 Јер кад си креирање ове функције, 537 00:31:05,104 --> 00:31:06,770 не знам стварно шта се дешава. 538 00:31:06,770 --> 00:31:10,210 Дакле понекад да желиш грешку, или можда само желите упозорење. 539 00:31:10,210 --> 00:31:12,160 У овом случају, Р то не ради. 540 00:31:12,160 --> 00:31:14,300 Тако да је стварно до ви базирано на основу које 541 00:31:14,300 --> 00:31:17,310 мислите језик треба да уради у овом случају 542 00:31:17,310 --> 00:31:22,920 ако прође у вектора логичке када радиш ако стању. 543 00:31:22,920 --> 00:31:31,733 >> Рецимо да сте имали оригинални једна са другом, ако врати ИСТИНА и ти си 544 00:31:31,733 --> 00:31:34,190 ће да врати ЛАЖ. 545 00:31:34,190 --> 00:31:39,300 Дакле, један начин апстраховања ово је за И рећи 546 00:31:39,300 --> 00:31:41,530 не треба ни ту условну ствар. 547 00:31:41,530 --> 00:31:47,220 Још једна ствар коју могу да урадим је само враћање саме вредности. 548 00:31:47,220 --> 00:31:53,240 Дакле, ако приметите, ако вас до вал је већи од 5, 549 00:31:53,240 --> 00:31:56,350 ово це да се врати вектор фалсе фалсе труе. 550 00:31:56,350 --> 00:31:58,850 >> Можда је то оно што сте Желим за боундед.цомпаре. 551 00:31:58,850 --> 00:32:02,940 Желите да се вратите вектор логичке где се пореди сваки од вредности 552 00:32:02,940 --> 00:32:04,190 да себи. 553 00:32:04,190 --> 00:32:11,165 Тако можете само да боундед.цомпаре функције к, износи 5. 554 00:32:11,165 --> 00:32:13,322 555 00:32:13,322 --> 00:32:15,363 И онда уместо да ради ово ако друго стање, 556 00:32:15,363 --> 00:32:21,430 Само ћу да се врате к је већи од 5. 557 00:32:21,430 --> 00:32:23,620 Дакле, ако је то истина, онда да ће вратити ИСТИНУ. 558 00:32:23,620 --> 00:32:26,830 И онда ако није, то је ће да врати ЛАЖ. 559 00:32:26,830 --> 00:32:30,880 >> И то ће радити за било који од ових структура. 560 00:32:30,880 --> 00:32:41,450 Тако да могу боундед.цомпаре Ц 1 6 или 9 а онда ћу да кажем једнако 6, 561 00:32:41,450 --> 00:32:42,799 на пример. 562 00:32:42,799 --> 00:32:44,840 А онда ће то дати вам праву Боолеан 563 00:32:44,840 --> 00:32:48,240 вектор да ли дизајнирате. 564 00:32:48,240 --> 00:32:50,660 >> Дакле, то су само функције и ми сад нека само 565 00:32:50,660 --> 00:32:54,980 схов иоу неке интерактивне визуелне. 566 00:32:54,980 --> 00:32:59,700 Ја не мислим да сам у ствари имам Ви-Фи, овде па пусти ме само напред 567 00:32:59,700 --> 00:33:01,970 и прескочите овај ваљда. 568 00:33:01,970 --> 00:33:05,260 >> Али једна ствар која је цоол иако је да ако вас само 569 00:33:05,260 --> 00:33:09,600 желите да тестирате гомилу различите команде података, 570 00:33:09,600 --> 00:33:13,320 постоји гомила различитих скупова података да су већ инсталираним у Р. 571 00:33:13,320 --> 00:33:15,770 Тако један од њих је зове Ирис датасет. 572 00:33:15,770 --> 00:33:18,910 Ово је један од најпознатијих оне у машинског учења. 573 00:33:18,910 --> 00:33:23,350 Обично ћу урадити неку врсту тест случајеви да видите да ли код ради. 574 00:33:23,350 --> 00:33:27,520 Па хајде да проверим шта ирис је. 575 00:33:27,520 --> 00:33:33,130 >> Дакле, ово ствар иде да оквир података. 576 00:33:33,130 --> 00:33:36,000 И да је мало дуго, јер Само одштампан ирис. 577 00:33:36,000 --> 00:33:38,810 То је одштампа целу ствар. 578 00:33:38,810 --> 00:33:42,830 Тако да је сва та различита имена. 579 00:33:42,830 --> 00:33:45,505 Дакле ирис је збирка од различитих цвеће. 580 00:33:45,505 --> 00:33:48,830 У овом случају, то говори Ви се врста ње, 581 00:33:48,830 --> 00:33:54,760 сви ти различити ширине и дужине на чашицу и латицу. 582 00:33:54,760 --> 00:33:58,880 >> И тако нормално, ако желите да одштампате ирис, 583 00:33:58,880 --> 00:34:03,680 На пример, не желите да га имају урадите све ово јер то може да преузме 584 00:34:03,680 --> 00:34:05,190 твој цијели конзола. 585 00:34:05,190 --> 00:34:09,280 Дакле, једна ствар која је стварно лепо је функција глава. 586 00:34:09,280 --> 00:34:12,929 Тако да ако само урадите главу ириса, ово ће вам дати 587 00:34:12,929 --> 00:34:17,389 Првих пет редова, или шест ваљда. 588 00:34:17,389 --> 00:34:19,909 А онда добро ти, могу само навести овде. 589 00:34:19,909 --> 00:34:22,914 Дакле 20-- то ће дати ти првих 20 редова. 590 00:34:22,914 --> 00:34:24,830 И ја сам био некако изненађен да је ова 591 00:34:24,830 --> 00:34:28,770 дао ми шест па ћу само напред и проверите ирис-- или главу, извини. 592 00:34:28,770 --> 00:34:31,699 593 00:34:31,699 --> 00:34:34,960 И овде ће дати Ви документација 594 00:34:34,960 --> 00:34:37,960 онога вредност глава ради. 595 00:34:37,960 --> 00:34:40,839 Тако да враћа први или последњи неког објекта. 596 00:34:40,839 --> 00:34:42,630 А онда ћу да погледате вредности. 597 00:34:42,630 --> 00:34:47,340 И онда се каже подразумевани Начин глава х и н једнако 6Л. 598 00:34:47,340 --> 00:34:50,620 Дакле, ово враћа првих шест елемената. 599 00:34:50,620 --> 00:34:55,050 И слично ако приметите овде, ја није морао да прецизира н једнако 6. 600 00:34:55,050 --> 00:34:56,840 Подразумева се користи шест, претпостављам. 601 00:34:56,840 --> 00:35:00,130 А онда, ако желим да наведете одређени вредност, онда ја могу да видите да је то добро. 602 00:35:00,130 --> 00:35:02,970 603 00:35:02,970 --> 00:35:10,592 >> Тако да је неке једноставне команде и ево још једног који је само-- добро, 604 00:35:10,592 --> 00:35:12,550 Могу-- ово је заправо мало сложенији, 605 00:35:12,550 --> 00:35:17,130 али то ће само узети разред сваког колони ириса података. 606 00:35:17,130 --> 00:35:20,910 Дакле, ово ће вам показати шта сваки од њих Колоне су у смислу њихових типова. 607 00:35:20,910 --> 00:35:23,665 Дакле чашични листић дужина је нумерички, чашични листић ширина је нумерички. 608 00:35:23,665 --> 00:35:26,540 Све ове вредности су само бројчани јер можете рећи из ове податке 609 00:35:26,540 --> 00:35:29,440 структуира су све иде у нумеричке. 610 00:35:29,440 --> 00:35:34,310 >> А колона Специес ће бити фактор. 611 00:35:34,310 --> 00:35:37,270 Дакле нормално, помислили бисте да је ово је као низ карактера. 612 00:35:37,270 --> 00:35:48,830 Али ако само урадите ирисСпециес, а онда ћу да урадим главу 5, 613 00:35:48,830 --> 00:35:51,820 а ово ће штампати оут првих пет вредности. 614 00:35:51,820 --> 00:35:54,150 >> А онда приметите ове нивое. 615 00:35:54,150 --> 00:35:58,870 Дакле, ово је кажем-- ово је Р-ов начин да имају категорички променљиве. 616 00:35:58,870 --> 00:36:03,765 Дакле, уместо да само има знакова стрингс, 617 00:36:03,765 --> 00:36:06,740 има нивое Специфиинг која од ових ствари су. 618 00:36:06,740 --> 00:36:12,450 >> Рецимо ирисСпециес 1. 619 00:36:12,450 --> 00:36:17,690 Па шта желите да урадите овде је досадно -сет да ова врста колоне. 620 00:36:17,690 --> 00:36:21,480 Дакле, ово узима Врста колона и онда 621 00:36:21,480 --> 00:36:23,820 ит индекси добити први елемент. 622 00:36:23,820 --> 00:36:27,140 Дакле, ово би требало да ти дам сетоса. 623 00:36:27,140 --> 00:36:28,710 И то вам даје ниво овде. 624 00:36:28,710 --> 00:36:32,812 >> Тако можете упоредити ово на сетоса карактера 625 00:36:32,812 --> 00:36:34,645 а ово неће да би било истинито, јер једном 626 00:36:34,645 --> 00:36:37,940 је различитог типа од друге. 627 00:36:37,940 --> 00:36:40,590 Или Претпостављам да је истина, јер Р је интелигентнији од тога. 628 00:36:40,590 --> 00:36:45,420 И изгледа ово и онда каже, можда је то оно што желите. 629 00:36:45,420 --> 00:36:51,860 Тако да ће рећи карактер стринг сетоса је исто као овај. 630 00:36:51,860 --> 00:37:01,290 А онда на сличан начин, можете Такође баш зграби их као тако даље. 631 00:37:01,290 --> 00:37:05,580 >> Дакле, то је само нека врста брзе команде на скуп. 632 00:37:05,580 --> 00:37:08,030 Дакле, ево неких података истраживања. 633 00:37:08,030 --> 00:37:11,360 Дакле, ово је мало више укључени у анализи података. 634 00:37:11,360 --> 00:37:18,340 А ово је узет из неке боотцамп у Р за у Берклију. 635 00:37:18,340 --> 00:37:20,790 >> Тако библиотека страних. 636 00:37:20,790 --> 00:37:24,880 Зато ћу да учита у библиотека која се зове страно. 637 00:37:24,880 --> 00:37:32,460 Дакле, ово ће ми дати реад.дта тако претпостављају да имам овог скупа података. 638 00:37:32,460 --> 00:37:39,000 Ово се чува у струја радни директоријум мог конзоле. 639 00:37:39,000 --> 00:37:42,190 Па хајде да видимо шта радни директоријум је. 640 00:37:42,190 --> 00:37:44,620 >> Дакле овде је мој радни директоријум. 641 00:37:44,620 --> 00:37:50,040 И реад дот податке, тхис ствар, каже овај фајл 642 00:37:50,040 --> 00:37:54,650 се налази у фолдеру података ово тренутни радни директоријум. 643 00:37:54,650 --> 00:38:00,520 А реад.дта ово није подразумевани команда. 644 00:38:00,520 --> 00:38:02,760 Ваљда сам већ лоадед га у. 645 00:38:02,760 --> 00:38:04,750 ИЕИ претпоставио сам већ лоадед ово у. 646 00:38:04,750 --> 00:38:08,115 >> Али тако реад.дта неће да буде подразумевани команда. 647 00:38:08,115 --> 00:38:11,550 И зато ћеш имати за учитавање у овој библиотеци пацкаге-- 648 00:38:11,550 --> 00:38:14,500 овај пакет зове страно. 649 00:38:14,500 --> 00:38:16,690 А ако немате пакет, мислим 650 00:38:16,690 --> 00:38:19,180 страно је један од уграђених оне. 651 00:38:19,180 --> 00:38:31,150 У супротном, можете такође урадите инсталл.пацкагес 652 00:38:31,150 --> 00:38:33,180 а то ће инсталирати пакет. 653 00:38:33,180 --> 00:38:36,878 И то ће вам дати Р. Ух, не. 654 00:38:36,878 --> 00:38:39,830 655 00:38:39,830 --> 00:38:43,140 И онда ја ћу престати ово јер већ имам га. 656 00:38:43,140 --> 00:38:46,920 >> Али оно што је заиста лепо о Р је да управљање пакета 657 00:38:46,920 --> 00:38:48,510 Систем је врло елегантно. 658 00:38:48,510 --> 00:38:52,470 Зато што ће сачувати све Заиста лепо за вас. 659 00:38:52,470 --> 00:38:59,780 Дакле, у овом случају, то ће складиштити она у, верујем, ова библиотека овде. 660 00:38:59,780 --> 00:39:02,390 >> Дакле кад год желите да инсталирање нових пакета, 661 00:39:02,390 --> 00:39:04,980 то је само тако једноставно радиш инсталл.пацкагес 662 00:39:04,980 --> 00:39:07,500 и Р ће управљати све пакети за вас. 663 00:39:07,500 --> 00:39:12,900 Тако да не морате да урадите нешто у Питхон, где имате додатну пакет 664 00:39:12,900 --> 00:39:15,330 менаџери као папир Анацонда где си 665 00:39:15,330 --> 00:39:18,310 доинг-- инсталирате пакети ван Питхон 666 00:39:18,310 --> 00:39:20,940 а ви покушавате да их води себе. 667 00:39:20,940 --> 00:39:22,210 Дакле, ово је заиста леп начин. 668 00:39:22,210 --> 00:39:25,590 >> И инсталл.пацкагес захтева интернет. 669 00:39:25,590 --> 00:39:31,950 Она га узима са сервера и спремиште да 670 00:39:31,950 --> 00:39:33,960 прикупља све пакети се зове ЦРАН. 671 00:39:33,960 --> 00:39:40,690 А можете наводи који врсту огледала желите да преузмете пакете из. 672 00:39:40,690 --> 00:39:43,420 >> Па ево ја узимам овог скупа података. 673 00:39:43,420 --> 00:39:46,240 Читам га у коришћењу ове функције. 674 00:39:46,240 --> 00:39:49,360 Тако да ме само напред и уради то. 675 00:39:49,360 --> 00:39:52,900 >> Па хајде да претпоставимо да имате овог скупа података 676 00:39:52,900 --> 00:39:55,550 а ви имате апсолутно немам појма шта је то. 677 00:39:55,550 --> 00:39:58,560 А ово у ствари долази до прилично често у индустрији 678 00:39:58,560 --> 00:40:00,910 где сте само ово тоне и тоне гомиле ствари 679 00:40:00,910 --> 00:40:02,890 и они су невероватно необележено. 680 00:40:02,890 --> 00:40:06,380 Па ево ја имам ово Скуп података и не знам 681 00:40:06,380 --> 00:40:08,400 шта је то тако ја сам само показујући да то провере. 682 00:40:08,400 --> 00:40:10,620 >> Тако ћу прво урадити главу. 683 00:40:10,620 --> 00:40:14,190 Тако да проверим првих шест колоне шта Овај скуп података је. 684 00:40:14,190 --> 00:40:21,730 Дакле, ово је стање, прес04, а затим Сви ови различити некако колона. 685 00:40:21,730 --> 00:40:25,612 И шта је занимљиво овде, претпостављам, јеси ли то ти 686 00:40:25,612 --> 00:40:27,945 претпостављам да ово изгледа као нека врста избора. 687 00:40:27,945 --> 00:40:30,482 688 00:40:30,482 --> 00:40:32,190 И претпостављам само од лоокинг ат тхе филе 689 00:40:32,190 --> 00:40:41,070 наме ово је нека врста збирке података о кандидатима или бирачима 690 00:40:41,070 --> 00:40:44,920 који су гласали за одређене председнике или председник кандидати 691 00:40:44,920 --> 00:40:46,550 за изборима 2004. године. 692 00:40:46,550 --> 00:40:52,920 >> Дакле овде је вредности 1, 2 тако један начин чувања 693 00:40:52,920 --> 00:40:56,540 кандидати председник су њихова имена. 694 00:40:56,540 --> 00:40:59,780 У овом случају, изгледа да они су само целе вредности. 695 00:40:59,780 --> 00:41:04,030 Тако 2004., било је Буш против Керија Верујем. 696 00:41:04,030 --> 00:41:09,010 А сада, рецимо да једноставно не знам да ли 1 одговара Буша или 2 697 00:41:09,010 --> 00:41:11,703 одговара Керри или и тако даље и тако даље, зар не? 698 00:41:11,703 --> 00:41:15,860 >> А ово је, само за мене, прилично чест проблем. 699 00:41:15,860 --> 00:41:18,230 Па шта можете да урадите у овом случају? 700 00:41:18,230 --> 00:41:20,000 Па хајде да проверимо све те друге ствари. 701 00:41:20,000 --> 00:41:22,790 >> држава, претпостављам ово долази из различитих држава. 702 00:41:22,790 --> 00:41:25,100 партиид, приход. 703 00:41:25,100 --> 00:41:27,710 Погледајмо партиид. 704 00:41:27,710 --> 00:41:32,800 Па можда једна ствар коју можете учинити је погледај сваки од запажања 705 00:41:32,800 --> 00:41:36,250 да имају партиид од републиканац или демократа или нешто. 706 00:41:36,250 --> 00:41:38,170 Па хајде да погледамо шта је партиид. 707 00:41:38,170 --> 00:41:41,946 >> Зато ћу узети ДАТ и онда идем 708 00:41:41,946 --> 00:41:47,960 да радим овај доллар сигн оператер који сам претходно урадио 709 00:41:47,960 --> 00:41:50,770 а ово ће подскуп тој колони. 710 00:41:50,770 --> 00:41:57,760 А онда ћу кренути у ово 20, само да видим шта ово личи. 711 00:41:57,760 --> 00:42:00,170 >> Дакле, ово је само гомила нас. 712 00:42:00,170 --> 00:42:02,800 Другим речима, ви имате недостају подаци о овим момцима. 713 00:42:02,800 --> 00:42:08,100 Али такође приметити ово ДАТ партиид је фактор 714 00:42:08,100 --> 00:42:10,030 па ово вам даје различите категорије. 715 00:42:10,030 --> 00:42:14,170 Дакле, другим речима, може да партиид Демократа, републиканац, самостални, 716 00:42:14,170 --> 00:42:16,640 или нешто друго. 717 00:42:16,640 --> 00:42:23,940 >> Дакле идемо напред и немојмо види који од ових је-- Ох, у реду. 718 00:42:23,940 --> 00:42:28,480 Тако ћу подскуп да партиид и онда 719 00:42:28,480 --> 00:42:32,780 погледај процене које су Демоцрат, на пример. 720 00:42:32,780 --> 00:42:37,150 Ово ће вам дати Боолеан, Огроман Булова од Труес и ФАЛСЕс. 721 00:42:37,150 --> 00:42:41,630 >> А сада, хајде да кажем да желим да подскуп са овим момцима. 722 00:42:41,630 --> 00:42:47,260 Дакле, ово ће да ми ДАТ и подскуп да шта год запажања 723 00:42:47,260 --> 00:42:48,910 имају партиид екуалс једнако демократа. 724 00:42:48,910 --> 00:42:52,830 725 00:42:52,830 --> 00:42:55,180 А ово је прилично дугачак, јер има толико много њих. 726 00:42:55,180 --> 00:42:59,060 Тако сада, ја ћу кренути ово у 20. 727 00:42:59,060 --> 00:43:05,690 728 00:43:05,690 --> 00:43:11,270 >> И као што сте приметили, једнако екуалс Интересантно је у томе да си 729 00:43:11,270 --> 00:43:13,250 алреади-- Такође сте укључујући и нас. 730 00:43:13,250 --> 00:43:19,010 Дакле, у овом случају, и даље можете да добијете свака информација јер сада имате нас 731 00:43:19,010 --> 00:43:22,650 а ви само желите да видите који од запажање одговарају демократа 732 00:43:22,650 --> 00:43:24,670 а не они сами недостаје вредности. 733 00:43:24,670 --> 00:43:27,680 Па како би ти се ослободите ових нас? 734 00:43:27,680 --> 00:43:36,410 >> Па ево ја само користим горе тастер на мој цурсор а затим говоре креће око. 735 00:43:36,410 --> 00:43:39,778 И онда овде ја ћу само да кажем ис.на датпартиид. 736 00:43:39,778 --> 00:43:48,970 737 00:43:48,970 --> 00:43:52,720 Дакле, ово ће бити и и два различита Боолеан вектори 738 00:43:52,720 --> 00:43:57,160 и кажу да ће бити Истина и лаж, на пример. 739 00:43:57,160 --> 00:43:59,190 Тако да ће то учинити ову компоненту-мудар. 740 00:43:59,190 --> 00:44:02,910 Па ево ја кажем Таке оквир података, подскуп 741 00:44:02,910 --> 00:44:10,170 онима који одговарају демократа, и уклоните било који од њих да нису НА. 742 00:44:10,170 --> 00:44:13,540 >> Дакле, ово би требало вилл-- да ти дам нешто. 743 00:44:13,540 --> 00:44:16,540 744 00:44:16,540 --> 00:44:17,600 Да видимо ис.на. 745 00:44:17,600 --> 00:44:24,670 746 00:44:24,670 --> 00:44:27,690 Хајде да пробамо ис.на датпартиид. 747 00:44:27,690 --> 00:44:36,290 748 00:44:36,290 --> 00:44:45,290 А ово би требало да дају тебе-- је-- само Боолеан вектор. 749 00:44:45,290 --> 00:44:49,260 А онда, пошто је то тако дуго, Идем у подскуп до 20. 750 00:44:49,260 --> 00:44:49,760 У реду. 751 00:44:49,760 --> 00:44:51,570 Дакле, то треба да раде. 752 00:44:51,570 --> 00:44:54,700 >> А овај ће такође бити Труес. 753 00:44:54,700 --> 00:45:01,830 Ах, тако да је мој грешка је што сам Ја-- користити Ц ++ и Р наизменично тако направим 754 00:45:01,830 --> 00:45:03,590 ово грешка све време. 755 00:45:03,590 --> 00:45:05,807 И оператер је заправо онај који желите. 756 00:45:05,807 --> 00:45:08,140 Ви не желите да користите два амперсандс, само један једини. 757 00:45:08,140 --> 00:45:14,970 758 00:45:14,970 --> 00:45:17,010 У реду. 759 00:45:17,010 --> 00:45:18,140 >> Па да видимо. 760 00:45:18,140 --> 00:45:20,930 761 00:45:20,930 --> 00:45:23,920 Тако да смо субсеттед да партиид где су демократе 762 00:45:23,920 --> 00:45:25,300 а они не пропуштате вредности. 763 00:45:25,300 --> 00:45:27,690 А сада да погледамо који су то гласали за. 764 00:45:27,690 --> 00:45:31,530 Тако изгледа као већина њих гласало за 1. 765 00:45:31,530 --> 00:45:36,090 Зато ћу ићи напред и кажу да је Кери. 766 00:45:36,090 --> 00:45:39,507 >> Слично томе, можете Такође идите на републиканац 767 00:45:39,507 --> 00:45:41,090 и надамо се, ово би требало да ти дам 2. 768 00:45:41,090 --> 00:45:49,730 769 00:45:49,730 --> 00:45:51,770 То је само гомила различитих колона. 770 00:45:51,770 --> 00:45:53,070 И заиста, то је 2. 771 00:45:53,070 --> 00:45:55,750 Дакле партиид сваког републиканског, већина њих гласају за 2. 772 00:45:55,750 --> 00:45:58,390 >> Тако то изгледа као, само гледајући ово, 773 00:45:58,390 --> 00:46:00,600 Републичка ће бити вери-- или партиид 774 00:46:00,600 --> 00:46:02,790 ће бити веома велики фактор у одређивању 775 00:46:02,790 --> 00:46:05,420 који кандидат да су гласати за. 776 00:46:05,420 --> 00:46:07,120 А ово је очигледно када уопште. 777 00:46:07,120 --> 00:46:10,139 А ово да ли одговара вашој интуиција, наравно. 778 00:46:10,139 --> 00:46:11,930 Тако да изгледа као да сам понестаје времена тако 779 00:46:11,930 --> 00:46:17,040 само да би требало да иде напред и показују неке брзе слике. 780 00:46:17,040 --> 00:46:21,120 Дакле овде је нешто што је незнатно више компликовано са визуелизацију. 781 00:46:21,120 --> 00:46:26,450 Дакле, у овом случају, ово је веома једноставна анализа само проверавам шта 782 00:46:26,450 --> 00:46:28,500 председник '04 је. 783 00:46:28,500 --> 00:46:33,920 >> Дакле, у овом случају, хајде да те кажем желео да одговори на ово питање. 784 00:46:33,920 --> 00:46:38,540 Тако рецимо да желимо да знамо гласање Понашање у 2004. председник изборима 785 00:46:38,540 --> 00:46:41,170 и како да варира у зависности од расе. 786 00:46:41,170 --> 00:46:44,380 Дакле, не само желиш да види понашање за гласање, 787 00:46:44,380 --> 00:46:47,860 али желите да подскуп сваког раса и врста резимирам то. 788 00:46:47,860 --> 00:46:50,770 А ти само могу рећи од овог сложеног нотацији 789 00:46:50,770 --> 00:46:52,580 да је ово врста постаје магловита. 790 00:46:52,580 --> 00:46:56,390 >> Тако је један од напреднијих Р То је такође пакети врста недавно 791 00:46:56,390 --> 00:47:00,070 назива дплир. 792 00:47:00,070 --> 00:47:03,060 Тако да је овај овде. 793 00:47:03,060 --> 00:47:08,080 И ггг-- ггплот2 је само лепо начин да се то боље визуелизације 794 00:47:08,080 --> 00:47:09,400 него уграђеног у једном. 795 00:47:09,400 --> 00:47:11,108 >> Зато ћу да учита ове две библиотеке. 796 00:47:11,108 --> 00:47:13,200 797 00:47:13,200 --> 00:47:16,950 И онда, ја ћу да идем напред и покрените ову команду. 798 00:47:16,950 --> 00:47:19,050 Можете само да се овим бави као црна кутија. 799 00:47:19,050 --> 00:47:23,460 >> Шта се дешава је да овај цеви оператер пролази у овом аргументу 800 00:47:23,460 --> 00:47:24,110 у овде. 801 00:47:24,110 --> 00:47:28,070 Тако да кажем групу од ДАТ раса и тадашњи председник 04. 802 00:47:28,070 --> 00:47:31,530 А онда, све ове друге команде се филтрирање и затим резимира 803 00:47:31,530 --> 00:47:34,081 где радим цоунт и онда сам га цртања овде. 804 00:47:34,081 --> 00:47:39,980 805 00:47:39,980 --> 00:47:42,500 Ок кул. 806 00:47:42,500 --> 00:47:44,620 Дакле идемо напред и видимо шта ово личи. 807 00:47:44,620 --> 00:47:52,280 808 00:47:52,280 --> 00:47:57,290 >> Па шта се овде дешава је да сам само графички сваки од раса и тада 809 00:47:57,290 --> 00:47:59,670 који су то гласали за. 810 00:47:59,670 --> 00:48:03,492 И ова два различита вредности одговарају 2 и 1. 811 00:48:03,492 --> 00:48:05,325 Ако желите да будете више елегантан, можете такође 812 00:48:05,325 --> 00:48:11,770 Само прецизирају да је 2 Керри-- или 2 је Бусх, а затим 1 је Керри. 813 00:48:11,770 --> 00:48:13,700 А можете имати да у вашем легенди. 814 00:48:13,700 --> 00:48:17,410 >> А можете и да поделите ове бар графиконе. 815 00:48:17,410 --> 00:48:19,480 Јер једна ствар је да, ако приметите, 816 00:48:19,480 --> 00:48:24,560 ово није баш лако идентификовати која је од ове две вредности су веће. 817 00:48:24,560 --> 00:48:27,920 Дакле, једна ствар коју би хтео да урадите јесте да ово плаво подручје 818 00:48:27,920 --> 00:48:31,855 и само га померите овамо тако тебе може поредити ова два раме уз раме. 819 00:48:31,855 --> 00:48:34,480 И мислим да је то нешто што немају времена да урадимо одмах, 820 00:48:34,480 --> 00:48:36,660 али то је такође врло лако урадити. 821 00:48:36,660 --> 00:48:40,310 Можете само да гледа у ман странице на ггплот. 822 00:48:40,310 --> 00:48:47,170 Тако можете само да ггплот као да и прочитате у овој ман страници. 823 00:48:47,170 --> 00:48:51,920 >> Па ме пусти само брзо схов иоу неке цоол ствари. 824 00:48:51,920 --> 00:48:57,610 Идемо напред и иди да-- само примена машинског учења. 825 00:48:57,610 --> 00:49:02,450 Рецимо да имамо ову тројицу пакети па идем да учита их у. 826 00:49:02,450 --> 00:49:05,500 827 00:49:05,500 --> 00:49:09,170 Дакле, ово само исписује неке Информације након што сам убачен у ствари. 828 00:49:09,170 --> 00:49:15,220 Тако ја кажем ово реад.цсв, Овај скуп података, и сада 829 00:49:15,220 --> 00:49:18,940 Идем да слободно гледај и види шта је унутра овај скуп. 830 00:49:18,940 --> 00:49:22,080 >> Дакле првих 20 запажања. 831 00:49:22,080 --> 00:49:27,190 Тако да само к1, к2, и И. Тако је Изгледа као гомила тих вредности 832 00:49:27,190 --> 00:49:31,640 су у распону од можда 20 до 80 или тако. 833 00:49:31,640 --> 00:49:37,700 А онда слично за Кс2 и онда ово И изгледа етикете 0 и 1. 834 00:49:37,700 --> 00:49:49,500 >> Да бисте проверили ово, ја могу Само уради резиме података Кс1. 835 00:49:49,500 --> 00:49:51,660 А онда слицно за сви ови остали колоне. 836 00:49:51,660 --> 00:49:55,300 Дакле резиме је брз начин Само вам показује брзе вредности. 837 00:49:55,300 --> 00:49:56,330 Ох, извините. 838 00:49:56,330 --> 00:49:58,440 Ово треба да буде И. 839 00:49:58,440 --> 00:50:03,420 >> Дакле, у овом случају, даје квантила, траке за, макес као добро. 840 00:50:03,420 --> 00:50:07,130 У овом случају, датаИ, можете видети да је само ће бити 0 и 1. 841 00:50:07,130 --> 00:50:10,100 Такође средња говори 0.6, само значи да њега 842 00:50:10,100 --> 00:50:13,380 Чини се као да имају више него 1с 0с. 843 00:50:13,380 --> 00:50:16,160 >> Тако да ме само напред и шоу Ви шта ово личи. 844 00:50:16,160 --> 00:50:17,470 Тако да сам само ћу нацртати ово. 845 00:50:17,470 --> 00:50:22,852 846 00:50:22,852 --> 00:50:24,636 Хајде да видимо како да обришете ово. 847 00:50:24,636 --> 00:50:30,492 848 00:50:30,492 --> 00:50:31,468 О реду. 849 00:50:31,468 --> 00:50:35,840 850 00:50:35,840 --> 00:50:36,340 У реду. 851 00:50:36,340 --> 00:50:37,590 >> Дакле, ово је како то изгледа. 852 00:50:37,590 --> 00:50:46,310 Тако изгледа као жута боја ја наведеним као 0, а затим црвено И наведена као 1с. 853 00:50:46,310 --> 00:50:52,190 Дакле овде изгледа као лабел поена и то 854 00:50:52,190 --> 00:50:56,410 Чини се као да само хтео мало некако груписања на ово. 855 00:50:56,410 --> 00:51:01,020 >> И дозволите ми само напред и шоу ви неке од ових уграђених функција. 856 00:51:01,020 --> 00:51:03,580 Дакле овде је лм. 857 00:51:03,580 --> 00:51:06,060 Дакле, ово је само покушава да стане линију на ово. 858 00:51:06,060 --> 00:51:08,640 Па шта је најбољи начин да сам може да стане линија што 859 00:51:08,640 --> 00:51:14,020 да ће најбоље одвојити ова врста груписања. 860 00:51:14,020 --> 00:51:21,790 И идеално, када погледате да само ја водим све ове команде 861 00:51:21,790 --> 00:51:25,450 а онда, ја идем напред и додајте линију. 862 00:51:25,450 --> 00:51:28,970 >> Дакле, ово изгледа као најбољи претпостављам. 863 00:51:28,970 --> 00:51:34,150 Она узима најбољу који минимизира грешка у покушају да се уклопе ову линију. 864 00:51:34,150 --> 00:51:40,000 Очигледно, ово изгледа некако добро, али то није најбоље. 865 00:51:40,000 --> 00:51:43,130 И линеарни модели, у Генерално, ће бити 866 00:51:43,130 --> 00:51:46,811 стварно супер за теорију и некако грађевинског основама машине 867 00:51:46,811 --> 00:51:47,310 учење. 868 00:51:47,310 --> 00:51:50,330 Али у пракси, ти ћеш желите да урадите нешто више опште. 869 00:51:50,330 --> 00:51:54,280 >> Тако да само можете покушати трчање што се назива неуронске мреже. 870 00:51:54,280 --> 00:51:57,110 Ове ствари су све чешћи. 871 00:51:57,110 --> 00:52:00,530 И они само раде фантастично за велике скупове података. 872 00:52:00,530 --> 00:52:07,080 Дакле, у овом случају, само смо бих-- хајде да видео-- имамо нров. 873 00:52:07,080 --> 00:52:09,010 Дакле нров је само кажем број редова. 874 00:52:09,010 --> 00:52:11,790 Дакле, у овом случају, ја имају 100 запажања. 875 00:52:11,790 --> 00:52:15,010 >> Тако да ме само напред и направи неуронске мреже. 876 00:52:15,010 --> 00:52:18,620 Дакле, ово је стварно лепо јер сам само да кажем ннет 877 00:52:18,620 --> 00:52:21,767 а онда сам назадује И. Дакле, И је та колона. 878 00:52:21,767 --> 00:52:23,850 А онда га назадује на друга два променљиве. 879 00:52:23,850 --> 00:52:27,360 Дакле, ово је краћи ознаке за Кс1 и Кс2. 880 00:52:27,360 --> 00:52:29,741 >> Дакле идемо напред и покрените ово. 881 00:52:29,741 --> 00:52:30,240 Ох, извините. 882 00:52:30,240 --> 00:52:32,260 Морам да покренете целу ствар. 883 00:52:32,260 --> 00:52:37,500 А ово је само штампање запис колико брзо или не брзо се 884 00:52:37,500 --> 00:52:38,460 цонвергед. 885 00:52:38,460 --> 00:52:41,420 Тако да изгледа као да се спајају. 886 00:52:41,420 --> 00:52:44,970 Тако да ме само напред и штампање шта ово личи. 887 00:52:44,970 --> 00:52:51,260 >> Погледајте ево слика и овде је контура показује колико добро се уклапа. 888 00:52:51,260 --> 00:52:56,380 А ово је само-- можете видети ово да је ово веома, веома лепо. 889 00:52:56,380 --> 00:52:59,400 То чак може бити оверфиттинг, али можете такође 890 00:52:59,400 --> 00:53:03,390 рачун за ово са другим технике попут унакрсног валидације. 891 00:53:03,390 --> 00:53:06,180 А ово су такође изграђена у Р. 892 00:53:06,180 --> 00:53:09,170 >> И нека ми да ти покажем подржати вектор машину. 893 00:53:09,170 --> 00:53:12,470 Ово је још једна заиста чест Техника у машинског учења. 894 00:53:12,470 --> 00:53:18,550 Веома је сличан линеарних модела, али користи оно што се зове метод кернела. 895 00:53:18,550 --> 00:53:22,790 И хајде да видимо колико добро то ради. 896 00:53:22,790 --> 00:53:26,430 Дакле, ово је један веома сличан начин добро неуронске мреже обавља, 897 00:53:26,430 --> 00:53:27,900 али то је много више глатко. 898 00:53:27,900 --> 00:53:35,740 А ово је заснована искључен од шта-- како СВМс рад. 899 00:53:35,740 --> 00:53:40,250 >> Дакле, ово је само веома брзи преглед неких 900 00:53:40,250 --> 00:53:43,822 од уграђених функција можете да урадите и такође неке од истраживања података. 901 00:53:43,822 --> 00:53:45,905 Тако да ме само напред и врати се у слајдовима. 902 00:53:45,905 --> 00:53:50,290 903 00:53:50,290 --> 00:53:53,670 >> Дакле, очигледно, ово је Не баш свеобухватан. 904 00:53:53,670 --> 00:53:57,140 А ово је заиста само теасер показујући вам шта стварно може да уради у Р. 905 00:53:57,140 --> 00:53:59,100 Па ако би баш као да сазнате више, овде 906 00:53:59,100 --> 00:54:01,210 су гомила различитих извора. 907 00:54:01,210 --> 00:54:06,890 >> Дакле, ако сте љубитељ уџбеника или сте Само воли читање ствари на мрежи, 908 00:54:06,890 --> 00:54:09,670 онда ово је фантастичан један од Хадлеи Вицкхам, 909 00:54:09,670 --> 00:54:13,010 који је такође створио све ово Стварно цоол пакети. 910 00:54:13,010 --> 00:54:17,420 Ако сте љубитељ видеа, онда Беркли има страшан БоотЦамп 911 00:54:17,420 --> 00:54:21,060 то је северал-- то је некако дуго. 912 00:54:21,060 --> 00:54:24,210 И то ће вас научити готово све што желите да знате о Р. 913 00:54:24,210 --> 00:54:27,770 >> Слично томе, ту је Цодеацадеми и све то остало врста 914 00:54:27,770 --> 00:54:29,414 интерактивних вебситес. 915 00:54:29,414 --> 00:54:31,580 Они су такође геттинг цоммон-- више и чешће. 916 00:54:31,580 --> 00:54:33,749 Дакле, ово је веома сличан Цодеацадеми. 917 00:54:33,749 --> 00:54:35,790 И на крају, ако само Желим заједнице и помоћи, 918 00:54:35,790 --> 00:54:38,800 то су гомила ствари које можете да иду на. 919 00:54:38,800 --> 00:54:40,880 Очигледно, ми и даље користите маилинг листе, само 920 00:54:40,880 --> 00:54:44,860 као готово сваки други програмски језик заједнице. 921 00:54:44,860 --> 00:54:47,880 И #рстатс, ово је наша заједница Твиттер. 922 00:54:47,880 --> 00:54:49,580 То је заправо сасвим уобичајене. 923 00:54:49,580 --> 00:54:50,850 А онда усер! 924 00:54:50,850 --> 00:54:52,340 Да ли је само наша конференција. 925 00:54:52,340 --> 00:54:55,390 >> И онда, наравно, можете користе све ове друге К & А ствари, 926 00:54:55,390 --> 00:54:57,680 као Стацк Оверфлов, Гоогле, а затим ГитХуб. 927 00:54:57,680 --> 00:55:00,490 Јер већина ових пакета и доста заједнице 928 00:55:00,490 --> 00:55:03,420 ће бити фокусиране развој Код зато што је отвореног кода. 929 00:55:03,420 --> 00:55:05,856 И то је само стварно лепо на ГитХуб. 930 00:55:05,856 --> 00:55:08,730 И на крају, можете ме контактирати ако само би требало брзе питања. 931 00:55:08,730 --> 00:55:13,530 Дакле, можете ме наћи на Твиттер овде, мој сајт, и само мој е-маил. 932 00:55:13,530 --> 00:55:17,840 Дакле, надамо се, да је нешто-- само кратко теасер 933 00:55:17,840 --> 00:55:20,900 од чега Р заиста способан да уради. 934 00:55:20,900 --> 00:55:23,990 И надамо се, само цхецк оут ове три везе 935 00:55:23,990 --> 00:55:25,760 а види шта можете да урадите више. 936 00:55:25,760 --> 00:55:28,130 И мислим да је то само због тога. 937 00:55:28,130 --> 00:55:28,630 Хвала. 938 00:55:28,630 --> 00:55:30,780 >> [АППЛАУСЕ] 939 00:55:30,780 --> 00:55:31,968