1 00:00:00,000 --> 00:00:00,750 2 00:00:00,750 --> 00:00:09,800 >> [Гуляе музыка] 3 00:00:09,800 --> 00:00:13,014 4 00:00:13,014 --> 00:00:13,680 DUSTIN TRAN: Прывітанне. 5 00:00:13,680 --> 00:00:14,980 Дастын Мяне клічуць. 6 00:00:14,980 --> 00:00:18,419 Так што я буду прадстаўляць Аналіз дадзеных у R. 7 00:00:18,419 --> 00:00:19,710 Проста крыху пра сябе. 8 00:00:19,710 --> 00:00:24,320 Я ў цяперашні час аспірант Інжынерная і прыкладной навукі. 9 00:00:24,320 --> 00:00:28,330 Я вывучаю скрыжаванне машыннае навучанне і статыстыка 10 00:00:28,330 --> 00:00:31,375 так Аналіз дадзеных у R з'яўляецца сапраўды асноватворнае значэнне для 11 00:00:31,375 --> 00:00:33,790 Я раблю на штодзённай аснове. 12 00:00:33,790 --> 00:00:35,710 >> І R асабліва добра для аналізу дадзеных 13 00:00:35,710 --> 00:00:39,310 таму што гэта вельмі добра для прототипирования. 14 00:00:39,310 --> 00:00:43,590 І, як правіла, калі вы робіце нейкія аналізу дадзеных, шмат праблем 15 00:00:43,590 --> 00:00:44,920 збіраюцца пазнавальнай. 16 00:00:44,920 --> 00:00:48,700 І так вы проста хочаце мець некаторыя сапраўды добры мова, што 17 00:00:48,700 --> 00:00:53,770 гэта проста добра для гэтага убудаваныя функцыі, у адрозненне 18 00:00:53,770 --> 00:00:57,430 для таго, каб мець справу з нізкімі рэчаў ўзроўню. 19 00:00:57,430 --> 00:01:01,040 Такім чынам, у самым пачатку, я проста хачу, ўвесці тое, што R, то чаму б 20 00:01:01,040 --> 00:01:04,540 Вы хочаце, каб выкарыстоўваць яго, і затым пераходзяць у нейкі дэма, 21 00:01:04,540 --> 00:01:07,060 і проста пайсці далей. 22 00:01:07,060 --> 00:01:08,150 >> Так што ж такое R? 23 00:01:08,150 --> 00:01:11,180 R толькі мову развіўся для статыстычных разлікаў 24 00:01:11,180 --> 00:01:12,450 і візуалізацыя. 25 00:01:12,450 --> 00:01:16,000 Дык што ж гэта азначае, што гэта вельмі добры мова 26 00:01:16,000 --> 00:01:22,400 для любога роду рэчы, што мае справу з няўпэўненасць або візуалізацыі дадзеных. 27 00:01:22,400 --> 00:01:24,850 Так што вы павінны ўсё гэта імавернасных размеркаванняў. 28 00:01:24,850 --> 00:01:27,140 Там збіраюцца быць убудаваныя функцыі. 29 00:01:27,140 --> 00:01:31,650 Вы таксама будзеце мець выдатны пабудова пакетаў. 30 00:01:31,650 --> 00:01:34,110 >> Python з'яўляецца яшчэ адным канкуруючых мова для дадзеных. 31 00:01:34,110 --> 00:01:40,020 І яшчэ адна рэч, якую я знаходжу, што R значна лепш візуалізацыя. 32 00:01:40,020 --> 00:01:45,200 Так што вы ўбачыце ў дэма як а проста вельмі інтуітыўна мова 33 00:01:45,200 --> 00:01:48,050 , Які проста працуе вельмі добра. 34 00:01:48,050 --> 00:01:53,140 Гэта таксама з'яўляецца бясплатным і адкрытым зыходным кодам, а любы іншы добры мову, я думаю. 35 00:01:53,140 --> 00:01:55,440 >> І вось, куча ўсяго Ключавыя словы кінутыя на вас. 36 00:01:55,440 --> 00:02:00,450 Гэта дынамічны, то бок, калі ў вас ёсць Канкрэтны тып прысвоены аб'екту 37 00:02:00,450 --> 00:02:02,025 чым проста змяніць яго на лета. 38 00:02:02,025 --> 00:02:05,670 Гэта лянівы, так што гэта разумна, аб як ён гэта робіць разлікі. 39 00:02:05,670 --> 00:02:12,250 Функцыянальнае значэнне гэта можа сапраўды працаваць заснаваныя ад функцый, так anything-- 40 00:02:12,250 --> 00:02:16,910 любы від маніпуляцый вы рабіць, ён будзе заснаваны оф функцый. 41 00:02:16,910 --> 00:02:20,162 >> Так бінарныя аператары, напрыклад, проста па сваёй сутнасці функцыі. 42 00:02:20,162 --> 00:02:21,870 І ўсё, што Вы збіраецеся зрабіць, гэта 43 00:02:21,870 --> 00:02:24,690 будзе бегчы функцыі самастойна. 44 00:02:24,690 --> 00:02:27,140 А потым аб'ектна-арыентаваны, а таксама. 45 00:02:27,140 --> 00:02:30,930 >> Дык вось сюжэт XKCD. 46 00:02:30,930 --> 00:02:34,350 Не толькі таму, што я адчуваю, што XKCD мае фундаментальнае значэнне для любога выгляду 47 00:02:34,350 --> 00:02:37,770 прэзентацыі, а таму, што Я адчуваю, што гэта сапраўды 48 00:02:37,770 --> 00:02:42,160 малаткі пункт, што шмат час, калі вы робіце нейкія дадзеныя 49 00:02:42,160 --> 00:02:46,570 аналіз, праблема заключаецца не ў так як хутка ён працуе, 50 00:02:46,570 --> 00:02:49,850 але як доўга гэта будзе вас праграмаваць задачы. 51 00:02:49,850 --> 00:02:54,112 Дык вось, гэта проста аналізуючы ці Стратэгія або б з'яўляецца больш эфектыўным. 52 00:02:54,112 --> 00:02:55,820 Гэта будзе тое, што вы 53 00:02:55,820 --> 00:02:58,290 будзем мець справу шмат з у Сартаваць нізкаўзроўневыя мовы 54 00:02:58,290 --> 00:03:03,440 дзе вы маеце справу з SEG няспраўнасцяў, вылучэнне памяці, ініцыялізацыя, 55 00:03:03,440 --> 00:03:05,270 нават робячы убудаваныя функцыі. 56 00:03:05,270 --> 00:03:09,920 І гэты матэрыял ўсё апрацоўваецца вельмі, вельмі элегантна ў R. 57 00:03:09,920 --> 00:03:12,839 >> Так што проста забіць гэты Справа, самае вузкае месца 58 00:03:12,839 --> 00:03:13,880 будзе пазнавальным. 59 00:03:13,880 --> 00:03:17,341 Так аналіз дадзеных вельмі складаная праблема. 60 00:03:17,341 --> 00:03:19,340 Калі вы робіце машыннае навучанне, ці вы 61 00:03:19,340 --> 00:03:22,550 рабіць проста нейкі Асноўная разведка дадзеных 62 00:03:22,550 --> 00:03:25,290 Вы не хочаце, каб ўзяць дакумент 63 00:03:25,290 --> 00:03:27,440 а затым скампіляваць тое, што кожны раз, калі вы 64 00:03:27,440 --> 00:03:31,010 хачу паглядзець, што калона выглядае, якія менавіта запісу ў матрыцы 65 00:03:31,010 --> 00:03:32,195 выглядае. 66 00:03:32,195 --> 00:03:34,320 Такім чынам, вы проста хочаце мець некаторыя сапраўды прыемны інтэрфейс 67 00:03:34,320 --> 00:03:37,740 Вы можаце запусціць простую функцыю што індэксы да таго, што 68 00:03:37,740 --> 00:03:41,870 Вы хацелі б і проста запусціць яго адтуль. 69 00:03:41,870 --> 00:03:44,190 І вы павінны дамен канкрэтныя мовы для гэтага. 70 00:03:44,190 --> 00:03:51,750 І R сапраўды дапаможа вам вызначыць Праблема і вырашыць гэтую праблему такім чынам. 71 00:03:51,750 --> 00:03:58,690 >> Дык вось графік, які паказвае праграмавання Папулярнасць R, як гэта пайшло з цягам часу. 72 00:03:58,690 --> 00:04:04,060 Такім чынам, як вы бачыце, як 2013 ці так што проста ўзарвалі надзвычай. 73 00:04:04,060 --> 00:04:09,570 І гэта было толькі з-за гэтага Велізарны тэндэнцыя ў індустрыі высокіх тэхналогій 74 00:04:09,570 --> 00:04:10,590 аб вялікіх дадзеных. 75 00:04:10,590 --> 00:04:13,010 Акрамя таго, не толькі тэхналогія прамысловасць, але на самой справе 76 00:04:13,010 --> 00:04:16,490 Любая галіна that--, таму што шмат галін 77 00:04:16,490 --> 00:04:20,589 з'яўляюцца свайго роду асновай для спрабуюць вырашыць гэтыя праблемы. 78 00:04:20,589 --> 00:04:24,590 І, як правіла, вы можаце мець некаторыя добрыя спосаб вымярэння гэтых праблем 79 00:04:24,590 --> 00:04:29,720 ці нават вызначаючы іх ці іх рашэнні, выкарыстоўваючы дадзеныя. 80 00:04:29,720 --> 00:04:35,430 Так што я думаю, зараз R з'яўляецца 11- самы папулярны мову на Tiobe 81 00:04:35,430 --> 00:04:38,200 і гэта расце з тых часоў. 82 00:04:38,200 --> 00:04:40,740 83 00:04:40,740 --> 00:04:43,080 >> Дык вось некаторыя больш асаблівасці R. Ён мае 84 00:04:43,080 --> 00:04:46,900 Велізарная колькасць пакетаў і для ўсіх гэтых розных рэчаў. 85 00:04:46,900 --> 00:04:52,470 Так у любы час у вас ёсць пэўная праблема, большасць 86 00:04:52,470 --> 00:04:55,060 Час R будзе мець што функцыя для вас. 87 00:04:55,060 --> 00:04:58,520 Так ці вы хочаце, каб пабудаваць якое-небудзь машыны 88 00:04:58,520 --> 00:05:02,770 Алгарытм навучання называецца Выпадковыя Лес або дрэвы рашэнняў, 89 00:05:02,770 --> 00:05:07,530 ці нават спрабуюць узяць сярэдняе функцыя або якой-небудзь з гэтага матэрыялу, 90 00:05:07,530 --> 00:05:10,000 R будзе мець гэта. 91 00:05:10,000 --> 00:05:14,190 >> І калі вы робіце вы клапоціцеся аб аптымізацыя, адна рэч, якая агульная 92 00:05:14,190 --> 00:05:17,430 з'яўляецца тое, што пасля таго як вы зрабілі прататыпы нейкая мове высокага ўзроўню, 93 00:05:17,430 --> 00:05:19,810 вы будзеце кідаць, што in-- Вы проста порт, які больш 94 00:05:19,810 --> 00:05:21,550 у якой-то мова нізкага ўзроўню. 95 00:05:21,550 --> 00:05:26,090 Тое, што добра пра R з'яўляецца тое, што, як толькі вы зроблена прататыпаў, вы можаце запусціць C ++, 96 00:05:26,090 --> 00:05:29,510 або Fortran, або любы з іх ніжнія ўзроўню непасрэдна ў R. 97 00:05:29,510 --> 00:05:32,320 Дык вось адзін сапраўды крута асаблівасцю R, 98 00:05:32,320 --> 00:05:35,930 Калі вы сапраўды клапоціцеся аб Справа ў аптымізацыі. 99 00:05:35,930 --> 00:05:39,490 >> І гэта таксама вельмі добра для вэб-візуалізацыі. 100 00:05:39,490 --> 00:05:43,530 Так D3.js, напрыклад, Я думаю, яшчэ адзін семінар 101 00:05:43,530 --> 00:05:45,130 што мы прадставілі сёння. 102 00:05:45,130 --> 00:05:48,510 І гэта сапраўды дзіўным для рабіць інтэрактыўныя візуалізацыі. 103 00:05:48,510 --> 00:05:54,460 І D3.js мяркуе, што ў вас ёсць свайго роду дадзеных, якія будуць нанесеныя 104 00:05:54,460 --> 00:05:58,080 і R з'яўляецца выдатным спосабам, каб быць здольным рабіць Аналіз дадзеных, перш чым экспартаваць яго 105 00:05:58,080 --> 00:06:04,220 да D3.js ці нават проста працаваць D3.js каманд у самой R, 106 00:06:04,220 --> 00:06:08,240 а таксама ўсе гэтыя іншыя бібліятэкі, а таксама. 107 00:06:08,240 --> 00:06:13,041 >> Так што проста ўкараненне што R і чаму яго можна выкарыстоўваць. 108 00:06:13,041 --> 00:06:14,790 Так, мы спадзяемся, у мяне перакананыя, што вы нешта 109 00:06:14,790 --> 00:06:18,460 аб проста спрабую ўбачыць, што гэта такое. 110 00:06:18,460 --> 00:06:23,930 Так што я збіраюся ісці наперад і прайсці праз некаторыя асновы аб аб'ектах R 111 00:06:23,930 --> 00:06:26,150 і тое, што вы сапраўды можаце зрабіць. 112 00:06:26,150 --> 00:06:29,690 >> Так вось проста куча каманд матэматыку. 113 00:06:29,690 --> 00:06:35,000 Так кажуць you're-- вы хочаце пабудаваць мова самастойна, і вы проста хочаце 114 00:06:35,000 --> 00:06:38,080 мець кучу розных інструментаў. 115 00:06:38,080 --> 00:06:42,520 Любы выгляд працы вы думаеце, вы хачу ў значнай ступені будзе ў R. 116 00:06:42,520 --> 00:06:44,150 >> Дык вось 2 плюс 2. 117 00:06:44,150 --> 00:06:46,090 Вось 2 разы пі. 118 00:06:46,090 --> 00:06:51,870 R мае кучу ўбудаваных канстант што вы будзеце часта выкарыстоўваць як пі, е. 119 00:06:51,870 --> 00:06:56,230 >> І потым, вось 7 плюс runif, так runif 1. 120 00:06:56,230 --> 00:07:02,450 Гэта функцыя, якая генеруе адно выпадковае раўнамернае ад 0 да 1. 121 00:07:02,450 --> 00:07:04,400 А тут яшчэ ад 3 да ступені 4. 122 00:07:04,400 --> 00:07:06,430 Там гэта квадратныя карані. 123 00:07:06,430 --> 00:07:07,270 >> Там жа часопіса. 124 00:07:07,270 --> 00:07:14,500 Так, аўтарызуйцеся будзе рабіць базу Экспанентны сам па сабе. 125 00:07:14,500 --> 00:07:18,337 І потым, калі вы пакажа базу, то Вы можаце рабіць усё, што база вы хочаце. 126 00:07:18,337 --> 00:07:19,920 І тады, вось некаторыя іншыя каманды. 127 00:07:19,920 --> 00:07:22,180 Так што вы павінны 23 мод 2. 128 00:07:22,180 --> 00:07:24,910 Тады ў вас ёсць рэшту. 129 00:07:24,910 --> 00:07:27,110 Тады ў вас ёсць навукова абазначэння, калі вы таксама 130 00:07:27,110 --> 00:07:34,060 хачу зрабіць проста больш і больш складаныя рэчы. 131 00:07:34,060 --> 00:07:37,320 >> Дык вось прызначэнне. 132 00:07:37,320 --> 00:07:40,830 Так тыповыя заданні ў R выконваецца са стрэлкай 133 00:07:40,830 --> 00:07:43,440 так што гэта менш, чым а затым злучок. 134 00:07:43,440 --> 00:07:47,250 Дык вось, я проста прызначэння 3 з зменнай Вал. 135 00:07:47,250 --> 00:07:50,160 >> І тады я друкую Val а затым выводзіць тры. 136 00:07:50,160 --> 00:07:53,920 Па змаўчанні ў R перакладчыка, яго будзе друкаваць рэчы для вас 137 00:07:53,920 --> 00:07:57,280 так што вам не трэба паказваць друку Val у любы час вы хочаце, каб нешта надрукаваць. 138 00:07:57,280 --> 00:08:00,200 Вы можаце проста зрабіць Вэл і то ён будзе рабіць гэта за вас. 139 00:08:00,200 --> 00:08:04,380 >> Акрамя таго, вы можаце выкарыстоўваць складае тэхнічна як аператар прысвойвання. 140 00:08:04,380 --> 00:08:07,190 Ёсць невялікія тонкасці паміж выкарыстаннем стрэлку 141 00:08:07,190 --> 00:08:10,730 аператар і роўнасці Аператар для выканання заданняў. 142 00:08:10,730 --> 00:08:15,470 У асноўным у адпаведнасці з Канвенцыяй, усё проста выкарыстоўваць аператар стрэлкі. 143 00:08:15,470 --> 00:08:21,850 >> І вось, я задаю гэты касой абазначэння называецца 1 двукроп'е 6. 144 00:08:21,850 --> 00:08:26,010 Гэта генеруе вектар ад 1 да 6. 145 00:08:26,010 --> 00:08:29,350 І гэта вельмі прыемна, таму што тады Вы проста прызначыць вектар Валь 146 00:08:29,350 --> 00:08:34,270 і што працуе сама па сабе. 147 00:08:34,270 --> 00:08:37,799 >> Так што гэта ўжо адбываецца з single-- вельмі інтуітыўны дадзеных 148 00:08:37,799 --> 00:08:41,070 Структура проста двайнік некаторы тып тыпу ў вектар 149 00:08:41,070 --> 00:08:45,670 і які будзе збіраць усе скалярныя значэння для вас. 150 00:08:45,670 --> 00:08:50,770 Такім чынам, пасля пераходу ад скалярнага, вы ёсць аб'екты R, і гэта вектар. 151 00:08:50,770 --> 00:08:55,610 Вектар любы від Збор і таго ж тыпу. 152 00:08:55,610 --> 00:08:58,150 Дык вось куча вектараў. 153 00:08:58,150 --> 00:08:59,800 >> Так што гэта лічбы. 154 00:08:59,800 --> 00:09:02,440 Лікавы, з'яўляецца спосаб R спосаб сказаць два разы. 155 00:09:02,440 --> 00:09:07,390 І так па змаўчанні, любы лік будзе ў два разы. 156 00:09:07,390 --> 00:09:13,150 >> Так што, калі ў вас ёсць з 1,1, 3, адмоўнай 5,7, C з'яўляецца функцыяй. 157 00:09:13,150 --> 00:09:16,760 Гэта аб'ядноўвае ўсе тры лікі ў вектары. 158 00:09:16,760 --> 00:09:19,619 І гэта будзе be-- так што калі Вы заўважылі, 3 само па сабе, 159 00:09:19,619 --> 00:09:21,910 як правіла, вы б выказаць здагадку, што гэта, як цэлае, 160 00:09:21,910 --> 00:09:25,050 а таму, што ўсе вектары той жа самы тып, 161 00:09:25,050 --> 00:09:28,660 гэта вектар парным разрадзе або лічбавы ў гэтым выпадку. 162 00:09:28,660 --> 00:09:34,920 >> RNorm з'яўляецца функцыяй, якая стварае стандартная нармальная variables-- 163 00:09:34,920 --> 00:09:36,700 або стандартныя нармальныя значэння. 164 00:09:36,700 --> 00:09:38,360 І я, паказаўшы дзве з іх. 165 00:09:38,360 --> 00:09:43,840 Так што я раблю RNorm 2, прызначэнне, што Распрацоўшчыкі, а затым я друкую дэвы. 166 00:09:43,840 --> 00:09:47,350 Такім чынам, гэтыя толькі два Выпадковыя нармальныя значэння. 167 00:09:47,350 --> 00:09:50,060 >> А потым цэлых лікаў, калі вы Вы клапоціцеся аб цэлых лікаў. 168 00:09:50,060 --> 00:09:54,650 Так што гэта проста аб памяці размеркаванне і захаванне аб'ём памяці. 169 00:09:54,650 --> 00:10:01,460 Такім чынам, вы павінны дадаць вашыя нумары па сталіцы Л. 170 00:10:01,460 --> 00:10:04,170 >> Увогуле, гэта Гістарычны абазначэння R ў 171 00:10:04,170 --> 00:10:06,940 для таго, што называецца доўгае цэлае. 172 00:10:06,940 --> 00:10:09,880 Таму вялікую частку часу, вы будзеце мець справу з двайнікамі. 173 00:10:09,880 --> 00:10:15,180 І калі вы калі-небудзь будзе позна на аптымізаваць свой код, 174 00:10:15,180 --> 00:10:18,110 Вы можаце проста дадаць іх у L'гадоў пасля або падчас яго 175 00:10:18,110 --> 00:10:22,280 калі вы, як прарочыя аб тым, што Вы збіраецеся зрабіць гэтыя зменныя. 176 00:10:22,280 --> 00:10:25,340 177 00:10:25,340 --> 00:10:26,890 >> Дык вось вектарны характар. 178 00:10:26,890 --> 00:10:31,440 Так, зноў жа, я аб'яднання тры струны на гэты раз. 179 00:10:31,440 --> 00:10:36,230 Звярніце ўвагу, што падвойныя струны і адзінкавыя радкі ж у R. 180 00:10:36,230 --> 00:10:41,000 Так што ў мяне Артур і Марвін і так калі я друкую гэта, усе яны 181 00:10:41,000 --> 00:10:43,210 збіраемся паказаць падвойнымі струнамі. 182 00:10:43,210 --> 00:10:45,880 І калі вы таксама хочаце, каб уключыць двайны або адзінарнай радкі 183 00:10:45,880 --> 00:10:50,070 ў вашых персанажаў, то вы можаце альбо чаргаваць вашыя радкі. 184 00:10:50,070 --> 00:10:53,540 >> Так Марвін для Другі элемент, гэта 185 00:10:53,540 --> 00:10:56,380 збіраецца show-- вас проста падвойнымі струнамі 186 00:10:56,380 --> 00:10:59,050 а затым адзін радок так што гэта пераменнага. 187 00:10:59,050 --> 00:11:04,040 У адваротным выпадку, калі вы хочаце выкарыстоўваць двойчы Радок аператар у двухмесным радкі 188 00:11:04,040 --> 00:11:07,090 калі вы абвясціўшы яе, а затым вы проста карыстаецеся аператар ўцёкаў. 189 00:11:07,090 --> 00:11:10,600 Так што вам зваротны слэш двайны радок. 190 00:11:10,600 --> 00:11:13,330 >> І, нарэшце, мы таксама ёсць лагічныя вектары. 191 00:11:13,330 --> 00:11:15,890 Так logical-- так правільна і FALSE, і яны 192 00:11:15,890 --> 00:11:18,880 будзе ўсё загалоўныя літары. 193 00:11:18,880 --> 00:11:22,370 А потым, зноў жа, я аб'яднання іх, а затым прызначаць іх BOOLS. 194 00:11:22,370 --> 00:11:24,590 Так Bools збіраецца паказаць Вы TRUE, FALSE, і TRUE. 195 00:11:24,590 --> 00:11:28,280 196 00:11:28,280 --> 00:11:31,620 >> Дык вось векторизация індэксацыі. 197 00:11:31,620 --> 00:11:34,870 Такім чынам, у пачатку, я бяру function-- 198 00:11:34,870 --> 00:11:39,230 гэта называецца sequence-- Паслядоўнасць ад 2 да 12. 199 00:11:39,230 --> 00:11:42,490 І я бяру паслядоўнасць, 2. 200 00:11:42,490 --> 00:11:46,660 Дык гэта будзе рабіць 2, 4, 6, 8, 10 і 12. 201 00:11:46,660 --> 00:11:50,080 І потым, я індэксаванне каб атрымаць трэці элемент. 202 00:11:50,080 --> 00:11:55,770 >> Такім чынам, адна рэч, каб мець на ўвазе, што г індэксы, пачынаючы з 1. 203 00:11:55,770 --> 00:12:00,550 Так Вальс 3 будзе даваць Вы Трэці элемент. 204 00:12:00,550 --> 00:12:04,580 Гэта свайго роду адрозніваецца ад іншых мовы, у якіх ён пачынаецца з нуля. 205 00:12:04,580 --> 00:12:09,780 Такім чынам, у C ці C ++, напрыклад, вы збіраецца атрымаць чацвёрты элемент. 206 00:12:09,780 --> 00:12:13,280 >> А вось вальс ад 3 да 5. 207 00:12:13,280 --> 00:12:16,030 Такім чынам, адна рэч, якая сапраўды выдатна, што вы 208 00:12:16,030 --> 00:12:20,410 можа генераваць часовыя зменныя ўнутры а затым проста выкарыстоўваць іх на лета. 209 00:12:20,410 --> 00:12:21,960 Дык вось 3 да 5. 210 00:12:21,960 --> 00:12:25,070 Так я генерацыі вектар 3, 4 і 5, а затым 211 00:12:25,070 --> 00:12:29,700 Я індэксацыі, каб атрымаць траціну, чацвёрты і пяты элементы. 212 00:12:29,700 --> 00:12:32,280 >> Такім чынам, падобным чынам, вы можаце Анатацыя проста зрабіць 213 00:12:32,280 --> 00:12:35,280 любы від вэктару Гэта дае вам індэксацыю. 214 00:12:35,280 --> 00:12:40,050 Дык вось вальс, а затым першы, трэці, шосты і элементы. 215 00:12:40,050 --> 00:12:42,800 І потым, калі вы хочаце зрабіць дадатак, 216 00:12:42,800 --> 00:12:45,210 так што вы проста зрабіць мінус пасля гэтага і што будзе 217 00:12:45,210 --> 00:12:48,600 даць вам усё, што не першы, трэці, шосты і элемент. 218 00:12:48,600 --> 00:12:51,590 Такім чынам, гэта будзе 4, 8 і 10. 219 00:12:51,590 --> 00:12:54,380 >> І калі вы хочаце атрымаць нават больш прасунутыя, 220 00:12:54,380 --> 00:12:57,610 Вы можаце аб'яднаць лагічныя вектары. 221 00:12:57,610 --> 00:13:05,210 Так гэты паказчык будзе даваць вам гэта булева вектара даўжыні 6. 222 00:13:05,210 --> 00:13:07,280 Так прадстаўнік TRUE, коска 3. 223 00:13:07,280 --> 00:13:09,680 Гэта будзе паўтараць ПРАЎДА тры разы. 224 00:13:09,680 --> 00:13:12,900 Так што гэта дасьць вам вектар TRUE, TRUE, TRUE. 225 00:13:12,900 --> 00:13:17,470 >> прадстаўнік FALSE 4-- гэта адбываецца, каб даць вам вектар FALSE, FALSE, FALSE, FALSE. 226 00:13:17,470 --> 00:13:21,280 І тады з будзе аб'ядноўваць гэтыя два Лагічныя разам. 227 00:13:21,280 --> 00:13:24,090 Такім чынам, вы збіраецеся атрымаць тры Ісціны, а затым чатыры FALSEs. 228 00:13:24,090 --> 00:13:28,460 >> Так што, калі вы форумаў вальс, вы збіраецца атрымаць TRUE, TRUE, TRUE. 229 00:13:28,460 --> 00:13:31,420 Дык вось хачу сказаць, ды, Я хачу, каб гэтыя тры элемента. 230 00:13:31,420 --> 00:13:33,520 А потым FALSE, FALSE, ХЛУСНЯ, ХЛУСНЯ збіраецца 231 00:13:33,520 --> 00:13:37,140 каб сказаць няма, я не хачу, каб гэтыя элементы так што не збіраецца іх вярнуць. 232 00:13:37,140 --> 00:13:41,490 >> І я думаю, ёсць на самой справе памылка друку тут таму што гэта кажа паўторыце TRUE, 3 233 00:13:41,490 --> 00:13:47,990 і паўтараць хлуслівыя 4, і тэхнічна, вам толькі шэсць элементаў, так паўтараць хлуслівыя, 234 00:13:47,990 --> 00:13:50,470 яна павінна быць паўтор FALSE 3. 235 00:13:50,470 --> 00:13:55,260 Я думаю, што R таксама досыць такі шыкоўны што калі вы проста паказваеце 4 тут, то 236 00:13:55,260 --> 00:13:56,630 Гэта не будзе нават без памылак. 237 00:13:56,630 --> 00:13:58,480 Гэта будзе проста даць вам гэтую велічыню. 238 00:13:58,480 --> 00:14:00,970 Дык гэта будзе проста ігнараваць, што ў чацвёртым ХЛУСНЯ. 239 00:14:00,970 --> 00:14:05,310 240 00:14:05,310 --> 00:14:09,270 >> Дык вось векторизация прызначэнне. 241 00:14:09,270 --> 00:14:15,480 Так set.seed-- гэта толькі ўстанаўлівае насенне псеўдавыпадковых лікаў. 242 00:14:15,480 --> 00:14:20,110 Так я ўсталёўваю насення з 42, гэта азначае, што, калі я магу генераваць 243 00:14:20,110 --> 00:14:22,950 тры выпадковых нармальна значэння, а затым, калі вас 244 00:14:22,950 --> 00:14:27,400 запусціць set.seed па сваім меркаванні кампутар, выкарыстоўваючы той жа значэнне 42, 245 00:14:27,400 --> 00:14:30,990 то вы таксама атрымліваеце Тыя ж тры выпадковыя нармалей. 246 00:14:30,990 --> 00:14:33,411 >> Так што гэта вельмі добра узнаўляльнасці. 247 00:14:33,411 --> 00:14:35,910 Звычайна, калі вы робіце некаторыя Сартаваць навуковага аналізу, 248 00:14:35,910 --> 00:14:37,230 Вы хацелі б ўсталяваць насеньне. 249 00:14:37,230 --> 00:14:41,270 Такім чынам, іншыя навукоўцы могуць проста прайграць сапраўды такі жа код, які вы 250 00:14:41,270 --> 00:14:44,790 зроблена таму, што яны маюць дакладнае ж выпадковыя велічыні that-- або выпадковая 251 00:14:44,790 --> 00:14:47,270 значэння, якія вы ўзялі, як добра. 252 00:14:47,270 --> 00:14:49,870 253 00:14:49,870 --> 00:14:53,910 >> І так Векторизованных прызначэнне тут паказвае Вальс з 1 па 2. 254 00:14:53,910 --> 00:14:59,290 Так што займае першыя два элемента з вальса, а затым прысвойвае іх 0. 255 00:14:59,290 --> 00:15:03,940 І потым, вы таксама можаце проста зрабіць Падобная рэч з перамыкачоў. 256 00:15:03,940 --> 00:15:09,340 >> Так вальс ня роўная 0-- гэтую волю даць вам вектар ХЛУСНЯ, ХЛУСНЯ, ПРАЎДА 257 00:15:09,340 --> 00:15:10,350 ў гэтым выпадку. 258 00:15:10,350 --> 00:15:13,770 І потым, гэта будзе казаць любы з тых індэксаў, якія былі праўдзівымі, 259 00:15:13,770 --> 00:15:15,270 то гэта будзе прызначыць што 5. 260 00:15:15,270 --> 00:15:18,790 Так ён прымае трэці элемент тут, а затым прысвойвае яго 5. 261 00:15:18,790 --> 00:15:22,300 >> І гэта вельмі прыемна у параўнанні з нізкаўзроўневых мовах 262 00:15:22,300 --> 00:15:25,560 дзе вы павінны выкарыстоўваць для завес зрабіць усё гэта векторизованного рэчы 263 00:15:25,560 --> 00:15:30,281 таму што гэта проста вельмі інтуітыўна і гэта адзіны адзін ўкладыш. 264 00:15:30,281 --> 00:15:32,030 І тое, што з'яўляецца вялікім аб векторизация абазначэння 265 00:15:32,030 --> 00:15:37,020 у тым, што ў R, гэта свайго роду ўбудаваныя такім чынам, што яны амаль гэтак жа хутка, 266 00:15:37,020 --> 00:15:42,490 як рабіць на мове нізкага ўзроўню, як у адрозненне ад рашэнняў для завесы ў R 267 00:15:42,490 --> 00:15:46,317 , А затым з яго рабіць Сам дынамічны індэксацыі. 268 00:15:46,317 --> 00:15:48,900 І гэта будзе больш павольна, чым рабіць Гэты выгляд векторизованного рэчы 269 00:15:48,900 --> 00:15:55,950 дзе ён можа зрабіць гэта паралельна, дзе ён робіць гэта ў запраўцы ў прынцыпе. 270 00:15:55,950 --> 00:15:58,650 >> Дык вось векторизуется аперацый. 271 00:15:58,650 --> 00:16:04,920 Так я генерацыі значэння 1 да 3, прызначаючы што vec1, ад 3 да 5, vec2, 272 00:16:04,920 --> 00:16:05,950 складаючы іх разам. 273 00:16:05,950 --> 00:16:11,490 Ён дадае ім покомпонентная так гэта 1 плюс 3, 2 плюс 4, і гэтак далей. 274 00:16:11,490 --> 00:16:13,330 >> vec1 раз vec2. 275 00:16:13,330 --> 00:16:16,110 Гэта памнажае два каштоўнасны кампанент мудрым. 276 00:16:16,110 --> 00:16:21,830 Так што гэта 1 раз 3, 2 разы 4, а затым 3 разы 5. 277 00:16:21,830 --> 00:16:28,250 >> А потым, гэтак жа вы можаце таксама зрабіць comparisons-- лагічнае параўнанне. 278 00:16:28,250 --> 00:16:33,640 Так што гэта ХЛУСНЯ ХЛУСНЯ ПРАЎДА ў гэтым так, таму што адзін не больш, чым 3, 279 00:16:33,640 --> 00:16:35,920 2 не болей, чым 4. 280 00:16:35,920 --> 00:16:41,160 Гэта, я думаю ,, іншы памылка друку, 3 вызначана не больш, чым 5. 281 00:16:41,160 --> 00:16:41,660 Так. 282 00:16:41,660 --> 00:16:45,770 І таму вы можаце проста зрабіць усё Гэтыя простыя аперацыі 283 00:16:45,770 --> 00:16:48,350 таму што іх у спадчыну ад саміх класаў. 284 00:16:48,350 --> 00:16:51,110 285 00:16:51,110 --> 00:16:52,580 >> Так што было проста вектар. 286 00:16:52,580 --> 00:16:56,530 І гэта свайго роду найбольш фундаментальных R аб'ект, таму што зададзены вектар, 287 00:16:56,530 --> 00:16:59,170 Вы можаце пабудаваць больш складаныя аб'екты. 288 00:16:59,170 --> 00:17:00,560 >> Дык вось матрыца. 289 00:17:00,560 --> 00:17:05,030 Гэта, па сутнасці абстракцыя што матрыца сама па сабе. 290 00:17:05,030 --> 00:17:10,099 Такім чынам, у гэтым выпадку, гэта тры розныя вектары, дзе кожны з калонкі, 291 00:17:10,099 --> 00:17:12,710 ці вы можаце разглядаць яго як кожнага з іх шэраг. 292 00:17:12,710 --> 00:17:18,250 >> Так што я захоўваю матрыцу ад 1 да 9, а затым я указаннем 3 радкоў. 293 00:17:18,250 --> 00:17:23,364 Так з 1 па 9 дасць вам вектар 1, 2, 3, 4, 5, 6, і аж да 9. 294 00:17:23,364 --> 00:17:29,250 >> Адна рэч, каб мець на ўвазе, што R захоўвае значэння ў Стоўбцах-маёр фармаце. 295 00:17:29,250 --> 00:17:34,160 Такім чынам, іншымі словамі, калі вы бачыце 1 9, гэта будзе захоўваць them-- 296 00:17:34,160 --> 00:17:36,370 гэта будзе 1, 2, 3 у першым слупку, 297 00:17:36,370 --> 00:17:38,510 а затым ён будзе рабіць 4, 5, 6 у другім слупку, 298 00:17:38,510 --> 00:17:41,440 а затым 7, 8, 9, у трэцім слупку. 299 00:17:41,440 --> 00:17:45,570 >> А вось некаторыя іншыя агульныя функцыі, якія вы можаце выкарыстоўваць. 300 00:17:45,570 --> 00:17:49,650 Так цьмяны мат, гэта дасць вам памеры матрыцы. 301 00:17:49,650 --> 00:17:52,620 Гэта будзе вяртаць вас вектар памернасці. 302 00:17:52,620 --> 00:17:55,580 Такім чынам, у гэтым выпадку, паколькі наша матрыца 3 на 3, 303 00:17:55,580 --> 00:18:01,900 гэта будзе даваць вам лічбавая вектарная гэта 3 сакавіка. 304 00:18:01,900 --> 00:18:05,270 >> А вось проста паказвае множання матрыц. 305 00:18:05,270 --> 00:18:11,970 Так звычайна, калі вы проста робіце asterisk-- так кілімок зорачка mat-- 306 00:18:11,970 --> 00:18:15,380 гэта будзе покомпонентная праца 307 00:18:15,380 --> 00:18:17,300 або тое, што называецца прадукт Адамара. 308 00:18:17,300 --> 00:18:21,310 Дык гэта будзе рабіць кожны элемент покомпонентная. 309 00:18:21,310 --> 00:18:23,610 Тым не менш, калі вы хочаце матрыца multiplication-- 310 00:18:23,610 --> 00:18:29,380 так множання першы раз радкоў Першы слупок другі матрыцы ў 311 00:18:29,380 --> 00:18:34,510 і так on-- вы павінны выкарыстоўваць гэты працэнт аперацыя. 312 00:18:34,510 --> 00:18:38,110 >> І т мата проста Праца для транспазіцыя. 313 00:18:38,110 --> 00:18:42,590 Так што я кажу, прыняць Транспанаванне ў матрыца, памножыць яго на матрыцу 314 00:18:42,590 --> 00:18:43,090 Сам. 315 00:18:43,090 --> 00:18:45,006 І тады гэта будзе вярнуцца да вас яшчэ 3 316 00:18:45,006 --> 00:18:50,700 на 3 матрыцы паказу прадукт, які вы хацелі. 317 00:18:50,700 --> 00:18:53,750 >> І так, каб было матрыца. 318 00:18:53,750 --> 00:18:56,020 Вось тое, што называецца кадр дадзеных. 319 00:18:56,020 --> 00:19:00,780 Кадр дадзеных вы можаце думаць аб якасці матрыца, а сама кожны слупок 320 00:19:00,780 --> 00:19:02,990 будзе іншага тыпу. 321 00:19:02,990 --> 00:19:07,320 >> Так што сапраўды выдатна аб дадзеных кадры, што ў аналізе дадзеных самога, 322 00:19:07,320 --> 00:19:11,260 Вы будзеце мець усё гэта гетэрагенныя дадзеныя і ўсё гэта на самай справе 323 00:19:11,260 --> 00:19:15,640 брудныя рэчы, дзе кожная з калон самі па сабе могуць быць розных тыпаў. 324 00:19:15,640 --> 00:19:21,460 Дык вось я і кажу стварыць кадр дадзеных, зрабіць цэлымі ад 1 да 3, 325 00:19:21,460 --> 00:19:24,750 а затым таксама вектарны характар. 326 00:19:24,750 --> 00:19:28,470 Так што я магу індэкс праз кожны з гэтых калонак 327 00:19:28,470 --> 00:19:30,930 і тады я атрымаю самі значэння. 328 00:19:30,930 --> 00:19:34,370 І вы таксама можаце зрабіць нейкі аперацый па фрэймаў дадзеных. 329 00:19:34,370 --> 00:19:38,040 І большую частку часу, калі вы рабіць аналіз дадзеных або нейкі 330 00:19:38,040 --> 00:19:42,042 папярэдняй апрацоўкі, вы будзеце працаваць з гэтымі структурамі дадзеных 331 00:19:42,042 --> 00:19:44,250 дзе кожны слупок будзе каб быць іншага тыпу. 332 00:19:44,250 --> 00:19:47,880 333 00:19:47,880 --> 00:19:52,970 >> Нарэшце, так што гэта ў асноўным толькі чатыры асноўныя аб'екты ў Спіс Р. 334 00:19:52,970 --> 00:19:55,820 будзе проста збіраць любыя іншыя аб'екты, якія вы хочаце. 335 00:19:55,820 --> 00:20:00,130 Так ён будзе захоўваць гэта ў адным пераменная, якую можна лёгка атрымаць доступ. 336 00:20:00,130 --> 00:20:02,370 >> Дык вось, я бяру спіс. 337 00:20:02,370 --> 00:20:04,460 Я кажу рэчы роўная 3. 338 00:20:04,460 --> 00:20:08,060 Так што я буду мець адзін элемент у Спіс, і гэта завецца матэрыял, 339 00:20:08,060 --> 00:20:10,570 і гэта будзе мець значэнне 3. 340 00:20:10,570 --> 00:20:13,140 >> Я магу таксама стварыць матрыцу. 341 00:20:13,140 --> 00:20:17,970 Так што гэта ад 1 да 4 і канчатковага запар роўны 2, так што матрыца 2 × 2. 342 00:20:17,970 --> 00:20:20,270 Акрамя таго, у спісе, і гэта завецца мат. 343 00:20:20,270 --> 00:20:24,690 moreStuff, радок знакаў, і нават адзін спіс сам па сабе. 344 00:20:24,690 --> 00:20:27,710 >> Так што гэта спіс, гэта 5 і мядзведзя. 345 00:20:27,710 --> 00:20:30,990 Так што мае значэнне 5 і яго мае знакавай радкі мядзведзя 346 00:20:30,990 --> 00:20:32,710 і гэта спіс ўнутры спісу. 347 00:20:32,710 --> 00:20:35,965 Такім чынам, вы можаце мець гэта рэкурсіўныя рэчаў, дзе 348 00:20:35,965 --> 00:20:38,230 ў вас ёсць another-- А ўвядзіце ў межах тыпу. 349 00:20:38,230 --> 00:20:41,420 Такім чынам, падобным чынам, вы можаце мець матрыцу у іншай матрыцы і гэтак далей. 350 00:20:41,420 --> 00:20:44,264 І спіс проста добры спосаб збору і агрэгавання 351 00:20:44,264 --> 00:20:45,430 усе гэтыя розныя аб'екты. 352 00:20:45,430 --> 00:20:50,210 353 00:20:50,210 --> 00:20:57,150 >> І, нарэшце, тут проста дапаможа ў выпадку Гэта было як раз перайшлі вельмі хутка. 354 00:20:57,150 --> 00:21:01,350 Так у любы час вы заблыталіся пра нейкую функцыі, 355 00:21:01,350 --> 00:21:03,510 Вы можаце зрабіць дапамогу гэтай функцыі. 356 00:21:03,510 --> 00:21:07,120 Такім чынам, вы можаце зрабіць даведачную матрыцу або пытальнік матрыца. 357 00:21:07,120 --> 00:21:11,430 І дапамогу і пытальнік з'яўляюцца толькі аблічваць за тое ж самае 358 00:21:11,430 --> 00:21:13,040 так што яны псеўданімы. 359 00:21:13,040 --> 00:21:16,820 >> ЛМ функцыя, якая проста робіць лінейная мадэль. 360 00:21:16,820 --> 00:21:20,340 Але калі вы проста паняцця не маю, як гэта Працы, вы можаце проста зрабіць дапамогу лм 361 00:21:20,340 --> 00:21:24,610 і гэта дасць вам некаторыя Сартаваць дакументацыі, якая 362 00:21:24,610 --> 00:21:27,960 выглядае накшталт як Чалавек старонкі ў Unix, дзе 363 00:21:27,960 --> 00:21:34,210 ў вас ёсць кароткае апісанне таго, што ён робіць, і тое, што яе аргументы, 364 00:21:34,210 --> 00:21:38,850 што гэта вяртаецца, і ўсяго саветаў аб тым, каб выкарыстоўваць яго, і некаторыя прыклады. 365 00:21:38,850 --> 00:21:41,680 366 00:21:41,680 --> 00:21:52,890 >> Такім чынам, дазвольце мне ісці наперад і шоў некаторыя дэма з дапамогай Р. OK. 367 00:21:52,890 --> 00:21:55,470 Так што я пайшоў на вельмі хутка толькі дадзеныя 368 00:21:55,470 --> 00:21:59,440 структуры і нейкі op-- некаторыя аперацыі. 369 00:21:59,440 --> 00:22:02,960 Вось некаторыя функцыі. 370 00:22:02,960 --> 00:22:06,750 >> Дык вось я проста хачу, вызначыць функцыю. 371 00:22:06,750 --> 00:22:09,970 Так я таксама выкарыстоўваю Аператар прысвойвання тут, 372 00:22:09,970 --> 00:22:12,610 і тады я кажу, аб'явіць яго як функцыю. 373 00:22:12,610 --> 00:22:14,140 І ён прымае значэнне х. 374 00:22:14,140 --> 00:22:18,210 Так што гэта якое-небудзь значэнне вы хочаце і я збіраюся вярнуцца х сам па сабе. 375 00:22:18,210 --> 00:22:20,840 Так што гэта функцыя тоеснасці. 376 00:22:20,840 --> 00:22:23,670 >> І тое, што гэта крута пра гэта у параўнанні з іншымі мовамі 377 00:22:23,670 --> 00:22:26,330 а другі з нізкім узроўнем моў заключаецца ў тым х 378 00:22:26,330 --> 00:22:29,350 можа быць самай розных тыпаў і яна верне гэты тып. 379 00:22:29,350 --> 00:22:35,251 Такім чынам, вы можаце imagine-- так што давайце мне проста запусціць гэта хутка. 380 00:22:35,251 --> 00:22:35,750 Выбачайце. 381 00:22:35,750 --> 00:22:40,300 >> Такім чынам, адна рэч, якую я павінен таксама згадаць, з'яўляецца тое, што гэты рэдактар ​​я выкарыстоўваю 382 00:22:40,300 --> 00:22:41,380 называецца RStudio. 383 00:22:41,380 --> 00:22:44,389 Гэта тое, што называецца IDE. 384 00:22:44,389 --> 00:22:46,180 І адна рэч, якая вельмі прыемна пра гэта 385 00:22:46,180 --> 00:22:51,500 з'яўляецца тое, што яна ўключае ў сябе мноства рэчы, якія вы хочаце зрабіць у R само па сабе 386 00:22:51,500 --> 00:22:53,180 проста вельмі інтуітыўна. 387 00:22:53,180 --> 00:22:55,550 >> Дык вось пульт перакладчыка. 388 00:22:55,550 --> 00:23:02,160 Такім чынам, падобным чынам, вы таксама можаце атрымаць гэта Кансоль сыравіны проста рабіць вялікай літары 389 00:23:02,160 --> 00:23:05,630 І гэта менавіта тое, Тое ж самае, як кансоль. 390 00:23:05,630 --> 00:23:12,210 Так што я магу рабіць дакумента функцыя х, х, х. 391 00:23:12,210 --> 00:23:16,130 І then--, а затым, што будзе выдатна сябе. 392 00:23:16,130 --> 00:23:19,200 393 00:23:19,200 --> 00:23:21,740 >> Так RStudio вялікі таму што яна мае кансоль. 394 00:23:21,740 --> 00:23:25,360 Яна таксама мае дакументы Вы хацелі б працаваць на. 395 00:23:25,360 --> 00:23:28,629 І тады яна мае некаторыя зменныя што вы можаце ўбачыць у навакольнага асяроддзі. 396 00:23:28,629 --> 00:23:30,420 І потым, калі ў вас ёсць зрабіць ўчасткі, то вам 397 00:23:30,420 --> 00:23:33,730 можна проста бачыць яго тут, у адрозненне ад кіравання ўсе гэтыя розныя вокны 398 00:23:33,730 --> 00:23:35,940 самі па сабе. 399 00:23:35,940 --> 00:23:40,530 >> Я на самой справе асабіста выкарыстоўваю Vim, але я адчуваю, што RStudio выдатна проста 400 00:23:40,530 --> 00:23:44,640 для атрымання добрай ідэяй аб тым, як выкарыстоўваць R. Звычайна 401 00:23:44,640 --> 00:23:47,040 калі вы спрабуеце даведацца некаторыя новыя задачы, 402 00:23:47,040 --> 00:23:49,590 Вы не хочаце апрацоўваць занадта шмат рэчаў адразу. 403 00:23:49,590 --> 00:23:53,120 Так R проста very-- RStudio гэта вельмі добры спосаб навучання R 404 00:23:53,120 --> 00:23:56,760 без неабходнасці мець справу з усе гэтыя іншыя рэчы. 405 00:23:56,760 --> 00:23:58,600 >> Дык вось я бягу ID Hello. 406 00:23:58,600 --> 00:24:00,090 Гэта вяртае прывітанне. 407 00:24:00,090 --> 00:24:01,740 ID 123. 408 00:24:01,740 --> 00:24:04,610 Вось вектар цэлых лікаў. 409 00:24:04,610 --> 00:24:08,620 Такім чынам, падобным чынам, таму што вы можаце прымаць якія-небудзь нейкую каштоўнасць, 410 00:24:08,620 --> 00:24:16,060 Вы можаце зрабіць вяртанне ідэнтыфікатар х, так што вяртаецца 1234 і 5. 411 00:24:16,060 --> 00:24:22,210 >> І дазвольце мне паказаць вам, што гэта сапраўды цэлы лік. 412 00:24:22,210 --> 00:24:28,800 І сапраўды гэтак жа, калі вы клас ID х, гэта будзе цэлы лік. 413 00:24:28,800 --> 00:24:34,170 І потым, вы таксама можаце параўнаць два і гэта праўда. 414 00:24:34,170 --> 00:24:38,350 Так я правяраю, калі ідэнтыфікатар X роўная роўная х і апавяшчэнне 415 00:24:38,350 --> 00:24:39,760 што яна дае вам два ісціны. 416 00:24:39,760 --> 00:24:44,280 Так што гэта не кажа, з'яўляюцца два аб'екта ідэнтычныя, 417 00:24:44,280 --> 00:24:46,845 але кожны з запісаў у вектары супадаюць. 418 00:24:46,845 --> 00:24:50,000 419 00:24:50,000 --> 00:24:52,090 >> Вось bounded.compare. 420 00:24:52,090 --> 00:24:58,470 Так што гэта крыху больш складана тым, што ён мае, і калі ўмова яшчэ 421 00:24:58,470 --> 00:25:00,960 а затым ён прымае два Аргументы ў той час. 422 00:25:00,960 --> 00:25:02,640 Так х любога тыпу. 423 00:25:02,640 --> 00:25:06,280 І я кажу гэта Другі аргумент. 424 00:25:06,280 --> 00:25:08,380 Гэта можа быць што заўгодна, як добра. 425 00:25:08,380 --> 00:25:12,490 Але па змаўчанні, гэта зойме 5, калі вы не пакажаце што-небудзь. 426 00:25:12,490 --> 00:25:16,730 >> Дык вось я хачу сказаць, калі х больш. 427 00:25:16,730 --> 00:25:19,220 Так што, калі я не паказваю, яго кажа, што калі х больш, чым 5, 428 00:25:19,220 --> 00:25:20,470 потым я збіраюся вярнуцца TRUE. 429 00:25:20,470 --> 00:25:23,230 яшчэ, я збіраюся вярнуцца FALSE. 430 00:25:23,230 --> 00:25:24,870 Такім чынам, дазвольце мне ісці наперад і вызначыць гэта. 431 00:25:24,870 --> 00:25:30,600 432 00:25:30,600 --> 00:25:34,550 >> А цяпер я збіраюся запусціць bounded.compare 3. 433 00:25:34,550 --> 00:25:39,150 Так ён кажа ў 3 менш, than-- 3 больш, чым 5. 434 00:25:39,150 --> 00:25:41,830 Не, гэта не так FALSE. 435 00:25:41,830 --> 00:25:46,550 >> І bounded.compare 3, і я збіраюся параўнаць яго з дапамогай складае 2. 436 00:25:46,550 --> 00:25:50,700 Так што цяпер я кажу так, цяпер я хачу, каб нешта іншае. 437 00:25:50,700 --> 00:25:52,750 Так што я збіраюся сказаць, вы павінны быць 2. 438 00:25:52,750 --> 00:25:56,640 >> Я магу альбо рабіць такога роду абазначэння ці я кажу роўная 2. 439 00:25:56,640 --> 00:25:58,720 Гэта больш чытэльным у тым, што, калі вы 440 00:25:58,720 --> 00:26:01,450 Гледзячы на ​​гэтыя сапраўды складаныя функцыі, якія 441 00:26:01,450 --> 00:26:08,110 ўзяць некалькі arguments-- і гэта можа быць дзесяткі oftentimes-- проста кажу, 442 00:26:08,110 --> 00:26:11,140 роўная 2 з'яўляецца больш чытэльным для Вы, каб потым у будучыні 443 00:26:11,140 --> 00:26:13,020 Вы будзеце ведаць, што вы робіце. 444 00:26:13,020 --> 00:26:17,120 >> Такім чынам, у гэтым выпадку, я прымаўка 3 больш, чым 2. 445 00:26:17,120 --> 00:26:18,270 Ды гэта так. 446 00:26:18,270 --> 00:26:22,350 І сапраўды гэтак жа, я магу проста выдаліць гэта і кажуць, 3 больш, чым 2 447 00:26:22,350 --> 00:26:23,440 дзе роўная 2. 448 00:26:23,440 --> 00:26:26,230 І гэта таксама праўда. 449 00:26:26,230 --> 00:26:26,730 Так? 450 00:26:26,730 --> 00:26:29,670 >> АЎДЫТОРЫЯ: Вы выкананне парадкова? 451 00:26:29,670 --> 00:26:30,670 >> DUSTIN TRAN: Так, я. 452 00:26:30,670 --> 00:26:33,900 Так, што я раблю тут ўспрымае тэкст document-- 453 00:26:33,900 --> 00:26:39,825 і тое, што з'яўляецца вялікім аб RStudio у тым, што Я магу проста запусціць short-- ключавую ярлык. 454 00:26:39,825 --> 00:26:41,820 Так што я раблю Control-Enter. 455 00:26:41,820 --> 00:26:44,850 >> І потым, я вязу радок у тэкставым дакуменце 456 00:26:44,850 --> 00:26:46,710 а затым пакласці ў кансолі. 457 00:26:46,710 --> 00:26:50,800 Дык вось я і кажу, bounded.compare і я раблю Control-X. 458 00:26:50,800 --> 00:26:52,540 Так што я магу проста запусціць тут. 459 00:26:52,540 --> 00:26:54,920 І тады вазьму лініі, а затым змясціць яго тут. 460 00:26:54,920 --> 00:26:57,900 А потым гэтак жа, я магу бягуць тут. 461 00:26:57,900 --> 00:27:04,630 І тады гэта будзе проста трымаць вызначэння лініі ў кансолі, як, што. 462 00:27:04,630 --> 00:27:10,690 >> І калі вы таксама заўважыце, кучаравыя брекеты там гэтак жа, як у сінтаксісе C. 463 00:27:10,690 --> 00:27:13,910 x-- калі калі ўмова таксама збіраецеся выкарыстоўваць дужкі, а затым 464 00:27:13,910 --> 00:27:15,350 Вы можаце выкарыстоўваць у іншым месцы. 465 00:27:15,350 --> 00:27:17,496 Яшчэ адзін яшчэ, калі. 466 00:27:17,496 --> 00:27:21,440 Так што гэта будзе х роўная роўная, напрыклад. 467 00:27:21,440 --> 00:27:24,190 468 00:27:24,190 --> 00:27:26,350 А потым я збіраюся вярнуць што-то тут. 469 00:27:26,350 --> 00:27:29,490 >> Звярніце ўвагу, што ёсць два розных рэчы, якія тут адбываецца. 470 00:27:29,490 --> 00:27:34,360 Па-першае, тут я з указаннем вярнуцца значэнне ПРАЎДА. 471 00:27:34,360 --> 00:27:35,950 Тут я проста кажу х. 472 00:27:35,950 --> 00:27:39,970 Так R будзе звычайна па змаўчанні ўзяць апошні arguments-- 473 00:27:39,970 --> 00:27:43,510 або ўзяць апошнюю радок кода, і гэта будзе тое, што ён вярнуўся. 474 00:27:43,510 --> 00:27:46,920 Дык вось, гэта ж рэч, як рабіць зваротны х. 475 00:27:46,920 --> 00:27:49,450 476 00:27:49,450 --> 00:27:50,540 >> І проста каб паказаць вам. 477 00:27:50,540 --> 00:27:54,000 478 00:27:54,000 --> 00:27:57,052 І потым, ён будзе працаваць менавіта так. 479 00:27:57,052 --> 00:27:58,260 Такім чынам, дазвольце мне працягнуць з гэтым. 480 00:27:58,260 --> 00:28:00,630 >> Так яшчэ, калі. 481 00:28:00,630 --> 00:28:04,060 І на самай справе, я магу вярнуцца усё, што я хацеў бы. 482 00:28:04,060 --> 00:28:06,680 Так што я нават не прыйдзецца Зваротныя Лагічныя ўвесь час, 483 00:28:06,680 --> 00:28:08,410 Я магу проста вярнуць што-нешта іншае. 484 00:28:08,410 --> 00:28:10,670 Так што я магу зрабіць зваротны мядзведзя. 485 00:28:10,670 --> 00:28:12,989 >> Так што, калі х роўны роўна, гэта збіраецца вярнуцца мядзведзя. 486 00:28:12,989 --> 00:28:14,530 У адваротным выпадку, гэта будзе вярнуць TRUE. 487 00:28:14,530 --> 00:28:19,310 Я таксама магу зрабіць вектар ці сапраўды што-небудзь. 488 00:28:19,310 --> 00:28:22,210 >> І звычайна ў статычна тыпізаваных мовах, 489 00:28:22,210 --> 00:28:23,840 вы павінны пазначыць тып тут. 490 00:28:23,840 --> 00:28:25,750 І заўважце, што гэта можа быць проста што-небудзь. 491 00:28:25,750 --> 00:28:32,400 І R досыць разумны, што ён проста гэта зрабіць, і яна будзе выдатна працаваць. 492 00:28:32,400 --> 00:28:33,620 >> Такім чынам, дазвольце мне вызначыць гэта. 493 00:28:33,620 --> 00:28:39,460 494 00:28:39,460 --> 00:28:41,230 Unexpected-- эх шкада. 495 00:28:41,230 --> 00:28:44,336 Яна павінна быць фігурная дужка тут. 496 00:28:44,336 --> 00:28:44,836 ОК. 497 00:28:44,836 --> 00:28:45,336 Крута. 498 00:28:45,336 --> 00:28:52,580 499 00:28:52,580 --> 00:28:54,530 Добра. 500 00:28:54,530 --> 00:28:58,250 Так што цяпер давайце параўнаем 3 і роўная 3. 501 00:28:58,250 --> 00:29:01,860 Так яно і павінна return-- yeah-- значэнне мядзведзя. 502 00:29:01,860 --> 00:29:06,740 >> Так што цяпер больш агульны Справа ў тым, як як наконт іншых структур дадзеных. 503 00:29:06,740 --> 00:29:09,110 Так што вы павінны гэтую функцыю. 504 00:29:09,110 --> 00:29:15,360 Гэта будзе працаваць на які-небудзь кошту, як 3 ці любую лічбавую, 505 00:29:15,360 --> 00:29:17,500 Іншымі словамі, у два разы. 506 00:29:17,500 --> 00:29:19,330 >> Але тое, што пра што-то, як вектара. 507 00:29:19,330 --> 00:29:27,750 Так што ж адбываецца, калі вы do-- таму я збіраецца прызначыць Вал, скажам, ад 4 да 6. 508 00:29:27,750 --> 00:29:31,640 Так што, калі я вярнуся гэта, гэта з'яўляецца вектарам з 4, 5, 6. 509 00:29:31,640 --> 00:29:34,935 >> Зараз давайце паглядзім, што адбываецца калі я bounded.compare Вал. 510 00:29:34,935 --> 00:29:37,680 511 00:29:37,680 --> 00:29:42,450 Так што гэта будзе даваць вам 15 1251. 512 00:29:42,450 --> 00:29:46,440 Такім чынам, іншымі словамі, гэта кажа калі вы паглядзіце на гэтага ўмовы 513 00:29:46,440 --> 00:29:50,040 так ён кажа х менш чым або чагосьці. 514 00:29:50,040 --> 00:29:51,880 Так што гэта крыху у зман, паколькі ў цяперашні час 515 00:29:51,880 --> 00:29:53,379 вы проста не ведаеце, што адбываецца. 516 00:29:53,379 --> 00:29:58,690 Так што я думаю, адна рэч, якая сапраўды добра аб проста спрабую адладжваць 517 00:29:58,690 --> 00:30:04,600 з'яўляецца тое, што вы можаце проста зрабіць Val больш чым і паглядзець, што там адбываецца. 518 00:30:04,600 --> 00:30:09,720 >> Так val-- па змаўчанні 5 так давайце проста Валь больш, чым 5. 519 00:30:09,720 --> 00:30:14,280 Так што гэта вектар ХЛУСНЯ ХЛУСНЯ ПРАЎДА. 520 00:30:14,280 --> 00:30:17,206 Так што цяпер, калі вы глядзіце на гэта, скажа, калі, 521 00:30:17,206 --> 00:30:20,080 а затым ён збіраецца даць вам гэта з'яўляецца вектар ілжывых ілжывых TRUE. 522 00:30:20,080 --> 00:30:23,450 >> Таму, калі вы праходзіце гэта ў R, R не мае ні найменшага падання, што вы робіце. 523 00:30:23,450 --> 00:30:26,650 Таму што ён чакае адзін сінгл значэнне, якое з'яўляецца лагічным, а цяпер 524 00:30:26,650 --> 00:30:29,420 Вы даеце яму вектар лагічных значэнняў. 525 00:30:29,420 --> 00:30:31,970 Таму па змаўчанні R проста хачу сказаць, што, чорт вазьмі, 526 00:30:31,970 --> 00:30:35,440 Я буду лічыць, што вы збіраецца ўзяць першы элемент тут. 527 00:30:35,440 --> 00:30:38,320 Так што я збіраюся say-- я збіраюся выказаць здагадку, што гэта няправільна. 528 00:30:38,320 --> 00:30:40,890 Так што збіраецца сказаць Не, гэта не правільна. 529 00:30:40,890 --> 00:30:45,246 >> Акрамя таго, ён збіраецца быць Val роўная роўная. 530 00:30:45,246 --> 00:30:47,244 Не, прабачце 5. 531 00:30:47,244 --> 00:30:48,910 І гэта таксама будзе ілжывым, а таксама. 532 00:30:48,910 --> 00:30:52,410 Так што скажа няма, Гэта не праўда, а таму 533 00:30:52,410 --> 00:30:53,680 збіраецца вярнуць гэтую апошнюю. 534 00:30:53,680 --> 00:30:56,420 535 00:30:56,420 --> 00:31:01,360 >> Так гэта ці добра ці дрэнна што, у залежнасці ад таго, як вы яго прагляду. 536 00:31:01,360 --> 00:31:05,104 Таму што, калі вы стварэння гэтых функцый, 537 00:31:05,104 --> 00:31:06,770 Вы на самой справе не ведаю, што адбываецца. 538 00:31:06,770 --> 00:31:10,210 Так што часам вы хацелі б памылку, ці, можа быць, вы проста хочаце папярэджанне. 539 00:31:10,210 --> 00:31:12,160 У гэтым выпадку, R не рабіць. 540 00:31:12,160 --> 00:31:14,300 Так што гэта сапраўды да Вы заснаваныя ад таго, што 541 00:31:14,300 --> 00:31:17,310 Вы думаеце, што мова павінен рабіць у гэтым выпадку 542 00:31:17,310 --> 00:31:22,920 калі вы праходзіце ў вектары Booleans калі вы робіце, калі ўмовы. 543 00:31:22,920 --> 00:31:31,733 >> Такім чынам, давайце казаць, што ў вас арыгінал адзін з тым, калі яшчэ вяртае ісціну, і вы 544 00:31:31,733 --> 00:31:34,190 збіраецца вярнуцца FALSE. 545 00:31:34,190 --> 00:31:39,300 Так адзін з спосабаў абстрагавання гэта сказаць, што я 546 00:31:39,300 --> 00:31:41,530 нават не трэба гэтую ўмоўную рэч. 547 00:31:41,530 --> 00:31:47,220 Іншая справа, што я магу зрабіць, гэта проста вяртанне самі значэння. 548 00:31:47,220 --> 00:31:53,240 Так што, калі вы заўважылі, калі вы Do Val больш, чым 5, 549 00:31:53,240 --> 00:31:56,350 гэта збіраецца вярнуцца вектар ХЛУСНЯ ХЛУСНЯ ПРАЎДА. 550 00:31:56,350 --> 00:31:58,850 >> Можа быць, гэта тое, што вы хачу на bounded.compare. 551 00:31:58,850 --> 00:32:02,940 Вы хочаце, каб вярнуцца вектар лагічных значэнняў, дзе ён параўноўвае кожнае з значэнняў 552 00:32:02,940 --> 00:32:04,190 да сябе. 553 00:32:04,190 --> 00:32:11,165 Такім чынам, вы можаце проста bounded.compare функцыя х, роўная 5. 554 00:32:11,165 --> 00:32:13,322 555 00:32:13,322 --> 00:32:15,363 І тады замест таго, каб рабіць гэта, калі яшчэ ўмова, 556 00:32:15,363 --> 00:32:21,430 Я проста хачу, каб вярнуцца х больш за 5. 557 00:32:21,430 --> 00:32:23,620 Так што, калі гэта праўда, то гэта збіраецца вяртацца TRUE. 558 00:32:23,620 --> 00:32:26,830 І потым, калі гэта не так, гэта збіраецца вярнуцца FALSE. 559 00:32:26,830 --> 00:32:30,880 >> І гэта будзе працаваць для любы з гэтых структур. 560 00:32:30,880 --> 00:32:41,450 Так што я магу bounded.compare з 1 6 або 9 і тады я буду казаць роўная 6, 561 00:32:41,450 --> 00:32:42,799 напрыклад. 562 00:32:42,799 --> 00:32:44,840 І тады гэта будзе даць вам права Boolean 563 00:32:44,840 --> 00:32:48,240 вектар, вы распрацоўваеце. 564 00:32:48,240 --> 00:32:50,660 >> Так што тыя проста функцыі і цяпер мне проста 565 00:32:50,660 --> 00:32:54,980 паказаць вам некаторыя інтэрактыўныя візуальныя эфекты. 566 00:32:54,980 --> 00:32:59,700 Я не думаю, што я на самой справе ёсць Wi-Fi тут, так што дазвольце мне ісці наперад 567 00:32:59,700 --> 00:33:01,970 і прапусціць гэты я думаю. 568 00:33:01,970 --> 00:33:05,260 >> Але адна рэч, якая крута хоць тое, што, калі вы проста 569 00:33:05,260 --> 00:33:09,600 хочаце праверыць кучу розныя каманды дадзеных, 570 00:33:09,600 --> 00:33:13,320 ёсць куча розных набораў дадзеных якія ўжо папярэдне загружаюцца ў R. 571 00:33:13,320 --> 00:33:15,770 Такім чынам, адна з іх называецца набор дадзеных касач. 572 00:33:15,770 --> 00:33:18,910 Гэта адна з найбольш добра вядомых тыя, у машынным навучанні. 573 00:33:18,910 --> 00:33:23,350 Вы, як правіла, толькі рабіць нейкія тэстаў, каб убачыць, калі ваш код працуе. 574 00:33:23,350 --> 00:33:27,520 Так што давайце проста праверыць, што вясёлкавая абалонка. 575 00:33:27,520 --> 00:33:33,130 >> Так што гэта справа будзе быць кадр дадзеных. 576 00:33:33,130 --> 00:33:36,000 І гэта свайго роду доўга, таму што Я проста раздрукаваць дыяфрагмы. 577 00:33:36,000 --> 00:33:38,810 Гэта Раздрукаваўшы ўсю рэч. 578 00:33:38,810 --> 00:33:42,830 Так што ёсць усе гэтыя розныя назвы. 579 00:33:42,830 --> 00:33:45,505 Так дыяфрагмы калекцыя розных кветак. 580 00:33:45,505 --> 00:33:48,830 У гэтым выпадку, гэта кажа Вы выгляд з яго, 581 00:33:48,830 --> 00:33:54,760 усе гэтыя рознай шырыні і Даўжыні чашалісцікаў і пялёсткаў. 582 00:33:54,760 --> 00:33:58,880 >> І так нармальна, калі Вы хочаце, каб раздрукаваць дыяфрагмы, 583 00:33:58,880 --> 00:34:03,680 Напрыклад, вы не хочаце, каб ён рабіць усё гэта, таму што гэта можа ўзяць на сябе 584 00:34:03,680 --> 00:34:05,190 Уся ваша кансоль. 585 00:34:05,190 --> 00:34:09,280 Такім чынам, адна рэч, якая сапраўды прыемна, функцыя кіраўнік. 586 00:34:09,280 --> 00:34:12,929 Так што, калі вы проста робіце галаву касач, гэта дасць вам 587 00:34:12,929 --> 00:34:17,389 Першыя пяць радкоў, ці шэсць гадоў, я думаю. 588 00:34:17,389 --> 00:34:19,909 І тады добра, вы можна проста паказаць тут. 589 00:34:19,909 --> 00:34:22,914 Так 20-- гэта дасць Вы першыя 20 радкоў. 590 00:34:22,914 --> 00:34:24,830 І я на самой справе быў добры здзіўлены, што гэта 591 00:34:24,830 --> 00:34:28,770 даў мне шэсць, таму дазвольце мне ісці наперад і праверце iris-- або галаву, прабачце. 592 00:34:28,770 --> 00:34:31,699 593 00:34:31,699 --> 00:34:34,960 І вось ён дасць Вы дакументацыя 594 00:34:34,960 --> 00:34:37,960 што значэнне кіраўнік робіць. 595 00:34:37,960 --> 00:34:40,839 Так яна вяртае першы ці апошні з аб'екта. 596 00:34:40,839 --> 00:34:42,630 А потым я збіраюся паглядзець на значэнні па змаўчанні. 597 00:34:42,630 --> 00:34:47,340 І тады ён размаўляе па змаўчанні Метад кіраўнік х і н роўная 6L. 598 00:34:47,340 --> 00:34:50,620 Так што гэта вяртае першыя шэсць элементаў. 599 00:34:50,620 --> 00:34:55,050 І сапраўды гэтак жа, калі вы заўважылі тут, я ня трэба паказваць N роўна 6. 600 00:34:55,050 --> 00:34:56,840 Па змаўчанні ён выкарыстоўвае шэсць, я думаю. 601 00:34:56,840 --> 00:35:00,130 І потым, калі я хачу, каб паказаць упэўнены, значэнне, то я магу паглядзець, што добра. 602 00:35:00,130 --> 00:35:02,970 603 00:35:02,970 --> 00:35:10,592 >> Так што некалькі простых каманд і вось яшчэ адзін гэта просто-- добра, 604 00:35:10,592 --> 00:35:12,550 Я can-- гэта на самай справе крыху больш складана, 605 00:35:12,550 --> 00:35:17,130 але гэта будзе проста ўзяць клас кожнага слупка вясёлкавай абалонкі дадзеных. 606 00:35:17,130 --> 00:35:20,910 Так што гэта будзе паказаць вам, што кожны з іх калонкі з пункту гледжання іх тыпаў. 607 00:35:20,910 --> 00:35:23,665 Так чашелистник даўжыня лічбавай, чашелистник шырыня з'яўляецца лікавы. 608 00:35:23,665 --> 00:35:26,540 Усе гэтыя значэння з'яўляюцца толькі лікавым таму што вы можаце сказаць па гэтых дадзеных 609 00:35:26,540 --> 00:35:29,440 структураваць гэтыя ўсе збіраемся лікавы. 610 00:35:29,440 --> 00:35:34,310 >> І калона Віды будзе фактарам. 611 00:35:34,310 --> 00:35:37,270 Так нармальна, можна падумаць, што гэта як радок знакаў. 612 00:35:37,270 --> 00:35:48,830 Але калі вы проста робіце irisSpecies, і тады я буду рабіць галаву 5, 613 00:35:48,830 --> 00:35:51,820 і гэта будзе раздрукаваць з першых пяці значэнняў. 614 00:35:51,820 --> 00:35:54,150 >> І зьвярніце ўвагу на тое гэта ўзроўні. 615 00:35:54,150 --> 00:35:58,870 Так што гэта saying-- гэта спосаб R ў таго, катэгарыяльныя зменныя. 616 00:35:58,870 --> 00:36:03,765 Такім чынам, замест таго, каб проста маючы знакавых радкоў, 617 00:36:03,765 --> 00:36:06,740 яна мае Настройка узроўняў якія з гэтых рэчаў. 618 00:36:06,740 --> 00:36:12,450 >> Такім чынам, давайце казаць irisSpecies 1. 619 00:36:12,450 --> 00:36:17,690 Так што вы хочаце зрабіць тут я падмноства ў гэтай калонцы відаў. 620 00:36:17,690 --> 00:36:21,480 Так гэта адбываецца Калонка выгляду і затым 621 00:36:21,480 --> 00:36:23,820 ён індэксуе, каб атрымаць першы элемент. 622 00:36:23,820 --> 00:36:27,140 Так што гэта павінна даць вам setosa. 623 00:36:27,140 --> 00:36:28,710 І гэта таксама дае вам ўзровень тут. 624 00:36:28,710 --> 00:36:32,812 >> Такім чынам, вы можаце таксама параўнаць гэта да setosa сімвалаў 625 00:36:32,812 --> 00:36:34,645 і гэта не будзе праўда, таму што адзін 626 00:36:34,645 --> 00:36:37,940 гэта іншага тыпу, чым іншыя. 627 00:36:37,940 --> 00:36:40,590 Ці я мяркую, што гэта праўда, таму што R разумнейшы, чым гэта. 628 00:36:40,590 --> 00:36:45,420 І ён глядзіць на гэта, а затым кажа, можа быць, гэта тое, што вы хочаце. 629 00:36:45,420 --> 00:36:51,860 Так што скажа характар Радок setosa з'яўляецца такой жа, як гэты. 630 00:36:51,860 --> 00:37:01,290 А потым гэтак жа, вы можаце таксама проста захапіць гэтыя як так далей. 631 00:37:01,290 --> 00:37:05,580 >> Так што гэта проста нейкае хуткіх каманд, набору дадзеных. 632 00:37:05,580 --> 00:37:08,030 Дык вось некаторыя даследаванні дадзеных. 633 00:37:08,030 --> 00:37:11,360 Так што гэта крыху больш, ўдзельнічае ў аналізе дадзеных. 634 00:37:11,360 --> 00:37:18,340 І гэта бярэцца з некаторых Bootcamp ў R для ў Берклі. 635 00:37:18,340 --> 00:37:20,790 >> Так бібліятэка замежнай. 636 00:37:20,790 --> 00:37:24,880 Так што я збіраюся загрузіць у бібліятэка, якая называецца вонкавай. 637 00:37:24,880 --> 00:37:32,460 Так што гэта дасць мне read.dta таму выкажам здагадку, што ў мяне ёсць гэты набор дадзеных. 638 00:37:32,460 --> 00:37:39,000 Гэта захоўваецца ў цяперашні час Працоўны каталог маёй кансолі. 639 00:37:39,000 --> 00:37:42,190 Такім чынам, давайце паглядзім, што працоўны каталог. 640 00:37:42,190 --> 00:37:44,620 >> Такім чынам, вось мой працоўны каталог. 641 00:37:44,620 --> 00:37:50,040 І чытаць кропкавыя дадзеныя, гэта рэч, кажа гэты файл 642 00:37:50,040 --> 00:37:54,650 знаходзіцца ў тэчцы дадзеных гэта бягучы працоўны каталог. 643 00:37:54,650 --> 00:38:00,520 І read.dta гэта не Каманда па змаўчанні. 644 00:38:00,520 --> 00:38:02,760 Я мяркую, што я загрузіў яго ва ўжо. 645 00:38:02,760 --> 00:38:04,750 IEI выказаў здагадку, што я нагружаная ва ўжо. 646 00:38:04,750 --> 00:38:08,115 >> Але так read.dta не збіраецца быць каманда па змаўчанні. 647 00:38:08,115 --> 00:38:11,550 І вось чаму вы будзеце мець для загрузкі ў гэтай бібліятэцы package-- 648 00:38:11,550 --> 00:38:14,500 Гэты пакет называецца вонкавай. 649 00:38:14,500 --> 00:38:16,690 І калі ў вас няма Пакет, я думаю, 650 00:38:16,690 --> 00:38:19,180 знешняя з'яўляецца адным з убудаваных у іх. 651 00:38:19,180 --> 00:38:31,150 У адваротным выпадку, вы можаце таксама зрабіць install.packages 652 00:38:31,150 --> 00:38:33,180 і гэта будзе ўсталяваць пакет. 653 00:38:33,180 --> 00:38:36,878 І гэта дасць вам Р. Э-э, няма. 654 00:38:36,878 --> 00:38:39,830 655 00:38:39,830 --> 00:38:43,140 А потым я проста хачу, каб спыніць Гэта таму, што я ўжо ёсць. 656 00:38:43,140 --> 00:38:46,920 >> Але тое, што сапраўды добра пра R з'яўляецца тое, што кіраванне пакетамі 657 00:38:46,920 --> 00:38:48,510 Сістэма вельмі элегантна. 658 00:38:48,510 --> 00:38:52,470 Таму што гэта будзе захоўваць усе сапраўды добра для вас. 659 00:38:52,470 --> 00:38:59,780 Такім чынам, у гэтым выпадку, гэта будзе для захоўвання гэта, я лічу, гэтая бібліятэка тут. 660 00:38:59,780 --> 00:39:02,390 >> Так у любы час вы хочаце ўсталяваць новыя пакеты, 661 00:39:02,390 --> 00:39:04,980 гэта так жа проста, як рабіць install.packages 662 00:39:04,980 --> 00:39:07,500 і R абыйдзецца ўсяго пакеты для вас. 663 00:39:07,500 --> 00:39:12,900 Такім чынам, вы не павінны рабіць што-то ў Python, дзе ў вас маецца знешні пакет 664 00:39:12,900 --> 00:39:15,330 менеджэры як папера Anaconda, дзе вы 665 00:39:15,330 --> 00:39:18,310 doing-- ўстаноўкі пакеты па-за Python 666 00:39:18,310 --> 00:39:20,940 а затым паспрабуйце запусціць іх самастойна. 667 00:39:20,940 --> 00:39:22,210 Так што гэта сапраўды добры спосаб. 668 00:39:22,210 --> 00:39:25,590 >> І install.packages патрабуецца доступ у Інтэрнэт. 669 00:39:25,590 --> 00:39:31,950 Яна прымае ад сервера і сховішча, у якім 670 00:39:31,950 --> 00:39:33,960 збірае ўсе пакеты, называецца кран. 671 00:39:33,960 --> 00:39:40,690 І вы можаце вызначыць, які выгляд люстэрка Вы хочаце, каб загрузіць пакеты. 672 00:39:40,690 --> 00:39:43,420 >> Дык вось, я бяру гэты набор дадзеных. 673 00:39:43,420 --> 00:39:46,240 Я чытаю яго пры дапамозе гэтай функцыі. 674 00:39:46,240 --> 00:39:49,360 Такім чынам, дазвольце мне ісці наперад і рабіць гэта. 675 00:39:49,360 --> 00:39:52,900 >> Такім чынам, давайце выкажам здагадку, што ў вас ёсць гэты набор дадзеных 676 00:39:52,900 --> 00:39:55,550 і ў вас ёсць абсалютна Не ведаю, што гэта такое. 677 00:39:55,550 --> 00:39:58,560 І гэта на самай справе адбываецца да даволі часта ў прамысловасці 678 00:39:58,560 --> 00:40:00,910 дзе вы проста павінны гэта тоны і тоны бруднай рэчы 679 00:40:00,910 --> 00:40:02,890 і яны неверагодна немеченых. 680 00:40:02,890 --> 00:40:06,380 Дык вось у мяне ёсць гэта набор дадзеных, і я не ведаю, 681 00:40:06,380 --> 00:40:08,400 што гэта такое, так што я проста паказваючы, каб праверыць яго. 682 00:40:08,400 --> 00:40:10,620 >> Так што я збіраюся зрабіць з галавой. 683 00:40:10,620 --> 00:40:14,190 Так што я праверыць першыя шэсць калоны, што гэта набор дадзеных. 684 00:40:14,190 --> 00:40:21,730 Так што гэта дзяржава, pres04, а затым Усе гэтыя розныя роду слупкоў. 685 00:40:21,730 --> 00:40:25,612 І што цікава, тут, я думаю, з'яўляецца тое, што вам 686 00:40:25,612 --> 00:40:27,945 было б выказаць здагадку, што гэта выглядае як свайго роду выбараў. 687 00:40:27,945 --> 00:40:30,482 688 00:40:30,482 --> 00:40:32,190 І я думаю, толькі з гледзячы на ​​файл 689 00:40:32,190 --> 00:40:41,070 назваць гэта нейкі калекцыі даных аб кандыдатах або выбаршчыкаў 690 00:40:41,070 --> 00:40:44,920 хто галасаваў за канкрэтных прэзідэнтаў ці прэзыдэнта кандыдаты 691 00:40:44,920 --> 00:40:46,550 для абрання ў 2004 годзе. 692 00:40:46,550 --> 00:40:52,920 >> Дык вось значэння 1, 2 так адзін спосаб захоўвання 693 00:40:52,920 --> 00:40:56,540 кандыдаты прэзідэнт іх імёны. 694 00:40:56,540 --> 00:40:59,780 У гэтым выпадку, падобна, яны проста цэлыя значэння. 695 00:40:59,780 --> 00:41:04,030 Так 2004 годзе ён быў Буш у параўнанні з Кэры я веру. 696 00:41:04,030 --> 00:41:09,010 А цяпер, выкажам здагадку, што вы проста не ведаеце, Ці 1 адпавядае Буша або 2 697 00:41:09,010 --> 00:41:11,703 адпавядае Кэры або і гэтак далей, і гэтак далей, ці не так? 698 00:41:11,703 --> 00:41:15,860 >> І гэта, толькі мне, даволі распаўсюджаная праблема. 699 00:41:15,860 --> 00:41:18,230 Так што вы можаце рабіць у дадзеным выпадку? 700 00:41:18,230 --> 00:41:20,000 Так давайце праверым усе гэтыя іншыя рэчы. 701 00:41:20,000 --> 00:41:22,790 >> стан, я мяркую, што гэта прыходзіць з розных дзяржаў. 702 00:41:22,790 --> 00:41:25,100 partyid, даход. 703 00:41:25,100 --> 00:41:27,710 Давайце паглядзім на partyid. 704 00:41:27,710 --> 00:41:32,800 Так, можа быць, адна рэч, вы можаце зрабіць гэта разгледзім кожны з назіранняў 705 00:41:32,800 --> 00:41:36,250 якія маюць partyid рэспубліканскага або дэмакрат ці нешта. 706 00:41:36,250 --> 00:41:38,170 Так што давайце проста паглядзім на тое, што partyid ёсць. 707 00:41:38,170 --> 00:41:41,946 >> Так што я збіраюся ўзяць DAT, а затым я іду 708 00:41:41,946 --> 00:41:47,960 зрабіць гэта знак даляра аператар, што я зрабіў раней 709 00:41:47,960 --> 00:41:50,770 і гэта будзе падмноства ў гэтым слупку. 710 00:41:50,770 --> 00:41:57,760 А потым я збіраюся ўзначаліць гэта 20, проста каб паглядзець, як гэта выглядае. 711 00:41:57,760 --> 00:42:00,170 >> Так што гэта проста куча NAS. 712 00:42:00,170 --> 00:42:02,800 Такім чынам, іншымі словамі, у вас ёсць адсутнічаюць дадзеныя аб гэтых хлопцаў. 713 00:42:02,800 --> 00:42:08,100 Але вы таксама заўважыце, гэта DAT partyid з'яўляецца фактарам 714 00:42:08,100 --> 00:42:10,030 так што гэта дае вам розныя катэгорыі. 715 00:42:10,030 --> 00:42:14,170 Такім чынам, іншымі словамі, partyid можа заняць Дэмакрат, рэспубліканец, Незалежная, 716 00:42:14,170 --> 00:42:16,640 ці нешта яшчэ. 717 00:42:16,640 --> 00:42:23,940 >> Так што давайце ісці наперад і давайце даведацца, якія з іх is-- О, добра. 718 00:42:23,940 --> 00:42:28,480 Так што я збіраюся падмноства у partyid, а затым 719 00:42:28,480 --> 00:42:32,780 паглядзець на тыя, якія з'яўляюцца Дэмакрат, напрыклад. 720 00:42:32,780 --> 00:42:37,150 Гэта будзе даваць вам лагічны, Велізарны Boolean ісцін і FALSEs. 721 00:42:37,150 --> 00:42:41,630 >> А цяпер, давайце казаць, што я хачу падмноствам з гэтымі хлопцамі. 722 00:42:41,630 --> 00:42:47,260 Так што гэта збіраюся прыняць мае DAT і падмноства да якога б назірання 723 00:42:47,260 --> 00:42:48,910 ёсць partyid роўных роўна дэмакрат. 724 00:42:48,910 --> 00:42:52,830 725 00:42:52,830 --> 00:42:55,180 І гэта даволі доўга, таму што ёсць так многія з іх. 726 00:42:55,180 --> 00:42:59,060 Так што цяпер, я збіраюся ўзначаліць гэта ў 20. 727 00:42:59,060 --> 00:43:05,690 728 00:43:05,690 --> 00:43:11,270 >> І, як вы заўважылі, прымаецца роўным роўных Цікава, што вы 729 00:43:11,270 --> 00:43:13,250 already-- вы таксама уключаючы NAS. 730 00:43:13,250 --> 00:43:19,010 Такім чынам, у гэтым выпадку, вы ўсё роўна не можаце атрымаць любая інфармацыя, таму што зараз у вас ёсць NAS 731 00:43:19,010 --> 00:43:22,650 і вы проста хочаце, каб убачыць, якія з назіранне адпавядаюць дэмакрат 732 00:43:22,650 --> 00:43:24,670 а не гэтыя адсутнічаюць сябе шануе. 733 00:43:24,670 --> 00:43:27,680 Так як жа пазбавіцца ад гэтых ВПЛ? 734 00:43:27,680 --> 00:43:36,410 >> Дык вось я толькі з дапамогай клавішу уверх на маім курсора, а затым кажуць перасоўвацца. 735 00:43:36,410 --> 00:43:39,778 А потым вось я проста хачу, сказаць is.na datpartyid. 736 00:43:39,778 --> 00:43:48,970 737 00:43:48,970 --> 00:43:52,720 Так гэта і і будзе прымаць два розныя Булевы вектары 738 00:43:52,720 --> 00:43:57,160 і сказаць, што гэта будзе ПРАЎДА і ХЛУСНЯ напрыклад. 739 00:43:57,160 --> 00:43:59,190 Так што будзе рабіць гэты кампанент Мудры. 740 00:43:59,190 --> 00:44:02,910 Дык вось я і кажу ўзяцце кадр дадзеных, падмноства 741 00:44:02,910 --> 00:44:10,170 на тыя, якія адпавядаюць дэмакрат, і выдаліць любы з іх, якія не з'яўляюцца NA. 742 00:44:10,170 --> 00:44:13,540 >> Так што гэта will-- павінны даць вам нешта. 743 00:44:13,540 --> 00:44:16,540 744 00:44:16,540 --> 00:44:17,600 Давайце паглядзім, is.na. 745 00:44:17,600 --> 00:44:24,670 746 00:44:24,670 --> 00:44:27,690 Давайце паспрабуем is.na datpartyid. 747 00:44:27,690 --> 00:44:36,290 748 00:44:36,290 --> 00:44:45,290 І гэта павінна даць you-- sorry-- толькі лагічны вектар. 749 00:44:45,290 --> 00:44:49,260 І потым, таму што гэта так доўга, Я збіраюся падмноства да 20. 750 00:44:49,260 --> 00:44:49,760 ОК. 751 00:44:49,760 --> 00:44:51,570 Так што гэта павінна працаваць. 752 00:44:51,570 --> 00:44:54,700 >> І на гэты раз таксама будзе ісцін. 753 00:44:54,700 --> 00:45:01,830 Ах, так мая памылка ў тым, што I'm-- Я выкарыстоўваць C ++ і R ўзаемазаменныя, так што я зрабіць 754 00:45:01,830 --> 00:45:03,590 гэтая памылка ўвесь час. 755 00:45:03,590 --> 00:45:05,807 І аператар на самай справе той, які вы хочаце. 756 00:45:05,807 --> 00:45:08,140 Вы ж не хочаце, каб выкарыстоўваць два Ампэрсанд, проста адзін. 757 00:45:08,140 --> 00:45:14,970 758 00:45:14,970 --> 00:45:17,010 ОК. 759 00:45:17,010 --> 00:45:18,140 >> Такім чынам, давайце паглядзім. 760 00:45:18,140 --> 00:45:20,930 761 00:45:20,930 --> 00:45:23,920 Такім чынам, мы subsetted ў partyid, дзе яны дэмакрат 762 00:45:23,920 --> 00:45:25,300 і яны не хапае значэнняў. 763 00:45:25,300 --> 00:45:27,690 А цяпер давайце паглядзім на якія яны галасавалі. 764 00:45:27,690 --> 00:45:31,530 Так што, падобна, як і большасць з іх прагаласавалі за 1. 765 00:45:31,530 --> 00:45:36,090 Так што я збіраюся ісці наперад і сказаць, што Кэры. 766 00:45:36,090 --> 00:45:39,507 >> І сапраўды гэтак жа, вы можаце таксама пайсці ў Рэспубліканскі 767 00:45:39,507 --> 00:45:41,090 і, спадзяюся, гэта павінна даць вам 2. 768 00:45:41,090 --> 00:45:49,730 769 00:45:49,730 --> 00:45:51,770 Гэта проста куча розных калонках. 770 00:45:51,770 --> 00:45:53,070 І на самай справе, гэта 2. 771 00:45:53,070 --> 00:45:55,750 Так partyid ўсіх рэспубліканскіх, большасць з іх галасуюць за 2. 772 00:45:55,750 --> 00:45:58,390 >> Так што падобна, проста гледзячы на ​​гэта, 773 00:45:58,390 --> 00:46:00,600 Рэспубліканскі будзе very-- або partyid 774 00:46:00,600 --> 00:46:02,790 будзе вельмі важным фактарам у вызначэнні 775 00:46:02,790 --> 00:46:05,420 які кандыдат яны збіраецца галасаваць. 776 00:46:05,420 --> 00:46:07,120 І гэта, відавочна, дакладна ў цэлым. 777 00:46:07,120 --> 00:46:10,139 І гэта адпавядае вашаму інтуіцыя, вядома. 778 00:46:10,139 --> 00:46:11,930 Так што, падобна, як быццам я не хапае часу, каб 779 00:46:11,930 --> 00:46:17,040 дазвольце мне ісці наперад і паказаць некалькі хуткіх здымкаў. 780 00:46:17,040 --> 00:46:21,120 Дык вось тое, што гэта крыху Чым складаней з візуалізацыяй. 781 00:46:21,120 --> 00:46:26,450 Такім чынам, у гэтым выпадку, гэта вельмі Просты аналіз проста праверка, што 782 00:46:26,450 --> 00:46:28,500 Прэзідэнт '04 ёсць. 783 00:46:28,500 --> 00:46:33,920 >> Такім чынам, у гэтым выпадку, дапусцім, што вы хацеў адказаць на гэтае пытанне. 784 00:46:33,920 --> 00:46:38,540 Таму выкажам здагадку, што мы хацелі ведаць галасавання паводзіны ў 2004 выбараў прэзідэнта 785 00:46:38,540 --> 00:46:41,170 і як гэта залежыць ад расы. 786 00:46:41,170 --> 00:46:44,380 Так што не толькі вы хочаце паглядзець паводзіны галасавання, 787 00:46:44,380 --> 00:46:47,860 але вы хочаце, каб падмноства сябар расы і роду рэзюмаваць, што. 788 00:46:47,860 --> 00:46:50,770 І можна толькі сказаць, гэтай комплекснай запісу 789 00:46:50,770 --> 00:46:52,580 што гэта свайго роду атрымання туманнымі. 790 00:46:52,580 --> 00:46:56,390 >> Такім чынам, адзін з больш прасунутых R пакеты, якія таксама выгляд нядаўняе 791 00:46:56,390 --> 00:47:00,070 называецца dplyr. 792 00:47:00,070 --> 00:47:03,060 Так што гэта прама тут. 793 00:47:03,060 --> 00:47:08,080 І ggg-- ggplot2 проста прыемна спосаб зрабіць лепш візуалізацыі 794 00:47:08,080 --> 00:47:09,400 чым убудаваная ў адным. 795 00:47:09,400 --> 00:47:11,108 >> Так што я збіраюся загрузіць Гэтыя дзве бібліятэкі. 796 00:47:11,108 --> 00:47:13,200 797 00:47:13,200 --> 00:47:16,950 І потым, я збіраюся пайсці наперад і запусціце наступную каманду. 798 00:47:16,950 --> 00:47:19,050 Вы можаце разглядаць гэта як чорны скрыню. 799 00:47:19,050 --> 00:47:23,460 >> Што адбываецца, што гэтую трубу Аператар праходзіць у гэтай спрэчцы 800 00:47:23,460 --> 00:47:24,110 у тут. 801 00:47:24,110 --> 00:47:28,070 Так што я кажу, групу, DAT Гонка, а затым прэзідэнтам 04. 802 00:47:28,070 --> 00:47:31,530 І потым, усе гэтыя іншыя каманды фільтруюцца, а затым падвядзенне вынікаў 803 00:47:31,530 --> 00:47:34,081 дзе я раблю лічыльнік і то я ў змову ягоную тут. 804 00:47:34,081 --> 00:47:39,980 805 00:47:39,980 --> 00:47:42,500 ОК выдатна. 806 00:47:42,500 --> 00:47:44,620 Так што давайце ісці наперад і см, як гэта выглядае. 807 00:47:44,620 --> 00:47:52,280 808 00:47:52,280 --> 00:47:57,290 >> Так, што тут адбываецца, што я проста нанесеныя кожнай з рас, а затым 809 00:47:57,290 --> 00:47:59,670 якія яны галасавалі. 810 00:47:59,670 --> 00:48:03,492 І гэтыя два розныя значэнні адпавядаюць 2 і 1. 811 00:48:03,492 --> 00:48:05,325 Калі вы хочаце быць больш элегантны, вы таксама можаце 812 00:48:05,325 --> 00:48:11,770 проста паказаць, што 2 Kerry-- або 2 Буш, а затым 1 Кэры. 813 00:48:11,770 --> 00:48:13,700 І вы таксама можаце мець што ў сваю легенду. 814 00:48:13,700 --> 00:48:17,410 >> І вы таксама можаце падзяліць гэтыя гістаграмы. 815 00:48:17,410 --> 00:48:19,480 Таму што адна справа што, калі вы заўважылі, 816 00:48:19,480 --> 00:48:24,560 гэта не вельмі лёгка вызначыць які з гэтых двух значэнняў больш. 817 00:48:24,560 --> 00:48:27,920 Такім чынам, адна рэч, якую вы хацелі б зрабіць, гэта прыняць гэтую сінюю вобласць 818 00:48:27,920 --> 00:48:31,855 і проста перанесьці яго сюды, каб вы Можна параўнаць гэтыя два бок аб бок. 819 00:48:31,855 --> 00:48:34,480 І я думаю, што гэта тое, што я не было часу, каб зрабіць прама цяпер, 820 00:48:34,480 --> 00:48:36,660 але гэта таксама вельмі лёгка зрабіць. 821 00:48:36,660 --> 00:48:40,310 Вы можаце проста паглядзець у у чалавека старонкі ggplot. 822 00:48:40,310 --> 00:48:47,170 Такім чынам, вы можаце проста ggplot як што і чытаць у гэтым даведачнай старонцы. 823 00:48:47,170 --> 00:48:51,920 >> Так дазвольце мне хутка паказаць вам некаторыя цікавыя рэчы. 824 00:48:51,920 --> 00:48:57,610 Давайце ісці наперад і ісці to-- толькі Прымяненне машыннага навучання. 825 00:48:57,610 --> 00:49:02,450 Так што давайце, у нас ёсць гэтыя тры пакеты, так што я збіраюся загрузіць іх у. 826 00:49:02,450 --> 00:49:05,500 827 00:49:05,500 --> 00:49:09,170 Так што гэта проста выводзіць некаторыя Інфармацыя пасля таго як я загружаны ў рэчы. 828 00:49:09,170 --> 00:49:15,220 Так што я кажу гэта read.csv, Гэты набор дадзеных, і цяпер 829 00:49:15,220 --> 00:49:18,940 Я збіраюся ісці наперад і глядзець і паглядзець, што ўнутры гэтага набору дадзеных. 830 00:49:18,940 --> 00:49:22,080 >> Такім чынам, першыя 20 назіранняў. 831 00:49:22,080 --> 00:49:27,190 Так што я проста X1, X2, і Y. Такім чынам, Падобна на тое, кучай гэтых значэнняў 832 00:49:27,190 --> 00:49:31,640 якія, магчыма, у межах ад 20 да 80 або каля таго. 833 00:49:31,640 --> 00:49:37,700 А потым гэтак жа для X2, а затым Гэты Y-відаць, этыкеткі 0 і 1. 834 00:49:37,700 --> 00:49:49,500 >> Каб пераканацца ў гэтым, я магу проста рабіць зводныя дадзеныя X1. 835 00:49:49,500 --> 00:49:51,660 А потым гэтак жа для усе гэтыя іншыя слупкі. 836 00:49:51,660 --> 00:49:55,300 Так кароткае выклад хуткі спосаб проста паказваючы вам хутка значэння. 837 00:49:55,300 --> 00:49:56,330 Эх, шкада. 838 00:49:56,330 --> 00:49:58,440 Гэта трэба быць Y. 839 00:49:58,440 --> 00:50:03,420 >> Такім чынам, у гэтым выпадку, дае Квант, медыяна, вычарпаны, а таксама. 840 00:50:03,420 --> 00:50:07,130 У гэтым выпадку, dataY, вы можаце ўбачыць што гэта проста будзе 0 і 1. 841 00:50:07,130 --> 00:50:10,100 Таксама сярэдняя кажа 0,6, азначае толькі тое, што яно 842 00:50:10,100 --> 00:50:13,380 Падобна на тое, у мяне ёсць яшчэ 1с, чым 0s. 843 00:50:13,380 --> 00:50:16,160 >> Такім чынам, дазвольце мне ісці наперад і шоў Вы, як гэта выглядае. 844 00:50:16,160 --> 00:50:17,470 Так што я проста хачу, каб пабудаваць гэта. 845 00:50:17,470 --> 00:50:22,852 846 00:50:22,852 --> 00:50:24,636 Давайце паглядзім, як ачысціць гэты. 847 00:50:24,636 --> 00:50:30,492 848 00:50:30,492 --> 00:50:31,468 Аб OK. 849 00:50:31,468 --> 00:50:35,840 850 00:50:35,840 --> 00:50:36,340 ОК. 851 00:50:36,340 --> 00:50:37,590 >> Так што гэта, як ён выглядае. 852 00:50:37,590 --> 00:50:46,310 Так што падобна жоўтых Я названых 0, а затым чырвоны я паказаў у выглядзе 1. 853 00:50:46,310 --> 00:50:52,190 Дык вось, падобна, пункту пазнак і гэта 854 00:50:52,190 --> 00:50:56,410 Падобна на тое, вы проста хацелі некаторыя Сартаваць кластарызацыі па гэтым пытанні. 855 00:50:56,410 --> 00:51:01,020 >> І дазвольце мне проста ісці наперад і шоў вам некаторыя з гэтых ўбудаваных функцый. 856 00:51:01,020 --> 00:51:03,580 Дык вось лм. 857 00:51:03,580 --> 00:51:06,060 Так што гэта проста спрабуе каб адпавядаць радок да гэтага. 858 00:51:06,060 --> 00:51:08,640 Так што лепшы спосаб што я магу адпавядаць лініі такіх 859 00:51:08,640 --> 00:51:14,020 што ён будзе лепш падзяліць Гэты выгляд кластарызацыі. 860 00:51:14,020 --> 00:51:21,790 А ў ідэале, вы можаце проста паглядзець што я проста запусціць ўсе гэтыя каманды 861 00:51:21,790 --> 00:51:25,450 а затым, я збіраюся наперад і дадайце радок. 862 00:51:25,450 --> 00:51:28,970 >> Так гэта здаецца найбольш верагодная здагадка. 863 00:51:28,970 --> 00:51:34,150 Гэта займае лепшае, што зводзіць да мінімуму Памылка пры спробе, каб адпавядаць гэтай лініі. 864 00:51:34,150 --> 00:51:40,000 Відавочна, што гэта выглядае накшталт добра, але гэта не самае лепшае. 865 00:51:40,000 --> 00:51:43,130 І лінейныя мадэлі, у наогул, будзе 866 00:51:43,130 --> 00:51:46,811 сапраўды выдатна падыходзіць для тэорыі, так і толькі выгляд будаўнічых асноў машыны 867 00:51:46,811 --> 00:51:47,310 навучанне. 868 00:51:47,310 --> 00:51:50,330 Але на практыцы, вы збіраецеся хачу зрабіць што-то больш агульнае. 869 00:51:50,330 --> 00:51:54,280 >> Такім чынам, вы можаце проста паспрабаваць запусціць тое, што называецца нейронавай сеткі. 870 00:51:54,280 --> 00:51:57,110 Гэтыя рэчы большае распаўсюджванне. 871 00:51:57,110 --> 00:52:00,530 І яны проста працуюць фантастычна для вялікіх набораў дадзеных. 872 00:52:00,530 --> 00:52:07,080 Такім чынам, у гэтым выпадку, мы толькі have-- давайце see-- ў нас ёсць nrow. 873 00:52:07,080 --> 00:52:09,010 Так nrow проста кажу лік радкоў. 874 00:52:09,010 --> 00:52:11,790 Такім чынам, у гэтым выпадку, я ёсць 100 назіранняў. 875 00:52:11,790 --> 00:52:15,010 >> Такім чынам, дазвольце мне ісці наперад і зрабіць нейронных сетку. 876 00:52:15,010 --> 00:52:18,620 Так што гэта вельмі прыемна таму што я магу толькі сказаць, Nnet 877 00:52:18,620 --> 00:52:21,767 а потым я рэгрэс Y. Так Y з'яўляецца тое, што калонка. 878 00:52:21,767 --> 00:52:23,850 А потым рэгрэс яго на дзве іншыя зменныя. 879 00:52:23,850 --> 00:52:27,360 Так што гэта карацей Абазначэння X1 і X2. 880 00:52:27,360 --> 00:52:29,741 >> Так што давайце ісці наперад і запуску гэтага. 881 00:52:29,741 --> 00:52:30,240 Эх, шкада. 882 00:52:30,240 --> 00:52:32,260 Мне трэба, каб запусціць усё гэта справа. 883 00:52:32,260 --> 00:52:37,500 І гэта толькі друк абазначэння аб тым, як хутка ці не хутка яна 884 00:52:37,500 --> 00:52:38,460 сыходзіліся. 885 00:52:38,460 --> 00:52:41,420 Так гэта выглядае, як гэта было сыходзяцца. 886 00:52:41,420 --> 00:52:44,970 Такім чынам, дазвольце мне ісці наперад і друку , Што гэта выглядае. 887 00:52:44,970 --> 00:52:51,260 >> См вось карціна і тут Контур паказвае, наколькі добра яна падыходзіць. 888 00:52:51,260 --> 00:52:56,380 І гэта просто-- вы можаце ўбачыць гэта, што гэта вельмі, вельмі прыемна. 889 00:52:56,380 --> 00:52:59,400 Гэта можа быць нават перанавучання, але вы таксама можаце 890 00:52:59,400 --> 00:53:03,390 даводзіцца гэта з іншымі такія метады, як крос-праверкі. 891 00:53:03,390 --> 00:53:06,180 І гэта таксама ўбудаваныя ў R. 892 00:53:06,180 --> 00:53:09,170 >> І дазвольце мне паказаць вам, Машына апорных вектараў. 893 00:53:09,170 --> 00:53:12,470 Гэта яшчэ адзін вельмі распаўсюджаны Тэхніка ў машынным навучанні. 894 00:53:12,470 --> 00:53:18,550 Гэта вельмі падобна на лінейных мадэляў, а ён выкарыстоўвае тое, што называецца метад ядра. 895 00:53:18,550 --> 00:53:22,790 І давайце паглядзім, як добра, што робіць. 896 00:53:22,790 --> 00:53:26,430 Такім чынам, гэта адна вельмі падобная на тым а Нейронавыя сеткі выконвае, 897 00:53:26,430 --> 00:53:27,900 але гэта значна больш гладкай. 898 00:53:27,900 --> 00:53:35,740 І гэта грунтуецца з што-хаў SVMs працу. 899 00:53:35,740 --> 00:53:40,250 >> Так што гэта проста вельмі кароткі агляд некаторых 900 00:53:40,250 --> 00:53:43,822 з убудаваных функцый вы можаце зрабіць а таксама некаторыя з даследавання дадзеных. 901 00:53:43,822 --> 00:53:45,905 Такім чынам, дазвольце мне проста ісці наперад і вярнуцца да слайдамі. 902 00:53:45,905 --> 00:53:50,290 903 00:53:50,290 --> 00:53:53,670 >> Так відавочна, што гэта не вельмі ўсёабдымны характар. 904 00:53:53,670 --> 00:53:57,140 І гэта на самай справе проста тізер паказваючы вам, што вы сапраўды можаце зрабіць у R. 905 00:53:57,140 --> 00:53:59,100 Так што калі вы проста хацеў каб даведацца больш, тут 906 00:53:59,100 --> 00:54:01,210 куча розных рэсурсаў. 907 00:54:01,210 --> 00:54:06,890 >> Так што калі вы любіце падручнікаў ці вы проста люблю чытаць рэчы ў Інтэрнэце, 908 00:54:06,890 --> 00:54:09,670 то гэта фантастычны адзін Хэдлі Уикхемом, 909 00:54:09,670 --> 00:54:13,010 які таксама стварыў усё гэта сапраўды выдатна пакеты. 910 00:54:13,010 --> 00:54:17,420 Калі вы любіце відэа, то Berkeley мае выдатную буткемп 911 00:54:17,420 --> 00:54:21,060 гэта several-- гэта нейкія доўгія. 912 00:54:21,060 --> 00:54:24,210 І ён будзе вучыць вас амаль усё, што вы хацелі б ведаць аб R. 913 00:54:24,210 --> 00:54:27,770 >> І сапраўды гэтак жа, ёсць Codeacademy і ўсё гэта іншага роду 914 00:54:27,770 --> 00:54:29,414 інтэрактыўных вэб-сайтаў. 915 00:54:29,414 --> 00:54:31,580 Яны таксама атрымліваюць common-- больш і больш распаўсюджаным. 916 00:54:31,580 --> 00:54:33,749 Такім чынам, гэта вельмі падобна на Codeacademy. 917 00:54:33,749 --> 00:54:35,790 І, нарэшце, калі вы проста хочаце супольнасці і дапамагчы, 918 00:54:35,790 --> 00:54:38,800 гэта куча рэчы, якія вы можаце пайсці. 919 00:54:38,800 --> 00:54:40,880 Відавочна, што мы да гэтага часу выкарыстоўваць паштовыя рассылкі, проста 920 00:54:40,880 --> 00:54:44,860 як і амаль усе іншыя мова праграмавання супольнасці. 921 00:54:44,860 --> 00:54:47,880 І #rstats, гэта Наша супольнасць Twitter. 922 00:54:47,880 --> 00:54:49,580 Гэта на самай справе даволі распаўсюджанай з'явай. 923 00:54:49,580 --> 00:54:50,850 І тады карыстальнік! 924 00:54:50,850 --> 00:54:52,340 Гэта проста наша канферэнцыя. 925 00:54:52,340 --> 00:54:55,390 >> І тады, вядома, вы можаце выкарыстоўваць усе гэтыя іншыя Q & A рэчы, 926 00:54:55,390 --> 00:54:57,680 як перапаўненне стэка, Google, а затым GitHub. 927 00:54:57,680 --> 00:55:00,490 Паколькі большасць з гэтых пакетаў і шмат супольнасці 928 00:55:00,490 --> 00:55:03,420 будзе засяроджаная вакол распрацоўкі Код, таму што гэта з адкрытым зыходным кодам. 929 00:55:03,420 --> 00:55:05,856 І гэта вельмі-вельмі добры на GitHub. 930 00:55:05,856 --> 00:55:08,730 І, нарэшце, вы можаце звязацца са мной, калі вы проста ёсць якія-небудзь простых пытанняў. 931 00:55:08,730 --> 00:55:13,530 Такім чынам, вы можаце знайсці мяне на Twitter тут, мой сайт, і толькі мой адрас электроннай пошты. 932 00:55:13,530 --> 00:55:17,840 Так, мы спадзяемся, што было something-- толькі кароткі тізер 933 00:55:17,840 --> 00:55:20,900 чаго R сапраўды здольны. 934 00:55:20,900 --> 00:55:23,990 І мы спадзяемся, Вы проста праверыць гэтыя тры спасылкі 935 00:55:23,990 --> 00:55:25,760 і паглядзець, што можна зрабіць яшчэ больш. 936 00:55:25,760 --> 00:55:28,130 І я думаю, што гэта як раз пра гэта. 937 00:55:28,130 --> 00:55:28,630 Дзякуй. 938 00:55:28,630 --> 00:55:30,780 >> [Апладысменты] 939 00:55:30,780 --> 00:55:31,968