1 00:00:00,000 --> 00:00:00,750 2 00:00:00,750 --> 00:00:09,800 >> [MÜZİK OYUN] 3 00:00:09,800 --> 00:00:13,014 4 00:00:13,014 --> 00:00:13,680 DUSTIN TRAN: Merhaba. 5 00:00:13,680 --> 00:00:14,980 Benim adım Dustin. 6 00:00:14,980 --> 00:00:18,419 Yani sunmak olacak R Veri Analizi 7 00:00:18,419 --> 00:00:19,710 Kendim hakkında sadece biraz. 8 00:00:19,710 --> 00:00:24,320 Ben şu anda bir lisansüstü öğrencisi değilim Mühendislik ve Uygulamalı Bilimler. 9 00:00:24,320 --> 00:00:28,330 Ben bir kavşak çalışması makine öğrenme ve istatistik 10 00:00:28,330 --> 00:00:31,375 yani R Veri Analizi olduğunu gerçekten temel ne 11 00:00:31,375 --> 00:00:33,790 Ben günlük olarak yapmak. 12 00:00:33,790 --> 00:00:35,710 >> Ve R, özellikle bir veri analizi için iyi 13 00:00:35,710 --> 00:00:39,310 bu prototip için çok iyi çünkü. 14 00:00:39,310 --> 00:00:43,590 Ve genellikle, bazı tür yapıyoruz veri analizi, sorunların bir sürü 15 00:00:43,590 --> 00:00:44,920 bilişsel gidiyor. 16 00:00:44,920 --> 00:00:48,700 Ve böylece sadece istiyorum bazı gerçekten iyi bir dil olduğunu 17 00:00:48,700 --> 00:00:53,770 yapmak için sadece iyi yerleşik fonksiyonlar, aksine 18 00:00:53,770 --> 00:00:57,430 Düşük seviyeli şeyler ile uğraşmak zorunda. 19 00:00:57,430 --> 00:01:01,040 Başlangıçta Yani, ben sadece gidiyorum tanıtmak için R ne, neden ederim 20 00:01:01,040 --> 00:01:04,540 bunu kullanmak istiyorum, ve sonra bazı demo içine gitmek, 21 00:01:04,540 --> 00:01:07,060 ve sadece oradan gitmek. 22 00:01:07,060 --> 00:01:08,150 >> R ne öylesine mi? 23 00:01:08,150 --> 00:01:11,180 R, sadece bir dil geliştirilmiştir İstatistiksel hesaplama için 24 00:01:11,180 --> 00:01:12,450 ve görselleştirme. 25 00:01:12,450 --> 00:01:16,000 Peki bunun anlamı olduğunu çok mükemmel bir dil var 26 00:01:16,000 --> 00:01:22,400 ile ilgilenen bir şey herhangi bir tür için belirsizlik veya veri görselleştirme. 27 00:01:22,400 --> 00:01:24,850 Yani tüm bu var olasılık dağılımları. 28 00:01:24,850 --> 00:01:27,140 Orada olacak Yerleşik işlevleri. 29 00:01:27,140 --> 00:01:31,650 Ayrıca mükemmel olacak paketleri komplo. 30 00:01:31,650 --> 00:01:34,110 >> Python başka rakip olduğunu veri dili. 31 00:01:34,110 --> 00:01:40,020 Ve bir şey o R bulmak görselleştirme çok daha iyidir. 32 00:01:40,020 --> 00:01:45,200 Peki demo olarak görürsünüz de sadece bir çok sezgisel bir dildir 33 00:01:45,200 --> 00:01:48,050 Bu sadece son derece iyi çalışıyor. 34 00:01:48,050 --> 00:01:53,140 Sanki, ayrıca ücretsiz ve açık kaynak sanırım herhangi bir diğer iyi bir dildir. 35 00:01:53,140 --> 00:01:55,440 Sadece bir >> Ve burada, bir demet anahtar kelimeler size atılan. 36 00:01:55,440 --> 00:02:00,450 Eğer bir varsa bu anlam, dinamik var Bir nesneye atanan özel tip 37 00:02:00,450 --> 00:02:02,025 daha sadece anında değiştirebilirsiniz edeceğiz. 38 00:02:02,025 --> 00:02:05,670 O tembel yüzden bu konuda akıllı nasıl hesaplamaları yapar. 39 00:02:05,670 --> 00:02:12,250 Gerçekten çalışabilir anlam Fonksiyonel fonksiyonların kapalı herhangibirşey böylece göre 40 00:02:12,250 --> 00:02:16,910 sen manipülasyon herhangi bir tür yapıyor, işlevleri kapalı esas alınacaktır. 41 00:02:16,910 --> 00:02:20,162 >> Nedenle ikili operatörler, örneğin, Sadece doğal işlevleri vardır. 42 00:02:20,162 --> 00:02:21,870 Ve her şey o Yapmanız olan gidiyoruz 43 00:02:21,870 --> 00:02:24,690 gidiş fonksiyonları kendisi kaçıp edilecek. 44 00:02:24,690 --> 00:02:27,140 Ve sonra sıra nesne yönelimli. 45 00:02:27,140 --> 00:02:30,930 >> Yani burada bir XKCD komplo olduğunu. 46 00:02:30,930 --> 00:02:34,350 Sadece ben gibi hissediyorum çünkü XKCD herhangi bir tür için esastır 47 00:02:34,350 --> 00:02:37,770 sunum, ancak çünkü Ben gerçekten böyle hissediyorum 48 00:02:37,770 --> 00:02:42,160 noktası çekiç ki bir sürü veri çeşit yapıyoruz zaman 49 00:02:42,160 --> 00:02:46,570 analizi, sorun değil o ishal ne kadar hızlı o kadar çok, 50 00:02:46,570 --> 00:02:49,850 ama gidiyor ne kadar Görevi programlamak için sizi. 51 00:02:49,850 --> 00:02:54,112 Yani burada sadece olmadığını analiz edilir strateji a veya b daha etkilidir. 52 00:02:54,112 --> 00:02:55,820 Bu olacak sen bir şey 53 00:02:55,820 --> 00:02:58,290 içinde bir sürü başa gidiyor tür düşük seviyeli diller 54 00:02:58,290 --> 00:03:03,440 Eğer seg hataları ile uğraşıyoruz nerede, bellek ayırma, baþlatma, 55 00:03:03,440 --> 00:03:05,270 Hatta yerleşik işlevleri yapma. 56 00:03:05,270 --> 00:03:09,920 Ve bu şeyler her işlenir çok, çok zarif R. 57 00:03:09,920 --> 00:03:12,839 >> Yani sadece bu çekiç nokta, büyük darboğaz 58 00:03:12,839 --> 00:03:13,880 bilişsel olacak. 59 00:03:13,880 --> 00:03:17,341 Yani veri analizi çok zor bir sorundur. 60 00:03:17,341 --> 00:03:19,340 Yapıyorsun olsun Makine öğrenme ya sen 61 00:03:19,340 --> 00:03:22,550 sadece bazı tür yapıyor temel veri arama, 62 00:03:22,550 --> 00:03:25,290 Eğer sahip olmak istemiyorum Bir belgeyi almak için 63 00:03:25,290 --> 00:03:27,440 ve daha sonra derlemek Her zaman bir şey mi 64 00:03:27,440 --> 00:03:31,010 Bir sütun neye benzediğini görmek istiyorum, bir matris özellikle hangi girdileri 65 00:03:31,010 --> 00:03:32,195 gibi görünüyor. 66 00:03:32,195 --> 00:03:34,320 Yani sadece istiyorum bazı gerçekten güzel bir arayüz 67 00:03:34,320 --> 00:03:37,740 Eğer basit bir işlevi çalıştırabilirsiniz indeksler için ne olursa olsun 68 00:03:37,740 --> 00:03:41,870 Beğendiğiniz ve sadece oradan kaçardım. 69 00:03:41,870 --> 00:03:44,190 Ve etki ihtiyacınız Bu özel dil. 70 00:03:44,190 --> 00:03:51,750 Ve R gerçekten tanımlamak yardımcı olacaktır Sorun ve bu şekilde bunu çözmek. 71 00:03:51,750 --> 00:03:58,690 >> Yani burada bir komplo gösteren programlama R popülerlik zamanla gitti gibi. 72 00:03:58,690 --> 00:04:04,060 Yani sen 2013 veya benzeri görebilirsiniz bu yüzden sadece müthiş havaya uçuruldu. 73 00:04:04,060 --> 00:04:09,570 Ve bu sırf bu olmuştur Teknoloji sektöründe büyük bir eğilim 74 00:04:09,570 --> 00:04:10,590 hakkında büyük veri. 75 00:04:10,590 --> 00:04:13,010 Ayrıca, sadece teknoloji sanayi, ama gerçekten 76 00:04:13,010 --> 00:04:16,490 Herhangi bir endüstri ki- çünkü sanayi bir sürü 77 00:04:16,490 --> 00:04:20,589 sort temel olan Bu sorunları çözmek için çalışıyoruz. 78 00:04:20,589 --> 00:04:24,590 Ve genellikle, bazı iyi olabilir Bu sorunların ölçülmesi yolu 79 00:04:24,590 --> 00:04:29,720 hatta onları tanımlamak veya verileri kullanarak bunları çözme. 80 00:04:29,720 --> 00:04:35,430 Yani şimdi R 11 olduğunu düşünüyorum TIOBE en popüler dil 81 00:04:35,430 --> 00:04:38,200 ve o zamandan beri büyüyor oldu. 82 00:04:38,200 --> 00:04:40,740 83 00:04:40,740 --> 00:04:43,080 >> Yani burada biraz daha var R. özellikleri It has 84 00:04:43,080 --> 00:04:46,900 paket muazzam sayıda ve Tüm bu farklı şeyler için. 85 00:04:46,900 --> 00:04:52,470 Yani her zaman bir var Belirli bir sorun, en 86 00:04:52,470 --> 00:04:55,060 Zaman R sahip olacak Sizin için bu işlev. 87 00:04:55,060 --> 00:04:58,520 Eğer isteyip istemediğinizi Yani Makinenin çeşit inşa 88 00:04:58,520 --> 00:05:02,770 denilen öğrenme algoritması Rastgele Orman veya Karar Ağaçları, 89 00:05:02,770 --> 00:05:07,530 hatta ortalamasını almaya çalışıyor Bir fonksiyon veya bu malzeme herhangi 90 00:05:07,530 --> 00:05:10,000 R o olacak. 91 00:05:10,000 --> 00:05:14,190 Eğer bunu yaparsanız >> Ve umurumda yaygın optimizasyon, bir şey 92 00:05:14,190 --> 00:05:17,430 Eğer prototip bitirdiniz yani sonra yüksek seviyeli dil çeşit, 93 00:05:17,430 --> 00:05:19,810 Bunu in-- atacağım olacak, sadece liman olduğunu üzerinde 94 00:05:19,810 --> 00:05:21,550 bazı düşük seviyeli dile. 95 00:05:21,550 --> 00:05:26,090 Ne Ar hakkında iyi sen bir kez olduğunu Bunu prototip yapılması, sen C ++ çalıştırabilirsiniz, 96 00:05:26,090 --> 00:05:29,510 veya Fortran, veya bunların herhangi bir doğrudan R. içine alt düzey olanlar 97 00:05:29,510 --> 00:05:32,320 Yani bu bir gerçekten R hakkında serin özelliği, 98 00:05:32,320 --> 00:05:35,930 Eğer gerçekten umurumda eğer optimizasyon noktası. 99 00:05:35,930 --> 00:05:39,490 >> Ve bu da gerçekten iyi Web görselleştirme için. 100 00:05:39,490 --> 00:05:43,530 Böylece D3.js, örneğin, Başka bir seminer sanırım 101 00:05:43,530 --> 00:05:45,130 Bugün sundu ki. 102 00:05:45,130 --> 00:05:48,510 Ve bu gerçekten harika interaktif görselleştirme yapıyor. 103 00:05:48,510 --> 00:05:54,460 Ve D3.js sahip olduğunu varsayar veri çeşit çizilebilmesini 104 00:05:54,460 --> 00:05:58,080 ve R yapmak için güçlü olmak harika bir yoldur veri analizi dışa önce 105 00:05:58,080 --> 00:06:04,220 üzerinde D3.js hatta sadece koşmak D3.js R kendisi içine komutları, 106 00:06:04,220 --> 00:06:08,240 yanı sıra bu gibi diğer kütüphaneler de. 107 00:06:08,240 --> 00:06:13,041 >> Yani sadece giriş oldu R ve neden bunu kullanmak olabilir budur. 108 00:06:13,041 --> 00:06:14,790 Yani umarım, ben oldum Sana bir şey ikna 109 00:06:14,790 --> 00:06:18,460 hakkında sadece neye benzediğini görmek için çalışıyorum. 110 00:06:18,460 --> 00:06:23,930 Yani go ahead ve geçmesi için gidiyorum R nesneler hakkında bazı temel 111 00:06:23,930 --> 00:06:26,150 ve gerçekten neler yapabileceğini. 112 00:06:26,150 --> 00:06:29,690 >> Yani burada sadece bir olduğunu matematik komutları demet. 113 00:06:29,690 --> 00:06:35,000 Yani inşa etmek istediğiniz sen-- demek dil kendiniz ve sadece istediğiniz 114 00:06:35,000 --> 00:06:38,080 Farklı araçlar bir demet var. 115 00:06:38,080 --> 00:06:42,520 Operasyon herhangi bir tür sen düşünüyorum hemen hemen R. olacak istiyorum 116 00:06:42,520 --> 00:06:44,150 >> Yani burada 2 artı 2. 117 00:06:44,150 --> 00:06:46,090 İşte 2 kez pi. 118 00:06:46,090 --> 00:06:51,870 R yerleşik sabitler bir grup var Eğer sık ​​sık pi, e gibi kullanabilirsiniz edeceğiz. 119 00:06:51,870 --> 00:06:56,230 >> Ve sonra, burada 7 artı runif, 1 runif yani. 120 00:06:56,230 --> 00:07:02,450 Bu olan bir fonksiyon üretir olduğunu 0-1 bir rasgele üniforma. 121 00:07:02,450 --> 00:07:04,400 Ve sonra 4 iktidara 3 var. 122 00:07:04,400 --> 00:07:06,430 Karekök var. 123 00:07:06,430 --> 00:07:07,270 >> Günlük var. 124 00:07:07,270 --> 00:07:14,500 Yani taban yapacak log kendisi tarafından üstel. 125 00:07:14,500 --> 00:07:18,337 Ve sonra, bir taban belirtirseniz, daha sonra Eğer istersen taban yapabilirsiniz. 126 00:07:18,337 --> 00:07:19,920 Ve sonra burada diğer bazı komutlar vardır. 127 00:07:19,920 --> 00:07:22,180 Yani 23 mod 2 var. 128 00:07:22,180 --> 00:07:24,910 Sonra geri kalan var. 129 00:07:24,910 --> 00:07:27,110 Sonra bilimsel var notasyonu da eğer 130 00:07:27,110 --> 00:07:34,060 sadece daha fazla yapmak istiyorum ve daha karmaşık şeyler. 131 00:07:34,060 --> 00:07:37,320 >> Yani burada atama olduğunu. 132 00:07:37,320 --> 00:07:40,830 Yani tipik atamalar R, bir ok ile yapılır 133 00:07:40,830 --> 00:07:43,440 bu yüzden daha az daha ve tire var. 134 00:07:43,440 --> 00:07:47,250 Yani burada sadece atama ediyorum Değişken val 3. 135 00:07:47,250 --> 00:07:50,160 >> Ve sonra ben val yazdırarak ediyorum ve sonra üç yazdırır. 136 00:07:50,160 --> 00:07:53,920 R tercüman Varsayılan olarak, bu Sizin için bir şeyler yazdırmak olacak 137 00:07:53,920 --> 00:07:57,280 böylece bir val yazdırmak belirtmek zorunda değilsiniz her zaman bir şey yazdırmak istiyorum. 138 00:07:57,280 --> 00:08:00,200 Sadece val yapabilirsiniz ve o zaman sizin için yapacağım. 139 00:08:00,200 --> 00:08:04,380 >> Ayrıca, teknik eşittir kullanabilirsiniz Bir atama operatörü olarak. 140 00:08:04,380 --> 00:08:07,190 Hafif incelikleri vardır okunu kullanarak arasındaki 141 00:08:07,190 --> 00:08:10,730 Operatör ve eşittir atamalar için operatör. 142 00:08:10,730 --> 00:08:15,470 Çoğunlukla kongre, herkes tarafından sadece ok operatörünü kullanır. 143 00:08:15,470 --> 00:08:21,850 >> Ve burada, ben bu atama ediyorum eğik gösterim 1 kolon 6 çağırdı. 144 00:08:21,850 --> 00:08:26,010 Bu 1-6 bir vektör oluşturur. 145 00:08:26,010 --> 00:08:29,350 Ve bu gerçekten güzel o çünkü Sadece val vektörü atamak 146 00:08:29,350 --> 00:08:34,270 ve bu tek başına çalışır. 147 00:08:34,270 --> 00:08:37,799 >> Peki bu zaten gelen gidiyor Bir çok sezgisel veri single-- 148 00:08:37,799 --> 00:08:41,070 sadece bir ikizi yapısı bir vektöre Çeşidi bir tür 149 00:08:41,070 --> 00:08:45,670 ve bütün bunlar toplayacak Sizin için skaler değerler. 150 00:08:45,670 --> 00:08:50,770 Yani skaler gelen gittikten sonra, sen R nesneleri ve bu bir vektördür. 151 00:08:50,770 --> 00:08:55,610 Bir vektör herhangi bir tür aynı tip koleksiyon. 152 00:08:55,610 --> 00:08:58,150 Yani burada vektörlerin bir demet. 153 00:08:58,150 --> 00:08:59,800 >> Peki bu sayısal olduğunu. 154 00:08:59,800 --> 00:09:02,440 Sayısal çift demenin R yoludur. 155 00:09:02,440 --> 00:09:07,390 Ve böylece varsayılan olarak, herhangi bir sayı bir çift olacak. 156 00:09:07,390 --> 00:09:13,150 >> Yani 1.1, 3 c varsa, 5.7 negatif C bir fonksiyonudur. 157 00:09:13,150 --> 00:09:16,760 Bu üç birleştirir Bir vektör içine sayılar. 158 00:09:16,760 --> 00:09:19,619 Bu yüzden, eğer göre-- olacak Eğer kendisi tarafından 3 fark, 159 00:09:19,619 --> 00:09:21,910 normalde varsayılabilir bu tamsayı gibi olduğu, 160 00:09:21,910 --> 00:09:25,050 ancak tüm vektörleri çünkü Aynı tip, 161 00:09:25,050 --> 00:09:28,660 Bu çiftler bir vektör veya bu durumda sayısal. 162 00:09:28,660 --> 00:09:34,920 >> Rnorm üreten bir fonksiyonudur standart normal variables-- 163 00:09:34,920 --> 00:09:36,700 veya standart normal değerler. 164 00:09:36,700 --> 00:09:38,360 Ve ben ikisini belirterek ediyorum. 165 00:09:38,360 --> 00:09:43,840 Yani bu atama, rnorm 2 yapıyorum Devs ve sonra devs dışarı baskı yapıyorum. 166 00:09:43,840 --> 00:09:47,350 Peki bu sadece ikisidir rastgele Normal değerler. 167 00:09:47,350 --> 00:09:50,060 >> Ve sonra yaparsanız INTS Eğer tamsayılar umurumda. 168 00:09:50,060 --> 00:09:54,650 Yani bu sadece bellekte hakkında tahsisi ve tasarruf bellek boyutu. 169 00:09:54,650 --> 00:10:01,460 Yani eklemek zorunda kalacak başkent L. tarafından numaralar 170 00:10:01,460 --> 00:10:04,170 >> Genel olarak, bu R tarihi gösterim 171 00:10:04,170 --> 00:10:06,940 bir şey için uzun tamsayı denir. 172 00:10:06,940 --> 00:10:09,880 Çoğu zaman, sen olacak Yani çiftler ile ilgili olacak. 173 00:10:09,880 --> 00:10:15,180 Ve eğer hiç sonradan olacak kodunuzu optimize üzerine, 174 00:10:15,180 --> 00:10:18,110 Sadece bu L'nin ekleyebilirsiniz sonradan ya da sırasında 175 00:10:18,110 --> 00:10:22,280 hakkında öngörüye gibisin eğer ne Bu değişkenleri yapmak için gidiyoruz. 176 00:10:22,280 --> 00:10:25,340 177 00:10:25,340 --> 00:10:26,890 >> Yani burada bir karakter vektör. 178 00:10:26,890 --> 00:10:31,440 Yani, yine, ben birleştirerek ediyorum Üç dizeleri bu kez. 179 00:10:31,440 --> 00:10:36,230 Bu çift dizeleri dikkat ve Tek dizeleri R. aynıdır 180 00:10:36,230 --> 00:10:41,000 Yani öylesine arthur ve Marvin en ve var zaman, hepsini dışarı baskı ediyorum 181 00:10:41,000 --> 00:10:43,210 Çift dizeleri göstermek için gidiyoruz. 182 00:10:43,210 --> 00:10:45,880 Ve ayrıca eklemek istiyorsanız çift ​​veya tek dize 183 00:10:45,880 --> 00:10:50,070 sizin karakter, o zaman yapabilirsiniz Ya senin dizeleri alternatif. 184 00:10:50,070 --> 00:10:53,540 >> Marvin en Yani İkinci unsur, bu 185 00:10:53,540 --> 00:10:56,380 Seni show-- olacak sadece çift dizeleri var 186 00:10:56,380 --> 00:10:59,050 ve daha sonra tek bir dize bu yüzden bu alternatif olduğunu. 187 00:10:59,050 --> 00:11:04,040 İstediğiniz Aksi takdirde, bir çift kullanmak için Bir çift dize dize operatörü 188 00:11:04,040 --> 00:11:07,090 Bunu ilan ederken, daha sonra Sadece kaçış operatörünü kullanın. 189 00:11:07,090 --> 00:11:10,600 Yani ters eğik çizgi çift dize yapmak. 190 00:11:10,600 --> 00:11:13,330 >> Ve son olarak, aynı zamanda mantıksal vektörleri var. 191 00:11:13,330 --> 00:11:15,890 Yani logical-- yüzden DOĞRU ve YANLIŞ, ve onlar konum 192 00:11:15,890 --> 00:11:18,880 Tüm harfler büyük olacak. 193 00:11:18,880 --> 00:11:22,370 Ve sonra, yine, ben birleştirerek ediyorum Onları ve daha sonra bool değerlerden oluşan bunları atama. 194 00:11:22,370 --> 00:11:24,590 Yani bool değerlerden oluşan göstermek için gidiyor Eğer, DOĞRU YANLIŞ, DOĞRU ve. 195 00:11:24,590 --> 00:11:28,280 196 00:11:28,280 --> 00:11:31,620 >> Yani burada vectorized indeksleme olduğunu. 197 00:11:31,620 --> 00:11:34,870 Ben, başında Yani Bir function-- alıyorum 198 00:11:34,870 --> 00:11:39,230 Bu sequence-- adlandırılır 2-12 sekansı. 199 00:11:39,230 --> 00:11:42,490 Ve ben 2 ile bir dizi alıyorum. 200 00:11:42,490 --> 00:11:46,660 Yani bunu yapmak için gidiyor 2, 4, 6, 8, 10 ve 12. 201 00:11:46,660 --> 00:11:50,080 Ve sonra, ben indeksleme değilim Üçüncü elemanı almak için. 202 00:11:50,080 --> 00:11:55,770 >> Yani akılda tutulması gereken bir şey 1 başlayarak, R indeksleri. 203 00:11:55,770 --> 00:12:00,550 Vals Yani 3 verecek Üçüncü unsur. 204 00:12:00,550 --> 00:12:04,580 Bu tür diğerinden farklı olduğunu sıfırdan başlar dilleri. 205 00:12:04,580 --> 00:12:09,780 Bu nedenle, C veya C ++, örneğin, konum Dördüncü elemanı almak için gidiyoruz. 206 00:12:09,780 --> 00:12:13,280 >> Ve burada 3-5 vals olduğunu. 207 00:12:13,280 --> 00:12:16,030 Yani bir şey olduğunu gerçekten harika senin olduğunu 208 00:12:16,030 --> 00:12:20,410 içinde geçici değişkenleri üretebilir ve sonra sadece anında bunları kullanmak. 209 00:12:20,410 --> 00:12:21,960 Yani burada 3-5 olduğu. 210 00:12:21,960 --> 00:12:25,070 Yani bir vektör üreten ediyorum 3, 4, 5 ve daha sonra 211 00:12:25,070 --> 00:12:29,700 Ben, üçte almak için endeksleme ediyorum Dördüncü ve beşinci elemanları. 212 00:12:29,700 --> 00:12:32,280 >> Yani benzer, yapabilirsiniz Bu soyut sadece yapmak 213 00:12:32,280 --> 00:12:35,280 Bir vektör herhangi bir tür Bu size indeksleme verir. 214 00:12:35,280 --> 00:12:40,050 Yani burada o vals ve bir ilk, üçüncü ve altıncı elemanları. 215 00:12:40,050 --> 00:12:42,800 Ve sonra, isterseniz bir tamamlayıcısı yapmak için, 216 00:12:42,800 --> 00:12:45,210 böylece sadece eksi yapmak Daha sonra ve olacak 217 00:12:45,210 --> 00:12:48,600 Sana değil her şeyi vermek ilk, üçüncü ve altıncı eleman. 218 00:12:48,600 --> 00:12:51,590 Yani bu 4, 8, ve 10 olacaktır. 219 00:12:51,590 --> 00:12:54,380 >> Ve almak istiyorsanız daha gelişmiş, 220 00:12:54,380 --> 00:12:57,610 Boole vektörleri arada kullanabilirsiniz. 221 00:12:57,610 --> 00:13:05,210 Yani bu endeks size verecek uzunluğunda 6 Bu Boole vektör. 222 00:13:05,210 --> 00:13:07,280 Yani temsilcisi DOĞRU virgül 3. 223 00:13:07,280 --> 00:13:09,680 Bu DOĞRU üç kez tekrar edecektir. 224 00:13:09,680 --> 00:13:12,900 Yani bu size verecek vektör DOĞRU, DOĞRU, DOĞRU. 225 00:13:12,900 --> 00:13:17,470 >> Temsilcisi YANLIŞ 4-- bu size verecek YANLIŞ, YANLIŞ, YANLIŞ YANLIŞ bir vektör. 226 00:13:17,470 --> 00:13:21,280 Ve ardından c bitiştirmek için gidiyor Birlikte bu iki Booleans. 227 00:13:21,280 --> 00:13:24,090 Yani üç almak için gidiyoruz Doğruları ve daha sonra dört falses. 228 00:13:24,090 --> 00:13:28,460 >> Eğer endeks vals, sen ne zaman o yüzden , DOĞRU, DOĞRU DOĞRU almak için gidiyoruz. 229 00:13:28,460 --> 00:13:31,420 Yani evet demek oluyor, Ben bu üç öğeleri istiyorum. 230 00:13:31,420 --> 00:13:33,520 Ve sonra YANLIŞ, YANLIŞ, YANLIŞ, YANLIŞ gidiyor 231 00:13:33,520 --> 00:13:37,140 hayır, ben bu unsurları istemiyorum demek bu yüzden onları geri gitmiyor. 232 00:13:37,140 --> 00:13:41,490 >> Ve ben burada bir yazım hatası var aslında sanırım Bu çünkü 3 tekrarlayın DOĞRU söylüyor 233 00:13:41,490 --> 00:13:47,990 ve teknik sizi YANLIŞ 4 tekrarlayın ve Sadece altı elemanları, YANLIŞ tekrarlamak var, 234 00:13:47,990 --> 00:13:50,470 bu 3 YANLIŞ tekrar olmalıdır. 235 00:13:50,470 --> 00:13:55,260 Ben R, aynı zamanda yeterince akıllı olduğunu düşünüyorum Bu sadece o, burada 4 belirtirseniz 236 00:13:55,260 --> 00:13:56,630 hatta dışarı hata olmaz. 237 00:13:56,630 --> 00:13:58,480 Sadece bu değeri verecektir. 238 00:13:58,480 --> 00:14:00,970 Yani sadece bu dördüncü YANLIŞ görmezden edeceğiz. 239 00:14:00,970 --> 00:14:05,310 240 00:14:05,310 --> 00:14:09,270 >> Yani burada vectorized atama olduğunu. 241 00:14:09,270 --> 00:14:15,480 Bu sadece setleri set.seed-- Yani yalancı rasgele numaralar için tohum. 242 00:14:15,480 --> 00:14:20,110 Yani tohum ayarlıyorum Yani 42, ben oluşturmak eğer 243 00:14:20,110 --> 00:14:22,950 Üç normal rasgele değerler, ve sonra eğer 244 00:14:22,950 --> 00:14:27,400 kendi set.seed çalıştırmak aynı değeri 42 ile bilgisayar, 245 00:14:27,400 --> 00:14:30,990 o zaman da olsun Aynı üç rastgele normaller. 246 00:14:30,990 --> 00:14:33,411 >> Peki bu gerçekten çok iyi tekrarlanabilirlik için. 247 00:14:33,411 --> 00:14:35,910 Genellikle, ne yapıyor bazı Bilimsel analiz tür, 248 00:14:35,910 --> 00:14:37,230 Eğer tohum ayarlamak isterim. 249 00:14:37,230 --> 00:14:41,270 Bu şekilde diğer bilim adamları sadece can Eğer ettik aynı kodu yeniden 250 00:14:41,270 --> 00:14:44,790 onlar tam olacak çünkü yapılan Aynı rasgele değişkenler ki- veya rasgele 251 00:14:44,790 --> 00:14:47,270 siz de dışarı attık değerleri. 252 00:14:47,270 --> 00:14:49,870 253 00:14:49,870 --> 00:14:53,910 >> Ve böylece vectorized atama Burada 2 Vals 1 gösteriliyor. 254 00:14:53,910 --> 00:14:59,290 Bu yüzden ilk iki elemanları alır vals ve daha sonra 0 onları atar. 255 00:14:59,290 --> 00:15:03,940 Ve sonra, sen de sadece yapabilirsiniz Booleans benzer bir şey. 256 00:15:03,940 --> 00:15:09,340 >> Peki vals bu iradeyi 0-- eşit değildir Size bir vektör YANLIŞ vermek, YANLIŞ, DOĞRU 257 00:15:09,340 --> 00:15:10,350 bu durumda. 258 00:15:10,350 --> 00:15:13,770 Ve sonra, herhangi bir söylemek için gidiyor DOĞRU vardı o endeksleri, 259 00:15:13,770 --> 00:15:15,270 o 5'e o atamak için gidiyor. 260 00:15:15,270 --> 00:15:18,790 Yani üçüncü elemanı alır Burada ve daha sonra 5 atar. 261 00:15:18,790 --> 00:15:22,300 >> Ve bu gerçekten güzel Düşük seviyeli diller ile karşılaştırıldığında 262 00:15:22,300 --> 00:15:25,560 nerede döngüler için kullanmak zorunda Bu vectorized şeyler her yapmak 263 00:15:25,560 --> 00:15:30,281 sadece çok sezgisel çünkü ve tek bir tek-liner var. 264 00:15:30,281 --> 00:15:32,030 Ve büyük hakkında ne vectorized gösterim 265 00:15:32,030 --> 00:15:37,020 R, bu tür olmasıdır Yerleşik onlar neredeyse hızlılar ki 266 00:15:37,020 --> 00:15:42,490 Düşük seviyeli dil olarak yapıyor gibi Ar döngü için bir yapım karşı 267 00:15:42,490 --> 00:15:46,317 ve daha sonra bunu yapmak zorunda Dinamik indeksleme kendisi. 268 00:15:46,317 --> 00:15:48,900 Ve bunu yaparken daha yavaş olacak vectorized bu tür bir şey 269 00:15:48,900 --> 00:15:55,950 bu paralel, bunu yapmak nerede temelde diş bunu yapıyor. 270 00:15:55,950 --> 00:15:58,650 >> Yani burada vectorized operasyonlar olduğunu. 271 00:15:58,650 --> 00:16:04,920 Yani 3 bir değer 1 üreten ediyorum, atama olduğunu vec1 için, 3-5, vec2, 272 00:16:04,920 --> 00:16:05,950 onları bir arada ekleyerek. 273 00:16:05,950 --> 00:16:11,490 O yüzden onlara bileşen bilge ekler o böylece 1 artı 3, 2 artı 4, ve var. 274 00:16:11,490 --> 00:16:13,330 >> Vec1 kez vec2. 275 00:16:13,330 --> 00:16:16,110 Bu, iki çarpar bilge bileşeni değerleri. 276 00:16:16,110 --> 00:16:21,830 Yani 1 kez 3, 2 kez var 4 ve daha sonra 3 kez 5. 277 00:16:21,830 --> 00:16:28,250 >> Ve sonra, benzer siz de yapabilirsiniz mantıksal karşılaştırmalar comparisons--. 278 00:16:28,250 --> 00:16:33,640 Yani bu DOĞRU YANLIŞ YANLIŞ var örnek 1 için, 3 daha büyük değildir 279 00:16:33,640 --> 00:16:35,920 2 4 daha büyük değildir. 280 00:16:35,920 --> 00:16:41,160 Bu benim, başka yazım hatası sanırım, bir, 3 kesinlikle 5'ten büyük değildir. 281 00:16:41,160 --> 00:16:41,660 Evet. 282 00:16:41,660 --> 00:16:45,770 Ve böylece sadece tüm yapabilirsiniz Bu basit işlemler 283 00:16:45,770 --> 00:16:48,350 onların miras nedeniyle sınıflar kendilerini. 284 00:16:48,350 --> 00:16:51,110 285 00:16:51,110 --> 00:16:52,580 >> Yani sadece vektör oldu. 286 00:16:52,580 --> 00:16:56,530 Ve bu en temel sıralama var R nesnesi, çünkü bir vektör verilen 287 00:16:56,530 --> 00:16:59,170 Eğer daha gelişmiş nesneleri oluşturabilirsiniz. 288 00:16:59,170 --> 00:17:00,560 >> Yani burada bir matris var. 289 00:17:00,560 --> 00:17:05,030 Bu aslında soyutlama Bir matris kendisi ne olduğu. 290 00:17:05,030 --> 00:17:10,099 Yani bu durumda, farklı üçü Her biri bir sütun vektörleri, 291 00:17:10,099 --> 00:17:12,710 ya da bunu düşünebilirsiniz Her biri olarak bir sıra. 292 00:17:12,710 --> 00:17:18,250 >> Yani 1'den bir matris için depolama ediyorum 9 ve daha sonra 3 satır belirterek ediyorum. 293 00:17:18,250 --> 00:17:23,364 Yani 1 ila 9, sana bir vektör 1 verecek 2, 3, 4, 5, 6, ve 9 kadar taşıyabilir. 294 00:17:23,364 --> 00:17:29,250 >> De akılda tutmak için bir şey olduğunu R mağazaları sütun ana formatta değerleri. 295 00:17:29,250 --> 00:17:34,160 Yani diğer bir deyişle, 1 zaman görmek 9, bu them-- depolamak için oluyor 296 00:17:34,160 --> 00:17:36,370 bu, 2, 1 olacak İlk sütunda 3, 297 00:17:36,370 --> 00:17:38,510 ve sonra yapacağım 4, 5, İkinci sütundaki 6, 298 00:17:38,510 --> 00:17:41,440 ve daha sonra 7, üçüncü sütundaki 8, 9. 299 00:17:41,440 --> 00:17:45,570 >> Ve burada diğer bazı vardır kullanabileceğiniz ortak fonksiyonlar. 300 00:17:45,570 --> 00:17:49,650 Yani loş mat, bu size vereceğim matris boyutları. 301 00:17:49,650 --> 00:17:52,620 Seni dönmek için gidiyor boyut bir vektör. 302 00:17:52,620 --> 00:17:55,580 Bu durumda, çünkü böylece Bizim matris, 3 ile 3 303 00:17:55,580 --> 00:18:01,900 size bir vermek için gidiyor Sayısal vektör 3 3 olduğunu. 304 00:18:01,900 --> 00:18:05,270 >> Ve burada sadece gösteriyor matris çarpım. 305 00:18:05,270 --> 00:18:11,970 Yani genellikle, sadece yaparsanız asterisk-- böylece mat yıldız mat-- 306 00:18:11,970 --> 00:18:15,380 Bu olacak bileşen-bilge operasyon 307 00:18:15,380 --> 00:18:17,300 veya Hadamard ürün ne denir. 308 00:18:17,300 --> 00:18:21,310 Yani her yapacak eleman bileşen bilge. 309 00:18:21,310 --> 00:18:23,610 Ancak, isterseniz matris multiplication-- 310 00:18:23,610 --> 00:18:29,380 böylece ilk satır kez çarparak İkinci matris ilk sütun 311 00:18:29,380 --> 00:18:34,510 ve böylece on-- kullanırsınız Bu yüzde operasyonu. 312 00:18:34,510 --> 00:18:38,110 >> Ve mat t sadece bir olduğunu devrik için operasyon. 313 00:18:38,110 --> 00:18:42,590 Yani ben devrik almak söylüyorum matris, matris ile çarpın 314 00:18:42,590 --> 00:18:43,090 kendisi. 315 00:18:43,090 --> 00:18:45,006 Ve o gidiyor Başka bir 3 sana dönecektir 316 00:18:45,006 --> 00:18:50,700 3 matris gösterimleri Eğer istediğimiz ürün. 317 00:18:50,700 --> 00:18:53,750 >> Ve böylece matris oldu. 318 00:18:53,750 --> 00:18:56,020 İşte bir veri çerçevesi denir şeydir. 319 00:18:56,020 --> 00:19:00,780 Siz aklınıza gelebilecek bir veri çerçevesi Bir matris, ancak her kolon kendisi 320 00:19:00,780 --> 00:19:02,990 Farklı Çeşidi olacak. 321 00:19:02,990 --> 00:19:07,320 >> Peki veriler hakkında gerçekten harika karedir veri analizi kendisi olduğunu, 322 00:19:07,320 --> 00:19:11,260 Tüm bu için gidiyoruz heterojen veri ve tüm bu gerçekten 323 00:19:11,260 --> 00:19:15,640 Dağınık şeyler nerede sütunların her biri kendilerini farklı türde olabilir. 324 00:19:15,640 --> 00:19:21,460 Yani burada bir oluşturmak söylüyorum veri çerçevesi, 1-3 int'leri mutlaka 325 00:19:21,460 --> 00:19:24,750 ve daha sonra da bir karakter vektör var. 326 00:19:24,750 --> 00:19:28,470 Yani aracılığıyla endeksi can Bu sütunların her biri 327 00:19:28,470 --> 00:19:30,930 ve sonra değerleri kendileri alırsınız. 328 00:19:30,930 --> 00:19:34,370 Ve ayrıca çeşit yapabilirsiniz veri çerçevelerinin üzerindeki işlemler. 329 00:19:34,370 --> 00:19:38,040 Ve çoğu zaman sen ne zaman veri analizi veya çeşit yapıyor 330 00:19:38,040 --> 00:19:42,042 önişleme, sen olacağım Bu veri yapısı ile çalışan 331 00:19:42,042 --> 00:19:44,250 nereye, her sütun gidiyor Farklı bir tip olması. 332 00:19:44,250 --> 00:19:47,880 333 00:19:47,880 --> 00:19:52,970 >> Son olarak, bu yüzden, bu gibi esas olarak R. Listesi dört temel nesneleri 334 00:19:52,970 --> 00:19:55,820 sadece herhangi toplayacak diğer nesneleri istediğiniz. 335 00:19:55,820 --> 00:20:00,130 Yani birine bu depolar kolayca erişebilirsiniz değişken. 336 00:20:00,130 --> 00:20:02,370 >> Yani burada, ben bir liste alıyorum. 337 00:20:02,370 --> 00:20:04,460 Ben şeyler 3 eşittir söylüyorum. 338 00:20:04,460 --> 00:20:08,060 Yani bir eleman olması için gidiyorum Liste, ve bu şeyler denir, 339 00:20:08,060 --> 00:20:10,570 ve değerini 3 sahip olacak. 340 00:20:10,570 --> 00:20:13,140 >> Ben de bir matris oluşturabilirsiniz. 341 00:20:13,140 --> 00:20:17,970 Yani bu 4 ve son satıra 1 2 eşittir, yani 2 2 matrisi ile. 342 00:20:17,970 --> 00:20:20,270 Ayrıca listede ve mat denir. 343 00:20:20,270 --> 00:20:24,690 moreStuff, bir karakter dizesi, kendisi ve hatta başka bir liste. 344 00:20:24,690 --> 00:20:27,710 >> Peki bu 5 ve ayı olan bir listedir. 345 00:20:27,710 --> 00:20:30,990 Bu değeri 5 ve has it Yani karakter dizesi ayısı 346 00:20:30,990 --> 00:20:32,710 ve bir liste içinde bir liste. 347 00:20:32,710 --> 00:20:35,965 Yani bu olabilir özyinelemeli şeyler nerede 348 00:20:35,965 --> 00:20:38,230 Eğer another-- a sahip türü içinde yazın. 349 00:20:38,230 --> 00:20:41,420 Yani benzer, bir matris olabilir Başka bir matris içinde ve böyle devam eder. 350 00:20:41,420 --> 00:20:44,264 Ve bir liste sadece iyi bir yoldur toplama ve toplayarak 351 00:20:44,264 --> 00:20:45,430 Tüm bu farklı nesneler. 352 00:20:45,430 --> 00:20:50,210 353 00:20:50,210 --> 00:20:57,150 >> Ve nihayet, burada sadece durumda yardım edilir Bu sadece çok hızlı bir şekilde gitmişti. 354 00:20:57,150 --> 00:21:01,350 Yani her zaman kafan karıştı fonksiyonunun çeşit hakkında, 355 00:21:01,350 --> 00:21:03,510 Eğer bu işlevi yardım yapabilirsiniz. 356 00:21:03,510 --> 00:21:07,120 Yani yardım matrisi yapabilirsiniz veya bir soru işareti matrisi. 357 00:21:07,120 --> 00:21:11,430 Ve yardım ve soru işareti vardır sadece aynı şey için steno 358 00:21:11,430 --> 00:21:13,040 bu yüzden diğer adlar konum. 359 00:21:13,040 --> 00:21:16,820 >> Lm bir fonksiyonu olduğunu Sadece bir doğrusal model yapar. 360 00:21:16,820 --> 00:21:20,340 Ama sadece nasıl hiçbir fikrim varsa işleri, sadece lm yardım yapabilir 361 00:21:20,340 --> 00:21:24,610 ve bu bazı vereceğim belgelerin tür olduğunu 362 00:21:24,610 --> 00:21:27,960 tür bir gibi görünüyor Unix, adam sayfası 363 00:21:27,960 --> 00:21:34,210 Eğer kısa bir açıklama var ne onun argümanlar da ne yapar, 364 00:21:34,210 --> 00:21:38,850 döndürür ve nasıl sadece ipuçları ne kullanmak, ve bazı örnekler de için. 365 00:21:38,850 --> 00:21:41,680 366 00:21:41,680 --> 00:21:52,890 >> Bu yüzden bana öncesinde ve gösteri gidelim R. OK kullanarak bazı demo. 367 00:21:52,890 --> 00:21:55,470 Yani çok gitti hızlı, sadece veri 368 00:21:55,470 --> 00:21:59,440 yapıları ve çeşit bazı operasyonlarını op--. 369 00:21:59,440 --> 00:22:02,960 İşte bazı fonksiyonlar. 370 00:22:02,960 --> 00:22:06,750 >> Yani burada sadece gidiyorum Bir işlev tanımlamak için. 371 00:22:06,750 --> 00:22:09,970 Yani ben de kullanıyorum Burada atama operatörü, 372 00:22:09,970 --> 00:22:12,610 ve sonra ben söylüyorum bir fonksiyonu olarak ilan. 373 00:22:12,610 --> 00:22:14,140 Ve bu değer x alır. 374 00:22:14,140 --> 00:22:18,210 Yani bu, istediğiniz herhangi bir değer ve ben kendisine x dönmek için gidiyorum. 375 00:22:18,210 --> 00:22:20,840 Yani bu kimlik işlevi. 376 00:22:20,840 --> 00:22:23,670 >> Ve bu konuda serin ne diğer dillere göre 377 00:22:23,670 --> 00:22:26,330 ve başka düşük seviyeli dil o x 378 00:22:26,330 --> 00:22:29,350 herhangi bir türünde olabilir ve bu tür dönersiniz. 379 00:22:29,350 --> 00:22:35,251 Yani bunu izin imagine-- olabilir Bana sadece hızlı çalıştırabilirsiniz. 380 00:22:35,251 --> 00:22:35,750 Özür dilerim. 381 00:22:35,750 --> 00:22:40,300 >> Yani bir şey ben de bahsetmeliyiz Bu editör kullanıyorum olduğunu 382 00:22:40,300 --> 00:22:41,380 rstudio olarak adlandırılır. 383 00:22:41,380 --> 00:22:44,389 Bu bir IDE denir şeydir. 384 00:22:44,389 --> 00:22:46,180 Ve bir şey olduğunu Bu konuda gerçekten güzel 385 00:22:46,180 --> 00:22:51,500 o bir sürü birleştirir olduğunu şeyler başına Ar yapmak istiyorum 386 00:22:51,500 --> 00:22:53,180 Sadece çok sezgisel. 387 00:22:53,180 --> 00:22:55,550 >> Yani burada bir tercüman konsoludur. 388 00:22:55,550 --> 00:23:02,160 Yani benzer, sen de bu alabilirsiniz Sadece sermaye R. yaparak konsol ham 389 00:23:02,160 --> 00:23:05,630 Ve bu tam olarak konsol olarak aynı şey. 390 00:23:05,630 --> 00:23:12,210 Yani sadece id fonksiyonu x, x, x yapabilirsiniz. 391 00:23:12,210 --> 00:23:16,130 Zaten-- ve daha sonra bu ve kendisi iyi olacak. 392 00:23:16,130 --> 00:23:19,200 393 00:23:19,200 --> 00:23:21,740 >> Böylece rstudio büyük bu konsol çünkü. 394 00:23:21,740 --> 00:23:25,360 Ayrıca belgeleri vardır Eğer çalıştırmak istiyorum. 395 00:23:25,360 --> 00:23:28,629 Ve sonra bazı değişkenleri vardır Eğer ortamlarda görebilirsiniz. 396 00:23:28,629 --> 00:23:30,420 Ve sonra, varsa Size daha sonra, araziler yapmak 397 00:23:30,420 --> 00:23:33,730 aksine sadece burada görebilirsiniz Tüm bu farklı pencereler yönetme 398 00:23:33,730 --> 00:23:35,940 başlarına. 399 00:23:35,940 --> 00:23:40,530 >> Ben aslında şahsen Vim kullanın, ama ben rstudio gibi hissediyorum, sadece mükemmel 400 00:23:40,530 --> 00:23:44,640 iyi bir fikir almak için Genellikle R. kullanmak nasıl, 401 00:23:44,640 --> 00:23:47,040 ne zaman çalışıyoruz Bazı yeni görev öğrenir, 402 00:23:47,040 --> 00:23:49,590 Eğer işlemek istemiyorum Bir seferde çok fazla şey. 403 00:23:49,590 --> 00:23:53,120 Yani R, sadece bir very-- rstudio olduğunu öğrenme R çok iyi bir yoldur 404 00:23:53,120 --> 00:23:56,760 ile uğraşmak zorunda kalmadan Tüm bu diğer şeyler. 405 00:23:56,760 --> 00:23:58,600 >> Yani burada koşuyorum id merhaba. 406 00:23:58,600 --> 00:24:00,090 Bu merhaba döndürür. 407 00:24:00,090 --> 00:24:01,740 id 123. 408 00:24:01,740 --> 00:24:04,610 İşte tamsayılar bir vektör. 409 00:24:04,610 --> 00:24:08,620 Yani benzer, yapabilirsiniz, çünkü değer herhangi bir çeşit almak 410 00:24:08,620 --> 00:24:16,060 Eğer id dönen yapabilirsiniz X bu nedenle 1234 ve 5 döndürür. 411 00:24:16,060 --> 00:24:22,210 >> Ve sadece size göstermek bana izin Bu gerçekten bir tam sayıdır. 412 00:24:22,210 --> 00:24:28,800 Ve benzer şekilde, sınıfı yaparsanız id x tamsayı olacak. 413 00:24:28,800 --> 00:24:34,170 Ve sonra, siz de yapabilirsiniz iki karşılaştırmak ve DOĞRU olduğunu. 414 00:24:34,170 --> 00:24:38,350 Yani x ise kimliği kontrol ediyorum eşittir x ve haber eşittir 415 00:24:38,350 --> 00:24:39,760 o size iki TRUEs verir. 416 00:24:39,760 --> 00:24:44,280 Yani bu söyleyerek değil özdeş iki nesne, 417 00:24:44,280 --> 00:24:46,845 ancak girişlerin her biri Vektörler aynı uzaklıktadır. 418 00:24:46,845 --> 00:24:50,000 419 00:24:50,000 --> 00:24:52,090 >> İşte bounded.compare edilir. 420 00:24:52,090 --> 00:24:58,470 Yani bu biraz daha karmaşık ki bu bir eğer durumu vardır ve başka 421 00:24:58,470 --> 00:25:00,960 ve sonra iki alır Bir seferde argümanlar. 422 00:25:00,960 --> 00:25:02,640 Yani x herhangi bir tiptedir. 423 00:25:02,640 --> 00:25:06,280 Ve ben bu söylüyorum İkinci argüman olduğunu. 424 00:25:06,280 --> 00:25:08,380 Bu aynı zamanda her şey olabilir. 425 00:25:08,380 --> 00:25:12,490 Ama varsayılan olarak, bu almaya gidiyor 5 şey belirtmek yoksa. 426 00:25:12,490 --> 00:25:16,730 >> Yani burada söylemek için gidiyorum x daha büyük ise. 427 00:25:16,730 --> 00:25:19,220 Ben bir belirtin yoksa Yani, bunu x, 5'den daha büyük olması durumunda, der 428 00:25:19,220 --> 00:25:20,470 sonra DOĞRU dönmek için gidiyorum. 429 00:25:20,470 --> 00:25:23,230 Başka, ben YANLIŞ dönmek için gidiyorum. 430 00:25:23,230 --> 00:25:24,870 Bu yüzden bana go ahead ve bu açıklayalım. 431 00:25:24,870 --> 00:25:30,600 432 00:25:30,600 --> 00:25:34,550 >> Ve şimdi ben gidiyorum bounded.compare 3 çalıştırın. 433 00:25:34,550 --> 00:25:39,150 Yani 3 daha az olduğunu söylüyor edemememden 5 3'ten fazladır. 434 00:25:39,150 --> 00:25:41,830 Hayır, o kadar YANLIŞ değil. 435 00:25:41,830 --> 00:25:46,550 >> Ve 3. bounded.compare ve ben gidiyorum Bir 2 eşittir kullanarak karşılaştırmak için. 436 00:25:46,550 --> 00:25:50,700 Yani şimdi ben şimdi, evet diyorum Bir başka bir şey olmak istiyorum. 437 00:25:50,700 --> 00:25:52,750 Ben bir söylemek için gidiyorum Yani, 2 olmalıdır. 438 00:25:52,750 --> 00:25:56,640 >> Ben bu tür yapmak ya notasyonu ya da ben bir 2 eşittir söylüyorlar. 439 00:25:56,640 --> 00:25:58,720 Bu bir daha okunabilir ki sen ne zaman 440 00:25:58,720 --> 00:26:01,450 Bu gerçekten bakarak karmaşık fonksiyonlar o 441 00:26:01,450 --> 00:26:08,110 Birden fazla arguments-- ve bu almak onlarca sadece söyleyerek oftentimes-- olabilir 442 00:26:08,110 --> 00:26:11,140 2 için daha okunabilir eşittir Gelecekte böylece daha sonra size 443 00:26:11,140 --> 00:26:13,020 Eğer ne yaptığınızı bilecek. 444 00:26:13,020 --> 00:26:17,120 >> Yani bu durumda, ben söz 2 3'ten fazladır. 445 00:26:17,120 --> 00:26:18,270 Evet öyle. 446 00:26:18,270 --> 00:26:22,350 Ve benzer, ben sadece kaldırabilirsiniz Bu ve söylemek, 2 den 3 büyüktür 447 00:26:22,350 --> 00:26:23,440 nerede 2 eşittir. 448 00:26:23,440 --> 00:26:26,230 Ve bu da DOĞRU var. 449 00:26:26,230 --> 00:26:26,730 Evet? 450 00:26:26,730 --> 00:26:29,670 >> İZLEYİCİ: Are you satır satır yürütme? 451 00:26:29,670 --> 00:26:30,670 >> DUSTIN TRAN: Evet öyleyim. 452 00:26:30,670 --> 00:26:33,900 Peki ben burada yapıyorum olduğunu Bu metni alarak dokümanımızda 453 00:26:33,900 --> 00:26:39,825 ve rstudio olduğunu hakkında büyük ne Ben sadece bir short-- önemli bir kısayol çalıştırabilirsiniz. 454 00:26:39,825 --> 00:26:41,820 Yani Kontrol girin yapıyorum. 455 00:26:41,820 --> 00:26:44,850 >> Ve sonra, ben alıyorum metin belgesinde çizgi 456 00:26:44,850 --> 00:26:46,710 ve daha sonra konsolda koyarak. 457 00:26:46,710 --> 00:26:50,800 Yani burada söylüyorum, bounded.compare ve ben Kontrol-X yapıyorum. 458 00:26:50,800 --> 00:26:52,540 Ben sadece burada da çalıştırabilirsiniz yapabilirsiniz. 459 00:26:52,540 --> 00:26:54,920 Ve o alacağım Daha sonra çizgi ve buraya koydum. 460 00:26:54,920 --> 00:26:57,900 Ve sonra benzer, ben burada koşmak yapabilirsiniz. 461 00:26:57,900 --> 00:27:04,630 Ve o zaman sadece tanımlama tutacak Böyle konsol içine çizgiler. 462 00:27:04,630 --> 00:27:10,690 >> Ve ayrıca kıvırcık fark ederseniz parantezi sadece C sözdizimi gibi vardır. 463 00:27:10,690 --> 00:27:13,910 x-- ise durum aynı zamanda ise, parantez kullanmak için gidiyoruz ve daha sonra 464 00:27:13,910 --> 00:27:15,350 Başka kullanabilirsiniz. 465 00:27:15,350 --> 00:27:17,496 Başka bir else if olduğunu. 466 00:27:17,496 --> 00:27:21,440 Yani bu x olacak örneğin, bir eşittir. 467 00:27:21,440 --> 00:27:24,190 468 00:27:24,190 --> 00:27:26,350 Ve sonra ben gidiyorum Burada bir şey dönün. 469 00:27:26,350 --> 00:27:29,490 >> Iki farklı olduğuna dikkat edin oluyor burada işler. 470 00:27:29,490 --> 00:27:34,360 Bir Ben belirterek ediyorum burada olduğunu değer TRUE döndürür. 471 00:27:34,360 --> 00:27:35,950 İşte ben sadece x söylüyorum. 472 00:27:35,950 --> 00:27:39,970 Yani R varsayılan genellikle olacak Geçen arguments-- almak 473 00:27:39,970 --> 00:27:43,510 veya kod son satırı almak ve o geri ne olacak. 474 00:27:43,510 --> 00:27:46,920 Yani burada bu aynı Dönüş x yapıyor gibi bir şey. 475 00:27:46,920 --> 00:27:49,450 476 00:27:49,450 --> 00:27:50,540 >> Ve sadece sana göstermek için. 477 00:27:50,540 --> 00:27:54,000 478 00:27:54,000 --> 00:27:57,052 Ve o zaman, sadece böyle çalışacaktır. 479 00:27:57,052 --> 00:27:58,260 Yani bana bu devam edelim. 480 00:27:58,260 --> 00:28:00,630 >> Yani başka. 481 00:28:00,630 --> 00:28:04,060 Ve gerçekten, ben dönebilirsiniz İsterdim şey. 482 00:28:04,060 --> 00:28:06,680 Yani ben bile gerek yok Dönüş Booleans her zaman, 483 00:28:06,680 --> 00:28:08,410 Ben sadece başka bir şey dönebilirsiniz. 484 00:28:08,410 --> 00:28:10,670 Yani dönüş ayı yapabilirsiniz. 485 00:28:10,670 --> 00:28:12,989 >> Yani eşittir x eşitse, o ayıyı geri gidiyor. 486 00:28:12,989 --> 00:28:14,530 Aksi takdirde, DOĞRU dönmek için gidiyor. 487 00:28:14,530 --> 00:28:19,310 Ben de bir vektör yapabilir ya da gerçekten bir şey. 488 00:28:19,310 --> 00:28:22,210 >> Ve normalde statik olarak yazılı dilleri, 489 00:28:22,210 --> 00:28:23,840 Burada bir türünü belirtmek zorundayız. 490 00:28:23,840 --> 00:28:25,750 Ve o sadece bir şey olabilir dikkat edin. 491 00:28:25,750 --> 00:28:32,400 Ve R öyle yeterince zeki sadece bu yapacak ve iyi çalışır. 492 00:28:32,400 --> 00:28:33,620 >> Bu yüzden bana bu açıklayalım. 493 00:28:33,620 --> 00:28:39,460 494 00:28:39,460 --> 00:28:41,230 Üzgünüm oh Unexpected--. 495 00:28:41,230 --> 00:28:44,336 Burada bir kaşlı ayraç olmalıdır. 496 00:28:44,336 --> 00:28:44,836 TAMAM MI. 497 00:28:44,836 --> 00:28:45,336 Serin. 498 00:28:45,336 --> 00:28:52,580 499 00:28:52,580 --> 00:28:54,530 Tamam. 500 00:28:54,530 --> 00:28:58,250 Şimdi en 3 karşılaştıralım ve 3 eşittir. 501 00:28:58,250 --> 00:29:01,860 Yani return-- gerekir değer ayı Evet--. 502 00:29:01,860 --> 00:29:06,740 >> Peki şimdi daha genel bir şey gibi ne diğer veri yapıları hakkında. 503 00:29:06,740 --> 00:29:09,110 Yani bu işlevi var. 504 00:29:09,110 --> 00:29:15,360 Bu, herhangi bir tür üzerinde çalışmak için gidiyor 3 ya da herhangi bir sayısal değer gibi, 505 00:29:15,360 --> 00:29:17,500 diğer bir deyişle, çift. 506 00:29:17,500 --> 00:29:19,330 >> Ama bir vektör gibi bir şey hakkında ne. 507 00:29:19,330 --> 00:29:27,750 Peki bunu sanıyor- eğer ben olur 6 diyelim ki, val, 4 atamak olacak. 508 00:29:27,750 --> 00:29:31,640 Yani bu, bu dönerseniz 4, 5, 6 bir vektördür. 509 00:29:31,640 --> 00:29:34,935 >> Şimdi ne görelim Ben yaparsam val bounded.compare. 510 00:29:34,935 --> 00:29:37,680 511 00:29:37,680 --> 00:29:42,450 Yani bu sana 1251 15 verecek. 512 00:29:42,450 --> 00:29:46,440 Diğer bir deyişle Yani, diyor Bu durumda bakarsanız 513 00:29:46,440 --> 00:29:50,040 bu nedenle X daha az olduğunu söyler Bir ya da bir şey daha. 514 00:29:50,040 --> 00:29:51,880 Yani bu hafifçe kafa karıştırıcı çünkü şimdi 515 00:29:51,880 --> 00:29:53,379 Sadece oluyor bilmiyorum. 516 00:29:53,379 --> 00:29:58,690 Yani gerçekten bir şey sanırım Sadece ayıklamak için çalışıyor hakkında iyi 517 00:29:58,690 --> 00:30:04,600 Sadece val büyüktür yapabilirsiniz olduğunu Bir ve orada daha ne olduğunu görün. 518 00:30:04,600 --> 00:30:09,720 >> Peki val-- varsayılan 5 öylesine tarafından Sadece 5'ten büyük Val yapalım. 519 00:30:09,720 --> 00:30:14,280 Yani bu bir vektör YANLIŞ YANLIŞ DOĞRU olduğunu. 520 00:30:14,280 --> 00:30:17,206 Yani şimdi bakıyoruz zaman Bu, o olmadığını söylemek için gidiyor, 521 00:30:17,206 --> 00:30:20,080 ve sonra bu vermek için gidiyor false false bir vektör DOĞRU olduğunu. 522 00:30:20,080 --> 00:30:23,450 >> Yani R, R içine bu geçirdiğinizde Eğer ne yaptığınızı hiçbir fikri yok. 523 00:30:23,450 --> 00:30:26,650 O bir single'ı bekliyor Çünkü Bir Boolean değerdir, ve şimdi 524 00:30:26,650 --> 00:30:29,420 bunu Booleans bir vektör veriyoruz. 525 00:30:29,420 --> 00:30:31,970 Yani varsayılan olarak, R, sadece bir ne halt diyecektim, 526 00:30:31,970 --> 00:30:35,440 Ben sen varsaymak gidiyorum Burada ilk elemanı alacak. 527 00:30:35,440 --> 00:30:38,320 Yani ben gidiyorum say-- gidiyorum Bu YANLIŞ olduğunu varsaymak. 528 00:30:38,320 --> 00:30:40,890 Yani demek oluyor hayır, bu doğru değil. 529 00:30:40,890 --> 00:30:45,246 >> Benzer şekilde, gidiyor val bir eşittir olacak. 530 00:30:45,246 --> 00:30:47,244 Hayır, 5 üzgünüm. 531 00:30:47,244 --> 00:30:48,910 Ve aynı zamanda da yanlış olacak. 532 00:30:48,910 --> 00:30:52,410 Bu yüzden, hayır demek için gidiyor bunun yanı sıra o yüzden DOĞRU değil 533 00:30:52,410 --> 00:30:53,680 Bu sonuncuyu geri gidiyor. 534 00:30:53,680 --> 00:30:56,420 535 00:30:56,420 --> 00:31:01,360 >> Peki bu iyi bir şey ya da kötü ya bir şey, bunu görmek ne kadar bağlı. 536 00:31:01,360 --> 00:31:05,104 Sen ne zaman Çünkü bu işlevleri oluştururken, 537 00:31:05,104 --> 00:31:06,770 aslında neler olduğunu bilmiyorum. 538 00:31:06,770 --> 00:31:10,210 Yani bazen bir hata isterdim, ya da belki sadece bir uyarı istiyorum. 539 00:31:10,210 --> 00:31:12,160 Bu durumda, R, bunu yapmaz. 540 00:31:12,160 --> 00:31:14,300 Yani gerçekten kalmış Eğer kapalı dayalı ne 541 00:31:14,300 --> 00:31:17,310 Eğer dili düşünüyorum Bu durumda yapmanız gereken 542 00:31:17,310 --> 00:31:22,920 Eğer boolean bir vektör geçmek durumunda Bir durumda eğer yapıyoruz. 543 00:31:22,920 --> 00:31:31,733 >> Yani orijinal olduğunu varsayalım bir else if ile DOĞRU dönmek ve sen 544 00:31:31,733 --> 00:31:34,190 YANLIŞ dönmek için gidiyoruz. 545 00:31:34,190 --> 00:31:39,300 Soyutlama Yani tek yönlü Bu ben demek ki 546 00:31:39,300 --> 00:31:41,530 Hatta bu koşullu bir şey gerekmez. 547 00:31:41,530 --> 00:31:47,220 Yapabileceğim başka bir şey sadece bir değerleri kendileri dönen. 548 00:31:47,220 --> 00:31:53,240 Yani fark ederseniz, eğer val 5'ten büyük yapmak, 549 00:31:53,240 --> 00:31:56,350 Bu bir geri gidiyor vektör YANLIŞ YANLIŞ DOĞRU. 550 00:31:56,350 --> 00:31:58,850 >> Belki de bu ne bounded.compare için istiyorum. 551 00:31:58,850 --> 00:32:02,940 Sen boolean bir vektör dönmek istiyor nerede değerlerin her karşılaştırır 552 00:32:02,940 --> 00:32:04,190 kendilerine. 553 00:32:04,190 --> 00:32:11,165 Yani sadece bounded.compare yapabilirsiniz fonksiyon x bir 5 eşittir. 554 00:32:11,165 --> 00:32:13,322 555 00:32:13,322 --> 00:32:15,363 Ve sonra yerine yapıyor Bu else if koşulu, 556 00:32:15,363 --> 00:32:21,430 Ben sadece geri dönmek için gidiyorum x, 5'den daha büyüktür. 557 00:32:21,430 --> 00:32:23,620 Yani o zaman, eğer doğruysa TRUE dönmek için gidiyor. 558 00:32:23,620 --> 00:32:26,830 O değilse Ve sonra, bu kadar YANLIŞ dönmek için gidiyoruz. 559 00:32:26,830 --> 00:32:30,880 >> Ve bunun için çalışacak Bu yapıların herhangi biri olabilir. 560 00:32:30,880 --> 00:32:41,450 Yani 1 6 veya 9 c bounded.compare olabilir ve sonra ben, bir 6 eşittir demek için gidiyorum 561 00:32:41,450 --> 00:32:42,799 örneğin. 562 00:32:42,799 --> 00:32:44,840 Ve o gidiyor size doğru Boole vermek 563 00:32:44,840 --> 00:32:48,240 Eğer tasarlarken vektör. 564 00:32:48,240 --> 00:32:50,660 >> Yani bu sadece fonksiyonlar ve şimdi bana sadece izin 565 00:32:50,660 --> 00:32:54,980 bazı interaktif görseller göstermektedir. 566 00:32:54,980 --> 00:32:59,700 Ben aslında var sanmıyorum Wi-Fi burada çok bana sadece devam edelim 567 00:32:59,700 --> 00:33:01,970 ve sanırım bu bir atlayın. 568 00:33:01,970 --> 00:33:05,260 Serin >> Ama bir şey gerçi olduğunu eğer sadece 569 00:33:05,260 --> 00:33:09,600 Bir demet test etmek istiyorum Farklı veri komutları 570 00:33:09,600 --> 00:33:13,320 Farklı veri setlerinin bir demet var zaten R. önceden yüklenir 571 00:33:13,320 --> 00:33:15,770 Yani bunlardan biri İris veri kümesi denir. 572 00:33:15,770 --> 00:33:18,910 Bu en iyi bilinen biridir Makine öğrenme olanlar. 573 00:33:18,910 --> 00:33:23,350 Genellikle sadece çeşit yapacağım kod çalışır eğer test durumları görmek için. 574 00:33:23,350 --> 00:33:27,520 Yani sadece iris ne olduğunu kontrol edelim. 575 00:33:27,520 --> 00:33:33,130 >> Yani bu şey gidiyor Bir veri çerçevesi olmak. 576 00:33:33,130 --> 00:33:36,000 Ve uzun çünkü tür Ben sadece iris yazdırılır. 577 00:33:36,000 --> 00:33:38,810 Bu tüm şey yazdırarak ediyor. 578 00:33:38,810 --> 00:33:42,830 Yani bütün bu farklı isimler alır. 579 00:33:42,830 --> 00:33:45,505 Yani iris bir koleksiyon Farklı çiçekler. 580 00:33:45,505 --> 00:33:48,830 Bu durumda, bu söylüyor bunu türleri, 581 00:33:48,830 --> 00:33:54,760 Tüm bu farklı genişlikleri ve sepal ve petal uzunlukları. 582 00:33:54,760 --> 00:33:58,880 >> Ve böylece normalde, eğer Eğer, irisini yazdırmak istiyorum 583 00:33:58,880 --> 00:34:03,680 Örneğin, bunu yapmak istemiyorum Bu devralmak çünkü tüm bu yapmak 584 00:34:03,680 --> 00:34:05,190 tüm konsol. 585 00:34:05,190 --> 00:34:09,280 Gerçekten Yani bir şey güzel kafa fonksiyonudur. 586 00:34:09,280 --> 00:34:12,929 Yani sadece başını yaparsanız iris, bu size vereceğim 587 00:34:12,929 --> 00:34:17,389 İlk beş satır, ya da altı sanırım. 588 00:34:17,389 --> 00:34:19,909 Ve sonra iyi, size sadece burada belirtebilirsiniz. 589 00:34:19,909 --> 00:34:22,914 Yani 20-- Bu verecek Eğer ilk 20 satır. 590 00:34:22,914 --> 00:34:24,830 Ve aslında nazikti Bu Bunun şaşırttı 591 00:34:24,830 --> 00:34:28,770 Bana altı yüzden beni go ahead izin verdi ve üzgünüm, iris-- veya kafasını kontrol. 592 00:34:28,770 --> 00:34:31,699 593 00:34:31,699 --> 00:34:34,960 Ve burada verecek Eğer dokümantasyon 594 00:34:34,960 --> 00:34:37,960 değer kafa yapar ne. 595 00:34:37,960 --> 00:34:40,839 Yani ilk döndürür ya da bir nesnenin son. 596 00:34:40,839 --> 00:34:42,630 Ve sonra ben gidiyorum varsayılan bak. 597 00:34:42,630 --> 00:34:47,340 Ve sonra varsayılan diyor yöntem kafa, x ve n 6L eşittir. 598 00:34:47,340 --> 00:34:50,620 Yani bu ilk altı elemanları döndürür. 599 00:34:50,620 --> 00:34:55,050 Ve burada fark benzer, ben n belirtmek yoktu 6 eşittir. 600 00:34:55,050 --> 00:34:56,840 Varsayılan olarak altı kullandığı, sanırım. 601 00:34:56,840 --> 00:35:00,130 Ben istiyorum Ve sonra, belli bir belirtmek için değeri, o zaman ben de bu görebilirsiniz. 602 00:35:00,130 --> 00:35:02,970 603 00:35:02,970 --> 00:35:10,592 >> Yani bazı basit komutlar ve Burada iyi sadece-- başka biri, 604 00:35:10,592 --> 00:35:12,550 Ben bu aslında can-- Biraz daha karmaşık, 605 00:35:12,550 --> 00:35:17,130 ama bu sadece sınıf alacak İris veri kümesi her sütunun. 606 00:35:17,130 --> 00:35:20,910 Yani bu, bu ne her göstereceğim sütun türleri açısından bulunmaktadır. 607 00:35:20,910 --> 00:35:23,665 Yani sepal uzunluğu, sayısal sepal genişliği sayısal olduğunu. 608 00:35:23,665 --> 00:35:26,540 Tüm bu değerler sadece sayısal olarak Bu verilerden söyleyebilirim çünkü 609 00:35:26,540 --> 00:35:29,440 bunlar yapı tüm sayısal gidiyor. 610 00:35:29,440 --> 00:35:34,310 >> Ve Türler sütunu Bir faktör olacak. 611 00:35:34,310 --> 00:35:37,270 Yani normalde, bunu düşünürdüm Bu bir karakter dizesi gibi. 612 00:35:37,270 --> 00:35:48,830 Ama sadece irisSpecies yaparsanız, ve sonra ben, kafa 5 yapacağım 613 00:35:48,830 --> 00:35:51,820 ve bu yazdırmak için gidiyor İlk beş değerleri üzerinden. 614 00:35:51,820 --> 00:35:54,150 >> Ve bu seviyelerde fark. 615 00:35:54,150 --> 00:35:58,870 Yani bu saying-- olan R yoludur kategorik değişkenler sahip. 616 00:35:58,870 --> 00:36:03,765 Yani yerine sadece karakter dizeleri sahip, 617 00:36:03,765 --> 00:36:06,740 bu seviyeleri belirterek vardır Bunlardan hangisinin. 618 00:36:06,740 --> 00:36:12,450 >> Yani irisSpecies 1 diyelim. 619 00:36:12,450 --> 00:36:17,690 Yani burada yapmak istediğim ben ise Bu Türler sütun subsetting. 620 00:36:17,690 --> 00:36:21,480 Yani bu alır Türler kolon ve ardından 621 00:36:21,480 --> 00:36:23,820 bu endeksler ilk elemanı almak için. 622 00:36:23,820 --> 00:36:27,140 Yani bu sana setosa vermelidir. 623 00:36:27,140 --> 00:36:28,710 Ve aynı zamanda burada size seviyeleri verir. 624 00:36:28,710 --> 00:36:32,812 >> Bu yüzden de karşılaştırabilirsiniz karakter setosa bu 625 00:36:32,812 --> 00:36:34,645 ve bu gidiş değil DOĞRU biri çünkü 626 00:36:34,645 --> 00:36:37,940 diğerinden daha farklı bir türüdür. 627 00:36:37,940 --> 00:36:40,590 Ya ben Ar çünkü doğrudur sanırım Bundan daha zeki olduğunu. 628 00:36:40,590 --> 00:36:45,420 Ve daha sonra bu ve bakar belki bu ne istediğiniz, diyor. 629 00:36:45,420 --> 00:36:51,860 Yani karakter söylemek için gidiyor Dize setosa bu aynıdır. 630 00:36:51,860 --> 00:37:01,290 Ve sonra benzer yapabilirsiniz Ayrıca sadece bu yüzden olduğu gibi bu kapmak. 631 00:37:01,290 --> 00:37:05,580 >> Yani sadece bazı tür veri kümesi hızlı komutları. 632 00:37:05,580 --> 00:37:08,030 Yani burada bazı veri arama var. 633 00:37:08,030 --> 00:37:11,360 Yani bu biraz daha veri analizi ile ilgili. 634 00:37:11,360 --> 00:37:18,340 Bu, bazı alınır Berkeley için Ar bootcamp. 635 00:37:18,340 --> 00:37:20,790 >> Yabancı Yani kütüphane. 636 00:37:20,790 --> 00:37:24,880 Yani bir yüklemek için gidiyorum yabancı denir kütüphane. 637 00:37:24,880 --> 00:37:32,460 Yani bu bana verecek read.dta bu yüzden bu veri kümesi olduğunu varsayalım. 638 00:37:32,460 --> 00:37:39,000 Bu, mevcut saklanır Benim konsol çalışma dizini. 639 00:37:39,000 --> 00:37:42,190 Yani sadece görelim ne çalışma dizin. 640 00:37:42,190 --> 00:37:44,620 >> Yani burada benim çalışma dizini var. 641 00:37:44,620 --> 00:37:50,040 Ve nokta verilerini, bu okuma şey, bu dosyayı söylüyor 642 00:37:50,040 --> 00:37:54,650 veri klasöründe bulunan Bu geçerli çalışma dizini. 643 00:37:54,650 --> 00:38:00,520 Bu değildir read.dta Bir varsayılan komut. 644 00:38:00,520 --> 00:38:02,760 Ben zaten yüklenir sanırım. 645 00:38:02,760 --> 00:38:04,750 IEI Ben zaten bu yüklenmiş üstlendi. 646 00:38:04,750 --> 00:38:08,115 >> Ama bu kadar read.dta gitmiyor Bir varsayılan komut olmak. 647 00:38:08,115 --> 00:38:11,550 Ve bu sahip olacak yüzden Bu kütüphanede yüklemek için package-- 648 00:38:11,550 --> 00:38:14,500 Bu paket yabancı denir. 649 00:38:14,500 --> 00:38:16,690 Ve sen yoksa paket, sanırım 650 00:38:16,690 --> 00:38:19,180 Yabancı yerleşik olanlardan biridir. 651 00:38:19,180 --> 00:38:31,150 Aksi takdirde, siz de yapabilirsiniz install.packages yapmak 652 00:38:31,150 --> 00:38:33,180 ve bu paketi yüklemek olacaktır. 653 00:38:33,180 --> 00:38:36,878 Ve bu hayır, size R. Uh verecektir. 654 00:38:36,878 --> 00:38:39,830 655 00:38:39,830 --> 00:38:43,140 Ve sonra ben sadece durdurmak için gidiyorum Bu zaten o var çünkü. 656 00:38:43,140 --> 00:38:46,920 >> Ama Ar ilgili gerçekten güzel ne paket yönetimi olduğunu 657 00:38:46,920 --> 00:38:48,510 Sistem çok şık. 658 00:38:48,510 --> 00:38:52,470 Her şeyi saklamak Çünkü Gerçekten güzel senin için. 659 00:38:52,470 --> 00:38:59,780 Yani bu durumda, depolamak olacak içeri, ben inanıyorum, burada bu kütüphane. 660 00:38:59,780 --> 00:39:02,390 >> Yani her zaman istediğiniz Yeni paketlerini yüklemek, 661 00:39:02,390 --> 00:39:04,980 o kadar basit install.packages yapıyor 662 00:39:04,980 --> 00:39:07,500 ve R tüm yönetecek Sizin için paketler. 663 00:39:07,500 --> 00:39:12,900 Yani bir şey yapmak zorunda değilsiniz Harici bir paket var Python, 664 00:39:12,900 --> 00:39:15,330 kağıt gibi yöneticileri Anaconda nerede sen 665 00:39:15,330 --> 00:39:18,310 Yüklemek doing-- Python dışında paketleri 666 00:39:18,310 --> 00:39:20,940 ve daha sonra bunları kendiniz çalıştırmayı deneyin. 667 00:39:20,940 --> 00:39:22,210 Yani bu gerçekten güzel bir yoldur. 668 00:39:22,210 --> 00:39:25,590 >> Ve install.packages internet gerektirir. 669 00:39:25,590 --> 00:39:31,950 Bir sunucudan alır ve depo o 670 00:39:31,950 --> 00:39:33,960 toplar bütün paketleri CRAN olarak adlandırılır. 671 00:39:33,960 --> 00:39:40,690 Ve aynaya hangi tür belirtebilirsiniz Eğer paketleri indirmek istiyorum. 672 00:39:40,690 --> 00:39:43,420 >> Yani burada ben bu dataset alıyorum. 673 00:39:43,420 --> 00:39:46,240 Bu fonksiyonu kullanarak bunu okuyorum. 674 00:39:46,240 --> 00:39:49,360 Bu yüzden bana go ahead ve bu yapalım. 675 00:39:49,360 --> 00:39:52,900 >> Yani varsayalım Bu veri kümesi var 676 00:39:52,900 --> 00:39:55,550 ve kesinlikle var ne hiçbir fikrim yok. 677 00:39:55,550 --> 00:39:58,560 Ve bu aslında gelir oldukça sık sanayide 678 00:39:58,560 --> 00:40:00,910 sadece bu var burada ton ve dağınık şeyler ton 679 00:40:00,910 --> 00:40:02,890 ve onlar inanılmaz etiketsiz konum. 680 00:40:02,890 --> 00:40:06,380 Yani burada bu var veri kümesi ve ben bilmiyorum 681 00:40:06,380 --> 00:40:08,400 ne yani ben sadece kulüpler bunu kontrol etmek gösteren. 682 00:40:08,400 --> 00:40:10,620 >> Yani ilk baş yapacağım. 683 00:40:10,620 --> 00:40:14,190 Bu yüzden ilk altı kontrol Bu veri kümesi ne sütunları. 684 00:40:14,190 --> 00:40:21,730 Yani bu daha sonra devlet, pres04 ve bir sütun tüm bu farklı sıralama. 685 00:40:21,730 --> 00:40:25,612 Ve ne ilginç Burada, sanırım, senin olduğunu 686 00:40:25,612 --> 00:40:27,945 Bu görünüyor farz ediyorum seçim çeşit gibi. 687 00:40:27,945 --> 00:40:30,482 688 00:40:30,482 --> 00:40:32,190 Ve ben sadece gelen tahmin dosyasına bakarak 689 00:40:32,190 --> 00:40:41,070 isim, bu koleksiyonun çeşit adaylar veya seçmen ilgili verilerin 690 00:40:41,070 --> 00:40:44,920 kim Belirli başkanları için oy veya başkan adayları 691 00:40:44,920 --> 00:40:46,550 2004 seçimleri için. 692 00:40:46,550 --> 00:40:52,920 >> Yani burada değerleri 1, 2 böylece depolama tek yönlü 693 00:40:52,920 --> 00:40:56,540 Başkan adayları onların isimleri. 694 00:40:56,540 --> 00:40:59,780 Bu durumda, bu gibi görünüyor onlar sadece tamsayı değerlerini konum. 695 00:40:59,780 --> 00:41:04,030 2004 Yani, Bush oldu Kerry karşı inanıyorum. 696 00:41:04,030 --> 00:41:09,010 Ve şimdi, diyelim ki sadece bilmiyorum diyelim Bush veya 2 1 tekabül olsun 697 00:41:09,010 --> 00:41:11,703 Kerry veya karşılık gelen ve böylece ve benzeri, değil mi? 698 00:41:11,703 --> 00:41:15,860 >> Ve bu sadece benim için, bir, oldukça yaygın bir problemdir. 699 00:41:15,860 --> 00:41:18,230 Yani bu durumda ne yapabilirim? 700 00:41:18,230 --> 00:41:20,000 Yani tüm bu diğer şeyleri kontrol edelim. 701 00:41:20,000 --> 00:41:22,790 >> Devlet, ben bu varsayarak yaşıyorum Farklı devletler geliyor. 702 00:41:22,790 --> 00:41:25,100 partyid, gelir. 703 00:41:25,100 --> 00:41:27,710 En partyid bakalım. 704 00:41:27,710 --> 00:41:32,800 Yani belki yapabileceğiniz bir şey gözlemler her bakmak 705 00:41:32,800 --> 00:41:36,250 Bu Cumhuriyet bir partyid var Demokrat falan ya. 706 00:41:36,250 --> 00:41:38,170 Yani sadece ne partyid bakalım. 707 00:41:38,170 --> 00:41:41,946 >> Yani almaya gidiyorum dat ve sonra ben gidiyorum 708 00:41:41,946 --> 00:41:47,960 Bu dolar işareti yapmak Ben daha önce yaptım operatör 709 00:41:47,960 --> 00:41:50,770 ve bu gidiyor Bu sütuna alt bileşenlerine. 710 00:41:50,770 --> 00:41:57,760 Ve sonra ben bu baş gidiyorum 20, sadece bu neye benzediğini görmek için. 711 00:41:57,760 --> 00:42:00,170 >> Yani bu UA sadece bir demet. 712 00:42:00,170 --> 00:42:02,800 Yani diğer bir deyişle, var Bu adamlar hakkında veri eksik. 713 00:42:02,800 --> 00:42:08,100 Ama aynı zamanda bu fark DAT partyid bir faktördür 714 00:42:08,100 --> 00:42:10,030 bu yüzden bu size farklı kategoriler verir. 715 00:42:10,030 --> 00:42:14,170 Bu yüzden, diğer bir deyişle partyid sunar Bağımsız Demokrat, Cumhuriyetçi, 716 00:42:14,170 --> 00:42:16,640 ya da başka bir şey. 717 00:42:16,640 --> 00:42:23,940 >> Yani go ahead ve atalım izin bkz bu o-- oh, Tamam hangi. 718 00:42:23,940 --> 00:42:28,480 Yani subsetine gidiyorum Daha sonra partyid ve 719 00:42:28,480 --> 00:42:32,780 olanlar hangi bakmak Demokratla, örneğin. 720 00:42:32,780 --> 00:42:37,150 Bu, size bir Boole verecek doğruları ve FALSEs büyük bir Boole. 721 00:42:37,150 --> 00:42:41,630 >> Ve şimdi, en istediğim diyelim Bu adamlar subsetine. 722 00:42:41,630 --> 00:42:47,260 Yani bu benim dat almaya gidiyor ve alt kümesi hangisi gözlemler için 723 00:42:47,260 --> 00:42:48,910 partyid eşittir sahip Demokrat eşittir. 724 00:42:48,910 --> 00:42:52,830 725 00:42:52,830 --> 00:42:55,180 Ve bu, çünkü oldukça uzun Onların o kadar çok var. 726 00:42:55,180 --> 00:42:59,060 Yani şimdi, ben 20 bu kafa gidiyorum. 727 00:42:59,060 --> 00:43:05,690 728 00:43:05,690 --> 00:43:11,270 Fark olarak >> Ve, eşittir eşittir sen ki ilginç 729 00:43:11,270 --> 00:43:13,250 already-- ayrıca Nas dahil ediyoruz. 730 00:43:13,250 --> 00:43:19,010 Yani bu durumda, yine alınamıyor herhangi bir bilgi şimdi Nas var çünkü 731 00:43:19,010 --> 00:43:22,650 ve sadece görmek istiyorum hangi Gözlem Demokrat uygun 732 00:43:22,650 --> 00:43:24,670 ve bu eksik değil kendilerini değerleri. 733 00:43:24,670 --> 00:43:27,680 Peki bu UA kurtulmak istiyorsunuz? 734 00:43:27,680 --> 00:43:36,410 >> Yani burada sadece yukarı tuşunu kullanarak yaşıyorum benim imleç ve sonra etrafında hareket söyleyerek. 735 00:43:36,410 --> 00:43:39,778 Ve sonra burada ben sadece gidiyorum is.na datpartyid demek. 736 00:43:39,778 --> 00:43:48,970 737 00:43:48,970 --> 00:43:52,720 Yani bu ve ve alacak iki farklı mantıksal vektörler 738 00:43:52,720 --> 00:43:57,160 ve olacak demek DOĞRU ve örneğin YANLIŞ. 739 00:43:57,160 --> 00:43:59,190 Yani bu bileşeni-bilge yapacak. 740 00:43:59,190 --> 00:44:02,910 Yani burada take söylüyorum veri çerçevesi, alt kümesi 741 00:44:02,910 --> 00:44:10,170 Demokrat uygun olanlar, ve NA olmadığını bunlardan herhangi çıkarın. 742 00:44:10,170 --> 00:44:13,540 >> Peki bu will-- gerekir Sana bir şey vermek. 743 00:44:13,540 --> 00:44:16,540 744 00:44:16,540 --> 00:44:17,600 En is.na. görelim 745 00:44:17,600 --> 00:44:24,670 746 00:44:24,670 --> 00:44:27,690 En is.na datpartyid deneyelim. 747 00:44:27,690 --> 00:44:36,290 748 00:44:36,290 --> 00:44:45,290 Ve bu sen-- vermelidir Sadece bir Boole vektör sorry--. 749 00:44:45,290 --> 00:44:49,260 Ve sonra, bu kadar uzun çünkü, Ben 20 subsetine gidiyorum. 750 00:44:49,260 --> 00:44:49,760 TAMAM MI. 751 00:44:49,760 --> 00:44:51,570 Yani bu çalışması gerekir. 752 00:44:51,570 --> 00:44:54,700 >> Ve bu da doğruları olacaktır. 753 00:44:54,700 --> 00:45:01,830 Ah, işte benim hata olduğunu Ben-- Ben C ++ ve R birbirinin yüzden yapmak kullanmak 754 00:45:01,830 --> 00:45:03,590 Bu hata her zaman. 755 00:45:03,590 --> 00:45:05,807 ve operatörüdür Aslında istediğiniz bir. 756 00:45:05,807 --> 00:45:08,140 Sen iki kullanmak istemiyorum ve işaretleri, sadece bir tane. 757 00:45:08,140 --> 00:45:14,970 758 00:45:14,970 --> 00:45:17,010 TAMAM MI. 759 00:45:17,010 --> 00:45:18,140 >> Peki bakalım. 760 00:45:18,140 --> 00:45:20,930 761 00:45:20,930 --> 00:45:23,920 Yani biz altkümelenir partyid onlar demokrat olduğunu nerede 762 00:45:23,920 --> 00:45:25,300 ve onlar değerleri eksik değil. 763 00:45:25,300 --> 00:45:27,690 Ve şimdi bakalım oldukları için oy olanlar. 764 00:45:27,690 --> 00:45:31,530 Yani çoğu gibi görünüyor Bunlardan 1 oy. 765 00:45:31,530 --> 00:45:36,090 Yani ben önde gitmek için gidiyorum ve bu Kerry olduğunu söylüyorlar. 766 00:45:36,090 --> 00:45:39,507 >> Ve benzer şekilde, yapabilirsiniz Ayrıca Cumhuriyet gitmek 767 00:45:39,507 --> 00:45:41,090 ve umarım, bu size 2 vermelidir. 768 00:45:41,090 --> 00:45:49,730 769 00:45:49,730 --> 00:45:51,770 Farklı sütun sadece bir avuç. 770 00:45:51,770 --> 00:45:53,070 Ve gerçekten de, bu 2 var. 771 00:45:53,070 --> 00:45:55,750 Yani, tüm Cumhuriyetçi partyid çoğu 2 için oy veriyor. 772 00:45:55,750 --> 00:45:58,390 >> Yani sadece gibi görünüyor Bu bakarak, 773 00:45:58,390 --> 00:46:00,600 Cumhuriyetçi olacak Bir very-- veya partyid 774 00:46:00,600 --> 00:46:02,790 Bir çok olacak belirlenmesinde büyük faktör 775 00:46:02,790 --> 00:46:05,420 Hangi aday they oy gidiyor. 776 00:46:05,420 --> 00:46:07,120 Ve bu genel kuşkusuz doğrudur. 777 00:46:07,120 --> 00:46:10,139 Ve bu, sizin maçlar sezgi, tabii. 778 00:46:10,139 --> 00:46:11,930 Yani ben gibi görünüyor böylece zaman tükeniyor 779 00:46:11,930 --> 00:46:17,040 bana sadece önde gitmeli izin ve bazı hızlı görüntüleri göstermek. 780 00:46:17,040 --> 00:46:21,120 Yani burada biraz var şey Daha fazla görselleştirme ile komplike. 781 00:46:21,120 --> 00:46:26,450 Yani bu durumda bu bir çok, Sadece kontrol basit analizi ne 782 00:46:26,450 --> 00:46:28,500 '04 başkanıdır. 783 00:46:28,500 --> 00:46:33,920 >> Bu durumda Yani, seni diyelim Bu soruyu cevaplamak istedim. 784 00:46:33,920 --> 00:46:38,540 Bu yüzden oylama bilmek istedim varsayalım 2004 başkanlık seçiminde davranış 785 00:46:38,540 --> 00:46:41,170 ve bu yarışta göre değişir nasıl. 786 00:46:41,170 --> 00:46:44,380 Yani sadece sen istiyorsun , oylama davranışı görmek 787 00:46:44,380 --> 00:46:47,860 ancak her subsetine istiyorum ırk ve tür olduğunu özetlemek. 788 00:46:47,860 --> 00:46:50,770 Ve sadece söyleyebilirim Bu karmaşık gösterimde tarafından 789 00:46:50,770 --> 00:46:52,580 Bu o tür puslu oluyor. 790 00:46:52,580 --> 00:46:56,390 Daha gelişmiş Ar >> Yani bir Son tür de var paketler 791 00:46:56,390 --> 00:47:00,070 dplyr olarak adlandırılır. 792 00:47:00,070 --> 00:47:03,060 Yani burada bu biridir. 793 00:47:03,060 --> 00:47:08,080 Ve ggg-- ggplot2 sadece güzel Daha iyi görselleştirme yapmanın yolu 794 00:47:08,080 --> 00:47:09,400 Yerleşik bir daha. 795 00:47:09,400 --> 00:47:11,108 >> Yani yüklemek için gidiyorum Bu iki kütüphaneler. 796 00:47:11,108 --> 00:47:13,200 797 00:47:13,200 --> 00:47:16,950 Ve sonra, ben gidiyorum önde ve bu komutu çalıştırın. 798 00:47:16,950 --> 00:47:19,050 Sen sadece bir kara kutu olarak bu davranabilirsiniz. 799 00:47:19,050 --> 00:47:23,460 >> Ne oluyor var bu boru olduğunu Operatör, bu argüman geçiyor 800 00:47:23,460 --> 00:47:24,110 Burada içine. 801 00:47:24,110 --> 00:47:28,070 Yani dat grubu tarafından söylüyorum ırk ve ardından cumhurbaşkanı 04. 802 00:47:28,070 --> 00:47:31,530 Ve sonra, bütün bu diğer komutlar filtreleme ve daha sonra özetleme olan 803 00:47:31,530 --> 00:47:34,081 nerede sayısını yapıyorum ve sonra ben burada komplo ediyorum. 804 00:47:34,081 --> 00:47:39,980 805 00:47:39,980 --> 00:47:42,500 Serin Tamam. 806 00:47:42,500 --> 00:47:44,620 Yani öncesinde gidelim ve Bu neye benzediğini görmek. 807 00:47:44,620 --> 00:47:52,280 808 00:47:52,280 --> 00:47:57,290 >> Peki burada oluyor ki I Sadece o ırklar ve her çizilen 809 00:47:57,290 --> 00:47:59,670 oldukları için oy olanlar. 810 00:47:59,670 --> 00:48:03,492 Ve bu iki farklı değerleri 2 ve 1 gelmektedir. 811 00:48:03,492 --> 00:48:05,325 Daha olmak istiyorsanız Zarif, siz de yapabilirsiniz 812 00:48:05,325 --> 00:48:11,770 sadece 2 Kerry-- ya da belirtmek 2 Bush ve daha sonra 1 Kerry. 813 00:48:11,770 --> 00:48:13,700 Ve ayrıca olabilir sizin efsane o. 814 00:48:13,700 --> 00:48:17,410 >> Ve aynı zamanda bu çubuk grafikler ayırabilirsiniz. 815 00:48:17,410 --> 00:48:19,480 Bir şey olduğundan Bu, dikkat ederseniz, 816 00:48:19,480 --> 00:48:24,560 Bu tanımlamak çok kolay değil Bu iki değerler daha büyüktür. 817 00:48:24,560 --> 00:48:27,920 Yani bir şey isterdim yapmak bu mavi bölgeyi take 818 00:48:27,920 --> 00:48:31,855 ve sadece sizin işte o üzerinde hareket yan bu iki yan karşılaştırabilirsiniz. 819 00:48:31,855 --> 00:48:34,480 Ve ben o bir şey sanırım Şu anda yapmak için zaman yok, 820 00:48:34,480 --> 00:48:36,660 ama bu da yapmak çok kolay. 821 00:48:36,660 --> 00:48:40,310 Sadece içine bakabilirsiniz ggplot adam sayfaları. 822 00:48:40,310 --> 00:48:47,170 Yani gibi ggplot yapabilirsiniz Bu ve bu adam sayfaya okuyun. 823 00:48:47,170 --> 00:48:51,920 >> Yani sadece hızlı bir şekilde bana izin bazı güzel şeyler gösteriyor. 824 00:48:51,920 --> 00:48:57,610 En önde gidin ve sadece bir amaçlara yönelik gidelim Makine öğrenme uygulaması. 825 00:48:57,610 --> 00:49:02,450 Yani bu üç var diyelim paketleri yüzden bu yüklemek için gidiyorum. 826 00:49:02,450 --> 00:49:05,500 827 00:49:05,500 --> 00:49:09,170 Yani bu sadece bazı yazdırır bilgiler şey yüklü sonra. 828 00:49:09,170 --> 00:49:15,220 Yani bu read.csv söylüyorum, Bu veri kümesi, ve şimdi 829 00:49:15,220 --> 00:49:18,940 Ben gitmek önde ve bakmak ve gidiyorum Bu veri kümesi içinde ne olduğunu görmek. 830 00:49:18,940 --> 00:49:22,080 >> İlk 20 gözlemler Yani. 831 00:49:22,080 --> 00:49:27,190 Yani sadece Yani X1, X2, ve Y. var Bu değerlerin bir grup gibi görünüyor 832 00:49:27,190 --> 00:49:31,640 belki 20 ila 80 ya da öylesine kadar vardır. 833 00:49:31,640 --> 00:49:37,700 Ve bundan sonra benzer şekilde X2 ve daha sonra Bu Y etiketleri 0 ve 1 gibi görünüyor. 834 00:49:37,700 --> 00:49:49,500 >> Bu doğrulamak için, elimden Sadece özet verileri X1 yapmak. 835 00:49:49,500 --> 00:49:51,660 Sonra Benzer için Tüm bu diğer sütunlar. 836 00:49:51,660 --> 00:49:55,300 Yani özet hızlı bir şekilde biridir Sadece size hızlı değerlerini gösteren. 837 00:49:55,300 --> 00:49:56,330 Ah, üzgünüm. 838 00:49:56,330 --> 00:49:58,440 Bu, bir Y olmalıdır 839 00:49:58,440 --> 00:50:03,420 Yani bu durumda >> verir kantilleri, medyan, hem de maxes. 840 00:50:03,420 --> 00:50:07,130 Bu durumda, VeriY görebilirsiniz sadece 0 ve 1 olacak ki. 841 00:50:07,130 --> 00:50:10,100 Ayrıca ortalama söylüyor 0.6, sadece anlamına gelir 842 00:50:10,100 --> 00:50:13,380 Ben 0 ların daha fazla 1s var gibi görünüyor. 843 00:50:13,380 --> 00:50:16,160 >> Bu yüzden bana öncesinde ve gösteri gidelim Eğer bu gibi göründüğünü. 844 00:50:16,160 --> 00:50:17,470 Yani sadece bu arsa için gidiyorum. 845 00:50:17,470 --> 00:50:22,852 846 00:50:22,852 --> 00:50:24,636 Şimdi bu temizlemek için nasıl görelim. 847 00:50:24,636 --> 00:50:30,492 848 00:50:30,492 --> 00:50:31,468 Tamam Ah. 849 00:50:31,468 --> 00:50:35,840 850 00:50:35,840 --> 00:50:36,340 TAMAM MI. 851 00:50:36,340 --> 00:50:37,590 >> Peki bu neye benzediğini olduğunu. 852 00:50:37,590 --> 00:50:46,310 Yani ben Belirtilen sarı gibi görünüyor 0 ve sonra kırmızı gibi 1s olarak belirtilmiş. 853 00:50:46,310 --> 00:50:52,190 Yani burada gibi görünüyor Etiket noktaları ve 854 00:50:52,190 --> 00:50:56,410 Eğer sadece bazı istediğin gibi görünüyor Bu konuda kümelenme tür. 855 00:50:56,410 --> 00:51:01,020 >> Ve bana sadece önde ve gösteri gidelim Bu yerleşik fonksiyonları bazı. 856 00:51:01,020 --> 00:51:03,580 Yani burada lm. 857 00:51:03,580 --> 00:51:06,060 Yani bu sadece çalışıyor Bu bir çizgi sığdırmak için. 858 00:51:06,060 --> 00:51:08,640 Peki en iyi yolu Ben bir çizgi gibi sığabilecek ki 859 00:51:08,640 --> 00:51:14,020 Bu en iyi olarak ayrı olacağı Kümelenme bu tür. 860 00:51:14,020 --> 00:51:21,790 Ve ideal, sadece görebilirsiniz Ben sadece tüm bu komutları çalıştırmak 861 00:51:21,790 --> 00:51:25,450 ve sonra, ben gidiyorum önde ve satır ekleyin. 862 00:51:25,450 --> 00:51:28,970 >> Peki bu iyi tahmin gibi görünüyor. 863 00:51:28,970 --> 00:51:34,150 Bu en aza indirir en iyisini alıyor Bu çizgiyi uyacak çalışırken hata. 864 00:51:34,150 --> 00:51:40,000 Açıkçası, bu tür görünüyor İyi, ama en iyisi değil. 865 00:51:40,000 --> 00:51:43,130 Ve doğrusal modeller, içinde genel olacak 866 00:51:43,130 --> 00:51:46,811 teori ve sadece tür gerçekten harika Makinenin bina temelleri 867 00:51:46,811 --> 00:51:47,310 öğrenme. 868 00:51:47,310 --> 00:51:50,330 Ancak uygulamada, sen gidiyorsun Daha genel bir şey yapmak istiyorum. 869 00:51:50,330 --> 00:51:54,280 >> Yani sadece çalışan deneyebilirsiniz bir şey bir sinir ağı denir. 870 00:51:54,280 --> 00:51:57,110 Bunlar şunlardır giderek daha yaygın. 871 00:51:57,110 --> 00:52:00,530 Ve onlar sadece fantastik çalışmak Büyük veri setleri için. 872 00:52:00,530 --> 00:52:07,080 Bu nedenle, bu durumda, sadece have-- en biz sat_say var see-- edelim. 873 00:52:07,080 --> 00:52:09,010 Yani sat_say sadece satır sayısını söylüyor. 874 00:52:09,010 --> 00:52:11,790 Ben, bu durumda Yani 100 gözlem var. 875 00:52:11,790 --> 00:52:15,010 >> Bu yüzden bana öncesinde gidelim ve bir sinir ağı yapmak. 876 00:52:15,010 --> 00:52:18,620 Yani bu gerçekten güzel Ben sadece -NMR söyleyebilirim çünkü 877 00:52:18,620 --> 00:52:21,767 ve sonra ben Y. gerileme ediyorum Yani Y, O sütun. 878 00:52:21,767 --> 00:52:23,850 Ve sonra gerileme Diğer iki değişken. 879 00:52:23,850 --> 00:52:27,360 Yani bu kısa X1 ve X2 için gösterim. 880 00:52:27,360 --> 00:52:29,741 >> Yani go ahead ve bu çalışmasına izin. 881 00:52:29,741 --> 00:52:30,240 Ah, üzgünüm. 882 00:52:30,240 --> 00:52:32,260 Ben bu şeyi çalıştırmak gerekir. 883 00:52:32,260 --> 00:52:37,500 Ve bu sadece gösterimde yazdırıyor ne kadar hızlı ya da çok hızlı değil için 884 00:52:37,500 --> 00:52:38,460 yaklaşmıştır. 885 00:52:38,460 --> 00:52:41,420 Yani o yakınsama yaptım gibi görünüyor. 886 00:52:41,420 --> 00:52:44,970 Bu yüzden bana öncesinde ve baskı gidelim Bu gibi göründüğünü dışarı. 887 00:52:44,970 --> 00:52:51,260 >> Buraya bakın burada bir resim var ve o uyuyor ne kadar iyi gösteren bir kontur. 888 00:52:51,260 --> 00:52:56,380 Ve bu gördüğünüz sadece-- olduğunu bu çok, çok güzel olduğunu. 889 00:52:56,380 --> 00:52:59,400 Hatta olabilir Ayrıca yapabilirsiniz overfitting, ancak 890 00:52:59,400 --> 00:53:03,390 Diğer bu hesaba çapraz doğrulama gibi teknikler. 891 00:53:03,390 --> 00:53:06,180 Ve bunlar da R. yerleşiktir 892 00:53:06,180 --> 00:53:09,170 >> Ve sadece size göstermek bana izin vektör makinesi desteği. 893 00:53:09,170 --> 00:53:12,470 Bu başka gerçekten yaygındır Makine öğrenme tekniği. 894 00:53:12,470 --> 00:53:18,550 Bu, doğrusal modeller çok benzer, ancak Bir çekirdek yöntemi ne denir kullanır. 895 00:53:18,550 --> 00:53:22,790 Ve yok ki ne kadar iyi görelim. 896 00:53:22,790 --> 00:53:26,430 Yani bu bir nasıl çok benzer iyi bir sinir ağı, gerçekleştirir 897 00:53:26,430 --> 00:53:27,900 ama çok daha pürüzsüz var. 898 00:53:27,900 --> 00:53:35,740 Ve bu kapalı dayanır ve nasıl DVM çalışmalarını ne--. 899 00:53:35,740 --> 00:53:40,250 >> Yani bu sadece çok olduğunu Bazı hızlı bakış 900 00:53:40,250 --> 00:53:43,822 yerleşik fonksiyonları yapabileceğiniz ve ayrıca veri keşif bazılarıdır. 901 00:53:43,822 --> 00:53:45,905 Yani bana sadece devam edelim ve slaytlar geri dönmek. 902 00:53:45,905 --> 00:53:50,290 903 00:53:50,290 --> 00:53:53,670 >> Yani açıkçası, bu çok kapsamlı değil. 904 00:53:53,670 --> 00:53:57,140 Ve bu gerçekten sadece bir teaser olduğunu Eğer gerçekten R. neler yapabileceğini gösteren 905 00:53:57,140 --> 00:53:59,100 Yani sadece isterseniz Burada, daha fazla bilgi için 906 00:53:59,100 --> 00:54:01,210 Farklı kaynakların bir demet. 907 00:54:01,210 --> 00:54:06,890 >> Eğer ders kitaplarının düşkün konum ya da eğer Yani sadece online şeyleri okuma düşkün, 908 00:54:06,890 --> 00:54:09,670 o zaman bu bir fantastik Hadley Wickham tek, 909 00:54:09,670 --> 00:54:13,010 Ayrıca oluşturulan her kim bu gerçekten harika paketler. 910 00:54:13,010 --> 00:54:17,420 Eğer videolar düşkün iseniz, o zaman Berkeley harika bir bootcamp var 911 00:54:17,420 --> 00:54:21,060 Bu tür uzun olduğunu several-- budur. 912 00:54:21,060 --> 00:54:24,210 Ve neredeyse sana öğretecek her şey R. hakkında bilmek istiyorum 913 00:54:24,210 --> 00:54:27,770 >> Ve benzer şekilde, Codeacademy var ve tüm bu diğer tür 914 00:54:27,770 --> 00:54:29,414 interaktif web siteleri. 915 00:54:29,414 --> 00:54:31,580 Onlar da alıyorsanız Daha fazla ve daha sık common--. 916 00:54:31,580 --> 00:54:33,749 Yani bu Codeacademy çok benzer. 917 00:54:33,749 --> 00:54:35,790 Ve son olarak, eğer sadece Topluluk istiyor ve yardım, 918 00:54:35,790 --> 00:54:38,800 Bu bir demet Eğer gidebilirsiniz şeyler. 919 00:54:38,800 --> 00:54:40,880 Açıkçası, biz hala Sadece, posta listeleri kullanın 920 00:54:40,880 --> 00:54:44,860 hemen hemen her gibi başka programlama dili topluluk. 921 00:54:44,860 --> 00:54:47,880 Ve #rstats, bu Bizim toplum Twitter. 922 00:54:47,880 --> 00:54:49,580 Bu aslında oldukça yaygındır. 923 00:54:49,580 --> 00:54:50,850 Ve sonra kullanıcı! 924 00:54:50,850 --> 00:54:52,340 Sadece bizim konferanstır. 925 00:54:52,340 --> 00:54:55,390 >> Ve sonra, tabii ki, can Tüm bu diğer Q & A şeyler kullanın, 926 00:54:55,390 --> 00:54:57,680 Yığın taşması gibi, Google, ve sonra GitHub. 927 00:54:57,680 --> 00:55:00,490 Bu paketlerin çoğu Çünkü ve toplumun bir çok 928 00:55:00,490 --> 00:55:03,420 Gelişmekte etrafında merkezli olacak kod açık kaynak çünkü. 929 00:55:03,420 --> 00:55:05,856 Ve GitHub üzerinde sadece gerçekten güzel. 930 00:55:05,856 --> 00:55:08,730 Ve son olarak, eğer bana ulaşabilirsiniz Sadece herhangi bir hızlı sorularım var. 931 00:55:08,730 --> 00:55:13,530 Yani burada Twitter'da beni bulabilirsiniz, Web sitem, ve sadece benim e-posta. 932 00:55:13,530 --> 00:55:17,840 Yani umarım, oldu şey-- sadece kısa bir teaser 933 00:55:17,840 --> 00:55:20,900 Ne R yapıyor gerçekten yetenekli olduğunu. 934 00:55:20,900 --> 00:55:23,990 Ve umarım, sadece Bu üç bağlantıları kontrol 935 00:55:23,990 --> 00:55:25,760 ve daha neler yapabileceğini görmek. 936 00:55:25,760 --> 00:55:28,130 Ve ben sadece bu konuda sanırım. 937 00:55:28,130 --> 00:55:28,630 Teşekkürler. 938 00:55:28,630 --> 00:55:30,780 >> [Alkış] 939 00:55:30,780 --> 00:55:31,968