1 00:00:00,000 --> 00:00:00,750 2 00:00:00,750 --> 00:00:09,800 >> [음악 연주] 3 00:00:09,800 --> 00:00:13,014 4 00:00:13,014 --> 00:00:13,680 더스틴 TRAN : 안녕하세요. 5 00:00:13,680 --> 00:00:14,980 내 이름은 더스틴. 6 00:00:14,980 --> 00:00:18,419 그래서 나는 제시 할 것 R.에서 데이터 분석 7 00:00:18,419 --> 00:00:19,710 자신에 대해 조금. 8 00:00:19,710 --> 00:00:24,320 나는 현재 대학원 학생입니다 엔지니어링 및 응용 과학. 9 00:00:24,320 --> 00:00:28,330 나는의 교차 연구 기계 학습 및 통계 10 00:00:28,330 --> 00:00:31,375 그래서 R에서 데이터 분석입니다 정말 기본적인 무엇 11 00:00:31,375 --> 00:00:33,790 나는 매일 않습니다. 12 00:00:33,790 --> 00:00:35,710 >> 그리고 R이다 특히 데이터 분석을위한 좋은 13 00:00:35,710 --> 00:00:39,310 이 프로토 타입을 위해 아주 좋은 때문이다. 14 00:00:39,310 --> 00:00:43,590 그리고 일반적으로, 당신은 어떤 종류의 일을 할 때 데이터 분석, 많은 문제 중 15 00:00:43,590 --> 00:00:44,920 인지에 갈 수 있습니다. 16 00:00:44,920 --> 00:00:48,700 그래서 그냥 갖고 싶어 정말 좋은 언어 그 17 00:00:48,700 --> 00:00:53,770 일을 단지 좋은 내장 함수, 반대 18 00:00:53,770 --> 00:00:57,430 낮은 수준의 일을 처리하는 데에. 19 00:00:57,430 --> 00:01:01,040 처음에 그래서, 난 그냥 갈거야 소개 R은 무엇을, 왜이 것입니다 20 00:01:01,040 --> 00:01:04,540 당신은 그것을 사용하고자하고, 다음 몇 가지 데모에 가서, 21 00:01:04,540 --> 00:01:07,060 그냥 거기에서 이동합니다. 22 00:01:07,060 --> 00:01:08,150 >> 그래서 R은 무엇인가? 23 00:01:08,150 --> 00:01:11,180 R은 언어 개발 통계 컴퓨팅을위한 24 00:01:11,180 --> 00:01:12,450 및 시각화. 25 00:01:12,450 --> 00:01:16,000 그래서 이것이 의미하는 것입니다 그것은 매우 훌륭한 언어이다 26 00:01:16,000 --> 00:01:22,400 다루는 것은 모든 종류의에 대한 불확실성 또는 데이터 시각화. 27 00:01:22,400 --> 00:01:24,850 그래서 당신은 모든이 확률 분포. 28 00:01:24,850 --> 00:01:27,140 있을거야 내장 함수. 29 00:01:27,140 --> 00:01:31,650 또한 우수해야합니다 패키지를 플로팅. 30 00:01:31,650 --> 00:01:34,110 >> 파이썬은 다른 경쟁이다 데이터의 언어. 31 00:01:34,110 --> 00:01:40,020 그리고 한 가지 그 R을 찾아 그 시각화에서 훨씬 낫다. 32 00:01:40,020 --> 00:01:45,200 그래서 당신은 데모로 볼 수 있습니다 잘 단지 매우 직관적 인 언어입니다 33 00:01:45,200 --> 00:01:48,050 그건 그냥 매우 잘 작동합니다. 34 00:01:48,050 --> 00:01:53,140 그것은으로, 또한 무료 오픈 소스 제 생각 엔 다른 좋은 언어입니다. 35 00:01:53,140 --> 00:01:55,440 >> 단지의 그리고 여기, 무리 키워드는 당신을 던져. 36 00:01:55,440 --> 00:02:00,450 당신이있는 경우에 그것은 의미, 동적이다 객체에 할당 된 특정 유형 37 00:02:00,450 --> 00:02:02,025 보다 그냥 즉석에서 변경합니다. 38 00:02:02,025 --> 00:02:05,670 그것은 게으른 그래서 약 똑똑 어떻게 계산을 수행합니다. 39 00:02:05,670 --> 00:02:12,250 정말 작동 할 수 있음을 의미 기능 기능의 떨어져 증거를 없애도록 기반 40 00:02:12,250 --> 00:02:16,910 당신이있어 조작의 모든 종류의 일, 그것은 기능을 기반으로합니다. 41 00:02:16,910 --> 00:02:20,162 >> 그래서 이항 연산자, 예를 들어, 다만 본질적 기능은 다음과 같습니다. 42 00:02:20,162 --> 00:02:21,870 그리고 모든 것을 당신은 어떻게되는거야 43 00:02:21,870 --> 00:02:24,690 가는 함수 자체를 실행합니다. 44 00:02:24,690 --> 00:02:27,140 그리고뿐만 아니라 객체 지향. 45 00:02:27,140 --> 00:02:30,930 >> 그래서 여기 XKCD 플롯이다. 46 00:02:30,930 --> 00:02:34,350 뿐만 아니라 내가 같은 느낌 때문에 XKCD는 어떤 종류의 기초입니다 47 00:02:34,350 --> 00:02:37,770 프리젠 테이션,하지만 때문에 난 정말이 같은 느낌 48 00:02:37,770 --> 00:02:42,160 점을 망치 그 많은 당신은 데이터의 일종을하고있는 시간 49 00:02:42,160 --> 00:02:46,570 분석, 문제가되지 않습니다 가 실행 얼마나 빨리 너무 많이, 50 00:02:46,570 --> 00:02:49,850 하지만가는 얼마나 오래 작업을 프로그래밍하는 당신을 데려 갈. 51 00:02:49,850 --> 00:02:54,112 그래서 여기에 단지 여부를 분석한다 전략 또는 b를 더 효율적이다. 52 00:02:54,112 --> 00:02:55,820 이 될 것입니다 당신이있어 뭔가 53 00:02:55,820 --> 00:02:58,290 에와 많은 거래를하려고 정렬의 로우 레벨 언어 54 00:02:58,290 --> 00:03:03,440 당신이 독방 감금 오류 다루고 경우, 메모리 할당, 초기화, 55 00:03:03,440 --> 00:03:05,270 심지어 내장 함수 만들기. 56 00:03:05,270 --> 00:03:09,920 그리고이 물건은 모든 처리 아주, 아주 우아 R.에서 57 00:03:09,920 --> 00:03:12,839 >> 그래서 그냥이를 망치로 포인트, 가장 큰 병목 58 00:03:12,839 --> 00:03:13,880 인지 될 것입니다. 59 00:03:13,880 --> 00:03:17,341 따라서 데이터 분석은 매우 어려운 문제이다. 60 00:03:17,341 --> 00:03:19,340 당신이하고있는 여부 기계 학습 또는 당신이있어 61 00:03:19,340 --> 00:03:22,550 단지 어떤 종류의 일을 기본 데이터 탐색, 62 00:03:22,550 --> 00:03:25,290 당신은하고 싶지 않아요 문서를 취할 63 00:03:25,290 --> 00:03:27,440 다음 컴파일 때마다 뭔가 당신 64 00:03:27,440 --> 00:03:31,010 열이 어떻게 생겼는지보고 싶어, 행렬의 어떤 특정 항목 65 00:03:31,010 --> 00:03:32,195 처럼 보인다. 66 00:03:32,195 --> 00:03:34,320 그래서 그냥 갖고 싶어 정말 멋진 인터페이스 67 00:03:34,320 --> 00:03:37,740 당신은 간단한 기능을 실행할 수 있습니다 인덱스에 그 무엇 68 00:03:37,740 --> 00:03:41,870 당신은 좋아하고 거기에서 실행할 것입니다. 69 00:03:41,870 --> 00:03:44,190 그리고 당신은 도메인이 필요 이 특정 언어. 70 00:03:44,190 --> 00:03:51,750 그리고 R은 정말 당신을 정의하는 데 도움이 될 것 문제는 이러한 방식으로이를 해결한다. 71 00:03:51,750 --> 00:03:58,690 >> 그래서 여기 플롯 보여주는 프로그램입니다 R의 인기는 시간이 지남에 사라 졌어요있다. 72 00:03:58,690 --> 00:04:04,060 같은 그래서 당신은 2013처럼 볼 수 있습니다 그래서 그냥 엄청난 폭파. 73 00:04:04,060 --> 00:04:09,570 그리고 이것은 단지 그 때문에되었습니다 기술 업계에 큰 추세 74 00:04:09,570 --> 00:04:10,590 에 대한 빅 데이터. 75 00:04:10,590 --> 00:04:13,010 또한, 단지 기술 산업,하지만 정말 76 00:04:13,010 --> 00:04:16,490 어떤 산업 거저 때문에 산업의 많은 77 00:04:16,490 --> 00:04:20,589 에 종류의 기본적인 이러한 문제를 해결하기 위해 노력. 78 00:04:20,589 --> 00:04:24,590 그리고 일반적으로, 당신은 좋은있을 수 있습니다 이러한 문제를 측정하는 방법 79 00:04:24,590 --> 00:04:29,720 심지어 그들을 정의하거나 데이터를 사용하여 해결. 80 00:04:29,720 --> 00:04:35,430 그래서 지금은 R이 11이 생각 TIOBE에 가장 인기있는 언어 81 00:04:35,430 --> 00:04:38,200 그리고 그 이후로 성장하고있다. 82 00:04:38,200 --> 00:04:40,740 83 00:04:40,740 --> 00:04:43,080 >> 그래서 여기에 몇 가지 더있어 R.의 기능이있다 84 00:04:43,080 --> 00:04:46,900 패키지의 엄청난 수와 모든 다른 것들에 대한. 85 00:04:46,900 --> 00:04:52,470 그래서 언제든지 당신은이 특정 문제 대부분을 86 00:04:52,470 --> 00:04:55,060 시간 R는 것 당신을 위해 그 기능. 87 00:04:55,060 --> 00:04:58,520 당신이 원하는 그래서 여부 기계의 일종을 구축 88 00:04:58,520 --> 00:05:02,770 라는 학습 알고리즘 임의 숲 또는 의사 결정 트리, 89 00:05:02,770 --> 00:05:07,530 심지어의 평균을하려고 함수 또는이 물건의, 90 00:05:07,530 --> 00:05:10,000 R은있을 것이다. 91 00:05:10,000 --> 00:05:14,190 >> 당신이 경우에 그리고 당신은 걱정 흔한 최적화, 한 가지 92 00:05:14,190 --> 00:05:17,430 당신은 프로토 타입을 수행하고 있는지 후 고급 언어의 일종, 93 00:05:17,430 --> 00:05:19,810 당신은을 받 발생합니다 당신은 것입니다 단지 포트 그 이상 94 00:05:19,810 --> 00:05:21,550 일부 낮은 수준의 언어. 95 00:05:21,550 --> 00:05:26,090 무엇 R에 대해 좋은 점은 일단 당신 것입니다 프로토 타입을 완료, 당신은 C ++를 실행할 수 있습니다, 96 00:05:26,090 --> 00:05:29,510 또는 포트란, 또는 이들의 임의 직접 R.으로 낮은 수준의 것들 97 00:05:29,510 --> 00:05:32,320 그래서 하나는 정말로 R에 대한 멋진 기능, 98 00:05:32,320 --> 00:05:35,930 당신이 정말로 걱정하는 경우 최적화 점. 99 00:05:35,930 --> 00:05:39,490 >> 그리고 그것은 또한 정말 좋은 웹 시각화합니다. 100 00:05:39,490 --> 00:05:43,530 그래서 D3.js는, 예를 들면, 나는 또 다른 세미나를 추측 101 00:05:43,530 --> 00:05:45,130 우리는 오늘 발표 것을. 102 00:05:45,130 --> 00:05:48,510 그리고 이것은 정말 굉장 인터랙티브 비주얼을. 103 00:05:48,510 --> 00:05:54,460 그리고 D3.js는 있다고 가정 데이터의 어떤 종류는 플롯 할 104 00:05:54,460 --> 00:05:58,080 R은 할 수있는의 좋은 방법입니다 데이터 분석 당신이 그것을 내보내기 전에 105 00:05:58,080 --> 00:06:04,220 이상 D3.js 또는 심지어 그냥 실행 D3.js는 R 자체에 명령, 106 00:06:04,220 --> 00:06:08,240 뿐만 아니라 모든 이들과 같은 다른 라이브러리뿐만 아니라. 107 00:06:08,240 --> 00:06:13,041 >> 그래서 단지 소개했다 R 그리고 왜 당신이 그것을 사용할 수있는 것입니다. 108 00:06:13,041 --> 00:06:14,790 그래서 희망, 나는했습니다 당신이 뭔가를 확신 109 00:06:14,790 --> 00:06:18,460 대한 그냥 어떤 건지 확인하려고합니다. 110 00:06:18,460 --> 00:06:23,930 그래서 내가 가서 통해 갈거야 R 객체에 대한 몇 가지 기본 사항 111 00:06:23,930 --> 00:06:26,150 그리고 당신이 정말로 무엇을 할 수 있는지. 112 00:06:26,150 --> 00:06:29,690 >> 그래서 여기에 단지입니다 수학 명령의 무리. 113 00:06:29,690 --> 00:06:35,000 그래서 당신이 구축하려는 혹시 교수님 말 언어 자신과 당신은 원하는 114 00:06:35,000 --> 00:06:38,080 다른 도구의 무리가 있습니다. 115 00:06:38,080 --> 00:06:42,520 작업의 모든 종류의 당신은 당신이 거라고 생각 거의 R. 될 것입니다 원하는 116 00:06:42,520 --> 00:06:44,150 >> 그래서 여기에 2 플러스 2입니다. 117 00:06:44,150 --> 00:06:46,090 여기에 2 회 파이입니다. 118 00:06:46,090 --> 00:06:51,870 R은 내장 상수의 무리가 자주 파이, 전자처럼 사용하고 있다고. 119 00:06:51,870 --> 00:06:56,230 >> 그리고, 여기에 7 플러스의 runif, 1 runif 그래서. 120 00:06:56,230 --> 00:07:02,450 이것은의 함수가 생성됩니다 0-1 하나의 랜덤 유니폼. 121 00:07:02,450 --> 00:07:04,400 그리고 4의 힘 (3)이있다. 122 00:07:04,400 --> 00:07:06,430 제곱근이있다. 123 00:07:06,430 --> 00:07:07,270 >> 로그가있다. 124 00:07:07,270 --> 00:07:14,500 그래서베이스를 할 것입니다 로그 그 자체로 지수. 125 00:07:14,500 --> 00:07:18,337 그리고, 당신은베이스를 지정하는 경우, 다음 당신은 당신이 원하는대로 기본 할 수 있습니다. 126 00:07:18,337 --> 00:07:19,920 그리고 여기에 몇 가지 다른 명령입니다. 127 00:07:19,920 --> 00:07:22,180 그래서 당신은 23 모드 2있다. 128 00:07:22,180 --> 00:07:24,910 그런 다음 나머지를 가지고있다. 129 00:07:24,910 --> 00:07:27,110 그럼 당신은 과학이 표기법 또한 경우 130 00:07:27,110 --> 00:07:34,060 단지 더 많은 일을하고 싶은 더 복잡한 것. 131 00:07:34,060 --> 00:07:37,320 >> 그래서 여기에 할당합니다. 132 00:07:37,320 --> 00:07:40,830 의 전형적인 지정 R은 화살표와 함께 이루어집니다 133 00:07:40,830 --> 00:07:43,440 그래서 미만보다 하이픈입니다. 134 00:07:43,440 --> 00:07:47,250 그래서 여기 난 그냥 할당 해요 변수 발 3. 135 00:07:47,250 --> 00:07:50,160 >> 그리고 나는 발을 인쇄하고 있습니다 다음은 세 가지 출력합니다. 136 00:07:50,160 --> 00:07:53,920 R 인터프리터 기본적으로, 그것을 당신을 위해 물건을 인쇄합니다 137 00:07:53,920 --> 00:07:57,280 그래서 당신은 발을 인쇄 지정할 필요가 없습니다 언제든지 당신이 뭔가를 인쇄 할. 138 00:07:57,280 --> 00:08:00,200 당신은 그냥 발을 할 수 있으며, 그것은 당신을 위해 그렇게 할 것입니다. 139 00:08:00,200 --> 00:08:04,380 >> 또한, 기술적으로 일치 한 사용할 수 있습니다 할당 연산자로. 140 00:08:04,380 --> 00:08:07,190 약간의 미묘한 차이가 있습니다 화살표를 사용하여 사이 141 00:08:07,190 --> 00:08:10,730 연산자와 같음 할당에 대한 연산자. 142 00:08:10,730 --> 00:08:15,470 대부분 컨벤션, 모든 사람 그냥 화살표 연산자를 사용합니다. 143 00:08:15,470 --> 00:08:21,850 >> 그리고 여기,이 할당 해요 경사 표기는 1 콜론 (6)을했다. 144 00:08:21,850 --> 00:08:26,010 이것은 1~6 벡터를 생성한다. 145 00:08:26,010 --> 00:08:29,350 그리고이 정말 좋은 다음 때문에 당신은 단지 발에 벡터를 할당 146 00:08:29,350 --> 00:08:34,270 그 자체로 작동합니다. 147 00:08:34,270 --> 00:08:37,799 >> 그래서이 이미로부터 것입니다 매우 직관적 인 데이터를 single-- 148 00:08:37,799 --> 00:08:41,070 단지 두 배의 구조 벡터 형식으로 어떤 유형의 149 00:08:41,070 --> 00:08:45,670 그리고 모두를 수집합니다 당신을위한 스칼라 값. 150 00:08:45,670 --> 00:08:50,770 그래서 스칼라에서 진행 후, 당신 R 오브젝트를 가지며이 벡터이다. 151 00:08:50,770 --> 00:08:55,610 벡터는 모든 종류입니다 동일한 유형의 컬렉션입니다. 152 00:08:55,610 --> 00:08:58,150 그래서 여기 벡터의 무리입니다. 153 00:08:58,150 --> 00:08:59,800 >> 그래서이 숫자입니다. 154 00:08:59,800 --> 00:09:02,440 숫자는 두 말의 R의 방법입니다. 155 00:09:02,440 --> 00:09:07,390 그래서 기본적으로, 어떤 숫자는 더블 될 것입니다. 156 00:09:07,390 --> 00:09:13,150 >> 그래서 당신은 1.1, 3의 c를 가지고 있다면, 네거티브 5.7, C는 함수이다. 157 00:09:13,150 --> 00:09:16,760 이 세 가지 연결합니다 벡터에 숫자. 158 00:09:16,760 --> 00:09:19,619 그리고 이것은 만약 그렇다면 나중에 ...합니다 당신은 그 자체로 3 알, 159 00:09:19,619 --> 00:09:21,910 일반적으로 당신은 생각할 겁니다 이 정수 같다고, 160 00:09:21,910 --> 00:09:25,050 하지만 모든 벡터 때문에 동일한 유형, 161 00:09:25,050 --> 00:09:28,660 이 두 배의 벡터이다 또는이 경우 숫자. 162 00:09:28,660 --> 00:09:34,920 >> rnorm이 생성하는 기능입니다 표준 정규 variables-- 163 00:09:34,920 --> 00:09:36,700 또는 표준 정규 값. 164 00:09:36,700 --> 00:09:38,360 그리고 나는 그들 중 두 가지를 지정하고 있습니다. 165 00:09:38,360 --> 00:09:43,840 그래서 해당 할당, rnorm 2 일을 해요 DEVS는 다음 나는 DEVS을 인쇄하고 있습니다. 166 00:09:43,840 --> 00:09:47,350 그래서 이건 그냥 두 가지 임의 정상 값. 167 00:09:47,350 --> 00:09:50,060 >> 그리고 당신이 경우에 INTS 당신은 정수에 대한 관심. 168 00:09:50,060 --> 00:09:54,650 그래서 이것은 단지 메모리에 관한 것입니다 할당 및 저장 메모리 크기. 169 00:09:54,650 --> 00:10:01,460 그래서 당신은 추가해야 할 것입니다 자본 L.하여 번호 170 00:10:01,460 --> 00:10:04,170 >> 일반적으로,은 R의 역사적인 표기 171 00:10:04,170 --> 00:10:06,940 뭔가 긴 정수했다. 172 00:10:06,940 --> 00:10:09,880 대부분의 시간, 당신은거야 그래서 복식 처리합니다. 173 00:10:09,880 --> 00:10:15,180 그리고 만약 당신은 윌 코드를 최적화에, 174 00:10:15,180 --> 00:10:18,110 당신은이 L의 추가 할 수 있습니다 이후 또는시 175 00:10:18,110 --> 00:10:22,280 당신에 대한 예지 같은 경우 어떤 이러한 변수를 할 것입니다. 176 00:10:22,280 --> 00:10:25,340 177 00:10:25,340 --> 00:10:26,890 >> 그래서 여기 문자 벡터이다. 178 00:10:26,890 --> 00:10:31,440 그래서, 다시, 나는 연결하는거야 세 개의 문자열이 시간. 179 00:10:31,440 --> 00:10:36,230 그 두 문자열을 주목하라 하나의 문자열은 R.에서 동일 180 00:10:36,230 --> 00:10:41,000 그래서 나는 그렇게 아서와 마빈의과가 때 나는 그들 모두를 밖으로 인쇄 해요 181 00:10:41,000 --> 00:10:43,210 두 문자열을 표시하는 것입니다. 182 00:10:43,210 --> 00:10:45,880 그리고 당신은 또한 포함 할 경우 이중 또는 단일 문자열 183 00:10:45,880 --> 00:10:50,070 당신의 문자에, 당신은 할 수 있습니다 도 당신의 문자열을 대체. 184 00:10:50,070 --> 00:10:53,540 >> 마빈의에 대한 그래서 두 번째 요소는, 여긴 185 00:10:53,540 --> 00:10:56,380 당신을 방송 ... 것 단지 두 문자열이 186 00:10:56,380 --> 00:10:59,050 다음 하나의 문자열 그래서 이것은 교류한다. 187 00:10:59,050 --> 00:11:04,040 당신이 원하는 경우 그렇지 않은 경우, 두 번 사용 이중 문자열에서 문자열 연산자 188 00:11:04,040 --> 00:11:07,090 이를를 선언 할 때, 그때 당신은 이스케이프 연산자를 사용합니다. 189 00:11:07,090 --> 00:11:10,600 그래서 당신은 백 슬래시 두 문자열을한다. 190 00:11:10,600 --> 00:11:13,330 >> 그리고 마지막으로, 우리는 또한 논리 벡터를 가지고있다. 191 00:11:13,330 --> 00:11:15,890 그래서 logical-- 그래서 TRUE FALSE를, 그리고 그들이있어 192 00:11:15,890 --> 00:11:18,880 모두 대문자로 될 것이다. 193 00:11:18,880 --> 00:11:22,370 그리고, 다시, 나는 연결하는거야 그 다음은 bools에 할당 할 수있을 것입니다. 194 00:11:22,370 --> 00:11:24,590 그래서 bools 보여줄 것입니다 당신은, TRUE FALSE 및 TRUE. 195 00:11:24,590 --> 00:11:28,280 196 00:11:28,280 --> 00:11:31,620 >> 그래서 여기 벡터화 색인이다. 197 00:11:31,620 --> 00:11:34,870 나는 처음에 그래서 function--을 먹고 있어요 198 00:11:34,870 --> 00:11:39,230 이것은 sequence--라고 2-12 순서. 199 00:11:39,230 --> 00:11:42,490 그리고 2 시퀀스를 데려 갈거야. 200 00:11:42,490 --> 00:11:46,660 그래서 할 것 2, 4, 6, 8, 10, 12. 201 00:11:46,660 --> 00:11:50,080 그리고, 나는 색인 해요 세 번째 요소를 얻을 수 있습니다. 202 00:11:50,080 --> 00:11:55,770 >> 그래서 한 가지 유념해야 할 점은있다 1에서 시작하여 그 R 인덱스. 203 00:11:55,770 --> 00:12:00,550 발스 그래서 3 줄 수 있겠나 당신이 세 번째 요소입니다. 204 00:12:00,550 --> 00:12:04,580 이 종류의 서로 다른입니다 제로에서 시작 언어. 205 00:12:04,580 --> 00:12:09,780 그래서 C 혹은 C ++에서, 예를 들어, 야 네 번째 요소를 얻을 것. 206 00:12:09,780 --> 00:12:13,280 >> 그리고 여기에 3-5 놈들이다. 207 00:12:13,280 --> 00:12:16,030 그래서 한 가지 그 정말 멋진 당신 것입니다 208 00:12:16,030 --> 00:12:20,410 내부의 임시 변수를 생성 할 수 있습니다 다음 바로 즉석에서이를 사용합니다. 209 00:12:20,410 --> 00:12:21,960 그래서 여기에 3-5이다. 210 00:12:21,960 --> 00:12:25,070 그래서 벡터를 생성하는거야 3, 4, 5 및 다음 211 00:12:25,070 --> 00:12:29,700 나는 세 번째를 얻기 위해 색인 해요 네 번째, 다섯 번째 요소. 212 00:12:29,700 --> 00:12:32,280 >> 그래서 유사하게, 당신은 할 수 이 추상 바로 수행에 213 00:12:32,280 --> 00:12:35,280 벡터의 모든 종류 즉, 색인을 제공합니다. 214 00:12:35,280 --> 00:12:40,050 그래서 여기에 그 놈들이고 첫 번째, 세 번째 및 여섯 번째 요소. 215 00:12:40,050 --> 00:12:42,800 그리고, 당신이 원하는 경우 보완해야 할 일, 216 00:12:42,800 --> 00:12:45,210 그래서 당신은 마이너스을 나중에 그는거야 217 00:12:45,210 --> 00:12:48,600 당신이 아니라 모든 것을 제공 첫 번째, 세 번째, 또는 6 요소. 218 00:12:48,600 --> 00:12:51,590 그래서이 4, 8, 10이 될 것입니다. 219 00:12:51,590 --> 00:12:54,380 >> 그리고 당신은 얻으려면 더 고급, 220 00:12:54,380 --> 00:12:57,610 당신은 부울 벡터를 연결할 수 있습니다. 221 00:12:57,610 --> 00:13:05,210 따라서이 지수는 당신에게 줄 수 있겠나? 길이 6의이 부울 벡터. 222 00:13:05,210 --> 00:13:07,280 그래서 담당자 TRUE 쉼표 3. 223 00:13:07,280 --> 00:13:09,680 이 TRUE 세 번 반복됩니다. 224 00:13:09,680 --> 00:13:12,900 그래서 이것은 당신에게 줄 것이다 벡터 TRUE, TRUE, TRUE. 225 00:13:12,900 --> 00:13:17,470 >> 담당자는 FALSE 4--이 당신에게 줄 수 있겠나? FALSE, FALSE, FALSE FALSE의 벡터. 226 00:13:17,470 --> 00:13:21,280 그리고 C를 연결하는 것입니다 함께 두 부울. 227 00:13:21,280 --> 00:13:24,090 그래서 당신은 세 가지를받을거야 TRUEs 다음 네 FALSEs. 228 00:13:24,090 --> 00:13:28,460 >> 당신 인덱스 놈들 아, 당신이있을 때 그 그래서 , TRUE, TRUE TRUE를 얻을 것. 229 00:13:28,460 --> 00:13:31,420 그래서이 네 말 것, 나는 그 세 가지 요소를 원한다. 230 00:13:31,420 --> 00:13:33,520 그리고 FALSE, FALSE, FALSE, FALSE는 것입니다 231 00:13:33,520 --> 00:13:37,140 아니, 그 요소를 원하지 않는 대답 그래서 그들을 돌려 않을거야. 232 00:13:37,140 --> 00:13:41,490 >> 그리고 여기에 오타가 실제로 존재 같아요 이 때문에 3 반복 TRUE 말하고있다 233 00:13:41,490 --> 00:13:47,990 그리고 기술적으로 당신을 FALSE 4를 반복하고, 만 여섯 요소가 너무 FALSE 반복이, 234 00:13:47,990 --> 00:13:50,470 그것은 3 FALSE를 반복해야합니다. 235 00:13:50,470 --> 00:13:55,260 나는 R은 또한 똑똑 생각 것을 당신은 다음, 여기에 4를 지정하는 경우 236 00:13:55,260 --> 00:13:56,630 심지어 에러 출력되지 않습니다. 237 00:13:56,630 --> 00:13:58,480 그것은 단지 당신이 값을 줄 것이다. 238 00:13:58,480 --> 00:14:00,970 그래서 그냥 네 번째 FALSE를 무시합니다. 239 00:14:00,970 --> 00:14:05,310 240 00:14:05,310 --> 00:14:09,270 >> 그래서 여기 벡터화 할당입니다. 241 00:14:09,270 --> 00:14:15,480 이 단지를 설정 set.seed-- 그래서 의사 난수를위한 씨앗. 242 00:14:15,480 --> 00:14:20,110 그래서 난에 씨앗을하고 있어요 의미 (42), 내가 생성하는 경우 그 243 00:14:20,110 --> 00:14:22,950 세 정상 임의 값, 다음 경우 244 00:14:22,950 --> 00:14:27,400 자신에 set.seed 실행할 같은 값 (42)을 사용하여 컴퓨터, 245 00:14:27,400 --> 00:14:30,990 당신은 또한 얻을 같은 세 가지 임의의 법선. 246 00:14:30,990 --> 00:14:33,411 >> 그래서 이것은 정말 좋은 재현성. 247 00:14:33,411 --> 00:14:35,910 일반적으로, 당신은 일을 할 때 몇 가지 과학적 분석의 종류, 248 00:14:35,910 --> 00:14:37,230 당신은 씨앗을 설정할 것입니다. 249 00:14:37,230 --> 00:14:41,270 그런 식으로 다른 과학자는 할 수 만약 여러분의 동일한 코드를 재현 250 00:14:41,270 --> 00:14:44,790 그들은 정확한있을 것이다 때문에 수행 같은 확률 변수 거저 또는 임의 251 00:14:44,790 --> 00:14:47,270 당신은뿐만 아니라 냈어요 값. 252 00:14:47,270 --> 00:14:49,870 253 00:14:49,870 --> 00:14:53,910 >> 그리고 벡터화 할당 여기에 2 발스 1을 보여주는 것입니다. 254 00:14:53,910 --> 00:14:59,290 그래서 처음 두 요소 소요 놈들의 한 다음 0으로 할당합니다. 255 00:14:59,290 --> 00:15:03,940 그리고, 당신은 또한 그냥 작업을 수행 할 수 있습니다 부울와 비슷한 일. 256 00:15:03,940 --> 00:15:09,340 >> 그래서 놈들이 뜻을 0-- 같지 당신에게 벡터 FALSE를주고, FALSE, TRUE 257 00:15:09,340 --> 00:15:10,350 이 경우에는. 258 00:15:10,350 --> 00:15:13,770 그리고, 어떤 말 것 사실 그 인덱스, 259 00:15:13,770 --> 00:15:15,270 다음은 5 저를 할당하는 것입니다. 260 00:15:15,270 --> 00:15:18,790 그래서 세번째 요소를 가져 여기에 다음 5에 할당합니다. 261 00:15:18,790 --> 00:15:22,300 >> 그리고 이것은 정말 좋은 낮은 수준의 언어에 비해 262 00:15:22,300 --> 00:15:25,560 어디 루프를 사용해야합니다 이 벡터화 된 물건을 모두 수행하는 263 00:15:25,560 --> 00:15:30,281 그냥 매우 직관적이기 때문에 그것은 단일 한 줄입니다. 264 00:15:30,281 --> 00:15:32,030 그리고 좋은 약 무엇 벡터화 표기 265 00:15:32,030 --> 00:15:37,020 R에, 이러한 일종의 있다는 것입니다 내장 그들은 거의 빠르다 있도록 266 00:15:37,020 --> 00:15:42,490 낮은 수준의 언어로 수행으로 R에서 루프를 만들기 위해 반대 267 00:15:42,490 --> 00:15:46,317 다음은 할 필요 동적 색인 자체. 268 00:15:46,317 --> 00:15:48,900 그리고 그 것보다 속도가 느려질 수 있습니다 벡터화 이런 종류의 269 00:15:48,900 --> 00:15:55,950 이 병렬에서 할 수있는 그것은 기본적으로 스레드에서 뭐하는거야. 270 00:15:55,950 --> 00:15:58,650 >> 그래서 여기에 작업을 벡터화. 271 00:15:58,650 --> 00:16:04,920 그래서 3에 값 1을 생성하고있어, 할당이 vec1에, 3-5, VEC2, 272 00:16:04,920 --> 00:16:05,950 그들을 함께 추가. 273 00:16:05,950 --> 00:16:11,490 너무 그들에게 성분이 많다는 추가 그렇게 1 플러스 3, 2 플러스 4,을합니다. 274 00:16:11,490 --> 00:16:13,330 >> vec1 배 VEC2. 275 00:16:13,330 --> 00:16:16,110 이는 두 개의 곱 지혜로운 구성 요소 값. 276 00:16:16,110 --> 00:16:21,830 그래서 1 ~ 3 배, 2 배의 4 일 후, 3 ~ 5 배이다. 277 00:16:21,830 --> 00:16:28,250 >> 그리고 마찬가지로 당신도 할 수있다 논리 비교를 comparisons--. 278 00:16:28,250 --> 00:16:33,640 그래서이에 TRUE FALSE FALSE입니다 케이스 (1)이므로, 3보다 크지 279 00:16:33,640 --> 00:16:35,920 이 4 이하이다. 280 00:16:35,920 --> 00:16:41,160 이것은 내가, 또 다른 오타를 추측이다, 3 확실히 크지 5 이상이다. 281 00:16:41,160 --> 00:16:41,660 그래. 282 00:16:41,660 --> 00:16:45,770 그래서 당신은 모든 할 수있는 이 간단한 작업 283 00:16:45,770 --> 00:16:48,350 자신의 상속 때문에 클래스 자체에서. 284 00:16:48,350 --> 00:16:51,110 285 00:16:51,110 --> 00:16:52,580 >> 그래서 그냥 벡터이었다. 286 00:16:52,580 --> 00:16:56,530 그리고 그 가장 기본적인의 일종 R 객체 때문에, 주어진 벡터 287 00:16:56,530 --> 00:16:59,170 당신은 더 진보 된 개체를 구성 할 수 있습니다. 288 00:16:59,170 --> 00:17:00,560 >> 그래서 여기 행렬이다. 289 00:17:00,560 --> 00:17:05,030 이것은 본질적으로 추상화 매트릭스 자체가 무엇을의. 290 00:17:05,030 --> 00:17:10,099 따라서이 경우에는, 다른 세 야 하나 하나가 열입니다 벡터,, 291 00:17:10,099 --> 00:17:12,710 또는 당신은 그것을 고려할 수 있습니다 각각 같은 행입니다. 292 00:17:12,710 --> 00:17:18,250 >> 그래서 1 매트릭스를 저장 해요 9는 내가 3 행을 지정하고 있습니다. 293 00:17:18,250 --> 00:17:23,364 그래서 1 ~ 9는, 당신에게 벡터 1을 줄 것이다 2, 3, 4, 5, 6 및 9의 모든 방법. 294 00:17:23,364 --> 00:17:29,250 >> 또한 한 가지 유념해야 할 점은 것입니다 R 매장 열 주요 형식으로 값. 295 00:17:29,250 --> 00:17:34,160 그래서 다른 말로하면, 당신은 일을 할 때 참조 9, 그것은 데모 테잎 저장 것 296 00:17:34,160 --> 00:17:36,370 그것은, 2, 1이 될 것 첫 번째 열에서 3, 297 00:17:36,370 --> 00:17:38,510 다음 그것을 할 거 4, 5, 두 번째 열에서 6, 298 00:17:38,510 --> 00:17:41,440 다음 7 번째 열에 8,9. 299 00:17:41,440 --> 00:17:45,570 >> 그리고 여기에 몇 가지 다른입니다 당신이 사용할 수있는 일반적인 기능. 300 00:17:45,570 --> 00:17:49,650 그래서 어두운 매트, 이것은 당신에게 줄 것이다 행렬의 크기. 301 00:17:49,650 --> 00:17:52,620 그것은 당신을 반환 할 것 차원의 벡터. 302 00:17:52,620 --> 00:17:55,580 이 경우, 그렇게 때문에 우리의 행렬은, (3)에 의한 3 303 00:17:55,580 --> 00:18:01,900 그것은 당신에게 줄 것 숫자 벡터 3 3이야,. 304 00:18:01,900 --> 00:18:05,270 >> 그리고 여기에 바로 표시되어 행렬 곱셈. 305 00:18:05,270 --> 00:18:11,970 그래서 일반적으로, 당신은 할 경우 asterisk-- 그래서 매트 별표 mat-- 306 00:18:11,970 --> 00:18:15,380 이 될 것입니다 구성 요소 단위 계산 307 00:18:15,380 --> 00:18:17,300 또는 마드 제품 무엇을 불렀다. 308 00:18:17,300 --> 00:18:21,310 그래서 각을 할 것 요소 요소 현명한. 309 00:18:21,310 --> 00:18:23,610 그러나, 당신이 원하는 경우 매트릭스 multiplication-- 310 00:18:23,610 --> 00:18:29,380 상기 제 1 행 배를 승산 두 번째 행렬의 첫 번째 열 311 00:18:29,380 --> 00:18:34,510 그래서 박사님의 당신은 사용합니다 이 %의 작업. 312 00:18:34,510 --> 00:18:38,110 >> 그리고 매트의 t 단지이다 전치에 대한 작업. 313 00:18:38,110 --> 00:18:42,590 그래서에서 전치을 말하는거야 행렬은 행렬 곱 314 00:18:42,590 --> 00:18:43,090 그 자체. 315 00:18:43,090 --> 00:18:45,006 그리고, 그것은에 무슨 다른 3로 돌아 316 00:18:45,006 --> 00:18:50,700 3 매트릭스 보여 당신이 원하는 것입니다 제품. 317 00:18:50,700 --> 00:18:53,750 >> 그리고 그 행렬이었다. 318 00:18:53,750 --> 00:18:56,020 다음은 데이터 프레임라고하는 것입니다. 319 00:18:56,020 --> 00:19:00,780 당신은뿐만 생각할 수있는 데이터 프레임 매트릭스 있지만, 각 컬럼 자체 320 00:19:00,780 --> 00:19:02,990 다른 유형의가 될 것입니다. 321 00:19:02,990 --> 00:19:07,320 >> 그렇다면 데이터에 대한 정말 멋진 프레임은 데이터 분석 자체가, 322 00:19:07,320 --> 00:19:11,260 당신은이 모든 것을 할 겁니다 이기종 데이터 및 모든 정말로 323 00:19:11,260 --> 00:19:15,640 지저분한 일 경우 각 열 자체는 다른 타입 일 수있다. 324 00:19:15,640 --> 00:19:21,460 그래서 나는 여기를 만들 말하는거야 데이터 프레임, 1-3 INT를 수행 325 00:19:21,460 --> 00:19:24,750 다음 또한 문자 벡터를 가지고있다. 326 00:19:24,750 --> 00:19:28,470 그래서 통해 인덱스를 할 수 이 컬럼의 각 327 00:19:28,470 --> 00:19:30,930 다음 나는 값 자체를 얻을 수 있습니다. 328 00:19:30,930 --> 00:19:34,370 그리고 당신은 또한 어떤 종류의 작업을 수행 할 수 있습니다 데이터 프레임에 작업. 329 00:19:34,370 --> 00:19:38,040 그리고 대부분의 시간을 당신이있을 때 데이터 분석 또는 어떤 종류의 일을 330 00:19:38,040 --> 00:19:42,042 전처리, 당신은있을거야 이러한 데이터 구조와 협력 331 00:19:42,042 --> 00:19:44,250 여기서 각 열은 것입니다 다른 유형이어야합니다. 332 00:19:44,250 --> 00:19:47,880 333 00:19:47,880 --> 00:19:52,970 >> 마지막으로, 그래서이 본질적으로 단지입니다 R. 목록에서 4 개의 필수 객체 334 00:19:52,970 --> 00:19:55,820 그냥를 수집합니다 다른 개체는 당신이 원하는. 335 00:19:55,820 --> 00:20:00,130 그래서 하나에이 저장됩니다 쉽게 액세스 할 수있는 변수입니다. 336 00:20:00,130 --> 00:20:02,370 >> 그래서 여기에, 나는 목록을 데려 갈거야. 337 00:20:02,370 --> 00:20:04,460 나는 물건 3에 해당 말하는거야. 338 00:20:04,460 --> 00:20:08,060 그래서 하나의 요소를 가지고 갈거야 목록이이 물건이라고, 339 00:20:08,060 --> 00:20:10,570 그리고 값 3을 가질 것입니다. 340 00:20:10,570 --> 00:20:13,140 >> 또한 매트릭스를 생성 할 수 있습니다. 341 00:20:13,140 --> 00:20:17,970 그래서이 4과 끝 행 1 2에 해당하므로이 두 행렬. 342 00:20:17,970 --> 00:20:20,270 또한 목록에서 그것은 매트라고합니다. 343 00:20:20,270 --> 00:20:24,690 moreStuff, 문자열, 자체 심지어 다른 목록입니다. 344 00:20:24,690 --> 00:20:27,710 >> 그래서이 5 곰의 목록입니다. 345 00:20:27,710 --> 00:20:30,990 그 값 5를 갖도록 문자열 곰이 346 00:20:30,990 --> 00:20:32,710 그리고 목록 내부의 목록입니다. 347 00:20:32,710 --> 00:20:35,965 그래서 당신이있을 수 있습니다 재귀 일 경우 348 00:20:35,965 --> 00:20:38,230 당신은 another--이 유형 내에서 입력합니다. 349 00:20:38,230 --> 00:20:41,420 그래서 유사하게, 당신은 매트릭스를 가질 수있다 또 다른 매트릭스 내부 등등. 350 00:20:41,420 --> 00:20:44,264 그리고 목록은 그냥 좋은 방법입니다 수집 및 집계의 351 00:20:44,264 --> 00:20:45,430 모든 다른 개체. 352 00:20:45,430 --> 00:20:50,210 353 00:20:50,210 --> 00:20:57,150 >> 그리고 마지막으로, 여기에 단지의 경우에 도움이된다 이것은 단지 매우 빠르게 이상 사라졌다. 354 00:20:57,150 --> 00:21:01,350 그래서 언제 당신은 혼란스러워 기능 어떤 종류의 약, 355 00:21:01,350 --> 00:21:03,510 해당 기능의 도움을 수행 할 수 있습니다. 356 00:21:03,510 --> 00:21:07,120 그래서 당신은 도움이 행렬을 할 수있는 또는 물음표 행렬. 357 00:21:07,120 --> 00:21:11,430 도움말 및 물음표입니다 그냥 같은 일을 나타내는 표현 358 00:21:11,430 --> 00:21:13,040 그래서 그들은 별명이야. 359 00:21:13,040 --> 00:21:16,820 >> LM는 기능입니다 단지 선형 모델을 수행합니다. 360 00:21:16,820 --> 00:21:20,340 하지만 당신은 어떻게 할 수 있는지 아무 생각이없는 경우 작품은, 당신은 단지 작품의 도움을 수행 할 수 있습니다 361 00:21:20,340 --> 00:21:24,610 그것은 당신에게 줄거야 문서의 종류 그 362 00:21:24,610 --> 00:21:27,960 가지처럼 보이는 유닉스, 남자 페이지 363 00:21:27,960 --> 00:21:34,210 당신의 짧은 설명을 가지고있는 그것의 인수는 또한 무엇을합니까, 364 00:21:34,210 --> 00:21:38,850 그것은 반환하고, 방법에 대한 그냥 팁 무엇 그것을 사용하고, 일부 실시 예뿐만 아니라한다. 365 00:21:38,850 --> 00:21:41,680 366 00:21:41,680 --> 00:21:52,890 >> 그래서 내가 미리와 쇼 가자 R. 확인을 사용하는 몇 가지 데모. 367 00:21:52,890 --> 00:21:55,470 그래서 나는 매우 갔다 신속하게 데이터 만 368 00:21:55,470 --> 00:21:59,440 구조와 어떤 종류의 작업의 일부를 op--. 369 00:21:59,440 --> 00:22:02,960 여기에 몇 가지 기능입니다. 370 00:22:02,960 --> 00:22:06,750 >> 그래서 여기 난 그냥 갈거야 함수를 정의 할 수 있습니다. 371 00:22:06,750 --> 00:22:09,970 그래서 나는 또한 사용하고 있습니다 여기에 대입 연산자, 372 00:22:09,970 --> 00:22:12,610 다음 말인지 함수로 선언. 373 00:22:12,610 --> 00:22:14,140 그리고 x 값을합니다. 374 00:22:14,140 --> 00:22:18,210 그래서이 원하는 값이다 나는 그 자체 x를 반환하는거야. 375 00:22:18,210 --> 00:22:20,840 그래서이 식별 기능입니다. 376 00:22:20,840 --> 00:22:23,670 >> 그리고 이것에 대해 멋진거야 다른 언어에 비해 377 00:22:23,670 --> 00:22:26,330 다른 낮은 수준 언어는 그 x는 378 00:22:26,330 --> 00:22:29,350 모든 유형 자체가 될 수 있습니다 그리고 그 형식을 반환합니다. 379 00:22:29,350 --> 00:22:35,251 그래서 당신은 그렇게 할 수 imagine-- 수 있습니다 내게는 신속하게이 프로그램을 실행합니다. 380 00:22:35,251 --> 00:22:35,750 미안 해요. 381 00:22:35,750 --> 00:22:40,300 >> 그래서 한 가지 나는 또한 언급해야한다 이 편집기 내가 사용하고 있다는 것입니다 382 00:22:40,300 --> 00:22:41,380 rstudio라고합니다. 383 00:22:41,380 --> 00:22:44,389 이 IDE라고하는 것입니다. 384 00:22:44,389 --> 00:22:46,180 그리고 한 가지입니다 그 이 정말 좋은 385 00:22:46,180 --> 00:22:51,500 이 많이 포함한다는 것이다 사물은 그 자체로 R에서 수행 할 386 00:22:51,500 --> 00:22:53,180 단지 매우 직관적. 387 00:22:53,180 --> 00:22:55,550 >> 그래서 여기 통역 콘솔입니다. 388 00:22:55,550 --> 00:23:02,160 그래서 유사하게, 당신은 또한이를 얻을 수 있습니다 다만 자본 R.을 수행하여 콘솔 원시 389 00:23:02,160 --> 00:23:05,630 그리고 이것은 정확히입니다 콘솔과 같은 일. 390 00:23:05,630 --> 00:23:12,210 그래서 난 그냥 ID 기능 X, X, X를 할 수 있습니다. 391 00:23:12,210 --> 00:23:16,130 그러고 나서 ... 그리고 그와 자체가 잘 될 것입니다. 392 00:23:16,130 --> 00:23:19,200 393 00:23:19,200 --> 00:23:21,740 >> 그래서 rstudio 중대하다 이 콘솔을 가지고 있기 때문에. 394 00:23:21,740 --> 00:23:25,360 또한 문서를 갖는다 당신은에 실행하고 싶습니다. 395 00:23:25,360 --> 00:23:28,629 그리고, 그것은 몇 가지 변수가 당신은 환경에서 볼 수있다. 396 00:23:28,629 --> 00:23:30,420 그리고, 당신은 할 경우 당신에게 다음, 플롯을 할 수 397 00:23:30,420 --> 00:23:33,730 반대로 그냥 여기를 볼 수 있습니다 모든 다른 창을 관리 398 00:23:33,730 --> 00:23:35,940 그 자체로. 399 00:23:35,940 --> 00:23:40,530 >> 사실 개인적으로 빔을 사용하지만 rstudio 같은 느낌 그냥 우수 400 00:23:40,530 --> 00:23:44,640 좋은 아이디어를 얻기위한 보통 R.를 사용하는 방법, 401 00:23:44,640 --> 00:23:47,040 때 당신이 노력하고 새로운 작업을 배우고, 402 00:23:47,040 --> 00:23:49,590 당신은 처리하지 않으려는 한 번에 너무 많은 것. 403 00:23:49,590 --> 00:23:53,120 그래서 R은 아주 - rstudio입니다 학습 R의 아주 좋은 방법입니다 404 00:23:53,120 --> 00:23:56,760 다루는 않고도 이 모든 다른 것들. 405 00:23:56,760 --> 00:23:58,600 >> 그래서 나는 여기 안녕하세요 ID를 실행 해요. 406 00:23:58,600 --> 00:24:00,090 이 인사 반환합니다. 407 00:24:00,090 --> 00:24:01,740 ID (123). 408 00:24:01,740 --> 00:24:04,610 여기서 정수 벡터이다. 409 00:24:04,610 --> 00:24:08,620 그래서 유사하게, 당신이 할 수 있기 때문에 가치의 일부를 취해야 410 00:24:08,620 --> 00:24:16,060 당신의 ID를 반환 할 수 X 그래서 1234 5 반환합니다. 411 00:24:16,060 --> 00:24:22,210 >> 그리고 바로 당신을 보여하겠습니다 이 참 정수입니다. 412 00:24:22,210 --> 00:24:28,800 그리고 유사하게, 당신은 클래스를 할 경우 아이디 x는,이 정수가 될 것. 413 00:24:28,800 --> 00:24:34,170 그리고, 당신은 또한 수 이 두 가지를 비교하고 그것은 사실입니다. 414 00:24:34,170 --> 00:24:38,350 그래서는 x의 경우 ID를 알아보고 있어요 등호 x 및 통지와 동일 415 00:24:38,350 --> 00:24:39,760 그것이 당신에게 두 TRUEs을 제공합니다. 416 00:24:39,760 --> 00:24:44,280 그래서이는 말을하지 않습니다 동일한 두 개체, 417 00:24:44,280 --> 00:24:46,845 하지만 각 항목입니다 벡터 동일 내. 418 00:24:46,845 --> 00:24:50,000 419 00:24:50,000 --> 00:24:52,090 >> 여기 bounded.compare입니다. 420 00:24:52,090 --> 00:24:58,470 그래서이 약간 더 복잡하다 점에서이 경우 조건을 가지고 있으며, 다른 421 00:24:58,470 --> 00:25:00,960 다음 삼각 관계 한 번에 인수. 422 00:25:00,960 --> 00:25:02,640 따라서 x는 임의의 타입이다. 423 00:25:02,640 --> 00:25:06,280 내가 이런 말을 해요 두 번째 인수는 것입니다. 424 00:25:06,280 --> 00:25:08,380 이것은 또한 무엇이든 될 수있다. 425 00:25:08,380 --> 00:25:12,490 그러나 기본적으로이 걸릴 거예요 5 당신은 아무것도 지정하지 않은 경우. 426 00:25:12,490 --> 00:25:16,730 >> 그래서 여기에 무슨 말을해야 겠어 X는보다 큰 경우. 427 00:25:16,730 --> 00:25:19,220 나는를 지정하지 않은 경우 그래서, 그것을 X가 5보다 큰 경우, 말한다 428 00:25:19,220 --> 00:25:20,470 나는 TRUE를 반환거야. 429 00:25:20,470 --> 00:25:23,230 다른, 나는 FALSE를 반환거야. 430 00:25:23,230 --> 00:25:24,870 그래서 내가 가서이 문제를 정의 할 수 있습니다. 431 00:25:24,870 --> 00:25:30,600 432 00:25:30,600 --> 00:25:34,550 >> 지금은 갈거야 bounded.compare 3를 실행합니다. 433 00:25:34,550 --> 00:25:39,150 그래서 3 이하 말합니다 than-- 5 3보다 크다. 434 00:25:39,150 --> 00:25:41,830 아니, 그렇게 FALSE 아니다. 435 00:25:41,830 --> 00:25:46,550 >> 그리고 3 bounded.compare 나는거야 2와 동일한 사용하여 비교. 436 00:25:46,550 --> 00:25:50,700 그래서 지금은 지금, 그래 말하는거야 뭔가 다른 싶어요. 437 00:25:50,700 --> 00:25:52,750 내가 말할거야 그래서, 당신은 2이어야합니다. 438 00:25:52,750 --> 00:25:56,640 >> 나는 이런 종류의 작업을 수행 할 수 있습니다 표기법 아니면 2에 해당 말한다. 439 00:25:56,640 --> 00:25:58,720 이것은 더 읽을 수 그 당신이있을 때 440 00:25:58,720 --> 00:26:01,450 이러한 정말보고 복잡한 기능이 441 00:26:01,450 --> 00:26:08,110 여러 arguments--이 걸릴 수십 그냥 말 oftentimes--이 될 수 있습니다 442 00:26:08,110 --> 00:26:11,140 2는 더 읽을 일치 한 향후 그래서 나중에 당신 443 00:26:11,140 --> 00:26:13,020 당신은 당신이 무슨 일을하는지 알 수 있습니다. 444 00:26:13,020 --> 00:26:17,120 >> 그래서이 경우에, 난 속담이 3보다 크다. 445 00:26:17,120 --> 00:26:18,270 예 그렇습니다. 446 00:26:18,270 --> 00:26:22,350 그리고 유사하게, 그냥 제거 할 수 있습니다 이 말과 2, 3보다 크다 447 00:26:22,350 --> 00:26:23,440 여기서 2와 동일합니다. 448 00:26:23,440 --> 00:26:26,230 그리고 그것은 또한 사실입니다. 449 00:26:26,230 --> 00:26:26,730 네? 450 00:26:26,730 --> 00:26:29,670 >> 청중 : 당신은 누구 라인으로 라인을 실행? 451 00:26:29,670 --> 00:26:30,670 >> 더스틴 TRAN : 그래, 난입니다. 452 00:26:30,670 --> 00:26:33,900 그래서 내가 여기서 뭘하고있어입니다 이 텍스트를 복용 document-- 453 00:26:33,900 --> 00:26:39,825 및 rstudio가 있다는 것입니다에 대한 좋은거야 난 그냥 short--에게 키 바로 가기를 실행할 수 있습니다. 454 00:26:39,825 --> 00:26:41,820 그래서 컨트롤 - 입력하고 있어요. 455 00:26:41,820 --> 00:26:44,850 >> 그리고, 내가 데려 갈거야 텍스트 문서의 라인 456 00:26:44,850 --> 00:26:46,710 다음 콘솔에 넣어. 457 00:26:46,710 --> 00:26:50,800 그래서 여기에 내가 말하고, bounded.compare 내가 제어-X를하고 있어요. 458 00:26:50,800 --> 00:26:52,540 그래서 난 그냥 여기에서도 실행 할 수 있습니다. 459 00:26:52,540 --> 00:26:54,920 그리고 그 할게요 다음 라인과 여기에 넣어. 460 00:26:54,920 --> 00:26:57,900 그리고 유사하게, 여기 실행 할 수 있습니다. 461 00:26:57,900 --> 00:27:04,630 그리고 그것은 단지 정의 계속됩니다 같은 콘솔에 라인. 462 00:27:04,630 --> 00:27:10,690 >> 그리고 당신은 또한 곱슬가 나는 경우 중괄호는 C 구문처럼이 있습니다. 463 00:27:10,690 --> 00:27:13,910 x-- 경우 조건이 또한 경우 괄호를 사용하려고하고 464 00:27:13,910 --> 00:27:15,350 당신은 다른 사용할 수 있습니다. 465 00:27:15,350 --> 00:27:17,496 또 다른 하나는 다른 경우입니다. 466 00:27:17,496 --> 00:27:21,440 그래서이 X이 될 것입니다 예를 들어, 동일 같습니다. 467 00:27:21,440 --> 00:27:24,190 468 00:27:24,190 --> 00:27:26,350 그리고 나는 갈거야 여기서 뭔가를 반환합니다. 469 00:27:26,350 --> 00:27:29,490 >> 두 개의 서로 다른 있다는 것을 주목 무슨 일 여기 가지. 470 00:27:29,490 --> 00:27:34,360 하나는 내가 지정하고있어 여기에 있다는 것입니다 값이 TRUE를 반환. 471 00:27:34,360 --> 00:27:35,950 여기에 그냥 X를 말하는거야. 472 00:27:35,950 --> 00:27:39,970 그래서 R 기본적으로 보통 것 마지막 arguments--을 473 00:27:39,970 --> 00:27:43,510 또는, 코드의 마지막 줄을 그리고 그것이 반환 무슨 될 것입니다. 474 00:27:43,510 --> 00:27:46,920 그래서 여기이 동일 반환 X 작업을 할 것. 475 00:27:46,920 --> 00:27:49,450 476 00:27:49,450 --> 00:27:50,540 >> 그리고 당신을 표시합니다. 477 00:27:50,540 --> 00:27:54,000 478 00:27:54,000 --> 00:27:57,052 그리고, 그냥 그런 식으로 작동합니다. 479 00:27:57,052 --> 00:27:58,260 그래서 날이 계속하자. 480 00:27:58,260 --> 00:28:00,630 >> 그래서 다른 경우. 481 00:28:00,630 --> 00:28:04,060 그리고 정말로, 나는 반환 할 수 있습니다 내가 좋아하는 것 아무것도. 482 00:28:04,060 --> 00:28:06,680 그래서 난 필요 없어 반환 부울​​ 모든 시간을, 483 00:28:06,680 --> 00:28:08,410 난 그냥 다른 뭔가를 반환 할 수 있습니다. 484 00:28:08,410 --> 00:28:10,670 그래서 반환 곰을 할 수 있습니다. 485 00:28:10,670 --> 00:28:12,989 >> x가 동일한 경우는 그래서, 동일 이 곰을 반환하는 것입니다. 486 00:28:12,989 --> 00:28:14,530 그렇지 않으면 TRUE를 반환 할 것입니다. 487 00:28:14,530 --> 00:28:19,310 또한 벡터를 할 수 나 정말 아무것도. 488 00:28:19,310 --> 00:28:22,210 >> 그리고 일반적으로 정적에 입력 된 언어, 489 00:28:22,210 --> 00:28:23,840 여기 유형을 지정해야 할 것이다. 490 00:28:23,840 --> 00:28:25,750 그리고 그냥 아무것도 할 수 있다는 것을 알 수 있습니다. 491 00:28:25,750 --> 00:28:32,400 그리고 R은 충분히 지능 다만이 작업을 수행하고 그것을 잘 작동합니다. 492 00:28:32,400 --> 00:28:33,620 >> 그래서 내가이를 정의 할 수 있습니다. 493 00:28:33,620 --> 00:28:39,460 494 00:28:39,460 --> 00:28:41,230 죄송 오 Unexpected--. 495 00:28:41,230 --> 00:28:44,336 여기 중괄호해야합니다. 496 00:28:44,336 --> 00:28:44,836 확인을 클릭합니다. 497 00:28:44,836 --> 00:28:45,336 쿨. 498 00:28:45,336 --> 00:28:52,580 499 00:28:52,580 --> 00:28:54,530 좋아. 500 00:28:54,530 --> 00:28:58,250 그래서 지금의 3을 비교하자 3 같습니다. 501 00:28:58,250 --> 00:29:01,860 그래서 return--한다 값 곰 생각났어. 502 00:29:01,860 --> 00:29:06,740 >> 그래서 지금보다 일반적인 것은 같다 어떤 다른 데이터 구조에 대한. 503 00:29:06,740 --> 00:29:09,110 그래서 당신은이 기능을 가지고있다. 504 00:29:09,110 --> 00:29:15,360 이것은 모든 종류의 작업을 할 것입니다 3 또는 숫자와 같은 값, 505 00:29:15,360 --> 00:29:17,500 즉, 두 번. 506 00:29:17,500 --> 00:29:19,330 >> 벡터 같은 약하지만. 507 00:29:19,330 --> 00:29:27,750 그렇다면 당신이 그렇게 싫어합니다 경우 난 발생 6 말에 발, 4를 할당하는 것. 508 00:29:27,750 --> 00:29:31,640 그래서이이를 반환하는 경우 4, 5, 6 행 벡터이다. 509 00:29:31,640 --> 00:29:34,935 >> 이제 어떻게되는지 보자 내가 할 경우 발을 bounded.compare. 510 00:29:34,935 --> 00:29:37,680 511 00:29:37,680 --> 00:29:42,450 그래서 이것은 당신에게 1251 (15)을 줄 것입니다. 512 00:29:42,450 --> 00:29:46,440 즉 그래서, 그것은 말 것 이 상태를 보면 513 00:29:46,440 --> 00:29:50,040 그래서 X 덜 말한다 또는 무엇인가보다. 514 00:29:50,040 --> 00:29:51,880 그래서이 약간 혼란 때문에 지금 515 00:29:51,880 --> 00:29:53,379 당신은 무슨 일이 일어나고 있는지 모른다. 516 00:29:53,379 --> 00:29:58,690 그래서 나는 정말로 한 가지를 추측 단지 디버그하려고에 대한 좋은 517 00:29:58,690 --> 00:30:04,600 당신이 발은 크다 할 수 있다는 것입니다 그리고보다 것은이 어떻게되는지. 518 00:30:04,600 --> 00:30:09,720 >> 그래서 val--은 기본 5 그렇게하는 것입니다 그냥 5보다 큰 발 할 수 있습니다. 519 00:30:09,720 --> 00:30:14,280 그래서이 벡터 FALSE FALSE TRUE입니다. 520 00:30:14,280 --> 00:30:17,206 그래서 지금 당신이보고 할 때 이,이 경우 말하는 것, 521 00:30:17,206 --> 00:30:20,080 그리고, 그것은 당신이 줄거야 FALSE FALSE의 벡터가 TRUE입니다. 522 00:30:20,080 --> 00:30:23,450 >> 당신은 R, R로이 전달 그래서 때 당신이 무슨 일을하는지 모르고있다. 523 00:30:23,450 --> 00:30:26,650 그것은 하나의 기대 때문에 부울 값, 그리고 지금 524 00:30:26,650 --> 00:30:29,420 당신은 그것을 부울의 벡터를 제공하고 있습니다. 525 00:30:29,420 --> 00:30:31,970 그래서 기본적으로, R은 그냥 도대체 무엇을 말을하려고, 526 00:30:31,970 --> 00:30:35,440 난 당신이있어 것 같은데요 여기에 첫 번째 요소를 걸릴 것. 527 00:30:35,440 --> 00:30:38,320 그래서 내가 갈거야 말하길거야 이 거짓이라고 가정합니다. 528 00:30:38,320 --> 00:30:40,890 그래서 말 것 아니, 이것은 옳지 않다. 529 00:30:40,890 --> 00:30:45,246 >> 마찬가지로,가는거야 발은 동일 동일합니다. 530 00:30:45,246 --> 00:30:47,244 아니, 5 죄송합니다. 531 00:30:47,244 --> 00:30:48,910 그리고 그것은 또한뿐만 아니라 거짓이 될 것. 532 00:30:48,910 --> 00:30:52,410 그래서, '아니오'라고하는거야 그것은뿐만 아니라 그것은 그래서 사실이 아니다 533 00:30:52,410 --> 00:30:53,680 이 마지막 하나를 반환하는 것. 534 00:30:53,680 --> 00:30:56,420 535 00:30:56,420 --> 00:31:01,360 >> 그래서 이것은 좋은 일이나 나쁜 중 하나입니다 일, 당신이 그것을 보는 방법에 따라 달라집니다. 536 00:31:01,360 --> 00:31:05,104 당신이있을 때 때문에 이러한 기능을 작성, 537 00:31:05,104 --> 00:31:06,770 당신은 실제로 무슨 일이 일어나고 있는지 모른다. 538 00:31:06,770 --> 00:31:10,210 그래서 때로는 오류를 할 것, 또는 어쩌면 당신은 경고를 할 수 있습니다. 539 00:31:10,210 --> 00:31:12,160 이 경우, R은 그렇게하지 ​​않습니다. 540 00:31:12,160 --> 00:31:14,300 그래서 정말에게 달려 당신의 기반으로 무엇 541 00:31:14,300 --> 00:31:17,310 당신은 언어를 생각 이 경우 어떻게해야 542 00:31:17,310 --> 00:31:22,920 당신은 부울의 벡터에 전달하는 경우 당신은 실행 조건 일 때. 543 00:31:22,920 --> 00:31:31,733 >> 그럼 원래 있다고 가정 해 봅시다 하나 다른 경우로하면 TRUE를 반환하고 당신이있어 544 00:31:31,733 --> 00:31:34,190 FALSE를 반환 것. 545 00:31:34,190 --> 00:31:39,300 추상화의 그래서 하나의 방법 이것은 내가 말을하는 것입니다 546 00:31:39,300 --> 00:31:41,530 심지어이 조건부 것은 필요하지 않습니다. 547 00:31:41,530 --> 00:31:47,220 내가 할 수있는 또 다른 것은 그냥 값 자체를 반환. 548 00:31:47,220 --> 00:31:53,240 그래서 당신은주의 경우 경우 발 5보다 큰 수행 549 00:31:53,240 --> 00:31:56,350 이를 반환하는 것입니다 벡터 FALSE FALSE TRUE. 550 00:31:56,350 --> 00:31:58,850 >> 어쩌면 이것은 당신이 무슨이다 bounded.compare 원하는. 551 00:31:58,850 --> 00:32:02,940 당신은 부울의 벡터를 반환 할 여기서, 그것은 각각의 값을 비교하여 552 00:32:02,940 --> 00:32:04,190 자신에. 553 00:32:04,190 --> 00:32:11,165 그래서 그냥 bounded.compare 할 수 함수 X는 5 같습니다. 554 00:32:11,165 --> 00:32:13,322 555 00:32:13,322 --> 00:32:15,363 그리고 대신이 일을 이 경우 다른 조건, 556 00:32:15,363 --> 00:32:21,430 난 그냥 돌아 갈거야 x는 5보다 크다. 557 00:32:21,430 --> 00:32:23,620 그래서 그 다음에, 사실이라면 TRUE를 반환 할 것입니다. 558 00:32:23,620 --> 00:32:26,830 그렇지 않은 경우 그리고, 그것은이다 FALSE를 반환 것. 559 00:32:26,830 --> 00:32:30,880 >> 그리고 이것은 작동합니다 이러한 임의의 구조. 560 00:32:30,880 --> 00:32:41,450 그래서 1 6 9 c를 bounded.compare 수 있습니다 그리고, 나는, 6에 해당 말할거야 561 00:32:41,450 --> 00:32:42,799 예를 들어. 562 00:32:42,799 --> 00:32:44,840 그리고, 그것은에 무슨 당신에게 오른쪽 부울을 제공 563 00:32:44,840 --> 00:32:48,240 당신이 설계하고 벡터. 564 00:32:48,240 --> 00:32:50,660 >> 그래서 사람들은 단지 기능은 지금 나에게 그냥하자 565 00:32:50,660 --> 00:32:54,980 당신에게 약간의 인터랙티브 영상을 보여줍니다. 566 00:32:54,980 --> 00:32:59,700 나는 실제로 생각하지 않습니다 와이파이 여기 그래서 내가 그냥 진행하자 567 00:32:59,700 --> 00:33:01,970 내가 추측이 하나를 건너 뜁니다. 568 00:33:01,970 --> 00:33:05,260 >> 멋진 그러나 한 가지 하지만은 당신의 경우 단지 569 00:33:05,260 --> 00:33:09,600 한 무리를 테스트 할 상이한 데이터 명령, 570 00:33:09,600 --> 00:33:13,320 다른 데이터 세트의 무리가있다 즉, 이미 R.에 미리로드 571 00:33:13,320 --> 00:33:15,770 그래서 그들 중 하나는 홍채 데이터 세트라고합니다. 572 00:33:15,770 --> 00:33:18,910 이것은 가장 잘 알려진 중 하나입니다 기계 학습에 사람. 573 00:33:18,910 --> 00:33:23,350 당신은 대개의 일종을 다하겠습니다 코드가 실행되는 경우 테스트 케이스를 확인합니다. 574 00:33:23,350 --> 00:33:27,520 그래서 그냥 조리개가 무엇인지 확인해 보도록하자. 575 00:33:27,520 --> 00:33:33,130 >> 그래서이 일은 것입니다 데이터 프레임 수입니다. 576 00:33:33,130 --> 00:33:36,000 그리고 오랜 때문에 종류의 난 그냥 조리개를 인쇄. 577 00:33:36,000 --> 00:33:38,810 그것은 전체 일을 인쇄합니다. 578 00:33:38,810 --> 00:33:42,830 그래서이 모든 다른 이름을 가지고있다. 579 00:33:42,830 --> 00:33:45,505 그래서 조리개 모음입니다 다른 꽃. 580 00:33:45,505 --> 00:33:48,830 이 경우에는 말하고 당신이 그것의 종, 581 00:33:48,830 --> 00:33:54,760 모든 다른 폭과 꽃받침 잎과 꽃잎의 길이. 582 00:33:54,760 --> 00:33:58,880 >> 그래서 일반적으로, 경우 당신은, 조리개를 인쇄 할 583 00:33:58,880 --> 00:34:03,680 예를 들어, 당신이 그것을하고 싶지 않아 그 이상 걸릴 수 있기 때문에 모든 이렇게 584 00:34:03,680 --> 00:34:05,190 전체 콘솔. 585 00:34:05,190 --> 00:34:09,280 정말로 그래서 한 가지 좋은 머리 기능입니다. 586 00:34:09,280 --> 00:34:12,929 그래서 그냥 머리를 할 경우 아이리스, 이것은 당신에게 줄 것이다 587 00:34:12,929 --> 00:34:17,389 처음 다섯 행, 6는 것 같아요. 588 00:34:17,389 --> 00:34:19,909 그리고 물론, 당신에게 여기 지정할 수 있습니다. 589 00:34:19,909 --> 00:34:22,914 그래서 20--이 줄 것이다 당신 처음 20 행. 590 00:34:22,914 --> 00:34:24,830 그리고 사실은 친절했다 이 그 놀라 591 00:34:24,830 --> 00:34:28,770 나 여섯 그래서 내가 앞서 가자 준 그리고 죄송합니다, iris-- 또는 머리를 확인합니다. 592 00:34:28,770 --> 00:34:31,699 593 00:34:31,699 --> 00:34:34,960 그리고 여기가 줄 것이다 당신 문서 594 00:34:34,960 --> 00:34:37,960 값 헤드는 수행의 무엇. 595 00:34:37,960 --> 00:34:40,839 그래서 제를 반환 또는 객체의 마지막. 596 00:34:40,839 --> 00:34:42,630 그리고 나는 갈거야 기본값을 확인합니다. 597 00:34:42,630 --> 00:34:47,340 그리고, 그것은 기본 말한다 방법 헤드 x와 n은 6L 같습니다. 598 00:34:47,340 --> 00:34:50,620 그래서이 처음 여섯 요소를 반환합니다. 599 00:34:50,620 --> 00:34:55,050 그리고 당신은 여기에 주목 유사 경우, I N를 지정하지 않은 것은 6 같습니다. 600 00:34:55,050 --> 00:34:56,840 기본적으로 여섯 사용하는 것 같아요. 601 00:34:56,840 --> 00:35:00,130 내가 원하는 경우 그리고, 일정을 지정합니다 값은, 그때 그뿐만 아니라 볼 수 있습니다. 602 00:35:00,130 --> 00:35:02,970 603 00:35:02,970 --> 00:35:10,592 >> 그 몇 가지 간단한 명령되도록하고 여기 아니라 그냥 ... 다른 하나의, 604 00:35:10,592 --> 00:35:12,550 나는이 실제로하고 있는데 ... 좀 더 복잡한, 605 00:35:12,550 --> 00:35:17,130 그러나 이것은 단지 클래스를 취할 것 홍채 데이터 세트의 각 열의. 606 00:35:17,130 --> 00:35:20,910 그래서이 어떤 각을 보여줍니다 열은 해당 유형의 점에있다. 607 00:35:20,910 --> 00:35:23,665 그래서 꽃받침 잎 길이는 숫자입니다 꽃받침 잎 폭은 숫자입니다. 608 00:35:23,665 --> 00:35:26,540 모든 이러한 값은 단지 숫자 아르 이 데이터에서 알 수 있기 때문에 609 00:35:26,540 --> 00:35:29,440 이러한이 구조 모든 숫자에 가고. 610 00:35:29,440 --> 00:35:34,310 >> 그리고 종 열 요인이 될 것입니다. 611 00:35:34,310 --> 00:35:37,270 그래서 일반적으로, 당신은 생각 것 이 문자열과 같다. 612 00:35:37,270 --> 00:35:48,830 그러나 당신이 irisSpecies을 할 경우, 그리고, 나는, 머리 5 할거야 613 00:35:48,830 --> 00:35:51,820 이 인쇄 할 것입니다 처음 다섯 값 아웃. 614 00:35:51,820 --> 00:35:54,150 >> 그리고이 수준을 알 수 있습니다. 615 00:35:54,150 --> 00:35:58,870 그래서이이 말했듯이되어 R의 방법입니다 의 범주 변수를 가진. 616 00:35:58,870 --> 00:36:03,765 그래서 그 대신 단지 문자열을 갖는 617 00:36:03,765 --> 00:36:06,740 이 수준의 지정이 있습니다 이런 것들 중 어느 것이 있습니다. 618 00:36:06,740 --> 00:36:12,450 >> 그럼 irisSpecies 1을 가정 해 봅시다. 619 00:36:12,450 --> 00:36:17,690 그래서 당신이 무엇을 원하는 난입니다 이 종 열을 부분 집합. 620 00:36:17,690 --> 00:36:21,480 그래서이 걸리는 종 열 다음 621 00:36:21,480 --> 00:36:23,820 그 인덱스는 첫 번째 요소를 얻을 수 있습니다. 622 00:36:23,820 --> 00:36:27,140 그래서 이것은 당신에게 setosa를 제공해야합니다. 623 00:36:27,140 --> 00:36:28,710 그리고 그것은 또한 당신이 여기 레벨을 제공합니다. 624 00:36:28,710 --> 00:36:32,812 >> 그래서 당신은 또한 비교할 수 있습니다 문자 setosa이 625 00:36:32,812 --> 00:36:34,645 이것은하지 않을 사실이 하나 때문에 626 00:36:34,645 --> 00:36:37,940 다른 상이한 타입이다. 627 00:36:37,940 --> 00:36:40,590 아니면 내가이 R 때문에 사실 추측 보다 더 지능이다. 628 00:36:40,590 --> 00:36:45,420 그리고 그 다음이과에 보인다 어쩌면 이것은 당신이 원하는 것입니다 말했다. 629 00:36:45,420 --> 00:36:51,860 그래서 문자를 말하는 것 문자열 setosa이 하나와 동일합니다. 630 00:36:51,860 --> 00:37:01,290 그리고 유사하게, 당신은 할 수 또한 단지 등처럼이를 잡아. 631 00:37:01,290 --> 00:37:05,580 >> 그래서 그냥 일종 데이터 세트의 빠른 명령. 632 00:37:05,580 --> 00:37:08,030 그래서 여기에 일부 데이터 탐색이다. 633 00:37:08,030 --> 00:37:11,360 그래서이 조금 더 데이터 분석에 관여. 634 00:37:11,360 --> 00:37:18,340 그리고 이것은 일부에서 가져온 것입니다 버클리에 대한 R에서 부트 캠프. 635 00:37:18,340 --> 00:37:20,790 >> 외국 그래서 도서관. 636 00:37:20,790 --> 00:37:24,880 그래서 난에로드 할거야 외국라고 라이브러리. 637 00:37:24,880 --> 00:37:32,460 그래서이 날 줄 수 있겠나 read.dta 그래서이 데이터 집합을 가지는 것을 전제로하고 있습니다. 638 00:37:32,460 --> 00:37:39,000 이 전류에 저장된 내 콘솔의 작업 디렉토리. 639 00:37:39,000 --> 00:37:42,190 그래서 그냥 보자 무엇 작업 디렉토리입니다. 640 00:37:42,190 --> 00:37:44,620 >> 그래서 여기 내 작업 디렉토리입니다. 641 00:37:44,620 --> 00:37:50,040 그리고 도트 데이터,이 읽기 일,이 파일을 말하고있다 642 00:37:50,040 --> 00:37:54,650 의 데이터 폴더에 있습니다 이 현재 작업 디렉토리. 643 00:37:54,650 --> 00:38:00,520 그리고이 아니다 read.dta 기본 명령. 644 00:38:00,520 --> 00:38:02,760 나는 이미 그것을에서로드 같아요. 645 00:38:02,760 --> 00:38:04,750 IEI는 이미이의로드 가정. 646 00:38:04,750 --> 00:38:08,115 >> 그러나 그렇게 read.dta는 않을 것입니다 기본 명령합니다. 647 00:38:08,115 --> 00:38:11,550 그리고 당신이 할 겁니다 이유 이 라이브러리에서로드 package-- 648 00:38:11,550 --> 00:38:14,500 이 패키지는 외국했다. 649 00:38:14,500 --> 00:38:16,690 그리고 당신이없는 경우 패키지, 나는 생각한다 650 00:38:16,690 --> 00:38:19,180 외국인이 내장 된 것들 중 하나입니다. 651 00:38:19,180 --> 00:38:31,150 그렇지 않으면, 당신은 또한 수 install.packages을 652 00:38:31,150 --> 00:38:33,180 이 패키지를 설치합니다. 653 00:38:33,180 --> 00:38:36,878 그리고 이것은 아니, 당신은 R. 어를 줄 것이다. 654 00:38:36,878 --> 00:38:39,830 655 00:38:39,830 --> 00:38:43,140 그리고 나는 그만거야 이 이미 그것을 가지고 있기 때문이다. 656 00:38:43,140 --> 00:38:46,920 >> 그러나 R 정말 좋은거야 패키지 관리한다는 것입니다 657 00:38:46,920 --> 00:38:48,510 시스템은 매우 우아하다. 658 00:38:48,510 --> 00:38:52,470 그것은 모든 것을 저장하는 것이기 때문에 정말 친절하게 당신을 위해. 659 00:38:52,470 --> 00:38:59,780 그래서이 경우, 저장할 것 거기에, 저는 믿습니다, 여기에이 라이브러리. 660 00:38:59,780 --> 00:39:02,390 >> 그래서 언제든지 당신이 원하는 새로운 패키지를 설치, 661 00:39:02,390 --> 00:39:04,980 그것만큼 간단합니다 install.packages 일 662 00:39:04,980 --> 00:39:07,500 R은 모든 관리합니다 당신을위한 패키지. 663 00:39:07,500 --> 00:39:12,900 그래서 당신은 무언가를 할 필요가 없습니다 외부 패키지가 파이썬, 664 00:39:12,900 --> 00:39:15,330 종이 같은 관리자 아나콘다 어디있어 665 00:39:15,330 --> 00:39:18,310 당신은 설치 하는거죠 파이썬의 외부 패키지 666 00:39:18,310 --> 00:39:20,940 그리고 당신은 그들에게 자신을 실행 해보십시오. 667 00:39:20,940 --> 00:39:22,210 그래서 정말 좋은 방법입니다. 668 00:39:22,210 --> 00:39:25,590 >> 그리고 install.packages 인터넷이 필요합니다. 669 00:39:25,590 --> 00:39:31,950 이 서버에서 소​​요 및 저장소 그 670 00:39:31,950 --> 00:39:33,960 수집 된 모든 패키지는 크랑이라고합니다. 671 00:39:33,960 --> 00:39:40,690 그리고 당신은 거울의 어떤 종류를 지정할 수 있습니다 당신은 패키지를 다운로드 할 수 있습니다. 672 00:39:40,690 --> 00:39:43,420 >> 그래서 나는 여기있는이 데이터 집합을 복용하고 있습니다. 673 00:39:43,420 --> 00:39:46,240 나는이 기능을 사용하여 그것을 읽고 있어요. 674 00:39:46,240 --> 00:39:49,360 그래서 내가 가서 그렇게 할 수 있습니다. 675 00:39:49,360 --> 00:39:52,900 >> 그럼 그 가정하자 이 데이터 집합을 가지고 676 00:39:52,900 --> 00:39:55,550 당신은 절대적으로이 그것이 무엇인지 전혀 생각하지 않습니다. 677 00:39:55,550 --> 00:39:58,560 그리고이 실제로 등장 상당히 자주 업계 678 00:39:58,560 --> 00:40:00,910 당신은이이 곳 톤 지저분한 것들을 톤 679 00:40:00,910 --> 00:40:02,890 그들은 믿을 수 없을만큼 레이블이없는거야. 680 00:40:02,890 --> 00:40:06,380 그래서 나는 여기이있다 데이터 세트 및 모르겠어요 681 00:40:06,380 --> 00:40:08,400 무엇을 그렇게하다 난 그냥 해요 그것을 확인하기 위해 게재합니다. 682 00:40:08,400 --> 00:40:10,620 >> 그래서 내가 먼저 머리를 할거야. 683 00:40:10,620 --> 00:40:14,190 그래서 처음 여섯을 확인 이 데이터 집합이 무엇인지의 열. 684 00:40:14,190 --> 00:40:21,730 그래서이는 상태, pres04하고, 열이 모든 다른 종류. 685 00:40:21,730 --> 00:40:25,612 그리고 무슨 일이 재미있다 여기에, 내 생각, 당신 것입니다 686 00:40:25,612 --> 00:40:27,945 이 보이는 가정 것 선거의 일종있다. 687 00:40:27,945 --> 00:40:30,482 688 00:40:30,482 --> 00:40:32,190 그리고 난 그냥에서 추측 파일을보고 689 00:40:32,190 --> 00:40:41,070 이름이 컬렉션의 일종입니다 후보자 나 유권자에 대한 데이터의 690 00:40:41,070 --> 00:40:44,920 누가 특정 대통령 투표 또는 대통령 후보 691 00:40:44,920 --> 00:40:46,550 2004 년 선거를위한. 692 00:40:46,550 --> 00:40:52,920 >> 그래서 여기에 값 1, 2 그래서 저장 편도 693 00:40:52,920 --> 00:40:56,540 대통령 후보 자신의 이름입니다. 694 00:40:56,540 --> 00:40:59,780 이 경우, 보이는 그들은 단지 정수 값이야. 695 00:40:59,780 --> 00:41:04,030 2004 그래서, 부시했다 케리 대 저는 믿습니다. 696 00:41:04,030 --> 00:41:09,010 그리고 지금, 당신이 모르는 가정 해 봅시다 부시 또는 1 내지 2 대응 하는지를 697 00:41:09,010 --> 00:41:11,703 케리 또는과에 해당 등등 등등, 오른쪽? 698 00:41:11,703 --> 00:41:15,860 >> 그리고, 그냥 나에게있다 매우 일반적인 문제. 699 00:41:15,860 --> 00:41:18,230 따라서이 경우에는 무엇을 할 수 있는가? 700 00:41:18,230 --> 00:41:20,000 그래서이 모든 다른 일을 확인 할 수 있습니다. 701 00:41:20,000 --> 00:41:22,790 >> 상태,이 있으리라 믿고있어 다른 상태에서 온다. 702 00:41:22,790 --> 00:41:25,100 partyid, 소득. 703 00:41:25,100 --> 00:41:27,710 의는 partyid 살펴 보자. 704 00:41:27,710 --> 00:41:32,800 아마 당신이 할 수있는 한 가지입니다 관찰의 각보고 705 00:41:32,800 --> 00:41:36,250 즉, 공화당의 partyid이 민주당 또는 무언가 또는. 706 00:41:36,250 --> 00:41:38,170 그래서 그냥 무엇 partyid 살펴 보자. 707 00:41:38,170 --> 00:41:41,946 >> 그래서 걸릴거야 DAT 후 나는거야 708 00:41:41,946 --> 00:41:47,960 이 달러 기호를 할 수 나는 이전과 연산자 709 00:41:47,960 --> 00:41:50,770 이것은을 것입니다 해당 열 부분 세트. 710 00:41:50,770 --> 00:41:57,760 그리고 나는이 머리거야 20, 그냥이의 모습을 볼 수 있습니다. 711 00:41:57,760 --> 00:42:00,170 >> 그래서이 NAS에 단지 무리입니다. 712 00:42:00,170 --> 00:42:02,800 그래서 다른 말로하면, 당신은 이 사람에 대한 데이터를 누락. 713 00:42:02,800 --> 00:42:08,100 하지만 당신은이 통지 DAT는 partyid 요인 714 00:42:08,100 --> 00:42:10,030 그래서 이것은 당신에게 다른 종류를 제공합니다. 715 00:42:10,030 --> 00:42:14,170 그래서 다른 말로하면, partyid이 걸릴 수 있습니다 독립 민주당, 공화당, 716 00:42:14,170 --> 00:42:16,640 다른 또는 뭔가. 717 00:42:16,640 --> 00:42:23,940 >> 그럼 가서하자하자 볼이는 ... 오, OK의있다. 718 00:42:23,940 --> 00:42:28,480 그래서 나는 부분 집합거야 다음 partyid하고 719 00:42:28,480 --> 00:42:32,780 사람이있는 볼 민주당, 예를 들면. 720 00:42:32,780 --> 00:42:37,150 이것은 당신에게 부울을 줄 것입니다 TRUEs 및 FALSEs의 거대한 부울. 721 00:42:37,150 --> 00:42:41,630 >> 그리고 지금의 내가하고 싶은 말은하자 이 사람에 세트에. 722 00:42:41,630 --> 00:42:47,260 그래서 내 날엔 걸릴 것입니다 및 일부 중 관측 723 00:42:47,260 --> 00:42:48,910 partyid 등호가 민주당 같습니다. 724 00:42:48,910 --> 00:42:52,830 725 00:42:52,830 --> 00:42:55,180 그리고이 때문에 상당히 긴 그들 중 많은이있다. 726 00:42:55,180 --> 00:42:59,060 그래서 지금은 20 년이 머리거야. 727 00:42:59,060 --> 00:43:05,690 728 00:43:05,690 --> 00:43:11,270 >> 당신이 알 수 있듯이, 등호와 동일 당신이있어 점에서 흥미 롭다 729 00:43:11,270 --> 00:43:13,250 already-- 당신은 또한 NAS를 포함하고 있습니다. 730 00:43:13,250 --> 00:43:19,010 이 경우, 당신은 여전히​​ 얻을 수 없다 정보 이제 NAS에 있기 때문에 731 00:43:19,010 --> 00:43:22,650 당신은 단지보고 싶은 어떤 관찰은 민주당에 해당 732 00:43:22,650 --> 00:43:24,670 이러한 누락되지 값 자체. 733 00:43:24,670 --> 00:43:27,680 그렇다면 이들의 NA 제거 것인가? 734 00:43:27,680 --> 00:43:36,410 >> 그래서 나는 여기 단지에 최대 키를 사용하고 내 커서 다음 주위를 움직이고 말. 735 00:43:36,410 --> 00:43:39,778 그리고 여기에 난 그냥 갈거야 is.na datpartyid 대답. 736 00:43:39,778 --> 00:43:48,970 737 00:43:48,970 --> 00:43:52,720 그래서 이것과 및 소요됩니다 두 개의 서로 다른 부울 벡터 738 00:43:52,720 --> 00:43:57,160 그것이 될 것 말 TRUE 예를 들면 FALSE. 739 00:43:57,160 --> 00:43:59,190 그래서이 구성 요소 현명 할 것입니다. 740 00:43:59,190 --> 00:44:02,910 그래서 나는 여기 테이크를 말하는거야 데이터 프레임은, 서브 세트 741 00:44:02,910 --> 00:44:10,170 민주당에 해당하는 것들, 및 NA되지 않은 그들 중 하나를 제거합니다. 742 00:44:10,170 --> 00:44:13,540 >> 그래서 그들은 ...이해야 당신이 뭔가를 제공합니다. 743 00:44:13,540 --> 00:44:16,540 744 00:44:16,540 --> 00:44:17,600 의는 is.na. 보자 745 00:44:17,600 --> 00:44:24,670 746 00:44:24,670 --> 00:44:27,690 의는 is.na datpartyid 해보자. 747 00:44:27,690 --> 00:44:36,290 748 00:44:36,290 --> 00:44:45,290 그리고이 드릴께요 제공해야 다만 부울 벡터를 sorry--. 749 00:44:45,290 --> 00:44:49,260 그리고, 너무 오래이기 때문에, 나는 20의 서브 세트를거야. 750 00:44:49,260 --> 00:44:49,760 확인을 클릭합니다. 751 00:44:49,760 --> 00:44:51,570 그래서이 작동합니다. 752 00:44:51,570 --> 00:44:54,700 >> 그리고 하나는 TRUEs 될 것입니다. 753 00:44:54,700 --> 00:45:01,830 아, 그래서 여기 내 오류는 그 난 ... I C ++ 및 R 상호 교환 내가 만들어 사용 754 00:45:01,830 --> 00:45:03,590 이 실수 모든 시간. 755 00:45:03,590 --> 00:45:05,807 및 운영자입니다 실제로 당신이 원하는 하나. 756 00:45:05,807 --> 00:45:08,140 두 가지를 사용하지 않으려는 앰퍼샌드, 단지 하나의 하나. 757 00:45:08,140 --> 00:45:14,970 758 00:45:14,970 --> 00:45:17,010 확인을 클릭합니다. 759 00:45:17,010 --> 00:45:18,140 >> 그래서 보자. 760 00:45:18,140 --> 00:45:20,930 761 00:45:20,930 --> 00:45:23,920 그래서 우리는에 서브 세트 partyid 그들은 민주당이야 어디 762 00:45:23,920 --> 00:45:25,300 그리고 그들은 값이 누락 아닙니다. 763 00:45:25,300 --> 00:45:27,690 그리고 이제 살펴 보자 이들이 투표 것. 764 00:45:27,690 --> 00:45:31,530 그래서 가장 좋아하는 것 이들의 1 투표했다. 765 00:45:31,530 --> 00:45:36,090 그래서 앞서 갈거야 그리고 케리 말한다. 766 00:45:36,090 --> 00:45:39,507 >> 그리고 유사하게, 당신은 할 수 또한 공화당로 이동 767 00:45:39,507 --> 00:45:41,090 희망이 당신에게 2를 제공해야합니다. 768 00:45:41,090 --> 00:45:49,730 769 00:45:49,730 --> 00:45:51,770 그것은 다른 열 그냥 무리입니다. 770 00:45:51,770 --> 00:45:53,070 그리고 실제로, 그것은 2입니다. 771 00:45:53,070 --> 00:45:55,750 그래서, 모든 공화당 partyid 그들 대부분은 2를 위해 투표한다. 772 00:45:55,750 --> 00:45:58,390 >> 그래서 그냥 같은 것 이보고에 의해, 773 00:45:58,390 --> 00:46:00,600 공화당이 될 것입니다 아주 - 또는 partyid 774 00:46:00,600 --> 00:46:02,790 매우 될 것입니다 결정하는 큰 요인 775 00:46:02,790 --> 00:46:05,420 어느 후보가있어 투표 할 것. 776 00:46:05,420 --> 00:46:07,120 그리고 이것은 일반적으로 분명 사실이다. 777 00:46:07,120 --> 00:46:10,139 그리고 이것은 당신의 일치 직관, 물론. 778 00:46:10,139 --> 00:46:11,930 그래서 난 것 같아 그래서 시간의 부족 779 00:46:11,930 --> 00:46:17,040 나 그냥 가서해야 할 일부 빠른 이미지를 보여줍니다. 780 00:46:17,040 --> 00:46:21,120 그래서 여기에 약간 뭔가입니다 더 시각화 복잡. 781 00:46:21,120 --> 00:46:26,450 이 경우, 이것은 매우 인 다만 검사의 간단한 분석 무엇 782 00:46:26,450 --> 00:46:28,500 '04의 대통령이다. 783 00:46:28,500 --> 00:46:33,920 >> 이 경우 그래서, 당신을 가정 해 봅시다 이 질문에 대답하고 싶​​었다. 784 00:46:33,920 --> 00:46:38,540 그래서 우리는 투표를 알고 싶어한다고 가정 2004 년 대통령 선거에서 동작 785 00:46:38,540 --> 00:46:41,170 그 인종에 따라 다릅니다 방법. 786 00:46:41,170 --> 00:46:44,380 그래서뿐만 아니라 당신은하고 싶지 않음 , 투표 동작을 볼 수 787 00:46:44,380 --> 00:46:47,860 하지만 당신은 각각의 부분 집합 할 레이스와 종류의 요약. 788 00:46:47,860 --> 00:46:50,770 그리고 당신은 말할 수 이 복잡​​한 표기법으로 789 00:46:50,770 --> 00:46:52,580 이 것을 가지 헷갈리는지고 있습니다. 790 00:46:52,580 --> 00:46:56,390 >> 그래서 더 많은 고급 R 중 하나 최근 가지도의 패키지 791 00:46:56,390 --> 00:47:00,070 dplyr라고합니다. 792 00:47:00,070 --> 00:47:03,060 그래서 여기이 하나입니다. 793 00:47:03,060 --> 00:47:08,080 그리고 ggg-- ggplot2 그냥 좋은 더 나은 시각화를 수행하는 방법 794 00:47:08,080 --> 00:47:09,400 내장보다. 795 00:47:09,400 --> 00:47:11,108 >> 그래서로드거야 이 두 라이브러리. 796 00:47:11,108 --> 00:47:13,200 797 00:47:13,200 --> 00:47:16,950 그리고, 내가 갈거야 앞서이 명령을 실행합니다. 798 00:47:16,950 --> 00:47:19,050 당신은 블랙 박스로이 처리 할 수​​ 있습니다. 799 00:47:19,050 --> 00:47:23,460 >> 무엇 일어나는 것은이 파이프 것입니다 운영자는이 인수를 전달한다 800 00:47:23,460 --> 00:47:24,110 여기에. 801 00:47:24,110 --> 00:47:28,070 그래서 나는 날엔에 의해 그룹을 말하는거야 인종과 다​​음 대통령 04. 802 00:47:28,070 --> 00:47:31,530 그리고 나서, 모든 다른 명령 필터링 한 후 요약된다 803 00:47:31,530 --> 00:47:34,081 어디 카운트를하고 있어요 및 그때 난 여기가 음모를 꾸미고있어. 804 00:47:34,081 --> 00:47:39,980 805 00:47:39,980 --> 00:47:42,500 멋진 OK. 806 00:47:42,500 --> 00:47:44,620 그럼 가서하자 이 모습을 참조하십시오. 807 00:47:44,620 --> 00:47:52,280 808 00:47:52,280 --> 00:47:57,290 >> 그래서 여기에 무슨 일이 일어나고 것은 제가이다 다만 다음 인종과 각을 그려 809 00:47:57,290 --> 00:47:59,670 이들이 투표 것. 810 00:47:59,670 --> 00:48:03,492 이 두 가지를 값이 1에 해당합니다. 811 00:48:03,492 --> 00:48:05,325 당신은 더 많은 수 있도록하려면 우아한, 당신은 또한 수 812 00:48:05,325 --> 00:48:11,770 단지 2 Kerry-- 이상인지 지정 이 부시는, 그 후 1 케리이다. 813 00:48:11,770 --> 00:48:13,700 그리고 당신도 할 수 있습니다 당신의 전설에서 그. 814 00:48:13,700 --> 00:48:17,410 >> 그리고 이러한 막대 그래프를 분할 할 수 있습니다. 815 00:48:17,410 --> 00:48:19,480 한 가지이기 때문에 즉, 당신이 나는 경우, 816 00:48:19,480 --> 00:48:24,560 이 식별하는 것은 매우 쉬운 일이 아닙니다 이들 두 값을 이용할지는 크다. 817 00:48:24,560 --> 00:48:27,920 그래서 한 가지 당신이 원하는 것 할이 파란색 영역을하다 818 00:48:27,920 --> 00:48:31,855 그리고 당신 때문에 여기를 통해 이동 측면에서이 두 가지 측면을 비교할 수 있습니다. 819 00:48:31,855 --> 00:48:34,480 그리고 그 뭔가 내가 추측 지금 할 시간이 없어, 820 00:48:34,480 --> 00:48:36,660 그러나 그것은 또한 아주 쉽게 할 수 있습니다. 821 00:48:36,660 --> 00:48:40,310 당신은에 볼 수 있습니다 ggplot의 매뉴얼 페이지를 참조하십시오. 822 00:48:40,310 --> 00:48:47,170 그래서 그냥 같이 ggplot 할 수 그와이 매뉴얼 페이지에 참조하십시오. 823 00:48:47,170 --> 00:48:51,920 >> 그러니 빨리하겠습니다 당신에게 멋진 일을 보여줍니다. 824 00:48:51,920 --> 00:48:57,610 이제 가서 단지를 아 - 가자 기계 학습의 응용 프로그램입니다. 825 00:48:57,610 --> 00:49:02,450 그래서 우리는이 세 가지가 있다고 가정 해 보자 패키지는 그래서 이러한로드거야. 826 00:49:02,450 --> 00:49:05,500 827 00:49:05,500 --> 00:49:09,170 그래서 이것은 단지 일부를 출력 정보 나는 일에로드 된 후. 828 00:49:09,170 --> 00:49:15,220 그래서 나는이 read.csv을 말하고, 이 데이터 집합, 그리고 지금 829 00:49:15,220 --> 00:49:18,940 내가 가서보고거야 이 데이터 집합의 내부에 무엇이 있는지. 830 00:49:18,940 --> 00:49:22,080 >> 처음 20 관찰 그래서. 831 00:49:22,080 --> 00:49:27,190 그래서 난 그냥 그래서 X1, X2,와 Y가 이 값의 무리처럼 보인다 832 00:49:27,190 --> 00:49:31,640 아마 20-80 정도에 이르기까지한다. 833 00:49:31,640 --> 00:49:37,700 그리고, 마찬가지로 X2 용 후 이 Y 라벨 0 및 1이 될 것으로 보인다. 834 00:49:37,700 --> 00:49:49,500 >> 이를 확인하려면, 난 할 수있어 그냥 요약 데이터 X1을한다. 835 00:49:49,500 --> 00:49:51,660 그리고 유사에 대한 모든 다른 열. 836 00:49:51,660 --> 00:49:55,300 그래서 요약 빠른 방법입니다 당신에게 빠른 값을 표시합니다. 837 00:49:55,300 --> 00:49:56,330 아, 죄송합니다. 838 00:49:56,330 --> 00:49:58,440 이 사람은 Y.해야 839 00:49:58,440 --> 00:50:03,420 >> 이 경우 그래서, 제공 분위수, 중앙값은 물론 maxes. 840 00:50:03,420 --> 00:50:07,130 이 경우, dataY, 당신은 볼 수 있습니다 그것은 단지 0과 1이 될 것있다. 841 00:50:07,130 --> 00:50:10,100 또한 평균 말하고있다 0.6은 그냥 것을 의미한다 842 00:50:10,100 --> 00:50:13,380 I가 0보다 1 초를 가지고있는 것처럼 보인다. 843 00:50:13,380 --> 00:50:16,160 >> 그래서 내가 미리와 쇼 가자 이는 모습. 844 00:50:16,160 --> 00:50:17,470 그래서 난 그냥이 음모거야. 845 00:50:17,470 --> 00:50:22,852 846 00:50:22,852 --> 00:50:24,636 자,이 제거하는 방법을 살펴 보자. 847 00:50:24,636 --> 00:50:30,492 848 00:50:30,492 --> 00:50:31,468 OK 오. 849 00:50:31,468 --> 00:50:35,840 850 00:50:35,840 --> 00:50:36,340 확인을 클릭합니다. 851 00:50:36,340 --> 00:50:37,590 >> 그래서이는 모습이다. 852 00:50:37,590 --> 00:50:46,310 그래서 내가 지정된 노랑처럼 보인다 0을 입력 한 다음 빨간색으로 나는 1 초로 지정. 853 00:50:46,310 --> 00:50:52,190 그래서 여기처럼 보인다 라벨 점과 854 00:50:52,190 --> 00:50:56,410 당신은 단지 몇 가지를 원처럼 보인다 이에 클러스터링의 종류. 855 00:50:56,410 --> 00:51:01,020 >> 그리고 내가 바로 앞에와 쇼 가자 이러한 내장 함수의 당신 일부. 856 00:51:01,020 --> 00:51:03,580 그래서 여기에 작품입니다. 857 00:51:03,580 --> 00:51:06,060 그래서 이것은 단지 시도 이에 라인에 맞게. 858 00:51:06,060 --> 00:51:08,640 그래서 가장 좋은 방법은 나는 선은 들어가는 지 859 00:51:08,640 --> 00:51:14,020 그것은 최고의 분리됩니다 클러스터링 이런 종류의. 860 00:51:14,020 --> 00:51:21,790 그리고 이상적으로, 당신은 볼 수 있습니다 난 그냥이 모든 명령을 실행하는 것이 861 00:51:21,790 --> 00:51:25,450 다음, 내가 갈거야 앞서와 라인을 추가합니다. 862 00:51:25,450 --> 00:51:28,970 >> 그래서이 추측처럼 보인다. 863 00:51:28,970 --> 00:51:34,150 그것은 최소화하는 가장 좋은 하나를 복용 이 줄을 맞추려고에서 오류가 발생했습니다. 864 00:51:34,150 --> 00:51:40,000 분명히, 이것은 가지 보인다 좋은하지만 최선이 아니다. 865 00:51:40,000 --> 00:51:43,130 그리고 선형 모델에서 일반적으로는 될거야 866 00:51:43,130 --> 00:51:46,811 이론과 그저 정말 좋은 기계의 건물 기초의 867 00:51:46,811 --> 00:51:47,310 학습. 868 00:51:47,310 --> 00:51:50,330 그러나 실제로, 당신은 갈거야 더 일반적으로 뭔가를 할 수 있습니다. 869 00:51:50,330 --> 00:51:54,280 >> 그래서 그냥 실행 시도 할 수 있습니다 뭔가 신경 네트워크를했다. 870 00:51:54,280 --> 00:51:57,110 이런 일들은 점점 더 일반적인. 871 00:51:57,110 --> 00:52:00,530 그리고 그들은 단지 환상적 일 큰 데이터 세트. 872 00:52:00,530 --> 00:52:07,080 이 경우, 우리는 니스, 니 의 우리가 nrow을 알아요 ... 수 있습니다. 873 00:52:07,080 --> 00:52:09,010 그래서 nrow은 행의 수를 말하고있다. 874 00:52:09,010 --> 00:52:11,790 I는,이 경우에 따라서 100 관찰을 가지고있다. 875 00:52:11,790 --> 00:52:15,010 >> 그래서 내가 가서하자 신경망을합니다. 876 00:52:15,010 --> 00:52:18,620 그래서 정말 좋은 난 그냥 nnet 말을 할 수 있기 때문에 877 00:52:18,620 --> 00:52:21,767 다음 나는 Y.의 기능에 영향을 미치지 해요 그래서 Y는 열입니다. 878 00:52:21,767 --> 00:52:23,850 그리고 그것을 역행 다른 두 변수. 879 00:52:23,850 --> 00:52:27,360 그래서이 짧은 X1과 X2에 대한 표기. 880 00:52:27,360 --> 00:52:29,741 >> 그럼 가서이를 실행하자. 881 00:52:29,741 --> 00:52:30,240 아, 죄송합니다. 882 00:52:30,240 --> 00:52:32,260 나는이 모든 일을 실행해야합니다. 883 00:52:32,260 --> 00:52:37,500 그리고 이것은 단지 표기를 인쇄 얼마나 빨리 여부를 신속하게하기에 884 00:52:37,500 --> 00:52:38,460 통합. 885 00:52:38,460 --> 00:52:41,420 그래서이 수렴 않은 것 같습니다. 886 00:52:41,420 --> 00:52:44,970 그러니 앞서 및 인쇄 가자 이 어떻게 생겼는지 알아. 887 00:52:44,970 --> 00:52:51,260 >> 여기에 그림이 그리고 여기를 참조하십시오 이 얼마나 잘 맞는지를 보여주는 윤곽. 888 00:52:51,260 --> 00:52:56,380 그리고 이것은 당신이 볼 수있는 단지 ... 이이 아주, 아주 좋은입니다. 889 00:52:56,380 --> 00:52:59,400 심지어 수 당신은 또한 수 있습니다 과다 적합하지만, 890 00:52:59,400 --> 00:53:03,390 다른이를 차지 교차 유효성 검사와 같은 기술. 891 00:53:03,390 --> 00:53:06,180 그리고이 또한 R. 내장되어 있습니다 892 00:53:06,180 --> 00:53:09,170 >> 그리고 제가 보여 드리죠 벡터 머신을 지원합니다. 893 00:53:09,170 --> 00:53:12,470 이것은 또 다른 정말 일반적입니다 기계 학습 기술. 894 00:53:12,470 --> 00:53:18,550 그것은 선형 모델과 매우 유사하지만, 그것은 커널 방법이라고 무엇을 사용합니다. 895 00:53:18,550 --> 00:53:22,790 그리고 이제 그 얼마나 잘하는지 보자. 896 00:53:22,790 --> 00:53:26,430 그래서 하나의 방법과 매우 유사 웰 신경망이 수행 897 00:53:26,430 --> 00:53:27,900 그러나 훨씬 부드러워 야. 898 00:53:27,900 --> 00:53:35,740 그리고 이것은 기반으로한다 의 방법 SVM을 작업 뭐냐 .... 899 00:53:35,740 --> 00:53:40,250 >> 그래서이 그냥 아주 몇 가지의 간단한 개요 900 00:53:40,250 --> 00:53:43,822 내장 함수의 작업을 수행 할 수 있습니다 또한 데이터 탐색의 일부. 901 00:53:43,822 --> 00:53:45,905 그러니 그냥 진행하자 그리고 슬라이드로 돌아갑니다. 902 00:53:45,905 --> 00:53:50,290 903 00:53:50,290 --> 00:53:53,670 >> 그러므로 분명히, 이것은 인 매우 포괄적 없습니다. 904 00:53:53,670 --> 00:53:57,140 그리고 이것은 정말 그냥 맛보기입니다 당신이 정말로 R.에서 무엇을 할 수 있는지를 보여주는 905 00:53:57,140 --> 00:53:59,100 그래서 당신이 원하신다면 여기에, 자세히 알아 봅니다 906 00:53:59,100 --> 00:54:01,210 다른 자원의 무리입니다. 907 00:54:01,210 --> 00:54:06,890 >> 당신은 교과서의 좋아하는 것 또는 당신은 그래서 만약 그냥 온라인으로 물건을 읽고 좋아, 908 00:54:06,890 --> 00:54:09,670 다음이 환상적입니다 해들리 위컴 하나, 909 00:54:09,670 --> 00:54:13,010 또한 생성 된 모든 사람이 정말 멋진 패키지. 910 00:54:13,010 --> 00:54:17,420 당신이 비디오를 좋아해요 경우, 버클리는 멋진 부트 캠프가 911 00:54:17,420 --> 00:54:21,060 그 가지 길어 several-- 때문입니다. 912 00:54:21,060 --> 00:54:24,210 그리고 그것은 거의 당신을 가르 칠 것입니다 모든 것을 당신은 R.에 대해 알고 싶습니다 913 00:54:24,210 --> 00:54:27,770 >> 그리고 유사하게, Codeacademy을 거기에 이 모든 다른 종류의 914 00:54:27,770 --> 00:54:29,414 의 대화 형 웹 사이트. 915 00:54:29,414 --> 00:54:31,580 그들은 또한 점점 더 일반적인 공통점. 916 00:54:31,580 --> 00:54:33,749 그래서이 Codeacademy 매우 유사하다. 917 00:54:33,749 --> 00:54:35,790 그리고 마지막으로, 당신의 경우 단지 커뮤니티를 원하고 도움, 918 00:54:35,790 --> 00:54:38,800 이들의 무리이다 당신이 갈 수있는 것. 919 00:54:38,800 --> 00:54:40,880 물론, 우리는 여전히 다만, 메일 링리스트를 사용 920 00:54:40,880 --> 00:54:44,860 거의 모든 다른 같은 프로그래밍 언어 커뮤니티. 921 00:54:44,860 --> 00:54:47,880 그리고 #rstats, 여긴 커뮤니티 트위터. 922 00:54:47,880 --> 00:54:49,580 즉, 실제로는 매우 일반적이다. 923 00:54:49,580 --> 00:54:50,850 다음 사용자! 924 00:54:50,850 --> 00:54:52,340 우리의 회의입니다. 925 00:54:52,340 --> 00:54:55,390 >> 그리고, 물론, 당신은 할 수 모든 다른 Q & A 물건을 사용, 926 00:54:55,390 --> 00:54:57,680 스택 오버플로 등, 구글 다음 GitHub에. 927 00:54:57,680 --> 00:55:00,490 이 패키지의 대부분 때문에 지역 사회의 많은 928 00:55:00,490 --> 00:55:03,420 개발을 중심으로한다 코드는 오픈 소스 때문이다. 929 00:55:03,420 --> 00:55:05,856 그리고 GitHub의에 정말 좋은 데요. 930 00:55:05,856 --> 00:55:08,730 그리고 마지막으로, 당신은 경우에 저에게 연락 할 수 있습니다 당신은 그냥 빠른 질문이 있습니다. 931 00:55:08,730 --> 00:55:13,530 그래서 당신은 여기에 트위터에 나를 찾을 수 있습니다, 내 웹 사이트, 단지 내 이메일. 932 00:55:13,530 --> 00:55:17,840 그래서 희망, 그했다 그 어떤 것도 짧은 맛보기 933 00:55:17,840 --> 00:55:20,900 무엇 R은 일을 정말 할 수있다. 934 00:55:20,900 --> 00:55:23,990 그리고 바라건대, 당신 단지 이 세 가지 링크를 체크 아웃 935 00:55:23,990 --> 00:55:25,760 당신은 더 많은 일을 할 수 있는지. 936 00:55:25,760 --> 00:55:28,130 그리고 그건 그냥 그것에 대해 같아요. 937 00:55:28,130 --> 00:55:28,630 감사합니다. 938 00:55:28,630 --> 00:55:30,780 >> [박수] 939 00:55:30,780 --> 00:55:31,968