1
00:00:00,000 --> 00:00:00,750

2
00:00:00,750 --> 00:00:09,800
>> [음악 연주]

3
00:00:09,800 --> 00:00:13,014

4
00:00:13,014 --> 00:00:13,680
더스틴 TRAN : 안녕하세요.

5
00:00:13,680 --> 00:00:14,980
내 이름은 더스틴.

6
00:00:14,980 --> 00:00:18,419
그래서 나는 제시 할 것
R.에서 데이터 분석

7
00:00:18,419 --> 00:00:19,710
자신에 대해 조금.

8
00:00:19,710 --> 00:00:24,320
나는 현재 대학원 학생입니다
엔지니어링 및 응용 과학.

9
00:00:24,320 --> 00:00:28,330
나는의 교차 연구
기계 학습 및 통계

10
00:00:28,330 --> 00:00:31,375
그래서 R에서 데이터 분석입니다
정말 기본적인 무엇

11
00:00:31,375 --> 00:00:33,790
나는 매일 않습니다.

12
00:00:33,790 --> 00:00:35,710
>> 그리고 R이다 특히
데이터 분석을위한 좋은

13
00:00:35,710 --> 00:00:39,310
이 프로토 타입을 위해 아주 좋은 때문이다.

14
00:00:39,310 --> 00:00:43,590
그리고 일반적으로, 당신은 어떤 종류의 일을 할 때
데이터 분석, 많은 문제 중

15
00:00:43,590 --> 00:00:44,920
인지에 갈 수 있습니다.

16
00:00:44,920 --> 00:00:48,700
그래서 그냥 갖고 싶어
정말 좋은 언어 그

17
00:00:48,700 --> 00:00:53,770
일을 단지 좋은
내장 함수, 반대

18
00:00:53,770 --> 00:00:57,430
낮은 수준의 일을 처리하는 데에.

19
00:00:57,430 --> 00:01:01,040
처음에 그래서, 난 그냥 갈거야
소개 R은 무엇을, 왜이 것입니다

20
00:01:01,040 --> 00:01:04,540
당신은 그것을 사용하고자하고,
다음 몇 가지 데모에 가서,

21
00:01:04,540 --> 00:01:07,060
그냥 거기에서 이동합니다.

22
00:01:07,060 --> 00:01:08,150
>> 그래서 R은 무엇인가?

23
00:01:08,150 --> 00:01:11,180
R은 언어 개발
통계 컴퓨팅을위한

24
00:01:11,180 --> 00:01:12,450
및 시각화.

25
00:01:12,450 --> 00:01:16,000
그래서 이것이 의미하는 것입니다
그것은 매우 훌륭한 언어이다

26
00:01:16,000 --> 00:01:22,400
다루는 것은 모든 종류의에 대한
불확실성 또는 데이터 시각화.

27
00:01:22,400 --> 00:01:24,850
그래서 당신은 모든이
확률 분포.

28
00:01:24,850 --> 00:01:27,140
있을거야
내장 함수.

29
00:01:27,140 --> 00:01:31,650
또한 우수해야합니다
패키지를 플로팅.

30
00:01:31,650 --> 00:01:34,110
>> 파이썬은 다른 경쟁이다
데이터의 언어.

31
00:01:34,110 --> 00:01:40,020
그리고 한 가지 그 R을 찾아 그
시각화에서 훨씬 낫다.

32
00:01:40,020 --> 00:01:45,200
그래서 당신은 데모로 볼 수 있습니다
잘 단지 매우 직관적 인 언어입니다

33
00:01:45,200 --> 00:01:48,050
그건 그냥 매우 잘 작동합니다.

34
00:01:48,050 --> 00:01:53,140
그것은으로, 또한 무료 오픈 소스
제 생각 엔 다른 좋은 언어입니다.

35
00:01:53,140 --> 00:01:55,440
>> 단지의 그리고 여기, 무리
키워드는 당신을 던져.

36
00:01:55,440 --> 00:02:00,450
당신이있는 경우에 그것은 의미, 동적이다
객체에 할당 된 특정 유형

37
00:02:00,450 --> 00:02:02,025
보다 그냥 즉석에서 변경합니다.

38
00:02:02,025 --> 00:02:05,670
그것은 게으른 그래서 약 똑똑
어떻게 계산을 수행합니다.

39
00:02:05,670 --> 00:02:12,250
정말 작동 할 수 있음을 의미 기능
기능의 떨어져 증거를 없애도록 기반

40
00:02:12,250 --> 00:02:16,910
당신이있어 조작의 모든 종류의
일, 그것은 기능을 기반으로합니다.

41
00:02:16,910 --> 00:02:20,162
>> 그래서 이항 연산자, 예를 들어,
다만 본질적 기능은 다음과 같습니다.

42
00:02:20,162 --> 00:02:21,870
그리고 모든 것을
당신은 어떻게되는거야

43
00:02:21,870 --> 00:02:24,690
가는 함수 자체를 실행합니다.

44
00:02:24,690 --> 00:02:27,140
그리고뿐만 아니라 객체 지향.

45
00:02:27,140 --> 00:02:30,930
>> 그래서 여기 XKCD 플롯이다.

46
00:02:30,930 --> 00:02:34,350
뿐만 아니라 내가 같은 느낌 때문에
XKCD는 어떤 종류의 기초입니다

47
00:02:34,350 --> 00:02:37,770
프리젠 테이션,하지만 때문에
난 정말이 같은 느낌

48
00:02:37,770 --> 00:02:42,160
점을 망치 그 많은
당신은 데이터의 일종을하고있는 시간

49
00:02:42,160 --> 00:02:46,570
분석, 문제가되지 않습니다
가 실행 얼마나 빨리 너무 많이,

50
00:02:46,570 --> 00:02:49,850
하지만가는 얼마나 오래
작업을 프로그래밍하는 당신을 데려 갈.

51
00:02:49,850 --> 00:02:54,112
그래서 여기에 단지 여부를 분석한다
전략 또는 b를 더 효율적이다.

52
00:02:54,112 --> 00:02:55,820
이 될 것입니다
당신이있어 뭔가

53
00:02:55,820 --> 00:02:58,290
에와 많은 거래를하려고
정렬의 로우 레벨 언어

54
00:02:58,290 --> 00:03:03,440
당신이 독방 감금 오류 다루고 경우,
메모리 할당, 초기화,

55
00:03:03,440 --> 00:03:05,270
심지어 내장 함수 만들기.

56
00:03:05,270 --> 00:03:09,920
그리고이 물건은 모든 처리
아주, 아주 우아 R.에서

57
00:03:09,920 --> 00:03:12,839
>> 그래서 그냥이를 망치로
포인트, 가장 큰 병목

58
00:03:12,839 --> 00:03:13,880
인지 될 것입니다.

59
00:03:13,880 --> 00:03:17,341
따라서 데이터 분석은 매우 어려운 문제이다.

60
00:03:17,341 --> 00:03:19,340
당신이하고있는 여부
기계 학습 또는 당신이있어

61
00:03:19,340 --> 00:03:22,550
단지 어떤 종류의 일을
기본 데이터 탐색,

62
00:03:22,550 --> 00:03:25,290
당신은하고 싶지 않아요
문서를 취할

63
00:03:25,290 --> 00:03:27,440
다음 컴파일
때마다 뭔가 당신

64
00:03:27,440 --> 00:03:31,010
열이 어떻게 생겼는지보고 싶어,
행렬의 어떤 특정 항목

65
00:03:31,010 --> 00:03:32,195
처럼 보인다.

66
00:03:32,195 --> 00:03:34,320
그래서 그냥 갖고 싶어
정말 멋진 인터페이스

67
00:03:34,320 --> 00:03:37,740
당신은 간단한 기능을 실행할 수 있습니다
인덱스에 그 무엇

68
00:03:37,740 --> 00:03:41,870
당신은 좋아하고 거기에서 실행할 것입니다.

69
00:03:41,870 --> 00:03:44,190
그리고 당신은 도메인이 필요
이 특정 언어.

70
00:03:44,190 --> 00:03:51,750
그리고 R은 정말 당신을 정의하는 데 도움이 될 것
문제는 이러한 방식으로이를 해결한다.

71
00:03:51,750 --> 00:03:58,690
>> 그래서 여기 플롯 보여주는 프로그램입니다
R의 인기는 시간이 지남에 사라 졌어요있다.

72
00:03:58,690 --> 00:04:04,060
같은 그래서 당신은 2013처럼 볼 수 있습니다
그래서 그냥 엄청난 폭파.

73
00:04:04,060 --> 00:04:09,570
그리고 이것은 단지 그 때문에되었습니다
기술 업계에 큰 추세

74
00:04:09,570 --> 00:04:10,590
에 대한 빅 데이터.

75
00:04:10,590 --> 00:04:13,010
또한, 단지 기술
산업,하지만 정말

76
00:04:13,010 --> 00:04:16,490
어떤 산업 거저 때문에
산업의 많은

77
00:04:16,490 --> 00:04:20,589
에 종류의 기본적인
이러한 문제를 해결하기 위해 노력.

78
00:04:20,589 --> 00:04:24,590
그리고 일반적으로, 당신은 좋은있을 수 있습니다
이러한 문제를 측정하는 방법

79
00:04:24,590 --> 00:04:29,720
심지어 그들을 정의하거나
데이터를 사용하여 해결.

80
00:04:29,720 --> 00:04:35,430
그래서 지금은 R이 11이 생각
TIOBE에 가장 인기있는 언어

81
00:04:35,430 --> 00:04:38,200
그리고 그 이후로 성장하고있다.

82
00:04:38,200 --> 00:04:40,740

83
00:04:40,740 --> 00:04:43,080
>> 그래서 여기에 몇 가지 더있어
R.의 기능이있다

84
00:04:43,080 --> 00:04:46,900
패키지의 엄청난 수와
모든 다른 것들에 대한.

85
00:04:46,900 --> 00:04:52,470
그래서 언제든지 당신은이
특정 문제 대부분을

86
00:04:52,470 --> 00:04:55,060
시간 R는 것
당신을 위해 그 기능.

87
00:04:55,060 --> 00:04:58,520
당신이 원하는 그래서 여부
기계의 일종을 구축

88
00:04:58,520 --> 00:05:02,770
라는 학습 알고리즘
임의 숲 또는 의사 결정 트리,

89
00:05:02,770 --> 00:05:07,530
심지어의 평균을하려고
함수 또는이 물건의,

90
00:05:07,530 --> 00:05:10,000
R은있을 것이다.

91
00:05:10,000 --> 00:05:14,190
>> 당신이 경우에 그리고 당신은 걱정
흔한 최적화, 한 가지

92
00:05:14,190 --> 00:05:17,430
당신은 프로토 타입을 수행하고 있는지 후
고급 언어의 일종,

93
00:05:17,430 --> 00:05:19,810
당신은을 받 발생합니다
당신은 것입니다 단지 포트 그 이상

94
00:05:19,810 --> 00:05:21,550
일부 낮은 수준의 언어.

95
00:05:21,550 --> 00:05:26,090
무엇 R에 대해 좋은 점은 일단 당신 것입니다
프로토 타입을 완료, 당신은 C ++를 실행할 수 있습니다,

96
00:05:26,090 --> 00:05:29,510
또는 포트란, 또는 이들의 임의
직접 R.으로 낮은 수준의 것들

97
00:05:29,510 --> 00:05:32,320
그래서 하나는 정말로
R에 대한 멋진 기능,

98
00:05:32,320 --> 00:05:35,930
당신이 정말로 걱정하는 경우
최적화 점.

99
00:05:35,930 --> 00:05:39,490
>> 그리고 그것은 또한 정말 좋은
웹 시각화합니다.

100
00:05:39,490 --> 00:05:43,530
그래서 D3.js는, 예를 들면,
나는 또 다른 세미나를 추측

101
00:05:43,530 --> 00:05:45,130
우리는 오늘 발표 것을.

102
00:05:45,130 --> 00:05:48,510
그리고 이것은 정말 굉장
인터랙티브 비주얼을.

103
00:05:48,510 --> 00:05:54,460
그리고 D3.js는 있다고 가정
데이터의 어떤 종류는 플롯 할

104
00:05:54,460 --> 00:05:58,080
R은 할 수있는의 좋은 방법입니다
데이터 분석 당신이 그것을 내보내기 전에

105
00:05:58,080 --> 00:06:04,220
이상 D3.js 또는 심지어 그냥 실행
D3.js는 R 자체에 명령,

106
00:06:04,220 --> 00:06:08,240
뿐만 아니라 모든 이들과 같은
다른 라이브러리뿐만 아니라.

107
00:06:08,240 --> 00:06:13,041
>> 그래서 단지 소개했다
R 그리고 왜 당신이 그것을 사용할 수있는 것입니다.

108
00:06:13,041 --> 00:06:14,790
그래서 희망, 나는했습니다
당신이 뭔가를 확신

109
00:06:14,790 --> 00:06:18,460
대한 그냥 어떤 건지 확인하려고합니다.

110
00:06:18,460 --> 00:06:23,930
그래서 내가 가서 통해 갈거야
R 객체에 대한 몇 가지 기본 사항

111
00:06:23,930 --> 00:06:26,150
그리고 당신이 정말로 무엇을 할 수 있는지.

112
00:06:26,150 --> 00:06:29,690
>> 그래서 여기에 단지입니다
수학 명령의 무리.

113
00:06:29,690 --> 00:06:35,000
그래서 당신이 구축하려는 혹시 교수님 말
언어 자신과 당신은 원하는

114
00:06:35,000 --> 00:06:38,080
다른 도구의 무리가 있습니다.

115
00:06:38,080 --> 00:06:42,520
작업의 모든 종류의 당신은 당신이 거라고 생각
거의 R. 될 것입니다 원하는

116
00:06:42,520 --> 00:06:44,150
>> 그래서 여기에 2 플러스 2입니다.

117
00:06:44,150 --> 00:06:46,090
여기에 2 회 파이입니다.

118
00:06:46,090 --> 00:06:51,870
R은 내장 상수의 무리가
자주 파이, 전자처럼 사용하고 있다고.

119
00:06:51,870 --> 00:06:56,230
>> 그리고, 여기에 7 플러스의
runif, 1 runif 그래서.

120
00:06:56,230 --> 00:07:02,450
이것은의 함수가 생성됩니다
0-1 하나의 랜덤 유니폼.

121
00:07:02,450 --> 00:07:04,400
그리고 4의 힘 (3)이있다.

122
00:07:04,400 --> 00:07:06,430
제곱근이있다.

123
00:07:06,430 --> 00:07:07,270
>> 로그가있다.

124
00:07:07,270 --> 00:07:14,500
그래서베이스를 할 것입니다 로그
그 자체로 지수.

125
00:07:14,500 --> 00:07:18,337
그리고, 당신은베이스를 지정하는 경우, 다음
당신은 당신이 원하는대로 기본 할 수 있습니다.

126
00:07:18,337 --> 00:07:19,920
그리고 여기에 몇 가지 다른 명령입니다.

127
00:07:19,920 --> 00:07:22,180
그래서 당신은 23 모드 2있다.

128
00:07:22,180 --> 00:07:24,910
그런 다음 나머지를 가지고있다.

129
00:07:24,910 --> 00:07:27,110
그럼 당신은 과학이
표기법 또한 경우

130
00:07:27,110 --> 00:07:34,060
단지 더 많은 일을하고 싶은
더 복잡한 것.

131
00:07:34,060 --> 00:07:37,320
>> 그래서 여기에 할당합니다.

132
00:07:37,320 --> 00:07:40,830
의 전형적인 지정
R은 화살표와 함께 이루어집니다

133
00:07:40,830 --> 00:07:43,440
그래서 미만보다 하이픈입니다.

134
00:07:43,440 --> 00:07:47,250
그래서 여기 난 그냥 할당 해요
변수 발 3.

135
00:07:47,250 --> 00:07:50,160
>> 그리고 나는 발을 인쇄하고 있습니다
다음은 세 가지 출력합니다.

136
00:07:50,160 --> 00:07:53,920
R 인터프리터 기본적으로, 그것을
당신을 위해 물건을 인쇄합니다

137
00:07:53,920 --> 00:07:57,280
그래서 당신은 발을 인쇄 지정할 필요가 없습니다
언제든지 당신이 뭔가를 인쇄 할.

138
00:07:57,280 --> 00:08:00,200
당신은 그냥 발을 할 수 있으며,
그것은 당신을 위해 그렇게 할 것입니다.

139
00:08:00,200 --> 00:08:04,380
>> 또한, 기술적으로 일치 한 사용할 수 있습니다
할당 연산자로.

140
00:08:04,380 --> 00:08:07,190
약간의 미묘한 차이가 있습니다
화살표를 사용하여 사이

141
00:08:07,190 --> 00:08:10,730
연산자와 같음
할당에 대한 연산자.

142
00:08:10,730 --> 00:08:15,470
대부분 컨벤션, 모든 사람
그냥 화살표 연산자를 사용합니다.

143
00:08:15,470 --> 00:08:21,850
>> 그리고 여기,이 할당 해요
경사 표기는 1 콜론 (6)을했다.

144
00:08:21,850 --> 00:08:26,010
이것은 1~6 벡터를 생성한다.

145
00:08:26,010 --> 00:08:29,350
그리고이 정말 좋은 다음 때문에
당신은 단지 발에 벡터를 할당

146
00:08:29,350 --> 00:08:34,270
그 자체로 작동합니다.

147
00:08:34,270 --> 00:08:37,799
>> 그래서이 이미로부터 것입니다
매우 직관적 인 데이터를 single--

148
00:08:37,799 --> 00:08:41,070
단지 두 배의 구조
벡터 형식으로 어떤 유형의

149
00:08:41,070 --> 00:08:45,670
그리고 모두를 수집합니다
당신을위한 스칼라 값.

150
00:08:45,670 --> 00:08:50,770
그래서 스칼라에서 진행 후, 당신
R 오브젝트를 가지며이 벡터이다.

151
00:08:50,770 --> 00:08:55,610
벡터는 모든 종류입니다
동일한 유형의 컬렉션입니다.

152
00:08:55,610 --> 00:08:58,150
그래서 여기 벡터의 무리입니다.

153
00:08:58,150 --> 00:08:59,800
>> 그래서이 숫자입니다.

154
00:08:59,800 --> 00:09:02,440
숫자는 두 말의 R의 방법입니다.

155
00:09:02,440 --> 00:09:07,390
그래서 기본적으로, 어떤
숫자는 더블 될 것입니다.

156
00:09:07,390 --> 00:09:13,150
>> 그래서 당신은 1.1, 3의 c를 가지고 있다면,
네거티브 5.7, C는 함수이다.

157
00:09:13,150 --> 00:09:16,760
이 세 가지 연결합니다
벡터에 숫자.

158
00:09:16,760 --> 00:09:19,619
그리고 이것은 만약 그렇다면 나중에 ...합니다
당신은 그 자체로 3 알,

159
00:09:19,619 --> 00:09:21,910
일반적으로 당신은 생각할 겁니다
이 정수 같다고,

160
00:09:21,910 --> 00:09:25,050
하지만 모든 벡터 때문에
동일한 유형,

161
00:09:25,050 --> 00:09:28,660
이 두 배의 벡터이다
또는이 경우 숫자.

162
00:09:28,660 --> 00:09:34,920
>> rnorm이 생성하는 기능입니다
표준 정규 variables--

163
00:09:34,920 --> 00:09:36,700
또는 표준 정규 값.

164
00:09:36,700 --> 00:09:38,360
그리고 나는 그들 중 두 가지를 지정하고 있습니다.

165
00:09:38,360 --> 00:09:43,840
그래서 해당 할당, rnorm 2 일을 해요
DEVS는 다음 나는 DEVS을 인쇄하고 있습니다.

166
00:09:43,840 --> 00:09:47,350
그래서 이건 그냥 두 가지
임의 정상 값.

167
00:09:47,350 --> 00:09:50,060
>> 그리고 당신이 경우에 INTS
당신은 정수에 대한 관심.

168
00:09:50,060 --> 00:09:54,650
그래서 이것은 단지 메모리에 관한 것입니다
할당 및 저장 메모리 크기.

169
00:09:54,650 --> 00:10:01,460
그래서 당신은 추가해야 할 것입니다
자본 L.하여 번호

170
00:10:01,460 --> 00:10:04,170
>> 일반적으로,은
R의 역사적인 표기

171
00:10:04,170 --> 00:10:06,940
뭔가 긴 정수했다.

172
00:10:06,940 --> 00:10:09,880
대부분의 시간, 당신은거야 그래서
복식 처리합니다.

173
00:10:09,880 --> 00:10:15,180
그리고 만약 당신은 윌
코드를 최적화에,

174
00:10:15,180 --> 00:10:18,110
당신은이 L의 추가 할 수 있습니다
이후 또는시

175
00:10:18,110 --> 00:10:22,280
당신에 대한 예지 같은 경우 어떤
이러한 변수를 할 것입니다.

176
00:10:22,280 --> 00:10:25,340

177
00:10:25,340 --> 00:10:26,890
>> 그래서 여기 문자 벡터이다.

178
00:10:26,890 --> 00:10:31,440
그래서, 다시, 나는 연결하는거야
세 개의 문자열이 시간.

179
00:10:31,440 --> 00:10:36,230
그 두 문자열을 주목하라
하나의 문자열은 R.에서 동일

180
00:10:36,230 --> 00:10:41,000
그래서 나는 그렇게 아서와 마빈의과가
때 나는 그들 모두를 밖으로 인쇄 해요

181
00:10:41,000 --> 00:10:43,210
두 문자열을 표시하는 것입니다.

182
00:10:43,210 --> 00:10:45,880
그리고 당신은 또한 포함 할 경우
이중 또는 단일 문자열

183
00:10:45,880 --> 00:10:50,070
당신의 문자에, 당신은 할 수 있습니다
도 당신의 문자열을 대체.

184
00:10:50,070 --> 00:10:53,540
>> 마빈의에 대한 그래서
두 번째 요소는, 여긴

185
00:10:53,540 --> 00:10:56,380
당신을 방송 ... 것
단지 두 문자열이

186
00:10:56,380 --> 00:10:59,050
다음 하나의 문자열
그래서 이것은 교류한다.

187
00:10:59,050 --> 00:11:04,040
당신이 원하는 경우 그렇지 않은 경우, 두 번 사용
이중 문자열에서 문자열 연산자

188
00:11:04,040 --> 00:11:07,090
이를를 선언 할 때, 그때
당신은 이스케이프 연산자를 사용합니다.

189
00:11:07,090 --> 00:11:10,600
그래서 당신은 백 슬래시 두 문자열을한다.

190
00:11:10,600 --> 00:11:13,330
>> 그리고 마지막으로, 우리는 또한
논리 벡터를 가지고있다.

191
00:11:13,330 --> 00:11:15,890
그래서 logical-- 그래서 TRUE
FALSE를, 그리고 그들이있어

192
00:11:15,890 --> 00:11:18,880
모두 대문자로 될 것이다.

193
00:11:18,880 --> 00:11:22,370
그리고, 다시, 나는 연결하는거야
그 다음은 bools에 할당 할 수있을 것입니다.

194
00:11:22,370 --> 00:11:24,590
그래서 bools 보여줄 것입니다
당신은, TRUE FALSE 및 TRUE.

195
00:11:24,590 --> 00:11:28,280

196
00:11:28,280 --> 00:11:31,620
>> 그래서 여기 벡터화 색인이다.

197
00:11:31,620 --> 00:11:34,870
나는 처음에 그래서
function--을 먹고 있어요

198
00:11:34,870 --> 00:11:39,230
이것은 sequence--라고
2-12 순서.

199
00:11:39,230 --> 00:11:42,490
그리고 2 시퀀스를 데려 갈거야.

200
00:11:42,490 --> 00:11:46,660
그래서 할 것
2, 4, 6, 8, 10, 12.

201
00:11:46,660 --> 00:11:50,080
그리고, 나는 색인 해요
세 번째 요소를 얻을 수 있습니다.

202
00:11:50,080 --> 00:11:55,770
>> 그래서 한 가지 유념해야 할 점은있다
1에서 시작하여 그 R 인덱스.

203
00:11:55,770 --> 00:12:00,550
발스 그래서 3 줄 수 있겠나
당신이 세 번째 요소입니다.

204
00:12:00,550 --> 00:12:04,580
이 종류의 서로 다른입니다
제로에서 시작 언어.

205
00:12:04,580 --> 00:12:09,780
그래서 C 혹은 C ++에서, 예를 들어, 야
네 번째 요소를 얻을 것.

206
00:12:09,780 --> 00:12:13,280
>> 그리고 여기에 3-5 놈들이다.

207
00:12:13,280 --> 00:12:16,030
그래서 한 가지 그
정말 멋진 당신 것입니다

208
00:12:16,030 --> 00:12:20,410
내부의 임시 변수를 생성 할 수 있습니다
다음 바로 즉석에서이를 사용합니다.

209
00:12:20,410 --> 00:12:21,960
그래서 여기에 3-5이다.

210
00:12:21,960 --> 00:12:25,070
그래서 벡터를 생성하는거야
3, 4, 5 및 다음

211
00:12:25,070 --> 00:12:29,700
나는 세 번째를 얻기 위해 색인 해요
네 번째, 다섯 번째 요소.

212
00:12:29,700 --> 00:12:32,280
>> 그래서 유사하게, 당신은 할 수
이 추상 바로 수행에

213
00:12:32,280 --> 00:12:35,280
벡터의 모든 종류
즉, 색인을 제공합니다.

214
00:12:35,280 --> 00:12:40,050
그래서 여기에 그 놈들이고
첫 번째, 세 번째 및 여섯 번째 요소.

215
00:12:40,050 --> 00:12:42,800
그리고, 당신이 원하는 경우
보완해야 할 일,

216
00:12:42,800 --> 00:12:45,210
그래서 당신은 마이너스을
나중에 그는거야

217
00:12:45,210 --> 00:12:48,600
당신이 아니라 모든 것을 제공
첫 번째, 세 번째, 또는 6 요소.

218
00:12:48,600 --> 00:12:51,590
그래서이 4, 8, 10이 될 것입니다.

219
00:12:51,590 --> 00:12:54,380
>> 그리고 당신은 얻으려면
더 고급,

220
00:12:54,380 --> 00:12:57,610
당신은 부울 벡터를 연결할 수 있습니다.

221
00:12:57,610 --> 00:13:05,210
따라서이 지수는 당신에게 줄 수 있겠나?
길이 6의이 부울 벡터.

222
00:13:05,210 --> 00:13:07,280
그래서 담당자 TRUE 쉼표 3.

223
00:13:07,280 --> 00:13:09,680
이 TRUE 세 번 반복됩니다.

224
00:13:09,680 --> 00:13:12,900
그래서 이것은 당신에게 줄 것이다
벡터 TRUE, TRUE, TRUE.

225
00:13:12,900 --> 00:13:17,470
>> 담당자는 FALSE 4--이 당신에게 줄 수 있겠나?
FALSE, FALSE, FALSE FALSE의 벡터.

226
00:13:17,470 --> 00:13:21,280
그리고 C를 연결하는 것입니다
함께 두 부울.

227
00:13:21,280 --> 00:13:24,090
그래서 당신은 세 가지를받을거야
TRUEs 다음 네 FALSEs.

228
00:13:24,090 --> 00:13:28,460
>> 당신 인덱스 놈들 아, 당신이있을 때 그 그래서
, TRUE, TRUE TRUE를 얻을 것.

229
00:13:28,460 --> 00:13:31,420
그래서이 네 말 것,
나는 그 세 가지 요소를 원한다.

230
00:13:31,420 --> 00:13:33,520
그리고 FALSE, FALSE,
FALSE, FALSE는 것입니다

231
00:13:33,520 --> 00:13:37,140
아니, 그 요소를 원하지 않는 대답
그래서 그들을 돌려 않을거야.

232
00:13:37,140 --> 00:13:41,490
>> 그리고 여기에 오타가 실제로 존재 같아요
이 때문에 3 반복 TRUE 말하고있다

233
00:13:41,490 --> 00:13:47,990
그리고 기술적으로 당신을 FALSE 4를 반복하고,
만 여섯 요소가 너무 FALSE 반복이,

234
00:13:47,990 --> 00:13:50,470
그것은 3 FALSE를 반복해야합니다.

235
00:13:50,470 --> 00:13:55,260
나는 R은 또한 똑똑 생각
것을 당신은 다음, 여기에 4를 지정하는 경우

236
00:13:55,260 --> 00:13:56,630
심지어 에러 출력되지 않습니다.

237
00:13:56,630 --> 00:13:58,480
그것은 단지 당신이 값을 줄 것이다.

238
00:13:58,480 --> 00:14:00,970
그래서 그냥 네 번째 FALSE를 무시합니다.

239
00:14:00,970 --> 00:14:05,310

240
00:14:05,310 --> 00:14:09,270
>> 그래서 여기 벡터화 할당입니다.

241
00:14:09,270 --> 00:14:15,480
이 단지를 설정 set.seed-- 그래서
의사 난수를위한 씨앗.

242
00:14:15,480 --> 00:14:20,110
그래서 난에 씨앗을하고 있어요
의미 (42), 내가 생성하는 경우 그

243
00:14:20,110 --> 00:14:22,950
세 정상 임의
값, 다음 경우

244
00:14:22,950 --> 00:14:27,400
자신에 set.seed 실행할
같은 값 (42)을 사용하여 컴퓨터,

245
00:14:27,400 --> 00:14:30,990
당신은 또한 얻을
같은 세 가지 임의의 법선.

246
00:14:30,990 --> 00:14:33,411
>> 그래서 이것은 정말 좋은
재현성.

247
00:14:33,411 --> 00:14:35,910
일반적으로, 당신은 일을 할 때 몇 가지
과학적 분석의 종류,

248
00:14:35,910 --> 00:14:37,230
당신은 씨앗을 설정할 것입니다.

249
00:14:37,230 --> 00:14:41,270
그런 식으로 다른 과학자는 할 수
만약 여러분의 동일한 코드를 재현

250
00:14:41,270 --> 00:14:44,790
그들은 정확한있을 것이다 때문에 수행
같은 확률 변수 거저 또는 임의

251
00:14:44,790 --> 00:14:47,270
당신은뿐만 아니라 냈어요 값.

252
00:14:47,270 --> 00:14:49,870

253
00:14:49,870 --> 00:14:53,910
>> 그리고 벡터화 할당
여기에 2 발스 1을 보여주는 것입니다.

254
00:14:53,910 --> 00:14:59,290
그래서 처음 두 요소 소요
놈들의 한 다음 0으로 할당합니다.

255
00:14:59,290 --> 00:15:03,940
그리고, 당신은 또한 그냥 작업을 수행 할 수 있습니다
부울와 비슷한 일.

256
00:15:03,940 --> 00:15:09,340
>> 그래서 놈들이 뜻을 0-- 같지
당신에게 벡터 FALSE를주고, FALSE, TRUE

257
00:15:09,340 --> 00:15:10,350
이 경우에는.

258
00:15:10,350 --> 00:15:13,770
그리고, 어떤 말 것
사실 그 인덱스,

259
00:15:13,770 --> 00:15:15,270
다음은 5 저를 할당하는 것입니다.

260
00:15:15,270 --> 00:15:18,790
그래서 세번째 요소를 가져
여기에 다음 5에 할당합니다.

261
00:15:18,790 --> 00:15:22,300
>> 그리고 이것은 정말 좋은
낮은 수준의 언어에 비해

262
00:15:22,300 --> 00:15:25,560
어디 루프를 사용해야합니다
이 벡터화 된 물건을 모두 수행하는

263
00:15:25,560 --> 00:15:30,281
그냥 매우 직관적이기 때문에
그것은 단일 한 줄입니다.

264
00:15:30,281 --> 00:15:32,030
그리고 좋은 약 무엇
벡터화 표기

265
00:15:32,030 --> 00:15:37,020
R에, 이러한 일종의 있다는 것입니다
내장 그들은 거의 빠르다 있도록

266
00:15:37,020 --> 00:15:42,490
낮은 수준의 언어로 수행으로
R에서 루프를 만들기 위해 반대

267
00:15:42,490 --> 00:15:46,317
다음은 할 필요
동적 색인 자체.

268
00:15:46,317 --> 00:15:48,900
그리고 그 것보다 속도가 느려질 수 있습니다
벡터화 이런 종류의

269
00:15:48,900 --> 00:15:55,950
이 병렬에서 할 수있는
그것은 기본적으로 스레드에서 뭐하는거야.

270
00:15:55,950 --> 00:15:58,650
>> 그래서 여기에 작업을 벡터화.

271
00:15:58,650 --> 00:16:04,920
그래서 3에 값 1을 생성하고있어,
할당이 vec1에, 3-5, VEC2,

272
00:16:04,920 --> 00:16:05,950
그들을 함께 추가.

273
00:16:05,950 --> 00:16:11,490
너무 그들에게 성분이 많다는 추가
그렇게 1 플러스 3, 2 플러스 4,을합니다.

274
00:16:11,490 --> 00:16:13,330
>> vec1 배 VEC2.

275
00:16:13,330 --> 00:16:16,110
이는 두 개의 곱
지혜로운 구성 요소 값.

276
00:16:16,110 --> 00:16:21,830
그래서 1 ~ 3 배, 2 배의
4 일 후, 3 ~ 5 배이다.

277
00:16:21,830 --> 00:16:28,250
>> 그리고 마찬가지로 당신도 할 수있다
논리 비교를 comparisons--.

278
00:16:28,250 --> 00:16:33,640
그래서이에 TRUE FALSE FALSE입니다
케이스 (1)이므로, 3보다 크지

279
00:16:33,640 --> 00:16:35,920
이 4 이하이다.

280
00:16:35,920 --> 00:16:41,160
이것은 내가, 또 다른 오타를 추측이다, 3
확실히 크지 5 이상이다.

281
00:16:41,160 --> 00:16:41,660
그래.

282
00:16:41,660 --> 00:16:45,770
그래서 당신은 모든 할 수있는
이 간단한 작업

283
00:16:45,770 --> 00:16:48,350
자신의 상속 때문에
클래스 자체에서.

284
00:16:48,350 --> 00:16:51,110

285
00:16:51,110 --> 00:16:52,580
>> 그래서 그냥 벡터이었다.

286
00:16:52,580 --> 00:16:56,530
그리고 그 가장 기본적인의 일종
R 객체 때문에, 주어진 벡터

287
00:16:56,530 --> 00:16:59,170
당신은 더 진보 된 개체를 구성 할 수 있습니다.

288
00:16:59,170 --> 00:17:00,560
>> 그래서 여기 행렬이다.

289
00:17:00,560 --> 00:17:05,030
이것은 본질적으로 추상화
매트릭스 자체가 무엇을의.

290
00:17:05,030 --> 00:17:10,099
따라서이 경우에는, 다른 세 야
하나 하나가 열입니다 벡터,,

291
00:17:10,099 --> 00:17:12,710
또는 당신은 그것을 고려할 수 있습니다
각각 같은 행입니다.

292
00:17:12,710 --> 00:17:18,250
>> 그래서 1 매트릭스를 저장 해요
9는 내가 3 행을 지정하고 있습니다.

293
00:17:18,250 --> 00:17:23,364
그래서 1 ~ 9는, 당신에게 벡터 1을 줄 것이다
2, 3, 4, 5, 6 및 9의 모든 방법.

294
00:17:23,364 --> 00:17:29,250
>> 또한 한 가지 유념해야 할 점은 것입니다
R 매장 열 주요 형식으로 값.

295
00:17:29,250 --> 00:17:34,160
그래서 다른 말로하면, 당신은 일을 할 때 참조
9, 그것은 데모 테잎 저장 것

296
00:17:34,160 --> 00:17:36,370
그것은, 2, 1이 될 것
첫 번째 열에서 3,

297
00:17:36,370 --> 00:17:38,510
다음 그것을 할 거 4, 5,
두 번째 열에서 6,

298
00:17:38,510 --> 00:17:41,440
다음 7 번째 열에 8,9.

299
00:17:41,440 --> 00:17:45,570
>> 그리고 여기에 몇 가지 다른입니다
당신이 사용할 수있는 일반적인 기능.

300
00:17:45,570 --> 00:17:49,650
그래서 어두운 매트, 이것은 당신에게 줄 것이다
행렬의 크기.

301
00:17:49,650 --> 00:17:52,620
그것은 당신을 반환 할 것
차원의 벡터.

302
00:17:52,620 --> 00:17:55,580
이 경우, 그렇게 때문에
우리의 행렬은, (3)에 의한 3

303
00:17:55,580 --> 00:18:01,900
그것은 당신에게 줄 것
숫자 벡터 3 3이야,.

304
00:18:01,900 --> 00:18:05,270
>> 그리고 여기에 바로 표시되어
행렬 곱셈.

305
00:18:05,270 --> 00:18:11,970
그래서 일반적으로, 당신은 할 경우
asterisk-- 그래서 매트 별표 mat--

306
00:18:11,970 --> 00:18:15,380
이 될 것입니다
구성 요소 단위 계산

307
00:18:15,380 --> 00:18:17,300
또는 마드 제품 무엇을 불렀다.

308
00:18:17,300 --> 00:18:21,310
그래서 각을 할 것
요소 요소 현명한.

309
00:18:21,310 --> 00:18:23,610
그러나, 당신이 원하는 경우
매트릭스 multiplication--

310
00:18:23,610 --> 00:18:29,380
상기 제 1 행 배를 승산
두 번째 행렬의 첫 번째 열

311
00:18:29,380 --> 00:18:34,510
그래서 박사님의 당신은 사용합니다
이 %의 작업.

312
00:18:34,510 --> 00:18:38,110
>> 그리고 매트의 t 단지이다
전치에 대한 작업.

313
00:18:38,110 --> 00:18:42,590
그래서에서 전치을 말하는거야
행렬은 행렬 곱

314
00:18:42,590 --> 00:18:43,090
그 자체.

315
00:18:43,090 --> 00:18:45,006
그리고, 그것은에 무슨
다른 3로 돌아

316
00:18:45,006 --> 00:18:50,700
3 매트릭스 보여
당신이 원하는 것입니다 제품.

317
00:18:50,700 --> 00:18:53,750
>> 그리고 그 행렬이었다.

318
00:18:53,750 --> 00:18:56,020
다음은 데이터 프레임라고하는 것입니다.

319
00:18:56,020 --> 00:19:00,780
당신은뿐만 생각할 수있는 데이터 프레임
매트릭스 있지만, 각 컬럼 자체

320
00:19:00,780 --> 00:19:02,990
다른 유형의가 될 것입니다.

321
00:19:02,990 --> 00:19:07,320
>> 그렇다면 데이터에 대한 정말 멋진
프레임은 데이터 분석 자체가,

322
00:19:07,320 --> 00:19:11,260
당신은이 모든 것을 할 겁니다
이기종 데이터 및 모든 정말로

323
00:19:11,260 --> 00:19:15,640
지저분한 일 경우 각 열
자체는 다른 타입 일 수있다.

324
00:19:15,640 --> 00:19:21,460
그래서 나는 여기를 만들 말하는거야
데이터 프레임, 1-3 INT를 수행

325
00:19:21,460 --> 00:19:24,750
다음 또한 문자 벡터를 가지고있다.

326
00:19:24,750 --> 00:19:28,470
그래서 통해 인덱스를 할 수
이 컬럼의 각

327
00:19:28,470 --> 00:19:30,930
다음 나는 값 자체를 얻을 수 있습니다.

328
00:19:30,930 --> 00:19:34,370
그리고 당신은 또한 어떤 종류의 작업을 수행 할 수 있습니다
데이터 프레임에 작업.

329
00:19:34,370 --> 00:19:38,040
그리고 대부분의 시간을 당신이있을 때
데이터 분석 또는 어떤 종류의 일을

330
00:19:38,040 --> 00:19:42,042
전처리, 당신은있을거야
이러한 데이터 구조와 협력

331
00:19:42,042 --> 00:19:44,250
여기서 각 열은 것입니다
다른 유형이어야합니다.

332
00:19:44,250 --> 00:19:47,880

333
00:19:47,880 --> 00:19:52,970
>> 마지막으로, 그래서이 본질적으로 단지입니다
R. 목록에서 4 개의 필수 객체

334
00:19:52,970 --> 00:19:55,820
그냥를 수집합니다
다른 개체는 당신이 원하는.

335
00:19:55,820 --> 00:20:00,130
그래서 하나에이 저장됩니다
쉽게 액세스 할 수있는 변수입니다.

336
00:20:00,130 --> 00:20:02,370
>> 그래서 여기에, 나는 목록을 데려 갈거야.

337
00:20:02,370 --> 00:20:04,460
나는 물건 3에 해당 말하는거야.

338
00:20:04,460 --> 00:20:08,060
그래서 하나의 요소를 가지고 갈거야
목록이이 물건이라고,

339
00:20:08,060 --> 00:20:10,570
그리고 값 3을 가질 것입니다.

340
00:20:10,570 --> 00:20:13,140
>> 또한 매트릭스를 생성 할 수 있습니다.

341
00:20:13,140 --> 00:20:17,970
그래서이 4과 끝 행 1
2에 해당하므로이 두 행렬.

342
00:20:17,970 --> 00:20:20,270
또한 목록에서 그것은 매트라고합니다.

343
00:20:20,270 --> 00:20:24,690
moreStuff, 문자열,
자체 심지어 다른 목록입니다.

344
00:20:24,690 --> 00:20:27,710
>> 그래서이 5 곰의 목록입니다.

345
00:20:27,710 --> 00:20:30,990
그 값 5를 갖도록
문자열 곰이

346
00:20:30,990 --> 00:20:32,710
그리고 목록 내부의 목록입니다.

347
00:20:32,710 --> 00:20:35,965
그래서 당신이있을 수 있습니다
재귀 일 경우

348
00:20:35,965 --> 00:20:38,230
당신은 another--이
유형 내에서 입력합니다.

349
00:20:38,230 --> 00:20:41,420
그래서 유사하게, 당신은 매트릭스를 가질 수있다
또 다른 매트릭스 내부 등등.

350
00:20:41,420 --> 00:20:44,264
그리고 목록은 그냥 좋은 방법입니다
수집 및 집계의

351
00:20:44,264 --> 00:20:45,430
모든 다른 개체.

352
00:20:45,430 --> 00:20:50,210

353
00:20:50,210 --> 00:20:57,150
>> 그리고 마지막으로, 여기에 단지의 경우에 도움이된다
이것은 단지 매우 빠르게 이상 사라졌다.

354
00:20:57,150 --> 00:21:01,350
그래서 언제 당신은 혼란스러워
기능 어떤 종류의 약,

355
00:21:01,350 --> 00:21:03,510
해당 기능의 도움을 수행 할 수 있습니다.

356
00:21:03,510 --> 00:21:07,120
그래서 당신은 도움이 행렬을 할 수있는
또는 물음표 행렬.

357
00:21:07,120 --> 00:21:11,430
도움말 및 물음표입니다
그냥 같은 일을 나타내는 표현

358
00:21:11,430 --> 00:21:13,040
그래서 그들은 별명이야.

359
00:21:13,040 --> 00:21:16,820
>> LM는 기능입니다
단지 선형 모델을 수행합니다.

360
00:21:16,820 --> 00:21:20,340
하지만 당신은 어떻게 할 수 있는지 아무 생각이없는 경우
작품은, 당신은 단지 작품의 도움을 수행 할 수 있습니다

361
00:21:20,340 --> 00:21:24,610
그것은 당신에게 줄거야
문서의 종류 그

362
00:21:24,610 --> 00:21:27,960
가지처럼 보이는
유닉스, 남자 페이지

363
00:21:27,960 --> 00:21:34,210
당신의 짧은 설명을 가지고있는
그것의 인수는 또한 무엇을합니까,

364
00:21:34,210 --> 00:21:38,850
그것은 반환하고, 방법에 대한 그냥 팁 무엇
그것을 사용하고, 일부 실시 예뿐만 아니라한다.

365
00:21:38,850 --> 00:21:41,680

366
00:21:41,680 --> 00:21:52,890
>> 그래서 내가 미리와 쇼 가자
R. 확인을 사용하는 몇 가지 데모.

367
00:21:52,890 --> 00:21:55,470
그래서 나는 매우 갔다
신속하게 데이터 만

368
00:21:55,470 --> 00:21:59,440
구조와 어떤 종류의
작업의 일부를 op--.

369
00:21:59,440 --> 00:22:02,960
여기에 몇 가지 기능입니다.

370
00:22:02,960 --> 00:22:06,750
>> 그래서 여기 난 그냥 갈거야
함수를 정의 할 수 있습니다.

371
00:22:06,750 --> 00:22:09,970
그래서 나는 또한 사용하고 있습니다
여기에 대입 연산자,

372
00:22:09,970 --> 00:22:12,610
다음 말인지
함수로 선언.

373
00:22:12,610 --> 00:22:14,140
그리고 x 값을합니다.

374
00:22:14,140 --> 00:22:18,210
그래서이 원하는 값이다
나는 그 자체 x를 반환하는거야.

375
00:22:18,210 --> 00:22:20,840
그래서이 식별 기능입니다.

376
00:22:20,840 --> 00:22:23,670
>> 그리고 이것에 대해 멋진거야
다른 언어에 비해

377
00:22:23,670 --> 00:22:26,330
다른 낮은 수준
언어는 그 x는

378
00:22:26,330 --> 00:22:29,350
모든 유형 자체가 될 수 있습니다
그리고 그 형식을 반환합니다.

379
00:22:29,350 --> 00:22:35,251
그래서 당신은 그렇게 할 수 imagine-- 수 있습니다
내게는 신속하게이 프로그램을 실행합니다.

380
00:22:35,251 --> 00:22:35,750
미안 해요.

381
00:22:35,750 --> 00:22:40,300
>> 그래서 한 가지 나는 또한 언급해야한다
이 편집기 내가 사용하고 있다는 것입니다

382
00:22:40,300 --> 00:22:41,380
rstudio라고합니다.

383
00:22:41,380 --> 00:22:44,389
이 IDE라고하는 것입니다.

384
00:22:44,389 --> 00:22:46,180
그리고 한 가지입니다 그
이 정말 좋은

385
00:22:46,180 --> 00:22:51,500
이 많이 포함한다는 것이다
사물은 그 자체로 R에서 수행 할

386
00:22:51,500 --> 00:22:53,180
단지 매우 직관적.

387
00:22:53,180 --> 00:22:55,550
>> 그래서 여기 통역 콘솔입니다.

388
00:22:55,550 --> 00:23:02,160
그래서 유사하게, 당신은 또한이를 얻을 수 있습니다
다만 자본 R.을 수행하여 콘솔 원시

389
00:23:02,160 --> 00:23:05,630
그리고 이것은 정확히입니다
콘솔과 같은 일.

390
00:23:05,630 --> 00:23:12,210
그래서 난 그냥 ID 기능 X, X, X를 할 수 있습니다.

391
00:23:12,210 --> 00:23:16,130
그러고 나서 ... 그리고 그와
자체가 잘 될 것입니다.

392
00:23:16,130 --> 00:23:19,200

393
00:23:19,200 --> 00:23:21,740
>> 그래서 rstudio 중대하다
이 콘솔을 가지고 있기 때문에.

394
00:23:21,740 --> 00:23:25,360
또한 문서를 갖는다
당신은에 실행하고 싶습니다.

395
00:23:25,360 --> 00:23:28,629
그리고, 그것은 몇 가지 변수가
당신은 환경에서 볼 수있다.

396
00:23:28,629 --> 00:23:30,420
그리고, 당신은 할 경우
당신에게 다음, 플롯을 할 수

397
00:23:30,420 --> 00:23:33,730
반대로 그냥 여기를 볼 수 있습니다
모든 다른 창을 관리

398
00:23:33,730 --> 00:23:35,940
그 자체로.

399
00:23:35,940 --> 00:23:40,530
>> 사실 개인적으로 빔을 사용하지만
rstudio 같은 느낌 그냥 우수

400
00:23:40,530 --> 00:23:44,640
좋은 아이디어를 얻기위한
보통 R.를 사용하는 방법,

401
00:23:44,640 --> 00:23:47,040
때 당신이 노력하고
새로운 작업을 배우고,

402
00:23:47,040 --> 00:23:49,590
당신은 처리하지 않으려는
한 번에 너무 많은 것.

403
00:23:49,590 --> 00:23:53,120
그래서 R은 아주 - rstudio입니다
학습 R의 아주 좋은 방법입니다

404
00:23:53,120 --> 00:23:56,760
다루는 않고도
이 모든 다른 것들.

405
00:23:56,760 --> 00:23:58,600
>> 그래서 나는 여기 안녕하세요 ID를 실행 해요.

406
00:23:58,600 --> 00:24:00,090
이 인사 반환합니다.

407
00:24:00,090 --> 00:24:01,740
ID (123).

408
00:24:01,740 --> 00:24:04,610
여기서 정수 벡터이다.

409
00:24:04,610 --> 00:24:08,620
그래서 유사하게, 당신이 할 수 있기 때문에
가치의 일부를 취해야

410
00:24:08,620 --> 00:24:16,060
당신의 ID를 반환 할 수
X 그래서 1234 5 반환합니다.

411
00:24:16,060 --> 00:24:22,210
>> 그리고 바로 당신을 보여하겠습니다
이 참 정수입니다.

412
00:24:22,210 --> 00:24:28,800
그리고 유사하게, 당신은 클래스를 할 경우
아이디 x는,이 정수가 될 것.

413
00:24:28,800 --> 00:24:34,170
그리고, 당신은 또한 수
이 두 가지를 비교하고 그것은 사실입니다.

414
00:24:34,170 --> 00:24:38,350
그래서는 x의 경우 ID를 알아보고 있어요
등호 x 및 통지와 동일

415
00:24:38,350 --> 00:24:39,760
그것이 당신에게 두 TRUEs을 제공합니다.

416
00:24:39,760 --> 00:24:44,280
그래서이는 말을하지 않습니다
동일한 두 개체,

417
00:24:44,280 --> 00:24:46,845
하지만 각 항목입니다
벡터 동일 내.

418
00:24:46,845 --> 00:24:50,000

419
00:24:50,000 --> 00:24:52,090
>> 여기 bounded.compare입니다.

420
00:24:52,090 --> 00:24:58,470
그래서이 약간 더 복잡하다
점에서이 경우 조건을 가지고 있으며, 다른

421
00:24:58,470 --> 00:25:00,960
다음 삼각 관계
한 번에 인수.

422
00:25:00,960 --> 00:25:02,640
따라서 x는 임의의 타입이다.

423
00:25:02,640 --> 00:25:06,280
내가 이런 말을 해요
두 번째 인수는 것입니다.

424
00:25:06,280 --> 00:25:08,380
이것은 또한 무엇이든 될 수있다.

425
00:25:08,380 --> 00:25:12,490
그러나 기본적으로이 걸릴 거예요
5 당신은 아무것도 지정하지 않은 경우.

426
00:25:12,490 --> 00:25:16,730
>> 그래서 여기에 무슨 말을해야 겠어
X는보다 큰 경우.

427
00:25:16,730 --> 00:25:19,220
나는를 지정하지 않은 경우 그래서, 그것을
X가 5보다 큰 경우, 말한다

428
00:25:19,220 --> 00:25:20,470
나는 TRUE를 반환거야.

429
00:25:20,470 --> 00:25:23,230
다른, 나는 FALSE를 반환거야.

430
00:25:23,230 --> 00:25:24,870
그래서 내가 가서이 문제를 정의 할 수 있습니다.

431
00:25:24,870 --> 00:25:30,600

432
00:25:30,600 --> 00:25:34,550
>> 지금은 갈거야
bounded.compare 3를 실행합니다.

433
00:25:34,550 --> 00:25:39,150
그래서 3 이하 말합니다
than-- 5 3보다 크다.

434
00:25:39,150 --> 00:25:41,830
아니, 그렇게 FALSE 아니다.

435
00:25:41,830 --> 00:25:46,550
>> 그리고 3 bounded.compare 나는거야
2와 동일한 사용하여 비교.

436
00:25:46,550 --> 00:25:50,700
그래서 지금은 지금, 그래 말하는거야
뭔가 다른 싶어요.

437
00:25:50,700 --> 00:25:52,750
내가 말할거야 그래서, 당신은 2이어야합니다.

438
00:25:52,750 --> 00:25:56,640
>> 나는 이런 종류의 작업을 수행 할 수 있습니다
표기법 아니면 2에 해당 말한다.

439
00:25:56,640 --> 00:25:58,720
이것은 더 읽을 수
그 당신이있을 때

440
00:25:58,720 --> 00:26:01,450
이러한 정말보고
복잡한 기능이

441
00:26:01,450 --> 00:26:08,110
여러 arguments--이 걸릴
수십 그냥 말 oftentimes--이 될 수 있습니다

442
00:26:08,110 --> 00:26:11,140
2는 더 읽을 일치 한
향후 그래서 나중에 당신

443
00:26:11,140 --> 00:26:13,020
당신은 당신이 무슨 일을하는지 알 수 있습니다.

444
00:26:13,020 --> 00:26:17,120
>> 그래서이 경우에, 난
속담이 3보다 크다.

445
00:26:17,120 --> 00:26:18,270
예 그렇습니다.

446
00:26:18,270 --> 00:26:22,350
그리고 유사하게, 그냥 제거 할 수 있습니다
이 말과 2, 3보다 크다

447
00:26:22,350 --> 00:26:23,440
여기서 2와 동일합니다.

448
00:26:23,440 --> 00:26:26,230
그리고 그것은 또한 사실입니다.

449
00:26:26,230 --> 00:26:26,730
네?

450
00:26:26,730 --> 00:26:29,670
>> 청중 : 당신은 누구
라인으로 라인을 실행?

451
00:26:29,670 --> 00:26:30,670
>> 더스틴 TRAN : 그래, 난입니다.

452
00:26:30,670 --> 00:26:33,900
그래서 내가 여기서 뭘하고있어입니다
이 텍스트를 복용 document--

453
00:26:33,900 --> 00:26:39,825
및 rstudio가 있다는 것입니다에 대한 좋은거야
난 그냥 short--에게 키 바로 가기를 실행할 수 있습니다.

454
00:26:39,825 --> 00:26:41,820
그래서 컨트롤 - 입력하고 있어요.

455
00:26:41,820 --> 00:26:44,850
>> 그리고, 내가 데려 갈거야
텍스트 문서의 라인

456
00:26:44,850 --> 00:26:46,710
다음 콘솔에 넣어.

457
00:26:46,710 --> 00:26:50,800
그래서 여기에 내가 말하고, bounded.compare
내가 제어-X를하고 있어요.

458
00:26:50,800 --> 00:26:52,540
그래서 난 그냥 여기에서도 실행 할 수 있습니다.

459
00:26:52,540 --> 00:26:54,920
그리고 그 할게요
다음 라인과 여기에 넣어.

460
00:26:54,920 --> 00:26:57,900
그리고 유사하게, 여기 실행 할 수 있습니다.

461
00:26:57,900 --> 00:27:04,630
그리고 그것은 단지 정의 계속됩니다
같은 콘솔에 라인.

462
00:27:04,630 --> 00:27:10,690
>> 그리고 당신은 또한 곱슬가 나는 경우
중괄호는 C 구문처럼이 있습니다.

463
00:27:10,690 --> 00:27:13,910
x-- 경우 조건이 또한 경우
괄호를 사용하려고하고

464
00:27:13,910 --> 00:27:15,350
당신은 다른 사용할 수 있습니다.

465
00:27:15,350 --> 00:27:17,496
또 다른 하나는 다른 경우입니다.

466
00:27:17,496 --> 00:27:21,440
그래서이 X이 될 것입니다
예를 들어, 동일 같습니다.

467
00:27:21,440 --> 00:27:24,190

468
00:27:24,190 --> 00:27:26,350
그리고 나는 갈거야
여기서 뭔가를 반환합니다.

469
00:27:26,350 --> 00:27:29,490
>> 두 개의 서로 다른 있다는 것을 주목
무슨 일 여기 가지.

470
00:27:29,490 --> 00:27:34,360
하나는 내가 지정하고있어 여기에 있다는 것입니다
값이 TRUE를 반환.

471
00:27:34,360 --> 00:27:35,950
여기에 그냥 X를 말하는거야.

472
00:27:35,950 --> 00:27:39,970
그래서 R 기본적으로 보통 것
마지막 arguments--을

473
00:27:39,970 --> 00:27:43,510
또는, 코드의 마지막 줄을
그리고 그것이 반환 무슨 될 것입니다.

474
00:27:43,510 --> 00:27:46,920
그래서 여기이 동일
반환 X 작업을 할 것.

475
00:27:46,920 --> 00:27:49,450

476
00:27:49,450 --> 00:27:50,540
>> 그리고 당신을 표시합니다.

477
00:27:50,540 --> 00:27:54,000

478
00:27:54,000 --> 00:27:57,052
그리고, 그냥 그런 식으로 작동합니다.

479
00:27:57,052 --> 00:27:58,260
그래서 날이 계속하자.

480
00:27:58,260 --> 00:28:00,630
>> 그래서 다른 경우.

481
00:28:00,630 --> 00:28:04,060
그리고 정말로, 나는 반환 할 수 있습니다
내가 좋아하는 것 아무것도.

482
00:28:04,060 --> 00:28:06,680
그래서 난 필요 없어
반환 부울​​ 모든 시간을,

483
00:28:06,680 --> 00:28:08,410
난 그냥 다른 뭔가를 반환 할 수 있습니다.

484
00:28:08,410 --> 00:28:10,670
그래서 반환 곰을 할 수 있습니다.

485
00:28:10,670 --> 00:28:12,989
>> x가 동일한 경우는 그래서, 동일
이 곰을 반환하는 것입니다.

486
00:28:12,989 --> 00:28:14,530
그렇지 않으면 TRUE를 반환 할 것입니다.

487
00:28:14,530 --> 00:28:19,310
또한 벡터를 할 수
나 정말 아무것도.

488
00:28:19,310 --> 00:28:22,210
>> 그리고 일반적으로 정적에
입력 된 언어,

489
00:28:22,210 --> 00:28:23,840
여기 유형을 지정해야 할 것이다.

490
00:28:23,840 --> 00:28:25,750
그리고 그냥 아무것도 할 수 있다는 것을 알 수 있습니다.

491
00:28:25,750 --> 00:28:32,400
그리고 R은 충분히 지능
다만이 작업을 수행하고 그것을 잘 작동합니다.

492
00:28:32,400 --> 00:28:33,620
>> 그래서 내가이를 정의 할 수 있습니다.

493
00:28:33,620 --> 00:28:39,460

494
00:28:39,460 --> 00:28:41,230
죄송 오 Unexpected--.

495
00:28:41,230 --> 00:28:44,336
여기 중괄호해야합니다.

496
00:28:44,336 --> 00:28:44,836
확인을 클릭합니다.

497
00:28:44,836 --> 00:28:45,336
쿨.

498
00:28:45,336 --> 00:28:52,580

499
00:28:52,580 --> 00:28:54,530
좋아.

500
00:28:54,530 --> 00:28:58,250
그래서 지금의 3을 비교하자 3 같습니다.

501
00:28:58,250 --> 00:29:01,860
그래서 return--한다
값 곰 생각났어.

502
00:29:01,860 --> 00:29:06,740
>> 그래서 지금보다 일반적인 것은 같다
어떤 다른 데이터 구조에 대한.

503
00:29:06,740 --> 00:29:09,110
그래서 당신은이 기능을 가지고있다.

504
00:29:09,110 --> 00:29:15,360
이것은 모든 종류의 작업을 할 것입니다
3 또는 숫자와 같은 값,

505
00:29:15,360 --> 00:29:17,500
즉, 두 번.

506
00:29:17,500 --> 00:29:19,330
>> 벡터 같은 약하지만.

507
00:29:19,330 --> 00:29:27,750
그렇다면 당신이 그렇게 싫어합니다 경우 난 발생
6 말에 발, 4를 할당하는 것.

508
00:29:27,750 --> 00:29:31,640
그래서이이를 반환하는 경우
4, 5, 6 행 벡터이다.

509
00:29:31,640 --> 00:29:34,935
>> 이제 어떻게되는지 보자
내가 할 경우 발을 bounded.compare.

510
00:29:34,935 --> 00:29:37,680

511
00:29:37,680 --> 00:29:42,450
그래서 이것은 당신에게 1251 (15)을 줄 것입니다.

512
00:29:42,450 --> 00:29:46,440
즉 그래서, 그것은 말 것
이 상태를 보면

513
00:29:46,440 --> 00:29:50,040
그래서 X 덜 말한다
또는 무엇인가보다.

514
00:29:50,040 --> 00:29:51,880
그래서이 약간
혼란 때문에 지금

515
00:29:51,880 --> 00:29:53,379
당신은 무슨 일이 일어나고 있는지 모른다.

516
00:29:53,379 --> 00:29:58,690
그래서 나는 정말로 한 가지를 추측
단지 디버그하려고에 대한 좋은

517
00:29:58,690 --> 00:30:04,600
당신이 발은 크다 할 수 있다는 것입니다
그리고보다 것은이 어떻게되는지.

518
00:30:04,600 --> 00:30:09,720
>> 그래서 val--은 기본 5 그렇게하는 것입니다
그냥 5보다 큰 발 할 수 있습니다.

519
00:30:09,720 --> 00:30:14,280
그래서이 벡터 FALSE FALSE TRUE입니다.

520
00:30:14,280 --> 00:30:17,206
그래서 지금 당신이보고 할 때
이,이 경우 말하는 것,

521
00:30:17,206 --> 00:30:20,080
그리고, 그것은 당신이 줄거야
FALSE FALSE의 벡터가 TRUE입니다.

522
00:30:20,080 --> 00:30:23,450
>> 당신은 R, R로이 전달 그래서 때
당신이 무슨 일을하는지 모르고있다.

523
00:30:23,450 --> 00:30:26,650
그것은 하나의 기대 때문에
부울 값, 그리고 지금

524
00:30:26,650 --> 00:30:29,420
당신은 그것을 부울의 벡터를 제공하고 있습니다.

525
00:30:29,420 --> 00:30:31,970
그래서 기본적으로, R은 그냥
도대체 무엇을 말을하려고,

526
00:30:31,970 --> 00:30:35,440
난 당신이있어 것 같은데요
여기에 첫 번째 요소를 걸릴 것.

527
00:30:35,440 --> 00:30:38,320
그래서 내가 갈거야 말하길거야
이 거짓이라고 가정합니다.

528
00:30:38,320 --> 00:30:40,890
그래서 말 것
아니, 이것은 옳지 않다.

529
00:30:40,890 --> 00:30:45,246
>> 마찬가지로,가는거야
발은 동일 동일합니다.

530
00:30:45,246 --> 00:30:47,244
아니, 5 죄송합니다.

531
00:30:47,244 --> 00:30:48,910
그리고 그것은 또한뿐만 아니라 거짓이 될 것.

532
00:30:48,910 --> 00:30:52,410
그래서, '아니오'라고하는거야
그것은뿐만 아니라 그것은 그래서 사실이 아니다

533
00:30:52,410 --> 00:30:53,680
이 마지막 하나를 반환하는 것.

534
00:30:53,680 --> 00:30:56,420

535
00:30:56,420 --> 00:31:01,360
>> 그래서 이것은 좋은 일이나 나쁜 중 하나입니다
일, 당신이 그것을 보는 방법에 따라 달라집니다.

536
00:31:01,360 --> 00:31:05,104
당신이있을 때 때문에
이러한 기능을 작성,

537
00:31:05,104 --> 00:31:06,770
당신은 실제로 무슨 일이 일어나고 있는지 모른다.

538
00:31:06,770 --> 00:31:10,210
그래서 때로는 오류를 할 것,
또는 어쩌면 당신은 경고를 할 수 있습니다.

539
00:31:10,210 --> 00:31:12,160
이 경우, R은 그렇게하지 ​​않습니다.

540
00:31:12,160 --> 00:31:14,300
그래서 정말에게 달려
당신의 기반으로 무엇

541
00:31:14,300 --> 00:31:17,310
당신은 언어를 생각
이 경우 어떻게해야

542
00:31:17,310 --> 00:31:22,920
당신은 부울의 벡터에 전달하는 경우
당신은 실행 조건 일 때.

543
00:31:22,920 --> 00:31:31,733
>> 그럼 원래 있다고 가정 해 봅시다
하나 다른 경우로하면 TRUE를 반환하고 당신이있어

544
00:31:31,733 --> 00:31:34,190
FALSE를 반환 것.

545
00:31:34,190 --> 00:31:39,300
추상화의 그래서 하나의 방법
이것은 내가 말을하는 것입니다

546
00:31:39,300 --> 00:31:41,530
심지어이 조건부 것은 필요하지 않습니다.

547
00:31:41,530 --> 00:31:47,220
내가 할 수있는 또 다른 것은 그냥
값 자체를 반환.

548
00:31:47,220 --> 00:31:53,240
그래서 당신은주의 경우 경우
발 5보다 큰 수행

549
00:31:53,240 --> 00:31:56,350
이를 반환하는 것입니다
벡터 FALSE FALSE TRUE.

550
00:31:56,350 --> 00:31:58,850
>> 어쩌면 이것은 당신이 무슨이다
bounded.compare 원하는.

551
00:31:58,850 --> 00:32:02,940
당신은 부울의 벡터를 반환 할
여기서, 그것은 각각의 값을 비교하여

552
00:32:02,940 --> 00:32:04,190
자신에.

553
00:32:04,190 --> 00:32:11,165
그래서 그냥 bounded.compare 할 수
함수 X는 5 같습니다.

554
00:32:11,165 --> 00:32:13,322

555
00:32:13,322 --> 00:32:15,363
그리고 대신이 일을
이 경우 다른 조건,

556
00:32:15,363 --> 00:32:21,430
난 그냥 돌아 갈거야
x는 5보다 크다.

557
00:32:21,430 --> 00:32:23,620
그래서 그 다음에, 사실이라면
TRUE를 반환 할 것입니다.

558
00:32:23,620 --> 00:32:26,830
그렇지 않은 경우 그리고, 그것은이다
FALSE를 반환 것.

559
00:32:26,830 --> 00:32:30,880
>> 그리고 이것은 작동합니다
이러한 임의의 구조.

560
00:32:30,880 --> 00:32:41,450
그래서 1 6 9 c를 bounded.compare 수 있습니다
그리고, 나는, 6에 해당 말할거야

561
00:32:41,450 --> 00:32:42,799
예를 들어.

562
00:32:42,799 --> 00:32:44,840
그리고, 그것은에 무슨
당신에게 오른쪽 부울을 제공

563
00:32:44,840 --> 00:32:48,240
당신이 설계하고 벡터.

564
00:32:48,240 --> 00:32:50,660
>> 그래서 사람들은 단지 기능은
지금 나에게 그냥하자

565
00:32:50,660 --> 00:32:54,980
당신에게 약간의 인터랙티브 영상을 보여줍니다.

566
00:32:54,980 --> 00:32:59,700
나는 실제로 생각하지 않습니다
와이파이 여기 그래서 내가 그냥 진행하자

567
00:32:59,700 --> 00:33:01,970
내가 추측이 하나를 건너 뜁니다.

568
00:33:01,970 --> 00:33:05,260
>> 멋진 그러나 한 가지
하지만은 당신의 경우 단지

569
00:33:05,260 --> 00:33:09,600
한 무리를 테스트 할
상이한 데이터 명령,

570
00:33:09,600 --> 00:33:13,320
다른 데이터 세트의 무리가있다
즉, 이미 R.에 미리로드

571
00:33:13,320 --> 00:33:15,770
그래서 그들 중 하나는
홍채 데이터 세트라고합니다.

572
00:33:15,770 --> 00:33:18,910
이것은 가장 잘 알려진 중 하나입니다
기계 학습에 사람.

573
00:33:18,910 --> 00:33:23,350
당신은 대개의 일종을 다하겠습니다
코드가 실행되는 경우 테스트 케이스를 확인합니다.

574
00:33:23,350 --> 00:33:27,520
그래서 그냥 조리개가 무엇인지 확인해 보도록하자.

575
00:33:27,520 --> 00:33:33,130
>> 그래서이 일은 것입니다
데이터 프레임 수입니다.

576
00:33:33,130 --> 00:33:36,000
그리고 오랜 때문에 종류의
난 그냥 조리개를 인쇄.

577
00:33:36,000 --> 00:33:38,810
그것은 전체 일을 인쇄합니다.

578
00:33:38,810 --> 00:33:42,830
그래서이 모든 다른 이름을 가지고있다.

579
00:33:42,830 --> 00:33:45,505
그래서 조리개 모음입니다
다른 꽃.

580
00:33:45,505 --> 00:33:48,830
이 경우에는 말하고
당신이 그것의 종,

581
00:33:48,830 --> 00:33:54,760
모든 다른 폭과
꽃받침 잎과 꽃잎의 길이.

582
00:33:54,760 --> 00:33:58,880
>> 그래서 일반적으로, 경우
당신은, 조리개를 인쇄 할

583
00:33:58,880 --> 00:34:03,680
예를 들어, 당신이 그것을하고 싶지 않아
그 이상 걸릴 수 있기 때문에 모든 이렇게

584
00:34:03,680 --> 00:34:05,190
전체 콘솔.

585
00:34:05,190 --> 00:34:09,280
정말로 그래서 한 가지
좋은 머리 기능입니다.

586
00:34:09,280 --> 00:34:12,929
그래서 그냥 머리를 할 경우
아이리스, 이것은 당신에게 줄 것이다

587
00:34:12,929 --> 00:34:17,389
처음 다섯 행, 6는 것 같아요.

588
00:34:17,389 --> 00:34:19,909
그리고 물론, 당신에게
여기 지정할 수 있습니다.

589
00:34:19,909 --> 00:34:22,914
그래서 20--이 줄 것이다
당신 처음 20 행.

590
00:34:22,914 --> 00:34:24,830
그리고 사실은 친절했다
이 그 놀라

591
00:34:24,830 --> 00:34:28,770
나 여섯 그래서 내가 앞서 가자 준
그리고 죄송합니다, iris-- 또는 머리를 확인합니다.

592
00:34:28,770 --> 00:34:31,699

593
00:34:31,699 --> 00:34:34,960
그리고 여기가 줄 것이다
당신 문서

594
00:34:34,960 --> 00:34:37,960
값 헤드는 수행의 무엇.

595
00:34:37,960 --> 00:34:40,839
그래서 제를 반환
또는 객체의 마지막.

596
00:34:40,839 --> 00:34:42,630
그리고 나는 갈거야
기본값을 확인합니다.

597
00:34:42,630 --> 00:34:47,340
그리고, 그것은 기본 말한다
방법 헤드 x와 n은 6L 같습니다.

598
00:34:47,340 --> 00:34:50,620
그래서이 처음 여섯 요소를 반환합니다.

599
00:34:50,620 --> 00:34:55,050
그리고 당신은 여기에 주목 유사 경우, I
N를 지정하지 않은 것은 6 같습니다.

600
00:34:55,050 --> 00:34:56,840
기본적으로 여섯 사용하는 것 같아요.

601
00:34:56,840 --> 00:35:00,130
내가 원하는 경우 그리고, 일정을 지정합니다
값은, 그때 그뿐만 아니라 볼 수 있습니다.

602
00:35:00,130 --> 00:35:02,970

603
00:35:02,970 --> 00:35:10,592
>> 그 몇 가지 간단한 명령되도록하고
여기 아니라 그냥 ... 다른 하나의,

604
00:35:10,592 --> 00:35:12,550
나는이 실제로하고 있는데 ...
좀 더 복잡한,

605
00:35:12,550 --> 00:35:17,130
그러나 이것은 단지 클래스를 취할 것
홍채 데이터 세트의 각 열의.

606
00:35:17,130 --> 00:35:20,910
그래서이 어떤 각을 보여줍니다
열은 해당 유형의 점에있다.

607
00:35:20,910 --> 00:35:23,665
그래서 꽃받침 잎 길이는 숫자입니다
꽃받침 잎 폭은 숫자입니다.

608
00:35:23,665 --> 00:35:26,540
모든 이러한 값은 단지 숫자 아르
이 데이터에서 알 수 있기 때문에

609
00:35:26,540 --> 00:35:29,440
이러한이 구조
모든 숫자에 가고.

610
00:35:29,440 --> 00:35:34,310
>> 그리고 종 열
요인이 될 것입니다.

611
00:35:34,310 --> 00:35:37,270
그래서 일반적으로, 당신은 생각 것
이 문자열과 같다.

612
00:35:37,270 --> 00:35:48,830
그러나 당신이 irisSpecies을 할 경우,
그리고, 나는, 머리 5 할거야

613
00:35:48,830 --> 00:35:51,820
이 인쇄 할 것입니다
처음 다섯 값 아웃.

614
00:35:51,820 --> 00:35:54,150
>> 그리고이 수준을 알 수 있습니다.

615
00:35:54,150 --> 00:35:58,870
그래서이이 말했듯이되어 R의 방법입니다
의 범주 변수를 가진.

616
00:35:58,870 --> 00:36:03,765
그래서 그 대신 단지
문자열을 갖는

617
00:36:03,765 --> 00:36:06,740
이 수준의 지정이 있습니다
이런 것들 중 어느 것이 있습니다.

618
00:36:06,740 --> 00:36:12,450
>> 그럼 irisSpecies 1을 가정 해 봅시다.

619
00:36:12,450 --> 00:36:17,690
그래서 당신이 무엇을 원하는 난입니다
이 종 열을 부분 집합.

620
00:36:17,690 --> 00:36:21,480
그래서이 걸리는
종 열 다음

621
00:36:21,480 --> 00:36:23,820
그 인덱스는 첫 번째 요소를 얻을 수 있습니다.

622
00:36:23,820 --> 00:36:27,140
그래서 이것은 당신에게 setosa를 제공해야합니다.

623
00:36:27,140 --> 00:36:28,710
그리고 그것은 또한 당신이 여기 레벨을 제공합니다.

624
00:36:28,710 --> 00:36:32,812
>> 그래서 당신은 또한 비교할 수 있습니다
문자 setosa이

625
00:36:32,812 --> 00:36:34,645
이것은하지 않을
사실이 하나 때문에

626
00:36:34,645 --> 00:36:37,940
다른 상이한 타입이다.

627
00:36:37,940 --> 00:36:40,590
아니면 내가이 R 때문에 사실 추측
보다 더 지능이다.

628
00:36:40,590 --> 00:36:45,420
그리고 그 다음이과에 보인다
어쩌면 이것은 당신이 원하는 것입니다 말했다.

629
00:36:45,420 --> 00:36:51,860
그래서 문자를 말하는 것
문자열 setosa이 하나와 동일합니다.

630
00:36:51,860 --> 00:37:01,290
그리고 유사하게, 당신은 할 수
또한 단지 등처럼이를 잡아.

631
00:37:01,290 --> 00:37:05,580
>> 그래서 그냥 일종
데이터 세트의 빠른 명령.

632
00:37:05,580 --> 00:37:08,030
그래서 여기에 일부 데이터 탐색이다.

633
00:37:08,030 --> 00:37:11,360
그래서이 조금 더
데이터 분석에 관여.

634
00:37:11,360 --> 00:37:18,340
그리고 이것은 일부에서 가져온 것입니다
버클리에 대한 R에서 부트 캠프.

635
00:37:18,340 --> 00:37:20,790
>> 외국 그래서 도서관.

636
00:37:20,790 --> 00:37:24,880
그래서 난에로드 할거야
외국라고 라이브러리.

637
00:37:24,880 --> 00:37:32,460
그래서이 날 줄 수 있겠나 read.dta
그래서이 데이터 집합을 가지는 것을 전제로하고 있습니다.

638
00:37:32,460 --> 00:37:39,000
이 전류에 저장된
내 콘솔의 작업 디렉토리.

639
00:37:39,000 --> 00:37:42,190
그래서 그냥 보자 무엇
작업 디렉토리입니다.

640
00:37:42,190 --> 00:37:44,620
>> 그래서 여기 내 작업 디렉토리입니다.

641
00:37:44,620 --> 00:37:50,040
그리고 도트 데이터,이 읽기
일,이 파일을 말하고있다

642
00:37:50,040 --> 00:37:54,650
의 데이터 폴더에 있습니다
이 현재 작업 디렉토리.

643
00:37:54,650 --> 00:38:00,520
그리고이 아니다 read.dta
기본 명령.

644
00:38:00,520 --> 00:38:02,760
나는 이미 그것을에서로드 같아요.

645
00:38:02,760 --> 00:38:04,750
IEI는 이미이의로드 가정.

646
00:38:04,750 --> 00:38:08,115
>> 그러나 그렇게 read.dta는 않을 것입니다
기본 명령합니다.

647
00:38:08,115 --> 00:38:11,550
그리고 당신이 할 겁니다 이유
이 라이브러리에서로드 package--

648
00:38:11,550 --> 00:38:14,500
이 패키지는 외국했다.

649
00:38:14,500 --> 00:38:16,690
그리고 당신이없는 경우
패키지, 나는 생각한다

650
00:38:16,690 --> 00:38:19,180
외국인이 내장 된 것들 중 하나입니다.

651
00:38:19,180 --> 00:38:31,150
그렇지 않으면, 당신은 또한 수
install.packages을

652
00:38:31,150 --> 00:38:33,180
이 패키지를 설치합니다.

653
00:38:33,180 --> 00:38:36,878
그리고 이것은 아니, 당신은 R. 어를 줄 것이다.

654
00:38:36,878 --> 00:38:39,830

655
00:38:39,830 --> 00:38:43,140
그리고 나는 그만거야
이 이미 그것을 가지고 있기 때문이다.

656
00:38:43,140 --> 00:38:46,920
>> 그러나 R 정말 좋은거야
패키지 관리한다는 것입니다

657
00:38:46,920 --> 00:38:48,510
시스템은 매우 우아하다.

658
00:38:48,510 --> 00:38:52,470
그것은 모든 것을 저장하는 것이기 때문에
정말 친절하게 당신을 위해.

659
00:38:52,470 --> 00:38:59,780
그래서이 경우, 저장할 것
거기에, 저는 믿습니다, 여기에이 라이브러리.

660
00:38:59,780 --> 00:39:02,390
>> 그래서 언제든지 당신이 원하는
새로운 패키지를 설치,

661
00:39:02,390 --> 00:39:04,980
그것만큼 간단합니다
install.packages 일

662
00:39:04,980 --> 00:39:07,500
R은 모든 관리합니다
당신을위한 패키지.

663
00:39:07,500 --> 00:39:12,900
그래서 당신은 무언가를 할 필요가 없습니다
외부 패키지가 파이썬,

664
00:39:12,900 --> 00:39:15,330
종이 같은 관리자
아나콘다 어디있어

665
00:39:15,330 --> 00:39:18,310
당신은 설치 하는거죠
파이썬의 외부 패키지

666
00:39:18,310 --> 00:39:20,940
그리고 당신은 그들에게 자신을 실행 해보십시오.

667
00:39:20,940 --> 00:39:22,210
그래서 정말 좋은 방법입니다.

668
00:39:22,210 --> 00:39:25,590
>> 그리고 install.packages 인터넷이 필요합니다.

669
00:39:25,590 --> 00:39:31,950
이 서버에서 소​​요
및 저장소 그

670
00:39:31,950 --> 00:39:33,960
수집 된 모든
패키지는 크랑이라고합니다.

671
00:39:33,960 --> 00:39:40,690
그리고 당신은 거울의 어떤 종류를 지정할 수 있습니다
당신은 패키지를 다운로드 할 수 있습니다.

672
00:39:40,690 --> 00:39:43,420
>> 그래서 나는 여기있는이 데이터 집합을 복용하고 있습니다.

673
00:39:43,420 --> 00:39:46,240
나는이 기능을 사용하여 그것을 읽고 있어요.

674
00:39:46,240 --> 00:39:49,360
그래서 내가 가서 그렇게 할 수 있습니다.

675
00:39:49,360 --> 00:39:52,900
>> 그럼 그 가정하자
이 데이터 집합을 가지고

676
00:39:52,900 --> 00:39:55,550
당신은 절대적으로이
그것이 무엇인지 전혀 생각하지 않습니다.

677
00:39:55,550 --> 00:39:58,560
그리고이 실제로 등장
상당히 자주 업계

678
00:39:58,560 --> 00:40:00,910
당신은이이 곳
톤 지저분한 것들을 톤

679
00:40:00,910 --> 00:40:02,890
그들은 믿을 수 없을만큼 레이블이없는거야.

680
00:40:02,890 --> 00:40:06,380
그래서 나는 여기이있다
데이터 세트 및 모르겠어요

681
00:40:06,380 --> 00:40:08,400
무엇을 그렇게하다 난 그냥 해요
그것을 확인하기 위해 게재합니다.

682
00:40:08,400 --> 00:40:10,620
>> 그래서 내가 먼저 머리를 할거야.

683
00:40:10,620 --> 00:40:14,190
그래서 처음 여섯을 확인
이 데이터 집합이 무엇인지의 열.

684
00:40:14,190 --> 00:40:21,730
그래서이는 상태, pres04하고,
열이 모든 다른 종류.

685
00:40:21,730 --> 00:40:25,612
그리고 무슨 일이 재미있다
여기에, 내 생각, 당신 것입니다

686
00:40:25,612 --> 00:40:27,945
이 보이는 가정 것
선거의 일종있다.

687
00:40:27,945 --> 00:40:30,482

688
00:40:30,482 --> 00:40:32,190
그리고 난 그냥에서 추측
파일을보고

689
00:40:32,190 --> 00:40:41,070
이름이 컬렉션의 일종입니다
후보자 나 유권자에 대한 데이터의

690
00:40:41,070 --> 00:40:44,920
누가 특정 대통령 투표
또는 대통령 후보

691
00:40:44,920 --> 00:40:46,550
2004 년 선거를위한.

692
00:40:46,550 --> 00:40:52,920
>> 그래서 여기에 값 1, 2
그래서 저장 편도

693
00:40:52,920 --> 00:40:56,540
대통령 후보
자신의 이름입니다.

694
00:40:56,540 --> 00:40:59,780
이 경우, 보이는
그들은 단지 정수 값이야.

695
00:40:59,780 --> 00:41:04,030
2004 그래서, 부시했다
케리 대 저는 믿습니다.

696
00:41:04,030 --> 00:41:09,010
그리고 지금, 당신이 모르는 가정 해 봅시다
부시 또는 1 내지 2 대응 하는지를

697
00:41:09,010 --> 00:41:11,703
케리 또는과에 해당
등등 등등, 오른쪽?

698
00:41:11,703 --> 00:41:15,860
>> 그리고, 그냥 나에게있다
매우 일반적인 문제.

699
00:41:15,860 --> 00:41:18,230
따라서이 경우에는 무엇을 할 수 있는가?

700
00:41:18,230 --> 00:41:20,000
그래서이 모든 다른 일을 확인 할 수 있습니다.

701
00:41:20,000 --> 00:41:22,790
>> 상태,이 있으리라 믿고있어
다른 상태에서 온다.

702
00:41:22,790 --> 00:41:25,100
partyid, 소득.

703
00:41:25,100 --> 00:41:27,710
의는 partyid 살펴 보자.

704
00:41:27,710 --> 00:41:32,800
아마 당신이 할 수있는 한 가지입니다
관찰의 각보고

705
00:41:32,800 --> 00:41:36,250
즉, 공화당의 partyid이
민주당 또는 무언가 또는.

706
00:41:36,250 --> 00:41:38,170
그래서 그냥 무엇 partyid 살펴 보자.

707
00:41:38,170 --> 00:41:41,946
>> 그래서 걸릴거야
DAT 후 나는거야

708
00:41:41,946 --> 00:41:47,960
이 달러 기호를 할 수
나는 이전과 연산자

709
00:41:47,960 --> 00:41:50,770
이것은을 것입니다
해당 열 부분 세트.

710
00:41:50,770 --> 00:41:57,760
그리고 나는이 머리거야
20, 그냥이의 모습을 볼 수 있습니다.

711
00:41:57,760 --> 00:42:00,170
>> 그래서이 NAS에 단지 무리입니다.

712
00:42:00,170 --> 00:42:02,800
그래서 다른 말로하면, 당신은
이 사람에 대한 데이터를 누락.

713
00:42:02,800 --> 00:42:08,100
하지만 당신은이 통지
DAT는 partyid 요인

714
00:42:08,100 --> 00:42:10,030
그래서 이것은 당신에게 다른 종류를 제공합니다.

715
00:42:10,030 --> 00:42:14,170
그래서 다른 말로하면, partyid이 걸릴 수 있습니다
독립 민주당, 공화당,

716
00:42:14,170 --> 00:42:16,640
다른 또는 뭔가.

717
00:42:16,640 --> 00:42:23,940
>> 그럼 가서하자하자
볼이는 ... 오, OK의있다.

718
00:42:23,940 --> 00:42:28,480
그래서 나는 부분 집합거야
다음 partyid하고

719
00:42:28,480 --> 00:42:32,780
사람이있는 볼
민주당, 예를 들면.

720
00:42:32,780 --> 00:42:37,150
이것은 당신에게 부울을 줄 것입니다
TRUEs 및 FALSEs의 거대한 부울.

721
00:42:37,150 --> 00:42:41,630
>> 그리고 지금의 내가하고 싶은 말은하자
이 사람에 세트에.

722
00:42:41,630 --> 00:42:47,260
그래서 내 날엔 걸릴 것입니다 및
일부 중 관측

723
00:42:47,260 --> 00:42:48,910
partyid 등호가 민주당 같습니다.

724
00:42:48,910 --> 00:42:52,830

725
00:42:52,830 --> 00:42:55,180
그리고이 때문에 상당히 긴
그들 중 많은이있다.

726
00:42:55,180 --> 00:42:59,060
그래서 지금은 20 년이 머리거야.

727
00:42:59,060 --> 00:43:05,690

728
00:43:05,690 --> 00:43:11,270
>> 당신이 알 수 있듯이, 등호와 동일
당신이있어 점에서 흥미 롭다

729
00:43:11,270 --> 00:43:13,250
already-- 당신은 또한 NAS를 포함하고 있습니다.

730
00:43:13,250 --> 00:43:19,010
이 경우, 당신은 여전히​​ 얻을 수 없다
정보 이제 NAS에 있기 때문에

731
00:43:19,010 --> 00:43:22,650
당신은 단지보고 싶은 어떤
관찰은 민주당에 해당

732
00:43:22,650 --> 00:43:24,670
이러한 누락되지 값 자체.

733
00:43:24,670 --> 00:43:27,680
그렇다면 이들의 NA 제거 것인가?

734
00:43:27,680 --> 00:43:36,410
>> 그래서 나는 여기 단지에 최대 키를 사용하고 내
커서 다음 주위를 움직이고 말.

735
00:43:36,410 --> 00:43:39,778
그리고 여기에 난 그냥 갈거야
is.na datpartyid 대답.

736
00:43:39,778 --> 00:43:48,970

737
00:43:48,970 --> 00:43:52,720
그래서 이것과 및 소요됩니다
두 개의 서로 다른 부울 벡터

738
00:43:52,720 --> 00:43:57,160
그것이 될 것 말
TRUE 예를 들면 FALSE.

739
00:43:57,160 --> 00:43:59,190
그래서이 구성 요소 현명 할 것입니다.

740
00:43:59,190 --> 00:44:02,910
그래서 나는 여기 테이크를 말하는거야
데이터 프레임은, 서브 세트

741
00:44:02,910 --> 00:44:10,170
민주당에 해당하는 것들,
및 NA되지 않은 그들 중 하나를 제거합니다.

742
00:44:10,170 --> 00:44:13,540
>> 그래서 그들은 ...이해야
당신이 뭔가를 제공합니다.

743
00:44:13,540 --> 00:44:16,540

744
00:44:16,540 --> 00:44:17,600
의는 is.na. 보자

745
00:44:17,600 --> 00:44:24,670

746
00:44:24,670 --> 00:44:27,690
의는 is.na datpartyid 해보자.

747
00:44:27,690 --> 00:44:36,290

748
00:44:36,290 --> 00:44:45,290
그리고이 드릴께요 제공해야
다만 부울 벡터를 sorry--.

749
00:44:45,290 --> 00:44:49,260
그리고, 너무 오래이기 때문에,
나는 20의 서브 세트를거야.

750
00:44:49,260 --> 00:44:49,760
확인을 클릭합니다.

751
00:44:49,760 --> 00:44:51,570
그래서이 작동합니다.

752
00:44:51,570 --> 00:44:54,700
>> 그리고 하나는 TRUEs 될 것입니다.

753
00:44:54,700 --> 00:45:01,830
아, 그래서 여기 내 오류는 그 난 ... I
C ++ 및 R 상호 교환 내가 만들어 사용

754
00:45:01,830 --> 00:45:03,590
이 실수 모든 시간.

755
00:45:03,590 --> 00:45:05,807
및 운영자입니다
실제로 당신이 원하는 하나.

756
00:45:05,807 --> 00:45:08,140
두 가지를 사용하지 않으려는
앰퍼샌드, 단지 하나의 하나.

757
00:45:08,140 --> 00:45:14,970

758
00:45:14,970 --> 00:45:17,010
확인을 클릭합니다.

759
00:45:17,010 --> 00:45:18,140
>> 그래서 보자.

760
00:45:18,140 --> 00:45:20,930

761
00:45:20,930 --> 00:45:23,920
그래서 우리는에 서브 세트
partyid 그들은 민주당이야 어디

762
00:45:23,920 --> 00:45:25,300
그리고 그들은 값이 누락 아닙니다.

763
00:45:25,300 --> 00:45:27,690
그리고 이제 살펴 보자
이들이 투표 것.

764
00:45:27,690 --> 00:45:31,530
그래서 가장 좋아하는 것
이들의 1 투표했다.

765
00:45:31,530 --> 00:45:36,090
그래서 앞서 갈거야
그리고 케리 말한다.

766
00:45:36,090 --> 00:45:39,507
>> 그리고 유사하게, 당신은 할 수
또한 공화당로 이동

767
00:45:39,507 --> 00:45:41,090
희망이 당신에게 2를 제공해야합니다.

768
00:45:41,090 --> 00:45:49,730

769
00:45:49,730 --> 00:45:51,770
그것은 다른 열 그냥 무리입니다.

770
00:45:51,770 --> 00:45:53,070
그리고 실제로, 그것은 2입니다.

771
00:45:53,070 --> 00:45:55,750
그래서, 모든 공화당 partyid
그들 대부분은 2를 위해 투표한다.

772
00:45:55,750 --> 00:45:58,390
>> 그래서 그냥 같은 것
이보고에 의해,

773
00:45:58,390 --> 00:46:00,600
공화당이 될 것입니다
아주 - 또는 partyid

774
00:46:00,600 --> 00:46:02,790
매우 될 것입니다
결정하는 큰 요인

775
00:46:02,790 --> 00:46:05,420
어느 후보가있어
투표 할 것.

776
00:46:05,420 --> 00:46:07,120
그리고 이것은 일반적으로 분명 사실이다.

777
00:46:07,120 --> 00:46:10,139
그리고 이것은 당신의 일치
직관, 물론.

778
00:46:10,139 --> 00:46:11,930
그래서 난 것 같아
그래서 시간의 부족

779
00:46:11,930 --> 00:46:17,040
나 그냥 가서해야 할
일부 빠른 이미지를 보여줍니다.

780
00:46:17,040 --> 00:46:21,120
그래서 여기에 약간 뭔가입니다
더 시각화 복잡.

781
00:46:21,120 --> 00:46:26,450
이 경우, 이것은 매우 인
다만 검사의 간단한 분석 무엇

782
00:46:26,450 --> 00:46:28,500
'04의 대통령이다.

783
00:46:28,500 --> 00:46:33,920
>> 이 경우 그래서, 당신을 가정 해 봅시다
이 질문에 대답하고 싶​​었다.

784
00:46:33,920 --> 00:46:38,540
그래서 우리는 투표를 알고 싶어한다고 가정
2004 년 대통령 선거에서 동작

785
00:46:38,540 --> 00:46:41,170
그 인종에 따라 다릅니다 방법.

786
00:46:41,170 --> 00:46:44,380
그래서뿐만 아니라 당신은하고 싶지 않음
, 투표 동작을 볼 수

787
00:46:44,380 --> 00:46:47,860
하지만 당신은 각각의 부분 집합 할
레이스와 종류의 요약.

788
00:46:47,860 --> 00:46:50,770
그리고 당신은 말할 수
이 복잡​​한 표기법으로

789
00:46:50,770 --> 00:46:52,580
이 것을 가지 헷갈리는지고 있습니다.

790
00:46:52,580 --> 00:46:56,390
>> 그래서 더 많은 고급 R 중 하나
최근 가지도의 패키지

791
00:46:56,390 --> 00:47:00,070
dplyr라고합니다.

792
00:47:00,070 --> 00:47:03,060
그래서 여기이 하나입니다.

793
00:47:03,060 --> 00:47:08,080
그리고 ggg-- ggplot2 그냥 좋은
더 나은 시각화를 수행하는 방법

794
00:47:08,080 --> 00:47:09,400
내장보다.

795
00:47:09,400 --> 00:47:11,108
>> 그래서로드거야
이 두 라이브러리.

796
00:47:11,108 --> 00:47:13,200

797
00:47:13,200 --> 00:47:16,950
그리고, 내가 갈거야
앞서이 명령을 실행합니다.

798
00:47:16,950 --> 00:47:19,050
당신은 블랙 박스로이 처리 할 수​​ 있습니다.

799
00:47:19,050 --> 00:47:23,460
>> 무엇 일어나는 것은이 파이프 것입니다
운영자는이 인수를 전달한다

800
00:47:23,460 --> 00:47:24,110
여기에.

801
00:47:24,110 --> 00:47:28,070
그래서 나는 날엔에 의해 그룹을 말하는거야
인종과 다​​음 대통령 04.

802
00:47:28,070 --> 00:47:31,530
그리고 나서, 모든 다른 명령
필터링 한 후 요약된다

803
00:47:31,530 --> 00:47:34,081
어디 카운트를하고 있어요 및
그때 난 여기가 음모를 꾸미고있어.

804
00:47:34,081 --> 00:47:39,980

805
00:47:39,980 --> 00:47:42,500
멋진 OK.

806
00:47:42,500 --> 00:47:44,620
그럼 가서하자
이 모습을 참조하십시오.

807
00:47:44,620 --> 00:47:52,280

808
00:47:52,280 --> 00:47:57,290
>> 그래서 여기에 무슨 일이 일어나고 것은 제가이다
다만 다음 인종과 각을 그려

809
00:47:57,290 --> 00:47:59,670
이들이 투표 것.

810
00:47:59,670 --> 00:48:03,492
이 두 가지를
값이 1에 해당합니다.

811
00:48:03,492 --> 00:48:05,325
당신은 더 많은 수 있도록하려면
우아한, 당신은 또한 수

812
00:48:05,325 --> 00:48:11,770
단지 2 Kerry-- 이상인지 지정
이 부시는, 그 후 1 케리이다.

813
00:48:11,770 --> 00:48:13,700
그리고 당신도 할 수 있습니다
당신의 전설에서 그.

814
00:48:13,700 --> 00:48:17,410
>> 그리고 이러한 막대 그래프를 분할 할 수 있습니다.

815
00:48:17,410 --> 00:48:19,480
한 가지이기 때문에
즉, 당신이 나는 경우,

816
00:48:19,480 --> 00:48:24,560
이 식별하는 것은 매우 쉬운 일이 아닙니다
이들 두 값을 이용할지는 크다.

817
00:48:24,560 --> 00:48:27,920
그래서 한 가지 당신이 원하는 것
할이 파란색 영역을하다

818
00:48:27,920 --> 00:48:31,855
그리고 당신 때문에 여기를 통해 이동
측면에서이 두 가지 측면을 비교할 수 있습니다.

819
00:48:31,855 --> 00:48:34,480
그리고 그 뭔가 내가 추측
지금 할 시간이 없어,

820
00:48:34,480 --> 00:48:36,660
그러나 그것은 또한 아주 쉽게 할 수 있습니다.

821
00:48:36,660 --> 00:48:40,310
당신은에 볼 수 있습니다
ggplot의 매뉴얼 페이지를 참조하십시오.

822
00:48:40,310 --> 00:48:47,170
그래서 그냥 같이 ggplot 할 수
그와이 매뉴얼 페이지에 참조하십시오.

823
00:48:47,170 --> 00:48:51,920
>> 그러니 빨리하겠습니다
당신에게 멋진 일을 보여줍니다.

824
00:48:51,920 --> 00:48:57,610
이제 가서 단지를 아 - 가자
기계 학습의 응용 프로그램입니다.

825
00:48:57,610 --> 00:49:02,450
그래서 우리는이 세 가지가 있다고 가정 해 보자
패키지는 그래서 이러한로드거야.

826
00:49:02,450 --> 00:49:05,500

827
00:49:05,500 --> 00:49:09,170
그래서 이것은 단지 일부를 출력
정보 나는 일에로드 된 후.

828
00:49:09,170 --> 00:49:15,220
그래서 나는이 read.csv을 말하고,
이 데이터 집합, 그리고 지금

829
00:49:15,220 --> 00:49:18,940
내가 가서보고거야
이 데이터 집합의 내부에 무엇이 있는지.

830
00:49:18,940 --> 00:49:22,080
>> 처음 20 관찰 그래서.

831
00:49:22,080 --> 00:49:27,190
그래서 난 그냥 그래서 X1, X2,와 Y가
이 값의 무리처럼 보인다

832
00:49:27,190 --> 00:49:31,640
아마 20-80 정도에 이르기까지한다.

833
00:49:31,640 --> 00:49:37,700
그리고, 마찬가지로 X2 용 후
이 Y 라벨 0 및 1이 될 것으로 보인다.

834
00:49:37,700 --> 00:49:49,500
>> 이를 확인하려면, 난 할 수있어
그냥 요약 데이터 X1을한다.

835
00:49:49,500 --> 00:49:51,660
그리고 유사에 대한
모든 다른 열.

836
00:49:51,660 --> 00:49:55,300
그래서 요약 빠른 방법입니다
당신에게 빠른 값을 표시합니다.

837
00:49:55,300 --> 00:49:56,330
아, 죄송합니다.

838
00:49:56,330 --> 00:49:58,440
이 사람은 Y.해야

839
00:49:58,440 --> 00:50:03,420
>> 이 경우 그래서, 제공
분위수, 중앙값은 물론 maxes.

840
00:50:03,420 --> 00:50:07,130
이 경우, dataY, 당신은 볼 수 있습니다
그것은 단지 0과 1이 될 것있다.

841
00:50:07,130 --> 00:50:10,100
또한 평균 말하고있다
0.6은 그냥 것을 의미한다

842
00:50:10,100 --> 00:50:13,380
I가 0보다 1 초를 가지고있는 것처럼 보인다.

843
00:50:13,380 --> 00:50:16,160
>> 그래서 내가 미리와 쇼 가자
이는 모습.

844
00:50:16,160 --> 00:50:17,470
그래서 난 그냥이 음모거야.

845
00:50:17,470 --> 00:50:22,852

846
00:50:22,852 --> 00:50:24,636
자,이 제거하는 방법을 살펴 보자.

847
00:50:24,636 --> 00:50:30,492

848
00:50:30,492 --> 00:50:31,468
OK 오.

849
00:50:31,468 --> 00:50:35,840

850
00:50:35,840 --> 00:50:36,340
확인을 클릭합니다.

851
00:50:36,340 --> 00:50:37,590
>> 그래서이는 모습이다.

852
00:50:37,590 --> 00:50:46,310
그래서 내가 지정된 노랑처럼 보인다
0을 입력 한 다음 빨간색으로 나는 1 초로 지정.

853
00:50:46,310 --> 00:50:52,190
그래서 여기처럼 보인다
라벨 점과

854
00:50:52,190 --> 00:50:56,410
당신은 단지 몇 가지를 원처럼 보인다
이에 클러스터링의 종류.

855
00:50:56,410 --> 00:51:01,020
>> 그리고 내가 바로 앞에와 쇼 가자
이러한 내장 함수의 당신 일부.

856
00:51:01,020 --> 00:51:03,580
그래서 여기에 작품입니다.

857
00:51:03,580 --> 00:51:06,060
그래서 이것은 단지 시도
이에 라인에 맞게.

858
00:51:06,060 --> 00:51:08,640
그래서 가장 좋은 방법은
나는 선은 들어가는 지

859
00:51:08,640 --> 00:51:14,020
그것은 최고의 분리됩니다
클러스터링 이런 종류의.

860
00:51:14,020 --> 00:51:21,790
그리고 이상적으로, 당신은 볼 수 있습니다
난 그냥이 모든 명령을 실행하는 것이

861
00:51:21,790 --> 00:51:25,450
다음, 내가 갈거야
앞서와 라인을 추가합니다.

862
00:51:25,450 --> 00:51:28,970
>> 그래서이 추측처럼 보인다.

863
00:51:28,970 --> 00:51:34,150
그것은 최소화하는 가장 좋은 하나를 복용
이 줄을 맞추려고에서 오류가 발생했습니다.

864
00:51:34,150 --> 00:51:40,000
분명히, 이것은 가지 보인다
좋은하지만 최선이 아니다.

865
00:51:40,000 --> 00:51:43,130
그리고 선형 모델에서
일반적으로는 될거야

866
00:51:43,130 --> 00:51:46,811
이론과 그저 정말 좋은
기계의 건물 기초의

867
00:51:46,811 --> 00:51:47,310
학습.

868
00:51:47,310 --> 00:51:50,330
그러나 실제로, 당신은 갈거야
더 일반적으로 뭔가를 할 수 있습니다.

869
00:51:50,330 --> 00:51:54,280
>> 그래서 그냥 실행 시도 할 수 있습니다
뭔가 신경 네트워크를했다.

870
00:51:54,280 --> 00:51:57,110
이런 일들은
점점 더 일반적인.

871
00:51:57,110 --> 00:52:00,530
그리고 그들은 단지 환상적 일
큰 데이터 세트.

872
00:52:00,530 --> 00:52:07,080
이 경우, 우리는 니스, 니
의 우리가 nrow을 알아요 ... 수 있습니다.

873
00:52:07,080 --> 00:52:09,010
그래서 nrow은 행의 수를 말하고있다.

874
00:52:09,010 --> 00:52:11,790
I는,이 경우에 따라서
100 관찰을 가지고있다.

875
00:52:11,790 --> 00:52:15,010
>> 그래서 내가 가서하자
신경망을합니다.

876
00:52:15,010 --> 00:52:18,620
그래서 정말 좋은
난 그냥 nnet 말을 할 수 있기 때문에

877
00:52:18,620 --> 00:52:21,767
다음 나는 Y.의 기능에 영향을 미치지 해요
그래서 Y는 열입니다.

878
00:52:21,767 --> 00:52:23,850
그리고 그것을 역행
다른 두 변수.

879
00:52:23,850 --> 00:52:27,360
그래서이 짧은
X1과 X2에 대한 표기.

880
00:52:27,360 --> 00:52:29,741
>> 그럼 가서이를 실행하자.

881
00:52:29,741 --> 00:52:30,240
아, 죄송합니다.

882
00:52:30,240 --> 00:52:32,260
나는이 모든 일을 실행해야합니다.

883
00:52:32,260 --> 00:52:37,500
그리고 이것은 단지 표기를 인쇄
얼마나 빨리 여부를 신속하게하기에

884
00:52:37,500 --> 00:52:38,460
통합.

885
00:52:38,460 --> 00:52:41,420
그래서이 수렴 않은 것 같습니다.

886
00:52:41,420 --> 00:52:44,970
그러니 앞서 및 인쇄 가자
이 어떻게 생겼는지 알아.

887
00:52:44,970 --> 00:52:51,260
>> 여기에 그림이 그리고 여기를 참조하십시오
이 얼마나 잘 맞는지를 보여주는 윤곽.

888
00:52:51,260 --> 00:52:56,380
그리고 이것은 당신이 볼 수있는 단지 ...
이이 아주, 아주 좋은입니다.

889
00:52:56,380 --> 00:52:59,400
심지어 수
당신은 또한 수 있습니다 과다 적합하지만,

890
00:52:59,400 --> 00:53:03,390
다른이를 차지
교차 유효성 검사와 같은 기술.

891
00:53:03,390 --> 00:53:06,180
그리고이 또한 R. 내장되어 있습니다

892
00:53:06,180 --> 00:53:09,170
>> 그리고 제가 보여 드리죠
벡터 머신을 지원합니다.

893
00:53:09,170 --> 00:53:12,470
이것은 또 다른 정말 일반적입니다
기계 학습 기술.

894
00:53:12,470 --> 00:53:18,550
그것은 선형 모델과 매우 유사하지만,
그것은 커널 방법이라고 무엇을 사용합니다.

895
00:53:18,550 --> 00:53:22,790
그리고 이제 그 얼마나 잘하는지 보자.

896
00:53:22,790 --> 00:53:26,430
그래서 하나의 방법과 매우 유사
웰 신경망이 수행

897
00:53:26,430 --> 00:53:27,900
그러나 훨씬 부드러워 야.

898
00:53:27,900 --> 00:53:35,740
그리고 이것은 기반으로한다
의 방법 SVM을 작업 뭐냐 ....

899
00:53:35,740 --> 00:53:40,250
>> 그래서이 그냥 아주
몇 가지의 간단한 개요

900
00:53:40,250 --> 00:53:43,822
내장 함수의 작업을 수행 할 수 있습니다
또한 데이터 탐색의 일부.

901
00:53:43,822 --> 00:53:45,905
그러니 그냥 진행하자
그리고 슬라이드로 돌아갑니다.

902
00:53:45,905 --> 00:53:50,290

903
00:53:50,290 --> 00:53:53,670
>> 그러므로 분명히, 이것은 인
매우 포괄적 없습니다.

904
00:53:53,670 --> 00:53:57,140
그리고 이것은 정말 그냥 맛보기입니다
당신이 정말로 R.에서 무엇을 할 수 있는지를 보여주는

905
00:53:57,140 --> 00:53:59,100
그래서 당신이 원하신다면
여기에, 자세히 알아 봅니다

906
00:53:59,100 --> 00:54:01,210
다른 자원의 무리입니다.

907
00:54:01,210 --> 00:54:06,890
>> 당신은 교과서의 좋아하는 것 또는 당신은 그래서 만약
그냥 온라인으로 물건을 읽고 좋아,

908
00:54:06,890 --> 00:54:09,670
다음이 환상적입니다
해들리 위컴 하나,

909
00:54:09,670 --> 00:54:13,010
또한 생성 된 모든 사람이
정말 멋진 패키지.

910
00:54:13,010 --> 00:54:17,420
당신이 비디오를 좋아해요 경우,
버클리는 멋진 부트 캠프가

911
00:54:17,420 --> 00:54:21,060
그 가지 길어 several-- 때문입니다.

912
00:54:21,060 --> 00:54:24,210
그리고 그것은 거의 당신을 가르 칠 것입니다
모든 것을 당신은 R.에 대해 알고 싶습니다

913
00:54:24,210 --> 00:54:27,770
>> 그리고 유사하게, Codeacademy을 거기에
이 모든 다른 종류의

914
00:54:27,770 --> 00:54:29,414
의 대화 형 웹 사이트.

915
00:54:29,414 --> 00:54:31,580
그들은 또한 점점
더 일반적인 공통점.

916
00:54:31,580 --> 00:54:33,749
그래서이 Codeacademy 매우 유사하다.

917
00:54:33,749 --> 00:54:35,790
그리고 마지막으로, 당신의 경우 단지
커뮤니티를 원하고 도움,

918
00:54:35,790 --> 00:54:38,800
이들의 무리이다
당신이 갈 수있는 것.

919
00:54:38,800 --> 00:54:40,880
물론, 우리는 여전히
다만, 메일 링리스트를 사용

920
00:54:40,880 --> 00:54:44,860
거의 모든 다른 같은
프로그래밍 언어 커뮤니티.

921
00:54:44,860 --> 00:54:47,880
그리고 #rstats, 여긴
커뮤니티 트위터.

922
00:54:47,880 --> 00:54:49,580
즉, 실제로는 매우 일반적이다.

923
00:54:49,580 --> 00:54:50,850
다음 사용자!

924
00:54:50,850 --> 00:54:52,340
우리의 회의입니다.

925
00:54:52,340 --> 00:54:55,390
>> 그리고, 물론, 당신은 할 수
모든 다른 Q & A 물건을 사용,

926
00:54:55,390 --> 00:54:57,680
스택 오버플로 등,
구글 다음 GitHub에.

927
00:54:57,680 --> 00:55:00,490
이 패키지의 대부분 때문에
지역 사회의 많은

928
00:55:00,490 --> 00:55:03,420
개발을 중심으로한다
코드는 오픈 소스 때문이다.

929
00:55:03,420 --> 00:55:05,856
그리고 GitHub의에 정말 좋은 데요.

930
00:55:05,856 --> 00:55:08,730
그리고 마지막으로, 당신은 경우에 저에게 연락 할 수 있습니다
당신은 그냥 빠른 질문이 있습니다.

931
00:55:08,730 --> 00:55:13,530
그래서 당신은 여기에 트위터에 나를 찾을 수 있습니다,
내 웹 사이트, 단지 내 이메일.

932
00:55:13,530 --> 00:55:17,840
그래서 희망, 그했다
그 어떤 것도 짧은 맛보기

933
00:55:17,840 --> 00:55:20,900
무엇 R은 일을 정말 할 수있다.

934
00:55:20,900 --> 00:55:23,990
그리고 바라건대, 당신 단지
이 세 가지 링크를 체크 아웃

935
00:55:23,990 --> 00:55:25,760
당신은 더 많은 일을 할 수 있는지.

936
00:55:25,760 --> 00:55:28,130
그리고 그건 그냥 그것에 대해 같아요.

937
00:55:28,130 --> 00:55:28,630
감사합니다.

938
00:55:28,630 --> 00:55:30,780
>> [박수]

939
00:55:30,780 --> 00:55:31,968