# **************************************************** # 대한민국 30대 여성 350만명의 키를 통한 정규분포 학습 # **************************************************** # 통계의 종류(기술통계, 추론통계) # 과거의 데이터를 분석, 기술 -> 기술통계 # 미래의 데이터값을 예측 -> 추론통계 # —————————————————- # – 1. 삼백오십만개의 난수를 생성하기 # —————————————————-
t1 <- runif(3500000, min = 15500, max = 17000)
# runif 함수는 특정범위의 랜덤수를 반환한다.
# 예제를 실행하면 1500 ~ 17000 사이에 350만개의 램덤수를 반환한다
t1 <- as.integer(t1)
# 난수생성 후 빠른 연산을 위해 정수로 바꾼다.
t2 <- integer(10^6)
# 100만개의 정수를 담는 공간을 만든다
for(i in 1:10^6){
s <- t1[sample(t1,30,replace = T)]
# 30개씩 표본추출 한다. replace = T 는 복원추출
mean_s <- mean(s)
# 평균을 구한다
t2[i] <- mean_s
# 평균을 t2에 저장한다
}
head(t2)
———————-
–2. 도수를 구한다
———————–
t3 <- table(t2)
#평균들을 table()함수를 이용해 도수를 그린다.
head(t3,3)
plot(t3,type='h',Iwd=2)
#Idw = "2"선의 굵기
#cex = "3"점이나 문자의 굵기
#Ity = 라인타입
————————–
–3. 상대도수를 구한다
————————–
t4 <- t2/length(t1)
t4
# 도수의 합계에 대한 각 계급의 도수의 비율을 그 계급의
# 상대도수라고 한다. 상대도수는 0이상 1이사인 소수로
# 나타내어지고, 그 합계는 반드시 1이다.
hist(t4,breaks = 10000, prob =T)
<<결과정리>>
모집합이 정규분포를 따르지 않더라도, 표본의 크기가 충분히 클때
(보통 30이상) 여러 번 표본을 추출하여 표본 평균을 추출해 보면,
이 표본 평균들은 정규분포를 따르며 모집합의 평균에 근접한다.
모집합이 정규분포일때 모집단의 평균은 95%의 확률로 속한다.
정규분포 중에서도 평균이 0이고 표준편차가 1인 것을
표준정규분포라고 하고 이를 Z-분포라고 한다.
많은 자연 현상이 나 사회학적인 데이터의 확률분포는 종모양의
정규분포라는 것을 따른다. 이 정규분포는 드므라는 사람에
의해 처음 발견되었고, 나중에 수학자 가우스에 의해 폭넓게 응용되었다.
t5 <- seq(from=15800, to=16200,length.out = 1000) ylim <- c(0,0.01) plot(t5, dnorm(t5, mean = 16000, sd=52.7), main=“Normal”, type = “l” , #line의 l ylim = ylim)
z-분포(=표준정규분포)를 따르는 난수 발생함수
t6 <- rnorm(10,mean = 0, sd=1) #10은 난수의 개수를 말한다. t6
확률밀도함수
dnorm(1:100, mean=0, sd = 1) #누적분포함수 (pnorm(1, mean = 0,sd = 1) -0.5)1 #[1] 0.3413447 (pnorm(1,mean=0, sd = 1)-0.5)2 #[1] 0.6826895 (pnorm(1, mean=0, sd = 1)-0.5)*3 #[1] 1.024034
분위수
qnorm(0.05, mean = 0,sd=1, lower.tail = F) qnorm(0.025, mean = 0, sd=1, lower.tail = F) # lower.tail =T 이면 확률값은 그래프 좌측면을 # F이면 우측면적을 계산
<<정규분포>>
[1] 종모양의 연속평함수
[2] 평균을 중심으로 좌우 대칭이다. 따라서 평균을 중심으로
좌측과 우측의 확률은 각각 0.5이다.
[3] X축에 대하여 (평균 mu, 표준편차 sd)
값이 [mu - sd ~ mu + sd] 에 속할 확률은 0.68
값이 [mu - sd2 ~ mu + sd2] 에 속할 확률은 0.95
값이 [mu - sd3 ~ mu + sd3] 에 속할 확률은 0.997
[4] sd 가 1이고 평균이 0 인 정규분포를 표준정규분포라고 한다.
z-분포는 95% 구간내에 들어가는 값는 +- 1.645
97.5% 구간내에 들어가는 값은 +-1.96 구간내에
99.5% 는 +-2.575 구간내에 속한다.
LS0tDQp0aXRsZTogIlIgTm90ZWJvb2siDQpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sNCi0tLQ0KICMgKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKg0KIyDrjIDtlZzrr7zqta0gMzDrjIAg7Jes7ISxIDM1MOunjOuqheydmCDtgqTrpbwg7Ya17ZWcIOygleq3nOu2hO2PrCDtlZnsirUNCiMgKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKg0KIyDthrXqs4TsnZgg7KKF66WYKOq4sOyIoO2GteqzhCwg7LaU66Gg7Ya16rOEKQ0KIyDqs7zqsbDsnZgg642w7J207YSw66W8IOu2hOyEnSwg6riw7IigIC0+IOq4sOyIoO2GteqzhA0KIyDrr7jrnpjsnZgg642w7J207YSw6rCS7J2EIOyYiOy4oSAtPiDstpTroaDthrXqs4QNCiMgLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQ0KIyAtLSAxLiDsgrzrsLHsmKTsi63rp4zqsJzsnZgg64Kc7IiY66W8IOyDneyEse2VmOq4sA0KIyAtLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tDQoNCmBgYHtyfQ0KdDEgPC0gcnVuaWYoMzUwMDAwMCwgbWluID0gMTU1MDAsIG1heCA9IDE3MDAwKQ0KIyBydW5pZiDtlajsiJjripQg7Yq57KCV67KU7JyE7J2YIOuenOuNpOyImOulvCDrsJjtmZjtlZzri6QuDQojIOyYiOygnOulvCDsi6TtlontlZjrqbQgMTUwMCB+IDE3MDAwIOyCrOydtOyXkCAzNTDrp4zqsJzsnZgg656o642k7IiY66W8IOuwmO2ZmO2VnOuLpA0KdDEgPC0gYXMuaW50ZWdlcih0MSkgICAgICAgICAgICAgICAgICANCiMg64Kc7IiY7IOd7ISxIO2bhCDruaDrpbgg7Jew7IKw7J2EIOychO2VtCDsoJXsiJjroZwg67CU6r6864ukLg0KdDIgPC0gaW50ZWdlcigxMF42KQ0KIyAxMDDrp4zqsJzsnZgg7KCV7IiY66W8IOuLtOuKlCDqs7XqsITsnYQg66eM65Og64ukDQpmb3IoaSBpbiAxOjEwXjYpew0KICBzIDwtIHQxW3NhbXBsZSh0MSwzMCxyZXBsYWNlID0gVCldDQogICMgMzDqsJzslKkg7ZGc67O47LaU7LacIO2VnOuLpC4gcmVwbGFjZSA9IFQg64qUIOuzteybkOy2lOy2nA0KICBtZWFuX3MgPC0gbWVhbihzKQ0KICAjIO2Pieq3oOydhCDqtaztlZzri6QNCiAgdDJbaV0gPC0gbWVhbl9zDQogICMg7Y+J6reg7J2EIHQy7JeQIOyggOyepe2VnOuLpA0KfQ0KaGVhZCh0MikNCg0KYGBgDQoNCiMgLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQ0KIyAtLTIuIOuPhOyImOulvCDqtaztlZzri6QNCiMtLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQ0KDQpgYGB7cn0NCnQzIDwtIHRhYmxlKHQyKQ0KI+2Pieq3oOuTpOydhCB0YWJsZSgp7ZWo7IiY66W8IOydtOyaqe2VtCDrj4TsiJjrpbwg6re466aw64ukLg0KaGVhZCh0MywzKQ0KcGxvdCh0Myx0eXBlPSdoJyxJd2Q9MikNCiNJZHcgPSAiMiLshKDsnZgg6rW16riwDQojY2V4ID0gIjMi7KCQ7J2064KYIOusuOyekOydmCDqtbXquLANCiNJdHkgPSDrnbzsnbjtg4DsnoUNCmBgYA0KDQoNCiMtLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQ0KIy0tMy4g7IOB64yA64+E7IiY66W8IOq1rO2VnOuLpA0KIy0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tDQoNCmBgYHtyfQ0KdDQgPC0gdDIvbGVuZ3RoKHQxKQ0KdDQNCiMg64+E7IiY7J2YIO2VqeqzhOyXkCDrjIDtlZwg6rCBIOqzhOq4ieydmCDrj4TsiJjsnZgg67mE7Jyo7J2EIOq3uCDqs4TquInsnZgNCiMg7IOB64yA64+E7IiY65286rOgIO2VnOuLpC4g7IOB64yA64+E7IiY64qUIDDsnbTsg4EgMeydtOyCrOyduCDshozsiJjroZwNCiMg64KY7YOA64K07Ja07KeA6rOgLCDqt7gg7ZWp6rOE64qUIOuwmOuTnOyLnCAx7J2064ukLg0KaGlzdCh0NCxicmVha3MgPSAxMDAwMCwgcHJvYiA9VCkNCmBgYA0KDQojPDzqsrDqs7zsoJXrpqw+Pg0KIyDrqqjsp5HtlansnbQg7KCV6rec67aE7Y+s66W8IOuUsOultOyngCDslYrrjZTrnbzrj4QsIO2RnOuzuOydmCDtgazquLDqsIAg7Lap67aE7Z6IIO2BtOuVjA0KIyAo67O07Ya1IDMw7J207IOBKSDsl6zrn6wg67KIIO2RnOuzuOydhCDstpTstpztlZjsl6wg7ZGc67O4IO2Pieq3oOydhCDstpTstpztlbQg67O066m0LA0KIyDsnbQg7ZGc67O4IO2Pieq3oOuTpOydgCDsoJXqt5zrtoTtj6zrpbwg65Sw66W066mwIOuqqOynke2VqeydmCDtj4nqt6Dsl5Ag6re87KCR7ZWc64ukLg0KIyDrqqjsp5HtlansnbQg7KCV6rec67aE7Y+s7J2865WMIOuqqOynkeuLqOydmCDtj4nqt6DsnYAgOTUl7J2YIO2ZleuloOuhnCDsho3tlZzri6QuDQojIOygleq3nOu2hO2PrCDspJHsl5DshJzrj4Qg7Y+J6reg7J20IDDsnbTqs6Ag7ZGc7KSA7Y647LCo6rCAIDHsnbgg6rKD7J2EDQojIO2RnOykgOygleq3nOu2hO2PrOudvOqzoCDtlZjqs6Ag7J2066W8IFot67aE7Y+s65286rOgIO2VnOuLpC4NCiMg66eO7J2AIOyekOyXsCDtmITsg4HsnbQg64KYIOyCrO2ajO2VmeyggeyduCDrjbDsnbTthLDsnZgg7ZmV66Wg67aE7Y+s64qUIOyiheuqqOyWkeydmCANCiMg7KCV6rec67aE7Y+s652864qUIOqyg+ydhCDrlLDrpbjri6QuIOydtCDsoJXqt5zrtoTtj6zripQg65Oc66+A652864qUIOyCrOuejOyXkA0KIyDsnZjtlbQg7LKY7J2MIOuwnOqyrOuQmOyXiOqzoCwg64KY7KSR7JeQIOyImO2VmeyekCDqsIDsmrDsiqTsl5Ag7J2Y7ZW0IO2PreuEk+qyjCDsnZHsmqnrkJjsl4jri6QuDQoNCg0KdDUgPC0gc2VxKGZyb209MTU4MDAsIHRvPTE2MjAwLGxlbmd0aC5vdXQgPSAxMDAwKQ0KeWxpbSA8LSBjKDAsMC4wMSkNCnBsb3QodDUsDQogICAgIGRub3JtKHQ1LCBtZWFuID0gMTYwMDAsIHNkPTUyLjcpLA0KICAgICBtYWluPSJOb3JtYWwiLA0KICAgICB0eXBlID0gImwiICwgI2xpbmXsnZggbA0KICAgICB5bGltID0geWxpbSkNCg0KIyB6Leu2hO2PrCg97ZGc7KSA7KCV6rec67aE7Y+sKeulvCDrlLDrpbTripQg64Kc7IiYIOuwnOyDne2VqOyImA0KdDYgPC0gcm5vcm0oMTAsbWVhbiA9IDAsIHNkPTEpDQojMTDsnYAg64Kc7IiY7J2YIOqwnOyImOulvCDrp5DtlZzri6QuDQp0Ng0KDQoj7ZmV66Wg67CA64+E7ZWo7IiYDQpkbm9ybSgxOjEwMCwgbWVhbj0wLCBzZCA9IDEpDQoj64iE7KCB67aE7Y+s7ZWo7IiYDQoocG5vcm0oMSwgbWVhbiA9IDAsc2QgPSAxKSAtMC41KSoxDQojWzFdIDAuMzQxMzQ0Nw0KKHBub3JtKDEsbWVhbj0wLCBzZCA9IDEpLTAuNSkqMg0KI1sxXSAwLjY4MjY4OTUNCihwbm9ybSgxLCBtZWFuPTAsIHNkID0gMSktMC41KSozDQojWzFdIDEuMDI0MDM0DQoNCg0KI+u2hOychOyImA0KcW5vcm0oMC4wNSwgbWVhbiA9IDAsc2Q9MSwgbG93ZXIudGFpbCA9IEYpDQpxbm9ybSgwLjAyNSwgbWVhbiA9IDAsIHNkPTEsIGxvd2VyLnRhaWwgPSBGKQ0KIyBsb3dlci50YWlsID1UIOydtOuptCDtmZXrpaDqsJLsnYAg6re4656Y7ZSEIOyijOy4oeuptOydhA0KIyBG7J2066m0IOyasOy4oeuptOyggeydhCDqs4TsgrANCg0KIzw87KCV6rec67aE7Y+sPj4NCiNbMV0g7KKF66qo7JaR7J2YIOyXsOyGje2Pie2VqOyImA0KI1syXSDtj4nqt6DsnYQg7KSR7Ius7Jy866GcIOyijOyasCDrjIDsua3snbTri6QuIOuUsOudvOyEnCDtj4nqt6DsnYQg7KSR7Ius7Jy866GcDQojICAg7KKM7Lih6rO8IOyasOy4oeydmCDtmZXrpaDsnYAg6rCB6rCBIDAuNeydtOuLpC4NCiMgWzNdIFjstpXsl5Ag64yA7ZWY7JesICjtj4nqt6AgbXUsIO2RnOykgO2OuOywqCBzZCkNCiMg6rCS7J20IFttdSAtIHNkIH4gbXUgKyBzZF0g7JeQIOyGje2VoCDtmZXrpaDsnYAgMC42OA0KIyDqsJLsnbQgW211IC0gc2QqMiB+IG11ICsgc2QqMl0g7JeQIOyGje2VoCDtmZXrpaDsnYAgMC45NQ0KIyDqsJLsnbQgW211IC0gc2QqMyB+IG11ICsgc2QqM10g7JeQIOyGje2VoCDtmZXrpaDsnYAgMC45OTcNCiMgWzRdIHNkIOqwgCAx7J206rOgIO2Pieq3oOydtCAwIOyduCDsoJXqt5zrtoTtj6zrpbwg7ZGc7KSA7KCV6rec67aE7Y+s65286rOgIO2VnOuLpC4NCiMgei3rtoTtj6zripQgOTUlIOq1rOqwhOuCtOyXkCDrk6TslrTqsIDripQg6rCS64qUICstIDEuNjQ1DQojIDk3LjUlIOq1rOqwhOuCtOyXkCDrk6TslrTqsIDripQg6rCS7J2AICstMS45NiDqtazqsITrgrTsl5ANCiMgOTkuNSUg64qUICstMi41NzUg6rWs6rCE64K07JeQIOyGje2VnOuLpC4gDQoNCg0KDQoNCg0KDQoNCg0KDQo=