Mean(평균) Median(중간값) min max 다 괜찮고
Duration 에 대해 작업을 하는데
quantile - 원래 4분위는 quartile 이고, quantile 은 ‘분위’ 로 통칭됨. 기본적으로 quantile 을 호출하면 4분위로 처리되지만
quantile(duration)
0% 25% 50% 75% 100%
1.60000 2.16275 4.00000 4.45425 5.10000
따로 분위를 설정해주면 그에 맞게 출력됨. 같은 요령으로 출력하고 싶은 퍼센트를 입력하면 딱 그것만 뽑아낼 수도 있음.
quantile(duration, c(seq(0.1, 1.0, by=0.1)))
10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
1.8517 2.0034 2.3051 3.6000 4.0000 4.1670 4.3667 4.5330 4.7000 5.1000
IQR : 75% 지점의 값 과 25% 지점의 값 의 차이 (75% - 25%) 얼마나 넓게 퍼져 있는지를 확인하는 용도
IQR(duration); quantile(duration, 0.75) - quantile(duration, 0.25)
[1] 2.2915
75%
2.2915

min, max, 25%, 75%, Median 값이 전부 출력됨. (mean 값은 기본적으로는 없다)
Variance (분산) : var() : 평균값에서 떨어진 정도의 합의 평균 Standard Deviation (표준 편차) : sd() (제곱하면 분산이 된다)
Covariance (공분산) : cov()
두 개의 확률변수 사이의 상관 정도를 얘기함 (비교해서, 분산은 하나의 변수의 이산 정도를 나타낸다) 관계가 양의 상관관계가 있을 때 양수, 음의 상관관계가 있을 때 음수, 거의 관계가 없다면 0에 가까운 구조
cov(duration, waiting)
[1] 13.97781
결과값이 양수이기 때문에 positive linear relationship 이 있다고 생각할 수 있다
Correlation Coefficient (상관계수) : cor()
공분산을 각각의 표준편차의 곱으로 나눈 식으로 계산해서 나오는 값인데, 결과적으로 -1~1 사이의 값이 나오게 되고, 값이 1 (혹은 -1) 에 가까울수록 관계성이 강하다고 볼 수 있다. 공분산은 값이 크다면 상관도가 어떻든 큰 값이 나오지만 상관계수는 값이 작더라도, 상관도가 크면 큰(=1에 가까운) 값이 나온다.
cor(duration, waiting); cov(duration,waiting)/sd(duration)/sd(waiting);
[1] 0.9008112
[1] 0.9008112
Central Moment : moment() : 분산 계산과 같은데 n승을 하는 경우. 즉, 2승을 하게 되면 분산과 동일.
Skewness(비대칭도) : skewness() : 중심을 기준으로, 그래프의 왼쪽이나 오른쪽으로 치우친 정도
이 계산은 Central Moment 3차값 결과값을 표준편차의 3승으로 나눠 계산하는데, Central Moment 에서 3승을 하기 때문에 우선 평균보다 큰 값이 많을 경우 음수가 가능해지기 때문에 (평균-값이니까), 왼쪽으로 치우칠 (평균보다 작은 값이 많을) 경우 양수값으로 커지고, 오른쪽으로 치우칠 (평균보다 큰 값이 많을) 경우 음수값으로 커진다.
skewness(duration); m_3/sd(duration)^3
[1] -0.4135498
[1] -0.4135498
Kurtosis(첨도) : kurtosis() : 얼마나 중심에 많이 뭉쳐 있는가, 혹은 좌우로 넓게 퍼져 있는가에 대한 평가
이건 Central Moment 4차값을 분산의 제곱으로 나눠서 3을 빼서 계산한다. 완전 정규 분포(분산/표준편차 1) 의 경우에도 Central Moment 4차값은 거의 3이 되는데, 그래서 3을 빼면 0에 가깝게 된다.
var(norm_x); moment(norm_x, order=4, center=TRUE); moment(norm_x, order=4, center=TRUE)/var(norm_x)^2-3; kurtosis(norm_x)
[1] 1.010754
[1] 3.056282
[1] -0.008408777
[1] -0.008408777
계산하면
moment(duration, order=4, center=TRUE)/var(duration)^2-3; kurtosis(duration)
[1] -1.511605
[1] -1.511605
4승을 했기 때문에, 평균에 가까운 값들이 많을수록(뾰족핦수록) 값이 커지고, 평균에서 떨어진 값이 많을수록 (꼬리가 길다) 값이 작아진다.
LS0tCnRpdGxlOiAiUiBTdHVkeTMgLSBOdW1lcmljYWwgRGlzdHJpYnV0aW9uIgpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sKLS0tCgpNZWFuKO2Pieq3oCkgTWVkaWFuKOykkeqwhOqwkikgbWluIG1heCDri6Qg6rSc7LCu6rOgCgpEdXJhdGlvbiDsl5Ag64yA7ZW0IOyekeyXheydhCDtlZjripTrjbAKCnF1YW50aWxlCi0g7JuQ656YIDTrtoTsnITripQgcXVhcnRpbGUg7J206rOgLCBxdWFudGlsZSDsnYAgJ+u2hOychCcg66GcIO2Gtey5reuQqC4K6riw67O47KCB7Jy866GcIHF1YW50aWxlIOydhCDtmLjstpztlZjrqbQgNOu2hOychOuhnCDsspjrpqzrkJjsp4Drp4wKCmBgYHtyfQpkdXJhdGlvbiA9IGZhaXRoZnVsJGVydXB0aW9ucwpxdWFudGlsZShkdXJhdGlvbikKYGBgCgrrlLDroZwg67aE7JyE66W8IOyEpOygle2VtOyjvOuptCDqt7jsl5Ag66ee6rKMIOy2nOugpeuQqC4K6rCZ7J2AIOyalOugueycvOuhnCDstpzroKXtlZjqs6Ag7Iu27J2AIO2NvOyEvO2KuOulvCDsnoXroKXtlZjrqbQg65SxIOq3uOqyg+unjCDrvZHslYTrgrwg7IiY64+EIOyeiOydjC4KCmBgYHtyfQpxdWFudGlsZShkdXJhdGlvbiwgYyhzZXEoMC4xLCAxLjAsIGJ5PTAuMSkpKQpgYGAKCklRUiA6IDc1JSDsp4DsoJDsnZgg6rCSIOqzvCAyNSUg7KeA7KCQ7J2YIOqwkiDsnZgg7LCo7J20ICg3NSUgLSAyNSUpCuyWvOuniOuCmCDrhJPqsowg7Y287KC4IOyeiOuKlOyngOulvCDtmZXsnbjtlZjripQg7Jqp64+ECgpgYGB7cn0KSVFSKGR1cmF0aW9uKTsgcXVhbnRpbGUoZHVyYXRpb24sIDAuNzUpIC0gcXVhbnRpbGUoZHVyYXRpb24sIDAuMjUpCmBgYAoKYGBge3J9CmJveHBsb3QoZHVyYXRpb24sIGhvcml6b250YWw9VFJVRSkKYGBgCgptaW4sIG1heCwgMjUlLCA3NSUsIE1lZGlhbiDqsJLsnbQg7KCE67aAIOy2nOugpeuQqC4gKG1lYW4g6rCS7J2AIOq4sOuzuOyggeycvOuhnOuKlCDsl4bri6QpCgpWYXJpYW5jZSAo67aE7IKwKSA6IHZhcigpIDog7Y+J6reg6rCS7JeQ7IScIOuWqOyWtOynhCDsoJXrj4TsnZgg7ZWp7J2YIO2Pieq3oCAKU3RhbmRhcmQgRGV2aWF0aW9uICjtkZzspIAg7Y647LCoKSA6IHNkKCkgKOygnOqzse2VmOuptCDrtoTsgrDsnbQg65Cc64ukKQoKQ292YXJpYW5jZSAo6rO167aE7IKwKSA6IGNvdigpCgrrkZAg6rCc7J2YIO2ZleuloOuzgOyImCDsgqzsnbTsnZgg7IOB6rSAIOygleuPhOulvCDslpjquLDtlaggCijruYTqtZDtlbTshJwsIOu2hOyCsOydgCDtlZjrgpjsnZgg67OA7IiY7J2YIOydtOyCsCDsoJXrj4Trpbwg64KY7YOA64K464ukKQrqtIDqs4TqsIAg7JaR7J2YIOyDgeq0gOq0gOqzhOqwgCDsnojsnYQg65WMIOyWkeyImCwg7J2M7J2YIOyDgeq0gOq0gOqzhOqwgCDsnojsnYQg65WMIOydjOyImCwg6rGw7J2YIOq0gOqzhOqwgCDsl4bri6TrqbQgMOyXkCDqsIDquYzsmrQg6rWs7KGwIAoKYGBge3J9CmR1cmF0aW9uID0gZmFpdGhmdWwkZXJ1cHRpb25zCndhaXRpbmcgPSBmYWl0aGZ1bCR3YWl0aW5nCmNvdihkdXJhdGlvbiwgd2FpdGluZykKYGBgCgrqsrDqs7zqsJLsnbQg7JaR7IiY7J206riwIOuVjOusuOyXkCBwb3NpdGl2ZSBsaW5lYXIgcmVsYXRpb25zaGlwIOydtCDsnojri6Tqs6Ag7IOd6rCB7ZWgIOyImCDsnojri6QgCgpDb3JyZWxhdGlvbiBDb2VmZmljaWVudCAo7IOB6rSA6rOE7IiYKSA6IGNvcigpCgrqs7XrtoTsgrDsnYQg6rCB6rCB7J2YIO2RnOykgO2OuOywqOydmCDqs7HsnLzroZwg64KY64iIIOyLneycvOuhnCDqs4TsgrDtlbTshJwg64KY7Jik64qUIOqwkuyduOuNsCwgCuqysOqzvOyggeycvOuhnCAtMX4xIOyCrOydtOydmCDqsJLsnbQg64KY7Jik6rKMIOuQmOqzoCwg6rCS7J20IDEgKO2YueydgCAtMSkg7JeQIOqwgOq5jOyauOyImOuhnSDqtIDqs4TshLHsnbQg6rCV7ZWY64uk6rOgIOuzvCDsiJgg7J6I64ukLgrqs7XrtoTsgrDsnYAg6rCS7J20IO2BrOuLpOuptCDsg4HqtIDrj4TqsIAg7Ja065a765OgIO2BsCDqsJLsnbQg64KY7Jik7KeA66eMCuyDgeq0gOqzhOyImOuKlCDqsJLsnbQg7J6R642U652864+ELCDsg4HqtIDrj4TqsIAg7YGs66m0IO2BsCg9MeyXkCDqsIDquYzsmrQpIOqwkuydtCDrgpjsmKjri6QuCgpgYGB7cn0KY29yKGR1cmF0aW9uLCB3YWl0aW5nKTsgY292KGR1cmF0aW9uLHdhaXRpbmcpL3NkKGR1cmF0aW9uKS9zZCh3YWl0aW5nKQpgYGAKCkNlbnRyYWwgTW9tZW50IDogbW9tZW50KCkgOiDrtoTsgrAg6rOE7IKw6rO8IOqwmeydgOuNsCBu7Iq57J2EIO2VmOuKlCDqsr3smrAuIOymiSwgMuyKueydhCDtlZjqsowg65CY66m0IOu2hOyCsOqzvCDrj5nsnbwuCgpTa2V3bmVzcyjruYTrjIDsua3rj4QpIDogc2tld25lc3MoKSA6IOykkeyLrOydhCDquLDspIDsnLzroZwsIOq3uOuemO2UhOydmCDsmbzsqr3snbTrgpgg7Jik66W47Kq97Jy866GcIOy5mOyasOy5nCDsoJXrj4QKCuydtCDqs4TsgrDsnYAgQ2VudHJhbCBNb21lbnQgM+ywqOqwkiDqsrDqs7zqsJLsnYQg7ZGc7KSA7Y647LCo7J2YIDPsirnsnLzroZwg64KY64igIOqzhOyCsO2VmOuKlOuNsCwKQ2VudHJhbCBNb21lbnQg7JeQ7IScIDPsirnsnYQg7ZWY6riwIOuVjOusuOyXkCDsmrDshKAg7Y+J6reg67O064ukIO2BsCDqsJLsnbQg66eO7J2EIOqyveyasCDsnYzsiJjqsIAg6rCA64ql7ZW07KeA6riwIOuVjOusuOyXkCAo7Y+J6regLeqwkuydtOuLiOq5jCksIOyZvOyqveycvOuhnCDsuZjsmrDsuaAgKO2Pieq3oOuztOuLpCDsnpHsnYAg6rCS7J20IOunjuydhCkg6rK97JqwIOyWkeyImOqwkuycvOuhnCDsu6Tsp4Dqs6AsIOyYpOuluOyqveycvOuhnCDsuZjsmrDsuaAgKO2Pieq3oOuztOuLpCDtgbAg6rCS7J20IOunjuydhCkg6rK97JqwIOydjOyImOqwkuycvOuhnCDsu6Tsp4Tri6QuIAoKYGBge3J9CmxpYnJhcnkoZTEwNzEpCm1fMyA9IG1vbWVudChkdXJhdGlvbiwgb3JkZXI9MywgY2VudGVyPVRSVUUpCnNrZXduZXNzKGR1cmF0aW9uKTsgbV8zL3NkKGR1cmF0aW9uKV4zCmBgYAoKS3VydG9zaXMo7LKo64+EKSA6IGt1cnRvc2lzKCkgOiDslrzrp4jrgpgg7KSR7Ius7JeQIOunjuydtCDrrYnss5Ag7J6I64qU6rCALCDtmLnsnYAg7KKM7Jqw66GcIOuEk+qyjCDtjbzsoLgg7J6I64qU6rCA7JeQIOuMgO2VnCDtj4nqsIAgCgrsnbTqsbQgQ2VudHJhbCBNb21lbnQgNOywqOqwkuydhCDrtoTsgrDsnZgg7KCc6rOx7Jy866GcIOuCmOuIoOyEnCAz7J2EIOu5vOyEnCDqs4TsgrDtlZzri6QuIArsmYTsoIQg7KCV6recIOu2hO2PrCjrtoTsgrAv7ZGc7KSA7Y647LCoIDEpIOydmCDqsr3smrDsl5Drj4QgQ2VudHJhbCBNb21lbnQgNOywqOqwkuydgCDqsbDsnZggM+ydtCDrkJjripTrjbAsIOq3uOuemOyEnCAz7J2EIOu5vOuptCAw7JeQIOqwgOq5neqyjCDrkJzri6QuCgpgYGB7cn0Kbm9ybV94ID0gcm5vcm0oNTAwMDAsIDAsIDEpICMg7KCV6rec67aE7Y+s66W8IOuenOuNpO2VmOqyjCDrp4zrk6TslrTshJwg7ZmV7J247ZW067O066m0CnZhcihub3JtX3gpOyBtb21lbnQobm9ybV94LCBvcmRlcj00LCBjZW50ZXI9VFJVRSk7IG1vbWVudChub3JtX3gsIG9yZGVyPTQsIGNlbnRlcj1UUlVFKS92YXIobm9ybV94KV4yLTM7IGt1cnRvc2lzKG5vcm1feCkKYGBgCgrqs4TsgrDtlZjrqbQKCmBgYHtyfQptb21lbnQoZHVyYXRpb24sIG9yZGVyPTQsIGNlbnRlcj1UUlVFKS92YXIoZHVyYXRpb24pXjItMzsga3VydG9zaXMoZHVyYXRpb24pIApgYGAKCjTsirnsnYQg7ZaI6riwIOuVjOusuOyXkCwg7Y+J6reg7JeQIOqwgOq5jOyatCDqsJLrk6TsnbQg66eO7J2E7IiY66GdKOu+sOyhse2VpuyImOuhnSkg6rCS7J20IOy7pOyngOqzoCwg7Y+J6reg7JeQ7IScIOuWqOyWtOynhCDqsJLsnbQg66eO7J2E7IiY66GdICjqvKzrpqzqsIAg6ri464ukKSDqsJLsnbQg7J6R7JWE7KeE64ukLgoKCg==