Medidas de dispersión

Varianza población \[ s_x^2 := \frac{1}{n} \sum_{i=1}^n(x_i - \bar x)^2 \]

Varianza muestral

\[ s_x^2 := \frac{1}{n-1} \sum_{i=1}^n(x_i - \bar x)^2 \]

Es complicado interpretar ya que las unidades de la varianza son cuadráticas, por esete motivo se hace necesario tomar raiz.

Desv estándar

Varianza población \[ s_x := \sqrt{\frac{1}{n} \sum_{i=1}^n(x_i - \bar x)^2} \]

Varianza muestral

\[ s_x := \sqrt{\frac{1}{n-1} \sum_{i=1}^n(x_i - \bar x)^2} \]

x<-rnorm(100,4,3)
hist(x)

var(x)
## [1] 8.257173
y<-rnorm(1000,4,3)
var(y)
## [1] 8.693046
x<-c(3.4,5.2,5.8,4.3)
mean(x)
## [1] 4.675
var(x)
## [1] 1.1025
sd(x)
## [1] 1.05
IQR(x)
## [1] 1.275
quantile(x)
##    0%   25%   50%   75%  100% 
## 3.400 4.075 4.750 5.350 5.800
x<-rnorm(100,4,3)
boxplot(x)

Prueba de la regla empírica

pnorm(3)-pnorm(-3)
## [1] 0.9973002
(pnorm(3)-pnorm(-3))*100
## [1] 99.73002
pnorm(2)-pnorm(-2)
## [1] 0.9544997
(pnorm(2)-pnorm(-2))*100
## [1] 95.44997
pnorm(1)-pnorm(-1)
## [1] 0.6826895
(pnorm(1)-pnorm(-1))*100
## [1] 68.26895
x<-seq(-3.5,3.5,length = 1000)
fx<-dnorm(x)
plot(x,fx,type='l')