Medidas de dispersión

Definición 1: La varianza de la poblacion, se denota:

Code in LaTex

#\sigma^{2}={\frac{{\displaystyle \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}}}{N}}

\[ \sigma^{2}={\frac{{\displaystyle \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}}}{N}} \]

La varianza de la muestra
\[ s^{2}={\frac{{\displaystyle \sum_{i=1}^{n}\left(x_{i}-\mu\right)^{2}}}{n-1}} \]

Definicion 2: La desviación típica o estandar se denota como la raíz cuadrada de la varianza

Desviación estandar de la población

\[ \sigma=\sqrt{\sigma^{2}} \] Desviación estandar de la muestra \[ s=\sqrt{s^{2}} \] A partir de estas medidas de dispersión se puede calcular el coeficiente de variación poblacional

\[ CV=\frac{\sigma}{|\mu|} 100 \] coefienciete de variación muestral

\[ CV=\frac{s}{|\overline{x}|} 100 \] Calculando medidas de dispersión con R

v<-c(1:10)
(mv<-mean(v))

## [1] 5.5

(varianzap<-sum((v-mv)^2)/length(v))

## [1] 8.25

(varianzam<-sum((v-mv)^2)/(length(v)-1))

## [1] 9.166667

var(v) ## Función de R

## [1] 9.166667

(desvp<-sqrt(varianzap))

## [1] 2.872281

(desvm<-sqrt(varianzam))

## [1] 3.02765

sd(v) ## Función de R

## [1] 3.02765

(cvm<- desvm/abs(mv)*100)

## [1] 55.04819

(cvp<- desvp/abs(mv)*100)

## [1] 52.2233

Estadística descriptiva por grupos con R Libreria Lattice

temp <- sort(rnorm(60, 15, 2))
HR <- sort(runif(60, 70, 90))
localidad <- gl(3, 20, 60, labels = c("L1", "L2", "L3"))
df3 <- data.frame(temp, HR, localidad)
#View(df3)
boxplot(temp~localidad, col = c("red", "yellow", "blue"),
        horizontal = T, xlab = "°C")
UMA <- gl(2, 10, 60, labels = c("UMA1", "UMA2"))
UMA2 <- gl(6, 10, 60, labels = c("UMA1", "UMA2", "UMA3", 
                                 "UMA4", "UMA5", "UMA6"))
df3b <- data.frame(df3, UMA, UMA2)
#View(df3b)
table(localidad, UMA)

##          UMA
## localidad UMA1 UMA2
##        L1   10   10
##        L2   10   10
##        L3   10   10

#install.packages(lattice)
library(lattice)

bwplot(HR~localidad, data = df3b)

bwplot(HR~UMA, data = df3b)

bwplot(HR~localidad|UMA, data = df3b)

bwplot(HR~UMA|localidad, data = df3b, layout = c(3,1))

Otro ejemplo

cd_a <- rnorm(120, 2, 0.35)
prg <- gl(6, 20, 120, labels = c("pg1", "pg2", "pg3", 
                                 "pg4", "pg5", "pg6"))
sustrato <- gl(2, 10, 120, labels = c("alto", "bajo"))
dfcd <- data.frame(cd_a, prg, sustrato)
#View(dfcd)
#Bueno
bwplot(cd_a~sustrato|prg)

#Malo 
bwplot(cd_a~prg|sustrato)

Graficos de dispersión

pH<-sort(rnorm(50,5.5,0.4))
mo<-sort(rnorm(50,2.3,0.4))
plot(pH, mo,
     ylab = "MO" , xlab = "pH",
     pch = 19, col = "orange", 
     main = "Diagrama de puntos",
     cex = 1.5)
grid(10, 10, col = "grey")

Covarianza muestral

\[ s_{xy}={\frac{{\displaystyle \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)} \left(y_{i}-\overline{y}\right)}{n-1}}\] coefiente de correlación de Pearson muestral

\[ r=\frac{s_{xy}}{s_{x} s_{y}} \]

Ejemplo

(covp<-sum((pH-mean(pH))*(mo-mean(mo)))/(length(pH)-1))

## [1] 0.1634975

(r<-covp/(sd(pH)*sd(mo)))

## [1] 0.9708394

## en R 
cor(pH,mo,method = "pearson")

## [1] 0.9708394