Definición 1: La varianza de la poblacion, se denota:
Code in LaTex
#\sigma^{2}={\frac{{\displaystyle \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}}}{N}}
\[ \sigma^{2}={\frac{{\displaystyle \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}}}{N}} \]
La varianza de la muestra
\[
s^{2}={\frac{{\displaystyle \sum_{i=1}^{n}\left(x_{i}-\mu\right)^{2}}}{n-1}}
\]
Definicion 2: La desviación tĆpica o estandar se denota como la raĆz cuadrada de la varianza
Desviación estandar de la población
\[ \sigma=\sqrt{\sigma^{2}} \] Desviación estandar de la muestra \[ s=\sqrt{s^{2}} \] A partir de estas medidas de dispersión se puede calcular el coeficiente de variación poblacional
\[ CV=\frac{\sigma}{|\mu|} 100 \] coefienciete de variación muestral
\[ CV=\frac{s}{|\overline{x}|} 100 \] Calculando medidas de dispersión con R
v<-c(1:10)
(mv<-mean(v))
## [1] 5.5
(varianzap<-sum((v-mv)^2)/length(v))
## [1] 8.25
(varianzam<-sum((v-mv)^2)/(length(v)-1))
## [1] 9.166667
var(v) ## Función de R
## [1] 9.166667
(desvp<-sqrt(varianzap))
## [1] 2.872281
(desvm<-sqrt(varianzam))
## [1] 3.02765
sd(v) ## Función de R
## [1] 3.02765
(cvm<- desvm/abs(mv)*100)
## [1] 55.04819
(cvp<- desvp/abs(mv)*100)
## [1] 52.2233
EstadĆstica descriptiva por grupos con R Libreria Lattice
temp <- sort(rnorm(60, 15, 2))
HR <- sort(runif(60, 70, 90))
localidad <- gl(3, 20, 60, labels = c("L1", "L2", "L3"))
df3 <- data.frame(temp, HR, localidad)
#View(df3)
boxplot(temp~localidad, col = c("red", "yellow", "blue"),
horizontal = T, xlab = "°C")
UMA <- gl(2, 10, 60, labels = c("UMA1", "UMA2"))
UMA2 <- gl(6, 10, 60, labels = c("UMA1", "UMA2", "UMA3",
"UMA4", "UMA5", "UMA6"))
df3b <- data.frame(df3, UMA, UMA2)
#View(df3b)
table(localidad, UMA)
## UMA
## localidad UMA1 UMA2
## L1 10 10
## L2 10 10
## L3 10 10
#install.packages(lattice)
library(lattice)
bwplot(HR~localidad, data = df3b)
bwplot(HR~UMA, data = df3b)
bwplot(HR~localidad|UMA, data = df3b)
bwplot(HR~UMA|localidad, data = df3b, layout = c(3,1))
Otro ejemplo
cd_a <- rnorm(120, 2, 0.35)
prg <- gl(6, 20, 120, labels = c("pg1", "pg2", "pg3",
"pg4", "pg5", "pg6"))
sustrato <- gl(2, 10, 120, labels = c("alto", "bajo"))
dfcd <- data.frame(cd_a, prg, sustrato)
#View(dfcd)
#Bueno
bwplot(cd_a~sustrato|prg)
#Malo
bwplot(cd_a~prg|sustrato)
Graficos de dispersión
pH<-sort(rnorm(50,5.5,0.4))
mo<-sort(rnorm(50,2.3,0.4))
plot(pH, mo,
ylab = "MO" , xlab = "pH",
pch = 19, col = "orange",
main = "Diagrama de puntos",
cex = 1.5)
grid(10, 10, col = "grey")
Covarianza muestral
\[ s_{xy}={\frac{{\displaystyle \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)} \left(y_{i}-\overline{y}\right)}{n-1}}\] coefiente de correlación de Pearson muestral
\[ r=\frac{s_{xy}}{s_{x} s_{y}} \]
Ejemplo
(covp<-sum((pH-mean(pH))*(mo-mean(mo)))/(length(pH)-1))
## [1] 0.1634975
(r<-covp/(sd(pH)*sd(mo)))
## [1] 0.9708394
## en R
cor(pH,mo,method = "pearson")
## [1] 0.9708394