El gobierno provincial desea averiguar si el número medio de hijos por familia ha descendido respecto de la década anterior. Para ello ha encuestado a 20 familias respecto al número de hijos, y ha obtenido los siguientes datos: 2 4 5 3 1 2 4 2 3 0 3 3 4 5 5 0 3 2 1 2
numhij <- c(2,4,5,3,1,2,4,2,3,0,3,3,4,5,5,0,3,2,1,2)
fabs<-table(numhij)
length(numhij)
## [1] 20
fabs
## numhij
## 0 1 2 3 4 5
## 2 2 5 5 3 3
frel<- fabs/length(numhij)
frel
## numhij
## 0 1 2 3 4 5
## 0.10 0.10 0.25 0.25 0.15 0.15
fabsacum<-cumsum(fabs)
fabsacum
## 0 1 2 3 4 5
## 2 4 9 14 17 20
frelacum<- cumsum(frel)
frelacum
## 0 1 2 3 4 5
## 0.10 0.20 0.45 0.70 0.85 1.00
tablafrecuencias<-cbind(fabs, frel,fabsacum,frelacum)
tablafrecuencias
## fabs frel fabsacum frelacum
## 0 2 0.10 2 0.10
## 1 2 0.10 4 0.20
## 2 5 0.25 9 0.45
## 3 5 0.25 14 0.70
## 4 3 0.15 17 0.85
## 5 3 0.15 20 1.00
barplot(fabs,ylab="Frec. absoluta",xlab="Número de hijos",main="Número de hijos
de las familias")
Procederemos a calcular las distintas medidas descriptivas
media<-mean(numhij)
media
## [1] 2.7
mediana<-median(numhij)
mediana
## [1] 3
Para mostrar el resultado del primer cuartil
q1<-quantile(numhij,.25)
q1
## 25%
## 2
Para mostrar el resultado del segundo cuartil
q2<-quantile(numhij,.50)
q2
## 50%
## 3
Para mostrar el resultado del tercer cuartil
q3<-quantile(numhij,.75)
q3
## 75%
## 4
varianza<-var(numhij)
varianza
## [1] 2.326316
desvioestandar<-sd(numhij)
desvioestandar
## [1] 1.525226
cv<-desvioestandar/media
cv
## [1] 0.5648987
También puedo utilizar la siguiente función para tener un resumen de los parámetros más importantes de una variable
summary(numhij)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0 2.0 3.0 2.7 4.0 5.0