Ejemplo 1

El gobierno provincial desea averiguar si el número medio de hijos por familia ha descendido respecto de la década anterior. Para ello ha encuestado a 20 familias respecto al número de hijos, y ha obtenido los siguientes datos: 2 4 5 3 1 2 4 2 3 0 3 3 4 5 5 0 3 2 1 2

numhij <- c(2,4,5,3,1,2,4,2,3,0,3,3,4,5,5,0,3,2,1,2)

Armar tabla de frecuencias Absolutas

fabs<-table(numhij)
length(numhij)
## [1] 20
fabs
## numhij
## 0 1 2 3 4 5 
## 2 2 5 5 3 3

Armar tabla de frecuencias relativas

frel<- fabs/length(numhij)
frel
## numhij
##    0    1    2    3    4    5 
## 0.10 0.10 0.25 0.25 0.15 0.15

Muestra la frecuencia absoluta acumulada de cada valor de la variable.

fabsacum<-cumsum(fabs)
fabsacum
##  0  1  2  3  4  5 
##  2  4  9 14 17 20

Muestra la frecuencia relativa acumulada de cada valor de la variable

frelacum<- cumsum(frel)
frelacum
##    0    1    2    3    4    5 
## 0.10 0.20 0.45 0.70 0.85 1.00

Creo la tabla con los distintos tipos de frecuencias

tablafrecuencias<-cbind(fabs, frel,fabsacum,frelacum)
tablafrecuencias
##   fabs frel fabsacum frelacum
## 0    2 0.10        2     0.10
## 1    2 0.10        4     0.20
## 2    5 0.25        9     0.45
## 3    5 0.25       14     0.70
## 4    3 0.15       17     0.85
## 5    3 0.15       20     1.00

Realizar un gráfico de barra de número de hijos y la frecuencia absoluta

barplot(fabs,ylab="Frec. absoluta",xlab="Número de hijos",main="Número de hijos
de las familias")

Procederemos a calcular las distintas medidas descriptivas

Medidas de tendencia central

Cálculo de la media muestral

media<-mean(numhij)
media
## [1] 2.7

Muestra el valor de la mediana la variable.

mediana<-median(numhij)
mediana
## [1] 3

Medidas de posición no central

Cuartiles

Para mostrar el resultado del primer cuartil

q1<-quantile(numhij,.25)
q1
## 25% 
##   2

Para mostrar el resultado del segundo cuartil

q2<-quantile(numhij,.50)
q2
## 50% 
##   3

Para mostrar el resultado del tercer cuartil

q3<-quantile(numhij,.75)
q3
## 75% 
##   4

Medidas de dispersión

Varianza muestral

varianza<-var(numhij)
varianza
## [1] 2.326316

Desvío estándar

desvioestandar<-sd(numhij)
desvioestandar
## [1] 1.525226

Coeficiente de variación

cv<-desvioestandar/media
cv
## [1] 0.5648987

También puedo utilizar la siguiente función para tener un resumen de los parámetros más importantes de una variable

summary(numhij)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     0.0     2.0     3.0     2.7     4.0     5.0