Se realiza un estudio en un hospital geriátrico, cuyo objetivo es determinar el tipo de pacientes a los que se atiende y averiguar a dónde van los pacientes cuando dejan el geriátrico Están implicadas cuatro variables aleatorias discretas. Estas son: sexo (codificado por el investigador como F= femenino o M= masculino) Diagnóstico (codificada como RM= retardo mental, EM= enfermo mental, FE= físicamente enfermo) Edad y destino al dejar el hospital geriátrico (codificado como 1=muerto, 2= hogar de familiares, 3= hospital, 4=calle, 5= otro geriátrico, 6= sanatorio particular, 7= no ha dejado el hospital geriátrico) (Adecuado de http://matematicapablocasals.blogspot.com/2015/05/cuadro-de-frecuencias-para-variable.html)
Tomaremos una variable cualitativa Sexo para construir una tabla de distribución de frecuencias, para lo cual insertamos los datos mediante la siguiente linea de comando
sexo=factor(c("F","M","F","F","F","M","M","F","F","F","F","F","M","M","M","F","M","M",
"F","F","F","F","F","M"))
Cuando se inserta datos cualitativos se utiliza la función factor(), cuyo proposito es indicar al programa que los datos son cualitativos y que estan en categorias o niveles.
Para el primer método se utiliza las funciones preinstaladas en R, para lo cual primero calculamos la frecuencia absoluta, utilizando la funcion table.
tabla=table(sexo)
tabla
## sexo
## F M
## 15 9
Como se puede observar, muestra la cantidad de datos que pertencen a una catogoria.
Para calcular la frecuencia relativa se utiliza la función prop.table aplicado al resultado que se obtuvo para la frecuencia absoluta.
tabla2=prop.table(tabla)
tabla2
## sexo
## F M
## 0.625 0.375
Para la representación gráfica de barras utilizamos la función barplot y como referencia tomamos el resultados de la frecuencia absoluta que se almaceno en la variable tabla.
barplot(tabla)
para mejora la representación grafica podemos aumentar mas argumentos a la linea de comando anterior, obteniendo la siguiente linea de comando.
barplot(tabla, main = "Diagrama de barras", col = c("green","orange"))
Tambien se puede mostra el diagrama de barra en forma horizontal de la siguiente manera.
barplot(tabla, horiz = TRUE)
Tambien conocido como el gráfico de la torta, que se puede crear utilizando la función pie aplicada al resultado de la tabla de frecuencias absolutas, que esta almacenada en la variable tabla.
pie(tabla)
Para construir la tabla de distribución de frecuencias instalaremos el paquete “fdth”, en caso de que NO se haya instalado antes.
install.packages("fdth")
luego abrimos la libreria fdth
library(fdth)
Para contruir la tabla de distibución de frecuencia se utiliza la función fdt_cat de la libreria fdth
tabla=fdt_cat(sexo)
tabla
## Category f rf rf(%) cf cf(%)
## F 15 0.62 62.5 15 62.5
## M 9 0.38 37.5 24 100.0
Donde:
Para la representación gráfica tomamos como referencia el resultado de la tabla de distribución de frecuencia que está almacenado en la variable tabla
Consideranto la frecuencia Absoluta para la magnitud de las barras se utiliza como parámetro el tipo fb
plot(tabla, type = "fb")
Para mejorar la presentación del grafico podemos aumentar mas parámetros como el título (main), el nombres del eje y (ylab) y el eje x (xlab), tambien se puede poner color (col).
plot(tabla, type = "fb", main="Pacientes de un hopital geriátrico", ylab="Frecuencias",
xlab = "Categorias", col="red")
Considerando la frecuencia relativa porcentual para la magnitud de las barras se utiliza como parámetro el tipo rfpb
plot(tabla, type = "rfpb")