Distribuciones de frecuencia para datos cualitativos
Tablas de distribución de frecuencia
Tablas de distribución de frecuencia en R
Distribuciones de frecuencia
En estadística, se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente incluye que indican el número de observaciones en cada categoría.
Proporciona un valor añadido a la agrupación de datos.
Presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase.
Pueden representarse por medio de tablas, gráficos o funciones.
Tablas de distribución de frecuencia
Definiciones
Frecuencias absolutas (f), se define como el número de ocurrecias totales en cada categoría en los datos.
Frecuencias relativa (fr), se define como el número de ocurrecias relativas al total en cada categoría de los datos.
Frecuencias relativa porcentual (f%), se define como el porcentaje de individuos con esa categoría. Se obtiene multiplicando la frecuencia relativa por 100.
Frecuencias acumulada (F), se define como la suma del número de ocurrencias hasta cada nivel en cada categoría.
Frecuencias relativa acumulada (Fr), se define como la suma relativa del número de ocurrencias hasta cada nivel en cada categoría.
Frecuencias relativa acumulada porcentual (F%), se define como el porcentaje de la suma relativa del número de ocurrencias hasta cada nivel en cada categoría. Se obtiene multiplicando por 100 la frecuencia relativa acumulada.
Ejemplo 1: Distribución de frecuencia para datos cualitativos
Un terapista quiere determinar los tipos de rehabilitación requerida para sus pacientes. Para esto, obtiene una muestra aleatoria simple de 30 pacientes y registra las partes de su cuerpo que necesita rehabilitación. La información obtenida fué la siguiente:
# tamaño de los datosx =c("espalda","muñeca","codo","espalda","cadera","hombro","espalda","rodilla","espalda","cuello","espalda","espalda","hombro","rodilla","rodilla","hombro","espalda","rodilla","espalda","codo","mano","espalda","cuello","espalda","hombro","rodila","espalda","espalda","espalda","muñeca")# longitud de los datos(cantidad)n =length(x)# frecuencia de cada categoriafrec_basica =table(x)# tabla de frecuencia basicatabla =data.frame(frec_basica)# agregamos las demas columnastabla$fr =round(tabla$Freq/n, 3)tabla$fp =round(tabla$fr*100, 3)tabla$F =cumsum(tabla$Freq)tabla$Fr =round(tabla$F/n, 3)tabla$Fp =round(tabla$Fr*100, 3)#Cambiamos los nombres de la tabla names(tabla)[1] <-"Clase"names(tabla)[2] <-"f"names(tabla)[4] <-"f%"names(tabla)[5] <-"F"names(tabla)[7] <-"F%"tabla
Ejercicio 1
Le intereza estimar el tiempo (horas semanales) que dedican al estudio los estudiantes de ingenieria, menores de 24 años de la UTB.
Población
Muestra
Variable de interés, y el tipo al que pertenece
Ejemplo de posibles valores de los datos obtenidos
Determine el tipo de cada una de las siguientes varibles
Temperatura
Número de autos vendidos el año 2010
Condición de fumar
Zip code (código postal)
La Organización Gallup contactó a 1028 adolescentes entre 13 y 18 años que viven en Estados Unidos, y les pregunto si recibían o no prescripción médica para algún desorden mental, tales como depresión o ansiedad.
Determine: población, muestra, variable, tipo de variable y datos.
Ejercicio 1
La Compañía de Turismo de Puerto Rico está interesado en saber de que país son los visitantes que llegan a Puerto Rico durante los meses de verano. Para esto se contrató al personal capacitado para que tome una muestra al azar de 49 visitantes y se les preguntó su nacionalidad; los resultados fueron los siguientes: