Estadística y Probabilidad

Clase 1.1
Distribuciones de frecuencia

Msc. Roberto Trespalacios

Universidad Tecnológica de Bolivar

2024-01-29

Tabla de contenido

  • Distribuciones de frecuencia
    • Distribuciones de frecuencia para datos cualitativos
    • Tablas de distribución de frecuencia
    • Tablas de distribución de frecuencia en R

Distribuciones de frecuencia

En estadística, se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente incluye que indican el número de observaciones en cada categoría.

  • Proporciona un valor añadido a la agrupación de datos.
  • Presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase.
  • Pueden representarse por medio de tablas, gráficos o funciones.

Tablas de distribución de frecuencia

Definiciones

  • Frecuencias absolutas (f), se define como el número de ocurrecias totales en cada categoría en los datos.
  • Frecuencias relativa (fr), se define como el número de ocurrecias relativas al total en cada categoría de los datos.
  • Frecuencias relativa porcentual (f%), se define como el porcentaje de individuos con esa categoría. Se obtiene multiplicando la frecuencia relativa por 100.
  • Frecuencias acumulada (F), se define como la suma del número de ocurrencias hasta cada nivel en cada categoría.
  • Frecuencias relativa acumulada (Fr), se define como la suma relativa del número de ocurrencias hasta cada nivel en cada categoría.
  • Frecuencias relativa acumulada porcentual (F%), se define como el porcentaje de la suma relativa del número de ocurrencias hasta cada nivel en cada categoría. Se obtiene multiplicando por 100 la frecuencia relativa acumulada.

Ejemplo 1: Distribución de frecuencia para datos cualitativos

Un terapista quiere determinar los tipos de rehabilitación requerida para sus pacientes. Para esto, obtiene una muestra aleatoria simple de 30 pacientes y registra las partes de su cuerpo que necesita rehabilitación. La información obtenida fué la siguiente:

“espalda”, “muñeca”, “codo”, “espalda”, “cadera”, “hombro”, “espalda”, “rodilla”, “espalda”, “cuello”, “espalda”, “espalda”, “hombro”, “rodilla”, “rodilla”, “hombro”, “espalda”, “rodilla”, “espalda”, “codo”, “mano”, “espalda”, “cuello”, “espalda”, “hombro”, “rodila”, “espalda”, “espalda”, “espalda”, “muñeca”

  1. Construya la tabla de frecuencias.
  2. Interprete la tabla.

Tabla de distribución de frecuencia del ejemplo 1

Categorias f fr f% F Fr F%
Espalda 13 \(\frac{13}{30}=0.433\) \(0.433\times100=43.3\%\)
Muñeca 2 \(\frac{2}{30}=0.067\) \(0.067\times100=6.7\%\)
Codo
Cadera
Cuello
Hombro
Rodilla
Mano
Total 30 1

Tabla en R

# tamaño de los datos

x = c("espalda","muñeca","codo","espalda","cadera","hombro","espalda","rodilla","espalda","cuello",
"espalda","espalda","hombro","rodilla","rodilla","hombro","espalda","rodilla","espalda","codo",
"mano","espalda","cuello","espalda","hombro","rodila","espalda","espalda","espalda","muñeca")

# longitud de los datos(cantidad)
n = length(x)

# frecuencia de cada categoria
frec_basica = table(x)

# tabla de frecuencia basica
tabla = data.frame(frec_basica)

# agregamos las demas columnas
tabla$fr = round(tabla$Freq/n, 3)
tabla$fp = round(tabla$fr*100, 3)
tabla$F = cumsum(tabla$Freq)
tabla$Fr = round(tabla$F/n, 3)
tabla$Fp = round(tabla$Fr*100, 3)

#Cambiamos los nombres de la tabla 
names(tabla)[1] <- "Clase"
names(tabla)[2] <- "f"
names(tabla)[4] <- "f%"
names(tabla)[5] <- "F"
names(tabla)[7] <- "F%"

tabla

Ejercicio 1

  1. Le intereza estimar el tiempo (horas semanales) que dedican al estudio los estudiantes de ingenieria, menores de 24 años de la UTB.
    • Población
    • Muestra
    • Variable de interés, y el tipo al que pertenece
    • Ejemplo de posibles valores de los datos obtenidos
  2. Determine el tipo de cada una de las siguientes varibles
    • Temperatura
    • Número de autos vendidos el año 2010
    • Condición de fumar
    • Zip code (código postal)
  3. La Organización Gallup contactó a 1028 adolescentes entre 13 y 18 años que viven en Estados Unidos, y les pregunto si recibían o no prescripción médica para algún desorden mental, tales como depresión o ansiedad.
    • Determine: población, muestra, variable, tipo de variable y datos.

Ejercicio 1

  1. La Compañía de Turismo de Puerto Rico está interesado en saber de que país son los visitantes que llegan a Puerto Rico durante los meses de verano. Para esto se contrató al personal capacitado para que tome una muestra al azar de 49 visitantes y se les preguntó su nacionalidad; los resultados fueron los siguientes:

“EEUU”, “EEUU”, “EEUU”, “EEUU”, “España”, “España”, “España”, “España”, “España”, “EEUU”, “EEUU”, “EEUU”, “EEUU”, “EEUU”, “España”, “España”, “España”, “Venezuela”, “España”, “EEUU”, “EEUU”, “Venezuela”, “Venezuela”, “República Dominicana”, “República Dominicana”, “República Dominicana”, “España”, “España”, “España”, “España”, “EEUU”, “EEUU”, “EEUU”, “EEUU”, “EEUU”, “EEUU”, “EEUU”, “España”, “España”, “EEUU”, “EEUU”, “EEUU”, “Venezuela”, “España”, “España”, “Venezuela”, “Venezuela”, “Venezuela”, “Venezuela”

  1. Construya la tabla de frecuencia(f, fr, f%, F, Fr, F%) para los datos del ejercicio 4.
  2. Construya la tabla de frecuencia usando R.