Estadística y Probabilidad

Clase 1.3
Distribuciones de frecuencia y gráficas

Msc. Roberto Trespalacios

Universidad Tecnológica de Bolivar

2024-01-29

Tabla de contenido

  • Breve historia de la estadística
  • Importancia de la estadística en las ciencias
  • La Estadística y sus partes
  • Conceptos básicos de la estadística
    • Población
    • Muestra
    • Individuo
    • Caracteres o variables
    • Tipos de variables

Gráfica Barras

Usan barras(columnas) horizontales o verticales de longitud proporcional a la frecuencia en cada categoría. Se asume que la base de cada barra tiene un ancho de 1 unidad.

Ejemplo 1

Se tomó una muestra de 807 empleados de todos los hospitales de Miami, de los cuales se ha obtenido la siguiente tabla.

Profesión Frecuencia Porcentaje
Médico 247
Enfermero 234
Técnico 92
Administrativo 192
Directivo 42
Total 807

Gráfico de barrras

Profesion = c("Médico","Enfermero","Técnico", "Administrativo","Directivo")
Frecuencia = c(247,234,92,192,42)
Porcentaje = (Frecuencia/sum(Frecuencia))*100

datos <- data.frame(Profesion, Frecuencia, Porcentaje)

# barplot basico
library(ggplot2)

ggplot(data = datos, aes(x = Profesion, y = Frecuencia, fill = Profesion)) +
  geom_bar(stat="identity") +
  labs(title = "Gráfico de barras", 
       x = "Profesión", 
       y = "Frecuencia absoluta") +
  theme(plot.title = element_text(hjust = 0.5), legend.position = "none")

Gráfico circular en R

library(ggplot2)

# etiquetas con porcentajes
etiqueta = paste(round(datos$Porcentaje,2), "%", sep = "")

# grafico circular
ggplot(datos, aes(x = "", y = Porcentaje, fill = Profesion)) +
  geom_col(color = "black") +
  geom_text(aes(label = etiqueta), position = position_stack(vjust = 0.5)) +
  coord_polar(theta = "y") +
  theme_void()

Diagrama de tallo y hoja (stem and leaf)

Se usa para datos cuantitativos. La idea es considerar los primeros dı́gitos del dato como una rama del tallo (“stem”) y el último dı́gito como una hoja (“leaf”) de dicha rama. Las ramas son ordenadas en forma creciente.

  • Ejemplo: Los siguientes datos representan los pesos de 15 adultos varones.

165, 195, 178, 200, 185, 183, 169, 191, 152, 197, 180, 208, 175, 179, 189

Hacer la gráfica de tallos y hojas (Stem and Leaf).

  1. Ordenemos los datos 152, 165, 169 175 178,179, 180,183, 185, 189, 191, 195,197, 200, 208

  2. Las ramas la forman los primeros dos dı́gitos de los datos, y las hojas serán dadas por los últimos dı́gitos de los datos. Entonces el diagrama de tallo y hoja queda de la siguiente manera.

Usando R

x = c(165,195,178,200,185,183,169,
      191,152,197,180,208,175,179,189)

stem(x,scale=2)