Estadística y Probabilidad

Clase 1.11
Medidas de forma

Msc. Roberto Trespalacios

Universidad Tecnológica de Bolivar

2024-01-29

Tabla de contenido

  • Medidas de forma
    • Forma de forma
    • Distribución normal
    • Coeficiente de asimetría de Fisher
    • Coeficiente de curtosis de Fisher
    • Ejemplos

Medidas de forma

  • Cuando dos distribuciones coinciden en sus medidas de posición y dispersión, no tenemos datos analíticos para ver si son distintas.

  • Una forma de compararlas es mediante su forma. Bastará con comparar la forma de sus histogramas o diagramas de barras para ver si se distribuyen o no de igual manera.

Distribución normal

Para efectuar el estudio de la forma en una sola variable, hemos de tener como referencia una distribución modelo.

Como convenio, se toma para la comparación la distribución continua: Normal con media 0 y varianza 1. Esta distribución se estudiará al final del curso.

Es conveniente estudiar la forma de la distribución; es decir, si la variable en cuestión está más o menos apuntalada Curtosis que la normal o si es más o menos simétrica Asimetría que ésta.

Coeficiente de asimetría de Fisher

El coeficiente de asimetría de Fisher se basa en la relación entre las distancias a la media y la desviación típica.

Datos no agrupados

\[ g_1 =\frac{(n-1)^{\frac{1}{2}}\sum z_i^3}{(\sum z_i^2)^{\frac{3}{2}}} \]

donde

  • \(z_i=x_i-\bar{x}\)
  • \(x_i\) es el \(i-\acute{e}simo\) dato.
  • \(\bar{x}\) es la media de los datos no agrupados.

Datos agrupados

\[ g_1 =\frac{(n-1)^{\frac{1}{2}}\sum z_i^3f_i}{(\sum z_i^2f_i)^{\frac{3}{2}}} \]

donde

  • \(z_i=x_i-\bar{x}\)
  • \(x_i\) es la marca de clase.
  • \(\bar{x}\) es la media de los datos agrupados.
  • \(f_i\) frecuencia absoluta.

Gráficos de simetría y asimetría

  • Si \(g_1 < 0\), la distribución es asimétrica negativa o a la izquierda.
  • Si \(g_1 = 0\), la distribución es simétrica.
  • Si \(g_1 > 0\), la distribución es asimétrica positiva o a la derecha.

Coeficiente de curtosis de Fisher

El concepto de curtosis o apuntamiento]{style=“color:blue;”} de Fisher de la comparación de la forma de una distribución con la forma de la distribución normal estandar.

Datos no agrupados

\[ g_2 =\frac{\sum z_i^4}{(\sum z_i^2)^2}-3 \]

Datos agrupados

\[ g_2 =\frac{\sum z_i^4f_i}{(\sum z_i^2f_i)^2}-3 \]

Basándose en la suposición de que comparamos con una distribución normal estandar, se espera que \(g_2 \approx 0\); es decir,

\[ g_2 =\frac{\sum z_i^4}{(\sum z_i^2)^2}-3 \approx 0 \]

Gráfico de curtósis

  • Si \(g_2 > 0\), la distribución es Leptocúrtica; está más apuntada que la normal. El coeficiente de curtosis es positivo.
  • Si \(g_2 = 0\), la distribución es Mesocúrtica, la distribución de los datos es la misma que la de la variable normal. El coeficiente de curtosis es cero.
  • Si \(g_2 < 0\) la distribución está menos apuntada que la normal, entonces es Platicúrtica y su coeficiente de curtosis es negativo.

Ejemplo 1

Dados los valores de 18 muestras del peso en gramos de caramelos de coco elaborados por una fábrica de dulces.

5 3 4 2 2 6 5 1 8
9 8 4 5 5 3 2 5 4

Calcule los coeficientes de asimetría y curtosis de los datos.

Solución manual

Solución en R

Code
library(moments)

# datos
x = c(5,3,4,2,2,6,5,1,8,9,8,4,5,5,3,2,5,4)

#Calcular el sesgo (asimetria)
cat("El coeficiente de asimetría es: ", skewness(x), "\n")
El coeficiente de asimetría es:  0.4588075 
Code
#Calcular la curtosis
cat("El coeficiente de curtosis es: ", kurtosis(x))
El coeficiente de curtosis es:  2.503589

Ejercicios

  1. Los datos representan el número de llamas telefónicas diarias que recibe un grup de 125 estudiantes universitarios durante el día. Los estudiantes fueron seleccionados en forma aleatoria.
\(Llamadas\) \(f\)
\([2,4)\) 28
\([4,6)\) 53
\([6,8)\) 42
\([8,10]\) 2

Calcule la simetría y la curtosis para los datos agrupados.

  1. Los siguientes datos corresponden al tiempo de hospitalización, en días, de 21 pacientes después de una cirugía de cráneo:

    8, 9, 9, 12, 13, 15, 15, 17, 21, 21, 23, 24, 26, 28, 33, 36, 37, 38, 44, 45, 78

Calcule la simetría y la curtosis para los datos no agrupados.