Objetivo

Determinar intervalos de confianza de media poblacional con desviación estándar de la población conocida y desconocida.

Descripción

Se calculan intervalos de confianza de medias poblacionales con varios ejercicios extraídos de la literatura

Fundamento teórico

La inferencia estadística, específicamente la toma y predicción de decisiones desempeña un papel muy importante en la vida de casi todas las personas.

Hay muchas formas de tomar estas decisiones o predicciones, algunas son subjetivas y otras son objetivas por naturaleza. L a pregunta es que tan buena son las decisiones y en que´argumentos se basan estas decisiones?

Aun cuando se pueda pensar que su propia capacidad de tomar decisiones es muy buena, la experiencia sugiere que éste puede no ser el caso.

Es la función del estadístico matemático dar métodos de toma de inferencia estadística son mejores y más confiables que únicamente cálculos subjetivos.(Mendenhall, Beaver, and Beaver 2010).

La inferencia estadística se encarga de apoyar el proceso de toma decisiones o predicciones acerca de parámetros. Tal vez estos parámetros de interés sean la media poblacional \(\mu\), la desviación estándar poblacional \(\sigma\) o la proporción de una población \(p\).

Para este caso en los ejercicios mostrados mas adelante, se describen estimación de las medias poblacionales.

Cabe recordar que si se trata de mediciones poblacionales estos se llaman parámetros y si se trata de mediciones muestrales estos se llaman estadísticos.

\[ población = parámetros \\ muestra = estadísticos \]

De acuerdo a (Mendenhall, Beaver, and Beaver 2010) estimación implica predecir el valor del parámetro.

Para estimar el valor de un parámetro poblacional, se puede usar datos de la muestra en la forma de un estimador. Los estimadores se determinan usando información de las observaciones muestrales y, en consecuencia, por definición son también estadísticas.

Por definición, un estimador es una regla, generalmente expresada como fórmula, que establece cómo calcular una estimación basada en información de la muestra.

Se pueden encontrar dos tipos de estimaciones

Estimaciones puntuales que significa que con base en datos muestrales, se calcula un solo número o un estimador puntual.

Estimaciones por intervalos que implica encontrar dos valores numéricos que se calculan para formar un intervalo dentro del cual se espera esté el parámetro poblacional. Los intervalos son el interés de este caso.

Ahora bien, es posible intuir que la distribución muestral de un estimador está centrada alrededor del parámetro que se trate de estimar, pero todo lo que se tiene es la estimación calculada de las \(n\) mediciones contenidas en la muestra.

¿A qué distancia del verdadero valor del parámetro estará esta estimación? ¿Qué tan diferente es el valor del estadísticos con respecto al parámetro? La distancia entre la estimación y el verdadero valor del parámetro se denomina error de estimación. (Mendenhall, Beaver, and Beaver 2010).

Se puede suponer que los tamaños muestrales son siempre grandes y que los estimadores provienen de distribuciones muestrales que pueden ser aproximadas por una distribución normal por el teorema del límite central.

La variabilidad del estimador se mide usando este error estándar y está determinado por:

\[ \frac{\sigma}{\sqrt{n}} \]

Este error estándar se incorpora y se utiliza para estimar intervalos de confianza como la media poblacional.

Ahora bien, el objetivo de la estimación por intervalo es aportar información de qué tan cerca se encuentra la estimación puntual, obtenida de la muestra, del valor del parámetro poblacional (Anderson, Sweeney, and Williams 2008).

Se identifican las fórmulas para estimar intervalos de confianza con desviación poblacional conocida y no conocida respectivamente.

Fórmula para desviación estándar de la población conocida.

\[ IC = \bar{x} \pm z \cdot \frac{S}{\sqrt{n}} \]

(lind2015?)

Fórmula para desviación estándar de la población no conocida.

\[ IC = \bar{x} \pm t \cdot \frac{S}{\sqrt{n}} \]

Se presentan ejercicios para estimar intervalos de confianza del parámetro media poblacional a partir es datos muestrales.

Desarrollo

Cargar librerías

library(visualize) # Gráficos de distribuciones
library(cowplot) # Gráficos
library(ggplot2) # Gráficos

Cargar funciones

source("https://raw.githubusercontent.com/rpizarrog/Probabilidad-y-EstadIstica-VIRTUAL-DISTANCIA/main/funciones/funciones.para.distribuciones.r")

Intervalo de confianza con desviación estándar conocida

Un científico interesado en vigilar contaminantes químicos en alimentos y, por lo tanto, la acumulación de contaminantes en la dieta humana, seleccionó una muestra aleatoria de \(n=50\) adultos hombres.

Se encontró que el promedio de ingesta diaria de productos lácteos fue de \(\bar{x} = 756\) gramos por día, con una desviación estándar de s \(s = 35\) gramos por día.

Se debe construir un intervalo de confianza de 95% para la ingesta diaria media de productos lácteos para hombres.

¿Cuál será el intervalo de confianza al 95%?

Los datos

media.m <- 756
desv.m <- 35
confianza <- 0.95
n <- 50

Intervalo de confianza

Se calcula el error estándar.

SE <- f.z.int.conf(confianza = confianza) * desv.m / sqrt(n)
SE
## [1] 9.701327

\[ 756 \pm 9.701327 \]

Se puede tener confianza al 95% en que la estimación muestral de 756 gramos está a no más de \(SE \approx 9\) gramos de la media poblacional.

Se calcula el intervalo de confianza

intervalo <- f.intervalo.confianza.z(media = media.m, desv = desv.m, confianza = confianza, n = n)
intervalo
## [1] 746.2987 765.7013

El intervalo tiene valores entre: 746.2987 y 765.7013.

Visualización de la distribución

Identificando el valor de z crítico.

z.critico <- f.z.int.conf(confianza = confianza)
z.critico
## [1] 1.959964
visualize.norm(stat = c(-z.critico, z.critico), section = "tails") +
  text(0, 0.2, paste(confianza * 100, "%", "\n", 
                     "alfa=", (1 - confianza), "\n",  "alfa / 2 = ", 
                     (1 - confianza) /  2, sep = ""),  col = "black")

## integer(0)

Intervalo de confianza con desviación estándar desconocida

Un ambientalista está realizando un estudio del oso polar, especie que se encuentra en el océano Ártico y sus alrededores. Su zona de distribución está limitada por la existencia de hielo en el mar, que usan como plataforma para cazar focas, principal sostén de los osos.

La destrucción de su hábitat en el hielo del Ártico, que se ha atribuido al calentamiento global, amenaza la supervivencia de los osos como especie; puede extinguirse antes de un siglo.

Una muestra aleatoria de \(n=50\) osos polares produjo un peso promedio de \(\bar{x}= 980\) libras con una desviación estándar de \(\sigma = 105\) libras.

¿Cuál será el intervalo de confianza al 95%?

Los datos

media.m <- 980
desv.m <- 105
confianza <- 0.95
n <- 50

Intervalo de confianza

Se calcula el error estándar.

SE <- f.t.int.conf(confianza = confianza, n = n) * desv.m / sqrt(n)
SE
## [1] 29.84067

\[ 980 \pm 29.84067 \]

Se puede tener confianza al 95% en que la estimación muestral de 980 libras está a no más de \(SE \approx 29\) libras de la media poblacional.

Se calcula el intervalo de confianza

intervalo <- f.intervalo.confianza.t(media = media.m, desv = desv.m, confianza = confianza, n = n)
intervalo
## [1]  950.1593 1009.8407

El intervalo tiene valores entre: 950.1593 y 1009.8407.

Visualización de la distribución

Identificando el valor de t crítico.

t.critico <- f.t.int.conf(confianza = confianza, n = n)
t.critico
## [1] 2.009575
visualize.t(stat = c(-t.critico, t.critico),  df = n-1, section = "tails") +
  text(0, 0.2, paste(confianza * 100, "%", "\n", 
                     "alfa=", (1 - confianza), "\n",  "alfa / 2 = ", 
                     (1 - confianza) /  2, sep = ""),  col = "black")

## integer(0)

Interpretación

Como lo menciona Mendenhall, William, Robert J. Beaver, and Barbara M. Beaver (2010), siempre se debe buscar una explicación en el texto del informe que diga si se está utilizando la desviación estándar o el error estándar en las estimaciones.

Para estos ejercicios se utilizó el error estándar \(SE\) para estimar los intervalos de confianza tanto para si se conoce la desviación estándar de la población como si no es conocida.
Para determinar y calcular los intervalos de confianza se utilizaron funciones previamente programadas que se encuentran en el enlace provisto para ello usando la función source().

Bibliografía

Anderson, David R., Dennis J. Sweeney, and Thomas A. Williams. 2008. Estadística Para Administración y Economía. 10th ed. Australia Brasil Corea España Estados Unidos Japón México Reino Unido Singapur: Cengage Learning,.
Mendenhall, William, Robert J. Beaver, and Barbara M. Beaver. 2010. Introducción a La Probabilidad y Estadística. 13th ed. Cengage Learning Editores, S.A. de C.V.,.