install.packages("tidyverse")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.5.1     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     ✔ tidyr     1.3.1
## ✔ purrr     1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
install.packages("sf")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(sf)
## Linking to GEOS 3.8.0, GDAL 3.0.4, PROJ 6.3.1; sf_use_s2() is TRUE
install.packages("tigris")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(tigris)
## To enable caching of data, set `options(tigris_use_cache = TRUE)`
## in your R script or .Rprofile.
install.packages("tidycensus")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(tidycensus)
install.packages("mapview")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(mapview)
install.packages("knitr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(knitr)
install.packages("leaflet")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(leaflet)
install.packages("stringr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(stringr)
install.packages("openintro")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(openintro)
## Loading required package: airports
## Loading required package: cherryblossom
## Loading required package: usdata
census_api_key("6e05c672a7c94bb95d26111726f0baf4368bfb46")
## To install your API key for use in future sessions, run this function with `install = TRUE`.
install.packages("ggplot2")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(ggplot2)
install.packages("dplyr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(dplyr)
#install.packages("mosaic") 
library(mosaic) 
## Registered S3 method overwritten by 'mosaic':
##   method                           from   
##   fortify.SpatialPolygonsDataFrame ggplot2
## 
## The 'mosaic' package masks several functions from core packages in order to add 
## additional features.  The original behavior of these functions should not be affected by this.
## 
## Attaching package: 'mosaic'
## The following object is masked from 'package:Matrix':
## 
##     mean
## The following object is masked from 'package:openintro':
## 
##     dotPlot
## The following objects are masked from 'package:dplyr':
## 
##     count, do, tally
## The following object is masked from 'package:purrr':
## 
##     cross
## The following object is masked from 'package:ggplot2':
## 
##     stat
## The following objects are masked from 'package:stats':
## 
##     binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
##     quantile, sd, t.test, var
## The following objects are masked from 'package:base':
## 
##     max, mean, min, prod, range, sample, sum

##Censo de los Estados Unidos

La Oficina del Censo de los Estados Unidos (en inglés: United States Census Bureau) forma parte del Departamento de Comercio de Estados Unidos. Es el organismo gubernamental que se encarga del censo en los Estados Unidos. Es la fuente de datos confiables sobre la economía y los habitantes de la nación, y lleva a cabo estudios demográficos tales como niveles de población y tendencias en la vivienda, y estudios económicos, como por ejemplo de productividad.

##Variable a trabajar (ingreso)

census_us_county_income <- get_acs(geography = "county", variables = "B19013_001", shift_geo = TRUE, geometry = TRUE)
## Getting data from the 2018-2022 5-year ACS
## Warning: The `shift_geo` argument is deprecated and will be removed in a future
## release. We recommend using `tigris::shift_geometry()` instead.
## Using feature geometry obtained from the albersusa package
## Please note: Alaska and Hawaii are being shifted and are not to scale.
## old-style crs object detected; please recreate object with a recent sf::st_crs()

##Distribución poblacional del ingreso

ggplot(data = census_us_county_income) + 
  geom_sf(aes(fill = estimate), color = NA) + 
  coord_sf(datum = NA) + 
  theme_minimal() + 
  scale_fill_viridis_c()

##Muestra aleatoria Tome una muestra aleatoria del 20% de la población para generar un interválo de confianza a los niveles de confiabilidad 1−α y significancia α solicitados

sample_us_county_income <- census_us_county_income[1:10, ]

##Intervalos de confianza Para la media μ con varianza conocida (σ2 =281.357.623 dolares2 )

\[\left(\bar{x}_{n}-z_{\frac{\alpha}{2}}\sqrt{\frac{{\sigma^2}}{n}};\bar{x}_{n}+z_{\frac{\alpha}{2}}\sqrt{\frac{{\sigma^2}}{n}}\right)\] 1. Con base en la muestra aleatoria generada calcule un intervalo de confianza para la media poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 90%

Media <-(mean(sample_us_county_income$estimate)) 
Media 
## [1] 59003.4

##Desviacion

Desviación <- round(281357623) 
Desviación 
## [1] 281357623

##Calculo de tamaño

size <- length(sample_us_county_income$estimate) 
size 
## [1] 10

##Calculo del error estándar

ErrorEstandar_SE <- round(Desviación/sqrt(size)) 
ErrorEstandar_SE 
## [1] 88973093

##Calculo del cuantíl de la distribución normal estánda

nivel.conf <- 0.9; z_alfa_0_5 <- qnorm((1 + nivel.conf)/2) 
nivel.conf 
## [1] 0.9

Calculo del error de estimación

ErrorEstimacion <- round(z_alfa_0_5 * ErrorEstandar_SE) 
ErrorEstimacion
## [1] 146347715

##Calculo del límite inferior del intervalo de confianza

Int.inf <- Media - ErrorEstimacion 
Int.inf 
## [1] -146288712

##Calculo del límite inferior del intervalo de confianza

Int.sup <- Media + ErrorEstimacion 
Int.sup
## [1] 146406718

##Calculo del intervalo de confianza

Media + c(-ErrorEstimacion, +ErrorEstimacion)
## [1] -146288712  146406718

##Graficación del intervalo de confianza

mean(sample_us_county_income$estimate) + cdist( "norm", .90) * 0.5 / 
sqrt(size) 

## [1] 59003.14 59003.66

##Conclusión

Este cálculo del intervalo de confianza nos permite hacer una estimación más segura sobre el ingreso promedio en los condados de EE. UU. Aunque no podemos saber con certeza cuál es la verdadera media, el intervalo nos da un rango razonable dentro del cual probablemente se encuentre. Es como tener una idea clara de un valor, pero con la seguridad de que está dentro de ciertos límites que nos dan confianza en nuestras decisiones.

Al usar una muestra representativa y tomar en cuenta la desviación estándar, podemos realizar predicciones con un nivel de certeza bastante alto. Este tipo de herramientas es valiosa cuando necesitamos tomar decisiones informadas basadas en datos, sobre todo en contextos como la economía o la administración pública, donde se gestionan recursos que afectan a muchas personas.

Aunque siempre existe un margen de incertidumbre, este tipo de análisis nos ayuda a reducir ese margen y a actuar con mayor confianza, basándonos en la evidencia disponible.

2.Con base en la muestra aleatoria generada calcule un intervalo de confianza para la media poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 95%

Media <-(mean(sample_us_county_income$estimate)) 
Media 
## [1] 59003.4

##Desviacion

Desviación <- round(281357623) 
Desviación 
## [1] 281357623

##Calculo de tamaño

size <- length(sample_us_county_income$estimate) 
size 
## [1] 10

##Calculo del error estándar

ErrorEstandar_SE <- round(Desviación/sqrt(size)) 
ErrorEstandar_SE 
## [1] 88973093

##Calculo del cuantíl de la distribución normal estánda

nivel.conf <- 0.95; z_alfa_2_5 <- qnorm((1 + nivel.conf)/2); z_alfa_2_5 
## [1] 1.959964

##Calculo del error de estimación

ErrorEstimacion <- round(z_alfa_2_5 * ErrorEstandar_SE) 
ErrorEstimacion 
## [1] 174384058

##Calculo del límite inferior del intervalo de confianza

Int.inf <- Media - ErrorEstimacion 
Int.inf 
## [1] -174325055

##Calculo del límite inferior del intervalo de confianza

Int.sup <- Media + ErrorEstimacion 
Int.sup 
## [1] 174443061

##Calculo del intervalo de confianza

Media + c(-ErrorEstimacion, +ErrorEstimacion)
## [1] -174325055  174443061

##Graficación del intervalo de confianza

mean(sample_us_county_income$estimate) + cdist( "norm", .95) * 2.5 / 
sqrt(size)

## [1] 59001.85 59004.95

##Conclusion

El cálculo del intervalo de confianza nos da una forma de estimar el ingreso promedio de los condados en Estados Unidos basándonos en una muestra de datos. Al hacerlo con un nivel de confianza del 95%, estamos diciendo que estamos bastante seguros de que la verdadera media poblacional está dentro de este rango. Esto significa que si repitiéramos el proceso muchas veces, el 95% de las veces el intervalo que calculamos incluiría la media real.

Este tipo de análisis es muy útil porque nos permite tomar decisiones basadas en datos sin tener que conocer todos los valores de la población. Aunque no podemos estar 100% seguros de la media exacta, el intervalo nos da una estimación confiable. En resumen, es una herramienta poderosa para reducir la incertidumbre y tomar decisiones informadas en situaciones donde no tenemos acceso a toda la información, como ocurre a menudo en estudios estadísticos.

3.Con base en la muestra aleatoria generada calcule un intervalo de confianza para la media poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 99%

Media <-(mean(sample_us_county_income$estimate)) 
Media
## [1] 59003.4

##Desviacion

Desviación <- round(281357623) 
Desviación 
## [1] 281357623

##Calculo de tamaño

size <- length(sample_us_county_income$estimate) 
size 
## [1] 10

##Calculo del error estándar

ErrorEstandar_SE <- round(Desviación/sqrt(size)) 
ErrorEstandar_SE 
## [1] 88973093

##Calculo del cuantíl de la distribución normal estánda

nivel.conf <- 0.99; z_alfa_0_05 <- qnorm((1 + nivel.conf)/2); z_alfa_0_05
## [1] 2.575829

##Calculo del error de estimación

ErrorEstimacion <- round(z_alfa_0_05 * ErrorEstandar_SE) 
ErrorEstimacion 
## [1] 229179500

##Calculo del límite inferior del intervalo de confianza

Int.inf <- Media - ErrorEstimacion 
Int.inf
## [1] -229120497

##Calculo del límite inferior del intervalo de confianza

Int.sup <- Media + ErrorEstimacion 
Int.sup 
## [1] 229238503

##Calculo del intervalo de confianza

Media + c(-ErrorEstimacion, +ErrorEstimacion) 
## [1] -229120497  229238503

##Graficación del intervalo de confianza

mean(sample_us_county_income$estimate) + cdist( "norm", .99) * 0.05 / 
sqrt(size) 

## [1] 59003.36 59003.44

##Conclusión

A través del cálculo de los intervalos de confianza, podemos obtener rangos dentro de los cuales creemos que se encuentra el valor verdadero del ingreso promedio de los condados de Estados Unidos al aumentar el nivel de confianza del 90% al 99%, el intervalo se amplía, reflejando una mayor certeza sobre el rango en el que se ubica la media poblacional.

Estos intervalos son herramientas muy útiles en la toma de decisiones, especialmente cuando no tenemos acceso a toda la población y trabajamos con muestras. Cada intervalo refleja el nivel de certeza con el que estimamos el valor promedio, y nos permite hacer predicciones informadas basadas en datos.

##Para la media μ con varianza desconocida

\[\left(\bar{x}_{n}-z_{\frac{\alpha}{2}}\sqrt{\frac{{s^2}}{n}};\bar{x}_{n}+z_{\frac{\alpha}{2}}\sqrt{\frac{{s^2}}{n}}\right)\] 4. Con base en la muestra aleatoria generada calcule un intervalo de confianza para la media poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 90%

Media <- round(mean(sample_us_county_income$estimate)) 
Media 
## [1] 59003

##Desviación estandar

Desviación <- round(sd(sample_us_county_income$estimate)) 
Desviación
## [1] 12718

##Tamaño Muestral

size <- length(sample_us_county_income$estimate) 
size 
## [1] 10

##Error Estandar

ErrorEstandar_SE <- round(Desviación/sqrt(size)) 
ErrorEstandar_SE
## [1] 4022

##Cuantíl de la distribución normal estándar

nivel.conf <- 0.90; t_alfa_0_01 <- qt((1 + nivel.conf)/2, df = size - 1) 
nivel.conf 
## [1] 0.9

##Error de estimación

ErrorEstimacion <- round(t_alfa_0_01 * ErrorEstandar_SE) 
ErrorEstimacion
## [1] 7373

##Límite inferior del intervalo de confianza

Int.inf <- Media - ErrorEstimacion 
Int.inf 
## [1] 51630

##Límite inferior del intervalo de confianza

Int.sup <- Media + ErrorEstimacion 
Int.sup 
## [1] 66376

##Intervalo de confianza

Media + c(-ErrorEstimacion, +ErrorEstimacion)
## [1] 51630 66376

##Graficación del intervalo de confianza

mean(sample_us_county_income$estimate) + cdist("t", p = 0.90, df=size-1) 

## [1] 59001.57 59005.23
sd(sample_us_county_income$estimate) / sqrt(size)
## [1] 4021.71

##Conclusión Este proceso nos permite estimar el ingreso promedio de los condados de EE. UU. con un 90% de certeza, basándonos en una muestra aleatoria. El intervalo de confianza resultante nos dice que estamos 90% seguros de que la verdadera media poblacional de los ingresos se encuentra dentro de este rango. Esto es útil para tomar decisiones informadas sobre políticas, inversiones, o estudios en contextos en los que no se tiene acceso a toda la población, como es el caso en este ejemplo.

  1. Con base en la muestra aleatoria generada calcule un intervalo de confianza para la media poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 95%
Media <- round(mean(sample_us_county_income$estimate)) 
Media 
## [1] 59003

##Desviación estandar

Desviación <- round(sd(sample_us_county_income$estimate)) 
Desviación 
## [1] 12718

##Tamaño Muestral

size <- length(sample_us_county_income$estimate) 
size 
## [1] 10

##Error Estandar

ErrorEstandar_SE <- round(Desviación/sqrt(size)) 
ErrorEstandar_SE
## [1] 4022

##Cuantíl de la distribución normal estándar

nivel.conf <- 0.95; t_alfa_0_5 <- qt((1 + nivel.conf)/2, df = size - 1) 
nivel.conf 
## [1] 0.95

##Error de estimación

ErrorEstimacion <- round(t_alfa_0_5 * ErrorEstandar_SE) 
ErrorEstimacion 
## [1] 9098

##Límite inferior del intervalo de confianza

Int.inf <- Media - ErrorEstimacion 
Int.inf
## [1] 49905

##Límite inferior del intervalo de confianza

Int.sup <- Media + ErrorEstimacion 
Int.sup 
## [1] 68101

##Intervalo de confianza

Media + c(-ErrorEstimacion, +ErrorEstimacion) 
## [1] 49905 68101

##Graficación del intervalo de confianza

mean(sample_us_county_income$estimate) + cdist("t", p = 0.95, df=size-1) 

## [1] 59001.14 59005.66
sd(sample_us_county_income$estimate) / sqrt(size)
## [1] 4021.71

##Conclusión

Con base en los cálculos realizados, el intervalo de confianza para la media poblacional de los ingresos con un 95% de certeza nos proporciona un rango en el cual se espera que se encuentre el valor real de la media de los ingresos de los condados de EE. UU. La idea es que, con un 95% de confianza, podemos afirmar que la media poblacional de los ingresos está dentro de este intervalo, lo que proporciona una estimación sólida y confiable para la toma de decisiones o análisis adicionales.

6.Con base en la muestra aleatoria generada calcule un intervalo de confianza para la media poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 99%

Media <- round(mean(sample_us_county_income$estimate)) 
Media 
## [1] 59003

##Desviación estandar

Desviación <- round(sd(sample_us_county_income$estimate)) 
Desviación
## [1] 12718

##Tamaño Muestral

size <- length(sample_us_county_income$estimate) 
size 
## [1] 10

##Error Estandar

ErrorEstandar_SE <- round(Desviación/sqrt(size)) 
ErrorEstandar_SE 
## [1] 4022

##Cuantíl de la distribución normal estándar

nivel.conf <- 0.99; t_alfa_0_01 <- qt((1 + nivel.conf)/2, df = size - 1) 
nivel.conf 
## [1] 0.99

##Error de estimación

ErrorEstimacion <- round(t_alfa_0_01 * ErrorEstandar_SE) 
ErrorEstimacion 
## [1] 13071

##Límite inferior del intervalo de confianza

Int.inf <- Media - ErrorEstimacion 
Int.inf
## [1] 45932

##Límite inferior del intervalo de confianza

Int.sup <- Media + ErrorEstimacion 
Int.sup 
## [1] 72074

##Intervalo de confianza

Media + c(-ErrorEstimacion, +ErrorEstimacion) 
## [1] 45932 72074

##Graficación del intervalo de confianza

mean(sample_us_county_income$estimate) + cdist("t", p = 0.99, df=size-1) 

## [1] 59000.15 59006.65
sd(sample_us_county_income$estimate) / sqrt(size) 
## [1] 4021.71

##Conclusión

Al calcular el intervalo de confianza con un nivel de confianza del 99%, hemos obtenido un rango en el que podemos estar casi seguros de que se encuentra la media de los ingresos de la población. Esto significa que, aunque no podemos conocer la media exacta, sabemos que con una probabilidad del 99% esta media está dentro de los límites que hemos calculado. Es como hacer una suposición muy informada, respaldada por los datos de la muestra, para entender mejor la realidad económica de una población más grande. Este tipo de análisis nos ayuda a tomar decisiones más acertadas, ya sea en políticas públicas, estudios económicos o cualquier área que necesite conocer tendencias sin tener que recopilar toda la información de una población completa.

Para la varianza \(\sigma^2\)

\[\left(\frac{({n}-1)s^2}{{\chi}_{n-1,1-\frac{\alpha}{2}}^{2}};\frac{({n}-1)s^2}{{\chi}_{n-1,\frac{\alpha}{2}}^{2}}\right)\]

  1. Con base en la muestra aleatoria generada calcule un intervalo de confianza para la varianza poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 90%
Media <- round(mean(sample_us_county_income$estimate))
Media
## [1] 59003

##desviación estándar de la muestra

Desviación <- round(sd(sample_us_county_income$estimate))
Desviación
## [1] 12718

##varianza muestral

Varianza_muestral <- round(Desviación^2)
Varianza_muestral
## [1] 161747524

##tamaño de la muestra

size <- length(sample_us_county_income$estimate)
size
## [1] 10

##valores críticos de la distribución chi-cuadrado

nivel.conf <- 0.90
alfa <- 1 - nivel.conf
df <- size - 1  # Grados de libertad

chi2_inferior <- qchisq(alfa / 2, df)
chi2_superior <- qchisq(1 - alfa / 2, df)

chi2_inferior
## [1] 3.325113
chi2_superior
## [1] 16.91898

##intervalo de confianza para la varianza poblacional

Int_inf_varianza <- (size - 1) * Varianza_muestral / chi2_superior
Int_sup_varianza <- (size - 1) * Varianza_muestral / chi2_inferior

Int_inf_varianza
## [1] 86041116
Int_sup_varianza
## [1] 437797989

#Graficar el intervalo de confianza de la varianza

mean(sample_us_county_income$estimate) + cdist("t", p = 0.90, df=size-1) 

## [1] 59001.57 59005.23
sd(sample_us_county_income$estimate) / sqrt(size) 
## [1] 4021.71

##Conclusión Con el cálculo del intervalo de confianza para la varianza poblacional, basado en nuestra muestra de ingresos, podemos obtener una idea más clara sobre la variabilidad de los ingresos en la población general. Al hacerlo con un nivel de confianza del 90%, logramos estimar el rango dentro del cual esperamos que se encuentre la verdadera varianza de la población.

Esto nos ayuda a comprender mejor cuán dispersos o concentrados están los ingresos en una población más grande, usando la información de nuestra muestra. Lo interesante de este intervalo de confianza es que, con un 90% de certeza, podemos afirmar que la verdadera varianza de los ingresos estará dentro del rango que hemos calculado.

Esto no solo nos da un valor numérico, sino que también nos brinda un grado de certeza sobre los resultados. Es como decir que, si repitiésemos el proceso muchas veces, en 9 de cada 10 intentos el valor real de la varianza estaría dentro de este intervalo. En resumen, el cálculo realizado nos da una herramienta más precisa para hacer afirmaciones sobre la variabilidad de los ingresos en una población más grande, basándonos en la muestra que tenemos

  1. Con base en la muestra aleatoria generada calcule un intervalo de confianza para la varianza poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 95%

##Calcular la varianza muestral

varianza_muestral <- var(sample_us_county_income$estimate)
varianza_muestral
## [1] 161741514

##tamaño de la muestra

n <- length(sample_us_county_income$estimate)
n
## [1] 10

#grados de libertad

df <- n - 1
df
## [1] 9

##valores críticos Chi-cuadrado para el intervalo de confianza

chi2_inf <- qchisq(alfa / 2, df)    # Valor crítico para el límite inferior
chi2_sup <- qchisq(1 - alfa / 2, df) # Valor crítico para el límite superior

chi2_inf
## [1] 3.325113
chi2_sup
## [1] 16.91898

##límites del intervalo de confianza para la varianza

limite_inferior <- (df * varianza_muestral) / chi2_sup
limite_superior <- (df * varianza_muestral) / chi2_inf

limite_inferior
## [1] 86037919
limite_superior
## [1] 437781721

##intervalo de confianza para la varianza

intervalo_varianza <- c(limite_inferior, limite_superior)
intervalo_varianza
## [1]  86037919 437781721
mean(sample_us_county_income$estimate) + cdist("t", p = 0.95, df=size-1) 

## [1] 59001.14 59005.66
sd(sample_us_county_income$estimate) / sqrt(size) 
## [1] 4021.71

##Conclusión Al calcular el intervalo de confianza para la varianza poblacional de la variable de ingreso, basándonos en la muestra aleatoria generada, hemos obtenido un rango dentro del cual, con un 95% de confianza, podemos estimar que se encuentra la verdadera varianza de los ingresos a nivel poblacional. Este intervalo nos da una idea más clara de la variabilidad o dispersión de los ingresos en la población de interés. Un intervalo más estrecho indicaría que los ingresos son relativamente consistentes, mientras que uno más amplio reflejaría una mayor variabilidad. Estos resultados son cruciales para los análisis económicos o de políticas, ya que permiten entender con mayor precisión cómo los ingresos se distribuyen en diferentes regiones o grupos. En resumen, el intervalo de confianza no solo nos ofrece una estimación, sino que también nos da una medida de certeza sobre esa estimación, ayudándonos a tomar decisiones más informadas.

  1. Con base en la muestra aleatoria generada calcule un intervalo de confianza para la varianza poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 99%
Media <- round(mean(sample_us_county_income$estimate))
Media
## [1] 59003

##Desviación estándar

Desviación <- round(sd(sample_us_county_income$estimate))
Desviación
## [1] 12718

##varianza muestral

Varianza_muestral <- round(Desviación^2)
Varianza_muestral
## [1] 161747524

##Tamaño de la muestra:

size <- length(sample_us_county_income$estimate)
size
## [1] 10

##Valores críticos de la distribución chi-cuadrado para un nivel de confianza del 99%

nivel.conf <- 0.99
alfa <- 1 - nivel.conf
df <- size - 1  # Grados de libertad

chi2_inferior <- qchisq(alfa / 2, df)
chi2_superior <- qchisq(1 - alfa / 2, df)

chi2_inferior
## [1] 1.734933
chi2_superior
## [1] 23.58935

##intervalo de confianza para la varianza poblacional

Int_inf_varianza <- (size - 1) * Varianza_muestral / chi2_superior
Int_sup_varianza <- (size - 1) * Varianza_muestral / chi2_inferior

Int_inf_varianza
## [1] 61711224
Int_sup_varianza
## [1] 839068596

##Graficar el intervalo de confianza de la varianza

mean(sample_us_county_income$estimate) + cdist("t", p = 0.99, df=size-1) 

## [1] 59000.15 59006.65
sd(sample_us_county_income$estimate) / sqrt(size)
## [1] 4021.71

##Conclusión Con el cálculo de este intervalo de confianza para la varianza poblacional, ahora podemos hacer afirmaciones más seguras sobre cómo se dispersan los ingresos en la población total. Con un 99% de confianza, podemos decir que la verdadera varianza de los ingresos se encuentra dentro del rango que hemos calculado. Esto significa que si tomáramos muchas muestras similares de la misma población, en 99 de cada 100 veces, la varianza real estaría dentro de este intervalo. Esto nos da una visión más completa de la distribución de los ingresos y nos ayuda a comprender mejor la dispersión de esta variable en la población general.