Instrucciones generales

Este estudio de caso constituye el 60% de la calificación.

El exámen es individual y desde ese punto de vista dos exámenes no tienen porque estar iguales ni parecidos, ya que se espera creatividad y trabajo individual para la realización de los mismos.

El reporte final se debe enviar a más tardar el martes 01 de agosto de 2020 antes de las 11:59 a la cuenta de correo o al whatsapp

Reportar las cifras utilizando la cantidad adecuada de decimales, dependiendo de lo que se quiera mostrar y las necesidades del problema.

Numerar figuras y tablas http://unilearning.uow.edu.au/report/1fi.html y proporcionarles un tamaño adecuado que no distorsione la información que estas contienen.

El archivo del reporte final debe ser generado por Markdown en formato html.

La presentación, la organización, la redacción y la ortografía serán parte integral de la calificación.

El objetivo principal de este trabajo es la claridad lógica y la interpretación de los resultados. El informe no necesita ser extenso. Recuerde ser minimalista escribiendo el reporte. Se deben incluir solo aquellos gráficos y tablas (¡y valores en la tabla!) que son relevantes para la discusión.

Cualquier evidencia de plagio o copia se castigará severamentetal y como el reglamento de la Universidad Externado de Colombia lo estipula.

Dejo a mi discreción el uso de software especializado para evaluar si hay copia o plagiode otros informes o internet.Si está claro que (por ejemplo) dos grupos han trabajado juntos en una parte de un problema que vale 20 puntos, y cada respuesta habría ganado 16 puntos (si no hubiera surgido de una colaboración ilegal), entonces cada grupo recibirá 8 de los 16 puntos obtenidos colectivamente (para una puntuación totalde 8 de 20), y me reservo el derecho de imponer penalidades adicionalesa mi discreción

Exámen parcial

Considere el censo realizado por los Estados Unidos que se trabajó en clase, durante cada una de las sesiones de trabajo, para la realización de un análisis descriptivos de la variable población de habitantes por Estado.

Librerias a usar

library(tidyverse)
library(sf)
library(tigris)
library(tidycensus)
library(mapview)
library(viridis)
library(knitr)
library(leaflet)
library(stringr)
library(openintro)
options(tigris_use_cache = TRUE)

tidycensus es un paquete R que permite a los usuarios interactuar con el censo decenal de la Oficina del Censo de los EE. UU. y las API de la comunidad estadounidense de cinco años y devolver marcos de datos listos para se usados con el paquete tidyverse. para obtener una clave de acceso debe acceder a la página web https://api.census.gov/data/key_signup.html y diligenciar el formulario, a continuación dentro de la siguiente instruccion deberá difitar su clave de acceso

census_api_key("clave personal obtenida del enlace y enviada al correo registrado en dicha página")

Censo de los Estados Unidos

La Oficina del Censo de los Estados Unidos (en inglés: United States Census Bureau) forma parte del Departamento de Comercio de Estados Unidos. Es el organismo gubernamental que se encarga del censo en los Estados Unidos. Es la fuente de datos confiables sobre la economía y los habitantes de la nación, y lleva a cabo estudios demográficos tales como niveles de población y tendencias en la vivienda, y estudios económicos, como por ejemplo de productividad.

Variable a trabajar (ingreso)

census_us_county_income <- get_acs(geography = "county", variables = "B19013_001", 
                            shift_geo = TRUE, geometry = TRUE)
## Warning: The `shift_geo` argument is deprecated and will be removed in a future
## release. We recommend using `tigris::shift_geometry()` instead.

Distribución poblacional del ingreso

ggplot(data = census_us_county_income) + 
  geom_sf(aes(fill = estimate), color = NA) + 
  coord_sf(datum = NA) + 
  theme_minimal() + 
  scale_fill_viridis_c()

Muestra aleatoria

Tome una muestra aleatoria del 20% de la población para generar un interválo de confianza y realizar las pruebas de hipótesis solicitadas

sample_us_county_income <- sample_frac(tbl = census_us_county_income, size = 0.2)

Intervalos de confianza

Para la media \(\mu\)

\[ \left(\bar{x}_{size}-z_{\frac{\alpha}{2}}\sqrt{\frac{{sd^2}}{size}};\bar{x}_{size}+z_{\frac{\alpha}{2}}\sqrt{\frac{{sd^2}}{size}}\right) \]

  1. Con base en la muestra aleatoria generada calcule un intervalo de confianza para la media poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 90%

  2. Con base en la muestra aleatoria generada calcule un intervalo de confianza para la media poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 95%

  3. Con base en la muestra aleatoria generada calcule un intervalo de confianza para la media poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 99%

Para la varianza \(\sigma^2\)

\[ \left(\frac{({n}-1)\widehat{{\sigma}^{2}}}{{\chi}_{\frac{\alpha}{2}}^{2}};\frac{({n}-1)\widehat{{\sigma}^{2}}}{{\chi}_{1-\frac{\alpha}{2}}^{2}}\right) \]

  1. Con base en la muestra aleatoria generada calcule un intervalo de confianza para la varianza poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 90%

  2. Con base en la muestra aleatoria generada calcule un intervalo de confianza para la varianza poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 95%

  3. Con base en la muestra aleatoria generada calcule un intervalo de confianza para la varianza poblacional de la variable ingreso, basándose en la muestra aleatoria generada (sample_us_county_income) del 99%

Pruebas de hipótesis

Tome \(\mu_0\) = 58423 y \(\sigma_0^2\) = 270506777

Para la media

Sistema de hipótesis

Hipótesis nula

\[H_0:\mu=\mu_0\]

Hipótesis alternativa

\[H_1:\mu\neq\mu_0\]

  1. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 90% (o significancia (\(\alpha\)) del 10%)

  2. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 95% (o significancia (\(\alpha\)) del 5%)

  3. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 99% (o significancia (\(\alpha\)) del 1%)

Sistema de hipótesis

Hipótesis nula

\[H_0:\mu\geq\mu_0\]

Hipótesis alternativa

\[H_1:\mu<\mu_0\]

  1. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 90% (o significancia (\(\alpha\)) del 10%)

  2. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 95% (o significancia (\(\alpha\)) del 5%)

  3. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 99% (o significancia (\(\alpha\)) del 1%)

Sistema de hipótesis

Hipótesis nula

\[H_0:\mu\leq\mu_0\]

Hipótesis alternativa

\[H_1:\mu>\mu_0\]

  1. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 90% (o significancia (\(\alpha\)) del 10%)

  2. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 95% (o significancia (\(\alpha\)) del 5%)

  3. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 99% (o significancia (\(\alpha\)) del 1%)

Para la varianza

Sistema de hipótesis

Hipótesis nula

\[H_0:\sigma^2=\sigma^2_0\]

Hipótesis alternativa

\[H_1:\sigma^2\neq\sigma^2_0\]

  1. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 90% (o significancia (\(\alpha\)) del 10%)

  2. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 95% (o significancia (\(\alpha\)) del 5%)

  3. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 99% (o significancia (\(\alpha\)) del 1%)

Sistema de hipótesis

Hipótesis nula

\[H_0:\sigma^2\geq\sigma^2_0\]

Hipótesis alternativa

\[H_1:\sigma^2<\sigma^2_0\]

  1. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 90% (o significancia (\(\alpha\)) del 10%)

  2. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 95% (o significancia (\(\alpha\)) del 5%)

  3. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 99% (o significancia (\(\alpha\)) del 1%)

Sistema de hipótesis

Hipótesis nula

\[H_0:\sigma^2\leq\sigma^2_0\]

Hipótesis alternativa

\[H_1:\sigma^2>\sigma^2_0\]

  1. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 90% (o significancia (\(\alpha\)) del 10%)

  2. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 95% (o significancia (\(\alpha\)) del 5%)

  3. Con base en la muestra aleatoria generada pruebe el sistema de hipótesis anterior, basándose en la muestra aleatoria generada (sample_us_county_income) con un nivel de confiabilidad (\(1-\alpha\)) del 99% (o significancia (\(\alpha\)) del 1%)