Este estudio de caso constituye el 60% de la calificación.
El exámen es individual y desde ese punto de vista dos exámenes no tienen porque estar iguales ni parecidos, ya que se espera creatividad y trabajo individual para la realización de los mismos.
El reporte final se debe enviar a más tardar el martes 01 de agosto de 2020 antes de las 11:59 a la cuenta de correo mario.saavedra@uexternado.edu.co
Reportar las cifras utilizando la cantidad adecuada de decimales, dependiendo de lo que se quiera mostrar y las necesidades del problema.
Numerar figuras y tablas http://unilearning.uow.edu.au/report/1fi.html y proporcionarles un tamaño adecuado que no distorsione la información que estas contienen.
El archivo del reporte final debe ser generado por Markdown en formato html.
La presentación, la organización, la redacción y la ortografía serán parte integral de la calificación.
El objetivo principal de este trabajo es la claridad lógica y la interpretación de los resultados. El informe no necesita ser extenso. Recuerde ser minimalista escribiendo el reporte. Se deben incluir solo aquellos gráficos y tablas (¡y valores en la tabla!) que son relevantes para la discusión.
Cualquier evidencia de plagio o copia se castigará severamentetal y como el reglamento de la Universidad Externado de Colombia lo estipula.
Dejo a mi discreción el uso de software especializado para evaluar si hay copia o plagiode otros informes o internet.Si está claro que (por ejemplo) dos grupos han trabajado juntos en una parte de un problema que vale 20 puntos, y cada respuesta habría ganado 16 puntos (si no hubiera surgido de una colaboración ilegal), entonces cada grupo recibirá 8 de los 16 puntos obtenidos colectivamente (para una puntuación totalde 8 de 20), y me reservo el derecho de imponer penalidades adicionalesa mi discreción
Considere el censo realizado por los Estados Unidos que se trabajó en clase, durante cada una de las sesiones de trabajo, para la realización de un análisis descriptivos de la variable población de habitantes por Estado.
Para lo anterior debe inicialmente cargar su clave api, que descargó con anterioridad, y cargar e instalar las siguientes librerías:
library(tidycensus)
library(tidyverse)
library(knitr)
library(leaflet)
library(stringr)
library(sf)
## To install your API key for use in future sessions, run this function with `install = TRUE`.
#census_api_key("clave personal de cada uno para enlazar con la base de datos")
Haga un listado de las variables disponibles para análisis
v10 <- load_variables(2010, "sf1", cache = TRUE)
v10 <- v10 %>%
filter(grepl("population", tolower(label), fixed = TRUE))
kable(head(v10))
name | label | concept |
---|---|---|
H011001 | Total population in occupied housing units | TOTAL POPULATION IN OCCUPIED HOUSING UNITS BY TENURE |
H011002 | Total population in occupied housing units!!Owned with a mortgage or a loan | TOTAL POPULATION IN OCCUPIED HOUSING UNITS BY TENURE |
H011003 | Total population in occupied housing units!!Owned free and clear | TOTAL POPULATION IN OCCUPIED HOUSING UNITS BY TENURE |
H011004 | Total population in occupied housing units!!Renter occupied | TOTAL POPULATION IN OCCUPIED HOUSING UNITS BY TENURE |
H011A001 | Population in occupied housing units | TOTAL POPULATION IN OCCUPIED HOUSING UNITS BY TENURE (WHITE ALONE HOUSEHOLDER) |
H011A002 | Population in occupied housing units!!Owned with a mortgage or a loan | TOTAL POPULATION IN OCCUPIED HOUSING UNITS BY TENURE (WHITE ALONE HOUSEHOLDER) |
Seleccione una variable, por ejemplo la población total en unidades de vivienda ocupadas por estado en la variable denominada H011001, y proceda a realizar su análisis descriptivo que deberá incluir tablas, gráficos y análisis de los resultados, basados en las cifras, y con la interpretación correspondiente de lo hallado
population <- get_decennial(geography = "state", variables = c(population = "H011001"),
shift_geo = TRUE, geometry = TRUE)
## Getting data from the 2010 decennial Census
## Using feature geometry obtained from the albersusa package
## Please note: Alaska and Hawaii are being shifted and are not to scale.
Muestre las primeras seis filas de la tabla de datos
kable(head(population))
GEOID | NAME | variable | value | geometry |
---|---|---|---|---|
04 | Arizona | population | 6252633 | MULTIPOLYGON (((-1111066 -8… |
05 | Arkansas | population | 2836987 | MULTIPOLYGON (((557903.1 -1… |
06 | California | population | 36434140 | MULTIPOLYGON (((-1853480 -9… |
08 | Colorado | population | 4913318 | MULTIPOLYGON (((-613452.9 -… |
09 | Connecticut | population | 3455945 | MULTIPOLYGON (((2226838 519… |
11 | District of Columbia | population | 561702 | MULTIPOLYGON (((1960720 -41… |
Escoja una paleta de colores y visualice los datos de la variable en cuestión
pal <- colorNumeric(palette = "viridis",
domain = population$value)
population %>%
st_transform(crs = "+init=epsg:4326") %>%
leaflet(width = "100%") %>%
addProviderTiles(provider = "CartoDB.Positron") %>%
addPolygons(popup = ~ str_extract(NAME, "^([^,]*)"),
stroke = FALSE,
smoothFactor = 0,
fillOpacity = 0.7,
color = ~ pal(value)) %>%
addLegend("bottomright",
pal = pal,
values = ~ value,
title = "Population",
#labFormat = labelFormat(prefix = "$"),
opacity = 1)
Proceda a realizar su análisis de los datos a continuación: