Estadística para la Investigación

Día 2

Facetas

ggplot(data=mpg)+
  geom_point(mapping = aes(x=displ,y=hwy))+
  facet_wrap(~ class, nrow=3)

Facetas con 2 variables

ggplot(data=mpg)+
  geom_point(mapping = aes(x=displ,y=hwy))+
  facet_grid(drv ~ class)

Facetas

ggplot(data=mpg)+
  geom_point(mapping = aes(x=displ,y=hwy))+
  facet_grid(. ~ class)

Geoms

Geoms

Transformaciones estadísticas

ggplot(data=diamonds)+
  geom_bar(mapping = aes(x=cut))

Transformaciones estadísticas 2

?geom_bar
ggplot(data=diamonds)+
  stat_count(mapping = aes(x=cut))

Ajustes

ggplot(data=diamonds)+
  stat_count(mapping = aes(x=cut,colour=cut))

ggplot(data=diamonds)+
  stat_count(mapping = aes(x=cut,fill=cut))
ggplot(data=diamonds)+
  stat_count(mapping = aes(x=cut,fill=clarity))

Ajustes 2

ggplot(data = diamonds, mapping = aes(x = cut, fill = clarity)) + 
  geom_bar(alpha = 1/5, position = "identity")
ggplot(data = diamonds, mapping = aes(x = cut, colour = clarity)) + 
  geom_bar(fill = NA, position = "identity")

Ajustes 3

ggplot(data = diamonds) + 
  geom_bar(mapping = aes(x = cut, fill = clarity), position = "fill")

Ajustes 4

ggplot(data = diamonds) + 
  geom_bar(mapping = aes(x = cut, fill = clarity), position = "dodge")

Sistemas de Coordenadas

ggplot(data = mpg, mapping = aes(x = class, y = hwy)) + 
  geom_boxplot()

Sistemas de Coordenadas 2

ggplot(data = mpg, mapping = aes(x = class, y = hwy)) + 
  geom_boxplot() +
  coord_flip()

Gráficos de Pastel

ggplot(mpg, aes(x = factor(1), fill = drv)) +
  geom_bar()

Gráficos de Pastel 2

ggplot(mpg, aes(x = factor(1), fill = drv)) +
  geom_bar(width = 1) + 
  coord_polar(theta="y")

Cargando nuestros propios datos

Comenzando a analizar

datos <- read.csv("IN_SBAC16_MicroCodigo_247682_20170510_CSV.csv",sep=";")
str(datos)

Lista de Variables

  1. codigo_estudiante Código del estudiante
  2. amie Código de la institución
  3. nm_inst Institución
  4. tp_regm Región
  5. es_regeva Régimen de evaluación
  6. id_zona Zona de planificación
  7. id_dist Distrito
  8. id_circ Circuito
  9. id_prov Código de la provincia
  10. nm_prov Provincia
  11. id_cant Código del cantón
  12. nm_cant Cantón
  13. id_parr Código de la parroquia
  14. nm_parr Parroquia
  15. tp_finan Tipo de financiamiento
  16. tp_area Área
  17. tp_sexo Sexo
  18. isec Índice socioeconómico
  19. inev Promedio global
  20. inev_rev Promedio global en revisión
  21. inev_aj_ciclo15 Promedio global ajustado
  22. imat Matemática
  23. ilyl Lengua y Literatura
  24. icn Ciencias Naturales
  25. ies Estudios Sociales
  26. nd_imat Nivel de Logro Matemática
  27. nd_ilyl Nivel de Logro Lengua y Literatura
  28. nd_icn Nivel de Logro Ciencias Naturales
  29. nd_ies Nivel de Logro Estudios Sociales

Ejercicios

  1. Hacer un diagrama de dispersión de las notas de Matemáticas contra la Región ¿Le parece adecuado el gráfico?
  2. ¿Qué gráfico sugiere?
  3. Realice el diagrama de Cajas de las notas de Matemáticas por Región
  4. Realice el diagrama de Cajas de las notas de Matemáticas por Región y Financiamiento
  5. Realice el diagrama de barras para el nivel de logro de Lengua y Literatura
  6. Realice el diagrama de barras para el nivel de logro de Lengua y Literatura por Región