# A tibble: 6 × 6
semester course_id faculty_id dept enrollment level
<dbl> <dbl> <dbl> <chr> <dbl> <chr>
1 20212202 10605 1772 Physics 7 UG
2 20212202 10605 1772 Physics 32 GR
3 20212202 11426 1820 Political Science 8 UG
4 20212202 12048 1914 English 24 UG
5 20212202 13269 1095 Sociology 48 UG
6 20212202 13517 1086 Music 17 UG
mean(enrollment)
Error: objeto 'enrollment' no encontrado
Accediendo a una variable
Enfoque 1: Con attach():
attach(courses)mean(enrollment)
[1] 28.75962
No recomendable. ¿Qué pasaría si tuviera otro conjunto de datos con el que está trabajando al mismo tiempo llamado que también tuviera una variable llamada enrollment?
Las funciones tidyverse toman un argumento data que les permite localizar cálculos dentro del marco de datos especificado
no enturbia el concepto de lo que hay en el entorno actual: siempre se accede a las variables desde dentro de un marco de datos sin el uso de una función adicional (como with()) o comillas, nunca como un vector
Funciones importantes
filter mantiene o elimina filas (observaciones)
select mantiene o elimina columnas (variables)
arrange ordena el conjunto de datos por cierta variable(s)
count calcula frecuencias para cierta variable(s)
mutate crea nuevas mariables
group_by/summarize agrega datos (tablas pivote!)
str_* prefijo de funciones para trabajar con texto
ggplot2 es el paquete de visualización de datos que se carga con tidyverse
la gramática de los gráficos asigna datos a los atributos estéticos de los puntos geométricos
la codificación de datos en señales visuales o canales (p. ej., longitud, color, posición, tamaño) es la forma en que representamos los cambios y las comparaciones
Gráfico de Barras
faculty %>%count(rank) %>%ggplot(aes(x = rank, y = n)) +geom_bar(stat ="identity")
para combinar líneas en un fragmento de código, use + en lugar de %>%
Gráfico de Barras
puede crear una gráfica con mejor presentación con bastante facilidad
expandir para ver el código
faculty %>%count(rank) %>%ggplot(aes(x =reorder(rank, -n), y = n)) +geom_bar(stat ="identity", fill ="#cc0000") +scale_y_continuous(expand =expansion(mult =c(0, 0.1))) +geom_text(aes(label = n), vjust =-0.5) +labs(x =NULL, y =NULL,title ="Count of faculty by rank, 2018-2021") +theme_linedraw() +theme(panel.grid.major.x =element_blank(),axis.ticks =element_blank())
Gráficos de Líneas
fac_enr %>%filter(!is.na(avg_enr)) %>%ggplot(aes(x = year, y = avg_enr, group = rank, color = rank)) +geom_line()
Gráficos de Líneas
expandir para ver el código completo
fac_enr %>%filter(!is.na(avg_enr)) %>%ggplot(aes(x = year, y = avg_enr, group = rank, color = rank)) +geom_line() +geom_point() +scale_color_brewer(type ="qual", palette ="Dark2") +labs(x =NULL, y ="Average enrollment",title ="Average undergraduate enrollment per rank over time") +theme_linedraw() +theme(panel.grid.major.x =element_blank(),axis.ticks =element_blank(),legend.title =element_blank(),legend.background =element_rect(fill =NA),legend.key =element_rect(fill =NA),legend.position =c(0.85, 0.82))