Oscar Padilla
Carné: 13000285
Econometria I
library(ggplot2)
Ejercicios Sección 3.8.1
———————————————————————————————————
1.What is the problem with this plot? How could you improve it?
ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) +
geom_point()

El problema es que hay múltiples observaciones para cada combinación de cty y hwy.
Se arreglaría usando un ajuste de posición de jitter:
ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) +
geom_point(position = "jitter")

2.What parameters to geom_jitter() control the amount of jittering?
Width: controla la cantidad de desplazamiento vertical, y Height: controla la cantidad de desplazamiento horizontal.
Los valores predeterminados que tienen el ancho y la altura hacen ruido en ambas direcciones. Aquí es cómo se ve la gráfica con los valores predeterminados de altura y ancho:
ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) +
geom_point(position = position_jitter(width = 0))

Podemos ajustarlos, esto significa que si x, y son variables discretas, sus resoluciones son iguales a 1, altura = 0.8 y ancho = 0.8.
3.Compare and contrast geom_jitter() with geom_count().
geom_jitter() Agrega ruido aleatorio a los puntos de ubicación de la gráfica.
ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) +
geom_jitter()

Le cambiamos de tamaño a los puntos con más observaciones, los volvemos más grandes y a los que tienen menos observaciones quedaran de un tamaño mas pequeño, todo esto se logra con la función geom_count ().
ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) +
geom_count()

Si los puntos están muy juntos y los conteos son grandes, el tamaño de algunos puntos puede quedar encima de otros puntos.
Debemos de agregar una tercer variable o más que sean color, etc para distinguir el modelo.
ggplot(data = mpg, mapping = aes(x = cty, y = hwy, color = class)) +
geom_jitter()

ggplot(data = mpg, mapping = aes(x = cty, y = hwy, color = class)) +
geom_count()

No existe una solución concreta ya que depende del modelo debemos de visualizar si agregamos otras variables o no nuestro modelo para lograr visualizar de una mejor forma como se comporta.
4. What’s the default position adjustment for geom_boxplot()? Create a visualisation of the mpg dataset that demonstrates it.
La posición default de geom_boxplot() es position_dodge().
Cuando agregamos color a la gráfica de caja, estas se esquivan.
ggplot(data = mpg, aes(x = drv, y = hwy, colour = class)) +
geom_boxplot()

Si fuera el caso de position_identity (), se pondrian una encima de otra.
ggplot(data = mpg, aes(x = drv, y = hwy, colour = class)) +
geom_boxplot(position = "identity")
