Oscar Padilla

Carné: 13000285

Econometria I

library(ggplot2)

Ejercicios Sección 3.8.1

———————————————————————————————————

1.What is the problem with this plot? How could you improve it?

ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) + 
  geom_point()

El problema es que hay múltiples observaciones para cada combinación de cty y hwy.

Se arreglaría usando un ajuste de posición de jitter:

ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) +
  geom_point(position = "jitter")

2.What parameters to geom_jitter() control the amount of jittering?

Width: controla la cantidad de desplazamiento vertical, y Height: controla la cantidad de desplazamiento horizontal.

Los valores predeterminados que tienen el ancho y la altura hacen ruido en ambas direcciones. Aquí es cómo se ve la gráfica con los valores predeterminados de altura y ancho:

ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) +
  geom_point(position = position_jitter(width = 0))

Podemos ajustarlos, esto significa que si x, y son variables discretas, sus resoluciones son iguales a 1, altura = 0.8 y ancho = 0.8.

3.Compare and contrast geom_jitter() with geom_count().

geom_jitter() Agrega ruido aleatorio a los puntos de ubicación de la gráfica.

ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) +
  geom_jitter()

Le cambiamos de tamaño a los puntos con más observaciones, los volvemos más grandes y a los que tienen menos observaciones quedaran de un tamaño mas pequeño, todo esto se logra con la función geom_count ().

ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) +
  geom_count()

Si los puntos están muy juntos y los conteos son grandes, el tamaño de algunos puntos puede quedar encima de otros puntos.

Debemos de agregar una tercer variable o más que sean color, etc para distinguir el modelo.

ggplot(data = mpg, mapping = aes(x = cty, y = hwy, color = class)) +
  geom_jitter()

ggplot(data = mpg, mapping = aes(x = cty, y = hwy, color = class)) +
  geom_count()

No existe una solución concreta ya que depende del modelo debemos de visualizar si agregamos otras variables o no nuestro modelo para lograr visualizar de una mejor forma como se comporta.

4. What’s the default position adjustment for geom_boxplot()? Create a visualisation of the mpg dataset that demonstrates it.

La posición default de geom_boxplot() es position_dodge().

Cuando agregamos color a la gráfica de caja, estas se esquivan.

ggplot(data = mpg, aes(x = drv, y = hwy, colour = class)) +
  geom_boxplot()

Si fuera el caso de position_identity (), se pondrian una encima de otra.

ggplot(data = mpg, aes(x = drv, y = hwy, colour = class)) +
  geom_boxplot(position = "identity")