EJERCICIOS 3.8.1 LIBRO GUIA
1) ¿Cual es el Prolema con este plot? ¿ Como podrias mejorarlo?
library(tidyr)
library(ggplot2)
ggplot(data = mpg, mapping = aes(x = cty, y = hwy))+
geom_point()

R: El problema en este plot es que los datos se redondean para poder ser mostrados en el cuadro y muchos puntos se superponen entre si, ademas no muestra la totalidad de los datos. Para mejorar el plot se tiene que hacer una configuracion para ajustar la posicion utilizando “jitter”, el cual agrega ruido aleatorio a cada punto y asi evita que salvan obsrvaciones con mas de un valor. Se puede configurar de la sigueinte manera: geom_point(position: “jitter”) o geom_jitter().
ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) +
geom_jitter()

2) Que parametros para geom_jitter() controlan la cantidad de jittering ?
R: los parametros que controlan la cantidad de jitter en geom_jitter() son height y width, los cuales controlan la cantidad de jitter vertical y horizontal que seran aplicados, si no se activan estas condiciones, el valor predeterminado que en la resoluion de los datos sera del 40%
ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) +
geom_jitter(height = 0.5)

3) Compara y contrasta geom_jitter() con geom_count()
geom_jitter agrega una pequeña cantidad de variacion aleatoria a la ubicacion
de cada punto en un diagrama de dispersion, se usa cuando sobreposicionamiento de
los datos formada por la discresion en conjuntos de datos pequeños.
La grafica que se muestra es de la siguiente forma:
ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) +
geom_jitter()

geom_count() es una variante de geom_point() que cuenta el numero de observaciones
en cada ubicacion y luego mapea el area y el diagrama de dispersion muestra un numero n
el cual es el numero de observaciones en una posicion y el grafico asociado a esta
variable se muestra a continuacion:
ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) +
geom_count()

ggplot(data = mpg, mapping = aes(x = cty, y = hwy, color = class, shape = class)) +
geom_jitter()

ggplot(data = mpg, mapping = aes(x = cty, y = hwy, color = class, shape = class)) +
geom_count()

R: como se mostro anteriormente, para una mejor visualizacion de los datos hay que utlizar
el ajuste geom_jitter(), este nos facilita poder diferenciar las diferentes oobservaciones
y realizar un analisis mucho mas facil, ya que con el ajuste geom_count() que lo unico que
hace es contar las observaciones y las muestra en una misma grfica.
se dificultaria trabajar con este tipo de graficas debido a que para un determinado
valor en x existen varios valores en y
4) Para que es el ajuste de posicion predeterminado geom_boxplot()?
Crear una Visualizacion del conjunto de datos mpg
El ajuste geom_boxplot() es un diagrama de caja el cual muestra una forma compacta de una variable continua, visualiza cinco datos estadisticos, en donde aparece la mediana, dos hinges y dos whiskers y a parte muestra individualmente todos los puntos externos
ggplot(data = mpg, mapping = aes(x = class, y = cty, notch = T, color = class ))+
geom_boxplot()+
coord_flip()

LS0tDQp0aXRsZTogIkhvamEgZGUgVHJhYmFqbyAjMiAtIENlc2FyIFRpbm9jbyAtIDEzMDAzMzg3Ig0Kb3V0cHV0OiBodG1sX25vdGVib29rDQotLS0NCg0KIyMgRUpFUkNJQ0lPUyAzLjguMSBMSUJSTyBHVUlBDQoNCiMjIyMgMSkgwr9DdWFsIGVzIGVsIFByb2xlbWEgY29uIGVzdGUgcGxvdD8gwr8gQ29tbyBwb2RyaWFzIG1lam9yYXJsbz8NCg0KYGBge3J9DQoNCmxpYnJhcnkodGlkeXIpDQpsaWJyYXJ5KGdncGxvdDIpDQoNCmdncGxvdChkYXRhID0gbXBnLCBtYXBwaW5nID0gYWVzKHggPSBjdHksIHkgPSBod3kpKSsNCiAgZ2VvbV9wb2ludCgpDQoNCmBgYA0KDQpSOiBFbCBwcm9ibGVtYSBlbiBlc3RlIHBsb3QgZXMgcXVlIGxvcyBkYXRvcyBzZSByZWRvbmRlYW4gcGFyYSBwb2RlciBzZXIgbW9zdHJhZG9zIGVuIGVsIGN1YWRybw0KICAgeSBtdWNob3MgcHVudG9zIHNlIHN1cGVycG9uZW4gZW50cmUgc2ksIGFkZW1hcyBubyBtdWVzdHJhIGxhIHRvdGFsaWRhZCBkZSBsb3MgZGF0b3MuIFBhcmEgbWVqb3Jhcg0KICAgZWwgcGxvdCBzZSB0aWVuZSBxdWUgaGFjZXIgdW5hIGNvbmZpZ3VyYWNpb24gcGFyYSBhanVzdGFyIGxhIHBvc2ljaW9uIHV0aWxpemFuZG8gImppdHRlciIsIGVsIGN1YWwNCiAgIGFncmVnYSBydWlkbyBhbGVhdG9yaW8gYSBjYWRhIHB1bnRvIHkgYXNpIGV2aXRhIHF1ZSBzYWx2YW4gb2JzcnZhY2lvbmVzIGNvbiBtYXMgZGUgdW4gdmFsb3IuDQogICBTZSBwdWVkZSBjb25maWd1cmFyIGRlIGxhIHNpZ3VlaW50ZSBtYW5lcmE6IGdlb21fcG9pbnQocG9zaXRpb246ICJqaXR0ZXIiKSBvIGdlb21faml0dGVyKCkuDQogICANCmBgYHtyfQ0KZ2dwbG90KGRhdGEgPSBtcGcsIG1hcHBpbmcgPSBhZXMoeCA9IGN0eSwgeSA9IGh3eSkpICsgDQogICAgZ2VvbV9qaXR0ZXIoKQ0KDQpgYGANCg0KIyMjIyAyKSBRdWUgcGFyYW1ldHJvcyBwYXJhIGdlb21faml0dGVyKCkgY29udHJvbGFuIGxhIGNhbnRpZGFkIGRlIGppdHRlcmluZyA/DQoNClI6IGxvcyBwYXJhbWV0cm9zIHF1ZSBjb250cm9sYW4gbGEgY2FudGlkYWQgZGUgaml0dGVyIGVuIGdlb21faml0dGVyKCkgc29uIGhlaWdodCB5IHdpZHRoLCANCiAgIGxvcyBjdWFsZXMgY29udHJvbGFuIGxhIGNhbnRpZGFkIGRlIGppdHRlciB2ZXJ0aWNhbCB5IGhvcml6b250YWwgcXVlIHNlcmFuIGFwbGljYWRvcywNCiAgIHNpIG5vIHNlIGFjdGl2YW4gZXN0YXMgY29uZGljaW9uZXMsIGVsIHZhbG9yIHByZWRldGVybWluYWRvIHF1ZSBlbiBsYSByZXNvbHVpb24gZGUgbG9zIGRhdG9zIHNlcmEgZGVsIDQwJQ0KICAgDQogICANCmBgYHtyfQ0KDQpnZ3Bsb3QoZGF0YSA9IG1wZywgbWFwcGluZyA9IGFlcyh4ID0gY3R5LCB5ID0gaHd5KSkgKyANCiAgICBnZW9tX2ppdHRlcihoZWlnaHQgPSAwLjUpDQoNCg0KYGBgDQoNCiAgIA0KIyMjIyAzKSBDb21wYXJhIHkgY29udHJhc3RhIGdlb21faml0dGVyKCkgY29uIGdlb21fY291bnQoKQ0KDQogICAgZ2VvbV9qaXR0ZXIgYWdyZWdhIHVuYSBwZXF1ZcOxYSBjYW50aWRhZCBkZSB2YXJpYWNpb24gYWxlYXRvcmlhIGEgbGEgdWJpY2FjaW9uIA0KICAgIGRlIGNhZGEgcHVudG8gZW4gdW4gZGlhZ3JhbWEgZGUgZGlzcGVyc2lvbiwgc2UgdXNhIGN1YW5kbyBzb2JyZXBvc2ljaW9uYW1pZW50byBkZQ0KICAgIGxvcyBkYXRvcyBmb3JtYWRhIHBvciBsYSBkaXNjcmVzaW9uIGVuIGNvbmp1bnRvcyBkZSBkYXRvcyBwZXF1ZcOxb3MuIA0KICAgIExhIGdyYWZpY2EgcXVlIHNlIG11ZXN0cmEgZXMgZGUgbGEgc2lndWllbnRlIGZvcm1hOg0KDQpgYGB7cn0NCmdncGxvdChkYXRhID0gbXBnLCBtYXBwaW5nID0gYWVzKHggPSBjdHksIHkgPSBod3kpKSArIA0KICAgIGdlb21faml0dGVyKCkNCg0KYGBgDQoNCiAgICBnZW9tX2NvdW50KCkgZXMgdW5hIHZhcmlhbnRlIGRlIGdlb21fcG9pbnQoKSBxdWUgY3VlbnRhIGVsIG51bWVybyBkZSBvYnNlcnZhY2lvbmVzDQogICAgZW4gY2FkYSB1YmljYWNpb24geSBsdWVnbyBtYXBlYSBlbCBhcmVhIHkgZWwgZGlhZ3JhbWEgZGUgZGlzcGVyc2lvbiBtdWVzdHJhIHVuIG51bWVybyBuDQogICAgZWwgY3VhbCBlcyBlbCBudW1lcm8gZGUgb2JzZXJ2YWNpb25lcyBlbiB1bmEgcG9zaWNpb24geSBlbCBncmFmaWNvIGFzb2NpYWRvIGEgZXN0YQ0KICAgIHZhcmlhYmxlIHNlIG11ZXN0cmEgYSBjb250aW51YWNpb246DQogICANCmBgYHtyfQ0KZ2dwbG90KGRhdGEgPSBtcGcsIG1hcHBpbmcgPSBhZXMoeCA9IGN0eSwgeSA9IGh3eSkpICsgDQogICAgZ2VvbV9jb3VudCgpDQoNCg0KYGBgDQoNCmBgYHtyfQ0KZ2dwbG90KGRhdGEgPSBtcGcsIG1hcHBpbmcgPSBhZXMoeCA9IGN0eSwgeSA9IGh3eSwgY29sb3IgPSBjbGFzcywgc2hhcGUgPSBjbGFzcykpICsgDQogICAgZ2VvbV9qaXR0ZXIoKQ0KYGBgDQogDQpgYGB7cn0NCmdncGxvdChkYXRhID0gbXBnLCBtYXBwaW5nID0gYWVzKHggPSBjdHksIHkgPSBod3ksIGNvbG9yID0gY2xhc3MsIHNoYXBlID0gY2xhc3MpKSArIA0KICAgIGdlb21fY291bnQoKQ0KYGBgDQogICAgUjogY29tbyBzZSBtb3N0cm8gYW50ZXJpb3JtZW50ZSwgcGFyYSB1bmEgbWVqb3IgdmlzdWFsaXphY2lvbiBkZSBsb3MgZGF0b3MgaGF5IHF1ZSB1dGxpemFyDQogICAgZWwgYWp1c3RlIGdlb21faml0dGVyKCksIGVzdGUgbm9zIGZhY2lsaXRhIHBvZGVyIGRpZmVyZW5jaWFyIGxhcyBkaWZlcmVudGVzIG9vYnNlcnZhY2lvbmVzDQogICAgeSByZWFsaXphciB1biBhbmFsaXNpcyBtdWNobyBtYXMgZmFjaWwsIHlhIHF1ZSBjb24gZWwgYWp1c3RlIGdlb21fY291bnQoKSBxdWUgbG8gdW5pY28gcXVlIA0KICAgIGhhY2UgZXMgY29udGFyIGxhcyBvYnNlcnZhY2lvbmVzIHkgbGFzIG11ZXN0cmEgZW4gdW5hIG1pc21hIGdyZmljYS4NCiAgICBzZSBkaWZpY3VsdGFyaWEgdHJhYmFqYXIgY29uIGVzdGUgdGlwbyBkZSBncmFmaWNhcyBkZWJpZG8gYSBxdWUgcGFyYSB1biBkZXRlcm1pbmFkbyANCiAgICB2YWxvciBlbiB4IGV4aXN0ZW4gdmFyaW9zIHZhbG9yZXMgZW4geQ0KICAgIA0KICAgIA0KICAgIA0KDQojIyMjIDQpIFBhcmEgcXVlIGVzIGVsIGFqdXN0ZSBkZSBwb3NpY2lvbiBwcmVkZXRlcm1pbmFkbyBnZW9tX2JveHBsb3QoKT8gDQojIyMjICAgIENyZWFyIHVuYSBWaXN1YWxpemFjaW9uIGRlbCBjb25qdW50byBkZSBkYXRvcyBtcGcNCg0KRWwgYWp1c3RlIGdlb21fYm94cGxvdCgpIGVzIHVuIGRpYWdyYW1hIGRlIGNhamEgZWwgY3VhbCBtdWVzdHJhIHVuYSBmb3JtYSBjb21wYWN0YQ0KZGUgdW5hIHZhcmlhYmxlIGNvbnRpbnVhLCB2aXN1YWxpemEgY2luY28gZGF0b3MgZXN0YWRpc3RpY29zLCBlbiBkb25kZSBhcGFyZWNlIGxhDQptZWRpYW5hLCBkb3MgaGluZ2VzIHkgZG9zIHdoaXNrZXJzIHkgYSBwYXJ0ZSBtdWVzdHJhIGluZGl2aWR1YWxtZW50ZSB0b2Rvcw0KbG9zIHB1bnRvcyBleHRlcm5vcw0KDQoNCmBgYHtyfQ0KZ2dwbG90KGRhdGEgPSBtcGcsIG1hcHBpbmcgPSBhZXMoeCA9IGNsYXNzLCB5ID0gY3R5LCBub3RjaCA9IFQsIGNvbG9yID0gY2xhc3MgKSkrDQogIGdlb21fYm94cGxvdCgpKw0KICBjb29yZF9mbGlwKCkNCg0KYGBgDQoNCiAgDQogICAgDQogICAgDQogICAgDQogICAgDQogICAgDQogICAgDQogICAgDQogICAgDQogICANCiAgIA0K