library(ggplot2)
library(dplyr)
library(titanic)

GROUP BY sirve para agrupar datos: para cambiar el dominio de acción de los verbos variable continua y categorica o discreta por continente <- group_by (gapminder, continent) en vez de ocupar los verbos sobre gapminder lo hacemos sobre la nueva variable summarise (por_continent, avgLifeExp)

carguemos los paquetes y exploremos la data del Titanic

df <- dplyr::bind_rows(titanic::titanic_train,
                       titanic::titanic_test)
glimpse(df)
Observations: 1,309
Variables: 12
$ PassengerId <int> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 2...
$ Survived    <int> 0, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1, ...
$ Pclass      <int> 3, 1, 3, 1, 3, 3, 1, 3, 3, 2, 3, 1, 3, 3, 3, 2, 3, 2, 3, 3, 2, 2, 3, 1, ...
$ Name        <chr> "Braund, Mr. Owen Harris", "Cumings, Mrs. John Bradley (Florence Briggs ...
$ Sex         <chr> "male", "female", "female", "female", "male", "male", "male", "male", "f...
$ Age         <dbl> 22, 38, 26, 35, 35, NA, 54, 2, 27, 14, 4, 58, 20, 39, 14, 55, 2, NA, 31,...
$ SibSp       <int> 1, 1, 0, 1, 0, 0, 0, 3, 0, 1, 1, 0, 0, 1, 0, 0, 4, 0, 1, 0, 0, 0, 0, 0, ...
$ Parch       <int> 0, 0, 0, 0, 0, 0, 0, 1, 2, 0, 1, 0, 0, 5, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, ...
$ Ticket      <chr> "A/5 21171", "PC 17599", "STON/O2. 3101282", "113803", "373450", "330877...
$ Fare        <dbl> 7.2500, 71.2833, 7.9250, 53.1000, 8.0500, 8.4583, 51.8625, 21.0750, 11.1...
$ Cabin       <chr> "", "C85", "", "C123", "", "", "E46", "", "", "", "G6", "C103", "", "", ...
$ Embarked    <chr> "S", "C", "S", "S", "S", "Q", "S", "S", "S", "C", "S", "S", "S", "S", "S...

bind_rows junta datos por fila (apila) los dos puntos :: significan que el paquete que esta antes tiene que estar cargado glimpse da una foto global de todos los datos

ggplot(data = df) +
  geom_bar(mapping = aes(x = Sex), fill = "turquoise", colour = "black") +
  theme_bw() +
   ggtitle ("Para observar la variacion de una variable categorica: geom_bar")

df %>% 
select (Fare)
ggplot(data = df) +
  geom_point(mapping = aes (x = Fare, y = 0)) +
theme_bw()

me da los precios de la tarifa y cuantos pasajeros pagaron con ella head muestra las 6 primeras filas de la data rectangular variable = columna control + shift + m = %>%

  df %>% 
  count(Fare) %>% 
  ggplot () +
  geom_point (mapping = aes(x = Fare, y = o, size =n),
              alpha = 1/5,
              shape = 21,
              fill = "red",
              colour = "black") +
theme_bw()

xx Crear intervalos y clasificar a cual de estos pertenecen los valores de una variable continua bindwidth = el tamaño del intervalo

  ggplot (data = df) +
  geom_histogram (mapping = aes(x = Fare), binwidth = 10, fill = "orange", colour = "black") +
  theme_bw() +
  ggtitle("Para observar la variacion de una variable continua: geom_histogram")

ggplot (data = df) +
  geom_freqpoly(mapping = aes(x = Fare, colour = factor (Pclass)),
                bindwidth = 10,
                size = 0.8) +
  theme_bw() +
  ggtitle("Para comparar distintas distribuciones: geom_freqpoly")
Ignoring unknown parameters: bindwidth

df %>%
  count(Pclass)

Para comparar distintas distribuciones: geom_freqpoly se puede utilizar y = …density… para hacer mas comparables los grupos con cantidad de observaciones muy distintas para poner titulos y que no se corten en la linea

Entre variable categorica y continua: geom_boxplot crear un data frame a partir de una secuencia de 1 al 25

(data_juguete <- tibble (
                          id = "var_categorica",
                          seq_num = seq (1, 25))
)

graficos de caja con lineas horizontales medida del x1,5 si estan fuera del rango es que quedan fuera de la variable (25, 50, 75) que tienen en comun o que diferencia a ciertos grupos de las variables NA = no asignado (cuando nos falta un dato) para observar la covariacion entre dos variables categoricas: geom_count para observar la covariacion entre dos variables vategoricas: geom_tile en grupos hacer un mini reportaje del titanic informando que paso como si hubiera pasado ahora no mas de 2 3 graficos, que tengan una historia detras que tenga contexto de que pasó (para el prox viernes) con titulos 2 hacer una sintesis, resumen tipo blog sintetizando las ideas principales ocupando Rnote y dar ejemplos y cómo queda de forma tidy (2 semanas)

LS0tDQp0aXRsZTogIkNsYXNlIENpbmNvIg0Kb3V0cHV0OiBodG1sX25vdGVib29rDQotLS0NCg0KYGBge3J9DQpsaWJyYXJ5KGdncGxvdDIpDQpsaWJyYXJ5KGRwbHlyKQ0KbGlicmFyeSh0aXRhbmljKQ0KYGBgDQoNCkdST1VQIEJZIHNpcnZlIHBhcmEgYWdydXBhciBkYXRvczogcGFyYSBjYW1iaWFyIGVsIGRvbWluaW8gZGUgYWNjafNuIGRlIGxvcyB2ZXJib3MNCnZhcmlhYmxlIGNvbnRpbnVhIHkgY2F0ZWdvcmljYSBvIGRpc2NyZXRhDQpwb3IgY29udGluZW50ZSA8LSBncm91cF9ieSAoZ2FwbWluZGVyLCBjb250aW5lbnQpDQplbiB2ZXogZGUgb2N1cGFyIGxvcyB2ZXJib3Mgc29icmUgZ2FwbWluZGVyIGxvIGhhY2Vtb3Mgc29icmUgbGEgbnVldmEgdmFyaWFibGUNCnN1bW1hcmlzZSAocG9yX2NvbnRpbmVudCwgYXZnTGlmZUV4cCkNCg0KY2FyZ3VlbW9zIGxvcyBwYXF1ZXRlcyB5IGV4cGxvcmVtb3MgbGEgZGF0YSBkZWwgVGl0YW5pYw0KDQpgYGB7cn0NCmRmIDwtIGRwbHlyOjpiaW5kX3Jvd3ModGl0YW5pYzo6dGl0YW5pY190cmFpbiwNCiAgICAgICAgICAgICAgICAgICAgICAgdGl0YW5pYzo6dGl0YW5pY190ZXN0KQ0KZ2xpbXBzZShkZikNCmBgYA0KYmluZF9yb3dzIGp1bnRhIGRhdG9zIHBvciBmaWxhIChhcGlsYSkNCmxvcyBkb3MgcHVudG9zIDo6IHNpZ25pZmljYW4gcXVlIGVsIHBhcXVldGUgcXVlIGVzdGEgYW50ZXMgdGllbmUgcXVlIGVzdGFyIGNhcmdhZG8NCmdsaW1wc2UgZGEgdW5hIGZvdG8gZ2xvYmFsIGRlIHRvZG9zIGxvcyBkYXRvcw0KDQpgYGB7cn0NCmdncGxvdChkYXRhID0gZGYpICsNCiAgZ2VvbV9iYXIobWFwcGluZyA9IGFlcyh4ID0gU2V4KSwgZmlsbCA9ICJ0dXJxdW9pc2UiLCBjb2xvdXIgPSAiYmxhY2siKSArDQogIHRoZW1lX2J3KCkgKw0KICAgZ2d0aXRsZSAoIlBhcmEgb2JzZXJ2YXIgbGEgdmFyaWFjaW9uIGRlIHVuYSB2YXJpYWJsZSBjYXRlZ29yaWNhOiBnZW9tX2JhciIpDQpgYGANCmBgYHtyfQ0KZGYgJT4lIA0Kc2VsZWN0IChGYXJlKQ0KYGBgDQpgYGB7cn0NCmdncGxvdChkYXRhID0gZGYpICsNCiAgZ2VvbV9wb2ludChtYXBwaW5nID0gYWVzICh4ID0gRmFyZSwgeSA9IDApKSArDQp0aGVtZV9idygpDQpgYGANCm1lIGRhIGxvcyBwcmVjaW9zIGRlIGxhIHRhcmlmYSB5IGN1YW50b3MgcGFzYWplcm9zIHBhZ2Fyb24gY29uIGVsbGENCmhlYWQgbXVlc3RyYSBsYXMgNiBwcmltZXJhcyBmaWxhcyBkZSBsYSBkYXRhIHJlY3Rhbmd1bGFyDQp2YXJpYWJsZSA9IGNvbHVtbmENCmNvbnRyb2wgKyBzaGlmdCArIG0gPSAlPiUNCmBgYHtyfQ0KICBkZiAlPiUgDQogIGNvdW50KEZhcmUpICU+JSANCiAgZ2dwbG90ICgpICsNCiAgZ2VvbV9wb2ludCAobWFwcGluZyA9IGFlcyh4ID0gRmFyZSwgeSA9IG8sIHNpemUgPW4pLA0KICAgICAgICAgICAgICBhbHBoYSA9IDEvNSwNCiAgICAgICAgICAgICAgc2hhcGUgPSAyMSwNCiAgICAgICAgICAgICAgZmlsbCA9ICJyZWQiLA0KICAgICAgICAgICAgICBjb2xvdXIgPSAiYmxhY2siKSArDQp0aGVtZV9idygpDQpgYGANCnh4DQpDcmVhciBpbnRlcnZhbG9zIHkgY2xhc2lmaWNhciBhIGN1YWwgZGUgZXN0b3MgcGVydGVuZWNlbiBsb3MgdmFsb3JlcyBkZSB1bmEgdmFyaWFibGUgY29udGludWENCmJpbmR3aWR0aCA9IGVsIHRhbWHxbyBkZWwgaW50ZXJ2YWxvDQoNCmBgYHtyfQ0KICBnZ3Bsb3QgKGRhdGEgPSBkZikgKw0KICBnZW9tX2hpc3RvZ3JhbSAobWFwcGluZyA9IGFlcyh4ID0gRmFyZSksIGJpbndpZHRoID0gMTAsIGZpbGwgPSAib3JhbmdlIiwgY29sb3VyID0gImJsYWNrIikgKw0KICB0aGVtZV9idygpICsNCiAgZ2d0aXRsZSgiUGFyYSBvYnNlcnZhciBsYSB2YXJpYWNpb24gZGUgdW5hIHZhcmlhYmxlIGNvbnRpbnVhOiBnZW9tX2hpc3RvZ3JhbSIpDQpgYGANCmBgYHtyfQ0KZ2dwbG90IChkYXRhID0gZGYpICsNCiAgZ2VvbV9mcmVxcG9seShtYXBwaW5nID0gYWVzKHggPSBGYXJlLCBjb2xvdXIgPSBmYWN0b3IgKFBjbGFzcykpLA0KICAgICAgICAgICAgICAgIGJpbmR3aWR0aCA9IDEwLA0KICAgICAgICAgICAgICAgIHNpemUgPSAwLjgpICsNCiAgdGhlbWVfYncoKSArDQogIGdndGl0bGUoIlBhcmEgY29tcGFyYXIgZGlzdGludGFzIGRpc3RyaWJ1Y2lvbmVzOiBnZW9tX2ZyZXFwb2x5IikNCmBgYA0KYGBge3J9DQpkZiAlPiUNCiAgY291bnQoUGNsYXNzKQ0KYGBgDQpQYXJhIGNvbXBhcmFyIGRpc3RpbnRhcyBkaXN0cmlidWNpb25lczogZ2VvbV9mcmVxcG9seSBzZSBwdWVkZSB1dGlsaXphciB5ID0gLi4uZGVuc2l0eS4uLg0KcGFyYSBoYWNlciBtYXMgY29tcGFyYWJsZXMgbG9zIGdydXBvcyBjb24gY2FudGlkYWQgZGUgb2JzZXJ2YWNpb25lcyBtdXkgZGlzdGludGFzDQpcblNlIHBhcmEgcG9uZXIgdGl0dWxvcyB5IHF1ZSBubyBzZSBjb3J0ZW4gZW4gbGEgbGluZWENCg0KRW50cmUgdmFyaWFibGUgY2F0ZWdvcmljYSB5IGNvbnRpbnVhOiBnZW9tX2JveHBsb3QNCmNyZWFyIHVuIGRhdGEgZnJhbWUgYSBwYXJ0aXIgZGUgdW5hIHNlY3VlbmNpYSBkZSAxIGFsIDI1DQpgYGB7cn0NCihkYXRhX2p1Z3VldGUgPC0gdGliYmxlICgNCiAgICAgICAgICAgICAgICAgICAgICAgICAgaWQgPSAidmFyX2NhdGVnb3JpY2EiLA0KICAgICAgICAgICAgICAgICAgICAgICAgICBzZXFfbnVtID0gc2VxICgxLCAyNSkpDQopDQpgYGANCmdyYWZpY29zIGRlIGNhamEgY29uIGxpbmVhcyBob3Jpem9udGFsZXMNCm1lZGlkYSBkZWwgeDEsNSBzaSBlc3RhbiBmdWVyYSBkZWwgcmFuZ28gZXMgcXVlIHF1ZWRhbiBmdWVyYSBkZSBsYSB2YXJpYWJsZSAoMjUsIDUwLCA3NSkNCnF1ZSB0aWVuZW4gZW4gY29tdW4gbyBxdWUgZGlmZXJlbmNpYSBhIGNpZXJ0b3MgZ3J1cG9zIGRlIGxhcyB2YXJpYWJsZXMNCk5BID0gbm8gYXNpZ25hZG8gKGN1YW5kbyBub3MgZmFsdGEgdW4gZGF0bykNCnBhcmEgb2JzZXJ2YXIgbGEgY292YXJpYWNpb24gZW50cmUgZG9zIHZhcmlhYmxlcyBjYXRlZ29yaWNhczogZ2VvbV9jb3VudA0KcGFyYSBvYnNlcnZhciBsYSBjb3ZhcmlhY2lvbiBlbnRyZSBkb3MgdmFyaWFibGVzIHZhdGVnb3JpY2FzOiBnZW9tX3RpbGUNCmVuIGdydXBvcyBoYWNlciB1biBtaW5pIHJlcG9ydGFqZSBkZWwgdGl0YW5pYyBpbmZvcm1hbmRvIHF1ZSBwYXNvIGNvbW8gc2kgaHViaWVyYSBwYXNhZG8gYWhvcmENCm5vIG1hcyBkZSAyIDMgZ3JhZmljb3MsIHF1ZSB0ZW5nYW4gdW5hIGhpc3RvcmlhIGRldHJhcw0KcXVlIHRlbmdhIGNvbnRleHRvIGRlIHF1ZSBwYXPzIChwYXJhIGVsIHByb3ggdmllcm5lcykgY29uIHRpdHVsb3MNCjIgaGFjZXIgdW5hIHNpbnRlc2lzLCByZXN1bWVuIHRpcG8gYmxvZyBzaW50ZXRpemFuZG8gbGFzIGlkZWFzIHByaW5jaXBhbGVzIG9jdXBhbmRvIFJub3RlIHkgZGFyIGVqZW1wbG9zIHkgY/NtbyBxdWVkYSBkZSBmb3JtYSB0aWR5ICgyIHNlbWFuYXMpDQo=