This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
Note that the echo = FALSE parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.
library(readr) library (janitor) library (dplyr)
datos <- read.csv(file.choose(), sep = “,”) # estructura del data frame
str(datos) head(datos)
summary(datos)
##1 resumen de cada vs numerica datos %>% group_by(“Anio mes” ,
“Pasajeros nacionales” , “Pasajeros internacionales”) %>%
summary(datos)
##2 tablas de frecuencias para cada vs categorica ******* ver
datos %>% group_by(“Codigo IATA” , “Descripcion” , “Estado”) %>% str (datos)
#3 agregaciones de comportamientos interesantes # No entendi que debe ir aqui
###4 histograma de pasajeros nacionales (solo abri una vez ggplot2 aqui para todos los graficos, es valido?)
library(ggplot2) data(datos) ggplot(datos, aes(x=Pasajeros nacionales)) + geom_histogram(binwidth=5, fill=“blue”, color=“black”, alpha=0.7) + labs(title=“Histograma de p nac”, x=“personas”, y=“Frecuencia”)
###5 barras del total de pasajeros por estado
ggplot(datos, aes(x=factor(Estado), fill=factor( Pasajeros internacionales))) + geom_bar(position=“stack”) + labs(title=“Gráfico de barras apiladas de estado y pasajeros internal”, x=“Pasajeros internacionales”, y=“Frecuencia”, fill=“personas”)
###6 boxplot pasajero por mes
ggplot(datos, aes(x=factor(Pasajeros internacionales), y=(Anio mes)) + geom_boxplot(fill=“orange”, color=“black”, alpha=0.7) + labs(title=“Diagrama de caja de Pasajeros internal y tiempo”, x=“personas por mes”)
###7 grafica vs numerica y categorica
datos %>% tabyl(“Pasajeros nacionales”, “Estado”) %>% adorn_totals(c(“row”, “col”)) %>% adorn_pct_formatting(digits = 2)
###8 grafico dos vs numericas
ggplot(datos, aes(x=Anio mes, y=Pasajeros nacionales) + geom_point(color=“blue”, size=2, alpha=0.7) + labs(title=“Fecha vs Pasajeros nacionales”, x=“tiempo”, y=“personas”)