R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

Including Plots

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

no olvidar abrir estos

library(readr) library (janitor) library (dplyr)

importar CSVdatos

datos <- read.csv(file.choose(), sep = “,”) # estructura del data frame

str(datos) head(datos)

resumen estad

summary(datos)

##1 resumen de cada vs numerica datos %>% group_by(“Anio mes” , “Pasajeros nacionales” , “Pasajeros internacionales”) %>% summary(datos)
##2 tablas de frecuencias para cada vs categorica ******* ver

datos %>% group_by(“Codigo IATA” , “Descripcion” , “Estado”) %>% str (datos)

#3 agregaciones de comportamientos interesantes # No entendi que debe ir aqui

###4 histograma de pasajeros nacionales (solo abri una vez ggplot2 aqui para todos los graficos, es valido?)

library(ggplot2) data(datos) ggplot(datos, aes(x=Pasajeros nacionales)) + geom_histogram(binwidth=5, fill=“blue”, color=“black”, alpha=0.7) + labs(title=“Histograma de p nac”, x=“personas”, y=“Frecuencia”)

###5 barras del total de pasajeros por estado

ggplot(datos, aes(x=factor(Estado), fill=factor( Pasajeros internacionales))) + geom_bar(position=“stack”) + labs(title=“Gráfico de barras apiladas de estado y pasajeros internal”, x=“Pasajeros internacionales”, y=“Frecuencia”, fill=“personas”)

###6 boxplot pasajero por mes

ggplot(datos, aes(x=factor(Pasajeros internacionales), y=(Anio mes)) + geom_boxplot(fill=“orange”, color=“black”, alpha=0.7) + labs(title=“Diagrama de caja de Pasajeros internal y tiempo”, x=“personas por mes”)

###7 grafica vs numerica y categorica

datos %>% tabyl(“Pasajeros nacionales”, “Estado”) %>% adorn_totals(c(“row”, “col”)) %>% adorn_pct_formatting(digits = 2)

###8 grafico dos vs numericas

ggplot(datos, aes(x=Anio mes, y=Pasajeros nacionales) + geom_point(color=“blue”, size=2, alpha=0.7) + labs(title=“Fecha vs Pasajeros nacionales”, x=“tiempo”, y=“personas”)