Cargamos las librerias
library(ggplot2)
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.1.3
## -- Attaching packages --------------------------------------- tidyverse 1.3.2 --
## v tibble 3.1.8 v dplyr 1.0.7
## v tidyr 1.1.4 v stringr 1.4.0
## v readr 2.1.2 v forcats 0.5.1
## v purrr 0.3.4
## Warning: package 'tibble' was built under R version 4.1.3
## Warning: package 'readr' was built under R version 4.1.3
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(dplyr)
Descargamos la informacion de nuestro excel
df <- read.csv("B.csv")
show(df)
## X X.Cuánto.consideras.que.se.cupa. X.Cuánto.gastan.en.gasolina.a.la.semana.
## 1 1 5 600
## 2 2 4 460
## 3 3 5 620
## 4 4 6 750
## 5 5 3 380
## 6 6 2 200
## 7 7 5 590
## 8 8 3 330
## 9 9 2 180
## 10 10 2 220
## 11 11 5 600
## 12 12 5 580
## 13 13 6 620
## 14 14 6 560
## 15 15 5 530
## 16 16 5 590
## 17 17 4 400
## 18 18 2 210
## 19 19 3 320
## 20 20 4 450
## 21 21 7 800
## 22 22 6 600
## 23 23 3 350
## 24 24 5 590
## 25 25 5 560
## 26 26 2 270
## 27 27 1 100
## 28 28 7 900
## 29 29 5 590
## 30 30 5 620
## X.Cuántas.horas.a.la.sema.lo..ocupas.aproximadamente. Color
## 1 9 Rojo
## 2 5 Negro
## 3 7 Rojo
## 4 6 Azul
## 5 4 Gris
## 6 1 Rojo
## 7 6 Café
## 8 3 Blanco
## 9 3 Azul
## 10 1 Gris
## 11 6 Azul
## 12 5 Gris
## 13 6 Negro
## 14 7 Rojo
## 15 4 Café
## 16 3 Rojo
## 17 3 Rojo
## 18 2 Azul
## 19 5 Amarillo
## 20 5 Plata
## 21 6 Negro
## 22 8 Gris
## 23 2 Azul
## 24 5 Café
## 25 4 Rojo
## 26 2 Negro
## 27 1 Azul
## 28 6 Plata
## 29 4 Rojo
## 30 4 Negro
Hacemos un analisis rapido de nuestro data frame
show(summary(df))
## X X.Cuánto.consideras.que.se.cupa.
## Min. : 1.00 Min. :1.000
## 1st Qu.: 8.25 1st Qu.:3.000
## Median :15.50 Median :5.000
## Mean :15.50 Mean :4.267
## 3rd Qu.:22.75 3rd Qu.:5.000
## Max. :30.00 Max. :7.000
## X.Cuánto.gastan.en.gasolina.a.la.semana.
## Min. :100.0
## 1st Qu.:335.0
## Median :560.0
## Mean :485.7
## 3rd Qu.:600.0
## Max. :900.0
## X.Cuántas.horas.a.la.sema.lo..ocupas.aproximadamente. Color
## Min. :1.000 Length:30
## 1st Qu.:3.000 Class :character
## Median :4.500 Mode :character
## Mean :4.433
## 3rd Qu.:6.000
## Max. :9.000
Empezamos a graficar con las variables cuantitativas Veamos primero las boxplot: Dias a la semana que se usa el carro
a <- c("Dias")
Cardinal <- seq(min(df[a]),max(df[a]),by=(max(df[a])-min(df[a]))/29)
ggplot(data = df) + geom_boxplot(aes(x = a,y = Cardinal,fill = "red")) +
theme(legend.position = "none")+ scale_y_continuous(breaks = seq(1,7,by=1),labels = seq(1,7,by=1))
Gasto
a <- c("Gasto")
Cardinal <- seq(min(df[a]),max(df[a]),by=(max(df[a])-min(df[a]))/29)
ggplot(data = df) + geom_boxplot(aes(x = a,y = Cardinal, fill = "red")) +
theme(legend.position = "none") + scale_y_continuous(breaks = seq(250,750,by=100),labels = seq(250,750,by=100))
Veamos las observaciones cualitativas Graficas de pastel Color: Tratamos los datos
a <- c(sum(df$Color=="Rojo"),sum(df$Color=="Negro")
,sum(df$Color=="Azul"),sum(df$Color=="Gris"),sum(df$Color=="Café")
,sum(df$Color=="Blanco"),sum(df$Color=="Amarillo"),sum(df$Color=="Plata"))
b <- c(unique(df$Color))
df <- data.frame(b,a)
df <- df %>% arrange(desc(a)) %>%
mutate(porcentaje = a / sum(df$a) *100) %>%
mutate(ypos = cumsum(porcentaje)- 0.5*porcentaje)
Graficamos:
ggplot(data = df) +
geom_bar(stat="identity", width=1, color="white",aes(x="", y = porcentaje, fill = b)) +
coord_polar("y", start=0) + theme_void()