Cargamos las librerias

library(ggplot2)
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.1.3
## -- Attaching packages --------------------------------------- tidyverse 1.3.2 --
## v tibble  3.1.8     v dplyr   1.0.7
## v tidyr   1.1.4     v stringr 1.4.0
## v readr   2.1.2     v forcats 0.5.1
## v purrr   0.3.4
## Warning: package 'tibble' was built under R version 4.1.3
## Warning: package 'readr' was built under R version 4.1.3
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(dplyr)
library(pander)
## Warning: package 'pander' was built under R version 4.1.3

Descargamos la informacion de nuestro excel

df <- read.csv("B.csv")
df %>% show() %>% pander()
X X.Cuánto.consideras.que.se.cupa. X.Cuánto.gastan.en.gasolina.a.la.semana.

1 1 5 600 2 2 4 460 3 3 5 620 4 4 6 750 5 5 3 380 6 6 2 200 7 7 5 590 8 8 3 330 9 9 2 180 10 10 2 220 11 11 5 600 12 12 5 580 13 13 6 620 14 14 6 560 15 15 5 530 16 16 5 590 17 17 4 400 18 18 2 210 19 19 3 320 20 20 4 450 21 21 7 800 22 22 6 600 23 23 3 350 24 24 5 590 25 25 5 560 26 26 2 270 27 27 1 100 28 28 7 900 29 29 5 590 30 30 5 620 X.Tienes.seguro. Color 1 Si Rojo 2 No Negro 3 No Rojo 4 No Azul 5 Si Gris 6 Si Rojo 7 No Café 8 No Blanco 9 Si Azul 10 No Gris 11 No Azul 12 Si Gris 13 Si Negro 14 No Rojo 15 No Café 16 No Rojo 17 Si Rojo 18 No Azul 19 Si Amarillo 20 No Plata 21 No Negro 22 Si Gris 23 No Azul 24 No Café 25 Si Rojo 26 No Negro 27 No Azul 28 No Plata 29 Si Rojo 30 No Negro

Hacemos un analisis rapido de nuestro data frame en las variables cuantitativas

show(summary(df)[,c(2,3)])
##  X.Cuánto.consideras.que.se.cupa. X.Cuánto.gastan.en.gasolina.a.la.semana.
##  Min.   :1.000                    Min.   :100.0                           
##  1st Qu.:3.000                    1st Qu.:335.0                           
##  Median :5.000                    Median :560.0                           
##  Mean   :4.267                    Mean   :485.7                           
##  3rd Qu.:5.000                    3rd Qu.:600.0                           
##  Max.   :7.000                    Max.   :900.0

Empezamos a graficar con las variables cuantitativas Veamos primero las boxplot: Dias a la semana que se usa el carro

a <- c("Dias")
  b <- seq(min(df[a]),max(df[a]),by=(max(df[a])-min(df[a]))/29)
    grafica <- ggplot(data = df) + geom_boxplot(aes(x = a,y = b,fill = "")) + 
  theme(legend.position = "none")+ scale_y_continuous(breaks = seq(1,7,by=1),labels = seq(1,7,by=1)) +
      labs(title = "Boxplot de Número de dias que usan coche",
           y = "Dias", x = "", caption = "Zamudio Paredes Zuriel & Peña Arriola Diego Fernando")
      show(grafica)

Veamos ahora el histograma

df <- read.csv("B.csv")
colnames(df) <- c("X" ,"Dias" ,"Gasto","Seguro" ,"Color")
df <- df %>% mutate(NumeroDeDias = as.character(Dias)) %>% arrange(Dias)
 grafica <- ggplot(data = df) + geom_bar(aes(x = NumeroDeDias,fill = NumeroDeDias),width = 1,
                               position = "dodge") + labs(y = "", x = "Número de dias", title = "Histograma de Número de dias que se usa el coche por semana", caption = "Zamudio Paredes Zuriel & Peña Arriola Diego Fernando")
    show(grafica)

  Gasto
a <- c("Gasto")
  b <- seq(min(df[a]),max(df[a]),by=(max(df[a])-min(df[a]))/29)
    grafica <- ggplot(data = df) + geom_boxplot(aes(x = a,y = b, fill = "")) + 
  theme(legend.position = "none") + scale_y_continuous(breaks =seq(250,750,by=100),labels=seq(250,750,by=100))
    show(grafica)

df <- read.csv("B.csv")
colnames(df) <- c("X" ,"Dias" ,"Gasto","Seguro" ,"Color")
df <- df %>% mutate(Cantidad = as.character(Gasto)) %>% arrange(Gasto)
 grafica <- ggplot(data = df) + geom_bar(aes(x = Cantidad,fill = Cantidad),width = 1,
                               position = "dodge") + labs(y = "", x = "Dinero gastado en gasolina", title = "Histograma Cantidad gastada por semana", caption = "Zamudio Paredes Zuriel & Peña Arriola Diego Fernando")
    show(grafica)

Grafiquemos ahora las

Veamos las observaciones cualitativas Graficas de pastel Color: Tratamos los datos

df <- read.csv("B.csv")
colnames(df) <- c("X" ,"Dias" ,"Gasto","Seguro" ,"Color")
a <- c(sum(df$Color=="Rojo"),sum(df$Color=="Negro")
,sum(df$Color=="Azul"),sum(df$Color=="Gris"),sum(df$Color=="Café")
,sum(df$Color=="Blanco"),sum(df$Color=="Amarillo"),sum(df$Color=="Plata"))
  b <- c(unique(df$Color))
df <- data.frame(b,a)
df <- df %>% arrange(desc(a)) %>%
  mutate(porcentaje = a / sum(df$a) *100)
  Graficamos:
grafica <- ggplot(data = df) +
  geom_bar(stat="identity", width=1, color="white",aes(x="", y = porcentaje, fill = b)) +
  coord_polar("y", start=0) + scale_fill_manual(values = c("yellow", "blue","white","tan4", "gray65","black","slategrey", "red")) +  theme_void() + labs( title = "Grafica de pastel de colores en autos", caption = "Zamudio Paredes Zuriel & Peña Arriola Diego Fernando")
    show(grafica)

“Vemos la otra variable”

df <- read.csv("B.csv")
  grafica <- ggplot(data = df) + geom_bar(aes(x = Color, fill = Color)) +
    scale_fill_manual(values=c("yellow", "blue","white","tan4", "gray65","black","slategrey", "red")) + 
    labs(y = "Numero de carros", x = "", title = "Grafica de barras de Colores en autos", caption = "Zamudio Paredes Zuriel & Peña Arriola Diego Fernando")
  show(grafica)

Por ultimo revisemos la infirmacion sobre que tan aseguradas estan las personas en nuestra muestra

df <- read.csv("B.csv")
colnames(df) <- c("X" ,"Dias" ,"Gasto","Seguro" ,"Color")
  a <- c(sum(df$Seguro=="Si"),sum(df$Seguro=="No"))
  b <- c(unique(df$Seguro))
    df <- data.frame(b,a)
    
      df <- df %>% arrange(desc(a)) %>%
  mutate(porcentaje = a / sum(df$a) *100)

Graficamos

colnames(df) <- c("¿Tiene Seguro?", "a", "porcentaje")
grafica <- ggplot(data = df) +
  geom_bar(stat="identity", width=1, color="white",aes(x="", y = porcentaje, fill = `¿Tiene Seguro?`)) +
  coord_polar("y", start=0) +  theme_void() + labs( title = "Grafica de pastel de colores en autos", caption = "Zamudio Paredes Zuriel & Peña Arriola Diego Fernando")
    show(grafica)

df <- read.csv("B.csv")
colnames(df) <- c("X" ,"Dias" ,"Gasto","Seguro" ,"Color")
 grafica <- ggplot(data = df) + geom_bar(aes(x = Seguro, fill = Seguro)) + 
    labs(y = "Numero de carros", x = "", title = "Grafica de barras de asegurados", caption = "Zamudio Paredes Zuriel & Peña Arriola Diego Fernando")
 show(grafica)