Entregable 2.2: Análisis estadístico descriptivo

Csv con continente para elaborar tabla de frecuencia

#file.choose()
bd7 <- read.csv("/Users/dannaperez/Desktop/R/RMD/Base_de_datos_continentes.csv")
summary(bd7)

##   Geography          Continente          Category          Data.Type        
##  Length:10          Length:10          Length:10          Length:10         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##       Unit       X2017            X2018            X2019           X2020       
##  Min.   :0   Min.   :  1.00   Min.   :  1.00   Min.   :  2.0   Min.   :  2.00  
##  1st Qu.:0   1st Qu.: 11.75   1st Qu.: 21.75   1st Qu.: 26.0   1st Qu.: 34.25  
##  Median :0   Median : 83.50   Median :165.00   Median :168.5   Median :116.00  
##  Mean   :0   Mean   :107.00   Mean   :159.00   Mean   :175.2   Mean   :152.20  
##  3rd Qu.:0   3rd Qu.:136.50   3rd Qu.:230.75   3rd Qu.:279.2   3rd Qu.:251.00  
##  Max.   :0   Max.   :364.00   Max.   :477.00   Max.   :490.0   Max.   :438.00  
##      X2021        crecimiento    
##  Min.   :  3.0   Min.   :0.1566  
##  1st Qu.: 44.0   1st Qu.:0.3539  
##  Median :115.0   Median :0.6444  
##  Mean   :151.5   Mean   :1.6423  
##  3rd Qu.:227.5   3rd Qu.:1.8750  
##  Max.   :421.0   Max.   :6.5000

Propuesta 1

Una propuesta para Form sería enfocarse en atraer clientes que sean de origen Europeo o que sus instalaciones estén en ese continente. La gráfica cualitativa se elaboro con el top 10 de países que mostraron más porcentaje de crecimiento en producción de “autos pasajeros” durante el periodo 2017-2021 y mostró que el 50% de los países que estuvieron en el top 10 son de Europa.

Propuesta 2

En la gráfica de datos cuantitativos podemos observar que en el 2020 hubo una baja muy significativa y esto es resultado de la pandemia producida por el “COVID-19”. La propuesta va hacia la elaboración de manuales pertinentes y realizar pruebas basadas en escenarios de emergencia, esto con la finalidad de fortalecer el sistema de gestión de riesgos para hacer frente a los acontecimientos negativos cuando estos se presenten.

Tablas y gráficos

Tabla de frecuencia

paises <- c("Europa", "Asia", "Asia", "Africa", "Asia", "Europa", "Europa", "Europa", "Asia", "Europa")
table(bd7$Continente)

## 
## Africa   Asia Europa 
##      1      4      5

Gráficos de datos cualitativos y cuantitativos

Gráficos de datos cualitativos

#install.packages("plyr")
library(plyr)
proporciones <- c(4, 1, 5)
etiquetas <- c("Asia", "Africa", "Europa")
pct <- round(proporciones/sum(proporciones)*100)
etiquetas <- paste(etiquetas, pct)
etiquetas <- paste(etiquetas,"%",sep="")
pie(proporciones,labels = etiquetas,
    col=rainbow(length(etiquetas)),
    main="Diagrama de tarta")

Gráficos datos cuantitativos

Eliminar variables que no necesito

bd8 <- bd7
borrar <- c("Geography", "Continente", "Category", "Data.Type", "Unit")
bd9 <- bd8[ , !(names(bd8) %in% borrar)]
summary(bd9)

##      X2017            X2018            X2019           X2020       
##  Min.   :  1.00   Min.   :  1.00   Min.   :  2.0   Min.   :  2.00  
##  1st Qu.: 11.75   1st Qu.: 21.75   1st Qu.: 26.0   1st Qu.: 34.25  
##  Median : 83.50   Median :165.00   Median :168.5   Median :116.00  
##  Mean   :107.00   Mean   :159.00   Mean   :175.2   Mean   :152.20  
##  3rd Qu.:136.50   3rd Qu.:230.75   3rd Qu.:279.2   3rd Qu.:251.00  
##  Max.   :364.00   Max.   :477.00   Max.   :490.0   Max.   :438.00  
##      X2021        crecimiento    
##  Min.   :  3.0   Min.   :0.1566  
##  1st Qu.: 44.0   1st Qu.:0.3539  
##  Median :115.0   Median :0.6444  
##  Mean   :151.5   Mean   :1.6423  
##  3rd Qu.:227.5   3rd Qu.:1.8750  
##  Max.   :421.0   Max.   :6.5000

Elaborar las variables que necesito. Las variables son a partir de la base de datos

fecha <- c(2017:2021)
suma_por_año <- c(sum(bd7$X2017), sum(bd7$X2018), sum(bd7$X2019), sum(bd7$X2020), sum(bd7$X2021))
bd9 <- cbind(bd9, fecha, suma_por_año)
borrar <- c("crecimiento", "X2017", "X2018", "X2019", "X2020", "X2021")
bd10 <- bd9[ , !(names(bd9) %in% borrar)]

Base de datos con las únicas dos variables que ocupo

summary(bd10)

##      fecha       suma_por_año 
##  Min.   :2017   Min.   :1070  
##  1st Qu.:2018   1st Qu.:1515  
##  Median :2019   Median :1522  
##  Mean   :2019   Mean   :1490  
##  3rd Qu.:2020   3rd Qu.:1590  
##  Max.   :2021   Max.   :1752

?plot

## Help on topic 'plot' was found in the following packages:
## 
##   Package               Library
##   graphics              /Library/Frameworks/R.framework/Versions/4.2/Resources/library
##   base                  /Library/Frameworks/R.framework/Resources/library
## 
## 
## Using the first match ...

plot(bd10, xlab = "fecha del 2017 al 2021", type = "b")

Gráficos de dispersión

summary(bd7)

##   Geography          Continente          Category          Data.Type        
##  Length:10          Length:10          Length:10          Length:10         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##       Unit       X2017            X2018            X2019           X2020       
##  Min.   :0   Min.   :  1.00   Min.   :  1.00   Min.   :  2.0   Min.   :  2.00  
##  1st Qu.:0   1st Qu.: 11.75   1st Qu.: 21.75   1st Qu.: 26.0   1st Qu.: 34.25  
##  Median :0   Median : 83.50   Median :165.00   Median :168.5   Median :116.00  
##  Mean   :0   Mean   :107.00   Mean   :159.00   Mean   :175.2   Mean   :152.20  
##  3rd Qu.:0   3rd Qu.:136.50   3rd Qu.:230.75   3rd Qu.:279.2   3rd Qu.:251.00  
##  Max.   :0   Max.   :364.00   Max.   :477.00   Max.   :490.0   Max.   :438.00  
##      X2021        crecimiento    
##  Min.   :  3.0   Min.   :0.1566  
##  1st Qu.: 44.0   1st Qu.:0.3539  
##  Median :115.0   Median :0.6444  
##  Mean   :151.5   Mean   :1.6423  
##  3rd Qu.:227.5   3rd Qu.:1.8750  
##  Max.   :421.0   Max.   :6.5000

library(ggplot2)

ggplot(bd7, aes(x=X2020, y=crecimiento)) + 
  geom_point()

ggplot(bd7, aes(x=X2021, y=crecimiento)) + 
  geom_point()

LS0tCnRpdGxlOiA8c3BhbiBzdHlsZT0iQ29sb3I6T3JhbmdlIj4iRXZpZGVuY2lhIDIuMiIKYXV0aG9yOiAiRGFuYSBQZXJleiAtIEEwMDIyNzA0MSIKZGF0ZTogIjkvMjIvMjAyMiIKb3V0cHV0OiAKICBodG1sX2RvY3VtZW50OiAKICAgIHRvYzogdHJ1ZQogICAgdG9jX2Zsb2F0OiB0cnVlCiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlCi0tLQoKPGltZyBzcmM9Ii9Vc2Vycy9kYW5uYXBlcmV6L0Rlc2t0b3AvaW1hZ2VuZXMgcGFyYSBIVE1ML0NhcHR1cmEgZGUgUGFudGFsbGEgMjAyMi0wOS0yMiBhIGxhKHMpIDIyLjEzLjExLnBuZyI+CgojIDxzcGFuIHN0eWxlPSJDb2xvcjpCbHVlIj4gRW50cmVnYWJsZSAyLjI6IEFuw6FsaXNpcyBlc3RhZMOtc3RpY28gZGVzY3JpcHRpdm8KQ3N2IGNvbiBjb250aW5lbnRlIHBhcmEgZWxhYm9yYXIgdGFibGEgZGUgZnJlY3VlbmNpYQpgYGB7cn0KI2ZpbGUuY2hvb3NlKCkKYmQ3IDwtIHJlYWQuY3N2KCIvVXNlcnMvZGFubmFwZXJlei9EZXNrdG9wL1IvUk1EL0Jhc2VfZGVfZGF0b3NfY29udGluZW50ZXMuY3N2IikKc3VtbWFyeShiZDcpCmBgYAoKIyMgUHJvcHVlc3RhIDEKVW5hIHByb3B1ZXN0YSBwYXJhIEZvcm0gc2Vyw61hIGVuZm9jYXJzZSBlbiBhdHJhZXIgY2xpZW50ZXMgcXVlIHNlYW4gZGUgb3JpZ2VuIEV1cm9wZW8gbyBxdWUgc3VzIGluc3RhbGFjaW9uZXMgZXN0w6luIGVuIGVzZSBjb250aW5lbnRlLiBMYSBncsOhZmljYSBjdWFsaXRhdGl2YSBzZSBlbGFib3JvIGNvbiBlbCB0b3AgMTAgZGUgcGHDrXNlcyBxdWUgbW9zdHJhcm9uIG3DoXMgcG9yY2VudGFqZSBkZSBjcmVjaW1pZW50byBlbiBwcm9kdWNjacOzbiBkZSAiYXV0b3MgcGFzYWplcm9zIiBkdXJhbnRlIGVsIHBlcmlvZG8gMjAxNy0yMDIxIHkgbW9zdHLDsyBxdWUgZWwgNTAlIGRlIGxvcyBwYcOtc2VzIHF1ZSBlc3R1dmllcm9uIGVuIGVsIHRvcCAxMCBzb24gZGUgRXVyb3BhLiAKCiMjIFByb3B1ZXN0YSAyCkVuIGxhIGdyw6FmaWNhIGRlIGRhdG9zIGN1YW50aXRhdGl2b3MgcG9kZW1vcyBvYnNlcnZhciBxdWUgZW4gZWwgMjAyMCBodWJvIHVuYSBiYWphIG11eSBzaWduaWZpY2F0aXZhIHkgZXN0byBlcyByZXN1bHRhZG8gZGUgbGEgcGFuZGVtaWEgcHJvZHVjaWRhIHBvciBlbCAqIkNPVklELTE5IiouIExhIHByb3B1ZXN0YSB2YSBoYWNpYSBsYSBlbGFib3JhY2nDs24gZGUgbWFudWFsZXMgIHBlcnRpbmVudGVzIHkgcmVhbGl6YXIgcHJ1ZWJhcyBiYXNhZGFzIGVuIGVzY2VuYXJpb3MgZGUgZW1lcmdlbmNpYSwgZXN0byBjb24gbGEgZmluYWxpZGFkIGRlIGZvcnRhbGVjZXIgZWwgc2lzdGVtYSBkZSBnZXN0acOzbiBkZSByaWVzZ29zIHBhcmEgaGFjZXIgZnJlbnRlIGEgbG9zIGFjb250ZWNpbWllbnRvcyBuZWdhdGl2b3MgY3VhbmRvIGVzdG9zIHNlIHByZXNlbnRlbi4gCgojIyBUYWJsYXMgeSBncsOhZmljb3MKIyMjIFRhYmxhIGRlIGZyZWN1ZW5jaWEgCmBgYHtyfQpwYWlzZXMgPC0gYygiRXVyb3BhIiwgIkFzaWEiLCAiQXNpYSIsICJBZnJpY2EiLCAiQXNpYSIsICJFdXJvcGEiLCAiRXVyb3BhIiwgIkV1cm9wYSIsICJBc2lhIiwgIkV1cm9wYSIpCnRhYmxlKGJkNyRDb250aW5lbnRlKQpgYGAKCiMjIyBHcsOhZmljb3MgZGUgZGF0b3MgY3VhbGl0YXRpdm9zIHkgY3VhbnRpdGF0aXZvcwojIyMjIEdyw6FmaWNvcyBkZSBkYXRvcyBjdWFsaXRhdGl2b3MgCmBgYHtyfQojaW5zdGFsbC5wYWNrYWdlcygicGx5ciIpCmxpYnJhcnkocGx5cikKcHJvcG9yY2lvbmVzIDwtIGMoNCwgMSwgNSkKZXRpcXVldGFzIDwtIGMoIkFzaWEiLCAiQWZyaWNhIiwgIkV1cm9wYSIpCnBjdCA8LSByb3VuZChwcm9wb3JjaW9uZXMvc3VtKHByb3BvcmNpb25lcykqMTAwKQpldGlxdWV0YXMgPC0gcGFzdGUoZXRpcXVldGFzLCBwY3QpCmV0aXF1ZXRhcyA8LSBwYXN0ZShldGlxdWV0YXMsIiUiLHNlcD0iIikKcGllKHByb3BvcmNpb25lcyxsYWJlbHMgPSBldGlxdWV0YXMsCiAgICBjb2w9cmFpbmJvdyhsZW5ndGgoZXRpcXVldGFzKSksCiAgICBtYWluPSJEaWFncmFtYSBkZSB0YXJ0YSIpCmBgYAoKIyMjIyBHcsOhZmljb3MgZGF0b3MgY3VhbnRpdGF0aXZvcyAKRWxpbWluYXIgdmFyaWFibGVzIHF1ZSBubyBuZWNlc2l0bwpgYGB7cn0KYmQ4IDwtIGJkNwpib3JyYXIgPC0gYygiR2VvZ3JhcGh5IiwgIkNvbnRpbmVudGUiLCAiQ2F0ZWdvcnkiLCAiRGF0YS5UeXBlIiwgIlVuaXQiKQpiZDkgPC0gYmQ4WyAsICEobmFtZXMoYmQ4KSAlaW4lIGJvcnJhcildCnN1bW1hcnkoYmQ5KQpgYGAKCkVsYWJvcmFyIGxhcyB2YXJpYWJsZXMgcXVlIG5lY2VzaXRvLiBMYXMgdmFyaWFibGVzIHNvbiBhIHBhcnRpciBkZSBsYSBiYXNlIGRlIGRhdG9zCmBgYHtyfQpmZWNoYSA8LSBjKDIwMTc6MjAyMSkKc3VtYV9wb3JfYcOxbyA8LSBjKHN1bShiZDckWDIwMTcpLCBzdW0oYmQ3JFgyMDE4KSwgc3VtKGJkNyRYMjAxOSksIHN1bShiZDckWDIwMjApLCBzdW0oYmQ3JFgyMDIxKSkKYmQ5IDwtIGNiaW5kKGJkOSwgZmVjaGEsIHN1bWFfcG9yX2HDsW8pCmJvcnJhciA8LSBjKCJjcmVjaW1pZW50byIsICJYMjAxNyIsICJYMjAxOCIsICJYMjAxOSIsICJYMjAyMCIsICJYMjAyMSIpCmJkMTAgPC0gYmQ5WyAsICEobmFtZXMoYmQ5KSAlaW4lIGJvcnJhcildCgpgYGAKCkJhc2UgZGUgZGF0b3MgY29uIGxhcyDDum5pY2FzIGRvcyB2YXJpYWJsZXMgcXVlIG9jdXBvCmBgYHtyfQpzdW1tYXJ5KGJkMTApCj9wbG90CnBsb3QoYmQxMCwgeGxhYiA9ICJmZWNoYSBkZWwgMjAxNyBhbCAyMDIxIiwgdHlwZSA9ICJiIikKYGBgCgojIyMgR3LDoWZpY29zIGRlIGRpc3BlcnNpw7NuCmBgYHtyfQoKCgpzdW1tYXJ5KGJkNykKCmxpYnJhcnkoZ2dwbG90MikKCmdncGxvdChiZDcsIGFlcyh4PVgyMDIwLCB5PWNyZWNpbWllbnRvKSkgKyAKICBnZW9tX3BvaW50KCkKCmdncGxvdChiZDcsIGFlcyh4PVgyMDIxLCB5PWNyZWNpbWllbnRvKSkgKyAKICBnZW9tX3BvaW50KCkKCgpgYGAKCgoK

“Evidencia 2.2”

Dana Perez - A00227041

9/22/2022