Introducción

En el presente informe se entregará un análisis realizado a partir de los datos entregados por la BBDD de Púlsar, donde es generaron distintos interpretaciones de los datos al mezclarse estos entre si. Cabe destacar que los datos con los que se trabajará, originalmente estaban almacenados en un archivo con distintas bases de datos, los cuales fueron traspasados o capturados en un archivo Excel nuevo para generar un BBDD especifica con la información relevante, luego los mismos se traspasaron a la plataforma del software R. Todo esto con el fin de poder obtener datos relevantes que permitan resolver e informar sobre lo que señalado anteriormente.

Descripción de los datos, Obtención y Procesamiento

Como se mencionó anteriormente los datos han sido obtenidos de un documento de tipo Excel y posteriormente importados a la IDE de R llamada R Studio, a continuación se muestra como es la estructura de dichos datos:

library(readxl)
BBDD_Púlsar <- read_excel("BBDD_Púlsar.xlsx")
View(BBDD_Púlsar)
BBDD_Púlsar

Luego de esto, los datos ya se encuentran cargados en R. Para confirmar que los datos se encuentran con todas sus columnas respectivas cargadas, se extraen los nombres de las columnas para su revisión, ejecutando el siguiente comando:

colnames(BBDD_Púlsar)

##  [1] "Instrumento"        "Semestre"           "Asignatura"        
##  [4] "Tipo curso"         "NRC"                "Escuela NRC"       
##  [7] "SDAD"               "RA1"                "RA2"               
## [10] "RA3"                "RA4"                "RA5"               
## [13] "RA6"                "RA7"                "RA8"               
## [16] "RA9"                "RA10"               "RA11"              
## [19] "RA12"               "RA13"               "RA14"              
## [22] "RA15"               "RA16"               "RA17"              
## [25] "Trabajo en Equipo"  "Foco en el Cliente" "Expresión Efectiva"
## [28] "Autoaprendizaje"    "Visita"             "Campus nrc"        
## [31] "Carrera Estudiante" "Escuela Estudiante"

Transformación

En esta oportunidad fue necesario realizar una transformación en los datos analizados ya que no todos eran del mismo tipo (numérico). El único procedimiento que se realizó fue el cambio de los datos N/A (nulos) presentes en el data set. Como primer paso se debe determinar si existen datos N/A mediante el siguiente comando:

any(is.na(BBDD_Púlsar))

## [1] TRUE

Si el valor retornado es “FALSE” se debe a que no existen valores N/A pero si el valor retornado es “TRUE” significa que si existen valores nulos dentro de los datos. En este caso y como fue mencionado anteriormente los datos están dentro de un documento Excel, a los cuales se les tuvo que aplicar una cierta limpieza como lo fue la transformación de todos los datos aplicados como N/A (espacios en blanco/nulos), los que fueron reemplazados por un “9” que representa “No aplica”. Quedando la BBDD de la siguiente manera:

suppressMessages(library(dplyr))
BBDD_Púlsar <- data.frame(BBDD_Púlsar)
BBDD_Púlsar <- mutate_if(BBDD_Púlsar, is.numeric,~replace(.,is.na(.),9))
View(BBDD_Púlsar)
BBDD_Púlsar

En primera instancia con los datos escogidos se pretendió realizar un análisis exploratorio, con el fin de tener una mayor claridad y orden de los datos que se utilizaran, esto debe realizarse antes de aplicar cualquier técnica de estadística, el objetivo principal de esto es tener una mayor comprensión de la base de datos, esto implica observar la distribución de los datos para detectar alguna falla en el diseño o en la recolección de la BBDD (base de datos).

Resultados del Análisis

Para este dataset se decidió aplicar estadística descriptiva para poder encontrar diversas características y comportamiento de los datos.

barplot(BBDD_Púlsar$RA1,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA2,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA3,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA4,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA5,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA6,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA7,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA8,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA9,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA10,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA11,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA12, xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA13, xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA14,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA15,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA16,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

barplot(BBDD_Púlsar$RA17,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")

Luego de realizar todo este análisis al dataset presentado, se cumple el objetivo principal el cual era informar sobre la cantidad de siniestros automovilísticos que ocurren en nuestro país anualmente, esto nos lleva además a demostrar lo preocupante que son las cifras a pesar de que no hay un patrón influyente que haga que anualmente aumenten o disminuyan los accidentes, eso básicamente es azar, no obstante los accidentes se pueden evitar, como por ejemplo, culturizando a las personas sobre las leyes de tránsito con el fin de que a largo plazo ese si sea un factor influyente en la reducción de los accidentes automovilísticos.

Discusión

Una de las labores más difíciles al realizar un trabajo de esta índole es encontrar el enfoque que se le va a dar al mismo, es por esto que se decide dar una visión más general pero a la vez relevante de cómo ha sido la evolución de los accidentes de tránsito dentro de los últimos 10 años ya que así se puede mostrar a las personas como es que si generar conciencia y se culturizan en este ámbito podrían dar solución a este problema social.

Conclusión

Como fue mencionado en los puntos anteriores se obtiene información relevante en este análisis, ya que a pesar de ser grande la cantidad de accidentes que ocurren, son muchas más personas que acaban con lesiones leves que fallecidos en los siniestros.

Además de todo lo destacado anteriormente si disminuyen los accidentes de tránsito el estado se ahorraría muchos millones de dólares que podrían invertirse en otros proyectos sociales.

Por último al analizar los datos se pueden percatar de que la distribución de los mismos en cierto aspectos formaba una distribución normal, por otra parte en otros aspectos se podría decir que de igual manera poseen una distribución normal pero con una leve desviación estándar de los datos.

Referencias

Las funciones utilizadas en este trabajo fueron:

https://rpubs.com/IgnacioPerez/557886 R plotting: https://rpubs.com/Paraneda/rplot Estadística Descriptiva: http://www.rpubs.com/paraneda/SD1 Gráficos Estadísticos en R: https://cran.r-project.org/doc/contrib/grafi3.pdf Boxplot: https://www.youtube.com/watch?v=L59qaSEN2EM

Analisis de Datos BBDD Púlsar

Ignacio Andrés Perez Flores

19/04/2023