En el presente informe se entregará un análisis realizado
a partir de los datos entregados por la BBDD de Púlsar, donde es
generaron distintos interpretaciones de los datos al mezclarse estos
entre si. Cabe destacar que los datos con los que se trabajará,
originalmente estaban almacenados en un archivo con distintas bases de
datos, los cuales fueron traspasados o capturados en un archivo Excel
nuevo para generar un BBDD especifica con la información relevante,
luego los mismos se traspasaron a la plataforma del software R. Todo
esto con el fin de poder obtener datos relevantes que permitan resolver
e informar sobre lo que señalado anteriormente.
Como se mencionó anteriormente los datos han sido
obtenidos de un documento de tipo Excel y posteriormente importados a la
IDE de R llamada R Studio, a continuación se muestra como es la
estructura de dichos datos:
library(readxl)
BBDD_Púlsar <- read_excel("BBDD_Púlsar.xlsx")
View(BBDD_Púlsar)
BBDD_Púlsar
Luego de esto, los datos ya se encuentran cargados en R. Para confirmar que los datos se encuentran con todas sus columnas respectivas cargadas, se extraen los nombres de las columnas para su revisión, ejecutando el siguiente comando:
colnames(BBDD_Púlsar) ## [1] "Instrumento" "Semestre" "Asignatura"
## [4] "Tipo curso" "NRC" "Escuela NRC"
## [7] "SDAD" "RA1" "RA2"
## [10] "RA3" "RA4" "RA5"
## [13] "RA6" "RA7" "RA8"
## [16] "RA9" "RA10" "RA11"
## [19] "RA12" "RA13" "RA14"
## [22] "RA15" "RA16" "RA17"
## [25] "Trabajo en Equipo" "Foco en el Cliente" "Expresión Efectiva"
## [28] "Autoaprendizaje" "Visita" "Campus nrc"
## [31] "Carrera Estudiante" "Escuela Estudiante"
En esta oportunidad fue necesario realizar una
transformación en los datos analizados ya que no todos eran del mismo
tipo (numérico). El único procedimiento que se realizó fue el cambio de
los datos N/A (nulos) presentes en el data set. Como primer paso se debe
determinar si existen datos N/A mediante el siguiente comando:
any(is.na(BBDD_Púlsar))## [1] TRUE
Si el valor retornado es “FALSE” se debe a que no existen valores N/A pero si el valor retornado es “TRUE” significa que si existen valores nulos dentro de los datos. En este caso y como fue mencionado anteriormente los datos están dentro de un documento Excel, a los cuales se les tuvo que aplicar una cierta limpieza como lo fue la transformación de todos los datos aplicados como N/A (espacios en blanco/nulos), los que fueron reemplazados por un “9” que representa “No aplica”. Quedando la BBDD de la siguiente manera:
suppressMessages(library(dplyr))
BBDD_Púlsar <- data.frame(BBDD_Púlsar)
BBDD_Púlsar <- mutate_if(BBDD_Púlsar, is.numeric,~replace(.,is.na(.),9))
View(BBDD_Púlsar)
BBDD_Púlsar
En primera instancia con los datos escogidos se pretendió
realizar un análisis exploratorio, con el fin de tener una mayor
claridad y orden de los datos que se utilizaran, esto debe realizarse
antes de aplicar cualquier técnica de estadística, el objetivo principal
de esto es tener una mayor comprensión de la base de datos, esto implica
observar la distribución de los datos para detectar alguna falla en el
diseño o en la recolección de la BBDD (base de datos).
Para este dataset se decidió aplicar estadística descriptiva para poder encontrar diversas características y comportamiento de los datos.
barplot(BBDD_Púlsar$RA1,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA2,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA3,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA4,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA5,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA6,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA7,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA8,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA9,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA10,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA11,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA12, xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA13, xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA14,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA15,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA16,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")barplot(BBDD_Púlsar$RA17,xlab = "Resultados de Aprendizaje", main = "Frecuencia de No aplica dentro de los RAP", ylab = "Puntuación", col = "brown")Luego de realizar todo este análisis al dataset presentado, se cumple el objetivo principal el cual era informar sobre la cantidad de siniestros automovilísticos que ocurren en nuestro país anualmente, esto nos lleva además a demostrar lo preocupante que son las cifras a pesar de que no hay un patrón influyente que haga que anualmente aumenten o disminuyan los accidentes, eso básicamente es azar, no obstante los accidentes se pueden evitar, como por ejemplo, culturizando a las personas sobre las leyes de tránsito con el fin de que a largo plazo ese si sea un factor influyente en la reducción de los accidentes automovilísticos.
Una de las labores más difíciles al realizar un trabajo de esta índole es encontrar el enfoque que se le va a dar al mismo, es por esto que se decide dar una visión más general pero a la vez relevante de cómo ha sido la evolución de los accidentes de tránsito dentro de los últimos 10 años ya que así se puede mostrar a las personas como es que si generar conciencia y se culturizan en este ámbito podrían dar solución a este problema social.
Como fue mencionado en los puntos anteriores se obtiene información relevante en este análisis, ya que a pesar de ser grande la cantidad de accidentes que ocurren, son muchas más personas que acaban con lesiones leves que fallecidos en los siniestros.
Además de todo lo destacado anteriormente si disminuyen los accidentes de tránsito el estado se ahorraría muchos millones de dólares que podrían invertirse en otros proyectos sociales.
Por último al analizar los datos se pueden percatar de que la distribución de los mismos en cierto aspectos formaba una distribución normal, por otra parte en otros aspectos se podría decir que de igual manera poseen una distribución normal pero con una leve desviación estándar de los datos.
Las funciones utilizadas en este trabajo fueron:
https://rpubs.com/IgnacioPerez/557886 R plotting: https://rpubs.com/Paraneda/rplot Estadística Descriptiva: http://www.rpubs.com/paraneda/SD1 Gráficos Estadísticos en R: https://cran.r-project.org/doc/contrib/grafi3.pdf Boxplot: https://www.youtube.com/watch?v=L59qaSEN2EM