Este es un markdown para realizar un análisis bi variado la base de datos bddocente.
La información de esta base de datos contiene datos que caracterizan a la población docente y los resultados de las calificaciones obtenidas en el marco de la formación docente en servicio 2023:
Programa: Nombre de la acción formativa Región: Nombre de la región UGEL: Nombre de la Unidad de Gestión Educativa Local Cod.Modular_IE_Nexus: Código modular de la institución educativa Sexo: Sexo del docente Escala: Escala magisterial Con. Locaboral: Condición Laboral CE: Resultados de la calificación de entrada CS: Resultados de la calificación de salida
Abrimos todos los paquetes que usaremos para realizar el análisis bivariado.
library(foreign) #Paquete para importar datos
## Warning: package 'foreign' was built under R version 4.1.3
library(dplyr) #Paquete de procesamiento de bases de datos
## Warning: package 'dplyr' was built under R version 4.1.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(car) #Paquete de análisis de datos
## Warning: package 'car' was built under R version 4.1.3
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.1.3
##
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
##
## recode
library(xtable) #Paquete tablas en LaTeX
## Warning: package 'xtable' was built under R version 4.1.3
Importamos nuestra base de datos BD de docentes del sector público en Excel.
library(readxl)
## Warning: package 'readxl' was built under R version 4.1.3
bddocente <- read_excel("docentes_m3_inominada.xlsx")
Observamos nuestras variables de interés. Para esta sesión trabajaremos con las variables: SEXO, ESCALA (Escala Magistaria: A mayor Escala el docente tiene más experiencia, estudios y mejor desempeño), CS (prueba de salida)
names(bddocente)
## [1] "ID" "PROGRAMA" "REGIÓN"
## [4] "UGEL" "NEXUS" "COD.MODULAR_IE_NEXUS"
## [7] "NIVEL_NEXUS" "SEXO" "ESCALA"
## [10] "COND_LABORAL" "CE" "CS"
El attach nos permite invocar a las variables de manera autónoma.
attach(bddocente)
**1. Correlación lineal paramétrica y no paramétrica
Relacionaremos escala magisterial con calificación de la prueba de salida (CS). Pimero graficamos una dispersión de puntos para observar si existe algún tipo de relación. Agregamos una línea para identificar la relación lineal.`
Previamente al análisis de correlación, es necesario comprobar si nuestras variables numéricas tienen una distribución normal. En este caso utilizaremos la prueba shapiro.test.
shapiro.test(ESCALA)
##
## Shapiro-Wilk normality test
##
## data: ESCALA
## W = 0.89657, p-value < 2.2e-16
shapiro.test(CS)
##
## Shapiro-Wilk normality test
##
## data: CS
## W = 0.73109, p-value < 2.2e-16
Al analizar los resultados de p valor, encontramos que es menor a 0.05, por ello, sabemos que ambas variables tienen distribución normal.
Podemos también generar gráficos qqplot para seguir analizando el comportamiento de las variables, para verificar los resultados encontrados en la prueba de normalidad.
qqPlot(ESCALA)
## [1] 42 137
qqPlot(CS)
## [1] 686 837
En estos gráficos,logramos ver que los valores de cada variables no siguen el comportamiento esperado y “no Siguen” la recta esperada en la gráfica. ….. La prueba de correlación de Pearson permite determinar si existe asociación lineal entre dos variables continuas. Sus supuestos de aplicación son:
H0: r=0. No existe asociación lineal entre las variables. H1: r≠0. Hay asociación lineal entre las variables.
Se decide trabajar con un nivel de confianza del 95% y un nivel de significación de α=0.05
cor.test(ESCALA, CS, method = "pearson") # Podemos aplicar Pearson?
##
## Pearson's product-moment correlation
##
## data: ESCALA and CS
## t = 2.5178, df = 995, p-value = 0.01196
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.01756747 0.14095700
## sample estimates:
## cor
## 0.07956701
***En nuestro caso, con la prueba Shapiro comprobamos que las variables escogidas tiene distribución no normal. Por lo tanto, tenemos que trabajar con una prueba de asociación no paramétrica.
cor.test(ESCALA, CS, method = "spearman")
## Warning in cor.test.default(ESCALA, CS, method = "spearman"): Cannot compute
## exact p-value with ties
##
## Spearman's rank correlation rho
##
## data: ESCALA and CS
## S = 154739541, p-value = 0.04619
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.06315549
H0: r=0. No existe asociación lineal entre las variables. H1: r≠0. Hay asociación lineal entre las variables.
Se decide trabajar con un nivel de confianza del 95% y un nivel de significación de α=0.05
El valor obtenido es de 0.06 lo que nos indica que la relación es positiva pero muy cercana a 0 por lo cual, podemos decir que no hay asociación entre la escala magisterial y la calificación de la prueba de salida.
***. Creando un reporte en web sobre la base de datos. ¡Mira cómo te salen los resultados en tu navegador!
#eda_paged_report(carseats, output_format = "html")
tinytex::install_tinytex()