La docencia universitaria o de educación superior es la piedra angular para el desarrollo social, científico y cultural de cualquier nación, pues son estos profesionales quienes no solo transmiten el conocimiento acumulado a las nuevas generaciones, sino que también lideran la creación de nuevo saber a través de la investigación, impulsan la innovación y fomentan el pensamiento crítico a los nuevos profesionales las cuales son habilidades indispensables para su buen desempeño a nivel profesional. En este orden de ideas la remuneración que perciben los docentes universitarios se convierte en un tema de crucial relevancia, pues el salario de un docente universitario no es simplemente un pago por servicios prestados, sino que representa una inversión en el capital humano más cualificado, un factor determinante para atraer y retener talento en las aulas y laboratorios, siendo un elemento motivacional que puede influir en la calidad de la enseñanza y la productividad investigativa. El panorama salarial de los académicos es inherentemente complejo y heterogéneo, difiere notablemente entre países, entre instituciones públicas y privadas, y dentro de las mismas universidades, está sujeto a una multiplicidad de factores. Elementos como el rango académico alcanzado (auxiliar, asistente, asociado, titular), el nivel de formación (maestría, doctorado), la experiencia acumulada, el tipo de vinculación contractual (tiempo completo, medio tiempo, hora cátedra), la productividad científica y la disciplina de conocimiento, configuran un mosaico variado de remuneraciones diverso en el mundo académico, es por eso que comprender la dinámica de estos salarios, los factores que los impulsan y las disparidades que puedan existir, es fundamental no solo para los propios docentes, sino también para los administradores universitarios, los gobiernos, administraciones territoriales y los responsables de la formulación de políticas educativas y científicas para lograr una academia fuerte y bien sustentada. El análisis en el presente informe pretende evaluar mediante herramientas exploratorias de la estadística a partir de una muestra la equidad, la competitividad y la sostenibilidad de los sistemas de compensación con el fin de conocer las dinámicas salariales en los Estados Unidos.
Se tomó una muestra aleatoria de 53 docentes universitarios con las siguientes variables a considerar
Sex: Género de los docentes que discretiza entre “hombres” y “mujeres”
Rank: Rango del docente, que discretiza los docentes según su dedicación, entre los cuales se encuentran los de dedicación completa “Full”, asociados “associate” y a los asistentes “assistant”.
Degree: Nivel de formación del docente, que discretiza entre doctorado “doctorade” y maestría “masters”.
Salary: Salario que devenga cada docente al año en dólares
Yt: Los años de experiencia que tiene cada docente.
Yd: Años transcurridos desde la obtención de su título de maestría o doctorado
A continuación, de describirá el proceso de redacción para el código desde su inicio hasta el fin. En primera instancia se instalan los paquetes que se necesitan para calcular y analizar la muestra. Los paquetes en R son en esencia una caja de herramientas con funciones determinadas las cuales, según las necesidades del análisis dado, se instalan aquellos que correspondan con las funciones necesarias.
install.packages("dplyr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
install.packages("ggplot2")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
install.packages("moments")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
install.packages("corrplot")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
Posteriormente, se llaman a las librerías, las cuales sirven para ejecutar acciones específicas sobre el conjunto de datos que ese está estudiando, como permitir operaciones entre ellos, organizar, presentar, visualizar, entre otras, lo cual es fundamental para el proceso de análisis que estaremos llevando a cabo. Las librerías utilizadas en el presente trabajo fueron las siguientes:
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(moments)
library(corrplot)
## corrplot 0.95 loaded
library(readr)
library(knitr)
En esta parte de nuestro código, cargaremos nuestra muestra aleatoria, la cual es la base de datos que usaremos para analizar las variables anteriormente definidas. La base de datos está construida sobre el formato CSV de Excel, que separa cada variable mediante comas, para adjuntarlo hacemos uso de los siguientes comandos:
Salario_Profes<-read_csv("/cloud/project/Salario_Profes.csv")
## Rows: 52 Columns: 6
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (3): sex, rank, degree
## dbl (3): yt, yd, salary
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
attach(Salario_Profes)
names(Salario_Profes)
## [1] "sex" "rank" "yt" "degree" "yd" "salary"
mean(yt)
## [1] 7.480769
mean(yd)
## [1] 16.11538
Una vez cargada nuestra base de datos, continuamos
Vamos a calcular las medidas solicitadas y generar gráficos para cada variable continua de cada variable categórica y numérica.
Medidas de Centralidad: Indican cuál es el valor central o típico alrededor del cual se agrupan los datos.
Media: Es el promedio aritmético de todos los valores. Se calcula sumando todos los datos y dividiendo por el número total de datos. Es sensible a valores extremos.
Mediana: Es el valor que ocupa la posición central cuando todos los datos están ordenados de menor a mayor. Si el número de datos es par, es el promedio de los dos valores centrales. No es sensible a valores extremos.
Medidas de Variabilidad (o Dispersión): Describen cuánto se extienden o se agrupan los datos, es decir, su grado de homogeneidad o heterogeneidad.
Rango: Es la diferencia entre el valor máximo y el valor mínimo del conjunto de datos. Ofrece una idea rápida de la dispersión total.
Varianza: Mide la dispersión promedio de los datos alrededor de la media, calculada como el promedio de las diferencias al cuadrado entre cada valor y la media. Sus unidades están al cuadrado.
Desviación Estándar: Es la raíz cuadrada de la varianza. Indica cuánto se desvían, en promedio, los datos de la media. Se expresa en las mismas unidades que los datos originales, facilitando su interpretación.
Rango Intercuartílico (IQR): Es la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1). Representa la dispersión del 50% central de los datos y es una medida robusta a valores extremos.
Medidas de Posición: Indican la ubicación de un dato específico en relación con el resto del conjunto o dividen la distribución en partes iguales.
Cuartiles (Q1, Q2, Q3): Son tres valores que dividen el conjunto de datos ordenado en cuatro partes iguales. Q1 (primer cuartil) deja por debajo el 25% de los datos, Q2 (segundo cuartil) es la mediana y deja por debajo el 50%, y Q3 (tercer cuartil) deja por debajo el 75%.
Percentiles (P1, P2,…, P99): Son 99 valores que dividen el conjunto de datos ordenado en cien partes iguales. El percentil k (Pk) es el valor por debajo del cual se encuentra el k% de los datos.
Puntuaciones Z (Z-scores): Indican a cuántas desviaciones estándar se encuentra un valor específico de la media del conjunto de datos. Permite comparar valores de diferentes distribuciones.
Medidas de Forma: Describen la forma de la distribución de los datos, usualmente visualizada a través de un histograma.
Asimetría (Skewness): Mide el grado de simetría (o falta de ella) de una distribución de datos respecto a su media.
Positiva: La cola derecha de la distribución es más larga (datos concentrados a la izquierda).
Negativa: La cola izquierda es más larga (datos concentrados a la derecha).
Cero (o cercana a cero): Distribución aproximadamente simétrica.
Curtosis (Kurtosis): Mide cuán “puntiaguda” o “achatada” es una distribución en comparación con una distribución normal (gaussiana), y cómo son sus colas.
Leptocúrtica (curtosis > 0): Más puntiaguda, colas más pesadas (más datos en los extremos).
Mesocúrtica (curtosis ≈ 0): Similar a la normal.
Platicúrtica (curtosis < 0): Más achatada, colas más ligeras.
Análisis de Datos Atípicos (Outliers): Se refiere a la identificación y estudio de valores que son inusualmente diferentes del resto de los datos en un conjunto.
Definición: Un dato atípico es una observación que se desvía significativamente de otras observaciones. Puede ser el resultado de un error de medición o de ingreso, o representar una variabilidad genuina y excepcional en los datos.
Importancia: Pueden distorsionar medidas estadísticas (como la media o la desviación estándar) y afectar los resultados de los análisis Gráficos: Para visualizar los datos
** Gráficos:**
Diagrama de barras o histograma
Diagrama de cajas y bigotes
hist(salary)
mean(salary)
## [1] 23797.65
median(salary)
## [1] 23719
Varianza_sal = var(salary)
Desiación_Estándar_sal = sd(salary)
Rango_sal = range(salary)
Rango_Iintercuartílico_sal = IQR(salary)
Varianza_sal
## [1] 35014311
Desiación_Estándar_sal
## [1] 5917.289
Rango_sal
## [1] 15000 38045
Rango_Iintercuartílico_sal
## [1] 9011.75
cuantiles_sal <- quantile(salary, probs = c(0.05, 0.25, 0.5, 0.75, 0.95), na.rm = TRUE)
cat("cuantiles_sal:\n")
## cuantiles_sal:
print(cuantiles_sal)
## 5% 25% 50% 75% 95%
## 16124.80 18246.75 23719.00 27258.50 34440.30
asimetria_sal = skewness(salary, na.rm = TRUE)
curtosis_sal = kurtosis(salary, na.rm = TRUE) # Exceso de curtosis (kurtosis - 3)
cat("asimetria_sal (Skewness):", asimetria_sal, "\n")
## asimetria_sal (Skewness): 0.4608939
cat("curtosis_sal:", curtosis_sal, "\n") # moments::kurtosis da el exceso de curtosis
## curtosis_sal: 2.493906
Q1 <- cuantiles_sal[2] # 0.25
Q3 <- cuantiles_sal[4] # 0.75
lim_inf <- Q1 - 1.5 * 9011.75
lim_sup <- Q3 + 1.5 * 9011.75
atipicos_sal <- salary[salary < lim_inf | salary > lim_sup]
cat("Valores atípicos (regla 1.5*IQR):", if(length(atipicos_sal) > 0) paste(atipicos_sal, collapse=", ") else "Ninguno", "\n")
## Valores atípicos (regla 1.5*IQR): Ninguno
boxplot(salary, main = "Salario docentes")
La Media (23.797.) y Mediana (23.719) son muy cercanos entre sí. La media es ligeramente superior a la mediana (23797.65 > 23719.00). Esto sugiere que la distribución de los salarios es ligeramente asimétrica hacia la derecha (positiva), lo que significa que hay algunos salarios un poco más altos que tiran del promedio hacia arriba.
Desviación Estándar (5.917): Indica que, en promedio, los salarios se desvían aproximadamente 5.917 dólares anuales de la media de 23.797. Esto representa una variabilidad de alrededor del 24.8% (5917 / 23797), lo cual puede considerarse una dispersión moderada
Rango (15000 a 38045): El salario más bajo es de 15000 y el más alto es de 38045, lo que da una amplitud total de 23045 unidades.
El 5% de los profesores gana menos de 16.124 dólares anuales
El 25% (primer cuartil, Q1) gana menos de 18.246. dólares anuales
El 50% (mediana o Q2) gana menos de 23.719 dólares anuales (confirmando el valor de la mediana).
El 75% (tercer cuartil, Q3) gana menos de 27.258 dólares anuales
El 95% de los profesores gana menos de 34.440 dólares anuales
Valores atípicos (regla 1.5*IQR): Ninguno Este es un hallazgo importante. Significa que, utilizando el criterio común del rango intercuartílico, no se identificaron salarios que fueran extremadamente altos o bajos en comparación con el resto del grupo.
hist(yd)
mean(yd)
## [1] 16.11538
median(yd)
## [1] 15.5
Varianza_yd = var(yd)
Desiación_Estándar_yd = sd(yd)
Rango_yd = range(yd)
Rango_Iintercuartílico_yd = IQR(yd)
Varianza_yd
## [1] 104.4962
Desiación_Estándar_yd
## [1] 10.22234
Rango_yd
## [1] 1 35
Rango_Iintercuartílico_yd
## [1] 16.5
cuantiles_yd <- quantile(yd, probs = c(0.05, 0.25, 0.5, 0.75, 0.95), na.rm = TRUE)
cat("cuantiles_yd:\n")
## cuantiles_yd:
print(cuantiles_yd)
## 5% 25% 50% 75% 95%
## 1.00 6.75 15.50 23.25 31.45
asimetria_yd = skewness(yd, na.rm = TRUE)
curtosis_yd = kurtosis(yd, na.rm = TRUE) # Exceso de curtosis (kurtosis - 3)
cat("asimetria_yd (Skewness):", asimetria_yd, "\n")
## asimetria_yd (Skewness): 0.07501461
cat("curtosis_yd:", curtosis_yd, "\n") # moments::kurtosis da el exceso de curtosis
## curtosis_yd: 1.868781
Q1 <- cuantiles_yd[2] # 0.25
Q3 <- cuantiles_yd[4] # 0.75
lim_inf <- Q1 - 1.5 * 9011.75
lim_sup <- Q3 + 1.5 * 9011.75
atipicos_yd <- yd[yd < lim_inf | yd > lim_sup]
cat("Valores atípicos (regla 1.5*IQR):", if(length(atipicos_yd) > 0) paste(atipicos_yd, collapse=", ") else "Ninguno", "\n")
## Valores atípicos (regla 1.5*IQR): Ninguno
boxplot(yd, main = "Salario docentes")
boxplot(yd, main = " Tiempo desde su graduación ")
Media (16.115 años) y Mediana (15.5 años): La media y la mediana son muy cercanas, con la media siendo solo ligeramente superior. Esto indica que el punto central de la distribución del tiempo desde la graduación se sitúa alrededor de los 15.5 a 16.1 años. La proximidad entre ambas sugiere una distribución bastante simétrica.
Desviación Estándar (10.222 años): Hay una dispersión considerable alrededor de la media. Una desviación estándar de más de 10 años, con una media de 16 años, implica que el tiempo desde la graduación varía significativamente entre los docentes
El 5% de los docentes tiene 1 año o menos desde su graduación (muy poca experiencia post-grado).
El 25% (Q1) tiene 6.75 años o menos.
El 50% (mediana) tiene 15.5 años o menos (la mitad del grupo).
El 75% (Q3) tiene 23.25 años o menos.
El 95% tiene 31.45 años o menos (solo un 5% tiene más tiempo desde la graduación). Estos cuantiles muestran una progresión bastante regular y una amplia gama de años desde la graduación representados en la muestra. La mitad de los docentes se encuentra entre 6.75 y 23.25 años desde su graduación.
mean(yt)# Media (Promedio Aritmético): (Suma de todos los valores)/(Cantidad de valores n)
## [1] 7.480769
Media_yt = mean(yt)
median(yt) #Valor que se encuentra exactamente en el medio de un conjunto de datos que ha sido ordenado de menor a mayor.
## [1] 7
Mediana__yt = median(yt)
#En este caso el valor de median es par, por tanto el el promedio de los dos valores centrales
hist(yt, main = "Tiempo desde su graduación")# Histograma
Varianza_yt = var(yt)
Desiación_Estándar_yt = sd(yt)
Rango_yt = range(yt)
Rango_Iintercuartílico_yt = IQR(yt)
Varianza_yt
## [1] 30.33296
Desiación_Estándar_yt
## [1] 5.507536
Rango_yt
## [1] 0 25
Rango_Iintercuartílico_yt
## [1] 8
cuantiles_yt <- quantile(yt, probs = c(0.05, 0.25, 0.5, 0.75, 0.95), na.rm = TRUE)
cat("cuantiles_yt:\n")
## cuantiles_yt:
print(cuantiles_yt)
## 5% 25% 50% 75% 95%
## 0.55 3.00 7.00 11.00 16.00
asimetria_yt = skewness(yt, na.rm = TRUE)
curtosis_yt = kurtosis(yt, na.rm = TRUE) # Exceso de curtosis (kurtosis - 3)
cat("asimetria_yt (Skewness):", asimetria_yt, "\n")
## asimetria_yt (Skewness): 0.768927
cat("curtosis_yt:", curtosis_yt, "\n") # moments::kurtosis da el exceso de curtosis
## curtosis_yt: 3.439519
Q1 <- cuantiles_yt[2] # 0.25
Q3 <- cuantiles_yt[4] # 0.75
lim_inf <- Q1 - 1.5 * 9011.75
lim_sup <- Q3 + 1.5 * 9011.75
atipicos_yt <- yt[yt < lim_inf | yt > lim_sup]
cat("Valores atípicos (regla 1.5*IQR):", if(length(atipicos_yt) > 0) paste(atipicos_yt, collapse=", ") else "Ninguno", "\n")
## Valores atípicos (regla 1.5*IQR): Ninguno
hist(yt, main = "Experiencia")# Histograma
boxplot(yt, main = " Experiencia ")
Media (7.48 años) y Mediana (7.0 años): La media es ligeramente superior a la mediana. Esto, junto con el valor de asimetría, sugiere que la distribución de la experiencia docente tiene un sesgo hacia la derecha. La experiencia “típica” se encuentra alrededor de los 7 años, pero algunos docentes con más años de experiencia elevan el promedio.
Desviación Estándar (5.51 años): Indica una dispersión considerable en los años de experiencia. Con una media de aproximadamente 7.5 años, una desviación estándar de 5.5 años es relativamente alta (alrededor del 73.6% de la media), lo que significa que los años de experiencia varían bastante entre los docentes.
Rango Intercuartílico (IQR) (8 años): El 50% central de los docentes tiene una experiencia que varía dentro de un intervalo de 8 años.
El 5% de los docentes tiene aproximadamente medio año de experiencia o menos (0.55 años).
El 25% (Q1) tiene 3 años de experiencia o menos.
El 50% (mediana) tiene 7 años de experiencia o menos.
El 75% (Q3) tiene 11 años de experiencia o menos.
El 95% de los docentes tiene 16 años de experiencia o menos (solo un 5% supera esta cifra). La mitad de los docentes tiene entre 3 y 11 años de experiencia. Hay una concentración notable en los rangos más bajos e intermedios de experiencia.
#ANÁLISIS DE VARIABLES CATEGÓRICAS
tabla_frec_sex = table(sex)
tabla_frec_sex
## sex
## female male
## 14 38
prop.table(tabla_frec_sex)
## sex
## female male
## 0.2692308 0.7307692
print(kable(tabla_frec_sex,col.names=c("sex", "Frecuencia Absoluta"), caption = paste("Frecuencias Absolutas de", sex)))
##
##
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de female
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de female
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de female
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de female
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de female
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de female
## Table: Frecuencias Absolutas de female
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de female
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de female
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de female
## Table: Frecuencias Absolutas de female
## Table: Frecuencias Absolutas de male
## Table: Frecuencias Absolutas de female
## Table: Frecuencias Absolutas de female
## Table: Frecuencias Absolutas de female
##
## |sex | Frecuencia Absoluta|
## |:------|-------------------:|
## |female | 14|
## |male | 38|
barplot(tabla_frec_sex, xlab = sex, ylab = "Frecuencia", col = rainbow(length(tabla_frec_sex)), las=2)
Mujeres Frecuencia Absoluta: 14 docentes
Proporción (Frecuencia Relativa): 0.2692308 (es decir, aproximadamente el 26.92%)
Hombres: Frecuencia Absoluta: 38 docentes
Proporción (Frecuencia Relativa): 0.7307692 (es decir, aproximadamente el 73.08%)
El número total de docentes en este conjunto de datos es de 14 + 38 = 52 docentes.
tabla_frec_rank = table(rank)
tabla_frec_rank
## rank
## assistant associate full
## 18 14 20
prop.table(tabla_frec_rank)
## rank
## assistant associate full
## 0.3461538 0.2692308 0.3846154
print(kable(tabla_frec_rank, col.names = c("Rango docente", "Frecuencia Absoluta"), caption = paste("Frecuencias Absolutas de", rank)))
##
##
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de associate
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de associate
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de associate
## Table: Frecuencias Absolutas de associate
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de associate
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de associate
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de associate
## Table: Frecuencias Absolutas de full
## Table: Frecuencias Absolutas de associate
## Table: Frecuencias Absolutas de associate
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de associate
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de associate
## Table: Frecuencias Absolutas de associate
## Table: Frecuencias Absolutas de associate
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de associate
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de assistant
## Table: Frecuencias Absolutas de assistant
##
## |Rango docente | Frecuencia Absoluta|
## |:-------------|-------------------:|
## |assistant | 18|
## |associate | 14|
## |full | 20|
barplot(tabla_frec_rank,
xlab = rank, ylab = "Frecuencia", col = rainbow(length(tabla_frec_rank)),)
Assistant (Asistente): Frecuencia Absoluta: 18 docentes y proporción (Frecuencia Relativa): 0.3461538 (aproximadamente el 34.62%)
Associate (Asociado): Frecuencia Absoluta: 14 docentes y proporción (Frecuencia Relativa): 0.2692308 (aproximadamente el 26.92%)
Full (Titular): Frecuencia Absoluta: 20 docentes y proporción (Frecuencia Relativa): 0.3846154 (aproximadamente el 38.46%)
El número total de docentes en este conjunto de datos, para los cuales se reporta el rango, es de 18 + 14 + 20 = 52 docentes, lo cual es consistente con el análisis de género previo.
tabla_frec_degree = table(degree)
tabla_frec_degree
## degree
## doctorate masters
## 34 18
prop.table(tabla_frec_degree)
## degree
## doctorate masters
## 0.6538462 0.3461538
print(kable(tabla_frec_degree, col.names = c("Formación", "Frecuencia Absoluta"), caption = paste("Frecuencias Absolutas de", degree)))
##
##
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de masters
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
## Table: Frecuencias Absolutas de doctorate
##
## |Formación | Frecuencia Absoluta|
## |:---------|-------------------:|
## |doctorate | 34|
## |masters | 18|
barplot(tabla_frec_degree,
xlab = degree, ylab = "Frecuencia", col = rainbow(length(tabla_frec_degree)),)
Doctorate (Doctorado): Frecuencia Absoluta: 34 docentes y proporción (Frecuencia Relativa): 0.6538462 (aproximadamente el 65.38%)
Masters (Maestría): Frecuencia Absoluta: 18 docentes y proporción (Frecuencia Relativa): 0.3461538 (aproximadamente el 34.62%)Algunas correlaciones
#COMPARACIONES DE INTERÉS
Como en presente informe pretende analizar el salario de los docentes universitarios, se procede a comparar el salario con las variables categóricas como género, nivel de formación y rango.
plot(salary ~ yd,
main = "Salario vs Años desde el título",
xlab = "Años desde que obtuvo el título",
ylab = "Salario",
pch = 16, col = "blue")
plot(salary ~ yt,
main = "Salario vs Experiencia",
xlab = "Experiencia",
ylab = "Salario",
pch = 16, col = "blue")
boxplot(salary ~ sex)
boxplot(salary ~ rank)
boxplot(salary ~ degree)
## **Resultados finales del análisis de las variables: ⮚ En general, los
salarios parecen formar un grupo relativamente homogéneo, aunque con una
tendencia a que algunos ganen un poco más y una mayor concentración de
valores en torno al promedio de lo que se esperaría en una curva normal
de los 23,700 dólares anuales sin valores atípicos.
⮚ La variable “tiempo transcurrido desde la graduación” de los docentes muestra una distribución muy simétrica, centrada alrededor de los 15-16 años. Presenta una variabilidad considerable, lo que indica una mezcla de docentes con poca, mediana y mucha experiencia post-graduación.
⮚ La experiencia de los docentes en este grupo se caracteriza por una media de aproximadamente 7.5 años, con una distribución moderadamente sesgada hacia la derecha, lo que sugiere una mayor concentración de docentes en los primeros años de su carrera y menos docentes con muchos años de experiencia.
⮚ En este grupo de 52 docentes, la categoría de rango académico más prevalente es “full”, seguida por “assistant”. El rango “associate” es el que cuenta con menos docentes. La distribución sugiere que una proporción significativa de los docentes se encuentra en el nivel más alto de la escala jerárquica o en el nivel de entrada, con un número menor en la categoría intermedia.
⮚ La mayoría de docentes cuenta con doctorado: La observación más destacada es que una mayoría de los docentes en esta muestra (casi dos tercios) posee un doctorado. Específicamente, el 65.38% de los docentes tiene este nivel de formación.
⮚ La formación académica no garantiza un salario alto
⮚ La experiencia si garantiza un salario alto
⮚ Los docentes hombres, por lo general, ganan mejor que las docentes mujeres.
https://rpubs.com/MyLifeIsRock/1331974
#Valor de estimación de Kernel para cada variable univariada
d= density(salary)
plot(d, main="densidad de kernel Salario")
polygon(d, col="green", border="blue")
e = density(yt)
plot(e, main="densidad de kernel experiencia")
polygon(e, col="yellow", border="blue")
plot(e)
f= density(yd)
plot(f, main = "densidad de kernel")
polygon(f, col="red",border = "blue")
```