Los ingresos por donaciones son una parte crítica de los presupuestos anuales en universidades. Un estudio realizado por National Association of College and University Business Officers informó que las 435 universidades encuestadas poseían 413 millones en donaciones. Las 10 universidades más ricas se muestran a continuación (The Wall Street Journal, 27 de de enero de, 2009). Las cantidades son en billones de dólares.
\[ \begin{array}{|c|c|c|c|} \hline \text { Universidad } & \text { Donaciones } & \text { Universidad } & \text { Donaciones } \\ \hline \text { Columbia } & 7.2 & \text { Princeton } & 16.4 \\ \hline \text { Harvard } & 36.6 & \text { Stanford } & 17.2 \\ \hline \text { M.I.T. } & 10.1 & \text { Texas } & 16.1 \\ \hline \text { Michigan } & 7.6 & \text { Texas A\&M } & 6.7 \\ \hline \text { Northwestern } & 7.2 & \text { Yale } & 22.9 \\ \hline \end{array} \]
install.packages(“modeest”)
library(modeest)
Donaciones<-c(7.2, 36.6, 10.1, 7.6, 7.2)
mean(Donaciones) #Media
## [1] 13.74
median(Donaciones) #Mediana
## [1] 7.6
mfv(Donaciones) #Moda
## [1] 7.2
summary(Donaciones) #Cuartiles
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 7.20 7.20 7.60 13.74 10.10 36.60
Se realizó una prueba de consumo de gasolina por kilometraje en automoviles, 13 automóviles fueron probados por 300 millas en ambas condiciones: ciudad y carretera. Los siguientes datos fueron recolectados en términos de millas por galón
\[ \begin{array}{|c|c|c|c|c|c|c|c|c|c|c|c|c|c|} \hline \text { Ciudad } & 16.2 & 16.7 & 15.9 & 14.4 & 13.2 & 15.3 & 16.8 & 16.0 & 16.1 & 15.3 & 15.2 & 15.3 & 16.2 \\ \hline \text { Carretera } & 19.4 & 20.6 & 18.3 & 18.6 & 19.2 & 17.4 & 17.2 & 18.6 & 19.0 & 21.1 & 19.4 & 18.5 & 18.7 \\ \hline \end{array} \]
Utilice la media, la mediana para concluir algo acerca de la diferencia en el rendimiento entre ciudad y carretera.
# Escriba sus códigos
ciudad<-c(16.2, 16.7, 15.9, 14.4, 13.2, 15.3, 16.8, 16.0, 16.1, 15.3, 15.2, 15.3, 16.2)
carretera<-c(19.4, 20.6, 18.3, 18.6, 19.2, 17.4, 17.2, 18.6, 19.0, 21.1, 19.4, 18.5, 18.7)
mean(ciudad)
## [1] 15.58462
median(ciudad)
## [1] 15.9
mean(carretera)
## [1] 18.92308
median(carretera)
## [1] 18.7
# Con las medidas de centro se puede establecer que el consumo de gasolina por millas es mayor en la ciudad, teniendo en cuenta que la media de la ciudad es 15.5 millas por galon y en la carretera es de 18.9. millas por galon. De la misma manera se evidencia el mismo compartamiento de la variable al analizar la media.
A Continuación se carga encuentra un link donde se encuentra una base de datos sobre los puntajes obtenidos por los estudiantes en una escuela secundaria Estudiantes de Estados Unidos https://drive.google.com/file/d/1Y-ngBOeKp1BQPz0q-93gFSvEhofpxCk1/view?usp=sharin9g Descarguela y carguela en R y proceda a responder las siguientes preguntas:
Encontrar la media y la mediana para la variable math.score para los estudiantes que hicieron tanto el curso de preparación como los que no lo hicieron. Comente sus resultados
# Escriba sus códigos
StudentsPerformance <- read.csv("~/Christian Figueroa/Especialización/Métodos estadísticos/Actividad 2/StudentsPerformance.csv")
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
x <- filter(StudentsPerformance, test.preparation.course=="none" )
summary(x)
## gender race.ethnicity parental.level.of.education
## Length:642 Length:642 Length:642
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
##
##
##
## lunch test.preparation.course math.score reading.score
## Length:642 Length:642 Min. : 0.00 Min. : 17.00
## Class :character Class :character 1st Qu.: 54.00 1st Qu.: 57.00
## Mode :character Mode :character Median : 64.00 Median : 67.00
## Mean : 64.08 Mean : 66.53
## 3rd Qu.: 74.75 3rd Qu.: 76.00
## Max. :100.00 Max. :100.00
## writing.score
## Min. : 10.0
## 1st Qu.: 54.0
## Median : 65.0
## Mean : 64.5
## 3rd Qu.: 74.0
## Max. :100.0
#La media en la calificación en matemáticas de los estudiantes que no estudiaron es 64.08 muy similar la valor de la mediana.
y <- filter(StudentsPerformance, test.preparation.course=="completed")
summary(y)
## gender race.ethnicity parental.level.of.education
## Length:358 Length:358 Length:358
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
##
##
##
## lunch test.preparation.course math.score reading.score
## Length:358 Length:358 Min. : 23.0 Min. : 37.00
## Class :character Class :character 1st Qu.: 60.0 1st Qu.: 65.00
## Mode :character Mode :character Median : 69.0 Median : 75.00
## Mean : 69.7 Mean : 73.89
## 3rd Qu.: 79.0 3rd Qu.: 84.00
## Max. :100.0 Max. :100.00
## writing.score
## Min. : 36.00
## 1st Qu.: 66.00
## Median : 76.00
## Mean : 74.42
## 3rd Qu.: 83.00
## Max. :100.00
#La media en la calificación en matemáticas de los estudiantes que estudiaron es 69.7 muy similar la valor de la mediana.
#Al comparar los resultados en matemáticas de los estudiantes que estudiaron vs los que no estudiaron se evidencia que los que estudiaron tienen en promedio mejores resultados.
# Escriba sus códigos
attach(StudentsPerformance)
hist(writing.score, xlim = c(0,100), ylim = c(0,300), main = "Histograma", xlab = "writing.scorer",
ylab="Frecuencia", col="steelblue")
#Teniendo en cuenta la gráfica se puede observar que la gran mayoría de los puntajes se encuentran entre 50 y 90 puntos y que la media y la mediana se encuentran cerca de los 70 puntos.
# Escriba sus códigos
library(ggplot2)
ggplot(data=StudentsPerformance, aes(y=math.score, x=gender))+
geom_boxplot(fill="steelblue")
# En la grafica de se puede observar que la media de hombres y mujeres es similar, siendo un poco mas elevada la de los hombres, las distribución de los resultados también es similar entre los dos generos, tal ves es importante rescatar que en las mujeres hay mas resultados alejados de la media.
Considere las variables math scorey reading score
# Escriba sus códigos
library(ggplot2)
#A. Gráfico de dispersión
ggplot(StudentsPerformance, aes(x=math.score, y=reading.score)) + geom_point() + ggtitle("Desempeño de las variables") + xlab("Matemáticas") + ylab("Lectura") + geom_smooth(method=lm)
## `geom_smooth()` using formula 'y ~ x'
cor(math.score, reading.score)
## [1] 0.8175797
#B. Correlación entre las variables
# El coeficiente de correlación entre la variable puntaje en matemátcas y puntaje en lectura es de 0.81, siendo esta una correlación significativa, tambien podemos decir que la asociación lineal es positiva.
# La ecuación de la recta que asocia a las variables es:
modelo=lm (data=StudentsPerformance, math.score ~ reading.score)
# Con un resultado de estimado de 7.35.
summary(modelo)
##
## Call:
## lm(formula = math.score ~ reading.score, data = StudentsPerformance)
##
## Residuals:
## Min 1Q Median 3Q Max
## -24.3419 -6.3419 -0.0221 6.2713 24.6581
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.35759 1.33818 5.498 4.87e-08 ***
## reading.score 0.84910 0.01893 44.855 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 8.736 on 998 degrees of freedom
## Multiple R-squared: 0.6684, Adjusted R-squared: 0.6681
## F-statistic: 2012 on 1 and 998 DF, p-value: < 2.2e-16
#C. Relación entre los variables.
#Teniendo en cuenta los resultados de las dos variables como lo son sus promedios, su disperción y la relación existente, su puede decir que los dos resultados de las pruebas de matemáticas y lectura se comportan de manera similar, con promedios cercanos al 70%, y muy pocos de estos de resultados alejados de a media.
¿Es eficiente el curso de preparación para los exámenes de matemáticas, Esscritura y Lectura?
# Escriba sus códigos
StudentsPerformance %>% group_by(test.preparation.course) %>% summarise(mean(math.score), mean(reading.score), mean(writing.score))
#Teniedo en cuenta el promedio obtenido en las 3 pruebas(Matemáticas, lectura y escritura) de los estudiantes que completaron el curso de preparación se puede inferiri que si es eficiente, estos estudiante obtuvieron mejores resultados comparados con los estudiantes que no comlpletaron el curso de preparación en la toalidad de las prueba, como lo muestra la tabla de promedios.