Ejercicio 1. En un periodo de un año, se registraron 100 nacimientos de gemelos en la Maternidad Isidro Ayora de Quito. La distribución de los recién nacidos, de acuerdo al sexo, es la siguiente: \[\begin{array} {|r|r|r|} \hline 2 \text{ varones} & 2 \text{ mujeres} & \text{1 varón, 1 mujer} \\ 29 & 38 & 33 \\ \hline \end{array}\]Hipótesis Nula: \(H_{0}: p_{1} = p_{10},p_{2} = p_{20}, \dots, p_{k} = p_{k0}\)
Hipótesis Alternativa: \(H_{1}:\) Por lo menos una es diferente
Estadístico de Prueba: \(\chi^{2}_{obs} = \sum_{i=1}^{k} \frac{(n_{i} - np_{i0})^{2}}{np_{i0}}\)
Región de Rechazo. Se rechaza \(H_{0}\) si \(\chi^{2}_{obs} > \chi^{2}_{k-1, \alpha}\)
Se supone que la proporciones esperadas son p1 = p2 = 1/4 y p3 = 1/2. Probar la hipótesis a un nivel de significación del 5%.
Solución
##
## Chi-squared test for given probabilities
##
## data: fre_obs
## X-squared = 13.18, df = 2, p-value = 0.001374
## [1] "Se rechaza la hipótesis nula"
Ejercicio 1. En una investigación se desea revelar si existe relación entre el consumo de combustible y el origen de los carros que circulan por la ciudad. \[\begin{array} {|r|r|r|r|r|} \hline \text{Consumo} & \text{EEUU} & \text{Europa} & \text{Japón} & \text{Total} \\ \text{Bajo} & 76 & 56 & 70 & 202\\ \text{Alto} & 160 & 14 & 9 & 183\\ \hline \text{Total} & 236 & 70 & 79 & 385\\ \hline \end{array}\]Hipótesis Nula: \(H_{0}: p_{ij} = p_{i.}p_{.j}\)
Hipótesis Alternativa: \(H_{0}: p_{ij} \neq p_{i.}p_{.j}\) Por lo menos una es diferente
Estadístico de Prueba: \(\chi^{2}_{obs} = \sum_{i=1}^{r}\sum_{j=1}^{c} \frac{(n_{ij} - e_{ij})^{2}}{e_{ij}}\)
Región de Rechazo. Se rechaza \(H_{0}\) si \(\chi^{2}_{obs} > \chi^{2}_{(r-1)(c-1), \alpha}\)
Al nivel 5%, verificar si las dos variables están asociadas
Solución
num_filas = 2
num_columnas = 3
# Para ingresar los datos, se tiene que hacer columna por columna. SIN LOS TOTALES
datos = c(76,160,56,14,70,9)
tabla = as.table(matrix(data = datos,nrow = num_filas,ncol = num_columnas))
alpha = 0.05##
## Pearson's Chi-squared test
##
## data: tabla
## X-squared = 101.51, df = 2, p-value < 2.2e-16
## [1] "Se rechaza la hipótesis nula"
Determine si la mediana de las notas es 5
Solución
# Instalar el paquete BSDA
# Solicitar ayuda al docente para instalar
# Cargar la libreria BSDA
library(BSDA)## Loading required package: lattice
##
## Attaching package: 'BSDA'
## The following object is masked from 'package:datasets':
##
## Orange
# dos colas = "two.sided"
# cola izquierda = "less"
# cola derecha = "greater"
res = SIGN.test(datos, md = 5, alternative = "two.sided")
res##
## One-sample Sign-Test
##
## data: datos
## s = 8, p-value = 0.3877
## alternative hypothesis: true median is not equal to 5
## 95 percent confidence interval:
## 4.531909 7.246818
## sample estimates:
## median of x
## 6.3
##
## Achieved and Interpolated Confidence Intervals:
##
## Conf.Level L.E.pt U.E.pt
## Lower Achieved CI 0.8540 4.8000 6.8000
## Interpolated CI 0.9500 4.5319 7.2468
## Upper Achieved CI 0.9614 4.5000 7.3000
## [1] "No se rechaza la hipótesis nula"
Ejercicio 1. Ilustremos el uso del coeficiente de correlación por rangos de Spearman. Una empresa desea determinar si las personas que prometían el más alto potencial al momento de ser contratadas resultaron tener el registro de mayores ventas. Para investigarlo, el director de recursos humanos revisó los registros originales de las entrevistas de trabajo, expediente académico y cartas de recomendación de 10 miembros de la fuerza de ventas. Después de la revisión, el director clasifi có a las 10 personas con base en su potencial de éxito en el momento de ser contratadas y asignó el rango 1 a la persona que tuvo el mayor potencial. A continuación se recabaron los datos de las ventas reales de cada vendedor durante sus primeros dos años de empleo. Sobre la base de los registros de ventas reales se obtuvo una segunda califi cación de los 10 sujetos con base en el desempeño en las ventas.
\[\begin{array} {r|r} \text{En la contratación} & 2-4-7-1-6-3-10-9-8-5 \\ \text{Luego de la contratación} & 1-3-5-6-7-4-10-8-9-2 \end{array}\]Determine si existe una correlación entre la variables
Solución
##
## Spearman's rank correlation rho
##
## data: x and y
## S = 44, p-value = 0.02117
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.7333333
## [1] "Se rechaza la hipótesis nula"