22/07/25
Abstract
Este manual fue generado por R Markdown. La teoría mencionada puede revisarse en el capítulo 3 de mis notas de clase que aparecen en el siguiente documento: 1.2. Estadística inferencial. Al final de esta guía, usted encontrará una serie de: (a) ejercicios, y (b) enlaces y materiales relacionados con la temática que se explica aquí. Usted encontrará otros documentos de posible interés en el siguiente enlace: https://rpubs.com/hllinas/toc.
library(dplyr) #A) Para filtrar data frames
Los siguientes datos representan los resultados obtenidos al realizar una encuesta a 400 estudiantes universitarios. En este documento, se importará la base de datos desde una dirección web (dos opciones):
Opción A (web, desde github): Para esta opción, se necesita cargar la librería “repmis”:
library(repmis)
source_data("https://github.com/hllinas/DatosPublicos/blob/main/Estudiantes.Rdata?raw=false")
datosCompleto <- Estudiantes
Opción B (web, desde Google Drive):
url.dat<- "http://bit.ly/Database-Estudiantes"
datosCompleto <- read.delim(url.dat)
Recuérdense las otras opciones, si tienen las bases de datos descargadas en su sesión de trabajo (ya sea en extensiones en Rdata, en excel o en otros formatos). Para más detalles, véase el documento R básico. A manera de ejemplo:
Opción C (local, con archivo en Rdata):
load(file="Estudiantes.Rdata")
datosCompleto <- Estudiantes
Opción D (local, con archivo en excel):
datosCompleto <- read.delim('clipboard')
El objetivo es realizar los ejercicios que se indican en las secciones de abajo.
Hipótesis estadística: Afirmación sobre uno o más parámetros de una o más poblaciones.
Hipótesis nula y alternativa
Tipos de pruebas de hipótesis. Si \(\theta\) es el parámetro de interés:
Comentarios:
Como se indica en el cuadro 3.1, hay dos tipos de errores: I y II.
El objetivo es realizar los ejercicios que se indican en las siguientes secciones, teniendo en cuenta la tabla de supuestos que se muestra abajo.
A). Es la región donde se rechaza \(H_0\). Para determinarla, se debe tener en cuenta la tabla de supuestos relacionada con la distribución muestral de una proporción (cuadro A.2).
B). La distribución a utilizar será la normal.
C). Los tres tipos de pruebas se muestran en el cuadro 3.4:
D). La región crítica es la región sombreada que aparece en la figura 3.3.
E). A los valores a, b, c y d que aparecen en la figura 3.3 o en el cuadro 3.4 se les llamará valores críticos.
A). Definición:
El \(P\)-valor es el mínimo nivel de significancia bajo la cual \(H_0\) es rechazada.
B). Regla de decisión (al nivel \(\alpha\)):
Se rechaza \(H_0\) cuando \(P\mbox{-valor} \; \leq \; \alpha\).
No se rechaza \(H_0\) cuando \(P\mbox{-valor} \; > \; \alpha\).
C). Fórmula para hallarlo:
El \(P\)-valor se calcula de la siguiente manera:
\[\text{$P$-valor} \;= \; \begin{cases} P(Z\leq z), & \text{para una prueba de una cola a la izquierda}, \\ & \\ P(Z\geq z), & \text{para una prueba de una cola a la derecha}, \\ &\\ 2\,P(Z\geq |z|),& \text{para una prueba de dos colas}. \end{cases} \]
Aquí \(z\) es el llamado valor de prueba, el cual es un posible valor de \(Z\).
El código para escribir la expresión anterior es:
$$\text{$P$-valor} \;= \;
\begin{cases}
P(Z\leq z), & \text{para una prueba de una cola a la izquierda}, \\
& \\
P(Z\geq z), & \text{para una prueba de una cola a la derecha}, \\
&\\
2\,P(Z\geq |z|),& \text{para una prueba de dos colas}.
\end{cases} $$
Realizar los siguientes ejercicios. Interprete todas sus respuestas.
a) Considere solamente las observaciones que van desde la 2 hasta la 35 y defina el data frame "datos2a35". Verifique su tamaño, variables y estructura.
b) Dentro de "datos2a35": Defina el objeto "Sexo" (género de los estudiantes). Conviértalo en factor y diga cuáles son sus respectivos niveles.
c) Dentro de "datos2a35": Construya una tabla de frecuencias para la variable Sexo y el diagrama de barras correspondiente.
d) Dentro de "datos2a35": Determine la proporción de mujeres.
e) Dentro de "datos2a35" y utilizando el método de la región crítica: Al nivel del 5%, determine si el porcentaje poblacional de mujeres es menor o igual que el 30%. Escriba un resumen del enunciado del problema, verifique los supuestos, concluya, diga cuál es la fórmula, el valor de prueba, el valor crítico, la región crítica e interprete.
f) Dentro de "datos2a35" y utilizando el método del P-valor: Determine si el porcentaje poblacional de mujeres es menor o igual que el 30%. Halle el P-valor, interprete y compare su decisión con el inciso (e).
g) Dentro de "datos2a35": Realice la misma prueba del inciso (h) con la función prop.test y compare los resultados obtenidos.
h) Dentro de "datos2a35": Con Geogebra (https://www.geogebra.org/classic#probability), realice la misma prueba de hipótesis del inciso (f) y compare los resultados obtenidos.
i) Dentro de "datos2a35": Con Geogebra, construya un intervalo del 95% de confianza para la proporción poblacional de mujeres y compare los resultados obtenidos en los incisos anteriores.
Filtramos y definimos como “datos2a35” al data frame con las observaciones del 2 al 35:
datos2a35 <- datosCompleto[2:35,] #A) La nueva base de datos
n <- nrow(datos2a35); n #B) Número observaciones (tamaño muestral)
## [1] 34
El número de observaciones y de variables se pueden revisar con:
dim(datos2a35) #C) Número observaciones y número de variables
Observamos que tamaño muestral es \(n=\) 34. Para revisar estructura y variables del data frame:
str(datos2a35) #D) Estructura
names(datos2a35) #E) Variables
Como la variable “Sexo” es categórica se debe definir como factor:
Sexo <- as.factor(datos2a35$Sexo) #F) La variable
Se puede revisar esta variable:
levels(Sexo)
class(Sexo)
La tabla de frecuencias no agrupadas para la variable fumadores es:
Cuentas <- table(Sexo); Cuentas #G) Tabla de frecuencias
## Sexo
## Femenino Masculino
## 20 14
El diagrama de barras:
barplot(Cuentas, main="Diagrama de barras", xlab="Sexo", ylab="Frecuencias", legend = rownames(Cuentas), col=c("pink","blue"), ylim = c(0, 30)) #G) Diagrama
Se pueden escoger más colores para las barra dando click en este aquí.
Calculamos la proporción de mujeres en la muestra, así:
f <- 20 #H) Frecuencia
pbarra <- f/n; pbarra #I) Proporción
## [1] 0.5882353
Es decir, el porcentaje de mujeres en la muestra es del 58.82%.
1. Datos:
* Unidades experimentales: Los estudiantes.
* Población: Respuesta a la pregunta: ¿Género?
* Estadístico: la proporción muestral de mujeres.
* Parámetro: la proporción poblacional de mujeres.
* Tamaño muestral: n=34.
* Tamaño poblacional: N es desconocido.
* Grado de confianza: 95%.
* Nivel de significancia: 5%.
* Hipótesis nula y alternativa:
\[H_0: p\leq 0.3 \quad \mbox{versus} \quad H_1: p > 0.3 \]
El código para escribir la expresión anterior es:
$$ H_0: p\leq 0.3 \quad \mbox{versus} \quad H_1: p > 0.3 $$
* Tipo de prueba: Prueba de una cola a la derecha.
* Otros datos: proporción muestral=0.5882353.
2. Verificación de supuestos:
De acuerdo a la tabla de supuestos (caso 1), tenemos que:
* El tamaño muestral es grande (n> 30).
3. Conclusión:
La distribución muestral de la proporción muestral es normal.
4. Fórmula:
Es la que aparece en la última columna del caso 1, es decir,
\[Z= \frac{\overline{p} - p}{\sqrt{\frac{p(1-p)}{n}}} \]
El código para escribir la expresión anterior es:
$$Z= \frac{\overline{p} - p}{\sqrt{\frac{p(1-p)}{n}}} $$
5. Cálculo del valor de prueba:
p <- 0.3 #J) Ver valor numérico en las hipótesis
proporcion <- pbarra
muestra <- n
ES <- sqrt(p*(1-p)/n) #K) Error estándar (= desviación estándar del estadístico)
Z <- (pbarra - p)/ES #L) Valor de prueba
Z
## [1] 3.667558
Observe que el error estándar es ES= 0.0785905 y el valor de prueba es 3.6675578.
6. Región crítica:
Tenemos una prueba una cola a la derecha.
7. Cálculo del valor crítico:
El valor crítico (o valor cuantil de la distribución normal) \(Z_{\alpha}\) es:
alfa <- 0.05
Critico <- qnorm(1-alfa) #M) Valor crítico
Critico
## [1] 1.644854
Es decir, \(Z_{\alpha}=\) 1.64485.
8. La decisión:
Se observa que el valor de prueba \(Z=\) 3.667558 cae en la región crítica. Es decir, se cumple: \[ Z \; > \; Z_{\alpha}\]
El código para escribir la expresión anterior es:
$$ Z \; > \; Z_{\alpha}$$
En R se verifica así:
Z> Critico #N) Región crítica
## [1] TRUE
O sea, se rechaza \(H_0: p\leq 0.3\). O, que es lo mismo, no se rechaza \(H_1: p> 0.3\).
9. Interpretación:
Con una confianza del 95%, podemos afirmar que el porcentaje poblacional de mujeres es mayor que el 30%.
1. Fórmula del \(P\)-valor:
Tenemos una prueba de una cola a la derecha. Por lo tanto, por la sección 7C, la fórmula que aplicaremos es la que se indica abajo:
\[\text{$P$-valor} \;= \; \begin{cases} & \text{para una prueba de una cola a la izquierda}, \\ & \\ P(Z\geq z), & \text{para una prueba de una cola a la derecha}, \\ &\\ & \text{para una prueba de dos colas}. \end{cases} \]
2. Cálculo del \(P\)-valor:
Con \(z=\) 3.667558 (el valor de prueba), el \(P\)-valor es: \[P\mbox{-valor} \; = \; P(Z \;\geq \; 3.667558) \; = \; 0.0001\]
El código para escribir la expresión anterior es:
$$P\mbox{-valor} \; = \; P(Z \;\geq \; 3.667558) \; = \; 0.0001$$
En R, el \(P\)-valor se calcula así:
1-pnorm(Z)
## [1] 0.0001224391
3. Regla de decisión:
Recordemos la regla de decisión (mencionada en el punto 2 de la sección 5.0.1):
Se rechaza \(H_0\) cuando \(P\mbox{-valor} \leq \alpha\).
No se rechaza \(H_0\) cuando \(P\mbox{-valor}> \alpha\).
4. La decisión:
Como el \(P\)-valor es menor que 0.05, por la regla de decisión (ver sección 7B), se rechaza \(H_0\) al nivel el 5%. Es decir, \(p>0.3\).
5. Interpretación:
Por consiguiente, con una confianza del 95%, podemos afirmar que el porcentaje poblacional de mujeres es mayor que el 30%.
En la función prop.test, el tipo de prueba se idicando igualando el argumento “alternative” a una de de las tres opciones siguientes: “two.sided” (dos colas), “less” (cola a la izquierda), “greater” (cola a la derecha). En este caso, seleccionamos “greater” porque tenemos una prueba de una cola a la derecha.
Prueba <-prop.test(f, n, p = 0.3, alternative = "greater")
Pvalor <- round(Prueba$p.value, 5)
Pvalor
## [1] 0.00025
Se observa que, con esta función, el \(P\)-valor obtenido es muy similar al de (f). Por lo tanto, las interpretaciones son las mismas en comparación con los resultados de los incisos anteriores.
En la imagen de abajo se pueden observar los resultados (de las pruebas de hipótesis e intervalos de confianza) encontrados con Geogebra.
En la figura (h) se observan los mismos resultados obtenidos en el inciso (f). En la figura (i) podemos observar que el intervalo no contiene valores de \(p\) menores o iguales que 0.3 (ya que su extremo inferior es 0.4228). Por esta razón, podemos concluir que los dos métodos (pruebas de hipótesis e intervalos de confianza) son equivalentes, ya que generan los mismos resultados.
Realizar los siguientes ejercicios. Interprete todas sus respuestas.
a) Considere el data frame "datos2a35" y el objeto "Sexo", definidos en el ejemplo 1. Dentro de "datos2a35", defina el objeto "Fuma" como la variable que indica si el estudiante es fumador o no.
b) Dentro de "datos2a35": Construya la tabla de contingencia para Fuma y Sexo y el diagrama de barras correspondiente (con colores, título principal, título en los ejes, etc.). En el grupo de los fumadores, determine la proporción de mujeres.
c) Dentro de "datos2a35": Defina el data frame "Fumadores" (obtenido al filtrar "datos2a35"), que representa a los estudiantes fumadores. Verifique su tamaño, variables y estructura.
d) Dentro de "Fumadores": Defina el objeto "SexoF" (género de los estudiantes), conviértalo en factor y diga cuáles son sus respectivos niveles.
e) Dentro "Fumadores": Construya una tabla de frecuencias para la variable SexoF y el diagrama de barras correspondiente.
f) Dentro "Fumadores": Determine la proporción de mujeres y compare con (b).
g) Dentro de "Fumadores" y utilizando el método de la región crítica: Al nivel del 5%, determine si si el porcentaje poblacional de mujeres es igual a 20%. Escriba un resumen del enunciado del problema, verifique los supuestos, concluya, diga cuál es la fórmula, el valor de prueba, el valor crítico, la región crítica e interprete.
h) Dentro de "Fumadores" y utilizando el método del P-valor: Determine si el porcentaje poblacional de mujeres es igual a 20%. Halle el P-valor e interprete.
i) Dentro de "Fumadores": Realice la misma prueba de hipótesis del inciso (h) con la función prop.test y compare los resultados obtenidos.
j) Dentro "Fumadores": Con Geogebra (https://www.geogebra.org/classic#probability), realice la misma prueba de hipótesis del inciso (h) y compare los resultados obtenidos.
k) Dentro "Fumadores": Con Geogebra (https://www.geogebra.org/classic#probability), construya un intervalo del 95% de confianza para la proporción poblacional de mujeres y compare los resultados obtenidos en los incisos anteriores.
Como la variable “Fuma” es categórica se debe definir como factor:
Fuma <- as.factor(datos2a35$Fuma) #A) La variable
Se puede revisar esta variable:
levels(Fuma)
class(Fuma)
La tabla de frecuencias no agrupadas para la variable fumadores es:
Cuentas <- table(Sexo, Fuma); Cuentas #B) Tabla de frecuencias
## Fuma
## Sexo No Si
## Femenino 9 11
## Masculino 5 9
El diagrama de barras:
barplot(Cuentas, main="Diagrama de barras", xlab="¿Fuma?", ylab="Frecuencias", legend = rownames(Cuentas), col=c("pink","blue"), ylim = c(0, 20), beside=TRUE)
Se pueden escoger más colores para las barra dando click en este aquí.
Calculamos la proporción de mujeres dentro del grupo de los fumadores, así:
pbarra <- 11/(11+9); pbarra #C) Proporción
## [1] 0.55
Es decir, el porcentaje de mujeres en la muestra es del 55%.
Filtramos nuestra base de datos:
Fumadores <- datos2a35 %>% filter(Fuma=="Si") #D) La nueva base de datos
n <- nrow(Fumadores); n #E) Número observaciones (tamaño muestral)
## [1] 20
El número de observaciones y de variables se pueden revisar con:
dim(Fumadores) #F) Número observacions y número de variables
Observamos que tamaño muestral es \(n=\) 20. Para revisar estructura y variables del data frame:
str(Fumadores) #G) Estructura
names(Fumadores) #H) Variables
Definimos la variable categórica y revisamos sus niveles:
SexoF <- as.factor(Fumadores$Sexo) #I) La variable Sexo en "Fumadores"
Se puede revisar las propiedades de esta variable:
levels(SexoF)
class(SexoF)
La tabla de frecuencias no agrupadas para la variable fumadores es:
Cuentas <- table(SexoF); Cuentas #J) Tabla de frecuencias
## SexoF
## Femenino Masculino
## 11 9
El diagrama de barras:
barplot(Cuentas, main="Diagrama de barras", xlab="Sexo", ylab="Frecuencias", legend = rownames(Cuentas), col=c("pink","blue"), ylim = c(0, 20))
Se pueden escoger más colores para las barra dando click en este aquí.
Calculamos la proporción de mujeres en la muestra, así:
f <- 11 #K) Frecuencia de éxitos
pbarraF <- f/n; pbarraF #L) Proporción
## [1] 0.55
Es decir, el porcentaje de mujeres en la muestra es del 55%. Al comparar con la proporción hallada en la parte (b), encontramos que ambas son iguales. En R se comprueba así:
pbarra==pbarraF
## [1] TRUE
1. Datos:
* Unidades experimentales: Los estudiantes que son fumadores
* Población: Respuesta a la pregunta: ¿Género?
* Estadístico: la proporción muestral de mujeres dentro de los fumadores.
* Parámetro: la proporción poblacional de mujeres dentro de los fumadores.
* Tamaño muestral: n=20.
* Tamaño poblacional: N es desconocido.
* Grado de confianza: 95%.
* Nivel de significancia: 5%.
* Hipótesis nula y alternativa:
\[H_0: p=0.2 \quad \mbox{versus} \quad H_1: p \ne 0.2\]
El código para escribir la expresión anterior es:
$$H_0: p=0.2 \quad \mbox{versus} \quad H_1: p \ne 0.2$$
* Tipo de prueba: Prueba de dos colas.
* Otros datos: proporción muestral=0.55.
2. Verificación de supuestos:
Se observa que el tamaño muestral es pequeño (n<30). Pero, de acuerdo a la tabla de supuestos (caso 2), tenemos que se cumplen que las dos condiciones siguientes:
* np=11 > 5 y n(1-p)=9 > 5
n*pbarra
## [1] 11
n*(1-pbarra)
## [1] 9
3. Conclusión:
La distribución muestral de la proporción muestral es normal.
4. Fórmula:
Es la que aparece en la última columna del caso 2, es decir,
\[Z= \frac{\overline{p} - p}{\sqrt{\frac{p(1-p)}{n}}} \]
El código para escribir la expresión anterior es:
$$Z= \frac{\overline{p} - p}{\sqrt{\frac{p(1-p)}{n}}} $$
5. Cálculo del valor de prueba:
p <- 0.2 #M) Ver valor numérico en las hipótesis
proporcion <- pbarra
muestra <- n
ES <- sqrt(p*(1-p)/n) #N) Error estándar (= desviación estándar del estadístico)
Z <- (pbarra - p)/ES #O) Valor de prueba
Z
## [1] 3.913119
Observe que el error estándar es ES= 0.0894427 y el valor de prueba es 3.913119.
6. Región crítica:
Tenemos una prueba de dos colas.
7. Cálculo del valor crítico:
El valor crítico (o valor cuantil de la distribución normal) \(Z_{\alpha/2}\) es:
alfa <- 0.05
Critico <- qnorm(1- (alfa/2)) #P) Valor crítico
Critico
## [1] 1.959964
Es decir, \(Z_{\alpha/2}=\) 1.95996.
8. La decisión:
Por lo tanto, se observa que el valor de prueba \(Z=\) 3.91312 cae en la región crítica (porque \(Z > Z_{\alpha/2}\)). Es decir, \(Z\) no está en la región de aceptación, a saber:
\[ -Z_{\alpha/2} \; < \; Z \; < \; Z_{\alpha/2}\]
El código para escribir la expresión anterior es:
$$ -Z_{\alpha/2} \; < \; < Z \; < \; Z_{\alpha/2}$$
En R se verifica así (el símbolo “|” indica el conectivo lógico “o”):
Z< -Critico | Z> Critico #Q) Región crítica
## [1] TRUE
O sea, se rechaza \(H_0: p=0.2\). Es decir, no se rechaza \(H_1: p \ne 0.2\).
9. Interpretación:
Cuando los estudiantes son fumadores, con una confianza del 95%, podemos afirmar que el porcentaje poblacional de mujeres es diferente del 20%.
1. Fórmula del \(P\)-valor:
Tenemos una prueba de dos colas. Por lo tanto, por la sección 7C, la fórmula que aplicaremos es la que se indica abajo:
\[\text{$P$-valor} \;= \; \begin{cases} & \text{para una prueba de una cola a la izquierda}, \\ & \\ & \text{para una prueba de una cola a la derecha}, \\ &\\ 2\,P(Z\geq |z|),& \text{para una prueba de dos colas}. \end{cases} \]
2. Cálculo del \(P\)-valor:
Con \(z=\) 3.91312 (el valor de prueba), el \(P\)-valor es: \[P\mbox{-valor} \; = \; 2\,P(Z \;\geq \; |3.91312|) \; = \; 2\,(0)\; = \; 0\]
El código para escribir la expresión anterior es:
$$P\mbox{-valor} \; = \; 2\,P(Z \;\geq \; |3.91312|) \; = \; 2\,(0)\; = \; 0$$
En R, el \(P\)-valor se calcula así:
2*(1-pnorm(Z))
## [1] 9.111162e-05
3. Regla de decisión:
Recordemos la regla de decisión (mencionada en el punto 2 de la sección 5.0.1):
Se rechaza \(H_0\) cuando \(P\mbox{-valor} \leq \alpha\).
No se rechaza \(H_0\) cuando \(P\mbox{-valor}> \alpha\).
4. La decisión:
Como el \(P\)-valor es menor que 0.05, por la regla de decisión (ver sección 7B), se rechaza \(H_0\) al nivel el 5%. Es decir, \(p\ne 0.2\).
5. Interpretación:
Cuando los estudiantes son fumadores, con una confianza del 95%, podemos afirmar que el porcentaje poblacional de mujeres es diferente del 20%.
En la función prop.test, el tipo de prueba se idicando igualando el argumento “alternative” a una de de las tres opciones siguientes: “two.sided” (dos colas), “less” (cola a la izquierda), “greater” (cola a la derecha). En este caso, seleccionamos “greater” porque tenemos una prueba de una cola a la derecha.
Prueba <-prop.test(f, n, p = 0.2, alternative = "two.sided")
Pvalor <- round(Prueba$p.value, 5)
Pvalor
## [1] 0.00028
Se observa que, con esta función, el \(P\)-valor obtenido es ligeramente diferente al hallado en (f). Aún así, sigue siendo menor que 0.05. Por lo tanto, las interpretaciones son las mismas en comparación con los resultados de los incisos anteriores.
En la imagen de abajo se pueden observar los resultados (de las pruebas de hipótesis e intervalos de confianza) encontrados con Geogebra.
En la figura (j) se observan los mismos resultados obtenidos en el inciso (h). En la figura (k) podemos observar que el intervalo no contiene al valor \(p=0.2\). Por esta razón, podemos concluir que los dos métodos (pruebas de hipótesis e intervalos de confianza) son equivalentes, ya que generan los mismos resultados. Es más, del intervalo presentado en la figura (k), con una confianza del 95%, podemos afirmar que, cuando los estudiantes fuman, el porcentaje de mujeres es mayor que el 20%.
Crear un nuevo documento R Markdown, realizando los ejercicios que se indican abajo.
Repetir el ejemplo 1, utilizando un nivel de significancia del
1%
10%
Compare los resultados hallados. Halle el P-valor en cada caso y compare también.
Repetir el ejemplo 2 con un grado de confianza del
1%
10%
Compare los resultados hallados. Halle el P-valor en cada caso y compare también.
Repetir el ejemplo 2, utilizando como referencia el grupo de los no fumadores y un nivel de significancia del:
1%
5%
10%
Compare los resultados hallados. Halle el P-valor en cada caso y compare también.
Realizar los siguientes ejercicios. Interprete todas sus respuestas.
Considere solamente las observaciones que van desde la 2 hasta la 35 y defina el data frame “datos2a35”. Verifique su tamaño, variables y estructura.
Dentro de “datos2a35”: Defina el objeto “Sexo” (género de los estudiantes). Conviértalo en factor y diga cuáles son sus respectivos niveles.
Dentro de “datos2a35”: Construya una tabla de frecuencias para la variable Sexo y el diagrama de barras correspondiente.
Dentro de “datos2a35”: Determine la proporción de hombres.
Dentro de “datos2a35” y utilizando el método de la región crítica: Al nivel del 5%, determine si el porcentaje poblacional de hombres es menor o igual que el 30%. Escriba un resumen del enunciado del problema, verifique los supuestos, concluya, diga cuál es la fómula, el valor de prueba, el valor crítico, la región crítica e interprete.
Dentro de “datos2a35” y utilizando el método del P-valor: Determine si el porcentaje poblacional de hombres es menor o igual que el 30%. Halle el P-valor, interprete y compare su decisión con el inciso (e).
Dentro de “datos2a35”: Realice la misma prueba del inciso (h) con la función prop.test y compare los resultados obtenidos.
Dentro de “datos2a35”: Con Geogebra (https://www.geogebra.org/classic#probability), realice la misma prueba de hipótesis del inciso (f) y compare los resultados obtenidos.
Dentro de “datos2a35”: Con Geogebra, construya un intervalo del 95% de confianza para la proporción poblacional de hombres y compare los resultados obtenidos en los incisos anteriores.
Realizar los siguientes ejercicios. Interprete todas sus respuestas.
Considere solamente las primeras 35 observaciones y defina el data frame “datos1a35”. Verifique su tamaño, variables y estructura.
Dentro de “datos1a35”: Defina el objeto “Sexo” (género de los estudiantes). Conviértalo en factor y diga cuáles son sus respectivos niveles.
Dentro de “datos1a35”: Construya una tabla de frecuencias para la variable Sexo y el diagrama de barras correspondiente.
Dentro de “datos1a35”: Determine la proporción de mujeres.
Dentro de “datos1a35” y utilizando el método de la región crítica: Al nivel del 5%, determine si el porcentaje poblacional de mujeres es menor o igual que el 30%. Escriba un resumen del enunciado del problema, verifique los supuestos, concluya, diga cuál es la fómula, el valor de prueba, el valor crítico, la región crítica e interprete.
Dentro de “datos1a35” y utilizando el método del P-valor: Determine si el porcentaje poblacional de mujeres es menor o igual que el 30%. Halle el P-valor, interprete y compare su decisión con el inciso (e).
Dentro de “datos1a35”: Realice la misma prueba del inciso (h) con la función prop.test y compare los resultados obtenidos.
Dentro de “datos1a35”: Con Geogebra (https://www.geogebra.org/classic#probability), realice la misma prueba de hipótesis del inciso (f) y compare los resultados obtenidos.
Dentro de “datos1a35”: Con Geogebra, construya un intervalo del 95% de confianza para la proporción poblacional de mujeres y compare los resultados obtenidos en los incisos anteriores.
Realizar los siguientes ejercicios. Interprete todas sus respuestas.
Considere solamente las primeras 35 observaciones y defina el data frame “datos1a35”. Verifique su tamaño, variables y estructura.
Dentro de “datos1a35”: Defina el objeto “Sexo” (género de los estudiantes). Conviértalo en factor y diga cuáles son sus respectivos niveles.
Dentro de “datos1a35”: Construya una tabla de frecuencias para la variable Sexo y el diagrama de barras correspondiente.
Dentro de “datos1a35”: Determine la proporción de hombres.
Dentro de “datos1a35” y utilizando el método de la región crítica: Al nivel del 5%, determine si el porcentaje poblacional de hombres es menor o igual que el 30%. Escriba un resumen del enunciado del problema, verifique los supuestos, concluya, diga cuál es la fómula, el valor de prueba, el valor crítico, la región crítica e interprete.
Dentro de “datos1a35” y utilizando el método del P-valor: Determine si el porcentaje poblacional de hombres es menor o igual que el 30%. Halle el P-valor, interprete y compare su decisión con el inciso (e).
Dentro de “datos1a35”: Realice la misma prueba del inciso (h) con la función prop.test y compare los resultados obtenidos.
Dentro de “datos1a35”: Con Geogebra (https://www.geogebra.org/classic#probability), realice la misma prueba de hipótesis del inciso (f) y compare los resultados obtenidos.
Dentro de “datos1a35”: Con Geogebra, construya un intervalo del 95% de confianza para la proporción poblacional de hombres y compare los resultados obtenidos en los incisos anteriores.
Realizar los siguientes ejercicios. Interprete todas sus respuestas.
Considere el data frame “datos2a35” y el objeto “Sexo”, definidos en el ejemplo 1. Dentro de “datos2a35”, defina el objeto “Fuma” como la variable que indica si el estudiante es fumador o no.
Dentro de “datos2a35”: Construya la tabla de contingencia para Fuma y Sexo y el diagrama de barras correspondiente (con colores, título principal, título en los ejes, etc.). En el grupo de los fumadores, determine la proporción de hombres.
Dentro de “datos2a35”: Defina el data frame “Fumadores” (obtenido al filtrar “datos2a35”), que representa a los estudiantes fumadores. Verifique su tamaño, variables y estructura.
Dentro de “Fumadores”: Defina el objeto “SexoF” (género de los estudiantes), conviértalo en factor y diga cuáles son sus respectivos niveles.
Dentro “Fumadores”: Construya una tabla de frecuencias para la variable SexoF y el diagrama de barras correspondiente.
Dentro “Fumadores”: Determine la proporción de hombres y compare con (b).
Dentro de “Fumadores” y utilizando el método de la región crítica: Al nivel del 5%, determine si si el porcentaje poblacional de hombres es igual a 40%. Escriba un resumen del enunciado del problema, verifique los supuestos, concluya, diga cuál es la fórmula, el valor de prueba, el valor crítico, la región crítica e interprete.
Dentro de “Fumadores” y utilizando el método del P-valor: Determine si si el porcentaje poblacional de hombres es igual a 40%. Halle el P-valor e interprete.
Dentro de “Fumadores”: Realice la misma prueba de hipótesis del inciso (h) con la función prop.test y compare los resultados obtenidos.
Dentro “Fumadores”: Con Geogebra (https://www.geogebra.org/classic#probability), realice la misma prueba de hipótesis del inciso (h) y compare los resultados obtenidos.
Dentro “Fumadores”: Con Geogebra (https://www.geogebra.org/classic#probability), construya un intervalo del 95% de confianza para la proporción poblacional de hombres y compare los resultados obtenidos en los incisos anteriores.
Realizar los siguientes ejercicios. Interprete todas sus respuestas.
Considere el data frame “datos1a35” que contiene las primeras 35 observaciones. Dentro de “datos1a35”, defina los objetos “Sexo” y “Fuma” como las variable que indican el género y si el estudiante es fumador o no, respectivamente.
Dentro de “datos1a35”: Construya la tabla de contingencia para Fuma y Sexo y el diagrama de barras correspondiente (con colores, título principal, título en los ejes, etc.). En el grupo de los fumadores, determine la proporción de mujeres.
Dentro de “datos1a35”: Defina el data frame “Fumadores” (obtenido al filtrar “datos2a35”), que representa a los estudiantes fumadores. Verifique su tamaño, variables y estructura.
Dentro de “Fumadores”: Defina el objeto “SexoF” (género de los estudiantes), conviértalo en factor y diga cuáles son sus respectivos niveles.
Dentro “Fumadores”: Construya una tabla de frecuencias para la variable SexoF y el diagrama de barras correspondiente.
Dentro “Fumadores”: Determine la proporción de mujeres y compare con (b).
Dentro de “Fumadores” y utilizando el método de la región crítica: Al nivel del 5%, determine si si el porcentaje poblacional de mujeres es igual a 40%. Escriba un resumen del enunciado del problema, verifique los supuestos, concluya, diga cuál es la fórmula, el valor de prueba, el valor crítico, la región crítica e interprete.
Dentro de “Fumadores” y utilizando el método del P-valor: Determine si si el porcentaje poblacional de mujeres es igual a 40%. Halle el P-valor e interprete.
Dentro de “Fumadores”: Realice la misma prueba de hipótesis del inciso (h) con la función prop.test y compare los resultados obtenidos.
Dentro “Fumadores”: Con Geogebra (https://www.geogebra.org/classic#probability), realice la misma prueba de hipótesis del inciso (h) y compare los resultados obtenidos.
Dentro “Fumadores”: Con Geogebra (https://www.geogebra.org/classic#probability), construya un intervalo del 95% de confianza para la proporción poblacional de mujeres y compare los resultados obtenidos en los incisos anteriores.
Realizar los siguientes ejercicios. Interprete todas sus respuestas.
Considere el data frame “datos1a35” que contiene las primeras 35 observaciones. Dentro de “datos1a35”, defina los objetos “Sexo” y “Fuma” como las variable que indican el género y si el estudiante es fumador o no, respectivamente.
Dentro de “datos1a35”: Construya la tabla de contingencia para Fuma y Sexo y el diagrama de barras correspondiente (con colores, título principal, título en los ejes, etc.). En el grupo de los fumadores, determine la proporción de hombres.
Dentro de “datos1a35”: Dentro de “datos1a35”: Defina el data frame “Fumadores” (obtenido al filtrar “datos2a35”), que representa a los estudiantes fumadores. Verifique su tamaño, variables y estructura.
Dentro de “Fumadores”: Defina el objeto “SexoF” (género de los estudiantes), conviértalo en factor y diga cuáles son sus respectivos niveles.
Dentro “Fumadores”: Construya una tabla de frecuencias para la variable SexoF y el diagrama de barras correspondiente.
Dentro “Fumadores”: Determine la proporción de hombres y compare con (b).
Dentro de “Fumadores” y utilizando el método de la región crítica: Al nivel del 5%, determine si el porcentaje poblacional de hombres es igual a 40%. Escriba un resumen del enunciado del problema, verifique los supuestos, concluya, diga cuál es la fórmula, el valor de prueba, el valor crítico, la región crítica e interprete.
Dentro de “Fumadores” y utilizando el método del P-valor: Determine si si el porcentaje poblacional de hombres es igual a 40%. Halle el P-valor e interprete.
Dentro de “Fumadores”: Realice la misma prueba de hipótesis del inciso (h) con la función prop.test y compare los resultados obtenidos.
Dentro “Fumadores”: Con Geogebra (https://www.geogebra.org/classic#probability), realice la misma prueba de hipótesis del inciso (h) y compare los resultados obtenidos.
Dentro “Fumadores”: Con Geogebra (https://www.geogebra.org/classic#probability), construya un intervalo del 95% de confianza para la proporción poblacional de hombres y compare los resultados obtenidos en los incisos anteriores.
LLinás, H., Estadística inferencial. Barranquilla: Editorial Universidad del Norte, 2006.
Geogebra: https://www.geogebra.org