Estos datos fueron recogidos de la información sobre el rendimiento corporal y tiene lassiguientes columnas: age, sexo, height_cm, weight_kg, body fat%, diastolic, systolic, gripForce,sit and bend forward_cm, sit-ups counts, broad jump_cm, class
Se seleccionan tres variables de estudio: age,height_cm y weight_kg
library(readr)
datos_taller <-read.csv("C:/Users/Usuario/Downloads/datos taller (1).csv")
View(datos_taller)
De estas variables se sabe que sus varianzas poblacionales son las siguiente:
var_edad<-185.9894
var_altura<-71.5558962
var_peso<- 144.382163
En este punto calcularemos las medias de cada una de las variables
Media_Edad <- mean(datos_taller$Age)
print(paste("La media de edad es:", Media_Edad))
## [1] "La media de edad es: 37.06"
Media_Altura<-mean(datos_taller$height_cm)
print(paste("La media de altura es:", Media_Altura))
## [1] "La media de altura es: 169.826"
Media_Peso<-mean(datos_taller$wight_kg)
print(paste("La media del peso es:", Media_Peso))
## [1] "La media del peso es: 68.1344"
Para calcular el tamaño de muestra necesario para tener una precisión del 3% o 5% con respecto a la media, se puede utilizar la fórmula siguiente:
n = (z^2 * s^2) / E^2
Iniciamos Multiplicando las medias de cada una de las varibles por el 3% y el 5 % respectivamente , esto siginificara nuestro error
error_3 <- 0.03
error_5 <- 0.05
error_edad_3 <- Media_Edad * error_3
error_altura_3 <- Media_Altura * error_3
error_peso_3 <- Media_Peso * error_3
print(paste("El error del 3% con respecto a la media para la variable edad es :", error_edad_3))
## [1] "El error del 3% con respecto a la media para la variable edad es : 1.1118"
print(paste("El error del 3% con respecto a la media para la variable Altura es :", error_altura_3))
## [1] "El error del 3% con respecto a la media para la variable Altura es : 5.09478"
print(paste("El error del 3% con respecto a la media para la variable Peso es :", error_peso_3))
## [1] "El error del 3% con respecto a la media para la variable Peso es : 2.044032"
error_edad_5 <- Media_Edad * error_5
error_altura_5 <- Media_Altura * error_5
error_peso_5 <- Media_Peso * error_5
print(paste("El error del 5% con respecto a la media para la variable edad es :", error_edad_5))
## [1] "El error del 5% con respecto a la media para la variable edad es : 1.853"
print(paste("El error del 5% con respecto a la media para la variable Altura es :", error_altura_5))
## [1] "El error del 5% con respecto a la media para la variable Altura es : 8.4913"
print(paste("El error del 5% con respecto a la media para la variable Peso es :", error_peso_5))
## [1] "El error del 5% con respecto a la media para la variable Peso es : 3.40672"
Nivel de confianza
NC<-qnorm(0.975,mean =0,sd=1)
NC
## [1] 1.959964
Teniendo ya los datos conocidos con anterioridad, ahora si aplicaremos la formula antes mencionada para cada una de las variables y aplicaremos un redondeo a cada uno de los resultados
n = (z^2 * s^2) / E^2
Iniciamos tomando el error del 3%
n_edad_3 <- (NC^2 * var_edad) / error_edad_3^2
n_altura_3 <- (NC^2 * var_altura) / error_altura_3^2
n_peso_3 <- (NC^2 * var_peso) / error_peso_3^2
cat("Tamaño de muestra necesario para un error del 3%:\n")
## Tamaño de muestra necesario para un error del 3%:
cat("Edad:", round(n_edad_3), "\n")
## Edad: 578
cat("Altura:", round(n_altura_3), "\n")
## Altura: 11
cat("Peso:", round(n_peso_3), "\n")
## Peso: 133
n_edad_5 <- (NC^2 * var_edad) / error_edad_5^2
n_altura_5 <- (NC^2 * var_altura) / error_altura_5^2
n_peso_5 <- (NC^2 * var_peso) / error_peso_5^2
cat("Tamaño de muestra necesario para un error del 5%:\n")
## Tamaño de muestra necesario para un error del 5%:
cat("Edad:", round(n_edad_5), "\n")
## Edad: 208
cat("Altura:", round(n_altura_5), "\n")
## Altura: 4
cat("Peso:", round(n_peso_5), "\n")
## Peso: 48
1.1 Si al final se sabe que la población total es de 347571 individuos. ¿Cuál es el nuevo valor de n de la muestra
#Nueva Poblacion
N <- 347571
n_edad_3_corr <- (NC^2 * var_edad * N) / (N * error_edad_3^2 + NC^2 * var_edad)
n_altura_3_corr <- (NC^2 * var_altura * N) / (N * error_altura_3^2 + NC^2 * var_altura)
n_peso_3_corr <- (NC^2 * var_peso * N) / (N * error_peso_3^2 + NC^2 * var_peso)
cat("Tamaño de muestra necesario para un error del 3% con corrección de población finita:\n")
## Tamaño de muestra necesario para un error del 3% con corrección de población finita:
cat("Edad:", round(n_edad_3_corr), "\n")
## Edad: 577
cat("Altura:", round(n_altura_3_corr), "\n")
## Altura: 11
cat("Peso:", round(n_peso_3_corr), "\n")
## Peso: 133
n_edad_5_corr <- (NC^2 * var_edad * N) / (N * error_edad_5^2 + NC^2 * var_edad)
n_altura_5_corr <- (NC^2 * var_altura * N) / (N * error_altura_5^2 + NC^2 * var_altura)
n_peso_5_corr <- (NC^2 * var_peso * N) / (N * error_peso_5^2 + NC^2 * var_peso)
cat("Tamaño de muestra necesario para un error del 5% con corrección de población finita:\n")
## Tamaño de muestra necesario para un error del 5% con corrección de población finita:
cat("Edad:", round(n_edad_5_corr), "\n")
## Edad: 208
cat("Altura:", round(n_altura_5_corr), "\n")
## Altura: 4
cat("Peso:", round(n_peso_5_corr), "\n")
## Peso: 48
¿Qué valor de proporción hace que la varianza de proporciones sea máxima? Realicelas operaciones correspondientes.?
Para la selección de muestra se conoce que el porcentaje de éxito es del 40%.Determine el valor de muestra para un error de precisión del 1% al 10%.
n = (Z^2 * p * q) / e^2
donde:
n: es el tamaño de muestra necesario Z : sera cada una de nuestras variables p : es la proporción poblacional de interés (también conocida como tasa de éxito) q : es el complemento de la proporción poblacional (es decir, q = 1 - p) e : es el error máximo permisible (también conocido como margen de error o precisión)
e<-seq(0,0.1,by=0.01)
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.4
q<-1-p
n<-c(((z^2)*p*q)/e)
n
## [1] Inf 92.195012 46.097506 30.731671 23.048753 18.439002 15.365835
## [8] 13.170716 11.524376 10.243890 9.219501
e<-seq(0,0.1,by=0.01)
nc<-0.95
p<-0.4
q<-1-p
n<-c(((n_edad_3^2)*p*q)/e)
n
## [1] Inf 8018134.1 4009067.0 2672711.4 2004533.5 1603626.8 1336355.7
## [8] 1145447.7 1002266.8 890903.8 801813.4
Para la selección de muestra se conoce que el porcentaje de éxito es del 50%.Determine el valor de muestra para un error de precisión del 1% al 10%.
e<-seq(0,0.1,by=0.01)
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.5
q<-1-p
n<-c(((z^2)*p*q)/e)
n
## [1] Inf 96.036471 48.018235 32.012157 24.009118 19.207294 16.006078
## [8] 13.719496 12.004559 10.670719 9.603647
e<-seq(0,0.1,by=0.01)
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.5
q<-1-p
n<-c(((n_edad_3^2)*p*q)/e)
n
## [1] Inf 8352223.0 4176111.5 2784074.3 2088055.7 1670444.6 1392037.2
## [8] 1193174.7 1044027.9 928024.8 835222.3
Para la selección de muestra se conoce que el porcentaje de éxito es del 60%.Determine el valor de muestra para un error de precisión del 1% al 10%
e<-seq(0,0.1,by=0.01)
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.6
q<-1-p
n<-c(((z^2)*p*q)/e)
n
## [1] Inf 92.195012 46.097506 30.731671 23.048753 18.439002 15.365835
## [8] 13.170716 11.524376 10.243890 9.219501
e<-seq(0,0.1,by=0.01)
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.6
q<-1-p
n<-c(((n_edad_3^2)*p*q)/e)
n
## [1] Inf 8018134.1 4009067.0 2672711.4 2004533.5 1603626.8 1336355.7
## [8] 1145447.7 1002266.8 890903.8 801813.4