Estos datos fueron recogidos de la información sobre el rendimiento corporal y tiene lassiguientes columnas: age, sexo, height_cm, weight_kg, body fat%, diastolic, systolic, gripForce,sit and bend forward_cm, sit-ups counts, broad jump_cm, class
Se seleccionan tres variables de estudio: age,height_cm y weight_kg
library(readr)
datos_taller <-read.csv("C:/Users/Usuario/Downloads/datos taller (1).csv")
View(datos_taller)
De estas variables se sabe que sus varianzas poblacionales son las siguiente:
var_edad<-185.9894
var_altura<-71.5558962
var_peso<- 144.382163
En este punto calcularemos las medias de cada una de las variables
Media_Edad <- mean(datos_taller$Age)
print(paste("La media de edad es:", Media_Edad))
## [1] "La media de edad es: 37.06"
Media_Altura<-mean(datos_taller$height_cm)
print(paste("La media de altura es:", Media_Altura))
## [1] "La media de altura es: 169.826"
Media_Peso<-mean(datos_taller$wight_kg)
print(paste("La media del peso es:", Media_Peso))
## [1] "La media del peso es: 68.1344"
Para calcular el tamaño de muestra necesario para tener una precisión del 3% o 5% con respecto a la media, se puede utilizar la fórmula siguiente:
n = (z^2 * s^2) / E^2
Iniciamos Multiplicando las medias de cada una de las varibles por el 3% y el 5 % respectivamente , esto siginificara nuestro error
error_3 <- 0.03
error_5 <- 0.05
error_edad_3 <- Media_Edad * error_3
error_altura_3 <- Media_Altura * error_3
error_peso_3 <- Media_Peso * error_3
print(paste("El error del 3% con respecto a la media para la variable edad es :", error_edad_3))
## [1] "El error del 3% con respecto a la media para la variable edad es : 1.1118"
print(paste("El error del 3% con respecto a la media para la variable Altura es :", error_altura_3))
## [1] "El error del 3% con respecto a la media para la variable Altura es : 5.09478"
print(paste("El error del 3% con respecto a la media para la variable Peso es :", error_peso_3))
## [1] "El error del 3% con respecto a la media para la variable Peso es : 2.044032"
error_edad_5 <- Media_Edad * error_5
error_altura_5 <- Media_Altura * error_5
error_peso_5 <- Media_Peso * error_5
print(paste("El error del 5% con respecto a la media para la variable edad es :", error_edad_5))
## [1] "El error del 5% con respecto a la media para la variable edad es : 1.853"
print(paste("El error del 5% con respecto a la media para la variable Altura es :", error_altura_5))
## [1] "El error del 5% con respecto a la media para la variable Altura es : 8.4913"
print(paste("El error del 5% con respecto a la media para la variable Peso es :", error_peso_5))
## [1] "El error del 5% con respecto a la media para la variable Peso es : 3.40672"
Nivel de confianza
NC<-qnorm(0.975,mean =0,sd=1)
NC
## [1] 1.959964
Teniendo ya los datos conocidos con anterioridad, ahora si aplicaremos la formula antes mencionada para cada una de las variables y aplicaremos un redondeo a cada uno de los resultados
n = (z^2 * s^2) / E^2
Iniciamos tomando el error del 3%
n_edad_3 <- (NC^2 * var_edad) / error_edad_3^2
n_altura_3 <- (NC^2 * var_altura) / error_altura_3^2
n_peso_3 <- (NC^2 * var_peso) / error_peso_3^2
cat("Tamaño de muestra necesario para un error del 3%:\n")
## Tamaño de muestra necesario para un error del 3%:
cat("Edad:", round(n_edad_3), "\n")
## Edad: 578
cat("Altura:", round(n_altura_3), "\n")
## Altura: 11
cat("Peso:", round(n_peso_3), "\n")
## Peso: 133
n_edad_5 <- (NC^2 * var_edad) / error_edad_5^2
n_altura_5 <- (NC^2 * var_altura) / error_altura_5^2
n_peso_5 <- (NC^2 * var_peso) / error_peso_5^2
cat("Tamaño de muestra necesario para un error del 5%:\n")
## Tamaño de muestra necesario para un error del 5%:
cat("Edad:", round(n_edad_5), "\n")
## Edad: 208
cat("Altura:", round(n_altura_5), "\n")
## Altura: 4
cat("Peso:", round(n_peso_5), "\n")
## Peso: 48
1.1 Si al final se sabe que la población total es de 347571 individuos. ¿Cuál es el nuevo valor de n de la muestra
#Nueva Poblacion
N <- 347571
n_edad_3_corr <- (NC^2 * var_edad * N) / (N * error_edad_3^2 + NC^2 * var_edad)
n_altura_3_corr <- (NC^2 * var_altura * N) / (N * error_altura_3^2 + NC^2 * var_altura)
n_peso_3_corr <- (NC^2 * var_peso * N) / (N * error_peso_3^2 + NC^2 * var_peso)
cat("Tamaño de muestra necesario para un error del 3% con corrección de población finita:\n")
## Tamaño de muestra necesario para un error del 3% con corrección de población finita:
cat("Edad:", round(n_edad_3_corr), "\n")
## Edad: 577
cat("Altura:", round(n_altura_3_corr), "\n")
## Altura: 11
cat("Peso:", round(n_peso_3_corr), "\n")
## Peso: 133
n_edad_5_corr <- (NC^2 * var_edad * N) / (N * error_edad_5^2 + NC^2 * var_edad)
n_altura_5_corr <- (NC^2 * var_altura * N) / (N * error_altura_5^2 + NC^2 * var_altura)
n_peso_5_corr <- (NC^2 * var_peso * N) / (N * error_peso_5^2 + NC^2 * var_peso)
cat("Tamaño de muestra necesario para un error del 5% con corrección de población finita:\n")
## Tamaño de muestra necesario para un error del 5% con corrección de población finita:
cat("Edad:", round(n_edad_5_corr), "\n")
## Edad: 208
cat("Altura:", round(n_altura_5_corr), "\n")
## Altura: 4
cat("Peso:", round(n_peso_5_corr), "\n")
## Peso: 48
¿Qué valor de proporción hace que la varianza de proporciones sea máxima? Realicelas operaciones correspondientes.?
Para la selección de muestra se conoce que el porcentaje de éxito es del 40%.Determine el valor de muestra para un error de precisión del 1% al 10%.
n = (Z^2 * p * q) / e^2
donde:
n: es el tamaño de muestra necesario Z : sera cada una de nuestras variables p : es la proporción poblacional de interés (también conocida como tasa de éxito) q : es el complemento de la proporción poblacional (es decir, q = 1 - p) e : es el error máximo permisible (también conocido como margen de error o precisión)
e<-seq(0,0.1,by=0.01)
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
z
## [1] 1.959964
p<-0.4
q<-1-p
n<-c(((z^2)*p*q)/e^2)
n
## [1] Inf 9219.50117 2304.87529 1024.38902 576.21882 368.78005
## [7] 256.09725 188.15309 144.05471 113.82100 92.19501
e<-seq(0,0.1,by=0.01)
nc<-0.95
p<-0.4
q<-1-p
n<-c(((n_edad_3^2)*p*q)/e^2)
n
## [1] Inf 801813407 200453352 89090379 50113338 32072536 22272595
## [8] 16363539 12528334 9898931 8018134
Para la selección de muestra se conoce que el porcentaje de éxito es del 50%.Determine el valor de muestra para un error de precisión del 1% al 10%.
e<-seq(0,0.1,by=0.01)
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.5
q<-1-p
n<-c(((z^2)*p*q)/e^2)
n
## [1] Inf 9603.64705 2400.91176 1067.07189 600.22794 384.14588
## [7] 266.76797 195.99280 150.05699 118.56354 96.03647
e<-seq(0,0.1,by=0.01)
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.5
q<-1-p
n<-c(((n_edad_3^2)*p*q)/e^2)
n
## [1] Inf 835222299 208805575 92802478 52201394 33408892 23200619
## [8] 17045353 13050348 10311386 8352223
Para la selección de muestra se conoce que el porcentaje de éxito es del 60%.Determine el valor de muestra para un error de precisión del 1% al 10%
e<-seq(0,0.1,by=0.01)
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.6
q<-1-p
n<-c(((z^2)*p*q)/e^2)
n
## [1] Inf 9219.50117 2304.87529 1024.38902 576.21882 368.78005
## [7] 256.09725 188.15309 144.05471 113.82100 92.19501
e<-seq(0,0.1,by=0.01)
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.6
q<-1-p
n<-c(((n_edad_3^2)*p*q)/e^2)
n
## [1] Inf 801813407 200453352 89090379 50113338 32072536 22272595
## [8] 16363539 12528334 9898931 8018134