Estos datos fueron recogidos de la información sobre el rendimiento corporal y tiene lassiguientes columnas: age, sexo, height_cm, weight_kg, body fat%, diastolic, systolic, gripForce,sit and bend forward_cm, sit-ups counts, broad jump_cm, class

Se seleccionan tres variables de estudio: age,height_cm y weight_kg

library(readr)
datos_taller <-read.csv("C:/Users/Usuario/Downloads/datos taller (1).csv")

View(datos_taller)

De estas variables se sabe que sus varianzas poblacionales son las siguiente:

var_edad<-185.9894
var_altura<-71.5558962
var_peso<- 144.382163

En este punto calcularemos las medias de cada una de las variables

Media_Edad <- mean(datos_taller$Age)
print(paste("La media de edad es:", Media_Edad))
## [1] "La media de edad es: 37.06"
Media_Altura<-mean(datos_taller$height_cm)
print(paste("La media de altura  es:", Media_Altura))
## [1] "La media de altura  es: 169.826"
Media_Peso<-mean(datos_taller$wight_kg)
print(paste("La media del peso  es:", Media_Peso))
## [1] "La media del peso  es: 68.1344"
  1. A partir de los siguientes datos correspondiente a una prueba piloto, determine elvalor de la muestra con unos erros de precisión del 3% y 5% con respecto a su media.

Para calcular el tamaño de muestra necesario para tener una precisión del 3% o 5% con respecto a la media, se puede utilizar la fórmula siguiente:

n = (z^2 * s^2) / E^2

Iniciamos Multiplicando las medias de cada una de las varibles por el 3% y el 5 % respectivamente , esto siginificara nuestro error

error_3 <- 0.03
error_5 <- 0.05
error_edad_3 <- Media_Edad * error_3
error_altura_3 <- Media_Altura * error_3
error_peso_3 <- Media_Peso * error_3

print(paste("El error del 3% con respecto a la media para la variable edad es :", error_edad_3))
## [1] "El error del 3% con respecto a la media para la variable edad es : 1.1118"
print(paste("El error del 3% con respecto a la media para la variable Altura es :", error_altura_3))
## [1] "El error del 3% con respecto a la media para la variable Altura es : 5.09478"
print(paste("El error del 3% con respecto a la media para la variable Peso es :", error_peso_3))
## [1] "El error del 3% con respecto a la media para la variable Peso es : 2.044032"
error_edad_5 <- Media_Edad * error_5
error_altura_5 <- Media_Altura * error_5
error_peso_5 <- Media_Peso * error_5

print(paste("El error del 5% con respecto a la media para la variable edad es :", error_edad_5))
## [1] "El error del 5% con respecto a la media para la variable edad es : 1.853"
print(paste("El error del 5% con respecto a la media para la variable Altura es :", error_altura_5))
## [1] "El error del 5% con respecto a la media para la variable Altura es : 8.4913"
print(paste("El error del 5% con respecto a la media para la variable Peso es :", error_peso_5))
## [1] "El error del 5% con respecto a la media para la variable Peso es : 3.40672"

Nivel de confianza

NC<-qnorm(0.975,mean =0,sd=1)
NC
## [1] 1.959964

Teniendo ya los datos conocidos con anterioridad, ahora si aplicaremos la formula antes mencionada para cada una de las variables y aplicaremos un redondeo a cada uno de los resultados

n = (z^2 * s^2) / E^2

Iniciamos tomando el error del 3%

n_edad_3 <- (NC^2 * var_edad) / error_edad_3^2
n_altura_3 <- (NC^2 * var_altura) / error_altura_3^2
n_peso_3 <- (NC^2 * var_peso) / error_peso_3^2

cat("Tamaño de muestra necesario para un error del 3%:\n")
## Tamaño de muestra necesario para un error del 3%:
cat("Edad:", round(n_edad_3), "\n")
## Edad: 578
cat("Altura:", round(n_altura_3), "\n")
## Altura: 11
cat("Peso:", round(n_peso_3), "\n")
## Peso: 133
n_edad_5 <- (NC^2 * var_edad) / error_edad_5^2
n_altura_5 <- (NC^2 * var_altura) / error_altura_5^2
n_peso_5 <- (NC^2 * var_peso) / error_peso_5^2

cat("Tamaño de muestra necesario para un error del 5%:\n")
## Tamaño de muestra necesario para un error del 5%:
cat("Edad:", round(n_edad_5), "\n")
## Edad: 208
cat("Altura:", round(n_altura_5), "\n")
## Altura: 4
cat("Peso:", round(n_peso_5), "\n")
## Peso: 48

1.1 Si al final se sabe que la población total es de 347571 individuos. ¿Cuál es el nuevo valor de n de la muestra

#Nueva Poblacion 
N <- 347571
n_edad_3_corr <- (NC^2 * var_edad * N) / (N * error_edad_3^2 + NC^2 * var_edad)
n_altura_3_corr <- (NC^2 * var_altura * N) / (N * error_altura_3^2 + NC^2 * var_altura)
n_peso_3_corr <- (NC^2 * var_peso * N) / (N * error_peso_3^2 + NC^2 * var_peso)

cat("Tamaño de muestra necesario para un error del 3% con corrección de población finita:\n")
## Tamaño de muestra necesario para un error del 3% con corrección de población finita:
cat("Edad:", round(n_edad_3_corr), "\n")
## Edad: 577
cat("Altura:", round(n_altura_3_corr), "\n")
## Altura: 11
cat("Peso:", round(n_peso_3_corr), "\n")
## Peso: 133
n_edad_5_corr <- (NC^2 * var_edad * N) / (N * error_edad_5^2 + NC^2 * var_edad)
n_altura_5_corr <- (NC^2 * var_altura * N) / (N * error_altura_5^2 + NC^2 * var_altura)
n_peso_5_corr <- (NC^2 * var_peso * N) / (N * error_peso_5^2 + NC^2 * var_peso)

cat("Tamaño de muestra necesario para un error del 5% con corrección de población finita:\n")
## Tamaño de muestra necesario para un error del 5% con corrección de población finita:
cat("Edad:", round(n_edad_5_corr), "\n")
## Edad: 208
cat("Altura:", round(n_altura_5_corr), "\n")
## Altura: 4
cat("Peso:", round(n_peso_5_corr), "\n")
## Peso: 48

¿Qué valor de proporción hace que la varianza de proporciones sea máxima? Realicelas operaciones correspondientes.?

Para la selección de muestra se conoce que el porcentaje de éxito es del 40%.Determine el valor de muestra para un error de precisión del 1% al 10%.

n = (Z^2 * p * q) / e^2

donde:

n: es el tamaño de muestra necesario Z : sera cada una de nuestras variables p : es la proporción poblacional de interés (también conocida como tasa de éxito) q : es el complemento de la proporción poblacional (es decir, q = 1 - p) e : es el error máximo permisible (también conocido como margen de error o precisión)

e<-seq(0,0.1,by=0.01) 
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.4
q<-1-p
n<-c(((z^2)*p*q)/e) 
n
##  [1]       Inf 92.195012 46.097506 30.731671 23.048753 18.439002 15.365835
##  [8] 13.170716 11.524376 10.243890  9.219501
e<-seq(0,0.1,by=0.01) 
nc<-0.95
p<-0.4
q<-1-p
n<-c(((n_edad_3^2)*p*q)/e) 
n
##  [1]       Inf 8018134.1 4009067.0 2672711.4 2004533.5 1603626.8 1336355.7
##  [8] 1145447.7 1002266.8  890903.8  801813.4

Para la selección de muestra se conoce que el porcentaje de éxito es del 50%.Determine el valor de muestra para un error de precisión del 1% al 10%.

e<-seq(0,0.1,by=0.01) 
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.5
q<-1-p
n<-c(((z^2)*p*q)/e) 
n
##  [1]       Inf 96.036471 48.018235 32.012157 24.009118 19.207294 16.006078
##  [8] 13.719496 12.004559 10.670719  9.603647
e<-seq(0,0.1,by=0.01) 
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.5
q<-1-p
n<-c(((n_edad_3^2)*p*q)/e) 
n
##  [1]       Inf 8352223.0 4176111.5 2784074.3 2088055.7 1670444.6 1392037.2
##  [8] 1193174.7 1044027.9  928024.8  835222.3

Para la selección de muestra se conoce que el porcentaje de éxito es del 60%.Determine el valor de muestra para un error de precisión del 1% al 10%

e<-seq(0,0.1,by=0.01) 
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.6
q<-1-p
n<-c(((z^2)*p*q)/e) 
n
##  [1]       Inf 92.195012 46.097506 30.731671 23.048753 18.439002 15.365835
##  [8] 13.170716 11.524376 10.243890  9.219501
e<-seq(0,0.1,by=0.01) 
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.6
q<-1-p
n<-c(((n_edad_3^2)*p*q)/e) 
n
##  [1]       Inf 8018134.1 4009067.0 2672711.4 2004533.5 1603626.8 1336355.7
##  [8] 1145447.7 1002266.8  890903.8  801813.4