Taller_1_Muestreo

Estos datos fueron recogidos de la información sobre el rendimiento corporal y tiene lassiguientes columnas: age, sexo, height_cm, weight_kg, body fat%, diastolic, systolic, gripForce,sit and bend forward_cm, sit-ups counts, broad jump_cm, class

Se seleccionan tres variables de estudio: age,height_cm y weight_kg

library(readr)
datos_taller <-read.csv("C:/Users/Usuario/Downloads/datos taller (1).csv")

View(datos_taller)

De estas variables se sabe que sus varianzas poblacionales son las siguiente:

var_edad<-185.9894
var_altura<-71.5558962
var_peso<- 144.382163

En este punto calcularemos las medias de cada una de las variables

Media_Edad <- mean(datos_taller$Age)
print(paste("La media de edad es:", Media_Edad))

## [1] "La media de edad es: 37.06"

Media_Altura<-mean(datos_taller$height_cm)
print(paste("La media de altura  es:", Media_Altura))

## [1] "La media de altura  es: 169.826"

Media_Peso<-mean(datos_taller$wight_kg)
print(paste("La media del peso  es:", Media_Peso))

## [1] "La media del peso  es: 68.1344"

A partir de los siguientes datos correspondiente a una prueba piloto, determine elvalor de la muestra con unos erros de precisión del 3% y 5% con respecto a su media.

Para calcular el tamaño de muestra necesario para tener una precisión del 3% o 5% con respecto a la media, se puede utilizar la fórmula siguiente:

n = (z^2 * s^2) / E^2

Iniciamos Multiplicando las medias de cada una de las varibles por el 3% y el 5 % respectivamente , esto siginificara nuestro error

error_3 <- 0.03
error_5 <- 0.05

error_edad_3 <- Media_Edad * error_3
error_altura_3 <- Media_Altura * error_3
error_peso_3 <- Media_Peso * error_3

print(paste("El error del 3% con respecto a la media para la variable edad es :", error_edad_3))

## [1] "El error del 3% con respecto a la media para la variable edad es : 1.1118"

print(paste("El error del 3% con respecto a la media para la variable Altura es :", error_altura_3))

## [1] "El error del 3% con respecto a la media para la variable Altura es : 5.09478"

print(paste("El error del 3% con respecto a la media para la variable Peso es :", error_peso_3))

## [1] "El error del 3% con respecto a la media para la variable Peso es : 2.044032"

error_edad_5 <- Media_Edad * error_5
error_altura_5 <- Media_Altura * error_5
error_peso_5 <- Media_Peso * error_5

print(paste("El error del 5% con respecto a la media para la variable edad es :", error_edad_5))

## [1] "El error del 5% con respecto a la media para la variable edad es : 1.853"

print(paste("El error del 5% con respecto a la media para la variable Altura es :", error_altura_5))

## [1] "El error del 5% con respecto a la media para la variable Altura es : 8.4913"

print(paste("El error del 5% con respecto a la media para la variable Peso es :", error_peso_5))

## [1] "El error del 5% con respecto a la media para la variable Peso es : 3.40672"

Nivel de confianza

NC<-qnorm(0.975,mean =0,sd=1)
NC

## [1] 1.959964

Teniendo ya los datos conocidos con anterioridad, ahora si aplicaremos la formula antes mencionada para cada una de las variables y aplicaremos un redondeo a cada uno de los resultados

n = (z^2 * s^2) / E^2

Iniciamos tomando el error del 3%

n_edad_3 <- (NC^2 * var_edad) / error_edad_3^2
n_altura_3 <- (NC^2 * var_altura) / error_altura_3^2
n_peso_3 <- (NC^2 * var_peso) / error_peso_3^2

cat("Tamaño de muestra necesario para un error del 3%:\n")

## Tamaño de muestra necesario para un error del 3%:

cat("Edad:", round(n_edad_3), "\n")

## Edad: 578

cat("Altura:", round(n_altura_3), "\n")

## Altura: 11

cat("Peso:", round(n_peso_3), "\n")

## Peso: 133

n_edad_5 <- (NC^2 * var_edad) / error_edad_5^2
n_altura_5 <- (NC^2 * var_altura) / error_altura_5^2
n_peso_5 <- (NC^2 * var_peso) / error_peso_5^2

cat("Tamaño de muestra necesario para un error del 5%:\n")

## Tamaño de muestra necesario para un error del 5%:

cat("Edad:", round(n_edad_5), "\n")

## Edad: 208

cat("Altura:", round(n_altura_5), "\n")

## Altura: 4

cat("Peso:", round(n_peso_5), "\n")

## Peso: 48

1.1 Si al final se sabe que la población total es de 347571 individuos. ¿Cuál es el nuevo valor de n de la muestra

#Nueva Poblacion 
N <- 347571

n_edad_3_corr <- (NC^2 * var_edad * N) / (N * error_edad_3^2 + NC^2 * var_edad)
n_altura_3_corr <- (NC^2 * var_altura * N) / (N * error_altura_3^2 + NC^2 * var_altura)
n_peso_3_corr <- (NC^2 * var_peso * N) / (N * error_peso_3^2 + NC^2 * var_peso)

cat("Tamaño de muestra necesario para un error del 3% con corrección de población finita:\n")

## Tamaño de muestra necesario para un error del 3% con corrección de población finita:

cat("Edad:", round(n_edad_3_corr), "\n")

## Edad: 577

cat("Altura:", round(n_altura_3_corr), "\n")

## Altura: 11

cat("Peso:", round(n_peso_3_corr), "\n")

## Peso: 133

n_edad_5_corr <- (NC^2 * var_edad * N) / (N * error_edad_5^2 + NC^2 * var_edad)
n_altura_5_corr <- (NC^2 * var_altura * N) / (N * error_altura_5^2 + NC^2 * var_altura)
n_peso_5_corr <- (NC^2 * var_peso * N) / (N * error_peso_5^2 + NC^2 * var_peso)

cat("Tamaño de muestra necesario para un error del 5% con corrección de población finita:\n")

## Tamaño de muestra necesario para un error del 5% con corrección de población finita:

cat("Edad:", round(n_edad_5_corr), "\n")

## Edad: 208

cat("Altura:", round(n_altura_5_corr), "\n")

## Altura: 4

cat("Peso:", round(n_peso_5_corr), "\n")

## Peso: 48

¿Qué valor de proporción hace que la varianza de proporciones sea máxima? Realicelas operaciones correspondientes.?

Para la selección de muestra se conoce que el porcentaje de éxito es del 40%.Determine el valor de muestra para un error de precisión del 1% al 10%.

n = (Z^2 * p * q) / e^2

donde:

n: es el tamaño de muestra necesario Z : sera cada una de nuestras variables p : es la proporción poblacional de interés (también conocida como tasa de éxito) q : es el complemento de la proporción poblacional (es decir, q = 1 - p) e : es el error máximo permisible (también conocido como margen de error o precisión)

e<-seq(0,0.1,by=0.01) 
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
z

## [1] 1.959964

p<-0.4
q<-1-p
n<-c(((z^2)*p*q)/e^2) 
n

##  [1]        Inf 9219.50117 2304.87529 1024.38902  576.21882  368.78005
##  [7]  256.09725  188.15309  144.05471  113.82100   92.19501

e<-seq(0,0.1,by=0.01) 
nc<-0.95
p<-0.4
q<-1-p
n<-c(((n_edad_3^2)*p*q)/e^2) 
n

##  [1]       Inf 801813407 200453352  89090379  50113338  32072536  22272595
##  [8]  16363539  12528334   9898931   8018134

Para la selección de muestra se conoce que el porcentaje de éxito es del 50%.Determine el valor de muestra para un error de precisión del 1% al 10%.

e<-seq(0,0.1,by=0.01) 
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.5
q<-1-p
n<-c(((z^2)*p*q)/e^2) 
n

##  [1]        Inf 9603.64705 2400.91176 1067.07189  600.22794  384.14588
##  [7]  266.76797  195.99280  150.05699  118.56354   96.03647

e<-seq(0,0.1,by=0.01) 
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.5
q<-1-p
n<-c(((n_edad_3^2)*p*q)/e^2) 
n

##  [1]       Inf 835222299 208805575  92802478  52201394  33408892  23200619
##  [8]  17045353  13050348  10311386   8352223

Para la selección de muestra se conoce que el porcentaje de éxito es del 60%.Determine el valor de muestra para un error de precisión del 1% al 10%

e<-seq(0,0.1,by=0.01) 
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.6
q<-1-p
n<-c(((z^2)*p*q)/e^2) 
n

##  [1]        Inf 9219.50117 2304.87529 1024.38902  576.21882  368.78005
##  [7]  256.09725  188.15309  144.05471  113.82100   92.19501

e<-seq(0,0.1,by=0.01) 
nc<-0.95
z<-abs(qnorm((1-nc)/2,mean=0,sd=1))
p<-0.6
q<-1-p
n<-c(((n_edad_3^2)*p*q)/e^2) 
n

##  [1]       Inf 801813407 200453352  89090379  50113338  32072536  22272595
##  [8]  16363539  12528334   9898931   8018134

Taller_1_Muestreo

Esteban Babativa

2023-03-23