# install.packages("samplingbook") #Instalar la primera vez (remover el primer #)
library(samplingbook)
## Loading required package: pps
## Loading required package: sampling
## Loading required package: survey
## Loading required package: grid
## Loading required package: Matrix
## Loading required package: survival
## 
## Attaching package: 'survival'
## The following objects are masked from 'package:sampling':
## 
##     cluster, strata
## 
## Attaching package: 'survey'
## The following object is masked from 'package:graphics':
## 
##     dotchart
#install.packages("readxl") #Instalar la primera vez (remover el primer #)
library(readxl)
#install.packages("dplyr") #Instalar la primera vez (remover el primer #)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Ejemplo 1

Se están estudiando las actitudes de los estudiantes de la carrera de sociología de la Universidad Central, sede Región de Coquimbo, frente a las clases online en el contexto de la pandemia COVID-19.

Calcule el tamaño de la muestra utilizando un 95% de nivel de confianza y un error máximo admisible de 1%, 3% y 5%. Luego decida con cuál de los tamaños de muestra obtenidos trabajar y seleccione una muestra aleatoria.

Paso 1: identificar fórmula

Se calculará una muestra para estimar proporciones.

\(n = \frac{\frac{N}{N-1}\cdot pq}{\frac{e^2}{Z^{2}_{\alpha/2}}+\frac{pq}{N-1}}\)

Paso 2: identificar información necesaria para calcular \(n\)

El marco muestral corresponde a la nómina de matriculados 2020.

marco.muestral <- read_xls("/home/daniel/Dropbox/U CENTRAL/02 2020/01 Primer semestre 2020/Analisis de datos cuantitativos I/Clases/03/matriculados.xls")
N <- nrow(marco.muestral) #Contar cantidad de filas (casos en el marco muestral)
N #87 personas
## [1] 87

Paso 3: reemplazar valores en la fórmula

Primero, se calcula la muestra con un error máximo admisible de 0.01:

\(n = \frac{\frac{87}{87-1}\cdot 0.25}{\frac{0.01^2}{1.96}+\frac{0.25}{87-1}}\)

## [1] 86
## 
## sample.size.prop object: Sample size for proportion estimate
## With finite population correction: N=87, precision e=0.01 and expected proportion P=0.5
## 
## Sample size needed: 87

Luego, se calcula la muestra con un error máximo admisible de 0.03:

\(n = \frac{\frac{87}{87-1}\cdot 0.25}{\frac{0.03^2}{1.96}+\frac{0.25}{87-1}}\)

## [1] 81
## 
## sample.size.prop object: Sample size for proportion estimate
## With finite population correction: N=87, precision e=0.03 and expected proportion P=0.5
## 
## Sample size needed: 81

Finalmente, se calcula la muestra con un error máximo admisible de 0.05:

\(n = \frac{\frac{87}{87-1}\cdot 0.25}{\frac{0.05^2}{1.96}+\frac{0.25}{87-1}}\)

## [1] 71
## 
## sample.size.prop object: Sample size for proportion estimate
## With finite population correction: N=87, precision e=0.05 and expected proportion P=0.5
## 
## Sample size needed: 71

Paso 4: decidir con qué n trabajar

Para hacer una estimación de las actitudes de los estudiantes de la carrera de sociología de la Universidad Central, sede Región de Coquimbo, frente a las clases online en el contexto de la pandemia COVID-19, asumiendo varianza máxima, con un nivel de confianza del 95% y un error admisible del 1%, se requiere encuestar a 86 personas. Es decir a todos los y las estudiantes de dicha institución. En cambio, manteniendo constante el nivel de confianza del 95%, pero variando el error máximo admisible a 3% y 5%, se requieren encuestar a 81 y 71 personas, respectivamente.

De esta manera, considerando los recursos y tiempo disponible, se decide trabajar en base a una muestra de 71 personas (nivel de confianza del 95% y error máximo admisible del 5%).

Paso 5: selección aleatori

Se seleccionan aleatoriamente 71 de los 87 casos que conforman el marco muestral.

set.seed(12345) #semilla aleatoria para que el siguiente paso sea reproducible
muestra <- sample_n(marco.muestral,71) #selección aleatoria
muestra$Orden #Para ver los folios o número ordenador de los casos seleccionados
##  [1] 14 51 80 24 58 75  2 82 38 10 32 40 39 79 30  1 12  3  9 87 13 64 20
## [24] 42 55 16 62 77 34 52 41 60 25 36 76 11 74 69  5 15 19 17 46 37 66 70
## [47] 47 67 31 43 78 27 59 22 23 85 26 33  7 48 49 68 73 71 86 54 83  4 21
## [70] 45 63

Ejemplo 2

Un equipo de investigación necesita saber el ingreso promedio de un sociólogo recién titulado. De acuerdo a fuentes consultadas (datos ficticios!), el año 2018 se titularon de sociólogas 327 personas a nivel nacional y el ingreso promedio se ubica alrededor de los 665,000 pesos (desviación estándar: 234,000 pesos).

Se necesita generar una estimación al 99% de confianza, con un error máximo admisible de 100,000 pesos.Calcule el tamaño de la muestra necesitado.

Paso 1: identificar fórmula

\(n = \frac{S^2}{\frac{e^2}{Z^{2}_{\alpha/2}}+\frac{S^2}{N-1}}\)

Se calculará una muestra para estimar medias.

Paso 2: identificar información necesaria para calcular \(n\)

Paso 3: reemplazar valores en la fórmula

\(n = \frac{54,756,000,000}{\frac{100,000^2}{2.58^{2}}+\frac{54,756,000,000}{327-1}}\)

## [1] 33
## 
## sample.size.mean object: Sample size for mean estimate
## With finite population correction: N=327, precision e=1e+05 and standard deviation S=234000
## 
## Sample size needed: 33

Paso 4: respuesta

Para hacer una estimación del ingreso promedio de un recién titulado de sociología, con un error máximo admisible de 100,000 pesos y un nivel de confianza del 99%, se requiere encuestar a 33 personas.