Objetivo: Elaborar un archivo markdown que identifique muestras y medias de cada muestra de un conjunto de datos.

1. Crear un conjunto de datos de una población con variables. El conjunto de datos será un data.frame(). 50 registros

  • Crear un data.frame()
nombres <- c("RUBEN", 'JUAN', 'PEDRO', 'LUISA', 'LUZ', 'ADRIANA', 'LOLA', 'PATY', 'ERNESTO', 'JAVIER', c(LETTERS, letters))
edades <- sample(15:60, 62, replace = TRUE)
estaturas <- sample(1.40:1:90, 62, replace = TRUE)


datos <- data.frame(nombres, edades, estaturas)
datos
##    nombres edades estaturas
## 1    RUBEN     18      79.4
## 2     JUAN     22      65.4
## 3    PEDRO     15       1.4
## 4    LUISA     44      34.4
## 5      LUZ     39      22.4
## 6  ADRIANA     43      60.4
## 7     LOLA     50      55.4
## 8     PATY     33      18.4
## 9  ERNESTO     36      14.4
## 10  JAVIER     60      83.4
## 11       A     38       8.4
## 12       B     16      84.4
## 13       C     41      70.4
## 14       D     58      35.4
## 15       E     42      51.4
## 16       F     28      30.4
## 17       G     21      64.4
## 18       H     19      20.4
## 19       I     38       9.4
## 20       J     42      11.4
## 21       K     25      25.4
## 22       L     15      21.4
## 23       M     41      56.4
## 24       N     41       7.4
## 25       O     26      27.4
## 26       P     59      81.4
## 27       Q     30      85.4
## 28       R     15      57.4
## 29       S     20       9.4
## 30       T     38      86.4
## 31       U     25       7.4
## 32       V     34      75.4
## 33       W     26      58.4
## 34       X     31       9.4
## 35       Y     22      53.4
## 36       Z     23       5.4
## 37       a     18      32.4
## 38       b     16      30.4
## 39       c     30      34.4
## 40       d     21      55.4
## 41       e     41      22.4
## 42       f     41      26.4
## 43       g     45      57.4
## 44       h     44       3.4
## 45       i     39      69.4
## 46       j     55      73.4
## 47       k     52      49.4
## 48       l     60      87.4
## 49       m     33      83.4
## 50       n     45      54.4
## 51       o     54      64.4
## 52       p     44      84.4
## 53       q     15      37.4
## 54       r     51       5.4
## 55       s     30      87.4
## 56       t     41      32.4
## 57       u     53       2.4
## 58       v     46      51.4
## 59       w     16      31.4
## 60       x     59      12.4
## 61       y     32      84.4
## 62       z     58      78.4

2. Crear 5 muestras de 10 registros de la población.

  • Utilizar una semilla set.seed
  • Muestra de edades
set.seed(2020) # Semilla
muestra1 <- sample(datos$edades, 10, replace = FALSE)
muestra2 <- sample(datos$edades, 10, , replace = FALSE)

3. De cada muestra determinar la media mean(muestra1,muestar2…. muestra5) de la edad, del peso y de la estatura

meanM1 <- mean(muestra1)
meanM2 <- mean(muestra2)

meanM1
## [1] 30.2
meanM2
## [1] 36.2

4. Comparar la media de cada muestra con la media de toda la población de la edad, del peso y de la estatura.

mean(datos$edades)
## [1] 35.69355

¿Qué pasa si determinar las media de las muestras comparadas con la media de la población?

mean(c(meanM1, meanM2))
## [1] 33.2

5. Descripción del caso

  • ¿Cuántas observaciones se analizaron?,
  • ¿cuántas variables?
  • ¿Qué significa una muestra y una población?
  • ¿Qué significa la media de una muestra y la media de una población?
  • ¿Es parecido, semejante diferente o igual la media de las muestras con respecto a la media de la población?
  • ¿Qué pasa si determinar las media de las muestras comparadas con la media de la población?

COMENTARIOS 70 a 100 palabras

Del caso concluimos, se interpretar … … … que las medias de las medias de todas las muestras de la variable …. es muy parecido a la media de la polación..,