CASO 1. Muestras y medias de variables de un conjunto de datos

Objetivo: Elaborar un archivo markdown que identifique muestras y medias de cada muestra de un conjunto de datos.

1. Crear un conjunto de datos de una población con variables. El conjunto de datos será un data.frame(). 50 registros

Crear un data.frame()

nombres <- c("RUBEN", 'JUAN', 'PEDRO', 'LUISA', 'LUZ', 'ADRIANA', 'LOLA', 'PATY', 'ERNESTO', 'JAVIER', c(LETTERS, letters))
edades <- sample(15:60, 62, replace = TRUE)
estaturas <- sample(1.40:1:90, 62, replace = TRUE)


datos <- data.frame(nombres, edades, estaturas)
datos

##    nombres edades estaturas
## 1    RUBEN     18      79.4
## 2     JUAN     22      65.4
## 3    PEDRO     15       1.4
## 4    LUISA     44      34.4
## 5      LUZ     39      22.4
## 6  ADRIANA     43      60.4
## 7     LOLA     50      55.4
## 8     PATY     33      18.4
## 9  ERNESTO     36      14.4
## 10  JAVIER     60      83.4
## 11       A     38       8.4
## 12       B     16      84.4
## 13       C     41      70.4
## 14       D     58      35.4
## 15       E     42      51.4
## 16       F     28      30.4
## 17       G     21      64.4
## 18       H     19      20.4
## 19       I     38       9.4
## 20       J     42      11.4
## 21       K     25      25.4
## 22       L     15      21.4
## 23       M     41      56.4
## 24       N     41       7.4
## 25       O     26      27.4
## 26       P     59      81.4
## 27       Q     30      85.4
## 28       R     15      57.4
## 29       S     20       9.4
## 30       T     38      86.4
## 31       U     25       7.4
## 32       V     34      75.4
## 33       W     26      58.4
## 34       X     31       9.4
## 35       Y     22      53.4
## 36       Z     23       5.4
## 37       a     18      32.4
## 38       b     16      30.4
## 39       c     30      34.4
## 40       d     21      55.4
## 41       e     41      22.4
## 42       f     41      26.4
## 43       g     45      57.4
## 44       h     44       3.4
## 45       i     39      69.4
## 46       j     55      73.4
## 47       k     52      49.4
## 48       l     60      87.4
## 49       m     33      83.4
## 50       n     45      54.4
## 51       o     54      64.4
## 52       p     44      84.4
## 53       q     15      37.4
## 54       r     51       5.4
## 55       s     30      87.4
## 56       t     41      32.4
## 57       u     53       2.4
## 58       v     46      51.4
## 59       w     16      31.4
## 60       x     59      12.4
## 61       y     32      84.4
## 62       z     58      78.4

2. Crear 5 muestras de 10 registros de la población.

Utilizar una semilla set.seed
Muestra de edades

set.seed(2020) # Semilla
muestra1 <- sample(datos$edades, 10, replace = FALSE)
muestra2 <- sample(datos$edades, 10, , replace = FALSE)

3. De cada muestra determinar la media mean(muestra1,muestar2…. muestra5) de la edad, del peso y de la estatura

meanM1 <- mean(muestra1)
meanM2 <- mean(muestra2)

meanM1

## [1] 30.2

meanM2

## [1] 36.2

4. Comparar la media de cada muestra con la media de toda la población de la edad, del peso y de la estatura.

mean(datos$edades)

## [1] 35.69355

¿Qué pasa si determinar las media de las muestras comparadas con la media de la población?

mean(c(meanM1, meanM2))

## [1] 33.2

5. Descripción del caso

¿Cuántas observaciones se analizaron?,
¿cuántas variables?
¿Qué significa una muestra y una población?
¿Qué significa la media de una muestra y la media de una población?
¿Es parecido, semejante diferente o igual la media de las muestras con respecto a la media de la población?
¿Qué pasa si determinar las media de las muestras comparadas con la media de la población?

COMENTARIOS 70 a 100 palabras

Del caso concluimos, se interpretar … … … que las medias de las medias de todas las muestras de la variable …. es muy parecido a la media de la polación..,

CASO 1. Muestras y medias de variables de un conjunto de datos

Rubén Pizarro

15/9/2020

Objetivo: Elaborar un archivo markdown que identifique muestras y medias de cada muestra de un conjunto de datos.

1. Crear un conjunto de datos de una población con variables. El conjunto de datos será un data.frame(). 50 registros

2. Crear 5 muestras de 10 registros de la población.

3. De cada muestra determinar la media mean(muestra1,muestar2…. muestra5) de la edad, del peso y de la estatura

4. Comparar la media de cada muestra con la media de toda la población de la edad, del peso y de la estatura.

¿Qué pasa si determinar las media de las muestras comparadas con la media de la población?

5. Descripción del caso

COMENTARIOS 70 a 100 palabras