1 Objetivo

Simular datos de una población y de una muestra describiendo la media poblacional y la media muestral para su adecuada interpretación.

2 Marco teórico

2.1 Población y muestra

.

La información que se utiliza para aplicar técnicas estadísticas se colecta en forma de muestras o conjuntos de observaciones. Las muestras se reúnen a partir de poblaciones, que son conjuntos de todos los individuos o elementos individuales de un tipo específico.

En el lenguaje de la estadística, uno de los conceptos más elementales es el muestreo. En casi todos los problemas de estadística, un número especificado de mediciones o datos, es decir, una muestra, se toma de un cuerpo de mediciones más grande llamado población.

2.2 Parámetro y estadístico

Un parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana, moda o una desviación estándar de una población.

Un estadístico es una medida que describe características de una muestra. Normalmente cuando se habla de muestra los estadísticos son estimadores dado que se acercan a los parámetros de una población.

3 Desarrollo

Cargar librerpias

{r} library(ggplot2) library(cowplot)

3.1 Crear datos

Genera los mismos números al ejecutar (run) de nuevo la función sample().

{r} set.seed(2023)

3.1.1 Crear población

Se genera o construye una población de 7000 edades con valores entre 25 y 60.

{r} poblacion <- sample(x = 25:60, size = 7000, replace = TRUE) # Poblacion de un universo de numeros entre 18-60 poblacion

3.1.2 Determinar N

La función length() determina la cantidad de elementos de un vector, de tal manera que N identifica el número de elementos de una población.

{r} N <- length(poblacion) N

3.1.3 Crear muestra

Se determina una muestra del 10% de la población de dichos números (edades), el 10%.

{r} n <- N * 0.10 muestra <- sample(x = poblacion, size = n, replace = FALSE) muestra

3.2 Medias aritméticas de población y muestra

3.2.1 Media población

Se determina en parámetro media poblacional.

{r} media_p <- mean(poblacion) media_p

3.2.2 Media muestral

Se determina el estadístico media de la muestra

{r} media_m <- mean(muestra) media_m

3.3 Explorando los datos

3.3.1 Estructura de los datos

{r} str(poblacion) str(muestra)

3.4 Resumen de los datos

{r} summary(poblacion) summary(muestra)

3.5 Visualizar los datos

3.5.1 Vertical

Se crea grafica1 para los datos e población; se crea gráfica2 para los datos de muestra. se visualizan las dispersiones de ambos diagramas con la librería ggplot2 y la función ggplot().

{r} g1 = ggplot()+ geom_point(aes(x = 1:N, y = poblacion), col= ‘orange’) + geom_hline(yintercept = media_p, col=‘green’) + ggtitle(label = “Población”, subtitle = paste(“Media poblacional =”, round(media_p, 2)))

{r} g2 = ggplot()+ geom_point(aes(x = 1:n, y = muestra), col= ‘purple’) + geom_hline(yintercept = media_m, col=‘pink’) + ggtitle(label = “Población”, subtitle = paste(“Media muestral =”, round(media_m, 2)))

{r} plot_grid(g1, g2)

3.5.2 Horizontal

Se crea grafica1 para los datos e población; se crea gráfica2 para los datos de muestra. se visualizan las dispersiones de ambos diagramas con la librería ggplot2 y la función ggplot().

{r} g1 = ggplot()+ geom_point(aes(x = poblacion, y = 1:N), col= ‘blue’) + geom_vline(xintercept = media_p, col=‘red’) + ggtitle(label = “Población”, subtitle = paste(“Media poblacional =”, round(media_p, 2)))

{r} g2 = ggplot()+ geom_point(aes(x = muestra, y = 1:n), col= ‘green’) + geom_vline(xintercept = media_m, col=‘red’) + ggtitle(label = “Población”, subtitle = paste(“Media muestral =”, round(media_m, 2)))

{r} plot_grid(g1, g2)

Describir de 120 a 150 palabras para interpretar el caso contestando las siguientes preguntas como sugerencia:

¿Cuál es el contexto de los datos, es decir, ¿qué significan los datos? analizar la poblacion con datos para la media

¿Cuántos datos tiene la población y la muestra respectivamente?,son 6500 edades. muestra de 650 que es el 10%

¿Qué porcentaje de la muestra es de la población? 10% ¿Cuál es el el valor de la media poblacional y la media muestral? poblacional 43.33 y media muestral 43.28

¿Que relación tiene la media poblacional y la media muestral? estan con valores muy aproximados

¿Cómo se obtiene la media ? sumando todos los valores de la muestra y dividiendo entre el número total de población

¿Como se obtiene la estructura de los datos (str()) y qué valores arroja?datos aleatorios

¿Cómo se describen los datos? con summary() y qué valores arroja? sumas de los resultados de funciones