1 Objetivo

Simular datos de una población y de una muestra describiendo la media poblacional y la media muestral para su adecuada interpretación.

2 Descripción

  • Generar una población de 1000 números con valores entre 250 y 600

  • Determinar una muestra del 10% de la población de dichos números

  • Identificar la estructura de los datos

  • Determinar el parámetro la media de la población

  • Determinar el estadístico de la media de la muestra

  • Mostrar el resumen de los daos de población y muestra

  • Comparar valores de medias del parámetro poblacional contra el estadístico de la muestra.

  • Se visualiza la dispersión de los datos con la función ggplot() de la librería “ggplot2”.

  • Interpretar el caso

3 Marco teórico

3.1 Población y muestra

La información que se utiliza para aplicar técnicas estadísticas se colecta en forma de muestras o conjuntos de observaciones. Las muestras se reúnen a partir de poblaciones, que son conjuntos de todos los individuos o elementos individuales de un tipo específico.

En el lenguaje de la estadística, uno de los conceptos más elementales es el muestreo. En casi todos los problemas de estadística, un número especificado de mediciones o datos, es decir, una muestra, se toma de un cuerpo de mediciones más grande llamado población.

3.2 Parámetro y estadístico

Un parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana, moda o una desviación estándar de una población.

Un estadístico es una medida que describe características de una muestra. Normalmente cuando se habla de muestra los estadísticos son estimadores dado que se acercan a los parámetros de una población.

4 Desarrollo

4.1 Cargar librerías

library(ggplot2)

4.2 Crear datos

4.2.1 Sembrar semilla

Genera los mismos números al ejecutar (run) de nuevo la funcion sample().

set.seed(043632) 

4.2.2 Crear población

Se genera o construye una población de 1000 números con valores entre 250 y 600.

poblacion <- sample(x = 250:600, 
                    size = 1000, 
                    replace = TRUE)   # Sacar una muestra
poblacion
##    [1] 279 337 594 414 583 315 350 558 556 387 536 287 311 331 322 575 565 556
##   [19] 269 282 528 484 377 600 418 600 392 448 371 349 293 386 343 434 355 287
##   [37] 402 441 344 519 257 387 442 253 455 356 472 473 553 463 593 577 336 490
##   [55] 574 474 535 467 572 295 477 275 291 332 337 349 357 440 254 430 550 354
##   [73] 317 430 361 285 433 384 477 300 437 389 479 419 575 343 340 283 444 423
##   [91] 499 330 357 340 506 501 369 402 266 273 455 522 517 395 318 365 500 510
##  [109] 557 362 299 305 391 519 272 383 524 594 468 445 348 320 376 490 563 370
##  [127] 468 560 300 571 302 540 435 254 532 372 430 502 508 551 562 376 376 447
##  [145] 522 578 327 310 536 375 310 358 556 465 381 298 431 304 358 286 353 278
##  [163] 422 371 338 433 280 584 274 517 559 397 481 437 430 419 344 400 414 483
##  [181] 300 273 476 317 459 333 301 562 426 311 585 433 353 555 417 392 506 308
##  [199] 412 256 516 308 599 400 277 353 600 349 582 561 513 350 452 522 326 528
##  [217] 468 564 355 470 395 399 275 480 404 533 284 341 478 488 338 291 527 268
##  [235] 265 463 362 394 288 421 545 367 411 276 277 586 541 367 545 298 383 278
##  [253] 437 449 505 369 394 255 570 494 586 340 276 371 325 420 478 542 501 449
##  [271] 276 492 430 409 432 530 467 319 577 332 257 265 442 540 351 420 579 511
##  [289] 267 500 357 426 433 378 525 598 561 506 273 405 494 382 260 584 488 278
##  [307] 539 354 468 482 290 381 388 543 516 357 357 579 585 339 268 560 283 391
##  [325] 490 277 522 503 491 339 338 565 400 591 547 509 328 313 543 592 305 361
##  [343] 349 557 295 311 355 468 356 250 290 256 357 589 476 381 600 268 493 303
##  [361] 512 336 594 499 536 553 583 473 374 369 417 353 577 579 303 517 371 511
##  [379] 491 402 448 557 515 307 520 333 264 554 307 567 566 563 446 404 535 580
##  [397] 269 338 412 370 333 417 394 288 302 250 431 354 510 449 358 546 387 562
##  [415] 412 521 396 371 362 499 501 578 355 507 298 250 420 388 600 299 343 362
##  [433] 251 292 400 281 286 306 535 272 423 527 422 392 482 389 512 319 263 304
##  [451] 464 398 271 282 509 390 254 419 312 599 549 600 414 302 559 596 520 576
##  [469] 350 538 357 530 453 328 291 593 454 507 496 503 489 448 357 478 587 292
##  [487] 357 413 575 574 557 371 502 433 499 334 511 487 435 588 422 559 561 567
##  [505] 535 252 521 461 564 577 262 378 581 337 593 463 347 476 459 340 552 334
##  [523] 346 373 526 414 578 511 573 361 324 340 600 516 311 370 375 582 447 350
##  [541] 425 420 367 253 456 319 463 415 284 510 403 347 523 389 298 431 493 374
##  [559] 336 600 357 510 555 297 308 528 488 331 343 412 280 578 430 422 301 437
##  [577] 484 344 504 478 370 571 556 311 321 435 398 299 352 277 509 322 336 372
##  [595] 462 435 330 438 329 514 466 494 595 504 322 364 409 489 357 392 469 385
##  [613] 383 506 544 524 411 421 385 580 322 454 288 572 358 283 428 284 574 524
##  [631] 278 484 542 594 315 305 251 310 427 307 306 486 492 341 413 473 590 502
##  [649] 372 596 399 301 445 384 273 270 435 414 371 411 350 541 479 554 383 448
##  [667] 486 480 440 571 424 509 452 473 395 420 445 563 253 587 510 478 422 421
##  [685] 491 335 590 416 539 534 396 494 366 523 316 381 435 423 505 352 372 349
##  [703] 373 375 327 455 426 373 270 375 555 495 281 306 537 303 277 505 593 460
##  [721] 557 549 439 296 367 330 435 360 400 316 318 568 258 502 299 276 446 265
##  [739] 411 542 558 297 598 588 333 357 561 499 497 576 363 431 579 394 278 585
##  [757] 398 371 293 415 497 499 388 264 368 373 508 453 318 520 259 278 461 409
##  [775] 466 391 469 440 473 534 385 417 510 531 487 592 588 507 561 351 517 558
##  [793] 301 515 459 366 325 409 405 591 330 504 508 269 536 355 377 266 260 267
##  [811] 600 597 535 552 530 427 265 584 571 544 558 474 509 437 521 387 493 466
##  [829] 551 455 525 543 465 297 418 339 324 364 380 559 341 494 383 600 462 358
##  [847] 276 495 309 499 334 382 322 407 407 283 347 413 556 290 470 564 597 343
##  [865] 462 476 366 552 600 402 381 333 411 391 489 389 281 387 577 544 596 428
##  [883] 443 437 483 535 460 598 521 420 255 552 298 502 336 360 307 338 283 367
##  [901] 352 558 386 378 296 526 434 457 257 323 424 382 559 484 545 270 469 469
##  [919] 536 277 573 285 420 510 450 564 589 263 384 440 362 491 483 436 504 354
##  [937] 535 577 442 306 445 539 312 335 351 448 567 272 480 389 292 357 350 291
##  [955] 544 467 477 575 271 501 331 444 293 521 523 275 478 492 343 289 395 385
##  [973] 383 463 461 371 458 332 569 265 299 260 600 568 272 282 355 480 307 253
##  [991] 329 595 398 382 405 279 537 309 250 390

4.2.3 Determinar N

La función length() determina la cantidad de elementos de un vector, de tal manera que N identifica el número de elementos de una población.

N <- length(poblacion)
N
## [1] 1000

4.2.4 Crear muestra

Se determina una muestra del 10% de la población de dichos números, 1000 * 0.10 es 100 o el 10%.

n <- N * 0.10 
muestra <- sample(x = poblacion, size = n, replace = FALSE)
muestra
##   [1] 447 353 575 330 596 462 407 273 354 510 331 570 560 479 270 594 435 426
##  [19] 556 336 545 483 367 398 513 402 306 253 508 412 420 422 323 431 590 578
##  [37] 385 283 557 556 447 301 254 409 400 446 530 283 355 424 542 494 322 366
##  [55] 456 254 265 321 381 389 377 355 448 433 409 546 558 493 583 524 372 484
##  [73] 366 277 325 356 588 333 358 382 423 416 502 362 435 503 527 414 589 535
##  [91] 481 361 422 334 577 540 373 519 477 465

4.3 Medias aritméticas de población y muestra

4.3.1 Media población

Se determina en parámetro media poblacional.

media.p <- mean(poblacion)
media.p
## [1] 424.212

4.3.2 Media muestral

Se determina el estadístico media de la muestra

media.m <- mean(muestra)
media.m
## [1] 430.57

4.4 Explorando los datos

4.4.1 Estructura de los datos

str(poblacion)
##  int [1:1000] 279 337 594 414 583 315 350 558 556 387 ...
str(muestra)
##  int [1:100] 447 353 575 330 596 462 407 273 354 510 ...

4.4.2 Resumen de los datos

summary(poblacion)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   250.0   340.0   420.0   424.2   510.0   600.0
summary(muestra)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   253.0   357.5   422.5   430.6   510.8   596.0

4.5 Visualizar los datos

Se muestra un diagrama de dispersión con librería ggplot2 y la función ggplot().

ggplot()+
  geom_point(aes(x = 1:N, y = poblacion), col= 'blue') + 
  geom_hline(yintercept = media.p, col='red') +
  ggtitle(label = "Población", subtitle = paste("Media poblacional = ", media.p))

5 Interpretación

Describir de 120 a 150 palabras interpretar el caso contestando las siguiente preguntas como sugerencia:

¿Cuántos datos tiene la población y la muestra respectivamente?, ¿Qué porcentaje de la muestra es de la población?

Se tiene una población con 1000 datos generados de forma aleatoria con valores de entre 250 y 600, y una muestra de 100 datos, es decir un 10 por ciento de la población total. Se presenta una media poblacional de 424.212 y una media muestral de 430.57. La media se obtiene sumando los valores de todos los datos y dividiendo el resultado entre el numero total de datos (en este caso 1000 y 100 datos). El comando summary() arroja valores relevantes de la serie de datos para hacer un análisis estadístico como el valor mínimo, el primer cuartil, la mediana, la media, el tercer cuartil y el valor máximo —