Simular datos de una población y de una muestra describiendo la media poblacional y la media muestral para su adecuada interpretación.
Generar una población de 1000 números con valores entre 250 y 600
Determinar una muestra del 10% de la población de dichos números
Identificar la estructura de los datos
Determinar el parámetro la media de la población
Determinar el estadístico de la media de la muestra
Mostrar el resumen de los datos de población y muestra
Comparar valores de medias del parámetro poblacional contra el estadístico de la muestra.
Se visualiza la dispersión de los datos con la función ggplot() de la librería “ggplot2”.
Interpretar el caso
La información que se utiliza para aplicar técnicas estadísticas se colecta en forma de muestras o conjuntos de observaciones. Las muestras se reúnen a partir de poblaciones, que son conjuntos de todos los individuos o elementos individuales de un tipo específico.
En el lenguaje de la estadística, uno de los conceptos más elementales es el muestreo. En casi todos los problemas de estadística, un número especificado de mediciones o datos, es decir, una muestra, se toma de un cuerpo de mediciones más grande llamado población.
Un parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana, moda o una desviación estándar de una población.
Un estadístico es una medida que describe características de una muestra. Normalmente cuando se habla de muestra los estadísticos son estimadores dado que se acercan a los parámetros de una población.
library(ggplot2)
Genera los mismos números al ejecutar (run) de nuevo la funcion sample().
set.seed(022022)
Se genera o construye una población de 1000 números con valores entre 250 y 600.
poblacion <- sample(x = 250:600,
size = 1000,
replace = TRUE) # Sacar una muestra
poblacion
## [1] 364 361 512 336 528 295 405 438 576 273 431 532 445 371 435 316 374 532
## [19] 371 347 577 412 535 265 513 254 523 573 410 436 543 596 369 479 513 275
## [37] 407 421 502 424 571 597 400 596 276 481 361 471 458 369 360 380 386 337
## [55] 370 463 547 578 587 561 586 541 435 535 316 352 504 347 325 553 484 260
## [73] 285 313 453 494 435 598 296 387 332 561 452 320 504 285 398 579 570 533
## [91] 495 469 324 289 417 557 380 528 424 521 303 264 473 426 353 460 352 260
## [109] 507 446 313 552 464 413 566 258 575 476 372 373 565 533 479 567 368 265
## [127] 569 570 297 289 555 380 546 455 268 266 464 293 457 293 380 416 589 435
## [145] 285 275 251 569 515 449 330 295 310 493 459 320 386 411 358 347 423 562
## [163] 300 570 486 411 525 469 409 411 259 512 261 357 482 281 396 599 450 360
## [181] 443 555 333 401 510 363 352 570 454 263 526 282 482 270 526 341 510 526
## [199] 262 366 355 524 329 462 409 250 376 424 554 282 298 537 326 517 399 561
## [217] 291 570 528 457 574 305 521 582 572 458 337 503 541 566 359 314 376 390
## [235] 261 558 525 256 291 573 363 403 329 458 514 368 282 402 388 252 569 423
## [253] 462 589 310 526 562 388 408 484 461 483 424 543 305 405 395 302 419 310
## [271] 311 497 577 517 458 308 437 370 336 361 593 372 534 545 441 500 288 404
## [289] 581 597 316 258 327 568 322 423 296 471 491 257 317 385 282 577 413 557
## [307] 543 532 590 391 465 537 451 473 315 511 258 471 382 343 538 358 401 401
## [325] 521 479 271 597 342 512 397 535 369 270 368 411 520 515 357 469 481 344
## [343] 391 353 600 267 270 287 259 561 493 397 554 419 356 579 536 571 360 426
## [361] 561 296 486 299 368 558 394 382 362 346 453 354 352 502 542 337 334 383
## [379] 250 442 305 458 403 270 292 500 520 494 475 531 391 325 301 541 483 544
## [397] 443 295 287 329 581 391 468 307 289 525 580 250 492 404 572 379 353 539
## [415] 355 461 470 296 382 439 561 259 466 331 299 404 411 418 273 366 514 443
## [433] 321 510 373 283 495 353 259 290 503 440 264 333 454 410 574 586 378 499
## [451] 324 278 384 486 369 596 309 389 442 308 407 466 581 497 340 477 598 492
## [469] 433 511 494 437 276 322 576 284 278 511 397 412 481 348 376 448 468 563
## [487] 342 566 572 336 541 487 409 256 568 283 281 273 413 554 262 558 557 507
## [505] 252 585 538 328 288 530 455 425 283 280 339 594 254 386 487 424 505 399
## [523] 293 262 355 253 327 436 388 257 578 475 443 525 454 325 456 445 559 317
## [541] 289 464 361 308 507 521 471 412 417 258 257 591 416 595 312 323 378 500
## [559] 564 344 378 546 350 437 569 387 413 405 504 264 382 386 314 520 587 530
## [577] 383 463 570 274 538 371 417 309 261 308 468 440 488 392 484 364 438 277
## [595] 579 405 336 596 525 329 320 529 506 583 346 596 571 284 507 447 396 383
## [613] 582 379 372 292 364 406 454 287 596 583 285 391 408 558 442 447 362 588
## [631] 443 347 319 364 416 420 552 574 533 450 342 572 428 443 387 463 486 585
## [649] 292 538 493 490 562 447 479 313 268 483 556 320 564 538 537 475 443 441
## [667] 300 327 441 273 332 458 404 331 326 528 397 566 365 324 439 377 572 552
## [685] 380 540 425 291 579 303 468 588 459 535 346 422 429 311 512 562 259 478
## [703] 359 424 450 468 301 445 560 431 420 394 394 314 518 466 282 583 390 498
## [721] 410 473 501 459 341 510 506 485 533 263 324 394 375 453 486 321 357 329
## [739] 316 510 444 434 533 533 391 306 298 529 487 410 402 493 460 343 359 448
## [757] 410 290 549 329 281 573 335 592 379 377 309 387 303 451 550 363 450 463
## [775] 510 493 257 558 335 287 550 344 501 256 375 379 312 309 353 482 445 277
## [793] 293 456 471 315 492 267 446 265 477 491 399 351 333 306 551 304 479 489
## [811] 489 263 251 596 577 336 298 586 443 586 433 420 579 331 442 390 256 448
## [829] 350 409 486 261 410 266 360 408 539 513 344 546 293 519 262 576 540 460
## [847] 295 499 433 304 516 457 506 534 581 590 286 481 273 436 502 397 276 590
## [865] 286 593 511 340 436 260 275 375 460 583 552 279 383 456 475 568 379 293
## [883] 417 513 503 307 307 411 436 341 567 504 365 545 325 432 526 513 521 576
## [901] 588 592 402 596 268 433 270 376 344 250 518 444 258 258 560 358 362 527
## [919] 395 346 362 341 437 589 569 421 265 313 397 457 285 336 578 532 595 322
## [937] 463 273 254 525 360 393 562 487 457 304 489 402 299 569 585 400 497 373
## [955] 431 515 290 432 529 568 373 503 527 550 591 485 283 475 590 390 416 353
## [973] 587 344 517 280 411 576 550 398 490 321 321 271 331 450 573 387 575 285
## [991] 384 319 266 577 422 434 273 336 571 482
La función length() determina la cantidad de elementos de un vector, de tal manera que N identifica el número de elementos de una población.
N <- length(poblacion)
N
## [1] 1000
Se determina una muestra del 10% de la población de dichos números, 1000 * 0.10 es 100 o el 10%.
n <- N * 0.10
muestra <- sample(x = poblacion, size = n, replace = FALSE)
muestra
## [1] 284 479 364 398 552 513 481 336 517 487 460 363 299 487 478 579 410 490
## [19] 554 405 447 353 409 495 296 397 346 394 484 360 417 571 468 420 304 466
## [37] 308 291 568 434 293 500 597 376 288 577 336 503 375 316 497 287 281 464
## [55] 482 421 590 590 295 366 386 568 440 325 503 309 285 573 344 387 320 484
## [73] 257 355 596 256 554 411 341 423 357 344 591 546 266 423 373 347 543 405
## [91] 398 596 577 538 305 358 592 579 329 336
Se determina en parámetro media poblacional.
media.p <- mean(poblacion)
media.p
## [1] 424.323
Se determina el estadístico media de la muestra
media.m <- mean(muestra)
media.m
## [1] 425.18
str(poblacion)
## int [1:1000] 364 361 512 336 528 295 405 438 576 273 ...
str(muestra)
## int [1:100] 284 479 364 398 552 513 481 336 517 487 ...
summary(poblacion)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 250.0 336.0 423.0 424.3 512.2 600.0
summary(muestra)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 256.0 343.2 410.5 425.2 500.8 597.0
Se muestra un diagrama de dispersión con librería ggplot2 y la función ggplot().
ggplot()+
geom_point(aes(x = 1:N, y = poblacion), col='magenta') +
geom_hline(yintercept = media.p, col='cyan')
De una población de 1000 campesinos se toma una muestra del 10% de la población campesina (es decir, 100 campesinos) para determinar el peso medio de la población (en libras).
De lo anterior se determinó que la media poblacional y muestral es:
Media poblacional: 424.323
Media muestral: 425.18
* Para calcular la media se suman todos los valores y dividiendo la suma entre el número total de valores. En Rstudio hacemos de la función
media.p <- mean()
media.p
media.m <- mean()
media.m
“Se extraen muestras aleatorias de tamaño n de una población infinita con media poblacional y varianza: La media de las medias muéstrales es igual a la media poblacional.” “Acuna, E. DISTRIBUCIONES MUESTRALES. de UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ