Simular datos de una población y de una muestra describiendo la media poblacional y la media muestral para su adecuada interpretación.
Generar una población de 1000 números con valores entre 250 y 600
Determinar una muestra del 10% de la población de dichos números
Identificar la estructura de los datos
Determinar el parámetro la media de la población
Determinar el estadístico de la media de la muestra
Mostrar el resumen de los daos de población y muestra
Comparar valores de medias del parámetro poblacional contra el estadístico de la muestra.
Se visualiza la dispersión de los datos con la función ggplot() de la librería “ggplot2”.
Interpretar el caso
La información que se utiliza para aplicar técnicas estadísticas se colecta en forma de muestras o conjuntos de observaciones. Las muestras se reúnen a partir de poblaciones, que son conjuntos de todos los individuos o elementos individuales de un tipo específico.
En el lenguaje de la estadística, uno de los conceptos más elementales es el muestreo. En casi todos los problemas de estadística, un número especificado de mediciones o datos, es decir, una muestra, se toma de un cuerpo de mediciones más grande llamado población.
Un parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana, moda o una desviación estándar de una población.
Un estadístico es una medida que describe características de una muestra. Normalmente cuando se habla de muestra los estadísticos son estimadores dado que se acercan a los parámetros de una población.
library(ggplot2)
set.seed(022422)
Se genera o construye una población de 1000 números con valores entre 250 y 600.
poblacion <- sample(x = 250:600,
size = 1000,
replace = TRUE)
poblacion
## [1] 477 265 312 391 421 583 591 370 252 388 361 470 566 437 434 341 532 358
## [19] 413 251 549 375 423 266 527 278 250 526 581 290 503 346 402 573 582 580
## [37] 311 493 455 410 578 500 344 269 400 454 287 463 596 562 533 397 289 394
## [55] 523 367 458 283 324 404 391 487 264 548 426 590 283 476 337 515 333 423
## [73] 505 464 261 589 437 527 539 463 553 328 319 260 306 520 266 375 361 549
## [91] 423 411 588 544 434 472 524 510 388 591 349 309 415 556 552 525 352 600
## [109] 386 339 301 316 335 477 577 274 514 434 452 456 343 486 396 403 322 337
## [127] 460 509 317 328 559 404 302 300 346 447 566 300 487 469 576 363 397 549
## [145] 533 592 307 409 561 301 342 548 584 268 432 517 453 425 466 403 569 530
## [163] 318 494 285 534 505 254 525 585 374 490 542 251 375 326 287 282 313 497
## [181] 389 387 496 499 591 557 599 265 400 338 522 476 516 477 342 407 410 474
## [199] 584 424 406 371 548 501 533 450 316 523 272 339 434 341 277 355 354 327
## [217] 414 514 509 466 335 312 264 494 396 450 314 534 598 316 495 279 287 515
## [235] 585 585 395 460 484 590 282 590 334 504 275 447 331 392 263 270 276 412
## [253] 335 327 378 482 380 531 378 321 371 534 483 595 267 419 523 489 446 410
## [271] 583 490 380 513 328 548 515 409 489 496 303 571 386 283 554 330 431 504
## [289] 350 512 568 384 324 428 382 352 251 383 296 387 571 533 316 370 442 391
## [307] 538 477 562 351 591 292 393 339 481 436 291 272 597 390 369 402 541 429
## [325] 280 412 456 309 448 260 449 368 345 338 337 519 539 296 342 325 565 590
## [343] 347 253 414 560 443 350 403 327 434 540 407 367 340 368 340 327 317 319
## [361] 354 253 588 522 557 356 369 399 485 421 363 362 509 517 481 563 266 351
## [379] 549 571 554 591 302 269 506 465 543 399 592 555 493 576 580 303 312 457
## [397] 545 312 317 508 376 525 470 558 469 358 280 551 448 250 554 421 309 534
## [415] 480 360 373 544 317 538 553 467 314 367 563 277 450 270 267 324 494 519
## [433] 331 535 275 315 468 310 490 381 542 448 537 278 579 311 256 373 494 251
## [451] 592 311 456 330 420 557 442 392 456 477 310 269 266 472 375 391 354 505
## [469] 553 551 520 427 504 546 320 352 270 436 480 320 346 270 464 259 378 566
## [487] 435 452 418 326 498 291 512 571 369 587 474 505 504 393 276 334 387 516
## [505] 302 372 475 412 320 349 313 435 267 485 252 311 522 253 588 408 441 441
## [523] 574 388 358 542 395 593 526 452 388 506 461 509 564 388 350 597 389 408
## [541] 272 444 343 420 327 503 254 482 260 511 495 293 306 367 293 534 413 434
## [559] 484 477 449 457 477 387 362 397 321 278 413 576 443 326 275 389 589 385
## [577] 570 356 572 269 578 251 440 460 409 588 264 354 358 293 253 469 578 326
## [595] 406 457 469 511 592 455 480 360 482 431 407 469 433 354 346 598 351 393
## [613] 563 376 515 359 466 570 426 304 312 335 283 427 409 262 519 320 580 522
## [631] 301 315 271 329 582 383 345 403 559 437 282 321 593 521 461 573 478 333
## [649] 505 523 331 524 461 502 461 320 489 334 482 359 381 530 478 338 567 521
## [667] 250 509 355 569 276 471 269 476 545 477 555 399 506 514 445 293 510 355
## [685] 446 291 391 327 372 567 312 502 294 564 509 341 497 501 577 526 270 563
## [703] 388 405 403 530 330 359 404 471 333 368 563 486 445 436 330 592 261 321
## [721] 380 430 307 269 334 461 447 372 515 489 335 576 398 585 410 337 317 497
## [739] 381 373 290 516 478 459 443 334 548 476 569 516 519 317 305 382 530 514
## [757] 535 325 524 507 504 519 328 533 462 588 375 591 465 328 367 373 427 460
## [775] 441 375 407 272 310 277 502 485 279 306 510 250 304 399 317 369 553 316
## [793] 484 477 275 518 345 551 530 293 345 544 588 529 313 387 442 373 256 562
## [811] 447 498 556 297 541 581 370 471 303 354 529 391 267 550 346 527 570 547
## [829] 369 578 580 436 473 360 537 578 401 597 279 589 479 551 522 398 350 552
## [847] 530 563 379 400 483 559 335 491 366 336 367 288 466 312 473 426 306 491
## [865] 579 435 287 496 427 504 278 521 299 305 413 297 253 527 371 527 293 462
## [883] 281 530 566 550 314 253 504 530 324 291 491 442 519 438 331 314 571 453
## [901] 545 405 525 334 435 327 264 485 454 258 528 540 338 473 425 553 572 467
## [919] 499 278 371 268 348 299 420 404 565 393 504 549 530 259 287 589 492 448
## [937] 287 483 568 586 503 345 331 523 488 369 343 321 532 597 500 454 313 596
## [955] 332 523 518 358 459 435 525 301 501 282 550 263 529 488 577 310 354 368
## [973] 559 286 327 264 433 414 518 374 477 430 253 330 459 318 316 388 288 441
## [991] 394 410 338 519 311 415 519 276 424 519
La función length() determina la cantidad de elementos de un vector, de tal manera que N identifica el número de elementos de una población.
N <- length(poblacion)
N
## [1] 1000
Se determina una muestra del 10% de la población de dichos números, 1000 * 0.10 es 100 o el 10%.
n <- N * 0.10
muestra <- sample(x = poblacion, size = n, replace = FALSE)
muestra
## [1] 537 558 535 546 391 518 580 482 503 374 311 356 595 393 441 299 523 387
## [19] 395 278 502 534 503 252 514 527 270 476 315 563 305 526 526 591 324 581
## [37] 358 269 521 433 447 334 524 369 470 457 330 371 368 534 321 363 527 314
## [55] 372 464 387 279 592 578 409 369 408 530 311 509 449 490 311 548 532 414
## [73] 468 452 525 505 589 344 504 548 551 399 500 358 312 414 346 393 490 582
## [91] 414 253 423 291 394 533 263 279 274 515
Se determina en parámetro media poblacional.
media.p <- mean(poblacion)
media.p
## [1] 424.738
Se determina el estadístico media de la muestra
media.m <- mean(muestra)
media.m
## [1] 434.92
str(poblacion)
## int [1:1000] 477 265 312 391 421 583 591 370 252 388 ...
str(muestra)
## int [1:100] 537 558 535 546 391 518 580 482 503 374 ...
summary(poblacion)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 250.0 334.0 425.5 424.7 515.0 600.0
summary(muestra)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 252.0 357.5 444.0 434.9 525.2 595.0
Se muestra un diagrama de dispersión con librería ggplot2 y la función ggplot().
ggplot()+
geom_point(aes(x = 1:N, y = poblacion), col= 'blue') +
geom_hline(yintercept = media.p, col='red') +
ggtitle(label = "Población", subtitle = paste("Media poblacional = ", media.p))
¿Cuántos datos tiene la población y la muestra respectivamente?, ¿Qué porcentaje de la muestra es de la población? La poblacion es de 1000 personas y la muestra es de un 10% osea que es de 100 personas.
¿Cuál es el el valor de la media poblacional y la media muestral? La media poblacional tiene un valor de 425.038 y la media muestral equivale a 398.16.
¿Que relación tiene la media poblacional y la media muestral? Pues las dos son medias de los datos pero la muestral es solo de algunos datos.
¿Cómo se obtiene la media ? La media es el promedio de los datos, tenemos que sumar todos los datos y dividirlo entre la cantidad de datos.