Simular datos de una población y de una muestra describiendo la media poblacional y la media muestral para su adecuada interpretación.
Generar una población de 1000 números con valores entre 250 y 600.
Determinar una muestra del 10% de la población de dichos números.
Identificar la estructura de los datos.
Determinar el parámetro la media de la población.
Determinar el estadístico de la media de la muestra.
Mostrar el resumen de los daos de población y muestra.
Comparar valores de medias del parámetro poblacional contra el estadístico de la muestra.
Se visualiza la dispersión de los datos con la función ggplot() de la librería “ggplot2”.
Interpretar el caso.
Una población es un conjunto de personas, objetos o eventos acerca de los cuales se desea hacer inferencias. Mientras que una muestra es un subconjunto de personas, objetos o eventos de una población más grande que se recolecta y analiza para hacer inferencias Si la muestra es aleatoria y lo suficientemente grande, usted puede utilizar la información obtenida de la muestra para hacer inferencias sobre la población, sin embargo, no siempre es conveniente o posible examinar cada miembro de una población completa.
Un parámetro es una cantidad numérica calculada sobre una población y resume los valores que se toman en algún atributo. Intenta resumir toda información que hay en la población. En cambio, un estadístico es una cantidad de igual manera numérica y calculada, pero en este caso, sobre una muestra que resume su información en cuestión.
library(ggplot2)
Genera los mismos números al ejecutar (run) de nuevo la función sample().
set.seed(4444)
Se genera o construye una población de 1000 números con valores entre 250 y 600.
poblacion = sample(x = 250:600,
size = 1000,
replace = TRUE)
poblacion
## [1] 289 331 434 319 455 372 478 412 490 315 373 425 469 355 593 391 412 321
## [19] 594 568 544 269 280 555 463 330 261 289 570 559 440 320 446 507 579 364
## [37] 543 252 578 566 359 272 536 295 587 423 520 267 391 286 361 329 291 538
## [55] 432 383 390 401 337 269 400 579 469 464 308 354 259 344 287 536 327 585
## [73] 259 551 385 571 487 489 576 543 290 300 512 585 293 359 292 305 577 410
## [91] 315 597 265 580 510 328 495 329 341 337 347 360 552 513 471 397 484 364
## [109] 418 536 300 597 342 265 276 514 536 324 415 482 293 401 488 370 525 567
## [127] 324 253 558 449 360 256 359 374 547 268 450 331 431 427 570 334 437 464
## [145] 334 255 554 518 541 313 510 578 519 488 329 296 317 526 392 572 574 357
## [163] 538 497 250 495 579 573 515 446 487 377 447 327 479 372 364 432 287 321
## [181] 387 309 400 533 357 286 553 375 293 428 580 579 362 327 586 530 391 462
## [199] 300 363 454 340 365 472 542 443 403 458 576 509 484 368 289 347 375 333
## [217] 361 430 504 580 292 435 527 567 430 553 422 360 273 489 533 452 543 401
## [235] 265 426 564 453 563 418 431 508 541 336 587 430 269 589 473 313 478 343
## [253] 335 554 499 492 519 340 512 443 437 406 302 504 522 270 297 407 386 277
## [271] 437 336 320 286 579 376 439 535 445 564 523 440 314 284 467 295 382 282
## [289] 305 535 361 342 512 502 390 600 494 274 470 481 310 391 345 481 277 365
## [307] 326 474 290 554 446 494 529 507 474 490 457 354 348 524 564 556 441 579
## [325] 303 430 545 559 526 600 385 413 593 325 341 490 348 355 290 452 334 503
## [343] 418 355 341 406 564 257 520 576 463 264 598 513 330 451 558 520 469 525
## [361] 448 383 572 485 531 403 513 531 504 445 283 408 276 334 397 486 551 451
## [379] 322 592 556 391 488 294 443 530 470 364 312 262 449 267 270 439 591 422
## [397] 346 534 461 380 385 282 410 477 514 514 566 342 271 592 584 424 358 304
## [415] 517 521 519 337 307 329 505 489 505 320 381 549 256 427 453 252 599 413
## [433] 424 282 304 267 334 469 256 476 455 524 472 553 301 493 524 303 423 284
## [451] 370 467 372 349 454 597 454 580 330 409 281 255 450 598 566 519 432 450
## [469] 471 289 527 431 384 525 415 477 516 263 434 447 535 518 440 554 430 347
## [487] 274 345 573 391 408 575 460 489 351 449 490 519 521 473 369 391 451 273
## [505] 493 316 410 529 397 388 408 450 528 441 507 278 343 330 583 536 594 520
## [523] 531 520 275 433 594 370 533 472 436 401 540 321 571 373 365 598 260 458
## [541] 280 389 354 456 588 311 561 337 279 356 323 531 386 541 590 582 287 391
## [559] 391 417 386 324 538 302 533 293 366 548 574 285 278 338 389 593 514 321
## [577] 502 414 533 313 453 565 441 324 546 540 467 504 297 381 525 407 306 389
## [595] 308 506 463 586 306 289 268 499 325 269 471 563 354 584 340 401 366 318
## [613] 376 439 495 588 413 383 392 381 415 581 464 595 430 577 545 443 353 517
## [631] 346 296 356 525 507 259 382 585 569 565 480 256 421 493 342 596 577 325
## [649] 521 468 403 520 260 428 296 355 300 489 479 328 287 257 425 298 388 492
## [667] 432 598 402 528 519 294 369 596 427 349 511 422 524 513 334 527 453 278
## [685] 574 395 582 571 478 386 333 546 280 518 281 524 551 508 272 492 387 553
## [703] 597 479 381 402 564 573 579 349 553 495 409 474 586 489 563 566 559 411
## [721] 316 337 312 321 357 281 378 419 543 434 473 592 393 389 526 443 481 283
## [739] 408 590 424 284 540 326 355 588 492 572 462 550 335 405 598 280 526 546
## [757] 451 286 268 425 299 412 541 486 567 552 507 345 391 318 513 446 393 443
## [775] 531 304 557 475 284 558 591 581 561 542 598 497 535 346 488 519 308 525
## [793] 385 581 419 507 548 326 470 272 269 393 497 504 316 316 358 428 342 375
## [811] 293 305 350 432 450 427 356 378 469 269 557 386 489 395 470 396 254 467
## [829] 357 483 544 330 474 439 314 445 514 433 516 434 511 310 435 343 349 305
## [847] 433 572 404 355 361 586 366 361 508 444 350 277 420 336 479 461 293 440
## [865] 549 253 477 590 316 592 460 386 412 580 517 368 405 375 269 437 293 511
## [883] 520 452 396 523 443 405 512 482 397 536 551 580 414 503 551 467 396 444
## [901] 315 259 343 299 357 538 256 262 432 330 530 390 372 538 264 452 513 262
## [919] 382 533 267 498 300 292 585 375 348 276 469 523 534 410 321 295 489 467
## [937] 459 449 386 282 403 334 387 260 530 542 518 334 477 488 568 522 384 421
## [955] 484 454 585 439 448 502 276 401 292 335 465 353 509 315 261 356 257 259
## [973] 563 422 323 291 373 456 400 429 364 507 482 404 585 535 478 350 389 463
## [991] 477 522 549 311 342 252 336 330 365 571
La función length() determina la cantidad de elementos de un vector, de tal manera que N identifica el número de elementos de una población.
N = length(poblacion)
N
## [1] 1000
Se determina una muestra del 10% de la población de dichos números, 1000 * 0.10 es 100 o el 10%.
n = N * 0.10
muestra = sample(x = poblacion, size = n, replace = FALSE)
muestra
## [1] 495 437 300 599 556 443 291 405 329 397 588 570 533 545 269 355 311 401
## [19] 520 520 527 284 538 356 479 315 522 316 571 579 321 314 383 372 382 264
## [37] 287 372 435 261 267 463 364 297 410 347 472 444 361 400 494 573 503 404
## [55] 585 563 495 330 397 586 408 348 262 430 474 429 495 531 424 287 580 477
## [73] 475 397 558 340 507 336 272 375 415 535 284 493 427 295 308 412 300 439
## [91] 523 511 294 512 471 451 253 440 597 541
Se determina en parámetro media poblacional.
media.p = mean(poblacion)
media.p
## [1] 428.522
Se determina el estadístico media de la muestra.
media.m = mean(muestra)
media.m
## [1] 424.03
str(poblacion)
## int [1:1000] 289 331 434 319 455 372 478 412 490 315 ...
str(muestra)
## int [1:100] 495 437 300 599 556 443 291 405 329 397 ...
summary(poblacion)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 250.0 342.0 431.5 428.5 518.0 600.0
summary(muestra)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 253.0 334.5 425.5 424.0 511.2 599.0
Se muestra un diagrama de dispersión con librería ggplot2 y la función ggplot().
ggplot()+
geom_point(aes(x = 1:N, y = poblacion), col= 'purple') +
geom_hline(yintercept = media.p, col='black') +
ggtitle(label = "Población", subtitle = paste("Media Poblacional = ", media.p))
Describir de 120 a 150 palabras interpretar el caso contestando las siguiente preguntas como sugerencia:
¿Cuántos datos tiene la población y la muestra respectivamente?, ¿Qué porcentaje de la muestra es de la población? ¿Cuál es el el valor de la media poblacional y la media muestral? ¿Que relación tiene la media poblacional y la media muestral? ¿Cómo se obtiene la media ? ¿Como se obtiene la estructura de los datos (str()) y que valores arroja? ¿Cómo se describen los datos? con summary() y que valores arroja?
Tienen 1000 (población) y 100 datos (muestra). Así mismo y dadas las cantidades mencionadas, podemos decir que la muestra consta de una décima parte de la población en su total, es decir, el 10%. Tienen 428.522 (población) de media y 424.03 (media muestral). La relación que tienen es considerablemente cercana en cuanto a su valor total, esto se debe a que el muestreo tiende a ser similar a su origen en cuestión. La media se obtiene mediante la función mean(x). Mientras que la estructura se obtiene mediante la función str(x) y arroja el tamaño de los datos, el tipo de los datos y los datos. A manera de tabla y arroja el mínimo, la media y la mediana de ambos muestreos (población y muestra).