0.1 Objetivo:

Simular datos de una población y de una muestra describiendo la media poblacional y la media muestral para su adecuada interpretación.

0.2 Descripción:

  • Generar una población de 1000 números con valores entre 250 y 600.

  • Determinar una muestra del 10% de la población de dichos números.

  • Identificar la estructura de los datos.

  • Determinar el parámetro la media de la población.

  • Determinar el estadístico de la media de la muestra.

  • Mostrar el resumen de los daos de población y muestra.

  • Comparar valores de medias del parámetro poblacional contra el estadístico de la muestra.

  • Se visualiza la dispersión de los datos con la función ggplot() de la librería “ggplot2”.

  • Interpretar el caso.

0.3 Marco Teórico

0.3.1 Población y Muestra:

Una población es un conjunto de personas, objetos o eventos acerca de los cuales se desea hacer inferencias. Mientras que una muestra es un subconjunto de personas, objetos o eventos de una población más grande que se recolecta y analiza para hacer inferencias Si la muestra es aleatoria y lo suficientemente grande, usted puede utilizar la información obtenida de la muestra para hacer inferencias sobre la población, sin embargo, no siempre es conveniente o posible examinar cada miembro de una población completa.

0.3.2 Parámetro y Estadístico:

Un parámetro es una cantidad numérica calculada sobre una población y resume los valores que se toman en algún atributo. Intenta resumir toda información que hay en la población. En cambio, un estadístico es una cantidad de igual manera numérica y calculada, pero en este caso, sobre una muestra que resume su información en cuestión.

0.4 Desarrollo

0.4.1 Cargar Librerías:

library(ggplot2)

0.5 Crear Datos

0.5.1 Sembrar Semilla:

Genera los mismos números al ejecutar (run) de nuevo la función sample().

set.seed(4444)

0.5.2 Crear Población:

Se genera o construye una población de 1000 números con valores entre 250 y 600.

poblacion = sample(x = 250:600,
                   size = 1000,
                   replace = TRUE)

poblacion 
##    [1] 289 331 434 319 455 372 478 412 490 315 373 425 469 355 593 391 412 321
##   [19] 594 568 544 269 280 555 463 330 261 289 570 559 440 320 446 507 579 364
##   [37] 543 252 578 566 359 272 536 295 587 423 520 267 391 286 361 329 291 538
##   [55] 432 383 390 401 337 269 400 579 469 464 308 354 259 344 287 536 327 585
##   [73] 259 551 385 571 487 489 576 543 290 300 512 585 293 359 292 305 577 410
##   [91] 315 597 265 580 510 328 495 329 341 337 347 360 552 513 471 397 484 364
##  [109] 418 536 300 597 342 265 276 514 536 324 415 482 293 401 488 370 525 567
##  [127] 324 253 558 449 360 256 359 374 547 268 450 331 431 427 570 334 437 464
##  [145] 334 255 554 518 541 313 510 578 519 488 329 296 317 526 392 572 574 357
##  [163] 538 497 250 495 579 573 515 446 487 377 447 327 479 372 364 432 287 321
##  [181] 387 309 400 533 357 286 553 375 293 428 580 579 362 327 586 530 391 462
##  [199] 300 363 454 340 365 472 542 443 403 458 576 509 484 368 289 347 375 333
##  [217] 361 430 504 580 292 435 527 567 430 553 422 360 273 489 533 452 543 401
##  [235] 265 426 564 453 563 418 431 508 541 336 587 430 269 589 473 313 478 343
##  [253] 335 554 499 492 519 340 512 443 437 406 302 504 522 270 297 407 386 277
##  [271] 437 336 320 286 579 376 439 535 445 564 523 440 314 284 467 295 382 282
##  [289] 305 535 361 342 512 502 390 600 494 274 470 481 310 391 345 481 277 365
##  [307] 326 474 290 554 446 494 529 507 474 490 457 354 348 524 564 556 441 579
##  [325] 303 430 545 559 526 600 385 413 593 325 341 490 348 355 290 452 334 503
##  [343] 418 355 341 406 564 257 520 576 463 264 598 513 330 451 558 520 469 525
##  [361] 448 383 572 485 531 403 513 531 504 445 283 408 276 334 397 486 551 451
##  [379] 322 592 556 391 488 294 443 530 470 364 312 262 449 267 270 439 591 422
##  [397] 346 534 461 380 385 282 410 477 514 514 566 342 271 592 584 424 358 304
##  [415] 517 521 519 337 307 329 505 489 505 320 381 549 256 427 453 252 599 413
##  [433] 424 282 304 267 334 469 256 476 455 524 472 553 301 493 524 303 423 284
##  [451] 370 467 372 349 454 597 454 580 330 409 281 255 450 598 566 519 432 450
##  [469] 471 289 527 431 384 525 415 477 516 263 434 447 535 518 440 554 430 347
##  [487] 274 345 573 391 408 575 460 489 351 449 490 519 521 473 369 391 451 273
##  [505] 493 316 410 529 397 388 408 450 528 441 507 278 343 330 583 536 594 520
##  [523] 531 520 275 433 594 370 533 472 436 401 540 321 571 373 365 598 260 458
##  [541] 280 389 354 456 588 311 561 337 279 356 323 531 386 541 590 582 287 391
##  [559] 391 417 386 324 538 302 533 293 366 548 574 285 278 338 389 593 514 321
##  [577] 502 414 533 313 453 565 441 324 546 540 467 504 297 381 525 407 306 389
##  [595] 308 506 463 586 306 289 268 499 325 269 471 563 354 584 340 401 366 318
##  [613] 376 439 495 588 413 383 392 381 415 581 464 595 430 577 545 443 353 517
##  [631] 346 296 356 525 507 259 382 585 569 565 480 256 421 493 342 596 577 325
##  [649] 521 468 403 520 260 428 296 355 300 489 479 328 287 257 425 298 388 492
##  [667] 432 598 402 528 519 294 369 596 427 349 511 422 524 513 334 527 453 278
##  [685] 574 395 582 571 478 386 333 546 280 518 281 524 551 508 272 492 387 553
##  [703] 597 479 381 402 564 573 579 349 553 495 409 474 586 489 563 566 559 411
##  [721] 316 337 312 321 357 281 378 419 543 434 473 592 393 389 526 443 481 283
##  [739] 408 590 424 284 540 326 355 588 492 572 462 550 335 405 598 280 526 546
##  [757] 451 286 268 425 299 412 541 486 567 552 507 345 391 318 513 446 393 443
##  [775] 531 304 557 475 284 558 591 581 561 542 598 497 535 346 488 519 308 525
##  [793] 385 581 419 507 548 326 470 272 269 393 497 504 316 316 358 428 342 375
##  [811] 293 305 350 432 450 427 356 378 469 269 557 386 489 395 470 396 254 467
##  [829] 357 483 544 330 474 439 314 445 514 433 516 434 511 310 435 343 349 305
##  [847] 433 572 404 355 361 586 366 361 508 444 350 277 420 336 479 461 293 440
##  [865] 549 253 477 590 316 592 460 386 412 580 517 368 405 375 269 437 293 511
##  [883] 520 452 396 523 443 405 512 482 397 536 551 580 414 503 551 467 396 444
##  [901] 315 259 343 299 357 538 256 262 432 330 530 390 372 538 264 452 513 262
##  [919] 382 533 267 498 300 292 585 375 348 276 469 523 534 410 321 295 489 467
##  [937] 459 449 386 282 403 334 387 260 530 542 518 334 477 488 568 522 384 421
##  [955] 484 454 585 439 448 502 276 401 292 335 465 353 509 315 261 356 257 259
##  [973] 563 422 323 291 373 456 400 429 364 507 482 404 585 535 478 350 389 463
##  [991] 477 522 549 311 342 252 336 330 365 571

0.5.3 Determinar “N”:

La función length() determina la cantidad de elementos de un vector, de tal manera que N identifica el número de elementos de una población.

N = length(poblacion)

N
## [1] 1000

0.5.4 Crear Muestra:

Se determina una muestra del 10% de la población de dichos números, 1000 * 0.10 es 100 o el 10%.

n = N * 0.10 
muestra = sample(x = poblacion, size = n, replace = FALSE)

muestra
##   [1] 495 437 300 599 556 443 291 405 329 397 588 570 533 545 269 355 311 401
##  [19] 520 520 527 284 538 356 479 315 522 316 571 579 321 314 383 372 382 264
##  [37] 287 372 435 261 267 463 364 297 410 347 472 444 361 400 494 573 503 404
##  [55] 585 563 495 330 397 586 408 348 262 430 474 429 495 531 424 287 580 477
##  [73] 475 397 558 340 507 336 272 375 415 535 284 493 427 295 308 412 300 439
##  [91] 523 511 294 512 471 451 253 440 597 541

0.6 Medidas Aritméticas de Población y Muestra

0.6.1 Media Población:

Se determina en parámetro media poblacional.

media.p = mean(poblacion)

media.p
## [1] 428.522

0.6.2 Media Muestral:

Se determina el estadístico media de la muestra.

media.m = mean(muestra)

media.m
## [1] 424.03

0.7 Explorando los Datos

0.7.1 Estractura de los Datos:

str(poblacion)
##  int [1:1000] 289 331 434 319 455 372 478 412 490 315 ...
str(muestra)
##  int [1:100] 495 437 300 599 556 443 291 405 329 397 ...

0.7.2 Resumen de los datos:

summary(poblacion)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   250.0   342.0   431.5   428.5   518.0   600.0
summary(muestra)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   253.0   334.5   425.5   424.0   511.2   599.0

0.7.3 Visualizar los Datos:

Se muestra un diagrama de dispersión con librería ggplot2 y la función ggplot().

ggplot()+
  geom_point(aes(x = 1:N, y = poblacion), col= 'purple') + 
  geom_hline(yintercept = media.p, col='black') +
  ggtitle(label = "Población", subtitle = paste("Media Poblacional = ", media.p))

0.8 Interpretación:

Describir de 120 a 150 palabras interpretar el caso contestando las siguiente preguntas como sugerencia:

¿Cuántos datos tiene la población y la muestra respectivamente?, ¿Qué porcentaje de la muestra es de la población? ¿Cuál es el el valor de la media poblacional y la media muestral? ¿Que relación tiene la media poblacional y la media muestral? ¿Cómo se obtiene la media ? ¿Como se obtiene la estructura de los datos (str()) y que valores arroja? ¿Cómo se describen los datos? con summary() y que valores arroja?

Tienen 1000 (población) y 100 datos (muestra). Así mismo y dadas las cantidades mencionadas, podemos decir que la muestra consta de una décima parte de la población en su total, es decir, el 10%. Tienen 428.522 (población) de media y 424.03 (media muestral). La relación que tienen es considerablemente cercana en cuanto a su valor total, esto se debe a que el muestreo tiende a ser similar a su origen en cuestión. La media se obtiene mediante la función mean(x). Mientras que la estructura se obtiene mediante la función str(x) y arroja el tamaño de los datos, el tipo de los datos y los datos. A manera de tabla y arroja el mínimo, la media y la mediana de ambos muestreos (población y muestra).