code_folding: hide
toc: true
toc_float: true
toc_depth: 6
Simular datos de una población y de una muestra describiendo la media poblacional y la media muestral para su adecuada interpretación.
Generar una población de 1000 números con valores entre 250 y 600
Determinar una muestra del 10% de la población de dichos números
Identificar la estructura de los datos
Determinar el parámetro la media de la población
Determinar el estadístico de la media de la muestra
Mostrar el resumen de los daos de población y muestra
Comparar valores de medias del parámetro poblacional contra el estadístico de la muestra.
Se visualiza la dispersión de los datos con la función ggplot() de la librería “ggplot2”.
Interpretar el caso
La información que se utiliza para aplicar técnicas estadísticas se colecta en forma de muestras o conjuntos de observaciones. Las muestras se reúnen a partir de poblaciones, que son conjuntos de todos los individuos o elementos individuales de un tipo específico.
En el lenguaje de la estadística, uno de los conceptos más elementales es el muestreo. En casi todos los problemas de estadística, un número especificado de mediciones o datos, es decir, una muestra, se toma de un cuerpo de mediciones más grande llamado población.
Un parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana, moda o una desviación estándar de una población.
Un estadístico es una medida que describe características de una muestra. Normalmente cuando se habla de muestra los estadísticos son estimadores dado que se acercan a los parámetros de una población.
library(ggplot2)
Genera los mismos números al ejecutar (run) de nuevo la funcion sample().
set.seed(3000)
Se genera o construye una población de 1000 números con valores entre 250 y 600.
poblacion <- sample(x = 250:600,
size = 1000,
replace = TRUE) # Sacar una muestra
poblacion
## [1] 592 599 352 484 526 272 460 516 266 252 368 347 386 391 337 429 426 269
## [19] 421 489 428 546 421 562 360 434 514 476 469 259 338 439 597 401 287 437
## [37] 416 378 565 330 507 569 580 578 311 464 262 539 427 427 549 488 536 432
## [55] 441 457 365 415 327 543 421 368 546 498 287 538 533 541 326 568 320 294
## [73] 385 409 470 490 568 477 396 337 258 325 581 535 373 384 454 260 493 543
## [91] 329 485 568 369 389 475 255 467 363 336 508 278 304 595 274 297 426 266
## [109] 580 334 442 497 503 507 569 485 259 272 396 588 414 559 364 454 590 303
## [127] 583 295 553 374 273 304 583 267 353 599 469 509 319 286 386 548 264 254
## [145] 598 484 318 412 432 479 525 470 364 276 593 564 437 263 425 264 414 512
## [163] 434 386 257 273 501 544 422 390 376 505 547 418 344 321 252 250 458 312
## [181] 286 417 406 429 419 553 568 481 403 275 573 310 445 312 505 474 326 350
## [199] 493 511 339 323 388 417 472 315 286 578 357 308 288 349 357 390 487 358
## [217] 551 322 435 564 291 299 275 567 531 286 373 520 295 317 337 411 590 287
## [235] 465 368 486 327 285 596 545 432 564 516 400 484 441 401 264 493 334 271
## [253] 310 522 326 543 459 343 577 566 285 389 540 361 385 332 380 332 463 511
## [271] 557 542 258 496 519 569 365 341 308 533 306 372 557 265 542 316 443 558
## [289] 297 372 324 591 400 436 422 505 508 578 335 551 339 585 264 480 337 336
## [307] 542 493 576 309 529 335 350 299 292 272 472 541 534 487 408 428 447 506
## [325] 324 335 558 534 488 494 338 460 410 270 325 446 510 266 402 280 266 296
## [343] 531 383 445 263 583 578 275 490 389 585 424 518 556 565 488 457 464 348
## [361] 330 355 349 454 280 309 558 282 593 283 413 548 329 368 586 310 358 330
## [379] 428 268 580 406 577 257 491 530 592 407 591 542 373 273 438 564 352 581
## [397] 347 573 508 304 337 560 551 536 571 273 569 369 371 291 546 296 573 543
## [415] 469 474 404 319 379 430 426 260 520 412 464 376 379 304 362 553 426 415
## [433] 441 530 535 328 416 407 293 461 481 471 406 271 319 441 326 547 567 596
## [451] 350 315 268 422 290 267 277 398 554 578 443 529 473 431 547 378 400 356
## [469] 463 396 499 257 495 266 519 429 416 401 460 472 410 286 357 440 500 373
## [487] 368 299 579 287 573 587 410 516 553 500 333 517 315 421 468 555 498 544
## [505] 512 443 483 348 295 552 439 403 286 503 364 483 559 391 540 516 491 439
## [523] 539 261 346 572 521 544 592 425 408 396 335 356 298 523 401 492 337 307
## [541] 363 566 572 498 335 279 318 538 450 459 360 312 373 262 253 267 292 385
## [559] 513 504 309 528 535 276 542 526 502 597 593 501 489 350 510 372 529 462
## [577] 555 422 427 484 251 268 575 490 507 354 448 425 378 580 575 321 253 533
## [595] 577 253 457 334 278 451 366 424 329 450 262 556 499 343 309 321 590 446
## [613] 586 482 551 252 578 407 335 288 538 395 342 455 354 553 575 438 512 498
## [631] 446 485 504 538 409 335 266 527 330 403 310 514 307 419 531 394 267 325
## [649] 338 306 310 317 459 331 515 464 325 292 324 296 271 592 333 274 260 523
## [667] 434 375 406 562 454 351 353 420 460 599 457 595 542 482 562 300 318 585
## [685] 264 491 364 565 379 447 368 443 576 509 486 585 415 475 328 465 260 269
## [703] 447 269 495 497 407 597 348 518 445 388 438 429 493 512 495 447 526 317
## [721] 586 467 330 258 333 438 438 557 389 425 469 464 545 253 413 406 424 574
## [739] 479 311 271 464 479 508 306 541 463 393 309 525 486 384 506 538 412 313
## [757] 521 524 569 396 446 599 349 499 448 361 309 410 555 542 277 463 269 327
## [775] 366 493 388 595 361 483 254 376 418 321 543 478 303 463 380 576 431 397
## [793] 374 270 551 434 467 593 404 447 374 545 292 591 456 582 519 281 418 309
## [811] 402 297 582 267 561 252 406 368 505 515 400 516 537 280 475 410 381 416
## [829] 253 508 305 535 252 464 553 292 318 264 552 519 432 533 506 404 402 470
## [847] 562 284 277 319 472 301 339 570 530 474 282 332 326 570 342 500 474 262
## [865] 528 371 444 403 444 351 272 337 271 507 281 408 547 287 504 368 293 488
## [883] 370 527 260 370 412 316 450 502 552 469 516 534 360 503 322 433 534 361
## [901] 538 389 359 521 258 457 589 436 255 512 552 498 527 593 430 419 593 503
## [919] 579 585 387 564 471 422 427 386 475 556 424 567 549 345 471 575 453 429
## [937] 361 588 593 461 367 434 415 254 401 293 479 378 563 592 565 352 576 495
## [955] 537 391 486 315 482 331 555 364 405 496 508 545 531 464 336 435 507 350
## [973] 466 518 323 349 275 329 389 364 499 406 417 315 439 350 444 381 433 390
## [991] 265 431 387 477 373 341 260 384 520 562
La función length() determina la cantidad de elementos de un vector, de tal manera que N identifica el número de elementos de una población.
N <- length(poblacion)
N
## [1] 1000
Se determina una muestra del 10% de la población de dichos números, 1000 * 0.10 es 100 o el 10%.
n <- N * 0.10
muestra <- sample(x = poblacion, size = n, replace = FALSE)
muestra
## [1] 349 531 599 576 541 322 375 308 495 404 516 445 457 542 309 275 368 378
## [19] 401 386 348 402 390 447 565 579 281 409 259 486 494 557 361 406 352 524
## [37] 293 599 294 592 531 421 583 483 573 381 283 388 501 404 458 299 337 540
## [55] 309 519 561 264 419 422 464 470 580 460 359 542 572 424 291 406 461 519
## [73] 391 562 534 595 387 493 255 297 533 469 364 459 389 569 387 396 395 527
## [91] 592 498 552 426 566 460 505 259 508 343
Se determina en parámetro media poblacional.
media.p <- mean(poblacion)
media.p
## [1] 426.373
Se determina el estadístico media de la muestra
media.m <- mean(muestra)
media.m
## [1] 441.5
str(poblacion)
## int [1:1000] 592 599 352 484 526 272 460 516 266 252 ...
str(muestra)
## int [1:100] 349 531 599 576 541 322 375 308 495 404 ...
summary(poblacion)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 250.0 336.0 427.5 426.4 514.2 599.0
summary(muestra)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 255.0 373.2 446.0 441.5 531.0 599.0
Se muestra un diagrama de dispersión con librería ggplot2 y la función ggplot().
ggplot()+
geom_point(aes(x = 1:N, y = poblacion), col='green') +
geom_hline(yintercept = media.p, col='yellow')
Describir de 120 a 150 palabras interpretar el caso:
En este caso tenemos una poblacion de 1000 empleados que ganan entre 250 y 600 pesos semanales,siendo que la media es el valor promedio de un grupo de valores, sumando todos los datos y luego dividiendolo por la cantidad de estos, utilizando la funcion ¨mean¨ se determino que la media es de 426.373 pesos semanales, luego la media de 100 de los empleados o el 10% de la poblacion y obtuvimos como resustado 441.5 pesos semanales. Como pudimos observar en la grafica los datos fueron muy variados.