Simular datos de una población y de una muestra describiendo la media poblacional y la media muestral para su adecuada interpretación.
Generar una población de 1000 números con valores entre 250 y 600
Determinar una muestra del 10% de la población de dichos números
Identificar la estructura de los datos
Determinar el parámetro la media de la población
Determinar el estadístico de la media de la muestra
Mostrar el resumen de los datos de población y muestra
Comparar valores de medias del parámetro poblacional contra el estadístico de la muestra.
Se visualiza la dispersión de los datos con la función ggplot() de la librería “ggplot2”.
Interpretar el caso
La información que se utiliza para aplicar técnicas estadísticas se colecta en forma de muestras o conjuntos de observaciones. Las muestras se reúnen a partir de poblaciones, que son conjuntos de todos los individuos o elementos individuales de un tipo específico.
En el lenguaje de la estadística, uno de los conceptos más elementales es el muestreo. En casi todos los problemas de estadística, un número especificado de mediciones o datos, es decir, una muestra, se toma de un cuerpo de mediciones más grande llamado población.
Población y muestra
Un parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana, moda o una desviación estándar de una población.
Un estadístico es una medida que describe características de una muestra. Normalmente cuando se habla de muestra los estadísticos son estimadores dado que se acercan a los parámetros de una población.
library(ggplot2)
Genera los mismos números al ejecutar (run) de nuevo la función sample().
set.seed(30082022)
Se genera o construye una población de 1000 números con valores entre 250 y 600.
poblacion <- sample(x = 250:600, size = 1000, replace = TRUE) # Poblacion de un universo de numeros entre 250-600
poblacion ## [1] 265 528 581 297 436 422 427 332 387 429 486 546 330 421 435 591 255 505 ## [19] 553 505 535 329 391 299 547 382 438 373 314 380 409 268 256 489 419 375 ## [37] 575 560 574 324 400 480 399 564 562 468 397 551 503 493 542 394 472 359 ## [55] 414 567 257 391 475 362 251 323 436 503 556 489 481 375 394 558 463 274 ## [73] 465 366 274 448 551 406 555 413 365 408 524 375 506 518 377 257 598 360 ## [91] 398 537 587 446 354 485 484 579 471 599 276 280 498 569 587 484 542 457 ## [109] 258 279 395 276 409 508 404 470 466 348 394 436 585 303 257 473 291 381 ## [127] 271 375 528 379 469 258 568 321 341 520 431 269 295 283 388 494 464 369 ## [145] 348 274 367 422 563 481 386 315 576 437 372 264 389 275 525 373 488 474 ## [163] 407 576 365 334 545 277 545 401 456 582 471 391 585 478 538 354 561 394 ## [181] 414 297 549 404 327 508 572 556 372 386 347 360 589 587 543 541 464 457 ## [199] 338 326 360 498 505 321 474 435 556 310 257 589 444 264 528 425 526 328 ## [217] 463 377 293 552 359 383 480 316 419 332 295 462 311 472 438 320 261 311 ## [235] 378 379 417 315 397 474 292 597 271 399 568 591 503 482 598 453 508 411 ## [253] 354 459 264 289 252 424 435 400 259 449 464 514 544 276 520 257 518 479 ## [271] 453 597 417 345 295 508 531 455 352 404 532 457 517 303 271 444 321 451 ## [289] 449 310 331 542 309 373 404 364 309 575 501 595 425 526 538 470 383 496 ## [307] 309 437 355 433 448 413 282 298 317 265 287 480 548 479 337 278 590 573 ## [325] 289 544 253 439 395 549 403 355 551 311 286 399 409 564 459 529 487 332 ## [343] 587 570 457 522 498 341 589 276 360 338 526 546 452 251 398 265 370 476 ## [361] 299 340 370 555 556 518 298 416 491 268 288 355 492 428 315 311 376 293 ## [379] 455 479 426 288 423 541 538 329 545 594 452 432 475 252 597 464 386 251 ## [397] 592 476 299 447 396 524 370 353 294 456 494 564 459 494 501 288 402 270 ## [415] 420 372 251 297 334 519 499 342 364 338 376 327 466 495 462 394 517 384 ## [433] 393 336 597 335 436 279 319 493 598 345 335 390 474 271 446 496 417 457 ## [451] 368 491 591 391 505 409 278 251 416 384 252 455 559 599 498 277 269 265 ## [469] 562 558 284 554 308 297 594 375 489 289 324 448 303 260 258 349 482 459 ## [487] 545 351 581 318 557 323 422 381 330 259 354 284 391 446 556 551 568 569 ## [505] 462 577 406 525 473 407 480 305 329 314 481 543 260 488 533 318 405 307 ## [523] 409 467 357 352 314 582 350 568 527 554 315 437 319 355 270 462 450 514 ## [541] 345 271 443 328 319 583 535 362 251 261 333 485 263 399 331 482 546 312 ## [559] 531 341 394 415 275 496 332 275 532 250 593 271 393 344 476 348 428 290 ## [577] 403 433 495 585 269 265 561 537 343 501 387 517 330 578 561 324 434 515 ## [595] 439 531 425 455 475 545 268 442 250 583 458 473 440 338 395 334 497 514 ## [613] 475 343 408 379 559 549 313 271 472 444 382 406 296 525 412 289 342 367 ## [631] 536 331 572 420 375 296 510 294 433 325 277 598 488 472 253 370 556 394 ## [649] 393 377 480 313 290 337 350 595 535 498 282 443 474 513 368 456 549 498 ## [667] 501 492 466 440 260 566 531 317 439 433 266 534 340 555 387 456 278 500 ## [685] 423 553 542 462 413 297 402 301 375 435 367 348 323 518 275 459 532 280 ## [703] 586 265 422 479 308 407 583 363 343 393 351 356 312 322 439 388 529 562 ## [721] 480 489 433 493 538 410 361 301 416 527 283 479 581 517 469 417 536 321 ## [739] 253 485 382 523 495 520 597 477 420 349 291 251 512 579 574 479 455 335 ## [757] 570 564 314 506 433 593 462 317 567 361 456 280 571 462 396 469 415 350 ## [775] 432 590 462 539 310 575 297 396 560 437 405 498 592 324 364 302 469 595 ## [793] 293 532 578 293 453 371 404 269 315 594 317 321 464 416 338 420 346 325 ## [811] 360 418 370 484 310 278 313 504 457 332 395 556 296 355 511 400 513 515 ## [829] 302 567 435 427 485 578 349 448 380 526 290 545 483 288 308 376 386 288 ## [847] 453 440 491 460 299 389 575 580 484 414 382 532 570 458 399 415 586 440 ## [865] 391 583 260 295 507 421 524 578 485 485 418 407 260 316 302 349 437 595 ## [883] 253 304 319 279 515 552 351 544 287 441 374 428 282 306 586 430 329 514 ## [901] 495 353 326 316 509 282 415 548 289 380 588 556 459 310 533 598 552 336 ## [919] 556 447 336 587 575 421 554 490 463 472 384 383 260 459 254 587 456 271 ## [937] 380 589 277 467 306 593 523 344 521 539 276 271 566 358 320 515 459 541 ## [955] 569 565 251 404 320 355 550 515 341 441 586 543 282 281 401 540 447 398 ## [973] 286 305 289 357 388 578 262 523 446 358 503 579 336 584 407 503 407 539 ## [991] 523 522 371 345 363 442 294 486 596 373
La función length() determina la cantidad de elementos de un vector, de tal manera que N identifica el número de elementos de una población.
N <- length(poblacion) N ## [1] 1000
Se determina una muestra del 10% de la población de dichos números, 1000 * 0.10 es 100 o el 10%.
n <- N * 0.10 muestra <- sample(x = poblacion, size = n, replace = FALSE) muestra ## [1] 319 455 337 539 575 294 494 330 527 504 278 462 480 473 421 346 308 313 ## [19] 398 329 287 320 567 598 372 308 341 475 387 311 398 435 363 554 297 544 ## [37] 382 321 545 446 351 442 372 328 590 345 566 508 492 289 414 553 364 581 ## [55] 341 425 591 297 481 345 329 556 426 542 431 535 336 456 380 328 257 466 ## [73] 260 265 564 324 486 545 326 382 391 568 515 367 303 332 462 573 462 423 ## [91] 491 485 350 404 464 396 288 548 274 407 4.3 Medias aritméticas de población y muestra
Se determina en parámetro media poblacional.
media.p <- mean(poblacion) media.p ## [1] 422.816
Se determina el estadístico media de la muestra
media.m <- mean(muestra) media.m ## [1] 418.05
str(poblacion) ## int [1:1000] 265 528 581 297 436 422 427 332 387 429 … str(muestra) ## int [1:100] 319 455 337 539 575 294 494 330 527 504 …
summary(poblacion) ## Min. 1st Qu. Median Mean 3rd Qu. Max. ## 250.0 334.8 421.0 422.8 508.0 599.0 summary(muestra) ## Min. 1st Qu. Median Mean 3rd Qu. Max. ## 257.0 329.8 405.5 418.1 492.5 598.0
Se muestra un diagrama de dispersión con librería ggplot2 y la función ggplot().
ggplot()+ geom_point(aes(x = 1:N, y = poblacion), col= ‘blue’) + geom_hline(yintercept = media.p, col=‘red’) + ggtitle(label = “Población”, subtitle = paste(“Media poblacional =”, media.p))
Describir de 120 a 150 palabras interpretar el caso contestando las siguiente preguntas como sugerencia:
¿Cuál es el contexto de los datos, es decir que significan los datos? dan los datos de una poblacion y muestra para poder interpretarlos
¿Cuántos datos tiene la población y la muestra respectivamente? la poblacion tiene 1000 datos y la muestra 100
¿Qué porcentaje de la muestra es de la población? 10%
¿Cuál es el el valor de la media poblacional y la media muestral? 422.816 y 418.05
¿Que relación tiene la media poblacional y la media muestral?la media de poblacion es el valor numerico de una media mientras la media muestral es un parametro de la media poblacion
¿Cómo se obtiene la media ? sumando los valores y dividiendo la suma entre los valores
¿Como se obtiene la estructura de los datos (str()) y que valores arroja?
¿Cómo se describen los datos? con summary() y que valores arroja?con un parametro y arroja los valores de la media muestral