Simular datos de una población y de una muestra describiendo la media poblacional y la media muestral para su adecuada interpretación.
Generar una población de 1000 números con valores entre 250 y 600
Determinar una muestra del 10% de la población de dichos números
Identificar la estructura de los datos
Determinar el parámetro la media de la población
Determinar el estadístico de la media de la muestra
Mostrar el resumen de los daos de población y muestra
Comparar valores de medias del parámetro poblacional contra el estadístico de la muestra.
Se visualiza la dispersión de los datos con la función ggplot() de la librería “ggplot2”.
Interpretar el caso
La información que se utiliza para aplicar técnicas estadísticas se colecta en forma de muestras o conjuntos de observaciones. Las muestras se reúnen a partir de poblaciones, que son conjuntos de todos los individuos o elementos individuales de un tipo específico.
En el lenguaje de la estadística, uno de los conceptos más elementales es el muestreo. En casi todos los problemas de estadística, un número especificado de mediciones o datos, es decir, una muestra, se toma de un cuerpo de mediciones más grande llamado población.
Un parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana, moda o una desviación estándar de una población.
Un estadístico es una medida que describe características de una muestra. Normalmente cuando se habla de muestra los estadísticos son estimadores dado que se acercan a los parámetros de una población.
library(ggplot2)
Genera los mismos números al ejecutar (run) de nuevo la funcion sample().
set.seed(056421)
Se genera o construye una población de 1000 números con valores entre 250 y 600.
poblacion <- sample(x = 250:600,
size = 1000,
replace = TRUE) # Sacar una muestra
poblacion
## [1] 472 384 486 504 393 330 431 468 406 351 474 526 407 504 546 358 561 276
## [19] 521 387 600 477 553 278 467 576 388 600 406 253 268 421 421 366 262 409
## [37] 356 472 600 280 570 402 446 346 587 389 585 573 594 494 306 370 428 274
## [55] 557 313 375 578 540 363 395 421 576 300 406 428 573 590 423 281 314 327
## [73] 530 575 568 532 453 503 420 375 380 490 479 541 308 568 493 428 487 431
## [91] 432 390 388 373 521 424 432 394 353 280 317 566 392 586 398 576 597 287
## [109] 525 369 400 475 277 516 329 478 534 585 474 287 324 579 440 312 468 507
## [127] 367 371 327 595 559 333 396 542 283 344 425 252 502 580 389 467 542 429
## [145] 569 432 582 417 514 378 528 251 540 571 591 505 277 470 531 474 543 555
## [163] 305 595 424 344 531 321 395 337 544 526 323 558 379 598 488 539 410 315
## [181] 389 561 372 403 488 457 268 365 310 314 463 334 250 570 561 568 252 563
## [199] 297 358 593 458 443 324 251 301 485 267 304 436 556 438 567 338 579 289
## [217] 298 297 568 384 491 518 592 346 548 363 365 539 366 421 298 347 562 392
## [235] 318 299 388 591 256 367 441 398 391 443 417 360 369 529 547 363 407 538
## [253] 517 498 254 484 396 458 277 293 328 357 545 340 488 578 354 341 327 591
## [271] 314 395 308 459 265 450 290 426 461 407 420 295 508 548 562 254 450 471
## [289] 318 296 294 443 546 301 505 365 351 375 257 548 586 388 282 489 593 414
## [307] 264 417 296 426 306 281 416 462 424 597 335 482 418 540 467 361 330 403
## [325] 502 360 525 439 596 574 538 485 544 295 525 396 563 491 387 546 341 544
## [343] 368 538 370 301 541 486 437 372 366 438 576 413 318 494 548 580 539 432
## [361] 481 591 396 412 487 528 250 449 516 526 479 554 512 509 370 386 375 510
## [379] 383 569 427 556 373 336 363 271 437 260 432 457 520 578 396 292 552 490
## [397] 365 486 556 431 547 550 499 385 449 425 571 375 514 543 596 466 330 263
## [415] 251 323 463 491 462 499 454 346 351 368 463 479 594 545 582 400 295 423
## [433] 365 543 543 502 552 436 554 343 558 524 557 264 430 400 600 354 331 364
## [451] 300 349 414 540 591 553 406 521 334 563 442 522 468 314 340 357 376 387
## [469] 478 269 547 309 589 395 501 298 542 282 315 587 485 297 563 456 397 272
## [487] 498 324 258 405 559 260 297 579 317 465 451 589 254 255 575 381 326 296
## [505] 359 447 353 371 549 262 478 514 423 556 551 319 303 564 483 393 309 522
## [523] 385 364 546 498 284 402 395 539 526 423 549 418 428 291 495 352 343 583
## [541] 332 398 508 411 304 554 514 348 583 371 522 339 589 396 396 589 494 335
## [559] 504 263 252 318 496 551 459 332 572 491 587 251 577 295 273 424 333 326
## [577] 531 548 288 585 600 545 300 534 484 342 539 521 262 489 458 425 344 258
## [595] 503 567 555 384 280 414 498 507 310 492 493 527 386 426 523 531 545 525
## [613] 273 294 509 379 348 446 516 368 507 548 349 471 296 415 462 495 426 444
## [631] 459 571 269 320 460 271 543 283 410 492 275 583 484 285 345 267 441 400
## [649] 297 534 450 396 555 275 520 532 380 363 339 295 393 338 572 458 531 424
## [667] 423 421 341 345 363 429 557 291 490 504 551 565 597 511 508 524 519 402
## [685] 516 359 475 383 256 326 427 488 565 354 342 534 492 455 507 582 401 305
## [703] 415 560 296 299 563 472 261 255 284 452 283 268 287 251 273 283 411 559
## [721] 303 308 423 523 527 557 482 425 265 365 585 351 539 253 446 446 441 391
## [739] 481 268 520 466 430 433 561 348 421 496 557 311 378 514 591 457 559 454
## [757] 592 427 562 453 584 372 482 465 565 451 441 339 586 435 557 342 369 413
## [775] 539 572 520 264 304 479 471 296 595 364 400 331 455 297 566 342 286 581
## [793] 348 582 328 585 481 264 275 298 379 537 552 418 545 332 421 487 383 591
## [811] 279 567 449 437 265 485 337 409 251 555 411 258 297 323 483 379 515 253
## [829] 471 433 427 257 581 279 383 553 572 559 446 461 507 526 575 561 296 262
## [847] 504 417 300 537 561 483 380 274 543 255 294 317 301 464 348 477 403 321
## [865] 366 398 587 255 278 475 591 336 555 518 517 295 307 554 569 583 560 368
## [883] 356 553 303 371 514 588 506 406 284 359 386 252 534 568 552 267 458 253
## [901] 553 274 263 479 360 577 371 345 503 545 592 361 515 474 337 343 436 570
## [919] 417 477 363 461 593 587 395 349 396 270 352 276 344 257 469 250 334 508
## [937] 379 383 275 434 336 283 289 450 348 524 357 262 351 445 300 533 469 402
## [955] 423 288 580 313 499 450 411 252 537 269 409 290 371 429 316 533 347 467
## [973] 501 560 389 571 401 582 424 506 311 464 338 349 425 598 528 383 574 567
## [991] 476 395 554 438 462 320 293 495 559 362
La función length() determina la cantidad de elementos de un vector, de tal manera que N identifica el número de elementos de una población.
N <- length(poblacion)
N
## [1] 1000
Se determina una muestra del 10% de la población de dichos números, 1000 * 0.10 es 100 o el 10%.
n <- N * 0.10
muestra <- sample(x = poblacion, size = n, replace = FALSE)
muestra
## [1] 508 327 493 300 489 396 293 396 503 458 379 360 591 577 393 388 485 403
## [19] 444 508 402 342 421 574 559 434 528 383 411 318 539 600 313 453 462 283
## [37] 370 455 583 575 295 453 561 459 253 591 321 425 597 569 495 278 264 407
## [55] 458 291 250 506 314 557 475 287 387 559 544 433 254 600 373 324 507 594
## [73] 543 410 315 472 486 490 267 403 502 339 348 463 318 341 354 446 252 568
## [91] 523 407 372 540 504 479 461 410 514 414
Se determina en parámetro media poblacional.
media.p <- mean(poblacion)
media.p
## [1] 430.469
Se determina el estadístico media de la muestra
media.m <- mean(muestra)
media.m
## [1] 433.18
str(poblacion)
## int [1:1000] 472 384 486 504 393 330 431 468 406 351 ...
str(muestra)
## int [1:100] 508 327 493 300 489 396 293 396 503 458 ...
summary(poblacion)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 250.0 344.0 428.0 430.5 525.0 600.0
summary(muestra)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 250.0 352.5 439.0 433.2 507.2 600.0
Se muestra un diagrama de dispersión con librería ggplot2 y la función ggplot().
ggplot()+
geom_point(aes(x = 1:N, y = poblacion), col= 'blue') +
geom_hline(yintercept = media.p, col='red') +
ggtitle(label = "Población", subtitle = paste("Media poblacional = ", media.p))
Describir de 120 a 150 palabras interpretar el caso contestando las siguiente preguntas como sugerencia:
¿Cuántos datos tiene la población y la muestra respectivamente?, ¿Qué porcentaje de la muestra es de la población?
La población es de un total de 1000 números diferentes, mientras que la muestra es de 100 de esos números, teniendo un porcentaje de 10% de la población.
¿Cuál es el el valor de la media poblacional y la media muestral?
La media poblacional es de 430.469.
La media muestral es de 433.18.
¿Que relación tiene la media poblacional y la media muestral?
La media poblacional se sacó a base de la población completa de números, tomando la suma de todos y dividiendo entre 1000. La media muestras se tomó en base a solamente 100 de esos números (los 100 que se tomaron como muestra), sumándolos y dividiendo entre 100 para calcularse.
¿Cómo se obtiene la media ?
La formula para la obtención de una media es tomar el total de números que hay, contar cuantos son, y asignarle una variable. Se suman todos los números que se quieran calcular y finalizando se divide entre la variable inicialmente especificada.
¿Como se obtiene la estructura de los datos (str()) y que valores arroja?
Para obtener los datos se escribe (str(“valor que se quiere”)), de esta forma se muestran todos los datos de ese valor de forma lineal
¿Cómo se describen los datos? con summary() y que valores arroja?
Para obtener los datos se escribe (summary(“valor que se quiere”)). La función se utiliza para mostrar diferentes datos del valor como; el parámetro mínimo y máximo que se tiene, la división en primera, segunda y tercera partes, teniendo la mediana como la segunda parte, y la media aritmética.