1 Objetivo

Simular datos de una población y de una muestra describiendo la media poblacional y la media muestral para su adecuada interpretación.

2 Descripción

3 Marco teórico

3.1 Población y muestra

La información que se utiliza para aplicar técnicas estadísticas se colecta en forma de muestras o conjuntos de observaciones. Las muestras se reúnen a partir de poblaciones, que son conjuntos de todos los individuos o elementos individuales de un tipo específico.

En el lenguaje de la estadística, uno de los conceptos más elementales es el muestreo. En casi todos los problemas de estadística, un número especificado de mediciones o datos, es decir, una muestra, se toma de un cuerpo de mediciones más grande llamado población.

3.2 Parámetro y estadístico

Un parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana, moda o una desviación estándar de una población.

Un estadístico es una medida que describe características de una muestra. Normalmente cuando se habla de muestra los estadísticos son estimadores dado que se acercan a los parámetros de una población.

4 Desarrollo

4.1 Cargar librerías

library(ggplot2)

4.2.2 Crear población

Se genera o construye una población de 1000 números con valores entre 250 y 600.

poblacion <- sample(x = 250:600, 
                    size = 1000, 
                    replace = TRUE) 
# Poblacion de un universo de numeros entre 250-600

poblacion
##    [1] 553 319 372 256 463 526 381 443 351 549 459 290 500 425 503 524 584 535
##   [19] 511 493 441 553 299 572 352 431 349 365 561 508 252 367 554 399 343 314
##   [37] 470 408 525 547 502 515 447 311 473 588 541 267 575 444 267 297 452 450
##   [55] 450 420 565 584 575 258 554 545 324 315 300 283 286 275 330 413 339 466
##   [73] 536 592 506 379 475 332 527 515 492 402 284 411 296 389 531 507 366 579
##   [91] 433 359 511 541 419 559 314 513 457 367 527 451 557 513 258 382 305 272
##  [109] 290 411 523 393 377 568 375 483 400 501 278 430 499 590 439 372 357 391
##  [127] 430 536 594 375 498 255 295 563 581 432 548 481 562 556 404 422 260 483
##  [145] 560 500 365 477 384 370 503 268 466 591 506 382 375 508 547 523 422 460
##  [163] 600 401 355 347 572 528 286 521 373 540 330 351 451 521 287 267 275 439
##  [181] 521 525 492 362 269 529 322 554 524 261 256 577 348 288 336 432 285 274
##  [199] 285 314 561 584 577 449 493 533 347 400 531 313 397 378 414 532 323 350
##  [217] 460 475 593 287 396 497 480 595 254 497 427 334 252 479 280 292 598 310
##  [235] 356 573 522 300 524 377 292 296 556 531 502 256 423 514 500 430 255 533
##  [253] 323 429 287 380 586 536 434 357 579 262 312 540 383 270 581 303 556 273
##  [271] 411 416 282 432 557 319 303 428 525 389 425 543 287 359 544 396 445 258
##  [289] 474 251 441 346 591 254 541 410 404 507 403 361 376 273 536 536 354 449
##  [307] 434 592 294 582 378 472 390 419 250 318 525 443 539 254 508 395 357 402
##  [325] 471 354 406 376 266 502 387 467 315 331 336 496 433 431 381 391 557 292
##  [343] 507 385 584 532 443 526 315 331 484 477 524 395 485 552 413 552 292 523
##  [361] 329 278 324 268 294 588 600 443 489 274 410 459 258 281 532 300 419 443
##  [379] 555 502 564 366 548 358 380 272 327 272 413 301 366 379 263 425 530 305
##  [397] 283 416 591 554 491 259 385 561 298 392 365 324 508 284 372 306 520 445
##  [415] 566 432 524 250 323 546 460 527 353 532 454 469 277 360 418 569 361 506
##  [433] 569 366 544 302 380 536 318 377 270 578 522 400 319 402 275 314 437 295
##  [451] 279 515 451 488 402 457 480 425 576 523 467 335 479 549 271 494 567 419
##  [469] 598 355 521 428 270 497 321 373 375 438 340 437 590 261 351 267 368 530
##  [487] 529 510 537 277 482 306 302 383 279 387 422 546 405 438 587 268 314 596
##  [505] 358 579 527 285 460 374 281 546 435 558 467 484 588 471 553 503 391 355
##  [523] 519 420 477 373 562 406 255 319 446 583 489 290 392 302 272 496 460 292
##  [541] 552 524 393 302 324 573 583 328 254 312 318 358 408 295 518 349 501 493
##  [559] 477 561 380 384 472 374 262 273 380 363 596 310 264 258 506 353 270 276
##  [577] 496 417 417 342 509 595 411 279 289 509 542 308 346 415 531 457 312 540
##  [595] 592 482 253 463 373 548 461 493 368 251 329 338 509 409 511 512 284 544
##  [613] 271 562 432 549 513 479 301 436 404 438 442 458 568 414 357 254 418 271
##  [631] 301 377 523 498 554 343 293 492 413 297 442 391 418 342 323 360 268 318
##  [649] 264 557 596 416 290 306 482 443 490 543 258 293 585 333 274 428 489 582
##  [667] 526 283 394 565 267 378 361 501 417 431 332 404 477 378 297 385 499 324
##  [685] 251 452 548 436 401 555 360 592 496 578 374 302 452 298 524 486 284 417
##  [703] 404 261 370 383 543 592 380 366 441 388 500 275 288 303 575 280 582 262
##  [721] 549 313 355 323 594 313 455 372 482 477 500 290 572 465 471 256 334 386
##  [739] 582 312 482 314 575 418 568 276 381 413 377 388 438 423 309 518 553 426
##  [757] 328 493 314 438 285 353 298 450 312 464 271 391 535 257 553 308 280 299
##  [775] 539 343 396 567 323 551 410 452 542 595 471 524 327 341 525 550 280 515
##  [793] 444 592 514 429 504 449 522 363 495 373 361 371 541 531 596 421 551 461
##  [811] 572 588 325 459 389 378 533 379 353 367 422 496 280 517 327 274 299 498
##  [829] 487 477 509 314 470 375 301 487 393 482 449 276 457 429 271 562 411 319
##  [847] 556 251 564 318 361 281 561 447 469 427 360 371 543 388 377 592 412 439
##  [865] 474 469 521 482 458 348 287 516 419 502 250 436 419 492 564 574 479 410
##  [883] 511 476 489 410 432 332 576 408 309 495 361 329 503 503 301 548 485 356
##  [901] 584 566 569 506 484 260 338 341 253 283 286 536 560 342 297 538 472 537
##  [919] 599 268 321 320 584 255 419 507 260 523 304 275 361 324 456 492 585 298
##  [937] 502 261 550 388 352 304 472 294 443 379 442 549 305 284 359 468 359 326
##  [955] 536 530 561 519 280 254 563 326 358 492 316 575 569 503 583 558 269 483
##  [973] 297 449 357 421 326 355 392 516 325 264 482 417 478 492 318 368 259 579
##  [991] 350 295 344 306 537 534 440 322 433 464

4.2.3 Determinar N

La función length() determina la cantidad de elementos de un vector, de tal manera que N identifica el número de elementos de una población.

N <- length(poblacion)
N
## [1] 1000

4.2.4 Crear muestra

Se determina una muestra del 10% de la población de dichos números, 1000 * 0.10 es 100 o el 10%.

n <- N * 0.10 
muestra <- sample(x = poblacion, size = n, replace = FALSE)
muestra
##   [1] 573 413 277 304 561 482 485 584 563 431 493 498 466 451 458 299 554 254
##  [19] 301 358 576 327 584 440 537 585 524 377 504 565 359 280 541 391 376 487
##  [37] 490 575 325 548 511 343 523 324 581 336 254 287 525 511 368 262 284 559
##  [55] 262 527 457 521 459 530 577 290 452 268 375 540 531 525 302 302 540 260
##  [73] 250 378 443 326 543 513 258 367 366 419 432 477 302 292 428 310 402 536
##  [91] 362 517 381 560 414 524 368 319 361 275

4.3 Medias aritméticas de población y muestra

4.3.1 Media población

Se determina en parámetro media poblacional.

media.p <- mean(poblacion)
media.p
## [1] 421.719

4.3.2 Media muestral

Se determina el estadístico media de la muestra

media.m <- mean(muestra)
media.m
## [1] 427.05

4.4 Explorando los datos

4.4.1 Estructura de los datos

str(poblacion)
##  int [1:1000] 553 319 372 256 463 526 381 443 351 549 ...
str(muestra)
##  int [1:100] 573 413 277 304 561 482 485 584 563 431 ...

4.4.2 Resumen de los datos

summary(poblacion)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   250.0   327.0   420.5   421.7   512.2   600.0

4.5 Visualizar los datos

Se muestra un diagrama de dispersión con librería ggplot2 y la función ggplot().

ggplot()+
  geom_point(aes(x = 1:N, y = poblacion), col= 'blue') + 
  geom_hline(yintercept = media.p, col='red') +
  ggtitle(label = "Población", subtitle = paste("Media poblacional = ", media.p))

5 Interpretación

Describir de 120 a 150 palabras interpretar el caso contestando las siguiente preguntas como sugerencia:

  • ¿Cuál es el contexto de los datos, es decir que significan los datos?

===Representan la poblacion de 1000 avitantes entre los numeros 250 y 6000===

  • ¿Cuántos datos tiene la población y la muestra respectivamente?,

===Contiene 1000 datos con una muestra del 10%===

  • ¿Qué porcentaje de la muestra es de la población?

===10%===

  • ¿Cuál es el el valor de la media poblacional y la media muestral?

===media poblacionar con un valor de 422.816 y la media muestral con un valor de 418.05===

  • ¿Que relación tiene la media poblacional y la media muestral?

===Que son valores cercanos a 420 solo se aproximan pero nadamas pues representan o intenta reprecentar una cantidad muy grande y se redondea con muetras===

  • ¿Cómo se obtiene la media ?

===sumando todas las cantidades descritas, una vez teniedo el resultado de esa sumatoria se dividen por la cantidad de numeros decritos===

  • ¿Como se obtiene la estructura de los datos (str()) y que valores arroja?

===solo meneja numeros enteros con una espacio del 1 al 1000 encarrados en corchetes===

  • ¿Cómo se describen los datos? con summary() y que valores arroja?

===meneja clasificasiones para los datos de nuemero entero===