Simular datos de una población y de una muestra describiendo la media poblacional y la media muestral para su adecuada interpretación.
Generar una población de 1000 números con valores entre 500 y 950
Determinar una muestra del 10% de la población de dichos números
Identificar la estructura de los datos
Determinar el parámetro la media de la población
Determinar el estadístico de la media de la muestra
Mostrar el resumen de los daos de población y muestra
Comparar valores de medias del parámetro poblacional contra el estadístico de la muestra.
Se visualiza la dispersión de los datos con la función ggplot() de la librería “ggplot2”.
Interpretar el caso
La información que se utiliza para aplicar técnicas estadísticas se colecta en forma de muestras o conjuntos de observaciones. Las muestras se reúnen a partir de poblaciones, que son conjuntos de todos los individuos o elementos individuales de un tipo específico.
En el lenguaje de la estadística, uno de los conceptos más elementales es el muestreo. En casi todos los problemas de estadística, un número especificado de mediciones o datos, es decir, una muestra, se toma de un cuerpo de mediciones más grande llamado población.
Un parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana, moda o una desviación estándar de una población.
Un estadístico es una medida que describe características de una muestra. Normalmente cuando se habla de muestra los estadísticos son estimadores dado que se acercan a los parámetros de una población.
library(ggplot2)
Genera los mismos números al ejecutar (run) de nuevo la funcion sample().
set.seed(022022)
Se genera o construye una población de 1000 números con valores entre 500 y 950.
poblacion <- sample(x = 500:950,
size = 1000,
replace = TRUE) # Sacar una muestra
poblacion
## [1] 614 611 762 586 778 950 935 545 655 688 895 826 523 949 681 782 880 695
## [19] 621 685 566 902 624 782 919 897 621 597 827 662 785 515 948 763 504 909
## [37] 773 823 926 660 864 686 793 846 619 881 729 885 763 525 903 859 657 671
## [55] 881 919 752 674 866 821 847 650 846 526 731 611 721 708 619 610 882 630
## [73] 636 587 620 713 797 828 837 811 836 791 685 785 566 602 754 904 597 575
## [91] 803 924 734 510 535 563 703 744 685 848 546 637 582 811 702 570 754 886
## [109] 535 648 829 820 921 783 745 719 574 539 935 667 807 630 778 674 771 899
## [127] 553 514 723 676 603 710 602 510 757 926 696 563 802 941 714 663 816 508
## [145] 825 726 888 622 623 815 783 729 851 817 618 515 819 864 820 547 539 805
## [163] 630 796 705 518 516 714 543 707 543 630 666 939 839 894 685 535 949 525
## [181] 501 819 765 944 699 580 545 560 743 709 570 945 870 935 636 661 608 597
## [199] 673 812 550 820 886 736 939 943 661 775 913 719 659 661 509 762 511 607
## [217] 921 732 926 531 860 888 889 646 950 863 849 700 610 693 805 583 651 949
## [235] 760 948 613 602 891 863 820 704 513 776 933 532 732 520 776 591 760 869
## [253] 776 914 512 616 605 774 579 712 892 659 500 626 674 804 532 548 787 576
## [271] 873 767 894 649 811 541 820 778 707 824 555 771 832 822 708 587 753 791
## [289] 816 609 906 564 626 640 511 872 808 775 506 918 541 823 913 613 653 881
## [307] 890 867 579 708 764 618 532 876 652 638 502 819 854 942 673 712 865 935
## [325] 931 839 560 776 812 638 658 904 734 711 733 674 793 555 863 655 866 645
## [343] 552 669 560 877 561 747 827 866 767 938 708 931 558 891 687 620 925 586
## [361] 611 843 622 784 795 901 691 750 923 538 881 654 905 831 847 917 566 508
## [379] 577 818 572 673 546 721 741 907 507 567 635 940 532 827 856 663 807 793
## [397] 782 840 641 715 787 701 723 910 565 761 508 896 721 632 593 788 608 651
## [415] 921 873 855 948 651 876 771 729 521 847 592 857 762 940 647 785 946 619
## [433] 520 937 618 661 770 878 765 607 877 719 731 854 594 941 641 603 850 517
## [451] 520 537 509 811 743 647 804 864 913 947 669 606 829 859 786 821 610 872
## [469] 676 811 546 736 938 549 618 930 808 644 632 871 612 596 703 604 864 891
## [487] 602 752 792 587 584 633 500 692 555 708 653 941 520 542 750 770 744 725
## [505] 781 641 575 551 791 733 794 693 545 537 579 831 641 718 557 539 775 830
## [523] 500 742 654 851 822 629 603 904 789 605 711 720 546 632 689 947 811 509
## [541] 716 581 898 549 654 924 661 668 865 523 616 764 693 900 571 888 760 623
## [559] 533 745 603 509 540 753 690 514 583 704 660 824 836 628 749 574 868 528
## [577] 634 736 619 846 559 872 639 692 558 657 716 934 860 931 831 929 931 747
## [595] 590 727 848 742 683 884 761 744 687 876 526 572 826 534 528 919 761 647
## [613] 662 731 598 626 698 718 813 592 816 871 908 822 586 791 737 659 857 506
## [631] 818 533 531 925 523 663 804 512 897 808 807 757 502 835 788 879 578 538
## [649] 780 922 705 675 533 530 589 844 504 636 737 674 755 649 543 512 947 605
## [667] 503 939 577 686 893 638 507 828 725 693 775 894 704 575 706 884 695 809
## [685] 567 539 948 714 611 558 930 861 932 913 873 922 757 771 858 938 721 662
## [703] 921 667 508 507 919 841 666 845 562 573 628 750 814 594 875 949 895 628
## [721] 796 896 600 687 868 884 819 938 637 914 663 948 901 655 754 514 632 636
## [739] 564 770 837 780 633 713 820 524 788 621 863 667 559 511 558 718 690 738
## [757] 887 642 734 855 614 688 527 895 829 655 586 876 934 878 846 775 579 916
## [775] 866 570 779 756 833 596 846 821 534 907 948 757 697 944 935 646 633 887
## [793] 832 629 622 542 614 656 932 704 537 846 833 535 641 658 808 886 692 868
## [811] 697 946 612 838 693 597 569 614 666 670 802 824 783 700 862 592 822 678
## [829] 693 637 713 736 835 923 931 542 788 743 740 928 812 697 729 888 563 878
## [847] 518 733 806 917 570 814 788 897 787 907 725 944 693 691 550 577 691 523
## [865] 582 708 654 581 576 778 647 816 615 574 689 627 822 802 853 630 790 675
## [883] 887 541 829 553 718 838 709 785 884 924 596 672 679 561 762 928 812 878
## [901] 509 728 855 609 674 700 718 901 551 695 810 681 670 895 644 644 564 768
## [919] 716 532 833 640 748 660 723 751 709 591 901 760 756 735 940 783 513 574
## [937] 644 625 703 736 571 607 579 566 760 879 893 694 684 783 783 931 641 556
## [955] 933 946 548 881 907 895 779 737 660 652 743 710 593 609 698 660 540 799
## [973] 944 579 531 823 585 885 842 629 627 559 637 553 701 800 886 869 613 700
## [991] 713 760 743 507 808 585 537 800 594 751
La función length() determina la cantidad de elementos de un vector, de tal manera que N identifica el número de elementos de una población.
N <- length(poblacion)
N
## [1] 1000
Se determina una muestra del 10% de la población de dichos números, 1000 * 0.10 es 100 o el 10%.
n <- N * 0.10
muestra <- sample(x = poblacion, size = n, replace = FALSE)
muestra
## [1] 557 512 676 627 868 821 626 651 881 938 675 651 661 509 888 542 941 842
## [19] 723 895 888 572 736 513 904 581 666 558 629 770 704 815 637 509 785 660
## [37] 784 823 881 780 511 863 689 949 537 561 776 754 763 806 507 783 922 543
## [55] 697 747 593 508 533 935 673 662 520 638 863 742 692 539 603 523 743 829
## [73] 893 609 570 826 808 846 576 523 560 906 762 600 881 676 591 561 807 694
## [91] 583 833 628 934 708 537 614 508 792 888
Se determina en parámetro media poblacional.
media.p <- mean(poblacion)
media.p
## [1] 724.079
Se determina el estadístico media de la muestra
media.m <- mean(muestra)
media.m
## [1] 703.97
str(poblacion)
## int [1:1000] 614 611 762 586 778 950 935 545 655 688 ...
str(muestra)
## int [1:100] 557 512 676 627 868 821 626 651 881 938 ...
summary(poblacion)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 500.0 613.8 719.0 724.1 832.0 950.0
summary(muestra)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 507.0 579.8 690.5 704.0 821.5 949.0
Se muestra un diagrama de dispersión con librería ggplot2 y la función ggplot().
ggplot()+
geom_point(aes(x = 1:N, y = poblacion), col='black')+
geom_hline(yintercept = media.p, col='yellow') +
ggtitle(label = "Población", subtitle = paste("Media poblacional = ", media.p))
Describir de 120 a 150 palabras interpretar el caso contestando las siguiente preguntas como sugerencia:
¿Cuántos datos tiene la población y la muestra respectivamente?, ¿Qué porcentaje de la muestra es de la población? Son 1000 datos de la poblacion y se muestran 100, entonces es el 10%
¿Cuál es el el valor de la media poblacional y la media muestral? valor de media población es de 724.079 y el valor de la media muestral es de 703.97.
¿Que relación tiene la media poblacional y la media muestral? El nombre “media poblacional” se usa para significar qué valor numérico de una media muestral es numéricamente cercano al parámetro media poblacional, para una muestra adecuada y suficientemente grande.
¿Cómo se obtiene la media ? La media se calcula sumando todos los valores y dividiendo la suma entre el número total de valores.
¿Como se obtiene la estructura de los datos (str()) y que valores arroja? Utilizando los datos de la población y el de la muestra. Este nos arroja en la población los valores de “501, 819, 765, 944, 699, 545, 743, 945, 870, 935, 636,…” y en la muestra nos arroja “557, 512, 676, 627, 868, 821, 626, 651, 881, 938, 675,…”.
¿Cómo se describen los datos? con summary() y que valores arroja? Nospresenta un pequeño resumen descriptivo que incluye el mínimo, máximo, mediana, primer y tercer cuartiles, media y número de valores perdidos. EL primero representa los valores de la población y el segundo el de la muestra