Muestreo aleatorio simple: todos los elementos de la población tienen la misma probabilidad de ser seleccionados.
n_proporcion_finita <- function(N, e = 0.05, conf = 0.95, p = 0.5){
z <- qnorm(1 - (1-conf)/2)
q <- 1 - p
num <- N * z^2 * p * q
den <- e^2 * (N - 1) + z^2 * p * q
ceiling(num / den)
}
set.seed(123)
N <- 1000
n <- n_proporcion_finita(N, e = 0.05, conf = 0.95, p = 0.5)
muestra_ids <- sample(1:N, size = n, replace = FALSE)
muestra_ids
## [1] 415 463 179 526 195 938 818 118 299 229 244 14 374 665 602 603 768 709
## [19] 91 953 348 649 355 840 26 519 426 979 766 211 932 590 593 555 871 373
## [37] 844 143 544 490 621 775 905 937 842 23 923 309 135 821 954 224 166 217
## [55] 290 581 72 588 575 141 722 865 859 153 294 277 999 41 431 90 316 223
## [73] 528 116 606 774 747 456 598 854 39 159 752 209 988 994 34 516 13 69
## [91] 895 755 409 308 278 89 537 291 424 880 286 671 121 110 158 64 483 477
## [109] 480 711 67 663 847 85 165 648 51 74 178 362 236 610 330 726 127 212
## [127] 686 785 814 310 744 243 862 888 792 113 619 893 151 666 614 767 160 391
## [145] 155 974 5 326 784 280 800 789 567 843 238 764 339 920 822 137 455 738
## [163] 560 589 83 696 867 196 769 680 900 926 500 852 344 966 459 20 996 164
## [181] 52 534 177 554 84 523 633 392 302 597 706 864 837 430 710 761 712 428
## [199] 672 250 429 398 928 381 545 40 522 473 200 125 265 959 186 573 252 458
## [217] 152 54 538 235 289 185 765 413 627 794 981 783 205 904 564 857 908 727
## [235] 346 858 468 509 57 457 617 357 279 270 646 347 129 218 618 698 337 976
## [253] 539 975 861 553 724 390 498 222 899 657 421 762 660 163 846 673 578 913
## [271] 878 225 389 117 771 885 55 947
N: tamaño total de la población.
e: error máximo permitido (por defecto 0.05 → 5%).
conf: nivel de confianza (por defecto 0.95 → 95%).
p: proporción esperada (por defecto 0.5, que es el caso más conservador).
N1=1500
n1<-n_proporcion_finita(N = 1500, e = 0.05, conf = 0.95, p = 0.5)
n1
## [1] 306
muestra_ids1 <- sample(1:N1, size = n1, replace = FALSE)
muestra_ids1
## [1] 597 557 415 1158 957 873 688 757 988 447 1128 821 831 711 1234
## [16] 349 1425 1282 177 386 1165 24 945 1023 1154 165 1401 170 1469 710
## [31] 1258 422 508 64 80 548 987 475 291 765 1367 1347 479 1135 791
## [46] 905 1341 807 1246 1311 292 1250 297 860 605 637 1063 1261 1475 619
## [61] 1057 83 1420 866 277 1233 1477 76 1118 1054 1241 946 1199 374 323
## [76] 115 1474 850 608 1382 682 938 1120 397 1172 989 392 593 1362 744
## [91] 243 106 11 625 1388 1481 403 461 141 31 1139 94 16 178 1482
## [106] 524 924 204 1428 373 646 384 1146 315 259 494 1313 1072 1355 1124
## [121] 1016 1132 1325 10 1473 1304 1372 402 1435 1333 108 8 626 261 541
## [136] 1330 326 1098 282 1291 1286 1393 1243 696 667 990 1143 452 856 622
## [151] 1390 1060 1079 1264 891 1328 1034 665 1129 793 463 1204 278 241 1479
## [166] 679 37 686 566 1327 19 378 549 1268 48 1212 464 393 1163 670
## [181] 1213 311 189 38 1108 319 1371 846 120 712 441 1223 599 72 714
## [196] 677 81 1348 134 424 756 6 1152 879 668 49 1263 193 709 459
## [211] 303 1416 898 190 191 446 119 1083 817 61 1379 1484 930 950 698
## [226] 983 1227 758 993 1270 947 690 251 560 643 545 1421 162 576 168
## [241] 788 78 1343 1309 445 995 95 379 221 1357 1185 620 448 242 927
## [256] 814 926 407 229 785 699 1195 1047 218 648 79 1188 237 579 929
## [271] 1472 493 730 209 1308 877 358 1065 904 1153 848 886 450 396 639
## [286] 41 201 52 67 680 577 457 1015 1044 124 592 740 45 91 653
## [301] 1162 606 127 1032 839 595
##INTERVALOS DE CONFIANZA
#INTERVALOS PARA LA MEDIA
library(readxl)
## Warning: package 'readxl' was built under R version 4.5.2
LIC_MATEMATICAS<-read_excel("C:/Users/Valentina/Downloads/LIC.MATEMATICAS.xlsx")
View(LIC_MATEMATICAS)
N1 <- nrow(LIC_MATEMATICAS)
set.seed(123)
muestra1 <- LIC_MATEMATICAS[sample(1:N1, size = 100, replace = FALSE), ]
nivel_confianza <- 0.95
muestra <- muestra1$Estrato
muestra_media <- mean(muestra, na.rm = TRUE)
desviacion_estandar <- sd(muestra, na.rm = TRUE)
tamano_muestra <- length(muestra)
muestra_media
## [1] 1.49
desviacion_estandar
## [1] 0.5411361
tamano_muestra
## [1] 100
##ERROR ESTANDAR DE LA MEDIA
error_estandar <- desviacion_estandar / sqrt(tamano_muestra)
error_estandar
## [1] 0.05411361
##VALOR CRITICO DE LA DISTRIBUCION t
valor_critico <- qnorm((1 + nivel_confianza) / 2)
valor_critico
## [1] 1.959964
##MARGEN DE ERROR
margen_error <- valor_critico * error_estandar
margen_error
## [1] 0.1060607
##INTERVALO DE CONFIANZA
intervalo_confianza <- c(muestra_media - margen_error, muestra_media + margen_error)
intervalo_confianza
## [1] 1.383939 1.596061
##RESULTADOS
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la media:", intervalo_confianza)
## Intervalo de confianza del 95 % para la media: 1.383939 1.596061