Distribuciones de Probabilidad

Distribuciones de probabilidad para variables continuas

Martin Rondon https://rpubs.com/mrondon (Pontificia Universidad Javeriana)http://javeriana.edu.co
2025-03-21


La distribución de probabilidad de una variable aleatoria es una función que asigna a cada suceso definido sobre la variable, la probabilidad de que dicho suceso ocurra.


Variable aleatoria continuas

Es aquella que generalmente depende de una medición y puede tomar cualquier valor.


Distribuciones de variable continua


Se denomina variable continua a aquella que puede tomar cualquiera de los infinitos valores existentes dentro de un intervalo. En el caso de variable continua la distribución de probabilidad es la integral de la función de densidad, por lo que tenemos entonces que:

\[F(X \le x) = \int_{-\infty}^x{f(t)dt}\]

Función de densidad

Para una variable continua X con función de distribución F(x), la función de densidad de X es:

\[f(x) = \frac{dF(x)}{dx}\]

Propiedades

\[f(x) > 0\]


\[\int_{-\infty}^{\infty}{f(x)dx} = 1\]


\[F(x) = P(X \le x) = \int_{-\infty}^{x}{f(t)dt} = 1\]


\[P(a<X<b) = $\int_{a}^{x}{f(t)dt} + \int_{x}^{b}{f(t)dt} = \int_{a}^{b}{f(t)dt}= F(b)-F(a)\]


Distribución normal

La distribución normal es uno de los ejemplos más comúnmente utilizados de distribuciones de variables aleatorias continuas, y uno de los más útiles. La distribución normal está definida por la fórmula:

\[f(x) = \frac{1}{\sqrt{2 \pi \sigma^2}}* \exp{(-\frac{(x- \mu)^2}{2\sigma^2})}\]


Existe una distribución normal para cada par de \(\mu\) y \(\sigma^2\), donde \(\mu\) es cualquier número y \(\sigma^2\) es positivo, siendo \(\mu\) y \(\sigma^2\) la media y la varianza de la distribución, respectivamente.

Casos particulares



Aunque se puede, es muy dificil tabular cada una de las posibles áreas bajo la curva para cada una de estas posibles distribuciones. Por lo tanto, se puede escoger una en particular, tabular sus áreas, y con dicha tabla y mediante las fórmulas de conversión adecuadas, calcular las distribuciones de probabilidades de cualquier variable normal. A este proceso se le llama estandarizar.


Distribución normal estándar


Si X es una variable aleatoria con media \(\mu\) y varianza \(\sigma^2\) , entonces, la variable estandarizada (Z) será:

\[Z = \frac{x-\mu}{\sigma}\]

Esta nueva variable tiene como parámetros: \(\mu = 0\) y \(\sigma^2 = 1\) y se nota como \(Z \sim N(0,1)\)



Tabla de la Distribución Normal Estándar

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 0.00
-3.0 0.0010 0.0010 0.0011 0.0011 0.0011 0.0012 0.0012 0.0013 0.0013 0.0013
-2.9 0.0014 0.0014 0.0015 0.0015 0.0016 0.0016 0.0017 0.0018 0.0018 0.0019
-2.8 0.0019 0.0020 0.0021 0.0021 0.0022 0.0023 0.0023 0.0024 0.0025 0.0026
-2.7 0.0026 0.0027 0.0028 0.0029 0.0030 0.0031 0.0032 0.0033 0.0034 0.0035
-2.6 0.0036 0.0037 0.0038 0.0039 0.0040 0.0041 0.0043 0.0044 0.0045 0.0047
-2.5 0.0048 0.0049 0.0051 0.0052 0.0054 0.0055 0.0057 0.0059 0.0060 0.0062
-2.4 0.0064 0.0066 0.0068 0.0069 0.0071 0.0073 0.0075 0.0078 0.0080 0.0082
-2.3 0.0084 0.0087 0.0089 0.0091 0.0094 0.0096 0.0099 0.0102 0.0104 0.0107
-2.2 0.0110 0.0113 0.0116 0.0119 0.0122 0.0125 0.0129 0.0132 0.0136 0.0139
-2.1 0.0143 0.0146 0.0150 0.0154 0.0158 0.0162 0.0166 0.0170 0.0174 0.0179
-2.0 0.0183 0.0188 0.0192 0.0197 0.0202 0.0207 0.0212 0.0217 0.0222 0.0228
-1.9 0.0233 0.0239 0.0244 0.0250 0.0256 0.0262 0.0268 0.0274 0.0281 0.0287
-1.8 0.0294 0.0301 0.0307 0.0314 0.0322 0.0329 0.0336 0.0344 0.0351 0.0359
-1.7 0.0367 0.0375 0.0384 0.0392 0.0401 0.0409 0.0418 0.0427 0.0436 0.0446
-1.6 0.0455 0.0465 0.0475 0.0485 0.0495 0.0505 0.0516 0.0526 0.0537 0.0548
-1.5 0.0559 0.0571 0.0582 0.0594 0.0606 0.0618 0.0630 0.0643 0.0655 0.0668
-1.4 0.0681 0.0694 0.0708 0.0721 0.0735 0.0749 0.0764 0.0778 0.0793 0.0808
-1.3 0.0823 0.0838 0.0853 0.0869 0.0885 0.0901 0.0918 0.0934 0.0951 0.0968
-1.2 0.0985 0.1003 0.1020 0.1038 0.1056 0.1075 0.1093 0.1112 0.1131 0.1151
-1.1 0.1170 0.1190 0.1210 0.1230 0.1251 0.1271 0.1292 0.1314 0.1335 0.1357
-1.0 0.1379 0.1401 0.1423 0.1446 0.1469 0.1492 0.1515 0.1539 0.1562 0.1587
-0.9 0.1611 0.1635 0.1660 0.1685 0.1711 0.1736 0.1762 0.1788 0.1814 0.1841
-0.8 0.1867 0.1894 0.1922 0.1949 0.1977 0.2005 0.2033 0.2061 0.2090 0.2119
-0.7 0.2148 0.2177 0.2206 0.2236 0.2266 0.2296 0.2327 0.2358 0.2389 0.2420
-0.6 0.2451 0.2483 0.2514 0.2546 0.2578 0.2611 0.2643 0.2676 0.2709 0.2743
-0.5 0.2776 0.2810 0.2843 0.2877 0.2912 0.2946 0.2981 0.3015 0.3050 0.3085
-0.4 0.3121 0.3156 0.3192 0.3228 0.3264 0.3300 0.3336 0.3372 0.3409 0.3446
-0.3 0.3483 0.3520 0.3557 0.3594 0.3632 0.3669 0.3707 0.3745 0.3783 0.3821
-0.2 0.3859 0.3897 0.3936 0.3974 0.4013 0.4052 0.4090 0.4129 0.4168 0.4207
-0.1 0.4247 0.4286 0.4325 0.4364 0.4404 0.4443 0.4483 0.4522 0.4562 0.4602
0.0 0.4641 0.4681 0.4721 0.4761 0.4801 0.4840 0.4880 0.4920 0.4960 0.5000
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990


Ejemplo de aplicación:


Un estudio quería evaluar si existe asociación entre el peso al nacer de un recién nacido y la edad de la madre al momento del parto. Se cree que la variable peso al nacer sigue una distribución normal en la población de donde fue extraída esta muestra, con un promedio de 2580 grs y una desviación estándar de 650 grs.

Si se selecciona al azar un recién nacido de esta población:


¿Cuál es la probabilidad de que tenga un peso al nacer menor a 2650 grs?


X: “Peso al nacer en gr de los recién nacidos”


\[P(X<2650) = P(\frac{X-\mu}{\sigma}<\frac{2650-2580}{650}) = P(Z<0.1077)\]

Al observar la tabla de la distribución normal estándar, se tiene que:

\[P(X<2650) \approx P(Z<0.11) = 0.5438\]


En R:

  pnorm(0.11)
[1] 0.5437953


El valor exacto es:


pnorm(0.1077)
[1] 0.5428832


Que es equivalente a:


pnorm(2650,2580,650)
[1] 0.5428801


¿Cuál es la probabilidad de que tenga un peso al nacer mayor a 2650 grs?

\[P(X>2650) = 1- P(\frac{X-\mu}{\sigma}<\frac{2650-2580}{650}) = 1- P(Z<0.1077) = 1- 0.5429 = 0.4571\]


en R
  1-pnorm(2650,2580,650)
[1] 0.4571199


¿Cuál es la probabilidad de que tenga un peso al nacer entre 2500 y 2660 grs?


\[P(2500<X<2660) = P(\frac{2500-2580}{650} < \frac{X-\mu}{\sigma}<\frac{2660-2580}{650})\]


\[P(-0.1231<Z<0.1077) = \phi(0.1077)-\phi(-0.1231) = 0.5490 - 0.4510 = 0.098\]


en R

[1] 0.09795381



Distribución t


La distribución t es una distribución de probabilidad creada por William Gosset, quien hizo sus publicaciones con el pseudónimo de Student, por lo que es también conocida como la distribución t de Student. Se utiliza especialmente para probar hipótesis en donde se han tomado datos numéricos y a diferencia de la distribución normal que depende de dos parámetros µ y \(\sigma\), la distribución t esta determinada por sólo un parámetro (notado como r) conocido como “grados de libertad”.

\[f_t(t) = \frac{\Gamma(\frac{r+1}{2})}{\sqrt{r\pi\Gamma(\frac{r}{2})}}(1+\frac{t^2}{r})^{-(\frac{r+1}{2})}\]
con n>1 y \(-\infty \le t \le \infty\)


Propiedades de la distribución t

  1. Tiene una media de 0.
  2. Es simétrica con respecto a la media.
  3. En general, tiene una varianza mayor que 1, pero la varianza se aproxima a 1 a medida que el tamaño de la muestra aumenta.
  4. La variable \(t\) varía desde \(-\infty\) hasta \(+\infty\).
  5. La distribución t es realmente una familia de distribuciones (cambia según el tamaño de la muestra). En comparación con la distribución normal, la distribución t tiene un pico menos pronunciado en el centro y colas más gruesas. La siguiente figura compara la distribución normal con diferentes distribuciones de t para diferentes grados de libertad. A medida que el número de grados de libertad aumenta, la distribución t se aproxima a la distribución normal.


Tabla de valores críticos de la distribución t de Student con r = n-1 grados de libertad

α
r 0.005 0.01 0.025 0.05 0.1 0.9 0.95 0.975 0.99 0.995
1 -63.6567 -31.8205 -12.7062 -6.3138 -3.0777 3.0777 6.3138 12.7062 31.8205 63.6567
2 -9.9248 -6.9646 -4.3027 -2.9200 -1.8856 1.8856 2.9200 4.3027 6.9646 9.9248
3 -5.8409 -4.5407 -3.1824 -2.3534 -1.6377 1.6377 2.3534 3.1824 4.5407 5.8409
4 -4.6041 -3.7469 -2.7764 -2.1318 -1.5332 1.5332 2.1318 2.7764 3.7469 4.6041
5 -4.0321 -3.3649 -2.5706 -2.0150 -1.4759 1.4759 2.0150 2.5706 3.3649 4.0321
6 -3.7074 -3.1427 -2.4469 -1.9432 -1.4398 1.4398 1.9432 2.4469 3.1427 3.7074
7 -3.4995 -2.9980 -2.3646 -1.8946 -1.4149 1.4149 1.8946 2.3646 2.9980 3.4995
8 -3.3554 -2.8965 -2.3060 -1.8595 -1.3968 1.3968 1.8595 2.3060 2.8965 3.3554
9 -3.2498 -2.8214 -2.2622 -1.8331 -1.3830 1.3830 1.8331 2.2622 2.8214 3.2498
10 -3.1693 -2.7638 -2.2281 -1.8125 -1.3722 1.3722 1.8125 2.2281 2.7638 3.1693
11 -3.1058 -2.7181 -2.2010 -1.7959 -1.3634 1.3634 1.7959 2.2010 2.7181 3.1058
12 -3.0545 -2.6810 -2.1788 -1.7823 -1.3562 1.3562 1.7823 2.1788 2.6810 3.0545
13 -3.0123 -2.6503 -2.1604 -1.7709 -1.3502 1.3502 1.7709 2.1604 2.6503 3.0123
14 -2.9768 -2.6245 -2.1448 -1.7613 -1.3450 1.3450 1.7613 2.1448 2.6245 2.9768
15 -2.9467 -2.6025 -2.1314 -1.7531 -1.3406 1.3406 1.7531 2.1314 2.6025 2.9467
16 -2.9208 -2.5835 -2.1199 -1.7459 -1.3368 1.3368 1.7459 2.1199 2.5835 2.9208
17 -2.8982 -2.5669 -2.1098 -1.7396 -1.3334 1.3334 1.7396 2.1098 2.5669 2.8982
18 -2.8784 -2.5524 -2.1009 -1.7341 -1.3304 1.3304 1.7341 2.1009 2.5524 2.8784
19 -2.8609 -2.5395 -2.0930 -1.7291 -1.3277 1.3277 1.7291 2.0930 2.5395 2.8609
20 -2.8453 -2.5280 -2.0860 -1.7247 -1.3253 1.3253 1.7247 2.0860 2.5280 2.8453
21 -2.8314 -2.5176 -2.0796 -1.7207 -1.3232 1.3232 1.7207 2.0796 2.5176 2.8314
22 -2.8188 -2.5083 -2.0739 -1.7171 -1.3212 1.3212 1.7171 2.0739 2.5083 2.8188
23 -2.8073 -2.4999 -2.0687 -1.7139 -1.3195 1.3195 1.7139 2.0687 2.4999 2.8073
24 -2.7969 -2.4922 -2.0639 -1.7109 -1.3178 1.3178 1.7109 2.0639 2.4922 2.7969
25 -2.7874 -2.4851 -2.0595 -1.7081 -1.3163 1.3163 1.7081 2.0595 2.4851 2.7874
26 -2.7787 -2.4786 -2.0555 -1.7056 -1.3150 1.3150 1.7056 2.0555 2.4786 2.7787
27 -2.7707 -2.4727 -2.0518 -1.7033 -1.3137 1.3137 1.7033 2.0518 2.4727 2.7707
28 -2.7633 -2.4671 -2.0484 -1.7011 -1.3125 1.3125 1.7011 2.0484 2.4671 2.7633
29 -2.7564 -2.4620 -2.0452 -1.6991 -1.3114 1.3114 1.6991 2.0452 2.4620 2.7564
30 -2.7500 -2.4573 -2.0423 -1.6973 -1.3104 1.3104 1.6973 2.0423 2.4573 2.7500
40 -2.7045 -2.4233 -2.0211 -1.6839 -1.3031 1.3031 1.6839 2.0211 2.4233 2.7045
50 -2.6778 -2.4033 -2.0086 -1.6759 -1.2987 1.2987 1.6759 2.0086 2.4033 2.6778
60 -2.6603 -2.3901 -2.0003 -1.6706 -1.2958 1.2958 1.6706 2.0003 2.3901 2.6603
90 -2.6316 -2.3685 -1.9867 -1.6620 -1.2910 1.2910 1.6620 1.9867 2.3685 2.6316
120 -2.6174 -2.3578 -1.9799 -1.6577 -1.2886 1.2886 1.6577 1.9799 2.3578 2.6174
240 -2.5965 -2.3420 -1.9699 -1.6512 -1.2851 1.2851 1.6512 1.9699 2.3420 2.5965
360 -2.5896 -2.3368 -1.9666 -1.6491 -1.2839 1.2839 1.6491 1.9666 2.3368 2.5896


Elección entre z y t

Para construir un intervalo de confianza para la media poblacional, debemos decidir si usar \(z\) o \(t\) como factor de confiabilidad. La elección depende del tamaño de la muestra, la normalidad de la población y si la varianza poblacional es conocida.


Diagrama de flujo para elegir entre \(z\) y \(t\) en la construcción de intervalos de confianza (tomado y adaptado de Daniel et al., 2019).


Ejemplos


Ejemplo 1

Encuentre el valor de t para un nivel de significancia del 5% y un tamaño de muestra de 10. A partir de la tabla, nos ubicamos en la intersección entre la columna donde aparece \(\alpha\)=0.05 y r=9 (recordemos que r = n-1).

Este valor corresponde a t9;0.05 = -1.8331.

en R

  qt(0.05, 9, lower.tail = T)
[1] -1.833113


Ejemplo 2


¿Cuál es la probabilidad de que t>2 con un tamaño de muestra de 10.?

A partir de la tabla, nos ubicamos en la fila donde aparece r=9. Dado que nos pregunta la cola derecha, en esa fila buscamos entre que valores de a se encuentra el valor de 2, y encontramos que esa probabilidad se encuentra entre 0.025 y 0.05.

En R:

  pt(2, 9, lower.tail = F)
[1] 0.03827641


La Distribución Chi-Cuadrado


La distribución Chi-cuadrado (\(\chi^2\)) con \(n-1\) grados de libertad es una de las distribuciones de probabilidad más usadas en Inferencia Estadística, principalmente en pruebas de hipótesis y en la construcción de intervalos de confianza.

La función de densidad de probabilidad de la distribución \(\chi^2\) es:

\[f(X) = (\frac{1}{2})^{r/2} \frac{1}{\Gamma(r/2)} x^{(r/2)-1} e^{-x/2}\]


donde \(x>0\) y \(r\) es el número de grados de libertad.


Propiedades de la distribución \(\chi^2\)

  1. La distribución \(\chi^2\) es asimétrica y no negativa.
  2. La media de la distribución \(\chi^2\) es igual al número de grados de libertad.
  3. La varianza de la distribución \(\chi^2\) es igual a dos veces el número de grados de libertad.
  4. La distribución \(\chi^2\) depende del número de grados de libertad.
  5. A medida que el número de grados de libertad aumenta, la distribución \(\chi^2\) se aproxima a una distribución normal.


Teorema del Límite Central aplicado a la distribución \(\chi^2\)

A medida que el número de grados de libertad r aumenta, la distribución \(\chi^2(r)\) tiende a una distribución normal con media \(r\) y varianza \(2r\).


\[ \chi^2(r) \approx N(r, 2r) \quad \text{para } r \to \infty \]


Tabla de valores críticos de la distribución \(\chi^2\) con r = n-1 grados de libertad


α
r 0.100 0.050 0.025 0.010 0.005 0.001
1 2.71 3.84 5.02 6.63 7.88 10.83
2 4.61 5.99 7.38 9.21 10.60 13.82
3 6.25 7.81 9.35 11.34 12.84 16.27
4 7.78 9.49 11.14 13.28 14.86 18.47
5 9.24 11.07 12.83 15.09 16.75 20.52
6 10.64 12.59 14.45 16.81 18.55 22.46
7 12.02 14.07 16.01 18.48 20.28 24.32
8 13.36 15.51 17.53 20.09 21.95 26.12
9 14.68 16.92 19.02 21.67 23.59 27.88
10 15.99 18.31 20.48 23.21 25.19 29.59
11 17.28 19.68 21.92 24.72 26.76 31.26
12 18.55 21.03 23.34 26.22 28.30 32.91
13 19.81 22.36 24.74 27.69 29.82 34.53
14 21.06 23.68 26.12 29.14 31.32 36.12
15 22.31 25.00 27.49 30.58 32.80 37.70
16 23.54 26.30 28.85 32.00 34.27 39.25
17 24.77 27.59 30.19 33.41 35.72 40.79
18 25.99 28.87 31.53 34.81 37.16 42.31
19 27.20 30.14 32.85 36.19 38.58 43.82
20 28.41 31.41 34.17 37.57 40.00 45.31
21 29.62 32.67 35.48 38.93 41.40 46.80
22 30.81 33.92 36.78 40.29 42.80 48.27
23 32.01 35.17 38.08 41.64 44.18 49.73
24 33.20 36.42 39.36 42.98 45.56 51.18
25 34.38 37.65 40.65 44.31 46.93 52.62
26 35.56 38.89 41.92 45.64 48.29 54.05
27 36.74 40.11 43.19 46.96 49.64 55.48
28 37.92 41.34 44.46 48.28 50.99 56.89
29 39.09 42.56 45.72 49.59 52.34 58.30
30 40.26 43.77 46.98 50.89 53.67 59.70
40 51.81 55.76 59.34 63.69 66.77 73.40
50 63.17 67.50 71.42 76.15 79.49 86.66
60 74.40 79.08 83.30 88.38 91.95 99.61
90 107.57 113.15 118.14 124.12 128.30 137.21
120 140.23 146.57 152.21 158.95 163.65 173.62
240 268.47 277.14 284.80 293.89 300.18 313.44
360 394.79 405.24 414.46 425.35 432.87 448.65

Ejemplo 1

Encuentre el valor de \(\chi^2\) para un nivel de significancia (\(\alpha\)) del 5% y un tamaño de muestra de 10.

A partir de la tabla, nos ubicamos en la intersección entre la columna donde aparece \(1-\alpha\)=0.95 y r=9 (recordemos que r = n-1).

Este valor corresponde a \(\chi^2_{9;0.05}\) = 16.9189.

en R:

  qchisq(0.95, 9, lower.tail = T)
[1] 16.91898

Ejemplo 2

¿Cuál es la probabilidad de que \(\chi^2\)>20 con un tamaño de muestra de 10?

A partir de la tabla, nos ubicamos en la fila donde aparece r=9. Dado que nos pregunta la cola derecha, en esa fila buscamos entre que valores de \(\alpha\) se encuentra el valor de 20, y encontramos que esa probabilidad se encuentra entre 0.025 y 0.05.

En R:

  1-pchisq(20, 9, lower.tail = T)
[1] 0.0179124


La Distribución F de Fisher-Snedecor


La distribución F de Fisher-Snedecor es una distribución de probabilidad continua que se utiliza en estadística para comparar la varianza de dos poblaciones. La distribución F es asimétrica y no negativa, y depende de dos parámetros: los grados de libertad de los dos conjuntos de datos. La función de densidad de probabilidad de la distribución F es:


\[f(x) = \frac{\Gamma(\frac{r_1+r_2}{2})}{\Gamma(\frac{r_1}{2})\Gamma(\frac{r_2}{2})} (\frac{r_1}{r_2})^{\frac{r_1}{2}} x^{\frac{r_1}{2}-1} (1+\frac{r_1}{r_2}x)^{-\frac{r_1+r_2}{2}}\]

donde \(x>0\) y \(r_1\) y \(r_2\) son los grados de libertad de los dos conjuntos de datos.


Propiedades de la distribución F


  1. La distribución F es asimétrica y no negativa.
  2. La media de la distribución F es igual a \(\frac{r_2}{r_2-2}\) si \(r_2>2\).
  3. La varianza de la distribución F es igual a \(\frac{2r_2^2(r_1+r_2-2)}{r_1(r_2-2)^2(r_2-4)}\) si \(r_2>4\).
  4. La distribución F depende de los grados de libertad de los dos conjuntos de datos.
  5. A medida que el número de grados de libertad aumenta, la distribución F se aproxima a una distribución normal.


Teorema del Límite Central aplicado a la distribución F


A medida que el número de grados de libertad \(r_1\) y \(r_2\) aumenta, la distribución F tiende a una distribución normal.


\[F(r_1, r_2) \approx N(r_2, 2r_2) \quad \text{para } r_1, r_2 \to \infty\]



Tabla de valores críticos de la distribución F de Fisher-Snedecor con r1 (numerador) y r2 (denominador) grados de libertad


Table 1: Percentiles of the F distribution
r1
r2 α 1 2 3 4 5 6 7 8 12 24 Inf
2 0.100 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.41 9.45 9.49
0.050 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.41 19.45 19.50
0.025 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.41 39.46 39.50
0.010 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.42 99.46 99.50
0.005 198.50 199.00 199.17 199.25 199.30 199.33 199.36 199.37 199.42 199.46 199.50
0.001 998.50 999.00 999.17 999.25 999.30 999.33 999.36 999.37 999.42 999.46 999.50
3 0.100 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.22 5.18 5.13
0.050 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.74 8.64 8.53
0.025 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.34 14.12 13.90
0.010 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.05 26.60 26.13
0.005 55.55 49.80 47.47 46.19 45.39 44.84 44.43 44.13 43.39 42.62 41.83
0.001 167.03 148.50 141.11 137.10 134.58 132.85 131.58 130.62 128.32 125.93 123.47
4 0.100 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.90 3.83 3.76
0.050 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 5.91 5.77 5.63
0.025 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.75 8.51 8.26
0.010 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.37 13.93 13.46
0.005 31.33 26.28 24.26 23.15 22.46 21.97 21.62 21.35 20.70 20.03 19.32
0.001 74.14 61.25 56.18 53.44 51.71 50.53 49.66 49.00 47.41 45.77 44.05
5 0.100 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.27 3.19 3.10
0.050 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.68 4.53 4.36
0.025 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.52 6.28 6.02
0.010 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 9.89 9.47 9.02
0.005 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.38 12.78 12.14
0.001 47.18 37.12 33.20 31.09 29.75 28.83 28.16 27.65 26.42 25.13 23.79
6 0.100 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.90 2.82 2.72
0.050 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.00 3.84 3.67
0.025 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.37 5.12 4.85
0.010 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.72 7.31 6.88
0.005 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.03 9.47 8.88
0.001 35.51 27.00 23.70 21.92 20.80 20.03 19.46 19.03 17.99 16.90 15.75
7 0.100 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.67 2.58 2.47
0.050 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.57 3.41 3.23
0.025 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.67 4.41 4.14
0.010 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.47 6.07 5.65
0.005 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.18 7.64 7.08
0.001 29.25 21.69 18.77 17.20 16.21 15.52 15.02 14.63 13.71 12.73 11.70
8 0.100 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.50 2.40 2.29
0.050 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.28 3.12 2.93
0.025 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.20 3.95 3.67
0.010 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.67 5.28 4.86
0.005 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.01 6.50 5.95
0.001 25.41 18.49 15.83 14.39 13.48 12.86 12.40 12.05 11.19 10.30 9.33
12 0.100 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.15 2.04 1.90
0.050 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.69 2.51 2.30
0.025 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.28 3.02 2.72
0.010 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.16 3.78 3.36
0.005 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 4.91 4.43 3.90
0.001 18.64 12.97 10.80 9.63 8.89 8.38 8.00 7.71 7.00 6.25 5.42
24 0.100 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.83 1.70 1.53
0.050 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.18 1.98 1.73
0.025 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.54 2.27 1.94
0.010 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.03 2.66 2.21
0.005 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.42 2.97 2.43
0.001 14.03 9.34 7.55 6.59 5.98 5.55 5.23 4.99 4.39 3.74 2.97


Sin embargo, en la práctica, la tabla de valores críticos de la distribución F es más compleja, ya que losgrados de libertad pueden ser diferentes a los de la tabla. Se recomienda utilizar software estadístico para obtener estos valores.


Ejemplo

Encuentre el valor de F para un nivel de significancia del 5% y dos conjuntos de datos con 5 y 5 grados de libertad.

A partir de la tabla, nos ubicamos en la intersección entre la columna donde aparece \(\alpha\)=0.05 y r1=5 y r2=5.

Este valor corresponde a \(F_{5,5;0.05}\) = 5.9874.

en R:

  qf(0.95, 5, 5, lower.tail = T)
[1] 5.050329


A partir de esta función, podemos calcular la probabilidad de otros escenarios distintos con tamaño de muestra diferente y por lo tanto, grado de libertad diferente.


Ejemplo 2

¿Con dos conjuntos de datos con 8 y 12 grados de libertad, cuál es la probabilidad de que F>3?

En R:

  pf(3, 8, 12, lower.tail = F)
[1] 0.04242239

Vemos que la probabilidad de que F>3 es de 0.0257.

Ejemplo 3

¿Con dos conjuntos de datos con 8 y 12 grados de libertad, cuál es el valor de F para un nivel de significancia del 1%?

En R:

  qf(0.01, 8, 12, lower.tail = T)
[1] 0.176469

Vemos que el valor de F para un nivel de significancia del 1% es de 4.9646.


Referencias