La verosimilitud consiste en otorgar a un estimador o estimación una determinada “credibilidad” o una mayor apariencia de ser el cierto valor(estimación) o el cierto camino para conseguirlo(estimador).
En términos probabilísticos podríamos hablar de que la verosimilitud es la probabilidad de que ocurra o se dé una determinada muestra si es cierta la estimación que hemos efectuado o el estimador que hemos planteado.
Evidentemente, la máxima verosimilitud, será aquel estimador o estimación que nos arroja mayor credibilidad.En situación formal tendríamos:
Un estimador máximo-verosímil es el que se obtiene maximizando la función de verosimilitud de la muestra
\[L\left ( \chi _{1},\chi _{2},\chi _{3},...\chi _{n} \mid \Theta \right )\]
Que es la función que asigna la probabilidad de que se obtenga una muestra dependiendo del parámetro “θ” pero considerada como función de θ.
La idea de este método es la de encontrar primero la función de densidad conjunta de todas las observaciones, que bajo condiciones de independencia, es
\[L\left ( \chi _{1},\chi _{2},\chi _{3},...\chi _{n} \mid \Theta \right )= \textit{f}\left (\chi_{1}\mid \Theta \right )\cdot \textit{f}\left (\chi_{2}\mid \Theta\right )\cdot \cdot \cdot \textit{f}\left (\chi_{n}\mid \Theta\right )\]
En teoría de probabilidad y estadística, la distribución de Poisson es una distribución de probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad de que ocurra un determinado número de eventos durante cierto período de tiempo. La función de masa de probabilidad de la distribución de Poisson es
\[{\displaystyle f(x,\lambda )={\frac {e^{-\lambda }\lambda ^{x}}{x!}}}\]
Entonces para una muestra de tamaño n tendremos que la función de de verosimilitud será:
\[L\left ( \chi _{1},\chi _{2},\chi _{3},...\chi _{n} \mid \Theta= \lambda\right)=\frac {e^{-\lambda }\lambda ^{x_{1}}}{x_{1}!}\cdot{\frac {e^{-\lambda }\lambda ^{x_{2}}}{x_{2}!}\cdot\cdots {\frac {e^{-\lambda }\lambda ^{x_{n}}}{x_{n}!}}}\]
simplificando sería:
\[L(x_i,\lambda) = \prod_{i=1}^{n}\frac{e^{-\lambda}.\lambda^{x_i}}{{x_i}!}\]
Puesto que queremos encontrar la máxima verosimilitud, debemos aplicar primero logaritmo natural que por sus propiedades nos puede facilitar el proceso de derivar.
\[LnL(x_i,\lambda) = \sum_{i=1}^{n}Ln\left(\frac{e^{-\lambda}.\lambda^{x_i}}{{x_i}!}\right)\]
\[LnL(x_i,\lambda) = \sum_{i=1}^{n}\left([-\lambda + x_iLn\lambda] - Lnx_i!\right)\]
También aplicamos las propiedades de la sumatoria:
\[LnL(x_i,\lambda) = \sum_{i=1}^{n}-\lambda + \sum_{i=1}^{n}x_iLn\lambda - \sum_{i=1}^{n}Lnx_i!\] \[LnL(x_i,\lambda) = n.-\lambda + Ln\lambda\sum_{i=1}^{n}x_i - \sum_{i=1}^{n}Lnx_i!\]
Una vez hecho lo anterior podemos maximizar
\[\frac{\partial{LnL}}{\partial\lambda} = 0 \longrightarrow \frac{\sum_{i=1}^{n}x_i}{\lambda} -n = 0\] \[\frac{\sum_{i=1}^{n}x_i}{\lambda} = n\] \[\frac{\sum_{i=1}^{n}x_i}{n} = \lambda\] Podemos ver ahora que λ es la media de los valores del modelo.
Acontinuación tenemos los siguientes datos del número de ventas diarias de una tienda virtual de productos del cuidado personal.
x=c(65,71,74,68,69,70,72,73,67,70)
Ahora crearemos una función que encuentre el λ que maximice la verosimilitud
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(pander)
calc_verosimil=function(l){
verosimiltud=prod(dpois(x,lambda = l))
return(verosimiltud)
}
lambdas=seq(45,85,1)
prueba=sapply(lambdas, calc_verosimil)
plot(lambdas,prueba,type="l")
De a cuerdo con la gráfica se puede ver que la probabilidad para los valores o ventas menores a 60 y mayores a 80 es baja, y que la media, en este caso el λ, se encuentra cercano a 70.
Para obtener el λ exacto, haremos lo siguiente:
resultados=data.frame(lambdas,prueba)
print(resultados)
## lambdas prueba
## 1 45 1.031924e-39
## 2 46 2.202318e-37
## 3 47 3.377641e-35
## 4 48 3.774774e-33
## 5 49 3.114448e-31
## 6 50 1.920478e-29
## 7 51 8.953331e-28
## 8 52 3.190244e-26
## 9 53 8.777579e-25
## 10 54 1.882934e-23
## 11 55 3.178134e-22
## 12 56 4.257340e-21
## 13 57 4.563381e-20
## 14 58 3.944440e-19
## 15 59 2.769677e-18
## 16 60 1.590934e-17
## 17 61 7.525546e-17
## 18 62 2.950051e-16
## 19 63 9.641349e-16
## 20 64 2.642109e-15
## 21 65 6.104363e-15
## 22 66 1.195282e-14
## 23 67 1.993432e-14
## 24 68 2.845114e-14
## 25 69 3.490915e-14
## 26 70 3.698367e-14
## 27 71 3.397198e-14
## 28 72 2.716473e-14
## 29 73 1.898125e-14
## 30 74 1.163249e-14
## 31 75 6.274498e-15
## 32 76 2.988905e-15
## 33 77 1.261488e-15
## 34 78 4.732043e-16
## 35 79 1.582390e-16
## 36 80 4.730779e-17
## 37 81 1.267988e-17
## 38 82 3.055097e-18
## 39 83 6.634129e-19
## 40 84 1.301588e-19
## 41 85 2.312793e-20
which.max(resultados$prueba)
## [1] 26
Si buscamos el ##26, vemos que corresponde al λ con valor 70. Finalmente encontramos la media de x para confirmar si esta coincide con el λ encontrado en la tabla que maximiza la verosimilitud
mean(x)
## [1] 69.9
Aproximando el valor dado, podemos concluir que el λ optimo coincide con la media de la muestra inicial de las ventas.