Una variable aleatoria discreta \(X\) es una función \(X: \Omega \to \mathbb{R}\) definida sobre un espacio de probabilidad \((\Omega, \mathcal{A}, P)\), tal que el conjunto de valores posibles \(\{x_1, x_2, \ldots, x_k, \ldots \}\) es finito o infinito numerable.
Cada valor \(x_k\) tiene asignada una probabilidad \(p_k = P(X = x_k)\), cumpliendo que:
- \(p_k \geq 0 \quad \forall k\),
- \(\sum_k p_k = 1\).
La función de distribución acumulada se define como:
\[ F_X(t) = P(X \leq t). \]
Además, la variable aleatoria discreta tiene las siguientes características estadísticas:
\[ E(X) = \sum_k x_k p_k. \]
\[ \mathrm{Var}(X) = \sum_k (x_k - E(X))^2 p_k. \]
Este tipo de variable se utiliza para modelar fenómenos donde los posibles resultados son contables y aislados, como el número de éxitos, cantidad de llamadas o resultados en el lanzamiento de dados.
La esperanza matemática (o valor esperado) de una variable aleatoria \(X\) es el promedio ponderado de todos los posibles valores que puede tomar, donde cada valor está ponderado por su probabilidad de ocurrencia.
\[ E(X) = \sum_{i} x_i p_i \]
\[ E(X) = \int_{-\infty}^{\infty} x f_X(x) \, dx \]
La esperanza representa el valor promedio esperado de la variable si el experimento se repitiera muchas veces.
Ejemplo:
Un distribuidor de computadores vende tres modelos diferentes de computadores con capacidad de 20 GB, 25 GB y 30 GB del disco duro.
Sea \(X\) la variable aleatoria que representa la cantidad de espacio del disco duro de un computador comprado por el siguiente cliente. Supongamos que \(X\) tiene la función de probabilidad \(f\) dada por:
| \(x\) | 20 | 25 | 30 |
|---|---|---|---|
| \(f(x)\) | 0.29 | 0.31 | 0.40 |
La función que define el precio del computador según la capacidad del disco duro es:
\[ h(X) = 15X - 3 \]
El precio esperado se calcula como el valor esperado de \(h(X)\):
\[ E[h(X)] = E[15X - 3] = 15E(X) - 3 \]
Donde \(E(X)\) es la esperanza de la variable aleatoria \(X\), que previamente se calculó como 25.55.
Entonces:
\[ E[h(X)] = 15 \times 25.55 - 3 = 380.25 \]
Esto significa que el precio promedio esperado que pagará un cliente por un computador, basado en la distribución de capacidades del disco duro y sus precios asociados, es de 380.25 unidades monetarias.
Se tienen los valores posibles de la variable \(X\): 20, 25 y 30.
Se tienen las probabilidades asociadas a cada valor: 0.29, 0.31 y 0.40.
La fórmula para calcular la esperanza es:
\[ E(X) = \sum_i x_i \cdot P(X = x_i) \]
\[ E(X) = 20 \times 0.29 + 25 \times 0.31 + 30 \times 0.40 \]
\[ E(X) = 5.8 + 7.75 + 12 = 25.55 \]
El valor \(E(X) = 25.55\) significa que la capacidad promedio esperada del disco duro de un computador comprado es de aproximadamente 25.55 GB, tomando en cuenta las probabilidades de cada modelo vendido.
La distribución hipergeométrica describe la probabilidad de obtener \(k\) éxitos en \(n\) extracciones sin reemplazo de una población finita de tamaño \(N\), que contiene \(K\) éxitos.
\[ P(X = x) = \frac{\binom{K}{x} \binom{N-K}{n-x}}{\binom{N}{n}} \]
donde: - \(N\) = tamaño total de la población - \(K\) = número de éxitos en la población - \(n\) = número de extracciones - \(k\) = número de éxitos observados en la muestra.
Ejemplo:
Un ejemplo industrial de la distribución hipergeométrica se encuentra en el control de calidad de los procesos de fabricación. Supongamos que una fábrica produce componentes electrónicos, algunos de los cuales podrían presentar defectos. De un lote de 40 componentes, se sospecha que 8 son defectuosos. El inspector de control de calidad toma una muestra aleatoria de 8 componentes sin reemplazo para comprobar su calidad. La distribución hipergeométrica permite calcular la probabilidad de encontrar exactamente 3 componentes defectuosos en la muestra.
f=numeric()
for(i in 1:3)
{f[i+1]=choose(8,i)*choose(40-8,8-i)/choose(40,8)
print(f[i+1])}
## [1] 0.3501327
## [1] 0.3299328
## [1] 0.1466368
¿ Cual es la probabilidad de encontrar a lo sumo 3 defectuoso?
f = numeric()
suma = 0
for(i in 0:3) {
f[i+1] = choose(8,i) * choose(40-8, 8-i) / choose(40,8)
print(f[i+1])
suma = suma + f[i+1]
}
## [1] 0.1367706
## [1] 0.3501327
## [1] 0.3299328
## [1] 0.1466368
print(suma)
## [1] 0.9634729¿ Cual es la media ?
M=(8*8/40) M # En Promedio se encuentra 1.6, es decir 1 componente electronico defectuuoso en una muestra de 8
Supongamos que un jurado consta de 30 personas, 15 hombres y 15 mujeres. Si se seleccionan 8 personas al azar, la probabilidad de que exactamente 5 sean mujeres es:
\[ P(X = 5) = \frac{\binom{15}{5} \binom{15}{3}}{\binom{30}{8}} \approx 0.2335 \]
Esto significa que hay aproximadamente un 23.3% de probabilidad de seleccionar 5 mujeres en una muestra de 8 personas.
La distribución de Poisson es una distribución de probabilidad discreta utilizada para modelar eventos raros que ocurren en un intervalo fijo de tiempo o espacio, bajo ciertas condiciones: los eventos deben ser independientes, ocurrir a una tasa promedio constante (λ) y no poder suceder simultáneamente. El parámetro λ representa el número promedio esperado de eventos en ese intervalo.
La función de distribución de probabilidad (o función de masa de probabilidad, PMF) para la distribución de Poisson describe la probabilidad de observar exactamente k eventos en un intervalo fijo, cuando los eventos son independientes y ocurren a una tasa constante λ. Es:
P(X = k) = e^(−λ) · λ^k / k!, para k = 0, 1, 2
Ejemplo: si λ=3 calcule la probabilidad de que una variable con distribucion de poisson sea menor o igual a 10
suma=0
f=numeric()
for (i in 0:10)
{f[i+1]=exp(-3)*(3^i)/factorial(i)
print(f[i+1])
suma=suma+f[i+1]
}
## [1] 0.04978707
## [1] 0.1493612
## [1] 0.2240418
## [1] 0.2240418
## [1] 0.1680314
## [1] 0.1008188
## [1] 0.05040941
## [1] 0.02160403
## [1] 0.008101512
## [1] 0.002700504
## [1] 0.0008101512
print(suma)
## [1] 0.9997077
La aproximación de la distribución binomial a la normal es una técnica que se utiliza para simplificar cálculos en distribuciones binomiales con ciertos parámetros. Esta aproximación es válida si se cumplen condiciones específicas: el tamaño de la muestra nn debe ser suficientemente grande (por lo general, n≥30) y tanto np como n(1−p) deben ser mayores o iguales a 5, donde p es la probabilidad de éxito en cada ensayo.
Bajo estas condiciones, la variable binomial X∼B(n,p)
X∼B(n,p) puede aproximarse por una variable normal X′∼N(μ,σ), con
media μ=np y desviación estándar σ=np(1−p).
Dado que la binomial es una variable discreta y la normal continua, se aplica una [translate:corrección de continuidad o de Yates] para mejorar la aproximación. Esto consiste en ajustar los valores de la binomial sumando o restando 0.5 antes de usar la distribución normal para calcular probabilidades.En resumen, la fórmula del estadístico \( z \) para la aproximación con corrección de continuidad es:\[z = \frac{(x \pm 0.5) - \mu}{\sigma} = \frac{(x \pm 0.5) - np}{\sqrt{np(1-p)}}\]donde:- \( x \) es el valor discreto para el que se estima la probabilidad,- \( \mu = np \) es la media de la binomial,- \( \sigma = \sqrt{np(1-p)} \) es la desviación estándar,y se suma 0.5 para calcular probabilidades \( P(X \leq x) \) .
This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.