Una variable aleatoria discreta \(X\) es una función \(X: \Omega \to \mathbb{R}\) definida sobre un espacio de probabilidad \((\Omega, \mathcal{A}, P)\), tal que el conjunto de valores posibles \(\{x_1, x_2, \ldots, x_k, \ldots \}\) es finito o infinito numerable.
Cada valor \(x_k\) tiene asignada una probabilidad \(p_k = P(X = x_k)\), cumpliendo que:
- \(p_k \geq 0 \quad \forall k\),
- \(\sum_k p_k = 1\).
La función de distribución acumulada se define como:
\[ F_X(t) = P(X \leq t). \]
Además, la variable aleatoria discreta tiene las siguientes características estadísticas:
\[ E(X) = \sum_k x_k p_k. \]
\[ \mathrm{Var}(X) = \sum_k (x_k - E(X))^2 p_k. \]
Este tipo de variable se utiliza para modelar fenómenos donde los posibles resultados son contables y aislados, como el número de éxitos, cantidad de llamadas o resultados en el lanzamiento de dados.
La esperanza matemática (o valor esperado) de una variable aleatoria \(X\) es el promedio ponderado de todos los posibles valores que puede tomar, donde cada valor está ponderado por su probabilidad de ocurrencia.
\[ E(X) = \sum_{i} x_i p_i \]
\[ E(X) = \int_{-\infty}^{\infty} x f_X(x) \, dx \]
La esperanza representa el valor promedio esperado de la variable si el experimento se repitiera muchas veces.
Ejemplo:
Un distribuidor de computadores vende tres modelos diferentes de computadores con capacidad de 20 GB, 25 GB y 30 GB del disco duro.
Sea \(X\) la variable aleatoria que representa la cantidad de espacio del disco duro de un computador comprado por el siguiente cliente. Supongamos que \(X\) tiene la función de probabilidad \(f\) dada por:
| \(x\) | 20 | 25 | 30 |
|---|---|---|---|
| \(f(x)\) | 0.29 | 0.31 | 0.40 |
La función que define el precio del computador según la capacidad del disco duro es:
\[ h(X) = 15X - 3 \]
El precio esperado se calcula como el valor esperado de \(h(X)\):
\[ E[h(X)] = E[15X - 3] = 15E(X) - 3 \]
Donde \(E(X)\) es la esperanza de la variable aleatoria \(X\), que previamente se calculó como 25.55.
Entonces:
\[ E[h(X)] = 15 \times 25.55 - 3 = 380.25 \]
Esto significa que el precio promedio esperado que pagará un cliente por un computador, basado en la distribución de capacidades del disco duro y sus precios asociados, es de 380.25 unidades monetarias.
Se tienen los valores posibles de la variable \(X\): 20, 25 y 30.
Se tienen las probabilidades asociadas a cada valor: 0.29, 0.31 y 0.40.
La fórmula para calcular la esperanza es:
\[ E(X) = \sum_i x_i \cdot P(X = x_i) \]
\[ E(X) = 20 \times 0.29 + 25 \times 0.31 + 30 \times 0.40 \]
\[ E(X) = 5.8 + 7.75 + 12 = 25.55 \]
El valor \(E(X) = 25.55\) significa que la capacidad promedio esperada del disco duro de un computador comprado es de aproximadamente 25.55 GB, tomando en cuenta las probabilidades de cada modelo vendido.
La distribución hipergeométrica describe la probabilidad de obtener \(k\) éxitos en \(n\) extracciones sin reemplazo de una población finita de tamaño \(N\), que contiene \(K\) éxitos.
\[ P(X = x) = \frac{\binom{K}{x} \binom{N-K}{n-x}}{\binom{N}{n}} \]
donde: - \(N\) = tamaño total de la población - \(K\) = número de éxitos en la población - \(n\) = número de extracciones - \(k\) = número de éxitos observados en la muestra.
Ejemplo:
Un ejemplo industrial de la distribución hipergeométrica se encuentra en el control de calidad de los procesos de fabricación. Supongamos que una fábrica produce componentes electrónicos, algunos de los cuales podrían presentar defectos. De un lote de 40 componentes, se sospecha que 8 son defectuosos. El inspector de control de calidad toma una muestra aleatoria de 8 componentes sin reemplazo para comprobar su calidad. La distribución hipergeométrica permite calcular la probabilidad de encontrar exactamente 3 componentes defectuosos en la muestra.
f=numeric()
for(i in 1:3)
{f[i+1]=choose(8,i)*choose(40-8,8-i)/choose(40,8)
print(f[i+1])}
## [1] 0.3501327
## [1] 0.3299328
## [1] 0.1466368
¿ Cual es la probabilidad de encontrar a lo sumo 3 defectuoso?
f = numeric()
suma = 0
for(i in 0:3) {
f[i+1] = choose(8,i) * choose(40-8, 8-i) / choose(40,8)
print(f[i+1])
suma = suma + f[i+1]
}
## [1] 0.1367706
## [1] 0.3501327
## [1] 0.3299328
## [1] 0.1466368
print(suma)
## [1] 0.9634729¿ Cual es la media ?
M=(8*8/40) M # En Promedio se encuentra 1.6, es decir 1 componente electronico defectuuoso en una muestra de 8
Supongamos que un jurado consta de 30 personas, 15 hombres y 15 mujeres. Si se seleccionan 8 personas al azar, la probabilidad de que exactamente 5 sean mujeres es:
\[ P(X = 5) = \frac{\binom{15}{5} \binom{15}{3}}{\binom{30}{8}} \approx 0.2335 \]
Esto significa que hay aproximadamente un 23.3% de probabilidad de seleccionar 5 mujeres en una muestra de 8 personas.
Solucion:
This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.