variable aleatoria discreta

Una variable aleatoria discreta \(X\) es una función \(X: \Omega \to \mathbb{R}\) definida sobre un espacio de probabilidad \((\Omega, \mathcal{A}, P)\), tal que el conjunto de valores posibles \(\{x_1, x_2, \ldots, x_k, \ldots \}\) es finito o infinito numerable.

Cada valor \(x_k\) tiene asignada una probabilidad \(p_k = P(X = x_k)\), cumpliendo que:

- \(p_k \geq 0 \quad \forall k\),

- \(\sum_k p_k = 1\).

La función de distribución acumulada se define como:

\[ F_X(t) = P(X \leq t). \]

Además, la variable aleatoria discreta tiene las siguientes características estadísticas:

Esperanza matemática (media):

\[ E(X) = \sum_k x_k p_k. \]

Varianza:

\[ \mathrm{Var}(X) = \sum_k (x_k - E(X))^2 p_k. \]

Este tipo de variable se utiliza para modelar fenómenos donde los posibles resultados son contables y aislados, como el número de éxitos, cantidad de llamadas o resultados en el lanzamiento de dados.

Esperanza matemática de una variable aleatoria

La esperanza matemática (o valor esperado) de una variable aleatoria \(X\) es el promedio ponderado de todos los posibles valores que puede tomar, donde cada valor está ponderado por su probabilidad de ocurrencia.

Para una variable aleatoria discreta \(X\), con valores posibles \(x_i\) y probabilidad \(p_i = P(X = x_i)\):

\[ E(X) = \sum_{i} x_i p_i \]

Para una variable aleatoria continua con función de densidad \(f_X(x)\):

\[ E(X) = \int_{-\infty}^{\infty} x f_X(x) \, dx \]

La esperanza representa el valor promedio esperado de la variable si el experimento se repitiera muchas veces.

Ejemplo:

Un distribuidor de computadores vende tres modelos diferentes de computadores con capacidad de 20 GB, 25 GB y 30 GB del disco duro.

Sea \(X\) la variable aleatoria que representa la cantidad de espacio del disco duro de un computador comprado por el siguiente cliente. Supongamos que \(X\) tiene la función de probabilidad \(f\) dada por:

\(x\)	20	25	30
\(f(x)\)	0.29	0.31	0.40

Solución

La función que define el precio del computador según la capacidad del disco duro es:

\[ h(X) = 15X - 3 \]

El precio esperado se calcula como el valor esperado de \(h(X)\):

\[ E[h(X)] = E[15X - 3] = 15E(X) - 3 \]

Donde \(E(X)\) es la esperanza de la variable aleatoria \(X\), que previamente se calculó como 25.55.

Entonces:

\[ E[h(X)] = 15 \times 25.55 - 3 = 380.25 \]

Esto significa que el precio promedio esperado que pagará un cliente por un computador, basado en la distribución de capacidades del disco duro y sus precios asociados, es de 380.25 unidades monetarias.

Cálculo paso a paso de la esperanza \(E(X)\)

Se tienen los valores posibles de la variable \(X\): 20, 25 y 30.
Se tienen las probabilidades asociadas a cada valor: 0.29, 0.31 y 0.40.
La fórmula para calcular la esperanza es:

\[ E(X) = \sum_i x_i \cdot P(X = x_i) \]

Sustituyendo los valores:

\[ E(X) = 20 \times 0.29 + 25 \times 0.31 + 30 \times 0.40 \]

Calculamos cada producto:

\(20 \times 0.29 = 5.8\)
\(25 \times 0.31 = 7.75\)
\(30 \times 0.40 = 12\)

Finalmente, sumamos los productos para obtener la esperanza:

\[ E(X) = 5.8 + 7.75 + 12 = 25.55 \]

El valor \(E(X) = 25.55\) significa que la capacidad promedio esperada del disco duro de un computador comprado es de aproximadamente 25.55 GB, tomando en cuenta las probabilidades de cada modelo vendido.

Distribución Hipergeométrica

La distribución hipergeométrica describe la probabilidad de obtener \(k\) éxitos en \(n\) extracciones sin reemplazo de una población finita de tamaño \(N\), que contiene \(K\) éxitos.

Función de Probabilidad

\[ P(X = x) = \frac{\binom{K}{x} \binom{N-K}{n-x}}{\binom{N}{n}} \]

donde: - \(N\) = tamaño total de la población - \(K\) = número de éxitos en la población - \(n\) = número de extracciones - \(k\) = número de éxitos observados en la muestra.

Ejemplo:

Un ejemplo industrial de la distribución hipergeométrica se encuentra en el control de calidad de los procesos de fabricación. Supongamos que una fábrica produce componentes electrónicos, algunos de los cuales podrían presentar defectos. De un lote de 40 componentes, se sospecha que 8 son defectuosos. El inspector de control de calidad toma una muestra aleatoria de 8 componentes sin reemplazo para comprobar su calidad. La distribución hipergeométrica permite calcular la probabilidad de encontrar exactamente 3 componentes defectuosos en la muestra.

f=numeric()
for(i in 1:3)
  {f[i+1]=choose(8,i)*choose(40-8,8-i)/choose(40,8)
print(f[i+1])}

## [1] 0.3501327
## [1] 0.3299328
## [1] 0.1466368

¿ Cual es la probabilidad de encontrar a lo sumo 3 defectuoso?

f = numeric()
suma = 0
for(i in 0:3) {
  f[i+1] = choose(8,i) * choose(40-8, 8-i) / choose(40,8)
  print(f[i+1])
  suma = suma + f[i+1]
}

## [1] 0.1367706
## [1] 0.3501327
## [1] 0.3299328
## [1] 0.1466368

print(suma)

## [1] 0.9634729

¿ Cual es la media ?

M=(8*8/40) M # En Promedio se encuentra 1.6, es decir 1 componente electronico defectuuoso en una muestra de 8

Propiedades clave

Media: \(E(X) = n \times \frac{K}{N}\)
Varianza: \(\mathrm{Var}(X) = n \times \frac{K}{N} \times \frac{N-K}{N} \times \frac{N-n}{N-1}\)

Ejemplo

Supongamos que un jurado consta de 30 personas, 15 hombres y 15 mujeres. Si se seleccionan 8 personas al azar, la probabilidad de que exactamente 5 sean mujeres es:

\[ P(X = 5) = \frac{\binom{15}{5} \binom{15}{3}}{\binom{30}{8}} \approx 0.2335 \]

Esto significa que hay aproximadamente un 23.3% de probabilidad de seleccionar 5 mujeres en una muestra de 8 personas.

Solucion:

R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)

##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

Variable aleatoria Discreta

Jair

2025-09-30