DISTRIBUCIONES DE PROBABILIDAD DISCRETAS

TALLER 2
Authors
Affiliation

Jeisson Esteven Callejas Salazar

Angie Lorena Ruiz Molina

Angee Yuliana Buritica Blanco

Published

July 9, 2023

1 DISTRIBUCIONES DE PROBABILIDAD

Las distribuciones de probabilidad son modelos matemáticos que describen la forma en que se distribuyen los valores posibles de una variable aleatoria en un conjunto de datos. En otras palabras, una distribución de probabilidad nos permite entender cómo se reparten las diferentes observaciones o resultados de un fenómeno aleatorio.

1.1 Distribuciones Discretas 1:

Definición:

Es una distribución de probabilidad binaria que modela un experimento con dos posibles resultados, generalmente etiquetados como éxito y fracaso. Se caracteriza por un único parámetro, \(p\), que representa la probabilidad de éxito.

Representación: \[X\sim Bin(n,p)\] En esta notación:

\(X\) representa la variable aleatoria que sigue una distribución binomial. \(\sim\)” se lee como “se distribuye como”. \(Bin(n, p)\) indica que la distribución es binomial, con \(n\) representando el número de ensayos y \(p\) la probabilidad de éxito en cada ensayo.

Fórmulas:

  1. Distribución de Probabilidad: \[ f(x)=P(X = x) = \binom{n}{x} \cdot p^x \cdot (1 - p)^{n - x} \]

Donde:

  • \(P(X = x)\) es la probabilidad de que ocurran exactamente \(x\) éxitos.

  • \(n\) es el número total de experimentos.

  • \(x\) es el número de éxitos que se desea calcular la probabilidad.

  • \(p\) es la probabilidad de éxito en cada experimento, y \(0\leq p\leq 1\).

  • \(\binom{n}{x}\) presenta el coeficiente binomial, que se calcula como \(\binom{n}{x}=\frac{n!}{x!(n-x)!}\) , donde \(n!\) es el factorial de \(n\).

  1. Media:

\[\mu=E(X)=np\]

  1. varianza:

\[\sigma^2=Var(X)=np~(1-p)\]

Definición:

Modela la probabilidad de obtener un número específico de éxitos en una muestra seleccionada sin reemplazo de una población finita con dos posibles resultados. Se caracteriza por tres parámetros: N, el tamaño total de la población; K, el número de éxitos en la población; y n, el tamaño de la muestra.

Representación:

\[X\sim HG(n,N,k)\] En esta notación: \(X ~ H(n, N, k)\), nos indica que la variable aleatoria \(X\) sigue una distribución hipergeométrica con los parámetros \(n\), \(N\) y \(k\). Esta notación se utiliza para describir la distribución de una variable y especificar qué tipo de distribución se está utilizando, en este caso, la distribución hipergeométrica.

Fórmulas: 1. Distribución de Probabilidad:

\[P(X = x) = \frac{{\binom{k}{x} \cdot \binom{N - k}{n - x}}}{{\binom{N}{n}}}\] Donde:

  • \(P(X = x)\) es la probabilidad de obtener exactamente \(k\) éxitos en la muestra.

  • \(N\) es el tamaño de la población.

  • \(k\) es el número de éxitos en la población.

  • \(x\) es el número de éxitos en la muestra.

  • \(n\) es el tamaño de la muestra.

  1. Media

\[\mu=E(X)=\frac{nk}{N}\] 3. Varianza

\[\sigma^2 = Var(X)=\frac{nk}{N} \left ( 1-\frac{k}{N} \right )\left ( \frac{N-n}{N-1} \right )\]

Definición: La distribución de Poisson modela la probabilidad de ocurrencia de un número específico de eventos raros en un intervalo de tiempo o espacio dado. Se utiliza cuando estamos interesados en contar eventos que ocurren de forma aleatoria e independiente a una tasa promedio conocida. La distribución de Poisson se caracteriza por un parámetro, λ (lambda), que representa la tasa promedio de ocurrencia de los eventos. Este parámetro es igual al número promedio de eventos que esperamos ver en el intervalo dado.

Representación:

\[X\sim Pois(\lambda )\] En esta notación: \(X ~ Poisson(λ)\), nos indica que la variable aleatoria \(X\) sigue una distribución de Poisson con parámetro \(λ\). Esta notación es utilizada para describir la distribución de una variable y especificar qué tipo de distribución se está utilizando.

Fórmulas:

  1. Distribución de Probabilidad:

\[P(X = x) = \frac{e^{-\lambda} \lambda^x}{x!}\] Donde:

  • \(P(X = x)\) es la probabilidad de que la variable aleatoria \(X\) tome el valor \(x\).
  • \(e\) es la base del logaritmo natural, aproximadamente igual a \(2.71828\).
  • \(λ~~ (lambda)\) es el parámetro de la distribución de Poisson, que representa la tasa promedio de ocurrencia de los eventos en un intervalo de tiempo o espacio dado.
  • \(x\) es el número de eventos que estamos interesados en contar.
  1. Media

\[\mu=E(X)=\lambda\] 3. Varianza

\[\sigma^2 = Var(X)=\lambda\]

Definición: La distribución geométrica modela el número de ensayos independientes necesarios para obtener el primer éxito en una secuencia de ensayos de Bernoulli, donde cada ensayo tiene dos posibles resultados: éxito o fracaso. La distribución geométrica se caracteriza por un parámetro \(p\), que representa la probabilidad de éxito en cada ensayo.

Representación

\[X\sim Geo(p)\] En esta notación: \(X ~ Geo(p)\) nos indica que \(X\) es una variable aleatoria que sigue la distribución geométrica con el parámetro \(p\).

Fórmulas:

  1. Distribución de Probabilidad:

    Fórmula 1

    \[P(X = x) = p(1 - p)^{x}\] Donde: la variable aleatoria \(X\) es el número de fracasos “ensayos” antes de ver el primer éxito.

    En la fórmula:

    P(X = x) es la probabilidad de que ocurran exactamente k ensayos antes del primer éxito. p es la probabilidad de éxito en cada ensayo (0 < p ≤ 1). k es el número de ensayos necesarios para obtener el primer éxito (k = 1, 2, 3, …).

    Fórmula 2

    \[P(X = x) = p(1 - p)^{x-1}\] La variable aleatoria \(X\) indica la prueba o ensayo en la que se produce el primer éxito.

    En la fórmula:

    \(P(X = x)\) es la probabilidad de que ocurran exactamente \(k\) ensayos con fracasos antes del primer éxito. \(p\) es la probabilidad de éxito en cada ensayo \((0 ≤ p ≤ 1)\). \(k\) es el número de ensayos necesarios para obtener el primer éxito \((k = 1, 2, 3, ...)\).

    1. Media

    \[\mu=E(X)=\frac{1-p}{p}\]

    1. Varianza

    \[\sigma^2 = Var(X)=\frac{1-p}{p^2}\]

Definición: La distribucion binomial negativa modela la probabilidad de obtener un numero especifico de fracasos antes de obtener un numero predeterminado de exitos en una secuencia de ensayos de Bernoulli, donde cada ensayo tiene dos posibles resultados: exito o fracaso. Se utiliza cuando estamos interesados en contar la cantidad de fracasos hasta alcanzar un numero objetivo de exitos. La distribucion binomial negativa se caracteriza por dos parametros: el numero objetivo de exitos \(r\) y la probabilidad de exito en cada ensayo \(p\).

Representación:

\[X\sim NegBin(r, p)\] En esta notacion: \(X \sim NegBin(r, p)\), nos indica que la variable aleatoria \(X\) sigue una distribucion binomial negativa con parametros \(r\) y \(p\)

Fórmulas:

  1. Distribución de Probabilidad:

\[P(X = x) = \binom{x+r-1}{r-1} \cdot p^r \cdot (1-p)^x\] Donde:

  • \(P(X = x)\) es la probabilidad de que la variable aleatoria \(X\) tome el valor \(x\) (numero de fracasos antes de obtener \(r\) exitos).

  • \(p\) es la probabilidad de exito en cada ensayo \((0 < p < 1)\).

  • \(r\) es el numero objetivo de exitos. \(x\) es el numero de fracasos antes de alcanzar \(r\) exitos.

    2. Media:

    \[\mu = E(X) = \frac{r(1-p)}{p}\] 3. Varianza:

    \[\sigma^2 = Var(X) = \frac{r(1-p)}{p^2}\]

2 Distribuciones de Probabilidad con R

En R, las distribuciones de probabilidad son funciones que permiten modelar y calcular las probabilidades asociadas a diferentes eventos o resultados. El paquete stats2 en R proporciona una amplia variedad de distribuciones de probabilidad predefinidas, como la distribución normal, binomial, Poisson, entre otras.

Estas distribuciones de probabilidad se representan mediante funciones específicas que se encuentran en el paquete stats. Cada distribución tiene su propia función, que se utiliza para calcular la probabilidad de eventos específicos, generar muestras aleatorias y realizar otros cálculos relacionados.

Para cada distribución, R dispone de cuatro funciones: 

\(d\): función de densidad o de probabilidad.

\(p\): función de distribución.

\(q\): función para el cálculo de cuantiles.

\(r\): función para simular datos con dicha distribución.

A continuación, te mostraré cómo utilizar el paquete stats para trabajar con las diferentes distribuciones de probabilidad discretas en R:

2.1 Distribución Binomial:

Supongamos que un jugador de baloncesto tiene una tasa de éxito del \(70%\) en sus tiros libres. En un partido, el jugador intentará \(10\) tiros libres.

  1. ¿Cuál es la probabilidad de que el jugador anote exactamente \(7\) tiros libres?

  2. ¿Cuál es la probabilidad de que el jugador anote al menos \(8\) tiros libres?

  3. Calcula la media y la varianza de la distribución binomial en este caso.

  4. Utilizando la distribución binomial, simula 100 intentos de tiros libres para un jugador de baloncesto con una tasa de éxito del 70%. Luego, crea una tabla que muestre el número de éxitos obtenidos en cada intento y la frecuencia correspondiente. Además, genera un gráfico de barras para visualizar la distribución de los datos simulados.

En este caso para resolver este ejemplo utilizaremos la función dbinom() de R para calcular las probabilidades y las fórmulas correspondientes para la media y la varianza.

¿Cuál es la probabilidad de que el jugador anote exactamente \(7\) tiros libres?

Code
n <- 10  # Número total de tiros libres
p <- 0.7  # Probabilidad de éxito en cada tiro libre

#Probabilidad de anotar exactamente 7 tiros libres

probabilidad_7 <- dbinom(7, n, p)
probabilidad_7
[1] 0.2668279

R/ La probabilidad de anotar exactamente \(7\) tiros libres es de \(0.2668279\) o mejor dicho del \(26.68%\) porciento.

¿Cuál es la probabilidad de que el jugador anote al menos \(8\) tiros libres?

Code
n <- 10  # Número total de tiros libres
p <- 0.7  # Probabilidad de éxito en cada tiro libre


# Probabilidad de anotar al menos 8 tiros libres
prob_de_almenos8 <- sum(dbinom(8:n, n, p))
prob_de_almenos8
[1] 0.3827828

R/ la probabilidad de que el jugador anote al menos \(8\) tiros libres es de \(0.3827828\) o mejor dicho del \(38.28%\) porciento.

Calcula la media y la varianza de la distribución binomial en este caso.

Media:

Code
n <- 10  # Número total de tiros libres
p <- 0.7  # Probabilidad de éxito en cada tiro libre




# Cálculo de la varianza
Media <- n * p
Media
[1] 7

R/ Para este caso la media es de \(7\)

Varianza:

Code
n <- 10  # Número total de tiros libres

p <- 0.7  # Probabilidad de éxito en cada tiro libre




# Cálculo de la varianza

varianza <- n * p * (1 - p)

varianza
[1] 2.1

R/ La varianza para este caso es de \(2.1\)

Utilizando la distribución binomial, simula \(100\) intentos de tiros libres para un jugador de baloncesto con una tasa de éxito del 70%. Luego, crea una tabla que muestre el número de éxitos obtenidos en cada intento y la frecuencia correspondiente. Además, genera un gráfico de bastones para visualizar la distribución de los datos simulados.

Code
# Parámetros de la distribución binomial
n <- 10
p <- 0.7

# Simulación de datos
datos <- rbinom(100, n, p)

# Cálculo de la distribución de probabilidad
x <- 0:n
prob <- dbinom(x, n, p)

# Creación de la tabla de frecuencias
frecuencias <- table(datos)


# Visualización de la tabla de frecuencias
print(frecuencias)
datos
 4  5  6  7  8  9 10 
 2 13 19 27 29  9  1 
Code
# Gráfico de la función de probabilidad
plot(x, prob, type = "h", lwd = 2, xlab = "Número de éxitos", ylab = "P(X=x)",
     main = "Función de Probabilidad B(10, 0.7)", col = "#8EE5EE")

Code
# Gráfico de la función de distribución acumulada
cum_prob <- pbinom(x, n, p)
plot(x, cum_prob, type = "h", lwd = 2, xlab = "Número de éxitos", ylab = "P(X ≤ x)",
     main = "Función de Distribución Binomial Acumulada", col = "#8EE5EE")

2.2 Distribución Hipergeométrica:

Supongamos que un lote de \(100\) productos contiene \(20\) productos defectuosos y \(80\) productos no defectuosos. Un inspector seleccionará al azar \(10\) productos del lote.

  1. ¿Cuál es la probabilidad de que exactamente \(3\) productos sean defectuosos?

  2. ¿Cuál es la probabilidad de que al menos \(4\) productos sean defectuosos?

  3. Calcula la media y la varianza de la distribución hipergeométrica en este caso.

  4. Utilizando la distribución hipergeométrica, simula \(100\) intentos de selección de \(10\) productos para el inspector. Luego, crea una tabla que muestre el número de productos defectuosos obtenidos en cada intento y la frecuencia correspondiente. Además, genera un gráfico de bastones para visualizar la distribución de los datos simulados.

Recuerda que para la distribución hipergeométrica se utilizan los parámetros N (tamaño de la población), K (número de elementos exitosos en la población) y n (tamaño de la muestra).

Solución:

¿Cuál es la probabilidad de que exactamente \(3\) productos sean defectuosos?

Code
# Parámetros de la distribución hipergeométrica
N <- 100
K <- 20
n <- 10

prob_exactamente_3 <- dhyper(3, K, N-K, n)
prob_exactamente_3
[1] 0.2092081

R/ la probabilidad de que exactamente \(3\) productos sean defectuosos es del \(20.92\) porciento.

¿Cuál es la probabilidad de que al menos \(4\) productos sean defectuosos?

Code
# Parámetros de la distribución hipergeométrica
N <- 100
K <- 20
n <- 10
# Calcular la probabilidad de obtener al menos 4 productos defectuosos utilizando la función phyper()
prob_al_menos_4 <- 1 - phyper(3, K, N-K, n)
prob_al_menos_4
[1] 0.1095719

R/ la probabilidad de que al menos \(4\) productos sean defectuosos es del \(10.96\) porciento.

Calcula la media y la varianza de la distribución hipergeométrica en este caso.

Code
# Parámetros de la distribución hipergeométrica
N <- 100
K <- 20
n <- 10
media <- n * (K / N)
media
[1] 2

La media para este ejercicio es de \(2\)

Varianza:

Code
# Parámetros de la distribución hipergeométrica
N <- 100
K <- 20
n <- 10
varianza <- n * (K / N) * ((N-K) / N) * ((N-n) / (N-1))
varianza
[1] 1.454545

La varianza para este ejercicio es de \(1.45\)

Utilizando la distribución hipergeométrica, simula \(100\) intentos de selección de \(10\) productos para el inspector. Luego, crea una tabla que muestre el número de productos defectuosos obtenidos en cada intento y la frecuencia correspondiente. Además, genera un gráfico de bastones para visualizar la distribución de los datos simulados.

Code
# Simulación de datos
simulacion <- rhyper(100, K, N-K, n)
frecuencias <- table(simulacion)

# Cálculo de la distribución de probabilidad
x <- 0:n
prob <- dhyper(x, K, N-K, n)

# Cálculo de la función de distribución acumulada
cum_prob <- phyper(x, K, N-K, n)

# Gráfico de la función de probabilidad
plot(x, prob, type = "h", lwd = 2, xlab = "Número de éxitos", ylab = "P(X=x)",
     main = "Función de Probabilidad Hipergeométrica", col = "#8EE5EE")

Code
# Gráfico de la función de distribución acumulada
plot(x, cum_prob, type = "h", lwd = 2, xlab = "Número de éxitos", ylab = "P(X ≤ x)",
     main = "Función de Distribución Hipergeométrica Acumulada", col = "#8EE5EE")

2.3 Distribución de Poisson:

Supongamos que en promedio se producen \(5\) accidentes automovilísticos por día en una ciudad. Queremos calcular la probabilidad de que exactamente \(3\) accidentes ocurran en un día determinado.

¿Cuál es la probabilidad de que exactamente \(3\) accidentes ocurran en un día?

¿Cuál es la probabilidad de que al menos \(4\) accidentes ocurran en un día?

Calcula la media y la varianza de la distribución de Poisson en este caso.

Utilizando la distribución de Poisson, simula \(100\) días y registra la cantidad de accidentes ocurridos en cada día. Luego, crea una tabla que muestre el número de días con cada cantidad de accidentes y la frecuencia correspondiente. Además, genera un gráfico de bastones para visualizar la distribución de los datos simulados.

Solución:

Code
# Parámetro de la distribución de Poisson
lambda <- 5
# Cálculo de la probabilidad de que exactamente 3 accidentes ocurran en un día
prob_3_accidentes <- dpois(3, lambda)
prob_3_accidentes
[1] 0.1403739
Code
# Cálculo de la probabilidad de que al menos 4 accidentes ocurran en un día
prob_al_menos_4_accidentes <- 1 - ppois(3, lambda)
prob_al_menos_4_accidentes
[1] 0.7349741

Media:

Code
media <- lambda
media
[1] 5

Varianza:

Code
varianza <- lambda
varianza
[1] 5
Code
# Simulación de 100 días y registro de la cantidad de accidentes ocurridos en cada día
dias <- rpois(100, lambda)
frecuencias <- table(dias)

# Visualización de la tabla de frecuencias
print(frecuencias)
dias
 0  1  2  3  4  5  6  7  8  9 10 11 
 2  3 11  9 19 20 12  8 11  2  1  2 
Code
# Creación del gráfico de bastones
plot(frecuencias, xlab = "Número de accidentes", ylab = "Frecuencia",
        main = "Distribución de Accidentes Automovilísticos",
        col = "steelblue")

Code
# Cálculo de las frecuencias acumuladas
frecuencias_acumuladas <- cumsum(frecuencias)

# Creación del gráfico de la función de distribución acumulada
plot(frecuencias_acumuladas, xlab = "Número de accidentes", ylab = "Frecuencia acumulada",
     main = "Función de Distribución Acumulada de Accidentes Automovilísticos",
     col = "steelblue")

2.4 Distribución Geométrica:

Supongamos que un jugador de baloncesto tiene una tasa de éxito del \(20\)% en sus tiros libres. Queremos calcular la probabilidad de que el jugador necesite exactamente \(5\) intentos para anotar su primer tiro libre.

¿Cuál es la probabilidad de que el jugador necesite exactamente \(5\) intentos para anotar su primer tiro libre?

¿Cuál es la probabilidad de que el jugador necesite al menos \(6\) intentos para anotar su primer tiro libre?

Calcula la media y la varianza de la distribución geométrica en este caso.

Utilizando la distribución geométrica, simula \(100\) intentos de tiros libres para el jugador. Luego, crea una tabla que muestre el número de intentos necesarios para anotar el primer tiro libre y la frecuencia correspondiente. Además, genera un gráfico de barras para visualizar la distribución de los datos simulados.

¿Cuál es la probabilidad de que el jugador necesite exactamente \(5\) intentos para anotar su primer tiro libre?

Code
# Parámetro de éxito en la distribución geométrica
p <- 0.2

# Cálculo de la probabilidad de necesitar exactamente 5 intentos
prob_5_intentos <- dgeom(5, p)
prob_5_intentos
[1] 0.065536

R/ la probabilidad de que el jugador necesite exactamente \(5\) intentos para anotar su primer tiro libre es del \(6.55\)%.

¿Cuál es la probabilidad de que el jugador necesite al menos \(6\) intentos para anotar su primer tiro libre?

Code
# Parámetro de éxito en la distribución geométrica
p <- 0.20
# Cálculo de la probabilidad de necesitar al menos 6 intentos
prob_al_menos_6_intentos <- pgeom(5, p, lower.tail = FALSE)
prob_al_menos_6_intentos
[1] 0.262144

R/ es la probabilidad de que el jugador necesite al menos \(6\) intentos para anotar su primer tiro libre es del \(26.21\)%.

Calcula la media y la varianza de la distribución geométrica en este caso.

Media:

Code
p=0.2
media <- 1 / p
media
[1] 5

R/ La media para este ejercicio es de \(5\)

Varianza:

Code
p=0.2
varianza <- (1 - p) / (p^2)
varianza
[1] 20

R/ La varianza para este ejercicio es de \(20\)

Utilizando la distribución geométrica, simula \(100\) intentos de tiros libres para el jugador. Luego, crea una tabla que muestre el número de intentos necesarios para anotar el primer tiro libre y la frecuencia correspondiente. Además, genera un gráfico de bastones para visualizar la distribución de los datos simulados.

Code
# Creación de la tabla de frecuencias
frecuencias <- table(datos)

# Creación del gráfico de bastones
plot(frecuencias, xlab = "Número de intentos", ylab = "Frecuencia",
        main = "Distribución de Intentos de Tiros Libres",
        col = "steelblue")

Code
# Cálculo de la función de distribución acumulada
prob_acumulada <- cumsum(frecuencias) / sum(frecuencias)

# Creación del gráfico de barras para la función de distribución acumulada
plot(prob_acumulada, type = "b", xlab = "Número de intentos", ylab = "P(X ≤ x)",
     main = "Función de Distribución de Intentos de Tiros Libres",
     col = "steelblue")

2.5 Distribución Binomial Negativa:

Supongamos que un call center tiene una tasa de éxito del \(60\)% al realizar ventas telefónicas. El supervisor desea determinar cuántas llamadas se necesitarán realizar hasta lograr \(10\) ventas exitosas.

¿Cuál es la probabilidad de que se necesiten exactamente \(15\) llamadas para lograr las \(10\) ventas exitosas?

¿Cuál es la probabilidad de que se necesiten al menos \(20\) llamadas para lograr las \(10\) ventas exitosas?

Calcula la media y la varianza de la distribución binomial negativa en este caso.

Utilizando la distribución binomial negativa, simula \(100\) intentos de llamadas telefónicas hasta lograr \(10\) ventas exitosas. Luego, crea una tabla que muestre el número de llamadas necesarias en cada intento y la frecuencia correspondiente. Además, genera un gráfico para visualizar la distribución de los datos simulados.

¿Cuál es la probabilidad de que se necesiten exactamente \(15\) llamadas para lograr las \(10\) ventas exitosas?

Code
# Parámetros de la distribución binomial negativa
p <- 0.6
k <- 10
# Probabilidad de necesitar exactamente 15 llamadas
prob_15_llamadas <- dnbinom(15, k, p)
prob_15_llamadas
[1] 0.008488978

R/ La probabilidad de que se necesiten exactamente \(15\) llamadas para lograr las \(10\) ventas exitosas es del \(0.0084\)%.

¿Cuál es la probabilidad de que se necesiten al menos \(20\) llamadas para lograr las \(10\) ventas exitosas?

Code
# Parámetros de la distribución binomial negativa
p <- 0.6
k <- 10
# Probabilidad de necesitar al menos 20 llamadas
prob_al_menos_20_llamadas <- 1 - pnbinom(19, k, p)
prob_al_menos_20_llamadas 
[1] 0.001522222

R/ la probabilidad de que se necesiten al menos \(20\) llamadas para lograr las \(10\) ventas exitosas es del \(0.1522\)%.

Calcula la media y la varianza de la distribución binomial negativa en este caso.

Media:

Code
media <- k * (1 - p) / p
media
[1] 6.666667

R/ La media para este ejercicio es de \(6.67\)

Varianza:

Code
varianza <- k * (1 - p) / (p^2)
varianza
[1] 11.11111

R/ La varianza para este ejercicio es de \(11.11\)

Utilizando la distribución binomial negativa, simula \(100\) intentos de llamadas telefónicas hasta lograr \(10\) ventas exitosas. Luego, crea una tabla que muestre el número de llamadas necesarias en cada intento y la frecuencia correspondiente. Además, genera un gráfico para visualizar la distribución de los datos simulados.

bar

Code
# Simulación de 100 intentos de llamadas hasta lograr 10 ventas exitosas
llamadas_necesarias <- rnbinom(100, k, p)

# Creación de la tabla de frecuencias
frecuencias <- table(llamadas_necesarias)

# Gráfico de barras para visualizar la distribución de los datos simulados
plot(frecuencias, xlab = "Número de llamadas necesarias", ylab = "Frecuencia",
        main = "Distribución de Llamadas Necesarias para 10 Ventas Exitosas",
        col = "steelblue")

Code
# Cálculo de la función de distribución acumulada
prob_acumulada <- pnbinom(0:max(llamadas_necesarias), k, p)

# Gráfico para visualizar la función de distribución de probabilidad acumulada
plot(prob_acumulada, xlab = "Número de llamadas necesarias", ylab = "P(X ≤ x)",
        main = "Función de Distribución de Llamadas Necesarias para 10 Ventas Exitosas",
        col = "steelblue")

Esperamos que este trabajo pueda ser de tu ayuda y puedas entender y aplicar de manera correcta las distribuciones de probabilidad discretas. cómo extra queremos darte algunos links en los cuales puedes aprender un poco más sobre el tema:

  1. Distribuciones de Probabilidad Discretas

  2. canal de youtube dedicado al analisis de datos con R

  3. R pub Sobre las Distribuciones de Probabilidad Discretas.

Te agradecemos tu atención.

[Wickham et al. (2023); Wickham (2016); Zhu (2021); Xie (2023); Bache and Wickham (2022); Xie, Allaire, and Horner (2023); ]

References

Bache, Stefan Milton, and Hadley Wickham. 2022. “Magrittr: A Forward-Pipe Operator for r.” https://CRAN.R-project.org/package=magrittr.
Wickham, Hadley. 2016. “Ggplot2: Elegant Graphics for Data Analysis.” https://ggplot2.tidyverse.org.
Wickham, Hadley, Romain François, Lionel Henry, Kirill Müller, and Davis Vaughan. 2023. “Dplyr: A Grammar of Data Manipulation.” https://CRAN.R-project.org/package=dplyr.
Xie, Yihui. 2023. “Knitr: A General-Purpose Package for Dynamic Report Generation in r.” https://yihui.org/knitr/.
Xie, Yihui, JJ Allaire, and Jeffrey Horner. 2023. “Markdown: Render Markdown with ’Commonmark’.” https://CRAN.R-project.org/package=markdown.
Zhu, Hao. 2021. “kableExtra: Construct Complex Table with ’Kable’ and Pipe Syntax.” https://CRAN.R-project.org/package=kableExtra.

Footnotes

  1. Las distribuciones de probabilidad discretas son aquellas que se aplican a variables aleatorias discretas, es decir, variables que solo pueden tomar un conjunto numerable o finito de valores distintos.↩︎

  2. El paquete “stats” en R es uno de los paquetes básicos y principales que se instala por defecto al instalar R. Proporciona una amplia gama de funciones estadísticas para realizar análisis de datos y modelado estadístico.

    El paquete “stats” contiene implementaciones de diversas distribuciones de probabilidad, pruebas estadísticas, técnicas de ajuste de modelos, métodos de regresión, técnicas de estimación, entre otras funciones estadísticas.

    Algunas de las funciones más comunes incluidas en el paquete “stats” son:

    - Funciones de distribución de probabilidad (como dbinom, dnorm, dpois, etc.).

    - Funciones para cálculos estadísticos descriptivos (como mean, median, sd, etc.).

    - Funciones para realizar pruebas estadísticas (como t.test, chi-square test, etc.).

    - Funciones para ajuste de modelos (como lm para ajuste de regresión lineal).

    - Funciones para realizar inferencia estadística (como confint para intervalos de confianza).

    - Funciones para realizar análisis de supervivencia (como survfit para estimar curvas de supervivencia).

    El paquete “stats” es ampliamente utilizado en el análisis estadístico y proporciona una base sólida para realizar diversas operaciones y análisis estadísticos en R.↩︎