Caso 14 Variables aleatorias discretas

Objetivo

Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas y visualización gráficas relacionados con variables discretas.

Descripción

Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada y su visualización gráfica para su adecuada interpretación.

Cargar librerías

library(ggplot2)
library(stringr)  # String
library(stringi)  # String
library(gtools)
library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(knitr)

Ejercicios

2.1. Ejercicio 1

discretas <- c(0,1)   # 0 Que no gane, 1 que gane
n <- 5000
casos <- c(4997,3)
probabilidades <- casos / n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla

##   x casos f.prob.x F.acum.x
## 1 0  4997   0.9994   0.9994
## 2 1     3   0.0006   1.0000

Grafica de Barra

ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
    geom_point() + 
  geom_line()

2.2. Ejercicio 2

discretas <- 0:5   # c(0,1,2,3,4,5)
n <- 300

casos <- c(54, 117, 72, 42, 12, 3)
probabilidades <- casos /n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla

##   x casos f.prob.x F.acum.x
## 1 0    54     0.18     0.18
## 2 1   117     0.39     0.57
## 3 2    72     0.24     0.81
## 4 3    42     0.14     0.95
## 5 4    12     0.04     0.99
## 6 5     3     0.01     1.00

Grafica de Barra

ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  #geom_bar(stat="identity")
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
  geom_point() + 
  geom_line()

2.3. Ejercicio 3

discretas <- 6:14
#n <- '?'

casos <- c(37369, 87436, 160840,239719,286719,306533,310787,302604,289168)

n <- sum(casos)
probabilidades <- casos /n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla

##    x  casos   f.prob.x   F.acum.x
## 1  6  37369 0.01848875 0.01848875
## 2  7  87436 0.04325998 0.06174874
## 3  8 160840 0.07957747 0.14132621
## 4  9 239719 0.11860378 0.25992999
## 5 10 286719 0.14185758 0.40178757
## 6 11 306533 0.15166079 0.55344837
## 7 12 310787 0.15376551 0.70721387
## 8 13 302604 0.14971687 0.85693075
## 9 14 289168 0.14306925 1.00000000

Grafica de barra

ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
  geom_point() + 
  geom_line()

2.4. Ejercicio 4.

discretas <- 1:5
#n <- '?'

casos <- c(5,9,3,42,41)

n <- sum(casos)
probabilidades <- casos /n

acumulada <- cumsum(probabilidades)   


tabla1 <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla1

##   x casos f.prob.x F.acum.x
## 1 1     5     0.05     0.05
## 2 2     9     0.09     0.14
## 3 3     3     0.03     0.17
## 4 4    42     0.42     0.59
## 5 5    41     0.41     1.00

paste("La probabilidad de que un ejecutivo de nivel alto dé una puntuación de 4 o 5 a su satisfacción con el trabajo es:", round(sum(tabla1$f.prob.x[4], tabla1$f.prob.x[5]) * 100, 2), "%")

## [1] "La probabilidad de que un ejecutivo de nivel alto dé una puntuación de 4 o 5 a su satisfacción con el trabajo es: 83 %"

Grafica de Barra

ggplot(data = tabla1, aes(x = x, y=f.prob.x, fill=x)) + 
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla1, aes(x = x, y=F.acum.x)) +
  geom_point(colour="blue") + 
  geom_line(colour="red")

discretas <- 1:5
#n <- '?'

casos <- c(4, 10, 12, 46, 28)

n <- sum(casos)
probabilidades <- casos /n

acumulada <- cumsum(probabilidades)   


tabla2 <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla2

##   x casos f.prob.x F.acum.x
## 1 1     4     0.04     0.04
## 2 2    10     0.10     0.14
## 3 3    12     0.12     0.26
## 4 4    46     0.46     0.72
## 5 5    28     0.28     1.00

paste(" La probabilidad de que un ejecutivo de nivel medio esté muy satisfecho es:", round(tabla2$f.prob.x[5] * 100, 2), "%")

## [1] " La probabilidad de que un ejecutivo de nivel medio esté muy satisfecho es: 28 %"

Grafica de Barra

ggplot(data = tabla2, aes(x = x, y=f.prob.x, fill=x)) + 
  geom_bar(stat="identity")

### Grafica lineal acumulada

ggplot(data = tabla2, aes(x = x, y=F.acum.x)) +
  geom_point(colour="blue") + 
  geom_line(colour="red")

2.5. Ejercicio 5.

S <- c("NNN", "NND", "NDN", "DNN", 
        "NDD", "DND", "DDN", "DDD")
S

## [1] "NNN" "NND" "NDN" "DNN" "NDD" "DND" "DDN" "DDD"

discretas <- 0:3
#n <- '?'

casos <- c(1,3,3,1)

n <- sum(casos)
probabilidades <- casos /n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla

##   x casos f.prob.x F.acum.x
## 1 0     1    0.125    0.125
## 2 1     3    0.375    0.500
## 3 2     3    0.375    0.875
## 4 3     1    0.125    1.000

x <- 1  
paste("La probabilidad de que haya 1 defecto es: ",round(tabla$f.prob.x[x+1] * 100, 2), "%")

## [1] "La probabilidad de que haya 1 defecto es:  37.5 %"

x <- 2 
paste("La probabilidad de que haya 2 defectos o mas es: ",round(sum(tabla$f.prob.x[x+1], tabla$f.prob.x[x+2]) * 100, 2), "%")

## [1] "La probabilidad de que haya 2 defectos o mas es:  50 %"

Grafica de Barra

ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  #geom_bar(stat="identity")
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
  geom_point() + 
  geom_line()

Interpretación de cada caso

3.1. ¿Cuál es la variable aleatoria y su significado en el contexto? 3.2. ¿Qué valores puede tomar la variable aleatoria? 3.3. ¿Cuál es el espacio muestral?, todos los elementos 3.4. ¿Cuántos elementos hay en espacio muestral (S)? 3.5. ¿Cuántos casos hay de cada valor de cada variable aleatoria? 3.6. ¿Cuáles son las probabilidades más altas de cada variable aleatoria? 3.7. Resolver lo que se solicita encontrando al menos dos probabilidades de variables aleatorias. 3.7.1. Que sea exactamente igual a un valor de variable aleatoria 3.7.2. Qué sea menor o igual 3.7.3. Que sea mayor o igual 3.7.4. Alguna otra pregunta del caso. 3.8. ¿Que significado tiene el gráfico de barra? 3.9. ¿Qué significado tiene el gráfico lineal acumulado?

Respuestas

3.1

El ejercicio 1 nos generó 5000 boletos para una rifa, la probabilidad 0 nos dio “4997” que no ganaron, y en la probabilidad 1 hubo “3” ganadores.”

En el ejercicio 2 la probabilidad de que se venda 1 automóvil es “0.39” y que se vendan 2 es “0.57”.

De tantas variables del ejercicio 3, los niños de 12 años son los que no pueden leer libros adecuados.

La variable del ejercicio 4 trabaja con “42” casos.

3.2

La variable aleatoria del ejercicio 1 son 5000 billetes de sorteo, y la probabilidad de ganar es del “0.0006”.

En el ejercicio 2 son 300 días de venta y la variable aleatoria de que se vendan es de “0.39”.

El ejercicio 3 nuestra variable aleatoria es de 6 a 14 y los niños no pueden leer libros adecuados de los 12 años.

La variable aleatoria del ejercicio 4 es que de la puntuación 1 era mala y 5 muy buena.

3.3

El espacio muestral del ejercicio 1 es “Si, ganar” y “No, ganar” El espacio muestral del ejercicio 2 es “300 días de venta” El espacio muestral del ejercicio 3 es “6 a 14 años” El espacio muestral del ejercicio 4 es “1 a 5 la satisfacción buena o mala”

3.4

Elementos del ejercicio 1 muestra “2” resultados Elementos del ejercicio 2 muestra “1 a 6” resultados Elementos del ejercicio 3 muestra “1 a 9” resultados Elementos del ejercicio 4 muestra “1 a 5” resultados

3.5

El ejercicio 1 “0-4997” y “1-3” El ejercicio 2 “0-54” “1-117” “2-72” “3-42” “4-12” “5-3” El ejercicio 3 “6-37369” …. “13-302604” “14-289168” El ejercicio 4 “1-5” … “5-41”

3.6

La probabilidad mas alta del ejercicio 1 es “0.9994 de No, ganar” La probabilidad mas alta del ejercicio 2 es “0.39” La probabilidad mas alta del ejercicio 3 es “0.15376551” La probabilidad mas alta del ejercicio 4 es “0.42”

3.8

Una forma de resumir un conjunto de datos, ya sea aleatorios u otros, muestra los datos usando varias barras

3.9

Se puede comprobar mediante este grafico rápidamente el cambio de tendencia de los datos

Caso 14 Variables aleatorias discretas

Alejandro Rosales Espinoza

5/11/2020

Objetivo

Descripción

Grafica de Barra

Grafica lineal acumulada

Grafica de Barra

Grafica lineal acumulada

Grafica de barra

Grafica lineal acumulada

Grafica de Barra

Grafica lineal acumulada

Grafica de Barra

Grafica de Barra

Grafica lineal acumulada

Respuestas

3.1

3.2

3.3

3.4

3.5

3.6

3.8

3.9