Objetivo Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas y visualización gráficas relacionados con variables discretas.

Descripción Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación. Los casos son identificados de la literatura relacionada con variables aleatorias discretas. Se deben elaborar tres ejercicios en este caso 14 encontrados en la literatura.

1. Cargar librerías

library(ggplot2)
library(stringr)  
## Warning: package 'stringr' was built under R version 4.0.3
library(stringi)  
## Warning: package 'stringi' was built under R version 4.0.3
library(gtools)
## Warning: package 'gtools' was built under R version 4.0.3
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(knitr)

2. Identificar ejercicios de la literatura

Para cada ejercicio realizar lo siguiente:

2.1. Ejercicio 1

Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere tres billetes. (Hero, n.d.)

Tabla de probabilidad

discretas <- c(0,1)   # 0 Que no gane, 1 que gane
n <- 5000
casos <- c(4997,3)
probabilidades <- casos / n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
                    
tabla
##   x casos f.prob.x F.acum.x
## 1 0  4997   0.9994   0.9994
## 2 1     3   0.0006   1.0000

Grafica de Barras

ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
    geom_point() + 
  geom_line()

2.2. Ejercicio 2

Las ventas de automóviles de una empresa

Durante los últimos 300 días de operación, los datos de ventas muestran que hubo

Tabla de probabilidad o Contingencia

discretas <- 0:5   # c(0,1,2,3,4,5)
n <- 300

casos <- c(54, 117, 72, 42, 12, 3)
probabilidades <- casos /n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla
##   x casos f.prob.x F.acum.x
## 1 0    54     0.18     0.18
## 2 1   117     0.39     0.57
## 3 2    72     0.24     0.81
## 4 3    42     0.14     0.95
## 5 4    12     0.04     0.99
## 6 5     3     0.01     1.00

Grafica de Barras

ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  #geom_bar(stat="identity")
  geom_bar(stat="identity")

Grafica Lineal acumulada

ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
  geom_point() + 
  geom_line() 

2.3. Ejercicio 3

En Estados Unidos un porcentaje de los niños de cuarto grado no pueden leer un libro adecuado a su edad. La tabla siguiente muestra, de acuerdo con las edades de entre 6 y 14 años, el número de niños que tienen problemas de lectura. La mayoría de estos niños tienen problemas de lectura que debieron ser detectados y corregidos antes del tercer grado.(Anderson et al., 2008)

discretas <- 6:14
#n <- '?'

casos <- c(37369, 87436, 160840,239719,286719,306533,310787,302604,289168)

n <- sum(casos)
probabilidades <- casos /n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla
##    x  casos   f.prob.x   F.acum.x
## 1  6  37369 0.01848875 0.01848875
## 2  7  87436 0.04325998 0.06174874
## 3  8 160840 0.07957747 0.14132621
## 4  9 239719 0.11860378 0.25992999
## 5 10 286719 0.14185758 0.40178757
## 6 11 306533 0.15166079 0.55344837
## 7 12 310787 0.15376551 0.70721387
## 8 13 302604 0.14971687 0.85693075
## 9 14 289168 0.14306925 1.00000000

Grafica de Barras

ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica Lineal Acumulada

ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
  geom_point() + 
  geom_line()

Interpretación de los tres ejercicios identificando al menos los siguientes puntos: 180 a 200 palabras.

3.1. ¿Cuál es la variable aleatoria y su significado en el contexto? 3.2. ¿Qué valores puede tomar la variable aleatoria? 3.3. ¿Cuál es el espacio muestral?, todos los elementos 3.4. ¿Cuántos elementos hay en espacio muestral (S)? 3.5. ¿Cuántos casos hay de cada valor de cada variable aleatoria? 3.6. ¿Cuáles son las probabilidades más altas de cada variable aleatoria? 3.7. Resolver lo que se solicita encontrando al menos dos probabilidades de variables aleatorias. 3.7.1. Que sea exactamente igual a un valor de variable aleatoria 3.7.2. Qué sea menor o igual 3.7.3. Que sea mayor o igual 3.7.4. Alguna otra pregunta del caso. 3.8. ¿Qué significado tiene el gráfico de barra? 3.9. ¿Qué significado tiene el gráfico lineal acumulado?

**En el Caso número 14 se explicarán lo que es las variables aleatorias discretas, es un campo de variación que esta constituido por un conjunto finito o infinito numerable de valores posibles. Hablaremos de 3 ejercicios que se explican a continuación

En el ejercicio 1: trata sobre 5000 billetes para una rifa el cual valen 1 euro, en donde hay un único premio de cierta cantidad claramente, exactamente cuando un comprador adquiere 3 billetes y pues la probabilidad de que dicha persona pierda la rifa es del 99.94% ya que se dividen los boletos restantes que son 4997/5000 que en el denominador son el total de los boletos. Y la probabilidad de que gane es del 0.06% es ovio que las probabilidades de ganar son muy nulas

A continuación, unas preguntas:

¿Cuál es la variable aleatoria y su significado en el contexto? Es la que tiene como nombre casos ya que contiene los valores posibles que son el 4997 y el 3.

¿Qué valores puede tomar la variable aleatoria? A lo que se son los números reales. En este ejercicio son 49997 y 3.

¿Cuál es el espacio muestral?, todos los elementos. En este ejercicio es la n que contiene los 5000 billetes.

¿Cuántos elementos hay en espacio muestral (S)? son 2 elementos.

¿Cuántos casos hay de cada valor de cada variable aleatoria? Hay 2 casos.

¿Cuáles son las probabilidades más altas de cada variable aleatoria? Caso 1 son: 99.94%, y en el Caso 2 es: 0.06%.

¿Qué significado tiene el gráfico de barra? Es la forma de representar las probabilidades de ambos casos.

¿Qué significado tiene el gráfico lineal acumulado? Es lo mismo que el grafico de barras, pero este es representado en líneas y con puntos.

Ejercicio 2: en este ejercicio se trata sobre las ventas de automóviles de una empresa en los últimos 300 días de operación en el que en 54 días no se vendió ningún automóvil, en 117 días se vendió 1 automóvil, en 72 días se vendieron 2 automóviles, en 42 días se vendieron 3 automóviles, en 12 días se vendieron 4 automóviles y en 3 días fueron 5 automóviles, se desea saber ¿La probabilidad de que se venda exactamente un automóvil? Que fue de: 39% y la otra pregunta es ¿la probabilidad de que se venda al menos 2 automóviles? Y es del 24%.

¿Cuál es la variable aleatoria y su significado en el contexto? Es la que tiene como nombre casos y contiene los valores posibles que son el 54,117,72,42,12,3.

¿Qué valores puede tomar la variable aleatoria? En este ejercicio son 54,117,72,42,12,3.

¿Cuál es el espacio muestral?, todos los elementos. n que contiene los 300.

¿Cuántos elementos hay en espacio muestral (S)? son 6 elementos.

¿Cuántos casos hay de cada valor de cada variable aleatoria? Hay 6.

¿Cuáles son las probabilidades más altas de cada variable aleatoria? Caso 1 son: 18%, en el Caso 2 es: 39%, en el caso 3 es: 24%, en el 4 es: 14%, en el 5 es: .04% y en el caso 6 es del .01%.

Ejercicio 3: en el ejercicio 3 habla sobre los niños que no pueden leer libros de cuarto grado de acuerdo con las edades entre 6 y 14 años, ¿Cuál es la probabilidad de elegir alumnos que tienen problemas de exactamente 10 años? Y es el 14.18% y la que esta por de 11 años o menos es del 55.34%.

¿Cuál es la variable aleatoria y su significado en el contexto? Es la que tiene como nombre casos y contiene los valores posibles que son 37369,87436,160840,239719,306533,310787,302604,289168.

¿Qué valores puede tomar la variable aleatoria? En este ejercicio son 37369,87436,160840,239719,306533,310787,302604,289168.

¿Cuál es el espacio muestral?, todos los elementos. n que contiene los 2021175.

¿Cuántos elementos hay en espacio muestral (S)? son 9 elementos.

¿Cuántos casos hay de cada valor de cada variable aleatoria? Hay 9 casos.

¿Cuáles son las probabilidades más altas de cada variable aleatoria? Caso 1 son: .018%, en el Caso 2 es: .043%, en el caso 3 es: .079%, en el 4 es: 11%, en el 5 es: 14% y en el caso 6 es del 15%, en el 7 es del: 15%, en el 8 es del 14% y en el 9 es del 14%. **