#Objetivo Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas, media, varianza y desviación estándar de distribuciones de variables discretas; visualización gráfica relacionada con variables discretas.

#Descripción Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación.

library(ggplot2)
library(stringr)  # String
library(stringi)  # String
library(gtools)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(knitr)

options(scipen = 999) # Notación normal

#2. Ejercicios Para cada ejercicio, se describe y define el contexo Se construye su tabla de probabilidad que contenga los valores de la variable aleatoria, la función de probabilidad y su función acumulada, la gráfica de barra de los valores de las variables aleatoria y la gráfica lineal de la función acumulada.

#2.1. Ejercicio 1

Una variable aleatoria discreta toma todos los valores enteros entre 0 y 4 con la siguiente función de densidad:

X 0 1 2 3 4 f(x) 0.3 0.25 0.25 0.1 0.1

Calcular su esperanza y varianza.

discretas <- 0:4   # c(0,1,2,3,4)
n <- 1.45

casos <- c( 0.3,  0.25,  0.25,  0.1,  0.1)
probabilidades <- casos /n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    
                    f.prob.x = probabilidades,
                    
                    F.acum.x = acumulada,
                    
                    x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")
Tabla de probabilidad con la columna para valor esperado
x casos f.prob.x F.acum.x x.f.prob.x
0 0.30 0.2068966 0.2068966 0.0000000
1 0.25 0.1724138 0.3793103 0.1724138
2 0.25 0.1724138 0.5517241 0.3448276
3 0.10 0.0689655 0.6206897 0.2068966
4 0.10 0.0689655 0.6896552 0.2758621

Valor esperado Se determina el valor esperado de acuerdo a la fórmula:

μ=∑xP(x)

*VE es el valor esperado

VE <- sum(tabla$x * tabla$f.prob.x)

VE
## [1] 1

#El valor esperado significa la media ponderada de las probabilidades o lo que es lo mismo es lo que se puede esperar.

Esto significa que la esperanza es de 1

*Varianza Agregando columna para obtención de la varianza a partir de los datos de la tabla previamente generada.

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
x casos f.prob.x F.acum.x x.f.prob.x VE x-VE.cuad.f.prob.x
0 0.30 0.2068966 0.2068966 0.0000000 1 0.2068966
1 0.25 0.1724138 0.3793103 0.1724138 1 0.0000000
2 0.25 0.1724138 0.5517241 0.3448276 1 0.1724138
3 0.10 0.0689655 0.6206897 0.2068966 1 0.2758621
4 0.10 0.0689655 0.6896552 0.2758621 1 0.6206897
              α2=∑(x−μ)2P(x)

*var = varianza de la distribución

varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 1.275862

La varianza calculada nos arroja un valor de 1.275862

Desviación estándar de una distribución discreta *La raiz cuadrada de la varianza α=α2−−√

desv.std <- sqrt(varianza)
desv.std 
## [1] 1.129541

#Referencia Rodríguez, B. (n.d.). Variables aleatorias: problemas resueltos. Retrieved from https://campusvirtual.ull.es/ocw/pluginfile.php/6033/mod_resource/content/1/tema8/PR8.2-valeatorias.pdf

#Ejercicio 2 Lanzamos un dado perfecto 240 veces, anotamos el resultado obtenido en la cara superior obteniendo los siguientes resultados:

Cara superior 1 2 3 4 5 6 Numero de veces 40 39 42 38 42 39

Construir tabla de distribucion de frecuencias relativas de los resultados obtenidos Construir la tabla de distribucion de probabilidad de los resultados esperados *Representar graficamente las dos distribuciones

*Si un dado es perfecto y la probabilidad de todas las caras es la misma y vale 1/6

discretas <- 1:6   # c(1,2,3,4,5,6)
n <- 240

casos <- c(40, 39, 42, 38, 42, 39)
probabilidades <- casos /n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    
                    f.prob.x = probabilidades,
                    
                    F.acum.x = acumulada,
                    
                    x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")
Tabla de probabilidad con la columna para valor esperado
x casos f.prob.x F.acum.x x.f.prob.x
1 40 0.1666667 0.1666667 0.1666667
2 39 0.1625000 0.3291667 0.3250000
3 42 0.1750000 0.5041667 0.5250000
4 38 0.1583333 0.6625000 0.6333333
5 42 0.1750000 0.8375000 0.8750000
6 39 0.1625000 1.0000000 0.9750000

Valor esperado Se determina el valor esperado de acuerdo a la fórmula: μ=∑xP(x)

VE <- sum(tabla$x * tabla$f.prob.x)

VE
## [1] 3.5

Significa que el valor es un poco bajo con tan solo el 3.5 en todos los casos que se lanzo el dado

*Varianza Agregando columna para obtención de la varianza a partir de los datos de la tabla previamente generada.

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
x casos f.prob.x F.acum.x x.f.prob.x VE x-VE.cuad.f.prob.x
1 40 0.1666667 0.1666667 0.1666667 3.5 1.0416667
2 39 0.1625000 0.3291667 0.3250000 3.5 0.3656250
3 42 0.1750000 0.5041667 0.5250000 3.5 0.0437500
4 38 0.1583333 0.6625000 0.6333333 3.5 0.0395833
5 42 0.1750000 0.8375000 0.8750000 3.5 0.3937500
6 39 0.1625000 1.0000000 0.9750000 3.5 1.0156250
             α2=∑(x−μ)2P(x)

*var = varianza de la distribución

varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 2.9

Desviación estándard de una distribución discreta La raiz cuadrada de la varianza α=α2−−√

desv.std <- sqrt(varianza)
desv.std
## [1] 1.702939

#Referencias Variables aleatorias discretas ejemplos. (2019). Retrieved November 7, 2020, from Vadenumeros.es website: https://www.vadenumeros.es/sociales/variable-aleatoria-discreta.html

#Ejercicio 3 Un trabajador recibira un premio de 3000, 2000 o 1000 euros, segun el tiempo que tarde en realizar un trabajo en menos de 10 horas, entre 10 y 15 horas y mas de 15 horas, respectivamente. La probabilidad de realizar el trabajo en cada uno de estos casos es de 0.1, 0.4 y 0.5. * Determine la esperanza y la funcion de probabilidad de la variable aleatoria X=premio recibido.

casos <- c(3000, 2000, 1000)
probabilidades <- c(0.1, 0.4, 0.5)
acumulada <- cumsum(probabilidades) 

p.3000 <- 0.4
p.2000 <- 0.2
p.1000 <- 0.1

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    
                    f.prob.x = probabilidades,
                    
                    F.acum.x = acumulada,
                    
                    x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")
Tabla de probabilidad con la columna para valor esperado
x casos f.prob.x F.acum.x x.f.prob.x
1 3000 0.1 0.1 0.1
2 2000 0.4 0.5 0.8
3 1000 0.5 1.0 1.5
4 3000 0.1 0.1 0.4
5 2000 0.4 0.5 2.0
6 1000 0.5 1.0 3.0

Valor esperado Se determina el valor esperado de acuerdo a la fórmula: μ=∑xP(x)

*VE es el valor esperado

VE <- sum(tabla$x * tabla$f.prob.x)

VE
## [1] 7.8

Varianza Agregando columna para obtención de la varianza a partir de los datos de la tabla previamente generada.

tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
x casos f.prob.x F.acum.x x.f.prob.x VE x-VE.cuad.f.prob.x
1 3000 0.1 0.1 0.1 7.8 4.624
2 2000 0.4 0.5 0.8 7.8 13.456
3 1000 0.5 1.0 1.5 7.8 11.520
4 3000 0.1 0.1 0.4 7.8 1.444
5 2000 0.4 0.5 2.0 7.8 3.136
6 1000 0.5 1.0 3.0 7.8 1.620
       α2=∑(x−μ)2P(x)

var = varianza de la distribución

varianza <- sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 35.8

Desviación estándard de una distribución discreta La raiz cuadrada de la varianza α=α2−−√

desv.std <- sqrt(varianza)
desv.std
## [1] 5.98331

Problemas. Variables Aleatorias. Modelos de Probabilidad. (n.d.). Retrieved from https://www.ugr.es/~mvargas/PTema3.pdf

#Interpretacion

  1. Interpretación de los tres ejercicios identificando al menos los siguientes puntos: 180 a 200 palabras. 3.1. ¿Cuál es la variable aleatoria y su significado en el contexto? 3.2. ¿Qué valores puede tomar la variable aleatoria? 3.3. ¿Cuál es el espacio muestral?, todos los elementos 3.4. ¿Cuántos elementos hay en espacio muestral (S)? 3.5. ¿Cuántos casos hay de cada valor de cada variable aleatoria? 3.6. ¿Cuáles son las probabilidades más altas de cada variable aleatoria? 3.7. Resolver lo que se solicita encontrando al menos dos probabilidades de variables aleatorias. 3.7.1. Que sea exactamente igual a un valor de variable aleatoria 3.7.2. Qué sea menor o igual 3.7.3. Que sea mayor o igual 3.7.4. Alguna otra pregunta del caso. 3.8. ¿Qué significado tiene el gráfico de barra? 3.9. ¿Qué significado tiene el gráfico lineal acumulado? 3.10. ¿Cuál es el valor de de la media de la distribución y qué significa? 3.11. ¿Cuál es el valor de la varianza de la distribución y qué significa? 3.12. ¿Cuál es el valor de desviación de la distribución y qué significa?

3.1 En el ejercicio 1 se basa en que una variable X toma solo valores enteros y nos muestra cierta densidad en cada valor entero, al sacar las graficas nos arroja unas barras todas con valor arriba de 0.15 siendo parejas en su mayoría e igual la grafica de líneas que va ascendiendo con valores de 0.25 hasta llegar a 1 y ser el numero entero. En el ejercicio 2 trata de que se lanza un dado 240 veces y el resultado que se va obteniendo se va anotando junto a la cara del dado que fue cayendo, dando así un promedio que cada cara cayo unas 30 veces, habiendo así un empate de la cara 5 con la cara 3 con 42 veces cada uno. En el ejercicio 3 nos arroja un problema sobre un trabajador que entre mas rápido acabe un trabajador mas dinero obtendrá, serian 3000, 2000 y 1000 euros esto si acababa en menos de 10 horas, 15 horas y mas de 15 horas, cada uno con la probabilidad de 0.1, 0.4 y 0.5

3.2 La variable aleatoria en el primer ejercicio seria la X ya que a partir de ahi nos arroja los numeros enteros, en el segundo ejercicio serian las 240 veces que se lanzo el dado y en el tercer ejercicio son los 3000 euros que van disminuyendo conforme se tarde en acabar.

3.3 El espacio muestral del primer ejercicio son (0.3, 0.25, 0.25, 0.1, 0.1), en el segundo ejercicio son (40, 39, 42, 38, 42, 39) y en el tercer ejercicio son (0.1, 0.4, 0.5)

3.4 Los elementos del espacio muestral en el primer caso son de 5, en el segundo caso son de 6 y en el tercero son de 3

3.5 los casos de la variable del primer ejercicio son (0,4) del segundo ejercicio son (1,6) y del tercero son de 3000, hasta 1000 de forms descendiente

3.6 Las probabilidad mas altas en cada uno de los ejercicios son: En el primer ejercicio es 0.20689655, el segundo ejercicio es 0.1750000 y en el tercer ejercicio es 0.5

3.8 Un gráfico de barras es una forma de resumir un conjunto de datos por categorías. Muestra los datos usando varias barras de la misma anchura, cada una de las cuales representa una categoría concreta. La altura de cada barra es proporcional a una agregación específica.

3.9 Utilice un gráfico de líneas acumulado si tiene una agrupación importante que representa un conjunto ordenado de datos y un valor para mostrar, acumulados con el tiempo. Por ejemplo, para ver la cantidad total de oportunidades cerradas por día en el mes actual de un informe, defina la cantidad como el eje y y el día de cierre como el eje x. El gráfico muestra una línea, con el grosor de línea que representa la cantidad acumulada de oportunidades cerradas hasta ese día incluido. No podrá ver la cantidad de un único día; sólo la cantidad acumulada.

3.10 La media aritmética o promedio representa el reparto equitativo, el equilibrio. Es el valor que tendrían los datos, si todos ellos fueran iguales.

3.11 La Varianza es una medida de dispersión que se utiliza para representar la variabilidad de un conjunto de datos respecto de la media aritmética de los mismo. Así, se calcula como la suma de los residuos elevados al cuadrado y divididos entre el total de observaciones.

3.12 La desviación estándar es un índice numérico de la dispersión de un conjunto de datos (o población). Mientras mayor es la desviación estándar, mayor es la dispersión de la población.