Los casos son identificados de la literatura relacionada con variables aleatorias discretas. Se deben elaborar tres ejercicios en este caso 15 encontrados en la literatura, se pueden apoyar de los mismos ejercicios del caso 14.
Cargar las librerias
library(ggplot2)
library(stringr)
library(stringi)
library(gtools)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(knitr)
options(scipen = 999)
Ejercicio 1
Calcular la función de probabilidad de los resultados al lanzar un dado una sola vez siendo x la variable aleatoria.
discretas=1:6
probabilidades=c(1/6, 1/6, 1/6, 1/6, 1/6, 1/6)
acumulada=cumsum(probabilidades)
tabla=data.frame(x=discretas,
f.prob.x = probabilidades,
F.acum.x = acumulada)
tabla
## x f.prob.x F.acum.x
## 1 1 0.1666667 0.1666667
## 2 2 0.1666667 0.3333333
## 3 3 0.1666667 0.5000000
## 4 4 0.1666667 0.6666667
## 5 5 0.1666667 0.8333333
## 6 6 0.1666667 1.0000000
VE es el valor esperado
VE=sum(tabla$x * tabla$f.prob.x)
VE
## [1] 3.5
Varianza
tabla=cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
| 1 |
0.1666667 |
0.1666667 |
3.5 |
1.0416667 |
| 2 |
0.1666667 |
0.3333333 |
3.5 |
0.3750000 |
| 3 |
0.1666667 |
0.5000000 |
3.5 |
0.0416667 |
| 4 |
0.1666667 |
0.6666667 |
3.5 |
0.0416667 |
| 5 |
0.1666667 |
0.8333333 |
3.5 |
0.3750000 |
| 6 |
0.1666667 |
1.0000000 |
3.5 |
1.0416667 |
var= Varianza de la distribucion
varianza=sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 2.916667
desv.std=sqrt(varianza)
desv.std
## [1] 1.707825
ggplot(data=tabla,aes(x=x, y=f.prob.x)) +
geom_bar(stat="identity")

ggplot(data = tabla,aes(x=x, y=F.acum.x))+
geom_point()+
geom_line()

Ejercicio 2
Una variable aelatoria toma los valores de 15,6,19,28,31 cada uno con la probabilidad de 30%,25%,10%,15% y 20%. calcular los valores de las variables aleatorias y sus probabilidades
discretas=1:5
casos=c(15,6,19,28,31)
probabilidades=c(0.30,0.25,0.10,0.15,0.20)
n=sum(casos)
probabilidades=casos/n
acumulada=cumsum(probabilidades)
tabla=data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada)
tabla
## x casos f.prob.x F.acum.x
## 1 1 15 0.15151515 0.1515152
## 2 2 6 0.06060606 0.2121212
## 3 3 19 0.19191919 0.4040404
## 4 4 28 0.28282828 0.6868687
## 5 5 31 0.31313131 1.0000000
Valor esperado=VE
VE=sum(tabla$x * tabla$f.prob.x)
VE
## [1] 3.545455
tabla=cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
| 1 |
15 |
0.1515152 |
0.1515152 |
3.545454 |
0.9817180 |
| 2 |
6 |
0.0606061 |
0.2121212 |
3.545454 |
0.1447533 |
| 3 |
19 |
0.1919192 |
0.4040404 |
3.545454 |
0.0570999 |
| 4 |
28 |
0.2828283 |
0.6868687 |
3.545454 |
0.0584356 |
| 5 |
31 |
0.3131313 |
1.0000000 |
3.545454 |
0.6624927 |
varianza=sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 1.9045
desv.std=sqrt(varianza)
desv.std
## [1] 1.380036
ggplot(data=tabla,aes(x=x, y=f.prob.x)) +
geom_bar(stat="identity")

ggplot(data = tabla,aes(x=x, y=F.acum.x))+
geom_point()+
geom_line()

Ejercicio 3
Una variable aelatoria toma los valores de 50,25,60,48 cada uno con la probabilidad de 30%,20%,32% y 18% . calcular los valores de las variables aleatorias y sus probabilidades
discretas=1:4
casos=c(50,25,60,48)
probabilidades=c(0.30,0.20,0.32,0.18)
n=sum(casos)
probabilidades=casos/n
acumulada=cumsum(probabilidades)
tabla=data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada)
tabla
## x casos f.prob.x F.acum.x
## 1 1 50 0.2732240 0.2732240
## 2 2 25 0.1366120 0.4098361
## 3 3 60 0.3278689 0.7377049
## 4 4 48 0.2622951 1.0000000
VE=sum(tabla$x * tabla$f.prob.x)
VE
## [1] 2.579235
tabla=cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)
kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
| 1 |
50 |
0.2732240 |
0.2732240 |
2.579235 |
0.6814161 |
| 2 |
25 |
0.1366120 |
0.4098361 |
2.579235 |
0.0458351 |
| 3 |
60 |
0.3278689 |
0.7377049 |
2.579235 |
0.0580470 |
| 4 |
48 |
0.2622951 |
1.0000000 |
2.579235 |
0.5294618 |
varianza=sum((tabla$x - VE)^2 * tabla$f.prob.x)
varianza
## [1] 1.31476
desv.std=sqrt(varianza)
desv.std
## [1] 1.14663
ggplot(data=tabla,aes(x=x, y=f.prob.x)) +
geom_bar(stat="identity")

ggplot(data = tabla,aes(x=x, y=F.acum.x))+
geom_point()+
geom_line()

Interpretacion
¿Cuál es la variable aleatoria y su significado en el contexto?: La variable aleatoria en cada caso es x y su significado es de dar los datos aleatorios a los problemas
¿Qué valores puede tomar la variable aleatoria?: Puede tomar cualquier valor depernde de que contexto tenga el problema
¿Cuál es el espacio muestral?, todos los elementos: El espacio muestral son las tablas y graficas de los ejercicios
¿Cuántos elementos hay en espacio muestral (S): Ej.1:Hay uno solo el cual es el unico tiro del dado Ej.2:Hay un total de 5 Ej.3:Hay un total de 4
¿Cuántos casos hay de cada valor de cada variable aleatoria?: Ej.1: Hay un solo caso Ej.2:Hay 5 casos Ej.3:Hay 4 casos
¿Cuáles son las probabilidades más altas de cada variable aleatoria?: Ej.1:0.16 Ej.2:0.28 Ej.3:0.32
¿Qué significado tiene el gráfico de barra?: Es el conjunto de datos de la frecuencia de la probabilidad aleatoria
¿Qué significado tiene el gráfico lineal acumulado?: Es la reprecentacion visual del los datos de la frecuencia acumulada de x
¿Cuál es el valor de de la media de la distribución y qué significa?:Es el valor que tendrían los datos, si todos ellos fueran iguales. O, también, el valor que correspondería a cada uno de los datos de la distribución si su suma total se repartiera por igual. Ej.1:3.5 Ej.2:2.91 Ej.3:1.70
¿Cuál es el valor de la varianza de la distribución y qué significa?: La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media Ej.1:3.54 Ej.2:1.90 Ej.3:1.38
¿Cuál es el valor de desviación de la distribución y qué significa?: La desviación estándar es un índice numérico de la dispersión de un conjunto de datos (o población). Mientras mayor es la desviación estándar, mayor es la dispersión de la población. La desviación estándar es un promedio de las desviaciones individuales de cada observación con respecto a la media de una distribución. Ej.1:2.57 Ej.2:1.31 Ej.3:1.14