En el siguiente trabajo se haran analisis de estadistica, usando la distribucion normal y binomial, en la normal se hizo el uso de variables continuas,obteniendo la altura de 247 hombres, para ser mas precisos con las probabilidades ,en la distribucion binomial usamos variables discretas, hicimos el uso de la poblacion de Texas.
Impresion de datos sobre cada region de los Estados Unidos.
tabal_1 <-
tibble(State = state.name,
Region = state.region) %>%
bind_cols(as_tibble(state.x77)) %>%
bind_cols(USArrests)
head(tabal_1)
## # A tibble: 6 x 14
## State Region Population Income Illiteracy `Life Exp` Murder `HS Grad` Frost
## <chr> <fct> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Alab~ South 3615 3624 2.1 69.0 15.1 41.3 20
## 2 Alas~ West 365 6315 1.5 69.3 11.3 66.7 152
## 3 Ariz~ West 2212 4530 1.8 70.6 7.8 58.1 15
## 4 Arka~ South 2110 3378 1.9 70.7 10.1 39.9 65
## 5 Cali~ West 21198 5114 1.1 71.7 10.3 62.6 20
## 6 Colo~ West 2541 4884 0.7 72.1 6.8 63.9 166
## # ... with 5 more variables: Area <dbl>, Murder1 <dbl>, Assault <int>,
## # UrbanPop <int>, Rape <dbl>
En Arizona hay 2212 habitantes y exite una probabilidad de 21.2% que un ciudadano haya sido violado se escojen a 100 habitantes.
p(0.212) numero de muestras=100
¿Cual es la probabilidad que 20 personas hayan sido violadas?
#p(x=20)
dbinom(20,100,0.212)
## [1] 0.09505302
¿Cual es la probabilidad de que al menos 10 personas hayan sido violadas?
#(x>=10)= 1-p(x<10) = 1-p(x<=10)
1-pbinom(10,100,0.212)
## [1] 0.9974944
¿Cual es la probabilidad de que menos de 30 hayan sido violados ?
#p(x<30)=p(x<=30)
pbinom(30,100,0.212)
## [1] 0.9859488
Obtención de datos de solo hombres.
hombres<- subset(bdims, sex == 1)
head(bdims$hgt,50)
## [1] 174.0 175.3 193.5 186.5 187.2 181.5 184.0 184.5 175.0 184.0 180.0 177.8
## [13] 192.0 176.0 174.0 184.0 192.7 171.5 173.0 176.0 176.0 180.5 172.7 176.0
## [25] 173.5 178.0 180.3 180.3 164.5 173.0 183.5 175.5 188.0 189.2 172.8 170.0
## [37] 182.0 170.0 177.8 184.2 186.7 171.4 172.7 175.3 180.3 182.9 188.0 177.2
## [49] 172.1 167.0
Segun la prueba de shapiro indica que si los dastos estan distribuidos de manera normal, los valores mayores a 0.05 dan positivo.
shapiro.test(hombres$hgt)
##
## Shapiro-Wilk normality test
##
## data: hombres$hgt
## W = 0.99358, p-value = 0.3716
El siguiente QQ-plot por su forma nos dice que la campana de Gauss tendra una simetria .
qqnorm(hombres$hgt)
qqline(hombres$hgt,col="red")
hist(hombres$hgt)
Demostracion de 50 datos de hombres(altura).
head(bdims$hgt,50)
## [1] 174.0 175.3 193.5 186.5 187.2 181.5 184.0 184.5 175.0 184.0 180.0 177.8
## [13] 192.0 176.0 174.0 184.0 192.7 171.5 173.0 176.0 176.0 180.5 172.7 176.0
## [25] 173.5 178.0 180.3 180.3 164.5 173.0 183.5 175.5 188.0 189.2 172.8 170.0
## [37] 182.0 170.0 177.8 184.2 186.7 171.4 172.7 175.3 180.3 182.9 188.0 177.2
## [49] 172.1 167.0
Calculo de la media y desviacion estandar de las alturas de hombres.
media<-mean(hombres$hgt)
desvEstandar<-sd(hombres$hgt)
Obtener desviacion estandar de un hombre que mida mas de 190 cm.
#p(x>190)=(z>1.8) = 1-p(z>1.8)
#forma estandarizada
#probabilidad:
1-pnorm(190,media,desvEstandar)
## [1] 0.04401201
z1<-(190-media)/desvEstandar
#pribabilidad:
1-pnorm(z1,0,1)
## [1] 0.04401201
x <- seq(-3.5,3.5,length=100)*desvEstandar + media
y <- dnorm(x,media,desvEstandar)
plot(x, y, type="l" )
polygon(c(x[x>=190], 190), c(y[x>=190], 0), col="red")
¿Cual es la desviacion estandar de hombres que midan mas de 185 cm?
#p(x>185)=1-p(185)
#----batos que midan mas de 185 cm p(x>185)=1-p(185)
#probabilidad:
1-pnorm(185,media,desvEstandar)
## [1] 0.1562746
#forma estandarizada
z2<-(185-media)/desvEstandar
#probabilidad:
1-pnorm(z2,0,1)
## [1] 0.1562746
#-grafica
x <- seq(-3.5,3.5,length=100)*desvEstandar + media
y <- dnorm(x,media,desvEstandar)
plot(x, y, type="l")
polygon(c(x[x>=185], 185), c(y[x>=185], 0), col="blue")
¿Probabilidad de hombres que midan menos de 170cm?
#p(x<=170)
#probabilidad:
pnorm(170,media,desvEstandar)
## [1] 0.1404736
#forma estandarizada
#probabilidad:
z3<-(170-media)/desvEstandar
pnorm(z3,0,1)
## [1] 0.1404736
#-grafica
x <- seq(-3.5,3.5,length=100)*desvEstandar + media
y <- dnorm(x,media,desvEstandar)
plot(x, y, type="l")
polygon(c(x[x<=170], 170), c(y[x<=170], 0), col="red")