INTRODUCCIÓN

En el siguiente trabajo se haran analisis de estadistica, usando la distribucion normal y binomial, en la normal se hizo el uso de variables continuas,obteniendo la altura de 247 hombres, para ser mas precisos con las probabilidades ,en la distribucion binomial usamos variables discretas, hicimos el uso de la poblacion de Texas.

Distribución binomial

Impresion de datos sobre cada region de los Estados Unidos.

tabal_1 <- 
  tibble(State = state.name,
         Region = state.region) %>%
  bind_cols(as_tibble(state.x77)) %>%
  bind_cols(USArrests)

head(tabal_1)
## # A tibble: 6 x 14
##   State Region Population Income Illiteracy `Life Exp` Murder `HS Grad` Frost
##   <chr> <fct>       <dbl>  <dbl>      <dbl>      <dbl>  <dbl>     <dbl> <dbl>
## 1 Alab~ South        3615   3624        2.1       69.0   15.1      41.3    20
## 2 Alas~ West          365   6315        1.5       69.3   11.3      66.7   152
## 3 Ariz~ West         2212   4530        1.8       70.6    7.8      58.1    15
## 4 Arka~ South        2110   3378        1.9       70.7   10.1      39.9    65
## 5 Cali~ West        21198   5114        1.1       71.7   10.3      62.6    20
## 6 Colo~ West         2541   4884        0.7       72.1    6.8      63.9   166
## # ... with 5 more variables: Area <dbl>, Murder1 <dbl>, Assault <int>,
## #   UrbanPop <int>, Rape <dbl>

En Arizona hay 2212 habitantes y exite una probabilidad de 21.2% que un ciudadano haya sido violado se escojen a 100 habitantes.

p(0.212) numero de muestras=100

¿Cual es la probabilidad que 20 personas hayan sido violadas?

#p(x=20)
dbinom(20,100,0.212)
## [1] 0.09505302

¿Cual es la probabilidad de que al menos 10 personas hayan sido violadas?

#(x>=10)= 1-p(x<10) = 1-p(x<=10)
1-pbinom(10,100,0.212)
## [1] 0.9974944

¿Cual es la probabilidad de que menos de 30 hayan sido violados ?

#p(x<30)=p(x<=30)
pbinom(30,100,0.212)
## [1] 0.9859488

Prueba de normalidad

Obtención de datos de solo hombres.

hombres<- subset(bdims, sex == 1)
head(bdims$hgt,50)
##  [1] 174.0 175.3 193.5 186.5 187.2 181.5 184.0 184.5 175.0 184.0 180.0 177.8
## [13] 192.0 176.0 174.0 184.0 192.7 171.5 173.0 176.0 176.0 180.5 172.7 176.0
## [25] 173.5 178.0 180.3 180.3 164.5 173.0 183.5 175.5 188.0 189.2 172.8 170.0
## [37] 182.0 170.0 177.8 184.2 186.7 171.4 172.7 175.3 180.3 182.9 188.0 177.2
## [49] 172.1 167.0

Segun la prueba de shapiro indica que si los dastos estan distribuidos de manera normal, los valores mayores a 0.05 dan positivo.

shapiro.test(hombres$hgt)
## 
##  Shapiro-Wilk normality test
## 
## data:  hombres$hgt
## W = 0.99358, p-value = 0.3716

El siguiente QQ-plot por su forma nos dice que la campana de Gauss tendra una simetria .

qqnorm(hombres$hgt)
qqline(hombres$hgt,col="red")

hist(hombres$hgt)

Distribución normal

Demostracion de 50 datos de hombres(altura).

head(bdims$hgt,50)
##  [1] 174.0 175.3 193.5 186.5 187.2 181.5 184.0 184.5 175.0 184.0 180.0 177.8
## [13] 192.0 176.0 174.0 184.0 192.7 171.5 173.0 176.0 176.0 180.5 172.7 176.0
## [25] 173.5 178.0 180.3 180.3 164.5 173.0 183.5 175.5 188.0 189.2 172.8 170.0
## [37] 182.0 170.0 177.8 184.2 186.7 171.4 172.7 175.3 180.3 182.9 188.0 177.2
## [49] 172.1 167.0

Calculo de la media y desviacion estandar de las alturas de hombres.

media<-mean(hombres$hgt) 
desvEstandar<-sd(hombres$hgt) 

Obtener desviacion estandar de un hombre que mida mas de 190 cm.

#p(x>190)=(z>1.8) = 1-p(z>1.8)

#forma estandarizada
#probabilidad:
1-pnorm(190,media,desvEstandar)
## [1] 0.04401201
z1<-(190-media)/desvEstandar
#pribabilidad:
1-pnorm(z1,0,1)
## [1] 0.04401201
x <- seq(-3.5,3.5,length=100)*desvEstandar + media
y <- dnorm(x,media,desvEstandar)
plot(x, y, type="l" )
polygon(c(x[x>=190], 190), c(y[x>=190], 0), col="red")

¿Cual es la desviacion estandar de hombres que midan mas de 185 cm?

#p(x>185)=1-p(185)
#----batos que midan mas de 185 cm p(x>185)=1-p(185)
#probabilidad:
1-pnorm(185,media,desvEstandar)
## [1] 0.1562746
#forma estandarizada
z2<-(185-media)/desvEstandar
#probabilidad:
1-pnorm(z2,0,1)
## [1] 0.1562746
#-grafica
x <- seq(-3.5,3.5,length=100)*desvEstandar + media
y <- dnorm(x,media,desvEstandar)
plot(x, y, type="l")
polygon(c(x[x>=185], 185), c(y[x>=185], 0), col="blue")

¿Probabilidad de hombres que midan menos de 170cm?

#p(x<=170)
#probabilidad:
pnorm(170,media,desvEstandar)
## [1] 0.1404736
#forma estandarizada
#probabilidad:
z3<-(170-media)/desvEstandar
pnorm(z3,0,1)
## [1] 0.1404736
#-grafica
x <- seq(-3.5,3.5,length=100)*desvEstandar + media
y <- dnorm(x,media,desvEstandar)
plot(x, y, type="l")
polygon(c(x[x<=170], 170), c(y[x<=170], 0), col="red")