setwd("~/veranoPyE")
library(pacman)
library(readxl)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2")
Inferencia estadística
La inferencia estadistica es una parte de la estadistica que comprende los metodos y precedimientos por una induccion determinada, su objetivo que tiene es obtener conclusiones utiles para hacer deducciones sobre una totalidad
Poblacion
es el conjunto de seres humanos que hacen vida a un determinado territorio
muestreo
El muestreo se hace seleccionando un conjunto de invidivuos de una poblacion con el fin de estudiarlos y poder saber su totalidad de la poblacion
Estadísticamente representativo
Hipótesis nula y alternativa
Hipotesis nula: es afirmacion que se basa en analisis previos, Hipotesis alternativa: es lo que nostros podriamos pensar que es cierto o espera probar que es cierto.
Importancia del muestreo
El muestreo es de vital importancia ya que un muestreo de toda la población puedes examinar y sacar conclusiones en base a una pequeña parte de la población total
aguasub <- read_excel("aguasubterranea.xlsx")
datatable(aguasub)
## Muestreo simple
dim(aguasub)
## [1] 586 3
n <- 45
muestras <- sample(1:nrow(aguasub), size = n, replace = FALSE)
muestras
## [1] 320 445 332 464 491 532 236 396 37 466 271 73 538 379 39 118 230 303 56
## [20] 424 427 535 428 242 553 342 312 274 106 370 434 260 503 559 459 5 302 569
## [39] 492 426 463 327 159 519 410
aguasubmuestras <- aguasub[muestras, ]
head(aguasubmuestras)
## # A tibble: 6 x 3
## N MEDICION VALOR
## <dbl> <chr> <dbl>
## 1 27 TEMP 28.8
## 2 152 TEMP 29.6
## 3 39 TEMP 29.7
## 4 171 TEMP 28.8
## 5 198 TEMP 28
## 6 239 TEMP 29
levels(as.factor(aguasub$MEDICION))
## [1] "PH" "TEMP"
set.seed(1)
sample.agua <- aguasub %>%
group_by(MEDICION) %>%
sample_n(20)
sample.agua
## # A tibble: 40 x 3
## # Groups: MEDICION [2]
## N MEDICION VALOR
## <dbl> <chr> <dbl>
## 1 167 PH 6.5
## 2 129 PH 6.7
## 3 270 PH 6.8
## 4 187 PH 6.8
## 5 85 PH 6.9
## 6 277 PH 7.1
## 7 263 PH 6.5
## 8 79 PH 6.8
## 9 213 PH 6.8
## 10 37 PH 7
## # ... with 30 more rows
**aqui observamos que separamos la poblacion con mas segmentos homogeneos
n <- 50
muestrah20 <- aguasub %>%
sample_n(size=n, replace = FALSE)
head(muestrah20)
## # A tibble: 6 x 3
## N MEDICION VALOR
## <dbl> <chr> <dbl>
## 1 176 PH 6.9
## 2 52 TEMP 29.5
## 3 110 PH 7
## 4 84 PH 7.1
## 5 29 PH 7
## 6 141 PH 7.4
aguas <- data.frame(aguasub)
n <- 100
aguasubterranea <- sample(1:nrow(aguas), size=n, replace=FALSE)
head(aguasubterranea)
## [1] 219 135 111 532 377 408
aguas.sub <- aguas %>%
sample_frac(0.05)
head(aguas.sub); dim(aguas.sub)
## N MEDICION VALOR
## 1 7 TEMP 28.0
## 2 282 PH 7.1
## 3 241 PH 6.5
## 4 33 PH 7.0
## 5 144 TEMP 28.9
## 6 117 PH 7.3
## [1] 29 3
Ph <- subset(aguasub, MEDICION == "PH")
Temp <- subset(aguasub, MEDICION == "TEMP")
shapiro.test(Ph$VALOR)
##
## Shapiro-Wilk normality test
##
## data: Ph$VALOR
## W = 0.95932, p-value = 2.661e-07
temperatura
shapiro.test(Temp$VALOR)
##
## Shapiro-Wilk normality test
##
## data: Temp$VALOR
## W = 0.98362, p-value = 0.001981
ks.test(Ph$VALOR, "pnorm", mean = mean(Ph$VALOR), sd = sd(Ph$VALOR))
## Warning in ks.test(Ph$VALOR, "pnorm", mean = mean(Ph$VALOR), sd = sd(Ph$VALOR)):
## ties should not be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: Ph$VALOR
## D = 0.1436, p-value = 1.129e-05
## alternative hypothesis: two-sided
esto es para el ph
para la temperatura
ks.test(Temp$VALOR, "pnorm", mean = mean(Temp$VALOR), sd = sd(Temp$VALOR))
## Warning in ks.test(Temp$VALOR, "pnorm", mean = mean(Temp$VALOR), sd =
## sd(Temp$VALOR)): ties should not be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: Temp$VALOR
## D = 0.071961, p-value = 0.09618
## alternative hypothesis: two-sided
var.test(Ph$VALOR, Temp$VALOR)
##
## F test to compare two variances
##
## data: Ph$VALOR and Temp$VALOR
## F = 0.047408, num df = 292, denom df = 292, p-value < 2.2e-16
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.03767300 0.05965831
## sample estimates:
## ratio of variances
## 0.04740789
fivenum(Ph$VALOR)
## [1] 6.1 6.8 6.9 7.0 7.5
este fue para el ph
para temperatura
fivenum(Temp$VALOR)
## [1] 25.6 28.0 28.7 29.2 32.1
boxplot(Ph$VALOR ~ Temp$VALOR, col = "orange")
op <- par(mfrow =c(1,2), cex.axis=.7, cex.lab=.9 )
boxplot(aguasub$VALOR ~ aguasub$MEDICION, col = "orange", main= "A")
barplot(tapply(aguasub$VALOR, list(aguasub$MEDICION), mean), beside = T, main = "B")
ya depende de uno mismo de como quiere ser en su vida, si ser feliz o no, creo yo que merece empeñar años de tu vida en buscar el trabajo de tu vida, pues asi disfruta plenamente cada dia cada mañana, experimenta la legria, ya sea si tienes una hermosa familia o el trabajo de tus sueños o ya sea tus carros de tu sueños, casa de tu sueños, si en verdad te encanta tu trabajo y lo que haces siempre viviras feliz, habra veces en las que no te sentiras feliz por cadias que te da la vida, pero hay que ser positivos siempre en la vida no hay que amargarse y salir de la zona de conford y no tener miedo a explorar nuevas cosas, nuevas ideas, capaz y saliendo de tu zona encontraras muchisimas cosas buenas que te alegraran y seras feliz.