setwd("~/PROBABILIDAD Y ESTADISTICA 2020")
library(pacman)
library(readxl)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "knitr","DT","dplyr", "ggplot2")

Inferencia estadística

  1. Describa con sus propias palabras los siguientes conceptos:

Entiendo este término como aquellos metodos que nos ayudan a conocer o determinar el valor de alguna muestra respecto a estadística; gracias a esta muestra se pueden conocer bastantes datos de aquello que deseemos evaluar.

En esta unidad pudimos profundizar en el tema de muestreo, el cual entiendo como la actividad o técnica para poder elegir una muestra en base a la población analizada; con esto nos evitamos tiempo y recursos extras ya que optimiza nuestro trabajo y al mismo tiempo nos permite visualizar como serían los valores obtenidos si se hubiese realizado esta prueba ante toda la población presente.

Serían todos aquellos datos pertenecientes a una población para así tener una representación concreta de todos los datos que se recopilaron; En cuanto a la estadística debe contar con bastantes muestras para así poder evaluar todo de una manera correcta.

Nula o H0 se refiere a la primer hipótesis planteada es decir que esta establece que no hay diferencias entre los grupos que se estan poniendo en comparación. Y a partir de esta surge la hipótesis alternativa o H1 que hace referencia a las diferencias representadas entre esta y la H0; se busca anular a H0 y tratar de comprobar o verificar la Hipotesis alternativa.

Pienso que para poder realizar una prueba estadística, el muestreo es la parte más importante ya que sin este no podriamos conocer y evaluar todos aquellos datos, y gracias a esto verificamos todos los datos presentados para ver si concuerdan con lo que estamos tratando de obtener que en estos casos serían las respuestas a la situación que se este evaluando.

library(readxl)
aguas <- read_excel("aguas.xlsx")
dim(aguas)
## [1] 586   3

Muestreo

Bajo sus propios criterios

  1. Realice un muestreo aleatorio simple
datatable(aguas)

Esta tabla representa todos los valores (586) que se encuentran bajo el concepto de “Medición” con los nombres de pH Y Temperatura cada uno con 293 valores y por consiguiente se muestra otra columna bajo el nombre “Valor” para c/u de los valores ya antes mencionados.

Una muestra de 25 para las muestras totales comprendidas en una población (agua), bajo el nombre de Temperatura y pH.

n <- 25
muestramia <- sample(1:nrow(aguas), size=n, replace=FALSE)
muestramia
##  [1] 435  50 130 461 443  66 433 116 148 107 516 417 397 513 311 203  72 335  47
## [20] 574  64 415 217 520 400

Esta tabla nos imprime “N” con sus números (no estan en orden ya que por efectos de practicidad en el código preferí conservar el orden original de el excel), también nos muestra “MEDICION” donde se encuentran alojados pH y Temperatura, las cuales son variables dependientes, y sus valores.

aguasmuestramia <- aguas[muestramia, ]
head(aguasmuestramia)
aguasmuestramia2 <- aguas %>%
  sample_n(size=n, replace=FALSE)
head(aguasmuestramia2)
aguasmuestramia2 <- aguas %>%
  sample_n(size=n, replace=TRUE)
head(aguasmuestramia2)

Decidí realizar ambas pruebas, aunque mi conclusión es que la población al ser tan pequeña, se desarrolla mejor con el “Muestreo aleatorio simple sin remplazo”

  1. Realice un muestreo estratificado
dim(aguas)
## [1] 586   3
head(aguas)
levels(as.factor(aguas$MEDICION))
## [1] "PH"   "TEMP"
MEDICION <- aguas
MEDICION$id <- 1:586
MEDICION[1:3, 1:4]
set.seed(12)
sample_aguas <- aguas %>%
  group_by(MEDICION) %>%
  sample_n(25)
sample_aguas

Aquí obtuvimos un muestreo de 50 ya que 25 de los datos pertenecen a Temperatura y los otros 25 a pH, todos estos comprendidos dentro de los 586 valores totales.

  1. Realice un muestreo ponderado

Todos los valores mostrados aquí están impresos de forma aletoria entre los 586 datos totales.

aguasmuestramia3 <- aguas %>%   
  sample_n(size=n, weight = VALOR )
head(aguasmuestramia3)
  1. Realice un muestreo de fracción.

Al igual que en el ejercicio anterior los datos mostrados aquí son totalmente al azar, pero aquí están bajo el muestreo de una fracción de 0.05 de la población .

n <- 25
aguas1 <- sample(1:nrow(aguas), size=n, replace=FALSE)
head(aguas1)
## [1] 510 396 204 579 133 342
aguas.p <- aguas %>%
  sample_frac (0.05)
head(aguas.p); dim(aguas.p)
## [1] 29  3

Prueba de hipótesis

Relice sus hipótesis y aplique lo siguiente

*Hipótesis nula:

Conocer si los valores de medición de pH son congruentes con la medición de temperatura de acuerdo a las tablas presentadas.

*Hipótesis alt:

Los valores de la temperatura influyen en el pH?

  1. Prueba de shapiro wilk
knitr::kable(aguas)
N MEDICION VALOR
1 PH 6.8
2 PH 6.9
3 PH 6.8
4 PH 7.1
5 PH 6.6
6 PH 6.8
7 PH 6.5
8 PH 6.9
9 PH 7.0
10 PH 7.0
11 PH 6.9
12 PH 7.2
13 PH 6.6
14 PH 6.7
15 PH 6.7
16 PH 7.1
17 PH 6.9
18 PH 7.4
19 PH 6.8
20 PH 7.0
21 PH 7.0
22 PH 7.3
23 PH 6.7
24 PH 6.8
25 PH 7.0
26 PH 7.0
27 PH 7.1
28 PH 6.8
29 PH 7.0
30 PH 6.9
31 PH 6.8
32 PH 7.0
33 PH 7.0
34 PH 7.0
35 PH 6.6
36 PH 7.1
37 PH 7.0
38 PH 7.1
39 PH 7.2
40 PH 7.1
41 PH 6.8
42 PH 7.0
43 PH 6.6
44 PH 7.0
45 PH 7.3
46 PH 7.2
47 PH 7.0
48 PH 7.4
49 PH 6.6
50 PH 6.6
51 PH 7.1
52 PH 7.1
53 PH 7.0
54 PH 7.1
55 PH 6.9
56 PH 6.8
57 PH 7.0
58 PH 6.9
59 PH 7.1
60 PH 7.2
61 PH 6.4
62 PH 7.0
63 PH 7.0
64 PH 6.8
65 PH 7.4
66 PH 7.0
67 PH 6.5
68 PH 7.0
69 PH 7.1
70 PH 7.0
71 PH 6.8
72 PH 6.9
73 PH 7.0
74 PH 6.8
75 PH 7.0
76 PH 7.0
77 PH 6.9
78 PH 7.4
79 PH 6.8
80 PH 7.1
81 PH 7.0
82 PH 7.0
83 PH 7.2
84 PH 7.1
85 PH 6.9
86 PH 7.0
87 PH 7.0
88 PH 6.8
89 PH 6.9
90 PH 7.1
91 PH 7.0
92 PH 7.0
93 PH 6.7
94 PH 7.1
95 PH 6.6
96 PH 6.6
97 PH 7.2
98 PH 7.3
99 PH 6.8
100 PH 6.9
101 PH 6.8
102 PH 7.0
103 PH 6.8
104 PH 6.9
105 PH 6.9
106 PH 6.8
107 PH 6.8
108 PH 7.2
109 PH 7.1
110 PH 7.0
111 PH 6.9
112 PH 6.8
113 PH 7.1
114 PH 7.0
115 PH 6.9
116 PH 7.2
117 PH 7.3
118 PH 6.1
119 PH 6.8
120 PH 6.6
121 PH 6.5
122 PH 7.0
123 PH 6.9
124 PH 6.8
125 PH 7.0
126 PH 6.9
127 PH 7.0
128 PH 6.8
129 PH 6.7
130 PH 6.9
131 PH 6.9
132 PH 6.4
133 PH 7.0
134 PH 6.8
135 PH 7.0
136 PH 6.8
137 PH 7.2
138 PH 7.1
139 PH 7.0
140 PH 7.0
141 PH 7.4
142 PH 6.8
143 PH 7.0
144 PH 7.0
145 PH 7.0
146 PH 7.3
147 PH 6.8
148 PH 7.1
149 PH 7.3
150 PH 6.9
151 PH 7.0
152 PH 6.6
153 PH 6.6
154 PH 7.0
155 PH 6.8
156 PH 7.1
157 PH 7.0
158 PH 7.5
159 PH 7.0
160 PH 7.2
161 PH 6.9
162 PH 6.8
163 PH 7.1
164 PH 6.8
165 PH 7.0
166 PH 6.5
167 PH 6.5
168 PH 7.0
169 PH 7.1
170 PH 6.8
171 PH 6.6
172 PH 7.0
173 PH 6.5
174 PH 6.8
175 PH 6.4
176 PH 6.9
177 PH 6.8
178 PH 7.4
179 PH 6.9
180 PH 6.6
181 PH 6.9
182 PH 7.0
183 PH 7.0
184 PH 6.9
185 PH 6.7
186 PH 6.6
187 PH 6.8
188 PH 6.9
189 PH 6.6
190 PH 7.0
191 PH 7.0
192 PH 6.8
193 PH 7.0
194 PH 6.9
195 PH 7.2
196 PH 7.1
197 PH 7.2
198 PH 7.0
199 PH 7.0
200 PH 6.9
201 PH 7.0
202 PH 7.0
203 PH 7.0
204 PH 7.1
205 PH 6.5
206 PH 6.8
207 PH 6.6
208 PH 7.0
209 PH 6.6
210 PH 6.9
211 PH 7.0
212 PH 7.0
213 PH 6.8
214 PH 6.8
215 PH 7.0
216 PH 6.9
217 PH 6.6
218 PH 6.8
219 PH 6.7
220 PH 7.0
221 PH 6.9
222 PH 7.0
223 PH 6.9
224 PH 6.9
225 PH 6.7
226 PH 7.0
227 PH 7.0
228 PH 6.9
229 PH 6.9
230 PH 6.8
231 PH 6.5
232 PH 6.9
233 PH 6.8
234 PH 7.0
235 PH 7.0
236 PH 6.5
237 PH 6.8
238 PH 7.0
239 PH 6.6
240 PH 6.8
241 PH 6.5
242 PH 6.9
243 PH 6.8
244 PH 6.8
245 PH 6.5
246 PH 7.1
247 PH 6.4
248 PH 7.0
249 PH 6.6
250 PH 7.1
251 PH 7.0
252 PH 6.8
253 PH 6.9
254 PH 6.8
255 PH 6.5
256 PH 7.0
257 PH 6.8
258 PH 6.5
259 PH 6.9
260 PH 6.8
261 PH 6.4
262 PH 6.3
263 PH 6.5
264 PH 6.6
265 PH 6.5
266 PH 6.9
267 PH 6.9
268 PH 6.8
269 PH 6.8
270 PH 6.8
271 PH 6.9
272 PH 6.8
273 PH 6.5
274 PH 6.7
275 PH 6.6
276 PH 6.8
277 PH 7.1
278 PH 6.8
279 PH 7.0
280 PH 7.1
281 PH 6.8
282 PH 7.1
283 PH 6.4
284 PH 6.8
285 PH 7.1
286 PH 6.8
287 PH 6.4
288 PH 6.5
289 PH 7.0
290 PH 6.9
291 PH 7.0
292 PH 6.6
293 PH 7.0
1 TEMP 28.5
2 TEMP 29.2
3 TEMP 28.9
4 TEMP 29.4
5 TEMP 28.3
6 TEMP 28.4
7 TEMP 28.0
8 TEMP 27.5
9 TEMP 28.7
10 TEMP 28.6
11 TEMP 27.8
12 TEMP 29.4
13 TEMP 28.6
14 TEMP 28.5
15 TEMP 28.7
16 TEMP 29.3
17 TEMP 28.9
18 TEMP 28.8
19 TEMP 30.3
20 TEMP 29.0
21 TEMP 29.8
22 TEMP 29.9
23 TEMP 28.2
24 TEMP 28.5
25 TEMP 29.5
26 TEMP 28.6
27 TEMP 28.8
28 TEMP 29.5
29 TEMP 29.1
30 TEMP 28.7
31 TEMP 29.4
32 TEMP 28.9
33 TEMP 28.2
34 TEMP 30.2
35 TEMP 31.1
36 TEMP 30.5
37 TEMP 31.5
38 TEMP 31.9
39 TEMP 29.7
40 TEMP 29.2
41 TEMP 30.1
42 TEMP 26.4
43 TEMP 28.8
44 TEMP 28.0
45 TEMP 29.2
46 TEMP 28.0
47 TEMP 28.6
48 TEMP 28.4
49 TEMP 28.2
50 TEMP 30.0
51 TEMP 29.8
52 TEMP 29.5
53 TEMP 28.6
54 TEMP 26.8
55 TEMP 28.6
56 TEMP 27.2
57 TEMP 28.7
58 TEMP 29.0
59 TEMP 29.9
60 TEMP 29.8
61 TEMP 30.3
62 TEMP 31.7
63 TEMP 29.5
64 TEMP 29.4
65 TEMP 30.0
66 TEMP 28.9
67 TEMP 31.4
68 TEMP 29.0
69 TEMP 30.0
70 TEMP 31.2
71 TEMP 30.4
72 TEMP 29.7
73 TEMP 29.2
74 TEMP 27.3
75 TEMP 26.3
76 TEMP 27.5
77 TEMP 27.8
78 TEMP 28.3
79 TEMP 29.3
80 TEMP 28.9
81 TEMP 28.0
82 TEMP 27.9
83 TEMP 28.7
84 TEMP 29.4
85 TEMP 28.0
86 TEMP 29.8
87 TEMP 28.6
88 TEMP 28.8
89 TEMP 30.0
90 TEMP 29.0
91 TEMP 29.1
92 TEMP 28.7
93 TEMP 28.4
94 TEMP 29.5
95 TEMP 30.0
96 TEMP 28.7
97 TEMP 28.9
98 TEMP 29.2
99 TEMP 29.5
100 TEMP 28.6
101 TEMP 27.5
102 TEMP 29.3
103 TEMP 29.9
104 TEMP 29.1
105 TEMP 29.8
106 TEMP 29.2
107 TEMP 28.9
108 TEMP 29.5
109 TEMP 28.6
110 TEMP 28.8
111 TEMP 28.5
112 TEMP 28.6
113 TEMP 27.9
114 TEMP 28.0
115 TEMP 28.6
116 TEMP 29.2
117 TEMP 29.0
118 TEMP 28.9
119 TEMP 28.7
120 TEMP 27.7
121 TEMP 27.8
122 TEMP 28.0
123 TEMP 27.9
124 TEMP 28.0
125 TEMP 27.3
126 TEMP 28.9
127 TEMP 28.0
128 TEMP 29.1
129 TEMP 28.5
130 TEMP 27.9
131 TEMP 28.3
132 TEMP 26.8
133 TEMP 27.0
134 TEMP 27.5
135 TEMP 27.8
136 TEMP 28.2
137 TEMP 28.4
138 TEMP 27.8
139 TEMP 27.9
140 TEMP 28.6
141 TEMP 29.4
142 TEMP 28.7
143 TEMP 29.2
144 TEMP 28.9
145 TEMP 29.6
146 TEMP 29.6
147 TEMP 30.1
148 TEMP 28.2
149 TEMP 27.4
150 TEMP 29.2
151 TEMP 29.0
152 TEMP 29.6
153 TEMP 30.2
154 TEMP 32.1
155 TEMP 28.5
156 TEMP 30.8
157 TEMP 29.2
158 TEMP 25.6
159 TEMP 28.3
160 TEMP 26.2
161 TEMP 29.0
162 TEMP 28.9
163 TEMP 28.6
164 TEMP 27.9
165 TEMP 27.5
166 TEMP 26.9
167 TEMP 27.6
168 TEMP 27.3
169 TEMP 28.4
170 TEMP 29.3
171 TEMP 28.8
172 TEMP 28.6
173 TEMP 29.1
174 TEMP 28.8
175 TEMP 27.4
176 TEMP 28.2
177 TEMP 27.9
178 TEMP 28.8
179 TEMP 28.0
180 TEMP 29.8
181 TEMP 29.2
182 TEMP 27.8
183 TEMP 28.9
184 TEMP 28.8
185 TEMP 27.5
186 TEMP 29.0
187 TEMP 29.1
188 TEMP 29.0
189 TEMP 28.9
190 TEMP 29.2
191 TEMP 28.5
192 TEMP 29.0
193 TEMP 28.9
194 TEMP 29.4
195 TEMP 29.5
196 TEMP 29.1
197 TEMP 28.9
198 TEMP 28.0
199 TEMP 27.8
200 TEMP 26.3
201 TEMP 28.3
202 TEMP 28.0
203 TEMP 27.5
204 TEMP 27.9
205 TEMP 29.4
206 TEMP 28.6
207 TEMP 28.0
208 TEMP 27.9
209 TEMP 27.5
210 TEMP 28.0
211 TEMP 28.4
212 TEMP 28.6
213 TEMP 28.2
214 TEMP 28.9
215 TEMP 28.2
216 TEMP 27.8
217 TEMP 28.1
218 TEMP 28.7
219 TEMP 27.7
220 TEMP 27.8
221 TEMP 28.6
222 TEMP 28.0
223 TEMP 28.7
224 TEMP 28.5
225 TEMP 29.9
226 TEMP 27.1
227 TEMP 28.1
228 TEMP 27.8
229 TEMP 27.9
230 TEMP 28.7
231 TEMP 28.0
232 TEMP 29.0
233 TEMP 28.6
234 TEMP 28.0
235 TEMP 28.2
236 TEMP 28.7
237 TEMP 29.2
238 TEMP 28.9
239 TEMP 29.0
240 TEMP 29.5
241 TEMP 29.2
242 TEMP 29.0
243 TEMP 28.2
244 TEMP 27.5
245 TEMP 27.9
246 TEMP 28.3
247 TEMP 30.1
248 TEMP 26.4
249 TEMP 28.1
250 TEMP 27.5
251 TEMP 27.4
252 TEMP 27.5
253 TEMP 27.9
254 TEMP 28.8
255 TEMP 28.6
256 TEMP 28.5
257 TEMP 28.8
258 TEMP 29.1
259 TEMP 30.9
260 TEMP 28.3
261 TEMP 29.4
262 TEMP 28.9
263 TEMP 30.6
264 TEMP 30.2
265 TEMP 29.1
266 TEMP 29.1
267 TEMP 31.1
268 TEMP 31.1
269 TEMP 25.8
270 TEMP 29.0
271 TEMP 28.8
272 TEMP 29.4
273 TEMP 29.4
274 TEMP 28.2
275 TEMP 30.1
276 TEMP 30.3
277 TEMP 30.3
278 TEMP 30.0
279 TEMP 27.4
280 TEMP 27.8
281 TEMP 29.1
282 TEMP 27.9
283 TEMP 27.3
284 TEMP 27.2
285 TEMP 27.0
286 TEMP 27.4
287 TEMP 27.7
288 TEMP 27.9
289 TEMP 28.4
290 TEMP 28.0
291 TEMP 27.5
292 TEMP 28.2
293 TEMP 27.7
* Test de normali dad de shapiro wilk
Temp  <- subset(aguas, MEDICION=="TEMP")
pH  <- subset(aguas, MEDICION=="PH")
shapiro.test(Temp$VALOR) #Temperatura
## 
##  Shapiro-Wilk normality test
## 
## data:  Temp$VALOR
## W = 0.98362, p-value = 0.001981
shapiro.test(pH$VALOR) #pH
## 
##  Shapiro-Wilk normality test
## 
## data:  pH$VALOR
## W = 0.95932, p-value = 2.661e-07
  1. Prueba de k.s.
ks.test(Temp$VALOR,"pnorm", mean=mean(Temp$VALOR), sd=sd(Temp$VALOR)) #Temperatura
## Warning in ks.test(Temp$VALOR, "pnorm", mean = mean(Temp$VALOR), sd =
## sd(Temp$VALOR)): ties should not be present for the Kolmogorov-Smirnov test
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  Temp$VALOR
## D = 0.071961, p-value = 0.09618
## alternative hypothesis: two-sided
ks.test(pH$VALOR,"pnorm", mean=mean(pH$VALOR), sd=sd(pH$VALOR)) #pH
## Warning in ks.test(pH$VALOR, "pnorm", mean = mean(pH$VALOR), sd = sd(pH$VALOR)):
## ties should not be present for the Kolmogorov-Smirnov test
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  pH$VALOR
## D = 0.1436, p-value = 1.129e-05
## alternative hypothesis: two-sided
  1. Normalidad de varianzas
var.test(pH$VALOR, Temp$VALOR)
## 
##  F test to compare two variances
## 
## data:  pH$VALOR and Temp$VALOR
## F = 0.047408, num df = 292, denom df = 292, p-value < 2.2e-16
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.03767300 0.05965831
## sample estimates:
## ratio of variances 
##         0.04740789
  1. Numeros de tukey
fivenum(Temp$VALOR)
## [1] 25.6 28.0 28.7 29.2 32.1
fivenum(pH$VALOR)
## [1] 6.1 6.8 6.9 7.0 7.5
  1. Comparativo de caja y bigote, comparativo de caja y bigote con desviación
boxplot(aguas$VALOR ~ aguas$MEDICION, col= "slateblue1")

op <- par(mfrow =c(1,2), cex.axis=.7, cex.lab=.9 )

boxplot(aguas$VALOR ~ aguas$MEDICION, col="darkslategray2", main="A"  )
barplot(tapply(aguas$VALOR, list(aguas$MEDICION), mean ), beside = T, main="B" , col = "royalblue4"                            )

t.test(Temp$VALOR, pH$VALOR, var.equal = T, ) #Prueba
## 
##  Two Sample t-test
## 
## data:  Temp$VALOR and pH$VALOR
## t = 358.45, df = 584, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  21.68802 21.92700
## sample estimates:
## mean of x mean of y 
## 28.697952  6.890444

Pienso que, en general la gente si busca ser realmente felíz, la felicidad es una cuestión muy personal ya que, todos tenemos una idea diferente de lo que engloba “ser felíz”; entonces personalemente creo que si, todos estamos constantemente buscando la felicidad por que este estado lo relacionamos con bienestar; aunque también creo que es un reflejo de los estandares sociales establecidos por que nos presentan esta idea de que si tenemos “X”cosa, o se nos presenta “x” situación vamos a ser plenos y por lo tanto felices. Sin embargo como lo mencione antes esto es subjetivo ya que no todos queremos lo mismo; es la maravilla del ser humano, cada uno genera sus propios pensamientos y así creamos una idea o conclusión general de lo que podría ser “nuestra” felicidad, a veces pensamos que el ser felices nos garantiza obtener algún tipo exito pero, al igual que como lo mencioné anteriormente, el ser “exitoso” no nos garantiza nada por que este concepto también varía bastante dependiendo de cada persona. Hay un cuento muy popular brasileño que me gusta mucho sobre un pescador y un empresario éxitoso, el cual al ver que dicho pescador era muy hábil y obtenia bastante producto, le pregunta cúal es su proceso de trabajo, el pescador describe su rútina de pesca y también como siempre se da el tiempo de convivir con sus seres amados; el empresario impactado le comienza a decir que si en vez de dedicarle tanto tiempo a sus actividades familiares le dedicase más a seguir pescando en muy poco tiempo podría obtener mayores ganancias y posteriormente esto lo llevaría a algún día sólo dedicarse a gestionar sus ingresos y entonces si, ser felíz y dedicarle todo el tiempo a sus seres queridos, el pescador muy tranquilo le responde que si acaso eso no es lo que ya hace. Con esto concluyo una vez más, lo que puede ser la felicidad para unos no lo es para los demás y está absolutamente bien. Me parece fascinante que todos podamos proyectar este sentimiento de tantas maneras diferentes y al mismo tiempo lograr en algún punto, ser plenos o en este caso “felices”.

xfun::embed_file("E3U3D.rmd")
Download E3U3D.rmd