Introducción

Como se ha visto recientemente en varios medios y se ha podido presenciar en varios lugares alrededor del mundo, la calidad del agua ha estado variando y ya no ha sido la misma, por lo que muchas instituciones han optado por buscar otras fuentes para poder suministrar este líquido vital. Esto mismo ha llevado a que se recolecten muestras de diversas fuentes y nacientes de agua para poder ser analizadas y determinar su utilización para fines de uso doméstico y de consumo humano. Esto mismo es lo que se nos ha pedido que realicemos en función de analistas de datos, se nos brindó un dataset con una cantidad de muestras tomadas para poder analizar si cumplen con los estándares de uso para poder ser usadas para análisis más detallados en el campo de la microbiología y determinar su uso, ya que, dependiendo de la cantidad de muestras que cumplan los estándares es que se envían para su análisis.

Hipótesis a trabajar

  1. ¿Es seguro afirmar que menos del 50% de las muestras de agua recolectadas se pueden utilizar para uso doméstico?
  2. Los valores atípicos únicamente nos van a dar resultados negativos y hay que descartarlos.
  3. ¿Puede entrar en juego una tercera variable?

Datos suministrados

A continuación se muestran los datos contenidos en el dataset, siendo estos de una cantidad de 500 muestras en total:

Muestras_agua 
Sample_ID pH Temperature_Celcius Turbidity_NTU Dissolved_Oxygen_mgL Conductivity_microsegundocm
1 7.25 23.1 4.5 7.8 342
2 7.11 22.3 5.1 6.2 335
3 7.03 21.5 3.9 8.3 356
4 7.38 22.9 3.2 9.5 327
5 7.45 20.7 3.8 8.1 352
6 6.89 23.6 4.6 7.2 320
7 7.19 21.2 4.2 8.8 350
8 6.98 22.1 3.7 6.9 325
9 7.31 20.4 4.1 8.4 360
10 7.02 22.7 4.8 7.5 330
11 7.24 22.4 4.3 8.6 347
12 7.17 21.6 3.6 7.1 328
13 6.95 22.3 4.1 6.4 341
14 7.06 23.5 3.7 9.2 355
15 7.48 20.8 3.4 7.9 329
16 6.92 21.4 4.9 6.8 362
17 7.11 22.0 4.4 8.1 336
18 7.30 23.2 3.5 9.6 351
19 7.13 21.1 4.0 7.5 319
20 7.01 23.0 4.7 8.9 330
21 6.83 22.5 3.3 6.1 348
22 7.34 20.3 4.2 8.0 365
23 7.16 23.4 4.5 7.7 326
24 7.25 22.6 3.9 9.1 355
25 7.39 21.9 4.1 7.4 317
26 7.02 22.2 4.6 6.6 339
27 7.27 21.8 3.7 8.7 354
28 7.09 23.3 5.0 7.0 324
29 7.15 20.6 4.4 8.5 358
30 7.07 22.8 3.8 6.9 332
31 7.22 22.5 4.3 8.9 345
32 6.92 21.7 4.7 6.3 363
33 7.13 23.1 3.6 8.2 347
34 7.31 20.9 4.0 7.6 316
35 7.03 22.6 4.9 7.9 331
36 7.21 21.8 3.8 8.5 346
37 7.13 22.5 4.2 7.7 321
38 7.09 23.1 4.4 7.2 335
39 7.35 21.6 3.9 9.2 357
40 7.02 22.0 3.2 8.8 318
41 7.28 23.5 3.7 9.5 353
42 7.14 20.9 4.3 8.1 330
43 6.96 22.9 4.8 6.5 344
44 7.24 22.7 4.1 8.0 327
45 7.37 21.5 4.5 9.3 361
46 7.08 23.3 3.6 7.8 338
47 7.16 21.1 4.4 7.3 352
48 7.03 22.4 4.0 8.3 319
49 7.32 23.2 4.5 8.9 346
50 7.19 20.8 3.9 9.1 331
51 7.12 22.1 4.6 6.8 340
52 7.26 22.2 3.3 9.4 356
53 7.04 21.6 3.8 8.4 322
54 7.41 23.0 4.2 7.1 364
55 7.08 21.7 4.1 8.6 337
56 7.25 22.8 3.5 9.7 349
57 7.17 20.6 4.7 7.6 328
58 7.01 23.4 3.6 6.9 333
59 6.90 22.5 4.2 6.0 357
60 7.29 21.9 4.8 7.9 320
61 7.19 23.1 3.9 9.0 342
62 7.01 21.3 4.3 7.4 326
63 7.15 22.6 4.5 8.2 355
64 7.12 22.0 3.7 8.7 334
65 6.94 23.2 4.0 6.6 348
66 7.36 22.4 4.5 9.4 362
67 7.02 20.7 3.8 8.2 323
68 7.26 23.5 4.6 7.5 350
69 7.08 21.4 3.3 9.1 330
70 7.14 22.9 4.4 7.1 341
71 7.31 21.2 3.6 8.8 329
72 7.03 23.0 4.8 6.7 345
73 7.18 22.5 3.5 9.3 358
74 7.24 20.9 4.6 7.9 332
75 7.14 22.8 4.2 8.5 347
76 7.06 22.1 3.9 8.0 321
77 7.29 23.3 3.4 9.5 351
78 7.12 21.7 4.7 7.4 330
79 7.01 22.6 3.2 8.2 339
80 7.35 22.1 4.5 9.2 359
81 7.04 23.1 4.0 6.4 324
82 7.16 21.3 3.8 7.7 346
83 7.22 22.3 4.3 8.9 329
84 7.13 20.7 4.1 8.4 337
85 7.25 23.0 3.9 9.6 354
86 7.09 22.2 4.4 7.0 333
87 7.19 21.1 3.3 9.0 348
88 7.08 22.7 4.6 7.8 331
89 7.37 22.4 3.7 9.1 362
90 7.12 21.8 4.5 8.6 340
91 7.27 23.4 4.2 7.2 327
92 7.04 21.5 4.8 6.8 342
93 7.15 23.1 4.4 8.1 355
94 7.21 22.5 3.6 8.7 338
95 6.98 21.9 4.0 8.9 328
96 7.34 23.2 4.6 8.3 365
97 7.02 21.0 3.9 7.5 332
98 7.26 22.8 3.2 9.2 358
99 7.09 23.0 4.3 7.3 327
100 7.13 21.6 4.7 7.8 350
101 7.16 22.2 3.3 8.9 331
102 7.21 21.4 4.2 7.4 347
103 7.32 23.3 4.1 9.5 366
104 7.05 20.9 3.7 8.1 339
105 7.13 22.5 4.3 7.9 326
106 7.25 21.9 3.5 9.3 350
107 7.08 23.1 4.5 6.5 319
108 7.19 22.0 4.7 7.8 343
109 7.01 20.8 3.6 8.4 330
110 7.33 22.4 4.8 9.0 360
111 7.07 23.2 3.5 7.7 327
112 7.17 21.6 4.5 8.5 345
113 7.23 22.9 3.6 9.1 352
114 7.14 20.5 4.4 7.6 334
115 7.26 23.4 3.3 9.4 357
116 7.09 22.1 4.1 7.0 329
117 7.20 21.3 4.4 8.2 346
118 7.05 22.7 4.7 7.2 335
119 7.38 21.5 3.9 9.6 364
120 7.11 22.6 4.2 8.8 341
121 7.28 20.7 3.8 9.2 353
122 7.03 23.3 4.3 6.9 322
123 7.15 21.2 3.4 8.0 344
124 7.21 22.4 4.6 8.6 326
125 7.12 23.0 3.1 9.4 356
126 7.00 22.3 4.5 6.3 328
127 7.34 21.1 3.7 9.1 361
128 7.02 22.9 4.1 7.5 338
129 7.24 21.8 4.4 8.3 347
130 7.10 23.4 4.8 7.7 331
131 7.16 20.4 3.8 8.7 329
132 7.29 22.3 4.2 9.3 357
133 7.01 21.6 4.3 7.2 326
134 7.18 23.1 3.7 9.0 348
135 7.13 21.3 4.5 8.1 335
136 7.24 22.5 3.9 9.5 353
137 7.05 20.8 4.6 7.6 329
138 7.20 23.4 4.1 8.8 342
139 7.10 22.6 3.8 8.3 336
140 7.33 21.2 4.4 9.7 365
141 7.07 23.0 3.4 7.9 324
142 7.21 21.7 4.5 8.7 349
143 7.23 22.1 3.6 9.4 356
144 7.16 20.6 4.2 7.8 331
145 7.28 23.3 3.4 9.1 358
146 7.09 21.9 4.8 7.3 332
147 7.22 20.5 4.6 8.4 344
148 7.04 22.8 3.5 8.2 336
149 7.35 21.4 3.9 9.8 367
150 7.08 22.2 4.3 7.5 327
151 7.26 21.0 3.8 9.3 354
152 7.03 23.2 4.1 6.8 323
153 7.15 21.1 4.7 7.7 345
154 7.19 22.5 3.1 9.6 351
155 7.11 22.9 4.4 8.0 339
156 7.01 20.9 4.8 6.9 328
157 7.31 21.6 3.6 9.2 359
158 7.02 22.2 4.5 7.4 337
159 7.25 21.8 4.2 8.9 346
160 7.12 23.5 4.6 7.9 333
161 7.17 21.4 3.9 8.5 331
162 7.29 20.8 4.7 9.6 363
163 7.01 22.3 4.5 7.8 328
164 7.18 23.0 4.1 8.9 347
165 7.14 20.5 3.6 8.0 333
166 7.25 21.3 4.4 9.4 352
167 7.05 22.6 3.9 7.3 325
168 7.20 21.2 4.6 8.6 345
169 7.10 22.9 3.7 8.1 335
170 7.33 23.4 4.5 9.9 370
171 7.07 20.6 3.5 7.7 329
172 7.21 22.1 4.2 8.8 350
173 7.23 23.3 4.6 9.7 359
174 7.16 21.8 4.0 8.3 339
175 7.28 20.9 4.3 9.2 360
176 7.09 22.2 3.7 7.9 331
177 7.22 23.1 4.4 8.5 355
178 7.04 20.8 4.1 7.5 332
179 7.35 22.5 3.8 9.8 370
180 7.08 21.7 4.6 7.4 330
181 7.26 23.0 3.9 9.5 357
182 7.03 20.7 4.4 7.1 327
183 7.15 22.1 3.8 8.1 342
184 7.19 23.2 4.3 9.0 351
185 7.11 21.3 4.5 7.9 334
186 7.01 22.0 3.6 7.1 327
187 7.31 21.5 4.7 9.4 364
188 7.02 23.1 4.1 6.8 322
189 7.25 20.7 4.6 8.7 346
190 7.12 22.4 3.5 8.2 338
191 7.09 21.9 4.2 8.2 336
192 7.16 22.5 3.9 8.4 340
193 7.20 21.7 4.1 8.6 347
194 7.08 23.5 3.8 7.8 330
195 7.32 20.5 4.2 9.8 369
196 7.14 21.2 4.3 8.1 340
197 7.05 22.8 3.6 7.4 328
198 7.25 23.2 4.4 9.3 357
199 7.19 21.6 4.6 8.7 344
200 7.10 22.7 3.5 7.9 335
201 7.16 21.8 4.2 8.4 342
202 7.29 23.1 3.8 9.3 357
203 7.01 21.3 4.3 7.9 328
204 7.18 22.2 3.9 8.5 347
205 7.14 23.4 4.7 8.8 353
206 7.25 20.6 4.5 9.2 349
207 7.05 22.5 3.7 7.5 330
208 7.20 21.9 4.6 8.1 341
209 7.10 23.0 4.1 9.0 356
210 7.33 20.9 4.4 9.7 366
211 7.07 22.1 3.8 7.7 331
212 7.21 23.3 4.3 8.9 358
213 7.23 20.8 4.2 8.6 345
214 7.16 22.6 3.6 9.1 335
215 7.28 21.2 4.5 8.3 348
216 7.09 22.9 3.9 9.4 362
217 7.22 20.5 4.6 8.2 344
218 7.04 23.0 3.7 7.8 330
219 7.35 21.6 4.4 9.5 369
220 7.08 22.3 3.8 8.0 333
221 7.26 23.2 4.3 9.6 359
222 7.03 21.1 4.2 7.6 324
223 7.15 22.7 3.9 8.9 347
224 7.19 21.4 4.5 7.8 336
225 7.11 23.5 3.6 9.2 355
226 7.01 20.7 4.7 7.2 331
227 7.31 22.4 4.4 8.7 348
228 7.02 23.0 3.8 9.3 361
229 7.25 21.8 4.6 7.5 335
230 7.12 22.3 4.1 8.8 343
231 7.16 20.8 3.9 8.3 339
232 7.29 22.7 4.5 9.4 364
233 7.01 21.4 4.2 7.7 327
234 7.18 23.2 3.6 9.1 351
235 7.14 20.9 4.4 7.9 336
236 7.25 22.6 3.8 8.4 344
237 7.05 21.1 4.7 8.2 333
238 7.20 23.4 4.3 9.5 360
239 7.10 21.9 3.9 8.7 342
240 7.33 22.5 4.6 9.9 370
241 7.07 23.3 3.8 8.0 345
242 7.21 20.8 4.5 9.3 359
243 7.23 22.3 4.1 8.9 355
244 7.16 21.6 4.4 8.1 338
245 7.28 23.1 3.7 9.6 367
246 7.09 20.4 4.6 7.5 329
247 7.22 22.0 4.3 8.6 347
248 7.04 23.2 3.9 7.8 332
249 7.35 21.5 4.7 9.7 366
250 7.08 22.6 3.8 8.2 340
251 7.26 21.3 4.5 9.2 358
252 7.03 22.2 4.2 7.6 329
253 7.15 23.0 3.6 9.1 353
254 7.19 20.6 4.4 8.5 342
255 7.11 22.5 3.9 9.4 363
256 7.01 21.2 4.6 7.8 328
257 7.31 23.3 4.1 9.2 362
258 7.02 20.9 4.5 8.7 337
259 7.25 22.8 3.8 9.5 359
260 7.12 21.4 4.3 7.9 336
261 7.16 22.1 3.9 8.3 342
262 7.29 20.8 4.6 9.2 355
263 7.01 22.3 4.3 7.7 329
264 7.18 23.0 3.7 9.1 352
265 7.14 20.5 4.5 7.9 334
266 7.25 21.3 4.2 8.4 346
267 7.05 22.6 3.8 7.5 328
268 7.20 21.2 4.7 8.1 341
269 7.10 22.9 3.9 8.7 348
270 7.33 23.4 4.6 9.8 368
271 7.07 20.6 3.8 7.7 331
272 7.21 22.1 4.5 8.9 355
273 7.23 23.3 4.2 8.6 351
274 7.16 20.8 4.3 8.0 332
275 7.28 23.0 3.6 9.4 362
276 7.09 21.9 4.5 7.8 338
277 7.22 20.5 4.4 8.5 345
278 7.04 22.8 3.7 8.2 333
279 7.35 21.4 4.6 9.7 370
280 7.08 22.2 3.9 7.9 335
281 7.26 21.0 4.5 9.3 359
282 7.03 23.2 4.2 7.6 327
283 7.15 21.1 4.1 8.3 342
284 7.19 22.5 4.3 9.0 351
285 7.11 22.9 3.8 8.0 339
286 7.01 20.9 4.6 7.2 328
287 7.31 21.6 3.9 9.2 358
288 7.02 22.2 4.4 7.4 337
289 7.25 21.8 4.1 8.9 345
290 7.12 23.5 4.5 7.9 333
291 7.16 21.3 4.0 8.3 341
292 7.29 22.4 4.7 9.2 360
293 7.01 21.0 4.5 7.7 328
294 7.18 23.2 3.9 9.1 353
295 7.14 20.9 4.4 7.9 336
296 7.25 22.5 3.8 8.4 343
297 7.05 21.1 4.3 7.5 330
298 7.20 22.9 4.6 8.1 346
299 7.10 21.8 3.9 8.7 342
300 7.33 23.1 4.5 9.8 366
301 7.07 20.7 3.8 7.7 331
302 7.21 22.6 4.5 8.9 356
303 7.23 21.2 4.2 8.6 344
304 7.16 23.0 3.6 9.1 354
305 7.28 20.8 4.5 9.5 361
306 7.09 22.3 3.9 9.4 363
307 7.22 23.2 4.3 8.5 350
308 7.04 20.6 4.4 7.8 335
309 7.35 22.1 3.7 9.7 368
310 7.08 23.4 4.6 8.2 349
311 7.26 21.3 3.9 9.2 359
312 7.03 22.0 4.2 7.6 328
313 7.15 23.1 3.6 8.9 352
314 7.19 21.4 4.3 7.8 336
315 7.11 22.7 4.5 8.3 347
316 7.01 20.8 4.6 7.1 327
317 7.31 22.5 3.8 9.4 362
318 7.02 21.2 4.7 7.5 334
319 7.25 23.0 3.9 8.7 358
320 7.12 20.9 4.4 8.2 339
321 7.16 21.7 4.1 8.3 344
322 7.29 22.8 4.8 9.2 361
323 7.01 21.4 4.6 7.7 329
324 7.18 23.1 4.0 9.1 354
325 7.14 20.7 4.4 7.9 336
326 7.25 22.3 3.8 8.4 344
327 7.05 21.0 4.3 7.5 329
328 7.20 22.9 4.7 8.1 347
329 7.10 21.8 4.0 8.7 343
330 7.33 23.2 4.6 9.8 367
331 7.07 20.8 3.8 7.7 332
332 7.21 22.4 4.5 8.9 356
333 7.23 21.2 4.2 8.6 343
334 7.16 23.0 3.6 9.1 354
335 7.28 20.9 4.5 9.5 362
336 7.09 22.5 3.9 9.4 363
337 7.22 23.3 4.3 8.5 350
338 7.04 20.7 4.4 7.8 335
339 7.35 22.6 3.7 9.7 369
340 7.08 21.3 4.6 8.2 340
341 7.26 23.1 3.9 9.2 360
342 7.03 22.0 4.2 7.6 330
343 7.15 23.2 3.6 8.9 353
344 7.19 21.4 4.3 7.8 336
345 7.11 22.7 4.5 8.3 347
346 7.01 20.8 4.6 7.1 327
347 7.31 22.5 3.8 9.4 361
348 7.02 21.2 4.7 7.5 334
349 7.25 23.0 3.9 8.7 359
350 7.12 20.9 4.4 8.2 339
351 7.16 21.7 4.1 8.3 344
352 7.29 22.8 4.8 9.2 361
353 7.01 21.4 4.6 7.7 329
354 7.18 23.1 4.0 9.1 354
355 7.14 20.7 4.4 7.9 336
356 7.25 22.3 3.8 8.4 344
357 7.05 21.0 4.3 7.5 329
358 7.20 22.9 4.7 8.1 347
359 7.10 21.8 4.0 8.7 343
360 7.33 23.2 4.6 9.8 367
361 7.07 20.8 3.8 7.7 332
362 7.21 22.4 4.5 8.9 356
363 7.23 21.2 4.2 8.6 343
364 7.16 23.0 3.6 9.1 354
365 7.28 20.9 4.5 9.5 362
366 7.09 22.5 3.9 9.4 363
367 7.22 23.3 4.3 8.5 350
368 7.04 20.7 4.4 7.8 335
369 7.35 22.6 3.7 9.7 369
370 7.08 21.3 4.6 8.2 340
371 7.26 23.1 3.9 9.2 360
372 7.03 22.0 4.2 7.6 330
373 7.15 23.2 3.6 8.9 353
374 7.19 21.4 4.3 7.8 336
375 7.11 22.7 4.5 8.3 347
376 7.01 20.8 4.6 7.1 327
377 7.31 22.5 3.8 9.4 361
378 7.02 21.2 4.7 7.5 334
379 7.25 23.0 3.9 8.7 359
380 7.12 20.9 4.4 8.2 339
381 7.16 21.7 4.1 8.3 344
382 7.29 22.8 4.8 9.2 361
383 7.01 21.4 4.6 7.7 329
384 7.18 23.1 4.0 9.1 354
385 7.14 20.7 4.4 7.9 336
386 7.25 22.3 3.8 8.4 344
387 7.05 21.0 4.3 7.5 329
388 7.20 22.9 4.7 8.1 347
389 7.10 21.8 4.0 8.7 343
390 7.33 23.2 4.6 9.8 367
391 7.07 20.8 3.8 7.7 332
392 7.21 22.4 4.5 8.9 356
393 7.23 21.2 4.2 8.6 343
394 7.16 23.0 3.6 9.1 354
395 7.28 20.9 4.5 9.5 362
396 7.09 22.5 3.9 9.4 363
397 7.22 23.3 4.3 8.5 350
398 7.04 20.7 4.4 7.8 335
399 7.35 22.6 3.7 9.7 369
400 7.08 21.3 4.6 8.2 340
401 7.26 23.1 3.9 9.2 360
402 7.03 22.0 4.2 7.6 330
403 7.15 23.2 3.6 8.9 353
404 7.19 21.4 4.3 7.8 336
405 7.11 22.7 4.5 8.3 347
406 7.01 20.8 4.6 7.1 327
407 7.31 22.5 3.8 9.4 361
408 7.02 21.2 4.7 7.5 334
409 7.25 23.0 3.9 8.7 359
410 7.12 20.9 4.4 8.2 339
411 7.16 21.7 4.1 8.3 344
412 7.29 22.8 4.8 9.2 361
413 7.01 21.4 4.6 7.7 329
414 7.18 23.1 4.0 9.1 354
415 7.14 20.7 4.4 7.9 336
416 7.25 22.3 3.8 8.4 344
417 7.05 21.0 4.3 7.5 329
418 7.20 22.9 4.7 8.1 347
419 7.10 21.8 4.0 8.7 343
420 7.33 23.2 4.6 9.8 367
421 7.07 20.8 3.8 7.7 332
422 7.21 22.4 4.5 8.9 356
423 7.23 21.2 4.2 8.6 343
424 7.16 23.0 3.6 9.1 354
425 7.28 20.9 4.5 9.5 362
426 7.09 22.5 3.9 9.4 363
427 7.22 23.3 4.3 8.5 350
428 7.04 20.7 4.4 7.8 335
429 7.35 22.6 3.7 9.7 369
430 7.08 21.3 4.6 8.2 340
431 7.26 23.1 3.9 9.2 360
432 7.03 22.0 4.2 7.6 330
433 7.15 23.2 3.6 8.9 353
434 7.19 21.4 4.3 7.8 336
435 7.11 22.7 4.5 8.3 347
436 7.01 20.8 4.6 7.1 327
437 7.31 22.5 3.8 9.4 361
438 7.02 21.2 4.7 7.5 334
439 7.25 23.0 3.9 8.7 359
440 7.12 20.9 4.4 8.2 339
441 7.16 21.7 4.1 8.3 344
442 7.29 22.8 4.8 9.2 361
443 7.01 21.4 4.6 7.7 329
444 7.18 23.1 4.0 9.1 354
445 7.14 20.7 4.4 7.9 336
446 7.25 22.3 3.8 8.4 344
447 7.05 21.0 4.3 7.5 329
448 7.20 22.9 4.7 8.1 347
449 7.10 21.8 4.0 8.7 343
450 7.33 23.2 4.6 9.8 367
451 7.07 20.8 3.8 7.7 332
452 7.21 22.4 4.5 8.9 356
453 7.23 21.2 4.2 8.6 343
454 7.16 23.0 3.6 9.1 354
455 7.28 20.9 4.5 9.5 362
456 7.09 22.5 3.9 9.4 363
457 7.22 23.3 4.3 8.5 350
458 7.04 20.7 4.4 7.8 335
459 7.35 22.6 3.7 9.7 369
460 7.08 21.3 4.6 8.2 340
461 7.26 23.1 3.9 9.2 360
462 7.03 22.0 4.2 7.6 330
463 7.15 23.2 3.6 8.9 353
464 7.19 21.4 4.3 7.8 336
465 7.11 22.7 4.5 8.3 347
466 7.01 20.8 4.6 7.1 327
467 7.31 22.5 3.8 9.4 361
468 7.02 21.2 4.7 7.5 334
469 7.25 23.0 3.9 8.7 359
470 7.12 20.9 4.4 8.2 339
471 7.16 21.7 4.1 8.3 344
472 7.29 22.8 4.8 9.2 361
473 7.01 21.4 4.6 7.7 329
474 7.18 23.1 4.0 9.1 354
475 7.14 20.7 4.4 7.9 336
476 7.25 22.3 3.8 8.4 344
477 7.05 21.0 4.3 7.5 329
478 7.20 22.9 4.7 8.1 347
479 7.10 21.8 4.0 8.7 343
480 7.33 23.2 4.6 9.8 367
481 7.07 20.8 3.8 7.7 332
482 7.21 22.4 4.5 8.9 356
483 7.23 21.2 4.2 8.6 343
484 7.16 23.0 3.6 9.1 354
485 7.28 20.9 4.5 9.5 362
486 7.09 22.5 3.9 9.4 363
487 7.22 23.3 4.3 8.5 350
488 7.04 20.7 4.4 7.8 335
489 7.35 22.6 3.7 9.7 369
490 7.08 21.3 4.6 8.2 340
491 7.26 23.1 3.9 9.2 360
492 7.03 22.0 4.2 7.6 330
493 7.15 23.2 3.6 8.9 353
494 7.19 21.4 4.3 7.8 336
495 7.11 22.7 4.5 8.3 347
496 7.01 20.8 4.6 7.1 327
497 7.31 22.5 3.8 9.4 361
498 7.02 21.2 4.7 7.5 334
499 7.25 23.0 3.9 8.7 359
500 7.12 20.9 4.4 8.2 339

Correlaciones

Antes de poder trabajar cada variable es necesario poder hacer sus respectivas correlaciones, ya que aquí es donde podemos observar el comportamiento que tienen unas con otras, ayudándonos más en el análisis y dándonos una mejor guía para trabajar las hipótesis previamente establecidas.

Datos estadísticos

summary(datos)
##    Sample_ID           pH        Temperature_Celcius Turbidity_NTU  
##  Min.   :  1.0   Min.   :6.830   Min.   :20.30       Min.   :3.100  
##  1st Qu.:125.8   1st Qu.:7.080   1st Qu.:21.20       1st Qu.:3.800  
##  Median :250.5   Median :7.160   Median :22.20       Median :4.200  
##  Mean   :250.5   Mean   :7.161   Mean   :22.05       Mean   :4.169  
##  3rd Qu.:375.2   3rd Qu.:7.250   3rd Qu.:22.90       3rd Qu.:4.500  
##  Max.   :500.0   Max.   :7.480   Max.   :23.60       Max.   :5.100  
##  Dissolved_Oxygen_mgL Conductivity_microsegundocm
##  Min.   :6.000        Min.   :316.0              
##  1st Qu.:7.800        1st Qu.:333.0              
##  Median :8.400        Median :344.0              
##  Mean   :8.382        Mean   :344.4              
##  3rd Qu.:9.100        3rd Qu.:355.0              
##  Max.   :9.900        Max.   :370.0

Como se puede observar, para las variables que queremos cubrir podemos determinar que los rangos en los que debe encontrarse el pH son los adecuados, ya que, el más bajo es de 6.8 y el más alto de 7.4, lo que nos indica que está en rango aceptable para poder ser usada la muestra. Pasando lo mismo con la conductividad, la cual se encuentra en un rango de 316 y 370, siendo valores que están dentro de los márgenes aceptados para poder usar esa agua.

Valores atípicos

Tenemos que asegurarnos que cada muestra esté dentro del rango permitido para uso doméstico, por lo cual es necesario encontrar esos valores atípicos que nos puede arrojar luz sobre las muestras y ver, además, con las cantidades de concentración que tengan,cómo pueden afectar.

Los valores encontrados son los siguientes mostrados en el siguiente gráfico:

De ellos podemos determinar que sus valores, tanto atípicos como comunes están todos dentro del rango permitido antes mencionado para que las muestras puedan ser utilizadas, por lo que usarlos para su análisis microbiológico está permitido. Por otra parte, si analizamos cada uno de los valores atípicos, se llega ver que no suponen riesgo para su uso doméstico, y que, además, pueden llegar a ser incluso tratados para limpiarlos más y hacerlos completamente seguros, para darle una seguridad aún mayor para su consumo normal. Ahora bien, explicando un poco más lo que significan los valores atípicos encontrados, se aprecia que, los valores más altos significan que pueden existir algún tipo de minerales y que el agua es alcalina pero no a niveles exagerados, por el contrario, entra en valores de neutralidad, pero pueden ser utilizados incluso en ambientes agrícolas y uso doméstico. Mientras que, los que están más bajos nos indican una ligera acidez en el agua y posible presencia de CO2 y/o algún tipo de bicarbonato y algunos minerales, pero ninguno representa un riesgo para su uso, por lo cual también son seguros de utilizar para su siguiente evaluación.

Ahora bien, se presenta además un pequeño gráfico de dispersión, con el fin de observar la tendencia de las muestras:

Preparación para Cluster

Es necesario el poder agrupar primeramente por cluster, ya que así se puede observar las similitudes que comparten las muestras, por lo que tomamos los métodos WSS, SILHOUETTE y GAP_STAT para determinar cuál de ellos es más adecuado en nuestro caso.

En el caso del algoritmo para clúster, se determinó utilizar el segundo, el de SILHOUETTE, ya que nuestro caso de estudio requiere no mucha agrupación, por lo que se divide en dos para observar el agrupamiento de las muestras, dándonos cuenta de que hay muestras que comparten características en ambos espacios seccionados, por lo que es de tipo jerárquico.

Preparación para Modelo de Regresión Lineal

En este caso, el mejor modelo que se puede aplicar es el de regresión lineal, ya que nos ayuda a explicar el comportamiento, en este caso, de pH y conductividad, y como se puede observar en la imagen de abajo:

## 
## Call:
## lm(formula = Conductivity_microsegundocm ~ pH, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -45.795  -5.431  -0.270   6.716  38.060 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -232.409     29.090  -7.989  9.5e-15 ***
## pH            80.542      4.062  19.829  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 9.757 on 498 degrees of freedom
## Multiple R-squared:  0.4412, Adjusted R-squared:  0.4401 
## F-statistic: 393.2 on 1 and 498 DF,  p-value: < 2.2e-16

Se sabe que es cierto que el pH influye en el comportamiento que pueda presentar la conductividad en el análisis, pero que, de cierto modo, hay algo que le falta al análisis para poder estabilizar de una forma más eficaz el modelo y los resultados.

¿Tercera variable?

Otro de los factores que también nos pueden ayudar a determinar si una muestra de agua puede ser utilizada para uso humano es la temperatura, ya que esta suele afectar algunos otros niveles.

Debido a lo anterior es que se decide poner a funcionar la variable temperatura, ya que, como es bien sabido, con los cambios de temperatura también pueden cambiar algunas de las variables. Al ejecutar para obtener los resultados obtenemos los siguientes:

summary(modelo_temperatura)
## 
## Call:
## lm(formula = Conductivity_microsegundocm ~ pH + Temperature_Celcius, 
##     data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -44.364  -4.289   0.567   4.804  38.206 
## 
## Coefficients:
##                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)         -273.6294    28.4896  -9.605  < 2e-16 ***
## pH                    76.4492     3.9335  19.435  < 2e-16 ***
## Temperature_Celcius    3.1979     0.4683   6.828 2.52e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 9.338 on 497 degrees of freedom
## Multiple R-squared:  0.4891, Adjusted R-squared:  0.4871 
## F-statistic: 237.9 on 2 and 497 DF,  p-value: < 2.2e-16

Siendo que, juntando las variables de pH y temperatura es mucho más exacto poder predecir y relacionar el comportamiento de la conductividad, tal como se muestra en el siguiente gráfico:

## `geom_smooth()` using formula = 'y ~ x'

Conclusiones

Gracias a todo el análisis que se ha podido realizar para poder garantizar la calidad de las muestras de agua, es que se llega a la conclusión de que todas las muestras pueden ser utilizadas para su análisis microbiológico y que posteriormente se le dé un uso a las fuentes de las que fueron tomadas para el uso diario en la vida cotidiana humana.

También se pudo observar que los valores en las muestras no exceden a los criterios establecidos para su uso, por lo cual, suponen una ventaja en temas ambientales. Por otra parte, el hecho de que durante el análisis se haya tenido que incorporar otra variable para ver los resultados que se querían es otra forma de analizar la información sobre la marcha, ya que, como se pudo observar, en ciertos casos es necesaria la interacción de más variables para que se pueda dar una mejor solución, como lo fue en este caso, ya que originalmente solo se utilizarían las variables de pH y conductividad, pero a la hora de avanzar la temperatura también jugaba un papel dentro del análisis.

Ahora bien, como recomendaciones, se puede mencionar que no se deberían descartar aquellas muestras que posean valores atípicos, ya que estas incluso, nos pueden dar una buena calidad del agua para ser usada. Por otra parte, si se considera que no se utilizarán para prevenir factores tal vez no deseados, se recomienda también, hacer un análisis más detallado para poder determinar los factores que están incluyendo en su calidad, y así, ver si es necesario, si se encontrara algún factor alarmante se puede comunicar a las autoridades correspondientes para determinar el proseguir.