E1U1

Marcia Tatiana Garcia Hinostro

30/10/2021

EXAMEN DE UNIDAD DE COMPETENCIA 1

Preguntas argumentadas (PRIMERA SECCIÓN)

¿Qué es la estadística y que aplicaciones tiene en ingeniería (según su ingeniería)? La estadistica es una ciencia rama de las matematicas que nos permite obtener resultados a partir de datos númericos aplicando las leyes de probabilidad. Nos ayuda a analizar la información, comprenderla y asímismo extraer de ella conclusiones relevantes. La estadística en la ingenieria es aplicada en la resolución de problemas ya sean productivos, baja en el número de errores por proceso, obtimización de tiempos, rutas de producción más favorables para reducción de costos y personal. En pocas palabras para comprender procesos y la variabilidad. En la ingenieria química por ejemplo, la estadistica es utilizada en la realización de pruebas de un producto en cualquier industría de mercado sea farmaceutica, alimentaria,etc.Facilita al momento de lanzar un producto a la venta, al existir una empresa y mejorar dicho producto o simplemente tambien es util para llevar un control del proceso. Y una de las principales es en la aplicación de modelos termodinamicos ya que la estadistica es utilizada para analizar los comportamientos de un estudio teorico y comprenderlo para que sea más practico.

Enliste y defina los tipos de variables usados en estadística, de 2 ejemplos de cada uno.

Las variables en estadistica puesden ser cualitativas o cuantitativas, las primeras expresan caracteristicas, ejemplo; sexo, estado civil, lugar de nacimiento, etc, y las cuantitativas son expresadas en magnitudes o numeros, ejemplo; edad, altura, peso, etc.

Defina distribución de frecuencia y explique que es la distribución normal. la distribucióm de frecuencias nos indica en una tabla cuantas veces se da una ocurrencia para un valor, ayudando a contabilizar de una manera mas sencilla el total de esos datos. la distribucion normal nos ayuda a aproximar valores de una variable a una situacion ideal, esta situacion depende de una función que involucra la media y la desviacion tipica.

Importar datos

Se importan los datos de pH y Temperatura de pozos de agua subterranea Se elaborarán estos incisos 1 vez para pH y otra para Temperatura.

Paquetes a utilizar

library(pacman)
p_load(rmdformats,readr,readxl,ggplot2,plotly,DT,xfun,gridExtra,leaflet)

library(pacman)
p_load(rmdformats,readr,readxl,ggplot2,plotly,DT,xfun,gridExtra,leaflet,fdth,modeest,dplyr)
library(readxl)
pozos <- read_excel("pozos.xlsx")
View(pozos)

PH <- (pozos$PH)
TEMP <- (pozos$TEMP)

datatable(pozos)
View(pozos)

A) Ordene los datos de menor a mayor, indique el valor máximo / mínimo y el rango total de datos

sort(pozos$"PH", decreasing = FALSE) 
##   [1] 6.1 6.3 6.4 6.4 6.4 6.4 6.4 6.4 6.4 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5
##  [19] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
##  [37] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.7 6.7 6.7 6.7 6.7
##  [55] 6.7 6.7 6.7 6.7 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
##  [73] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
##  [91] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [109] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [127] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 7.0 7.0
## [163] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [181] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [199] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [217] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [235] 7.0 7.0 7.0 7.0 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [253] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.2 7.2
## [271] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.3 7.3 7.3 7.3 7.3 7.3 7.4 7.4
## [289] 7.4 7.4 7.4 7.4 7.5

Aqui se acomodaron los datos de menor a mayor para una mejor visualizacion de estos ## Ordenar datos de PH mayor a menor

 sort(pozos$"PH", decreasing = TRUE) 
##   [1] 7.5 7.4 7.4 7.4 7.4 7.4 7.4 7.3 7.3 7.3 7.3 7.3 7.3 7.2 7.2 7.2 7.2 7.2
##  [19] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
##  [37] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
##  [55] 7.1 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
##  [73] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
##  [91] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [109] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [127] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [163] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.8 6.8 6.8
## [181] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [199] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [217] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [235] 6.8 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
## [253] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.5 6.5 6.5
## [271] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.4 6.4 6.4 6.4
## [289] 6.4 6.4 6.4 6.3 6.1

Aqui se acomodaron los datos de mayor a menor para una mejor visualizacion de estos

Ordenar datos de temperatura menor a mayor

sort(pozos$"TEMP", decreasing = FALSE) 
##   [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
##  [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
##  [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
##  [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
##  [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
##  [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
##  [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1

Aqui se acomodaron los datos de temperatura de menor a mayor para una mejor visualizacion de estos

Ordenar datos de temperatura mayor a menor

sort(pozos$"TEMP", decreasing = TRUE) 
##   [1] 32.1 31.9 31.7 31.5 31.4 31.2 31.1 31.1 31.1 30.9 30.8 30.6 30.5 30.4 30.3
##  [16] 30.3 30.3 30.3 30.2 30.2 30.2 30.1 30.1 30.1 30.1 30.0 30.0 30.0 30.0 30.0
##  [31] 30.0 29.9 29.9 29.9 29.9 29.8 29.8 29.8 29.8 29.8 29.8 29.7 29.7 29.6 29.6
##  [46] 29.6 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.4 29.4 29.4 29.4 29.4
##  [61] 29.4 29.4 29.4 29.4 29.4 29.4 29.3 29.3 29.3 29.3 29.2 29.2 29.2 29.2 29.2
##  [76] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.1 29.1 29.1 29.1 29.1 29.1
##  [91] 29.1 29.1 29.1 29.1 29.1 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [106] 29.0 29.0 29.0 29.0 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [121] 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [136] 28.8 28.8 28.8 28.8 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [166] 28.6 28.6 28.6 28.6 28.6 28.6 28.5 28.5 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [181] 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.3 28.3 28.3 28.3 28.3 28.3 28.3 28.2
## [196] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.1 28.1 28.1 28.0
## [211] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
## [226] 28.0 28.0 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
## [241] 27.9 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.7 27.7 27.7
## [256] 27.7 27.6 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.4
## [271] 27.4 27.4 27.4 27.4 27.3 27.3 27.3 27.3 27.2 27.2 27.1 27.0 27.0 26.9 26.8
## [286] 26.8 26.4 26.4 26.3 26.3 26.2 25.8 25.6

rango total de datos de pH (min-max)

min(pozos$"PH")
## [1] 6.1

Maximo PH

max(pozos$"PH")
## [1] 7.5

Minimo Temperatura

min(pozos$"TEMP")
## [1] 25.6

Maximo Temperatura

max(pozos$"TEMP")
## [1] 32.1

Rango total de los datos

rango <- range(pozos) 
rango
## [1]  6.1 32.1

Rango PH

rangoph <- range(pozos$"PH") 
rangoph
## [1] 6.1 7.5

Rango Temperatura

rangotemp<- range(pozos$"TEMP") 
rangotemp
## [1] 25.6 32.1

B) Obtenga (el número de) los intervalos (o clases) usando la fórmula según Surges y el ancho de clase.

Numero de intervalos utilizando la formula de surges y el ancho de clase

\(k=1+log10(N)\) \(I= √(n)\)

# ancho de clase 
#K= 1+log10(293)
#K= 3.466
# numero de intervalos 
#I= sqrt(n)
#I= sqrt(293)
#I= 17.117

C) Construya una tabla de frecuencias que incluya: límites de clases, frecuencia absoluta, frecuencia relativa, frecuencia relativa porcentual, frecuencia acumulada y explique a detalle que refleja esta tabla.

Frecuencia absoluta

abs.pH<-table(pozos$PH)

#Frecuencia relativa

rel.pH<-(abs.pH/margin.table(abs.pH))
rel.pH
## 
##         6.1         6.3         6.4         6.5         6.6         6.7 
## 0.003412969 0.003412969 0.023890785 0.058020478 0.078498294 0.030716724 
##         6.8         6.9           7         7.1         7.2         7.3 
## 0.197952218 0.150170648 0.266211604 0.102389078 0.040955631 0.020477816 
##         7.4         7.5 
## 0.020477816 0.003412969

Frecuencia relativa porcentual

(rel.pH*100)
## 
##        6.1        6.3        6.4        6.5        6.6        6.7        6.8 
##  0.3412969  0.3412969  2.3890785  5.8020478  7.8498294  3.0716724 19.7952218 
##        6.9          7        7.1        7.2        7.3        7.4        7.5 
## 15.0170648 26.6211604 10.2389078  4.0955631  2.0477816  2.0477816  0.3412969

D) Elabore un histograma, polígono de frecuencias, histograma de frecuencias acumulado.

library(fdth)
tabla <- fdt(pozos)
tabla
## PH 
##   Class limits   f   rf rf(%)  cf  cf(%)
##  [6.039,6.193)   1 0.00  0.34   1   0.34
##  [6.193,6.346)   1 0.00  0.34   2   0.68
##    [6.346,6.5)   7 0.02  2.39   9   3.07
##    [6.5,6.653)  40 0.14 13.65  49  16.72
##  [6.653,6.807)  67 0.23 22.87 116  39.59
##  [6.807,6.961)  44 0.15 15.02 160  54.61
##  [6.961,7.114) 108 0.37 36.86 268  91.47
##  [7.114,7.268)  12 0.04  4.10 280  95.56
##  [7.268,7.421)  12 0.04  4.10 292  99.66
##  [7.421,7.575)   1 0.00  0.34 293 100.00
## 
## TEMP 
##     Class limits  f   rf rf(%)  cf  cf(%)
##  [25.344,26.052)  2 0.01  0.68   2   0.68
##  [26.052,26.759)  5 0.02  1.71   7   2.39
##  [26.759,27.467) 17 0.06  5.80  24   8.19
##  [27.467,28.175) 63 0.22 21.50  87  29.69
##  [28.175,28.883) 79 0.27 26.96 166  56.66
##   [28.883,29.59) 81 0.28 27.65 247  84.30
##   [29.59,30.298) 28 0.10  9.56 275  93.86
##  [30.298,31.006)  9 0.03  3.07 284  96.93
##  [31.006,31.713)  7 0.02  2.39 291  99.32
##  [31.713,32.421)  2 0.01  0.68 293 100.00

Graficos para datos de pH

plot(tabla,type='fh')

Poligono de frecuencia segun sturge

plot(tabla,type='fp')

Histograma de frecuencias acumulado

plot(tabla, type = 'cfh') 

Poligono de frecuencia acumulada

plot(tabla, type= 'cfp') 

E) Obtenga la media, mediana, moda e interprete los resultados.

Media pH

mean(pozos$PH)
## [1] 6.890444

Un valor que nos indica que la mayoria de los datos tiende a tener un valor cercano o proximo a 6.89, como se puede observar con la mediana, el valor central de los datos, se acerca mucho a la media registrada.

mediana PH

median(pozos$"PH")
## [1] 6.9

Este valor se encuentra muy cercano a los valores de media y moda, por lo cual se puede tomar como representativo, al estar justo al medio de los datos ordenados, nos dice como pueden comportarse los demas datos.

moda PH

library(modeest)
mlv(pozos$"PH", method= "mfv")
## [1] 7

El valor de la moda es 7. Lo cual nos dice que es el dato que mas se presenta en el analisis de las muestras de agua de pozo.

media Temperatura

mean(pozos$"TEMP")
## [1] 28.69795

Es un valor que nos indica que la mayoria de los datos tiende a tener un valor cercano o proximo a 28.69, como se puede observar con la mediana, el valor central de los datos, se acerca mucho a la media registrada.

mediana Temperatura

median(pozos$"TEMP")
## [1] 28.7

Este valor se encuentra muy cercano a los valores de media, por lo cual se puede tomar como representativo, al estar justo al medio de los datos ordenados, nos dice como pueden comportarse los demas datos.

moda Temperatura

library(modeest)
mlv(pozos$"TEMP", method= "mfv")
## [1] 28.6

El dato de 28.6, se encuentra entre los que mas fueron analizados para sacar un pH

F) Obtenga la varianza y la desviación estándar, interprete los resultados. ¿Pueden estas medidas ser negativas?

Varianza y desviacion estandar

var(tabla)
## $PH
## [1] 0.04936057
## 
## $TEMP
## [1] 1.065229
sd(tabla)
## $PH
## [1] 0.2221724
## 
## $TEMP
## [1] 1.032099

La varianza resulto ser pequeña, al tener un rango muy corto entre los datos, en este caso fue de 0.049, indicando que entre datos hay poca varicion de la unidad medida. No sería posible una varianza y desviacion estandar negativas porque es calculada mediante cuadrados.

La desviacion estandar nos indica que los datos se alejan en promedio 0.221 de la media calculada de pH y de temperatura de 1.032. Los datos fueron registrados a diversas temperaturas ambientales, y por lo mismo, no hay cambios bruscos de temperatura entre los datos, obteniendo una varianza de 1.03 en mi punto de vista muy razonable.

G) Elabore gráfico de caja y bigote

Grafico de caja y bigotes para pH

summary(pozos)
##        PH            TEMP     
##  Min.   :6.10   Min.   :25.6  
##  1st Qu.:6.80   1st Qu.:28.0  
##  Median :6.90   Median :28.7  
##  Mean   :6.89   Mean   :28.7  
##  3rd Qu.:7.00   3rd Qu.:29.2  
##  Max.   :7.50   Max.   :32.1
boxplot(pozos$PH, col="indianred1")

boxplot(pozos$PH, col="lightseagreen")

## H) Elabora una gráfica de dispersión de pH versus temperatura, use ggplot aquí. En base a esta gráfica: ¿Considera que estas 2 variables están relacionadas?

Grafica de dispersion de PH vs temperatura

pairs(pozos)

Diagrma de dispersion pH vs temperatura

plot(x = pozos$PH, y = pozos$TEMP)

Se puede analizar que cuando la temperatura fue tomada entre los 27.5 y 29.5 datos, es cuando el pH de entre 6.8 y 7.0 fue registrado, indicando que hay una relacion en el nivel de pH respecto a la temperatura.

Pregunta de rescate (opcional): Mini ensayo de mínimo media y máximo una cuartilla contestando a la pregunta: ¿De qué manera o maneras reales puede México ser un país más desarrollado? Elaboren y argumenten su propuesta o propuesta. (Use datos para fundamentarse)

El crecimiento económico sostenido, en México no se ha alcanzado, crecimiento que me parecen tendrían que estar oscilando entre 4 y 5%, en un periodo de más de 20 años”, especialista con Forbes México.

Según Forbes México nuestro pais una de las principales caracteristicas por cual México no se ha desarrollado como potencia mundial viene de la problematica del crecimiento economico . Qué en mi opinión estoy completamente de acuerdo ya que el país no cuenta con un sistema productivo nacional alto con empresas nacionales capaz de competir en el mercado interno y externo. Es demasiado dinero que se va de las manos a países extranjeros y todo porqué la mayoría del dinero esta mal utilizado, si se invirtiera más en innovación tecnologica, en educación de alta calidad México sería un país mas desarrollado.