title: "E1U1" author: "ana" date: "23 de octubre de 2020" output: html_document
La estadística en ingeniera química juega un papel importe ya que en ella podemos determinar parámetros involucrados en el estudio de un proceso, hacer diversas formas varias veces con diferentes presiones, temperaturas, concentraciones etc., para saber cuál es la más indicada para el proceso y con ello tener un resultado adecuado y de calidad. Por otra parte la producción química tiene su costado económico y financiero que también requiere mucho uso de estadística. Hay modelos estadísticos que usan variables aleatorias, por ejemplo para modelar procesos de difusión o para resolver ecuaciones diferenciales. En si es muy importante saber el estudio de la estadística porque es importante para mi carrera
La variable estadística, de acuerdo con las características que la definen, puede ser cualitativa o cuantitativa. Las variables cualitativas son aquellas características o cualidades que no pueden ser calculadas con números, sino que son clasificadas con palabras.
Tres ejemplos de esto son
Cualitativa nominal: aquellas variables que no siguen ningún orden en específico. Por ejemplo, los colores, tales como el negro, naranja o amarillo.
Cualitativa ordinal: aquellas que siguen un orden o jerarquía. Por ejemplo, el nivel socioeconómico alto, medio o bajo.
Cualitativa binaria: variables que permiten tan solo dos resultados. Por ejemplo, sí o no; hombre o mujer. Las variables cuantitativas son aquellas características o cualidades que sí pueden expresarse o medirse a través de números.
Dos ejemplos
Cuantitativa discreta: aquella variable que utiliza valores enteros y no finitos. Por ejemplo, la cantidad de familiares que tiene una persona, tal como 2, 3, 4 o más.
Cuantitativa continua: aquella variable que utiliza valores finitos y objetivos, y suele caracterizarse por utilizar valores decimales. Por ejemplo, el peso de una persona, tal como 64.3 kg, 72.3 kg, etc.
library(prettydoc)
library(readr)
library(DT)
library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
library(readr)
pozos <- read_csv("pozos.csv")
##
## -- Column specification -------------------------------------------------------------
## cols(
## PH = col_double(),
## TEMP = col_double()
## )
View(pozos)
Se elaborarán estos incisos 1 vez para pH y otra para Temperatura
**A) Ordene los datos de menor a mayor, indique el valor máximo / mínimo y el rango total de datos.
Ph<-(pozos$PH)
Temp<-(pozos$TEMP)
# Datos para el PH
## Ordenar los datos de menor a mayor
sort(Ph)
## [1] 6.1 6.3 6.4 6.4 6.4 6.4 6.4 6.4 6.4 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5
## [19] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
## [37] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.7 6.7 6.7 6.7 6.7
## [55] 6.7 6.7 6.7 6.7 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [73] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [91] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [109] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [127] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 7.0 7.0
## [163] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [181] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [199] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [217] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [235] 7.0 7.0 7.0 7.0 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [253] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.2 7.2
## [271] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.3 7.3 7.3 7.3 7.3 7.3 7.4 7.4
## [289] 7.4 7.4 7.4 7.4 7.5
## Valor Minimo
min(Ph)
## [1] 6.1
## Valor Maximo
max(Ph)
## [1] 7.5
## Rango total de datos
R1<-range(Ph)
# Datos para la Temperatura
## Ordenar los datosde menor a mayor
sort(Temp)
## [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
## [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
## [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
## [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
## [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
## [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
## [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1
## Valor Minimo
min(Temp)
## [1] 25.6
## Valor Maximo
max(Temp)
## [1] 32.1
## Rango total de datos
R<-range(Temp)
**B) Obtenga (el número de) los intervalos (o clases) usando la fórmula según Surges y el ancho de clase.
# Numero de intervalos para el Ph
K1<-nclass.Sturges(Ph)
K1
## [1] 10
# Ancho de clase para el Ph
round(R1/K1, 1)
## [1] 0.6 0.8
# Numero de intervalos para la Temperatura
K<-nclass.Sturges(Temp)
K
## [1] 10
# Ancho de clase para el Temperatura
round(R/K, 1)
## [1] 2.6 3.2
**C) Construya una tabla de frecuencias que incluya: límites de clases, frecuencia absoluta, frecuencia relativa, frecuencia relativa porcentual, frecuencia acumulada y explique a detalle que refleja esta tabla.
# Tabla de frecuencias para el Ph
library(fdth)
Datos <- fdt(pozos, breaks="Sturge")
Datos
## PH
## Class limits f rf rf(%) cf cf(%)
## [6.039,6.193) 1 0.00 0.34 1 0.34
## [6.193,6.346) 1 0.00 0.34 2 0.68
## [6.346,6.5) 7 0.02 2.39 9 3.07
## [6.5,6.653) 40 0.14 13.65 49 16.72
## [6.653,6.807) 67 0.23 22.87 116 39.59
## [6.807,6.961) 44 0.15 15.02 160 54.61
## [6.961,7.114) 108 0.37 36.86 268 91.47
## [7.114,7.268) 12 0.04 4.10 280 95.56
## [7.268,7.421) 12 0.04 4.10 292 99.66
## [7.421,7.575) 1 0.00 0.34 293 100.00
##
## TEMP
## Class limits f rf rf(%) cf cf(%)
## [25.344,26.052) 2 0.01 0.68 2 0.68
## [26.052,26.759) 5 0.02 1.71 7 2.39
## [26.759,27.467) 17 0.06 5.80 24 8.19
## [27.467,28.175) 63 0.22 21.50 87 29.69
## [28.175,28.883) 79 0.27 26.96 166 56.66
## [28.883,29.59) 81 0.28 27.65 247 84.30
## [29.59,30.298) 28 0.10 9.56 275 93.86
## [30.298,31.006) 9 0.03 3.07 284 96.93
## [31.006,31.713) 7 0.02 2.39 291 99.32
## [31.713,32.421) 2 0.01 0.68 293 100.00
DatosT<- fdt(pozos, breaks="Sturge")
DatosT
## PH
## Class limits f rf rf(%) cf cf(%)
## [6.039,6.193) 1 0.00 0.34 1 0.34
## [6.193,6.346) 1 0.00 0.34 2 0.68
## [6.346,6.5) 7 0.02 2.39 9 3.07
## [6.5,6.653) 40 0.14 13.65 49 16.72
## [6.653,6.807) 67 0.23 22.87 116 39.59
## [6.807,6.961) 44 0.15 15.02 160 54.61
## [6.961,7.114) 108 0.37 36.86 268 91.47
## [7.114,7.268) 12 0.04 4.10 280 95.56
## [7.268,7.421) 12 0.04 4.10 292 99.66
## [7.421,7.575) 1 0.00 0.34 293 100.00
##
## TEMP
## Class limits f rf rf(%) cf cf(%)
## [25.344,26.052) 2 0.01 0.68 2 0.68
## [26.052,26.759) 5 0.02 1.71 7 2.39
## [26.759,27.467) 17 0.06 5.80 24 8.19
## [27.467,28.175) 63 0.22 21.50 87 29.69
## [28.175,28.883) 79 0.27 26.96 166 56.66
## [28.883,29.59) 81 0.28 27.65 247 84.30
## [29.59,30.298) 28 0.10 9.56 275 93.86
## [30.298,31.006) 9 0.03 3.07 284 96.93
## [31.006,31.713) 7 0.02 2.39 291 99.32
## [31.713,32.421) 2 0.01 0.68 293 100.00
**D) Elabore un histograma, polígono de frecuencias, histograma de frecuencias acumulado.
# Histograma Ph
hist(Ph, col="pink4")
# Poligono de frecuencias Ph
plot(Datos, type="fp", col='pink4', main="Poligono de frecuencias")
# Histograma de frecuencias acumulado Ph
plot(Datos, type="cfh", col='pink4',main="Histograma de frecuencias acumuladas")
# Histograma Temperatura
hist(Temp, col="pink3")
# Poligono de frecuencias Temperatura
plot(DatosT, type="fp", col='pink3', main="Poligono de frecuencias")
# Histograma de frecuencias acumulado Temperatura
plot(DatosT, type="cfh", col='pink3',main="Histograma de frecuencias acumuladas")
**E) Obtenga la media, mediana, moda e interprete los resultados.
# Media Ph
mean(Ph)
## [1] 6.890444
# Mediana Ph
median(Ph)
## [1] 6.9
#Moda Ph
mfv(Ph)
## [1] 7
# Media Temperatura
mean(Temp)
## [1] 28.69795
# Mediana Temperatura
median(Temp)
## [1] 28.7
#Moda Temperatura
mfv(Temp)
## [1] 28.6
**F) Obtenga la varianza y la desviación estándar, interprete los resultados. ¿Pueden estas medidas ser negativas?
respuesta: no,cuando salen negativos es cuando esto no es real
# Varianza Ph
var(Ph)
## [1] 0.04908645
# Desviacion Estandar Ph
sd(Ph)
## [1] 0.2215546
# Varianza Temperatura
var(Temp)
## [1] 1.035407
# Desviacion Estandar Temperatura
sd(Temp)
## [1] 1.017549
**G) Elabore gráfico de caja y bigote
boxplot(Ph, col="blue4", main="Caja y Bigote PH")
boxplot(Temp, col="blue3", main="Caja y Bigote Temperatura")
**H) Elabora una gráfica de dispersión de pH versus temperatura, use ggplot aquí. En base a esta gráfica: ¿Considera que estas 2 variables están relacionadas?
hay un punto que si estan relacionadas ya que cuando sube la temperatura los casos en los que es acido aumentan y se observa que la linea se ve en alza mientras la temperatura sube.
# Grafica de dispersion
library(ggplot2)
ggplot(data = pozos)+geom_point(mapping = aes(x=Temp, y=Ph),col='violetred4',lwd=2)
#Regresion Temp vs Ph
regresion <- lm(PH ~ TEMP, data=pozos)
summary(regresion)
##
## Call:
## lm(formula = PH ~ TEMP, data = pozos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.78955 -0.09220 0.01089 0.11089 0.59587
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.017231 0.366448 19.149 <2e-16 ***
## TEMP -0.004418 0.012761 -0.346 0.729
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2219 on 291 degrees of freedom
## Multiple R-squared: 0.0004117, Adjusted R-squared: -0.003023
## F-statistic: 0.1199 on 1 and 291 DF, p-value: 0.7294
plot(pozos$TEMP, pozos$PH, xlab="Temperatura del pozo", ylab="pH", col="violetred3", lwd=2, main="Regresion Temp vs Ph")
abline(regresion)
# Representacion grafica de los datos ALCALINOS/NEUTROS (0) y ACIDOS (1)
PHB<-(pozos$PHB)
## Warning: Unknown or uninitialised column: `PHB`.
table(pozos$PHB)
## Warning: Unknown or uninitialised column: `PHB`.
## < table of extent 0 >
colores <- NULL
colores[pozos$PHB==0] <- "turquoise3"
## Warning: Unknown or uninitialised column: `PHB`.
colores[pozos$PHB==1] <- "violetred3"
## Warning: Unknown or uninitialised column: `PHB`.
plot(pozos$TEMP, pozos$PHB, pch=21,bg=colores, xlab="Temperatura", ylab="pH" )
## Warning: Unknown or uninitialised column: `PHB`.
Yo creo que una cosa real que pueda responder a esa pregunta está en la educación, a mi punto de vista los estudiantes de México deben de salir muy bien preparados ya que nosotros somos el futuro de México o del mundo en sí, hay diferentes tipos de estudiantes hay muchos que nomás estudian una carrera por estudiar algo y no le echan ganas , otros si lo hacen porque les gusta y les apasiona su carrera,¿ pero los que no?, ¿Qué pasa?, dejan la escuela, copean tareas, etc. A lo que quiero llegar es que si los estudiantes se enfocan a conciencia, podemos llevar a México a otro nivel, salir mejor preparados.
Otro de los aspectos es el dinero para meterte a un escuela y estudiar una carrera, deberían de apoyar más a los estudiantes universitarios que no tienen recursos, yo sé que hay muchas becas, pero no las suficientes no alcanza para todos la verdad, tengo varios amigos que dejan de estudiar por este aspecto. Otro punto es la falta de trabajo, no hay trabajo para todos yo creo que es muy importante tener alguna estrategia y que se enfoquen mucho en esto el gobierno para poder que el puebla pueda crecer. Económicamente hablando ciento que hoy en día estamos mal como país, la pandemia ha afectado a todos y por lo tanto no hemos sabido cómo controlar este aspecto.
Una recomendación personal que me gustaría agregar es que el gobierno pudiera invertir en infraestructura, las ventajas de esto serían más empleos y mejor calidad de vida, ya que un ejemplo sería un pueblo que casi no tiene habitantes, pero en ese pueblo está el mejor queso pero a consecuencia que está lejos y que no tiene un buen pavimento no hay gente que quiera ir para comprar ese queso, en cambio sí hay una buena carretera se facilita y ese pueblo económicamente puede crecer.