1.- ¿Qué es la estadística y que aplicaciones tiene en ingeniería (según su ingeniería)?

La Estadística se ocupa de la recolección, agrupación, presentación, análisis e interpretación de datos. A menudo se llaman estadísticas a las listas de estos datos, cosa que crea una cierta ambigüedad, que no debería originarnos confusiones. La Estadística no son sólo los resultados de encuestas, ni el cálculo de unos porcentajes, la Estadística es un método científico que pretende sacar conclusiones a partir de unas observaciones hechas.

La importancia de la estadística en la ingeniería, ha sido encaminada por la participación de la industria en el aumento de la calidad. La estadística es un elemento decisivo en el incremento de la calidad, ya que las técnicas estadísticas pueden emplearse para describir y comprender la variabilidad.

2.- Enliste y defina los tipos de variables usados en estadística, de 2 ejemplos de cada uno. Defina distribución de frecuencia y explique que es la distribución normal.

Variable independiente Un variable independiente es una variable que representa una cantidad que se modifica en un experimento. A menudo xxx es la variable que se utiliza para representar la variable independiente en una ecuación.

¿Cuál es la variable independiente? La variable independiente es la cantidad de tareas que haces, pues esta es la variable sobre la que tienes control.

Variables dependientes Una variable dependiente representa una cantidad cuyo valor depende de cómo se modifica la variable independiente. A menudo y es la variable que se utiliza para representar la variable dependiente en una ecuación.

¿Cuál es la variable dependiente? Su puntuación de la prueba afecta cuánto tiempo duerme. Esto no tiene ningún sentido (a menos que no se puede dormir porque te preocupa que no pasó una prueba, pero eso sería un experimento de otro conjunto).

library(pacman)
library(readr)
pozos <- read_csv("~/ESTADISTICA1011/pozos.csv")
## 
## -- Column specification -------------------------------------------------------------------------------
## cols(
##   TEMP = col_double(),
##   PH = col_double()
## )
p_load("readr","DT","prettydoc","fdth","modeest")
View(pozos)

a)Ordene los datos de menor a mayor, indique el valor máximo / mínimo y el rango total de datos.

datatable(pozos)
## 
## -- Column specification --------------------------------------------------------------------
## cols(
##   PH = col_double(),
##   TEMP = col_double()
## )
Ph<-(pozos$PH)
Temp<-(pozos$TEMP)
  • Valor Minimo temp
min(Temp)
## [1] 25.6
  • Valor Máximo
max(Temp)
## [1] 32.1

b) Obtenga (el número de) los intervalos (o clases) usando la fórmula según Surges y el ancho de clase.

  • Número de intervalos para el Ph
K1<-nclass.Sturges(Ph)
K1
## [1] 10
  • Ancho de clase para el Ph
round(K1/Ph, 1)
##   [1] 1.6 1.6 1.6 1.6 1.6 1.6 1.6 1.6 1.6 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5
##  [19] 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5
##  [37] 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5
##  [55] 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5
##  [73] 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5
##  [91] 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5
## [109] 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4
## [127] 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4
## [145] 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4
## [163] 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4
## [181] 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4
## [199] 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4
## [217] 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4
## [235] 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4
## [253] 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4
## [271] 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4
## [289] 1.4 1.4 1.4 1.4 1.3
  • Número de intervalos para la Temperatura
K<-nclass.Sturges(Temp)
K
## [1] 10
  • Ancho de clase para el Temperatura
round(K1/Temp, 1)
##   [1] 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4
##  [19] 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4
##  [37] 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4
##  [55] 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4
##  [73] 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4
##  [91] 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4
## [109] 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.3 0.3 0.3 0.3
## [127] 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3
## [145] 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3
## [163] 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3
## [181] 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3
## [199] 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3
## [217] 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3
## [235] 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3
## [253] 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3
## [271] 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3
## [289] 0.3 0.3 0.3 0.3 0.3

c)Construya una tabla de frecuencias que incluya: límites de clases, frecuencia absoluta, frecuencia relativa, frecuencia relativa porcentual, frecuencia acumulada y explique a detalle que refleja esta tabla.

  • Tabla de frecuencias para el Ph
library(fdth)
Datos <- fdt(pozos, breaks="Sturge")
Datos
## TEMP 
##     Class limits  f   rf rf(%)  cf  cf(%)
##  [25.344,26.052)  2 0.01  0.68   2   0.68
##  [26.052,26.759)  5 0.02  1.71   7   2.39
##  [26.759,27.467) 17 0.06  5.80  24   8.19
##  [27.467,28.175) 63 0.22 21.50  87  29.69
##  [28.175,28.883) 79 0.27 26.96 166  56.66
##   [28.883,29.59) 81 0.28 27.65 247  84.30
##   [29.59,30.298) 28 0.10  9.56 275  93.86
##  [30.298,31.006)  9 0.03  3.07 284  96.93
##  [31.006,31.713)  7 0.02  2.39 291  99.32
##  [31.713,32.421)  2 0.01  0.68 293 100.00
## 
## PH 
##   Class limits   f   rf rf(%)  cf  cf(%)
##  [6.039,6.193)   1 0.00  0.34   1   0.34
##  [6.193,6.346)   1 0.00  0.34   2   0.68
##    [6.346,6.5)   7 0.02  2.39   9   3.07
##    [6.5,6.653)  40 0.14 13.65  49  16.72
##  [6.653,6.807)  67 0.23 22.87 116  39.59
##  [6.807,6.961)  44 0.15 15.02 160  54.61
##  [6.961,7.114) 108 0.37 36.86 268  91.47
##  [7.114,7.268)  12 0.04  4.10 280  95.56
##  [7.268,7.421)  12 0.04  4.10 292  99.66
##  [7.421,7.575)   1 0.00  0.34 293 100.00

d) Elabore un histograma, polígono de frecuencias, histograma de frecuencias acumulado.

  • Histograma Ph
hist(Ph, col="green")

  • Poligono de frecuencias Ph
plot(Datos, type="fp", col='blue', main="Polígono de frecuencias")

* Histograma de frecuencias acumulado Ph

plot(Datos,  type="cfh", col='green',main="Histograma de frecuencias acumuladas")

* Histograma Temperatura

hist(Temp, col="lightgreen")

  • Histograma de frecuencias acumulado Temperatura
plot(Datos,  type="cfh", col='lightgreen',main="Histograma de frecuencias acumuladas")

e) Obtenga la media, mediana, moda e interprete los resultados.

  • Media Ph
mean(Ph)
## [1] 6.890444
  • Mediana Ph
median(Ph)
## [1] 6.9

*Moda Ph

mfv(Ph)
## [1] 7
  • Media Tem
mean(Temp)
## [1] 28.69795
  • Mediana Temp
median(Temp)
## [1] 28.7

*Moda Temp

mfv(Temp)
## [1] 28.6

f) Obtenga la varianza y la desviación estándar, interprete los resultados. ¿Pueden estas medidas ser negativas?

  • Varianza Ph
var(Ph)
## [1] 0.04908645
  • Desviación Estándar Ph
sd(Ph)
## [1] 0.2215546
  • Varianza Temperatura
var(Temp)
## [1] 1.035407
  • Desviación Estándar Temperatura
sd(Temp)
## [1] 1.017549

g) Elabore gráfico de caja y bigote

boxplot(Ph, col="pink", main="Caja y Bigote PH")

boxplot(Temp, col="violet", main="Caja y Bigote Temperatura")  

h) Elabora una gráfica de dispersión de pH versus temperatura, use ggplot aquí. En base a esta gráfica: ¿Considera que estas 2 variables están relacionadas?

  • Gráfica de dispersión
library(ggplot2)
ggplot(data = pozos)+geom_point(mapping = aes(x=Temp, y=Ph),col='yellow',lwd=2)

  • Regresión Temp vs Ph
regresion <- lm(PH ~ TEMP, data=pozos)
summary(regresion)
## 
## Call:
## lm(formula = PH ~ TEMP, data = pozos)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.167567 -0.034955  0.009123  0.039951  0.087977 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  0.82181    0.08731   9.413   <2e-16 ***
## TEMP         0.21147    0.00304  69.550   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.05287 on 291 degrees of freedom
## Multiple R-squared:  0.9433, Adjusted R-squared:  0.9431 
## F-statistic:  4837 on 1 and 291 DF,  p-value: < 2.2e-16
plot(pozos$TEMP, pozos$PH, xlab="Temperatura del pozo", ylab="pH", col="red", lwd=2, main="Regresion Temp vs Ph") 
abline(regresion)