Karina Valeria Flores Guerrero 228709
##¿Qué es la estadística y que aplicaciones tiene en ingeniería (según su ingeniería)? La estadística es lo que agrupa y clasifica datos que tienen algo en común, para poder llegar a conclusiones a partir de los datos numéricos extraídos. En la ingenieria industrial se podria aplicar para el control de calidad, mejoras en procesos, control del personal, seguridad industrial, entre otros muchos usos. A pesar de ser una ciencia exacta, también se pueden cometer errores por lo que es importante saber aplicar las técnicas y herramientas.
##Enliste y defina los tipos de variables usados en estadística, de 2 ejemplos de cada uno. Defina distribución de frecuencia y explique que es la distribución normal.
-La variable cuantitativa:Son variables que se pueden contar, expresados con numeros. Ejemplo: El tiempo que tarda un competidor de carreras en llegar a su meta. Número de tamales que se comieron las personas.
-La variable cualitativa:Son variables que no son medibles Ejemplo: El color de cabello puede ser rojo, blanco, negro, etc. La calificación del examen puede ser aprobada, reprobado, etc.
La distribución de frecuencia es cuando se agrupan los datos en categorias.
La distribución normal sirve para conocer la probailidad para encontrar un valor ideal.
setwd("~/Pye 1pm")
library(readxl)
library(pacman)
library(fdth)##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
library(modeest)##
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
##
## mfv
p_load("DT", "prettydoc", "xfun")
pozos <- read_excel("pozos.xlsx")
datatable(pozos)Estos datos son : Datos de pH y Temperatura de pozos de agua subterránea
Ordenados de menor a mayor
sort(pozos$TEMP)## [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
## [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
## [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
## [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
## [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
## [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
## [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1
Aqui se observa lo que son los valores máximos, mínimos y el rango total
summary(pozos)## PH TEMP
## Min. :6.10 Min. :25.6
## 1st Qu.:6.80 1st Qu.:28.0
## Median :6.90 Median :28.7
## Mean :6.89 Mean :28.7
## 3rd Qu.:7.00 3rd Qu.:29.2
## Max. :7.50 Max. :32.1
Obtenga (el número de) los intervalos (o clases) usando la fórmula según Surges y el ancho de clase.
El número de intervalos de la temperatura son de 10 y tienen un ancho de clase de 0.707 o 0.708.
tabla <- fdt(pozos$TEMP, breaks = "Sturges")
tabla## Class limits f rf rf(%) cf cf(%)
## [25.344,26.052) 2 0.01 0.68 2 0.68
## [26.052,26.759) 5 0.02 1.71 7 2.39
## [26.759,27.467) 17 0.06 5.80 24 8.19
## [27.467,28.175) 63 0.22 21.50 87 29.69
## [28.175,28.883) 79 0.27 26.96 166 56.66
## [28.883,29.59) 81 0.28 27.65 247 84.30
## [29.59,30.298) 28 0.10 9.56 275 93.86
## [30.298,31.006) 9 0.03 3.07 284 96.93
## [31.006,31.713) 7 0.02 2.39 291 99.32
## [31.713,32.421) 2 0.01 0.68 293 100.00
Tabla de frecuencia
La tabla de frecuencia nos señala con que frecuencia de los datos se repiten dentro de un intervalo.
tabla <- fdt(pozos, breaks = "Sturges")
tabla## PH
## Class limits f rf rf(%) cf cf(%)
## [6.039,6.193) 1 0.00 0.34 1 0.34
## [6.193,6.346) 1 0.00 0.34 2 0.68
## [6.346,6.5) 7 0.02 2.39 9 3.07
## [6.5,6.653) 40 0.14 13.65 49 16.72
## [6.653,6.807) 67 0.23 22.87 116 39.59
## [6.807,6.961) 44 0.15 15.02 160 54.61
## [6.961,7.114) 108 0.37 36.86 268 91.47
## [7.114,7.268) 12 0.04 4.10 280 95.56
## [7.268,7.421) 12 0.04 4.10 292 99.66
## [7.421,7.575) 1 0.00 0.34 293 100.00
##
## TEMP
## Class limits f rf rf(%) cf cf(%)
## [25.344,26.052) 2 0.01 0.68 2 0.68
## [26.052,26.759) 5 0.02 1.71 7 2.39
## [26.759,27.467) 17 0.06 5.80 24 8.19
## [27.467,28.175) 63 0.22 21.50 87 29.69
## [28.175,28.883) 79 0.27 26.96 166 56.66
## [28.883,29.59) 81 0.28 27.65 247 84.30
## [29.59,30.298) 28 0.10 9.56 275 93.86
## [30.298,31.006) 9 0.03 3.07 284 96.93
## [31.006,31.713) 7 0.02 2.39 291 99.32
## [31.713,32.421) 2 0.01 0.68 293 100.00
Histograma
Histograma de la temperatura
hist(pozos$TEMP,
col = "Blue")Histograma de frecuencia acumulada
Donde se usa para representar las frecuencias acumulada de los valores dados.
plot(tabla, type="cfh",
col = "Blue") ## Polígono de frecuencia acumulada
plot(tabla, type="cfp",
col = "Blue") ## Media
Donde la media es la sumatoria de todos nuestros datos dividiendolos entre el numero de datos que tenemos. Donde en nuestro caso es 28.69795 la media de la temperatura.
mean(pozos$TEMP)## [1] 28.69795
Mediana
La mediana es el numero que se encuentra exactamente en el medio de todos nuestros datos.
median(pozos$TEMP)## [1] 28.7
Moda
La moda es el dato que más se repite.
mlv(pozos$TEMP, method="mfv")## [1] 28.6
Varianza
La varianza es lo que varia de nuestros datos respecto a la media.
var(pozos)## PH TEMP
## PH 0.049086446 -0.004574431
## TEMP -0.004574431 1.035406751
Desviación estandar
La raíz cuadrada de la varianza es la desviación estándar. La desviación estándar es la cantidad que se desvia de nuestro limite de desviación.
sd(pozos$TEMP)## [1] 1.017549
¿Pueden estas medidas ser negativas? No, no pueden ser negativas. La varianza lo más bajo a lo que puede llegar es 0 y la desviación estandar depende de la varianza.
Gráfico de caja y bigote
Manera de representar los cuartiles de manera más visual en una gráfica.
boxplot(pozos$TEMP,
col = "Blue") ## Gráfica de dispersión de pH versus temperatura
plot(pozos$TEMP, pozos$PH,
col = "Blue",
Main = "Gráfico de dispersión de temperatura y el pH en el pozo",
xlab = "Temperatura",
ylab = "PH")## Warning in plot.window(...): "Main" is not a graphical parameter
## Warning in plot.xy(xy, type, ...): "Main" is not a graphical parameter
## Warning in axis(side = side, at = at, labels = labels, ...): "Main" is not a
## graphical parameter
## Warning in axis(side = side, at = at, labels = labels, ...): "Main" is not a
## graphical parameter
## Warning in box(...): "Main" is not a graphical parameter
## Warning in title(...): "Main" is not a graphical parameter
¿Considera que estas 2 variables están relacionadas? Si, ya que en la gráfica se pueden observar los puntos muy parejos.