Examen primer parcial Flores

Valeria F

21/2/2022

Karina Valeria Flores Guerrero 228709

##¿Qué es la estadística y que aplicaciones tiene en ingeniería (según su ingeniería)? La estadística es lo que agrupa y clasifica datos que tienen algo en común, para poder llegar a conclusiones a partir de los datos numéricos extraídos. En la ingenieria industrial se podria aplicar para el control de calidad, mejoras en procesos, control del personal, seguridad industrial, entre otros muchos usos. A pesar de ser una ciencia exacta, también se pueden cometer errores por lo que es importante saber aplicar las técnicas y herramientas.

##Enliste y defina los tipos de variables usados en estadística, de 2 ejemplos de cada uno. Defina distribución de frecuencia y explique que es la distribución normal.

-La variable cuantitativa:Son variables que se pueden contar, expresados con numeros. Ejemplo: El tiempo que tarda un competidor de carreras en llegar a su meta. Número de tamales que se comieron las personas.

-La variable cualitativa:Son variables que no son medibles Ejemplo: El color de cabello puede ser rojo, blanco, negro, etc. La calificación del examen puede ser aprobada, reprobado, etc.

La distribución de frecuencia es cuando se agrupan los datos en categorias.

La distribución normal sirve para conocer la probailidad para encontrar un valor ideal.

setwd("~/Pye 1pm")
library(readxl)
library(pacman)
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
p_load("DT", "prettydoc", "xfun")
pozos <- read_excel("pozos.xlsx")
datatable(pozos)

Estos datos son : Datos de pH y Temperatura de pozos de agua subterránea

Ordenados de menor a mayor

sort(pozos$TEMP)
##   [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
##  [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
##  [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
##  [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
##  [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
##  [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
##  [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1

Aqui se observa lo que son los valores máximos, mínimos y el rango total

summary(pozos)
##        PH            TEMP     
##  Min.   :6.10   Min.   :25.6  
##  1st Qu.:6.80   1st Qu.:28.0  
##  Median :6.90   Median :28.7  
##  Mean   :6.89   Mean   :28.7  
##  3rd Qu.:7.00   3rd Qu.:29.2  
##  Max.   :7.50   Max.   :32.1

Obtenga (el número de) los intervalos (o clases) usando la fórmula según Surges y el ancho de clase.

El número de intervalos de la temperatura son de 10 y tienen un ancho de clase de 0.707 o 0.708.

tabla <- fdt(pozos$TEMP, breaks = "Sturges") 
tabla
##     Class limits  f   rf rf(%)  cf  cf(%)
##  [25.344,26.052)  2 0.01  0.68   2   0.68
##  [26.052,26.759)  5 0.02  1.71   7   2.39
##  [26.759,27.467) 17 0.06  5.80  24   8.19
##  [27.467,28.175) 63 0.22 21.50  87  29.69
##  [28.175,28.883) 79 0.27 26.96 166  56.66
##   [28.883,29.59) 81 0.28 27.65 247  84.30
##   [29.59,30.298) 28 0.10  9.56 275  93.86
##  [30.298,31.006)  9 0.03  3.07 284  96.93
##  [31.006,31.713)  7 0.02  2.39 291  99.32
##  [31.713,32.421)  2 0.01  0.68 293 100.00

Tabla de frecuencia

La tabla de frecuencia nos señala con que frecuencia de los datos se repiten dentro de un intervalo.

tabla <- fdt(pozos, breaks = "Sturges") 
tabla
## PH 
##   Class limits   f   rf rf(%)  cf  cf(%)
##  [6.039,6.193)   1 0.00  0.34   1   0.34
##  [6.193,6.346)   1 0.00  0.34   2   0.68
##    [6.346,6.5)   7 0.02  2.39   9   3.07
##    [6.5,6.653)  40 0.14 13.65  49  16.72
##  [6.653,6.807)  67 0.23 22.87 116  39.59
##  [6.807,6.961)  44 0.15 15.02 160  54.61
##  [6.961,7.114) 108 0.37 36.86 268  91.47
##  [7.114,7.268)  12 0.04  4.10 280  95.56
##  [7.268,7.421)  12 0.04  4.10 292  99.66
##  [7.421,7.575)   1 0.00  0.34 293 100.00
## 
## TEMP 
##     Class limits  f   rf rf(%)  cf  cf(%)
##  [25.344,26.052)  2 0.01  0.68   2   0.68
##  [26.052,26.759)  5 0.02  1.71   7   2.39
##  [26.759,27.467) 17 0.06  5.80  24   8.19
##  [27.467,28.175) 63 0.22 21.50  87  29.69
##  [28.175,28.883) 79 0.27 26.96 166  56.66
##   [28.883,29.59) 81 0.28 27.65 247  84.30
##   [29.59,30.298) 28 0.10  9.56 275  93.86
##  [30.298,31.006)  9 0.03  3.07 284  96.93
##  [31.006,31.713)  7 0.02  2.39 291  99.32
##  [31.713,32.421)  2 0.01  0.68 293 100.00

Histograma

Histograma de la temperatura

hist(pozos$TEMP,
      col = "Blue")

Histograma de frecuencia acumulada

Donde se usa para representar las frecuencias acumulada de los valores dados.

plot(tabla, type="cfh",
      col = "Blue")

## Polígono de frecuencia acumulada

plot(tabla, type="cfp",
      col = "Blue")

## Media

Donde la media es la sumatoria de todos nuestros datos dividiendolos entre el numero de datos que tenemos. Donde en nuestro caso es 28.69795 la media de la temperatura.

mean(pozos$TEMP)
## [1] 28.69795

Mediana

La mediana es el numero que se encuentra exactamente en el medio de todos nuestros datos.

median(pozos$TEMP)
## [1] 28.7

Moda

La moda es el dato que más se repite.

mlv(pozos$TEMP, method="mfv")
## [1] 28.6

Varianza

La varianza es lo que varia de nuestros datos respecto a la media.

var(pozos)
##                PH         TEMP
## PH    0.049086446 -0.004574431
## TEMP -0.004574431  1.035406751

Desviación estandar

La raíz cuadrada de la varianza es la desviación estándar. La desviación estándar es la cantidad que se desvia de nuestro limite de desviación.

sd(pozos$TEMP)
## [1] 1.017549

¿Pueden estas medidas ser negativas? No, no pueden ser negativas. La varianza lo más bajo a lo que puede llegar es 0 y la desviación estandar depende de la varianza.

Gráfico de caja y bigote

Manera de representar los cuartiles de manera más visual en una gráfica.

boxplot(pozos$TEMP,
        col = "Blue")

## Gráfica de dispersión de pH versus temperatura

plot(pozos$TEMP, pozos$PH,
     col = "Blue",
      Main = "Gráfico de dispersión de temperatura y el pH en el pozo",
      xlab = "Temperatura",
      ylab = "PH")
## Warning in plot.window(...): "Main" is not a graphical parameter
## Warning in plot.xy(xy, type, ...): "Main" is not a graphical parameter
## Warning in axis(side = side, at = at, labels = labels, ...): "Main" is not a
## graphical parameter

## Warning in axis(side = side, at = at, labels = labels, ...): "Main" is not a
## graphical parameter
## Warning in box(...): "Main" is not a graphical parameter
## Warning in title(...): "Main" is not a graphical parameter

¿Considera que estas 2 variables están relacionadas? Si, ya que en la gráfica se pueden observar los puntos muy parejos.