1.- ¿Qué es la estadística?
insertando imagen
La estadistica hace referencia a un conjunto de metodos para obtener, manejar y analisar datos numericos. Su objetivo es describir los datos analizados y asi poder tomar deciciones o llegar a una conclusion sobre el tema o variable que se esta estudiando.
¿Que aplicaciones tiene la estadistica en Ingenieria Quimica?
Desarrollo de nuevos productos:
insertando imagen
La estadistica es una herramienta utilizada para hacer pruebas de un producto antes de lanzarlo al mercado.
Control de calidad :
#### El control estadistico de la calidad se aplica a procesos i9ndustriales, procesos administrativos y/o servicios con el fin de verificar si cada parte del proceso cumplen con ciertas exigencias de calidad y asi ayudar a cumplirlas.
Control de procesos:
insertando imagen
El control estadistico de procesos se utiliza para lograr un proceso estable y asi poder mejorar su capacidad. Se puede considerar como un conjunto de herramientas para resolver problemas que pueden ser aplicadas a cualqueir proceso.
Descripcion de modelos termodinamicos:
insertando imagen
La fisica estadistica utiliza la teoria de la probabilidad para deducir el comportamiento de sistemas fisicos macroscopicos.
Analisis de produccion:
insertando imagen
La estadistica nos ayuda a determinar parametros que se involucran en el estudio de un proceso, asi como variables que afectan directamente y hacen eficiente la produccion para si poder evaluar el material producido y poder determinar si un producto es rentable, compararlo con la competencia en el mercado y con ello poder determinar su vida util en el mercado.
2.- Enliste y defina los tipos de variables usados en estadística, de 2 ejemplos de cada uno.
## Variables cualitativas ### son aquellas características o cualidades que no pueden ser calculadas con números, sino que son clasificadas con palabras.
Cualitativa nominal
variables que no siguen ningún orden en específico. Por ejemplo, el color de pelo de una persona tal como castaño, rubio etc.
Cualitativa ordinaria
aquellas que siguen un orden o jerarquía. Por ejemplo, el nivel socioeconómico alto, medio o bajo.
Cualitativa binaria
variables que permiten tan solo dos resultados. Por ejemplo, sí o no; hombre o mujer.
Variables cuantitativas
Las variables cuantitativas son aquellas características o cualidades que sí pueden expresarse o medirse a través de números.
Cuantitativas discreta
variables que utilizan valores enteros y no finitos. Por ejemplo, la cantidad de familiares que tiene una persona, tal como 2, 3, 4 o más.
cuantitativa continua
variables que utilizan valores finitos y objetivos, y suele caracterizarse por utilizar valores decimales. Por ejemplo, el peso de una persona, tal como 64.3 kg, 72.3 kg, etc.
Defina distribución de frecuencia
La distribucion de frecuencias es la manera en la que se ordena una serie de observaciones en diferentes grupos que normalmente se encuentran en orden ascendente o descendente.
Distribucion normal
Propiedades de la distribucion normal
1.- Los datos tienen una apariencia de forma de campana
2.- Sus medidas de tendencia central (media, mediana y moda) son todas idénticas.
3.- Su variable aleatoria asociada tiene un rango infinito (-∞ < X < ∞).
Importar datos
Datos de PH y Temperatura de pozos de agua subterranea
library(readxl)
pozos <- read_excel("pozos.xlsx")
View(pozos)
Paquetes a utilizar
library(pacman)
p_load(rmdformats,readr,readxl,ggplot2,plotly,DT,xfun,gridExtra,leaflet)
Importar libreria
library(readxl)
pozos <- read_excel("pozos.xlsx")
datatable(pozos)
View(pozos)
Ordenar datos de PH menor a mayor
sort(pozos$"PH", decreasing = FALSE)
## [1] 6.1 6.3 6.4 6.4 6.4 6.4 6.4 6.4 6.4 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5
## [19] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
## [37] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.7 6.7 6.7 6.7 6.7
## [55] 6.7 6.7 6.7 6.7 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [73] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [91] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [109] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [127] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 7.0 7.0
## [163] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [181] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [199] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [217] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [235] 7.0 7.0 7.0 7.0 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [253] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.2 7.2
## [271] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.3 7.3 7.3 7.3 7.3 7.3 7.4 7.4
## [289] 7.4 7.4 7.4 7.4 7.5
Ordenar datos de PH mayor a menor
sort(pozos$"PH", decreasing = TRUE)
## [1] 7.5 7.4 7.4 7.4 7.4 7.4 7.4 7.3 7.3 7.3 7.3 7.3 7.3 7.2 7.2 7.2 7.2 7.2
## [19] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [37] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [55] 7.1 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [73] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [91] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [109] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [127] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [163] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.8 6.8 6.8
## [181] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [199] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [217] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [235] 6.8 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
## [253] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.5 6.5 6.5
## [271] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.4 6.4 6.4 6.4
## [289] 6.4 6.4 6.4 6.3 6.1
Ordenar datos de temperatura menor a mayor
sort(pozos$"TEMP", decreasing = FALSE)
## [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
## [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
## [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
## [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
## [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
## [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
## [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1
Ordenar datos de temperatura mayor a menor
sort(pozos$"TEMP", decreasing = TRUE)
## [1] 32.1 31.9 31.7 31.5 31.4 31.2 31.1 31.1 31.1 30.9 30.8 30.6 30.5 30.4 30.3
## [16] 30.3 30.3 30.3 30.2 30.2 30.2 30.1 30.1 30.1 30.1 30.0 30.0 30.0 30.0 30.0
## [31] 30.0 29.9 29.9 29.9 29.9 29.8 29.8 29.8 29.8 29.8 29.8 29.7 29.7 29.6 29.6
## [46] 29.6 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.4 29.4 29.4 29.4 29.4
## [61] 29.4 29.4 29.4 29.4 29.4 29.4 29.3 29.3 29.3 29.3 29.2 29.2 29.2 29.2 29.2
## [76] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.1 29.1 29.1 29.1 29.1 29.1
## [91] 29.1 29.1 29.1 29.1 29.1 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [106] 29.0 29.0 29.0 29.0 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [121] 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [136] 28.8 28.8 28.8 28.8 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [166] 28.6 28.6 28.6 28.6 28.6 28.6 28.5 28.5 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [181] 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.3 28.3 28.3 28.3 28.3 28.3 28.3 28.2
## [196] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.1 28.1 28.1 28.0
## [211] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
## [226] 28.0 28.0 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
## [241] 27.9 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.7 27.7 27.7
## [256] 27.7 27.6 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.4
## [271] 27.4 27.4 27.4 27.4 27.3 27.3 27.3 27.3 27.2 27.2 27.1 27.0 27.0 26.9 26.8
## [286] 26.8 26.4 26.4 26.3 26.3 26.2 25.8 25.6
Valor maximo y minimo
Minimo PH
min(pozos$"PH")
## [1] 6.1
El valor minimo de PH es de 6.1
Maximo PH
max(pozos$"PH")
## [1] 7.5
El valor maximo de PH es de 7.5
Minimo Temperatura
min(pozos$"TEMP")
## [1] 25.6
El valor minimo de Temperatura es de 25.6
Maximo Temperatura
max(pozos$"TEMP")
## [1] 32.1
El valor maximo de Temperatura es de 32.1
Rango total de los datos
Rango PH
rangoph <- range(pozos$"PH")
rangoph
## [1] 6.1 7.5
Podemos observar que la diferencia entre el valor minimo y maximo es de 1.4, esta diferencia nos indica la dispersion total de los datos de PH.
Rango Temperatura
rangotemp<- range(pozos$"TEMP")
rangotemp
## [1] 25.6 32.1
Podemos observar que la diferencia entre el valor minimo y maximo es de 6.5 grados, esta diferencia nos indica la dispersion total de los datos de Temperatura.
Numero de intervalos utilizando la formula de sturges y el ancho de clase
Clase
\(k=1+log10(N)\) \(I= √(n)\) \(R= (n-m)/√n\)
Ancho de clase
K= 1+log10(293)
K= 3.466
numero de intervalos
n<- 293
I= sqrt(n)
I= sqrt(293)
I= 17.117
rango
R= (32.1-25.6)/sqrt(293)
R= 0.379
Tabla de frecuencias
library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
tabla <- fdt(pozos)
tabla
## PH
## Class limits f rf rf(%) cf cf(%)
## [6.039,6.193) 1 0.00 0.34 1 0.34
## [6.193,6.346) 1 0.00 0.34 2 0.68
## [6.346,6.5) 7 0.02 2.39 9 3.07
## [6.5,6.653) 40 0.14 13.65 49 16.72
## [6.653,6.807) 67 0.23 22.87 116 39.59
## [6.807,6.961) 44 0.15 15.02 160 54.61
## [6.961,7.114) 108 0.37 36.86 268 91.47
## [7.114,7.268) 12 0.04 4.10 280 95.56
## [7.268,7.421) 12 0.04 4.10 292 99.66
## [7.421,7.575) 1 0.00 0.34 293 100.00
##
## TEMP
## Class limits f rf rf(%) cf cf(%)
## [25.344,26.052) 2 0.01 0.68 2 0.68
## [26.052,26.759) 5 0.02 1.71 7 2.39
## [26.759,27.467) 17 0.06 5.80 24 8.19
## [27.467,28.175) 63 0.22 21.50 87 29.69
## [28.175,28.883) 79 0.27 26.96 166 56.66
## [28.883,29.59) 81 0.28 27.65 247 84.30
## [29.59,30.298) 28 0.10 9.56 275 93.86
## [30.298,31.006) 9 0.03 3.07 284 96.93
## [31.006,31.713) 7 0.02 2.39 291 99.32
## [31.713,32.421) 2 0.01 0.68 293 100.00
Las tablas anteriores se encuentran estructuradas por el limite de clases que en total son 10 valores, estos 10 valores nos indican los intervalos necesarios para poder representan los datos de manera correcta, la segunda columna representa la frecuencia absoluta que nos permite conocer la cantidad de veces que se repite un suceso, la tercer columna nos representa la frecuencia relativa, esta nos proporciona el numero de veces que se produce el resultado de la frecuencia absoluta, dividido entre el numero total de los datos.
La cuarta columna reprecenta la frecuencia relativa porcentual y la quinta columna nos representa la frecuencia acumulada que representa el resultado de sumar sucesivamente las frecuencias absolutas o relativas, desde el menor al mayor de sus valores.
Histograma
plot(tabla,type='fh', col = "red")
En el histograma tanto de PH podemos observar dos aglomeraciones, en los intervalos de 6.35-6.96 y de 6.96-7.58, los datos logran asemejarse a una campana de gauss, mientras que en
El histograma de Temperatura se puede observar que los datos logran comportarse de manera mas exacta a una campana de gauss, por lo tanto los datos se encuentran normalizados.
Esto se puede probar con las medidas de tendencia central: Moda, NMedia y Media, ya que los valores obtenidos para cada histograma son muy similares como se muestran a continuacion.
Poligono de frecuencia segun sturge
plot(tabla,type='fp', col = "red")
En el poligono de frecuencia anterior podemos observar de manera mas exacta los picos y aglomeraciones que se presentan en cada histograma, este grafico se obtiene uniendo los distintos puntos medios de las columnas de cada histograma.
Histograma de frecuencias acumulado
plot(tabla, type = 'cfh', col = "red")
El histograma de frecuencias acumulado nos representa la frecuencia absoluta acumulada hasta cada valor de PH y Temperatura. Aqui podemos observar una tendencia alcista.
Poligono de frecuencia acumulada
plot(tabla, type= 'cfp', col = "red")
En el poligono de frecuencia acumulada podemos observar la tendencia de manera mas detallada.
Medidas de tendencia central
A continuacion podemos observar los valores para media, mediana y moda, se puede observar que los valores son muy similares, por lo tanto los datos tenderan a agruparse en forma de campana de gauss.
media PH
mean(pozos$"PH")
## [1] 6.890444
mediana PH
median(pozos$"PH")
## [1] 6.9
moda PH
library(modeest)
## Registered S3 method overwritten by 'rmutil':
## method from
## print.response httr
##
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
##
## mfv
mlv(pozos$"PH", method= "mfv")
## [1] 7
A continuacion podemos observar los valores para media, mediana y moda, se puede observar que los valores son muy similares, por lo tanto los datos tenderan a agruparse en forma de campana de gauss.
media Temperatura
mean(pozos$"TEMP")
## [1] 28.69795
mediana Temperatura
median(pozos$"TEMP")
## [1] 28.7
moda Temperatura
library(modeest)
mlv(pozos$"TEMP", method= "mfv")
## [1] 28.6
Varianza
var(tabla)
## $PH
## [1] 0.04936057
##
## $TEMP
## [1] 1.065229
Desviacion estandar
sd(tabla)
## $PH
## [1] 0.2221724
##
## $TEMP
## [1] 1.032099
¿Pueden estas medidas ser negativas?
La desviacion estandar y la varianza no pueden ser negativas, ya que esta surge de un promedio de cuadrados.
La varianza y la desviación estándar son medidas de variación para las variables de razón de intervalo . Describen cuánta variación o diversidad hay en una distribución. Tanto la varianza como la desviación estándar aumentan o disminuyen en función de qué tan cerca se agrupen las puntuaciones alrededor de la media.
Cuartiles
summary(pozos)
## PH TEMP
## Min. :6.10 Min. :25.6
## 1st Qu.:6.80 1st Qu.:28.0
## Median :6.90 Median :28.7
## Mean :6.89 Mean :28.7
## 3rd Qu.:7.00 3rd Qu.:29.2
## Max. :7.50 Max. :32.1
Grafico de caja y bigotes PH
boxplot(pozos$"PH", col = "red")
En el grafico de caja y bigotes para PH podemos observar la manera en la que se distribuyen los datos. Los datos se encuentran agrupados en 4 secciones, podemos observar 3 valores atipicos muy pequeños y 2 valores atipicos muy grandes.
Grafico de caja y bigotes Temperatura
boxplot(pozos$"TEMP", col = "red")
En el grafico de caja y bigotes para Temperatura podemos observar la manera en la que se distribuyen los datos. Los datos se encuentran agrupados en 4 secciones, podemos observar 3 valores atipicos muy pequeños y 7 valores atipicos muy grandes.
Grafica de dispersion de PH vs temperatura
plot(x = pozos$PH, y = pozos$TEMP, col = "red")
cor(pozos)
## PH TEMP
## PH 1.00000000 -0.02029087
## TEMP -0.02029087 1.00000000