EXAMEN UC1

Jesús David Apodaca Urías ID:180953

30/10/2021

¿Qué es la estadística?

puede ser definida una rama de la matemática que se relaciona con la recolección, procesamiento, análisis e interpretación de datos numéricos. La estadística es presentada en dos direcciones en sus aplicaciones: la descripción de datos numéricos (estadística descriptiva) y la generalización basada en el análisis e interpretación datos numéricos (inferencia estadística). La estadistica hace referencia a un conjunto de metodos para obtener, manejar y analisar datos numericos. Su objetivo es describir los datos analizados y asi poder tomar deciciones o llegar a una conclusion sobre el tema o variable que se esta estudiando.

¿Que aplicaciones tiene la estadistica en Ingenieria Quimica?

  • Desarrollo de nuevos productos: La estadistica es una herramienta utilizada para hacer pruebas de un producto antes de lanzarlo al mercado.

  • Control de calidad : El control estadistico de la calidad se aplica a procesos i9ndustriales, procesos administrativos y/o servicios con el fin de verificar si cada parte del proceso cumplen con ciertas exigencias de calidad y asi ayudar a cumplirlas.

  • Control de procesos: El control estadistico de procesos se utiliza para lograr un proceso estable y asi poder mejorar su capacidad. Se puede considerar como un conjunto de herramientas para resolver problemas que pueden ser aplicadas a cualqueir proceso.

  • Descripcion de modelos termodinamicos: La fisica estadistica utiliza la teoria de la probabilidad para deducir el comportamiento de sistemas fisicos macroscopicos.

  • Analisis de produccion: La estadistica nos ayuda a determinar parametros que se involucran en el estudio de un proceso, asi como variables que afectan directamente y hacen eficiente la produccion para si poder evaluar el material producido y poder determinar si un producto es rentable, compararlo con la competencia en el mercado y con ello poder determinar su vida util en el mercado.

Enliste y defina los tipos de variables usados en estadística, de 2 ejemplos de cada uno.

  • Variables cualitativas son aquellas características o cualidades que no pueden ser calculadas con números, sino que son clasificadas con palabras.

  • Cualitativa nominal variables que no siguen ningún orden en específico. Por ejemplo, el color de pelo de una persona tal como castaño, rubio etc.

  • Cualitativa ordinaria aquellas que siguen un orden o jerarquía. Por ejemplo, el nivel socioeconómico alto, medio o bajo.

  • Cualitativa binaria variables que permiten tan solo dos resultados. Por ejemplo, sí o no; hombre o mujer.

  • Variables cuantitativas Las variables cuantitativas son aquellas características o cualidades que sí pueden expresarse o medirse a través de números.

  • Cuantitativas discreta variables que utilizan valores enteros y no finitos. Por ejemplo, la cantidad de familiares que tiene una persona, tal como 2, 3, 4 o más.

  • cuantitativa continua variables que utilizan valores finitos y objetivos, y suele caracterizarse por utilizar valores decimales. Por ejemplo, el peso de una persona, tal como 64.3 kg, 72.3 kg, etc.

  • Defina distribución de frecuencia La distribucion de frecuencias es la manera en la que se ordena una serie de observaciones en diferentes grupos que normalmente se encuentran en orden ascendente o descendente.

  • Distribucion normal Es la distribución continua que se utiliza más comúnmente en estadística, es un modelo que aproxima el valor de una variable aleatoria a una situación ideal, dependiendo de la media y la desviación típica. Se usa para entender fenomenos naturales, sociales, artificiales.

  • Propiedades de la distribucion normal 1.- Los datos tienen una apariencia de forma de campana 2.- Sus medidas de tendencia central (media, mediana y moda) son todas idénticas. 3.- Su variable aleatoria asociada tiene un rango infinito (-∞ < X < ∞).

Importar datos

*Datos de PH y Temperatura de pozos de agua subterranea

library(readxl)
pozos <- read_excel("pozos.xlsx")
View(pozos)

Paquetes a utilizar

library(pacman)
p_load(rmdformats,readr,readxl,ggplot2,plotly,DT,xfun,gridExtra,leaflet)

Importar libreria

library(readxl)
pozos <- read_excel("pozos.xlsx")
datatable(pozos)
View(pozos)

Ordenar datos de PH menor a mayor

sort(pozos$"PH", decreasing = FALSE) 
##   [1] 6.1 6.3 6.4 6.4 6.4 6.4 6.4 6.4 6.4 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5
##  [19] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
##  [37] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.7 6.7 6.7 6.7 6.7
##  [55] 6.7 6.7 6.7 6.7 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
##  [73] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
##  [91] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [109] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [127] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 7.0 7.0
## [163] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [181] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [199] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [217] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [235] 7.0 7.0 7.0 7.0 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [253] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.2 7.2
## [271] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.3 7.3 7.3 7.3 7.3 7.3 7.4 7.4
## [289] 7.4 7.4 7.4 7.4 7.5

Aqui se acomodaron los datos de menor a mayor para una mejor visualizacion de estos ## Ordenar datos de PH mayor a menor

sort(pozos$"PH", decreasing = TRUE) 
##   [1] 7.5 7.4 7.4 7.4 7.4 7.4 7.4 7.3 7.3 7.3 7.3 7.3 7.3 7.2 7.2 7.2 7.2 7.2
##  [19] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
##  [37] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
##  [55] 7.1 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
##  [73] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
##  [91] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [109] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [127] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [163] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.8 6.8 6.8
## [181] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [199] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [217] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [235] 6.8 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
## [253] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.5 6.5 6.5
## [271] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.4 6.4 6.4 6.4
## [289] 6.4 6.4 6.4 6.3 6.1

Aqui se acomodaron los datos de mayor a menor para una mejor visualizacion de estos

Ordenar datos de temperatura menor a mayor

sort(pozos$"TEMP", decreasing = FALSE) 
##   [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
##  [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
##  [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
##  [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
##  [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
##  [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
##  [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1

Aqui se acomodaron los datos de temperatura de menor a mayor para una mejor visualizacion de estos

Ordenar datos de temperatura mayor a menor

sort(pozos$"TEMP", decreasing = TRUE) 
##   [1] 32.1 31.9 31.7 31.5 31.4 31.2 31.1 31.1 31.1 30.9 30.8 30.6 30.5 30.4 30.3
##  [16] 30.3 30.3 30.3 30.2 30.2 30.2 30.1 30.1 30.1 30.1 30.0 30.0 30.0 30.0 30.0
##  [31] 30.0 29.9 29.9 29.9 29.9 29.8 29.8 29.8 29.8 29.8 29.8 29.7 29.7 29.6 29.6
##  [46] 29.6 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.4 29.4 29.4 29.4 29.4
##  [61] 29.4 29.4 29.4 29.4 29.4 29.4 29.3 29.3 29.3 29.3 29.2 29.2 29.2 29.2 29.2
##  [76] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.1 29.1 29.1 29.1 29.1 29.1
##  [91] 29.1 29.1 29.1 29.1 29.1 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [106] 29.0 29.0 29.0 29.0 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [121] 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [136] 28.8 28.8 28.8 28.8 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [166] 28.6 28.6 28.6 28.6 28.6 28.6 28.5 28.5 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [181] 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.3 28.3 28.3 28.3 28.3 28.3 28.3 28.2
## [196] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.1 28.1 28.1 28.0
## [211] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
## [226] 28.0 28.0 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
## [241] 27.9 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.7 27.7 27.7
## [256] 27.7 27.6 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.4
## [271] 27.4 27.4 27.4 27.4 27.3 27.3 27.3 27.3 27.2 27.2 27.1 27.0 27.0 26.9 26.8
## [286] 26.8 26.4 26.4 26.3 26.3 26.2 25.8 25.6

Aqui se acomodaron los datos de temperatura de mayor a menor para una mejor visualizacion de estos

Valor maximo y minimo

Minimo PH

min(pozos$"PH")
## [1] 6.1

Maximo PH

max(pozos$"PH")
## [1] 7.5

Minimo Temperatura

min(pozos$"TEMP")
## [1] 25.6

Maximo Temperatura

max(pozos$"TEMP")
## [1] 32.1

Rango total de los datos

rango <- range(pozos) 
rango
## [1]  6.1 32.1

Rango PH

rangoph <- range(pozos$"PH") 
rangoph
## [1] 6.1 7.5

Rango Temperatura

rangotemp<- range(pozos$"TEMP") 
rangotemp
## [1] 25.6 32.1

Numero de intervalos utilizando la formula de surges y el ancho de clase

\(k=1+log10(N)\) \(I= √(n)\)

# ancho de clase 
#K= 1+log10(293)
#K= 3.466
# numero de intervalos ç
#I= sqrt(n)
#I= sqrt(293)
#I= 17.117

Tabla de frecuencias

library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tabla <- fdt(pozos)
tabla
## PH 
##   Class limits   f   rf rf(%)  cf  cf(%)
##  [6.039,6.193)   1 0.00  0.34   1   0.34
##  [6.193,6.346)   1 0.00  0.34   2   0.68
##    [6.346,6.5)   7 0.02  2.39   9   3.07
##    [6.5,6.653)  40 0.14 13.65  49  16.72
##  [6.653,6.807)  67 0.23 22.87 116  39.59
##  [6.807,6.961)  44 0.15 15.02 160  54.61
##  [6.961,7.114) 108 0.37 36.86 268  91.47
##  [7.114,7.268)  12 0.04  4.10 280  95.56
##  [7.268,7.421)  12 0.04  4.10 292  99.66
##  [7.421,7.575)   1 0.00  0.34 293 100.00
## 
## TEMP 
##     Class limits  f   rf rf(%)  cf  cf(%)
##  [25.344,26.052)  2 0.01  0.68   2   0.68
##  [26.052,26.759)  5 0.02  1.71   7   2.39
##  [26.759,27.467) 17 0.06  5.80  24   8.19
##  [27.467,28.175) 63 0.22 21.50  87  29.69
##  [28.175,28.883) 79 0.27 26.96 166  56.66
##   [28.883,29.59) 81 0.28 27.65 247  84.30
##   [29.59,30.298) 28 0.10  9.56 275  93.86
##  [30.298,31.006)  9 0.03  3.07 284  96.93
##  [31.006,31.713)  7 0.02  2.39 291  99.32
##  [31.713,32.421)  2 0.01  0.68 293 100.00

Las tablas anteriores se encuentran estructuradas por el limite de clases que en total son 10 valores, estos 10 valores nos indican los intervalos necesarios para poder representan los datos de manera correcta, la segunda columna representa la frecuencia absoluta que nos permite conocer la cantidad de veces que se repite un suceso, la tercer columna nos representa la frecuencia relativa, esta nos proporciona el numero de veces que se produce el resultado de la frecuencia absoluta, dividido entre el numero total de los datos. La cuarta columna reprecenta la frecuencia relativa porcentual y la quinta columna nos representa la frecuencia acumulada que representa el resultado de sumar sucesivamente las frecuencias absolutas o relativas, desde el menor al mayor de sus valores.

Histograma

plot(tabla,type='fh')

Poligono de frecuencia segun sturge

plot(tabla,type='fp')

Histograma de frecuencias acumulado

plot(tabla, type = 'cfh') 

Poligono de frecuencia acumulada

plot(tabla, type= 'cfp') 

con base en las graficas anteriores se obseva que se tiene una buena coorrelacion entre la temperatura y el ph ya que al subir la temperatura tambien sube el pH

Medidas de tendencia central

media PH

mean(pozos$"PH")
## [1] 6.890444

es el promedio del pH en los datos anlizados

mediana PH

median(pozos$"PH")
## [1] 6.9

es el dato que estan en medio de todos los datos del pH

moda PH

library(modeest)
## Registered S3 method overwritten by 'rmutil':
##   method         from
##   print.response httr
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
mlv(pozos$"PH", method= "mfv")
## [1] 7

es el pH que con mas frecuencia se repite

media Temperatura

mean(pozos$"TEMP")
## [1] 28.69795

es el promedio de la temperatura en los datos anlizados

mediana Temperatura

median(pozos$"TEMP")
## [1] 28.7

es el dato que estan en medio de todos los datos

moda Temperatura

library(modeest)
mlv(pozos$"TEMP", method= "mfv")
## [1] 28.6

es la temperatura que con mas frecuencia se repite

Varianza y desviacion estandar

var(tabla)
## $PH
## [1] 0.04936057
## 
## $TEMP
## [1] 1.065229
sd(tabla)
## $PH
## [1] 0.2221724
## 
## $TEMP
## [1] 1.032099

Grafico de caja y bigotes

Cuartiles

summary(pozos)
##        PH            TEMP     
##  Min.   :6.10   Min.   :25.6  
##  1st Qu.:6.80   1st Qu.:28.0  
##  Median :6.90   Median :28.7  
##  Mean   :6.89   Mean   :28.7  
##  3rd Qu.:7.00   3rd Qu.:29.2  
##  Max.   :7.50   Max.   :32.1

Grafico de caja y bigotes PH

boxplot(pozos$"PH")

estos datos son normlaes ya que se encuentran en la media de nuestros datos

Grafico de caja y bigotes Temperatura

boxplot(pozos$"TEMP")

se puede observar en este graficod e caja y bigote que los datos no son normales ya que la mayoeria de ellos estan en la parte superior osea en mayor temperatura

Grafica de dispersion de PH vs temperatura

pairs(pozos)

se observa que llevan una relacion ya que cuando sube una variable la otra se comporta de la misma manera ## Diagrma de dispersion pH vs temperatura

plot(x = pozos$PH, y = pozos$TEMP)

se observa que los datos estan relacionados entre si

Pregunta de rescate (opcional): Mini ensayo de mínimo media y máximo una cuartilla contestando a la pregunta: ¿De qué manera o maneras reales puede México ser un país más desarrollado? Elaboren y argumenten su propuesta o propuesta. (Use datos para fundamentarse)

México se encuentra en el lugar 57 de 141 países en el Índice Global de Innovación 2015, elaborado por la Organización Mundial de la Propiedad Intelectual (OMPI), la Universidad de Cornell y la escuela de negocios INSEAD. Aún existen obstáculos que impiden el paso definitivo para ubicar al país en los primeros lugares en este rubro. Aunque estamos lejos de poder lograrlo no es solo responsabilidad del gobierno si no de toda la poblacion en general ya que se tienen fallos en:

  • polica: muchas veces es una cuestión reactiva, en que sólo cuando algo sucede se hace algo para arreglarlo.

  • cultura: se nececita una cultura de colaboración ya que sin esta no se puede avanzar nada se puede lograr o construir sin ayuda colaborativa, y eso implica una cultura de confianza que hace mucha falta en México. Confiar en el otro para poder colaborar y así generar ideas innovadoras.

  • Unir fuerzas: Empezando por unir fuerzas, confiar en el otro y por sumar esfuerzos para nuevos propósitos, en vez de partir de la desconfianza, ya que si no hay confianza en los demas no se puede colaborar y si no se colabora no hay avances en la construccion de un mejor mexico.