U1E1

Johana Dominguez

23/10/2020

  • Examen de la primera unidad de competencia de estadística aplicada
  • Alumna: Johana Valeria Dominguez Arvayo ID: 204134

1.- ¿Qué es la estadística y que aplicaciones tiene en ingeniería (según su ingeniería)? La Estadística se ocupa de los métodos y procedimientos para comprender mejor cualquier una serie de datos, los clasifica, resume y halla regularidades asi como tambien analizar los datos, en base a esto puede formular predicciones. Establece comparaciones o variabilidades que permiten comprender un fenomeno en particular. A pesar de que puede ser utilizada mas alla de las ciencias se utliza mucho en ingenieria, como por ejemplo en ingenieria quimica mayormente se utiliza para conocer comportamientos de quimicos a utilizar, ya sea para medir sus temperaturas, flujos, ph, presiones, etc. es de suma importancia ya que esto nos permite formar predicciones acerca del quimico.

2.- Enliste y defina los tipos de variables usados en estadística, de 2 ejemplos de cada uno. Defina distribución de frecuencia y explique que es la distribución normal.

  1. Cualitativas: son aquellas que no se expresan mediante un numero si no mediante una cualidad como por ejemplo color, olor, forma, nombre

  2. Cuantitativas: son aquellas que se expresan mediante un numero o sea cantidad, de estas hay dos tipos que son ls discretas y continuas

Distribucion de frecuencia: Son tablas en que se dispone las modalidades de la variable por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que contienen los datos.

Distribucion normal: La distribución normal es una distribución con forma de campana donde las desviaciones estándar sucesivas con respecto a la media establecen valores de referencia para estimar el porcentaje de observaciones de los datos.

library(pacman)
p_load("readr","DT","prettydoc","fdth","modeest" )
library(readr)
pozos_3_ <- read_csv("pozos.csv")
## Parsed with column specification:
## cols(
##   TEMP = col_double(),
##   PHB = col_double(),
##   PH = col_double()
## )
View(pozos_3_)
  • Estos datos son: Datos de pH y Temperatura de pozos de agua subterránea Se elaborarán estos incisos 1 vez para pH y otra para Temperatura
datatable(pozos_3_)
    1. Ordene los datos de menor a mayor, indique el valor máximo / mínimo y el rango total de datos.
#Ordenar de menor a mayor
sort(pozos_3_$TEMP)
##   [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
##  [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
##  [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
##  [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
##  [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
##  [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
##  [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1
sort(pozos_3_$PH)
##   [1] 6.1 6.3 6.4 6.4 6.4 6.4 6.4 6.4 6.4 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5
##  [19] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
##  [37] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.7 6.7 6.7 6.7 6.7
##  [55] 6.7 6.7 6.7 6.7 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
##  [73] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
##  [91] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [109] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [127] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 7.0 7.0
## [163] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [181] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [199] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [217] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [235] 7.0 7.0 7.0 7.0 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [253] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.2 7.2
## [271] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.3 7.3 7.3 7.3 7.3 7.3 7.4 7.4
## [289] 7.4 7.4 7.4 7.4 7.5
#Indique valor Max y Min, rango de datos
TEMPMax <- max(pozos_3_$TEMP)
TEMPMin <- min(pozos_3_$TEMP)
HPMax <- max(pozos_3_$PH)
HPMin <- min(pozos_3_$PH)
#Rango total ph
range(pozos_3_$PH)
## [1] 6.1 7.5
rangoPH <- max(pozos_3_$PH)-min(pozos_3_$PH)
rangoPH
## [1] 1.4
#Rango total temperatura
range(pozos_3_$TEMP)
## [1] 25.6 32.1
rangoTEMP <- max(pozos_3_$TEMP)-min(pozos_3_$TEMP)
rangoTEMP
## [1] 6.5
    1. Obtenga (el número de) los intervalos (o clases) usando la fórmula según Surges y el ancho de clase
#intervalos PH
PH = nclass.Sturges(pozos_3_$PH)
PH
## [1] 10
#intervalos temperatura
TEMP = nclass.Sturges(pozos_3_$TEMP)
TEMP
## [1] 10
#Ancho de clase PH
round(rangoPH/PH,1) 
## [1] 0.1
#Ancho de clase Temperatura
round(rangoTEMP/TEMP,1)
## [1] 0.7
    1. Construya una tabla de frecuencias que incluya: límites de clases, frecuencia absoluta, frecuencia relativa, frecuencia relativa porcentual, frecuencia acumulada y explique a detalle que refleja esta tabla.
tfPH <- pozos_3_$PH
distPH <- fdt(tfPH, breaks="Sturges")
distPH
##   Class limits   f   rf rf(%)  cf  cf(%)
##  [6.039,6.193)   1 0.00  0.34   1   0.34
##  [6.193,6.346)   1 0.00  0.34   2   0.68
##    [6.346,6.5)   7 0.02  2.39   9   3.07
##    [6.5,6.653)  40 0.14 13.65  49  16.72
##  [6.653,6.807)  67 0.23 22.87 116  39.59
##  [6.807,6.961)  44 0.15 15.02 160  54.61
##  [6.961,7.114) 108 0.37 36.86 268  91.47
##  [7.114,7.268)  12 0.04  4.10 280  95.56
##  [7.268,7.421)  12 0.04  4.10 292  99.66
##  [7.421,7.575)   1 0.00  0.34 293 100.00
#Nos brinda una tabla con los calculos de la distribución de frecuencias.
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual
tfTEMP <- pozos_3_$TEMP
distTEMP <- fdt(tfTEMP, breaks="Sturges")
distTEMP
##     Class limits  f   rf rf(%)  cf  cf(%)
##  [25.344,26.052)  2 0.01  0.68   2   0.68
##  [26.052,26.759)  5 0.02  1.71   7   2.39
##  [26.759,27.467) 17 0.06  5.80  24   8.19
##  [27.467,28.175) 63 0.22 21.50  87  29.69
##  [28.175,28.883) 79 0.27 26.96 166  56.66
##   [28.883,29.59) 81 0.28 27.65 247  84.30
##   [29.59,30.298) 28 0.10  9.56 275  93.86
##  [30.298,31.006)  9 0.03  3.07 284  96.93
##  [31.006,31.713)  7 0.02  2.39 291  99.32
##  [31.713,32.421)  2 0.01  0.68 293 100.00
#Nos brinda una tabla con los calculos de la distribución de frecuencias.
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual
    1. Elabore un histograma, polígono de frecuencias, histograma de frecuencias acumulado.
#histograma para PH
hist(tfPH,breaks= "Sturges",col='purple', main="HISTOGRAMA PH")

#histograma para PH
hist(tfTEMP,breaks= "Sturges",col='pink', main="HISTOGRAMA TEMP")

#poligono de frecuencia
plot(distTEMP, type="fp") # Poligono de frecuencia absoluta

plot(distTEMP, type="cfp") # Poligono de frecuencia acumulada

plot(distTEMP, type="rfp") # Poligono de frecuencia relativa

#histograma de frecuencias acumulado
plot(distTEMP, type="cfh") # histograma de frecuencia acumulada

    1. Obtenga la media, mediana, moda e interprete los resultados.
#Media
mean(pozos_3_$TEMP)
## [1] 28.69795
mean(pozos_3_$PH)
## [1] 6.890444
#Estos resultados nos muestran la media o promedio de la temperatura que es 28.69 mientras que la de Ph es 6.89
#Mediana
median(pozos_3_$TEMP)
## [1] 28.7
median(pozos_3_$PH)
## [1] 6.9
#Estos datos nos aportan que ordenando los datos la mediana de la temperatura es 28.7 mientras que la media del PH es 6.9
#Moda
mfv(pozos_3_$TEMP, method="discrete")
## [1] 28.6
mfv(pozos_3_$PH, method="discrete")
## [1] 7
#Estos datos nos arrojan que el valor que más se repite en la temperatura es 28.6 mientras que en elPH es 7

se puede observar que los datos de moda, media y mediana son muy parecidos entre si en ambos datos ya que nuestros datos no diferencian mucho, la temperatura esta entre 28 aproximadamente mientras que el Ph llegando a 7

    1. Obtenga la varianza y la desviación estándar, interprete los resultados. ¿Pueden estas medidas ser negativas?
#Varianza del PH y la temperatura
var(pozos_3_$TEMP)
## [1] 1.035407
var(pozos_3_$PH)
## [1] 0.04908645
#Desviación estandár de la temperatura y del PH
sd(pozos_3_$TEMP)
## [1] 1.017549
sd(pozos_3_$PH)
## [1] 0.2215546

La desviacion estandar nos muestra que tan dispersos estan nuestros datos y en este caso en especifico se puede observar que los datos de la temperatura tienen una desviacion estandar mas alta por lo tanto sus datos varian mas entre si; mientras que la varianza es el cuadrado de la desviacion estandar y de igual manera nos indica que tan dispersos se encuentran los datos alrededor de la media por lo tanto en este caso la temperatura sigue teniendo un numero mayor.

No pueden ser negativas debido a que se obtienen de un promedio de cuadrados.

    1. Elabore gráfico de caja y bigote
boxplot(pozos_3_$TEMP)

boxplot(pozos_3_$PH)

    1. Elabora una gráfica de dispersión de pH versus temperatura, use ggplot aquí. En base a esta gráfica: ¿Considera que estas 2 variables están relacionadas?
library(ggplot2)
ggplot(data = pozos_3_) +
  geom_point(mapping = aes(x=TEMP, y=PH), col="blue", lwd=2, main="TEMPERATURA VS PH" )
## Warning: Ignoring unknown parameters: main

# Análisis de correlación
TEMP <- pozos_3_$TEMP
PH<- pozos_3_$PH
TvsP <- data.frame(TEMP,PH)
pairs(TvsP)

cor(TvsP)
##             TEMP          PH
## TEMP  1.00000000 -0.02029087
## PH   -0.02029087  1.00000000

Basandome en la gráfica considero que estas 2 variables si estan relacionadas, basandome en la quimica el ph es dependiente de la temperatura, y lo podemos comprobarlo observando esta grafica de dispercion

Pregunta de rescate (opcional): Mini ensayo de mínimo media y máximo una cuartilla contestando a la pregunta: ¿De qué manera o maneras reales puede México ser un país más desarrollado? Elaboren y argumenten su propuesta o propuesta. (Use datos para fundamentarse)

En mi opinión México tiene todos los recursos para poder lograr ser un país desarrollado, ya que somos un país sumamente rico en recursos naturales. Sin embargo, exportamos los recursos para que otros países los procesen y se los recompramos casi a doble de precio. Pienso que si como país procesáramos nuestros propios recursos lograríamos rápidamente ser un país más desarrollado, sin mencionar el gran impacto que tendría en la economía, así como en los trabajos que se producirían. Como país deberíamos invertir más en la salud, y en la educación para próximas generaciones, pienso que con esto se crearía un ambiente más saludable y más sustentable, así como desarrollado, utilizar y sacarles el mayor provecho a nuestros recursos, así como energías renovables. Como, por ejemplo, Sonora es uno de los estados donde más se podría aprovechar la energía solar, sin embargo, no se aplica, pensando en los grandes cambios que esto tendría tanto en la economía como en la sustentabilidad ambiental, traería un gran cambio al país. Debería darse prioridad sobre todo a una buena educación para con ello lograr formar al futuro de México, con grandes aspiraciones y proyectos en los que espero yo próximamente logremos ser un país desarrollado.