- Examen de la primera unidad de competencia de estadística aplicada
- Alumna: Johana Valeria Dominguez Arvayo ID: 204134
1.- ¿Qué es la estadística y que aplicaciones tiene en ingeniería (según su ingeniería)? La Estadística se ocupa de los métodos y procedimientos para comprender mejor cualquier una serie de datos, los clasifica, resume y halla regularidades asi como tambien analizar los datos, en base a esto puede formular predicciones. Establece comparaciones o variabilidades que permiten comprender un fenomeno en particular. A pesar de que puede ser utilizada mas alla de las ciencias se utliza mucho en ingenieria, como por ejemplo en ingenieria quimica mayormente se utiliza para conocer comportamientos de quimicos a utilizar, ya sea para medir sus temperaturas, flujos, ph, presiones, etc. es de suma importancia ya que esto nos permite formar predicciones acerca del quimico.
2.- Enliste y defina los tipos de variables usados en estadística, de 2 ejemplos de cada uno. Defina distribución de frecuencia y explique que es la distribución normal.
Cualitativas: son aquellas que no se expresan mediante un numero si no mediante una cualidad como por ejemplo color, olor, forma, nombre
Cuantitativas: son aquellas que se expresan mediante un numero o sea cantidad, de estas hay dos tipos que son ls discretas y continuas
Distribucion de frecuencia: Son tablas en que se dispone las modalidades de la variable por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que contienen los datos.
Distribucion normal: La distribución normal es una distribución con forma de campana donde las desviaciones estándar sucesivas con respecto a la media establecen valores de referencia para estimar el porcentaje de observaciones de los datos.
library(pacman)
p_load("readr","DT","prettydoc","fdth","modeest" )
library(readr)
pozos_3_ <- read_csv("pozos.csv")## Parsed with column specification:
## cols(
## TEMP = col_double(),
## PHB = col_double(),
## PH = col_double()
## )
- Estos datos son: Datos de pH y Temperatura de pozos de agua subterránea Se elaborarán estos incisos 1 vez para pH y otra para Temperatura
- Ordene los datos de menor a mayor, indique el valor máximo / mínimo y el rango total de datos.
## [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
## [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
## [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
## [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
## [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
## [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
## [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1
## [1] 6.1 6.3 6.4 6.4 6.4 6.4 6.4 6.4 6.4 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5
## [19] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
## [37] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.7 6.7 6.7 6.7 6.7
## [55] 6.7 6.7 6.7 6.7 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [73] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [91] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [109] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [127] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 7.0 7.0
## [163] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [181] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [199] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [217] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [235] 7.0 7.0 7.0 7.0 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [253] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.2 7.2
## [271] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.3 7.3 7.3 7.3 7.3 7.3 7.4 7.4
## [289] 7.4 7.4 7.4 7.4 7.5
#Indique valor Max y Min, rango de datos
TEMPMax <- max(pozos_3_$TEMP)
TEMPMin <- min(pozos_3_$TEMP)## [1] 6.1 7.5
## [1] 1.4
## [1] 25.6 32.1
## [1] 6.5
- Obtenga (el número de) los intervalos (o clases) usando la fórmula según Surges y el ancho de clase
## [1] 10
## [1] 10
## [1] 0.1
## [1] 0.7
- Construya una tabla de frecuencias que incluya: límites de clases, frecuencia absoluta, frecuencia relativa, frecuencia relativa porcentual, frecuencia acumulada y explique a detalle que refleja esta tabla.
## Class limits f rf rf(%) cf cf(%)
## [6.039,6.193) 1 0.00 0.34 1 0.34
## [6.193,6.346) 1 0.00 0.34 2 0.68
## [6.346,6.5) 7 0.02 2.39 9 3.07
## [6.5,6.653) 40 0.14 13.65 49 16.72
## [6.653,6.807) 67 0.23 22.87 116 39.59
## [6.807,6.961) 44 0.15 15.02 160 54.61
## [6.961,7.114) 108 0.37 36.86 268 91.47
## [7.114,7.268) 12 0.04 4.10 280 95.56
## [7.268,7.421) 12 0.04 4.10 292 99.66
## [7.421,7.575) 1 0.00 0.34 293 100.00
#Nos brinda una tabla con los calculos de la distribución de frecuencias.
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual## Class limits f rf rf(%) cf cf(%)
## [25.344,26.052) 2 0.01 0.68 2 0.68
## [26.052,26.759) 5 0.02 1.71 7 2.39
## [26.759,27.467) 17 0.06 5.80 24 8.19
## [27.467,28.175) 63 0.22 21.50 87 29.69
## [28.175,28.883) 79 0.27 26.96 166 56.66
## [28.883,29.59) 81 0.28 27.65 247 84.30
## [29.59,30.298) 28 0.10 9.56 275 93.86
## [30.298,31.006) 9 0.03 3.07 284 96.93
## [31.006,31.713) 7 0.02 2.39 291 99.32
## [31.713,32.421) 2 0.01 0.68 293 100.00
#Nos brinda una tabla con los calculos de la distribución de frecuencias.
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual- Elabore un histograma, polígono de frecuencias, histograma de frecuencias acumulado.
#histograma de frecuencias acumulado
plot(distTEMP, type="cfh") # histograma de frecuencia acumulada- Obtenga la media, mediana, moda e interprete los resultados.
## [1] 28.69795
## [1] 6.890444
#Estos resultados nos muestran la media o promedio de la temperatura que es 28.69 mientras que la de Ph es 6.89## [1] 28.7
## [1] 6.9
#Estos datos nos aportan que ordenando los datos la mediana de la temperatura es 28.7 mientras que la media del PH es 6.9## [1] 28.6
## [1] 7
#Estos datos nos arrojan que el valor que más se repite en la temperatura es 28.6 mientras que en elPH es 7se puede observar que los datos de moda, media y mediana son muy parecidos entre si en ambos datos ya que nuestros datos no diferencian mucho, la temperatura esta entre 28 aproximadamente mientras que el Ph llegando a 7
- Obtenga la varianza y la desviación estándar, interprete los resultados. ¿Pueden estas medidas ser negativas?
## [1] 1.035407
## [1] 0.04908645
## [1] 1.017549
## [1] 0.2215546
La desviacion estandar nos muestra que tan dispersos estan nuestros datos y en este caso en especifico se puede observar que los datos de la temperatura tienen una desviacion estandar mas alta por lo tanto sus datos varian mas entre si; mientras que la varianza es el cuadrado de la desviacion estandar y de igual manera nos indica que tan dispersos se encuentran los datos alrededor de la media por lo tanto en este caso la temperatura sigue teniendo un numero mayor.
No pueden ser negativas debido a que se obtienen de un promedio de cuadrados.
- Elabore gráfico de caja y bigote
- Elabora una gráfica de dispersión de pH versus temperatura, use ggplot aquí. En base a esta gráfica: ¿Considera que estas 2 variables están relacionadas?
library(ggplot2)
ggplot(data = pozos_3_) +
geom_point(mapping = aes(x=TEMP, y=PH), col="blue", lwd=2, main="TEMPERATURA VS PH" )## Warning: Ignoring unknown parameters: main
# Análisis de correlación
TEMP <- pozos_3_$TEMP
PH<- pozos_3_$PH
TvsP <- data.frame(TEMP,PH)
pairs(TvsP)## TEMP PH
## TEMP 1.00000000 -0.02029087
## PH -0.02029087 1.00000000
Basandome en la gráfica considero que estas 2 variables si estan relacionadas, basandome en la quimica el ph es dependiente de la temperatura, y lo podemos comprobarlo observando esta grafica de dispercion
Pregunta de rescate (opcional): Mini ensayo de mínimo media y máximo una cuartilla contestando a la pregunta: ¿De qué manera o maneras reales puede México ser un país más desarrollado? Elaboren y argumenten su propuesta o propuesta. (Use datos para fundamentarse)
En mi opinión México tiene todos los recursos para poder lograr ser un país desarrollado, ya que somos un país sumamente rico en recursos naturales. Sin embargo, exportamos los recursos para que otros países los procesen y se los recompramos casi a doble de precio. Pienso que si como país procesáramos nuestros propios recursos lograríamos rápidamente ser un país más desarrollado, sin mencionar el gran impacto que tendría en la economía, así como en los trabajos que se producirían. Como país deberíamos invertir más en la salud, y en la educación para próximas generaciones, pienso que con esto se crearía un ambiente más saludable y más sustentable, así como desarrollado, utilizar y sacarles el mayor provecho a nuestros recursos, así como energías renovables. Como, por ejemplo, Sonora es uno de los estados donde más se podría aprovechar la energía solar, sin embargo, no se aplica, pensando en los grandes cambios que esto tendría tanto en la economía como en la sustentabilidad ambiental, traería un gran cambio al país. Debería darse prioridad sobre todo a una buena educación para con ello lograr formar al futuro de México, con grandes aspiraciones y proyectos en los que espero yo próximamente logremos ser un país desarrollado.