library(pacman)
p_load(rmdformats,readr,readxl,ggplot2,plotly,DT,xfun,gridExtra,leaflet)
library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
Examen de la primera unidad de competencia de estadística aplicada
Nombre: Jesús Omar Hernández Iturbe Matrícula: 00000216652 30/10/2021
Respuestas amplias y muy bien argumentadas / elaboradas / específicas.
1.- ¿Qué es la estadística y que aplicaciones tiene en ingeniería (según su ingeniería)?
La estadística es una ciencia la cual por medio de la organización de datos numéricos se puede llegar a analizar problemas o situaciones basadas en el cálculo de probabilidades. En el caso en el área de ingeniería de software la estadística es un importante factor ya que esta se basa en la resolución de problemas y para ello es muy necesario llegar a buscar en los datos formas para llegar a una solución. Es posible poder resumir los resultados en cosas tan cómodamente visibles con lo son las gráficas y tablas además de ayudar a sacar conclusiones. A grandes rasgos la estadística es muy importante en el software porque permite llegar a solucionar problemas por medio de datos obtenidos.
Enliste y defina los tipos de variables usados en estadística, de 2 ejemplos de cada uno. Defina distribución de frecuencia y explique que es la distribución normal.
Variable cuantitativa Estas son aquellas variables las cuales se pueden llegar a expresar de forma numerica
Variable continua
Una variable continua es un tipo de variable aleatoria la cual puede cambiar dependiendo la circunstancia.
Variable discreta
Una variable es discreta cuando no puede tomar ningún valor de dos consecutivos.
Variable cualitativa
La variable cualitativa son aquellas las cuale dan un valor tipo cualidad o palabras.
Variable ordinal:
Esta es un tipo de variable que expresa por medio de palabras su valor Variable nominal:
Una variable nominal es un tipo de variable estadística se llega a dominar con nombre sus cualidades.
Distribución de frecuencia:
Las distribuciones de frecuencias son organizadores en forma de tabla en que se dispone por medio de filas. En las columnas se pone el número de ocurrencias por cada valor, porcentajes.
Distribución normal:
Funciona para conocer la probabilidad de encontrar un valor de la variable que sea igual o inferior a un cierto valor numerico.
Cargar los datos utilizados
setwd("~/APLICADA")
<- read_excel("pozos.xlsx")
pozos datatable(pozos)
Datos de PH de menor a mayor:
sort(pozos$"PH", decreasing = FALSE)
## [1] 6.1 6.3 6.4 6.4 6.4 6.4 6.4 6.4 6.4 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5
## [19] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
## [37] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.7 6.7 6.7 6.7 6.7
## [55] 6.7 6.7 6.7 6.7 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [73] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [91] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [109] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [127] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 7.0 7.0
## [163] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [181] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [199] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [217] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [235] 7.0 7.0 7.0 7.0 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [253] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.2 7.2
## [271] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.3 7.3 7.3 7.3 7.3 7.3 7.4 7.4
## [289] 7.4 7.4 7.4 7.4 7.5
Datos de Temperatura de menor a mayor:
sort(pozos$"TEMP", decreasing = FALSE)
## [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
## [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
## [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
## [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
## [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
## [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
## [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1
Valor Maximo PH
max(pozos$"PH")
## [1] 7.5
Valor Minimo PH
min(pozos$"PH")
## [1] 6.1
Valor Maximo Temperatura
max(pozos$"PH")
## [1] 7.5
Valor Minimo Temperatura
min(pozos$"PH")
## [1] 6.1
Rango total de PH
<- range(pozos$"PH")
rangoPH rangoPH
## [1] 6.1 7.5
Rango total de Temperatura
<- range(pozos$"TEMP")
rangoTEMP rangoTEMP
## [1] 25.6 32.1
Numero de clases de PH
nclass.Sturges(pozos$"PH")
## [1] 10
Ancho de la clase de PH:
<- ((max(pozos$"PH") - min(pozos$"PH"))/nclass.Sturges(pozos$"PH"))
anchoPH anchoPH
## [1] 0.14
Numero de clases de Temperatura
nclass.Sturges(pozos$"TEMP")
## [1] 10
Ancho de la clase de Temperatura:
<- ((max(pozos$"TEMP") - min(pozos$"TEMP"))/nclass.Sturges(pozos$"TEMP"))
anchoTEMP anchoTEMP
## [1] 0.65
Comenzamos con la realizacion de la estructura del Histograma
<- fdt(pozos)
tablaP tablaP
## PH
## Class limits f rf rf(%) cf cf(%)
## [6.039,6.193) 1 0.00 0.34 1 0.34
## [6.193,6.346) 1 0.00 0.34 2 0.68
## [6.346,6.5) 7 0.02 2.39 9 3.07
## [6.5,6.653) 40 0.14 13.65 49 16.72
## [6.653,6.807) 67 0.23 22.87 116 39.59
## [6.807,6.961) 44 0.15 15.02 160 54.61
## [6.961,7.114) 108 0.37 36.86 268 91.47
## [7.114,7.268) 12 0.04 4.10 280 95.56
## [7.268,7.421) 12 0.04 4.10 292 99.66
## [7.421,7.575) 1 0.00 0.34 293 100.00
##
## TEMP
## Class limits f rf rf(%) cf cf(%)
## [25.344,26.052) 2 0.01 0.68 2 0.68
## [26.052,26.759) 5 0.02 1.71 7 2.39
## [26.759,27.467) 17 0.06 5.80 24 8.19
## [27.467,28.175) 63 0.22 21.50 87 29.69
## [28.175,28.883) 79 0.27 26.96 166 56.66
## [28.883,29.59) 81 0.28 27.65 247 84.30
## [29.59,30.298) 28 0.10 9.56 275 93.86
## [30.298,31.006) 9 0.03 3.07 284 96.93
## [31.006,31.713) 7 0.02 2.39 291 99.32
## [31.713,32.421) 2 0.01 0.68 293 100.00
Para dar una pequeña explicacion, aqui las tablas se pueden encontrar extructuradas las cuales tienen una cantidad de 10 valores divididas entre la que es de PH y la de temperatura. Ahora es necesario dividir la información en diferentes organizadores.
Histograma
plot(tablaP,type='fh')
Poligono de frecuencia segun sturge
plot(tablaP,type='fp')
Histograma de frecuencia acumulada
plot(tablaP, type = 'cfh')
## E) Obtenga la media, mediana, moda e interprete los resultados.
Datos PH
Media
mean(pozos$"PH")
## [1] 6.890444
Mediana
median(pozos$"PH")
## [1] 6.9
Moda
mfv(pozos$"PH")
## [1] 7
Se puede llegar a ver que la mediana es mayor que la media aun que estas se encuentren muy cercanas. Ademas de que el PH de 7 es muy comun al parecer.
Datos PH
Media
mean(pozos$"TEMP")
## [1] 28.69795
Mediana
median(pozos$"TEMP")
## [1] 28.7
Moda
mfv(pozos$"TEMP")
## [1] 28.6
La diferencia entre la Mediana y la media es casi minima por numeros muy pequeños y al parecer la temperatura mas comun es la de 28.6.
Varianza
var(tablaP)
## $PH
## [1] 0.04936057
##
## $TEMP
## [1] 1.065229
La varianza del PH es muy pequeña
Desviacion estandar
sd(tablaP)
## $PH
## [1] 0.2221724
##
## $TEMP
## [1] 1.032099
Aqui los valores no pueden ser negativos ya que al estar siempre mayor al 0 nunca estaria en un numero inferior a este. ## G) Elabore gráfico de caja y bigote
PH
boxplot(pozos$"PH")
Temperatura
boxplot(pozos$"TEMP")
## H) Elabora una gráfica de dispersión de pH versus temperatura, use ggplot aquí. En base a esta gráfica: ¿Considera que estas 2 variables están relacionadas?
ggplot(data = pozos)+
geom_point(mapping = aes(x= TEMP, y= PH), lwd = 2)
pairs(pozos)
Se puede llegar a ver que el PH si tiene que ver según la temperatura según estos datos. Estos llegan a tener cierto comportamiento llegando la mayoría a centrar en los datos medios.
México puede llegar a tener una enorme cantidad de recursos en ser explotados, un vasto territorio mucho más grande que cualquier otro país pequeño que fácilmente puedo superarse a sí mismo pero lo que siento yo es que la riqueza en si mismo en México es la gente en sí misma. México puede dar una mano de obra similares comparándonos a los países desarrollados según paginas como elfinanciero, lastimosamente también somos unos de los países con la mano de obra mas barata en el mundo siento esto foco de que ciertas empresas extranjeras que lleguen a acomodar en el país dando mas oportunidad de ser más diversos en estos ámbitos pero también ser dependientes de productos de otras partes dejándonos como simples trabajadores de segunda con datos tomados de páginas como https://www.bbc.com/ “Cómo se beneficia Estados Unidos fabricando productos en México” dando como ejemplo de que empresas americanas prefieren mano de obra mexicana ya que su pago es mucho menos que un trabajador promedio de Estados unidos aunque esto es del todo malo en realidad. Debemos comprometernos mas en productos de ámbito nacional y no dejar en su mayoría ser dependientes de empresas extranjeras (sin dejar de serlo completamente) y llegar a ver que nosotros mismos como mexicanos podemos llegar a mas si simplemente cultivamos el talento de cada uno.