library(pacman)
p_load(rmdformats,readr,readxl,ggplot2,plotly,DT,xfun,gridExtra,leaflet)
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var

Examen de la primera unidad de competencia de estadística aplicada

Nombre: Jesús Omar Hernández Iturbe Matrícula: 00000216652 30/10/2021

Respuestas amplias y muy bien argumentadas / elaboradas / específicas.

1.- ¿Qué es la estadística y que aplicaciones tiene en ingeniería (según su ingeniería)?

La estadística es una ciencia la cual por medio de la organización de datos numéricos se puede llegar a analizar problemas o situaciones basadas en el cálculo de probabilidades. En el caso en el área de ingeniería de software la estadística es un importante factor ya que esta se basa en la resolución de problemas y para ello es muy necesario llegar a buscar en los datos formas para llegar a una solución. Es posible poder resumir los resultados en cosas tan cómodamente visibles con lo son las gráficas y tablas además de ayudar a sacar conclusiones. A grandes rasgos la estadística es muy importante en el software porque permite llegar a solucionar problemas por medio de datos obtenidos.

Enliste y defina los tipos de variables usados en estadística, de 2 ejemplos de cada uno. Defina distribución de frecuencia y explique que es la distribución normal.

Variable cuantitativa Estas son aquellas variables las cuales se pueden llegar a expresar de forma numerica

Variable continua

Una variable continua es un tipo de variable aleatoria la cual puede cambiar dependiendo la circunstancia.

Variable discreta

Una variable es discreta cuando no puede tomar ningún valor de dos consecutivos.

Variable cualitativa

La variable cualitativa son aquellas las cuale dan un valor tipo cualidad o palabras.

Variable ordinal:

Esta es un tipo de variable que expresa por medio de palabras su valor Variable nominal:

Una variable nominal es un tipo de variable estadística se llega a dominar con nombre sus cualidades.

Distribución de frecuencia:

Las distribuciones de frecuencias son organizadores en forma de tabla en que se dispone por medio de filas. En las columnas se pone el número de ocurrencias por cada valor, porcentajes.

Distribución normal:

Funciona para conocer la probabilidad de encontrar un valor de la variable que sea igual o inferior a un cierto valor numerico.

Pozos

Cargar los datos utilizados

setwd("~/APLICADA")
pozos <- read_excel("pozos.xlsx")
datatable(pozos)

A) Ordene los datos de menor a mayor, indique el valor máximo / mínimo y el rango total de datos.

Datos de PH de menor a mayor:

sort(pozos$"PH", decreasing = FALSE) 
##   [1] 6.1 6.3 6.4 6.4 6.4 6.4 6.4 6.4 6.4 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5
##  [19] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
##  [37] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.7 6.7 6.7 6.7 6.7
##  [55] 6.7 6.7 6.7 6.7 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
##  [73] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
##  [91] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [109] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [127] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 7.0 7.0
## [163] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [181] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [199] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [217] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [235] 7.0 7.0 7.0 7.0 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [253] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.2 7.2
## [271] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.3 7.3 7.3 7.3 7.3 7.3 7.4 7.4
## [289] 7.4 7.4 7.4 7.4 7.5

Datos de Temperatura de menor a mayor:

sort(pozos$"TEMP", decreasing = FALSE) 
##   [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
##  [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
##  [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
##  [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
##  [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
##  [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
##  [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1

Valor Maximo PH

max(pozos$"PH")
## [1] 7.5

Valor Minimo PH

min(pozos$"PH")
## [1] 6.1

Valor Maximo Temperatura

max(pozos$"PH")
## [1] 7.5

Valor Minimo Temperatura

min(pozos$"PH")
## [1] 6.1

Rango total de PH

rangoPH <- range(pozos$"PH") 
rangoPH
## [1] 6.1 7.5

Rango total de Temperatura

rangoTEMP <- range(pozos$"TEMP") 
rangoTEMP
## [1] 25.6 32.1

B) Obtenga (el número de) los intervalos (o clases) usando la fórmula según Sturges y el ancho de clase.

Numero de clases de PH

nclass.Sturges(pozos$"PH")
## [1] 10

Ancho de la clase de PH:

anchoPH <- ((max(pozos$"PH") - min(pozos$"PH"))/nclass.Sturges(pozos$"PH"))
anchoPH
## [1] 0.14

Numero de clases de Temperatura

nclass.Sturges(pozos$"TEMP")
## [1] 10

Ancho de la clase de Temperatura:

anchoTEMP <- ((max(pozos$"TEMP") - min(pozos$"TEMP"))/nclass.Sturges(pozos$"TEMP"))
anchoTEMP
## [1] 0.65

C) Construya una tabla de frecuencias que incluya: límites de clases, frecuencia absoluta, frecuencia relativa, frecuencia relativa porcentual, frecuencia acumulada y explique a detalle que refleja esta tabla.

Comenzamos con la realizacion de la estructura del Histograma

tablaP <- fdt(pozos)
tablaP
## PH 
##   Class limits   f   rf rf(%)  cf  cf(%)
##  [6.039,6.193)   1 0.00  0.34   1   0.34
##  [6.193,6.346)   1 0.00  0.34   2   0.68
##    [6.346,6.5)   7 0.02  2.39   9   3.07
##    [6.5,6.653)  40 0.14 13.65  49  16.72
##  [6.653,6.807)  67 0.23 22.87 116  39.59
##  [6.807,6.961)  44 0.15 15.02 160  54.61
##  [6.961,7.114) 108 0.37 36.86 268  91.47
##  [7.114,7.268)  12 0.04  4.10 280  95.56
##  [7.268,7.421)  12 0.04  4.10 292  99.66
##  [7.421,7.575)   1 0.00  0.34 293 100.00
## 
## TEMP 
##     Class limits  f   rf rf(%)  cf  cf(%)
##  [25.344,26.052)  2 0.01  0.68   2   0.68
##  [26.052,26.759)  5 0.02  1.71   7   2.39
##  [26.759,27.467) 17 0.06  5.80  24   8.19
##  [27.467,28.175) 63 0.22 21.50  87  29.69
##  [28.175,28.883) 79 0.27 26.96 166  56.66
##   [28.883,29.59) 81 0.28 27.65 247  84.30
##   [29.59,30.298) 28 0.10  9.56 275  93.86
##  [30.298,31.006)  9 0.03  3.07 284  96.93
##  [31.006,31.713)  7 0.02  2.39 291  99.32
##  [31.713,32.421)  2 0.01  0.68 293 100.00

Para dar una pequeña explicacion, aqui las tablas se pueden encontrar extructuradas las cuales tienen una cantidad de 10 valores divididas entre la que es de PH y la de temperatura. Ahora es necesario dividir la información en diferentes organizadores.

D) Elabore un histograma, polígono de frecuencias, histograma de frecuencias acumulado.

Histograma

plot(tablaP,type='fh')

Poligono de frecuencia segun sturge

plot(tablaP,type='fp')

Histograma de frecuencia acumulada

plot(tablaP, type = 'cfh') 

## E) Obtenga la media, mediana, moda e interprete los resultados.

Datos PH

Media

mean(pozos$"PH")
## [1] 6.890444

Mediana

median(pozos$"PH")
## [1] 6.9

Moda

mfv(pozos$"PH")
## [1] 7

Se puede llegar a ver que la mediana es mayor que la media aun que estas se encuentren muy cercanas. Ademas de que el PH de 7 es muy comun al parecer.

Datos PH

Media

mean(pozos$"TEMP")
## [1] 28.69795

Mediana

median(pozos$"TEMP")
## [1] 28.7

Moda

mfv(pozos$"TEMP")
## [1] 28.6

La diferencia entre la Mediana y la media es casi minima por numeros muy pequeños y al parecer la temperatura mas comun es la de 28.6.

F) Obtenga la varianza y la desviación estándar, interprete los resultados. ¿Pueden estas medidas ser negativas?

Varianza

var(tablaP)
## $PH
## [1] 0.04936057
## 
## $TEMP
## [1] 1.065229

La varianza del PH es muy pequeña

Desviacion estandar

sd(tablaP)
## $PH
## [1] 0.2221724
## 
## $TEMP
## [1] 1.032099

Aqui los valores no pueden ser negativos ya que al estar siempre mayor al 0 nunca estaria en un numero inferior a este. ## G) Elabore gráfico de caja y bigote

PH

boxplot(pozos$"PH")

Temperatura

boxplot(pozos$"TEMP")

## H) Elabora una gráfica de dispersión de pH versus temperatura, use ggplot aquí. En base a esta gráfica: ¿Considera que estas 2 variables están relacionadas?

ggplot(data = pozos)+
  geom_point(mapping = aes(x= TEMP, y= PH), lwd = 2)

pairs(pozos)

Se puede llegar a ver que el PH si tiene que ver según la temperatura según estos datos. Estos llegan a tener cierto comportamiento llegando la mayoría a centrar en los datos medios.

Pregunta de rescate (opcional): Mini ensayo de mínimo media y máximo una cuartilla contestando a la pregunta: ¿De qué manera o maneras reales puede México ser un país más desarrollado? Elaboren y argumenten su propuesta o propuesta. (Use datos para fundamentarse)

México puede llegar a tener una enorme cantidad de recursos en ser explotados, un vasto territorio mucho más grande que cualquier otro país pequeño que fácilmente puedo superarse a sí mismo pero lo que siento yo es que la riqueza en si mismo en México es la gente en sí misma. México puede dar una mano de obra similares comparándonos a los países desarrollados según paginas como elfinanciero, lastimosamente también somos unos de los países con la mano de obra mas barata en el mundo siento esto foco de que ciertas empresas extranjeras que lleguen a acomodar en el país dando mas oportunidad de ser más diversos en estos ámbitos pero también ser dependientes de productos de otras partes dejándonos como simples trabajadores de segunda con datos tomados de páginas como https://www.bbc.com/ “Cómo se beneficia Estados Unidos fabricando productos en México” dando como ejemplo de que empresas americanas prefieren mano de obra mexicana ya que su pago es mucho menos que un trabajador promedio de Estados unidos aunque esto es del todo malo en realidad. Debemos comprometernos mas en productos de ámbito nacional y no dejar en su mayoría ser dependientes de empresas extranjeras (sin dejar de serlo completamente) y llegar a ver que nosotros mismos como mexicanos podemos llegar a mas si simplemente cultivamos el talento de cada uno.