Examen

Joshiva Yzair Ruiz Tapia

29/10/2021

library(pacman)
p_load(rmdformats,readr,readxl,ggplot2,plotly,DT,xfun,gridExtra,leaflet,fdth,modeest,dplyr)
library(readxl)
datos<- read_excel("pozos.xlsx")
datatable(datos)

1.- ¿Qué es la estadística y que aplicaciones tiene en ingeniería (según su ingeniería)?

La estadística es la ciencia de los datos y que su principal objetivo es mejorar la comprensión de los hechos a partir de la información disponible. Esta consiste en métodos, procedimientos y fórmulas que permiten la obtención de información, para posteriormente poder ordenarla, analizarla y estudiarla, extrayendo de este proceso un mejor entendimiento de los datos y a su vez predicciones sobre fenómenos observados, con el cual podemos redactar una conclusión relevante.

Existen varios tipos de estadística: Estadística descriptiva: Se refiere a los métodos de recolección, organización, resumen y presentación de un conjunto de datos, El objetivo principal de esta estadística es la de describir las características fundamentales de los datos, normalmente para lograr este objetivo se utilizan herramientas como indicadores, gráficos y tablas.

Estadística inferencial: Se refiere a los métodos y formulas utilizadas para la obtención de datos para posteriormente poder realizar las predicciones y generalizaciones, de las cuales poder obtener conclusiones a partir de los datos analizados.

La estadística inferencial se subdivide en dos tipos: Estadística paramétrica: Se caracteriza porque asume que los datos tienen una distribución determinada, la cual determina el papel de juzgar si los datos están dentro de los parámetros normales o no. En base a esto, se puede realizar la conclusión de los datos analizados.

Estadística no paramétrica: Al contrario que la estadística paramétrica, esta se caracteriza por no asumir ningún tipo de distribución subyacente en los datos, ni poseer ningún parámetro especifico. Un ejemplo de esta, sería la prueba binomial.

Algunos elementos que son utilizados en la estadística:

Población: Grupo de individuos que se presenta como datos que se desea investigar.

Muestra: un subgrupo de datos extraídos de una población que debe representar adecuadamente la totalidad del grupo.

Parámetros: Son medidas que ofrecen información sobre el centro de un conjunto de datos (medidas de tendencia central) y dispersión o variabilidad (medidas de dispersión).

Experimento: proceso o actividad llevada a cabo de forma intencional para obtener una serie de datos, la cual es utilizada para ratificar o refutar una hipótesis.

Variable: Característica de una muestra o población a la cual se le puede asignar un valor.

Estadística en ingeniería en Software: Como se mencionó anteriormente, la estadística es una herramienta la cual nos permite entender y facilitar la comprensión de los datos, la cual la hace una herramienta extremadamente útil, y es normal que esta se utilice en distintas áreas de estudio. Un ejemplo seria en ing. Software, de la cual la combinación de la Estadística y Software nace el Software estadístico que se basa en la creación de aplicaciones con el objetivo de facilitar la ejecución de la estadística, ya que esta agiliza y supera por mucho la capacidad de calculo de la mente humana. realizando trabajos mucha mas grandes y complicados en menor tiempo.

Algunas aplicaciones creadas con este fin son Excel y r Studio, estas funcionan mediante un lenguaje de programación en específico, realizan algunos métodos y funciones que ayuda a la transformación de los datos, estas aplicaciones aportan al usuario una gran manejabilidad de los datos, haciendo sencillo el uso de estas y logrando que cualquier persona pueda aplicar la estadística sin la necesidad de un entendimiento profundo del tema.

2.- Enliste y defina los tipos de variables usados en estadística, de 2 ejemplos de cada uno. Defina distribución de frecuencia y explique que es la distribución normal. En la estadística existen docenas de tipos de variables y por norma general se encuentran dos tipos de variables las cuales son Variables cuantitativas y cualitativas.

Variable Cuantitativa: Este tipo de variables son las que se expresan de manera numérica, por ejemplo las horas que trabaja un empleado a lo largo de la semana.

Las variables cuantitativas se subdividen en dos tipos de variables que son la continua y discreta.

Variable continua: Se caracteriza por tomar un valor infinito de valores entre un intervalo de datos, por ejemplo, el tiempo que tarda un corredor en completar 100 metros lisos.

Variable discreta: Se caracteriza por tomar un valor finito de valores entre un intervalo de datos, un ejemplo seria la cantidad de helados vendidos en una tienda que posee x cantidad de helados.

Variable Cualitativa: Este tipo de variables son las que se expresan por norma general de manera alfabética, un ejemplo seria los asistentes de un concierto que tienen entradas diferenciadas por zonas (Vip o normal).

Las variables cualitativas se subdividen en dos tipos de variables que son la ordinal y nominal.

Variable ordinal: Expresa diferentes niveles y orden, por ejemplo los pilotos de una carrera de coches de la Fórmula 1.

Variable nominal: Expresa una palabra diferenciada, por ejemplo el color de ojos puede tener variables como café, azul, verde entre otros.

Distribución de frecuencia Es la forma en la que un conjunto de datos ordenados en una serie de observaciones que se clasifica en distintos grupos individuales entre si, es decir si un dato pertenece a un grupo no puede pertenecer a otro.

Existen tipos de distribuciones de frecuencia:

Frecuencia absoluta(fi): Es la cantidad de observaciones que pertenecen a cada grupo, esto se interpreta como la cantidad de veces que se repite un suceso, por ejemplo un grupo de 100 personas, entre ellos 20 tengan entre 20 a 30 años.

Frecuencia relativa(hi): Esta es el resultado de la división entre la frecuencia absoluta entre el numero de datos, un ejemplo seria el caso anterior 20/100 = 0.2 o 20%

Frecuencia absoluta acumulada(FI): Es el resultado de sumar las frecuencias absolutas de una clase o grupo de muestras con la anterior o anteriores, por ejemplo para calcular la frecuencia absoluta acumulada del tercer grupo, se suman las frecuencias absolutas del primer, según y tercer grupo.

Frecuencia relativa acumulada(HI): Es el resultado de sumar las frecuencias relativas tal y como se explica en la frecuencia absoluta acumulada, por ejemplo para calcular la frecuencia relativa acumulada del cuarto grupo, se suman el primer, segundo, tercer y cuarto grupo.

Distribución normal La distribución normal es un modelo teórico capaz de aproximar satisfactoriamente el valor de una variable aleatoria a una situación ideal. La distribución normal adapta una variable aleatoria a una función que depende de la media y la desviación típica. Esta posee la característica de que su grafica es similar a la de una campana, donde las desviaciones estándar sucesivas con respecto a la media establecen los valores de referencia para estimar el porcentaje de observaciones de los datos, estos valores son la base de muchas pruebas de hipótesis. Su formula es la siguiente

Z=(X-Media)/Desviación típica

menorMayorPH = t(datos$PH)
menorMayorTEMP = t(datos$TEMP)
menorMayorPH=sort(menorMayorPH,decreasing = FALSE)
menorMayorTEMP=sort(menorMayorTEMP,decreasing = FALSE)

mayorMenorPH=t(datos$PH)
mayorMenorTEMP=t(datos$TEMP)
mayorMenorPH=sort(mayorMenorPH,decreasing = TRUE)
mayorMenorTEMP=sort(mayorMenorTEMP,decreasing = TRUE)

A

Menor a mayor PH

menorMayorPH
##   [1] 6.1 6.3 6.4 6.4 6.4 6.4 6.4 6.4 6.4 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5
##  [19] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
##  [37] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.7 6.7 6.7 6.7 6.7
##  [55] 6.7 6.7 6.7 6.7 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
##  [73] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
##  [91] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [109] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [127] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 7.0 7.0
## [163] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [181] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [199] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [217] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [235] 7.0 7.0 7.0 7.0 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [253] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.2 7.2
## [271] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.3 7.3 7.3 7.3 7.3 7.3 7.4 7.4
## [289] 7.4 7.4 7.4 7.4 7.5

Mayor a menor PH

mayorMenorPH
##   [1] 7.5 7.4 7.4 7.4 7.4 7.4 7.4 7.3 7.3 7.3 7.3 7.3 7.3 7.2 7.2 7.2 7.2 7.2
##  [19] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
##  [37] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
##  [55] 7.1 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
##  [73] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
##  [91] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [109] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [127] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [163] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.8 6.8 6.8
## [181] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [199] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [217] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [235] 6.8 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
## [253] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.5 6.5 6.5
## [271] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.4 6.4 6.4 6.4
## [289] 6.4 6.4 6.4 6.3 6.1

Valor maximo y minimo PH

# Maximo
max(datos$PH)
## [1] 7.5
#Minimo
min(datos$PH)
## [1] 6.1

Valor maximo y minimo TEMP

# Maximo
max(datos$TEMP)
## [1] 32.1
#Minimo
min(datos$TEMP)
## [1] 25.6

Menor a mayor TEMP

menorMayorTEMP
##   [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
##  [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
##  [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
##  [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
##  [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
##  [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
##  [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1

Mayor a menor TEMP

mayorMenorTEMP
##   [1] 32.1 31.9 31.7 31.5 31.4 31.2 31.1 31.1 31.1 30.9 30.8 30.6 30.5 30.4 30.3
##  [16] 30.3 30.3 30.3 30.2 30.2 30.2 30.1 30.1 30.1 30.1 30.0 30.0 30.0 30.0 30.0
##  [31] 30.0 29.9 29.9 29.9 29.9 29.8 29.8 29.8 29.8 29.8 29.8 29.7 29.7 29.6 29.6
##  [46] 29.6 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.4 29.4 29.4 29.4 29.4
##  [61] 29.4 29.4 29.4 29.4 29.4 29.4 29.3 29.3 29.3 29.3 29.2 29.2 29.2 29.2 29.2
##  [76] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.1 29.1 29.1 29.1 29.1 29.1
##  [91] 29.1 29.1 29.1 29.1 29.1 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [106] 29.0 29.0 29.0 29.0 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [121] 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [136] 28.8 28.8 28.8 28.8 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [166] 28.6 28.6 28.6 28.6 28.6 28.6 28.5 28.5 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [181] 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.3 28.3 28.3 28.3 28.3 28.3 28.3 28.2
## [196] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.1 28.1 28.1 28.0
## [211] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
## [226] 28.0 28.0 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
## [241] 27.9 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.7 27.7 27.7
## [256] 27.7 27.6 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.4
## [271] 27.4 27.4 27.4 27.4 27.3 27.3 27.3 27.3 27.2 27.2 27.1 27.0 27.0 26.9 26.8
## [286] 26.8 26.4 26.4 26.3 26.3 26.2 25.8 25.6

Rango de datos PH

resul=max(datos$PH)-min(datos$PH)
range(datos$PH)
## [1] 6.1 7.5
resul
## [1] 1.4

Rango de datos TEMP

resul2=max(datos$TEMP)-min(datos$TEMP)
range(datos$TEMP)
## [1] 25.6 32.1
resul2
## [1] 6.5

B

Numero de clases PH

k=nclass.Sturges(datos$PH)
k
## [1] 10

Anchura de clase PH

a = round(resul/k, 1)
a
## [1] 0.1

Numero de clases TEMP

k2=nclass.Sturges(datos$TEMP)
k2
## [1] 10

Anchura de clase TEMMP

a2 = round(resul2/k2, 1)
a2
## [1] 0.7

C

Tabla de distribuciones de frecuencias PH

tablaPH=fdt(datos$PH,breaks="Sturges")
tablaPH
##   Class limits   f   rf rf(%)  cf  cf(%)
##  [6.039,6.193)   1 0.00  0.34   1   0.34
##  [6.193,6.346)   1 0.00  0.34   2   0.68
##    [6.346,6.5)   7 0.02  2.39   9   3.07
##    [6.5,6.653)  40 0.14 13.65  49  16.72
##  [6.653,6.807)  67 0.23 22.87 116  39.59
##  [6.807,6.961)  44 0.15 15.02 160  54.61
##  [6.961,7.114) 108 0.37 36.86 268  91.47
##  [7.114,7.268)  12 0.04  4.10 280  95.56
##  [7.268,7.421)  12 0.04  4.10 292  99.66
##  [7.421,7.575)   1 0.00  0.34 293 100.00

En esta tabla se puede observar que el intervalo con mayor cantidad de datos es el de 6.961-7.114 a su vez es la que mas se repite dandonos a entender que el rango de PH que mas se repite esta entre este rango con un 36.86% de las variables totales.

Tabla de distribuciones de frecuencias TEMP

tablaTEMP=fdt(datos$TEMP,breaks="Sturges")
tablaTEMP
##     Class limits  f   rf rf(%)  cf  cf(%)
##  [25.344,26.052)  2 0.01  0.68   2   0.68
##  [26.052,26.759)  5 0.02  1.71   7   2.39
##  [26.759,27.467) 17 0.06  5.80  24   8.19
##  [27.467,28.175) 63 0.22 21.50  87  29.69
##  [28.175,28.883) 79 0.27 26.96 166  56.66
##   [28.883,29.59) 81 0.28 27.65 247  84.30
##   [29.59,30.298) 28 0.10  9.56 275  93.86
##  [30.298,31.006)  9 0.03  3.07 284  96.93
##  [31.006,31.713)  7 0.02  2.39 291  99.32
##  [31.713,32.421)  2 0.01  0.68 293 100.00

En esta tabla se puede observar que el intervalo con mayor cantidad de datos es el de 28.883-29.59 a su vez es la que mas se repite dandonos a entender que el rango de PH que mas se repite esta entre este rango con un 27.65% de las variables totales.

D

Histograma PH

hist(datos$PH,breaks = "Sturges")

Histograma TEMP

hist(datos$TEMP,breaks = "Sturges")

Poligono de frecuencias PH

Poligono de frecuencia absoluta

plot(tablaPH,type = "fp") 

Poligono de frecuencia relativa

plot(tablaPH,type = "rfp") 

Poligono de frecuencia acumulada

plot(tablaPH,type = "cfp") 

Poligono de frecuencias TEMP

Poligono de frecuencia absoluta

plot(tablaTEMP,type = "fp") 

Poligono de frecuencia relativa

plot(tablaTEMP,type = "rfp") 

Poligono de frecuencia acumulada

plot(tablaTEMP,type = "cfp") 

Histograma de frecuencias acumulado PH

plot(tablaPH,type = "cfh") 

Histograma de frecuencias acumulado TEMP

plot(tablaTEMP,type = "cfh") 

E

Media

Media PH

mean(datos$PH)
## [1] 6.890444

Media TEMP

mean(datos$TEMP)
## [1] 28.69795

Mediana

Mediana PH

median(datos$PH)
## [1] 6.9

Mediana TEMP

median(datos$TEMP)
## [1] 28.7

Moda

Moda PH

mlv(datos$PH)
## Warning: argument 'method' is missing. Data are supposed to be continuous. 
##             Default method 'shorth' is used
## [1] 6.989796

Moda TEMP

mlv(datos$TEMP)
## Warning: argument 'method' is missing. Data are supposed to be continuous. 
##             Default method 'shorth' is used
## Warning: encountered a tie, and the difference between minimal and 
##                    maximal value is > length('x') * 'tie.limit'
## the distribution could be multimodal
## [1] 28.59864

Como se puede observar los datos de medida central tanto el PH como la TEMP, vemos que los datos rondan ente 6.8 y 6.9 en el caso de PH y 28 en el caso de TEMP, lo que nos da a entender que en promedio los pozos poseen entre 6.8 y 6.9 de PH con una temperatura de 28 grados.

F

Varianza

Varianza PH

var(datos$PH)
## [1] 0.04908645

Varianza TEMP

var(datos$TEMP)
## [1] 1.035407

Desviacion estándar

Desviación estándar PH

sd(datos$PH)
## [1] 0.2215546

Desviación estándar TEMP

sd(datos$TEMP)
## [1] 1.017549

Como se puede observar en los resultados de varianza y desviacipon estándar, los datos se alejan demaciado de la media, lo cual nos da a indicar que los datos pueden cambiar drasticamente con el tiempo, nosotros al saber esto, podremos poner un plan de emergencia en dado caso de que los datos cambien de acuerdo a esta informacion.

¿Pueden estas medidas ser negativas?

la respuesta es no, ya que es matematicamente imposible que estas tengan un valor negativo, el valor mas pequeño que estas, puedan adoptar es el 0.

G

Grafica de caja y bigote PH

summary(datos$PH)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    6.10    6.80    6.90    6.89    7.00    7.50
boxplot(datos$PH)

Grafica de caja y bigote TEMP

summary(datos$TEMP)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    25.6    28.0    28.7    28.7    29.2    32.1
boxplot(datos$TEMP)

# H

cor(datos)
##               PH        TEMP
## PH    1.00000000 -0.02029087
## TEMP -0.02029087  1.00000000
regresion = lm(datos$PH ~ datos$TEMP, data = datos)
plot(datos$TEMP, datos$PH, xlab="Temperatura", ylab = "PH")
abline(regresion)

En base a la grafica y el resultado que nos dio, considero que estas variables no estan relacionadas, esto es debido a que hay mas factores que afectan al PH en los pozos a parte de la temperatura, pese a saber que el PH puede cambiar con la temperatura, esta relacion es minima, pero pese a ser minima, siempre es un factor que se debe de tener en cuenta.

Pregunta de rescate

¿De qué manera o maneras reales puede México ser un país más desarrollado?

México cuenta con los componentes necesarios para ser un país desarrollado, mediante el aprovechamiento de fortalezas como su ubicación, estabilidad macroeconómica y recursos naturales y energéticos, pero pese a estas ventajas, México sigue siendo un pais subdesarrollado las principales razones son las siguientes:

Corrupción, Educacion y seguridad. Son algunas de las razones por las cuales México no se puede dar el siguiente paso.

ahora sabiendo esto, ¿que es lo que debe de hacer México para mejorar?

1.-Satisfacer las necesidades básicas

para que México logre su estatus de desarrollado, debe de tener una calidad de vida excelente para su gente. Además de ser un requisito fundamental para la clasificación, también es una parte necesaria para aumentar la riqueza.

2.-El gobierno debería invertir mas en el desarrollo científico y tecnológico

los principales activos de los países desarrollados ya no son la mano de obra o las materias primas como sucedía en la Revolución Industrial, sino que ahora son los productos industrializados de alto valor los que les dan riqueza a las naciones. Es decir, tecnología de punta, medicinas y maquinaria para la producción.

Para crear productos de alto valor, es necesaria una buena inversión en investigación y desarrollo. Por eso los gobiernos deben invertir una buena parte del PIB en áreas relacionadas con la ciencia.

3.- Falta de Corrupción en las Instituciones

Para que México se haga rico, debe tener institutociones confiables. Estos incluyen cárceles, tribunales, bancos y el gobierno, si la gente es corrupta en estas instituciones, es casi imposible servir verdaderamente a la gente que se rige bajo ellas. Si la gente de una nación no está siendo tratada de manera justa por quienes tienen autoridad sobre ellos, toda la estructura (de los ciudadanos al presidente) no alcanzará ninguna forma de prosperidad porque la gente no cree en ella.

4.- Fuerza laboral educada y capacitada

México no puede llegar a ser rico si no hay una reforma educativa sólida o la estructura de la fuerza laboral en su lugar. Sin estos, los ciudadanos no pueden traer a casa salarios decentes que se necesitan para pagar impuestos que a su vez, ayuda al desarrollo educativo.

5.- Militar, Seguridad, Leyes y Orden

tener seguridad nacional es esencial para cualquier país para alcanzar una mayor prosperidad. Los países pobres son mucho más propensos a tener problemas de delincuencia internos que los países ricos porque hay una falta de orden público debido a la facilidad de la corrupción.