library(pacman)
p_load(rmdformats,readr,readxl,ggplot2,plotly,DT,xfun,gridExtra,leaflet,fdth,modeest,dplyr)
library(readxl)
datos<- read_excel("pozos.xlsx")
datatable(datos)
1.- ¿Qué es la estadística y que aplicaciones tiene en ingeniería (según su ingeniería)?
La estadística es la ciencia de los datos y que su principal objetivo es mejorar la comprensión de los hechos a partir de la información disponible. Esta consiste en métodos, procedimientos y fórmulas que permiten la obtención de información, para posteriormente poder ordenarla, analizarla y estudiarla, extrayendo de este proceso un mejor entendimiento de los datos y a su vez predicciones sobre fenómenos observados, con el cual podemos redactar una conclusión relevante.
Existen varios tipos de estadística: Estadística descriptiva: Se refiere a los métodos de recolección, organización, resumen y presentación de un conjunto de datos, El objetivo principal de esta estadística es la de describir las características fundamentales de los datos, normalmente para lograr este objetivo se utilizan herramientas como indicadores, gráficos y tablas.
Estadística inferencial: Se refiere a los métodos y formulas utilizadas para la obtención de datos para posteriormente poder realizar las predicciones y generalizaciones, de las cuales poder obtener conclusiones a partir de los datos analizados.
La estadística inferencial se subdivide en dos tipos: Estadística paramétrica: Se caracteriza porque asume que los datos tienen una distribución determinada, la cual determina el papel de juzgar si los datos están dentro de los parámetros normales o no. En base a esto, se puede realizar la conclusión de los datos analizados.
Estadística no paramétrica: Al contrario que la estadística paramétrica, esta se caracteriza por no asumir ningún tipo de distribución subyacente en los datos, ni poseer ningún parámetro especifico. Un ejemplo de esta, sería la prueba binomial.
Algunos elementos que son utilizados en la estadística:
Población: Grupo de individuos que se presenta como datos que se desea investigar.
Muestra: un subgrupo de datos extraídos de una población que debe representar adecuadamente la totalidad del grupo.
Parámetros: Son medidas que ofrecen información sobre el centro de un conjunto de datos (medidas de tendencia central) y dispersión o variabilidad (medidas de dispersión).
Experimento: proceso o actividad llevada a cabo de forma intencional para obtener una serie de datos, la cual es utilizada para ratificar o refutar una hipótesis.
Variable: Característica de una muestra o población a la cual se le puede asignar un valor.
Estadística en ingeniería en Software: Como se mencionó anteriormente, la estadística es una herramienta la cual nos permite entender y facilitar la comprensión de los datos, la cual la hace una herramienta extremadamente útil, y es normal que esta se utilice en distintas áreas de estudio. Un ejemplo seria en ing. Software, de la cual la combinación de la Estadística y Software nace el Software estadístico que se basa en la creación de aplicaciones con el objetivo de facilitar la ejecución de la estadística, ya que esta agiliza y supera por mucho la capacidad de calculo de la mente humana. realizando trabajos mucha mas grandes y complicados en menor tiempo.
Algunas aplicaciones creadas con este fin son Excel y r Studio, estas funcionan mediante un lenguaje de programación en específico, realizan algunos métodos y funciones que ayuda a la transformación de los datos, estas aplicaciones aportan al usuario una gran manejabilidad de los datos, haciendo sencillo el uso de estas y logrando que cualquier persona pueda aplicar la estadística sin la necesidad de un entendimiento profundo del tema.
2.- Enliste y defina los tipos de variables usados en estadística, de 2 ejemplos de cada uno. Defina distribución de frecuencia y explique que es la distribución normal. En la estadística existen docenas de tipos de variables y por norma general se encuentran dos tipos de variables las cuales son Variables cuantitativas y cualitativas.
Variable Cuantitativa: Este tipo de variables son las que se expresan de manera numérica, por ejemplo las horas que trabaja un empleado a lo largo de la semana.
Las variables cuantitativas se subdividen en dos tipos de variables que son la continua y discreta.
Variable continua: Se caracteriza por tomar un valor infinito de valores entre un intervalo de datos, por ejemplo, el tiempo que tarda un corredor en completar 100 metros lisos.
Variable discreta: Se caracteriza por tomar un valor finito de valores entre un intervalo de datos, un ejemplo seria la cantidad de helados vendidos en una tienda que posee x cantidad de helados.
Variable Cualitativa: Este tipo de variables son las que se expresan por norma general de manera alfabética, un ejemplo seria los asistentes de un concierto que tienen entradas diferenciadas por zonas (Vip o normal).
Las variables cualitativas se subdividen en dos tipos de variables que son la ordinal y nominal.
Variable ordinal: Expresa diferentes niveles y orden, por ejemplo los pilotos de una carrera de coches de la Fórmula 1.
Variable nominal: Expresa una palabra diferenciada, por ejemplo el color de ojos puede tener variables como café, azul, verde entre otros.
Distribución de frecuencia Es la forma en la que un conjunto de datos ordenados en una serie de observaciones que se clasifica en distintos grupos individuales entre si, es decir si un dato pertenece a un grupo no puede pertenecer a otro.
Existen tipos de distribuciones de frecuencia:
Frecuencia absoluta(fi): Es la cantidad de observaciones que pertenecen a cada grupo, esto se interpreta como la cantidad de veces que se repite un suceso, por ejemplo un grupo de 100 personas, entre ellos 20 tengan entre 20 a 30 años.
Frecuencia relativa(hi): Esta es el resultado de la división entre la frecuencia absoluta entre el numero de datos, un ejemplo seria el caso anterior 20/100 = 0.2 o 20%
Frecuencia absoluta acumulada(FI): Es el resultado de sumar las frecuencias absolutas de una clase o grupo de muestras con la anterior o anteriores, por ejemplo para calcular la frecuencia absoluta acumulada del tercer grupo, se suman las frecuencias absolutas del primer, según y tercer grupo.
Frecuencia relativa acumulada(HI): Es el resultado de sumar las frecuencias relativas tal y como se explica en la frecuencia absoluta acumulada, por ejemplo para calcular la frecuencia relativa acumulada del cuarto grupo, se suman el primer, segundo, tercer y cuarto grupo.
Distribución normal La distribución normal es un modelo teórico capaz de aproximar satisfactoriamente el valor de una variable aleatoria a una situación ideal. La distribución normal adapta una variable aleatoria a una función que depende de la media y la desviación típica. Esta posee la característica de que su grafica es similar a la de una campana, donde las desviaciones estándar sucesivas con respecto a la media establecen los valores de referencia para estimar el porcentaje de observaciones de los datos, estos valores son la base de muchas pruebas de hipótesis. Su formula es la siguiente
Z=(X-Media)/Desviación típica
menorMayorPH = t(datos$PH)
menorMayorTEMP = t(datos$TEMP)
menorMayorPH=sort(menorMayorPH,decreasing = FALSE)
menorMayorTEMP=sort(menorMayorTEMP,decreasing = FALSE)
mayorMenorPH=t(datos$PH)
mayorMenorTEMP=t(datos$TEMP)
mayorMenorPH=sort(mayorMenorPH,decreasing = TRUE)
mayorMenorTEMP=sort(mayorMenorTEMP,decreasing = TRUE)
A
Menor a mayor PH
menorMayorPH
## [1] 6.1 6.3 6.4 6.4 6.4 6.4 6.4 6.4 6.4 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5
## [19] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
## [37] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.7 6.7 6.7 6.7 6.7
## [55] 6.7 6.7 6.7 6.7 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [73] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [91] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [109] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [127] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 7.0 7.0
## [163] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [181] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [199] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [217] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [235] 7.0 7.0 7.0 7.0 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [253] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.2 7.2
## [271] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.3 7.3 7.3 7.3 7.3 7.3 7.4 7.4
## [289] 7.4 7.4 7.4 7.4 7.5
Mayor a menor PH
mayorMenorPH
## [1] 7.5 7.4 7.4 7.4 7.4 7.4 7.4 7.3 7.3 7.3 7.3 7.3 7.3 7.2 7.2 7.2 7.2 7.2
## [19] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [37] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [55] 7.1 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [73] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [91] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [109] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [127] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [163] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.8 6.8 6.8
## [181] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [199] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [217] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [235] 6.8 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
## [253] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.5 6.5 6.5
## [271] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.4 6.4 6.4 6.4
## [289] 6.4 6.4 6.4 6.3 6.1
Valor maximo y minimo PH
# Maximo
max(datos$PH)
## [1] 7.5
#Minimo
min(datos$PH)
## [1] 6.1
Valor maximo y minimo TEMP
# Maximo
max(datos$TEMP)
## [1] 32.1
#Minimo
min(datos$TEMP)
## [1] 25.6
Menor a mayor TEMP
menorMayorTEMP
## [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
## [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
## [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
## [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
## [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
## [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
## [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1
Mayor a menor TEMP
mayorMenorTEMP
## [1] 32.1 31.9 31.7 31.5 31.4 31.2 31.1 31.1 31.1 30.9 30.8 30.6 30.5 30.4 30.3
## [16] 30.3 30.3 30.3 30.2 30.2 30.2 30.1 30.1 30.1 30.1 30.0 30.0 30.0 30.0 30.0
## [31] 30.0 29.9 29.9 29.9 29.9 29.8 29.8 29.8 29.8 29.8 29.8 29.7 29.7 29.6 29.6
## [46] 29.6 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.4 29.4 29.4 29.4 29.4
## [61] 29.4 29.4 29.4 29.4 29.4 29.4 29.3 29.3 29.3 29.3 29.2 29.2 29.2 29.2 29.2
## [76] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.1 29.1 29.1 29.1 29.1 29.1
## [91] 29.1 29.1 29.1 29.1 29.1 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [106] 29.0 29.0 29.0 29.0 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [121] 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [136] 28.8 28.8 28.8 28.8 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [166] 28.6 28.6 28.6 28.6 28.6 28.6 28.5 28.5 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [181] 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.3 28.3 28.3 28.3 28.3 28.3 28.3 28.2
## [196] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.1 28.1 28.1 28.0
## [211] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
## [226] 28.0 28.0 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
## [241] 27.9 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.7 27.7 27.7
## [256] 27.7 27.6 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.5 27.4
## [271] 27.4 27.4 27.4 27.4 27.3 27.3 27.3 27.3 27.2 27.2 27.1 27.0 27.0 26.9 26.8
## [286] 26.8 26.4 26.4 26.3 26.3 26.2 25.8 25.6
Rango de datos PH
resul=max(datos$PH)-min(datos$PH)
range(datos$PH)
## [1] 6.1 7.5
resul
## [1] 1.4
Rango de datos TEMP
resul2=max(datos$TEMP)-min(datos$TEMP)
range(datos$TEMP)
## [1] 25.6 32.1
resul2
## [1] 6.5
B
Numero de clases PH
k=nclass.Sturges(datos$PH)
k
## [1] 10
Anchura de clase PH
a = round(resul/k, 1)
a
## [1] 0.1
Numero de clases TEMP
k2=nclass.Sturges(datos$TEMP)
k2
## [1] 10
Anchura de clase TEMMP
a2 = round(resul2/k2, 1)
a2
## [1] 0.7
C
Tabla de distribuciones de frecuencias PH
tablaPH=fdt(datos$PH,breaks="Sturges")
tablaPH
## Class limits f rf rf(%) cf cf(%)
## [6.039,6.193) 1 0.00 0.34 1 0.34
## [6.193,6.346) 1 0.00 0.34 2 0.68
## [6.346,6.5) 7 0.02 2.39 9 3.07
## [6.5,6.653) 40 0.14 13.65 49 16.72
## [6.653,6.807) 67 0.23 22.87 116 39.59
## [6.807,6.961) 44 0.15 15.02 160 54.61
## [6.961,7.114) 108 0.37 36.86 268 91.47
## [7.114,7.268) 12 0.04 4.10 280 95.56
## [7.268,7.421) 12 0.04 4.10 292 99.66
## [7.421,7.575) 1 0.00 0.34 293 100.00
En esta tabla se puede observar que el intervalo con mayor cantidad de datos es el de 6.961-7.114 a su vez es la que mas se repite dandonos a entender que el rango de PH que mas se repite esta entre este rango con un 36.86% de las variables totales.
Tabla de distribuciones de frecuencias TEMP
tablaTEMP=fdt(datos$TEMP,breaks="Sturges")
tablaTEMP
## Class limits f rf rf(%) cf cf(%)
## [25.344,26.052) 2 0.01 0.68 2 0.68
## [26.052,26.759) 5 0.02 1.71 7 2.39
## [26.759,27.467) 17 0.06 5.80 24 8.19
## [27.467,28.175) 63 0.22 21.50 87 29.69
## [28.175,28.883) 79 0.27 26.96 166 56.66
## [28.883,29.59) 81 0.28 27.65 247 84.30
## [29.59,30.298) 28 0.10 9.56 275 93.86
## [30.298,31.006) 9 0.03 3.07 284 96.93
## [31.006,31.713) 7 0.02 2.39 291 99.32
## [31.713,32.421) 2 0.01 0.68 293 100.00
En esta tabla se puede observar que el intervalo con mayor cantidad de datos es el de 28.883-29.59 a su vez es la que mas se repite dandonos a entender que el rango de PH que mas se repite esta entre este rango con un 27.65% de las variables totales.
D
Histograma PH
hist(datos$PH,breaks = "Sturges")
Histograma TEMP
hist(datos$TEMP,breaks = "Sturges")
Poligono de frecuencias PH
Poligono de frecuencia absoluta
plot(tablaPH,type = "fp")
Poligono de frecuencia relativa
plot(tablaPH,type = "rfp")
Poligono de frecuencia acumulada
plot(tablaPH,type = "cfp")
Poligono de frecuencias TEMP
Poligono de frecuencia absoluta
plot(tablaTEMP,type = "fp")
Poligono de frecuencia relativa
plot(tablaTEMP,type = "rfp")
Poligono de frecuencia acumulada
plot(tablaTEMP,type = "cfp")
Histograma de frecuencias acumulado PH
plot(tablaPH,type = "cfh")
Histograma de frecuencias acumulado TEMP
plot(tablaTEMP,type = "cfh")
E
Media
Media PH
mean(datos$PH)
## [1] 6.890444
Media TEMP
mean(datos$TEMP)
## [1] 28.69795
Mediana
Mediana PH
median(datos$PH)
## [1] 6.9
Mediana TEMP
median(datos$TEMP)
## [1] 28.7
Moda
Moda PH
mlv(datos$PH)
## Warning: argument 'method' is missing. Data are supposed to be continuous.
## Default method 'shorth' is used
## [1] 6.989796
Moda TEMP
mlv(datos$TEMP)
## Warning: argument 'method' is missing. Data are supposed to be continuous.
## Default method 'shorth' is used
## Warning: encountered a tie, and the difference between minimal and
## maximal value is > length('x') * 'tie.limit'
## the distribution could be multimodal
## [1] 28.59864
Como se puede observar los datos de medida central tanto el PH como la TEMP, vemos que los datos rondan ente 6.8 y 6.9 en el caso de PH y 28 en el caso de TEMP, lo que nos da a entender que en promedio los pozos poseen entre 6.8 y 6.9 de PH con una temperatura de 28 grados.
F
Varianza
Varianza PH
var(datos$PH)
## [1] 0.04908645
Varianza TEMP
var(datos$TEMP)
## [1] 1.035407
Desviacion estándar
Desviación estándar PH
sd(datos$PH)
## [1] 0.2215546
Desviación estándar TEMP
sd(datos$TEMP)
## [1] 1.017549
Como se puede observar en los resultados de varianza y desviacipon estándar, los datos se alejan demaciado de la media, lo cual nos da a indicar que los datos pueden cambiar drasticamente con el tiempo, nosotros al saber esto, podremos poner un plan de emergencia en dado caso de que los datos cambien de acuerdo a esta informacion.
¿Pueden estas medidas ser negativas?
la respuesta es no, ya que es matematicamente imposible que estas tengan un valor negativo, el valor mas pequeño que estas, puedan adoptar es el 0.
G
Grafica de caja y bigote PH
summary(datos$PH)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 6.10 6.80 6.90 6.89 7.00 7.50
boxplot(datos$PH)
Grafica de caja y bigote TEMP
summary(datos$TEMP)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 25.6 28.0 28.7 28.7 29.2 32.1
boxplot(datos$TEMP)
# H
cor(datos)
## PH TEMP
## PH 1.00000000 -0.02029087
## TEMP -0.02029087 1.00000000
regresion = lm(datos$PH ~ datos$TEMP, data = datos)
plot(datos$TEMP, datos$PH, xlab="Temperatura", ylab = "PH")
abline(regresion)
En base a la grafica y el resultado que nos dio, considero que estas variables no estan relacionadas, esto es debido a que hay mas factores que afectan al PH en los pozos a parte de la temperatura, pese a saber que el PH puede cambiar con la temperatura, esta relacion es minima, pero pese a ser minima, siempre es un factor que se debe de tener en cuenta.
Pregunta de rescate
¿De qué manera o maneras reales puede México ser un país más desarrollado?
México cuenta con los componentes necesarios para ser un país desarrollado, mediante el aprovechamiento de fortalezas como su ubicación, estabilidad macroeconómica y recursos naturales y energéticos, pero pese a estas ventajas, México sigue siendo un pais subdesarrollado las principales razones son las siguientes:
Corrupción, Educacion y seguridad. Son algunas de las razones por las cuales México no se puede dar el siguiente paso.
ahora sabiendo esto, ¿que es lo que debe de hacer México para mejorar?
1.-Satisfacer las necesidades básicas
para que México logre su estatus de desarrollado, debe de tener una calidad de vida excelente para su gente. Además de ser un requisito fundamental para la clasificación, también es una parte necesaria para aumentar la riqueza.
2.-El gobierno debería invertir mas en el desarrollo científico y tecnológico
los principales activos de los países desarrollados ya no son la mano de obra o las materias primas como sucedía en la Revolución Industrial, sino que ahora son los productos industrializados de alto valor los que les dan riqueza a las naciones. Es decir, tecnología de punta, medicinas y maquinaria para la producción.
Para crear productos de alto valor, es necesaria una buena inversión en investigación y desarrollo. Por eso los gobiernos deben invertir una buena parte del PIB en áreas relacionadas con la ciencia.
3.- Falta de Corrupción en las Instituciones
Para que México se haga rico, debe tener institutociones confiables. Estos incluyen cárceles, tribunales, bancos y el gobierno, si la gente es corrupta en estas instituciones, es casi imposible servir verdaderamente a la gente que se rige bajo ellas. Si la gente de una nación no está siendo tratada de manera justa por quienes tienen autoridad sobre ellos, toda la estructura (de los ciudadanos al presidente) no alcanzará ninguna forma de prosperidad porque la gente no cree en ella.
4.- Fuerza laboral educada y capacitada
México no puede llegar a ser rico si no hay una reforma educativa sólida o la estructura de la fuerza laboral en su lugar. Sin estos, los ciudadanos no pueden traer a casa salarios decentes que se necesitan para pagar impuestos que a su vez, ayuda al desarrollo educativo.
5.- Militar, Seguridad, Leyes y Orden
tener seguridad nacional es esencial para cualquier país para alcanzar una mayor prosperidad. Los países pobres son mucho más propensos a tener problemas de delincuencia internos que los países ricos porque hay una falta de orden público debido a la facilidad de la corrupción.