E1U2

Aldo Mendivil Ochoa

26/11/2021

Examen de la primera y segunda unidad de competencia de probabilidad y estadística

1.- ¿Qué es la estadística y que aplicaciones tiene en ingeniería (según su ingeniería)? La estadística se cataloga como una ciencia, en la cual se utilizan métodos que nos ayudan en la presentación, procesamiento e interpretación de los datos obtenidos. La estadística es de suma importancia en ingeniería en software, ya que nos ayuda en la elección de diferentes elementos para resolver ecuaciones complicadas.

2.- Enliste y defina los tipos de variables usados en estadística, de 2 ejemplos de cada uno. Defina distribución de frecuencia y explique que es la distribución normal. Los diferentes tipos de variables utilizados en estadística son:

  • Variables cuantitativas: Estas son las variables que dan como resultado un valor numérico. Algunos ejemplos de estas son: Altura (1.73 m), peso (77kg).

  • Variables cualitativas: Estas variables se entiende como el tipo de característica o categoría, para clasificar algo sin hacer uso de números. Algunos ejemplos de estas son: Orientación sexual, estado civil, color.

  • Continuas: En pocas palabras, básicamente, una variable es continua cuando puede tomar cualquier valor que se encuentre dentro de un intervalo. Algunos ejemplos de estas son: Velocidad de un avión, Peso de una persona.

  • Discretas: Estas variables no aceptan cualquier tipo de valor, sino, solamente las que pertenecen al conjunto que se encuentra. Algunos ejemplos de estas son: Número de niños en el salón, Numero de personas en el parque.

library(pacman) 
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales")

Importe los datos del archivo de Excel

library(readr)
pozos <- read_csv("pozos.csv")
## Rows: 293 Columns: 2
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## dbl (2): PH, TEMP
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
names(pozos)
## [1] "PH"   "TEMP"
head(pozos)
## # A tibble: 6 x 2
##      PH  TEMP
##   <dbl> <dbl>
## 1   6.8  28.5
## 2   6.9  29.2
## 3   6.8  28.9
## 4   7.1  29.4
## 5   6.6  28.3
## 6   6.8  28.4

A) Ordene los datos de menor a mayor, indique el valor máximo / mínimo y el rango total de datos.

DATOS PH

  • Datos ordenados de menor a mayor de PH
ph <- t(pozos$PH)
ph <- as.vector(ph)
ph <- ph[1:293]
ph <- as.numeric(ph)

sort(ph,decreasing=FALSE)
##   [1] 6.1 6.3 6.4 6.4 6.4 6.4 6.4 6.4 6.4 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5
##  [19] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
##  [37] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.7 6.7 6.7 6.7 6.7
##  [55] 6.7 6.7 6.7 6.7 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
##  [73] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
##  [91] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [109] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [127] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 7.0 7.0
## [163] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [181] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [199] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [217] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [235] 7.0 7.0 7.0 7.0 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [253] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.2 7.2
## [271] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.3 7.3 7.3 7.3 7.3 7.3 7.4 7.4
## [289] 7.4 7.4 7.4 7.4 7.5
  • Valor mínimo PH
min(ph)
## [1] 6.1
  • Valor máximo PH
max(ph)
## [1] 7.5
  • Rango PH
max(ph)-min(ph)
## [1] 1.4

DATOS TEMPERATURA

  • Datos ordenados de menor a mayor de TEMPERATURA
temperatura <- t(pozos$TEMP)
temperatura <- as.vector(temperatura)
temperatura <- temperatura[1:293]

sort(temperatura,decreasing=FALSE)
##   [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
##  [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
##  [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
##  [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
##  [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
##  [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
##  [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1
  • Valor mínimo TEMPERATURA
min(temperatura)
## [1] 25.6
  • Valor máximo TEMPERATURA
max(temperatura)
## [1] 32.1
  • Rango TEMPERATURA
max(temperatura)-min(temperatura)
## [1] 6.5
datosa <- data.frame(ph,temperatura)

B) Obtenga (el número de) los intervalos (o clases) usando la fórmula según Surges y el ancho de clase.

PH

numero <- length(ph)
intervalo <- ceiling(sqrt(numero))
intervalo
## [1] 18

TEMPERATURA

numero <- length(temperatura)
## Número de intervalos
intervalo <- ceiling(sqrt(numero))
intervalo
## [1] 18

C) Construya una tabla de frecuencias que incluya: límites de clases, frecuencia absoluta, frecuencia relativa, frecuencia relativa porcentual, frecuencia acumulada y explique a detalle que refleja esta tabla.

library(fdth)
## Warning: package 'fdth' was built under R version 4.1.2
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var

PH

tablaFrecuenciasPH<- fdt(ph)
tablaFrecuenciasPH
##   Class limits   f   rf rf(%)  cf  cf(%)
##  [6.039,6.193)   1 0.00  0.34   1   0.34
##  [6.193,6.346)   1 0.00  0.34   2   0.68
##    [6.346,6.5)   7 0.02  2.39   9   3.07
##    [6.5,6.653)  40 0.14 13.65  49  16.72
##  [6.653,6.807)  67 0.23 22.87 116  39.59
##  [6.807,6.961)  44 0.15 15.02 160  54.61
##  [6.961,7.114) 108 0.37 36.86 268  91.47
##  [7.114,7.268)  12 0.04  4.10 280  95.56
##  [7.268,7.421)  12 0.04  4.10 292  99.66
##  [7.421,7.575)   1 0.00  0.34 293 100.00

Como podemos observar en la tabla de frecuencias del PH, Vemos que en los primeros intervalos se muestra una frecuencia relativa de 34% sobre todos los datos. Asi mismo vemos podemos obervar los demas porcentajes que se muestran en la tabla, basandonos en el apartado de rf(%).

TEMPERATURA

tablaFrecuenciasTEMPERATURA<- fdt(temperatura)
tablaFrecuenciasTEMPERATURA
##     Class limits  f   rf rf(%)  cf  cf(%)
##  [25.344,26.052)  2 0.01  0.68   2   0.68
##  [26.052,26.759)  5 0.02  1.71   7   2.39
##  [26.759,27.467) 17 0.06  5.80  24   8.19
##  [27.467,28.175) 63 0.22 21.50  87  29.69
##  [28.175,28.883) 79 0.27 26.96 166  56.66
##   [28.883,29.59) 81 0.28 27.65 247  84.30
##   [29.59,30.298) 28 0.10  9.56 275  93.86
##  [30.298,31.006)  9 0.03  3.07 284  96.93
##  [31.006,31.713)  7 0.02  2.39 291  99.32
##  [31.713,32.421)  2 0.01  0.68 293 100.00

Como podemos observar en la tabla de frecuencias del Temperatura, Vemos que en el primer intervalo se muestra una frecuencia relativa de 68% sobre todos los datos. Asi mismo vemos podemos obervar los demas porcentajes que se muestran en la tabla, basandonos en el apartado de rf(%).

D) Elabore un histograma, polígono de frecuencias, histograma de frecuencias acumulado.

PH

  • Histograma PH
plot(tablaFrecuenciasPH, type = "fh")
title(main = "Histograma PH")

En esta tabla de frecuencias podemos observar los datos de manera más visual, para un mejor entendimiento del comportamiento. Vemos en la parte de abajo los intervalos y en la parte lateral la frecuencia. Las barras nos indican el comportaiento y claramente se muestarn los picos en dichos intervalos.

  • Poligono de frecuencias PH
plot(tablaFrecuenciasPH, type = "fp")
title(main = "Poligono de frecuencias PH")

Son los mismos datos anteriores pero presentados de una manera diferentes, ya que aquí se muestran los puntos situados en medio de las tablas formando ls poligono de frecuencia.

  • Histograma de frecuencias acomulado PH
plot(tablaFrecuenciasPH, type = "cfh")
title(main = "Histograma de frecuencias acomulado PH")

en este podemos observar la frecuencia que llevan los datos pero de una forma acomulada.

TEMPERATURA

  • Histograma TEMPERATURA
plot(tablaFrecuenciasTEMPERATURA, type = "fh")
title(main = "Histograma TEMPERATURA")

En esta tabla de frecuencias podemos observar los datos de manera más visual, para un mejor entendimiento del comportamiento. Vemos en la parte de abajo los intervalos y en la parte lateral la frecuencia. Las barras nos indican el comportaiento y claramente se muestarn los picos en dichos intervalos.

  • Poligono de frecuencias PH
plot(tablaFrecuenciasTEMPERATURA, type = "fp")
title(main = "Poligono de frecuencias TEMPERATURA")

Son los mismos datos anteriores pero presentados de una manera diferentes, ya que aquí se muestran los puntos situados en medio de las tablas formando ls poligono de frecuencia.

  • Histograma de frecuencias acomulado PH
plot(tablaFrecuenciasTEMPERATURA, type = "cfh")
title(main = "Histograma de frecuencias acomulado TEMPERATURA")

en este podemos observar la frecuencia que llevan los datos pero de una forma acomulada.

E) Obtenga la media, mediana, moda e interprete los resultados.

PH

library(modeest)
## Warning: package 'modeest' was built under R version 4.1.2
## Registered S3 method overwritten by 'rmutil':
##   method         from
##   print.response httr
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
  • Media PH
mean(ph)
## [1] 6.890444
  • Mediana PH
median(ph)
## [1] 6.9

*Moda PH

mlv(ph,method = "mfv")
## [1] 7

Los datos recolectados de PH se pueden considerar normales ya que las 3 cifras se encuentar parecidas

TEMPERATURA

library(modeest)
  • Media TEMPERATURA
mean(temperatura)
## [1] 28.69795
  • Mediana TEMPERATURA
median(temperatura)
## [1] 28.7

*Moda TEMPERATURA

mlv(temperatura,method = "mfv")
## [1] 28.6

Los datos recolectados de TEMPERATURA se pueden considerar normales ya que las 3 cifras se encuentar parecidas

F) Obtenga la varianza y la desviación estándar, interprete los resultados. ¿Pueden estas medidas ser negativas?

PH

  • Varianza PH
var(ph)
## [1] 0.04908645
  • Desviación estándar PH
sd(ph)
## [1] 0.2215546

lOS datos no estan muy dispersos entre si

TEMPERATURA

  • Varianza TEMPERATURA
var(temperatura)
## [1] 1.035407
  • Desviación estándar TEMPERATURA
sd(temperatura)
## [1] 1.017549

lOS datos no estan muy dispersos entre si

G) Elabore gráfico de caja y bigote

PH

boxplot(ph)

TEMPERATURA

boxplot(temperatura)

H) Elabora una gráfica de dispersión de pH versus temperatura, use ggplot aquí. En base a esta gráfica: ¿Considera que estas 2 variables están relacionadas?

cor(pozos)
##               PH        TEMP
## PH    1.00000000 -0.02029087
## TEMP -0.02029087  1.00000000
ggplot(data = datosa)+
  aes(x=temperatura,y=ph)+
  geom_point()

Podemos observar que unos datos estan muy juntos y miestras que otras no tienen tanta relación.

Pregunta de rescate

  • Pregunta de rescate (opcional): Mini ensayo de mínimo media y máximo una cuartilla contestando a la pregunta: ¿De qué manera o maneras reales puede México ser un país más desarrollado? Elaboren y argumenten su propuesta o propuestas. (Use datos para fundamentarse)

Sin duda alguna, unos de los principales factores por la cual México no está dentro de los países mejores desarrollados de mundo, es la corrupción que se vive actualmente en el país. Primeramente, México cuenta con muchos recursos naturales, tales como, selva, sierra, mar, planicie, petróleo, oro, plata, ganadería, etc. y que no tener mejores niveles de vida de la población es una situacion que no se puede permitir. A lo largo de estos 60 años, gobiernos de diferentes partidos políticos han impulsado distintas políticas públicas, pero el resultado no ha logrado superar los problemas históricos de la pobreza, la desigualdad, la corrupción, impunidad, inseguridad, etc. Los gobiernos priistas promovieron durante 70 años el nacionalismo revolucionario, la corrupción, la economía de compadres y el clientelismo paternalista.

Por otro lado, algo que debemos tener en claro, que fuera de la situación politica que se vive actualmente, tenemos que darnos cuenta de nuestras propias acciones como seres humanos, ya que la falta de valores y de disciplina de la sociedad actual ha traído como consecuencia acciones y comportamientos que han venido erosionando la unidad de la sociedad creando una crisis a nivel mundial que se puede ver reflejado en lo que en nuestra volutad para salir adelante como pais y como humanos.

Una propuesta para poder tratar de solucionar el problema, o en defecto, acercarnos mas a tratar de ser un país mas desarrollado, es dedicarles mayor enfoque a los adolescentes, ya que como bien se dice, nosotros somos el futuro del país, por lo tanto brindarle mas atención en base a aprendizaje, mejores instalaciones y herramientas que permitan tener un mejor desarollo en el campo que estemos trabajando. Los valores comienzan desde casa, y así es la mejor manera para llegar a crecer como país.