Examen de la primera y segunda unidad de competencia de probabilidad y estadística
1.- ¿Qué es la estadística y que aplicaciones tiene en ingeniería (según su ingeniería)? La estadística se cataloga como una ciencia, en la cual se utilizan métodos que nos ayudan en la presentación, procesamiento e interpretación de los datos obtenidos. La estadística es de suma importancia en ingeniería en software, ya que nos ayuda en la elección de diferentes elementos para resolver ecuaciones complicadas.
2.- Enliste y defina los tipos de variables usados en estadística, de 2 ejemplos de cada uno. Defina distribución de frecuencia y explique que es la distribución normal. Los diferentes tipos de variables utilizados en estadística son:
Variables cuantitativas: Estas son las variables que dan como resultado un valor numérico. Algunos ejemplos de estas son: Altura (1.73 m), peso (77kg).
Variables cualitativas: Estas variables se entiende como el tipo de característica o categoría, para clasificar algo sin hacer uso de números. Algunos ejemplos de estas son: Orientación sexual, estado civil, color.
Continuas: En pocas palabras, básicamente, una variable es continua cuando puede tomar cualquier valor que se encuentre dentro de un intervalo. Algunos ejemplos de estas son: Velocidad de un avión, Peso de una persona.
Discretas: Estas variables no aceptan cualquier tipo de valor, sino, solamente las que pertenecen al conjunto que se encuentra. Algunos ejemplos de estas son: Número de niños en el salón, Numero de personas en el parque.
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales")
Importe los datos del archivo de Excel
library(readr)
pozos <- read_csv("pozos.csv")
## Rows: 293 Columns: 2
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## dbl (2): PH, TEMP
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
names(pozos)
## [1] "PH" "TEMP"
head(pozos)
## # A tibble: 6 x 2
## PH TEMP
## <dbl> <dbl>
## 1 6.8 28.5
## 2 6.9 29.2
## 3 6.8 28.9
## 4 7.1 29.4
## 5 6.6 28.3
## 6 6.8 28.4
A) Ordene los datos de menor a mayor, indique el valor máximo / mínimo y el rango total de datos.
DATOS PH
- Datos ordenados de menor a mayor de PH
ph <- t(pozos$PH)
ph <- as.vector(ph)
ph <- ph[1:293]
ph <- as.numeric(ph)
sort(ph,decreasing=FALSE)
## [1] 6.1 6.3 6.4 6.4 6.4 6.4 6.4 6.4 6.4 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5
## [19] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
## [37] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.7 6.7 6.7 6.7 6.7
## [55] 6.7 6.7 6.7 6.7 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [73] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [91] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [109] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [127] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 7.0 7.0
## [163] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [181] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [199] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [217] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [235] 7.0 7.0 7.0 7.0 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [253] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.2 7.2
## [271] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.3 7.3 7.3 7.3 7.3 7.3 7.4 7.4
## [289] 7.4 7.4 7.4 7.4 7.5
- Valor mínimo PH
min(ph)
## [1] 6.1
- Valor máximo PH
max(ph)
## [1] 7.5
- Rango PH
max(ph)-min(ph)
## [1] 1.4
DATOS TEMPERATURA
- Datos ordenados de menor a mayor de TEMPERATURA
temperatura <- t(pozos$TEMP)
temperatura <- as.vector(temperatura)
temperatura <- temperatura[1:293]
sort(temperatura,decreasing=FALSE)
## [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
## [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
## [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
## [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
## [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
## [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
## [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1
- Valor mínimo TEMPERATURA
min(temperatura)
## [1] 25.6
- Valor máximo TEMPERATURA
max(temperatura)
## [1] 32.1
- Rango TEMPERATURA
max(temperatura)-min(temperatura)
## [1] 6.5
datosa <- data.frame(ph,temperatura)
B) Obtenga (el número de) los intervalos (o clases) usando la fórmula según Surges y el ancho de clase.
PH
numero <- length(ph)
intervalo <- ceiling(sqrt(numero))
intervalo
## [1] 18
TEMPERATURA
numero <- length(temperatura)
## Número de intervalos
intervalo <- ceiling(sqrt(numero))
intervalo
## [1] 18
C) Construya una tabla de frecuencias que incluya: límites de clases, frecuencia absoluta, frecuencia relativa, frecuencia relativa porcentual, frecuencia acumulada y explique a detalle que refleja esta tabla.
library(fdth)
## Warning: package 'fdth' was built under R version 4.1.2
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
PH
tablaFrecuenciasPH<- fdt(ph)
tablaFrecuenciasPH
## Class limits f rf rf(%) cf cf(%)
## [6.039,6.193) 1 0.00 0.34 1 0.34
## [6.193,6.346) 1 0.00 0.34 2 0.68
## [6.346,6.5) 7 0.02 2.39 9 3.07
## [6.5,6.653) 40 0.14 13.65 49 16.72
## [6.653,6.807) 67 0.23 22.87 116 39.59
## [6.807,6.961) 44 0.15 15.02 160 54.61
## [6.961,7.114) 108 0.37 36.86 268 91.47
## [7.114,7.268) 12 0.04 4.10 280 95.56
## [7.268,7.421) 12 0.04 4.10 292 99.66
## [7.421,7.575) 1 0.00 0.34 293 100.00
Como podemos observar en la tabla de frecuencias del PH, Vemos que en los primeros intervalos se muestra una frecuencia relativa de 34% sobre todos los datos. Asi mismo vemos podemos obervar los demas porcentajes que se muestran en la tabla, basandonos en el apartado de rf(%).
TEMPERATURA
tablaFrecuenciasTEMPERATURA<- fdt(temperatura)
tablaFrecuenciasTEMPERATURA
## Class limits f rf rf(%) cf cf(%)
## [25.344,26.052) 2 0.01 0.68 2 0.68
## [26.052,26.759) 5 0.02 1.71 7 2.39
## [26.759,27.467) 17 0.06 5.80 24 8.19
## [27.467,28.175) 63 0.22 21.50 87 29.69
## [28.175,28.883) 79 0.27 26.96 166 56.66
## [28.883,29.59) 81 0.28 27.65 247 84.30
## [29.59,30.298) 28 0.10 9.56 275 93.86
## [30.298,31.006) 9 0.03 3.07 284 96.93
## [31.006,31.713) 7 0.02 2.39 291 99.32
## [31.713,32.421) 2 0.01 0.68 293 100.00
Como podemos observar en la tabla de frecuencias del Temperatura, Vemos que en el primer intervalo se muestra una frecuencia relativa de 68% sobre todos los datos. Asi mismo vemos podemos obervar los demas porcentajes que se muestran en la tabla, basandonos en el apartado de rf(%).
D) Elabore un histograma, polígono de frecuencias, histograma de frecuencias acumulado.
PH
- Histograma PH
plot(tablaFrecuenciasPH, type = "fh")
title(main = "Histograma PH")
En esta tabla de frecuencias podemos observar los datos de manera más visual, para un mejor entendimiento del comportamiento. Vemos en la parte de abajo los intervalos y en la parte lateral la frecuencia. Las barras nos indican el comportaiento y claramente se muestarn los picos en dichos intervalos.
- Poligono de frecuencias PH
plot(tablaFrecuenciasPH, type = "fp")
title(main = "Poligono de frecuencias PH")
Son los mismos datos anteriores pero presentados de una manera diferentes, ya que aquí se muestran los puntos situados en medio de las tablas formando ls poligono de frecuencia.
- Histograma de frecuencias acomulado PH
plot(tablaFrecuenciasPH, type = "cfh")
title(main = "Histograma de frecuencias acomulado PH")
en este podemos observar la frecuencia que llevan los datos pero de una forma acomulada.
TEMPERATURA
- Histograma TEMPERATURA
plot(tablaFrecuenciasTEMPERATURA, type = "fh")
title(main = "Histograma TEMPERATURA")
En esta tabla de frecuencias podemos observar los datos de manera más visual, para un mejor entendimiento del comportamiento. Vemos en la parte de abajo los intervalos y en la parte lateral la frecuencia. Las barras nos indican el comportaiento y claramente se muestarn los picos en dichos intervalos.
- Poligono de frecuencias PH
plot(tablaFrecuenciasTEMPERATURA, type = "fp")
title(main = "Poligono de frecuencias TEMPERATURA")
Son los mismos datos anteriores pero presentados de una manera diferentes, ya que aquí se muestran los puntos situados en medio de las tablas formando ls poligono de frecuencia.
- Histograma de frecuencias acomulado PH
plot(tablaFrecuenciasTEMPERATURA, type = "cfh")
title(main = "Histograma de frecuencias acomulado TEMPERATURA")
en este podemos observar la frecuencia que llevan los datos pero de una forma acomulada.
E) Obtenga la media, mediana, moda e interprete los resultados.
PH
library(modeest)
## Warning: package 'modeest' was built under R version 4.1.2
## Registered S3 method overwritten by 'rmutil':
## method from
## print.response httr
##
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
##
## mfv
- Media PH
mean(ph)
## [1] 6.890444
- Mediana PH
median(ph)
## [1] 6.9
*Moda PH
mlv(ph,method = "mfv")
## [1] 7
Los datos recolectados de PH se pueden considerar normales ya que las 3 cifras se encuentar parecidas
TEMPERATURA
library(modeest)
- Media TEMPERATURA
mean(temperatura)
## [1] 28.69795
- Mediana TEMPERATURA
median(temperatura)
## [1] 28.7
*Moda TEMPERATURA
mlv(temperatura,method = "mfv")
## [1] 28.6
Los datos recolectados de TEMPERATURA se pueden considerar normales ya que las 3 cifras se encuentar parecidas
F) Obtenga la varianza y la desviación estándar, interprete los resultados. ¿Pueden estas medidas ser negativas?
PH
- Varianza PH
var(ph)
## [1] 0.04908645
- Desviación estándar PH
sd(ph)
## [1] 0.2215546
lOS datos no estan muy dispersos entre si
TEMPERATURA
- Varianza TEMPERATURA
var(temperatura)
## [1] 1.035407
- Desviación estándar TEMPERATURA
sd(temperatura)
## [1] 1.017549
lOS datos no estan muy dispersos entre si
G) Elabore gráfico de caja y bigote
PH
boxplot(ph)
TEMPERATURA
boxplot(temperatura)
H) Elabora una gráfica de dispersión de pH versus temperatura, use ggplot aquí. En base a esta gráfica: ¿Considera que estas 2 variables están relacionadas?
cor(pozos)
## PH TEMP
## PH 1.00000000 -0.02029087
## TEMP -0.02029087 1.00000000
ggplot(data = datosa)+
aes(x=temperatura,y=ph)+
geom_point()
Podemos observar que unos datos estan muy juntos y miestras que otras no tienen tanta relación.
Pregunta de rescate
- Pregunta de rescate (opcional): Mini ensayo de mínimo media y máximo una cuartilla contestando a la pregunta: ¿De qué manera o maneras reales puede México ser un país más desarrollado? Elaboren y argumenten su propuesta o propuestas. (Use datos para fundamentarse)
Sin duda alguna, unos de los principales factores por la cual México no está dentro de los países mejores desarrollados de mundo, es la corrupción que se vive actualmente en el país. Primeramente, México cuenta con muchos recursos naturales, tales como, selva, sierra, mar, planicie, petróleo, oro, plata, ganadería, etc. y que no tener mejores niveles de vida de la población es una situacion que no se puede permitir. A lo largo de estos 60 años, gobiernos de diferentes partidos políticos han impulsado distintas políticas públicas, pero el resultado no ha logrado superar los problemas históricos de la pobreza, la desigualdad, la corrupción, impunidad, inseguridad, etc. Los gobiernos priistas promovieron durante 70 años el nacionalismo revolucionario, la corrupción, la economía de compadres y el clientelismo paternalista.
Por otro lado, algo que debemos tener en claro, que fuera de la situación politica que se vive actualmente, tenemos que darnos cuenta de nuestras propias acciones como seres humanos, ya que la falta de valores y de disciplina de la sociedad actual ha traído como consecuencia acciones y comportamientos que han venido erosionando la unidad de la sociedad creando una crisis a nivel mundial que se puede ver reflejado en lo que en nuestra volutad para salir adelante como pais y como humanos.
Una propuesta para poder tratar de solucionar el problema, o en defecto, acercarnos mas a tratar de ser un país mas desarrollado, es dedicarles mayor enfoque a los adolescentes, ya que como bien se dice, nosotros somos el futuro del país, por lo tanto brindarle mas atención en base a aprendizaje, mejores instalaciones y herramientas que permitan tener un mejor desarollo en el campo que estemos trabajando. Los valores comienzan desde casa, y así es la mejor manera para llegar a crecer como país.