Examen de la tercera unidad de competencia de la materia de probabilidad y estadística

setwd("~/Documents/R-PyE/Unidad3/Examen")
library(base64enc)
library(htmltools)
library(mime)
library(xfun)
## 
## Attaching package: 'xfun'
## The following object is masked from 'package:base':
## 
##     attr
library(prettydoc)
library(readr)
library(knitr)
library(DT)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(readxl)

Inferencia estadística

  1. Describa con sus propias palabras los siguientes conceptos:
  • Inferencia estadística
    • Busca hacer una comparación y llegar a una conclución que sea sólida utiizando mecanismos matematicos.
  • Población
    • Es un grupo de elementos que tienen caracteristicas en común para ser estudiados.
  • Muestreo
    • Es una porción de la población y su propósito es tomar un grupo menor de elementos de la población y estudiarlos especialmente cuando la población es muy grande como para estudiar toda la población.
  • Estadísticamente representativo
    • Una muestra representativa es una pequeña cantidad de elementos que refleja, con la mayor precisión posible, a un grupo más grande, un punto importante es el tamaño de la muestra, ya que mientras más grande sea, mayor la posibilidad de que sea más representativa de la población.
  • Hipótesis nula y alternativa
    • Hipótesis nula: Es una suposición que se utiliza para negar o afirmar en función de la muestra de la población
    • Hipótesis alterna: Es una suposición que podríamos pensar que es cierto y esperamos poder probarlo, nos servirá como referencia para negar o afirmar si la hipótesis es nula.
  • Importancia del muestreo
    • Un analisis para considerar que es representativo de una población y que su resultado no esta sesgado requiere de un muestreo

En esta parte es muy importante la redacción

  • Muestreo y prueba de hipótesis Escoja alguno de los 3 archivos con datos para realizar su examen:
#Datos de agua subterranea
xfun::embed_file("aguasubterranea.xlsx")
Download aguasubterranea.xlsx
aguasubterranea <- read_excel("aguasubterranea.xlsx")

aguasubterraneaPh <- aguasubterranea %>% filter(aguasubterranea$MEDICION == 'PH')
aguasubterraneaTemp <- aguasubterranea %>% filter(aguasubterranea$MEDICION == 'TEMP')

#Datos de salud 
xfun::embed_file("COVID_CONFIRMADOS_ESTADOS.xlsx")
Download COVID_CONFIRMADOS_ESTADOS.xlsx
#nota: Aquí en los datos de covid puede por ejemplo tomar 2 estados y comparar

#Datos de calidad del aire 
xfun::embed_file("calidad_aire_ozono_Junio_Julio.xlsx")
Download calidad_aire_ozono_Junio_Julio.xlsx
#Comparar los primeros 5 dias de Junio y Julio de 2020 en terminos de contenido de ozono en el aire (partes por billon)

Muestreo

Bajo sus propios criterios

#Tamaño de la muestra para todos los ejercicios.
n <- 25
  1. Realice un muestreo aleatorio simple
  • Se determinó una muestra de 25
  • Se realizan dos muestreos simples, uno para Ph y otro para Temp
masPh <- sample(1:nrow(aguasubterraneaPh), size=n, replace=FALSE)
masTemp <- sample(1:nrow(aguasubterraneaTemp), size=n, replace=FALSE)
#Resultado de la muestra
masPh
##  [1]  20  93 251 234  98 230 131  18  67  68 153  30 147 280 232  82 142 165 115
## [20] 179  72 211  65  76 146
masTemp
##  [1] 197  50 111  55 195 100 170 218 211  43 182 158  30 239 225 159 277 169 105
## [20] 168 214 292 163 115 180
  • El muestreo aleatorio simple nos ayudará de manera objetiva de tomar la muestra ya que todos los elementos que confirman forman la población de datos tienen la misma probabilidad de ser seleccionados para la muestra.
  1. Realice un muestreo estratificado
  • El propósito del muestro estratificado es lograr que la población se separe en segmentos homogéneos, en otras plabras es hacer sub-grupos de la población.
  • Se toma el subgrupo solo Ph
set.seed(6)
muestra_estratificada <- aguasubterraneaPh %>%
  group_by(VALOR) %>%
  sample_n(size=n, replace=TRUE)
muestra_estratificada
  1. Realice un muestreo ponderado
  • Muestreo utilizando el valor de las aguas subterraneas
  • Solo Ph
muestreoPonderado <- aguasubterraneaPh %>%   
  sample_n(size=n, weight = aguasubterraneaPh$VALOR)
head(muestreoPonderado)
muestreoPonderadoFraccion <- sample(1:nrow(aguasubterraneaPh), size=n, replace=FALSE)
head(muestreoPonderadoFraccion)
## [1] 163  46 203 113 199 251
  1. Realice un muestreo de fracción
  • Es una proporción del tamaño de la muestra, se calcula por el cociente entre el tamaño de la muestra deseada (n=25) y el total de la población candidata (aguasubterraneaPh = 293 registros)
muestroFaccion <- sample(1:nrow(aguasubterraneaPh), size=n, replace=FALSE)
head(muestroFaccion)
## [1] 271  23  66 160 139 194

Explique cada respuesta

Prueba de hipótesis

Relice sus hipótesis y aplique lo siguiente * Hipótesis: Determinar si existe una relación entre el Ph y la Temperatura

  1. Prueba de shapiro wilk
  • Aplicando una prueba individual para cada tipo Ph y Temp
shapiro.test(aguasubterraneaPh$VALOR)
## 
##  Shapiro-Wilk normality test
## 
## data:  aguasubterraneaPh$VALOR
## W = 0.95932, p-value = 2.661e-07
shapiro.test(aguasubterraneaTemp$VALOR)
## 
##  Shapiro-Wilk normality test
## 
## data:  aguasubterraneaTemp$VALOR
## W = 0.98362, p-value = 0.001981
  • Si el valor de p-value es menor a 0.05 la hipótesis nula se rechaza
  • si el valor de p-value es mayor a 0.05 la hipótesis nula No se rechaza
  1. Prueba de k.s.
  • Prueba de normalidad de Kolmogorov-Smirnov
  • permite estudiar si una muestra procede de una población con una distribución determinada (media y desviación típica)
ks.test(aguasubterraneaPh$VALOR,"pnorm", mean=mean(aguasubterraneaPh$VALOR), sd=sd(aguasubterraneaPh$VALOR))
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  aguasubterraneaPh$VALOR
## D = 0.1436, p-value = 1.129e-05
## alternative hypothesis: two-sided
ks.test(aguasubterraneaTemp$VALOR,"pnorm", mean=mean(aguasubterraneaTemp$VALOR), sd=sd(aguasubterraneaTemp$VALOR))
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  aguasubterraneaTemp$VALOR
## D = 0.071961, p-value = 0.09618
## alternative hypothesis: two-sided
  1. Normalidad de varianzas
var.test(aguasubterraneaPh$VALOR, aguasubterraneaTemp$VALOR)
## 
##  F test to compare two variances
## 
## data:  aguasubterraneaPh$VALOR and aguasubterraneaTemp$VALOR
## F = 0.047408, num df = 292, denom df = 292, p-value < 2.2e-16
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.03767300 0.05965831
## sample estimates:
## ratio of variances 
##         0.04740789
  • El resultado de la prueba p-value muestra un valor debajo del 0.05 por lo tanto la hipótesis nula se rechaza
  1. Numeros de tukey
fivenum(aguasubterraneaPh$VALOR)
## [1] 6.1 6.8 6.9 7.0 7.5
fivenum(aguasubterraneaTemp$VALOR)
## [1] 25.6 28.0 28.7 29.2 32.1
  1. Comparativo de caja y bigote, comparativo de caja y bigote con desviación
op <- par(mfrow =c(1,2), cex.axis=.7, cex.lab=.9 )

boxplot(aguasubterranea$VALOR ~ aguasubterranea$MEDICION, col="grey", main="A"  )
barplot(tapply(aguasubterranea$VALOR, list(aguasubterranea$MEDICION), mean ), beside = T, main="B")

* Por el comparativo de caja y bigote, podemos concluir que existe una relación entre el PH y la Temperatura, ya que cada uno tienen una simetría de la distribución de sus datos lo que nos indica que pueden estar relacionados.

Pregunta de rescate

Solo suma pero no resta

  • ¿La gente realmente quiere ser feliz o es una idea que nos vendieron?

    Considero que una parte la idea de la felicidad está influenciada (nos las han vendido).

    Creo que las personas si desean ser felices, es el estado de ánimo más placentero para el cuerpo y la mente, por lo tanto, no creo que alguien voluntaria y conscientemente desee no ser feliz, sin embargo, no todos tenemos una idea clara de que nos hace feliz y es en donde ‘adoptamos’ una idea de felicidad influenciada por el mercado y consumismo para llenar ese vacío o falta de identidad.

    Niños pequeños, antes de ser conscientes de los bienes materiales se perciben felices y no requieren de más que su imaginación y quizás la compañía de su familia.

  • Para descargar el codigo de este examen:

xfun::embed_file("E3U3D.rmd")
Download E3U3D.rmd

Este documento se encuentra publicado en https://rpubs.com/robertocorona/EPyE3-E3U3D