Distribucuión normal

Teoría

Distribuciones de Probabilidad Continua Pueden tomar varias formas, pero un gran número de variables observadas en la naturaleza poseen una distribución de frecuencia que tiene mas o menos la forma de montículo, o bien, como se diría en estadística, es aproximadamente una distribución normal de probabilidad. La formula que genera esta distribución es:

Para hallar la probabilidad de que una variable aleatoria normal x se encuentre cen el intervalo de “a” a “b” necesitamos obtener el área bajo la curna normal entre los puntos “a” y “b”. No obstante, hay un número infinitamente grande de distribuciones normales, uno para cada media y desviación estándar diferentes.

Variable Aleatoria Normal Estándar

Beneficio: Nos permite usar la misma tabla para todas las distribuciones normales

1.645*4.5

Pruebas de hipotesis

Conceptos Generales

  • Es un procedimiento basado en evidencia muestral y en la teoría de la probabilidad que se emplea para determinar si la hipótesis es un enunciado racional y no debe rechazarse o si es irracional y debe ser rechazado

  • En un trabajo de investigación se plantean dos hipótesis mutuamente excluyentes. La Hipótesis Nula(Ho) y la Hipótesis Alternativa(H1 o Ha) o de investigador.

  • El análisis estadístico de los datos servirá para determinar si se rechaza o no la Ho.

  • Cuando se rechaza Ho significa que el factor estudiado ha influido significativamente en los resultados y no se rechaza la H1.

Clasificación de las Pruebas de Hipótesis

Distribución t de Student

  • Desarrollada en 1908 por W.S. Gosset, quien trabajó en la fabrica de cerveza Guiness en Irlanda.

Los 5 pasos para Pruebas de Hipótesis

EJERCICIO

Un nuevo proceso para producir diamantes sintétcos es rentabke solo si el peso de estos es mayor a 0.5 quilates. Para evaluarlo se generaron 6 diamantes con los siguientes pesos: 0.46, 0.61, 0.52, 0.48, 0.57, 0.54

El proceso es rentable?

  1. Ho: M <= 0.5 H1: M <= 0.05

peso_diamantes <- c(0.46, 0.61, 0.52, 0.48, 0.57, 0.54)
peso_diamantes
## [1] 0.46 0.61 0.52 0.48 0.57 0.54
promedio <- mean(peso_diamantes)
promedio
## [1] 0.53
desviacion_estandar_muestral <- sqrt(var(peso_diamantes))
desviacion_estandar_muestral
## [1] 0.05585696
n <- 6
miu_o <- 0.5

t <- (promedio-miu_o)/(desviacion_estandar_muestral/sqrt(n))
t
## [1] 1.315587
#No se rechaza Ho, los datos no presentan suficiente evidencia para indicar que el peso medio de los diamantes exceda los 0.5 quilates.

Gráficas

# Función de Densidad de Probabilidad (t de Student)
x_densidad <- seq(-4,4, length = 1000)
y_densidad <- dt(x_densidad, df=5)
plot(x_densidad, y_densidad, type = "l", lty = 1, xlab = "t", ylab = "f(t)", main = "Función de Densidad de Probabilidad (t de Student)")

# Funcion de Distribución de Probabilidad(t de Student)
x_distribucion <- seq(-4,4, length = 1000)
y_distribucion <- pt(x_distribucion, df = 5)
plot(x_distribucion, y_distribucion, type = "l", lty = 1, xlab = "t", ylab = "f(t)", main = "Funcion de Distribución de Probabilidad(t de Student)")

Ejercicio 6.1

Los desechos industriales y residuales descargados en nuestros ríos y arroyos absorben oxígeno y, por tanto, reducen la cantidad de oxígeno disuelto disponible para peces y otras formas de fauna acuática. Una agencia estatal requiere un mínimo de 5 partes por millón (ppm) de oxígeno disuelto para que el contenido de oxígeno sea suficiente para sostener vida acuática. Seis especímenes de agua tomados de un río en un lugar específico durante la estación de aguas bajas (julio) dio lecturas de 4.9, 5.1, 4.9, 5.0, 5.0 y 4.7 de oxígeno disuelto.

¿Los datos dan suficiente evidencia para indicar que el contenido de oxígeno disuelto es menor a 5 ppm? Pruebe usando α = 0.05

  1. Ho: μ ≤ 0.5 Ha: μ < 0.5

  2. α = 0.05

oxigeno <- c(4.9, 5.1, 4.9, 5.0, 5.0 , 4.7)
oxigeno
## [1] 4.9 5.1 4.9 5.0 5.0 4.7
promedio_oxigeno <- mean(oxigeno)
promedio_oxigeno
## [1] 4.933333
desviacion_estandar_oxigeno <- sqrt(var(oxigeno))
desviacion_estandar_oxigeno
## [1] 0.136626
n_oxigeno <- 6
miu_oxigeno <- 5

t_oxigeno = (promedio_oxigeno-miu_oxigeno)/(desviacion_estandar_oxigeno/sqrt(n_oxigeno))
t_oxigeno
## [1] -1.195229

Winsorizing vs Trimming

peso_diamantes_con_error <- c(.46, .61, .52, .48, .57, 54)
boxplot(peso_diamantes_con_error, horizontal = TRUE)

#library(DescTools)
#peso_diamantes_winsorizado <- Winsorize(peso_diamantes_con_error, 0.10)
#peso_diamantes_winsorizado

#peso_diamantes_recortado <- Trim(peso_diamantes_con_error, 1)
#peso_diamantes_recortado

Shiny App

library(shiny)
library(shinythemes)

# Define UI for application that draws a histogram
ui <- fluidPage(theme = shinytheme("cosmo"),
                navbarPage("Aplicaciones", 
                           tabPanel("Nombre Completo",
                                    sidebarPanel(
                                      tags$h5("Ingresa los siguientes datos:"), 
                                      textInput("primer_nombre", "Primer Nombre:", " "),
                                      textInput("segundo_nombre", "Segundo Nombre:", " "),
                                      textInput("apellido_paterno", "Apellido paterno:", " "),
                                      textInput("apellido_materno", "Apellido materno:", " ")
                                    ),
                                    mainPanel(
                                      h3("Tu nombre completo es:"),
                                      verbatimTextOutput("nombre_completo")
                                      )
                                    ),
                            tabPanel("Tab 2"), 
                            tabPanel("Tab 3")
                           )  
)

server <- function(input, output) {
  output$nombre_completo <- renderText(
    paste(input$primer_nombre, input$segundo_nombre, input$apellido_paterno, input$apellido_materno, sep= " ")
    
  )


}


shinyApp(ui = ui, server = server)
Shiny applications not supported in static R Markdown documents