Módulo 3 - Desviación estándar

Distribución Normal de Probabilidad

Distribución Probabilidad Continua

En diversas ocasiones, se pueden identificar múltiples formas en las que se presentan, pero un considerable conjunto de valores aleatorios que se observan en la naturaleza exhiben un patrón de ocurrencia que se asemeja en mayor o menor medida a una estructura de tipo montículo. O, en términos estadísticos, adoptan una forma cercana a la distribución de probabilidad normal.

En el caso de las variables aleatorias continuas, la región bajo la curva de esta distribución se mantiene constante y suma 1, lo cual es equivalente a decir que esta área representa la probabilidad total. Más aún, cuando nos centramos en la parte izquierda de la media, esta área coincide con el valor “S”.

Para calcular la probabilidad de que una variable aleatoria normal, denotada como “x”, se encuentre en el rango comprendido entre los valores “a” y “b”, es necesario calcular el área situada bajo la curva normal que se extiende entre estos dos puntos. No obstante, es relevante considerar que existen innumerables distribuciones normales, cada una asociada a una media y una desviación estándar distintas.

Ejercicio 3

Porcentaje

Probabilidad, área bajo la curva

1-pnorm(30,25.5,4.5)

## [1] 0.1586553

x

Si dan X

qnorm(0.95,25.5,4.5)

## [1] 32.90184

EJERCICIO 4

Suponga que los diametros de tallos no soportados en la base de una especie particular de girasol, tienen una distribución normal con un diametro prodemido de 35mm y una desviacion estandar de 3mm

¿Cuál es la probabilidad de que una planta de girasol tenga un diametro de base de mas de 40mm? X es el valor que queremos calcular, 35 es la media y 3 es la desviacion, el valor que es 40 se le resta la media lo cual sale 5 y se divide entre la desviacion que es 3 lo que da 1.67, consultamos la tabla para saber el valor del girasol o si lo metemos en r, nos sale tambien

media <- 35
desviacion <- 3
valor <- 40
probabilidad <- 1 -pnorm(valor, mean = media, sd= desviacion)

#.047

Si 2 plantas de girasol se selecciona al azar ¿Cuál es la probabilidad de que ambas plantas tengan un diametro de base de mas de 40mm? Probabilidad de una planta es 40mm y se multiplica por el mismo valor para sacar el resultado

Probabilidad_Planta <- 1 - pnorm(40, 35, 3)
Prob_ambas <- Probabilidad_Planta*Probabilidad_Planta

#.0022

c)¿Dentro de qué límites esperaría usted que se encuentren los diametros de base, con probabilidad de 0.95? Para esto se utiliza la media de la distribucion que es 35 La distribucion estandar que es 3 Z nivel de confianza deseado (95% en este caso). n es el número de observaciones (2 plantas).

35 -(1.95*3)

## [1] 29.15

35 +(1.95*3)

## [1] 40.85

¿Qué diámetro representa el 90avo percentil de la distribución de diámetros? media <- 35 desviacion <- 3 percentil_deseado <- 0.90

 diametro_percentil_90 <- qnorm(0.90, 35, 3)

#38.8446

Grafica

  x <-40
  promedio <- 35
  desviacion_estandar <- 3

Funcion de Densidad de Probabilidad (Normal)

  x_densidad <- seq(promedio-3*desviacion_estandar, promedio+3*desviacion_estandar,length=1000)
  y_densidad <- dnorm(x_densidad, promedio, desviacion_estandar)
  plot(x_densidad, y_densidad, type="l", lty=1, xlab="x", ylab = "f(x)", main="Funcion de probabilidad (Normal)", col="lightblue")

Funcion de Distribucion de Probabilidad (Normal)

  x_distribucion <- seq(promedio-3*desviacion_estandar, promedio+3*desviacion_estandar,length=1000)
  y_distribucion <- pnorm(x_distribucion, promedio, desviacion_estandar)
  plot(x_distribucion,y_distribucion,type ="l",lty=1, xlab="x", ylab="f(x)", main="Función de Distribución de Probabilidad (Normal)",col="hotpink")

GRAFICA

library(shiny) library(shinythemes) shinyApp( ui <- fluidPage(theme = shinytheme(“spacelab”), navbarPage(“Módulo 3”, tabPanel(“Densidad y Distribución de probabilidad”, sidebarPanel( tags$h4(“Ingresa los siguientes datos:”), numericInput(“x”, “x”, ““), numericInput(”promedio”, “Promedio”, ““), numericInput(”desviacion_estandar”, “Desviación Estándar”, ““)

                                    ),
                                    mainPanel(
                                      h1("Gráficas de distribuciones:"),
                                      plotOutput(outputId = "graficadensidad"),
                                      plotOutput(outputId = "graficadistribucion")
                                    )
                           )
                           
                )
),

server <- function(input, output) {
  output$graficadensidad <- renderPlot({x_densidad <- seq(input$promedio-3*input$desviacion_estandar, input$promedio+3*desviacion_estandar,length=1000)
  y_densidad <- dnorm(x_densidad,input$promedio,input$desviacion_estandar)
  plot(x_densidad,y_densidad,type ="l",lty=1, xlab="x", ylab="f(x)", main="Función de Densidad de Probabilidad (Normal)",col="hotpink")
  })
  
  output$graficadistribucion <- renderPlot({x_distribucion <- x_distribucion <- seq(input$promedio-3*input$desviacion_estandar, input$promedio+3*input$desviacion_estandar,length=1000)
  y_distribucion <- pnorm(x_distribucion, input$promedio, input$desviacion_estandar)
  plot(x_distribucion,y_distribucion,type ="l",lty=1, xlab="x", ylab="f(x)", main="Función de Distribución de Probabilidad (Normal)",col="lightblue")
  
  })
}

)

Ejercicio 5

Un nuevo proceso para producir diamantes sintéticos es rentable sólo si el peso de estos es mayor a 0.5 quilates. Para evaluarlo se generan 6 diamantes con los siguientes pesos: 0.46, 0.61, 0.52, 0.48, 0.57, 0,54 No se rechaza Ho, los datos no presentan suficiente evidencia para indicar que el peso medio de los diamantes excede los 0.5 quilates.

peso_diamantes <- c(.46, .61, .52, .48, .57, .54)
peso_diamantes

## [1] 0.46 0.61 0.52 0.48 0.57 0.54

promedio <- mean(peso_diamantes)
promedio

## [1] 0.53

desviacion_estandar_muestral <- sqrt(var(peso_diamantes))
desviacion_estandar_muestral

## [1] 0.05585696

n <- 6
miu_o <- 0.5
t <- (promedio-miu_o)/(desviacion_estandar_muestral/sqrt(n))

Funcion de Densidad de Probabilidad

x_densidad1 <- seq(-4,4, length=1000)
y_densidad1 <- dt(x_densidad, df=5)
plot(x_densidad, y_densidad, type="l", lty=1,xlab="t", ylab="f(t)", main="Función de densidad de probabilidad (t de Student)")

Funcion de Distribucion de Probabilidad

x_distribucion1 <- seq(-4,4, length=1000)
y_distribucion1 <- pt(x_densidad, df=5)
plot(x_distribucion1, y_distribucion1, type="l", lty=1,xlab="t", ylab="f(t)", main="Función de distribución de probabilidad (t de Student)")

Ejercicio Contenido de O2 disuelto

Los desechos industriales y residuales descargados en nuestros ríos y arroyos absorben oxígeno y, por tanto, reducen la cantidad de oxígeno disuelto disponible para pedes y otras formas de fauna acuática. Una agencia estatal requiere un mínimo de 5 partes por millón (ppm) de oxígeno disuelto para que el contenido de oxígeno sea suficiente para sostener vida acuática. Seis especímenes de agua tomados de un río en un lugar específico durante la estación de aguas bajas (julio) dio lecturas de 4.9, 5.1, 4.9, 5.0, 5.0 y 4.7 de oxígeno disuelto. ¿Los datos dan suficiente evidencia para indicar que el contenido de oxígeno disuelto es menor a 5 ppm? Pruebe usando a = .05.

# Datos de oxígeno disuelto
data <- c(4.9, 5.1, 4.9, 5.0, 5.0, 4.7)
result <- t.test(data, mu = 5, alternative = "less")
result

## 
##  One Sample t-test
## 
## data:  data
## t = -1.1952, df = 5, p-value = 0.1428
## alternative hypothesis: true mean is less than 5
## 95 percent confidence interval:
##      -Inf 5.045727
## sample estimates:
## mean of x 
##  4.933333

Por lo tanto no se rechaza el Ho, ya que cae en la zona de aceptacion

Winsorzing vs Trimming

library(DescTools)
peso_diamantes_E <- c(.46, .61, .52, .48, .57, 54)
boxplot(peso_diamantes_E, horizontal=TRUE)

peso_diamantes_W <- Winsorize(peso_diamantes_E, 0.10)
peso_diamantes_W

## [1]  0.4600  0.6100  0.5200  0.4800  0.5700 40.6525

peso_diamantes_R <- Trim(peso_diamantes_E,1)
peso_diamantes_R

## [1] 0.61 0.52 0.48 0.57
## attr(,"trim")
## [1] 1 6

R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)

##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

Ejercicio 3.2

Geli Martinez

2023-09-04