En diversas ocasiones, se pueden identificar múltiples formas en las que se presentan, pero un considerable conjunto de valores aleatorios que se observan en la naturaleza exhiben un patrón de ocurrencia que se asemeja en mayor o menor medida a una estructura de tipo montículo. O, en términos estadísticos, adoptan una forma cercana a la distribución de probabilidad normal.
En el caso de las variables aleatorias continuas, la región bajo la curva de esta distribución se mantiene constante y suma 1, lo cual es equivalente a decir que esta área representa la probabilidad total. Más aún, cuando nos centramos en la parte izquierda de la media, esta área coincide con el valor “S”.
Para calcular la probabilidad de que una variable aleatoria normal, denotada como “x”, se encuentre en el rango comprendido entre los valores “a” y “b”, es necesario calcular el área situada bajo la curva normal que se extiende entre estos dos puntos. No obstante, es relevante considerar que existen innumerables distribuciones normales, cada una asociada a una media y una desviación estándar distintas.
1-pnorm(30,25.5,4.5)
## [1] 0.1586553
Si dan X
qnorm(0.95,25.5,4.5)
## [1] 32.90184
Suponga que los diametros de tallos no soportados en la base de una especie particular de girasol, tienen una distribución normal con un diametro prodemido de 35mm y una desviacion estandar de 3mm
media <- 35
desviacion <- 3
valor <- 40
probabilidad <- 1 -pnorm(valor, mean = media, sd= desviacion)
#.047
Probabilidad_Planta <- 1 - pnorm(40, 35, 3)
Prob_ambas <- Probabilidad_Planta*Probabilidad_Planta
#.0022
c)¿Dentro de qué límites esperaría usted que se encuentren los diametros de base, con probabilidad de 0.95? Para esto se utiliza la media de la distribucion que es 35 La distribucion estandar que es 3 Z nivel de confianza deseado (95% en este caso). n es el número de observaciones (2 plantas).
35 -(1.95*3)
## [1] 29.15
35 +(1.95*3)
## [1] 40.85
diametro_percentil_90 <- qnorm(0.90, 35, 3)
#38.8446
x <-40
promedio <- 35
desviacion_estandar <- 3
x_densidad <- seq(promedio-3*desviacion_estandar, promedio+3*desviacion_estandar,length=1000)
y_densidad <- dnorm(x_densidad, promedio, desviacion_estandar)
plot(x_densidad, y_densidad, type="l", lty=1, xlab="x", ylab = "f(x)", main="Funcion de probabilidad (Normal)", col="lightblue")
x_distribucion <- seq(promedio-3*desviacion_estandar, promedio+3*desviacion_estandar,length=1000)
y_distribucion <- pnorm(x_distribucion, promedio, desviacion_estandar)
plot(x_distribucion,y_distribucion,type ="l",lty=1, xlab="x", ylab="f(x)", main="Función de Distribución de Probabilidad (Normal)",col="hotpink")
library(shiny) library(shinythemes) shinyApp( ui <- fluidPage(theme = shinytheme(“spacelab”), navbarPage(“Módulo 3”, tabPanel(“Densidad y Distribución de probabilidad”, sidebarPanel( tags$h4(“Ingresa los siguientes datos:”), numericInput(“x”, “x”, ““), numericInput(”promedio”, “Promedio”, ““), numericInput(”desviacion_estandar”, “Desviación Estándar”, ““)
),
mainPanel(
h1("Gráficas de distribuciones:"),
plotOutput(outputId = "graficadensidad"),
plotOutput(outputId = "graficadistribucion")
)
)
)
),
server <- function(input, output) {
output$graficadensidad <- renderPlot({x_densidad <- seq(input$promedio-3*input$desviacion_estandar, input$promedio+3*desviacion_estandar,length=1000)
y_densidad <- dnorm(x_densidad,input$promedio,input$desviacion_estandar)
plot(x_densidad,y_densidad,type ="l",lty=1, xlab="x", ylab="f(x)", main="Función de Densidad de Probabilidad (Normal)",col="hotpink")
})
output$graficadistribucion <- renderPlot({x_distribucion <- x_distribucion <- seq(input$promedio-3*input$desviacion_estandar, input$promedio+3*input$desviacion_estandar,length=1000)
y_distribucion <- pnorm(x_distribucion, input$promedio, input$desviacion_estandar)
plot(x_distribucion,y_distribucion,type ="l",lty=1, xlab="x", ylab="f(x)", main="Función de Distribución de Probabilidad (Normal)",col="lightblue")
})
}
)
Un nuevo proceso para producir diamantes sintéticos es rentable sólo si el peso de estos es mayor a 0.5 quilates. Para evaluarlo se generan 6 diamantes con los siguientes pesos: 0.46, 0.61, 0.52, 0.48, 0.57, 0,54 No se rechaza Ho, los datos no presentan suficiente evidencia para indicar que el peso medio de los diamantes excede los 0.5 quilates.
peso_diamantes <- c(.46, .61, .52, .48, .57, .54)
peso_diamantes
## [1] 0.46 0.61 0.52 0.48 0.57 0.54
promedio <- mean(peso_diamantes)
promedio
## [1] 0.53
desviacion_estandar_muestral <- sqrt(var(peso_diamantes))
desviacion_estandar_muestral
## [1] 0.05585696
n <- 6
miu_o <- 0.5
t <- (promedio-miu_o)/(desviacion_estandar_muestral/sqrt(n))
x_densidad1 <- seq(-4,4, length=1000)
y_densidad1 <- dt(x_densidad, df=5)
plot(x_densidad, y_densidad, type="l", lty=1,xlab="t", ylab="f(t)", main="Función de densidad de probabilidad (t de Student)")
x_distribucion1 <- seq(-4,4, length=1000)
y_distribucion1 <- pt(x_densidad, df=5)
plot(x_distribucion1, y_distribucion1, type="l", lty=1,xlab="t", ylab="f(t)", main="Función de distribución de probabilidad (t de Student)")
Los desechos industriales y residuales descargados en nuestros ríos y arroyos absorben oxígeno y, por tanto, reducen la cantidad de oxígeno disuelto disponible para pedes y otras formas de fauna acuática. Una agencia estatal requiere un mínimo de 5 partes por millón (ppm) de oxígeno disuelto para que el contenido de oxígeno sea suficiente para sostener vida acuática. Seis especímenes de agua tomados de un río en un lugar específico durante la estación de aguas bajas (julio) dio lecturas de 4.9, 5.1, 4.9, 5.0, 5.0 y 4.7 de oxígeno disuelto. ¿Los datos dan suficiente evidencia para indicar que el contenido de oxígeno disuelto es menor a 5 ppm? Pruebe usando a = .05.
# Datos de oxígeno disuelto
data <- c(4.9, 5.1, 4.9, 5.0, 5.0, 4.7)
result <- t.test(data, mu = 5, alternative = "less")
result
##
## One Sample t-test
##
## data: data
## t = -1.1952, df = 5, p-value = 0.1428
## alternative hypothesis: true mean is less than 5
## 95 percent confidence interval:
## -Inf 5.045727
## sample estimates:
## mean of x
## 4.933333
Por lo tanto no se rechaza el Ho, ya que cae en la zona de aceptacion
library(DescTools)
peso_diamantes_E <- c(.46, .61, .52, .48, .57, 54)
boxplot(peso_diamantes_E, horizontal=TRUE)
peso_diamantes_W <- Winsorize(peso_diamantes_E, 0.10)
peso_diamantes_W
## [1] 0.4600 0.6100 0.5200 0.4800 0.5700 40.6525
peso_diamantes_R <- Trim(peso_diamantes_E,1)
peso_diamantes_R
## [1] 0.61 0.52 0.48 0.57
## attr(,"trim")
## [1] 1 6
This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.