1. Estimadores Peso, Estatura, Edad calcular los siguientes estimadores
# Variables salon
Peso <- c(63.4, 60, 70, 65, 95, 61, 85, 87, 65, 60, 50, 97, 58)
Estatura <- c(171, 158, 174, 173, 173, 160, 180, 182, 160, 150, 154, 183, 161)
Edad <- c(21, 31, 30, 26, 33, 26, 32, 43, 33, 30, 39, 30, 29)
# Estadísticas Poblacionales
media_Peso<- mean(Peso)
media_Peso
## [1] 70.49231
desviacion_Peso <- sd(Peso)
desviacion_Peso
## [1] 15.22993
media_Estatura<- mean(Estatura)
media_Estatura
## [1] 167.6154
desviacion_Estatura <- sd(Estatura)
desviacion_Estatura
## [1] 11.01165
media_Edad<- mean(Edad)
media_Edad
## [1] 31
desviacion_Edad <- sd(Edad)
desviacion_Edad
## [1] 5.582711
#Con el fin de estimar el sesgo y la consistencia, selecciono una muestra por conveniencia.
PesoConv <- c(63.4, 60, 70, 65, 95, 61)
EstaturaConv <- c(171, 158, 174, 173, 173, 160)
EdadConv <- c(21, 31, 30, 26, 33, 26)
# Estadísticas Muestrales=Estimadores
media_PesoConv<- mean(PesoConv)
media_PesoConv
## [1] 69.06667
desviacion_PesoConv <- sd(PesoConv)
desviacion_PesoConv
## [1] 13.18585
media_EstaturaConv<- mean(EstaturaConv)
media_EstaturaConv
## [1] 168.1667
desviacion_EstaturaConv <- sd(EstaturaConv)
desviacion_EstaturaConv
## [1] 7.194906
media_EdadConv<- mean(EdadConv)
media_EdadConv
## [1] 27.83333
desviacion_EdadConv <- sd(EdadConv)
desviacion_EdadConv
## [1] 4.355074
#Hay Sesgo?
cat("El promedio de Peso Poblacional:",media_Peso)
## El promedio de Peso Poblacional: 70.49231
cat("El promedio de Peso Muestral:",media_PesoConv)
## El promedio de Peso Muestral: 69.06667
# Check the value of x using an if statement
if (media_Peso != media_PesoConv) {
print("Si hay sesgo en el estimador de Media de Peso")
} else {
print("El estimador de media de Peso es insesgado")
}
## [1] "Si hay sesgo en el estimador de Media de Peso"
#------------------------------------------------------------
cat("El promedio de Edad Poblacional:",media_Edad)
## El promedio de Edad Poblacional: 31
cat("El promedio de Edad Muestral:",media_EdadConv)
## El promedio de Edad Muestral: 27.83333
# Check the value of x using an if statement
if (media_Edad != media_EdadConv) {
print("Si hay sesgo en el estimador de Media de Edad")
} else {
print("El estimador de media de Edad es insesgado")
}
## [1] "Si hay sesgo en el estimador de Media de Edad"
#------------------------------------------------------------
cat("El promedio de Estatura Poblacional:",media_Estatura)
## El promedio de Estatura Poblacional: 167.6154
cat("El promedio de Estatura Muestral:",media_EstaturaConv)
## El promedio de Estatura Muestral: 168.1667
# Check the value of x using an if statement
if (media_Estatura != media_EstaturaConv) {
print("Si hay sesgo en el estimador de Media de Estaura")
} else {
print("El estimador de media de Estataura es insesgado")
}
## [1] "Si hay sesgo en el estimador de Media de Estaura"
#Definicion de Consistencia
PesoConv <- c(63.4, 60, 70, 65, 95, 61)
Length1<-length(PesoConv)
PesoConv1 <- c(63.4, 60, 70, 65, 95, 61,85, 87)
Length2<-length(PesoConv1)
Peso <- c(63.4, 60, 70, 65, 95, 61, 85, 87, 65, 60, 50, 97, 58)
Length3<-length(Peso)
media_PesoConv<- mean(PesoConv)
media_PesoConv
## [1] 69.06667
media_PesoConv1<- mean(PesoConv1)
media_PesoConv1
## [1] 73.3
media_Peso<- mean(Peso)
media_Peso
## [1] 70.49231
cat("El promedio de Peso con:",Length1,"es igual a:" ,media_PesoConv)
## El promedio de Peso con: 6 es igual a: 69.06667
cat("El promedio de Peso con:",Length2,"es igual a:" ,media_PesoConv1)
## El promedio de Peso con: 8 es igual a: 73.3
cat("El promedio de Peso con:",Length3,"es igual a:" ,media_Peso)
## El promedio de Peso con: 13 es igual a: 70.49231
#Se concluye que los datos no son consistentes, ya que al analizar la media poblacional con respecto a la media de una muestra de n=6 y otra muestra de n=8, hay variaciones importantes entre los resultados obtenidos. Esto se debe en primera medida, al tamaño de la población de estudio, la cual sólo cuenta con un total de 13 individuos, adicional, se observa que los datos del peso varían significativamente unos de otros, segundo, las muestras fueron seleccionadas por conveniencia.
#Definicion de Eficiencia
varianza_Poblacional <- var(Peso)
varianza_Poblacional
## [1] 231.9508
varianza_estimador1 <- var(PesoConv)
varianza_estimador1
## [1] 173.8667
varianza_estimador2 <- var(PesoConv1)
varianza_estimador2
## [1] 185.92
if (varianza_estimador1 < varianza_estimador2) {
print("Es eficiente")
} else {
print("No es eficiente")
}
## [1] "Es eficiente"
2. Estimadores Ingresos
# Generar datos de ejemplo Muestra
set.seed(123) # Para reproducibilidad
datos <- rnorm(1000, mean = 2200000, sd = 100000)
Media_datos<-mean(datos)
Media_datos
## [1] 2201613
Media_Poblacion<-Media_datos-500000
Media_Poblacion
## [1] 1701613
Mediana_datos<-median(datos)
Mediana_datos
## [1] 2200921
#Simulacion 1
set.seed(1) # Para reproducibilidad
datos1 <- rnorm(1000, mean = 2200000, sd = 100000)
Media_datos1<-mean(datos1)
Media_datos1
## [1] 2198835
Mediana_datos1<-median(datos1)
Mediana_datos1
## [1] 2196468
#Simulacion 2
set.seed(10) # Para reproducibilidad
datos2 <- rnorm(1000, mean = 2200000, sd =100000)
Media_datos2<-mean(datos2)
Media_datos2
## [1] 2201137
Mediana_datos2<-median(datos2)
Mediana_datos2
## [1] 2199700
#Suponer que elegimos los mas ricos
cat("El promedio de Ingresos de la poblacion:", Media_Poblacion)
## El promedio de Ingresos de la poblacion: 1701613
cat("El promedio de Ingresos de la muestra 1:",Media_datos)
## El promedio de Ingresos de la muestra 1: 2201613
cat("El promedio de Ingresos de la muestra 2:",Media_datos1)
## El promedio de Ingresos de la muestra 2: 2198835
cat("El promedio de Ingresos de la muestra 3:",Media_datos2)
## El promedio de Ingresos de la muestra 3: 2201137
Resultados_Media<-c(Media_datos, Media_datos1, Media_datos2)
Varianza_Media<-var(Resultados_Media)
Varianza_Media
## [1] 2206920
cat("La Mediana de Ingresos de la muestra 1:",Mediana_datos)
## La Mediana de Ingresos de la muestra 1: 2200921
cat("La Mediana de Ingresos de la muestra 2:",Mediana_datos1)
## La Mediana de Ingresos de la muestra 2: 2196468
cat("La Mediana de Ingresos de la muestra 3:",Mediana_datos2)
## La Mediana de Ingresos de la muestra 3: 2199700
Resultados_Mediana<-c(Mediana_datos, Mediana_datos1, Mediana_datos2)
Varianza_Mediana<-var(Resultados_Mediana)
Varianza_Mediana
## [1] 5295237
#Realizamos simulaciones y encontramos que la varianza de la media muestral es menor que la de la mediana, por lo tanto la media es un mejor estimador y seria mas eficiente en este caso.
#Consistencia: Tomamos muestras de diferentes tamaños y calculamos la media muestral en cada caso. Observamos que a medida que aumentamos el tamaño de la muestra, las estimaciones de la media convergen hacia un valor específico (quizás el valor real de la media de ingresos en la población).
set.seed(123) # Para reproducibilidad
Datos100<- rnorm(100, mean = 2200000, sd = 100000)
Datos200<- rnorm(200, mean = 2200000, sd = 100000)
Datos500<- rnorm(500, mean = 2200000, sd = 100000)
Media_datos100<-mean(Datos100)
Media_datos200<-mean(Datos200)
Media_datos500<-mean(Datos500)
Media_Poblacion
## [1] 1701613
#Asumiendo los Mil como poblacion
cat("El promedio de Ingresos de 100 ciudadanos:",Media_datos100)
## El promedio de Ingresos de 100 ciudadanos: 2209041
cat("El promedio de Ingresos de 200 ciudadanos:",Media_datos200)
## El promedio de Ingresos de 200 ciudadanos: 2200646
cat("El promedio de Ingresos de 500 ciudadanos:",Media_datos500)
## El promedio de Ingresos de 500 ciudadanos: 2199671
cat("El promedio de Ingresos de toda la población:",Media_datos)
## El promedio de Ingresos de toda la población: 2201613
#Calcular valor critico es encontrar el alfa/2
nivel_confianza <- 0.75
valor_critico <- qnorm((1+nivel_confianza)/2)
valor_critico
## [1] 1.150349
nivel_confianza <- 0.85
valor_critico <- qnorm((1+nivel_confianza)/2)
valor_critico
## [1] 1.439531
nivel_confianza <- 0.95
valor_critico <- qnorm((1+nivel_confianza)/2)
valor_critico
## [1] 1.959964
#Si lo hago a mano, depende de la tabla que se use. Si mi tabla contiene Z en los encabezados, ingreso con el nivel de confianza mas la mitad de alfa (Eje 85%+ 7.5%=92.5%). Si por el contrario tengo la tabla de desviacion normal x, Ingreso solo con Alfa/2, entraria a leer el dato con 7.5%. Y el resultado en ambos escenarios deberia dar lo mismo para la estimacion del intervalo de confianza.
Media_Rugby<-28.5
NC<-0.95
valor_critico <- qnorm((1+NC)/2)
valor_critico
## [1] 1.959964
LimiteS<-Media_Rugby+valor_critico
LimiteS
## [1] 30.45996
LimiteI<-Media_Rugby-valor_critico
LimiteI
## [1] 26.54004
#Un intervalo de confianza de 95% nos indica que dentro del rango dado se encuentra el valor real de un parametro con un 95% de certeza
#Ejercicio Clase - 1.
NC<-0.99
valor_critico1 <- qnorm((1+NC)/2)
valor_critico1
## [1] 2.575829
#En la desviacion normal es 0 y la sd es 0
Acumulada<-pnorm(q = valor_critico1, mean = 0, sd = 1)
Acumulada
## [1] 0.995
#Ejercicio Clase - 2
#Supongamos que tienes una muestra de 40 observaciones con una media de 120 y una desviación estándar de 15. Construye un intervalo de confianza del 95% para la media poblacional.
#Si esto fuera la Poblacion
Media_40datos<-120
NC_40datos<-0.95
valor_critico_40 <- qnorm((1+NC_40datos)/2)
valor_critico_40
## [1] 1.959964
LimiteS_40datos<-Media_40datos+valor_critico_40
LimiteS_40datos
## [1] 121.96
LimiteI_40datos<-Media_40datos-valor_critico
LimiteI_40datos
## [1] 118.04
#Pero como es una muestra
NC_40datos<-0.95
Media_40datos<-120
desviacion_estandar_40datos <- 15
tamano_muestra <- 40
# Calcular el error estándar de la media
error_estandar <- desviacion_estandar_40datos / sqrt(tamano_muestra)
# Calcular el valor crítico de la distribución t
valor_critico <- qt((1 + NC_40datos) / 2, df = tamano_muestra - 1)
# Calcular el margen de error
margen_error <- valor_critico * error_estandar
# Calcular el intervalo de confianza
intervalo_confianza <- c(Media_40datos - margen_error, Media_40datos + margen_error)
# Mostrar resultados
cat("Intervalo de confianza del", NC_40datos * 100, "% para la media:", intervalo_confianza)
## Intervalo de confianza del 95 % para la media: 115.2028 124.7972
#Ejercicio Clase - 3
#Dado que las puntuaciones en un examen siguen una distribución normal con una media de 75 y una desviación estándar de 10, encuentra la probabilidad de que un estudiante obtenga una puntuación mayor a 85 en el examen.
Media_Notas<-75
Desviacion_Notas<-10
Acumulada_Notas<-pnorm(q = 85, mean = 75, sd = 10)
MayorQue85<-(1-Acumulada_Notas)*100
MayorQue85
## [1] 15.86553