Estimadores2Ejemplo

1. Estimadores Peso, Estatura, Edad calcular los siguientes estimadores

# Variables salon
Peso <- c(63.4, 60, 70, 65, 95, 61, 85, 87, 65, 60, 50, 97, 58)
Estatura <- c(171, 158, 174, 173, 173, 160, 180, 182, 160, 150, 154, 183, 161)
Edad <- c(21, 31, 30, 26, 33, 26, 32, 43, 33, 30, 39, 30, 29)

# Estadísticas Poblacionales
media_Peso<- mean(Peso)
media_Peso

## [1] 70.49231

desviacion_Peso <- sd(Peso)
desviacion_Peso

## [1] 15.22993

media_Estatura<- mean(Estatura)
media_Estatura

## [1] 167.6154

desviacion_Estatura <- sd(Estatura)
desviacion_Estatura

## [1] 11.01165

media_Edad<- mean(Edad)
media_Edad

## [1] 31

desviacion_Edad <- sd(Edad)
desviacion_Edad

## [1] 5.582711

#Con el fin de estimar el sesgo y la consistencia, selecciono una muestra por conveniencia.

PesoConv <- c(63.4, 60, 70, 65, 95, 61)
EstaturaConv <- c(171, 158, 174, 173, 173, 160)
EdadConv <- c(21, 31, 30, 26, 33, 26)

# Estadísticas Muestrales=Estimadores
media_PesoConv<- mean(PesoConv)
media_PesoConv

## [1] 69.06667

desviacion_PesoConv <- sd(PesoConv)
desviacion_PesoConv

## [1] 13.18585

media_EstaturaConv<- mean(EstaturaConv)
media_EstaturaConv

## [1] 168.1667

desviacion_EstaturaConv <- sd(EstaturaConv)
desviacion_EstaturaConv

## [1] 7.194906

media_EdadConv<- mean(EdadConv)
media_EdadConv

## [1] 27.83333

desviacion_EdadConv <- sd(EdadConv)
desviacion_EdadConv

## [1] 4.355074

#Hay Sesgo?
cat("El promedio de Peso Poblacional:",media_Peso)

## El promedio de Peso Poblacional: 70.49231

cat("El promedio de Peso Muestral:",media_PesoConv)

## El promedio de Peso Muestral: 69.06667

# Check the value of x using an if statement
if (media_Peso != media_PesoConv) {
  print("Si hay sesgo en el estimador de Media de Peso")
} else {
  print("El estimador de media de Peso es insesgado")
}

## [1] "Si hay sesgo en el estimador de Media de Peso"

#------------------------------------------------------------
cat("El promedio de  Edad Poblacional:",media_Edad)

## El promedio de  Edad Poblacional: 31

cat("El promedio de Edad Muestral:",media_EdadConv)

## El promedio de Edad Muestral: 27.83333

# Check the value of x using an if statement
if (media_Edad != media_EdadConv) {
  print("Si hay sesgo en el estimador de Media de Edad")
} else {
  print("El estimador de media de Edad es insesgado")
}

## [1] "Si hay sesgo en el estimador de Media de Edad"

#------------------------------------------------------------
cat("El promedio de  Estatura Poblacional:",media_Estatura)

## El promedio de  Estatura Poblacional: 167.6154

cat("El promedio de Estatura Muestral:",media_EstaturaConv)

## El promedio de Estatura Muestral: 168.1667

# Check the value of x using an if statement
if (media_Estatura != media_EstaturaConv) {
  print("Si hay sesgo en el estimador de Media de Estaura")
} else {
  print("El estimador de media de Estataura es insesgado")
}

## [1] "Si hay sesgo en el estimador de Media de Estaura"

#Definicion de Consistencia

PesoConv <- c(63.4, 60, 70, 65, 95, 61)
Length1<-length(PesoConv)
PesoConv1 <- c(63.4, 60, 70, 65, 95, 61,85, 87)
Length2<-length(PesoConv1)
Peso <- c(63.4, 60, 70, 65, 95, 61, 85, 87, 65, 60, 50, 97, 58)
Length3<-length(Peso)
media_PesoConv<- mean(PesoConv)
media_PesoConv

## [1] 69.06667

media_PesoConv1<- mean(PesoConv1)
media_PesoConv1

## [1] 73.3

media_Peso<- mean(Peso)
media_Peso

## [1] 70.49231

cat("El promedio de  Peso con:",Length1,"es igual a:" ,media_PesoConv)

## El promedio de  Peso con: 6 es igual a: 69.06667

cat("El promedio de  Peso con:",Length2,"es igual a:" ,media_PesoConv1)

## El promedio de  Peso con: 8 es igual a: 73.3

cat("El promedio de  Peso con:",Length3,"es igual a:" ,media_Peso)

## El promedio de  Peso con: 13 es igual a: 70.49231

#Se concluye que los datos no son consistentes, ya que al analizar la media poblacional con respecto a la media de una muestra de n=6 y otra muestra de n=8, hay variaciones importantes entre los resultados obtenidos. Esto se debe en primera medida, al tamaño de la población de estudio, la cual sólo cuenta con un total de 13 individuos, adicional, se observa que los datos del peso varían significativamente unos de otros, segundo, las muestras fueron seleccionadas por conveniencia.

#Definicion de Eficiencia

varianza_Poblacional <- var(Peso)
varianza_Poblacional

## [1] 231.9508

varianza_estimador1 <- var(PesoConv)
varianza_estimador1

## [1] 173.8667

varianza_estimador2 <- var(PesoConv1)
varianza_estimador2

## [1] 185.92

if (varianza_estimador1 < varianza_estimador2) {
  print("Es eficiente")
} else {
  print("No es eficiente")
}

## [1] "Es eficiente"

2. Estimadores Ingresos

# Generar datos de ejemplo Muestra
set.seed(123)  # Para reproducibilidad
datos <- rnorm(1000, mean = 2200000, sd = 100000)
Media_datos<-mean(datos)
Media_datos

## [1] 2201613

Media_Poblacion<-Media_datos-500000
Media_Poblacion

## [1] 1701613

Mediana_datos<-median(datos)
Mediana_datos

## [1] 2200921

#Simulacion 1
set.seed(1)  # Para reproducibilidad
datos1 <- rnorm(1000, mean = 2200000, sd = 100000)
Media_datos1<-mean(datos1)
Media_datos1

## [1] 2198835

Mediana_datos1<-median(datos1)
Mediana_datos1

## [1] 2196468

#Simulacion 2
set.seed(10)  # Para reproducibilidad
datos2 <- rnorm(1000, mean = 2200000, sd =100000)
Media_datos2<-mean(datos2)
Media_datos2

## [1] 2201137

Mediana_datos2<-median(datos2)
Mediana_datos2

## [1] 2199700

#Suponer que elegimos los mas ricos
cat("El promedio de  Ingresos de la poblacion:", Media_Poblacion)

## El promedio de  Ingresos de la poblacion: 1701613

cat("El promedio de  Ingresos de la muestra 1:",Media_datos)

## El promedio de  Ingresos de la muestra 1: 2201613

cat("El promedio de  Ingresos de la muestra 2:",Media_datos1)

## El promedio de  Ingresos de la muestra 2: 2198835

cat("El promedio de  Ingresos de la muestra 3:",Media_datos2)

## El promedio de  Ingresos de la muestra 3: 2201137

Resultados_Media<-c(Media_datos, Media_datos1, Media_datos2)
Varianza_Media<-var(Resultados_Media)
Varianza_Media

## [1] 2206920

cat("La Mediana de  Ingresos de la muestra 1:",Mediana_datos)

## La Mediana de  Ingresos de la muestra 1: 2200921

cat("La Mediana de  Ingresos de la muestra 2:",Mediana_datos1)

## La Mediana de  Ingresos de la muestra 2: 2196468

cat("La Mediana de  Ingresos de la muestra 3:",Mediana_datos2)

## La Mediana de  Ingresos de la muestra 3: 2199700

Resultados_Mediana<-c(Mediana_datos, Mediana_datos1, Mediana_datos2)
Varianza_Mediana<-var(Resultados_Mediana)
Varianza_Mediana

## [1] 5295237

#Realizamos simulaciones y encontramos que la varianza de la media muestral es menor que la de la mediana, por lo tanto la media es un mejor estimador y seria mas eficiente en este caso.

#Consistencia: Tomamos muestras de diferentes tamaños y calculamos la media muestral en cada caso. Observamos que a medida que aumentamos el tamaño de la muestra, las estimaciones de la media convergen hacia un valor específico (quizás el valor real de la media de ingresos en la población). 
set.seed(123)  # Para reproducibilidad
 Datos100<- rnorm(100, mean = 2200000, sd = 100000)
 Datos200<- rnorm(200, mean = 2200000, sd = 100000)
 Datos500<- rnorm(500, mean = 2200000, sd = 100000)
 Media_datos100<-mean(Datos100)
 Media_datos200<-mean(Datos200)
 Media_datos500<-mean(Datos500)
 Media_Poblacion

## [1] 1701613

 #Asumiendo los Mil como poblacion
cat("El promedio de Ingresos de 100 ciudadanos:",Media_datos100)

## El promedio de Ingresos de 100 ciudadanos: 2209041

cat("El promedio de Ingresos de 200 ciudadanos:",Media_datos200)

## El promedio de Ingresos de 200 ciudadanos: 2200646

cat("El promedio de Ingresos de 500 ciudadanos:",Media_datos500)

## El promedio de Ingresos de 500 ciudadanos: 2199671

cat("El promedio de Ingresos de toda la población:",Media_datos)

## El promedio de Ingresos de toda la población: 2201613

#Calcular valor critico es encontrar el alfa/2

nivel_confianza <- 0.75
valor_critico <- qnorm((1+nivel_confianza)/2)
valor_critico

## [1] 1.150349

nivel_confianza <- 0.85
valor_critico <- qnorm((1+nivel_confianza)/2)
valor_critico

## [1] 1.439531

nivel_confianza <- 0.95
valor_critico <- qnorm((1+nivel_confianza)/2)
valor_critico

## [1] 1.959964

#Si lo hago a mano, depende de la tabla que se use. Si mi tabla contiene Z en los encabezados, ingreso con el nivel de confianza mas la mitad de alfa (Eje 85%+ 7.5%=92.5%). Si por el contrario tengo la tabla de desviacion normal x, Ingreso solo con Alfa/2, entraria a leer el dato con 7.5%. Y el resultado en ambos escenarios deberia dar lo mismo para la estimacion del intervalo de confianza.
Media_Rugby<-28.5
NC<-0.95
valor_critico <- qnorm((1+NC)/2)
valor_critico

## [1] 1.959964

LimiteS<-Media_Rugby+valor_critico
LimiteS

## [1] 30.45996

LimiteI<-Media_Rugby-valor_critico
LimiteI

## [1] 26.54004

#Un intervalo de confianza de 95% nos indica que dentro del rango dado se encuentra el valor real de un parametro con un 95% de certeza

#Ejercicio Clase - 1.
NC<-0.99
valor_critico1 <- qnorm((1+NC)/2)
valor_critico1

## [1] 2.575829

#En la desviacion normal es 0 y la sd es 0

Acumulada<-pnorm(q = valor_critico1, mean = 0, sd = 1)
Acumulada

## [1] 0.995

#Ejercicio Clase - 2
#Supongamos que tienes una muestra de 40 observaciones con una media de 120 y una desviación estándar de 15. Construye un intervalo de confianza del 95% para la media poblacional.
#Si esto fuera la Poblacion
Media_40datos<-120
NC_40datos<-0.95
valor_critico_40 <- qnorm((1+NC_40datos)/2)
valor_critico_40

## [1] 1.959964

LimiteS_40datos<-Media_40datos+valor_critico_40
LimiteS_40datos

## [1] 121.96

LimiteI_40datos<-Media_40datos-valor_critico
LimiteI_40datos

## [1] 118.04

#Pero como es una muestra

NC_40datos<-0.95
Media_40datos<-120
desviacion_estandar_40datos <- 15
tamano_muestra <- 40

# Calcular el error estándar de la media
error_estandar <- desviacion_estandar_40datos / sqrt(tamano_muestra)

# Calcular el valor crítico de la distribución t
valor_critico <- qt((1 + NC_40datos) / 2, df = tamano_muestra - 1)

# Calcular el margen de error
margen_error <- valor_critico * error_estandar

# Calcular el intervalo de confianza
intervalo_confianza <- c(Media_40datos - margen_error, Media_40datos + margen_error)
# Mostrar resultados
cat("Intervalo de confianza del", NC_40datos * 100, "% para la media:", intervalo_confianza)

## Intervalo de confianza del 95 % para la media: 115.2028 124.7972

#Ejercicio Clase - 3
#Dado que las puntuaciones en un examen siguen una distribución normal con una media de 75 y una desviación estándar de 10, encuentra la probabilidad de que un estudiante obtenga una puntuación mayor a 85 en el examen.
Media_Notas<-75
Desviacion_Notas<-10
Acumulada_Notas<-pnorm(q = 85, mean = 75, sd = 10)
MayorQue85<-(1-Acumulada_Notas)*100
MayorQue85

## [1] 15.86553

Estimadores2Ejemplo

Daniela/ Dicleny/Ricardo

2023-11-17