Estadistica

Importar bases de datos

file.choose()

## [1] "C:\\Users\\jimen\\Downloads\\Recibo de luz.Rmd"

poblacion <- read.csv("C:\\Users\\jimen\\Downloads\\poblacion (1).csv")

file.choose()

## [1] "C:\\Users\\jimen\\Downloads\\Recibo de luz.Rmd"

muestra <- read.csv("C:\\Users\\jimen\\Downloads\\muestra (1).csv")

Tamaño de la población (N)

N <- length(poblacion$Pago)
N

## [1] 12

Tamaño de la muestra (n)

n <- length(muestra$Pago)
n

## [1] 5

Medidas de Tendencia central: permiten conocer el valor al que tiende el conjunt de datos

media o pormedio: valor que se obtiene al sumar todos los datros y dividirlos entre la cantidad total de datos

Media poblacional: (x Barra )

media_poblacional <-mean(poblacion$Pago)
media_poblacional

## [1] 245.0167

Media Muestral (miu)

media_muestral <- mean(muestra$Pago)
media_muestral

## [1] 249.432

Mediana : valor que ocupa el lugar central de todos los datos cuando estos estan ordenados de mayor a menor.

mediana_poblacional <- mean(poblacion$Pago)
mediana_poblacional

## [1] 245.0167

Mediana Muestral

mediana_muestral <- median(muestra$Pago)
mediana_muestral

## [1] 230.46

Moda: valor que aparecce con mayor frecuencia en un conjunto de datos.

Funcion para calcualr moda

mode <- function(x) {
  ux<- unique(x)
  ux[which.max(tabulate(match(x, ux )))]
}

Nota: si ningun dato se repite, la funcion coloca el primer valor en lugar de marcar error

Moda poblacional

moda_poblacional <-mode(poblacion$Pago)
moda_poblacional

## [1] 266.63

Moda muestral

moda_muestral <-mode(muestra$Pago)
moda_muestral

## [1] 266.63

Relación entre la media, medianaa y moda

si la media= mediana =moda, los datos tienen una DISTRIBUCION SIMETRICA

Si la media < mediana < moda, los datos tienen SESGO NEGATIVO

Si la moda < mediana < media, los datos tienen SESGO POSITIVO

hist(poblacion$Pago)

Existe un sesgo positivo en la poblacion

Medidas de Dispersión : Miden que tan esparcidos se encuentran los datos

Rango: Intervalo o diferencia entre el valor máximo y el minimo de un conjunto

Rango poblacional

rango_poblacional <- max(poblacion$Pago) - min(poblacion$Pago)
rango_poblacional

## [1] 180.86

r <- range(poblacion$Pago)
r

## [1] 162.64 343.50

La función range() devuelve el valor miimo y maximo pero no su diferencia, que es el valor que buscamos

rango_muestral <- max(muestra$Pago) - min (muestra$Pago)
rango_muestral

## [1] 156.34

Varianza : es el promedio elevado de las desviaciones individuales de cada observacion con respecto a la media de una distribucion

si es población, se divide entre N; Si es Muestra, se divide entre n-1 para una mejor estimación

Varianza poblacional (sigma cuadrada)

varianza_poblacional <- var(poblacion$Pago)*(N-1) /N
varianza_poblacional

## [1] 3614.659

Varianza Muestral (s cuadrada)

varianza_muestral <- var(muestra$Pago)
varianza_muestral

## [1] 3570.905

Desviación Estándar : Raíz cuadrada de la varianza

Desviación Estándar poblacional (sigma)

desviacion_estandar_poblacional <-sqrt(varianza_poblacional)
desviacion_estandar_poblacional

## [1] 60.12203

Desviación Estándar Muestral (s)

desviacion_estandar_muestral <- sqrt(varianza_muestral)
desviacion_estandar_muestral

## [1] 59.75705

Conclusion

Para analisis estadistico existen diferentes funciones que resaltan por su importancia como lo fueron las abarcadas a lo largo de todo este codigo, las cuales ayudan para realizar un mejor analisis con datos curados.