poblacion<-read.csv("C:\\Users\\javaw\\OneDrive - Instituto Tecnologico y de Estudios Superiores de Monterrey\\7mo Semestre\\Modulo 3\\poblacion.csv")
muestra<-read.csv("C:\\Users\\javaw\\OneDrive - Instituto Tecnologico y de Estudios Superiores de Monterrey\\7mo Semestre\\Modulo 3\\muestra.csv")
N<-length(poblacion$Pago)
N
## [1] 12
n<-length(muestra$Pago)
n
## [1] 5
Media o promedio: valor que se obtiene al sumar todos los datos y dividirlos entre la cantidad total de datos.
Media Poblacional(X barra)
media_poblacional<-mean(poblacion$Pago)
media_poblacional
## [1] 245.0167
Media Muestral (miu)
media_muestral<-mean(muestra$Pago)
media_muestral
## [1] 249.432
Mediana: valor que ocupa el lugar central de todos los datos cuando estos estan ordenados de menor a mayor.
Mediana Poblacional
mediana_poblacional<-median(poblacion$Pago)
mediana_poblacional
## [1] 228.63
Mediana Muestral
mediana_muestral<-median(muestra$Pago)
mediana_muestral
## [1] 230.46
Moda: valor que aparece con mayor frecuencia en un conjunto de datos.
Funcion para calcular la moda
mode <- function(x){
ux<-unique(x)
ux[which.max(tabulate(match(x,ux)))]
}
Moda Poblacional
moda_poblacional<-mode(poblacion$Pago)
moda_poblacional
## [1] 266.63
Moda Muestral
moda_muestral<-mode(muestra$Pago)
moda_muestral
## [1] 266.63
Relacion entre la media, mediana y moda
Si la media = mediana = moda, los datos tienen una DISTRIBUCION
SIMETRICA.
Si la media < mediana < moda, los datos tienen SESGO NEGATIVO.
(Left Skewed)
Si la moda < mediana > media, los datos tienen SESGO POSITIVO.
(Right Skewed)
Histograma de la población
hist(poblacion$Pago)
Al observar la distribución en el histograma podemos observar que la población tiene SESGO POSITIVO.
Rango: intervalo o diferencia entre el valor máximo y el mínimo de un conjunto de datos.
Rango Poblacional
rango_poblacional <-max(poblacion$Pago)-min(poblacion$Pago)
rango_poblacional
## [1] 180.86
Funcion de rango
La funcion range() devuelve el valor minimo y maximo pero no su
diferencia, el cual es el valor que buscamos.
r<-range(poblacion$Pago)
r
## [1] 162.64 343.50
Rango Muestral
rango_muestral<-max(muestra$Pago)-min(muestra$Pago)
rango_muestral
## [1] 156.34
Varianza: Promedio elevado al cuadrado de las
desviaciónes individuales de cada observación con respecto a la media de
una distribución.
Si es Población, se divide entre N; Si es Muestra, se divide entre
n-1.
Varianza Poblacional (sigma cuadrada)
varianza_poblacional <-var(poblacion$Pago)*(N-1)/N
varianza_poblacional
## [1] 3614.659
Varianza Muestral (s cuadrada)
varianza_muestral <- var(muestra$Pago)
varianza_muestral
## [1] 3570.905
Desviación Estándar: raíz cuadrada de la varianza.
Desviación Estándar Poblacional (sigma)
desv_est_poblacional<-sqrt(varianza_poblacional)
desv_est_poblacional
## [1] 60.12203
Desviación Estándar Muestral (s)
desv_est_muestral<-sqrt(varianza_muestral)
desv_est_muestral
## [1] 59.75705
Este código nos permite conocer y tener a la mano aquellas medidas de dispersión, tendencia central y estadística que podemos llegar a requerir al momento de estar manipulando y analizando bases de datos.