Importar base de datos

#file.choose()
poblacion <- read.csv("/Users/dannaperez/Desktop/R/bases de datos/poblacion.csv")
summary(poblacion)
##      Mes                 Pago      
##  Length:12          Min.   :162.6  
##  Class :character   1st Qu.:203.5  
##  Mode  :character   Median :228.6  
##                     Mean   :245.0  
##                     3rd Qu.:293.5  
##                     Max.   :343.5
#file.choose()
muestra <- read.csv("/Users/dannaperez/Desktop/R/bases de datos/muestra.csv")

summary(poblacion)
##      Mes                 Pago      
##  Length:12          Min.   :162.6  
##  Class :character   1st Qu.:203.5  
##  Mode  :character   Median :228.6  
##                     Mean   :245.0  
##                     3rd Qu.:293.5  
##                     Max.   :343.5
summary(muestra)
##      Mes                 Pago      
##  Length:5           Min.   :187.2  
##  Class :character   1st Qu.:219.4  
##  Mode  :character   Median :230.5  
##                     Mean   :249.4  
##                     3rd Qu.:266.6  
##                     Max.   :343.5

Tamaño de la poblacion (N)

cuantos datos hay recibos de pago

N <- length(poblacion$Pago)
N
## [1] 12

Tamaño de la muestra

n <- length(muestra$Pago)
n
## [1] 5

Medidas de tendencia central: permiten conocer el valor al que tiende el conjunto de datos.

Media o promedio: valor que se obtiene al sumar todos los datos y dividirlos en la cant. total de todos los datos.

Media poblacional (xbarra)

media_poblacional <- mean(poblacion$Pago)
media_poblacional 
## [1] 245.0167

Media muestral (miu)

media_muestral <- mean(muestra$Pago)
media_muestral  
## [1] 249.432

Mediana: valor que ocupa el lugar central de todos los datos cuando estos estan ordenados de menor a mayor.

Mediana poblacional

mediana_poblacional <- median(poblacion$Pago)
mediana_poblacional  
## [1] 228.63

Mediana muestral

mediana_muestral <- median(muestra$Pago)
mediana_muestral    
## [1] 230.46

Moda: valor que aparece con mayor frecuencia en un conjunto de datos.

Funcion para calcular la moda

mode <- function(x) {
ux <- unique(x)    
ux[which.max(tabulate(match(x, ux)))]      
}    

nota: si ningun dato se repite, la funcion coloca el primer valor en lugar de marcar error
### Moda poblacional

moda_poblacional <- mode(poblacion$Pago)
moda_poblacional    
## [1] 266.63

Moda muestral

moda_muestral <- mode(muestra$Pago)
moda_muestral    
## [1] 266.63

Relacion entre la media, mediana y moda

Si la media = mediana = moda, los datos tienen una DISTRIBUCION SIMÉTRICA.
Si la media < mediana < moda, los datos tienen SESGO NEGATIVO.
Si la moda < mediana < media, los datos tiene SESGO POSITIVO.
Ejemplo:

hist(poblacion$Pago)

La poblacion tiene SESGO POSITIVO.

Medidas de dispersion: miden que tan esparcidos se encuentran los datos

Rango: Intervalo o diferencia entre el valor maximo y el minimo de un conjunto de datos

Rango poblacional

rango_poblacional <- max(poblacion$Pago - min(poblacion$Pago))
rango_poblacional
## [1] 180.86
r <- range(poblacion$Pago)      
r   
## [1] 162.64 343.50

Nota: La funcion range() devuelve el valor minimo y maximo pero no su diferencia, que es el valor que buscamos.
### Rango muestral

rango_muestral <- max(muestra$Pago) - min(muestra$Pago)
rango_muestral
## [1] 156.34

Varianza: promedio elevado al cuadrado de las desviaciones individuales con respecto a la media de una distribucion

Nota: Si es poblacion, se divide entre N; si es muestra, se divide entre n-1 ### Varianza poblacional (sigma cuadrada)

varianza_poblacional <- var(poblacion$Pago) * (N-1)/N      
varianza_poblacional 
## [1] 3614.659

varianza muestral (s cuadrada)

varianza_muestral <- var(muestra$Pago)
varianza_muestral 
## [1] 3570.905

Desviacion estandar: raiz cuadrada de la varianza.

Desviacion estandar poblacional (sigma)

desviacion_estandar_poblacional <- sqrt(varianza_poblacional)
desviacion_estandar_poblacional 
## [1] 60.12203

Desviacion estandar muestral (s)

desviacion_estandar_muestral <- sqrt(varianza_muestral)
desviacion_estandar_muestral   
## [1] 59.75705

Conclusión

Las medidas de tendencia central nos sirven para visualizar la acumulación más alta de datos que se encuentren entre la base de datos y así tener una idea general acerca de los números. Por otro lado las medidas de dispersión nos ofrecen información acerca de las diferencias que hay entre variables. Si hay una diferencia muy grande entre variables significa que se tiene que encontrar una razón lógica o la base de datos no es confiable.

LS0tCnRpdGxlOiA8c3BhbiBzdHlsZT0iQ29sb3I6T3JhbmdlIj4gIkVzdGFkaXN0aWNhcy1SZWNpYm9fZGVfbHV6IgphdXRob3I6ICJEYW5hIFBlcmV6IC0gQTAwMjI3MDQxIgpkYXRlOiAiOS84LzIwMjIiCm91dHB1dDogCiAgaHRtbF9kb2N1bWVudDogCiAgICB0b2M6IHRydWUKICAgIHRvY19mbG9hdDogdHJ1ZQogICAgY29kZV9kb3dubG9hZDogdHJ1ZQotLS0KCjxpbWcgc3JjPSIvVXNlcnMvZGFubmFwZXJlei9EZXNrdG9wL2ltYWdlbmVzIHBhcmEgSFRNTC9TdGF0aXN0aWNzLVBORy1GcmVlLURvd25sb2FkLnBuZyI+CgojIEltcG9ydGFyIGJhc2UgZGUgZGF0b3MgCmBgYHtyfQojZmlsZS5jaG9vc2UoKQpwb2JsYWNpb24gPC0gcmVhZC5jc3YoIi9Vc2Vycy9kYW5uYXBlcmV6L0Rlc2t0b3AvUi9iYXNlcyBkZSBkYXRvcy9wb2JsYWNpb24uY3N2IikKc3VtbWFyeShwb2JsYWNpb24pCiNmaWxlLmNob29zZSgpCm11ZXN0cmEgPC0gcmVhZC5jc3YoIi9Vc2Vycy9kYW5uYXBlcmV6L0Rlc2t0b3AvUi9iYXNlcyBkZSBkYXRvcy9tdWVzdHJhLmNzdiIpCgpzdW1tYXJ5KHBvYmxhY2lvbikKc3VtbWFyeShtdWVzdHJhKQpgYGAKCiMgVGFtYcOxbyBkZSBsYSBwb2JsYWNpb24gKE4pCmN1YW50b3MgZGF0b3MgaGF5IHJlY2lib3MgZGUgcGFnbwpgYGB7cn0KTiA8LSBsZW5ndGgocG9ibGFjaW9uJFBhZ28pCk4KYGBgCgojIFRhbWHDsW8gZGUgbGEgbXVlc3RyYQpgYGB7cn0KbiA8LSBsZW5ndGgobXVlc3RyYSRQYWdvKQpuCmBgYAoKIyBNZWRpZGFzIGRlIHRlbmRlbmNpYSBjZW50cmFsOiBwZXJtaXRlbiBjb25vY2VyIGVsIHZhbG9yIGFsIHF1ZSB0aWVuZGUgZWwgY29uanVudG8gZGUgZGF0b3MuIAojIyBNZWRpYSBvIHByb21lZGlvOiB2YWxvciBxdWUgc2Ugb2J0aWVuZSBhbCBzdW1hciB0b2RvcyBsb3MgZGF0b3MgeSBkaXZpZGlybG9zIGVuIGxhIGNhbnQuIHRvdGFsIGRlIHRvZG9zIGxvcyBkYXRvcy4gIAojIyMgTWVkaWEgcG9ibGFjaW9uYWwgKHhiYXJyYSkKYGBge3J9Cm1lZGlhX3BvYmxhY2lvbmFsIDwtIG1lYW4ocG9ibGFjaW9uJFBhZ28pCm1lZGlhX3BvYmxhY2lvbmFsIApgYGAKIyMjIE1lZGlhIG11ZXN0cmFsIChtaXUpCmBgYHtyfQptZWRpYV9tdWVzdHJhbCA8LSBtZWFuKG11ZXN0cmEkUGFnbykKbWVkaWFfbXVlc3RyYWwgIApgYGAKCiMjIE1lZGlhbmE6IHZhbG9yIHF1ZSBvY3VwYSBlbCBsdWdhciBjZW50cmFsIGRlIHRvZG9zIGxvcyBkYXRvcyBjdWFuZG8gZXN0b3MgZXN0YW4gb3JkZW5hZG9zIGRlIG1lbm9yIGEgbWF5b3IuCiMjIyBNZWRpYW5hIHBvYmxhY2lvbmFsCmBgYHtyfQptZWRpYW5hX3BvYmxhY2lvbmFsIDwtIG1lZGlhbihwb2JsYWNpb24kUGFnbykKbWVkaWFuYV9wb2JsYWNpb25hbCAgCmBgYAojIyMgTWVkaWFuYSBtdWVzdHJhbApgYGB7cn0KbWVkaWFuYV9tdWVzdHJhbCA8LSBtZWRpYW4obXVlc3RyYSRQYWdvKQptZWRpYW5hX211ZXN0cmFsICAgIApgYGAKCiMjIE1vZGE6IHZhbG9yIHF1ZSBhcGFyZWNlIGNvbiBtYXlvciBmcmVjdWVuY2lhIGVuIHVuIGNvbmp1bnRvIGRlIGRhdG9zLgojIyMgRnVuY2lvbiBwYXJhIGNhbGN1bGFyIGxhIG1vZGEgCmBgYHtyfQptb2RlIDwtIGZ1bmN0aW9uKHgpIHsKdXggPC0gdW5pcXVlKHgpICAgIAp1eFt3aGljaC5tYXgodGFidWxhdGUobWF0Y2goeCwgdXgpKSldICAgICAgCn0gICAgCmBgYApub3RhOiBzaSBuaW5ndW4gZGF0byBzZSByZXBpdGUsIGxhIGZ1bmNpb24gY29sb2NhIGVsIHByaW1lciB2YWxvciBlbiBsdWdhciBkZSBtYXJjYXIgZXJyb3IgICAgCiMjIyBNb2RhIHBvYmxhY2lvbmFsIApgYGB7cn0KbW9kYV9wb2JsYWNpb25hbCA8LSBtb2RlKHBvYmxhY2lvbiRQYWdvKQptb2RhX3BvYmxhY2lvbmFsICAgIApgYGAKIyMjIE1vZGEgbXVlc3RyYWwKYGBge3J9Cm1vZGFfbXVlc3RyYWwgPC0gbW9kZShtdWVzdHJhJFBhZ28pCm1vZGFfbXVlc3RyYWwgICAgCmBgYAoKIyBSZWxhY2lvbiBlbnRyZSBsYSBtZWRpYSwgbWVkaWFuYSB5IG1vZGEKU2kgbGEgbWVkaWEgPSBtZWRpYW5hID0gbW9kYSwgbG9zIGRhdG9zIHRpZW5lbiB1bmEgRElTVFJJQlVDSU9OIFNJTcOJVFJJQ0EuICAKU2kgbGEgbWVkaWEgPCBtZWRpYW5hIDwgbW9kYSwgbG9zIGRhdG9zIHRpZW5lbiBTRVNHTyBORUdBVElWTy4gIApTaSBsYSBtb2RhIDwgbWVkaWFuYSA8IG1lZGlhLCBsb3MgZGF0b3MgdGllbmUgU0VTR08gUE9TSVRJVk8uICAKRWplbXBsbzoKYGBge3J9Cmhpc3QocG9ibGFjaW9uJFBhZ28pCmBgYApMYSBwb2JsYWNpb24gdGllbmUgU0VTR08gUE9TSVRJVk8uCiAgICAKIyBNZWRpZGFzIGRlIGRpc3BlcnNpb246IG1pZGVuIHF1ZSB0YW4gZXNwYXJjaWRvcyBzZSBlbmN1ZW50cmFuIGxvcyBkYXRvcyAKIyMgUmFuZ286IEludGVydmFsbyBvIGRpZmVyZW5jaWEgZW50cmUgZWwgdmFsb3IgbWF4aW1vIHkgZWwgbWluaW1vIGRlIHVuIGNvbmp1bnRvIGRlIGRhdG9zCiMjIyBSYW5nbyBwb2JsYWNpb25hbApgYGB7cn0KcmFuZ29fcG9ibGFjaW9uYWwgPC0gbWF4KHBvYmxhY2lvbiRQYWdvIC0gbWluKHBvYmxhY2lvbiRQYWdvKSkKcmFuZ29fcG9ibGFjaW9uYWwKciA8LSByYW5nZShwb2JsYWNpb24kUGFnbykgICAgICAKciAgIApgYGAKTm90YTogTGEgZnVuY2lvbiByYW5nZSgpIGRldnVlbHZlIGVsIHZhbG9yIG1pbmltbyB5IG1heGltbyBwZXJvIG5vIHN1IGRpZmVyZW5jaWEsIHF1ZSBlcyBlbCB2YWxvciBxdWUgYnVzY2Ftb3MuICAKIyMjIFJhbmdvIG11ZXN0cmFsCmBgYHtyfQpyYW5nb19tdWVzdHJhbCA8LSBtYXgobXVlc3RyYSRQYWdvKSAtIG1pbihtdWVzdHJhJFBhZ28pCnJhbmdvX211ZXN0cmFsCmBgYAoKIyMgVmFyaWFuemE6IHByb21lZGlvIGVsZXZhZG8gYWwgY3VhZHJhZG8gZGUgbGFzIGRlc3ZpYWNpb25lcyBpbmRpdmlkdWFsZXMgY29uIHJlc3BlY3RvIGEgbGEgbWVkaWEgZGUgdW5hIGRpc3RyaWJ1Y2lvbgpOb3RhOiBTaSBlcyBwb2JsYWNpb24sIHNlIGRpdmlkZSBlbnRyZSBOOyBzaSBlcyBtdWVzdHJhLCBzZSBkaXZpZGUgZW50cmUgbi0xCiMjIyBWYXJpYW56YSBwb2JsYWNpb25hbCAoc2lnbWEgY3VhZHJhZGEpCmBgYHtyfQp2YXJpYW56YV9wb2JsYWNpb25hbCA8LSB2YXIocG9ibGFjaW9uJFBhZ28pICogKE4tMSkvTiAgICAgIAp2YXJpYW56YV9wb2JsYWNpb25hbCAKYGBgCiMjIyB2YXJpYW56YSBtdWVzdHJhbCAocyBjdWFkcmFkYSkKYGBge3J9CnZhcmlhbnphX211ZXN0cmFsIDwtIHZhcihtdWVzdHJhJFBhZ28pCnZhcmlhbnphX211ZXN0cmFsIApgYGAKCiMjIERlc3ZpYWNpb24gZXN0YW5kYXI6IHJhaXogY3VhZHJhZGEgZGUgbGEgdmFyaWFuemEuCiMjIyBEZXN2aWFjaW9uIGVzdGFuZGFyIHBvYmxhY2lvbmFsIChzaWdtYSkKYGBge3J9CmRlc3ZpYWNpb25fZXN0YW5kYXJfcG9ibGFjaW9uYWwgPC0gc3FydCh2YXJpYW56YV9wb2JsYWNpb25hbCkKZGVzdmlhY2lvbl9lc3RhbmRhcl9wb2JsYWNpb25hbCAKYGBgCiMjIyBEZXN2aWFjaW9uIGVzdGFuZGFyIG11ZXN0cmFsIChzKQpgYGB7cn0KZGVzdmlhY2lvbl9lc3RhbmRhcl9tdWVzdHJhbCA8LSBzcXJ0KHZhcmlhbnphX211ZXN0cmFsKQpkZXN2aWFjaW9uX2VzdGFuZGFyX211ZXN0cmFsICAgCmBgYAoKIyBDb25jbHVzacOzbgpMYXMgbWVkaWRhcyBkZSB0ZW5kZW5jaWEgY2VudHJhbCBub3Mgc2lydmVuIHBhcmEgdmlzdWFsaXphciBsYSBhY3VtdWxhY2nDs24gbcOhcyBhbHRhIGRlIGRhdG9zIHF1ZSBzZSBlbmN1ZW50cmVuIGVudHJlIGxhIGJhc2UgZGUgZGF0b3MgeSBhc8OtIHRlbmVyIHVuYSBpZGVhIGdlbmVyYWwgYWNlcmNhIGRlIGxvcyBuw7ptZXJvcy4gUG9yIG90cm8gbGFkbyBsYXMgbWVkaWRhcyBkZSBkaXNwZXJzacOzbiBub3Mgb2ZyZWNlbiBpbmZvcm1hY2nDs24gYWNlcmNhIGRlIGxhcyBkaWZlcmVuY2lhcyBxdWUgaGF5IGVudHJlIHZhcmlhYmxlcy4gU2kgaGF5IHVuYSBkaWZlcmVuY2lhIG11eSBncmFuZGUgZW50cmUgdmFyaWFibGVzIHNpZ25pZmljYSBxdWUgc2UgdGllbmUgcXVlIGVuY29udHJhciB1bmEgcmF6w7NuIGzDs2dpY2EgbyBsYSBiYXNlIGRlIGRhdG9zIG5vIGVzIGNvbmZpYWJsZS4gIAoK