knitr::opts_chunk$set(error = TRUE)

En este estudio, vamos a intentar descifrar cual es la edad que mas predomina en una muestra de 31 personas que viven en tres casas de la ciudad de Mendoza. Todo esto, para que podamos elegir en la empresa “Good View” que tipo de publicidad vamos a colocar en el cartel que esta en frente de estas tres casas y a que publico.

Utilizamos a R como fuente de estudio.

#Declaramos las edades en un vector 
edades <- c(25,31,33,38,41,27,33,45,77,71,60,55,57,61,33,39,41,42,49,46,61,58,54, 43,54,51,43,54,66,80,77)
print(edades)
##  [1] 25 31 33 38 41 27 33 45 77 71 60 55 57 61 33 39 41 42 49 46 61 58 54
## [24] 43 54 51 43 54 66 80 77

Ahora, es momento de calcular medidas de tendencia central

#Calcula la media aritmetica
media_aritmetica <- mean(edades)
print(paste("La media aritmetica es igual a:" , media_aritmetica))
## [1] "La media aritmetica es igual a: 49.8387096774194"
print("El promedio de edades se encuentra cercana a los 49 años")
## [1] "El promedio de edades se encuentra cercana a los 49 años"
#Calcula la mediana
mediana <- median(edades)
print(paste("La mediana es igual a:", mediana))
## [1] "La mediana es igual a: 49"
print("Si ordenamos las edades, el valor central es 49")
## [1] "Si ordenamos las edades, el valor central es 49"
#Calcula minima
minimo <- min(edades)
print(paste("La edad minima en la muestra es igual a:", minimo))
## [1] "La edad minima en la muestra es igual a: 25"
#Calcula maxima
maximo <- max(edades)
print(paste("La edad maxima en la muestra es igual a:", maximo))
## [1] "La edad maxima en la muestra es igual a: 80"
library(modeest)
## 
## This is package 'modeest' written by P. PONCET.
## For a complete list of functions, use 'library(help = "modeest")' or 'help.start()'.
r <- mlv(edades, method = "mfv")
print("Imprimo moda")
## [1] "Imprimo moda"
print(r)
## Mode (most likely value): 43.5 
## Bickel's modal skewness: 0.1612903 
## Call: mlv.default(x = edades, method = "mfv")
#Vamos por la distorsion
#Calcula desviacion distorsion
desviacion <- sd(edades)
print(paste("La desviacion estandar del estudio es:", desviacion))
## [1] "La desviacion estandar del estudio es: 14.82811917539"
#Resumen y desviacion interquartilica
resumen <- summary(edades)
print(resumen)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   25.00   40.00   49.00   49.84   59.00   80.00
#Curtosis 
print("Para calcular la curtosis, llamo a la libreria E1071 que me brinda la posibilidad de calcular la Curtosis automaticamente. Me va a dar una apreciacion de la distribucion del plano")
## [1] "Para calcular la curtosis, llamo a la libreria E1071 que me brinda la posibilidad de calcular la Curtosis automaticamente. Me va a dar una apreciacion de la distribucion del plano"
library(e1071)
## 
## Attaching package: 'e1071'
## The following object is masked from 'package:modeest':
## 
##     skewness
curtosis <- kurtosis(resumen)
print(paste("La curtosis de este estudio es igual a:", curtosis))
## [1] "La curtosis de este estudio es igual a: -1.28360915047571"
print("Tenemos una muestra platicurtica. Plana y ancha")
## [1] "Tenemos una muestra platicurtica. Plana y ancha"
barplot(edades, density = 30, main = "Edades de cada persona", sub = "Lo que observamos es la cantidad de gente y sus edades correspondientes", col = rainbow(20), xlab = "Personas", ylab = "Edades")

#Coeficiente de variacion - distorsion
coeficiente <- desviacion/media_aritmetica
print(paste("El coeficiente de variacion es igual a:", coeficiente))
## [1] "El coeficiente de variacion es igual a: 0.297522132321742"
porcentaje <- coeficiente*100
print(paste("Consideramos que nuestra muestra es homogenea porque tenemos un porcentaje por debajo del 30% arrojando el resultado de:", porcentaje))
## [1] "Consideramos que nuestra muestra es homogenea porque tenemos un porcentaje por debajo del 30% arrojando el resultado de: 29.7522132321742"

Ahora, graficamos. En Python y en R

hist(edades, density = 30, col = "blue", main = "Frecuencia de las edades en la muestra", xlab = "Edades", ylab = "Frecuencia", axes = TRUE, plot = TRUE, angle = 90, freq = TRUE,border = "red")

Graficamos en un grafico de caja para identificar rapidamente donde se ubican todas esas edades de forma rapida

boxplot(edades, notch = TRUE, col = "bisque", ylab = "Edades")