x=c(3.6,2.5,1.2,0.6,1.3,2.1,2.7,3.5)
mean(x) #Cálcula el promedio
## [1] 2.1875
var(x) # Cálculo de la varianza
## [1] 1.195536
sd(x) # Cálculo de la desvación estandar
## [1] 1.093406
table(x) # tabla de frecuencia
## x
## 0.6 1.2 1.3 2.1 2.5 2.7 3.5 3.6
## 1 1 1 1 1 1 1 1
prop.table(table(x)) #tabla de frecuencia en porcentaje
## x
## 0.6 1.2 1.3 2.1 2.5 2.7 3.5 3.6
## 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125
cumsum(table(x)) # tabla de frecuencia acumulada
## 0.6 1.2 1.3 2.1 2.5 2.7 3.5 3.6
## 1 2 3 4 5 6 7 8
cumsum(prop.table(table(x))) # tabla de frecuencia acumulada en porcentaje
## 0.6 1.2 1.3 2.1 2.5 2.7 3.5 3.6
## 0.125 0.250 0.375 0.500 0.625 0.750 0.875 1.000
barplot(table(x))
pie(table(x))
boxplot(x)
Se sospecha que la temperatura en la ciudad ha venido aumentado año a año; para responder este interrogante se midieron las temperaturas durante el mes de febrero de 2019 y 2020. Una muestra de temperaturas por día medidas en grados centígrados aparecen a continuación:
a=c(32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29,25)
b=c(32, 33, 26, 22, 32, 32, 31, 31, 32, 31, 24, 22, 26, 31, 35, 31, 32, 31, 34, 21, 23, 31, 31, 30, 30, 33, 36, 32, 33, 29,25)
stem(a)
##
## The decimal point is at the |
##
## 25 | 0
## 26 |
## 27 | 0
## 28 | 00
## 29 | 00000
## 30 | 0000000
## 31 | 00000000
## 32 | 000
## 33 | 000
## 34 | 0
stem(b)
##
## The decimal point is at the |
##
## 20 | 0
## 22 | 000
## 24 | 00
## 26 | 00
## 28 | 0
## 30 | 0000000000
## 32 | 000000000
## 34 | 00
## 36 | 0
table(a)
## a
## 25 27 28 29 30 31 32 33 34
## 1 1 2 5 7 8 3 3 1
barplot(table(a))
mean(a)
## [1] 30.32258
sd(a)
## [1] 1.886568
mean(b)
## [1] 29.74194
sd(b)
## [1] 4.024655
# las temperaturas del 2020 son mas varibles que las temperatura de de 2019
quantile(a,0.9)
## 90%
## 33
quantile(b,0.9)
## 90%
## 33
# el 90% de las temperaturas son 33 grado o menos para las dos años.
# el 10% de las temperaturas son superiores a 33 para los dos años
hist(rnorm(100000,mean = 25, 10), main="Datos simetricos")
boxplot(rnorm(100000,mean = 25, 10), main="Datos simetricos")
#Si los datos son simetricos, 99,7% de los datos estan a 3 desviaciones estandar de la media
# 25-3*2,25+3*2
# lo que este fuera de ese intervalo se considera datos atipico
hist(rf(n = 10000,10,20), main="Datos asimetricos positivos ")
boxplot((rf(n = 10000,10,20)), main="Datos asimetricos positivos ")
hist(-rf(n = 10000,10,20),main="Datos asimetricos negativos")
boxplot((-rf(n = 10000,10,20)),main="Datos asimetricos negativos")
par(mfrow=c(1, 3))
boxplot(rnorm(100000,mean = 25, 10), main="Datos simetricos")
boxplot((rf(n = 10000,10,20)), main="Datos asimetricos positivos ")
boxplot((-rf(n = 10000,10,20)),main="Datos asimetricos negativos")
dev.off()
## null device
## 1