En el enlace pueden encontrar como installar R y R STUDIO

Comandos bƔsicos

x=c(3.6,2.5,1.2,0.6,1.3,2.1,2.7,3.5)
mean(x) #CƔlcula el promedio 
## [1] 2.1875
var(x) # CƔlculo de la varianza 
## [1] 1.195536
sd(x) # CÔlculo de la desvación estandar 
## [1] 1.093406

Construcción de una tabla de frecuencia

table(x) # tabla de frecuencia
## x
## 0.6 1.2 1.3 2.1 2.5 2.7 3.5 3.6 
##   1   1   1   1   1   1   1   1
prop.table(table(x)) #tabla de frecuencia en porcentaje 
## x
##   0.6   1.2   1.3   2.1   2.5   2.7   3.5   3.6 
## 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125
cumsum(table(x)) # tabla de frecuencia acumulada 
## 0.6 1.2 1.3 2.1 2.5 2.7 3.5 3.6 
##   1   2   3   4   5   6   7   8
cumsum(prop.table(table(x))) # tabla de frecuencia acumulada en porcentaje 
##   0.6   1.2   1.3   2.1   2.5   2.7   3.5   3.6 
## 0.125 0.250 0.375 0.500 0.625 0.750 0.875 1.000

Algunos grƔficos estadisticos

barplot(table(x))

pie(table(x))

boxplot(x)

Ejemplo nĆŗmero 1

a=c(32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29,25)
b=c(32, 33, 26, 22, 32, 32, 31, 31, 32, 31, 24, 22, 26, 31, 35, 31, 32, 31, 34, 21, 23, 31, 31, 30, 30, 33, 36, 32, 33, 29,25)

stem(a)
## 
##   The decimal point is at the |
## 
##   25 | 0
##   26 | 
##   27 | 0
##   28 | 00
##   29 | 00000
##   30 | 0000000
##   31 | 00000000
##   32 | 000
##   33 | 000
##   34 | 0
stem(b)
## 
##   The decimal point is at the |
## 
##   20 | 0
##   22 | 000
##   24 | 00
##   26 | 00
##   28 | 0
##   30 | 0000000000
##   32 | 000000000
##   34 | 00
##   36 | 0
table(a)
## a
## 25 27 28 29 30 31 32 33 34 
##  1  1  2  5  7  8  3  3  1
barplot(table(a))

mean(a)
## [1] 30.32258
sd(a)
## [1] 1.886568
mean(b)
## [1] 29.74194
sd(b)
## [1] 4.024655
# las temperaturas del 2020 son mas varibles que las temperatura de de 2019

quantile(a,0.9)
## 90% 
##  33
quantile(b,0.9)
## 90% 
##  33
# el 90% de las temperaturas son 33 grado o menos para las dos aƱos.
# el 10% de las temperaturas son superiores a 33 para los dos aƱos

# AnƔlisis de simetria y asimetria a partir del grafico de caja

Se generaron 100000 nÚmeros aleatorios con media 25 y desviación estadar 10

hist(rnorm(100000,mean = 25, 10), main="Datos simetricos")

boxplot(rnorm(100000,mean = 25, 10), main="Datos simetricos")

#Si los datos son simetricos, 99,7% de los datos estan a 3 desviaciones estandar de la media
# 25-3*2,25+3*2
# lo que este fuera de ese intervalo se considera datos atipico

Se generaron datos asimetricos positivos a partir de uan distribución F

hist(rf(n = 10000,10,20), main="Datos asimetricos positivos ")

boxplot((rf(n = 10000,10,20)), main="Datos asimetricos positivos ")

Se generaron datos asimetricos positivos a partir de la distribución F

hist(-rf(n = 10000,10,20),main="Datos asimetricos negativos")

boxplot((-rf(n = 10000,10,20)),main="Datos asimetricos negativos")

Resumen

par(mfrow=c(1, 3))
boxplot(rnorm(100000,mean = 25, 10), main="Datos simetricos")
boxplot((rf(n = 10000,10,20)), main="Datos asimetricos positivos ")
boxplot((-rf(n = 10000,10,20)),main="Datos asimetricos negativos")

dev.off()
## null device 
##           1