Se omiten las tildes para evitar los caracteres de edicion.
FUNCIÓN # EN R
Cada vez que usted escribe el simbolo de #, R entendera que es un
nota adicional a cualquier funcion que usted realice.
a<-c(1,2,3) # creando un vector de 3 elementos que hemos denominado ???a???
FUNCIONES ESTADISTICAS BASICAS
# Con base a los datos.
x<- c(0, 3, 6, 7, 9, 12)
sum(x)
[1] 37
FUNCION LISTAR ls()
Revisaremos cuantos objetos hemos creado en R. Para nuestro caso
escribimos la funcion listar ls()
ls()
[1] "a" "x"
VALOR MINIMO
min(x)
[1] 0
DESVIACION ESTANDAR
sd(x)
[1] 4.262237
VARIANZA
variance <- function (x) sum((x-mean(x))^2)/(length(x)-1) #escrita como una funcion
variance(x)
[1] 18.16667
Escriba un vector denominado f que vaya del 1 al 15, y obtenga su
desviacion estandar:
f <- 1:15
f
[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
(sum(f^2) - 15 * mean(f)^2) / 14
[1] 20
#o
sd(f)
[1] 4.472136
LONGITUD DE LA VARIABLE
x<- c(16, 32, 17, 22, 8, 21, 46, 29, 52, 79, 44)
length(x)
[1] 11
range(x)
[1] 8 79
#muestra el rango, valor (min) y valor (max) de la variable x.
QUANTILES
quantile(x) #Muestra los cuartiles de la variable x
0% 25% 50% 75% 100%
8 19 29 45 79
quantile(x, c(.35, .60, .98)) #Muestra los percentiles al 35, 60 y 96% de la variable x
35% 60% 98%
21.5 32.0 73.6
sort(x) #Ordena los datos en forma ascendente de los valores de la variable x
[1] 8 16 17 21 22 29 32 44 46 52 79
ASIMETRIA Y CURTOSIS
Son medidas que representan la asimetria de la distribucion y el
achatamiento o no de la misma. Para obtener estas dos medidas
utilizaremos el paquete {moments}
install.packages(“moments”) #Funcion que instala paquete
library(moments)
skewness(x) #nos da el valor de la asimetria de los datos de la variable x
[1] 0.9262894
kurtosis(x) #nos da el achatamiento de la distribucion de los datos de la variable x.
[1] 3.178227
Si este coeficiente es nulo, la distribucion se dice normal (similar
a la distribucion normal de Gauss) y recibe el nombre de mesocurtica. Si
el coeficiente es positivo, la distribucion se llama leptocurtica, hay
una mayor concentracion de los datos en torno a la media. Si el
coeficiente es negativo, la distribucion se llama platicurtica y hay una
menor concentracion de datos en torno a la media
FIN