TRABAJAR CON EL CONJUNTO DE DATOS WOMEN

DETERMINAR LA MEDIA, MEDIANA, MODA, MAXIMO, MINIMO, FRECUENCIA, DESVIACION ESTANDAR, VARIANZA, CUARTILES, PERCEPTILES

ROCONOCER EL

CARGAR EN UN AVARIABLE W <- WOMEN

w <- women
w
##    height weight
## 1      58    115
## 2      59    117
## 3      60    120
## 4      61    123
## 5      62    126
## 6      63    129
## 7      64    132
## 8      65    135
## 9      66    139
## 10     67    142
## 11     68    146
## 12     69    150
## 13     70    154
## 14     71    159
## 15     72    164

CUANTAS VARIABLES, OBSERVACIONES Y TIPO DE DATO QUE ES

str(w)
## 'data.frame':    15 obs. of  2 variables:
##  $ height: num  58 59 60 61 62 63 64 65 66 67 ...
##  $ weight: num  115 117 120 123 126 129 132 135 139 142 ...
class(w)
## [1] "data.frame"

SACAR LA MEDIA DE ALTURAS HEIGHT

mean(w$height)
## [1] 65

SACAR EL MINIMO Y EL MAXIMO DE LA ALTURA DE LAS PERSONAS

max(w$height)
## [1] 72
min(w$height)
## [1] 58

ORDENAMOS PARA ENTENDER LA MEDIA EN LSA ALTURAS

sort(w$height)
##  [1] 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72

SACAR LA MODA, EL QUE MAS SE REPITE Y UTILIZAMOS TABLE

#### Es el dato que mas se repite 
####Hay muchas formas
#Utilizando table
w <- women
w <- rbind(w, c(71, 164)) # OTRA FORMA DE AGREGAR REGISTROS
w <- rbind.data.frame(w, c(70,146)) # height y weight OTRA FORMA DE AGREGAR REGISTRO
moda <- table (w$height)# Moda de la estatura
#moda <- table (w$weight) #Moda de los pesos

moda
## 
## 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 
##  1  1  1  1  1  1  1  1  1  1  1  1  2  2  1

VAMOS A GENERAR 100 NUMEROS ALEATORIOS ENRE 70 Y 100 Y DETERMINANOS LA MODA

set.seed(10) # generamos la semilla
numeros <- sample(70:100, size = 100, replace = TRUE)
numeros
##   [1] 85 79 83 91 72 76 78 78 89 83 90 87 73 88 81 83 71 78 82 95 96 89 94
##  [24] 81 82 91 95 77 93 81 86 72 75 97 83 93 95 99 91 85 78 77 70 92 77 74
##  [47] 70 85 73 94 80 99 77 84 75 88 84 84 82 85 70 73 84 82 95 93 87 83 72
##  [70] 76 72 86 89 86 71 86 81 99 77 76 96 84 76 89 76 70 94 78 75 75 85 92
##  [93] 88 86 81 95 77 86 93 70

SACAMOS LA MODA

moda <- table(numeros)

VISUALISAR DATOS PLOT()

COMANDO PLOT(), GRAFICA DE DISPERSION

# plot ()
#plot(numeros) # otra forma de graficar
plot(x=1:100, y=numeros, type = "l") #otra forma de graficar, p = puntos, b =ambos l= lineas tipo de figura que quieres que aparezca

####GENERANDO UN HISTOGRAMA

#otra manera de dibujar
hist(numeros) #histograma un diagrama de barras

hist(x=numeros, breaks =10, col = "red") # grafica con 70 cortes

hist(x=numeros, breaks =70, col = "red") # grafica con 70 cortes

GRAFICA DE BARRAS

GRAFICANDO LOS NUMEROS

barplot(height=numeros, col = "yellow", xlab = "NUMEROS", ylab = "VALORES", main = "LOS NUMEROS GENERADOS") #Poner etiquetas a la grafica

VAMOS A REALIZAR UNA BARRA CON DOS VARIABLES

UTILIZANDO W

# w
barplot(w$height, col = "yellow", xlab = "PERSONAS", ylab = "ALTURAS", names.arg= 1:length(w$height), main = "HEIGHT DE W") #generame una grafica de barras con las personas y alturas, names.arg organiza los nombres desde el uno hasta la longitud maxima de height

####REGRESANDO A LOS NUMEROS PARA VER ####GRAFICA DE HOJAS

#numeros
stem(numeros) #se visualiza la grafica de tallo y hoja (se visualiza la moda)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   7 | 000001122223334
##   7 | 555566666777777888889
##   8 | 01111122223333344444
##   8 | 55555666666778889999
##   9 | 0111223333444
##   9 | 55555667999

GRAFICA DE CAJAS

median(numeros) #Muestra la mediana
## [1] 83
boxplot(numeros)

####LOS CUARTILES DE LA DISTRIBUCION ####quantiles (divide la distribucion en 4 partes)

quantile(numeros) # te sirve para saber en cuanl cuantil esta la mayor consentracion de los datos
##   0%  25%  50%  75% 100% 
##   70   77   83   89   99

SUMARY DE LOS DATOS

SUMARY(NUMEROS)

summary(numeros)# resumen de los datos
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   70.00   77.00   83.00   83.29   89.00   99.00

HACIENDO UN PASTEL CON

OTRA DISTRIBUCION DE DATOS CON VARIABLES CATEGORIAS

datos <- data.frame(nombres=c("HUGO", "PACO", "LUIS", "PATY","ROBERTO", "MARY"), genero=c("M","M","M","F","M","F"))

#table(datos)
table(datos$genero)
## 
## F M 
## 2 4
pie(table(datos$genero))

#Determinar mediante pastel graph numero de personas por genero
pie(table(datos$genero),main = "Personas por cada género")