Principales Parámetros

Símbolos:

  • pch : el parámetro pch sirve para realizar gráficos con símbolos. (sintaxis: plot(x,pch=1))
Núm. Forma
0 Cuadrado
1 Círculo
2 Triángulo.a
3 Cruz
4 Aspa
5 Rombo
6 Triángulo.b
7 Cuadrado-Aspa
8 Asterisco
9 Rombo-Cruz
10 Círculo-Aspa
  • main : sirve para ingresar un título a un gráfico. Mientras que xlab y ylab colocan etiquetas a los ejex X e Y respectivamente (sintaxis: “plot(main =”Gráfico 1“, xlab =”Eje X“, ylab =”Eje Y" )).

  • col : sirve para colorear, internamentente, los gráficos. Mientras que border colorea únicamente los bordes (sintaxis: “col=, border=”).

Color Texto Número
Blanco “White” 0
Negro “Black” 1
Rojo “Red” 2
Rojo Oscuro “Darkred” -
Verde “Green” 3
Verde Claro “Lightgreen” -
Verde Oscuro “Darkgreen” -
Azul “Blue” 4
Celeste “Skyblue” -
  • lwd : sirve para declarar el tamaño del ancho de línea del gráfico a realizar (sintaxis: “plot(x,lwd=2.5)” ; “hist(x,lwd=4.5)”).

Gráficos de Plot

Gráficos Plot

La función plot irve para trazar gráficos bidimensionales X - Y. Donde la sintaxis es: plot(x,y) ó plot(x,y,type="p) y X e Y son vectores numéricos de igual dimensión.

Ejemplo: graficar con puntos la función f(x) = sen (x), x pertenece [0,Pi]

Gráficos de Línea

La sintaxis de estos gráficos es: plot(x,y,type=“l”). Donde X y Y son vectores numéricos de igual dimensión.

Gráfica con Líneas Veticales

La sintaxis de estos gráficos es: plot(x,y,type=“h”). Donde X y Y son vectores numéricos de igual dimensión.

Gráfica Tipo Escalera

La sintaxis de estos gráficos es: plot(x,y,type=“s”). Donde X y Y son vectores numéricos de igual dimensión.

Histograma

Se utilizan usando la función hist. Sintaxis: hist(x,…) Donde X es un vector.

Histograma de Frecuencias

Realizamos un ejemplo cargando la siguiente base de datos:

\[\begin{array} {rrr} 265 & 197 & 349 & 280 & 265 & 200 & 221 & 265 & 261 & 278 \\ 205 & 286 & 317 & 242 & 254 & 235 & 174 & 262 & 248 & 250 \\ 263 & 274 & 242 & 260 & 281 & 246 & 248 & 271 & 260 & 265 \\ 307 & 243 & 258 & 321 & 294 & 328 & 263 & 245 & 274 & 270 \\ 220 & 231 & 276 & 228 & 223 & 296 & 231 & 301 & 337 & 298 \\ 268 & 267 & 300 & 250 & 260 & 276 & 334 & 280 & 250 & 257 \\ 260 & 281 & 208 & 299 & 308 & 264 & 280 & 274 & 278 & 210 \\ 234 & 265 & 187 & 258 & 235 & 269 & 265 & 253 & 254 & 280 \\ 299 & 214 & 264 & 267 & 283 & 235 & 272 & 287 & 274 & 269 \\ 215 & 318 & 271 & 293 & 277 & 290 & 283 & 258 & 275 & 251 \\ \end{array} \]

Cargamos la base de datos de la siguiente forma:

Y luego graficamos:

### Histograma de Densidad

La función hist() por defecto, muestra el gráfico de frecuencia; también genera la representación gráfica de las densidades. Sintaxis: hist(x,prob=TRUE). Donde “TRUE” es para mostrar la densidad y no las frecuencias, y “lwd” es el grosor de la línea.

Diagrama de Barras

Se realizan utilizando la función barplot(). Donde X puede ser un vector o matriz en la sintaxis: barplot(x,..)

Ejemplo: Los siguientes datos corresponden a las puntuaciones de un conductor de Cabify y con ello debemos realizar un gráfico de barras para frecuencias absolutas y relativas.

\[\begin{array} {rrr} 3 & 5 & 5 & 4 & 5 & 5 & 3 & 5 & 3 & 5 & 4 & 1 & 3 & 3 & 5 & 1 & 5 & 5 & 5 & 5 & 5 & 5 & 4 & 4 & 2 & 5 & 5 & 4 & 4 \\ 5 & 4 & 4 & 4 & 4 & 5 & 4 & 5 & 5 & 5 & 5 & 5 & 4 & 5 & 3 & 3 & 4 & 4 & 5 & 5 & 4 & 5 & 5 & 4 & 3 & 3 & 5 & 4 & 5 \\ 5 & 3 & 3 & 5 & 4 & 5 & 4 & 5 & 4 & 5 & 4 & 5 & 4 & 5 & 4 & 4 & 5 & 4 & 5 & 5 & 5 & 5 & 5 & 5 & 5 & 5 & 5 & 4 & 5 \\ \end{array} \]

Cargamos los datos y luego usamos la función table ya que toda tabla de frecuencias se denomina con dicha función.

Realizamos el gráfico de frecuencia absoluta con los siguientes comandos:

Finalmente, realizamos el gráfico de frecuencias relativas con los siguientes comandos: Recordar que una frecuencia relativa es una proporción de la frecuencia absoluta entre la cantidad de datos, es decir, un cociente, por ello usamos prop.

Gráficos Circulares

Gráfico 2D:

La sintaxis para realizar este tipo de gráficos es pie(x,…). Donde X es un vector numérico no negativo.

Primero se debe generar las etiquetas

Ponemos que sea colorido con rainbows

Gráfico 3D:

Para ello debemos installar el paquete plotrix con:

install.packages(plotrix)

library(plotrix)

Ahora usamos la función para hacer el gráfico

Diagrama de Pareto

La sintaxis es la siguiente: _pareto.chart(x,…). Donde X es un vector, pero antes debemos instalar el siguiente paquete:

install.packages(qcc)

library(qcc)

Para el ejemplo se seguirá utilizando la base de datos del conductor de Cabify. Para ello, crearemos una tabla utilizando la tabla creada anteriormente y 2l ylab2 será el porcentaje acumulado, siempre un 20% y 80%.

## Warning: package 'qcc' was built under R version 4.0.2
## Package 'qcc' version 2.7
## Type 'citation("qcc")' for citing this R package in publications.

Para ver los datos de la Tabla creada.

##    
## Pareto chart analysis for tabla
##      Frequency  Cum.Freq. Percentage Cum.Percent.
##   5  47.000000  47.000000  54.022989    54.022989
##   4  26.000000  73.000000  29.885057    83.908046
##   3  11.000000  84.000000  12.643678    96.551724
##   1   2.000000  86.000000   2.298851    98.850575
##   2   1.000000  87.000000   1.149425   100.000000

Diagrama de Cajas

La sintaxis es la siguiente: boxplot(x~grupo). Donde X es un vector numérico que debe dividirse en grupos en referencia a la variable grupoy este último debe ser cualitativo.

Para el ejmeplo se usará la data iris que viene instalada en R, utilizando los siguientes comandos para obtener un diagrama de cajasusando el ancho de sépalos de la data iris con agrupamiento de especies:

Del gráfico se desprende que, la mediana de las variables (iris setosa, versicolor y virgínica) no son homogéneas. Dado que la iris setosa presenta una mediana mayor al de los otros tipos de iris. Además, en la iris setosa se puede observar un dato atípico. Se recomienda analizarlo.

Diagrama de Tallos y Hojas

La sintaxis es la siguiente: stem(x,…). Donde X es un vector numérico.

Ejemplo: Realizar un diagrama de tallos y hojas para 20 plantas, extraídos de manera aleatoria de la data iris, en referencia al largo del sépalo. Primero extraemos los datos:

##    Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1           5.1         3.5          1.4         0.2  setosa
## 2           4.9         3.0          1.4         0.2  setosa
## 3           4.7         3.2          1.3         0.2  setosa
## 4           4.6         3.1          1.5         0.2  setosa
## 5           5.0         3.6          1.4         0.2  setosa
## 6           5.4         3.9          1.7         0.4  setosa
## 7           4.6         3.4          1.4         0.3  setosa
## 8           5.0         3.4          1.5         0.2  setosa
## 9           4.4         2.9          1.4         0.2  setosa
## 10          4.9         3.1          1.5         0.1  setosa
## 11          5.4         3.7          1.5         0.2  setosa
## 12          4.8         3.4          1.6         0.2  setosa
## 13          4.8         3.0          1.4         0.1  setosa
## 14          4.3         3.0          1.1         0.1  setosa
## 15          5.8         4.0          1.2         0.2  setosa
## 16          5.7         4.4          1.5         0.4  setosa
## 17          5.4         3.9          1.3         0.4  setosa
## 18          5.1         3.5          1.4         0.3  setosa
## 19          5.7         3.8          1.7         0.3  setosa
## 20          5.1         3.8          1.5         0.3  setosa

Realizamos el gráfico:

## 
##   The decimal point is at the |
## 
##   4 | 34
##   4 | 6678899
##   5 | 00111444
##   5 | 778

Gráficos de Dispersión

Matriz de Diagramas de Dispersión

Para crear una matriz de diagramas de dispersión, se usa la siguiente sintaxis: pairs(x,…).

Como ejemplo: Realizar el gráfico de dispersión de la data iris usando el largo y el ancho del sépalo.

Recordar lo siguiente: - pch & bg: Color y símbolo - oma: Modificar el margen exterior

Según el diagrama de dispersión, se puede observar que el ancho y largo del sépalo para la iris setosa se encuentra una correlación positiva y alta; mientras que en las otras dos variables, presentan una correlación moderada y positiva.

Ejemplos Aplicados

Ejemplo 1: Diagrama de tallos y hojas

Con los siguientes datos: 60 85 72 59 37 75 93 7 98 63 41 90 5 17 97. Realizar lo siguiente:

  • Guardar los datos en archivo txt (bloc de notas)
  • Importar dicho archivo en R.
  • Obtener un resumen numérico de los datos.
  • Hacer un diagrama de tallo y hojas.
  • Elaborar una representación gráfica.

El archivo en el bloc de notas tiene que estar de la siguiente forma:

-
60
85
72
59
37
75
93
7
98
63
41
90
5
17
97

Importamos los datos y posterior a ello vemos los estadísticos descriptivos más conocidos con summary:

## # A tibble: 15 x 1
##       X1
##    <dbl>
##  1    60
##  2    85
##  3    72
##  4    59
##  5    37
##  6    75
##  7    93
##  8     7
##  9    98
## 10    63
## 11    41
## 12    90
## 13     5
## 14    17
## 15    97
##        X1       
##  Min.   : 5.00  
##  1st Qu.:39.00  
##  Median :63.00  
##  Mean   :59.93  
##  3rd Qu.:87.50  
##  Max.   :98.00

Se realiza el diagrama de tallos y hojas

## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   0 | 57
##   1 | 7
##   2 | 
##   3 | 7
##   4 | 1
##   5 | 9
##   6 | 03
##   7 | 25
##   8 | 5
##   9 | 0378

La representación gráfica, como la data es cuantitativa y al presentar más de 8 grupos se podría hacer un diagrama de bastones.

Ejemplo 2: Gráfico de Barras

Cargamos una base de datos producto que tiene los siguientes datos: los cuales son cualitativos.

## # A tibble: 50 x 1
##    X1   
##    <chr>
##  1 A    
##  2 B    
##  3 A    
##  4 A    
##  5 C    
##  6 B    
##  7 C    
##  8 C    
##  9 B    
## 10 C    
## # ... with 40 more rows

Para relizar el gráfico de barras primero se debe hacer la tabal de frecuencias y finalmente con barplot se hace el gráfico de barras con las siguientes características.

## Productos
##  A  B  C 
## 20 14 16

Ejemplo 3: Diagrama Circular

Considerar el ingreso de 200 trabajadores y con ello elaborar un gráfico circular donde se consideren grupos entre distintos rangos de sueldo.

Los datos son los siguientes:

## # A tibble: 200 x 1
##       X1
##    <dbl>
##  1  1000
##  2  1400
##  3  1350
##  4   930
##  5   930
##  6  1200
##  7  1050
##  8   930
##  9   953
## 10   974
## # ... with 190 more rows

Creamos la variable ingreso en referencia a cada grupo:

Calculamos las frecuencias y etiquetas:

Ejemplo 6: Gráficos de Dispersión

Primero importamos una data que tenga las siguientes características entre las edades y numero de hijos de 50 personas.

## # A tibble: 50 x 2
##     Edad  Peso
##    <dbl> <dbl>
##  1    20     0
##  2    20     0
##  3    20     0
##  4    20     1
##  5    20     1
##  6    20     0
##  7    20     0
##  8    23     0
##  9    23     1
## 10    23     0
## # ... with 40 more rows

Calculamos la frecuencia:

## $x
##  [1] 20 20 23 23 27 27 33 33 39 39 39 45 45 45 50 50 50 65 65
## 
## $y
##  [1] 0 1 0 1 2 3 2 3 2 3 4 2 3 4 3 4 5 4 5
## 
## $number
##  [1] 5 2 2 1 5 1 2 3 1 2 2 1 6 3 4 5 1 2 2

La gráfica de dispersión por defecto:

Modificando el tamaño de los marcadores:

Modificando el color:

Otro:

Modificando el grosor de la línea:

Ingresando Texto:

Contacto

Cualquier error existente comunicarlo al siguiente correo: