Informe de taller corto #1

El motivo prinipal del taller es demostrar el conocimiento adquirido del estudiante para crear graficas, todo realizado con datos predeterminados.

Ahora iniciaremos demostrando paso por paso del trabajo anteriormente planteado.

1. Boxplot para el “salary” en función del “rank”

Como primer paso, creamos nuestro directo de trabajo y procedemos a seleccionar la carpeta en la que se ubican los datos a trabajar. Para diferenciar nuestro trabajo podemos agregar colores a nuestro gusto para una mejor visualisacion de las graficas.

1.Selecionamos carpeta y agregamos detalles como el color

wd = "/Users/salvatorefrieri/Desktop/ElectivaR/"

setwd(wd)
BD <- read.table("salaries.txt", header=TRUE, dec=".")
newdata <- dplyr::select(BD, salary, rank)
color=c( "#FFFF6D","#D8152F","#2400D8")

Boxplot

Ahora agregamos la estructura de la grafica y definimos nombres de nuestras variables a analizar. 2. Nombramos y seleccionamos configuraciones de las graficas.

boxplot(BD$salary ~ BD$rank,
        ylab="CargosP",
        xlab = "SalariosP",
        col=color, 
        main = "Graficos de caja",
        outpch= 20,
        outbg= "Black",
        horizontal = TRUE)

### 2. Barplot para el “rank”.

Barplot

Ahora analizaremos el diagrama de barras. 2.Procederemos a configurar nombres de ejes y otras configuraciones para una mejor comprension del grafico.

tabla = table(BD$rank) 

coor <- barplot(tabla,
                main= "Cantidad de Trabajadores",
                xlab = "Numero de trabajadores",
                ylab = "Cargos de trabajadores",
                col=color,
                horiz=TRUE)

text(tabla, coor,labels = tabla, pos=4 )

#### Boxplot El gráfico de caja (“box-plot” en inglés) es una forma de presentación estadística destinada, fundamentalmente, a resaltar aspectos de la distribución de las observaciones en una o más series de datos cuantitativos. Reemplaza, en consecuencia, al histograma y a la curva de distribución de frecuencias sobre los que tiene ventajas en cuanto a la información que brinda y a la apreciación global que surge de la lectura. Fue ideado por John Tukey, de la Universidad de Princeton (U.S.A.) en 1977 Cabe destacar que en diferentes textos (y presentaciones del gráfico) se utilizan de manera diferente a las señaladas por su creador algunos elementos de la Boxplo.t

este gráfico utiliza una sola escala: la correspondiente a la variable de los datos que se presentan. Es decir, no utiliza escala de frecuencias. Por lo tanto, no corresponde asociarlo a los que utilizan el sistema de coordenadas cartesianas.

La caja: Es un rectángulo que abarca el recorrido (o rango, o intervalo) intercuartílico (RIC) de la distribución; o sea, el tramo de la escala que va desde el primer cuartil (C1) al tercer cuartil (C3). Esto incluye el 50 % de las observaciones centrales. Mediana: Se dibuja mediante una línea (algunos lo marcan con un asterisco, otros con una cruz) dentro de la caja y a la altura de la escala que corresponde al valor de esa medida. Bigotes: Son líneas que salen a los costados de la caja y que sirven como referencia para ubicar las observaciones que están por fuera del 50 % central de la distribución. (Para determinar su longitud: ver explicación más adelante). Cercados interiores: Indica la finalización de los bigotes. A veces no se dibujan. Cercados exteriores: Ubicados más periféricamente en la distribución. Casi nunca se dibujan. Periféricos (o periféricos próximos): Señalamiento de las observaciones que se encuentran entre el cercado interior y el cercado exterior. Se marcan con un asterístico . (Algunos paquetes informáticos utilizan una “O”). Periféricos lejanos (o periféricos extremos): Señalamiento de las observaciones que se encuentran fuera del cercado exterior. Se marcan con un punto grande . (Algunos paquetes informáticos utilizan una “E” y otros una “X”).

Barplot

Una gráfica de barras tiene barras rectangulares con longitudes proporcionales a los valores que representan. Las gráficas de barras se utilizan para comparar dos o más valores. Las barras pueden ser horizontales o verticales.

En este gráfico, se reflejan los conteos de frecuencia de valores de los distintos niveles de las variables.