Antecedentes.

JSON, que significa “JavaScript Object Notation”, es una formatación usada para estructurar datos en forma de texto y transmitirlos de un sistema a otro, como en aplicaciones cliente-servidor o en aplicaciones móviles.

En la práctica, .json es un archivo que contiene una serie de datos estructurados en formato de texto y se usa para transferir información entre sistemas. Es importante decir que, a pesar de su origen estar en el lenguaje JavaScript, JSON no es un lenguaje de programación.

JSON es una notación para la transferencia de datos que sigue un estándar específico. Por eso, puede emplearse en diferentes lenguajes de programación y de sistemas.

Los datos contenidos en un archivo en formato JSON deben estructurarse por medio de una colección de pares con nombre y valor o deben ser una lista ordenada de valores. Sus elementos tienen que contener:

•   Clave: corresponde al identificador del contenido. Por eso, debe ser una string delimitada por comillas.
•   Valor: representa el contenido correspondiente y puede contener los siguientes tipos de datos: string, array, object, number, boolean o null.

En el presente reporte, se realiza un análisis de un archivo en formato JSON sobre un repositorio de una tienda de ropa. Se pretenden realizar varios tipos de gráficos con los cuales pueda interpretarse de la mejor manera la información.

Instrucciones.

A continuación, se presentan las instrucciones dadas para la realización de la actividad.

•   Leer datos en formato JSON a través de R.
•   Interpretar la información del dataset.
•   Filtrar y limpiar datos proporcionados.
•   Realizar al menos dos graficas interactivas utilizando la librería Plotly.
•   Redactar la interpretación de datos, así como la explicación de las gráficas.
•   Generar una publicación en Rpubs y compartir el link.

Analisis previo.

Al abrir el archivo JSON con ayuda de un visualizador de cadenas de texto, podemos apreciar que sus valores principales son relacionados con las ventas de una tienda de ropa. La información esta estructurada por medio de matrices que contienen registros con diferentes campos como lo son:

•   ID.
•   Nombre.
•   Correo.
•   Teléfono.
•   Numero de Orden.
•   Piezas.
•   Talla.
•   Color.
•   Total de la venta.

Paso 1: Cargar nuestros datos.

## Warning: package 'plotly' was built under R version 4.1.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.1.3
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
## List of 9
##  $ ID      : chr [1:1000] "9975399231" "6687373552" "4818857254" "4941313364" ...
##  $ Nombre  : chr [1:1000] "Mord" "Joly" "Cornelia" "Hermione" ...
##  $ Correo  : chr [1:1000] "btimmens0@unc.edu" "rattrie0@networksolutions.com" "abrawn0@flavors.me" "rsoffe0@census.gov" ...
##  $ Telefono: chr [1:1000] "(160) 5368797" "(342) 1357366" "(275) 9686147" "(573) 2352919" ...
##  $ No_Orden: num [1:1000] 3855 267 234 8861 6740 ...
##  $ Piezas  : num [1:1000] 12 6 4 11 1 2 3 11 6 3 ...
##  $ Talla   : chr [1:1000] "L" "2XL" "3XL" "XL" ...
##  $ Color   : chr [1:1000] "Purple" "Yellow" "Goldenrod" "Violet" ...
##  $ Total   : chr [1:1000] "$147.98" "$27.26" "$12.80" "$129.82" ...

Interpretacion.

Como primer paso debemos de importar las librerías que vamos a utilizar en este caso son tres:

•   Rjson: Nos ayuda a establecer una conexión para la correcta lectura de los datos que contiene nuestro documento.
•   Plotly: Es usada para la realización de las gráficas interactivas que harán más digeribles nuestros datos.
•   Ggplot2: Ayudara con la construcción de graficas no interactivas, pero de estructuración rápida que proporciona información útil.
Posteriormente, utilizamos el comando “str ()” para obtener una descripción mas general de la información que esta almacenada en nuestro archivo. Podemos ver que contiene nueve matrices con información referente a 1000 registros, inclusive se aprecia el tipo de dato que maneja en cada atributo de la información.

Paso 2: Transformación del archivo a un marco de trabajo.

##       ID               Nombre             Correo            Telefono        
##  Length:1000        Length:1000        Length:1000        Length:1000       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##     No_Orden        Piezas          Talla              Color          
##  Min.   :   1   Min.   : 1.000   Length:1000        Length:1000       
##  1st Qu.:2581   1st Qu.: 3.000   Class :character   Class :character  
##  Median :5018   Median : 6.000   Mode  :character   Mode  :character  
##  Mean   :5076   Mean   : 6.302                                        
##  3rd Qu.:7625   3rd Qu.: 9.000                                        
##  Max.   :9997   Max.   :12.000                                        
##     Total          
##  Length:1000       
##  Class :character  
##  Mode  :character  
##                    
##                    
## 

Interpretacion.

Para poder trabajar con nuestro archivo debemos de realizar una transformación a un marco de trabajo (DF) ya que de esta manera será mas sencillo manipular sus registros y construir con sus datos graficas que nos ayuden a establecer interpretaciones. 
    

Paso 3: Grafica 1 (Tallas más solicitadas).

Interpretacion.

Al construir el primer grafico se puede observar las tendencias de los clientes al solicitar una talla en específico, por ejemplo, la talla mas solicitada es la 3XL y la menos solicitada es la 2XL.

Paso 4: Grafico 2 (Color más popular).

Interpretacion.

En dado caso si deseamos saber cual es el color mas popular entre los pedidos de la tienda de ropa usaremos la grafica anterior. Se puede visualizar que los tres colores más persistentes son el azul, el verde y el amarillo.

Paso 5: Graficas 3, 4 y 5 (Talla más solicitada en relación con el color del pedido).

Interpretacion.

En las graficas ateriores se presenta exactamente la misma información de las dos primeras graficas que se contruyeron, únicamente variando que se puede apreciar la información al mismo tiempo y de una forma mas atractiva para la vista.

Paso 6: Grafica 6 (Tendencia a encargar cierto número de piezas).

Interpretacion.

Usando una gráfica de cajas podemos ver la información resumida respecto al número de piezas mínimo y máximo. junto con su respectiva mediana.

Paso 7: Grafica 7 (Información referente a las ordenes totales atendidas por la tienda).

Interpretacion.

Si queremos conocer cuantas ordenes ha tenido la tienda de ropa hasta el momento, se puede recurrir al siguiente grafico que contiene entre otras cosas, el número máximo de ordenes en el archivo JSON hasta el momento.

Anexos.

Interpretacion.

En estas tres graficas, se presentan otra forma de visualizar la información presentada con anterioridad únicamente cambiando el tipo de grafo utilizado.

Conclusión.

Una vez analizada la información podemos descubrir varias cosas respecto a nuestro repositorio, por ejemplo, se trata de una tienda de ropa lo suficientemente grande para atender grandes cantidades de pedidos al mismo tiempo, además de que su distribución se hace totalmente virtual debido a que solicitan solo un correo electrónico de referencia.

Realizar esta actividad me ayudo a practicar la construcción de gráficos dentro del entorno de R, es sorprendente el nivel de calidad de unas simples líneas de código, pienso que es uno de los lenguajes más útiles que pude aprender y que será de mucho apoyo en el entorno laboral.

Creo que uno de los aspectos que mas se me complicaban fue el echo de que no sabia como se manipulaba la información de este tipo de archivo, pero ahora me doy cuenta de que no es nada del otro mundo.