7 de septiembre de 2020

Estructura de los datos

Las bases de datos pueden estar estructuradas en 2 formatos:

  • Formato Long

  • Formato Wide

¿Qué es un reshape?

Un reshape es una forma de redimensionar una base de datos, es decir, reestrucutrar y agregar datos de un data frame o data.table.

Un reshape sirve para pasar de un formato “long” a “wide” (dcast) o de un formato “wide” a “long” (melt)

Formato long a wide

dcast(data,formula,value.var)

  • data: base de datos

  • formula: Una fórmula de la forma LHS ~ RHS. Por ejemplo: var1 ~ var2

  • value.var: nombre de la columna cuyos valores se van a rellenar

Formato long a wide: Ejemplo

Tenemos un objeto “poblacion” en formato long:

Aplicamos la función dcast:

poblacion <- dcast(poblacion, Provincia ~ variable, value.var="value")

Ahora queda el objeto “poblacion” en formato wide:

Formato wide a long

melt(data,id.vars,value.name)

  • data: base de datos

  • id.vars: vector de variables indentificadoras

Formato wide a long: Ejemplo

Tenemos un objeto “poblacion” en formato wide:

Aplicamos la función melt:

poblacion <- melt(poblacion, id.vars="Provincia")

Ahora queda el objeto “poblacion” en formato wide: