Las bases de datos pueden estar estructuradas en 2 formatos:
- Formato Long
- Formato Wide
7 de septiembre de 2020
Las bases de datos pueden estar estructuradas en 2 formatos:
Un reshape es una forma de redimensionar una base de datos, es decir, reestrucutrar y agregar datos de un data frame o data.table.
Un reshape sirve para pasar de un formato “long” a “wide” (dcast) o de un formato “wide” a “long” (melt)
dcast(data,formula,value.var)
data: base de datos
formula: Una fórmula de la forma LHS ~ RHS. Por ejemplo: var1 ~ var2
value.var: nombre de la columna cuyos valores se van a rellenar
Tenemos un objeto “poblacion” en formato long:
Aplicamos la función dcast:
poblacion <- dcast(poblacion, Provincia ~ variable, value.var="value")
Ahora queda el objeto “poblacion” en formato wide:
melt(data,id.vars,value.name)
data: base de datos
id.vars: vector de variables indentificadoras
Tenemos un objeto “poblacion” en formato wide:
Aplicamos la función melt:
poblacion <- melt(poblacion, id.vars="Provincia")
Ahora queda el objeto “poblacion” en formato wide: