data.table包

为什么要用data.table包

*data.table的最大特性之一是它简洁的语法,它使探索性分析更快、更容易编写和理解;这种方便可以促使包作者在自己的包中使用data.table。另一个可能更重要的原因是高性能。当将繁重的计算任务从包外包到data.table时,通常不需要自己重新发明任何这些数值优化技巧,就可以获得最高的性能。

*使用data.table比较简单

fread函数快速读取数据

其参数都与read.table系列函数类似 但读取速度更快,智能性更高

require(data.table)
## Loading required package: data.table

read.csv读取时间

system.time(read.csv("ego.csv",header = T))
##    user  system elapsed 
##    0.58    0.00    0.61

fread读取

system.time(fread("ego.csv",header = T))
##    user  system elapsed 
##       0       0       0

通过简单的比较很容易看出fread消耗的时间更短,这样在读取较大的数据时,差异就会更明显