并行转换csv文件为libffm格式并行转换csv文件为libffm格式
并行转换csv文件为libffm格式 在使用libffm或者xlearn时,需要数据文件是libffm格式的,而我们一般拿到的数据都是csv格式或类csv格式的,所以需要转换。最简单的做法是把csv一行一行地读入,然后对每个特征进行编码处理,然后拼接成完整的一行,但是这样做是在是太慢了。本文参考这里,提取出最核心的部分,给出一种并行转换libffm文件的方法,然后对并行后节省的时间进行评估。...