难过墨镜

文章
5
资源
0
加入时间
3年0月9天

给定a、b两个文件,各存放50亿个url,每个url各占用64字节,内存限制是4G,如何找出a、b文件共同的url?...

可以估计每个文件的大小为5G*64=300G,远大于4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。 遍历文件a,对每个url求取hash(url)%1000,然后根据所得值将url分别存储到1000个小文件(设为a0,a1,...a999)当中。这样每个小文件的大小约为300M。遍历文件b,采取和a相同的方法将url分别存储到1000个小文件(b0,b1....b999)中...

TD-SCDMA基础知识总结1

TD-SCDMA基础1:切换整体过程  测量过程-》预同步过程(接力切换)-》判决过程-》执行过程;  1G、2A、3A的measurement control消息在DCCH上传输,即UE进入CELL_DCH状态后的任何时刻,RNC都可以向UE发送measurement control消息;  1G:最佳小区的改变,同频  2A:最佳频率的更新,异频  3A:当前使用的UT

Python进阶(四十)应用matplotlib绘图实战

matplotlib是基于Python语言的开源项目,旨在为Python提供一个数据绘图包。我将在这篇文章中介绍matplotlib API的核心对象,并介绍如何使用这些对象来实现绘图。实际上,matplotlib的对象体系严谨而有趣,为使用者提供了巨大的发挥空间。用户在熟悉了核心对象之后,可以轻易的定制图像。matplotlib的对象体系也是计算机图形学的一个优秀范例。即使你不是Python程序员,你也可以从文中了解一些通用的图形绘制原则。matplotlib使用numpy。