两个50亿url文件找出共同的url的个人思考解法
最近听到了一个以前的算法题,题目大概是这样的给A,B两个文件,各存放50亿条URL,每条URL占用64个字节,内存限制为4G,找出A,B中相同的URL。一看题干,算都不用算,肯定一次性内存加载不起来,必须想其他办法看了一下网上主要有这两种解决方案:第一种方法是用布隆过滤器,利用布隆过滤器的特性来获得相同URL,其实我第一次看到这个题目的时候的第一个想法也是布隆过滤器,但这种方法有个...