问题:
[问答题]如何进行选择排序?
问题:
[问答题]有一个1GB大小的文件,文件里面每一行是一个词,每个词的大小不超过16B,内存大小限制是1MB,要求返回频数最高的100个词。
问题:
[问答题]现有海量日志数据保存在一个超级大的文件中,该文件无法直接读入内存,要求从中提取某天访问BD次数最多的那个IP。
问题:
[问答题]有20个数组,每个数组有500个元素,并且是有序排列好的,现在如何在这20*500个数中找出排名前500的数?
问题:
[问答题]给定a、b两个文件,各存放50亿个url,每个url各占64B,内存限制是4GB,请找出a、b两个文件共同的url。
问题:
[问答题]从5亿个数中找出中位数。数据排序后,位置在最中间的数值就是中位数。当样本数为奇数时,中位数=(N+1)/2;当样本数为偶数时,中位数为N/2与1+N/2的均值(那么10G个数的中位数,就是第SG大的数
问题:
[问答题]有10个文件,每个文件1GB,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求按照query的频度排序。
问题:
[问答题]1、搜索引擎会通过日志文件把用户每次检索使用的所有查询串都记录下来,每个查询串的长度为1~255B。 假设目前有1000万个记录(这些查询串的重复度比较高,
问题:
[问答题]已知某个文件内包含一些电话号码,每个号码为8位数字,统计不同号码的个数。