问题:
[问答题]1、搜索引擎会通过日志文件把用户每次检索使用的所有查询串都记录下来,每个查询串的长度为1~255B。 假设目前有1000万个记录(这些查询串的重复度比较高,虽然总数是1000万,但如果除去重复后,那么不超过300万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门),请统计最热门的10个查询串,要求使用的内存不能超过1GB。
Tags:Python程序员面试真题解析
答案解析:
您可能感兴趣的问题
- 有10个文件,每个文件1GB,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求按照query的频度排序。
- 已知随机数生成函数rand7()能产生的随机数是整数1~7的均匀分布,如何构造rand10()函数, 使其产生的随机数是整数1~10的均匀分布。
- 3. 下列关于Java语言基础知识的描述中,正确的是______。
- 6. Java语言是从______语言改进重新设计。
- 下面程序是否存在问题?如果存在,请指出问题所在,如果不存在,说明输出结果。
- 8. 在Java语言中,下面可以用作正确的变量名称的是______。
- 10. 下面关键字中,可以用来修饰接口中的变量的是______。
- 6. 以下是合理的标识符的有______。
- 11. Java语言中字符使用Unicode编码,每个Unicode码占用______比特位。
- 编写一个方法,求一个字符串的字符长度。