问题:
A假设词的重要性随着它在文档中出现的次数成正比
B假设词的重要性随着它在语料库中出现的频率成反比下降
C假设词的重要性和它所在文档的长度成反比
D逆文档频率的基本思想是如果一个词在语料库中出现的频率越高,则该词越普遍,对应的重要性/区分度越低
[多选题]以下关于TF-IDF模型,正确的有()
答案解析:
您可能感兴趣的问题
- 表达式3 > 5 and math.sin(0)的值为0。
- 已知x.shape的值为(3, 5),那么语句x[:, 3] = 2的作用是把数组x所有行中列下标为3的元素值都改为2。
- 5.世界银行工程造价的构成与我国现阶段工程造价的构成有哪些不同?
- 6.已知用塔式起重机吊运混凝土。测定塔节需时50s,运行需时80s,卸料需时40s,返回需时30s,中断40s。每次装运混凝土0.5m3,机械利用系数0.85。求塔式起重机的产量定额和时间定额。
- 14.某开发公司造价工程师针对设计院提出的某商住楼的A,B,C3个设计方案,进行了技术经济分析和专家调查,得到表5.8所示数据。 问题:①计算各方案成本系数、功能系数和价值系数,计算结果保留小数点后
- 2.什么是工程预算?工程预算在工程造价管理过程中有何作用?
- 7.试述实物量法和单价法的异同点及其优缺点。
- 9.工程结算方式有哪几种?若某工程预计工期4个月,合同价款为90万元,该如何确定合理的工程结算方式?
- 12.某土建工程按月结算,结算款总额为750万元,主要材料和结构构件金额占工程费用的60%,预付款占工程价款的20%,则预付款回扣点为多少?
- 14.某工程由于设计不当,竣工后建筑物出现不均匀沉降现象,保修费用应由谁承担?为什么?