朴实毛巾

文章
5
资源
0
加入时间
2年10月17天

Spark特征提取---TF-IDF

词频(Term Frequency,缩写为TF)在一篇文档中出现次数最多的词是----"的"、"是"、"在"----这一类最常用的词。它们叫做"停用词"(stop words),表示对找到结果毫无帮助、必须过滤掉的词。还有长度小于2大于10的,数字也过滤掉,根据词性过滤,留下有实际意义的词。假设我们把它们都过滤掉了,只考虑剩下的有实际意义的词。这样又会遇到了另一个问题,我们可能

5G下行信道探测之“CSI-RS”

5G下行信道探测之“CSI-RS” 从4G以来,载波的带宽大幅增加,从3G的5M增加到了20M,到了5G,单载波带宽增加到了100M(Sub6G)或者400M(毫米波)。 在这么大的带宽上,无线传输环境瞬息万变,不同频率的衰减和受干扰情况也不同,对这些信息不了解,数据的发送就相当于碰运气,没有预判没有性能保证。那么,在怎么让手机和基站随时掌握上下行的无线信道信息呢?...