TF-IDF(Term Frequency-Inverse Document Frequency),即:词频-逆文件频率。 是一种统计方法,度量一个词对文档的重要性。当某个词在一个文档中出现的频率越高, 而在其它文档集中出现频率越低,则该词越能表征该文档。
浙公网安备 33010602006230号
浙ICP备14015892号