用python采用TF IDF实现从多个文本文档中选出特征词应该怎样实现

日期:2022-03-06 15:07:41 人气:1

用python采用TF IDF实现从多个文本文档中选出特征词应该怎样实现

如果最终就是文本分类的话,对所有词汇得到TF-IDF后,再建立各文本对词汇表的特征向量,用余弦定理判断相似度,然后做一下聚类,从而实现文本分类。
应该从工程角度效果应该不错,吴军博士《数学之美》第14章讲到过,里面把原理也解释了,很符合直觉,虽然没有用到太高深的理论。
    A+
热门评论