+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

暂无数据

文字级别的文字分类

发布于2021-02-28 17:31     阅读(799)     评论(0)     点赞(4)     收藏(2)


0

1

2

3

4

5

6

7

8

我目前正在一个项目中,在该项目中我有评论,并且评论中的某些单词都带有标签(例如,不同的情感和一个类,这意味着没有情感)。目标是对测试复习的每个单词进行分类。我已经尝试过使用Naive Baise,但是它并不是很有用,因为如果我不得不给文档加标签,那么它们的概率将更多。当我只想标记一个单词时,我就有了概率。标签x本身的概率。因此,没有太多信息。

我也尝试将单词转换为向量,但是TF-IDF例如也是基于文档的,因此不适合单个单词。

对我的想法也可能是我可以为每个单词做一个XY坐标,以便我可以使用它们(以及相关的标签)来训练a SVM但是不幸的是,经过研究,我什么也没找到。也许单词的总数表示为数字(0-x),也表示为y-value所有文本中每个单词的出现频率。


解决方案


暂无回答

0

1

2

3

4

5



所属网站分类: 技术文章 > 问答

作者:黑洞官方问答小能手

链接: https://www.pythonheidong.com/blog/article/864088/15cdca44f92fee416f18/

来源: python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

4 0
收藏该文
已收藏

评论内容:(最多支持255个字符)