laomagic / THUCNewsProjectLinks
THUCNews中文文本分类数据集的处理,该数据集包含84万篇新闻文档,总计14类;在数据集的基础上可以进行文本分类、词向量的训练等任务。
☆23Updated 5 years ago
Alternatives and similar repositories for THUCNewsProject
Users that are interested in THUCNewsProject are comparing it to the libraries listed below
Sorting:
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆104Updated 2 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆68Updated 5 months ago
- Self complemented sentiment words expansion using seed sentiment words and so-pmi , this method is tested to be effective, 基于情感种子词与so-pmi…☆87Updated 7 years ago
- 中文情感分析模型,包含各种主流的情感词典、机器学习、深度学习、预训练模型方法☆110Updated 6 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆93Updated 4 years ago
- 中文微博语料库 情感二分类☆279Updated 5 years ago
- 本项目的数据来自“互联网新闻情感分析”赛题。基于Transformer2.0库中的中文Bert模型,对新闻语料进行三分类。☆119Updated 6 years ago
- 文本热点挖掘,基于DBSCAN聚类模型,对文本的热点事件进行挖掘☆44Updated 5 years ago
- TextClf :基 于Pytorch/Sklearn的文本分类框架,包括逻辑回归、SVM、TextCNN、TextRNN、TextRCNN、DRNN、DPCNN、Bert等多种模型,通过简单配置即可完成数据处理、模型训练、测试等过程。☆245Updated 2 years ago
- 在SMP2020的微博情绪分类任务上,微调在中文预料上预训练的BERT模型,进行文本分类。☆120Updated 3 years ago
- 情感分析、文本分类、词典、bayes、sentiment analysis、TextCNN、classification、tensorflow、BERT、CNN、text classification☆516Updated 8 months ago