laomagic / THUCNewsProject
THUCNews中文文本分类数据集的处理,该数据集包含84万篇新闻文档,总计14类;在数据集的基础上可以进行文本分类、词向量的训练等任务。
☆17Updated 4 years ago
Alternatives and similar repositories for THUCNewsProject:
Users that are interested in THUCNewsProject are comparing it to the libraries listed below
- 根据褒贬种子词,利用SO-PMI构建情感词典☆26Updated 9 years ago
- 文本热点挖掘,基于DBSCAN聚类模型,对文本的热点事件进行挖掘☆43Updated 4 years ago
- Chinese Subjective Dectection based on subjective knowlegebase, 中文主观性计算。基于中文主观性知识库的句子主观性评定方法。☆57Updated last year
- 用gensim训练LDA模型,进行新闻文本主题分析☆77Updated 5 years ago
- Self complemented sentiment words expansion using seed sentiment words and so-pmi , this method is tested to be effective, 基于情感种子词与so-pmi…☆87Updated 7 years ago
- 本项目的数据来自“互联网新闻情感分析”赛题。基于Transformer2.0库中的中文Bert模型,对新闻语料进行三分类。☆110Updated 5 years ago
- 复现了论文《基于主题模型的短文本关键词抽取及扩展》的代码☆30Updated 4 years ago
- 提出基于划分的LDA主题模型 (PLDA)。对传统LDA模型进行改进,考虑中长篇文档篇章结构较为清晰,传统LDA在处理中长篇文档时不能识别每个篇章的主题,提出基于划分的LDA主题模型,对中长篇文档如新闻报道】国务院工作报告等按照段落进行划分,先拆后合,并将其效果与传统LDA…☆39Updated 5 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆93Updated 3 years ago
- 利用bert预训练模型生成句向量或词向量☆27Updated 4 years ago
- NLP 相关的项目 如:词向量,文本分类,文本匹配,NER,信息抽取,文本生成以及NLP在电商中的应用☆34Updated last year
- 本项目的数据来自“互联网新闻情感分析”赛题。使用Bert-As-Service库中的中文Bert模型进行句向量的提取,加入全连接层后进行三分类。☆29Updated 5 years ago
- 领域自适应文本挖掘工具(新词发现、情感分析、实体链接等),基于少量种子词和背景知识☆13Updated 5 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆93Updated last year
- 中文情感分析☆18Updated 9 years ago
- pytorch implementation of multi-label text classification, includes kinds of models and pretrained. Especially for Chinese preprocessing.☆75Updated 5 years ago
- Aspect Based Sentiment Analysis 基于方面的细粒度情感分析☆168Updated 2 years ago
- Use BERT pre-trained model to do sentiment classification☆95Updated 4 years ago
- Bert预训练模型fine-tune计算文本相似度☆104Updated last year
- Self complemented Key infomation extraction including keywords, abstract from text using algorithm like textrank ,tfidf 基于Textrank算法的文本摘要…☆54Updated 7 years ago
- 一个用于中文文本的抽取式摘要工具 a tool for chinese summary extraction☆19Updated 4 years ago
- 参考NER,基于BERT的电商评论观点挖掘和情感分析☆41Updated 5 years ago
- lda模型的python实现☆30Updated 9 years ago
- 疫情期间网民情绪识别比赛分享+top1~3解决方案☆50Updated 4 years ago
- THUCNews中文文本分类数据集,该数据集包含84万篇新闻文档,总计14类;在该模型的基础上测试多个版本bert分类效果。☆60Updated 4 years ago
- 利用python爬虫从日本雅虎网站获取新闻(政治,经济,体育等类别),对新闻文本做相似度计算,训练 新闻分类模型☆20Updated 7 years ago
- 该仓库收集了常用的中文情感词典,仅供学习☆125Updated 9 months ago
- 评论上的情感分析:主题与情感词抽取☆81Updated 4 years ago
- 新闻文本自动摘要, 以Textrank 为基础,融入 标题特征,单句位置特征,重要实体特征,线索词特征,做句子的综合权重计算,并使用MMR算法,兼顾自动摘要的主题相关性和摘要多样性。☆26Updated 2 years ago
- 之江-电商评论观点挖掘的比赛,基于pytorch-transformers版本,暂时只实现了BERT做aspect+opinion+属性分类+情感极性的联合标注,还未加上CRF。☆32Updated 5 years ago