laomagic / THUCNewsProjectLinks
THUCNews中文文本分类数据集的处理,该数据集包含84万篇新闻文档,总计14类;在数据集的基础上可以进行文本分类、词向量的训练等任务。
☆18Updated 5 years ago
Alternatives and similar repositories for THUCNewsProject
Users that are interested in THUCNewsProject are comparing it to the libraries listed below
Sorting:
- 本项目的数据来自“互联网新闻情感分析”赛题。基于Transformer2.0库中的中文Bert模型,对新闻语料进行三分类。☆115Updated 6 years ago
- 文本热点挖掘,基于DBSCAN聚类模型,对文本的热点事件进行挖掘☆45Updated 5 years ago
- TextClf :基于Pytorch/Sklearn的文本分类框架,包括逻辑回归、SVM、TextCNN、TextRNN、TextRCNN、DRNN、DPCNN、Bert等多种模型,通过简单配置即可完成数据处理、模型训练、测试等过程。☆245Updated 2 years ago
- Self complemented sentiment words expansion using seed sentiment words and so-pmi , this method is tested to be effective, 基于情感种子词与so-pmi…☆87Updated 7 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆99Updated 2 years ago
- 基于Transformer的生成式文本摘要☆186Updated 3 years ago
- THUCNews中文文本分类数据集,该数据集包含84万篇新闻文档,总计14类;在该模型的基础上测试多个版本bert分类效果。☆66Updated 4 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆68Updated last month
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆197Updated last year
- ☆82Updated 6 years ago
- 本项目的数据来自“互联网新闻情感分析”赛题。使用Bert-As-Service库中的中文Bert模型进行句向量的提取,加入全连接层后进行三分类。☆29Updated 6 years ago
- 基于TF-IDF和余弦定理计算文本相似度☆36Updated 7 years ago
- 零基础入门NLP - 新闻文本分类 正式赛第一名方案☆236Updated 5 years ago
- 提出基于划分的LDA主题模型 (PLDA)。对传统LDA模型进行改进,考虑中长篇文档篇章结构较为清晰,传统LDA在处理中长篇文档时不能识别每个篇章的主题,提出基于划分的LDA主题模型,对中长篇文档如新闻报道】国务院工作报告等按照段落进行划分,先拆后合,并将其效果与传统LDA…☆41Updated 6 years ago
- Tensorflow2.3的文本分类项目,支持各种分类模型,支持相 关tricks。☆178Updated 10 months ago
- “互联网新闻情感分析”赛题,是CCF大数据与计算智能大赛赛题之一。对新闻情绪进行分类,0代表正面情绪、1代表中性情绪、2代表负面情绪。☆148Updated 6 years ago
- pytorch implementation of multi-label text classification, includes kinds of models and pretrained. Especially for Chinese preprocessing.☆77Updated 5 years ago
- 文本相似度(匹配)计算,提供Baseline、 训练、推理、指标分析...代码包含TensorFlow/Pytorch双版本☆179Updated 3 years ago
- Bert预训练模型fine-tune计算文本相似度☆109Updated 2 years ago
- 基于预训练模型(BERT,BERT-wwm)的文本分类模板,CCF BDCI新闻情感分析A榜4/2735。☆271Updated 5 years ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等☆201Updated 6 years ago
- multi-label,classifier,text classification,多标签文本分类,文本分类,BERT,ALBERT,multi-label-classification☆141Updated 4 years ago
- 新闻文本自动摘要, 以Textrank 为基础,融入 标题特征,单句位置特征,重要实体特征,线索词特征,做句子的综合权重计算,并使用MMR算法,兼顾自动摘要的主题相关性和摘要多样性。☆26Updated 3 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆93Updated 3 years ago
- bert pytorch模型微调用于的多标签文本分类☆137Updated 5 years ago
- smp ewect code☆78Updated 5 years ago
- Self complemented Key infomation extraction including keywords, abstract from text using algorithm like textrank ,tfidf 基于Textrank算法的文本摘要…☆54Updated 7 years ago
- 中文文本情感分类数据集分享 chinese sentiment datasets☆81Updated 4 years ago
- Aspect Based Sentiment Analysis 基于方面的细粒度情感分析☆174Updated 3 years ago
- 复现了论文《基于主题模型的短文本关键词抽取及扩展》的代码☆31Updated 4 years ago