JiangYanting / CNKI_Chinese_paper_dataset
中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析
☆49Updated last month
Alternatives and similar repositories for CNKI_Chinese_paper_dataset:
Users that are interested in CNKI_Chinese_paper_dataset are comparing it to the libraries listed below
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated 4 months ago
- 各大文本摘要模型-中文文本可运行的解决方案☆69Updated last year
- 法研杯2021类案检索赛道三等奖方案☆50Updated 3 years ago
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆47Updated 3 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆65Updated 4 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆130Updated 3 years ago
- A light NER Tool,NER标注工具,基于Vue & FastAPI,带NER数据增强☆64Updated 4 years ago
- 基于深度学习的FAQ式问答系统☆34Updated 3 years ago
- NLP文本增强的两种方式:同义词替换(利用word2vec词表)和回译☆76Updated 4 years ago
- 基于pytorch的百度UIE命名实体识别。☆57Updated 2 years ago
- bert_avg,bert_whitening,sbert,consert,simcse,esimcse 中文句向量表示☆16Updated 3 years ago
- Python实现中文文本关键词抽取,分别用了TF-IDF、LDA、RNN、LSTM和LR-SGD两类共五种方法,全网最全没有之一。☆33Updated 4 years ago
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆113Updated last year
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago
- deep training task☆29Updated last year
- 文本分类baseline:BERT、半监督学习UDA、对抗学习、数据增强☆102Updated 4 years ago
- 文本相似度(匹配)计算,提供Baseline、训练、推理、指标分析...代码包含TensorFlow/Pytorch双版本☆176Updated 2 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆161Updated 3 years ago
- 新闻文本自动摘要, 以Textrank 为基础,融入 标题特征,单句位置特征,重要实体特征,线索词特征,做句子的综合权重计算,并使用MMR算法,兼顾自动摘要的主题相关性和摘要多样性。☆26Updated 2 years ago
- Bert预训练模型fine-tune计算文本相似度☆104Updated last year
- 基于ChatGPT的情感分析☆50Updated 2 years ago
- RelExt: A Tool for Relation Extraction from Text. 文本实体关系抽取工具。☆50Updated 2 years ago
- SinglepassTextCluster, an TextCluster tools based on Singlepass cluster algorithm that use tfidf vector and doc2vec,which can be used for…☆62Updated 3 years ago
- 利用指针网络进行信息抽取,包含命名实体识别、关系抽取、事件抽取。☆123Updated 2 years ago
- ☆29Updated last year
- 文本热点挖掘,基于DBSCAN聚类模型,对文本的热点事件进行挖掘☆43Updated 4 years ago
- 中文纠错☆92Updated 3 years ago
- 文本 自动摘要☆94Updated last year
- 基于pytorch_bert的中文多标签分类☆89Updated 3 years ago
- 使用bert进行事件抽取。☆44Updated last year