JiangYanting / CNKI_Chinese_paper_datasetLinks
中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析
☆53Updated 9 months ago
Alternatives and similar repositories for CNKI_Chinese_paper_dataset
Users that are interested in CNKI_Chinese_paper_dataset are comparing it to the libraries listed below
Sorting:
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆75Updated last year
- llama信息抽取实战☆101Updated 2 years ago
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆116Updated last year
- RelExt: A Tool for Relation Extraction from Text. 文本实体关系抽取工具。☆51Updated 3 years ago
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆208Updated last year
- 各大文本摘要模型-中文文本可运行的解决方案☆69Updated 2 years ago
- 文本自动摘要☆93Updated 2 years ago
- 文本相似度(匹配)计算,提供Baseline、训练、推理、指标分析...代码包含TensorFlow/Pytorch双版本☆180Updated 3 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆131Updated 4 years ago
- 利用指针网络进行信息抽取,包含命名实体识别、关系抽取、事件抽取。☆127Updated 2 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆170Updated 4 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆30Updated 5 years ago
- LERT: A Linguistically-motivated Pre-trained Language Model(语言学信息增强的预训练模型LERT)☆221Updated 4 months ago
- 基于pytorch_bert的中文多标签分类☆92Updated 4 years ago
- A Multi-Modal Dataset of Chinese Governmental Docunments☆38Updated 5 years ago
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆157Updated last year
- Bert预训练模型fine-tune计算文本相似度☆111Updated 2 years ago
- 基于qlora对baichuan-7B大模型进行指令微调。☆23Updated 2 years ago
- Sentence-Transformers Information Retrieval example on Chinese☆30Updated last year
- 天池比赛作品整理。实现从pdf中提取出姓名、出生年月、性别、电话、最高学历、籍贯、落户市县、政治面貌、毕业院校、工作单位、工作内容、职 务、项目名称、项目责任、学位、毕业时间、工作时间、项目时间共18个字段。☆116Updated last year
- 中文心理问答数据集☆79Updated 5 years ago
- LLM for NER☆80Updated last year
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆68Updated 3 months ago
- 基于pytorch的百度UIE命名实体识别。☆56Updated 2 years ago
- 基于词汇信息融合的中文NER模型☆170Updated 3 years ago
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆49Updated 4 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆16Updated 2 years ago
- pke_zh, python keyphrase extraction for chinese(zh). 中文关键词或关键句提取工具,实现了KeyBert、PositionRank、TopicRank、TextRank等算法,开箱即用。☆212Updated last year
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆224Updated 7 years ago
- deep training task☆30Updated 2 years ago