sharejing / TakinLinks
A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。
☆33Updated 2 years ago
Alternatives and similar repositories for Takin
Users that are interested in Takin are comparing it to the libraries listed below
Sorting:
- ChineseTextualInference project including chinese corpus build and inferecence model, 中文文本推断项目,包括88万文本蕴含中文文本蕴含数据集的翻译与构建,基于深度学习的文本蕴含判定模型构建…☆174Updated 6 years ago
- BERT微调在机器翻译上的应用,哎哟,效果贼好。☆49Updated 4 years ago
- 中文机器阅读理解数据集☆103Updated 4 years ago
- 文本自动摘要☆94Updated 2 years ago
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆207Updated last year
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆115Updated last year
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆155Updated 8 months ago
- 继续预训练中文bert☆31Updated 3 years ago
- Sentence-Transformers Information Retrieval example on Chinese☆29Updated last year
- 各大文本摘要模型-中文文本可运行的解决方案☆68Updated last year
- 中文、分词、词表、核 心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆165Updated 3 years ago
- 基于bert的kbqa系统☆151Updated 3 years ago
- ChatGLM2-6B微调, SFT/LoRA, instruction finetune☆108Updated last year
- LERT: A Linguistically-motivated Pre-trained Language Model(语言学信息增强的预训练模型LERT)☆214Updated this week
- PERT: Pre-training BERT with Permuted Language Model☆363Updated this week
- 一个基于预训练的句向量生成工具☆137Updated 2 years ago
- ☆23Updated 2 years ago
- 中文标注工具,支持NER、文本分类、关系标注、对话标注等。☆78Updated 11 months ago
- Bert预训练模型fine-tune计算文本相似度☆105Updated 2 years ago
- 基于bert进行中文文本纠错☆235Updated 2 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘 要、关键词抽取、研究热点分析、数据挖掘、数据分析☆52Updated 4 months ago
- 京东/淘宝客服对话数据公开,seq2seq生成模型设计对话系统获第二名☆44Updated 2 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated 2 years ago
- 使用torch整合两种经典的指针NER抽取范式,分别是SpanBert和苏神的GlobalPointer,简单加了些tricks,配置后一键运行☆133Updated last year
- 文本智能校对大赛(Chinese Text Correction)的baseline☆67Updated 2 years ago
- 时间抽取、解析、标准化工具☆53Updated 2 years ago
- 本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。☆115Updated 4 years ago
- 维基百科中文语料整理☆296Updated 7 years ago
- benchmark of KgCLUE, with different models and methods☆27Updated 3 years ago
- 基于Pytorch+BERT+CRF的NLP序列标注模型,目前包括分词,词性标注,命名实体识别等☆61Updated 2 years ago