sharejing / TakinLinks
A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。
☆32Updated 2 years ago
Alternatives and similar repositories for Takin
Users that are interested in Takin are comparing it to the libraries listed below
Sorting:
- ChineseTextualInference project including chinese corpus build and inferecence model, 中文文本推断项目,包括88万文本蕴含中文文本蕴含数据集的翻译与构建,基于深度学习的文本蕴含判定模型构建…☆172Updated 6 years ago
- 中文机器阅读理解数据集☆103Updated 4 years ago
- 继续预训练中文bert☆30Updated 3 years ago
- 各大文本摘要模型-中文文本可运行的解决方案☆68Updated last year
- 基于 LoRA 和 P-Tuning v2 的 ChatGLM-6B 高效参数微调☆55Updated 2 years ago
- 基于向量召回的检索式对话系统解决方案,dense retrieval,FAQ……☆33Updated 3 years ago
- LORA微调BLOOMZ,参考BELLE☆25Updated 2 years ago
- 一个基于预训练的句向量生成工具☆137Updated 2 years ago
- 基于SpanBert的中文指代消解,pytorch实现☆98Updated 2 years ago
- 基于bert的kbqa系统☆151Updated 2 years ago
- CLUEWSC2020: WSC Winograd模式挑战中文版,中文指代消解任务☆75Updated 5 years ago
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆89Updated 4 years ago
- Sentence-Transformers Information Retrieval example on Chinese☆29Updated last year
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆113Updated last year
- 大语言模型训练和服务调研☆37Updated last year
- 基于pytorch的百度UIE命名实体识别。☆56Updated 2 years ago
- The Corpus & Code for EMNLP 2022 paper "FCGEC: Fine-Grained Corpus for Chinese Grammatical Error Correction" | FCGEC中文语法纠错语料及STG模型☆117Updated 5 months ago
- ☆23Updated last year
- 中文标注工具,支持NER、文本分类、关系标注、对话标注等。☆76Updated 10 months ago
- 基于seq2edit (Gector) 的中文文本纠错。☆28Updated 2 years ago
- 本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。☆114Updated 4 years ago
- A light NER Tool,NER标注工具,基于Vue & FastAPI,带NER数据增强☆64Updated 5 years ago
- 句子匹配模型,包括无监督的SimCSE、ESimCSE、PromptBERT,和有监督的SBERT、CoSENT。☆99Updated 2 years ago
- 基于PaddleNLP开源的抽取式UIE进行医学命名实体识别(torch实现)☆43Updated 2 years ago
- [Unofficial] Predict code for AAAI 2022 paper: Unified Named Entity Recognition as Word-Word Relation Classification☆53Updated 2 years ago
- RelExt: A Tool for Relation Extraction from Text. 文本实体关系抽取工具。☆50Updated 2 years ago
- 本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。☆38Updated last year
- Code & Data for our Paper "NaSGEC: Multi-Domain Chinese Grammatical Error Correction for Native Speaker Texts" (ACL 2023 Findings)☆89Updated 3 months ago
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆47Updated 3 years ago
- 基于词汇信息融合的中文NER模型☆168Updated 3 years ago