dataaug / chatbot_multiround
多轮中文聊天机器人,采用GPT2进行微调,清洗聊天数据110w+,采用语义相似度和文本jaccard相似度过滤回话。
☆22Updated 3 years ago
Related projects ⓘ
Alternatives and complementary repositories for chatbot_multiround
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆10Updated 3 years ago
- 使用GENIUS文本生成模型训练自己的数据集。☆8Updated last year
- 基于simcse的中文句向量生成☆15Updated 2 years ago
- deep training task☆29Updated last year
- 基于pytorch的GlobalPointer进行中文命名实体识别。☆36Updated last year
- implementation SlotGated SLU model for keras☆33Updated 3 years ago
- LORA微调BLOOMZ,参考BELLE☆25Updated last year
- 基于seq2edit (Gector) 的中文文本纠错。☆26Updated 2 years ago
- 使 用bert做领域分类、意图识别和槽位填充任务☆73Updated 4 years ago
- 基于Pytorch的知识蒸馏(中文文本分类)☆16Updated last year
- 带拼音、字形特征的文本纠错模型☆11Updated last year
- ☆100Updated 4 years ago
- intent detection and slot filling 意图识别与槽填充联合模型☆37Updated 2 years ago
- 基于pytorch的百度UIE命名实体识别。☆53Updated last year
- [Unofficial] Predict code for AAAI 2022 paper: Unified Named Entity Recognition as Word-Word Relation Classification☆50Updated 2 years ago
- 基于span分类和负采样的嵌套实体识别☆14Updated last year
- benchmark of KgCLUE, with different models and methods☆26Updated 2 years ago
- bert语言模型校验句子的通顺性☆15Updated 4 years ago
- 基于文本相似度的win10智能客服问 答系统☆14Updated 4 years ago
- rasa 2.0中文nlu系统搭建☆30Updated last year
- 中文文本纠错模型,keras实现☆70Updated 3 years ago
- 基于百度uie的关系抽取☆20Updated 2 years ago
- 基于torch的,支持logits、crf、span、global_pointer四种方法的命名实体识别任务框架☆18Updated 8 months ago
- 时间关键词正则提取以 及标准化☆21Updated 2 years ago
- 基于汽车知识图谱的汽车问答多轮对话系统☆33Updated 5 years ago
- 文本智能校对大赛(Chinese Text Correction)的baseline☆64Updated 2 years ago
- BLOOM 模型的指令微调☆24Updated last year
- 中文标注工具,支持NER、文本分类、关系标注、对话标注等。☆66Updated 3 months ago
- 一个使用tensorflow2.3开发的基于Bert的意图识别的自然语言理解任务Demo☆24Updated 6 months ago
- 同花顺算法挑战平台:【9-10双月赛】跨领域迁移的文本语义匹配☆11Updated 3 years ago