dataaug / chatbot_multiround
多轮中文聊天机器人,采用GPT2进行微调,清洗聊天数据110w+,采用语义相似度和文本jaccard相似度过滤回话。
☆22Updated 3 years ago
Alternatives and similar repositories for chatbot_multiround
Users that are interested in chatbot_multiround are comparing it to the libraries listed below
Sorting:
- 🤖️🐱 一个基于 Rasa 的中文聊天机器人——「锅贴」☆22Updated 3 years ago
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆11Updated 4 years ago
- 带拼音、字形特征的文本纠错模型☆11Updated 2 years ago
- 时间关键词正则提取以及标准化☆21Updated 3 years ago
- 基于sentence-transformers实现文本转向量的机器人☆46Updated 2 years ago
- 中文文本的向量表示方法(Sentence-BERT, CoSENT)的PyTorch简单实现,可以用于文本相似度计算。☆9Updated 3 years ago
- 基于文本相似度的win10智能客服问答系统☆15Updated 5 years ago
- A full-process dialogue system that can be deployed online☆98Updated 2 years ago
- deep training task☆29Updated 2 years ago
- 使用BERT构建多标签标注模型☆41Updated 5 years ago
- 同花顺算法挑战平台:【9-10双月赛】跨领域迁移的文本语义匹配☆11Updated 3 years ago
- Chatbot_CN项目中的Chatbot_rasa模块☆59Updated 4 years ago
- rasa_chinese 的服务 package☆18Updated 3 years ago
- 文本转拼音、提取英文字段、提取数字、提取中文字符、英文转中文、字符型的数字转中文的数字表示、拼音转文本、文本纠错、基于bert转词向量、基于bert转句向量、繁体字转简体、中文数字转阿拉伯数字☆21Updated 4 years ago
- 中文文本纠错模型,keras实现☆74Updated 3 years ago
- 本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。☆38Updated last year
- ☆101Updated 4 years ago
- 合同信息抽取☆17Updated 4 years ago
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆48Updated 5 years ago
- 基于seq2edit (Gector) 的中文文本纠错。☆28Updated 2 years ago
- 基于检索的任务型多轮对话☆77Updated 4 years ago
- ☆23Updated last year
- 任务型对话系统(Task-based Dialogue System)☆65Updated 3 years ago
- rasa 2.0中文nlu系统搭建☆30Updated 2 years ago
- 可部署的相似度模型 deployable similarity model☆17Updated 2 years ago
- benchmark of KgCLUE, with different models and methods☆27Updated 3 years ago
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆89Updated 4 years ago
- BERT微调在机器翻译上的应用,哎哟,效果贼好。☆49Updated 4 years ago
- 基于向量召回的检索式对话系统解决方案,dense retrieval,FAQ……☆33Updated 3 years ago
- bert-flat 简化版 添加了很多注释☆15Updated 3 years ago