BarryZM / dataProcessor
中英文语料数据清洗及分布式分句分词预处理工作
☆12Updated 5 years ago
Alternatives and similar repositories for dataProcessor:
Users that are interested in dataProcessor are comparing it to the libraries listed below
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆11Updated 4 years ago
- 基于文本相似度的win10智能客服问答系统☆15Updated 5 years ago
- 基于汽车知识图谱的汽车问答多轮对话系统☆35Updated 5 years ago
- 基于知识图谱的QA系统,BERT模型☆18Updated 5 years ago
- 微博情感分析多分类数据集fastnlpDemo测试☆9Updated 4 years ago
- Rasa框架实现,面向新闻类的任务型对话系统,再基于flask框架web实现对话☆17Updated 6 years ago
- ☆11Updated 5 years ago
- 基于Bert的智能问答系统!☆29Updated 5 years ago
- 多轮对话系统的多意图识别☆29Updated 7 years ago
- 使用fastNLP架构简单利用Bert-Bi-LSTM-CRF实现中文NER☆15Updated 4 years ago
- TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking☆16Updated 4 years ago
- 基于知识图谱的党史可视化平台☆22Updated 6 years ago
- 分别使用TextRank、BiLSTM和UniLM实现中文文章标题自动生成☆27Updated 4 years ago
- 实现基于相似度匹配和检索的问答系统☆18Updated 5 years ago
- 基于百度uie的关系抽取☆20Updated 2 years ago
- 基于ELMo, tensorflow的中文命名实体标注 Chinese Named Entity Recognition Based on ELMo☆21Updated 5 years ago
- benchmark of KgCLUE, with different models and methods☆27Updated 3 years ago
- 采用依存句法分析进行关系抽取☆21Updated 6 years ago
- 本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。☆38Updated last year
- 闲聊机器人☆11Updated 4 years ago
- flyai 医疗QA NLG☆21Updated 5 years ago
- 文言文信息抽取(实体识别+关系抽取)☆9Updated 2 years ago
- bootstrap式知识三元组抽取 开放式实体关系抽取 依靠依存分析确定可能的实体和关系☆23Updated 6 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago
- 用BERT在百度WebQA中文问答数据集上做阅读问答☆65Updated 5 years ago
- bert_avg,bert_whitening,sbert,consert,simcse,esimcse 中文句向量表示☆16Updated 3 years ago
- 将bert模型应用到问答系统中来,一者学习知识图谱的基本操作,二简单搭建问答系统的基本框架,三将词向量、bert模型实践应用☆59Updated 5 years ago
- ☆17Updated 3 years ago
- 系统的介绍如何搭建一个完整的文本分类系统,包括数据预处理、主要方法的原理介绍和实现细节、实验结果与分析、网页Demo的构建以及项目文件的组织方式。项目的原理和处理细节可以查看我的博客专栏:https://blog.csdn.net/sdu_hao/category_9286…☆29Updated 5 years ago
- 基于预训练模型的中文关键词抽取方法(论文SIFRank: A New Baseline for Unsupervised Keyphrase Extraction Based on Pre-trained Language Model 的中文版代码)☆12Updated 4 years ago