BarryZM / dataProcessorLinks
中英文语料数据清洗及分布式分句分词预处理工作
☆12Updated 5 years ago
Alternatives and similar repositories for dataProcessor
Users that are interested in dataProcessor are comparing it to the libraries listed below
Sorting:
- PyTorch-Bert-BiLSTM-ATT-LJP☆16Updated 6 years ago
- 本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。☆38Updated last year
- 分别使用TextRank、BiLSTM和UniLM实现中文文章标题自动生成☆27Updated 4 years ago
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆11Updated 4 years ago
- ☆17Updated 3 years ago
- 基于ELMo, tensorflow的中文命名实体标注 Chinese Named Entity Recognition Based on ELMo☆21Updated 5 years ago
- 系统的介绍如何搭建一个完整的文本分类系统,包括数据预处理、主要方法的原理介绍和实现细节、实验结果与分析、网页Demo的构建以及项目文件的组织方式。项目的原理和处理细节可以查看我的博客专栏:https://blog.csdn.net/sdu_hao/category_9286…☆29Updated 5 years ago
- ☆35Updated 3 years ago
- 提出基于划分的LDA主题模型 (PLDA)。对传统LDA模型进行改进,考虑中长篇文档篇章结构较为清晰,传统LDA在处理中长篇文档时不能识别每个篇章的主题,提出基于划分的LDA主题模型,对中长篇文档如新闻报道】国务院工作报告等按照段落进行划分,先拆后合,并将其效果与传统LDA…☆40Updated 5 years ago
- 使用fastNLP架构简单利用Bert-Bi-LSTM-CRF实现中文NER☆15Updated 4 years ago
- 文言文信息抽取(实体识别+关系抽取)☆9Updated 2 years ago
- 用户画像,知识图谱挖掘☆10Updated 2 years ago
- 这是我2014级本科毕业论文项目,在深交所实习期间完成!☆20Updated 7 years ago
- 实现基于相似度匹配和检索的问答系统☆18Updated 6 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago
- 基于知识图谱的QA系统,BERT模型☆18Updated 5 years ago
- Chinese Word Segmentation Using MM/CRF/Bi-LSTM/Bi-LSTM-CRF/BERT-LSTM, 中文分词,使用 最大词匹配、CRF(CRF++)、Bi-LSTM (+CRF)、BERT-Bi-LSTM☆30Updated 5 years ago
- 基于文本相似度的win10智能客服问答系统☆15Updated 5 years ago
- ☆12Updated 3 years ago
- 本项目使用Keras实现Transformer模型来进行文本分类(中文、英文均支持)。☆11Updated 3 years ago
- ☆13Updated last year
- 基于BERT+Biaffine结构的关系抽取模型☆12Updated 3 years ago
- 基于BERT和指针网络构建实体抽取任务☆14Updated 4 years ago
- 2020语言与智能技术竞赛:事件抽取任务☆27Updated 5 years ago
- solve text generation tasks by the language model GPT2, including papers, code, demo demos, and hands-on tutorials. 使用语言模型GPT2来解决文本生成任务的…☆26Updated 5 years ago
- fasttext 多标签文本分类☆13Updated 5 years ago
- 基于pytorch+bilstm_crf的中文命名实体识别☆15Updated 2 years ago
- 简版文本对话/问答系统☆34Updated 5 years ago
- BERT-BiLSTM-CRF的Keras版实现☆40Updated 6 years ago
- ccks2020的比赛-面向金融领域的篇章级事件主体与要素抽取(一)事件主体抽取☆17Updated 4 years ago