BarryZM / dataProcessorLinks
中英文语料数据清洗及分布式分句分词预处理工作
☆12Updated 5 years ago
Alternatives and similar repositories for dataProcessor
Users that are interested in dataProcessor are comparing it to the libraries listed below
Sorting:
- 基于知识图谱的QA系统,BERT模型☆18Updated 5 years ago
- bert,albert计算中文句子的相似度☆21Updated 5 years ago
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆11Updated 4 years ago
- 基于文本相似度的win10智能客服问答系统☆15Updated 5 years ago
- 文本转拼音、提取英文字段、提取数字、提取中文字符、英文转中文、字符型的数字转中文的数字表示、拼音转文本、文本纠错、基于bert转词向量、基于bert转句向量、繁体字转简体、中文数字转阿拉伯数字☆21Updated 5 years ago
- BERT微调在机器翻译上的应用,哎哟,效果贼好。☆49Updated 4 years ago
- 基于ELMo, tensorflow的中文命名实体标注 Chinese Named Entity Recognition Based on ELMo☆21Updated 5 years ago
- Self complemented Key infomation extraction including keywords, abstract from text using algorithm like textrank ,tfidf 基于Textrank算法的文本摘要…☆54Updated 7 years ago
- 主要是实现nlp常用网络以及结果比较,各模型的优劣势,如:FastText,TextCNN,TextRNN,TextRCNN,BiLSTM,Seq2seq,BERT,Transformer,ELMo以及Attention机制等等。☆45Updated 6 years ago
- 提出基于划分的LDA主题模型 (PLDA)。对传统LDA模型进行改进,考虑中长篇文档篇章结构较为清晰,传统LDA在处理中长篇文档时不能识别每个篇章的主题,提出基于划分的LDA主题模型,对中长篇文档如新闻报道】国务院工作报告等按照段落进行划分,先拆后合,并将其效果与传统LDA…☆40Updated 6 years ago
- NLP 相关的项目 如:词向量,文本分类,文本匹配,NER,信息抽取,文本生成以及NLP在电商中的应用☆36Updated last month
- 分别使用TextRank、BiLSTM和UniLM实现中文文章标题自动生成☆27Updated 4 years ago
- chinesetokenization☆13Updated 12 years ago
- 中英机器文本翻译☆167Updated 6 years ago
- ☆13Updated last year
- ☆82Updated 6 years ago
- 使用fastNLP架构简单利用Bert-Bi-LSTM-CRF实现中文NER☆15Updated 4 years ago
- ☆17Updated 3 years ago
- 使用tensorflow.keras实现《动手学深度学习》☆10Updated 5 years ago
- 本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。☆38Updated last year
- a neural machine translation system from english (chinese) to chinese (english) based on 30m parallel data.☆68Updated 4 years ago
- ☆11Updated 5 years ago
- 英中机器文本翻译☆63Updated 6 years ago
- 2020阿里云天池大数据竞赛-中医药命名实体识别挑战赛☆27Updated 4 years ago
- Dataset from 'Character-based BiLSTM-CRF Incorporating POS and Dictionaries for Chinese Opinion Target Extraction'☆44Updated 6 years ago
- Bert中文文本分类☆40Updated 6 years ago
- ☆35Updated 3 years ago
- 金庸小说人物关系图谱构建☆63Updated 5 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆118Updated 7 years ago
- 使用BERT构建多标签标注模型☆41Updated 5 years ago