dapaozhan / text_proprecessLinks
文本转拼音、提取英文字段、提取数字、提取中文字符、英文转中文、字符型的数字转中文的数字表示、拼音转文本、文本纠错、基于bert转词向量、基于bert转句向量、繁体字转简体、中文数字转阿拉伯数字
☆21Updated 5 years ago
Alternatives and similar repositories for text_proprecess
Users that are interested in text_proprecess are comparing it to the libraries listed below
Sorting:
- 带拼音、字形特征的文本纠错模型☆11Updated 2 years ago
- 中文文本纠错模型,keras实现☆74Updated 4 years ago
- 本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。☆38Updated last year
- Bert中文文本分类☆40Updated 6 years ago
- 简版文本对话/问答系统☆34Updated 5 years ago
- 使用bert做领域分类、意图识别和槽位填充任务☆76Updated 5 years ago
- 合同信息抽取☆17Updated 4 years ago
- 基于轻量级的albert实现albert+BiLstm+CRF☆89Updated 2 years ago
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆47Updated 5 years ago
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆11Updated 4 years ago
- NLP 相关的项目 如:词向量,文本分类,文本匹配,NER,信息抽取,文本生成以及NLP在电商中的应用☆36Updated last month
- 基于mlm方式的带有纠错功能的拼音转汉字bert预训练模型,pinyin correcter,基于pytorch框架实现☆45Updated 4 years ago
- Bert预训练模型fine-tune计算文本相似度☆105Updated 2 years ago
- 基于bert的中文自然语言处理工具,包括情感分析、中文分词、 词性标注、以及命名实体识别功能,并提供文本分类任务、序列标注任务、句对关系判断任务的训练与预测接口☆132Updated 6 years ago
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆89Updated 4 years ago
- BERT预训练模型字向量提取工具☆52Updated 5 years ago
- 汉字字符特征提取工具,可以提取出字符中的字音(声母、韵母、声调)、字形(偏旁、部首)、四角编码等特征,同时可作为tensor输入到模型☆137Updated 5 years ago
- 对苏神的bert4keras的实现原理和矩阵运算进行详细的注释,方便学习;bert4keras链接:https://github.com/bojone/bert4keras☆41Updated 4 years ago
- soft_mask_bert model for Chinese Spelling Correction in keras☆21Updated 4 years ago
- 微调预训练语言模型,解决多标签分类任务(可加载BERT、Roberta、Bert-wwm以及albert等知名开源tf格式的模型)☆140Updated 4 years ago
- BERT微调在机器翻译上的应用,哎哟,效果贼好。☆49Updated 4 years ago
- 闲聊机器人☆11Updated 4 years ago
- bert语言模型校验句子的通顺性☆15Updated 4 years ago
- bert-flat 简化版 添加了很多注释☆15Updated 3 years ago
- 实现基于相似度匹配和检索的问答系统☆18Updated 6 years ago
- 基于 TensorFlow & PaddlePaddle 的通用序列标注算法库(目前包含 BiLSTM+CRF, Stacked-BiLSTM+CRF 和 IDCNN+CRF,更多算法正在持续添加中)实现中文分词(Tokenizer / segmentation)、词性标注…☆84Updated 2 years ago
- 这是使用pytoch 实现的长文本分类器☆45Updated 5 years ago
- A full-process dialogue system that can be deployed online☆98Updated 3 years ago
- 手动实现Elasticsearch的倒排索引以及BM25算法☆47Updated 6 years ago
- 开天-新词,中文新词发现工具,Chinese New Word Discovery Tool☆21Updated 5 years ago