dapaozhan / text_proprecess
文本转拼音、提取英文字段、提取数字、提取中文字符、英文转中文、字符型的数字转中文的数字表示、拼音转文本、文本纠错、基于bert转词向量、基于bert转句向量、繁体字转简体、中文数字转阿拉伯数字
☆21Updated 4 years ago
Related projects ⓘ
Alternatives and complementary repositories for text_proprecess
- 带拼音、字形特征的文本纠错模型☆11Updated last year
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response, 使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆10Updated 3 years ago
- 中文文本纠错模型,keras实现☆70Updated 3 years ago
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆48Updated 4 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆28Updated 4 years ago
- 中国中文信息学会社会媒体处理专业委员会举办的2019届中文人机对话之自然语言理解竞赛☆74Updated 4 years ago
- Bert预训练模型fine-tune计算文本相似度☆98Updated last year
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆90Updated 4 years ago
- 简版文本对话/问答系统☆32Updated 4 years ago
- BERT预训练模型字向量提取工具☆52Updated 4 years ago
- 问题等价性判断数据预处理,包含添加对抗样本(同音字、近义词替换等)、获取样本的pattern(用通配符替换相同词汇,提取相同和不同词汇)☆39Updated 4 years ago
- NLP实验:新词挖掘+预训练模型继续Pre-training☆47Updated last year
- 基于Pytorch的文本分类框架,支持TextCNN、Bert、Electra等。☆58Updated last year
- bert_avg,bert_whitening,sbert,consert,simcse,esimcse 中文句向量表示☆16Updated 2 years ago
- 一个用于中文文本的抽取式摘要工具 a tool for chinese summary extraction☆19Updated 3 years ago
- benchmark of KgCLUE, with different models and methods☆26Updated 2 years ago
- ☆15Updated 3 years ago
- 这是使用pytoch 实现的长文本分类器☆45Updated 5 years ago
- 使用bert做领域分类、意图识别和槽位填充任务☆73Updated 4 years ago
- 参考NER,基于BERT的电商评论观点挖掘和情感分析☆41Updated 5 years ago
- 基于pytorch的中文拼写纠错,使用的模型是Bert以及SoftMaskedBert☆31Updated 3 years ago
- 多标签文本分类☆28Updated 3 years ago
- finetune chinese bert with sentence-transformers☆10Updated 3 years ago
- 基于汽车知识图谱的汽车问答多轮对话系统☆33Updated 5 years ago
- 2020 “万创杯”中医药天池大数据竞赛——中药说明书实体识别挑战 复盘☆30Updated 3 years ago
- ☆51Updated 4 years ago
- multi-label,classifier,text classification,多标签文本分类,文本分类,BERT,ALBERT,multi-label-classification☆27Updated 3 years ago
- 本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。☆35Updated 7 months ago