dapaozhan / text_proprecessLinks
文本转拼音、提取英文字段、提取数字、提取中文字符、英文转中文、字符型的数字转中文的数字表示、拼音转文本、文本纠错、基于bert转词向量、基于bert转句向量、繁体字转简体、中文数字转阿拉伯数字
☆21Updated 5 years ago
Alternatives and similar repositories for text_proprecess
Users that are interested in text_proprecess are comparing it to the libraries listed below
Sorting:
- 带拼音、字形特征的文本纠错模型☆11Updated 2 years ago
- 简版文本对话/问答系统☆35Updated 5 years ago
- 使用bert做领域分类、意图识别和槽位填充任务☆77Updated 5 years ago
- bert语言模型校验句子的通顺性☆15Updated 5 years ago
- Bert预训练模型fine-tune计算文本相似度☆109Updated 2 years ago
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆48Updated 5 years ago
- 微调预训练语言模型,解决多标签分类任务(可加载BERT、Roberta、Bert-wwm以及albert等知名开源tf格式的模型)☆141Updated 5 years ago
- 中文文本纠错模型,keras实现☆74Updated 4 years ago
- 同花顺算法挑战平台:【9-10双月赛】跨领域迁移的文本语义匹配☆11Updated 3 years ago
- 2020 “万创杯”中医药天池大数据竞赛——中药说明书实体识别挑战 复盘☆31Updated 4 years ago
- 通过Bert结合BiLSTM-CRF进行序列标注任务☆15Updated 6 years ago
- 基于汽车知识图谱的汽车问答多轮对话系统☆38Updated 5 years ago
- A full-process dialogue system that can be deployed online☆100Updated 3 years ago
- Pytorch进行长文本分类。这里用到的网络有:FastText、TextCNN、TextRNN、TextRCNN、Transformer☆48Updated 5 years ago
- 本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。☆39Updated last year
- 基于tensorflow的bilstm+crf的命名实体识别☆13Updated 4 years ago
- ☆15Updated 4 years ago
- Cascade bert+word vec and one layer FLAT, trained by adversarial FGM and Stochastic Weight Averaging☆23Updated 3 years ago
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆50Updated 4 years ago
- 基于bert_mrc的中文命名实体识别☆43Updated 3 years ago
- BERT微调在机器翻译上的应用,哎哟,效果贼好。☆50Updated 4 years ago
- 基于pytorch的中文拼写纠错,使用的模型是Bert以及SoftMaskedBert☆33Updated 3 years ago
- bert-flat 简化版 添加了很多注释☆15Updated 3 years ago
- 中文文本情感分类数据集分享 chinese sentiment datasets☆81Updated 4 years ago
- 自然语言处理中的基础任务,包含但不限于文本表示,文本分类,命名实体识别,关系抽取,文本生成,文本摘要等,基于tensorflow2或Pytorch,所有代码均经过测试,项目中也包含相关数据。☆151Updated 2 years ago
- 通用kbqa,训练数据来源于ccks2018和2019,图谱数据爬取于百度百科☆24Updated 5 years ago
- bert_avg,bert_whitening,sbert,consert,simcse,esimcse 中文句向量表示☆16Updated 3 years ago
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆90Updated 5 years ago
- WordMultiSenseDisambiguation, chinese multi-wordsense disambiguation based on online bake knowledge base and semantic embedding similarit…☆130Updated 6 years ago
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆11Updated 4 years ago