dapaozhan / text_proprecess
文本转拼音、提取英文字段、提取数字、提取中文字符、英文转中文、字符型的数字转中文的数字表示、拼音转文本、文本纠错、基于bert转词向量、基于bert转句向量、繁体字转简体、中文数字转阿拉伯数字
☆21Updated 4 years ago
Alternatives and similar repositories for text_proprecess:
Users that are interested in text_proprecess are comparing it to the libraries listed below
- 带拼音、字形特征的文本纠错模型☆11Updated 2 years ago
- Bert预训练模型fine-tune计算文本相似度☆100Updated last year
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆10Updated 3 years ago
- bert语言模型校验句子的通顺性☆15Updated 4 years ago
- 基于Pytorch的知识蒸馏(中文文本分类)☆15Updated 2 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago
- 2020 “万创杯”中医药天池大数据竞赛——中药说明书实体识别挑战 复盘☆31Updated 3 years ago
- Bert中文文本分类☆40Updated 5 years ago
- 基于pytorch的中文拼写纠错,使用的模型是Bert以及SoftMaskedBert☆31Updated 3 years ago
- 中文文本纠错模型,keras实现☆70Updated 3 years ago
- bert_avg,bert_whitening,sbert,consert,simcse,esimcse 中文句向量表示☆16Updated 2 years ago
- 手动实现Elasticsearch的倒排索引以及BM25算法☆46Updated 6 years ago
- 基于tensorflow的bilstm+crf的命名实体识别☆12Updated 4 years ago
- 使用bert做领域分类、意图识别和槽位填充任务☆75Updated 4 years ago
- pytorch bert 版的 multi_label_text_classification☆10Updated 5 years ago
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆47Updated 5 years ago
- 简版文本对话/问答系统☆34Updated 5 years ago
- 实现基于相似度匹配和检索的问答系统☆18Updated 5 years ago
- NLP实验:新词挖掘+预训练模型继续Pre-training☆47Updated last year
- 基于轻量级的albert实现albert+BiLstm+CRF☆88Updated last year
- 中文关键词提取☆12Updated last year
- 中国中文信息学会社会媒体处理专业委员会举办的2019届中文人机对话之自然语言理解竞赛☆74Updated 4 years ago
- benchmark of KgCLUE, with different models and methods☆27Updated 3 years ago
- 利用ALBERT实现文本二分类,判别是否属于政治上的出访类事件,提升模型训练和预测速度。☆72Updated last year
- 基于意图识别和命名实体识别的多轮对话场景设计☆37Updated 5 years ago
- 多标签文本分类☆29Updated 3 years ago
- 问题等价性判断数据预处理,包含添加对抗样本(同音字、近义词替换等)、获取样本的pattern(用通配符替换相同词汇,提取相同和不同词汇)☆39Updated 5 years ago
- BERT微调在机器翻译上的应用,哎哟,效果贼好。☆47Updated 3 years ago
- 继续预训练中文bert☆30Updated 3 years ago
- bert-flat 简化版 添加了很多注释☆15Updated 3 years ago