lovejing0306 / Pinyin2HanziPy
训练拼音转汉字模型
☆8Updated 3 years ago
Related projects ⓘ
Alternatives and complementary repositories for Pinyin2HanziPy
- Chinese Grammatical Error Diagnosis☆11Updated 3 years ago
- 有一个通用实体关系事件抽取的任务,需要使用到UIE模框架,而且需要将起部署到昇腾310服务器上,因为UIE模型底层使用的是ernie3.0,但是目前paddle官方还不支持ernie3.0模型在昇腾310上部署,所以才有了以下的操作,主要过程是,先试用paddle训练处模型…☆17Updated 2 years ago
- TensorRT☆11Updated 4 years ago
- 利用BERT预训练模型进行文本生成,可用于对话、摘要、问题生成等任务。 目前支持策略,词表的插入和删除、自定义Character Embedding、随机词替换等☆8Updated 2 years ago
- Large-scale exact string matching tool☆15Updated last week
- 带拼音、字形特征的文本纠错模型☆11Updated last year
- nlp分析工具是一款基于NLP开源算法和模型库(jieba、spacy、paddlenlp)对文本数据进行向量化,然后通过机器学习算法(聚类、主成分分析、图网络GraphicalLasso)对文本数据词向量之间进行关联性分析的小工具。☆14Updated last year
- FinCUGE Instruction dataset☆10Updated last year
- 互联网舆情企业风险事件的识别和预警,将公司名称进行实体提取,对新闻进行舆情分类,比赛地址为:http://ailab.aiwin.org.cn/competitions/48#learn_the_details☆16Updated 3 years ago
- 词、句拼音转汉字、拼音分割、拼音补全、pygame输入中文☆14Updated 4 years ago
- rasa_chinese 的服务 package☆18Updated 3 years ago
- 针对NER领域提供从线下训练到线上部署的一整套闭环流程☆12Updated 3 years ago
- 基于Paddle进行语义检索并部署上线,支持多语言 This code is based on Paddle to do a semantic search, and deploy it. Multilingual support☆11Updated 2 years ago
- ☆13Updated 10 months ago
- Having fun with ML☆11Updated 7 months ago
- 用Paddle复现论文ChineseBERT: Chinese Pretraining Enhanced by Glyph and Pinyin Information(ACL2021)☆9Updated 3 years ago
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型 对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆10Updated 3 years ago
- pytorch版损失函数,改写自科学空间文章,【通过互信息思想来缓解类别不平衡问题】、【将“softmax+交叉熵”推广到多标签分类问题】☆13Updated 3 years ago
- 机器学习训练简单模型判定一个句子是不是疑问句☆16Updated 2 years ago
- 音乐类语料的意图识别填槽以及槽值纠错模型☆16Updated last year
- 别名发现系统☆11Updated 2 years ago
- 企业事件抽取☆14Updated 3 years ago
- Unsupervised tableQA and databaseQA on chinese finance question and tabular data☆12Updated last year
- 一个关于血色衣冠的对话机器人, 基于 Rasa, 可语音与机器人对话☆26Updated 2 years ago
- 这里将paddle中的ocr等模型转为onnx格式,并利用java版深度框架djl加载这些onnx模型进行推理预测尝试。☆13Updated 2 years ago
- huggingface ChineseBert Tokenizer☆15Updated 2 years ago
- 基于seq2edit (Gector) 的中文文本纠错。☆26Updated 2 years ago
- source code of EMNLP2021: A Lightweight Pretrained Model for Chinese Spelling Check☆13Updated 3 years ago
- 中文关键词提取☆12Updated last year