dapaozhan / text_proprecess
文本转拼音、提取英文字段、提取数字、提取中文字符、英文转中文、字符型的数字转中文的数字表示、拼音转文本、文本纠错、基于bert转词向量、基于bert转句向量、繁体字转简体、中文数字转阿拉伯数字
☆21Updated 4 years ago
Alternatives and similar repositories for text_proprecess:
Users that are interested in text_proprecess are comparing it to the libraries listed below
- 带拼音、字形特征的文本纠错模型☆11Updated 2 years ago
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆48Updated 5 years ago
- Bert预训练模型fine-tune计算文本相似度☆102Updated last year
- 简版文本对话/问答系统☆34Updated 5 years ago
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆11Updated 4 years ago
- Cascade bert+word vec and one layer FLAT, trained by adversarial FGM and Stochastic Weight Averaging☆23Updated 3 years ago
- 分别使用TextRank、BiLSTM和UniLM实现中文文章标题自动生成☆27Updated 4 years ago
- 基于tensorflow的bilstm+crf的命名实体识别☆12Updated 4 years ago
- bert-flat 简化版 添加了很多注释☆15Updated 3 years ago
- 利用bert预训练模型生成句向量或词向量☆27Updated 4 years ago
- 利用 HMM、BiLSTM-CRF 及 ALBERT 模型进行中文命名实体识别☆23Updated 2 years ago
- 实现基于相似度匹配和检索的问答系统☆18Updated 5 years ago
- Bert中文文本分类☆41Updated 5 years ago
- LSTM,TextCNN,fastText情感分析,模型用 tf_serving 和 flask 部署成web应用☆42Updated 5 years ago
- 基于结构化信息(特征)的中文命名实体识别系统☆10Updated 4 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago
- 中文文本纠错模型,keras实现☆73Updated 3 years ago
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆89Updated 4 years ago
- BERT微调在机器翻译上的应用,哎哟,效果贼好。☆48Updated 4 years ago
- 手动实现Elasticsearch的倒排索引以及BM25算法☆46Updated 6 years ago
- bert语言模型校验句子的通顺性☆15Updated 4 years ago
- 将bert模型应用到问答系统中来,一者学习知识图谱的基本操作,二简单搭建问答系统的基本框架,三将词向量、bert模型实践应用☆59Updated 5 years ago
- 开天-新词,中文新词发现工具,Chinese New Word Discovery Tool☆20Updated 5 years ago
- 继续预训练中文bert☆30Updated 3 years ago
- 使用bert做领域分类、意图识别和槽位填充任务☆75Updated 4 years ago
- bert_avg,bert_whitening,sbert,consert,simcse,esimcse 中文句向量表示☆16Updated 2 years ago
- 本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。☆38Updated 11 months ago
- 基于轻量级的albert实现albert+BiLstm+CRF☆88Updated last year
- intent detection and slot filling 意图识别与槽填充联合模型☆38Updated 2 years ago
- 基于seq2edit (Gector) 的中文文本纠错。☆28Updated 2 years ago