dapaozhan / text_proprecessLinks
文本转拼音、提取英文字段、提取数字、提取中文字符、英文转中文、字符型的数字转中文的数字表示、拼音转文本、文本纠错、基于bert转词向量、基于bert转句向量、繁体字转简体、中文数字转阿拉伯数字
☆21Updated 5 years ago
Alternatives and similar repositories for text_proprecess
Users that are interested in text_proprecess are comparing it to the libraries listed below
Sorting:
- 带拼音、字形特征的文本纠错模型☆11Updated 2 years ago
- 使用bert做领域分类、意图识别和槽位填充任务☆79Updated 5 years ago
- 基于pytorch的中文拼写纠错,使用的模型是Bert以及SoftMaskedBert☆33Updated 4 years ago
- Pytorch进行长文本分类。这里用到的网络有:FastText、TextCNN、TextRNN、TextRCNN、Transformer☆48Updated 5 years ago
- 中文文本纠错模型,keras实现☆74Updated 4 years ago
- A full-process dialogue system that can be deployed online☆100Updated 3 years ago
- bert语言模型校验句子的通顺性☆15Updated 5 years ago
- 分别使用TextRank、BiLSTM和UniLM实现中文文章标题自动生成☆28Updated 5 years ago
- 简版文本对话/问答系统☆35Updated 5 years ago
- 微调预训练语言模型,解决多标签分类任务(可加载BERT、Roberta、Bert-wwm以及albert等知名开源tf格式的模型)☆141Updated 5 years ago
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆48Updated 5 years ago
- 基于pytorch_bert的中文多标签分类☆92Updated 3 years ago
- 自然语言处理中的基础任务,包含但不限于文本表示,文本分类,命名实体识别,关系抽取,文本生成,文本摘要等,基于tensorflow2或Pytorch,所有代码均经过测试,项目中也包含相关数据。☆151Updated 3 years ago
- 问题等价性判断数据预处理,包含添加对抗样本(同音字、近义词替换等)、获取样本的pattern(用通配符替换相同词汇,提取相同和不同词汇)☆39Updated 5 years ago
- 基于汽车知识图谱的汽车问答多轮对话系统☆40Updated 6 years ago
- Bert预训练模型fine-tune计算文本相似度☆111Updated 2 years ago
- 合同信息抽取☆17Updated 5 years ago
- ☆15Updated 4 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆30Updated 5 years ago
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆49Updated 4 years ago
- albert + lstm + crf实体识别,pytorch实现。识别的主要实体是人名、地名、机构名和时间。albert + lstm + crf (named entity recognition)☆137Updated 3 years ago
- BERT微调在机器翻译上的应用,哎哟,效果贼好。☆49Updated 4 years ago
- bert pytorch模型微调用于的多标签文本分类☆137Updated 6 years ago
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆90Updated 5 years ago
- 参考NER,基于BERT的电商评论观点挖掘和情感分析☆43Updated 6 years ago
- 文本二分类任务,是否文档是否属于政治上的出访类事件,利用BERT提取特征,模型采用简单的DNN。☆61Updated 5 years ago
- 同花顺算法挑战平台:【9-10双月赛】跨领域迁移的文本语义匹配☆11Updated 4 years ago
- 本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。☆39Updated last year
- 使用torch整合两种经典的指针NER抽取范式,分别是SpanBert和苏神的GlobalPointer,简单加了些tricks,配置后一键运行☆134Updated last year
- 中国中文信息学会社会媒体处理专业委员会举办的2019届中文人机对话之自然语言理解竞赛☆76Updated 5 years ago