dapaozhan / text_proprecessLinks
文本转拼音、提取英文字段、提取数字、提取中文字符、英文转中文、字符型的数字转中文的数字表示、拼音转文本、文本纠错、基于bert转词向量、基于bert转句向量、繁体字转简体、中文数字转阿拉伯数字
☆21Updated 4 years ago
Alternatives and similar repositories for text_proprecess
Users that are interested in text_proprecess are comparing it to the libraries listed below
Sorting:
- 带拼音、字形特征的文本纠错模型☆11Updated 2 years ago
- 使用bert做领域分类、意图识别和槽位填充任务☆76Updated 5 years ago
- 问题等价性判断数据预处理,包含添加对抗样本(同音字、近义词替换等)、获取样本的pattern(用通配符替换相同词汇,提取相同和不同词汇)☆39Updated 5 years ago
- Bert中文文本分类☆40Updated 6 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆47Updated 5 years ago
- 中文关键词提取☆13Updated last year
- 复现了论文《基于主题模型的短文本关键词抽取及扩展》的代码☆30Updated 4 years ago
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆48Updated 3 years ago
- 基于Bert(或Robert)预训练模型微调命名实体识别任务,并提供基于docker的Tensor Serving部署模型方案实现过程。☆36Updated 5 years ago
- 利用bert预训练模型生成句向量或词向量☆27Updated 4 years ago
- 参考NER,基于BERT的电商评论观点挖掘和情感分析☆41Updated 5 years ago
- 基于tensorflow的bilstm+crf的命名实体识别☆13Updated 4 years ago
- 中国中文信息学会社会媒体处 理专业委员会举办的2019届中文人机对话之自然语言理解竞赛☆74Updated 5 years ago
- 本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。☆38Updated last year
- 这是使用pytoch 实现的长文本分类器☆45Updated 5 years ago
- bert,albert计算中文句子的相似度☆21Updated 5 years ago
- pytorch bert 版的 multi_label_text_classification☆11Updated 5 years ago
- bert-flat 简化版 添加了很多注释☆15Updated 3 years ago
- 基于预训练模型的中文关键词抽取方法(论文SIFRank: A New Baseline for Unsupervised Keyphrase Extraction Based on Pre-trained Language Model 的中文版代码)☆12Updated 5 years ago
- bert_avg,bert_whitening,sbert,consert,simcse,esimcse 中文句向量表示☆16Updated 3 years ago
- 2021语言与智能技术竞赛:机器阅读理解任务☆30Updated 4 years ago
- 基于RNN、CNN、XGboost的问答系统意图识别模块☆35Updated 7 years ago
- 手动实现Elasticsearch的倒排索引以及BM25算法☆47Updated 6 years ago
- NLP实验:新词挖掘+预训练模型继续Pre-training☆47Updated last year
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆89Updated 4 years ago
- Multi-Label Text Classification Based On Bert☆22Updated 2 years ago
- 分别使用TextRank、BiLSTM和UniLM实现中文文章标题自动生成☆27Updated 4 years ago
- BERT预训练模型字向量提取工具☆52Updated 5 years ago
- 新闻文本自动摘要, 以Textrank 为基础,融入 标题特征,单句位置特征,重要实体特征,线索词特征,做句子的综合权重计算,并使用MMR算法,兼顾自动摘要的主题相关性和摘要多样性。☆26Updated 3 years ago