wxbool / NLP
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库、中文聊天语料、中文谣言数据、百度中文问答数据集、句子相似度匹配算法集合、bert资源、文本生成&摘要相关工具、cocoNLP信息抽取工具、国内电话号码正则匹配、清华大学XLORE:中英文跨语言百科知识图谱、清华大学人工智能技术…
☆23Updated last year
Alternatives and similar repositories for NLP:
Users that are interested in NLP are comparing it to the libraries listed below
- MiniRBT (中文小型预训练模型系列)☆259Updated last year
- 中文文本分类任务,基于PyTorch实现(TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention, DPCNN, Transformer,Bert,ERNIE),开箱即用!☆367Updated last year
- 使用Pytorch框架对NLP方向上的文本分类、实体识别、三元组抽取做代码实战☆163Updated 8 months ago
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆198Updated 8 months ago
- MuCGEC中文纠错数据集及文本纠错SOTA模型开源;Code & Data for our NAACL 2022 Paper "MuCGEC: a Multi-Reference Multi-Source Evaluation Dataset for Chinese Gr…☆517Updated last year
- 基于PyTorch的BERT中文文本分类模型(BERT Chinese text classification model implemented by PyTorch)☆175Updated 10 months ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated last month
- All NLP you Need Here. 目前包含15个NLP demo的pytorch实现(大量代码借鉴于其他开源项目,原先是自己玩的,后来干脆也开源出来)☆264Updated this week
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆155Updated 2 months ago
- KgCLUE: 大规模中文开源知识图谱问答☆436Updated 2 years ago
- 记录本人整理的一些数据集☆1,021Updated 2 years ago
- 大语言模型微调,Qwen2VL、Qwen2、GLM4指令微调☆283Updated last month
- Revisiting Pre-trained Models for Chinese Natural Language Processing (MacBERT)☆652Updated last year
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆149Updated 3 years ago
- Pytorch-NLU,一个中文文本分类、序列标注工具包,支持中文长文本、短文本的多类、多标签分类任务,支持中文命名实体识别、词性标注、分词、抽取式文本摘要等序列标注任务。 Ptorch NLU, a Chinese text classification and sequ…☆341Updated 6 months ago
- 文本相似度(匹配)计算,提供Baseline、训练、推理、指标分析...代码包含TensorFlow/Pytorch双版本☆173Updated 2 years ago
- 提供一款中文版生成式摘要服务☆335Updated this week
- Collections of resources from Joint Laboratory of HIT and iFLYTEK Research (HFL)☆368Updated last year
- 维基百科中文语料整理☆292Updated 6 years ago
- SimCSE在中文上的复现,有监督+无监督☆272Updated 3 years ago
- 中文命名实体识别。包含目前最新的中文命名实体识别论文、中文实体识别相关工具、数据集,以及中文预训练模型、词向量、实体识别综述等。☆651Updated 3 weeks ago
- 基于pytorch+bert的中文文本分类☆81Updated last year
- 中文自然语言推理与语义相似度数据集☆346Updated 3 years ago
- [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集☆590Updated last year
- PaddleNLP UIE模型的PyTorch版实现☆609Updated last year
- pytextclassifier is a toolkit for text classification. 文本分类,LR,Xgboost,TextCNN,FastText,TextRNN,BERT等分类模型实现,开箱即用。☆499Updated 3 months ago
- An off-the-shelf tool for Chinese Keyphrase Extraction 一个快速从中文里抽取关键短语的工具,仅占35M内存 www.jionlp.com☆543Updated last year
- 基于scrapy的层次优先队列方法爬取中文维基百科,并自动抽取结构和半结构数据☆141Updated last year
- 本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的☆63Updated 4 years ago
- 基于pytorch_bert的中文多标签分类☆87Updated 3 years ago