whxf / awesome-chinese-nlpLinks
本项目整合了常用中文nlp资源,包括:工具、数据、学习资源和常用模型。
☆34Updated 5 years ago
Alternatives and similar repositories for awesome-chinese-nlp
Users that are interested in awesome-chinese-nlp are comparing it to the libraries listed below
Sorting:
- 中文文本相似度计算器☆158Updated 11 months ago
- pytextclassifier is a toolkit for text classification. 文本分类,LR,Xgboost,TextCNN,FastText,TextRNN,BERT等分类模型实现,开箱即用。☆514Updated 11 months ago
- 维基百科中文语料整理☆299Updated 7 years ago
- Computing similarity of two sentences with google's BERT algorithm。利用Bert计算句子相似度。语义相似度计算。文本相似度计算。☆507Updated 2 years ago
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆208Updated last year
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问 答、问答数据、知识图谱、文本语料。☆169Updated 3 years ago
- 中文文本分类、序列标注工具包(pytorch),支持中文长文本、短文本的多类、多标签分类任务,支持中文命名实体识别、词性标注、分词、抽取式文本摘要等序列标注任务。 Chinese text classification and sequence labeling toolk…☆349Updated last year
- An off-the-shelf tool for Chinese Keyphrase Extraction 一个快速从中文里抽取关键短语的工具,仅占35M内存 www.jionlp.com☆552Updated last year
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆132Updated 3 years ago
- TextClf :基于Pytorch/Sklearn的文本分类框架,包括逻辑回归、SVM、TextCNN、TextRNN、TextRCNN、DRNN、DPCNN、Bert等多种模型,通过简单配置即可完成数据处理、模型训练、测试等过程。☆242Updated 2 years ago
- 文本相似度计算/文本匹配☆307Updated 5 years ago
- A PyTorch implementation of a BiLSTM \ BERT \ Roberta (+ BiLSTM + CRF) model for Chinese Word Segmentation (中文分词) .☆210Updated 3 years ago
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆115Updated last year
- NLP文本增强的两种方式:同义词替换(利用word2vec词表)和回译☆77Updated 4 years ago
- 文本相似度(匹配)计算,提供Baseline、训练、推理、指标分析...代码包含TensorFlow/Pytorch双版本☆179Updated 3 years ago
- Bert预训练模型fine-tune计算文本相似度☆107Updated 2 years ago
- 自然语 言处理工具Macropodus,基于Albert+BiLSTM+CRF深度学习网络架构,中文分词,词性标注,命名实体识别,新词发现,关键词,文本摘要,文本相似度,科学计算器,中文数字阿拉伯数字(罗马数字)转换,中文繁简转换,拼音转换。tookit(tool) of N…☆663Updated 2 years ago
- 提供一款中文版生成式摘要服务☆347Updated 2 weeks ago
- dialogbot, provide search-based dialogue, task-based dialogue and generative dialogue model. 对话机器人,基于问答型对话、任务型对话、聊天型对话等模型实现,支持网络检索问答,领域知识…☆334Updated last year
- PERT: Pre-training BERT with Permuted Language Model☆365Updated last month
- 多标签文本分类,多标签分类,文本分类, multi-label, classifier, text classification, BERT, seq2seq,attention, multi-label-classification☆786Updated 8 months ago
- 各大中文分词性能评测☆158Updated 6 years ago
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆49Updated 3 years ago
- 中文文本摘要(text summarization)工具包, 抽取式中文文本摘要 Extractive text summary of Lead3、keyword、textrank、text teaser、word significance、LDA、LSI、NMF。(gra…☆421Updated last year
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆723Updated last year
- 无监督中文关键词抽取(Keyphrase Extraction),基于统计,基于图【LDA与PageRank(TextRank, TPR, Salience Rank, Single TPR等)】,基于嵌入【SIFRank等】,开箱即用!☆108Updated 3 years ago
- MiniRBT (中文小型预训练模型系列)☆291Updated last month
- 常用的中文停用词表☆78Updated 7 years ago
- Minimal keyword extraction with BERT☆88Updated 3 years ago
- pke_zh, python keyphrase extraction for chinese(zh). 中文关键词或关键句提取工具,实现了KeyBert、PositionRank、TopicRank、TextRank等算法,开箱即用。☆208Updated last year