Northriven / StopwordsLinks
常用中文停用词表:包含百度停用词表、哈工大停用词表和四川大学机器智能实验室停用词表。还有整理过的英文停用词表以及其他语言的停用词表
☆165Updated 2 years ago
Alternatives and similar repositories for Stopwords
Users that are interested in Stopwords are comparing it to the libraries listed below
Sorting:
- cntext 是一个专为社会科学实证研究设计的中文文本分析 Python 库。它不仅提供传统的词频统计和情感分析,还支持词嵌入训练、语义投影计算等高级功能,帮助研究者从大规模非结构化文本中测量抽象构念——如态度、认知、文化观念与心理状态。☆423Updated 2 months ago
- ☆246Updated last year
- 中文情感词典汇总(台湾大学NTUSD简体中文情感词典,清华大学李军中文褒贬义词典,知网Hownet情感词典等)☆206Updated 10 months ago
- ☆15Updated last year
- [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集☆661Updated 2 years ago
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆733Updated 2 years ago
- LDA主题模型 | 主题困惑度 | 多文本☆19Updated last year
- 文本挖掘和预处理工具(文本清洗、新词发现、情感分析、实体识别链接、关键词抽取、知识抽取、句法分析等),无监督或弱监督方法☆2,596Updated last year
- 中文文本相似度计算器☆168Updated last year
- 中文情感分析库(Chinese Sentiment))可对文本进行情绪分析、正负情感分析。Text analysis, supporting multiple methods including word count, readability, document simil…☆580Updated 3 years ago
- A Chinese NLP library based on BERT for sentiment analysis and general-purpose Chinese word segmentation. | 基于 BERT 的中文 NLP 库,用于中文情感倾向分析、…☆223Updated 5 months ago
- 情感分析、文本分类、词典、bayes、sentiment analysis、TextCNN、classification、tensorflow、BERT、CNN、text classification☆514Updated 7 months ago
- 中文命名实体识别。包含目前最新的中文命名实体识别论文、中文实体识别相关工具、数据集,以及中文预训练模型、词向量、实体识别综述等。☆758Updated 6 months ago
- 基于Pytorch的Bert应用,包括命名实体识别、情感分析、文本分类以及文本相似度等☆814Updated 4 years ago
- 人民日报爬虫(Python)☆153Updated 6 months ago
- 自然语言处理(NLP)教程,包括:词向量,词法分析,预训练语言模型,文本分类,文本语义匹配,信息抽取,翻译,对话。☆480Updated 3 years ago
- A NLP package for Chinese text:Preprocessing, Tokenization, Chinese Fonts, Word Embeddings, Text Similarity and Sentiment Analysis 轻量级中文自…☆36Updated last year
- Similarities: a toolkit for similarity calculation and semantic search. 相似度计算、匹配搜索工具包,支持亿级数据文搜文、文搜图、图搜图,python3开发,开箱即用。☆892Updated last year
- 大模型相关实践记录☆158Updated 9 months ago
- 大连理工大学情感词汇本体库及其他相关操作☆142Updated 8 years ago
- 在SMP2020的微博情绪分类任务上,微调在中文预料上预训练的BERT模型,进行文本分类。☆119Updated 3 years ago
- 人民日报(1946-2024)、习近平系列重要讲话数据库、古诗文☆80Updated 10 months ago
- a collection of NLP projects&tools. 自然语言处理方向项目和工具集合。☆237Updated last year
- 多标签文本分类,多标签分类,文本分类, multi-label, classifier, text classification, BERT, seq2seq,attention, multi-label-classification☆802Updated last year
- The official repository of the paper: COLD: A Benchmark for Chinese Offensive Language Detection☆309Updated 2 years ago
- Crime assistant including crime type prediction and crime consult service based on nlp methods and crime kg,罪名法务智能项目,内容包括856项罪名知识图谱, 基于28…☆1,550Updated 2 years ago
- xmnlp:提供中文分词, 词性标注, 命名体识别,情感分析,文本纠错,文本转拼音,文本摘要,偏旁部首,句子表征及文本相似度计算等功能☆1,298Updated 3 years ago
- 中文:方便好用的文本分类模型训练加推理全公开!欢迎star后礼貌获取!大体上本项目采用ERINE3.0的base版本将文本转换为语义向量而后做特征进行分类,实测上限极高可以优化后在61分类任务中达到92%准确 率。☆49Updated last year
- pytextclassifier is a toolkit for text classification. 文本分类,LR,Xgboost,TextCNN,FastText,TextRNN,BERT等分类模型实现,开箱即用。☆520Updated last year
- 中文文本分类任务,基于PyTorch实现(TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention, DPCNN, Transformer,Bert,ERNIE),开箱即用!☆403Updated 2 years ago