endNone / stopwords
中英文停用词表(3076,包含部分特殊符号)
☆18Updated 4 months ago
Alternatives and similar repositories for stopwords:
Users that are interested in stopwords are comparing it to the libraries listed below
- text analysis, supporting multiple methods including word count, readability, document similarity, sentiment analysis, Word2Vec/GloVe, an…☆341Updated last week
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆94Updated 3 years ago
- A Chinese NLP library based on BERT for sentiment analysis and general-purpose Chinese word segmentation. | 基于 BERT 的中文 NLP 库,用于中文情感倾向分析、…☆204Updated 11 months ago
- 常用中文停用词表:包含百度停用词表、哈工大停用词表和四川大学机器智能实验室停用词表。还有整理过的英文停用词表以及其他语言的停用词表☆129Updated 2 years ago
- 人民日报爬虫(Python)☆116Updated 2 months ago
- A NLP package for Chinese text:Preprocessing, Tokenization, Chinese Fonts, Word Embeddings, Text Similarity and Sentiment Analysis 轻量级中文自…☆26Updated 6 months ago
- 一个比较全面的文本挖掘过程。包含了利用机器学习和文本挖掘技术完成情感分析模型搭建;利用情感极性判断与程度计算来判断情感倾向;利用词频和TF-IDF挖掘出正负文本中的关键点情况;利用文本挖掘相关算法找到平台中用户讨论的集中点。☆34Updated 2 weeks ago
- ☆172Updated 10 months ago
- LDA主题模型 | 主题困惑度 | 多文本☆17Updated 3 months ago
- 大模型相关实践记录☆147Updated last month
- 中文情感词典汇总(台湾大学NTUSD简体中文情感词典,清华大学李军中文褒贬义词典,知网Hownet情感词典等)☆171Updated last month
- BERTopic 中文使用範例☆21Updated last year
- 中文微博语料库 情感二分类☆272Updated 4 years ago
- 知网 爬虫,作者、摘要、题目、发表期刊等主要内容的获取☆24Updated 2 months ago
- Python 百度指数爬虫及其 Web GUI☆30Updated 6 months ago
- 情感分析、文本分类、词典、bayes、sentiment analysis、TextCNN、classification、tensorflow、BERT、CNN、text classification☆463Updated last year
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆137Updated last week
- bilibili弹幕分析,包含爬虫、词云分析、词频分析、情感分析、构建衍生指标,可视化☆166Updated 2 years ago
- 本项目是一个微博爬虫项目,旨在通过微博的mid获取到其对应的所有点赞、转发、评论与二级评论的相关数据。☆53Updated 2 years ago
- 该仓库收集了常用的中文情感词典,仅供学习☆126Updated 9 months ago
- 中文文本分析库,可对文本进行词频统计、词典扩充、情绪分析、相似度、可读性等☆55Updated 3 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆93Updated last year
- 情感分类实战,基于数据集 weibo_senti_100k☆12Updated 4 years ago
- 对豆瓣影评进行文本分类情感分析,利用爬虫豆瓣爬取评论,进行数据清洗,分词,采用BERT、CNN、LSTM等模型进行训练,采用tensorboardX可视化训练过程,自然语言处理项目\A project for text classification, based on to…☆150Updated 2 years ago
- 人民日报(1946-2024)、习近平系列重要讲话数据库、古诗文☆58Updated last month
- [数据+代码] 经典的中文情感词典、情感分析停用词、程度副词、否定词表+中文金融情感词典(包括上市公司文本_正式和股吧社媒文本_非正式)...☆134Updated 2 years ago
- B站视频评论爬虫 Bilibili完整爬取评论数据,包括一级评论、二级评论、昵称、用户ID、发布时间、点赞数☆373Updated last year
- 适用于中文分词的经济金融词 典☆80Updated 4 years ago
- 该资源为调用大连理工情感词典实现的情感分析和情绪分类,并与SnowNLP进行对比。基础性文章,希望对您有所帮助~☆100Updated 4 years ago
- A Chinese financial sentiment word dictionary☆165Updated 3 years ago