endNone / stopwordsLinks
中英文停用词表(3076,包含部分特殊符号)
☆19Updated 5 months ago
Alternatives and similar repositories for stopwords
Users that are interested in stopwords are comparing it to the libraries listed below
Sorting:
- text analysis, supporting multiple methods including word count, readability, document similarity, sentiment analysis, Word2Vec/GloVe, an…☆352Updated last month
- 情感分析、文本分类、词典、bayes、sentiment analysis、TextCNN、classification、tensorflow、BERT、CNN、text classification☆469Updated last year
- A Chinese NLP library based on BERT for sentiment analysis and general-purpose Chinese word segmentation. | 基于 BERT 的中文 NLP 库,用于中文情感倾向分析、…☆206Updated last year
- ☆178Updated 11 months ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆94Updated 3 years ago
- 一个比较全面的文本挖掘过程。包含了利用机器学习和文本挖掘技术完成情感分析模型搭建;利用情感极性判断与程度计算来判断情感倾向;利用词频和TF-IDF挖掘出正负文本中的关键点情况;利用文本挖掘相关算法找到平台中用户讨论的集中点。☆35Updated last month
- 中文情感词典汇总(台湾大学NTUSD简体中文情感词典,清华大学李军中文褒贬义词典,知网Hownet情感词典等)☆181Updated 2 months ago
- 大模型相关实践记录☆149Updated last month
- 常用中文停用词表:包含百度停用词表、哈工大停用词表和四川大学机器智能实验室停用词表。还有整理过的英文停用词表以及其他语言的停用词表☆137Updated 2 years ago
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆138Updated last month
- 大连理工大学情感词汇本体库及其他相关操作☆135Updated 7 years ago
- ☆12Updated last year
- 中文文本分析库,可对文本进行词频统计、词典扩充、情绪分析、相似度、可读性等☆55Updated 3 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆95Updated last year
- 基于bert-base-chinese微调的中文情感分析任务,在WeiboSenti100k 数据集上训练5个epoch并且收敛☆36Updated last year
- BERTopic 中文使用範例☆21Updated last year
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆716Updated last year
- 爬取指定关键词的微博数据☆52Updated last year
- 古诗词爬虫和文本挖掘,含13个朝代的3万多条诗人数据、85万多条诗词数据,包括主题聚类、相关诗词推荐、藏头诗生成、诗词翻译等算法实现☆29Updated 2 years ago
- LDA主题模型 | 主题困惑度 | 多文本☆18Updated 4 months ago
- 本项目是一个微博爬虫项目,旨在通过微博的mid获取到其对应的所有点赞、转发、评论与二级评论的相关数据。☆53Updated 2 years ago
- 中文微博语料库 情感二分类☆277Updated 5 years ago
- 中文情感分析库(Chinese Sentiment))可对文本进行情绪分析、正负情感分析。Text analysis, supporting multiple methods including word count, readability, document simil…☆555Updated 2 years ago
- 人民日报爬虫(Python)☆123Updated 3 months ago
- 爬取bilibili视频下的评论,最新出品!!!⚠本代码只适用于学习,做其他事情概不负责!!!☆62Updated 4 months ago
- 人民日报(1946-2024)、习近平系列重要讲话数据库、古诗文☆63Updated 2 months ago
- CnkiSpider is a package for efficiently crawling articles on CNKI☆21Updated 2 years ago
- [数据+代码] 经典的中文情感词典、情感分析停用词、程度副词、否定词表+中文金融情感词典(包括上市公司文本_正式和股吧社媒文本_非正式)...☆137Updated 2 years ago
- 中文文本相似度计算器☆148Updated 8 months ago
- 中文:方便好用的文本分类模型训练加推理全公开!欢迎star后礼貌获取!大体上本项目采用ERINE3.0的base版本将文本转换为语义向量而后做特征进行分类,实测上限极高可以优化后在61分类任务中达到92%准确率。☆48Updated last year