endNone / stopwordsLinks
中英文停用词表(3076,包含部分特殊符号)
☆21Updated 10 months ago
Alternatives and similar repositories for stopwords
Users that are interested in stopwords are comparing it to the libraries listed below
Sorting:
- cntext 是一个专为社会科学实证研究设计的中文文本分析 Python 库。它不仅提供传统的词频统计和情感分析,还支持词嵌入训练、语义投影计算等高级功能,帮助研究者从大规模非结构化文本中测量抽象构念——如态度、认知、文化观念与心理状态。☆393Updated 2 weeks ago
- 常用中文停用词表:包含百度停用词表、哈工大停用词表和四川大学机器智能实验室停用词表。还有整理过的英文停用词表以及其他语言的停用词表☆156Updated 2 years ago
- ☆227Updated last year
- A Chinese NLP library based on BERT for sentiment analysis and general-purpose Chinese word segmentation. | 基于 BERT 的中文 NLP 库,用于中文情感倾向分析、…☆220Updated 3 months ago
- 爬取bilibili视频下的评论,最新出品!!!⚠本代码只适用于学习,做其他事情概不负责!!!☆65Updated 3 months ago
- LDA主题模型 | 主题困惑度 | 多文本☆18Updated 10 months ago
- 大模型相关实践记录☆157Updated 7 months ago
- CnkiSpider is a package for efficiently crawling articles on CNKI☆20Updated 2 years ago
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆143Updated 2 months ago
- 中文文本相似度计算器☆163Updated last year
- 人民日报爬虫(Python)☆148Updated 4 months ago
- 情感分析、文本分类、词典、bayes、sentiment analysis、TextCNN、classification、tensorflow、BERT、CNN、text classification☆507Updated 5 months ago
- 对b站弹幕、评论进行爬虫,然后使用Word2Vec模型将其转化为词向量进行分析☆33Updated 3 years ago
- bilibili弹幕分析,包含爬虫、词云分析、词频分析、情感分析、构建衍生指标,可视化☆174Updated 2 years ago
- BERTopic 中文使用範例☆22Updated last year
- TXT文本语料数据清洗(Text corpus data cleaning):1> 合并TXT文件;2> 过滤干扰字符串;3> 对人名、地名、组织机构进行遮码处理;4> 将其他编码格式统一转换为UTF-8☆19Updated 3 years ago
- A NLP package for Chinese text:Preprocessing, Tokenization, Chinese Fonts, Word Embeddings, Text Similarity and Sentiment Analysis 轻量级中文自…☆35Updated last year
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆94Updated 4 years ago
- 中文情感词典汇总(台湾大学NTUSD简体中文情感词典,清华大学李军中文褒贬义词典,知网Hownet情感词典等)☆204Updated 7 months ago
- 自己手写的百度搜索接口的封装,pip安装,支持命令行执行。Baidu Search unofficial API for Python with no external dependencies☆156Updated last year
- 在SMP2020的微博情绪分类任务上,微调在中文预料上预训练的BERT模型,进行文本分类。☆114Updated 3 years ago
- 基于bert-base-chinese微调的中文情感分析任务,在WeiboSenti100k 数据集上训练5个epoch并且收敛☆37Updated 2 years ago
- 一个爬取微博热榜,并进行可视化展示及推送的小工具☆33Updated 9 months ago
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆414Updated 3 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆100Updated 2 years ago
- 一个比较全面的文本挖掘过程。包含了利用机器学习和文本挖掘技术完成情感分析模型搭建;利用情感极性判断与程度计算来判断情感倾向;利用词频和TF-IDF挖掘出正负文本中的关键点情况;利用文本挖掘相关算法找到平台中用户讨论的集中点。☆38Updated 6 months ago
- 中文情感分析库(Chinese Sentiment))可对文本进行情绪分析、正负情感分析。Text analysis, supporting multiple methods including word count, readability, document simil…☆573Updated 2 years ago
- 中文文本分析库,可对文本进行词频统计、词典扩充、情绪分析、相似度、可读性等☆57Updated 4 years ago
- 自动读取本地pdf文献并提取标题、作者、摘要和结论生成综述。Read and translate English literature to generate review automatically.☆168Updated 3 years ago
- 爬取指定关键词的微博数据☆58Updated last year