endNone / stopwords
中英文停用词表(3076,包含部分特殊符号)
☆16Updated 3 months ago
Alternatives and similar repositories for stopwords:
Users that are interested in stopwords are comparing it to the libraries listed below
- 常用中文停用词表:包含百度停用词表、哈工大停用词表和四川大学机器智能实验室停用词表。还有整理过的英文停用词表以及其他语言 的停用词表☆118Updated last year
- 文本分析包,支持字数统计、可读性、文档相似度、情感分析在内的多种文本分析方法。chinese text sentiment analysis☆329Updated 2 weeks ago
- CnkiSpider is a package for efficiently crawling articles on CNKI☆21Updated 2 years ago
- A Chinese NLP library based on BERT for sentiment analysis and general-purpose Chinese word segmentation. | 基于 BERT 的中文 NLP 库,用于中文情感倾向分析、…☆200Updated 10 months ago
- ☆148Updated 8 months ago
- 基于bert-base-chinese微调的中文情感分析任务,在WeiboSenti100k 数据集上训练5个epoch并且收敛☆34Updated last year
- Legal-Eagle-InternLM 是一个基于商汤科技和上海人工智能实验室推出的书生浦语大模型InternLM的法律问答机器人。旨在为用户提供符合3H(即Helpful、Honest、Harmless)原则的专业、智能、全面的法律服务的法律领域大模型。☆55Updated last year
- 中文文本分析相关资源汇总☆135Updated 2 weeks ago
- 人民日报(1946-2024)、 习近平系列重要讲话数据库、古诗文☆57Updated last week
- 大连理工大学情感词汇本体库及其他相关操作☆131Updated 7 years ago
- 大模型相关实践记录☆142Updated 3 months ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆92Updated 3 years ago
- 中文世界的NLP自动标注开源工具,简单样本,交给LabelFast。☆66Updated 2 months ago
- 中文文本相似度计算器☆137Updated 6 months ago
- 黄帝(Huang-Di)模型仓库,基于Ziya-LLaMA-13B-V1的中医古籍知识问答大模型。☆113Updated 3 months ago
- 一个比较基础、全面的文本挖掘过程。包含了利用机器学习和文本挖掘技术完成情感分析模型搭建;利用情感极性判断与程度计算来判断情感倾向;利用词频和TF-IDF挖掘出正负文本中的关键点情况;利用文本挖掘相关算法找到平台中用户讨论的集中点。☆29Updated 8 months ago
- 情感分类实战,基于数据集 weibo_senti_100k☆11Updated 4 years ago
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆708Updated last year
- A NLP package for Chinese text:Preprocessing, Tokenization, Chinese Fonts, Word Embeddings, Text Similarity and Sentiment Analysis 轻量级中文自…☆26Updated 5 months ago
- 中文情感词典汇总(台湾大学NTUSD简体中文情感词典,清华大学李军中文褒贬义词典,知网Hownet情感词典等)☆159Updated this week
- 实现了简单的微博关键字爬虫+基于GPT 3.5模型的情感分析☆15Updated last year
- 情感分析、文本分类、词典、bayes、sentiment analysis、TextCNN、classification、tensorflow、BERT、CNN、text classification☆452Updated last year
- 术语词典数据集/分词词典/专业词表语料库/词汇知识库/领域词表下载/主题词表/词库/自然语言处理/数据挖掘/深度学习☆27Updated 3 weeks ago
- 📝 针对文档类图像做内容提取,将文档类图像一比一输出到Word或者Txt中,便于进一步使用或处理。后续计划支持输入PDF/图像,输出对应json格式、Txt格式、Word格式和Markdown格式。☆188Updated 5 months ago
- 古诗词爬虫和文本挖掘,含13个朝代的3万多条诗人数据、85万多条诗词数据,包括主题聚类、相关诗词推荐、藏头诗生成、诗词翻译等算法实现☆28Updated 2 years ago
- 适用于中文分词的经济金融词典☆78Updated 3 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆92Updated last year
- [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集☆615Updated last year
- 爬取bilibili视频下的评论,最新出品!!!⚠本代码只适用于学习,做其他事情概不负责!!!☆62Updated 2 months ago
- 中文情感分析库(Chinese Sentiment))可对文本进行情绪分析、正负情感分析。Text analysis, supporting multiple methods including word count, readability, document simil…☆544Updated 2 years ago