CharyHong / StopwordsLinks
常用中文停用词表:包含百度停用词表、哈工大停用词表和四川大学机器智能实验室停用词表。还有整理过的英文停用词表以及其他语言的停用词表
☆136Updated 2 years ago
Alternatives and similar repositories for Stopwords
Users that are interested in Stopwords are comparing it to the libraries listed below
Sorting:
- text analysis, supporting multiple methods including word count, readability, document similarity, sentiment analysis, Word2Vec/GloVe, an…☆352Updated last month
- ☆177Updated 11 months ago
- 中英文停用词表(3076,包含部分特殊符号)☆19Updated 5 months ago
- ☆12Updated last year
- [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集☆633Updated last year
- 中文文本相似度计算器☆148Updated 8 months ago
- 雅意信息抽取大模型:在百万级人工构造的高 质量信息抽取数据上进行指令微调,由中科闻歌算法团队研发。 (Repo for YAYI Unified Information Extraction Model)☆304Updated 9 months ago
- 中文命名实体识别。包含目前最新的中文命名实体识别论文、中文实体识别相关工具、数据集,以及中文预训练模型、词向量、实体识别综述等。☆706Updated 2 months ago
- 中文情感词典汇总(台湾大学NTUSD简体中文情感词典,清华大学李军中文褒贬义词典,知网Hownet情感词典等)☆180Updated 2 months ago
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆208Updated last year
- 大模型相关实践记录☆149Updated last month
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆716Updated last year
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆138Updated last month
- PaddleNLP UIE模型的PyTorch版实现☆632Updated last year
- 中文:方便好用的文本分类模型训练加推理全公开!欢迎star后礼貌获取!大体上本项目采用ERINE3.0的base版本将文本转换为语义向量而后做特征进行分类,实测上限极高可以优化后在61分类任务中达到92%准确率。☆48Updated last year
- 基于scrapy的层次优先队列方法爬取中文维基百科,并自动抽取结构和半结构数据☆152Updated 2 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆94Updated 3 years ago
- 由中国政法大学和北京航空航天大学共同设计,基于GLM-9B的法律文书处理和判决预测模型☆22Updated 8 months ago
- GuwenModels: 古文自然语言处理模型合集, 收录互联网上的古文相关模型及资源. A collection of Classical Chinese natural language processing models, including Classical Ch…☆175Updated last year
- 情感分析、文本分类、词典、bayes、sentiment analysis、TextCNN、classification、tensorflow、BERT、CNN、text classification☆469Updated last year
- 基于bert-base-chinese微调的中文情感分析任务,在WeiboSenti100k 数据集上训练5个epoch并且收敛☆36Updated last year
- 使用BERT-BILSTM-CRF进行中文命名实体识别。☆434Updated 4 months ago
- 大连理工大学情感词汇本体库及其他相关操作☆135Updated 7 years ago
- 中文世界的NLP自动标注开源工具,简单样本,交给LabelFast。☆71Updated 4 months ago
- 基于ChatGPT的情感分析☆51Updated 2 years ago
- 中文情感分析库(Chinese Sentiment))可对文本进行情绪分析、正负情感分析。Text analysis, supporting multiple methods including word count, readability, document simil…☆555Updated 2 years ago
- A Chinese NLP library based on BERT for sentiment analysis and general-purpose Chinese word segmentation. | 基于 BERT 的中文 NLP 库,用于中文情感倾向分析、…☆206Updated last year
- 使用Pytorch框架对NLP方向上的文本分类、实体识别、三元组抽取做代码实战☆181Updated last year
- 基于pytorch的bert_bilstm_crf中文命名实体识别☆565Updated 2 years ago
- 基于论文摘要的文本分类与关键词抽取挑战赛—Task 1☆25Updated last year