CharyHong / Stopwords
常用中文停用词表:包含百度停用词表、哈工大停用词表和四川大学机器智能实验室停用词表。还有整理过的英文停用词表以及其他语言的停用词表
☆123Updated 2 years ago
Alternatives and similar repositories for Stopwords:
Users that are interested in Stopwords are comparing it to the libraries listed below
- 文本分析包,支持字数统计、可读性、 文档相似度、情感分析在内的多种文本分析方法。Text analysis, supporting multiple methods including word count, readability, document similarity,…☆333Updated this week
- ☆160Updated 9 months ago
- ☆12Updated last year
- pke_zh, python keyphrase extraction for chinese(zh). 中文关键词或关键句提取工具,实现了KeyBert、PositionRank、TopicRank、TextRank等算法,开箱即用。☆204Updated last year
- 中文文本相似度计算器☆142Updated 6 months ago
- 情感分析、文本分类、词典、bayes、sentiment analysis、TextCNN、classification、tensorflow、BERT、CNN、text classification☆461Updated last year
- 自然语言处理(NLP)教程,包括:词向量,词法分析,预训练语言模型,文本分类,文本语义匹配,信息抽取,翻译,对话。☆443Updated 2 years ago
- 中文情感词典汇总(台湾大学NTUSD简体中文情感词典,清华大学李军中文褒贬义词典,知网Hownet情感词典等)☆163Updated 3 weeks ago
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆714Updated last year
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆93Updated 3 years ago
- BERTopic 中文使用範例☆19Updated last year
- 大模型相关实践记录☆146Updated 2 weeks ago
- [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集☆623Updated last year
- A Chinese NLP library based on BERT for sentiment analysis and general-purpose Chinese word segmentation. | 基于 BERT 的中文 NLP 库,用于中文情感倾向分析、…☆201Updated 10 months ago
- 基于Pytorch的Bert应用,包括命名实体识别、情感分析、文本分类以及文本相似度等☆770Updated 3 years ago
- 中文世界的NLP自动标注开源工具,简单样本,交给LabelFast。☆68Updated 3 months ago
- 使用Bert完成实体之间关系抽取☆705Updated this week
- 中文文本分类任务,基于PyTorch实现(TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention, DPCNN, Transformer,Bert,ERNIE),开箱即用!☆384Updated last year
- 大模型文本分类☆49Updated 8 months ago
- Similarities: a toolkit for similarity calculation and semantic search. 相似度计算、匹配搜索工具包,支持亿级数据文搜文、文搜图、图搜图,python3开发,开箱即用。☆843Updated 5 months ago
- 中文情感分析库(Chinese Sentiment))可对文本进行情绪分析、正负情感分析。Text analysis, supporting multiple methods including word count, readability, document simil…☆544Updated 2 years ago
- 雅意信息抽取大模型:在百万级人工构造的高质量信息抽取数据上进行指令微调,由中科闻歌算法团队研发。 (Repo for YAYI Unified Information Extraction Model)☆300Updated 8 months ago
- 此项目完成了关于 NLP-Beginner:自然语言处理入门练习 的所有任务(文本分类、信息抽取、知识图谱、机器翻译、问答系统、文本生成、Text-to-SQL、文本纠错、文本挖掘、知识蒸馏、模型加速、OCR、TTS、Prompt、embedding等),所有代码都经过测试…☆194Updated last year
- Pytorch-NLU,一个中文文本分类、序列标注工具包,支持中文长文本、短文本的多类、多标签分类任务,支持中文命名实体识别、词性标注、分词、抽取式文本摘要等序列标注任务。 Ptorch NLU, a Chinese text classification and sequ…☆343Updated 9 months ago
- LDA主题模型 | 主题困惑度 | 多文本☆17Updated 3 months ago
- 使用BERT-BILSTM-CRF进行中文命名实体识别。☆415Updated 3 months ago
- 在SMP2020的微博情绪分类任务上,微调在中文预料上预训练的BERT模型,进行文本分类。☆104Updated 2 years ago
- 多标签文本分类,多标 签分类,文本分类, multi-label, classifier, text classification, BERT, seq2seq,attention, multi-label-classification☆762Updated 4 months ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated 4 months ago
- A NLP package for Chinese text:Preprocessing, Tokenization, Chinese Fonts, Word Embeddings, Text Similarity and Sentiment Analysis 轻量级中文自…☆26Updated 5 months ago