baipengyan / Chinese-StopWords
中文常用的停用词(包含百度、哈工大、四川大学等词表)
☆30Updated 6 years ago
Alternatives and similar repositories for Chinese-StopWords
Users that are interested in Chinese-StopWords are comparing it to the libraries listed below
Sorting:
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆93Updated last year
- 大连理工大学情感词汇本体库及其他相关操作☆134Updated 7 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆130Updated 3 years ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated 5 months ago
- keyword extraction and summarization for Chinese text by TextRank☆68Updated 2 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆94Updated 3 years ago
- Self complemented sentiment words expansion using seed sentiment words and so-pmi , this method is tested to be effective, 基于情感种子词与so-pmi…☆87Updated 7 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 7 years ago
- Bert预训练模型fine-tune计算文本相似度☆104Updated 2 years ago
- Chinese Subjective Dectection based on subjective knowlegebase, 中文主观性计算。基于中文主观性知识库的句子主观性评定方法。☆57Updated last year
- 搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。☆96Updated 6 years ago
- 根据维基中文语料库预训练 GloVe 中文词向量;Pre-train GloVe word-embedding From Chinese Wiki corpus☆73Updated last year
- 基于ltp的简单评论观点抽取模块☆116Updated 6 years ago
- 各大中文分词性能评测☆157Updated 6 years ago
- 人民日报语料处理工具集 | Tools for Corpus of People's Daily☆281Updated last year
- ☆53Updated 4 years ago
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆137Updated last week
- smp ewect code☆77Updated 4 years ago
- 复现了论文《基于主题模型的短文本关键词抽取及扩展》的代码☆30Updated 4 years ago
- 中文微博语料库 情感二分类☆272Updated 4 years ago
- 基于TF-IDF和余弦定理计算文本相似度☆36Updated 6 years ago
- Code for Chinese LIWC Lexicon Expansion via Hierarchical Classification of Word Embeddings with Sememe Attention (AAAI18)☆152Updated 7 years ago
- 教育行业新闻 自动文摘 语料库 自动摘要☆199Updated 6 years ago
- SMP 2020年微博情感分类评测任务 第六名解决方案☆69Updated 2 years ago
- ☆82Updated 6 years ago
- 今日头条中文新闻(文本)分类数据集☆64Updated 7 years ago
- 基于 pytorch 的 bert 实现和下游任务微调☆50Updated 2 years ago
- 中文文本情感分类数据集分享 chinese sentiment datasets☆81Updated 4 years ago
- 无监督中文关键词抽取(Keyphrase Extraction),基于统计,基于图【LDA与PageRank(TextRank, TPR, Salience Rank, Single TPR等)】,基于嵌入【SIFRank等】,开箱即用!☆105Updated 2 years ago
- 用gensim训练LDA模型,进行新闻文本主题分析☆77Updated 5 years ago