fondoger / scholar_datasetLinks
百度百科学者词条、知网学者和中文论文元数据开源数据集
☆19Updated 5 years ago
Alternatives and similar repositories for scholar_dataset
Users that are interested in scholar_dataset are comparing it to the libraries listed below
Sorting:
- 大连理工大学情感词汇本体库及其他相关操作☆142Updated 8 years ago
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆150Updated 2 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆94Updated 4 years ago
- A PyTorch implementation of a BiLSTM \ BERT \ Roberta (+ BiLSTM + CRF) model for Chinese Word Segmentation (中文分词) .☆216Updated 3 years ago
- 中文文本情感分类数据集分享 chinese sentiment datasets☆85Updated 5 years ago
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆143Updated 3 months ago
- GuwenModels: 古文自然语言处理模型合集, 收录互联网上的古文相关模型及资源. A collection of Classical Chinese natural language processing models, including Classical Ch…☆196Updated 2 years ago
- A Benchmark for Classical Chinese Based on a Crowdsourcing System.☆59Updated 4 years ago
- A sentiment analysis platform☆50Updated 5 years ago
- BTM实现代码☆101Updated 3 years ago
- 使用开源的Bert-as-Service预训练生成文档特征向量,基于k-means对COVID-19文献聚类,t-SNE可视化数据,通过LDA为每个簇生成主题关键词,画Bokeh图实现按簇、关键词搜索和筛选数据。☆19Updated 5 years ago
- 在SMP2020的微博情绪分类任务上,微调在中文预料上预训练的BERT模型,进行文本分类。☆118Updated 3 years ago
- 该仓库收集了常用的中文情感词典,仅供学习☆132Updated last year
- Chinese Subjective Dectection based on subjective knowlegebase, 中文主观性计算。基于中文主观性知识库的句子主观性评定方法。☆57Updated 2 years ago
- 今日头条中文新闻(文本)分类数据集☆71Updated 7 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆102Updated 2 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 10 months ago
- smp ewect code☆79Updated 5 years ago
- CCL 2020 中文隐喻识别与情感分析任务说明与数据集☆41Updated 5 years ago
- SMP 2020年微博情感分类评 测任务 第六名解决方案☆69Updated 3 years ago
- 将word2vec训练生成的词向量和BERT生成的词向量进行可视化对比☆15Updated 5 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆131Updated 4 years ago
- a Corpus for Classical Chinese Language Event Extraction☆24Updated last month
- 中文文本分类,Bert,TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention,DPCNN,Transformer,基于pytorch,开箱即用。☆34Updated 3 years ago
- 文本相似度(匹配)计算,提供Baseline、训练、推理、指标分析...代码包含TensorFlow/Pytorch双版本☆179Updated 3 years ago
- ASAP: A Chinese Review Dataset Towards Aspect Category Sentiment Analysis and Rating Prediction☆344Updated 4 years ago
- cntext 是一个专为社会科学实证研究设计的中文文本分析 Python 库。它不仅提供传统的词频统计和情感分析,还支持词嵌入训练、语义投影计算等高级功能,帮助研究者从大规模非结构化文本中测量抽象构念——如态度、认知、文化观念与心理状态。☆422Updated last month
- 基于 RoBERTa-wwm-ext 模型的微博中文情绪识别☆38Updated 4 years ago
- 中文词义消歧项目(Chinese WSD),基于LSTM + ATTENTION模型架构,Pytorch实现。代码简单,上手容易。☆17Updated 3 years ago
- 自然语言处理NLP(自然语言生成NLG、自然语言理解NLU)、自然语言学术会议大盘点、自然语言大佬介绍、NLP研究机构、NLP资料分享、NLP学习资源分享、NLP学术论文介绍☆185Updated 10 months ago