fondoger / scholar_datasetLinks
百度百科学者词条、知网学者和中文论文元数据开源数据集
☆19Updated 5 years ago
Alternatives and similar repositories for scholar_dataset
Users that are interested in scholar_dataset are comparing it to the libraries listed below
Sorting:
- 大连理工大学情感词汇本体库及其他相关操作☆138Updated 8 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆93Updated 3 years ago
- COVID-19-sentiment-analysis-dataset-Weibo☆37Updated 5 years ago
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆139Updated 2 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆97Updated 2 years ago
- 中文文本情感分类数据集分享 chinese sentiment datasets☆82Updated 4 years ago
- BTM实现代码☆100Updated 3 years ago
- smp ewect code☆77Updated 4 years ago
- a Corpus for Classical Chinese Language Event Extraction☆21Updated 2 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 5 months ago
- A PyTorch implementation of a BiLSTM \ BERT \ Roberta (+ BiLSTM + CRF) model for Chinese Word Segmentation (中文分词) .☆210Updated 3 years ago
- SMP 2020年微博情感分类评测任务 第六名解决方案☆69Updated 3 years ago
- 本仓库是基于bert4keras实现的古文-现代文翻译模型。具体使用了基于掩码自注意力机制的UNILM(Li al., 2019)预训练模型作为翻译系统的backbone。我们首先使用了普通的中文(现代文)BERT、Roberta权重作为UNILM的初始权重以训练UNILM…☆50Updated 3 years ago
- 该仓库收集了常用的中文情感词典,仅供学习☆131Updated last year
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆132Updated 3 years ago
- CCL 2020 中文隐喻识别与情感分析任务说明与数据集☆41Updated 4 years ago
- 将word2vec训练生成的词向量和BERT生成的词向量进行可视化对比☆15Updated 5 years ago
- 今日头条中文新闻(文本)分类数据集☆68Updated 7 years ago
- ASAP: A Chinese Review Dataset Towards Aspect Category Sentiment Analysis and Rating Prediction☆336Updated 4 years ago
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆142Updated 4 months ago
- 在SMP2020的微博情绪分类任务上,微调在中文预料上预训练的BERT模型,进行文本分类。☆110Updated 3 years ago
- A Benchmark for Classical Chinese Based on a Crowdsourcing System.☆60Updated 4 years ago
- 基于pytorch_bert的中文多标签分类☆91Updated 3 years ago
- 根据维基中文语料库预训练 GloVe 中文词向量;Pre-train GloVe word-embedding From Chinese Wiki corpus☆76Updated last year
- NLP文本增强的两种方式:同义词替换(利用word2vec词表)和回译☆77Updated 4 years ago
- 毕业设计,基于事理图谱的事件推理系统☆70Updated 5 years ago
- Python实现中文文本关键词抽取,分别用了TF-IDF、LDA、RNN、LSTM和LR-SGD两类共五种方法,全网最全没有之一。☆61Updated 4 years ago
- THUCNews中文文本分类数据集,该数据集包含84万篇新闻文档,总计14类;在该模型的基础上测试多个版本bert分类效果。☆65Updated 4 years ago
- GuwenModels: 古文自然语言处理模型合集, 收录互联网上的古文相关模型及资源. A collection of Classical Chinese natural language processing models, including Classical Ch…☆185Updated last year
- 中文文本分类,Bert,TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention,DPCNN,Transformer,基于pytorch,开箱即用。☆33Updated 3 years ago