datawarex / renmin1949-1978
人民日报文章数据集(1949-1978)
☆14Updated 4 years ago
Alternatives and similar repositories for renmin1949-1978
Users that are interested in renmin1949-1978 are comparing it to the libraries listed below
Sorting:
- 人民日报1998年1-4月中文标注语料库☆32Updated 6 years ago
- Chinese Subjective Dectection based on subjective knowlegebase, 中文主观性计算。基于中文主观性知识库的句子主观性评定方法。☆57Updated last year
- 一个面向繁体中文古籍分词的python工具包☆32Updated 3 years ago
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆137Updated 2 weeks ago
- 人民日报(1946-2003)☆135Updated 6 years ago
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆129Updated last year
- 大连理工大学情感词汇本体库及其他相关操作☆134Updated 7 years ago
- Chinese Word Segmentation Using MM/CRF/Bi-LSTM/Bi-LSTM-CRF/BERT-LSTM, 中文分词,使用 最大词匹配、CRF(CRF++)、Bi-LSTM (+CRF)、BERT-Bi-LSTM☆30Updated 5 years ago
- 爬取各种数据的爬虫的样例(百度百科、知乎、微博、简书、搜狗词库),可用于自然语言处理语料收集☆10Updated 5 years ago
- 古文现代文翻译平行语料库☆104Updated 3 years ago
- 中文常用的停用词(包含百度、哈工大、四川大学等词表)☆30Updated 6 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 7 years ago
- 基于Pytorch+BERT+CRF的NLP序列标注模型,目前包括分词,词性标注,命名实体识别等☆60Updated 2 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆94Updated last year
- 各大文本摘要模型-中文文本可运行的解决方案☆69Updated last year
- NER(命名实体识别)中文语料,一站式获取☆128Updated 5 years ago
- 人民日报(1946-2024)、习近平系列重要讲话数据库、古诗文☆58Updated last month
- 古文语言理解测评基准 Classical Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard☆50Updated last year
- 基于mlm方式的带有纠错功能的拼音转汉字bert预训练模型,pinyin correcter,基于pytorch框架实现☆45Updated 4 years ago
- Dataset from 'Character-based BiLSTM-CRF Incorporating POS and Dictionaries for Chinese Opinion Target Extraction'☆43Updated 6 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆162Updated 3 years ago
- 人民日报语料处理工具集 | Tools for Corpus of People's Daily☆281Updated last year
- 基于bert的中文自然语言处理工具,包括情感分析、中文分词、词性标注、以及命名实体识别功能,并提供文本分类任务、序列标注任务、句对关系判断任务的训练与预测接口☆132Updated 6 years ago
- BERT微调在机器翻译上的应用,哎哟,效果贼好。☆49Updated 4 years ago
- 基于BERT-BLSTM-CRF 序列标注模型,支持中文分词、词性标注、命名实体识别、语义角色标注。☆22Updated 4 years ago
- A PyTorch implementation of a BiLSTM \ BERT \ Roberta (+ BiLSTM + CRF) model for Chinese Word Segmentation (中文分词) .☆210Updated 2 years ago
- GuwenModels: 古文自然语言处理模型合集, 收录互联网上的古文相关模型及资源. A collection of Classical Chinese natural language processing models, including Classical Ch…☆174Updated last year
- 常用的中文停用词表☆75Updated 7 years ago
- 汉字字符特征提取工具,可以提取出字符中的字音(声母、韵母、声调)、字形(偏旁、部首)、四角编码等特征,同时可作为tensor输入到模型☆137Updated 4 years ago
- 各大中文分词性能评测☆157Updated 6 years ago