WangLaoShi / NLP-Resources-MaterialForChinese
中文 NLP 资源库,语料库,相关的框架,文章收集。
☆24Updated 2 years ago
Alternatives and similar repositories for NLP-Resources-MaterialForChinese:
Users that are interested in NLP-Resources-MaterialForChinese are comparing it to the libraries listed below
- 仇恨言论语料库☆16Updated last year
- 爬取各种数据的爬虫的样例(百度百科、知乎、微博、简书、搜狗词库),可用于自然语言处理语料收集☆11Updated 5 years ago
- 术语词典数据集/分词词典/专业词表语料库/词汇知识库/领域词表下载/主题词表/词库/自然语言处理/数据挖掘/深度学习☆26Updated 4 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆152Updated 3 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆46Updated 2 months ago
- 各大文本摘要模型-中文文本可运行的解决方案☆65Updated last year
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆31Updated 2 years ago
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆121Updated last year
- JurisLMs: Jurisprudential Language Models☆21Updated last year
- ☆105Updated 11 months ago
- LERT: A Linguistically-motivated Pre-trained Language Model(语言学信息增强的预训练模型LERT)☆202Updated last year
- A PyTorch implementation of a BiLSTM \ BERT \ Roberta (+ BiLSTM + CRF) model for Chinese Word Segmentation (中文分词) .☆207Updated 2 years ago
- CINO: Pre-trained Language Models for Chinese Minority (少数民族语言预训练模型)☆226Updated last year
- 一个面向繁体中文古籍分词的python工具包☆32Updated 3 years ago
- ChineseHumorSentiment, chinese humor sentiment mining including corpus build and mining nlp methods.中文文本幽默情绪计算项目,项目包括幽默文本语料库的构建,幽默计算模型,包括…☆116Updated 6 years ago
- 爬取自互联网的古诗词语料库,包含先秦至当代诗词,共计1014508首诗☆29Updated 2 years ago
- ☆74Updated 4 years ago
- 基于法律裁判文书的事件抽取及其应用,包括数据的分词、词性标注、命名实体识别、事件要素抽取和判决结果预测等内容☆581Updated 2 years ago
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆155Updated 3 months ago
- 基于词汇信息融合的中文NER模型☆164Updated 2 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 6 years ago
- 法研杯2021类案检索赛道三等奖方案☆52Updated 3 years ago
- 中国法研杯-司法人工智能挑战赛(CAIL2018-2020)☆89Updated 2 years ago
- ☆135Updated 3 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago
- CCL 2020 中文隐喻识别与情感分析任务说明与数据集☆36Updated 4 years ago
- 本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。☆112Updated 4 years ago
- 文本自动摘要☆92Updated last year
- 基于pytorch+bert的指代消解☆14Updated 3 years ago
- 人民日报语料处理工具集 | Tools for Corpus of People's Daily☆274Updated last year