WangLaoShi / NLP-Resources-MaterialForChineseLinks
中文 NLP 资源库,语料库,相关的框架,文章收集。
☆28Updated 3 years ago
Alternatives and similar repositories for NLP-Resources-MaterialForChinese
Users that are interested in NLP-Resources-MaterialForChinese are comparing it to the libraries listed below
Sorting:
- 仇恨言论语料库☆24Updated 2 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆171Updated 4 years ago
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆208Updated last year
- [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集☆647Updated 2 years ago
- 爬取自互联网的古诗词语料库,包含先秦至当代诗词,共计1014508首诗☆40Updated 3 years ago
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆158Updated last year
- 术语词典数据集/分词词典/专业词表语料库/词汇知识库/领域词表下载/主题词表/词库/自然语言处理/数据挖掘/深度学习☆30Updated 8 months ago
- "桃李“: 国际中文教育大模型☆187Updated last year
- 爬取各种数据的爬虫的样例(百度百科、知乎、微博、简书、搜狗词库),可用于自然语言处理语料收集☆13Updated 3 months ago
- GuwenModels: 古文自然语言处理模型合集, 收录互联网上的古文相关模型及资源. A collection of Classical Chinese natural language processing models, including Classical Ch…☆190Updated last year
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 8 months ago
- <数字人文教程>资源合集☆108Updated last year
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆723Updated 2 years ago
- clueai工具包: 3行代码3分钟,自定义需要的API!☆231Updated 2 years ago
- 中文语料库-每日自动更新版 ── 语料文件☆163Updated 4 years ago
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆145Updated 2 years ago
- dialogbot, provide search-based dialogue, task-based dialogue and generative dialogue model. 对话机器人,基于问答型对话、任务型对话、聊天型对话等模型实现,支持网络检索问答,领域知识…☆332Updated last year
- 中国法律相关语料库☆32Updated 2 years ago
- Easy-to-use CPM for Chinese text generation(基于CPM的中文文本生成)☆534Updated 2 years ago
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆34Updated 3 years ago
- mirror of dongxiexidian/Chinese☆305Updated 6 years ago
- 搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。☆69Updated 6 years ago
- A PyTorch implementation of a BiLSTM \ BERT \ Roberta (+ BiLSTM + CRF) model for Chinese Word Segmentation (中文分词) .☆216Updated 3 years ago
- 文本自动摘要☆93Updated 2 years ago
- CCNC: A Comprehensive Chinese Name Corpus (3.65M name samples). 大型中文姓名语料库 (内含365万姓名语例)。☆44Updated last month
- 人民日报(1946-2024)、习近平系列重要讲话数据库、古诗文☆71Updated 7 months ago
- 中文心理问答数据集☆78Updated 5 years ago
- ☆396Updated 3 months ago
- pytextclassifier is a toolkit for text classification. 文本分类,LR,Xgboost,TextCNN,FastText,TextRNN,BERT等分类模型实现,开箱即用。☆515Updated last year
- Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目☆351Updated 6 years ago