WangLaoShi / NLP-Resources-MaterialForChineseLinks
中文 NLP 资源库,语料库,相关的框架,文章收集。
☆26Updated 3 years ago
Alternatives and similar repositories for NLP-Resources-MaterialForChinese
Users that are interested in NLP-Resources-MaterialForChinese are comparing it to the libraries listed below
Sorting:
- 仇恨言论语料库☆24Updated 2 years ago
- 术语词典数据集/分词词典/专业词表语料库/词汇知识库/领域词表下载/主题词表/词库/自然语言处理/数据挖掘/深度学习☆30Updated 6 months ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆171Updated 3 years ago
- mirror of dongxiexidian/Chinese☆301Updated 6 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 6 months ago
- 中文语料库-每日自动更新版 ── 语料文件☆159Updated 4 years ago
- 爬取各种数据的爬虫的样例(百度百科、知乎、微博、简书、搜狗词库),可用于自然语言处理语料收集☆13Updated 2 months ago
- 爬取自互联网的古诗词语料库,包含先秦至当代诗词,共计1014508首诗☆37Updated 3 years ago
- 中文文本相似度计算器☆160Updated last year
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆158Updated 11 months ago
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆33Updated 2 years ago
- 中文心理问答数据集☆78Updated 5 years ago
- Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目☆349Updated 6 years ago
- 近代汉语语料库数据集 自然语言处理 语料库 古代汉语 古汉语 文言文 数字人文 计算语言☆167Updated 6 months ago
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆208Updated last year
- 维基百科中文语料整理☆299Updated 7 years ago
- clueai工具包: 3行代码3分钟,自定义需要的API!☆231Updated 2 years ago
- <数字人文教程>资源合集☆102Updated last year
- CCNC: A Comprehensive Chinese Name Corpus (3.65M name samples). 大型中文姓名语料库 (内含365万姓名语例)。☆43Updated 2 weeks ago
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆81Updated 5 years ago
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆721Updated last year
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆99Updated 2 years ago
- [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集☆641Updated 2 years ago
- A large high-quality corpus of Chinese synonyms 一个大型、高质量的中文同义词语料库。☆63Updated 3 years ago
- TXT文本语料数据清洗(Text corpus data cleaning):1> 合并TXT文件;2> 过滤干扰字符串;3> 对人名、地名、组织机构进行遮码处理;4> 将其他编码格式统一转换为UTF-8☆18Updated 2 years ago
- 自然语言处理工具Macropodus,基于Albert+BiLSTM+CRF深度学习网络架构,中文分词,词性标注,命名实体识别,新词发现,关键词,文本摘要,文本相似度,科学计算器,中文数字阿拉伯数字(罗马数字)转换,中文繁简转换,拼音转换。tookit(tool) of N…☆665Updated 2 years ago
- 打造人人都会的NLP,开源不易,记得star哦☆101Updated 2 years ago
- 中文文本摘要(text summarization)工具包, 抽取式中文文本摘要 Extractive text summary of Lead3、keyword、textrank、text teaser、word significance、LDA、LSI、NMF。(gra…☆421Updated last year
- Easy-to-use CPM for Chinese text generation(基于CPM的中文文本生成)☆535Updated 2 years ago
- DoTAT 是一款基于web、面向领域的通用文本标注工具,支持大规模实体标注、关系标注、事件标注、文本分类、基于字典匹配和正则匹配的自动标注以及用于实现归一化的标准名标注,同时也支持迭代标注、嵌套实体标注和嵌套事件标注。标注规范可自定义且同类型任务中可“一次创建多次复用”。…☆621Updated last year