mahavivo / scripta-sinica
汉语古典文本资料库
☆265Updated 7 years ago
Alternatives and similar repositories for scripta-sinica:
Users that are interested in scripta-sinica are comparing it to the libraries listed below
- 比较全的中华古诗古词古文库,包括21 万首古诗词,以及注释、赏析等信息,包含10000多名诗人以及诗人的介绍、生平等,同时包含,1600多个词牌介绍,中国70多个朝代解析,和古诗文的近200个分类标签☆331Updated last year
- 古文现代文翻译平行语料库☆100Updated 3 years ago
- 近代汉语语料库数据集 自然语言处理 语料库 古代汉语 古汉语 文言文 数字人文 计算语言☆152Updated 2 months ago
- 甲言,专注于古代汉语(古汉语/古文/文言文/文言)处理的NLP工具包,支持文言词库构建、分词、词性标注、断句和标点。Jiayan, the 1st NLP toolkit designed for Classical Chinese, supports lexicon co…☆599Updated 3 years ago
- 古诗词语料库☆125Updated 7 years ago
- GuwenBERT: 古文预训练语言模型(古文BERT) A Pre-trained Language Model for Classical Chinese (Literary Chinese)☆515Updated 3 years ago
- GuwenModels: 古文自然语言处理模型合集, 收录互联网上的古文相关模型及资源. A collection of Classical Chinese natural language processing models, including Classical Ch…☆166Updated last year
- 中华古诗文数据库和API。包含10000首古文(诗、词、歌、赋以及其它形式的文言文),近4000名作者,10000名句☆464Updated 6 months ago
- 中国诗词歌赋数据库 总计82万余首(827108) CSV 格式 简体中文 按照number有序☆59Updated last week
- 古汉语(文言文)字典-爬取文言文字典网,制作Kindle字典.☆65Updated 6 years ago
- chatbot based on music region using method including es and music kb.基于14W歌曲知识库的问答尝试,功能包括歌词接龙,已知歌词找歌曲以及歌曲歌手歌词三角关系的问答。☆270Updated 6 years ago
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆76Updated 4 years ago
- 《现代汉语词典》(第7版)全文TXT☆258Updated 7 months ago
- 中华经典古籍精校、诗词,四书五经、四大名著、诗经、楚辞、全唐诗、全宋词、唐诗三百首、宋詞三百首、二十四史......☆86Updated 3 years ago
- 漢語拆字字典☆750Updated 2 years ago
- 汉字拆字库,可以将汉字拆解成偏旁部首,在机器学习中作为汉字的字形特征 | Hanzi Decomposition Library allows Chinese characters to be broken down into radicals and components…☆356Updated 3 months ago
- 非常全的文言文(古文)-现代文平行语料☆1,259Updated 9 months ago
- 10W首中文歌词数据库☆462Updated 3 years ago
- 殆知阁古代文献☆1,334Updated 9 months ago
- 渊 - A project for Classical Chinese☆96Updated 2 years ago
- 中学语文课文——文言文古诗词☆30Updated 5 years ago
- Dataset for couplets. 70万条对联数据库。☆725Updated last week
- Poetry-related datasets developed by THUAIPoet (Jiuge) group.☆218Updated 4 years ago
- 中文汉语拼音辞典,汉字拼音字典,词典,成语词典,常用字、多音字字典数据库☆539Updated last week
- 人民日报(1946-2003)☆129Updated 6 years ago
- 同义词表,反义词表,否定词表☆526Updated 3 months ago
- 中文相关词典和语料库。☆169Updated 10 years ago
- 汉字数据集,包括汉字的相关信息,例如笔画数、部首、拼音、英文释义/同义词等。☆113Updated 4 years ago
- The most comprehensive database of modern Chinese poetry and foreign poetry 最全的中国近现代诗以及外国诗数据库☆125Updated 3 years ago
- 图书名语料库。含部分电影、游戏名称。☆68Updated 10 months ago