mahavivo / scripta-sinica
汉语古典文本资料库
☆259Updated 6 years ago
Alternatives and similar repositories for scripta-sinica:
Users that are interested in scripta-sinica are comparing it to the libraries listed below
- 比较全的中华古诗古词古文库,包括21万首古诗词,以及 注释、赏析等信息,包含10000多名诗人以及诗人的介绍、生平等,同时包含,1600多个词牌介绍,中国70多个朝代解析,和古诗文的近200个分类标签☆330Updated last year
- 近代汉语语料库数据集 自然语言处理 语料库 古代汉语 古汉语 文言文 数字人文 计算语言☆152Updated last month
- GuwenBERT: 古文预训练语言模型(古文BERT) A Pre-trained Language Model for Classical Chinese (Literary Chinese)☆514Updated 3 years ago
- 甲言,专注于古代汉语(古汉语/古文/文言文/文言)处理的NLP工具包,支持文言词库构建、分词、词性标 注、断句和标点。Jiayan, the 1st NLP toolkit designed for Classical Chinese, supports lexicon co…☆594Updated 3 years ago
- 古诗词语料库☆122Updated 7 years ago
- 古文现代文翻译平行语料库☆100Updated 3 years ago
- 中华古诗文数据库和API。包含10000首古文(诗、词、歌、赋以及其它形式的文言文),近4000名作者,10000名句☆460Updated 5 months ago
- 中国诗词歌赋数据库 总计82万余首(827108) CSV 格式 简体中文 按照number有序☆58Updated last year
- GuwenModels: 古文自然语言处理模型合集, 收录互联网上的古文相关模型及资源. A collection of Classical Chinese natural language processing models, including Classical Ch…☆164Updated last year
- 古汉语(文言文)字典-爬取文言文字典网,制作Kindle字典.☆65Updated 6 years ago
- 漢語拆字字典☆748Updated 2 years ago
- 古典中文語料庫☆280Updated 2 years ago
- 汉字拆字库,可以将汉字拆解成偏旁部首,在机器学习中作为汉字的字形特征 | Hanzi Decomposition Library allows Chinese characters to be broken down into radicals and components…☆353Updated 3 months ago
- 中学语文课文——文言文古诗词☆29Updated 5 years ago
- The most comprehensive database of modern Chinese poetry and foreign poetry 最全的中国近现代诗以及外国诗数据库☆125Updated 3 years ago
- 历朝代诗词数据集,以及简单展示页面。其中数据集包括三国、五代十国、南北朝、晋、秦、汉、唐、宋、金、元、明和清的诗词曲,另外有两个版本的全唐诗。☆77Updated 2 years ago
- 殆知阁古代文献☆1,323Updated 8 months ago
- 中华经典古籍精校、诗词,四书五经、四大名著、诗经、楚辞、全唐诗、全宋词、唐诗三百首、宋詞三百首、二十四史......☆86Updated 3 years ago
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆76Updated 4 years ago
- 《现代汉语词典》(第7版)全文TXT☆253Updated 6 months ago
- 汉字数据集,包括汉字的相关信息,例如笔画数、部首、拼音、英文释义/同义词等。☆113Updated 4 years ago
- 非常全的文言文(古文)-现代文平行语料☆1,237Updated 8 months ago
- 中文汉语拼音辞典,汉字拼音字典,词典,成语词典,常用字、多音字字典数据库☆527Updated last year
- Dataset for couplets. 70万条对联数据库。☆720Updated 6 years ago
- THUOCL(THU Open Chinese Lexicon)中文词库☆888Updated last year
- chatbot based on music region using method including es and music kb.基于14W歌曲知识库的问答尝试,功能包括歌词接龙,已知歌词找歌曲以及歌曲歌手歌词三角关系的问答。☆270Updated 6 years ago
- 非常全的古诗词数据,收录了从先秦到现代的共计85万余首古诗词。☆1,581Updated last year
- Poetry-related datasets developed by THUAIPoet (Jiuge) group.☆218Updated 4 years ago
- 字词:收集国学/汉语字词拼音相关资源☆29Updated 6 years ago