mahavivo / scripta-sinica
汉语古典文本资料库
☆275Updated 7 years ago
Alternatives and similar repositories for scripta-sinica:
Users that are interested in scripta-sinica are comparing it to the libraries listed below
- 比较全的中华古诗古词古文库,包括21万首古诗词,以及注释、赏析等信息,包含10000多名诗人以及诗人的介绍、生平等,同时包含,1600多个词牌介绍,中国70多个朝代解析,和古诗文的近200个分类标签☆348Updated last year
- 古文现代文翻译平行语料库☆102Updated 3 years ago
- 近代汉语语料库数据集 自然语言处理 语料库 古代汉语 古汉语 文言文 数字人文 计算语言☆156Updated last month
- 中国诗词歌赋数据库 总计82万余首(827108) CSV 格式 简体中文 按照number有序☆59Updated 2 months ago
- 古诗词语料库☆130Updated 8 years ago
- 中华经典古籍精校、诗词,四书五经、四大名著、诗经、楚辞、全唐诗、全宋词、唐诗三百首、宋詞三百首、二十四史......☆91Updated 4 years ago
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆77Updated 5 years ago
- GuwenModels: 古文自然语言处理模型合集, 收录互联网上的古文相关模型及资源. A collection of Classical Chinese natural language processing models, including Classical Ch…☆174Updated last year
- 汉字拆字库,可以将汉字拆解成偏旁部首,在机器学习中作为汉字的字形特征 | Hanzi Decomposition Library allows Chinese characters to be broken down into radicals and components…☆368Updated 5 months ago
- 甲言,专注于古代汉语(古汉语/古文/文言文/文言)处理的NLP工具包,支持文言词库构建、分词、词性标注、断句和标点。Jiayan, the 1st NLP toolkit designed for Classical Chinese, supports lexicon co…☆610Updated 3 years ago
- GuwenBERT: 古文预训练语言模型(古文BERT) A Pre-trained Language Model for Classical Chinese (Literary Chinese)☆528Updated 3 years ago
- 古汉语(文言文)字典-爬取文言文字典网,制作Kindle字典.☆66Updated 6 years ago
- 汉字数据集,包括汉字的相关信息,例如笔画数、部首、拼音、英文释义/同义词等。☆115Updated 4 years ago
- 《现代汉语词典》(第7版)全文TXT☆266Updated 9 months ago
- 中学语文课文——文言文古诗词☆32Updated 6 years ago
- 古典中文語料庫☆285Updated 2 years ago
- 中國古代基本典籍☆58Updated 2 years ago
- chatbot based on music region using method including es and music kb.基于14W歌曲知识库的问答尝试,功能包括歌词接龙,已知歌词找歌曲以及歌曲歌手歌词三角关系的问答。☆271Updated 6 years ago
- 历朝代诗词数据集,以及简单展示页面。其中数据集包括三国、五代十国、南北朝、晋、秦、汉、唐、宋、金、元、明和清的诗词曲,另外有两个版本的全唐诗。☆81Updated 2 years ago
- 中文相关词典和语料库。☆173Updated 10 years ago
- 殆知阁古代文献☆1,362Updated 11 months ago
- 漢語拆字字典☆771Updated 2 years ago
- 10W首中文歌词数据库☆468Updated 3 years ago
- 汉字笔画整理,数据来源是一个提供汉字查询的网站☆32Updated 8 years ago
- 维基百科中文语料整理☆296Updated 7 years ago
- 中华古诗文数据库和API。包含10000首古文(诗、词、歌、赋以及其它形式的文言文),近4000名作者,10000名句☆477Updated 8 months ago
- 华夏文明给我们留下了浩如烟海的文献典籍,古籍的数字化可以让大众更方便更大范围的享受这一文化大餐,弥补不能接触原典的遗憾。古籍数字化中汉字分割是关键环节,诚邀您共同参与。古籍汉字切分算法研究:将古籍扫描图片上的汉字切分出来的算法研究。☆18Updated 8 years ago
- The latest SQLite version of the China Biographical Database☆122Updated 7 months ago
- 对常用的6700个汉字进行音、形比较,输出音近字、形近字的列表。 # 相近字☆455Updated last year
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆127Updated last year