hsc748NLP / code-for-digital-humanities-tutorial
<数字人文教程>资源合集
☆101Updated 11 months ago
Alternatives and similar repositories for code-for-digital-humanities-tutorial
Users that are interested in code-for-digital-humanities-tutorial are comparing it to the libraries listed below
Sorting:
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆129Updated last year
- GuwenModels: 古文自然语言处理模型合集, 收录互联网上的古文相关模型及资源. A collection of Classical Chinese natural language processing models, including Classical Ch…☆174Updated last year
- ☆297Updated last month
- 古文现代文翻译平行语料库☆104Updated 3 years ago
- ☆35Updated 2 years ago
- 一个面向繁体中文古籍分词的python工具包☆32Updated 3 years ago
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆155Updated 6 months ago
- "桃李“: 国际中文教育大模型☆179Updated last year
- 爬取自互联网的古诗词语料库,包含先秦至当代诗词,共计1014508首诗☆30Updated 3 years ago
- 基于ChineseAlpaca微调的,专精与古汉语翻译、古汉语断句的大语言模型☆18Updated last year
- CINO: Pre-trained Language Models for Chinese Minority (少数民族语言预训练模型)☆243Updated 2 years ago
- 渊 - A project for Classical Chinese☆104Updated 3 years ago
- 黄帝(Huang-Di)模型仓库,基于Ziya-LLaMA-13B-V1的中医古籍知识问答大模型。☆121Updated 5 months ago
- 古文语言理解测评基准 Classical Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard☆50Updated last year
- 中文心理问答数据集☆75Updated 5 years ago
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆77Updated 5 years ago
- Ancient Chinese Corpus with Word Sense Annotation☆49Updated 11 months ago
- text analysis, supporting multiple methods including word count, readability, document similarity, sentiment analysis, Word2Vec/GloVe, an…☆342Updated 2 weeks ago
- 基于pytorch的中文意图识别和槽位填充☆174Updated 10 months ago
- 中文标注工具,支持NER、文本分类、关系标注、对话标注等。☆75Updated 9 months ago
- 汉语古典文本资料库☆280Updated 7 years ago
- A Benchmark for Classical Chinese Based on a Crowdsourcing System.☆58Updated 3 years ago
- 本仓库是基于bert4keras实现的古文-现代文翻译模型。具体使用了基于掩码自注意力机制的UNILM(Li al., 2019)预训练模型作为翻译系统的backbone。我们首先使用了普通的中文(现代文)BERT、Roberta权重作为UNILM的初始权重以训练UNILM…☆49Updated 3 years ago
- a Corpus for Classical Chinese Language Event Extraction☆21Updated last year
- 近代汉语语料库数据集 自然语言处理 语料库 古代汉语 古汉语 文言文 数字人文 计算语言☆158Updated 2 months ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆162Updated 3 years ago
- 该资源将应用人工智能技术研究水族文化、文字和古籍。为更好的抢救和保护濒危水族文字和非物质文化遗产,作者申请并开源了该项目,主要通过人工智能技术识别水书,构建与汉字的自动翻译系统,实现水族本体和文献知识图谱构建,挖掘新词并溯源民族变迁历史。作者回到家乡贵州教书以来,对利用AI…☆43Updated last year
- 中文文本可读性分级数据集☆13Updated last year
- [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集☆628Updated last year
- A large high-quality corpus of Chinese synonyms 一个大型、高质量的中文同义词语料库。☆52Updated 3 years ago