hsc748NLP / code-for-digital-humanities-tutorial
<数字人文教程>资源合集
☆89Updated 7 months ago
Alternatives and similar repositories for code-for-digital-humanities-tutorial:
Users that are interested in code-for-digital-humanities-tutorial are comparing it to the libraries listed below
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆119Updated last year
- GuwenModels: 古文自然语言处理模型合集, 收录互联网上的古文相关模型及资源. A collection of Classical Chinese natural language processing models, including Classical Ch…☆164Updated last year
- ☆270Updated last month
- ☆31Updated last year
- 一个面向繁体中文古籍分词的python工具包☆31Updated 3 years ago
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆155Updated 2 months ago
- 渊 - A project for Classical Chinese☆95Updated 2 years ago
- "桃李“: 国际中文教育大模型☆172Updated last year
- 中文心理问答数据集☆72Updated 4 years ago
- 古文现代文翻译平行语料库☆100Updated 3 years ago
- 术语词典数据集/分词词典/专业词表语料库/词汇知识库/领域词表下载/主题词表/词库/自然语言处理/数据挖掘/深度学习☆26Updated 4 years ago
- CINO: Pre-trained Language Models for Chinese Minority (少数民族语言预训练模型)☆224Updated last year
- a Corpus for Classical Chinese Language Event Extraction☆17Updated last year
- 打造人人都会的NLP,开源不易,记得star哦☆101Updated last year
- 基于中医药知识图谱智能问答☆155Updated 4 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆149Updated 3 years ago
- 文本分析包,支持字数统计、可读性、文档相似度、情感分析在内的多种文本分析方法。chinese text sentiment analysis☆303Updated 5 months ago
- A NLP package for Chinese text:Preprocessing, Tokenization, Chinese Fonts, Word Embeddings, Text Similarity and Sentiment Analysis 轻量级中文自…☆22Updated 2 months ago
- 中文标注工具,支持NER、文本分类、关系标注、对话标注等。☆67Updated 5 months ago
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆76Updated 4 years ago
- 本仓库是基于bert4keras实现的古文-现代文翻译模型。具体使用了基于掩码自注意力机制的UNILM(Li al., 2019)预训练模型作为翻译系统的backbone。我们首先使用了普通的中文(现代文)BERT、Roberta权重作为UNILM的初始权重以训练UNILM…☆45Updated 2 years ago
- 爬取自互联网的古诗词语料库,包含先秦至当代诗词,共计1014508首诗☆29Updated 2 years ago
- 古文语言理解测评基准 Classical Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard☆47Updated last year
- 中文AI写作(写诗或写对联)☆115Updated 10 months ago
- Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目☆309Updated 6 years ago
- 基于Rasa框架实现的智能医疗机器人 功能包含: 医药问答 智能问药 疾病诊断 病症查询 症状查询 闲聊 天气查询 语音对话 使用手段包括: rasa框架 知识图谱 neo4j数据库 语音识别 语音合成 开放API 等功能☆176Updated last month
- 黄帝(Huang-Di)模型仓库,基于Ziya-LLaMA-13B-V1的中医古籍知识问答大模型。☆102Updated last month
- 大创项目:中医药知识图谱构建☆100Updated 4 years ago
- 基于pytorch的中文意图识别和槽位填充☆154Updated 6 months ago
- 甲言,专注于古代汉语(古汉语/古文/文言文/文言)处理的NLP工具包,支持文言词库构建、分词、词性标注、断句和标点。Jiayan, the 1st NLP toolkit designed for Classical Chinese, supports lexicon co…☆595Updated 3 years ago