hsc748NLP / code-for-digital-humanities-tutorial
<数字人文教程>资源合集
☆95Updated 9 months ago
Alternatives and similar repositories for code-for-digital-humanities-tutorial:
Users that are interested in code-for-digital-humanities-tutorial are comparing it to the libraries listed below
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆124Updated last year
- 中 文心理问答数据集☆73Updated 4 years ago
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆155Updated 4 months ago
- 一个面向繁体中文古籍分词的python工具包☆32Updated 3 years ago
- GuwenModels: 古文自然语言处理模型合集, 收录互联网上的古文相关模型及资源. A collection of Classical Chinese natural language processing models, including Classical Ch…☆173Updated last year
- 黄帝(Huang-Di)模型仓库,基于Ziya-LLaMA-13B-V1的中医古籍知识问答大模型。☆111Updated 3 months ago
- "桃李“: 国际中文教育大模型☆175Updated last year
- ☆280Updated 3 months ago
- 渊 - A project for Classical Chinese☆99Updated 3 years ago
- ☆33Updated 2 years ago
- 古文现代文翻译平行语料库☆101Updated 3 years ago
- A NLP package for Chinese text:Preprocessing, Tokenization, Chinese Fonts, Word Embeddings, Text Similarity and Sentiment Analysis 轻量级中文自…☆25Updated 4 months ago
- Legal-Eagle-InternLM 是一个基于商汤科技和上海人工智能实验室推出的书生浦语大模型InternLM的法律问答机器人。旨在为用户提供符合3H(即Helpful、Honest、Harmless)原则的专业、智能、全面的法律服务的法律领域大模型。☆55Updated last year
- 该资源将应用人工智能技术研究水族文化、文字和古籍。为更好的抢救和保护濒危水族文字和非物质文化遗产,作者申请并开源了该项目,主要通过人工智能技术识别水书,构建与汉字的自动翻译系统,实现水族本体和文献知识图谱构建,挖掘新词并溯源民族变迁历史。作者回到家乡贵州教书以来,对利用AI…☆40Updated 10 months ago
- 打造人人都会的NLP,开源不易,记得star哦☆101Updated last year
- 基于ChineseAlpaca微调的,专精与古汉语翻译、古汉语断句的大语言模型☆17Updated last year
- 古文语言理解测评基准 Classical Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard☆48Updated last year
- 供AI训练的中文数据集(持续更新。。。)与AI公司图谱,目前的数据集餐饮行业8000问,百度知道,Alpaca中文数据集,计算机领域数据集,Vicuna数据集,RedPajama数据集,Wikipedia中文词条数据集,网站论 坛问答数据集☆56Updated last year
- Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目☆330Updated 6 years ago
- ☆139Updated 8 months ago
- 在中文开源大模型的基础上进行定制化的微调,拥有自己专属的语言模型。☆47Updated last year
- 中文世界的NLP自动标注开源工具,简单样本,交给LabelFast。☆65Updated 2 months ago
- 中文标注工具,支持NER、文本分类、关系标注、对话标注等。☆68Updated 7 months ago
- 近代汉语语料库数据集 自然语言处理 语料库 古代汉语 古汉语 文言文 数字人文 计算语言☆153Updated 2 weeks ago
- 爬取自互联网的古诗词语料库,包含先秦至当代诗词,共计1014508首诗☆30Updated 3 years ago
- 文本分析包,支持字数统计、可读性、文档相似度、情感分析在内的多种文本分析方法。chinese text sentiment analysis☆323Updated this week
- 基于ChatGLM-6b+langchain实现本地化知识库检索与智能答案生成☆24Updated last year
- 从小说中提取对话数据集☆169Updated 9 months ago
- CINO: Pre-trained Language Models for Chinese Minority (少数民族语言预训练模型)☆233Updated 2 years ago
- ☆94Updated 11 months ago