hsc748NLP / code-for-digital-humanities-tutorial
<数字人文教程>资源合集
☆91Updated 8 months ago
Alternatives and similar repositories for code-for-digital-humanities-tutorial:
Users that are interested in code-for-digital-humanities-tutorial are comparing it to the libraries listed below
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆121Updated last year
- GuwenModels: 古文自然语言处理模型合集, 收录互联网上的古文相关模型及资源. A collection of Classical Chinese natural language processing models, including Classical Ch…☆166Updated last year
- ☆272Updated 2 months ago
- 中文心理问答数据集☆72Updated 4 years ago
- 一个面向繁体中文古籍分词的python工具包☆32Updated 3 years ago
- ☆33Updated last year
- 古文现代文翻译平行语料库☆100Updated 3 years ago
- "桃李“: 国际中文教育大模型☆174Updated last year
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆155Updated 3 months ago
- 黄帝(Huang-Di)模型仓库,基于Ziya-LLaMA-13B-V1的中医古籍知识问答大模型。☆103Updated 2 months ago
- 中文标注工具,支持NER、文本分类、关系标注、对话标注等。☆66Updated 6 months ago
- 古文语言理解测评基准 Classical Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard☆47Updated last year
- 打造人人都会的NLP,开源不易,记得star哦☆100Updated last year
- 术语词典数据集/分词词典/专业词表语料库/词汇知识库/领域词表下载/主题词表/词库/自然语言处理/数据挖掘/深度学习☆26Updated 4 years ago
- 渊 - A project for Classical Chinese☆96Updated 2 years ago
- 基于中医药知识图谱智能问答☆159Updated 4 years ago
- 近代汉语语料库数据集 自然语言处理 语料库 古代汉语 古汉语 文言文 数字人文 计算语言☆152Updated 2 months ago
- Legal-Eagle-InternLM 是一个基于商汤科技和上海人工智能实验室推出的书生浦语大模型InternLM的法律问答机器人。旨在为用户提供符合3H(即Helpful、Honest、Harmless)原则的专业、智能、全面的法律服务的法律领域大模型。☆51Updated 11 months ago
- 供AI训练的中文数据集(持续更新。。。)与AI公司图谱,目前的数据集餐饮行业8000问,百度知道,Alpaca中文数据集,计算机领域数据集,Vicuna数据集,RedPajama数据集,Wikipedia中文词条数据集,网站论坛问答数据集☆55Updated last year
- Ancient Chinese Corpus with Word Sense Annotation☆46Updated 8 months ago
- AnchiBERT: A Pre-Trained Model for Ancient Chinese Language Understanding and Generation(古文预训练模型)☆63Updated 3 years ago
- Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目☆316Updated 6 years ago
- ☆87Updated 10 months ago
- 税收政策服务--政策爬虫,从国税总局,及其他税务相关机构的网站,爬取税收政策、解读、条约等信息,以备后续处理☆22Updated 5 years ago
- 该资源将应用人工智能技术研究水族文化、文字和古籍。为更好的抢救和保护濒危水族文字和非物质文化遗产,作者申请并开源了该项目,主要通过人工智能技术识别水书,构建与汉字的自动翻译系统,实现水族本体和文献知识图谱构建,挖掘新词并溯源民族变迁历史。作者回到家乡贵州教书以来,对利用AI…☆39Updated 9 months ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆110Updated last year
- 爬取自互联网的古诗词语料库,包含先秦至当代诗词,共计1014508首诗☆29Updated 2 years ago
- 律知, 法律咨询大模型☆38Updated last year
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆46Updated 2 months ago
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆110Updated 5 months ago