jaaack-wang / ccnc
CCNC: A Comprehensive Chinese Name Corpus (3.65M name samples). 大型中文姓名语料库 (内含365万姓名语例)。
☆32Updated 3 years ago
Related projects ⓘ
Alternatives and complementary repositories for ccnc
- mirror of dongxiexidian/Chinese☆285Updated 5 years ago
- 汉字笔画库☆81Updated 3 years ago
- 医疗语料库。医疗机构名语料库。药品本位码。☆57Updated 7 months ago
- 手把手教你搭建人工智能AI写诗平台,从模型搭建到前后端开发到SEO优化推广☆234Updated 2 years ago
- 小说人名统计和关系提取(基于HanLP)☆38Updated 5 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感 词、问答、问答数据、知识图谱、文本语料。☆147Updated 3 years ago
- 物种名称语料库。植物名,动物名。☆41Updated 7 months ago
- 一个比较好看的WEB聊天界面UI☆104Updated last year
- This is a corpus of Chinese abbreviation, including negative full forms.☆189Updated 3 years ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆105Updated last year
- 图书名语料库。含部分电影、游戏名称。☆66Updated 7 months ago
- 爬取自互联网的古诗词语料库,包含先秦至当代诗词,共计1014508首诗☆26Updated 2 years ago
- 中文预处理语料☆106Updated 5 years ago
- 百度汉语字典爬虫,拼音数据,35万海量百度词典数据。☆23Updated 2 years ago
- ChatGLM 6B 的模型与UI,通过 LangChain 与向量匹配实现本地知识库问答,支持流式输出☆109Updated last year
- 古诗词语料库☆120Updated 7 years ago
- chatbot based on music region using method including es and music kb.基于14W歌曲知识库的问答尝试,功能包括歌词接龙,已知歌词找歌曲以及歌曲歌手歌词三角关系的问答。☆270Updated 6 years ago
- 收集的一些敏感词汇,挺全的,还细分了暴恐词库、反动词库、民生词库、色情词库、贪腐词库、其他词库等☆384Updated 7 years ago
- Easy-to-use CPM for Chinese text generation(基于CPM的中文文本生成)☆525Updated last year
- CBDB中国历代人物资料库可视化项目☆47Updated last year
- 中文地址分词(地址元素识别与抽取),通过序列标注进行NER☆192Updated 4 years ago
- clueai工具包: 3行代码3分钟,自定义需要的API!☆231Updated last year
- 中文文本相似度计算器☆116Updated last month
- 渊 - A project for Classical Chinese☆94Updated 2 years ago
- 流水线系统(pipeline)构建基于本地知识库的ChatGLM问答☆86Updated last year
- 比较全的中华古诗古词古文库,包括21万首古诗词,以及注释、赏析等信息,包含10000多名诗人以及诗人的介绍、生平等,同时包含,1600多个词牌介绍,中国70多个朝代解析,和古诗文的近200个分类标签☆312Updated last year
- 中文日期/时间/数字量提取工具☆64Updated 4 years ago
- ChatGLM-6B-Slim:裁减掉20K图片Token的ChatGLM-6B,完全一样的性能,占用更小的显存。☆126Updated last year