jaaack-wang / ccnc
CCNC: A Comprehensive Chinese Name Corpus (3.65M name samples). 大型中文姓名语料库 (内含365万姓名语例)。
☆32Updated 3 years ago
Related projects ⓘ
Alternatives and complementary repositories for ccnc
- mirror of dongxiexidian/Chinese☆284Updated 5 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆147Updated 3 years ago
- 医疗语料库。医疗机构名语料库。药品本位码。☆57Updated 7 months ago
- 图书名语料库。含部分电影、游戏名称。☆66Updated 7 months ago
- 物种名称语料库。植物名,动物名。☆41Updated 7 months ago
- This is a corpus of Chinese abbreviation, including negative full forms.☆189Updated 3 years ago
- 中文日期/时间/数字量提取工具☆64Updated 4 years ago
- clueai工具包: 3行代码3分钟,自定义需要的API!☆231Updated last year
- 古诗词语料库☆120Updated 7 years ago
- company name parser, extract company name brand. 中文公司名称分词工具,支持公司名称中的地名,品牌名(主词),行业词,公司名后缀提取。☆82Updated 2 years ago
- chatbot based on music region using method including es and music kb.基于14W歌曲知识库的问答尝试,功能包括歌词接龙,已知歌词找歌曲以及歌曲歌手歌词三角关系的问答。☆269Updated 6 years ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆104Updated last year
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆152Updated last week
- 爬取自互联网的古诗词语料库,包含先秦至当代诗词,共计1014508首诗☆26Updated 2 years ago
- 中文文本改写☆19Updated 4 years ago
- tensorflow+bert+seq2seq 周公解梦。AI遇上玄学,说出你的梦境(dream),模型自动解析decode梦境的征兆。类似聊天机器人(chatbot,QA),你问我答。☆125Updated 4 years ago
- 中文预处理语料☆106Updated 5 years ago
- 汉字拆字库,可以将汉字拆解成偏旁部首,在机器学习中作为汉字的字形特征 | Hanzi Decomposition Library allows Chinese characters to be broken down into radicals and components…☆329Updated 3 weeks ago
- 中文心理问答数据集☆67Updated 4 years ago
- 菜谱名语料库。☆13Updated 3 years ago
- 打造人人都会的NLP,开源不易,记得star哦☆101Updated last year
- 整理开发中常用的各类API接口,当前有4大类:微信相关、数据及分析、开发专用、生活服务,如:天气预报、文档生成、身份证识别、代理IP等; 整理各种数据 包,如:中华古诗词数据、词库、敏感词表、医学词表、四六级英汉词典数据等☆58Updated 5 years ago
- 汉字笔画库☆80Updated 3 years ago
- 中文文本相似度计算器☆113Updated last month
- 基于sentence transformers和chatglm实现的文档搜索工具☆154Updated last year
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- 小说人名统计和关系提取(基于HanLP)☆38Updated 5 years ago
- ChatGLM-6B fine-tuning.☆135Updated last year