jaaack-wang / ccncLinks
CCNC: A Comprehensive Chinese Name Corpus (3.65M name samples). 大型中文姓名语料库 (内含365万姓名语例)。
☆40Updated 3 years ago
Alternatives and similar repositories for ccnc
Users that are interested in ccnc are comparing it to the libraries listed below
Sorting:
- mirror of dongxiexidian/Chinese☆301Updated 6 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆164Updated 3 years ago
- 术语词典数据集/分词词典/专业词表语料库/词汇知识库/领域词表下载/主题词表/词库/自然语言处理/数据挖掘/深度学习☆29Updated 3 months ago
- 物种名称语料库。植物名,动物名。☆48Updated last year
- 医疗语料库。医疗机构名语料库。药品本位码。☆69Updated last year
- 中文文本错别字检测以及自动纠错 / Autochecker & autocorrecter for chinese☆296Updated 7 years ago
- 图书名语料库。含部分电影、游戏名称。☆71Updated last year
- DomainWordsDict, Chinese words dict that contains more than 68 domains, which can be used as text classification、knowledge enhance task。…☆706Updated 3 years ago
- 菜谱名语料库。☆15Updated 3 years ago
- This is a corpus of Chinese abbreviation, including negative full forms.☆196Updated 3 years ago
- 近代汉语语料库数据集 自然语言处理 语料库 古代汉语 古汉语 文言文 数字人文 计算语言☆162Updated 3 months ago
- ChineseSemanticKB,chinese semantic knowledge base, 面向中文处理的12类、百万规模的语义常用词典,包括34万抽象语义库、34万反义语义库、43万同义语义库等,可支持句子扩展、转写、事件抽象与泛化等多种应用场景。☆756Updated 2 years ago
- 爬取自互联网的古诗词语料库,包含先秦至当代诗词,共计1014508首诗☆32Updated 3 years ago
- 中文 NLP 资源库,语料库,相关的框架,文章收集。☆26Updated 3 years ago
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆155Updated 7 months ago
- Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目☆342Updated 6 years ago
- Easy-to-use CPM for Chinese text generation(基于CPM的中文文本生成)☆533Updated 2 years ago
- 自然语言处理工具Macropodus,基于Albert+BiLSTM+CRF深度学习网络架构,中文分词,词性标注,命名实体识别,新词发现,关键词,文本摘要,文本相似度,科学计算器,中文数字阿拉伯数字(罗马数字)转换,中文繁简转换,拼音转换。tookit(tool) of N…☆663Updated 2 years ago
- 百度汉语字典爬虫,拼音数据,35万海量百度词典数据。☆26Updated 2 years ago
- 适用于中文分词的经济金融词典☆82Updated 4 years ago
- GPT2 training script for Chinese in Tensorflow 2.0☆153Updated 3 years ago
- company name parser, extract company name brand. 中文公司名称分词工具,支持公司名称中的地名,品牌名(主词),行业词,公司名后缀提取。☆90Updated 2 years ago
- chatbot based on music region using method including es and music kb.基于14W歌曲知识库的问答尝试,功能包括歌词接龙,已知歌词找歌曲以及歌曲歌手歌词三角关系的问答。☆271Updated 6 years ago
- 中国大陆 31 个省份最近几日新增工商企业注册信息以及其他部分企业数据,大概100余万信息,包含企业名称、注册地址、统一社会信用代码、省份、城市、注册日期、经营范围、负责人、邮箱、注册资金、企业类型等资料。 In 31 provinces in mainland China…☆176Updated 5 years ago
- 中文地址提取工具,支持中国三级区划地址(省、市、区)提取和映射,支持地址热力图绘制。☆226Updated 7 months ago
- <数字人文教程>资源合集☆101Updated last year
- 中文文本改写☆19Updated 4 years ago
- 📦 快速转化「中文数字」和「阿拉伯数字」~ (最新特性:分数,日期、温度等转化)☆728Updated 5 months ago
- Lexicon for Chinese lexical analyzing, 中文语言分词词库☆118Updated 3 years ago
- 中文文本相似度计算器☆149Updated 8 months ago