jaaack-wang / ccnc
CCNC: A Comprehensive Chinese Name Corpus (3.65M name samples). 大型中文姓名语料库 (内含365万姓名语例)。
☆36Updated 3 years ago
Alternatives and similar repositories for ccnc:
Users that are interested in ccnc are comparing it to the libraries listed below
- 中文、分词、 词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆149Updated 3 years ago
- 医疗语料库。医疗机构名语料库。药品本位码。☆63Updated 10 months ago
- 菜谱名语料库。☆15Updated 3 years ago
- 汉字笔画库☆82Updated 4 years ago
- 物种名称语料库。植物名,动物名。☆45Updated 10 months ago
- mirror of dongxiexidian/Chinese☆286Updated 6 years ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆109Updated last year
- 中文心理问答数据集☆72Updated 4 years ago
- clueai工具包: 3行代码3分钟,自定义需要的API!☆231Updated last year
- 中文文本相似度计算器☆132Updated 3 months ago
- 小说人名统计和关系提取(基于HanLP)☆39Updated 5 years ago
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆698Updated last year
- 流水线系统(pipeline)构建基于本地知识库的ChatGLM问答☆86Updated last year
- jcorrector 中文文本纠错工具, Text Error Correction Tool,Spelling Check☆58Updated 2 years ago
- 首个llama2 13b 中文版模型 (Base + 中文对话SFT,实现流畅多轮人机自然语言交互)☆89Updated last year
- 打造人人都会的NLP,开源不易,记得star哦☆100Updated last year
- 自然语言处理工具Macropodus,基于Albert+BiLSTM+CRF深度学习网络架构,中文分词,词性标注,命名实体识别,新词发现,关键词,文本摘要,文本相似度,科学计算器,中文数字阿拉伯数字(罗马数字)转换,中文繁简转换,拼音转换。tookit(tool) of N…☆659Updated last year
- 中文预处理语料☆106Updated 6 years ago
- 中文地址分词(地址元素识别与抽取),通过序列标注进行NER☆193Updated 4 years ago
- 图书名语料库。含部分电影、游戏名称。☆68Updated 10 months ago
- Python3 package for Chinese/English OCR, with paddleocr-v4 onnx model(~14MB). 基于ppocr-v4-onnx模型推理,可实现 CPU 上毫秒级的 OCR 精准预测,通用场景中英文OCR达到开源SO…☆55Updated last week
- 中文词库/词典,可用于NLP项目、分词等场景☆47Updated 2 years ago
- 行业知识图谱,关系抽取,数据清洗,ncov,疫情数据,百科,医疗,保险,汽车,垃圾分类,产业链,投资,高考,行业专家圈子,CXO圈子☆97Updated 6 months ago
- Lexicon for Chinese lexical analyzing, 中文语言分词词库☆118Updated 3 years ago
- 敏感词过滤系统☆58Updated 9 years ago
- Q&A based on elasticsearch+langchain+chatglm2 | 基于elasticsearch,langchain,chatglm2的自有知识库问答☆234Updated last year
- 一个比较好看的WEB聊天界面UI☆105Updated 2 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- Predicting gender of given Chinese names (93~99% test set accuracy). 预测中文姓名的性别(93~99%的测试集准确率)。☆18Updated 2 years ago
- A convenient Chinese word segmentation tool 简便中文分词器☆46Updated 3 weeks ago