CyberCommy / baidu-wiki-500wLinks
百度百科 500 万数据集
☆37Updated last year
Alternatives and similar repositories for baidu-wiki-500w
Users that are interested in baidu-wiki-500w are comparing it to the libraries listed below
Sorting:
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆165Updated 3 years ago
- 百度QA100万数据集☆47Updated last year
- 天池比赛作品整理。实现从pdf中提取出姓名、出生年月、性别、电话、最高学历、籍贯、落户市县、政治面貌、毕业院校、工作单位、工作内容、职务、项目名称、项目责任、学位、毕业时间、工作时间、项目时间共18个字段。☆114Updated 11 months ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆52Updated 4 months ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated 2 years ago
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆33Updated 2 years ago
- PersonGraphDataSet, nearly 10 thousand person2person relationship facts。 人物图谱数据集,近十万的人物关系图谱事实数据库,通过人物关系抽取算法抽取+人工整理得出,可用于人物关系搜索、查询、人物关系多跳问…☆249Updated 4 years ago
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆78Updated 5 years ago
- 医疗语料库。医疗机构名语料库。药品本位码。☆69Updated last year
- clueai工具包: 3行代码3分钟,自定义需要的API!☆233Updated 2 years ago
- A convenient Chinese word segmentation tool 简便中文分词器☆46Updated 2 months ago
- 千问14B和7B的逐行解释☆60Updated last year
- 在中文开源大模型的基础上进行定制化的微调,拥有自己专属的语言模型。☆48Updated 2 years ago
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆31Updated last year
- ☆21Updated 3 years ago
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆56Updated 5 years ago
- 行业知识图谱,关系抽取,数据清洗,ncov,疫情数据,百科,医疗,保险,汽车,垃圾分类,产业链,投资,高考,行业专家圈子,CXO圈子☆111Updated last year
- Transformer模型训练的单轮对话聊天机器人☆83Updated 3 years ago
- 中文图书数据集/数据挖掘/自然语言处理/中国图书分类法/图书情报学/数据挖掘/文本分类/☆90Updated 4 months ago
- 知乎大语言模型、ChatGPT、Transformers问答☆38Updated last year
- 打造人人都会的NLP,开源不易,记得star哦☆101Updated 2 years ago
- 中文AI写作(写诗或写对联)☆121Updated last year
- 文本自动摘要☆94Updated 2 years ago
- "桃李“: 国际中文教育大模型☆182Updated last year
- ChatGLM2-6B微调, SFT/LoRA, instruction finetune☆108Updated last year
- 纯c++的全平台llm加速库,支持python调用,支持baichuan, glm, llama, moss基座,手机端流畅运行chatglm-6B级模型单卡可达10000+token / s,☆45Updated last year
- LLama3中文个人版本☆39Updated last year
- 金庸小说人物关系图谱构建☆63Updated 5 years ago
- 京东/淘宝客服对话数据公开,seq2seq生成模型设计对话系统获第二名☆44Updated 2 years ago
- 中文纠错☆92Updated 3 years ago