CyberCommy / baidu-wiki-500wLinks
百度百科 500 万数据集
☆43Updated last year
Alternatives and similar repositories for baidu-wiki-500w
Users that are interested in baidu-wiki-500w are comparing it to the libraries listed below
Sorting:
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆170Updated 4 years ago
- 百度QA100万数据集☆47Updated last year
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆83Updated 5 years ago
- 首个llama2 13b 中文版模型 (Base + 中文对话SFT,实现流畅多轮人机自然语言交互)☆91Updated 2 years ago
- 千问14B和7B的逐行解释☆63Updated 2 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆16Updated 2 years ago
- "桃李“: 国际中文教育大模型☆187Updated 2 years ago
- 中文心理问答数据集☆78Updated 5 years ago
- 医疗语料库。医疗机构名语料库。药品本位码。☆69Updated last year
- clueai工具包: 3行代码3分钟,自定义需要的API!☆231Updated 2 years ago
- PersonGraphDataSet, nearly 10 thousand person2person relationship facts。 人物图谱数据集,近十万的人物关系图谱事实数据库,通过人物关系抽取算法抽取+人工整理得出,可用于人物关系搜索、查询、人物关系多跳问…☆254Updated 4 years ago
- 打造人人都会的NLP,开源不易,记得star哦☆101Updated 2 years ago
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆157Updated last year
- 中国知网论文数据集,24000+篇论文信息。自然语言处 理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 8 months ago
- 京东/淘宝客服对话数据公开,seq2seq生成模型设计对话系统获第二名☆44Updated 2 years ago
- 文本自动摘要☆93Updated 2 years ago
- A Multi-Modal Dataset of Chinese Governmental Docunments☆38Updated 4 years ago
- SuperCLUE琅琊榜:中文通用大模型匿名对战评价基准☆145Updated last year
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆132Updated 2 years ago
- 大语言模型ChatGLM-6B为基座,接入文档阅读功能进行实时问答,可上传txt/docx/pdf多种文件类型。☆42Updated 2 years ago
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆38Updated last year
- 中文AI写作(写诗或写对联)☆123Updated last year
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆34Updated 3 years ago
- Datawhale自研数据标注工具☆71Updated last year
- 🤖 聊天机器人示例,定制聊天机器人,聊天机器人语料导入导出☆128Updated last year
- 在中文开源大模型的基础上进行定制化的微调,拥有自己专属的语言模型。☆51Updated 2 years ago
- 手动实现Elasticsearch的倒排索引以及BM25算法☆47Updated 6 years ago
- Tracking the hot Github repos and update daily 每天自动追踪Github热门项目☆49Updated this week
- 基于人工智能标记语言 (AIML)和开放域问答(WebQA)的深度智能对话模型☆84Updated 6 years ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆75Updated 11 months ago