i3ef0xh4ck / the-most-complete-dictionary-ever
The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。
☆76Updated 4 years ago
Alternatives and similar repositories for the-most-complete-dictionary-ever:
Users that are interested in the-most-complete-dictionary-ever are comparing it to the libraries listed below
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆152Updated 3 years ago
- 收集的各类字典,欢迎大家提交。(专业、中草药、中药、交通、停用词、动物、健康、国家、地名、学校、植物、汽车品牌)☆70Updated 4 years ago
- 手工整理医疗行业词汇、术语等语料。可用于语音识别、对话系统等各类nlp模型训练。☆113Updated 4 years ago
- GuwenModels: 古文自然语言处理模型合集, 收录互联网上的古文相关模型及资源. A collection of Classical Chinese natural language processing models, including Classical Ch…☆168Updated last year
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆215Updated 6 years ago
- 中文心理问答数据集☆72Updated 4 years ago
- 人民日报语料处理工具集 | Tools for Corpus of People's Daily☆274Updated last year
- “万创杯”中医药天池大数据竞赛——中医文献问题生成挑战 决赛 第一名方案☆132Updated 4 years ago
- 古诗词语料库☆125Updated 7 years ago
- 各大中文分词性能评测☆155Updated 6 years ago
- 爬取自互联网的古诗词语料库,包含先秦至当代诗词,共计1014508首诗☆29Updated 2 years ago
- 中文纠错☆92Updated 2 years ago
- 图书名语料库。含部分电影、游戏名称。☆68Updated 10 months ago
- 中文生物医学自然语言处理(Chinese-BioNLP)☆159Updated 4 years ago
- 物种名称语料库。植物名,动物名。☆45Updated 10 months ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 6 years ago
- 医疗语料库。医疗机构名语料库。药品本位码。☆64Updated 10 months ago
- 结合BERT+GRU+ATT模型,对自己收集的人物关系数据进行模型训练,用于人物关系抽取。☆318Updated last year
- 中文图书数据集/数据挖掘/自然语言处理/中国图书分类法/图书情报学/数据挖掘/文本分类/☆85Updated 2 months ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆46Updated 2 months ago
- PersonGraphDataSet, nearly 10 thousand person2person relationship facts。 人物图谱数据集,近十万的人物关系图谱事实数据库,通过人物关系抽取算法抽取+人工整理得出,可用于人物关系搜索、查询、人物关系多跳问…☆241Updated 4 years ago
- 基于知识图谱的问答系统☆134Updated 4 years ago
- 大创项目:中医药知识图谱构建☆103Updated 4 years ago
- 提供一款中文版生成式摘要服务☆336Updated this week
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- 汉字字符特征提取工具,可以提取出字符中的字音(声母、韵母、声调)、字形(偏旁、部首)、四角编码等特征,同时可作为tensor输入到 模型☆130Updated 4 years ago
- Chinese Classic Poem Mining Project including corpus buiding by spyder and content analysis by nlp methods, 基于爬虫与nlp的中国古代诗词文本挖掘项目☆107Updated 6 years ago
- 基于深度学习的FAQ式问答系统☆34Updated 3 years ago
- 构建医疗实体识别的模型,包含词典和语料标注,基于python构建☆337Updated 7 years ago
- 中文医疗问答数据集☆41Updated 4 years ago