i3ef0xh4ck / the-most-complete-dictionary-ever
The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。
☆70Updated 4 years ago
Related projects ⓘ
Alternatives and complementary repositories for the-most-complete-dictionary-ever
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆147Updated 3 years ago
- 收集的各类字典,欢迎大家提交。(专业、中草药、中药、交通、停用词、动物、健康、国家、地名、学校、植物、汽车品牌)☆70Updated 4 years ago
- 中文心理问答数据集☆67Updated 4 years ago
- PersonGraphDataSet, nearly 10 thousand person2person relationship facts。 人物图谱数据集,近十万的人物关系图谱事实数据库,通过人物关系抽取算法抽取+人工整理得出,可用于人物关系搜索、查询、人物关系多跳问…☆239Updated 3 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆116Updated 6 years ago
- This is the dataset for Chinese community medical question answering.☆96Updated 5 years ago
- 金庸小说人物关系图谱构建☆63Updated 5 years ago
- 爬取自互联网的古诗词语料库,包含先秦至当代诗词,共计1014508首诗☆26Updated 2 years ago
- 维基百科中文语料整理☆291Updated 6 years ago
- 人民日报语料处理工具集 | Tools for Corpus of People's Daily☆268Updated last year
- 各大中文分词性能评测☆154Updated 5 years ago
- 医疗实体识别☆177Updated 3 years ago
- 调研药品数据网站。基于网络爬虫爬取药源网药物数据,搭建药品数据库。含中成药和化学药品信息共计10万余条。爬取国家食品药品监督管理局药品数据对药源网数据进行修正。基于Selenium等工具应对反爬,爬取ICD10等数据共研究使用。☆105Updated 5 years ago
- 图书名语料库。含部分电影、游戏名称。☆66Updated 7 months ago
- Chinese Word2vec Medicine,中文医学词向量☆160Updated 7 months ago
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆115Updated last year
- 大创项目:中医药知识图谱构建☆95Updated 4 years ago
- “万创杯”中医药天池大数据竞赛——中医文献问题生成挑战 决赛 第一名方案☆129Updated 3 years ago
- 基于知识图谱的问答系统☆133Updated 4 years ago
- 中文生物医学自然语言处理(Chinese-BioNLP)☆156Updated 3 years ago
- 近代汉语语料库数据集 自然语言处理 语料库 古代汉语 古汉语 文言文 数字人文 计算语言☆147Updated last year
- 发现新词 无监督词库生成 医学词库生成 发现未登录词☆77Updated 3 years ago
- 中文谐音词/字库(同音词/字)Chinese Homophones☆96Updated 5 years ago
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆211Updated 6 years ago
- WordMultiSenseDisambiguation, chinese multi-wordsense disambiguation based on online bake knowledge base and semantic embedding similarit…☆124Updated 5 years ago
- 中文纠错☆91Updated 2 years ago
- 古文现代文翻译平行语料库☆96Updated 2 years ago
- 汉字字符特征提取工具,可以提取出字符中的字音(声母、韵母、声调)、字形(偏旁、部首)、四角编码等特征,同时可作为tensor输入到模型☆128Updated 4 years ago
- 中文医学知识图谱命名实体识别,包括bi-LSTM+CRF,transformer+CRF等模型☆234Updated 5 years ago