MenglinLu / Web-crawler
调研药品数据网站。基于网络爬虫爬取药源网药物数据,搭建药品数据库。含中成药和化学药品信息共计10万余条。爬取国家食品药品监督管理局药品数据对药源网数据进行修正。基于Selenium等工具应对反爬,爬取ICD10等数据共研究使用。
☆107Updated 5 years ago
Alternatives and similar repositories for Web-crawler:
Users that are interested in Web-crawler are comparing it to the libraries listed below
- 大创项目:中医药知识图谱构建☆100Updated 4 years ago
- 基于中医药知识图谱智能问答☆155Updated 4 years ago
- 中医妇科自动组方☆40Updated 5 years ago
- 中医药自动组方☆76Updated 6 years ago
- 中医药知识图谱探索demo:数据集、介绍文章、可视化结果☆81Updated 2 years ago
- 中医智能检索系统 TCM-Retrieval-System☆28Updated 5 years ago
- 知识图谱构建,自动问答,基于kg的自动问答。以疾病为中心的一定规模医药领域知识图谱,并以该知识图谱完成自动问答与分析服务。☆33Updated 5 years ago
- 中医药的三元组分类☆23Updated 6 years ago
- 手工整理医疗行业词汇、术语等语料。可用于语音识别、对话系统等各类nlp模型训练。☆111Updated 4 years ago
- Chinese Word2vec Medicine,中文医学词向量☆164Updated 9 months ago
- 用于管理中医药数据库文件及其说明文档。☆37Updated 11 years ago
- 中文医疗问答数据集☆40Updated 4 years ago
- 从药智数据网站爬取药品信息,说明书和图片☆18Updated 6 years ago
- 中文心理问答数据集☆72Updated 4 years ago
- 发现新词 无监督词库生成 医学词库生成 发现未登录词☆77Updated 4 years ago
- ☆62Updated last year
- 医疗保险领域知识图谱☆128Updated 6 years ago
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆76Updated 4 years ago
- 中文生物医学自然语言处理(Chinese-BioNLP)☆159Updated 3 years ago
- 医疗图谱,Python前期数据抓取与处理,后期配合neo4j实现图谱构造与实体搜索。☆52Updated 5 years ago
- CCKS2019中文命名实体识别任务。从医疗文本中识别疾病和诊断、解剖部位、影像检查、实验室检验、手术和药物6种命名实体。现已实现基于jieba和AC自动机的baseline构建、基于BiLSTM和CRF的序列标住模型构建。bert的部分代码主要源于https://gith…☆349Updated 2 years ago
- 本项目源自中科院软件所刘焕勇老师的开源项目(QABasedOnMedicaKnowledgeGraph). 立足医药领域,以垂直型医药网站为数据来源. 以疾病为核心,构建起一个包含7类规模为4.4万的知识实体,11类规模约30万实体关系的知识图谱.☆33Updated 3 years ago
- 中医古籍语料☆25Updated 4 years ago
- ☆84Updated 9 months ago
- 收集的各类字典,欢迎大家提交。(专业、中草药、中药、交通、停用词、动物、健康、国家、地名、学校、植物、汽车品牌)☆69Updated 4 years ago
- 医疗语料库。医疗机构名语料库。药品本位码。☆63Updated 9 months ago
- 中医骨科电子病历数据集☆13Updated 5 years ago
- 本项目是针对医疗数据,进行命名实体识别。项目中有600份标注好的电子病历文本,共需识别含解剖部位、独立症状、症状描述、手术和药物五类实体。该领域的命名实体识别问题是自然语言处理中经典的序列标注问题。☆147Updated 5 years ago
- 中医药术语识别,使用CNN-BILSTM-CRF模型对9000条训练数据和1000条测试数据进行处理,最终测试数据正确率为90+%。为方便使用,使用Tkinter对模型进行封装使用☆10Updated 4 years ago
- 法律知识图谱网站。A legal knowledge graph web project.☆16Updated 6 years ago