MenglinLu / Web-crawlerLinks
调研药品数据网站。基于网络爬虫爬取药源网药物数据,搭建药品数据库。含中成药和化学药品信息共计10万余条。爬取国家食品药品监督管理局药品数据对药源网数据进行修正。基于Selenium等工具应对反爬,爬取ICD10等数据共研究使用。
☆119Updated 5 years ago
Alternatives and similar repositories for Web-crawler
Users that are interested in Web-crawler are comparing it to the libraries listed below
Sorting:
- 大创项目:中医药知识图谱构建☆109Updated 4 years ago
- 手工整理医疗行业词汇、术语等语料。可用于语音识别、对话系统等各类nlp模型训练。☆120Updated 5 years ago
- 基于中医药知识图谱智能问答☆175Updated 5 years ago
- 中医智能检索系统 TCM-Retrieval-System☆30Updated 5 years ago
- 中医妇科自动组方☆43Updated 5 years ago
- 中医药自动组方☆82Updated 7 years ago
- 知识图谱构建,自动问答,基于kg的自动问答。以疾病为中心的一定规模医药领域知识图谱,并以该知识图谱完成自动问答与分析服务。☆33Updated 5 years ago
- ICD-10 Chinese Verion☆48Updated 8 years ago
- Chinese Word2vec Medicine,中文医学词向量☆186Updated 4 months ago
- A Patient Disease Drug Graph. 一个权威的医疗 RDF 数据集, 关于医疗知识图谱。☆75Updated 6 years ago
- 中文医疗问答数据集☆43Updated 5 years ago
- 本项目是针对医疗数据,进行命名实体识别。项目中有600份标注好的电子病历文本,共需识别含解剖部位、独立症状、症状描述、手术和药物五类实体。该领域的命名实体识别问题是自然语言处理中经典的序列标注问题。☆153Updated 6 years ago
- 医疗语料库。医疗机构名语料库。药品本位码。☆69Updated last year
- 行业知识图谱,关系抽取,数据清洗,ncov,疫情数据,百科,医疗,保险,汽车,垃圾分类,产业链,投资,高考,行业专家圈子,CXO圈子☆111Updated last year
- 医疗保险领域知识图谱☆132Updated 7 years ago
- 中文生物医学自然语言处理(Chinese-BioNLP)☆163Updated 4 years ago
- 构建医疗实体识别的模型,包含词典和语料标注,基于python构建☆343Updated 7 years ago
- 中医药知识图谱探索demo:数据集、介绍文章、可视化结果☆92Updated 3 years ago
- 一 个以化妆品为主题的知识图谱项目。目前包含3000节点,15000边,口红和香水两种品类。支持图谱检索、智能问答。A Knowledge Graph project about cosmetics. At present, there are 3000 nodes, 150…☆88Updated 2 years ago
- 中文医学知识图谱命名实体识别,包括bi-LSTM+CRF,transformer+CRF等模型☆246Updated 6 years ago
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆78Updated 5 years ago
- A Chinese EHR Bert Pretrained Model.☆261Updated 4 years ago
- Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目☆345Updated 6 years ago
- 人文历史知识图谱 三元组涵盖历史/文学/地理/军事/政治/艺术/科学技术史等学科领域 人物关系网络☆13Updated 4 years ago
- CCKS2019中文命名实体识别任务。从医疗文本中识别疾病和诊断、解剖部位、影像检查、实验室检验、手术和药物6种命名实体。现已实现基于jieba和AC自动机的baseline构建、基于BiLSTM和CRF的序列标住模型构建。bert的部分代码主要源于https://gith…☆352Updated 2 years ago
- 用于管理中医药数据库文件及其说明文档。☆38Updated 11 years ago
- 医疗实体识别☆182Updated 4 years ago
- 发现新词 无监督词库生成 医学词库生成 发现未登录词☆78Updated 4 years ago
- self summary after attending 2018全国知识图谱与语义计算大会,China Conference on Knowledge Graph and Semantic Computing☆244Updated 6 years ago
- spider for chinese medical websites with wechat notification enabled☆29Updated 8 years ago