shi-yuan / nmpa-data
国家药监局药品数据
☆45Updated 4 years ago
Alternatives and similar repositories for nmpa-data
Users that are interested in nmpa-data are comparing it to the libraries listed below
Sorting:
- 调研药品数据网站。基于网络爬虫爬取药源网药物数据,搭建药品数据库。含中成药和化学药品信息共计10万余条。爬取国家食品药品监督管理局药品数据对药源网数据进行修正。基于Selenium等工具应对反爬,爬取ICD10等数据共研究使用。☆116Updated 5 years ago
- 搜索引擎关键词排位爬虫,包括百度,搜狗,360的搜索引擎关键词排位爬虫,关键词从百度热词中取得,排位分别从三个搜索引擎中抓取。☆19Updated 5 years ago
- 通用新闻类网站分布式爬虫☆75Updated 6 years ago
- 淘宝商品详情+评论爬虫+天猫工商执照(Scrapy、Redis)☆26Updated 7 years ago
- 裁判文书数据-增量更新☆39Updated 5 years ago
- 无监督中文仿真评论自动生成。 Unsupervised Automatic Generation of Chinese Fake Reviews.☆84Updated 5 years ago
- 中医药自动组方☆82Updated 6 years ago
- 裁判文书网 Android App 详情及列表接口,2021/6/9加入用户校验, 列表接口失效, 但详情接口仍可用, 项目不再进行维护☆50Updated 3 years ago
- 使用python抓取京东全站数据(商品,店铺,分类,评论)☆66Updated 2 years ago
- 对不同模板的静态网页,识别并提取正文、标题、时间等元素☆15Updated 8 years ago
- 包含爬取商品信息的京东,天猫,苏宁的三个爬虫,以及一个对京东商品评论进行爬取和分析的脚本☆13Updated 2 years ago
- 高效微信公众号历史文章和阅读数据爬虫powered by scrapy 微信公众号爬虫 微信采集 公众号采集☆66Updated 6 years ago
- 对淘宝(天猫)的评论爬取并进行简单分析☆27Updated 5 years ago
- 爬取北大法宝网http://www.pkulaw.cn/Case/☆169Updated 6 years ago
- 天猫爬虫(大量注释,readme有思路分析)☆22Updated 6 years ago
- 爬虫项目,领英、专利、乐捐、好大夫、阿里拍卖、看准网、实习僧、百度百科、51job、智联招聘等近80个网站☆84Updated 4 years ago
- 爬取大众点评的店铺评论的爬虫☆18Updated 5 years ago
- django+es搭建的前后端分离,唐诗宋词搜索引擎。☆34Updated 3 years ago
- 裁判文书网爬虫☆38Updated 2 years ago
- 收集的各类字典,欢迎大家提交。(专业、中草药、中药、交通、停用词、动物、健康、国家、地名、学校、植物、汽车品牌)☆71Updated 5 years ago
- 百度指数(百度热搜爬虫)(js破解版)☆13Updated 6 years ago
- Python练习项目,当前实现了:homes.jp爬虫、大悦城自动签到、人人网相册爬虫、mm131爬虫、人力系统验证码识别、每日NHK爬虫☆10Updated 5 years ago
- 基于scrapy的新闻爬虫☆101Updated 5 years ago
- 根据企业名称对企业类型进行分类☆38Updated 6 years ago
- 对收集的法律文档进行一系列分析,包括根据规 范自动切分、案件相似度计算、案件聚类、法律条文推荐等(试验目前基于婚姻类案件,可扩展至其它领域)。☆200Updated 8 years ago
- 基于scrapy实现裁判文书网爬虫☆27Updated 4 years ago
- 基于文字密度的新闻正文提取模块,兼容python2和python3,传入新闻网址或者网页源码即可返回标题,发布时间和正文内容。☆14Updated 6 years ago
- 古诗词语料库☆132Updated 8 years ago
- 整理开发中常用的各类API接口,当前有4大类:微信相关、数据及分析、开发专用、生活服务,如:天气预报、文档生成、身份证识别、代理IP等; 整理各种数据包,如:中华古诗词数据、词库、敏感词表、医学词表、四六级英汉词典数据等☆64Updated 5 years ago
- TiktokCrawler抖音爬虫(无水印),多线程爬虫+JS逆向☆48Updated 2 years ago