Root-lee / DocReplace
Batch replace strings in all specific format documents in a certain folder.
☆9Updated 9 years ago
Alternatives and similar repositories for DocReplace:
Users that are interested in DocReplace are comparing it to the libraries listed below
- 企查查企业分类信息采集☆43Updated 5 years ago
- 爬取百度指数和阿里指数,采用selenium,存入hbase,验证码自动识别,多线程控制☆32Updated 8 years ago
- 房产语料库☆25Updated 6 years ago
- ☆20Updated 7 years ago
- 自己使用Request+PyQT编写可视化视频解析工具,主要借用全民解析API的进行的各源头VIP视频解析,软件主要有各大厂的视频VIP解析功能,主要通过网络爬虫解析视频源,实现点击线路即可自动加载浏览器播放视频的功能,还有在加载视频的同时也生成对应的链接二维码,微信扫一扫…☆24Updated 4 years ago
- 自用docker☆18Updated 7 years ago
- Python脚本实现千万级文本数据快速去重☆18Updated 9 years ago
- 利用Elasticsearch, LogStash, Kibana集群实现数据可视化☆14Updated 8 years ago
- 基于Python/Tornado的图灵服务(个人机器学习平台)☆21Updated 7 years ago
- 百度网盘爬虫2017☆19Updated 8 years ago
- 读书笔记《自己动手写网络爬虫》,自己敲的代码。主要记录了网络爬虫的基本实现,网页去重的算法,网页指纹算法,文本信息挖掘☆47Updated 10 years ago
- 使用Python requests 和 BeautifulSoup 开发爬虫。 抓取汽车之家中,汽车的基本信息(车型,品牌,报价等)☆64Updated 6 years ago
- 超级快速爬取1024社区,将种子和配图保存本地,发送到指定邮箱的神奇代码【暂定长期维护中。。。】☆33Updated 6 years ago
- 百度网盘爬虫一天7W 条数据,求star☆48Updated 8 years ago
- 记录每天百度搜索热点☆24Updated 2 years ago
- 贝壳网房价爬虫,基于Scrapy, 采集北京上海广州深圳等21个中国主要城市的房价数据(小区,二手房),稳定可靠快速!支持csv存储,注释丰富,链家网爬虫见我另一个项目☆53Updated 6 years ago
- 面向证券信息类专业搜索引擎,基于WEB信息挖掘技术的专业搜索引擎设计与实现并着重分析基于特定主题的爬取方法,通过下载Internet上WEB文档,进行过滤、分词、转换等处理工作,并建立索引数据库,最终可由检索器通过用户输入查询关键字,搜索器支持微博客、短信等内容短小而又不规…☆23Updated 6 years ago
- java 算法设计与实现--《剑指offer》《编程之美》等Java实现☆16Updated 6 years ago
- 该项目为scrapy框架脚手架,整合了自动切换agent,自动切换代理ip等中间件,可以下载后自行编写爬虫。 支持: 豆瓣电影,某东商品信息(名称价格等)。☆35Updated 6 years ago
- 抓取网页文章,生成 mobi 格式电子书。主要便于导入 Kindle 阅读及存档。目前支持:微信公众号,知乎收藏,投资知道……☆33Updated 4 years ago
- 中国新闻网爬虫(全站增量爬虫,可用时间至2019.7)☆17Updated 5 years ago
- 大数据精准营销中搜狗用户画像挖掘☆36Updated 8 years ago
- python爬取QQ音乐某个歌手的全部专辑歌词并生成文字云图片☆29Updated 8 years ago
- TuShare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工 到 数据存储的过程,能够为金融分析人员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大地减轻工作量,使他们更加专注于策略和模型的研究与实现上。☆36Updated 9 years ago
- 一些爬虫的代码☆147Updated 6 years ago
- 本项目为企业工商信息网络爬虫,输入行业关键字,例如“铜箔”,可爬取八方资源网等工商信息网上所有与铜箔有关企业的工商信息。☆24Updated 6 years ago
- 抓取拉勾,内推,智联招聘,前程无忧等网站的招聘信息,格式化存储,图表化展示。☆67Updated 5 years ago
- 利用 tesseract 解析简单数字验证码图片☆21Updated 6 years ago
- 爆破zip密码☆33Updated 8 years ago
- 联盟广告机器人,自动切换代理、点击广告☆30Updated 9 years ago