JackKing-defier / BaiduwenkuLinks
Baidu Wenku Crawler——徒手造轮子系列:百度文库爬虫,爬取文档的文字内容
☆23Updated last year
Alternatives and similar repositories for Baiduwenku
Users that are interested in Baiduwenku are comparing it to the libraries listed below
Sorting:
- 视频转帧、帧转图片、图片转文字,文字语义分析,辅助视频打标签☆36Updated 6 years ago
- 用Python实现图像的手绘化☆56Updated 2 years ago
- 这可能是爬百度文 库最全的项目了☆66Updated 5 years ago
- face-p-easy:Python实现视频人脸p图或替换☆29Updated 6 years ago
- 🎯Python 3 网络爬虫实战、数据分析合集 | 当当 | 网易云音乐 | unsplash | 必胜客 | 猫眼 |☆110Updated 5 years ago
- 新手实战:语料爬取、数据处理、数据分析、规则作诗与机器学习写诗☆78Updated 5 years ago
- 截取图片并识别出图片的文字☆301Updated 7 months ago
- OpenCV+Pyqt实现人脸互换、人 脸融合,人脸特效、人脸生成,OpenCV结课大作业☆33Updated 4 years ago
- 文本生成,可用于作诗、写小说☆129Updated 6 years ago
- 基于 Scrapy 的新闻智能分类微信小程序,是一个文本分类相关的应用,目的是打造出一个可以对新闻进行智能分类的微信小程序。技术栈:Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序,涉及爬虫、文本分类、Web …☆63Updated 6 years ago
- 微博内容及评论自动爬取☆45Updated 4 years ago
- 百度文库付费文档下载工具☆69Updated 6 years ago
- 各种大小爬虫集合☆240Updated 5 years ago
- 下载百度文库文档☆144Updated 6 years ago
- 淘宝模拟登录,销售数据,评论数据,商品评分数据爬取(学数据分析的可以用于获取淘宝电商的销售数据,学爬虫的可以参考一下思路和方法),由于评论数据比较大,暂时没办法上传,大家也可以直接用下面的代码爬取☆45Updated 5 years ago
- 爬虫项目☆70Updated 6 years ago
- Python开发的图片批量处理工具,可以为图片添加文字水印、图片水印,也可以对图片批量重命名☆30Updated 6 years ago
- 请切换分支到Django-vue!!!毕业设计-中国知网(cnki)爬虫及数据可视化,采用Django和Celery将爬虫内置在网站内,展示实时爬取的数据☆78Updated 4 years ago
- 贴吧API 微信智能控制 贴吧舆情监控 关键词分析 热点分析 python3 爬虫☆105Updated 4 years ago
- 基于scrapy的中国国内各大新闻网站内容爬虫☆28Updated 3 years ago
- B站弹幕爬虫☆40Updated 5 years ago
- 百度文字识别api,Python3,包含了(通用文字识别,通用文字识别(含位置信息版),通用文字识别(高精度版),通用文字识别(高精度含位置版),网络图片文字识别,身份证识别,银行卡识别,驾驶证识别,行驶证识别,营业执照识别,车牌识别,表格文字识别-提交请求,通用票据识别,…☆76Updated 6 years ago
- 使用PyMuPDF库,实现PDF转Word,PDF转图片,图片转PDF,合并、拆分等功能☆58Updated 6 years ago
- Python编写的爬虫合集,欢迎Star(豆瓣,百度翻译,斗鱼,优酷,B站,今日头条,笔趣阁,Unsplash,起点中文网, 一点资讯,空气质量, 酷酷漫画)☆37Updated 6 years ago
- 题库(单选+多选+判断).xlsx 本题库中单选520题,多选256题,判断题363题。 现在需要从题库随机选择20题单选题,10题多选题,10题判断题,生成1份测试考试试卷(本程序实现生成10份试卷和答案卷)。 本程序采用Tkinter做GUI界面,选择对应的题库路…☆63Updated 2 years ago
- 基于 Simhash 的论文查重系统☆81Updated 3 years ago
- 百度文库!进来吧,这是就是你想要的百度文库爬虫,必能运行!word生成可编辑的word文档,ppt和pdf生成不可编辑的ppt(排版完美).可以实现百度文库自动化爬取,支持ppt,pdf,doc。☆141Updated 4 years ago
- 分布式采集拉钩网中杭州爬虫相关职位的数据并使用Flask进行数据的可视化与分析☆37Updated 7 years ago
- 自动化爬取各大媒体网站网站视频,文章,然后处理后自动上传到头条号☆47Updated 6 years ago
- powered by python3( simple learning of spider) 百度文库;网易云歌曲; 豆瓣电影; GitHub; 京东; QQ空间; 天气; vip解析助手; TED文本内容; wifi破解脚本; 必应图片设置为桌面等爬取☆153Updated 5 years ago