SunRelease / PaperCheck
论文查重代码
☆22Updated 4 years ago
Alternatives and similar repositories for PaperCheck:
Users that are interested in PaperCheck are comparing it to the libraries listed below
- 基于 Simhash 的论文查重系统☆80Updated 3 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆65Updated 4 years ago
- selenium裁判文书网爬虫,文书网登录☆38Updated 2 years ago
- 知网爬虫,专利、论文项目。仅供学习交流,严禁盈利☆47Updated 2 years ago
- [2023.05.09]基于selenium的新浪微博关键字搜索结果全自动爬虫,支持自定义搜素关键字、搜索起始时间、爬取起始页数(以实现中断后接上次继续爬取)。爬取内容包括微博账号、发文时间、发送平台、微博内容、转发次数、评论次数、点赞次数、原博地址。☆32Updated last year
- 实战🐍多种网站、电商数据爬虫🕷。包含🕸:淘宝商品、微信公众号、大众点评、企查查、招聘网站、闲鱼、阿里任务、博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛…☆27Updated 4 years ago
- 微博的爬虫,从个人主页开始 爬博文和评论,用的scrapy 框架☆29Updated 2 months ago
- 基于 Scrapy 的新闻智能分类微信小程序,是一个文本分类相关的应用,目的是打造出一个可以对新闻进行智能分类的微信小程序。技术栈:Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序,涉及爬虫、文本分类、Web …☆62Updated 5 years ago
- Python 写的一些小案例,涉及爬虫、可视化方面,希望对Python初学者有所帮助☆90Updated 3 years ago
- 通用新闻类网站分布式爬虫