SunRelease / PaperCheckLinks
论文查重代码
☆22Updated 4 years ago
Alternatives and similar repositories for PaperCheck
Users that are interested in PaperCheck are comparing it to the libraries listed below
Sorting:
- 微博爬虫,一个基于Scrapy框架的轻量微博爬虫,Sina Weibo Spider☆136Updated 2 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆163Updated 6 years ago
- 长行的爬虫集合:微博、Twitter、玩加、知网、虎牙、斗鱼、B站、WeGame、猫眼、豆瓣、安居客、居理新房☆373Updated 4 years ago
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆407Updated 2 years ago
- 爬虫项目:链家网(普通/scrapy)、虎扑、维基百科、百度地图api、房天下(分布式爬虫)、微信公众号(代理池爬取)☆212Updated 2 years ago
- 谷歌翻译,360翻译,iCIBA翻译,有道翻译,免费API☆188Updated 3 years ago
- 基于 Simhash 的论文查重系统☆82Updated 3 years ago
- 知网爬虫,专利、论文项目。仅供学习交流,严禁盈利☆49Updated 3 years ago
- 基于scrapy的中国国内各大新闻网站内容爬虫☆28Updated 3 years ago
- selenium裁判文书网爬虫,文书网登录☆40Updated 3 years ago
- 谷歌翻译, 支持 APIKEY 一口气翻译十万条☆241Updated last month
- 各种爬虫---大众点评,amazon,安居客,58,1688,养老网,人人贷,和讯网股票,豆瓣,无讼案例,爱回收...☆130Updated 5 years ago
- data sdk for baidu Index☆777Updated 2 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆67Updated 4 years ago
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要…☆79Updated 4 years ago
- 通用新闻类网站分布式爬虫☆78Updated 7 years ago
- 知网爬虫cnkispider,输入关键字爬取知网检索数据☆34Updated 7 years ago
- 微博的爬虫,从个人主页开始 爬博文和评论,用的scrapy 框架☆34Updated last month
- 借助Python抓取微博数据,并对抓取的数据进行情绪分析☆371Updated 2 years ago
- Python 写的一些小案例,涉及爬虫、可视化方面,希望对Python初学者有所帮助☆91Updated 3 years ago
- 自动读取本地pdf文献并提取标题、作者、摘要和结论生成综述。Read and translate English literature to generate review automatically.☆161Updated 3 years ago
- 最快的Python入门教程,包含Python基础、爬虫、Django、Flask等内容。☆189Updated 3 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆93Updated 3 years ago
- 中文图书数据集/数据挖掘/自然语言处理/中国图书分类法/图书情报学/数据挖掘/文本分类/☆91Updated 6 months ago
- 公司、企业名称模糊匹配,基于词频的公司名主体提取,基于编辑距离的匹配度☆41Updated 4 years ago
- 新闻爬虫,爬取新浪、搜狐、新华网即时财经新闻。☆188Updated 5 years ago
- 一些 Python 爬虫练习:bilibili用户信息爬取、下载工具、房天下新房二手房redis分布式爬虫、简书全站文章爬取、观 察者网站首页新闻爬取、淘宝模拟登陆、淘宝搜索商品信息爬取及可视化展示、知乎问题回答信息爬取\抖音无水印视频下载☆141Updated 7 months ago
- 使用 flask + pyecharts 搭建的新冠肺炎疫情数据可视化交互分析网站平台,包含疫情数据获取、每日疫情地图、曲线图展示,数据统计分析、态势感知、确诊人数预测分析算法设计、NLP舆情监测等任务(部署在http://covid.yunwei123.tech/)☆334Updated 2 years ago
- 包含leleketang.com做文库十万余条作文信息,每条作文包含标题、作者、时间、地点、正文、评语、等级等信息。根据文本数据,从多个维度对数据进行分析,并用python中的pyecharts绘制图表。使用TF-IDF和Doc2Vec模型统计关键词☆14Updated 5 years ago
- 爬取智联招聘网数据,并对其进行招聘数据可视化,爬虫,Data visualization,Django2,echarts☆133Updated last year