SunRelease / PaperCheckLinks
论文查重代码
☆22Updated 5 years ago
Alternatives and similar repositories for PaperCheck
Users that are interested in PaperCheck are comparing it to the libraries listed below
Sorting:
- 基于 Simhash 的论文查重系统☆81Updated 3 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆165Updated 6 years ago
- selenium裁判文书网爬虫,文书网登录☆40Updated 3 years ago
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要…☆80Updated 4 years ago
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆411Updated 3 years ago
- 谷歌翻译,360翻译,iCIBA翻译,有道翻译,免费API☆188Updated 3 years ago
- 爬虫项目:链家网(普通/scrapy)、虎扑、维基百科、百度地图api、房天下(分布式爬虫)、微信公众号(代理池爬取)☆212Updated 2 years ago
- 微博用户关系爬虫☆12Updated 7 years ago
- 谷歌翻译, 支持 APIKEY 一口气翻译十万条☆243Updated 3 months ago
- Simple examples of text data visualization. 文本人物可视化,词云、人物关系图谱☆112Updated 8 years ago
- 通用新闻类网站分布式爬虫☆78Updated 7 years ago
- 长行的爬虫集合:微博、Twitter、玩加、知网、虎牙、斗鱼、B站、WeGame、猫眼、豆瓣、安居客、居理新房☆373Updated 4 years ago
- 中文图书数据集/数据挖掘/自然语言处理/中国图书分类法/图书情报学/数据挖掘/文本分类/☆92Updated 7 months ago
- 公司、企业名称模糊匹配,基于词频的公司名主体提取,基于编辑距离的匹配度☆41Updated 4 years ago
- 基于selenium的轻量级新浪微博爬虫,可实现:1.后台自动爬取微博搜索结果/2.按时间段爬取搜索结果/3.爬取用户基本信息☆51Updated 5 years ago
- 基于 Scrapy 的新闻智能分类微信小程序,是一个文本分类相关的应用,目的是打造出一个可以对新闻进行智能分类的微信小程序。技术栈:Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序,涉及爬虫、文本分类、Web …☆63Updated 6 years ago
- 中文聊天机器人,基于10万组对白训 练而成,采用注意力机制,对一般问题都会生成一个有意义的答复。已上传模型,可直接运行。☆325Updated 2 years ago
- 用最简单的代码带你实现基于大模型的本地知识库问答系统☆33Updated 2 years ago
- 根据关键词抓取微博数据,再生成词云☆220Updated 7 years ago
- 文本聚类 k-means算法及实战☆55Updated 6 years ago
- 裁判文书数据-增量更新☆41Updated 5 years ago
- 慕课网公开课:数 据预处理☆75Updated 6 years ago
- 发送邮件,文字识别,获取天气数据,哔哩哔哩弹幕,网易云音乐评论 ,turtle画图,爬虫,贝壳二手房房源数据,二手房可视化,51JOB,猫眼Top榜,微博文章,微博评论,微博热搜榜,CBA数据,批量下载图片,可视化,冰墩墩,佩奇,插画,火柴人,兔子,樱花树,玲娜贝儿,生日蛋…☆219Updated 11 months ago
- 博客文章开源代码分享区☆126Updated 4 years ago
- 无监督中文仿真评论自动生成。 Unsupervised Automatic Generation of Chinese Fake Reviews.☆84Updated 6 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆68Updated last month
- 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技术的发展,建立基于自然语言处理技术的…☆34Updated 5 years ago
- 中文文本相似度计算器☆160Updated last year
- 基于Scrapy的QQ音乐爬虫(QQ Music Spider),爬取歌曲信息、歌词、精彩评论等,并且分享了QQ音乐中排名前6400名的内地和港台歌手的49万+的音乐语料☆350Updated last year
- 借助Python抓取微博数据,并对抓取的数据进行情绪分析☆371Updated 2 years ago