xjtushilei / ChineseStarsRelationship
中国明星数据爬取。你甚至可以拿到互联网上所有的人之间的关系,接下来你可以自己发挥!基于这些数据,你可以完成更多有趣的事情。比如说社交网络分析,关系网络可视化,算法研究,和其他有意思的事情。Chinese star data crawling. You can even get all the people on the internet! Based on these data, you can do more interesting things. For example, social network analysis, relational network visualization, algorithm research, and other interesting thing…
☆27Updated 6 years ago
Related projects ⓘ
Alternatives and complementary repositories for ChineseStarsRelationship
- 用java写的搜狐新闻爬虫☆13Updated 7 years ago
- 微博数据展示与舆情监控系统后台API☆63Updated 6 years ago
- 新闻网站爬虫,目前能够爬取网易,新浪,qq,搜狐等三家网站的新闻页面,并保存到本地。☆33Updated 9 years ago
- 基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类☆76Updated 10 years ago
- 中国娱乐圈关系挖掘,可以快速的查询明星之间的关系。This is a complex network of course assignments. The realization of the relationship analysis and visualization …☆23Updated 5 years ago
- 爬取百度指数和阿里指数,采用selenium,存入hbase,验证码自动识别,多线程控制☆32Updated 7 years ago
- 读书笔记《自己动手写网络爬虫》,自己敲的代码。主要记录了网络爬虫的基本实现,网页去重的算法,网页指纹算法,文本信息挖掘☆47Updated 9 years ago
- 豆瓣爬虫 爬取热门标签、图书信息、图书评论 系统架构 Webmagic+SSM+Redis+Mysql+ActiveMQ+Druid☆43Updated 5 years ago
- 基于词典的负面舆情信息评分算法。☆25Updated 9 years ago
- 基于TF-IDF模型的文本相似度分析软件☆13Updated 7 years ago
- 爬取了一些新闻,建立索引!简单分析了一些数据,做了一些前台的可视化工作。This is the "information system modeling" course assignments. Climb up some news, build index! Simple…☆20Updated 5 years ago
- 新闻评论观点挖掘系统,粗粒度的分析出新闻网评观点的倾向和走势☆53Updated 9 years ago
- 基于Nutch+ElasticSearch+MySQL+SSM的简易搜索引擎☆19Updated 8 years ago
- 一个简易的搜索引擎,采用Java开发☆33Updated 10 years ago
- 1、支持网页爬虫 2、多线程、线程池 3、支持全文搜索 4、支持Hadoop分布式平台、HDFS/MapReduce、Zookeeper、HBase 5、支持redis分布式缓存 6、集成微信公众号开发 7、Spring4新特性 8、ActiveMQ 9、Nginx详细配置…☆16Updated last year
- 金融数据爬虫☆29Updated 8 years ago
- A Web Page Of Public Sentiment For P2P Industry( P2P 行业的舆情分析前端展示)☆25Updated 8 years ago
- 推荐系统相关代码☆23Updated 9 years ago
- 京东商品推荐系统-数据爬虫☆18Updated 9 years ago
- 天亮舆情系统之天亮舆情采集器,基于master/slave结构开发的分布采集器系统☆22Updated 2 years ago
- 一个集分布式爬虫,分布式存储,分布式计算统计分析一体的统计分析数据挖掘项目☆14Updated 6 years ago
- 微博情感分析☆12Updated 11 years ago
- 推荐算法☆29Updated 9 years ago
- java 基于selenium抓取搜狗微信公众号文章☆47Updated 8 years ago
- 舆情分析平台☆33Updated 7 years ago
- 微云盘,高仿百度云;使用技术jdbc/servlet/jquery MVC三层架构;同时封装了大量通用工具☆34Updated 4 years ago
- 数据平台(DataPlateform),最初的设计想法是:当今大数据横行,我们也不能落后。所以就想着写一个这样的平台系统。此项目集爬虫、搜索、Hadoop、Dwr推送、Quartz定时任务于一体的平台,其目的是想通过抓取互联网数据,通过大数据推测人或者某一事物的下一行为。C…☆18Updated 7 years ago
- 基于词频密度过滤、利用百度、谷歌、搜搜、360搜索4个引擎为种子来源的多线程爬虫,结果存入mysql。☆97Updated 10 years ago
- 这是一个工具程序集合,方便我们平时对数据进行预处理。针对文本处理的内容较多。包括分词(集成了张华平分词、结巴分词)、文件处理增强(如读取文本到Map中,保存文本到Map)和语料模型(把文档转换成矩阵,就算单词数量等)☆20Updated last month