codingdie / DiggerLinks
一个集分布式爬虫,分布式存储,分布式计算统计分析一体的统计分析数据挖掘项目
☆14Updated 7 years ago
Alternatives and similar repositories for Digger
Users that are interested in Digger are comparing it to the libraries listed below
Sorting:
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 6 years ago
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆87Updated 7 years ago
- spark机器学习算法研究和源 码分析☆31Updated 8 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆66Updated 8 years ago
- 信托数据仓库及商业智能☆32Updated 7 years ago
- 新闻评论观点挖掘系统,粗粒度的分析出新闻网评观点的倾向和走势☆53Updated 10 years ago
- 大数据建模分析平台☆66Updated 6 years ago
- 清华大数据作业MapReduce处理几百个G的JSON数据☆50Updated 9 years ago
- 流程化 机器学习框架 基于 scala java语言 ,一站式自动机器学习平台 ,主要包括数据分析 特征工程 ,机器模型,自动部署,超参数优化,模型自动优化,自动扩容分配创建功能,类似第四范式、阿里PAI平台、google autoMl、亚马逊SageMaker☆66Updated 7 years ago
- A big data platform for analyzing web access logs☆53Updated 2 years ago
- 大数据招聘信息分析平台☆44Updated 9 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 2 years ago
- 四川大学拓思爱诺用户session行为数据离线分析项目☆67Updated 3 years ago
- 总结了一些Spark学习过程中的例子(附代码详细注释)☆23Updated 7 years ago
- 基于Flink流处理的动态实时亿级全端用户画像系统可视化界面☆35Updated 2 years ago
- SparkSQL数据分析案例☆23Updated 8 years ago
- 基于Spark和Kubernetes的机器学习平台☆31Updated 7 years ago
- 《Spark 大型电商项目实战》源码,博客地址:http://blog.csdn.net/u012318074/article/category/6744423☆212Updated last year
- 电商+大数据+spark机器学习☆17Updated 7 years ago
- spark算子使用例子, spark RDD的算子挺多,有时候如何灵活的使用,该如何用一下子想不起来,这一段时间将spark的算子如何使用的例子给记录了下来,下面是spark RDD 的一些常用算子的使用 这些算子包括有java的,也有scala的语言(博客中才有),由于精…☆36Updated 7 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 7 years ago
- 使用Spark GraphX基于PageRank算法构建一个仿微博用户好友的分布式推荐系统。☆24Updated 7 years ago
- java爬虫,反爬虫策略、ETL清洗数据,以及spark离线和实时分析新闻并存入ES☆20Updated 6 years ago
- hadoop_storm_spark结合实验的例子,模拟淘宝双11节,根据订单详细信息,汇总出总销售量,各个省份销售排行,以及后期的SQL分析,数据分析,数据挖掘等。 --------大概流程------- 第一阶段(storm实时报表) 第二阶段(离线报表)第三阶段(大规…☆323Updated 10 years ago
- 基于spark streaming+flume+kafka+hbase的实时日志处理分析系统(分为控制台版本和基于springboot、Echarts等的Web UI可视化版本)☆39Updated 2 years ago
- 基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类☆74Updated 11 years ago
- hive仓库元数据管理系统☆167Updated 9 years ago
- 微博数据展示与舆情监控系统后台API☆68Updated 7 years ago
- spark tutorial for big data mining。包括app流量运营分析、als推荐、smote样本采样、RFM客户价值分群、AHP层次分析客户价值得分、手机定位数据商圈挖掘、马尔可夫智能邮件预测、时序预测、关联规则、推荐电影好友等。☆40Updated 3 years ago
- 大数据精准营销中搜狗用户画像挖掘☆36Updated 8 years ago