codingdie / DiggerLinks
一个集分布式爬虫,分布式存储,分布式计算统计分析一体的统计分析数据挖掘项目
☆14Updated 7 years ago
Alternatives and similar repositories for Digger
Users that are interested in Digger are comparing it to the libraries listed below
Sorting:
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆87Updated 8 years ago
- spark机器学习算法研究和源码分析☆31Updated 8 years ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆95Updated 6 years ago
- 新闻评论观点挖掘系统,粗粒度的分析出新闻网评观点的倾向和走势☆53Updated 10 years ago
- 信托数据仓库及商业智能☆32Updated 7 years ago
- 四川大学拓思爱诺用户session行为数据离线分析项目☆67Updated 3 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 3 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆68Updated 8 years ago
- 基于wifi抓取信息的大数据查询分析系统☆111Updated 8 years ago
- 大数据建模分析平台☆67Updated 7 years ago
- A big data platform for analyzing web access logs☆53Updated 2 years ago
- 常用文本聚类算法java实现☆15Updated 10 years ago
- Hadoop简单应用案例,包括MapReduce、单词统计、HDFS基本操作、web日志分析、Zookeeper基本使用、Hive简单操作等☆190Updated 6 years ago
- spark全示例代码(java、scala) Spark most full instance code DEMO (java、scala)☆85Updated 5 years ago
- 以慕课网日志分析为例 进入大数据 Spark SQL 的世界☆15Updated 7 years ago
- hive仓库元数据管理系统☆168Updated 9 years ago
- 模拟电商系统上线运行一段时间后,根据收集到大量的用户行为数据,利用大数据技术(Flink)进行深入挖掘和分析,进而得到感兴趣的商业指标并增强对风险的控制。 整体可以分为用户行为习惯数据和业务行为数据两大类。用户的行为习惯数据包括了用户的登录方式、上线的时间点及时长、点击和浏…☆136Updated 5 years ago
- 大数据框架 Spark MLlib 机器学习库基础算法全面讲解,附带齐全的测试文件☆40Updated last year
- 用户画像相关的参考代码☆156Updated 3 years ago
- 大数据招聘信息分析平台☆45Updated 9 years ago
- 1、支持网页爬虫 2、多线程、线程池 3、支持全文搜索 4、支持Hadoop分布式平台、HDFS/MapReduce、Zookeeper、HBase 5、支持redis分布式缓存 6、集成微信公众号开发 7、Spring4新特性 8、ActiveMQ 9、Nginx详细配置…☆16Updated 3 years ago
- 金融风控系统(springboot+drools)、flink流计算、mongodb☆168Updated 3 years ago
- 流程化 机器学习框架 基于 scala java语言 ,一站式自动机器学习平台 ,主要包括数据分析 特征工程 ,机器模型,自动部署,超参数优化,模型自动优化,自动扩容分配创建功能,类似第四范式、阿里PAI平台、google autoMl、亚马逊SageMaker☆66Updated 7 years ago
- 商品关联关系挖掘,使用Spring Boot开发框架和Spark MLlib机器学习框架,通过FP-Growth算法,分析用户的购物车商品数据,挖掘商品之间的关联关系。项目对外提供RESTFul接口。☆35Updated 4 years ago
- 基于Flink流处理的动态实时亿级全端用户画像系统可视化界面☆36Updated 2 years ago
- 数仓项目☆10Updated 6 years ago
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala 实现☆36Updated 7 years ago
- java爬虫,反爬虫策略、ETL清洗数据,以及spark离线和实时分析新闻并存入ES☆20Updated 7 years ago
- 微博数据展示与舆情监控系统后台API☆67Updated 7 years ago
- 基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类☆74Updated 11 years ago