jiangnanboy / spark_data_miningLinks
spark tutorial for big data mining。包括app流量运营分析、als推荐、smote样本采样、RFM客户价值分群、AHP层次分析客户价值得分、手机定位数据商圈挖掘、马尔可夫智能邮件预测、时序预测、关联规则、推荐电影好友等。
☆40Updated 3 years ago
Alternatives and similar repositories for spark_data_mining
Users that are interested in spark_data_mining are comparing it to the libraries listed below
Sorting:
- 基于Flink流处理的动态实时亿级全端用户画像系统可视化界面☆36Updated 3 years ago
- java爬虫,反爬虫策略、ETL清洗数据,以及spark离线和实时分析新闻并存入ES☆20Updated 7 years ago
- 专注于解决自然语言处理领域的几个核心问题:词法分析,句法分析,语义分析,语种检测,信息抽取,文本聚类和文本分类. 为相关领域的研发人员提供完整的通用设计与参考实现. 涵盖了多种自然语言处理算法,适配了多个自然语言处理框架. 兼容Lucene/Solr/ElasticSe…☆118Updated 2 years ago
- AMS实时推荐系统☆17Updated 3 years ago
- 蜂鸟数据分析平台帮助企业快速完成多数据整合,建立统一数据口径,支持自助式数据准备(ETL), 并提供可视化分析,帮助企业构建贴合自身业务的企业洞察,并将数据决策覆盖各层员工及应用场景☆21Updated 6 years ago
- 大数据框架 Spark MLlib 机器学习库基础算法全面讲解,附带齐全的测试文件☆40Updated last year
- 以Spring Boot框架为载体,通过集成hanLP、neo4j、spark-mllib实现基于电影知识图谱的简易问答系统。☆63Updated 2 years ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 6 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 7 years ago
- 模拟电商系统上线运行一段时间后,根据收集到大量的用户行为数据,利用大数据技术(Flink)进行深入挖掘和分析,进而得到感兴趣的商业指标并增强对风险的控制。 整体可以分为用户行为习惯数据和业务行为数据两大类。用户的行为习惯数据包括了用户的登录方式、上线的时间点及时长、点击和浏…☆138Updated 5 years ago
- 用户画像平台,涵盖标签管理,用户画像报告,用户分群,用户360视角,oneId服务☆107Updated 2 years ago
- 基于flink的推荐系统,实时获取kafka数据进行数据清洗,离线计算进行文件读取(文件,mongodb,hbase)运用协同过滤算法进行计算得出推荐数据☆20Updated 3 years ago
- SpringBoot + Apache Mahout 推荐引擎 基于用户评分数据推荐相关电影☆11Updated 7 years ago
- 基于Spark和Kubernetes的机器学习平台☆31Updated 7 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆69Updated 8 years ago
- SpringBoot + OpenNLP + Neo4j + Spark朴素贝叶斯分类器实现石油相关论文的智能分析问答系统☆31Updated 7 years ago
- 金融风控系统(springboot+drools)、flink流计算、mongodb☆169Updated 3 years ago
- 大数据【企业级360°全方位用户画像】标签开发部分源码☆19Updated 5 years ago
- 电商+大数据+spark机器学习☆17Updated 8 years ago
- springBoot的简单整合neo4j☆13Updated 7 years ago
- spark流式计算电商商品关注度+推荐系统/关联系统☆14Updated 8 years ago
- Fitting是一个面向大数据的统一的开发框架,由大快搜索主导并完全开源,克服了大数据技术开发涉及技术面广,各组件间缺乏统一规范等问题,能有效降低大数据的学习难度,并提高大数据项目的开发效率并可与开源项目混用。 Fitting遵循Apache2.0开源协议,采用类黑箱框架模…☆181Updated 3 years ago
- hbase + spark 实现常用推荐算 法(主要用于精准广告投放和推荐系统)☆69Updated 9 years ago
- 实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续会上传CDH版本…☆57Updated 3 years ago
- 数据分析快速开发平台:包含统一数据访问接口,数据建模,数据治理,数据展现☆23Updated 7 years ago
- 系统从互联网爬取资讯,对热点公共事件进行 检测、聚合和追踪,多维度分析事件内容,监测时间传播路径,分析用户的观点和和情绪,形成摘要、报告、图表等分析结果,实现公共事件的舆情分析可视化系统,提供专业的舆情监测、分析和预警服务☆99Updated 7 years ago
- 信托数据仓库及商业智能☆32Updated 7 years ago
- 内嵌AI的数据质量控制系统☆48Updated 4 years ago
- 数据可视化, 数据挖掘, 数据处理 ETL分析☆171Updated 3 months ago
- 大数据招聘信息分析平台☆46Updated 9 years ago