Rossichan / Titanic-data-miningLinks
## 数据挖掘流程 **(一)数据读取** - 读取数据,并进行展示 - 统计数据各项指标 - 明确数据规模与要完成的任务 **(二)特征理解分析** - 单特征分析,逐个变量分析其对结果的影响 - 多变量统计分析,综合考虑多种情况影响 - 统计绘图得出结论 **(三)数据清洗与预处理** - 对缺失值进行填充 - 特征标准化/归一化 - 筛选有价值的特征 - 分析特征之间的相关性 **(四)建立模型** - 特征数据与标签准备 - 数据集切分 - 多种建模算法对比 - 集成策略等方 案改进
☆10Updated 5 years ago
Alternatives and similar repositories for Titanic-data-mining
Users that are interested in Titanic-data-mining are comparing it to the libraries listed below
Sorting:
- 通过聚类分析交易流水检测异常交易☆20Updated 2 years ago
- 机器学习的特征工程,包括特征抽取、特征预处理、特征选择、特征降维。☆25Updated 6 years ago
- 利用python进行反欺诈检测☆34Updated 6 years ago
- 人工智能社会保险反欺诈分析☆30Updated 7 years ago
- 利用python对3000个数据利用机器学习算法建立模型,并预测未来客户信用风险。处理数据不均衡问题时采用了SMOTE过采样以及随机过采样技术;通过相关性分析进行特征选择;建模过程中用到了Logistic回归、SVM、随机森林、GBDT四种模型,并通过网格搜索法确定最优参数…☆33Updated 3 years ago
- 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技术的发展,建立基于自然语言处理技术的…☆35Updated 5 years ago
- 构建基于逻辑回归的评分卡模型☆46Updated 6 years ago
- 交易欺诈作为信用卡行业面临的主要贷后风险业务问题,每年都使信用卡行业遭受巨额损失。基于大数据机器学习开发出高效的交易欺诈识别模型一直是金融行业的主要挑战之一。本次大赛以此作为主题☆45Updated 6 years ago
- 根据用户数据以及消费行为数据,使用Python建立分类模型,通过评估客户流失的风险来预测客户流转情况,找到对客户影响较大的因素,进而挽留客户☆10Updated 5 years ago
- 智慧物流算法大赛简介: 根据包括货值、路程和油价等字段的数据集,对每趟货物运送的运价进行回归预测。 本项目为我的参赛代码,分为四个主要的部分:1.数据预处理;2.特征工程;3.建模调参训练;4.数据可视化。 最终获得了大赛的二等奖。☆38Updated 6 years ago
- 基于互联网金融平台2015年度贷款数据完成信贷违约预测模型,该模型可以作为信贷平台预测违约借款人的参 考☆70Updated 7 years ago
- 某电商手机评论的文本挖掘初体验 功能板块:数据预处理、LDA模型获取特征词、情感极性判断与程度计算、回归模型预测销量排序☆123Updated 6 years ago
- 我们对一个知乎社交网络进行了基础属性、度分布、节点影响力、社区检测等分析操作,得到了一些有趣的结论(补充),发现了知乎社交网络的哪些特性(具体写出来)。之后,我们又做了一个知乎兴趣内容推荐系统,对用户的兴趣偏好进行分析,为用户推荐话题、问题、答主等相关内容,取得了不错的效果…☆28Updated 6 years ago
- 本系列代码主要是作者Python人工智能之TensorFlow的系列博客,涉及回归神经网络、CNN、RNN、TensorFboard等内容。基础性代码,希望对您有所帮助。☆105Updated 7 months ago
- 基于ARIMA时间序列的销量预测模型,实际预测准确率达90%以上,内含有测试记录和实际上线效果。☆109Updated 6 years ago
- 2019厦门国际银行“数创金融杯”数据建模大赛 复赛第六☆19Updated 5 years ago
- Python实现经典分类回归、关联分析、聚类以及推荐算法等☆214Updated 6 years ago
- 智能供应链分析,对顾客用rfm模型分类,用多种机器学习模型建模,进行欺诈订单预测,延迟发货预测,销售额预测,销售数量预测☆38Updated 5 years ago
- 该工程是利用python3.6进行“特征提取+分类器”来实现美团评论的文本二分类问题。在特征提取部分提取了6种特征,分类器选择了python里面的包xgboost和lightGBM分别实现提升树和GBDT(梯度提升决策树)。☆94Updated 6 years ago
- 本赛题旨在运用有效的金融科技和大数据系统,分析涉赌涉诈资金交易新方式,持续优化风险监测模型,通过赛题提供的涉赌涉诈黑名单、白名单及用于训练的相关交易流水数据集,构建涉赌涉诈账户算法识别模型,全面排查存量风险。A榜排名11/1594,B榜排名13/1594。☆47Updated 2 years ago
- 信用卡反欺诈消费预测模型☆10Updated 6 years ago
- 大家好,我是coggle开源小组成员 庐州小火锅,这篇文章将会介绍天池学习赛贷款违约预测的TOP6单模方案(具体介绍见我的csdn:),现附上比赛链接天池学习赛贷款违约预测.https://tianchi.aliyun.com/competition/entrance/53…☆55Updated 4 years ago
- 数据挖掘大作业, 东野圭吾小说集文本挖掘☆72Updated 8 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆68Updated 2 months ago
- 利用公开的安然财务和邮件数据集,利用 PCA 和特征选择分析处理缺失的数据,再通过朴素贝叶斯、决策树、SVM等机器学习构建筛选器,找出有欺诈嫌疑的安然员工☆10Updated 7 years ago
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要…☆81Updated 4 years ago
- 基于用户行为的用户画像项目☆78Updated 7 years ago
- DCIC 2023年 科技金融应用——欺诈风险识别☆28Updated 2 years ago
- 智能风控 python金融风险管理与评分卡建模 数据和代码☆23Updated 4 years ago
- 机器学习实践:贷款违约预测☆39Updated 6 years ago