泰坦尼克号乘客存活预测详细笔记

article/2025/2/4 15:09:42

http://www.mzlw.cn/qdNP8uFn.shtml

相关文章

利用泰坦尼克号数据集进行机器学习

利用泰坦尼克号数据集进行机器学习

最近在学习pytorch深度学习实践，记录一下处理这个数据集以及利用其训练网络的过程。数据集位置：泰坦尼克号数据集 1. 数据集处理可以在jupyter notebook上先跑一跑，看看数据集的样子 import numpy import pandas as pd from sklearn impo…

阅读更多...

《吊打分析师》实战—经典重现，你会怎么选择？

《吊打分析师》实战—经典重现，你会怎么选择？

2020，努力做一个无可替代的人！ 长文多图，建议先收藏再看作者|小一全文共5683字，阅读全文需19分钟写在前面的话你好，我是小一今天的实战项目是一个比赛项目，小一我通过分析和建模杀入了Top10% 害&#…

阅读更多...

机器学习实战——kaggle 泰坦尼克号生存预测——六种算法模型实现与比较

机器学习实战——kaggle 泰坦尼克号生存预测——六种算法模型实现与比较

一、初识 kaggle kaggle是一个非常适合初学者去实操实战技能的一个网站，它可以根据你做的项目来评估你的得分和排名。让你对自己的能力有更清楚的了解，当然，在这个网站上，也有很多项目的教程，可以跟着教程走&#xff…

阅读更多...

titanic生存率数据分析

titanic生存率数据分析

该例程通过分析titanic数据中个各个特征来判断最后是否获救。例程背景就不多说了，网上到处都有。该例程是到目前kaggle上讨论最多，关注度最高，最活跃的一个，其中有对数据处理的常见的方法如：缺失值处理、类别值处理&…

阅读更多...

深度学习之构建MPL神经网络——泰坦尼克号乘客的生存分析

深度学习之构建MPL神经网络——泰坦尼克号乘客的生存分析

大家好，我是带我去滑雪！ 本期使用泰坦尼克号数据集，该数据集的响应变量为乘客是生存还是死亡（survived，其中1表示生存，0表示死亡），特征变量有乘客舱位等级（pclass&#x…

阅读更多...

动手学数据分析Task2第一节数据清洗及特征处理

动手学数据分析Task2第一节数据清洗及特征处理

第二章：数据清洗及特征处理我们拿到的数据通常是不干净的，所谓的不干净，就是数据中有缺失值，有一些异常点等，需要经过一定的处理才能继续做后面的分析或建模，所以拿到数据的第一步是进行数据清洗，本章我们将学习缺失值、重复值、字符串和数据转换等操作，将数据…

阅读更多...

泰坦尼克号乘客生存情况分析之第二部分特征工程

泰坦尼克号乘客生存情况分析之第二部分特征工程

第二部分特征工程继第一部分数据探索性分析，今天主要介绍下第二部分特征工程。原始数据肯定不能直接拿来分析，因为数据比较杂乱，就算分析的话，也得不到有价值的信息，所以需要进行数据处理，处理成我们想要…

阅读更多...

python机器学习之数据的预处理（五种方式数据处理案例详解）

python机器学习之数据的预处理（五种方式数据处理案例详解）

数据的预处理数据下载地址——>点这里下载到入文件时可以直接复制地址然后用r" "包裹起来。例如：data pd.read_cav(r"C:\work\data.csv") 或者也可以以直接将\换成//也可以导入。 1.归一化在sklearn当中，我们使用prepro…

阅读更多...

python数据挖掘框架_来自Kaggle金牌得主的Python数据挖掘框架，一文学会机器学习基本流程！...

python数据挖掘框架_来自Kaggle金牌得主的Python数据挖掘框架，一文学会机器学习基本流程！...

目录项目背景与分析数据读入与检查数据预处理数据校正缺失值填充数据创建数据转换数据清洗数据划分探索性分析建模分析模型评估与优化交叉验证超参数调整特征选择模型验证改进与总结项目背景与分析泰坦尼克号沉没是历史上有名的沉船事件之一。1912年4月15日&am…

阅读更多...

动手学数据分析 TASK2 数据清洗及特征处理

动手学数据分析 TASK2 数据清洗及特征处理

本篇主要解决数据清洗和数据的特征处理问题，数据清洗包括缺失值、重复值的处理、字符串数据转换等，此项过程为数据分析的前序环节起铺垫作用。 2 第二章：数据清洗及特征处理知识概要缺失值和重复值的观察与处理数据的分箱处理文本变量转…

阅读更多...

Kaggle泰坦尼克号预测——Last

Kaggle泰坦尼克号预测——Last

整理了一下全部流程，写成了一个ipynb文件导入数据集 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import warnings warnings.filterwarnings(ignore)##载入数据集 data_path = D:/Now/Titanic/train_data = pd.read_cs…

阅读更多...

来自Kaggle金牌得主的Python数据挖掘框架，一文学会机器学习基本流程！

来自Kaggle金牌得主的Python数据挖掘框架，一文学会机器学习基本流程！

导读很多同学在学习机器学习时往往掉进了不停看书、刷视频的，但缺少实际项目训练的坑，有时想去练习却又找不到一个足够完整的教程，本项目翻译自kaggle入门项目Titanic金牌获得者的Kernel，该篇文章通过大家并不陌生的泰坦尼克数据…

阅读更多...

kaggle_泰坦尼克实战入门

kaggle_泰坦尼克实战入门

前言为了记录自己的学习过程，我把分析的过程大致整理了一下，工具是使用jupyter notebook,个人比较喜欢,然后导出成md格式，传到csdn和大家做一个分享； 这次只是一个简单的分析过程，所以相对来说比较简单，如…

阅读更多...

泰坦尼克号乘客生存情况预测分析总

泰坦尼克号乘客生存情况预测分析总

🌟欢迎来到我的博客 —— 探索技术的无限可能！ 🌟博客的简介（文章目录） 泰坦尼克号乘客生存情况预测分析1 泰坦尼克号乘客生存情况预测分析2 泰坦尼克号乘客生存情况预测分析3 泰坦尼克号乘客生存情况预测分析总背景…

阅读更多...

Python28-6 随机森林

Python28-6 随机森林

随机森林算法详细介绍 1. 理论背景随机森林（Random Forest）是一种由Leo Breiman和Adele Cutler在2001年提出的集成学习方法。它结合了多个决策树的预测结果，以提高模型的准确性和鲁棒性。 2. 算法细节随机森林的构建过程可以分为以下几…

阅读更多...

Titanic(Kaggle)-数据处理（1）

Titanic(Kaggle)-数据处理（1）

数据集介绍： PassengerId乘客编号，Survived是否被救， Parch 父母子女数量，SibSP兄弟姐妹配偶数， Pclass客舱等级， Pclass登船港口，Ticket票号，Fare票价，Cabin客舱号 Cabi…

阅读更多...

Kaggle机器学习入门课程泰坦尼克号数据科学解决方案中文翻译

Kaggle机器学习入门课程泰坦尼克号数据科学解决方案中文翻译

泰坦尼克号数据科学解决方案该笔记本引导我们了解在Kaggle等网站上解决数据科学竞赛的典型工作流程。有几个优秀的notebooks可以研究数据科学竞赛的参赛作品。然而，许多notebooks会跳过一些关于解决方案开发的解释，因为这些笔记本是为专家开发的&…

阅读更多...

泰坦尼克号数据处理与预测

泰坦尼克号数据处理与预测

♚ 作者：罗罗攀，林学的研究僧。Python中文社区专栏作者，《从零开始学Python网络爬虫》作者。《从零开始学Python数据分析：视频教学版》作者。之前我们用过传统的机器学习算法预测过泰坦尼克号数据的生还情况，这次我们…

阅读更多...

数据分析（一）

数据分析（一）

以Kaggle上的一道经典题Titanic为例，总结一下数据分析的一些方法。题目说明 RMS泰坦尼克号的沉没是历史上最著名的沉船事件之一。 1912年4月15日，泰坦尼亚号在首次航行中与冰山相撞后沉没，在2224名乘客和船员中有1502人死亡。虽然在幸存…

阅读更多...

泰坦尼克号生存预测

泰坦尼克号生存预测

学习机器学习之特征工程使用sklearn做单机特征工程参考 kaggle 泰坦尼克号生存预测——六种算法模型实现与比较 Kaggle初体验-机器学习之泰坦尼克号乘客生存预测(上) 猴子数据分析之泰坦尼克号生存率预测数据集：https://www.kaggle.com/c/titanic 字段 Age:年龄 C…

阅读更多...

推荐文章