本报告深入分析了泰坦尼克号乘客生存率之谜,通过泰坦尼克号数据挖掘,揭示了影响乘客生存的关键因素。本报告为一场基于数据分析的揭秘之旅,揭示了一个历史事件背后的真相。
本文目录导读:
泰坦尼克号沉船事件是人类历史上最悲惨的灾难之一,共造成1500多人丧生,关于乘客的生存率,人们一直充满好奇,本文将通过数据分析,揭开泰坦尼克号乘客生存率之谜。
数据来源及处理
1、数据来源:本文数据来源于公开的泰坦尼克号乘客名单及沉船事件相关资料。
2、数据处理:对数据进行清洗、筛选,确保数据的准确性,主要包括以下内容:
图片来源于网络,如有侵权联系删除
(1)乘客基本信息:年龄、性别、船舱等级、登船地点等;
(2)生存状态:生存、死亡;
(3)乘客关系:兄弟姐妹、配偶等。
数据分析方法
1、描述性统计分析:对乘客基本信息进行描述性统计分析,如年龄、性别、船舱等级等分布情况;
2、生存分析:利用生存分析方法,研究影响乘客生存率的因素;
3、相关性分析:分析乘客基本信息与生存状态之间的相关性。
数据分析结果
1、描述性统计分析
(1)年龄分布:从数据来看,乘客年龄主要集中在20-50岁之间,占比超过60%。
图片来源于网络,如有侵权联系删除
(2)性别分布:男性乘客占比约为58%,女性乘客占比约为42%。
(3)船舱等级分布:头等舱乘客占比约为23%,二等舱乘客占比约为28%,三等舱乘客占比约为49%。
2、生存分析
(1)船舱等级与生存率:通过生存分析发现,头等舱乘客的生存率明显高于二等舱和三等舱乘客,这可能与船舱等级对应的票价、座位位置、逃生通道等因素有关。
(2)性别与生存率:女性乘客的生存率高于男性乘客,这可能与当时的社会观念、逃生时女性乘客被优先救助等因素有关。
(3)年龄与生存率:年龄在20-40岁的乘客生存率较高,而40岁以上乘客的生存率明显降低,这可能与年轻乘客体力较好、逃生时反应更快等因素有关。
3、相关性分析
(1)船舱等级与生存率:船舱等级与生存率呈正相关,即船舱等级越高,生存率越高。
图片来源于网络,如有侵权联系删除
(2)性别与生存率:性别与生存率呈正相关,即女性乘客的生存率高于男性乘客。
通过对泰坦尼克号乘客数据的分析,我们可以得出以下结论:
1、船舱等级、性别、年龄等因素对乘客生存率有显著影响;
2、头等舱乘客的生存率明显高于二等舱和三等舱乘客;
3、女性乘客的生存率高于男性乘客;
4、年轻乘客的生存率高于老年乘客。
泰坦尼克号沉船事件中的乘客生存率之谜,在一定程度上揭示了当时的社会现象和人们的价值观,通过对数据的分析,我们不仅了解了乘客的生存情况,还对历史事件有了更深入的认识。
评论列表