Kaggle心脏病分类预测
数据挖掘作业代写 心脏病是人类健康的头号杀手。全世界1/3的人口死亡是心脏病引起的。而我国,每年有几十万人死于心脏病。如果可以通过提取人体相关的体测指标,通过数据挖掘方式来分析不同特征对于心脏病的影响,将对预防心脏病起到至关重要的作用。
背景
心脏病是人类健康的头号杀手。全世界1/3的人口死亡是心脏病引起的。而我国,每年有几十万人死于心脏病。如果可以通过提取人体相关的体测指标,通过数据挖掘方式来分析不同特征对于心脏病的影响,将对预防心脏病起到至关重要的作用。
数据来源
Kaggle平台Heart Disease UCI 案例https://www.kaggle.com/ronitf/heart-disease-uci
案例数据介绍 数据挖掘作业代写
包含了303条美国某区域的心脏病检查患者的体测数据。具体字段如下表。
age 用年数表示的年龄 sex- 性别枚举(1 = 男性; 0 = 女性)
cp: 胸部疼痛的类型 (值为 ‘1’: 典型的心绞痛 值为 ‘2’: 非典型的心绞痛 值为 ‘3’: 非心绞痛的疼痛)
trestbpss: 静息血压 (准许入院的毫米汞柱(mm Hg))
chol: 以mg/dl为单位的血清类固醇
fbs: (空腹血糖 > 120 mg/dl) (1 = 是; 0 = 否)
restecg: 静息心电图结果 (值为 0: 正常 值为 1: 有ST-T波异常 (T波倒置和/或ST段抬高或压低>0.05 mV) 值为 2: 显示该标准下可能或明确的的左心室肥厚)
thalach : 达到的最大心率
exang : 是否运动诱发的心绞痛 (1 = 是; 0 = 否)
oldpeak : 由与相对休息有明显差异的运动诱导的ST段压低
slope : 运动高峰期的ST段斜率 (值为 1: 上斜 值为 2: 水平)
ca : 被透视荧光检查(flourosopy)标注颜色的大血管的数量 (0-3)
thal : 3 = 正常; 6 = 固有缺陷; 7 = 可修复缺陷
num : 心脏病的诊断 (冠状动脉疾病状态)
status:值为 0: < 50% 直径缩小 (意味着’没有疾病’) 值为 1: > 50% 直径缩小 (意味着’出现了疾病’)
作业要求: 数据挖掘作业代写
- 根据提供的数据进行数据预处理、可视化分析和特征挖掘,建模和预测不做要求(可根据自身能力考虑是否完成,如能完成并在课堂展示中较好的解释清楚逻辑和算法,成绩有加分)
- 于12月25日前把ppt和python文件提交给老师的邮箱(chenpei114@hotmail.com)
- 12月28日课上分小组介绍自己的案例及方案
- 可参考网上其他人的方案和pythoncoding(百度搜索Kaggle 心脏病分类预测或者Kaggle网页上的参与竞赛者方案sharing),如在执行python coding方面遇到问题,可以咨询老师,尽量先自行百度处理简单问题,如缺少必要库需要先安装、拼写错误等简单问题
网络方案举例:
Kaggle 心脏病分类预测数据分析案例 (逻辑回归,KNN,决策树,随机森林…)