财务作业代写
财务作业代写 1 数据和指标已经给出,其中Xn代表财务变量,Y代表高风险,企业名称前有*ST或ST的
代表高风险企业,没有这些前缀的为正常企业;随机森林模型的目的是通过财务变量来预测企业是否是高风险的(即是否是ST或*ST)。
1 数据和指标已经给出,其中Xn代表财务变量,Y代表高风险,企业名称前有*ST或ST的
代表高风险企业,没有这些前缀的为正常企业;随机森林模型的目的是通过财务变量来预测企业是否是高风险的(即是否是ST或*ST)。
2 划分训练集和测试集,比例为3:1
3 指标筛选:a. 根据OOB误差率的不纯度平均减少值来度量特征重要性,并将指标按照
重要性来降序排列 财务作业代写
(麻烦呈现2个图并发给我
图1:横坐标为特征变量数目,纵坐标为OOB error
图2:横坐标为MeanDecreaseGini,纵坐标为特征变量)
4 参数寻优:a. 设定ntree,基于OOB的误差率选择最优mtry
(麻烦呈现1个图并发给我 图:横坐标为mtry的数目,纵坐标为Error rate)
- 进一步确定ntree的值 财务作业代写
(麻烦呈现1个图并发给我 图:横坐标为决策树数目,纵坐标为Error rate)
5 建立RF和CART两种模型,用训练集进行模型的训练,用测试集进行预测,然后计算各个模型的总错误率、第一类错误率、第二类错误率