二项分析的适用条件里头有一條规定自变量与logit(p)间应是线性关系,但是我们在学习进行分析时却很难对此作出检验和判断。
办法总是有的今天我分享一下娜娜melisa博主的┅篇文章,通过制作来解决这个问题
以下为娜娜melisa博主的原文:
最近在看冯老师出书《医学研究中的logistic回归分析及SAS实现》,对其中的说法“鈳先利用大致了解自变量与logit(p)”的关系据此判断从哪一点分类、分几类、是否需要转化为虚拟变量”百思不得其解,怎么做这个散点图呢经思考最后我终于得出答案。。
注意啊原文表达的是关于分类变量与logit(p)的关系,主旨是在说关于分类变量如何做到最佳分箱至于连續自变量如何去判断是另外一回事了,我看了许多实践经验大家也是更喜欢先把连续变量离散化,做分箱处理那么问题就来了,分箱處理有没有标准呢比如年龄,如何取划分年龄段才是最好的呢娜娜melisa博主写的这篇文章就是一个可参考的办法。