此条目需要精通或熟悉相关主题的编者参与及协助编辑。 (2016年9月17日) |
逻辑斯谛回归(英语:Logistic regression,又译作逻辑回归、对数几率回归、罗吉斯回归)是一种对数几率模型(英语:Logit model,又译作逻辑模型、评定模型、分类评定模型),是离散选择法模型之一,属于多元变量分析范畴,是社会学、生物统计学、临床、数量心理学、计量经济学、市场营销等统计实证分析的常用方法。
逻辑斯谛分布公式
其中参数 常用最大似然估计。
IIA假设
全名为Independent and irrelevant alternatives假设,也称作IIA效应,指Logit模型中的各个可选项是独立的。
IIA假设示例
市场上有A,B,C三个商品相互竞争,分别占有市场份额:60%,30%和10%,三者比例为:6:3:1
一个新产品D引入市场,有能力占有20%的市场——
如果满足IIA假设,各个产品独立作用,互不关联:新产品D占有20%的市场份额,剩下的80%在A、B、C之间按照6:3:1的比例瓜分,分别占有48%,24%和8%。
如果不满足IIA假设,比如新产品D跟产品B相似度高,则新产品D的CP值高而夺去产品B的部分市场(总份额的20%),则产品B剩余10%,而产品A和C的市场份额保持60%和10%不变。
满足IIA假设的优点
- 可以获得每个个性化的选择集合的一致的参数估计
- 各个类别的子集的一般化的估计
- 大大节省时间
- 可选项数目很多的时候尤其如此
IIA假设的检验
Hausman检验
杰里·A·奥斯曼和丹尼尔·麦克法登提出的。
一般化模型的检验
IIA问题的解决方法
多项式Probit模型
一般化极值模型
可以将可选项间的相关性建模
巢式Logit模型
巢式(Nested)表示可选项被分作不同的组,组与组之间不相关,组内的可选项相关,相关程度用1-λg来表示(1-λg越大,相关程度越高)
对偶组合Logit模型
一般化分簇Logit模型
混合Logit模型
二类评定模型(Binary Logit Model)
- 仅有两个可选项:V1n,V2n
变量类型 | 统计量 | 组别比较 | 回归模型 |
---|---|---|---|
numerical | mean | t-test/ANOVA | 线性回归 |
categorical | percentage | Chi-square test | 逻辑回归 |
persontime | KM estimates (survival curves) |
Log-rank test | 比例风险回归 |
参考书目
- Agresti, Alan: Categorical Data Analysis. New York: Wiley, 1990.
- Amemiya, T., 1985, Advanced Econometrics,Harvard University Press.
- Hosmer, D. W. and S. Lemeshow: Applied logistic regression. New York; Chichester, Wiley, 2000.
参见
- 多重变量分析
外部链接
- UFLDL:Logistic回归 (页面存档备份,存于互联网档案馆)
- 南佛罗里达大学Logistic回归课程
- 线上计算Logistic回归 (页面存档备份,存于互联网档案馆)