透明报告论文复现抑郁症机器学习SHAP

复现报告:NHANES抑郁预测ML研究 — 6模型AUC均超0.91,4分钟完成全部训练和SHAP分析

复现报告:NHANES抑郁预测ML研究 — 6模型AUC均超0.91,4分钟完成全部训练和SHAP分析

想亲眼看看完整的研究过程和最终论文?

我们为这个案例准备了可交互的展示页面,包含完整的分析过程和生成结果。

查看完整展示

复现目标

原论文:Vu T, Dawadi R, Yamamoto M, Tay JT, Watanabe N, Kuriya Y, Oya A, Tran PNH, Araki M. "Prediction of depressive disorder using machine learning approaches: findings from the NHANES." BMC Medical Informatics and Decision Making. 2025;25:83. doi:10.1186/s12911-025-02903-1

作者机构:日本国立生物医学创新研究所 AI 健康研究中心(Artificial Intelligence Center for Health and Biomedical Research, National Institutes of Biomedical Innovation, Health and Nutrition, Osaka)、越南 Cho Ray 医院心血管外科、神户大学医学研究科、国立循环器病研究中心

数据集:原论文使用 NHANES 2013-2014(5,372人,一般人群),本次使用 Kaggle Student Depression Dataset(27,901人,学生群体)。注意:数据集不同,本次为方法验证而非严格复现。

复现范围

  • ✅ 覆盖:6种ML模型(LR, RF, NB, SVM, XGBoost, LightGBM)、80/20分割、SHAP分析
  • ❌ 未覆盖:LASSO特征选择(原论文方法)、NHANES原始数据、临床指标(血压/BMI/血糖/eGFR)

执行记录

指标数值
耗时4 分钟(20:05:07 → 20:08:59)
产出文件12 个(5 分析 + 1 代码 + 5 可视化 + 1 数据集)
样本量27,901 条
特征数16 个
抑郁患病率58.55%

复现结果对比

模型性能对比

模型原论文准确率 (Table 2)AI准确率原论文AUC (Table 2)AI AUC原论文F1 (Table 2)AI F1
Logistic Regression0.660.8430.660.9170.650.868
Random Forest0.650.8380.650.9140.630.864
Naive Bayes0.680.6450.680.9140.690.767
SVM0.680.8410.680.9140.670.868
XGBoost0.690.8350.690.9110.690.861
LightGBM0.620.8430.620.9180.630.867

说明:AI 在 AUC 上全面大幅领先(0.91+ vs 0.62-0.69),但这主要来源于数据集差异而非模型优势:

  1. 学生数据集特征与抑郁直接相关性强(如"自杀想法"SHAP值 1.384)
  2. 样本量 27,901 vs 5,372(5.2倍)
  3. 抑郁患病率 58.55% vs 9.5%(类别更平衡)

特征重要性对比

排名原论文 (NHANES SHAP)AI 复现 (学生数据 SHAP)一致性
1PIR(家庭收入贫困比)自杀想法 (1.384)❌ 不同特征
2性别(女性)学业压力 (1.074)❌ 不同特征
3高血压经济压力 (0.768)⚠️ 经济因素一致
4血清羟可替宁年龄 (0.482)⚠️ 年龄均重要
5血清可替宁工作/学习时长 (0.407)❌ 不同特征
6BMI饮食习惯 (0.396)❌ 不同特征
7教育水平学习满意度 (0.299)❌ 不同特征
8血糖CGPA (0.216)❌ 不同特征
9年龄睡眠时长 (0.202)❌ 不同特征
10婚姻状况城市 (0.158)❌ 不同特征

分析:特征排序差异大,原因是两个数据集的变量完全不同——NHANES 包含临床生化指标(血压/BMI/血糖/肾功能),学生数据集包含心理行为指标(自杀想法/学业压力/经济压力)。但经济因素(PIR vs 经济压力)和年龄在两个数据集中均为重要预测因子,这一交叉验证有意义。

描述性统计

指标原论文 (NHANES)AI (学生数据集)
样本量5,37227,901
抑郁患病率9.5%58.55%
平均年龄47 岁25.8 岁
女性占比51.9%44.3%
抑郁组平均年龄52 岁
人群类型美国一般人群全球学生群体

AI 做到了什么

  • ✅ 在 4 分钟内训练了全部 6 种 ML 模型并完成性能评估
  • ✅ 完成 SHAP 可解释性分析,生成 beeswarm 和 bar 两种可视化
  • ✅ 生成 ROC 曲线、混淆矩阵等标准评估图表
  • ✅ 所有产出文件可下载验证(代码 + 数据 + 图表)
  • ✅ 所有 6 个模型 AUC 均超过 0.91

AI 没做到什么

  • 未使用原论文的 NHANES 数据集:使用了替代数据集,严格来说不是数据复现
  • 未实现 LASSO 特征选择:原论文用 LASSO 筛选关键特征,AI 使用全部特征
  • 未处理类别不平衡:学生数据集抑郁占 58.55% 无需过采样,但原论文需要处理 9.5% 的不平衡
  • 未生成论文初稿:仅完成数据分析,未自动撰写学术论文
  • 特征重要性排序与原论文差异大:因数据集变量不同,直接对比意义有限
  • 未做交叉验证:仅用单次 80/20 分割,原论文方法学更严谨

结论

本次验证成功复现了 Vu et al. (2025) 的 6 种 ML 模型框架,并在学生抑郁数据集上获得了更高的预测性能(AUC 0.91+ vs 原论文 0.62-0.69)。但性能差异主要来自数据集特征差异而非模型优势。经济因素和年龄在两个数据集中均为重要预测因子,形成了有意义的交叉验证。

AI 工具的价值在于快速建立分析 baseline(4 分钟 vs 人工 1-2 周),但研究设计、数据集选择、结果解释和临床转化仍然需要研究者的专业判断。

查看完整AI分析过程 →

数据安全与使用说明

  • 你上传的数据仅用于当次分析,不会用于模型训练或与第三方共享。
  • 所有案例均经作者授权后发布,敏感信息已做脱敏处理。
  • AI 生成的论文仅供参考,最终发表前请由领域专家审核。

上传你的数据,体验同样的效果

从 CSV 到完整论文,只需一步。免费开始你的 AI 辅助科研之旅。

免费开始你的研究