透明报告论文复现葡萄酒品质SHAP

复现报告:Wine Quality ML预测 — 酒精度稳居第一预测因子,9分钟完成6模型+Stacking对比

复现报告:Wine Quality ML预测 — 酒精度稳居第一预测因子,9分钟完成6模型+Stacking对比

想亲眼看看完整的研究过程和最终论文?

我们为这个案例准备了可交互的展示页面,包含完整的分析过程和生成结果。

查看完整展示

复现目标

原论文:Khan R, Goyal A, Kanyal HS, Parashar D, Sharma SK, Iqbal M. Improved machine learning framework with feature engineering and SHAP analysis for predicting wine quality. Discover Applied Sciences (Springer Nature). 2025;8(1):27. DOI: 10.1007/s42452-025-07999-8

作者机构:Manipal Academy of Higher Education, Manipal, India

数据集:UCI Wine Quality Dataset(红葡萄酒 1,599 条 + 白葡萄酒 4,898 条 = 6,497 条),12 个理化特征 + 品质评分

复现范围

  • ✅ 覆盖:多模型分类对比(Logistic Regression、Random Forest、Gradient Boosting、XGBoost、CatBoost、LightGBM)+ Stacking 集成
  • ✅ 覆盖:SHAP 特征重要性分析
  • ✅ 覆盖:红白葡萄酒合并分析
  • ❌ 未覆盖:原论文的 34 维特征工程(多项式特征和高阶交互项)
  • ❌ 未覆盖:Transfer Learning(白葡萄酒 → 红葡萄酒迁移)
  • ❌ 未覆盖:Deep Neural Network 实验

方法差异

  • 特征数量:原论文 34 个工程特征 vs AI 复现 15 个(原始 12 + 3 个交互特征)
  • 分类设置:原论文部分实验用二分类,AI 复现统一用三分类(低/中/高品质)
  • 异常值处理:AI 复现使用 IQR 方法移除 1,901 个异常值(29.3%),原论文处理方式未详述

执行记录

指标数值
数据集UCI Wine Quality (6,497 → 4,596 rows after cleaning)
耗时9 分钟(17:12 → 17:21)
产出文件15 个(6 图表 + 5 脚本 + 3 数据 + 1 摘要)
积分消耗93.48 积分(¥0.93)
模型数量6 + 1 Stacking = 7
交叉验证分层 5 折

复现结果对比

特征重要性排序对比

排名原论文(SHAP Analysis Section)AI 复现(SHAP)一致性
1酒精度 (alcohol)酒精度 (alcohol)✅ 一致
2二氧化硫水平 (SO₂)挥发酸度 (volatile acidity)⚠️ 顺序互换
3挥发酸度 (volatile acidity)密度 (density)⚠️ 不同
4未详细列出硫酸盐 (sulphates)
5未详细列出总二氧化硫 (total SO₂)

分析:酒精度作为第一预测因子完全一致。挥发酸度和二氧化硫相关指标在两项研究中都位于前列,但具体排序有差异——这可能与特征工程方案不同有关(原论文 34 维 vs AI 15 维特征空间中,各特征的相对重要性会发生变化)。

负相关因子:挥发酸度(volatile acidity)在 AI 复现中是明确的负相关因子——高挥发酸度意味着醋酸含量高,导致口感尖酸,品质下降。这与食品化学理论一致。

SHAP 特征重要性

模型性能对比

模型原论文准确率原论文数据来源AI 准确率AI F1AI AUC
Random Forest~95%Results Section72.28%72.27%0.8803
Stacking Ensemble81.5%Results Section71.63%71.65%0.8812
Gradient Boosting未单独报告69.78%69.79%0.8485
LightGBM未单独报告68.80%68.81%0.8413
XGBoost未单独报告68.15%68.17%0.8375
Logistic Regression未单独报告57.61%57.23%0.7371

:原论文的 ~95% 准确率来自更丰富的特征工程(34 维)和可能不同的分类设置。AI 复现使用三分类(低/中/高品质),比二分类天然更难。

模型性能对比

品质分布统计

品质等级样本数占比
低品质(3-5分)~1,79839.1%
中品质(6分)~1,95342.5%
高品质(7-9分)~84518.4%

类别不平衡明显,高品质葡萄酒仅占 18.4%,这增加了分类难度。

品质分布

差距原因分析

  1. 特征工程差距大:原论文从 14 个特征扩展到 34 个(多项式特征 + 高阶交互项),AI 仅添加了 3 个基础交互特征。这是性能差距的主要原因。
  2. 分类难度不同:三分类比二分类更具挑战性,尤其是中等品质(6分)与低品质(5分)、高品质(7分)之间界限模糊。
  3. Transfer Learning 缺失:原论文的创新点之一是白葡萄酒模型迁移到红葡萄酒,AI 复现未实现此步骤。
  4. 异常值处理策略:AI 移除了 29.3% 的数据作为异常值,可能过于激进。

AI做到了什么

  • 9 分钟内完成 6 种模型 + Stacking 集成的全流程训练和评估
  • 正确识别酒精度为第一预测因子(与原论文和 Scientific Reports 同领域研究一致)
  • 自动生成 6 张可解释性图表
  • 提供了所有模型的完整性能指标(原论文仅报告了部分模型)
  • 三分类设置下 Random Forest AUC 达到 0.88,具有实际应用价值

AI没做到什么

  • 未复现核心创新:原论文的 34 维特征工程方案是性能提升的关键,AI 仅使用基础特征
  • 未实现 Transfer Learning:白葡萄酒 → 红葡萄酒的迁移学习是原论文的独特贡献
  • 未测试深度学习:原论文包含 DNN 实验,AI 复现未涉及
  • 准确率差距明显:RF 72.28% vs 原论文 ~95%,说明特征工程对此任务极其重要
  • 未做超参数深度调优:AI 使用了 GridSearchCV 但搜索空间可能有限
  • CatBoost 缺失:由于环境依赖问题,CatBoost 在实际运行中未成功训练

结论

AI 在 9 分钟内建立了一个可用的 baseline(RF AUC 0.88),正确识别了核心预测因子。但与原论文的差距说明,精心设计的特征工程方案——将 14 个原始特征扩展为 34 个有意义的工程特征——是将准确率从 72% 提升到 95% 的关键。这正是研究者专业判断的价值所在。

AI 适合快速验证研究方向和建立初始 baseline,研究者则负责设计创新的特征工程方案和分析策略。

特征相关性热力图

红白葡萄酒品质对比

查看完整AI分析过程 →

数据安全与使用说明

  • 你上传的数据仅用于当次分析,不会用于模型训练或与第三方共享。
  • 所有案例均经作者授权后发布,敏感信息已做脱敏处理。
  • AI 生成的论文仅供参考,最终发表前请由领域专家审核。

上传你的数据,体验同样的效果

从 CSV 到完整论文,只需一步。免费开始你的 AI 辅助科研之旅。

免费开始你的研究