news 2026/6/10 12:22:45

【25年美赛C题】Olympic Multi-dimensional Predictive Integrator

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【25年美赛C题】Olympic Multi-dimensional Predictive Integrator

#2500759

文章目录

    • 技术路线
    • 我不太懂的几个问题与解答
      • 1. LSTM怎么用于获取时间趋势信息,输入和输出是什么
      • 2. Bootstrap
      • 3. Wlicoxon符号秩检验怎么用于确定零突破
      • 4. SHapley Additive exPlanations (SHAP)
      • 5. Difference-in-Differences (DID) model

技术路线

问题1:
建立预测模型,预测2028年洛杉矶奥运会上每个国家的金牌和奖牌总数,并把预测结果和2024年巴黎奥运会比较
解:
(1)数据预处理:插值、清洗,PCA降维并去噪
(2)预测模型:LSTM考虑时间趋势信息,以建立dual-channel的XGBoost-Bootstrap预测模型(改进的XGBoost算法)

  • 对于数据点少的小国,在应用LSTM之前使用了插值。
  • LSTM调参考虑了两个参数:①隐藏层的神经元数量,②epoch数。并在文中展示了不同参数的结果。
  • 基于PCA和LSTM,获得了XGBoost的输入数据。接着分别构建基于金牌数和总奖牌数的XGBoost预测模型(即建立了两个模型)
  • XGBoost模型使用了10重交叉验证和网格搜索
    • 超参数调整确定了nrounds, max_depth, eta, gamma, …多个参数
    • XGBoost模型效果的评估指标:RMSE
  • 使用Bootstrap重采样预测置信区间

问题2:
使用问题1中的模型,预测2028年奥运会赢得首枚奖牌的国家,并估计“zero breakthrough”零突破的可能性
解:使用Wlicoxon符号秩检验确定哪些国家会赢得第一枚奖牌及对应概率。

问题3:
分析奥运会项目和奖牌数的关系,考虑主办国和所选项目的影响
解:利用Spearman相关系数SHapley Additive exPlanations (SHAP)进行关系和重要性分析

问题4:
创建模型以预测在特定体育项目中具有“伟大教练”效应的国家,并提供贡献系数
解:利用Difference-in-Differences (DID) model量化教练更换的竞争效益,并进行统计显著性检验及平行趋势检验

问题5:
基于工作,提供额外的见解(insights)

我不太懂的几个问题与解答

1. LSTM怎么用于获取时间趋势信息,输入和输出是什么

gpt:趋势编码器(trend encoder)
作用:时间序列建模、趋势特征提取(Representation Learning)
同类型方法:

输入与输出:

2. Bootstrap

  • 作用:给 XGBoost 的预测结果做不确定性估计(置信区间)

  • 同类型方法:

  • 怎么用:

3. Wlicoxon符号秩检验怎么用于确定零突破



4. SHapley Additive exPlanations (SHAP)



5. Difference-in-Differences (DID) model


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 11:10:29

DataCMD 怎么部署?用服务器搭建终端数据可视化工具

如果你日常做运维、管服务器,肯定对下面这些场景非常熟悉: 🖥️ top、htop、df -h、iostat 来回敲 😵 数据是有了,但全是文本,靠自己脑补趋势 📉 CPU/负载突然飙高,只能事后翻日志 🧠 想把常用指标“看成图”,却又不想上复杂监控系统 后来我开始用 DataCMD 这种…

作者头像 李华
网站建设 2026/6/9 13:17:11

二分+滑窗|hash

lc2982二分定窗class Solution { public:int maximumLength(string s) {auto check [&](int mid)->bool {unordered_map<char, int> fre_map;for (int i 0; i < s.length();) {int l i;char c s[i];int fre 0;while (s[i] c) {i;}if (i - l > mid) {f…

作者头像 李华
网站建设 2026/6/10 11:13:02

使用 frp 实现内网穿透:让本地服务器安全暴露到公网

使用 frp 实现内网穿透&#xff1a;让本地服务器安全暴露到公网 frp&#xff08;frp 是 Fast Reverse Proxy 的缩写&#xff09;是一个轻量、高效的内网穿透工具&#xff0c;可以将内网的 SSH、Web、MySQL 等服务安全地暴露到公网。本文基于一个实际生产环境&#xff0c;介绍 …

作者头像 李华
网站建设 2026/6/10 11:06:46

沃虎电子BMS隔离通讯变压器:新能源领域的安全通信核心

在电池管理系统&#xff08;BMS&#xff09;中&#xff0c;隔离通讯变压器是保障高低压电路安全隔离、信号稳定传输的关键器件&#xff0c;直接决定电池系统的安全性、可靠性与使用寿命。沃虎电子深耕磁性器件研发&#xff0c;推出的BMS隔离通讯变压器系列&#xff0c;以高隔离…

作者头像 李华
网站建设 2026/6/10 0:24:38

MySQL数据可视化实战:从查询到图表的全流程

数据可视化是将枯燥的数据库数据转化为直观图表的核心手段&#xff0c;而 MySQL 作为最常用的关系型数据库&#xff0c;并非只能做数据存储和查询 —— 结合合理的查询技巧与可视化工具&#xff0c;你可以用 MySQL 快速实现从 “数据提取” 到 “图表展示” 的全链路可视化分析…

作者头像 李华
网站建设 2026/5/31 1:11:45

AI营销内容如何将成本锐减90%?2026企业终极指南

原圈科技 营销洞察原圈科技的AI营销内容解决方案,旨在解决企业高成本与低效率痛点。本文通过四步实操指南,详解如何利用多智能体系统实现内容成本降低90%、效率数倍提升,助您构建坚不可摧的品牌护城河。引言欢迎来到2026年。在今天的商业世界里,AI内容生成不再是遥远的趋势,而…

作者头像 李华