Skip to content

组会纪要 - 2025.10.26

一、 模型创新的五个核心方向

未来工作中的创新点,主要可以从以下五个部分展开:

1. 输入 (Input)

  • 核心工作: 丰富输入信息,处理数据特性。
  • 具体方向:
    • 处理类别不平衡问题: 探讨如何解决数据中的不平衡现象。
    • 丰富特征维度:
      • 增加衍生的趋势性指标(例如股票领域常用的 K、M、D 指标)。
      • 引入频域信息:通过傅立叶分解 (Fourier Transform) 或小波分解 (Wavelet Transform) 将时域信号转换为频域信号,丰富输入信息。
      • 参考方法:PMD(可能是指某种分解方法)。

2. 网络模型 (Network Model)

  • 核心工作: 优化网络结构,提升模型性能。
  • 具体方向:
    • 基础结构: CNN + RNN (如 LSTM, GRU) 的组合是常用基础。
    • 前沿结构:
      • 自注意力机制 (Self-Attention): 需要重点关注近期的相关论文。
      • 知识蒸馏 (Knowledge Distillation): 用于模型压缩或性能提升。
    • 创新思路:
      • 通过在现有网络中加入新的模块结构来提升性能。
      • 跨领域借鉴:阅读 NLP、CV 领域的论文,将其中的新模块和创新思路引入到我们的模型中。

3. 损失函数 (Loss Function)

  • 核心工作: 设计新的损失函数或优化目标。
  • 注意事项:
    • 这是创新难度最大的一点,通常需要很强的数学基础。
    • 案例参考: GoogleNet(Inception V1)将模型中间层的输出也纳入到损失计算中,辅助模型训练。

4. 优化算法 (Optimizer)

  • 核心工作: 选择或改进模型训练时的优化策略。
  • 具体方向:
    • 常用算法: 大部分模型使用 Adam 等基于一阶梯度的优化算法。
    • 理论基础:
      • 了解不同优化方法(如 Adam, SGD, RMSprop)之间的核心区别。
      • 区分一阶梯度(常用)与二阶梯度(如海森矩阵,Hessian Matrix)。
      • 推荐阅读: 《数值最优化方法》等相关书籍。
        • 阅读重点: 跳过复杂的证明,主要了解“什么是数值优化”以及“有哪些优化的方法”,掌握其核心概念。

5. 超参数 (Hyperparameters)

  • 核心工作: 高效寻找最优的超参数组合。
  • 背景: 超参数对网络模型性能影响显著。
  • 搜索方法:
    • 早期方法: 网格搜索 (Grid Search)、启发式算法。
    • 进化算法: GA (遗传算法) 等(常被统称为“飞禽走兽”算法集或“进化学习”)。
    • 前沿方法: 元学习 (Meta-learning) 可用于实现更优的超参数优化。

二、 论文阅读与学术训练

1. 论文选择

  • 时效性(新论文):
    • 重点关注 24/25 年的电价相关新论文。
    • 跨领域阅读: 关注电气、机械、化工、NLP 等领域中处理时序数据的论文。
    • 论文水平: 筛选 SCI、CCF A/B/C 等高水平会议和期刊的论文。
  • 基础性(老论文):
    • 阅读目的: 不要局限于看方法,重点是理解经典算法的核心原理
    • 注意: 不要试图根据论文标题来寻找创新点的来源。
  • 语言: 鼓励多读英文原版论文。

2. 论文阅读重点

阅读论文时,应重点关注以下几个部分:

  1. 模型结构 (Pipeline):
    • 关注论文中绘制的整体流程图(Pipeline)。
  2. 实验设计 (Experiment):
    • 性能指标: 了解论文使用了哪些指标来评价模型性能。
    • 图表绘制:
      • 注意图表的横纵坐标、表现形式。
      • 学习使用 Seaborn 等工具绘制清晰、专业的图表(参考优秀论文的绘图风格)。
    • 消融实验 (Ablation Study): 这是证明模型各个模块有效性的关键实验。
    • 实验分析:
      • 这是论文的重要部分,占幅通常较大。
      • 需要分析模型在性能较差的样本性能较好的样本上的具体表现,深入理解模型的优缺点。

3. 学术训练闭环

一个完整的基础学术训练应包含:

  • 理论 (Theory) <- 论文 (Paper)
  • 实践 (Practice) <- 代码 (Code)
  • 分析 (Analysis) <- 论文 (Paper)

三、 电力市场背景知识

1. 市场概况

  • 电能量市场: 核心关注的是价格数量
  • 市场层级: 分为批发市场(发电商 -> 现货市场 -> 用户)和零售市场。

2. 市场分类

电能量市场主要分为两个市场:

  1. 中长期市场:

    • 性质: 即差价合约。
    • 周期: 覆盖多年、月、日等不同时长。
    • 电量分解:
      • 将总电量按月权重分解(或月平均分到日)。
      • 可能按天加权,或按小时划分(使用一天24小时的经典负荷曲线)。
      • 时段分解: 按照谷、平、峰等时段,按比例划分不同的价格。
  2. 现货市场 (Spot Market):

    • 重点: 这是电价预测的核心关注点。

    • 时间节点:

      • 运行日 (D): 当天。
      • 日前 (D-1): 运行日的前一天。
    • 流程:

      • D-1日: 市场成员进行报量报价。
      • D日: 电力需要实时平衡(发的电不用就没了)。
    • 价格核心:

      • 出清 (Clearing): 供需曲线的交点称为出清点,决定出清价格。

      • 日前价格 (D-1 Price): D-1日形成的价格,用于日前电量结算。

      • 现货价格 (D-Day Price / Real-time Price): D日实时价格,用于结算偏差电量。

    • 预测目标: 日前价格现货价格是预测的两个核心目标。

3. 关键概念

  • 直调负荷: 省级调度的负荷。
  • 联络线: 省级之间的电力交换线路。
  • 抽水蓄能 (Pumped Storage):
    • 作用: 电力难以大规模储存,需要“时移”。将用电低谷期(谷)的电量用于抽水,在用电高峰期(峰)放水发电。
    • 特征: 数据上有明显的正负(发电/用电)。
  • 新型储能: 指电池储能等(例如 312H),类似大型“充电宝”。

四、 实验 Pipeline 与实践

1. 实验注意事项

  1. 数据集划分:
    • 严格划分训练集、验证集、测试集。
    • 时序数据陷阱: 验证集和测试集在时间上不能与训练集有重叠,防止“偷看”未来数据。
  2. 模型对比:
    • 可比性: 不同论文在不同数据集上的指标不能直接比较。
    • 正确做法: 必须复现参考论文的模型,并将其放到同一数据集上进行训练和测试,才能进行公平的性能比较。

2. Pipeline 搭建

  • 标准流程: Data -> Input -> Model -> Output -> 指标/Sample分析/图表
  • 模块化设计:
    • 搭建 Pipeline 时,应确保 Model 部分可以灵活替换。
    • Input 部分也可能需要根据不同模型进行替换。
    • 其他部分(如数据加载、评估指标)应保持固定。
  • 持续迭代: 通过不断阅读论文,来扩充和完善自己的 Pipeline 模板。

3. 实践步骤

  1. 注册超算平台。
  2. 搭建基础模板: 基于自己的 Pipeline 模板,先实现一个最简单的模型(例如 LSTM)。
  3. 跑通流程: 将该简单模型放到超算平台,确保整个流程(数据读取、训练、验证、测试)可以顺利跑通。