组会纪要 - 2025.10.26

一、模型创新的五个核心方向

未来工作中的创新点，主要可以从以下五个部分展开：

1. 输入 (Input)

核心工作： 丰富输入信息，处理数据特性。
具体方向：
- 处理类别不平衡问题： 探讨如何解决数据中的不平衡现象。
- 丰富特征维度：
  - 增加衍生的趋势性指标（例如股票领域常用的 K、M、D 指标）。
  - 引入频域信息：通过傅立叶分解 (Fourier Transform) 或小波分解 (Wavelet Transform) 将时域信号转换为频域信号，丰富输入信息。
  - 参考方法：PMD（可能是指某种分解方法）。

2. 网络模型 (Network Model)

核心工作： 优化网络结构，提升模型性能。
具体方向：
- 基础结构： CNN + RNN (如 LSTM, GRU) 的组合是常用基础。
- 前沿结构：
  - 自注意力机制 (Self-Attention)： 需要重点关注近期的相关论文。
  - 知识蒸馏 (Knowledge Distillation)： 用于模型压缩或性能提升。
- 创新思路：
  - 通过在现有网络中加入新的模块结构来提升性能。
  - 跨领域借鉴：阅读 NLP、CV 领域的论文，将其中的新模块和创新思路引入到我们的模型中。

3. 损失函数 (Loss Function)

核心工作： 设计新的损失函数或优化目标。
注意事项：
- 这是创新难度最大的一点，通常需要很强的数学基础。
- 案例参考： GoogleNet（Inception V1）将模型中间层的输出也纳入到损失计算中，辅助模型训练。

4. 优化算法 (Optimizer)

核心工作： 选择或改进模型训练时的优化策略。
具体方向：
- 常用算法： 大部分模型使用 Adam 等基于一阶梯度的优化算法。
- 理论基础：
  - 了解不同优化方法（如 Adam, SGD, RMSprop）之间的核心区别。
  - 区分一阶梯度（常用）与二阶梯度（如海森矩阵，Hessian Matrix）。
  - 推荐阅读： 《数值最优化方法》等相关书籍。
    - 阅读重点： 跳过复杂的证明，主要了解“什么是数值优化”以及“有哪些优化的方法”，掌握其核心概念。

5. 超参数 (Hyperparameters)

核心工作： 高效寻找最优的超参数组合。
背景： 超参数对网络模型性能影响显著。
搜索方法：
- 早期方法： 网格搜索 (Grid Search)、启发式算法。
- 进化算法： GA (遗传算法) 等（常被统称为“飞禽走兽”算法集或“进化学习”）。
- 前沿方法： 元学习 (Meta-learning) 可用于实现更优的超参数优化。

二、论文阅读与学术训练

1. 论文选择

时效性（新论文）：
- 重点关注 24/25 年的电价相关新论文。
- 跨领域阅读： 关注电气、机械、化工、NLP 等领域中处理时序数据的论文。
- 论文水平： 筛选 SCI、CCF A/B/C 等高水平会议和期刊的论文。
基础性（老论文）：
- 阅读目的： 不要局限于看方法，重点是理解经典算法的核心原理。
- 注意： 不要试图根据论文标题来寻找创新点的来源。
语言： 鼓励多读英文原版论文。

2. 论文阅读重点

阅读论文时，应重点关注以下几个部分：

模型结构 (Pipeline)：
- 关注论文中绘制的整体流程图（Pipeline）。
实验设计 (Experiment)：
- 性能指标： 了解论文使用了哪些指标来评价模型性能。
- 图表绘制：
  - 注意图表的横纵坐标、表现形式。
  - 学习使用 Seaborn 等工具绘制清晰、专业的图表（参考优秀论文的绘图风格）。
- 消融实验 (Ablation Study)： 这是证明模型各个模块有效性的关键实验。
- 实验分析：
  - 这是论文的重要部分，占幅通常较大。
  - 需要分析模型在性能较差的样本和性能较好的样本上的具体表现，深入理解模型的优缺点。

3. 学术训练闭环

一个完整的基础学术训练应包含：

理论 (Theory) <- 论文 (Paper)
实践 (Practice) <- 代码 (Code)
分析 (Analysis) <- 论文 (Paper)

三、电力市场背景知识

1. 市场概况

电能量市场： 核心关注的是价格和数量。
市场层级： 分为批发市场（发电商 -> 现货市场 -> 用户）和零售市场。

2. 市场分类

电能量市场主要分为两个市场：

中长期市场：
- 性质： 即差价合约。
- 周期： 覆盖多年、月、日等不同时长。
- 电量分解：
  - 将总电量按月权重分解（或月平均分到日）。
  - 可能按天加权，或按小时划分（使用一天24小时的经典负荷曲线）。
  - 时段分解： 按照谷、平、峰等时段，按比例划分不同的价格。
现货市场 (Spot Market)：
- 重点： 这是电价预测的核心关注点。
- 时间节点：
  - 运行日 (D)： 当天。
  - 日前 (D-1)： 运行日的前一天。
- 流程：
  - D-1日： 市场成员进行报量报价。
  - D日： 电力需要实时平衡（发的电不用就没了）。
- 价格核心：
  - 出清 (Clearing)： 供需曲线的交点称为出清点，决定出清价格。
  - 日前价格 (D-1 Price)： D-1日形成的价格，用于日前电量结算。
  - 现货价格 (D-Day Price / Real-time Price)： D日实时价格，用于结算偏差电量。
- 预测目标： 日前价格和现货价格是预测的两个核心目标。

3. 关键概念

直调负荷： 省级调度的负荷。
联络线： 省级之间的电力交换线路。
抽水蓄能 (Pumped Storage)：
- 作用： 电力难以大规模储存，需要“时移”。将用电低谷期（谷）的电量用于抽水，在用电高峰期（峰）放水发电。
- 特征： 数据上有明显的正负（发电/用电）。
新型储能： 指电池储能等（例如 312H），类似大型“充电宝”。

四、实验 Pipeline 与实践

1. 实验注意事项

数据集划分：
- 严格划分训练集、验证集、测试集。
- 时序数据陷阱： 验证集和测试集在时间上不能与训练集有重叠，防止“偷看”未来数据。
模型对比：
- 可比性： 不同论文在不同数据集上的指标不能直接比较。
- 正确做法： 必须复现参考论文的模型，并将其放到同一数据集上进行训练和测试，才能进行公平的性能比较。

2. Pipeline 搭建

标准流程： Data -> Input -> Model -> Output -> 指标/Sample分析/图表
模块化设计：
- 搭建 Pipeline 时，应确保 Model 部分可以灵活替换。
- Input 部分也可能需要根据不同模型进行替换。
- 其他部分（如数据加载、评估指标）应保持固定。
持续迭代： 通过不断阅读论文，来扩充和完善自己的 Pipeline 模板。

3. 实践步骤

注册超算平台。
搭建基础模板： 基于自己的 Pipeline 模板，先实现一个最简单的模型（例如 LSTM）。
跑通流程： 将该简单模型放到超算平台，确保整个流程（数据读取、训练、验证、测试）可以顺利跑通。

组会纪要 - 2025.10.26 ​

一、 模型创新的五个核心方向 ​

1. 输入 (Input) ​

2. 网络模型 (Network Model) ​

3. 损失函数 (Loss Function) ​

4. 优化算法 (Optimizer) ​

5. 超参数 (Hyperparameters) ​

二、 论文阅读与学术训练 ​

1. 论文选择 ​

2. 论文阅读重点 ​

3. 学术训练闭环 ​

三、 电力市场背景知识 ​

1. 市场概况 ​

2. 市场分类 ​

3. 关键概念 ​

四、 实验 Pipeline 与实践 ​

1. 实验注意事项 ​

2. Pipeline 搭建 ​

3. 实践步骤 ​

组会纪要 - 2025.10.26

一、模型创新的五个核心方向

1. 输入 (Input)

2. 网络模型 (Network Model)

3. 损失函数 (Loss Function)

4. 优化算法 (Optimizer)

5. 超参数 (Hyperparameters)

二、论文阅读与学术训练

1. 论文选择

2. 论文阅读重点

3. 学术训练闭环

三、电力市场背景知识

1. 市场概况

2. 市场分类

3. 关键概念

四、实验 Pipeline 与实践

1. 实验注意事项

2. Pipeline 搭建

3. 实践步骤