组会纪要 - 2025.10.26
一、 模型创新的五个核心方向
未来工作中的创新点,主要可以从以下五个部分展开:
1. 输入 (Input)
- 核心工作: 丰富输入信息,处理数据特性。
- 具体方向:
- 处理类别不平衡问题: 探讨如何解决数据中的不平衡现象。
- 丰富特征维度:
- 增加衍生的趋势性指标(例如股票领域常用的 K、M、D 指标)。
- 引入频域信息:通过傅立叶分解 (Fourier Transform) 或小波分解 (Wavelet Transform) 将时域信号转换为频域信号,丰富输入信息。
- 参考方法:PMD(可能是指某种分解方法)。
2. 网络模型 (Network Model)
- 核心工作: 优化网络结构,提升模型性能。
- 具体方向:
- 基础结构: CNN + RNN (如 LSTM, GRU) 的组合是常用基础。
- 前沿结构:
- 自注意力机制 (Self-Attention): 需要重点关注近期的相关论文。
- 知识蒸馏 (Knowledge Distillation): 用于模型压缩或性能提升。
- 创新思路:
- 通过在现有网络中加入新的模块结构来提升性能。
- 跨领域借鉴:阅读 NLP、CV 领域的论文,将其中的新模块和创新思路引入到我们的模型中。
3. 损失函数 (Loss Function)
- 核心工作: 设计新的损失函数或优化目标。
- 注意事项:
- 这是创新难度最大的一点,通常需要很强的数学基础。
- 案例参考: GoogleNet(Inception V1)将模型中间层的输出也纳入到损失计算中,辅助模型训练。
4. 优化算法 (Optimizer)
- 核心工作: 选择或改进模型训练时的优化策略。
- 具体方向:
- 常用算法: 大部分模型使用 Adam 等基于一阶梯度的优化算法。
- 理论基础:
- 了解不同优化方法(如 Adam, SGD, RMSprop)之间的核心区别。
- 区分一阶梯度(常用)与二阶梯度(如海森矩阵,Hessian Matrix)。
- 推荐阅读: 《数值最优化方法》等相关书籍。
- 阅读重点: 跳过复杂的证明,主要了解“什么是数值优化”以及“有哪些优化的方法”,掌握其核心概念。
5. 超参数 (Hyperparameters)
- 核心工作: 高效寻找最优的超参数组合。
- 背景: 超参数对网络模型性能影响显著。
- 搜索方法:
- 早期方法: 网格搜索 (Grid Search)、启发式算法。
- 进化算法: GA (遗传算法) 等(常被统称为“飞禽走兽”算法集或“进化学习”)。
- 前沿方法: 元学习 (Meta-learning) 可用于实现更优的超参数优化。
二、 论文阅读与学术训练
1. 论文选择
- 时效性(新论文):
- 重点关注 24/25 年的电价相关新论文。
- 跨领域阅读: 关注电气、机械、化工、NLP 等领域中处理时序数据的论文。
- 论文水平: 筛选 SCI、CCF A/B/C 等高水平会议和期刊的论文。
- 基础性(老论文):
- 阅读目的: 不要局限于看方法,重点是理解经典算法的核心原理。
- 注意: 不要试图根据论文标题来寻找创新点的来源。
- 语言: 鼓励多读英文原版论文。
2. 论文阅读重点
阅读论文时,应重点关注以下几个部分:
- 模型结构 (Pipeline):
- 关注论文中绘制的整体流程图(Pipeline)。
- 实验设计 (Experiment):
- 性能指标: 了解论文使用了哪些指标来评价模型性能。
- 图表绘制:
- 注意图表的横纵坐标、表现形式。
- 学习使用 Seaborn 等工具绘制清晰、专业的图表(参考优秀论文的绘图风格)。
- 消融实验 (Ablation Study): 这是证明模型各个模块有效性的关键实验。
- 实验分析:
- 这是论文的重要部分,占幅通常较大。
- 需要分析模型在性能较差的样本和性能较好的样本上的具体表现,深入理解模型的优缺点。
3. 学术训练闭环
一个完整的基础学术训练应包含:
- 理论 (Theory) <- 论文 (Paper)
- 实践 (Practice) <- 代码 (Code)
- 分析 (Analysis) <- 论文 (Paper)
三、 电力市场背景知识
1. 市场概况
- 电能量市场: 核心关注的是价格和数量。
- 市场层级: 分为批发市场(发电商 -> 现货市场 -> 用户)和零售市场。
2. 市场分类
电能量市场主要分为两个市场:
中长期市场:
- 性质: 即差价合约。
- 周期: 覆盖多年、月、日等不同时长。
- 电量分解:
- 将总电量按月权重分解(或月平均分到日)。
- 可能按天加权,或按小时划分(使用一天24小时的经典负荷曲线)。
- 时段分解: 按照谷、平、峰等时段,按比例划分不同的价格。
现货市场 (Spot Market):
重点: 这是电价预测的核心关注点。
时间节点:
- 运行日 (D): 当天。
- 日前 (D-1): 运行日的前一天。
流程:
- D-1日: 市场成员进行报量报价。
- D日: 电力需要实时平衡(发的电不用就没了)。
价格核心:
出清 (Clearing): 供需曲线的交点称为出清点,决定出清价格。
日前价格 (D-1 Price): D-1日形成的价格,用于日前电量结算。
现货价格 (D-Day Price / Real-time Price): D日实时价格,用于结算偏差电量。

预测目标: 日前价格和现货价格是预测的两个核心目标。

3. 关键概念
- 直调负荷: 省级调度的负荷。
- 联络线: 省级之间的电力交换线路。
- 抽水蓄能 (Pumped Storage):
- 作用: 电力难以大规模储存,需要“时移”。将用电低谷期(谷)的电量用于抽水,在用电高峰期(峰)放水发电。
- 特征: 数据上有明显的正负(发电/用电)。
- 新型储能: 指电池储能等(例如 312H),类似大型“充电宝”。
四、 实验 Pipeline 与实践
1. 实验注意事项
- 数据集划分:
- 严格划分训练集、验证集、测试集。
- 时序数据陷阱: 验证集和测试集在时间上不能与训练集有重叠,防止“偷看”未来数据。
- 模型对比:
- 可比性: 不同论文在不同数据集上的指标不能直接比较。
- 正确做法: 必须复现参考论文的模型,并将其放到同一数据集上进行训练和测试,才能进行公平的性能比较。
2. Pipeline 搭建
- 标准流程:
Data -> Input -> Model -> Output -> 指标/Sample分析/图表 - 模块化设计:
- 搭建 Pipeline 时,应确保 Model 部分可以灵活替换。
- Input 部分也可能需要根据不同模型进行替换。
- 其他部分(如数据加载、评估指标)应保持固定。
- 持续迭代: 通过不断阅读论文,来扩充和完善自己的 Pipeline 模板。
3. 实践步骤
- 注册超算平台。
- 搭建基础模板: 基于自己的 Pipeline 模板,先实现一个最简单的模型(例如 LSTM)。
- 跑通流程: 将该简单模型放到超算平台,确保整个流程(数据读取、训练、验证、测试)可以顺利跑通。