值此清华大学能源互联网创新研究院成立十周年之际,我们推出“建院十周年学术特辑”专栏,精选院内各研究团队已发表的学术成果,系统呈现研究院在能源互联网领域的前沿研究。本期推出能量管理与调控研究中心的学术论文,发表于Journal of Modern Power Systems and Clean Energy,详见文末“阅读原文”。
基于博弈论进行面向自动化按需出行车队的充电定价
| DOI: 10.35833/MPCE.2024.000139
| 作者 王嘉炜 盛裕杰 葛怀畅 白翔
苏珈 郭庆来 孙宏斌
现实世界的运营案例表明,与传统出行方式相比,共享交通可以更有效地满足城市出行需求,显著提高资源利用效率。在此基础上,车联网、自动驾驶等技术突破进一步为变革交通模式提供了强大动力。AMoD成为极具前景的交通解决方案。然而,电动化车队的高效运作离不开充电支持。AMoD车队的充电行为将会成为连接电力系统和交通系统的关键环节,需要以充电定价为代表的充电负荷管理策略加以合理引导。充电站运营商(Charging station operator, CSO)与AMoD车队这两大主体作为未来城市交通中举足轻重的角色,它们之间的交互存在着与现状不同的模式,将深刻影响着电力系统与交通系统的运行动态。
目前,AMoD车队的特点已经得到充分认识。已有研究探索了车队调控优化,并已经关注到电力-交通耦合,重视车队充电行为的关键作用。然而,对于CSO与AMoD车队之间围绕充电价格展开交互的模式及其产生的效果,尚未得到充分的讨论。它面临的挑战主要包括:
1)以往的充电定价工作通过各类交通分配模型刻画以传统电动汽车为主的交通流,但交通分配模型无法描述AMoD车队的行动模式与决策理性。按需调度的AMoD车队可以在利润驱动下更有效地协调其路线安排和充电计划,而这伴随着接单、移动、充电等行为的复杂时空耦合。
2)部分现有工作尝试协同优化电力系统和AMoD系统,这忽视了CSO的独立主体地位以及充电服务价格作为车队实际可感知信息的基础性作用。两个研究对象之间的交互并非只是“充电站”与“车辆”的物理交互,而更是“充电站运营者”与“车队管理者”的决策交互。充电价格作为同时影响双方利益的关键变量,成为双方博弈的核心。
3)集中管理的自动化车队表现出的决策理性将使得车辆有资格与充电站进行对等交互(例如谈判),而这在交通系统仍被分散无序的私家车占据主导的场景中几乎是不可能的。新的交互模式为系统带来更大的效益潜力,也扩展了充电价格的形成机制。
为了以适当的复杂性描述接单、移动、充电等多类型车队决策,本文在如图1所示的时间-空间-电量增强网络中基于多商品网络流问题建立AMoD车队的决策模型。在网络流的视角下,车队中一定数目的车辆从一个位置移动到另一个位置的决策被描述为在时间、空间、电量三个维度上的流动行为。尽管网络流模型的近似属性导致它可能不适用于开发AMoD系统的实时控制器,但用于评估与CSO的交互和博弈时,它可以反映出车队的行动趋势。
图1 时间-空间-电量增强网络中对于各种类型车队决策的建模
对CSO而言,从实际出发,其定价决策往往是分档位的。CSO可以按照历史运行经验和任何已有数据,给出充电价格的大致范围,并将充电价格划分为从高到低的多个档位。离散化的充电定价有助于解决后续联立构建博弈问题时可能出现的连续变量相乘的问题,有利于计算实施。同时,充电定价的时间尺度一般而言也不会过于频繁,可能具备与车队调度不同的时间尺度。
本文为AMoD车队和CSO设计了非合作与合作两种交互模式。
首先,如图2所示,作为基准,利用主从博弈(Stackelberg博弈)分析了CSO面对AMoD车队的非合作定价策略,捕捉到两个主体之间的基本交互趋势。
图2 CSO与AMoD车队之间的Stackelberg博弈
以非合作为基准(谈判破裂点),双方合作将带来更大的效益潜力。如图3所示,本文使用纳什谈判(Nash Bargaining)作为协商议价工具。突破非合作困境的基础在于,非合作博弈将得到低效率的均衡。在所有充电站均积极配合车队作为可用资源的情况下,车队无需过度计较充电成本,其接单顺序、路线安排都有可能得到进一步优化,低效的移动可能减少,有利于完成更多的乘客订单,从而提升总收入。
图3 CSO与AMoD车队之间的纳什谈判
面向AMoD车队的充电定价与交互模式可能有怎样的影响?
本文采用了真实世界中的网约车订单数据集进行数值实验,认为经过预处理后,数据集中的17万余条乘客出行订单能够描述该城市的乘客出行需求分布情况。
本文设置了4个用于对比的案例,以全面比较各种场景的特点与影响。
案例1:完全的集中优化。假设存在一个单一实体,它能够完全控制充电站和车队,以优化总利益为目标。
案例2:非合作博弈。CSO与AMoD车队互相考虑对手的行动,以最大化自身利益为唯一目标,达成Stackelberg均衡。
案例3:合作谈判。以非合作为基准,CSO与AMoD车队共同协商出一个使得双方利益都有所增加,且相对公平(按照纳什谈判视角)的充电价格方案。
案例4:合作谈判,但假设AMoD车队背叛了谈判协议。
表1给出了不同案例下的博弈结果并计算了与双方相关的指标。
表1 不同案例下的博弈结果与指标计算
首先可以看到,案例1决定了两个主体的总收益上限。在案例2中,即使CSO的平均充电定价较高,但AMoD车队并未非常积极地进行充电,且充电时段都尽可能避开了高价时段,CSO并没有获得很好的净收益。由于充电成本的顾虑,车队必须精细地规划路线,甚至放弃大量乘客订单,车队净收益也有下降。总体而言,案例2与案例1相比,体现了非合作所带来的整体效率损失(约为7.45%)。在案例3中,CSO按照谈判协议,平均充电价格有所下调,这使得车队无需过度顾虑充电成本,路线安排进一步优化,可以尝试接送更多乘客,净收入上升。由于移动距离的增加,车队充电需求也必然增加,一日内的总充电电量有所上升,CSO的净收入也得到提高。除去两大运营主体的净收益得到增加,乘客的出行需求也得到了更大的满足,达成了多方共赢。
案例2与案例3的对比表明,CSO作为先手方,没有主动背叛并回到Stackelberg均衡上的动机。案例4与案例3的对比表明,AMoD车队作为后手方,一旦选择背叛,确实将会明显提升净收入。然而,这种收入提升并非来源于乘客订单,而是来源于过度地追求低价时段,这将严重损害CSO的收益。同时,从整个交通系统上讲,这种情况减少了完成乘客订单的数量,明显增加了空车移动的距离。与案例1相比,这带来了严重的效率损失(约为8.83%)。为了抑制合作中的背叛行为,从博弈原理上讲,阻碍背叛可能需要重复博弈和冷酷触发策略所带来的威慑作用;从现实世界的视角,复杂的环境和监管有待进一步探索。
综上,本文设计的交互框架捕捉到了CSO与AMoD车队的决策特点,希望博弈均衡有助于为未来城市交通提供有价值的见解。
Jiawei Wang, Yujie Sheng, Huaichang Ge, Xiang Bai, Jia Su, Qinglai Guo, and Hongbin Sun. Charging pricing for autonomous mobility-on-demand fleets based on game theory [J]. Journal of Modern Power Systems and Clean Energy, 2024, 12(6): 2006-2018.
作 者 介 绍
郭庆来:清华大学电机系教授,博士生导师,主要研究方向为:能量管理系统、电压稳定与控制、信息物理系统、电动汽车。
孙宏斌:清华大学电机系教授,博士生导师,主要研究方向为:多能流系统的综合能量管理、无功电压优化控制、能源互联网。
王嘉炜:清华大学电机系博士研究生,主要研究方向为:电动汽车、能源-交通耦合分析与优化。
盛裕杰:清华大学电机系博士,现为国网福建电力调度控制中心工程师,主要研究方向为:电动汽车调度、能源-交通耦合网络建模与优化。
葛怀畅:清华大学电机系博士,主要研究方向为:电压稳定与控制、能源互联网。
白翔:华北电力大学能源动力与机械工程学院硕士,主要研究方向为:能源互联网。
苏珈:太原理工大学电气与动力工程学院讲师,主要研究方向为:综合能源系统、机器学习在能源系统中的应用。
团 队 介 绍
能量管理与调控研究中心成立于2015年,现有研究人员40余人,包括教授4人,副研究员1人。能量管理与调控研究中心面向能源互联网的能量管理与运行控制,以保证未来能源互联网的安全可靠高效运行为目标,研究方向涵盖能量管理与运行控制、多能协同调度、可再生能源、信息物理融合系统、主动配电网与微网、需求侧响应、虚拟电厂、电碳联合智慧决策等。能量管理与调控研究中心根植于清华大学电机系调度自动化研究室。该团队在电力系统能量管理领域有超过30年的研究积累,是我国最早开始电网能量管理与运行控制研究的单位之一。研发了我国第一套具有完全自主知识产权的大区电网EMS应用软件,开发的EMS应用软件在国内超过72个地区级以上电网推广应用。电网无功/电压控制和有功/频率控制的主要研究成果应用面覆盖我国2/3以上网省级电网和6/10以上的大型风/光基地,相关技术出口到北美最大的区域电网——美国PJM电网,成为我国先进电网控制系统输出美国的首例,并获2018年国家科技进步一等奖。