基于预测的自动驾驶GPS欺骗检测

汽车安全 3年前 (2022) admin
660 0 0

*本文来自轩辕实验室杨杰森的研究成果和学习笔记。

01-概述

全球导航卫星系统(GNSS)为使用卫星和无线电通信的自动驾驶车辆(av)提供定位、导航和定时(PNT)服务。由于缺乏加密、粗获取(C/A)代码的开放访问和信号强度的低,GNSS容易受到欺骗攻击,影响AV的导航能力。欺骗攻击很难检测到,因为欺骗攻击者(执行欺骗攻击的攻击者)可以模拟GNSS信号,并将不准确的位置坐标传输到AV。这篇论文开发了一种基于预测的欺骗攻击检测策略,使用长期短期记忆(LSTM)模型,一个递归神经网络模型。LSTM模型用于预测自动驾驶汽车的两个连续位置之间的行驶距离。为了开发LSTM预测模型,这篇论文使用了一个公开可用的真实世界comma2k19驾驶数据集,训练数据集包含从AV的控制局域网(CAN)、GNSS和惯性测量单元(IMU)传感器中提取的不同特征(即加速度、方向盘角度、速度和两个连续位置之间的行驶距离)。基于当前位置和自动驾驶车辆的未来位置之间的预测行驶距离,使用GNSS装置的定位误差和与当前位置和未来位置之间的行驶距离相关的预测误差(即最大绝对误差)建立阈值。分析表明,基于预测的欺骗攻击检测策略能够成功地实时检测到攻击。

02-数据集描述和处理

这篇论文的研究使用了来自Comma.ai的真实世界驾驶数据集,名为Comma2k19,其中包含各种AV传感器数据。2019年,该车在加州280条高速公路上行驶了33个小时(见图1),每个路段的旅行时间为1分钟,所有路段均位于圣何塞和旧金山之间,全长为20公里,Comma.ai使用的AV有一个前置摄像头、温度计和9轴惯性测量单元(IMU),用于收集数据,除了这些传感器数据外,Comma2k19数据集还包含了来自GNSS和控制区域网(CAN)的测量值(见表1和表2)。一个可以跟踪GNSS的u-blox M8 GNSS模块被用于采集数据,它的水平位置精度为2.5m,全球定位系统(GPS)和全球轨道导航卫星系统(GLONASS)信号用于位置测量。此外,还使用了一个开放访问的GNSS处理库Laika来减少定位误差,它使定位误差减少了40%,与这篇论文研究相关的IMU数据是车辆的加速度(如表3所示)。
基于预测的自动驾驶GPS欺骗检测
图1:加州美国-280高速公路上的公路路段。
基于预测的自动驾驶GPS欺骗检测
表1:来自Comma2k19数据集的样本GNSS数据。
基于预测的自动驾驶GPS欺骗检测
表2:来自Comma2k19数据集的CAN数据。
基于预测的自动驾驶GPS欺骗检测
表3:来自Comma2k19数据集的IMU数据。
同样,相关的CAN数据是车辆的速度和方向盘角度数据(见表2)。GNSS数据集包含来自u-blox和Qcom的实时和原始GNSS数据。每个活动部分包括纬度、经度、速度、utc_timestamp、高度和承载角度数据。该数据集包含密集和多样的驱动数据,可用于训练递归神经网络模型和预测所需的变量。该用于分析的数据集包含7200个GNSS观测、35726个CAN观测和72148个IMU观测。
当预测当前位置和自动驾驶汽车的未来位置之间的距离时,每个时间步长的经纬度坐标的距离用下面的哈弗森大圆(Haversine great circle)公式计算:

其中d为地球表面上两个点之间的距离,r为地球半径,?1,?2为当前位置的纬度,?2,?1为未来位置的纬度,ℎ????????函数定义为

其中,为以半径为单位的角度测量,图2显示了从comma2k19数据集其中一块中获得的5987个观测结果的每个时间戳的当前位置和即刻未来位置之间的距离,这些数据与CAN和IMU一起用于训练LSTM模型。
基于预测的自动驾驶GPS欺骗检测
图2:每个时间戳中当前位置和将来的位置之间的距离。

03-预测模型

LSTM是一种特定类型的RNN,它可以通过将时间序列数据的时间依赖性存储在循环隐藏层的内存块中来处理长期依赖关系。每个存储块由三个门组成:(i)输入、(ii)输出和(iii)忘记门。块状态由这三个门控制,一个LSTM块包括一个和一个激活函数。这篇论文使用LSTM模型来预测每个时间戳中使用无攻击的CAN、IMU和GNSS传感器数据(地面真实值)的当前位置和即时未来位置之间的移动距离。这篇论文使用了一个LSTM模型,它由一个输入层、一个包含50个神经元的循环隐藏层和一个输出层组成,训练LSTM模型的输入数据CAN的速度和转向角度数据和IMU的前向加速数据组成,输出数据每个时间戳的当前位置和将来位置之间的距离。(备注:Lable数据GNSS数据,即由GNSS数据得到的相邻两个时间戳之间的AV行驶距离)
在训练LSTM模型之前,所有特征都在0到1之间归一化,然后作为输入输入LSTM模型,并且将数据集分成一个由4500个样本组成的训练数据集一个由1487个样本组成的验证数据集,LSTM模型的超参数,如神经元数量、周期数、批处理大小和学习率,对提高预测精度起着至关重要的作用,采用试错方法求出最优超参数以Adam优化器作为评价度量,确保在训练模型时不存在过拟合和过拟合问题,采用**平均绝对误差(MAE)**准则作为损失函数,它的定义为

其中,N为训练样本量,分别为地面真实距离和预测距离。优化后的超参数的值如表4所示。在训练和验证数据集上绘制了MAE来评估LSTM模型的拟合优度,使用最优超参数的损失轮廓如训练和验证数据集的图3所示。比较这两个数据集的MAE,表明预测模型与最优超参数拟合良好
基于预测的自动驾驶GPS欺骗检测
表4:LSTM模型超参数。
基于预测的自动驾驶GPS欺骗检测
图3:平均绝对误差(MAE)(损失)轮廓与最优参数集的比较。
RMSE被用来当作评估模型效率的距离度量方式,它的定义如下

其中,N为总测试样本量,分别为地面真相和预测距离数据。图4显示了每个时间戳的当前位置和未来即刻位置之间的地面真实值和预测距离。最后发现,预测的行驶距离的RMSE为0.0242m,平均绝对误差为0.0203m
基于预测的自动驾驶GPS欺骗检测
图4:每个时间戳的当前位置和未来即刻位置之间的地面真实值和预测距离。

04-GNSS攻击检测策略

通过比较AV的LSTM预测距离和基于GNSS数据的当前位置和不久的未来位置之间的距离来检测欺骗攻击,在任何时间点t,模型将根据时间点t的当前GNSS、CAN和IMU数据预测车辆将通过(t+1)时间点行驶的距离,由于GNSS接收机模块的频率固定,因此时间步长持续时间固定。通过添加GNSS定位误差和LSTM预测误差,建立误差阈值。在(t+1)时间点时,使用t和(t+1)时间点时的经纬度计算车辆行驶的距离,如果计算出的距离大于欺骗攻击检测阈值(?),那么本文提出的基于预测的检测模型将将其检测为GNSS欺骗攻击。
基于预测的自动驾驶GPS欺骗检测
图5:GNSS攻击检测策略。
如图5所示,绿色圆圈的中心与车辆的当前位置重合,半径等于误差阈值。误差阈值为LSTM模型的预测误差和GNSS定位误差之和。如果来自GNSS的AV的下一个位置数据位于圆圈内(实绿色圆圈),那么车辆就不会受到攻击,但如果下一个位置位于绿色圆圈(实红色圆圈)之外,那么我们的策略可以检测到它作为一种攻击,这篇论文提出的检测策略中,用于检测对AV的欺骗攻击的误差阈值为1.5650m(?=1.5650m)

05-欺骗检测策略评估

基于预测的自动驾驶GPS欺骗检测
图6(a)
基于预测的自动驾驶GPS欺骗检测
图6(b)
图6(a)显示,从欺骗攻击开始的点开始,地面真实值和欺骗位置之间的距离开始显著增加,攻击点从图6(a)可以明显看出,图6(b)显示了在每个时间点,地面真实和欺骗位置之间的距离差异,一旦车辆的GNSS接收器受到欺骗攻击,预测的行驶距离与基于欺骗的GNSS信号计算出的距离之间的差值就大于攻击检测阈值(即1.5650m)。因此,一旦超过攻击检测阈值,该论文的攻击检测策略就会检测到攻击。同时该论文的研究中,还计算了基于预测的GNSS攻击检测策略的计算延迟,计算延迟为5ms,明显低于实时计算延迟的要求,即100ms(GNSS数据的频率,10Hz)。这证明了该论文提出的模型可以成功地检测到欺骗攻击。

原文始发于微信公众号(轩辕实验室):基于预测的自动驾驶GPS欺骗检测

版权声明:admin 发表于 2022年4月14日 下午12:49。
转载请注明:基于预测的自动驾驶GPS欺骗检测 | CTF导航

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...