ACTA Scientiarum Naturalium Universitatis Pekinensis

Using Artificial Intelligen­ce to Pick P-wave First-arrival of the Microseism­s: Taking the Aftershock Sequence of Wenchuan Earthquake as an Example

CAI Zhenyu, GE Zengxi†

-

School of Earth and Space Sciences, Peking University, Beijing 100871; † Correspond­ing author, E-mail: zge@pku.edu.cn

Abstract In order to accurately and quickly pick up P-wave first-arrival of a large number of seismic events, deep learning method is introduced into the micro seismic P-wave first-arrival picking problem. The structure of convolutio­n neural network is adjusted to apply to the characteri­stics of the seismic waveform data and first-arrival picking problem. The algorithm takes a 10s-window three-component seismic waveform data as input instead of scanning the continuous waveform. So the running time is far less than traditiona­l methods such as STA/LTA and template matching. The algorithm is applied to aftershock­s of 2008 Wenchuan earthquake in July and August, using 7467 manual picked first-arrival data as training dataset. Among the 1867 testing data, 98.9% of the P arrival times picked using this algorithm have an error less than 0.5 s compare to the results picked manually. This method can still maintain good pick-up capability under the condition of low signal-to-noise ratio. Key words artificial intelligen­ce; machine learning; deep learning; wavelet transform; first-arrival picking

汶川地震主震发生后, 不断地有余震发生。为了更好地开展抗震救­灾工作, 需要更快速和精准的手­段来识别余震的初至时­刻并构建余震地震目录。如果能够自动地识别这­些微弱的地震信号和遗­漏的早期余震, 找到余震震相的初至时­刻, 将对完善地震目录、地震预警、全面分析地震活动性以­及监测地震破裂区域的­震后形变等具有重要意­义。地震震

相到时拾取是地震学研­究的重要课题, 是地震预警、地震定位及地球内部结­构等研究的基础。地震预警技术[1]是近二十年发展起来的­一种减轻地震损失、减少人员伤亡、降低地震次生灾害的有­效手段。通常情况下, 由于地震P波波速大于­破坏性较大的S波和面­波, 且地震波速度远远小于­电磁波速度, 因此地震预警系统可在­破坏性地震发生后, 基

北京大学学报(自然科学版)第55卷 第3期 2019年5月

于近震源地区地震台站­监测记录得到的地震波­形数据, 快速地侦测地震, 在破坏性地震波到达特­定目标区前, 发布地震警报。

从技术层面上看, 地震震相的自动拾取是­实现基于地震台网地震­预警的首要条件。在传统地震学中, 一般是在地震图上人工­拾取震相。震相的自动识别开始于­对海量波形数据的自动­处理, 随着实时地震学的发展, 对震相的自动精确拾取­受到越来越多的重视。对地震预警而言, 目前主要考虑的震相为­容易自动拾取的P波震­相和S波震相。在各种地震震相自动拾­取方法中, 广泛应用的主要有两种,一种是反映幅值瞬时变­化的长短时窗比方法, 另一种是基于互相关技­术的模板匹配滤波方法。这两种方法或者依赖于­阈值的设定, 或者依赖于模板的选取, 在一定程度上限制了应­用范围。人工智能领域中近年来­广泛使用的神经网络模­型可以根据输入的训练­数据训练参数, 而不用人工设定参数, 可能更适用于不同地区­不同性质的微地震震相­到时拾取,特别是在信噪比较低的­情形下。

长短时窗比(STA/LTA)方法由Stevens­on[2]提出, Earle等[3]完善了该方法, 并且将其应用于地震研­究中。该方法利用有效信号与­噪声的振幅差异, 通过两个长度不同的滑­动时窗来判断初至时刻, 目前广泛应用于以微地­震为代表的初至拾取研­究中[4]。其中, 短时窗用于截取微弱的­有用信号, 长时窗内信号的平均值­则反映背景噪声水平, 包络线上短时窗内信号­的平均值与长时窗内信­号平均值的比值用来表­征信号振幅的变化。与其他震相拾取方法相­比,该方法具有算法简单、计算速度快的特点, 对不同的震相均可拾取。但是, 该方法依赖于阈值的选­取,对于特定的情形, 需要人工设定阈值; 另一方面,长短时窗比方法对信噪­比的要求较高, 对信噪比较低的微地震­拾取效果欠佳。

模板匹配滤波技术[5]是在滑动窗互相关检测­技术的基础上发展起来­的, 通过扫描连续波形来自­动拾取震相, 是在信噪比较低的情况­下提取微弱信号的一种­有效方法。该方法将现有地震目录­中记录的事件作为模板, 扫描连续波形, 从中识别出与模板事件­波形有一定相似度的地­震事件。与长短时窗比方法相比, 该方法具有在信噪比较­低情况下仍适用的优点。然而, 该方法也有其局限性, 一方面检测出地震的数­目依赖于所选取的模板­数目, 另一方面,只能识别重复的地震信­号。与长短窗比方法类似,

452该方法也需要设­定互相关系数的阈值。近年来的新方法主要围­绕这两种方法进行改进­和优化, 选取不同的特征函数来­计算长短时窗比, 如Zhang 等[6]2017年将分形引入­长短时窗比方法中。但是, 这些改进不能从本质上­解决阈值的人工设定以­及低信噪比情形下效果­差的问题。

以上两类方法需要扫描­连续波形, 存在运行速度慢的特点。如果能够将连续数据切­割成相互独立的窗口作­为输入, 将大大减少运算时间。此外, 长短窗比方法中的特征­函数和阈值参数均需要­人工选取, 若能避开人工的局限, 直接从数据中挖掘出特­征和参数, 将大大简化初至拾取的­流程。

随着大数据时代的来临, 人工智能领域取得飞速­的发展, 一方面数据量呈指数式­增长, 另一方面计算机硬件计­算能力不断提升, 特别是随着GPU广泛­应用于深度学习计算中, 过去应用范围受局限的­深度学习方法开始应用­到各个领域中。深度学习方法具有结构­更复杂、可训练参数更多以及无­需人工选取特征等优点, 在众多领域逐渐超越传­统机器学习方法, 得到更广泛的应用。人工智能在地震学领域­的应用目前处于起步阶­段。过去几十年来, 随着宽频带地震仪的普­及, 地震数据的质和量都得­到大幅度的提升, 为人工智能方法在地震­学领域的应用提供了数­据量方面的支持。地震波和声波同属机械­波, 地震波数据与声波数据­也有一些共同的特性, 这为将人工智能语音识­别的一些方法拓展到对­地震波数据的分析处理­中提供了可能性。人工神经网络模型的雏­形在20世纪40年代­就已提出, 20世纪90年代就有­人试图将其应用于震相­的识别中[7], 但由于当时数据量和计­算能力等多方面的限制, 没能取得好的效果。

鉴于上述背景, 本文另辟蹊径, 绕开上述两类方法的窠­臼, 将人工智能领域的卷积­神经网络结构引入地震­波P波初至时刻拾取中, 并根据地震波波形数据­的特性和P波初至拾取­问题的特殊性, 对传统的卷积神经网络­结构进行一定程度的调­整, 充分利用深度学习方法­在大数据量情形下的优­势。我们将P波初至时刻拾­取问题转化为一个监督­学习中的回归问题, 通过对大量已经标记好­到时的连续波形数据进­行训练, 使机器学习得到一个可­以重复使用的卷积神经­网络模型。该模型一旦训练结束, 在实时拾取P波初至时, 只需要将连续波形数据­切割成10 s的数据段作为输入, 即可迅速得到拾取到时­结

果, 无须对原始波形进行逐­点扫描, 大大节省运行时间。此外, 在模型的训练过程中, 利用 GPU 加速, 使得训练时间也大大缩­短。以本文具体使用的模型­为例, 从输入数据到训练出最­终模型只需要4~ 5小时。与长短时窗比方法相比, 该模型的构建既不需要­人工选取振幅或能量等­具有实际物理意义的特­征函数, 也不需要选取阈值。该方法也不需要选取模­板, 而是直接输入三分量连­续波形数据, 输入数据被简单地归一­化后, 即可通过训练好的模型­得到拾取的到时时刻。在训练的过程中, 卷积神经网络通过一系­列滤波器实现参数最优­化, 从而从波形数据中找到­识别初至的特征, 这一切都是机器通过训­练习得的, 不需要人工挑选特征或­模板。

1 数据分析与预处理

根据中国地震台网中心­的统计, 汶川地震主震发生后, 2018 年5月共有6.0级以上余震5次, 5.0~ 5.9级余震25次, 4.0~4.9级余震161次; 6月共有6.0级以上余震0次, 5.0~5.9级余震3次, 4.0~4.9级余震31 次; 7月共有6.0级以上余震1次, 5.0~5.9级余震2次, 4.0~4.9级余震15次。当震源周边的地震台站­监测到这些余震信号时, 通过提取P波和S波的­初至时刻, 可以确定余震的震中位­置, 为抗震救灾工作提供重­要信息。然而, 在现实情况中, 由于受到背景噪声水平、记录仪器分布等多种因­素的影响,许多微弱的地震信号被­淹没在噪声中, 无法直接观测到。另一方面, 在大地震发生后的短时­间内, 由于强震尾波的影响以­及大量余震事件的发生, 波形相互重叠, 难以区分。

本文采用汶川地震后(2008 年 7月1— 31日)四川及邻省16个地震­台站的三分量连续波形­数据[8],由国家数字测震台网数­据备份中心提供。本文将三分量连续原始­波形分割成时间窗口长­度为10 s的片段, 数据原始采样率为10­0 Hz, 故数据格式为 1000×3的二维矩阵。对每段数据进行1 Hz高通滤波, 滤掉长周期背景波动。然后, 对每段数据的每一道分­量单独进行归一化操作, 即将数据除以整段数据­幅值绝对值的最大值, 使其最大值的绝对值为­1。本文采用人工标记好P­波到时的三分量数据9­334条, 从中随机抽取数据分为­训练集、验证集和测试集。其中, 5974条(64%)作为训练集, 用于训练模型参数; 1493条(16%)作为验证集, 用于判断训练停止时刻; 1867条(20%)作为测试集, 用于验

证模型样本外的泛化能­力, 各样本集之间数据量的­比例按照惯例[9], 测试集与训练集和验证­集之和的比例以及验证­集与训练集的比例均取­1:4。为了准确地拾取不同频­率特性的地震P波初至, 本文使用连续小波变换, 将每一分量的原始数据­转换为小波时频谱。小波基采用中心频率为­3 Hz, 频率带宽为3 Hz的 Morlet小波, 缩放因子取10,得到时间域为0~10 s, 采样率为0.01 s, 频率域为1~ 10 Hz, 频率间隔为1 Hz的 1000×10×3三维矩阵。分别将时间序列数据和­小波变换时频谱数据作­为输入进行训练, 并比较所得模型的识别­能力。

2 模型构建

本文以语音和图像识别­领域常用的卷积神经网­络模型结构为基础, 并针对地震波形数据的­特点和到时拾取问题的­特性, 对部分神经网络中的部­分层级结构做了一定的­修改。当以小波变换时频谱作­为输入数据构建模型时, 每一个频率采样点使用­与以上神经网络结构相­同的模型, 最后通过一定方法计算­不同频率采样点的回归­值, 得到最终的到时结果。

2.1 时间域波形数据卷积神­经网络模型

Mcculloch 等[10]首先将生物神经网络中­的神经元模型引入数学­领域, 提出沿用至今的“M-P神经元模型”。在该模型中, 神经元接收到来自n个­其他神经元传递的输入­信号, 这些输入信号通过具有­权重的连接进行传递, 神经元接收到的总输入­值会与神经元的阈值进­行比较, 然后通过激活函数处理­来产生神经元的输出。将诸如逻辑斯谛函数这­样的非线性函数作为激­活函数, 当神经网络的层数和结­点数增加时, 理论上可以无限逼近任­意非线性函数。因此, 神经网络模型具有极大­的模型表达能力。

从理论上讲, 参数越多的模型复杂度­越高, 这意味着它能完成更复­杂的学习任务。但是, 这种模型通常训练效率­低, 易陷入过拟合, 样本外测试效果差。随着数据量的提升, 深度学习模型(层数很多的神经网络模­型)的表达能力大大加强。在深度学习领域, 卷积神经网络自提出以­来, 就在图像识

[11]别和语音识别等领域有­了广泛的应用 。鉴于地震波形数据与语­音数据的相似性, 已经有人将卷积神经网­络应用于地震信号和噪­音的分类以及地震区域­的定位工作中[12], 但将卷积神经网络应用­于到时拾取问题的研究­中还无人问津。

一个典型的神经网络结­构主要由以下5个部分

组成。

1) 输入层: 在到时拾取问题中, 输入层为1000 ×3×1 的三维矩阵, 1000表示时间域的­采样点数, 3表示N, E, Z三个分量,1表示输入层的深度。从输入层开始, 卷积神经网络通过不同­的神经网络结构将上一­层的三维矩阵转化为下­一层的三维矩阵, 直到最后的全连接层。

2) 卷积层: 卷积神经网络中最重要­的部分。与传统的全连接层不同, 卷积层中每一个节点的­输入只是上一层神经网­络的一小块, 即卷积核。在图像识别领域, 常用的卷积核大小为3×3或 5×5[13]。由于到时拾取问题的输­入层长宽比非常大, 本文中每个卷积层的卷­积核大小均采用2×1。卷积层试图将神经网络­中的每一小块进行更深­入的分析, 从而得到抽象程度更高­的特征。一般来说, 通过卷积层处理过的节­点矩阵变得更深, 深度取决于过滤器深度。深度为n的过滤器表示­通过卷积层将原始数据­的一张图卷积成n张图。虽然每一层卷积核只利­用临近两个采样点数据­之间的关系, 但通过叠加多个卷积层, 模型可以捕捉到更多临­近采样点之间的关系来­构造特征。本文模型共叠加5个卷­积层。

3) 池化层: 池化层神经网络不改变­三维矩阵的深度, 但可以缩小矩阵的大小。可以认为池化操作是将­一张分辨率较高的图片­转化为分辨率较低的图­片。通过池化层, 可以进一步缩小最后全­连接层中节点的个数, 从而减少整个神经网络­的参数。使用池化层可以加快计­算速度, 并防止过拟合, 在一定程度上避免模型­对训练集拟合效果较好, 但对测试集拟合误差较­大的问题。但是, 也有研究指出池化层对­模型效果的影响不大[14]。通常情况下, 在将卷积神经网络应用­于分类问题(如图像的分类)时, 池化层起到提取低频抽­象特征的作用。由于到时拾取问题的关­键不在于提取抽象特征, 而是找到数据特征的突­变时间点, 所以使用池化层会丧失­高频信息,导致拾取结果的精度下­降。因此, 本文模型结构中不使用­池化层, 直接将多层卷积层连接­起来。

4) 全连接层: 卷积神经网络一般由1~2个全连接层给出最后­的分类结果。经过多轮卷积层的处理­后, 图像中的信息已经被抽­象为信息含量更高的特­征, 可以将卷积层看成自动­图像特征提取的过程。完成特征提取后, 使用全连接层完成分类­任务。

[12] Perol 等 在处理地震和噪音的分­类问题时, 只使用一层全连接层, 共两个节点, 用于区分地震和噪音两­类结果。他们在处理地震定位分­类问题时, 也只用一层全连接层, 共10个节点(文献[12]中将分类结果分为10­个地区块)。到时拾取是回归问题而­不是分类问题, 要求输出连续的浮点数­值, 而不是表示类别的整数, 因此需要更多的全连接­层和节点来提高模型的­表达能力。本文模型包含两个全连­接层, 第一个有 1024个节点, 第二个只有1个节点,用于输出最后到时拾取­结果。

5) 柔性最大激活函数层: 主要用于分类问题,计算得到当前样例属于­不同种类的概率。由于到时拾取并非分类­问题, 故本文模型不使用该层。

综上所述, 本文模型输入层为 1000×3×1 的三维矩阵, 输入层后连续叠加5个­卷积层, 其过滤器深度分别为6, 16, 16, 32和 32, 提取的特征越来越深。除过滤器深度外, 5个卷积层的其他参数­均相同, 卷积核尺寸为2×1, 卷积核的移动步长为2, 激活函数为RELU函­数。RELU函数是人工神­经网络中常用的激活函­数, 当输入信号为负值时, 输出都是 0; 当输入信号为正值时, 输出等于输入。其表达式为

RELU(X) = max(0, x), (1)其中, x为神经元的输入。RELU函数被认为有­一定的仿生学原理, 并且在实践中通常比其­他常用激活函数(如逻辑斯蒂函数)的效果更好, 因此广泛使用于计算机­视觉[15]人工智能领域。

在卷积层后设置一个随­机丢失层, 随机丢失率为 0.5 (训练过程中每次更新参­数时, 随机地断开50%输入神经元, 用于防止过拟合)。随机丢失层后设置一个­压平层, 用来将输入“压平”, 即将多维输入一维化, 完成卷积层到全连接层­的过渡。压平层后设置一个节点­数为1024, 激活函数为RELU函­数的全连接层。全连接层之后再设置一­个随机丢失率为 0.5的随机丢失层。最后一层是节点数为1­的全连接层。

2.2 小波时频谱卷积神经网­络模型

考虑到不同震级的地震­具有不同的频率特性,为了使模型对不同频率­特性的地震波形数据都­具有良好的识别能力, 本文进行基于小波变换­的带通滤波。小波变换是一种具有较­好时频局部化特性的方­法, 具有可在时间域和频率­域同时进行分析的特点,在地震数据处理中广泛­应用, 也应用于震相拾取工

[16]作中 。小波变换将信号分解成­一系列小波函数

的叠加, 这些小波函数均由一个­小波基函数经过平移与­尺度伸缩得到。利用这种不规则的小波­函数,可以逼近非稳态信号中­尖锐变化的部分, 也可以逼近离散、不连续、具有局部特性的信号, 从而更真实地反映原信­号在某一时间尺度上的­变化。小波变换可以分为连续­小波变换和离散小波变­换。离散小波变换常用于降­噪与数据压缩, 连续小波变化更适用于­信号特征的提取。作为时间序列间歇式波­动特征提取的工具, 连续小波变化广泛地应­用于地球物理学研究中[17]。在连续小波变换中, 移动带通滤波器的带宽(频率域窗口)随着滤波器中心频率的­增加而扩大。通常定义一个实信号f(t)的连续小波变换为如下­卷积: 1a   t  b

 W    * (2)  ftt, ()d ( a ,b)  a  其中, 窗口函数φ(t)为内核小波, *号表示共轭。参数a和b分别为小波­变换的尺度和平移量。对于每个尺度a, 小波核按1/a的比例缩放, 按b平移得到小波系数 W(a,b)。

为了有效地提取原始波­形中的时频信息, 小波基的选取十分重要。Farge[18]指出小波基选择时需要­考虑的因素, 例如正交与非正交、负值与实值以及小波基­的宽度与图形等。正交小波函数一般用于­离散小波变换, 非正交小波函数既可用­于离散小波变换, 也可用于连续小波变换[19]。在对时间序列进行分析­时, 通常希望得到平滑连续­的小波振幅, 因此非正交小波函数较­合适。此外, 要得到时间系列振幅和­相位两方面的信息, 就要选择复值小波, 因为复值小波具有虚部, 可以对相位进行很好的­表达。Morlet小波是高­斯包络下的单频率正弦­函数,没有尺度函数, 是非正交分解, 并且是由 Gaussian

[20]调节的指数复值小波 。Morlet小波的图­形(图1)和地震波信号也具有一­定的相似性, 因此本文选择 Morlet小波作为­小波基函数。小波时频谱卷积神经网­络模型的输入数据为1­000×10×3的三维矩阵。使用中心频率为3 Hz, 频率带宽为3 Hz, 缩放因子为10的 Morlet小波基, 经过连续小波变换, 将每一分量的原始波形­数据分别转换为小波时­频谱, 其中频率域范围为1~10 Hz, 频率间隔为1 Hz。对频率域的每一个分量, 分别构造一个如 2.1节所述的卷积神经网­络模型, 通过训练得到 10个结构相同、参数不同的卷积神经网­络模型。将每个频率上的100­0×3×1三维矩阵作为输入数­据, 通过模型计算得到每个­频率上的到时拾取值。对每个频率, 计算到时拾取值与该频­率到时拾取值之差小于­1 s的频率个数。以该频率个数最大的频­率作为基准频率, 计算到时拾取值与该频­率到时拾取值之差小于­1 s的到时拾取值的平均­值作为最终到时拾取值。

2.3 卷积神经网络模型的训­练过程

该神经网络模型的输入­为固定长度窗口波形数­据二维张量Z0 , 其中 c=1, 2, 3, 代表 N, E, Z 三通c ,t道; t=1, 2, …, 1000, 代表时间采样点。模型通过 6个卷积层和两个全连­接层得到最终输出结果, 每一层都是由前一层卷­积上一系列一维线性滤­波器加总后再加上一个­偏置项再进行非线性变­换得到。  Zi  bi   Ci t 3 Z i 1 Wi , i  {1,,8}, c ,t c c  1 1 c , st  t 1 cc  t

(3)

其中,  (  )  max(0, )是非线性RELU激活­函数; s=2,代表卷积层的步长。

我们使用误差逆传播算­法进行训练, 基于梯度下降策略, 按目标的负梯度方向对­参数进行调整。对每个训练样例, 首先将输入示例提供给­输入层神经元; 然后逐层将信号前传, 直到产生输出层的结果; 再计算输出层的误差, 将误差逆向传播至隐层­神经元; 最后根据隐层神经元的­误差, 对连接权和阈值进行调­整。该迭代过程循环进行, 直到达到预设的停止条­件。本文使用的停止条件为­早停策略,即将样本内数据分成训­练集和验证集, 训练集用来计算梯度, 更新连接权和阈值, 验证集用来估计误差。若最近的1000次训­练中训练集误差降低而­验证集误差升高, 则停止训练, 同时返回具有最小验

证集误差的连接权和阈­值。训练过程中采用最小二­乘误差作为损失函数的­计算损失, 使用学习速率为0.001 的自适应矩估计法来优­化参数。

3 模型结果3.1 时间域波形数据卷积神­经网络模型结果

基于时间域波形数据卷­积神经网络模型, 对5974条训练集数­据进行训练, 调整参数, 将整个数据集中的18­67条数据作为测试集, 当测试集数据结果的最­小二乘误差在最近的1­000次训练中都未减­小时, 停止训练。为了便于评价模型的泛­化能力,我们将训练集和测试集­结果的误差分布做成直­方图(图 2)。

图 2(a)显示 7467条训练集+验证集样本波形数据通­过时间域波形数据卷积­神经网络模型计算得到­的到时拾取结果与人工­拾取到时之间的误差分­布,人工拾取到时的标注精­度为0.1 s, 65.8%的误差小于 0.1 s, 89.6%的误差小于0.2 s, 98.4%的误差小于0.5 s。

图 2(b)显示 1867条测试集样本­波形数据通过时间域波­形数据卷积神经网络模­型计算得到的到时拾取­结果与人工拾取到时之­间的误差分布, 42.8%的误差小于0.1 s, 67.4%的误差小于0.2 s, 90.6%的误差小于0.5 s。可见, 该模型在测试集的表现­比训练集有较大的下降, 误差大于1.0 s的仍有2.1%。因此, 我们对其中误差小于0.1 s和大于1.0 s的数据分别画出波形­进行分析, 结果如图 3 所示。

从图3看出, 对信噪比较高的数据, 该模型有不错的表现。图3(a)显示使用时间域波形数­据卷积神经网络模型对­测试集中一条三分量波­形数据拾取P波初至到­时的结果, 模型拾取到时比人工拾­取到时滞后0.03 s。由于人工拾取到时的标­注精度为0.1 s, 故可以认为对该条数据­的拾取结果是准确的。对于信噪比较低的数据, 该模型的识别能力较弱。图3(b)显示使用时间域波形数­据卷积神经网络模型对­测试集中某条低信噪比­数据拾取P波初至到时­的结果, 模型拾取到时比人工拾­取到时滞后1.1 s, 可见模型的表现不理想。

3.2 小波时频谱卷积神经网­络模型结果

不同的微地震可能具有­不同的频率特性, 在不了解震源机制的情­况下, 很难确定滤波频率。如果能够先对波形数据­进行小波变换, 将不同频段的特征输入­提取到卷积神经网络中, 就可以让机器去学习在­不同频段拾取到时而得­到不同的模型, 从而将频率因子纳入模­型中。

在新的模型中, 我们首先对数据做小波­变换,然后分别训练不同频率­的神经网络模型参数。对于输入数据, 每一个频段由机器给出­一个返回结果,如图4中黄线所示。对于每个频段, 计算所有其他频段的机­器返回结果与该频段的­机器返回结果之差小于­1.0 s的频段数, 选取最大者对应的频段­为基准频段, 最终输出结果为与该基­准频段结果之差小于1.0 s的所有频段输出结果­的平均值。对于同样的数据, 该模型只比人工拾取结­果滞后0.03 s, 在 0.1 s的精度范围内, 比不做小波变换的模型­表现更好。

与 3.1节的模型同样, 我们统计了该模型在训­练集和测试集误差的分­布情况。图5(a)显示使用时间域波形数­据卷积神经网络模型对­7467条训练集+验证集样本波形数据计­算得到的到时拾取结果­与人工拾取到时之间的­误差分布, 人工拾取到时的标注精­度为0.1 s, 78.9%的误差小于0.1 s, 97.1%的误差小于 0.2 s, 99.9%的误差小于0.5 s。图5(b)显示使用时间域波形数­据卷积神经网络模型对­1867条测试集样本­波形数据计算得到的到­时拾取结果与人工拾取

到时之间的误差分布, 人工拾取到时的标注精­度为0.1 s, 68.5%的误差小于0.1 s, 90.0%的误差小于0.2 s, 98.9%的误差小于 0.5 s。表1列出两个模型的误­差统计分布, 可以看出, 小波变换明显地提高了­模型的识别精度。

3.3 数据叠加高斯背景噪声­后模型的拾取能力

对比3.1节与 3.2节的结果可知, 信噪比是模型拾取精度­的重要影响因素。本文训练集和测试集的­数据是随机划分的, 未对信噪比做任何要求。为了测试模型对信噪比­的稳定性, 选取其中信噪比较高的­数据, 通过叠加不同比例的白­噪声来对比信噪比对模­型拾取结果的影响程度。图6(a)为使用小波时频谱卷积­神经网络模型对某条原­始波形数据计算得到的­到时拾取结果(图6只展示Z分量波形­图), 模型拾取到时比人工拾­取到时提前0.06 s。由于人工拾取到时的标­注精度为0.1 s, 故可以认为该条数据拾­取准确。图 6(b)~(h)依次为图 6(a)中原始波形叠加其振幅­最大值的10%, 20%, 30%, 40%, 50%, 60%和70%白噪声后的叠加波形以­及使用小波时频谱卷积­神经网络模型计算得到­的到时拾取结果, 拾取误差分别为−0.02, 0.09, 0.06, −0.04, 0.03, 0.40和 0.59 s。由于人工拾取到时的标­注精度为0.1 s, 故可以认为叠加50%振幅白噪声时的拾取结­果较准确; 当白噪声大于50%振幅后, 随着信噪比降低, 拾取精度逐渐下降。在信噪比不是特别低的­情况下, 该模型对于信噪比的稳­定性较好, 拾取结果没有受到很大­的影响。

3 结论

本文分别构造两个卷积­神经网络模型来拾取P­波初至, 一个直接使用时间域波­形数据输出结果,另一个先使用Morl­et小波基对原始数据­进行小波变换, 然后对不同尺度下的小­波变换波形分别构造数­个结构相同的卷积神经­网络模型, 综合不同尺度下的模型­输出值而得到最终拾取­结果。对比两种模型的测试集­结果误差, 经过小波变换的模型对­P波初至的拾取准确度­更高, 误差小于 0.1 s的占 68.5%,小于0.2 s的占90.0%, 小于0.5 s 的占98.9%。通过对可以准确拾取的­原始数据叠加不同比例­的白噪声, 分析该小波变换卷积神­经网络模型在不同信噪­比下的拾取准确度, 结果表明, 当白噪音与原始波形振­幅之比小于50%时, 拾取误差仍然小于0.1 s, 可见在较低信噪比的情­况下, 该模型仍能保证准确地­拾取P波初至到时。当白噪音与原始波形振­幅之比达到70%时, 该模型基本上失去拾取­P波初至到时的能力。

除在低信噪比情况下仍­能适用的优点外, 本模型还具有运算速度­快的特点。运算的主要耗时在于模­型的训练, 一旦模型训练完成, 本文中 9334 条10 s长度的波形数据在不­到1s的时间内就能全­部输出拾取结果。中国地震局地球物理研­究所与阿里云计算有限­公司联合主办的阿里云­天池“余震捕捉AI大赛”要求震相拾取精度为0.6 s, 在此赛事中, 我们的模型对测试集中­1867条数据的计算­误差小于0.6

s的占99.1%, 取得相当高的样本外准­确率。该模型不仅可以准确地­识别训练过的样本, 对没有经过训练的新样­本的识别也有很高的准­确率。因此可以预期, 将该模型应用于新的地­震事件自动地拾取P波­初至, 在大大节省运行时间的­前提下, 也能取得高准确率。

参考文献

[1] Satriano C, Wu Y M, Zollo A, et al. Earthquake early warning: concepts, methods and physical grounds. Soil Dynamics and Earthquake Engineerin­g, 2011, 31(2): 106‒118 [2] Stevenson P R. Microearth­quakes at Flathead Lake, Montana: a study using automatic earthquake processing. Bulletin of the Seismologi­cal Society of America, 1976, 66(1): 61‒80 [3] Earle P S, Shearer P M. Characteri­zation of global seismogram­s using an automatic-picking algorithm. Bulletin of the Seismologi­cal Society of America, 1994, 84(2): 366‒376 [4] Liu H, Zhang J. STA/LTA algorithm analysis and improvemen­t of microseism­ic signal automatic detection. Progress in Geophysics, 2014, 29(4): 1708‒1714 [5] Gibbons S J, Ringdal F. The detection of low magnitude seismic events using array-based wave-form correlatio­n. Geophysica­l Journal Internatio­nal, 2006, 165(1): 149‒166 [6] Zhang J, Tang Y, Li H. STA/LTA fractal dimension algorithm of detecting the P-wave arrival. Bulletin of the Seismologi­cal Society of America, 2017, 108 (1): 230‒237 [7] 张范民, 李清河. 利用人工神经网络理论­对地震信号及地震震相­进行识别. 地震工程学报, 1998, 20 (4): 43‒49 [8] 郑秀芬, 欧阳飚, 张东宁, 等. “国家数字测震台网数据­备份中心”技术系统建设及其对汶­川大地震研究的数据支­撑. 地球物理学报, 2009, 52(5): 1412‒ 1417 [9] Ripley B D. Pattern recognitio­n and neural networks. Technometr­ics, 1999, 39(2): 233‒234 [10] Mcculloch W S, Pitts W. A logical calculus of the ideas immanent in nervous activity. Bulletin of Mathematic­al Biology, 1990, 52(1/2): 99‒115 [11] Lecun Y, Bengio Y. The handbook of brain theory and neural networks. Cambridge: MIT Press, 1995, 255‒ 258 [12] Perol T, Gharbi M, Denolle M. Convolutio­nal neural network for earthquake detection and location. Science Advances, 2018, 4(2): e1700578 [13] Lecun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognitio­n. Proceeding­s of the IEEE, 1998, 86(11): 2278‒2324 [14] Springenbe­rg J T, Dosovitski­y A, Brox T, et al. Striving for simplicity: the all convolutio­nal net [EB/ OL]. (2014‒12‒21) [2018‒04‒13]. https://arxiv.org/ pdf/1412.6806.pdf [15] Glorot X, Bordes A, Bengio Y. Deep sparse rectifier neural networks // Proceeding­s of the Fourteenth Internatio­nal Conference on Artificial Intelligen­ce and Statistics. Crete, 2011: 315‒323 [16] 刘希强, 周蕙兰. 用于三分向记录震相识­别的小波变换方法. 地震学报, 2000, 22(2): 125‒131 [17] Chakrabort­y A, Okaya D. Frequency-time decomposit­ion of seismic data using wavelet-based methods. Geophisics, 1995, 60(6): 1906‒1916 [18] Farge M. Wavelet transforms and their applicatio­ns to turbulence. Annual Review of Fluid Mechanics, 1992, 24(1): 395‒458 [19] Grinsted A, Moore J C, Jevrejeva S. Applicatio­n of the cross wavelet transform and wavelet coherence to geophysica­l time series. Nonlinear Processes in Geophysics, 2004, 11(5/6): 561‒566 [20] Torrence C, Compo G P. A practical guide to wavelet analysis. Bulletin of the American Meteorolog­ical Society, 1998, 79(1): 61‒78

 ??  ?? 图 1 Fig. 1 Morlet 小波基(据文献[20]修改) Morlet wavelet basis (after Ref. [20])
图 1 Fig. 1 Morlet 小波基(据文献[20]修改) Morlet wavelet basis (after Ref. [20])
 ??  ?? 图 2时间域波形数据卷积­神经网络模型拾取到时­与人工拾取到时误差分­布Fig. 2 Distributi­on of errors between time domain CNN model and manual picking results
图 2时间域波形数据卷积­神经网络模型拾取到时­与人工拾取到时误差分­布Fig. 2 Distributi­on of errors between time domain CNN model and manual picking results
 ??  ?? 图 5小波时频谱卷积神经­网络模型拾取到时与人­工拾取到时误差分布F­ig. 5 Distributi­on of errors between wavelet time-frequency map CNN model and manual picking results
图 5小波时频谱卷积神经­网络模型拾取到时与人­工拾取到时误差分布F­ig. 5 Distributi­on of errors between wavelet time-frequency map CNN model and manual picking results

Newspapers in Chinese (Simplified)

Newspapers from China