AI 偵測慢地震

katepili
2021年1月7日
讀畢需時 6 分鐘

已更新：2021年1月10日

一、連續資料中不同事件類別能否被系統性的偵測和分類？

跟我們生活息息相關的環境震動，短至數秒的爆炸事件、飛機墜毀和重大車禍，長至長微震和土石流事件，對社會和經濟造成一定衝擊，尤其對微小震動高度敏感的半導體產業。埋藏的環境震動，包含天然地震與人造地震，其即時偵測、分類、定位與物理機制仍未有系統的收集和分類，主要原因在於地震儀的連續紀錄中，一般皆以天然地震為主要分析目標。如圖一所示，不同震央距的地震，能量的持續時間不同，P、S波的分辨度、振幅比亦不同(a-c)，而背景噪音(雜訊)在夜晚和白天，則有不同的振幅和波形特性表現(d-e)。在背景噪音中，近年來發現了大量的非火山長微震(non-volcanic tremor)活動，這種慢速滑移活動介於一般地震(快地震)數十秒的快速破裂、和數年的緩慢蠕變(creeping)之間，其錯動位移有限、錯動歷時長，以至於僅有非常弱的地震波輻射，難以從地震波分辨，特徵為貌似雜訊、主頻在2至8 Hz間、無明顯P波、S波到時、能量持續時間長、數分鐘到數月不等、並能在相距數公里至數十公里不等的測站具近乎一致之到時。這樣類型的「雜訊」直至2002才被發現 (Obara, 2002)，又被稱作慢地震。

圖一、連續資料中的不同種類訊號。在此Y軸為速度(cm/s)，X軸為時間(s)，在不同圖有不同的比例: (a-c) 3秒至50秒不等，而(d-e)為80秒，請見以下說明。(a) 震央距<10km內的近距地震，有清楚的P波和S波初達波相，能量持續時間為3秒，主頻為6-30 Hz。 (b) 震央距在10-100km內的地震，S波初達波相不清楚，能量持續時間為26秒，主頻為2-15 Hz。(c) 100-600 km的區域型地震，有清楚的P波初達波相，能量持續時間為50秒，主頻為0.5-8 Hz。(d) 夜間噪音，主頻範圍0.3-30 Hz。(e)白天噪音，主頻範圍0.3-30 Hz。(圖取自Beyreuther and Wassermann, 2008)

記錄著環境背景震動的連續資料中，有多少訊號，對應著深部變形和近地表人為活動? 他們能不能被系統性地偵測與分類?

二、事件偵測手段的演化

事件偵測是將有用訊號和背景噪音分離的手段，在這裡的有用訊號，泛指我們感興趣的訊號，在地震學裡的「模式辨識」(pattern recognition)淵源已久，主要分成三個步驟：第一、將微弱訊號由背景噪音中分離；第二、定義地震波相以做「到時」的自動判定；第三、釐清物理機制(天然地震或人為地震)。大量連續資料中的事件偵測，需要兼顧運算效能(computational efficiency)、偵測靈敏度(detection sensitivity) 和應用廣度(general applicability)，過去有四大手段陸續被提出 (Yoon et al., 2015)：最早提出的是計算訊號的長期平均(LTA)和短期平均(STA)比值，當比值大於特定門檻時，定義為有意義事件的STA/LTA法，具有最大的應用廣度，對任何型態的目標事件，可以用訊號的短、長期平均比值進行篩選，但是人工辨識耗時，適合用於中規模以上地震，或測站數目少的資料。為了克服STA/LTA利用「振幅」當門檻的缺點(僅適用脈衝訊號)，另一種模版配對法(template matching)利用了全波形特徵，並考慮地震重複發生的特性，以波形的相關性在吵雜的資料裡尋找事件，此法具有最高的運算效率，適合已有大量波形模板(template)的事件搜尋(例如相似地震)，然而，若資料數目變大時，比對的時間將大幅增加，此外，比對之閥值也須經由嘗試錯誤法來調整，當測站數目增加時，閥值之調整將需要大量的時間，且不保證最佳化。為改善模版配對法必須把「波形模板」備齊的難處，自相關法(autocorrelation)對訊號進行了盲蔽搜尋(blind search)，亦即把資料切割成N個短時窗，每個時窗進行相關計算，當相關係數值大於特定門檻則留用，視為候選事件，此法具有最佳的偵測分辨率，適合訊號中有大量目標事件的資料(例如地震頻繁區)。目前為止最新最快的盲蔽式偵測法，稱作FAST(Fingerprint And Similarity Thresholding) 利用多維度的最近鄰居法搜尋(nearest-neighbor search)，提供最高機率的相似事件對，避免不相似事件對的耗時比較。但是在訊號的特徵萃取，必須依目標事件量身訂做。

近幾年，利用機器學習(machine learning)進行地震資料分類的技術漸漸盛行，其中包含類神經網絡(Artificial Neuronal Network, ANN)、隱馬可夫模型(Hidden Markov Models, HMM)和支持向量機(Support Vector Machine, SVM)等等，目標皆為改善單一門檻分類的缺點，藉由標籤化的資料進行監督式學習(supervised learning)，讓電腦自行建立一個分類的模型，不同的特徵的資料點在多維模型的表現如圖二所示，資料點間呈現最小變異度的歸類成同一組，而最大變異度的歸類成不同組，而以支持向量機(SVM)為例，這個線性分類器能定義在特徵空間上間隔最大的群組，以求最佳的分離超平面。本研究擬採用監督式學習的演算法，進行特徵抽取以有利分類率的表現，期能定義「多維特徵空間中的邊界」而非「門檻值」。

圖二、資料群在特徵空間的分布圖。由訓練資料(黑點)所決定的分界線如虛線所示，當新的資料(紅、藍、綠)進到系統時，會依貝氏分類法則計算新資料落於A、B、C的機率。(圖取自Beyreuther and Wassermann, 2008)

三、本研究使用之機器學習手段

自2017年開始，我們與台科大機械工程系的劉益宏老師合作，致力於利用機器學習演算法進行智能偵測和分類，期能避免樣板比對的高計算複雜度，並自動學習決策邊界(decision boundary)來進行偵測及分類(Liu et al., 2019)。我們想問，能否利用單站，對偵測有難度、和背景噪音振幅相仿、往往需要多站共同判釋的慢地震訊號進行分類和偵測？

本計畫分別準備地震、長微震和背景噪訊三種類別的波形，將之標籤化以進行後續資料訓練，利用的三個測站和對應的波形如圖三所示。首先選用的分類器，是傳統而簡單的kNN（k近鄰分類法），此法計算任一比未知資料「與不同類別在特徵空間的歐式距離」，找最相近的k個鄰居投票表決，來決定這個未知資料應該分到哪一類別。在訓練階段，所有的演算法參數皆須最佳化，我們採用廣泛使用的交叉驗證法(Leave-One-Out Cross Validation, LOO-CV)來進行，此方法容易實現，並且可以自動化執行。每個測站、每個類別均為204筆事件（每個事件為60-s），經由LOO-CV得到的分類表現如表一所示，在較遠離長微震震源區的YULB有最差的分類率為68%，而在較近的測站則介於86-94%間。

接著，我們選出時間域、頻率域、時頻域共27個特徵，利用Fisher’s class-separability criterion (Fang et al., 2015) 針對每一種初始特徵進行自動評估。每一種特徵，得到一個費雪分數(Fisher score) - 同組內和不同組間的分散量之比值，代表此特徵對於事件分類的優劣，分數越高，代表此特徵讓不同類別間的鑑別更容易。因此，在訓練階段將所有初始特徵依照費雪分數從高至低排序，挑出前N%的最佳的特徵當作後端的偵測及分類輸入。此方法之好處在於：(1)演算法自動快速選擇，免人為嘗試錯誤所造長的過長訓練時間；(2)所選出之最佳特徵子集合可達到較高之事件偵測及分類率。利用選過的特徵重新進行分類，得到的分類率有顯著的提升，利用訓練資料進行交叉驗證法(LOO-CV)得到顯著提升的分類率，為87-99%，然利用測試資料，則為71-96%。我們發現三類別中，背景噪訊有顯著的時間變異，不同期間收集的訓練和測試資料，會有較差的分類表現。這說明未來在背景噪訊的細緻分群有其必要。

要分開三類別的資料，哪些特徵最重要？在本研究中(Liu et al., 2019)我們發現，這些有效特徵在各站的表現均一制，說明費雪分數可以成為單一特徵篩選的重要指標。更重要的是，我們亦發現離散傅立葉轉換(時頻域)之中位數的波峰數量，能有效分離長微震和背景噪訊，這是從未被使用在偵測門檻上、未來可納入即時偵測的重要特徵。

圖三、(a-c)三種類別資料的波形示意圖 (d) 使用的地震(灰色圓圈)和長微震(黃色圓圈)及三個測站之分佈圖。在此三種不同顏色的測站對應三種地震網。

表一、本研究使用的三類別資料在不同測站的分類表現（事件數量和分類率）

本研究是與台科大機械系劉益宏老師長期合作的成果。未來仍將針對長微震的偵測進行單類別分類與多測站決策，敬請期待！

四、參考文獻

Beyreuther, M. and Wassermann, J. (2008). Continuous earthquake detection and classification using discrete Hidden Markov Models, Geophys. J. Int., 175(3), 1055-1066.

Fang, L., Zhao, H., Wang, P., Yu, M., Yan, J., Cheng, W., and Chen, P. (2015). Feature selection method based on mutual information and class separability for dimension reduction in multidimensional time series for clinical data, Biomedical Signal Processing and Control, 21, 82-89.

Liu, Y. H., Yen, T. C., *Chen, K. H., Chen, Y., Yen, Y. Y., Yen, H. Y. (2019), Investigation of single-station classification for short tectonic tremor in Taiwan, J. Geophys. Res., 124, 8803–8822. https://doi.org/10.1029/2019JB017866 .

Obara, K. (2002). Nonvolcanic deep tremor associated with subduction in southwest Japan, Science, 296(5573), 1679-81.

Yoon, C. E., O’Reilly, O, Bergen, K. J., Beroza, G. (2015). Earthquake detection through computational efficient similarity search, Science Advances, 1 (11), e1501057, doi:10.1126/sciadv.1501057.

Kate Chen's homepage

AI 偵測慢地震

最新文章

1 則留言