人工智慧AI偵測慢地震

Press/Media: research_highlightnatural sciences

Description

【本報導由地球科學系 陳卉瑄教授研究團隊提供】

  在全世界的觀測儀器逐年增多增密的趨勢下,傳回雲端的連續資料,如何快速做偵測和分類運算,是即時地震學的一大挑戰。近十年,利用機器學習進行地震學相關的應用逐漸盛行,藉由標籤化資料,進行分類和回歸(監督式學習),抑或經由未標籤化的資料做分群和降維(非監督式學習),讓電腦學習並建立模型以大幅地減少人工介入處理的可能性,已蓬勃風展。除了地震,地震儀記錄著環境中不同來源的震動,這些背景噪訊的連續紀錄中,有多少訊號,對應著深部變形和近地表人為活動? 他們能不能被系統性地偵測與分類?  利用機器學習的分法,我們能不能成功分類訊號微弱、卻有構造意義的慢地震?

 

  跟我們生活息息相關的環境震動,短至數秒的爆炸事件、飛機墜毀和重大車禍,長至長微震和土石流事件,對社會和經濟造成一定衝擊,尤其對微小震動高度敏感的半導體產業。埋藏的環境震動,包含天然地震與人造地震,其即時偵測、分類、定位與物理機制仍未有系統的收集和分類,主要原因在於地震儀的連續紀錄中,一般皆以天然地震為主要分析目標。

  在背景噪音中,近年來發現了大量的非火山長微震(non-volcanic tremor)活動,這種慢速滑移活動介於一般地震(快地震)數十秒的快速破裂、和數年的緩慢蠕變(creeping)之間,其錯動位移有限、錯動歷時長,以至於僅有非常弱的地震波輻射,難以從地震波分辨,特徵為貌似雜訊、主頻在2至8 Hz間、無明顯P波、S波到時、能量持續時間長、數分鐘到數月不等、並能在相距數公里至數十公里不等的測站具近乎一致之到時。這樣類型的「雜訊」直至2002才被發現 (Obara, 2002),又被稱作慢地震。

  記錄著環境背景震動的連續資料中,有多少訊號,對應著深部變形和近地表人為活動? 他們能不能被系統性地偵測與分類? 

  自2017年開始,師大地科系研究團隊與台科大機械工程系的劉益宏老師合作,致力於利用機器學習演算法進行智能偵測和分類,期望能避免樣板比對時複雜度計算,並使用自動學習決策邊界(decision boundary)來進行偵測及分類(Liu et al., 2019)。能否利用單站資料,對(1) 偵測有難度(2) 和背景噪音振幅相仿(3) 往往需要多站共同判釋的「慢地震」訊號進行分類和偵測?

  我們將地震、長微震和背景噪訊三種類別波形標籤化,以進行後續資料訓練。三個測站和對應的波形如圖一所示,首先選用的分類器,是傳統而簡單的kNN(k近鄰分類法),此法計算任一比未知資料「與不同類別在特徵空間的歐式距離」,找最相近的k個鄰居投票表決,來決定這個未知資料應該分到哪一類別。在訓練階段,所有的演算法參數皆須最佳化,我們採用廣泛使用的交叉驗證法(Leave-One-Out Cross Validation, LOO-CV)來進行,此方法容易實現,並且可以自動化執行。每個測站、每個類別均為204筆事件(每個事件為60-s),經由LOO-CV得到的分類表現,發現在較遠離長微震震源區的YULB有最差的分類率為68%,而在較近的測站則介於86-94%間。

  接著,我們選出時間域、頻率域、時頻域共27個特徵,利用Fisher’s class-separability criterion (Fang et al., 2015) 針對每一種初始特徵進行自動評估。每一種特徵,得到一個費雪分數(Fisher score) - 同組內和不同組間的分散量之比值,代表此特徵對於事件分類的優劣,若分數越高,代表此特徵讓不同類別間的鑑別更容易。因此,在訓練階段將所有初始特徵依照費雪分數從高至低排序,挑出前N%的最佳的特徵當作後端的偵測及分類輸入。此方法之好處在於:(1)演算法自動快速選擇,必免人為嘗試錯誤所造成過長的訓練時間;(2)所選出最佳特徵子集合可達到較高之事件偵測及分類率。利用選過的特徵重新進行分類,得到的分類率有顯著的提升,其中利用訓練資料進行交叉驗證法(LOO-CV)得到顯著提升的分類率為87-99%;而利用測試資料的分類率則為71-96%。結果發現三類別中,背景噪訊有顯著的時間變異,不同期間收集的訓練和測試資料,會有較差的分類表現。這說明未來在背景噪訊的細緻分群有其必要。

  要分開三類別的資料,哪些特徵最重要?在本研究中(Liu et al., 2019)發現,這些有效特徵在各站的表現均一制,說明費雪分數可以成為單一特徵篩選的重要指標。我們亦發現,在過去從未被使用在偵測門檻上的離散傅立葉轉換(時頻域)之中位數的波峰數量,其能有效分離長微震和背景噪訊,成為了未來納入即時偵測的一項重要特徵。

圖一、(a-c)三種類別資料的波形示意圖 (d) 使用的地震(灰色圓圈)和長微震(黃色圓圈)及三個測站之分佈圖。在此三種不同顏色的測站對應三種地震網。
圖一、(a-c)三種類別資料的波形示意圖 (d) 使用的地震(灰色圓圈)和長微震(黃色圓圈)及三個測站之分佈圖。在此三種不同顏色的測站對應三種地震網。 

 

 

Period2020 Nov 11

Media coverage

1

Media coverage