7月28日,“諦聽”地震波大模型在四川成都發(fā)布,該大模型由國家超級計算成都中心、中國地震局地球物理研究所以及清華大學聯(lián)合開發(fā),是首個億級參數(shù)量的地震波大模型。
成都超算中心運營管理有限公司董事長郭黎介紹,2023年9月,國家超級計算成都中心與中國地震局地球物理研究所合作共建了“地震大模型創(chuàng)新應用聯(lián)合實驗室”,與清華大學、中國科學院地質與地球物理研究所合作啟動了“諦聽”地震波大模型的訓練。“諦聽”數(shù)據(jù)集是國內首個,也是目前國內外最大規(guī)模、樣本類型和標注最為全面的地震學專業(yè)AI訓練數(shù)據(jù)集之一,半年多時間里,實驗室研究人員利用“諦聽”數(shù)據(jù)集獲得了首個億級參數(shù)量的地震波大模型。
“長期來看,地震學是一門觀測科學,重大突破往往來自對觀測數(shù)據(jù)的深刻理解?!敝袊卣鹁值厍蛭锢硌芯克彼L陳石介紹,目前,傳統(tǒng)方法和中小模型均無法充分利用百TB、千TB級別的地震觀測數(shù)據(jù),而這些數(shù)據(jù)對地震學研究有重要意義,只有通過大模型才能深入挖掘。
“‘諦聽’大模型依托海量數(shù)據(jù),通過先進的人工智能技術,已經(jīng)顯著提升了地震信號的識別準確率和速度。”陳石說。
國家超算成都中心常務副主任王建波介紹,“諦聽”地震波大模型對于突破中小地震波模型性能瓶頸,提高地震大數(shù)據(jù)智能處理能力和信息挖掘水平具有重要意義,國家超算成都中心正不斷加速人工智能技術在防災減災、智慧城市等領域的應用與發(fā)展。據(jù)了解,目前“諦聽”地震波大模型已可投入使用,十億參數(shù)量級的版本預計2024年8月完成預訓練。未來,該大模型還可用于礦震監(jiān)測、城市地下空間結構探測、海底地震監(jiān)測等多個領域。