白玉蘭科學大模型發布,加速科學新發現

    來源: 新民晚報2023-07-09 09:11:11
      

    圖說:白玉蘭科學大模型 來源/采訪對象供圖

    人工智能在前沿科學領域已經取得了一系列顛覆性成果,新的科學研究范式正在形成。昨日(8日)記者從上海交通大學獲悉,為推進面向重大科學問題的人工智能模型和算法創新,構建以人工智能支撐基礎和前沿科學研究的新模式,上海交大研制“白玉蘭科學大模型1.0版”, 依托上海白玉蘭開源開放研究院正式開源發布。


    (資料圖)

    “白玉蘭科學大模型1.0版”包括化學合成(BAI-Chem)、神經流體(BAI-NeuroFluid)和科學評測基準(BAI-SciEval)三個領域模型,分別代表以分子結構為中心、以動力學為中心的學科方向,及跨學科、跨模態的基礎模型。

    化學合成(BAI-Chem)依托大模型訓練技術,利用生成式人工智能技術賦能化學合成研究,是首個具備反應條件生成與“人在環路”反饋優化能力的化學大模型。加速從分子設計、反應設計、到條件生成、反應檢驗等化學合成全鏈條,潛在功能性分子(如藥物分子)及其合成方案設計,從傳統方法的幾個月提速到幾十分鐘。

    以抗HIV小分子設計為例,BAI-Chem能夠在2分鐘內生成超過250,000個全新的分子;并在30分鐘內進一步篩選出172個潛在有效的分子,同時提供合成路線以及相應的反應條件;最終在5秒內進行驗證,進一步篩選出23個可合成的潛在分子,大幅提升分子設計迭代效率。

    同時,BAI-Chem平臺破除了傳統頁面交互的壁壘,提供化學聊天機器人和化學合成助手,支持用戶以自然語言的方式進行交互,以便捷的溝通方式,能夠基于用戶給定的目標分子一次性提供生成式合成方案和檢索式合成方案。

    神經流體(BAI-NeuroFluid)創建了視覺直覺學習框架,將物理啟發的生成式人工智能技術用于流體粒子模型的計算與模擬,首次實現了從外部視覺表觀推理內部流體動態,并可反演粘度、密度等流體屬性,形成了“規律—仿真—觀測”空間的閉環。

    同時支持跨流體屬性、跨空間尺度、跨邊界條件的大規模神經網絡訓練與推理,可以捕捉具有高泛化性的流體規律,在問題規模、模擬速度、模型泛化性、反問題求解精度等多個方面突破了現有流體數值模擬方法的計算瓶頸,十萬粒子場景的模擬速度比現有流體仿真軟件提升一個量級。

    上海交通大學人工智能研究院楊小康教授團隊于2022年提出“神經流體”方法(NeuroFluid),他說道:“生成式人工智能拓展形成的仿真空間可以覆蓋傳統的計算機模擬方法‘仿而不真’的現象,允許科學家根據實際觀測數據反演仿真空間中的狀態‘后驗信息’,通過與仿真得到的‘先驗信息’進行比對,對已有的科學規律進行修正,甚至通過拓展假設空間,發現新的科學現象。”

    評測基準(SciEval)模型的面向基礎科學領域構建了首個包含動態數據的評測基準,旨在全面評估大模型的科學知識掌握水平和輔助科研能力,涵蓋約18000道具有挑戰性的科學問題,涉及化學、物理和生物三大基礎科學領域及其數十種子領域,以布魯姆“記憶-理解-應用-分析-評價-創造”六大認知層級為參考,從基礎知識、知識應用、科學計算和科研能力四方面多層級全方位評估語言大模型的科學研究能力。評測方法采用了以客觀題為主、主觀題為輔的方式,旨在全面考察模型的科學思維和應用能力。同時,BAI-SciEval包含了部分基于基本科學原理動態生成的評測數據,以降低數據泄露風險,保證評估結果的公正性和可信度。

    新民晚報記者 易蓉

    關鍵詞:

    責任編輯:sdnew003

    相關新聞

    版權與免責聲明:

    1 本網注明“來源:×××”(非商業周刊網)的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,本網不承擔此類稿件侵權行為的連帶責任。

    2 在本網的新聞頁面或BBS上進行跟帖或發表言論者,文責自負。

    3 相關信息并未經過本網站證實,不對您構成任何投資建議,據此操作,風險自擔。

    4 如涉及作品內容、版權等其它問題,請在30日內同本網聯系。