人工智能大舉“入侵”科學搜索引擎

    來源: 中國科學報2023-08-04 16:25:52
      

    當前,互聯(lián)網(wǎng)搜索引擎中出現(xiàn)了越來越多的人工智能(AI)聊天機器人,如谷歌的Bard、微軟的Bing等。這似乎將要改變科學搜索引擎。


    (資料圖)

    據(jù)《自然》報道,8月1日,荷蘭出版業(yè)巨頭愛思唯爾向其Scopus數(shù)據(jù)庫的部分用戶發(fā)布了一個基于ChatGPT的AI界面。當天,英國數(shù)字科學公司(Digital Science)也宣布為其Dimensions數(shù)據(jù)庫的AI大語言模型(LLM)進行封閉試驗。美國科睿唯安公司還試圖將LLM納入其Web of Science數(shù)據(jù)庫。

    用于科學搜索的LLM并不是什么新鮮事物,Elicit、Scite和Consensus等初創(chuàng)公司已經(jīng)推出了此類AI系統(tǒng),即依靠免費的科學數(shù)據(jù)庫或通過與出版商合作的方式訪問付費的研究論文,從而幫助總結(jié)某個領(lǐng)域的發(fā)現(xiàn)或識別頂尖研究。

    現(xiàn)在,擁有大型科學數(shù)據(jù)庫的公司也加入其中。

    愛思唯爾作為試點推出了名為Scopus AI的聊天機器人。負責該工具開發(fā)的Maxim Khan說,作為一個輕便、有趣的工具,Scopus AI旨在幫助研究人員快速獲得不熟悉的研究主題的摘要,其使用LLM GPT-3.5版本可以獲得一段關(guān)于該研究主題的流暢總結(jié)、引用的參考文獻以及需要進一步探索的問題。

    但學者對LLM的擔憂是,它們是不可靠的。LLM只是通過輸出文本上看似合理的詞語來工作,輸出的內(nèi)容可能包含事實錯誤和偏見,甚至還會編造出不存在的參考文獻。

    因此,Scopus AI只能通過參考5至10篇研究摘要來生成答案。愛思唯爾還限制Scopus AI僅搜索2018年后發(fā)表的文章,以獲取最近的論文,并指示其在回復中適當引用摘要,以避免不安全或惡意的查詢。這雖然不能完全避免錯誤,但可以最大限度減少錯誤。

    那么,用戶是否會將機器人生成的段落復制粘貼到論文中,從而對內(nèi)容進行抄襲?Khan表示,這是有可能的。不過,愛思唯爾通過“指導意見”來解決這一問題,要求研究人員負責任地使用摘要。資助者和出版商也發(fā)布了類似的指導意見,要求公開透明地披露LLM是否用于撰寫論文或進行同行評審,或者在某些情況下聲明不應該使用LLM。

    目前,Scopus AI僅向約1.5萬名用戶推送。愛思唯爾表示,該工具預計將于2024年初全面開放。

    Dimensions數(shù)據(jù)庫引入AI助手同樣只針對選定的測試者。在用戶輸入問題后,搜索引擎首先檢索相關(guān)文章,然后開放的AI GPT模型圍繞已檢索到的排名靠前的摘要生成摘要段落。Dimensions還使用LLM提供了相關(guān)論文的更多細節(jié),包括研究結(jié)果的簡短總結(jié)。

    數(shù)字科學公司首席產(chǎn)品官Christian Herzog說,公司希望在今年底前在更廣泛的范圍內(nèi)發(fā)布該工具,目前正在與科學家、資助者和其他使用Dimensions的人合作,測試LLM在哪些方面可能有用。他說:“這關(guān)乎逐漸適應一項新技術(shù)并信任它。”(文樂樂)

    關(guān)鍵詞:

    責任編輯:sdnew003

    相關(guān)新聞

    版權(quán)與免責聲明:

    1 本網(wǎng)注明“來源:×××”(非商業(yè)周刊網(wǎng))的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,本網(wǎng)不承擔此類稿件侵權(quán)行為的連帶責任。

    2 在本網(wǎng)的新聞頁面或BBS上進行跟帖或發(fā)表言論者,文責自負。

    3 相關(guān)信息并未經(jīng)過本網(wǎng)站證實,不對您構(gòu)成任何投資建議,據(jù)此操作,風險自擔。

    4 如涉及作品內(nèi)容、版權(quán)等其它問題,請在30日內(nèi)同本網(wǎng)聯(lián)系。