(資料圖片)
據(jù)證券時(shí)報(bào)報(bào)道,日前,度小滿開(kāi)源國(guó)內(nèi)首個(gè)千億級(jí)中文金融大模型“軒轅”。
據(jù)介紹,該大模型在金融名詞理解、金融市場(chǎng)評(píng)論、金融數(shù)據(jù)分析和金融新聞理解等任務(wù)上,效果相較于通用大模型大幅提升。
度小滿有關(guān)人員表示,為提升軒轅大模型對(duì)金融領(lǐng)域問(wèn)題的理解能力,該公司將自身業(yè)務(wù)中積累的金融領(lǐng)域的千億tokens的中文預(yù)訓(xùn)練數(shù)據(jù)集用來(lái)訓(xùn)練模型。該數(shù)據(jù)集涵蓋了金融研報(bào)、股票、基金、銀行、保險(xiǎn)等各個(gè)方向的專業(yè)知識(shí)。
度小滿工作人員稱,經(jīng)過(guò)清洗和標(biāo)注的高質(zhì)量數(shù)據(jù)集,不僅在通用性方面與ChatGPT達(dá)到持平成為可能,且顯著提升了模型在金融垂直領(lǐng)域的性能。