您的位置：首頁 >觀察 > 正文

2023年科大訊飛研究報(bào)告星火大模型發(fā)布，積極掌握AI源頭技術(shù)

來源：安信證券時(shí)間：2023-05-11 11:41:58

1.科大訊飛：星火大模型發(fā)布，積極掌握AI源頭技術(shù)

1.1.從訊飛超腦到星火大模型，認(rèn)知智能技術(shù)持續(xù)積累

(資料圖片)

認(rèn)知智能多年積累，AI 源頭技術(shù)持續(xù)研發(fā)?？拼笥嶏w堅(jiān)持源頭核心技術(shù)創(chuàng)新，人工智能關(guān)鍵核心技術(shù)始終保持國際前沿水平。公司承建有國家首批新一代人工智能開放創(chuàng)新平臺、全國首個(gè)認(rèn)知智能國家重點(diǎn)實(shí)驗(yàn)室（首批標(biāo)桿全國重點(diǎn)實(shí)驗(yàn)室），以及語音及語言信息處理國家工程研究中心等國家級平臺。

科大訊飛多年來積累了認(rèn)知智能大模型綜合研發(fā)實(shí)力、持續(xù)關(guān) 鍵技術(shù)突破和創(chuàng)新能力，相關(guān)積累包括：1）在認(rèn)知智能大模型最核心的 Transformer 深度神經(jīng)網(wǎng)絡(luò)算法方面擁有豐富的經(jīng)驗(yàn)，Transformer 算法已廣泛應(yīng)用于科大訊飛的語音識別、圖文識別、機(jī)器翻譯等任務(wù)，并已經(jīng)開源了 6 個(gè)大類、超過 40 個(gè)通用領(lǐng)域的系列中文預(yù)訓(xùn) 練語言模型，相關(guān)模型庫月均調(diào)用量超 1000 萬，在 Github 平臺獲得星標(biāo)數(shù)位列同類中文預(yù)訓(xùn)練語言模型第一；2）在多年認(rèn)知智能系統(tǒng)研發(fā)推廣中積累了豐富的行業(yè)數(shù)據(jù)，為認(rèn)知智能大模型的研發(fā)和專業(yè)領(lǐng)域優(yōu)化提供了扎實(shí)基礎(chǔ)；3）牽頭國家專項(xiàng)，在國產(chǎn)化訓(xùn)練推理平臺建設(shè)和優(yōu)化方面持續(xù)投入形成的扎實(shí)積累。

“訊飛超腦 2030”計(jì)劃牽引，促使機(jī)器從“能聽會說”向“能理解會思考”演進(jìn)。2014 年，公司發(fā)布訊飛超腦計(jì)劃，明確提出要讓機(jī)器像人一樣具備能理解會思考的能力。2023 年初，公司正式迭代并發(fā)布“訊飛超腦 2030 計(jì)劃”。“訊飛超腦 2030 計(jì)劃”將構(gòu)建基于認(rèn)知智能的人機(jī)協(xié)作、自我進(jìn)化的復(fù)雜智能系統(tǒng)。即讓機(jī)器的感知能力超過人類，深度理解領(lǐng)域?qū)I(yè) 知識，具備持續(xù)自主進(jìn)化的能力；讓機(jī)器全方面感知人和環(huán)境，懂各行各業(yè)知識，有通識和情感，能靈活運(yùn)動(dòng)，會多維表達(dá)，打造可持續(xù)自主進(jìn)化的復(fù)雜智能系統(tǒng)，助力家庭陪伴機(jī)器人走進(jìn)千家萬戶，造福億萬百姓生活。

訊飛超腦 2030 計(jì)劃分為三個(gè)階段，每個(gè)階段都圍繞“懂知識、善學(xué)習(xí)和能進(jìn)化”，將軟硬一體機(jī)器人和數(shù)字虛擬人向前推進(jìn)。其中，第一階段，在 2022-2023 年，科大訊飛將打造可養(yǎng) 成的寵物機(jī)器人和專業(yè)虛擬人家族；第二階段，時(shí)間為 2023-2025 年，將打造自適應(yīng)行走的外骨骼機(jī)器人和陪伴虛擬人家族；第三階段，時(shí)間為 2025-2030 年，將打造軟硬一體懂知識會學(xué)習(xí)的陪伴機(jī)器人和自主學(xué)習(xí)虛擬人，幫助人類更好地應(yīng)對未來。

從“訊飛超腦 2030”到星火大模型，認(rèn)知智能技術(shù)迭代突破。以“訊飛超腦 2030 計(jì)劃”為牽引，公司關(guān)鍵技術(shù)持續(xù)突破，同時(shí)，公司布局認(rèn)知智能大模型關(guān)鍵技術(shù)，不斷推動(dòng)認(rèn)知智能技術(shù)邁向新臺階。2017 年，訊飛智醫(yī)助理首次通過國家執(zhí)業(yè)醫(yī)師考試臨床綜合筆試，并以 456 分的成績超過了 96.3%的人類考生，讓機(jī)器首次具有擔(dān)任全科醫(yī)生的能力；在 2019 年全球機(jī)器閱讀理解頂級水平測試 SQuAD 2.0 中，科大訊飛系統(tǒng)效果首次超過人類平均水平；2022 年 4 月的 CommonsenseQA 2.0 常識推理挑戰(zhàn)賽中，科大訊飛以 76.06%的成績獲得第一；

2022 年 7 月，面對特定領(lǐng)域的知識推理，科大訊飛在 OpenBookQA 科學(xué)知識推理挑戰(zhàn)賽中刷新最好成績，成為全球首個(gè)超越人類平均水平（91.7%）的單模型；2022 年 12 月，在多模態(tài)閱讀理解評測 VCR（Visual Commensense Reasoning）中再次獲得第一，標(biāo)志機(jī)器的閱讀理解能力實(shí)現(xiàn)了從單模態(tài)到多模態(tài)的跨越。

2022 年 12 月，科大訊飛啟動(dòng)了“1+N 認(rèn)知智能大模型技術(shù)及應(yīng)用”專項(xiàng)攻關(guān)，其中“1”指的是通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練方案底座平臺，“N”指的是將認(rèn)知智能大模型技術(shù)應(yīng)用在教育、醫(yī)療、人機(jī)交互、辦公、翻譯等多個(gè)行業(yè)領(lǐng)域。2023 年 5 月 6 日，公司成功舉辦“訊飛星火認(rèn)知大模型”成果發(fā)布會。訊飛星火大模型是公司面向通用人工智能的技術(shù)探索，也是對標(biāo)海外頭部產(chǎn)品如 ChatGPT 的技術(shù)演進(jìn)。與其他的大模型廠商產(chǎn)品發(fā)布不同，訊飛的星火大模型系列成果不僅包含了通用人工智能大模型，還包含了多種搭載了大模型的產(chǎn)品和落地場景，一方面展現(xiàn)了具體的應(yīng)用方向，另一方面也將為大模型的持續(xù)迭代提供豐富的數(shù)據(jù)入口和數(shù)據(jù)資源。

星火大模型有望持續(xù)升級，年內(nèi)仍有三大關(guān)鍵里程碑值得期待。星火大模型仍將持續(xù)迭代升級。6 月 9 日首先將突破開放式問答（即實(shí)時(shí)問答），不是簡單搜索，而是通過類搜索插件抓取知識，以更人性化的方式呈現(xiàn)結(jié)果；再次升級多輪對話能力；數(shù)學(xué)能力還會再上一個(gè)新的臺階。8 月 15 日，將會突破代碼能力，讓開發(fā)者、合作伙伴非常方便地調(diào)用使用；多模態(tài)的交互能力也將正式開放。到今年 10 月 24 日的“1024 開發(fā)者節(jié)”，希望星火大模型能夠在通用的認(rèn)知大模型能力上，通過科學(xué)的評測體系實(shí)現(xiàn)對標(biāo) ChatGPT，在中文上實(shí)現(xiàn)能力超越，在英文上實(shí)現(xiàn)能力的對齊。

1.2.星火大模型聚焦七大核心能力，向通用人工智能邁進(jìn)

發(fā)布通用認(rèn)知智能大模型測評體系，聚焦七大核心能力?？拼笥嶏w和中國科學(xué)技術(shù)大學(xué)共同承建的認(rèn)知智能全國重點(diǎn)實(shí)驗(yàn)室牽頭設(shè)計(jì)了面向通用人工智能大模型的測評體系，從 7 個(gè)主要方向、481 個(gè)細(xì)分任務(wù)類型對模型效果進(jìn)行細(xì)化評價(jià)，包括文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、編程能力和多模態(tài)能力等，從而促使大模型的能力呈現(xiàn)更加客觀。具體到星火大模型而言，發(fā)布會從七個(gè)方向?qū)δＰ湍芰M(jìn)行了全方位的展示，具備包括：多風(fēng)格、多任務(wù)長文本生成；多層次、跨語種語言理解；泛領(lǐng)域、開放式知識問答；情境式、思維鏈邏輯推理；多題型、可解析數(shù)學(xué)能力；多功能、多語言代碼能力；多模態(tài)輸入和表達(dá) 能力。

一是多風(fēng)格、多任務(wù)長文本生成。星火大模型可以實(shí)現(xiàn)多種文本生成功能，比如生成歡迎詞，創(chuàng)作一個(gè)特定要求的故事，還可以根據(jù)要求寫作工作郵件等公文。此外，星火大模型可以實(shí) 現(xiàn)用多種語言生成文本，例如用英文生成一個(gè)品宣文案，并支持對文案進(jìn)行翻譯。不僅如此，星火大模型還可以對文字用不同的風(fēng)格進(jìn)行再次創(chuàng)作，例如用小紅書的風(fēng)格重寫文案等。我們認(rèn)為，多風(fēng)格、多任務(wù)的長文本生成式大預(yù)言模型的基礎(chǔ)應(yīng)用之一，星火大模型已經(jīng)具備了相應(yīng)的能力，為其他的應(yīng)用奠定了基礎(chǔ)。

二是多層次、跨語種語言理解。星火大模型可以實(shí)現(xiàn)不同層次的語義理解。如最細(xì)粒度的單詞和語法方面的檢查，以及對于句子含義的理解，乃至最高層次的關(guān)于句子情感的分析。語義理解是認(rèn)知智能大模型的主要應(yīng)用領(lǐng)域和研究方向之一，能夠準(zhǔn)確進(jìn)行分詞和情感識別，也是未來復(fù)雜場景下任務(wù)處理的基礎(chǔ)。三是泛領(lǐng)域、開放式知識問答。星火大模型針對生活常識、科學(xué)知識、工作技巧以及醫(yī)學(xué)知識等大眾關(guān)注的領(lǐng)域，可以進(jìn)行相應(yīng)的回答，且仍在不斷地豐富學(xué)習(xí)和完善中。例如，可以詢問專有名詞的解釋，一些醫(yī)學(xué)領(lǐng)域的常識等，這類應(yīng)用有望部分取代搜索引擎的功能，實(shí) 現(xiàn)知識的快速查詢。

四是情境式、思維鏈邏輯推理。星火大模型可以實(shí)現(xiàn)常識推理、科學(xué)推理以及時(shí)空推理等多方面的邏輯推理。我們認(rèn)為邏輯推理能力是未來通用人工智能產(chǎn)生質(zhì)變的重要能力，當(dāng)前各家大模型廠商均在嘗試，客觀而言邏輯推理能力相比人而言仍有較大差距，但是這是值得研究和突破的重要方向。星火大模型具備了初步了邏輯推理能力，未來有望持續(xù)迭代升級。五是多題型、可解析數(shù)學(xué)能力。數(shù)學(xué)能力包括計(jì)算、代數(shù)、幾何、解方程、情景應(yīng)用等。數(shù) 學(xué)能力一定意義上代表了通用人工智能認(rèn)知大模型的智慧水平。公司目前的星火大模型，已經(jīng)初步具備一定的數(shù)學(xué)解題能力。

六是多功能、多語言代碼能力。這一能力星火大模型仍在迭代過程中，公司將在 8 月 15 日的新版本中進(jìn)一步突破代碼能力，從而實(shí)現(xiàn)為開發(fā)者賦能。七是多模態(tài)輸入和表達(dá)能力。星火大模型一方面搭載了訊飛多年積累的語音識別和合成技術(shù)，能夠?qū)崿F(xiàn)語音的輸入和輸出。另一方面，發(fā)布會展示了星火大模型對圖像的識別，以及生成虛擬數(shù)字人視頻的場景。我們認(rèn)為這些能力仍將進(jìn)一步持續(xù)迭代，從而拓展星火大模型的應(yīng) 用范圍和場景。

大模型持續(xù)迭代，仍有問題亟待攻克。雖然包括星火在內(nèi)的大模型已經(jīng)具備了在多種下游任務(wù)中的通用化能力，但是目前仍有部分問題亟待解決。例如對于新知識難以及時(shí)更新的問題，對于時(shí)事類問答容易“張冠李戴”的問題，對于史實(shí)、傳統(tǒng)典籍等容易“編造情節(jié)”的問題，以及對于數(shù)學(xué)和邏輯推理方面仍需進(jìn)一步提升。我們認(rèn)為這是模型演進(jìn)的未來方向，訊飛有望在原有模型的基礎(chǔ)上，通過多輪迭代，繼續(xù)提升產(chǎn)品性能，真正向通用人工智能邁進(jìn)。

2.從技術(shù)探索到場景落地，星火首發(fā)四類應(yīng)用場景

圍繞 1+N 大模型體系，首發(fā)四大類應(yīng)用產(chǎn)品?？拼笥嶏w除了做到核心技術(shù)“頂天”之外，也在多個(gè)垂直應(yīng)用領(lǐng)域建立了“根據(jù)地”優(yōu)勢。結(jié)合公司在垂直行業(yè)多年的深耕優(yōu)勢和產(chǎn)品，公司此次發(fā)布會了搭載星火大模型的四大類應(yīng)用產(chǎn)品。分別為：1）AI+教育：發(fā)布搭載星火大模型的 AI 學(xué)習(xí)機(jī)新品，實(shí)現(xiàn)中英文作為的自動(dòng)化批改；2）AI+辦公：發(fā)布搭載星火大模型的智能辦公本，實(shí)現(xiàn)會議語音轉(zhuǎn)寫和紀(jì)要的語篇規(guī)整和一鍵成稿；3）AI+汽車：發(fā)布搭載星火大模型的汽車座艙人機(jī)交互系統(tǒng)，提供多輪、多人、多區(qū)域、多模態(tài)的智能汽車人機(jī)交互范式；4）AI+數(shù)字員工：發(fā)布搭載星火大模型的 AI 虛擬數(shù)字助手，實(shí)現(xiàn)導(dǎo)購、線上營銷等多種功能，以及實(shí)現(xiàn)工作流程的自動(dòng)化（RPA）。未來，訊飛還將探索星火大模型在醫(yī)療、智慧城市、司法、工業(yè)等場景下的落地產(chǎn)品。

我們認(rèn)為，大模型能力和垂直場景的結(jié)合才能凸顯相應(yīng)的競爭優(yōu)勢，訊飛在教育、醫(yī)療、消費(fèi)者業(yè)務(wù)等領(lǐng)域深耕多年，掌握了大量垂直行業(yè)的專業(yè)數(shù)據(jù)，有助于實(shí)現(xiàn)模型的產(chǎn)品級應(yīng)用，從而真正跑通大模型的商業(yè)模式。

2.1.AI+教育：學(xué)習(xí)機(jī)實(shí)現(xiàn)自動(dòng)化閱卷和英語口語自然對話

全新升級訊飛學(xué)習(xí)機(jī) T20，搭載星火大模型實(shí)現(xiàn)類人教學(xué)。此次搭載星火大模型的第一個(gè)應(yīng) 用場景就是 AI+教育場景，也是訊飛深耕多年的優(yōu)勢賽道。訊飛 AI 學(xué)習(xí)機(jī)自上市以來，得到用戶和行業(yè)的高度認(rèn)可。在競爭激烈的學(xué)習(xí)機(jī)行業(yè)中，訊飛 AI 學(xué)習(xí)機(jī)市場份額和品牌知名度持續(xù)提升，用戶凈推薦值 NPS 持續(xù)保持行業(yè)第一。2022 年科大訊飛 AI 學(xué) 習(xí)機(jī)銷售額增長超 50%，繼續(xù)強(qiáng)勢增長并跑贏行業(yè)大盤。618 大促期間獲得線上全渠道全周期（天貓＆京東＆抖音）累計(jì) GMV 排名第一，雙 11 期間線上銷量實(shí)現(xiàn) 100%增長；線下門店數(shù)量增長 100%，線下銷量連續(xù)兩年增長超 100%。

此次星火大模型搭載后，學(xué)習(xí)機(jī)主要實(shí)現(xiàn)兩種功能的提升：1）實(shí)現(xiàn)自動(dòng)化中英文作文批閱：作為一直占用老師非常多的批閱時(shí)間，且主觀性較強(qiáng)無法實(shí)現(xiàn)千人千面的個(gè)性化教學(xué)，搭載星火大模型的 AI 學(xué)習(xí)機(jī)，可以針對中英文作文的語法、句子、修辭方式等做出全方位的批改，從而實(shí)現(xiàn)類人的閱卷模式。2）實(shí)現(xiàn)英語口語自然對話：口語對話一直是學(xué)生學(xué)習(xí)英語的難點(diǎn)，搭載星火大模型后，學(xué)習(xí)機(jī)可以實(shí)現(xiàn)多輪自然的英語口語對話，助力學(xué)生實(shí)現(xiàn)口語能力的提升。

2.2.AI+辦公：實(shí)現(xiàn)會議紀(jì)要語篇規(guī)整和一鍵成稿

星火大模型融入 AI 辦公全產(chǎn)品線，實(shí)現(xiàn)會議紀(jì)要語篇規(guī)整和一鍵成稿。訊飛擁有 AI+辦公全系列產(chǎn)品，包括訊飛智能辦公本、訊飛智能錄音筆、訊飛聽見會議系統(tǒng)、訊飛耳機(jī)等各類產(chǎn) 品。其中，根據(jù)年報(bào)披露，訊飛智能辦公本產(chǎn)品體系逐步完善，連續(xù)兩年榮獲 618、雙十一京東/天貓雙平臺電紙書類目品牌及單品銷售額冠軍，同時(shí)在線下市場領(lǐng)跑墨水屏辦公本品類，市場占有率第一。訊飛智能錄音筆持續(xù)領(lǐng)跑智能錄音筆行業(yè)。618、雙十一期間，已連續(xù)四年獲得京東＆天貓雙平臺錄音筆品類銷售額第一；已入駐 3630 家線下門店或零售網(wǎng)點(diǎn)；用戶遍布全球日、韓、東南亞、北美、歐洲、澳洲等 180 個(gè)國家和地區(qū)，連續(xù)三年榮獲德國 iF 設(shè)計(jì)大獎(jiǎng)。

此次搭載星火大模型的辦公系列產(chǎn)品，主要實(shí)現(xiàn)了三大功能：1）會議紀(jì)要語篇規(guī)整：應(yīng)用星火大模型，可以將一篇轉(zhuǎn)寫的口語稿件變成書面稿，實(shí)現(xiàn)閱讀效率提升。根據(jù)發(fā)布會描述，語篇規(guī)整后的原文忠實(shí)度保持在 96%以上，關(guān)鍵信息幾乎完全保留，同時(shí)將文章的篇幅縮短20%到40%；縮短之后由于看起來更規(guī)整、更通順，閱讀效率可以提升 50%以上。2）要點(diǎn)挖掘：通過星火大模型，實(shí)現(xiàn)會議紀(jì)要的摘要生成。例如對于一篇 7252 字的會議紀(jì) 要，可以生成 240 字的摘要，從而一目了然看懂會議重點(diǎn)。3）一鍵成稿能力：可以將一篇會議的轉(zhuǎn)寫紀(jì)要，通過一鍵生成的形式，形成不同風(fēng)格和內(nèi) 容的文稿，例如將其轉(zhuǎn)化為新聞稿、宣傳稿等，從而實(shí)現(xiàn)相應(yīng)內(nèi)容的一鍵成稿。

2.3.AI+汽車：實(shí)現(xiàn)更加智能的汽車人機(jī)交互

星火大模型賦能車載場景，實(shí)現(xiàn)更加智能的人機(jī)交互。訊飛車載智能座艙語音交互系統(tǒng)，能夠提供多輪、多人、多區(qū)域、多模態(tài)的智能汽車人機(jī)交互形式，服務(wù)車型超過 1330 個(gè)，服務(wù)用戶累計(jì) 4200 萬，在汽車中文語音市場占有率持續(xù)領(lǐng)先。2022 年，公司智能汽車業(yè)務(wù)新增前裝出貨量超過 710 萬套，累計(jì)出貨量超過 4610 萬套，年度交互次數(shù)突破 30.4 億次，平均月活用戶 1488 萬。此次搭載星火大模型之后，可以讓汽車的人機(jī)交互再上新臺階，實(shí)現(xiàn)更加自由、擬人化的人機(jī)溝通，真正實(shí)現(xiàn)系統(tǒng)對汽車的理解。

2.4.AI+數(shù)字員工：打造虛擬數(shù)字人和 RPA 平臺

星火大模型打造數(shù)字員工，實(shí)現(xiàn)虛擬人定制和 RPA 自動(dòng)生成。在數(shù)字員工方面，星火大模型的賦能主要體現(xiàn)在兩個(gè)方面：1）自由定制虛擬數(shù)字人：2021 年底科大訊飛推出 AI 虛擬人交互平臺之后，目前這個(gè)平臺已經(jīng)有超 1000 個(gè)虛擬形象資產(chǎn)，有 300 多個(gè)專業(yè)且不同的聲音，有 30 多萬用戶自定義的音庫，目前已經(jīng)在多個(gè)產(chǎn)業(yè)場景落地。搭載星火大模型的虛擬數(shù)字人，能夠更加智能、人性化地實(shí)現(xiàn)與人之間的互動(dòng)，例如進(jìn)行商場的虛擬導(dǎo)購，實(shí)現(xiàn) 24 小時(shí)不打烊等。

2）打造生成式 RPA 平臺：過去的 RPA 平臺利用人工拖拽構(gòu)建自動(dòng)化流程，非常依賴專業(yè)人員如業(yè)務(wù)流程專家和實(shí)施工程師，同時(shí)構(gòu)建流程耗時(shí)周期長、成本高?，F(xiàn)在有了星火大模型的加持，RPA 就變成了深層次的自動(dòng)化流程平臺。只需要把需求流程場景描述出來，就能自動(dòng)生成所有流程。RPA 加星火大模型讓企業(yè)與流程相關(guān)的工作，實(shí)現(xiàn)人人可操作，降低了對專業(yè)人士的依賴，同時(shí)構(gòu)建流程的周期變短、成本下降。

2.5.開放合作，共建人工智能“星火”生態(tài)

依托訊飛開放平臺，構(gòu)建星火大模型開放生態(tài)。公司除了實(shí)現(xiàn)核心技術(shù)的源頭創(chuàng)新、垂直場景的應(yīng)用落地和產(chǎn)品發(fā)布之外，也一直致力于生態(tài)環(huán)境的構(gòu)建。根據(jù)年報(bào)披露，訊飛人工智能開放平臺作為首批國家新一代人工智能開放創(chuàng)新平臺，致力于向開發(fā)者提供業(yè)界領(lǐng)先的人工智能核心技術(shù)，圍繞開發(fā)者群體持續(xù)構(gòu)建生態(tài)。同時(shí)，通過整合產(chǎn)業(yè)鏈多維度資源賦能開發(fā)者創(chuàng)業(yè)團(tuán)隊(duì)，協(xié)力共建千行百業(yè)的人工智能商業(yè)化標(biāo)桿案例。根據(jù)公司公告，截至 2022 年末，訊飛開放平臺已開放 559 項(xiàng) AI 能力及場景解決方案，聚集 398.1 萬開發(fā)者團(tuán)隊(duì)，總應(yīng)用數(shù)達(dá) 164.6 萬，鏈接超過 500 萬生態(tài)合作伙伴。此次星火大模型發(fā)布會，公司將在未來推動(dòng)星火大模型的認(rèn)知能力開放、插件開放和行業(yè)共創(chuàng)，真正實(shí)現(xiàn)星火大模型對千行白業(yè)的賦能，也通過各領(lǐng)域的應(yīng)用來反哺大模型的迭代，從而實(shí)現(xiàn)良性的產(chǎn)業(yè)循環(huán)。

（本文僅供參考，不代表我們的任何投資建議。如需使用相關(guān)信息，請參閱報(bào)告原文。）

關(guān)鍵詞