1.1.從訊飛超腦到星火大模型,認(rèn)知智能技術(shù)持續(xù)積累
(資料圖片)
認(rèn)知智能多年積累,AI 源頭技術(shù)持續(xù)研發(fā)??拼笥嶏w堅(jiān)持源頭核心技術(shù)創(chuàng)新,人工智能關(guān)鍵 核心技術(shù)始終保持國際前沿水平。公司承建有國家首批新一代人工智能開放創(chuàng)新平臺、全國 首個(gè)認(rèn)知智能國家重點(diǎn)實(shí)驗(yàn)室(首批標(biāo)桿全國重點(diǎn)實(shí)驗(yàn)室),以及語音及語言信息處理國家 工程研究中心等國家級平臺。
科大訊飛多年來積累了認(rèn)知智能大模型綜合研發(fā)實(shí)力、持續(xù)關(guān) 鍵技術(shù)突破和創(chuàng)新能力,相關(guān)積累包括:1)在認(rèn)知智能大模型最核心的 Transformer 深度 神經(jīng)網(wǎng)絡(luò)算法方面擁有豐富的經(jīng)驗(yàn),Transformer 算法已廣泛應(yīng)用于科大訊飛的語音識別、 圖文識別、機(jī)器翻譯等任務(wù),并已經(jīng)開源了 6 個(gè)大類、超過 40 個(gè)通用領(lǐng)域的系列中文預(yù)訓(xùn) 練語言模型,相關(guān)模型庫月均調(diào)用量超 1000 萬,在 Github 平臺獲得星標(biāo)數(shù)位列同類中文 預(yù)訓(xùn)練語言模型第一;2)在多年認(rèn)知智能系統(tǒng)研發(fā)推廣中積累了豐富的行業(yè)數(shù)據(jù),為認(rèn)知 智能大模型的研發(fā)和專業(yè)領(lǐng)域優(yōu)化提供了扎實(shí)基礎(chǔ);3)牽頭國家專項(xiàng),在國產(chǎn)化訓(xùn)練推理 平臺建設(shè)和優(yōu)化方面持續(xù)投入形成的扎實(shí)積累。
“訊飛超腦 2030”計(jì)劃牽引,促使機(jī)器從“能聽會說”向“能理解會思考”演進(jìn)。2014 年, 公司發(fā)布訊飛超腦計(jì)劃,明確提出要讓機(jī)器像人一樣具備能理解會思考的能力。2023 年初, 公司正式迭代并發(fā)布“訊飛超腦 2030 計(jì)劃”。“訊飛超腦 2030 計(jì)劃”將構(gòu)建基于認(rèn)知智能 的人機(jī)協(xié)作、自我進(jìn)化的復(fù)雜智能系統(tǒng)。即讓機(jī)器的感知能力超過人類,深度理解領(lǐng)域?qū)I(yè) 知識,具備持續(xù)自主進(jìn)化的能力;讓機(jī)器全方面感知人和環(huán)境,懂各行各業(yè)知識,有通識和 情感,能靈活運(yùn)動(dòng),會多維表達(dá),打造可持續(xù)自主進(jìn)化的復(fù)雜智能系統(tǒng),助力家庭陪伴機(jī)器 人走進(jìn)千家萬戶,造福億萬百姓生活。
訊飛超腦 2030 計(jì)劃分為三個(gè)階段,每個(gè)階段都圍繞“懂知識、善學(xué)習(xí)和能進(jìn)化”,將軟硬一 體機(jī)器人和數(shù)字虛擬人向前推進(jìn)。其中,第一階段,在 2022-2023 年,科大訊飛將打造可養(yǎng) 成的寵物機(jī)器人和專業(yè)虛擬人家族;第二階段,時(shí)間為 2023-2025 年,將打造自適應(yīng)行走的 外骨骼機(jī)器人和陪伴虛擬人家族;第三階段,時(shí)間為 2025-2030 年,將打造軟硬一體懂知識 會學(xué)習(xí)的陪伴機(jī)器人和自主學(xué)習(xí)虛擬人,幫助人類更好地應(yīng)對未來。
從“訊飛超腦 2030”到星火大模型,認(rèn)知智能技術(shù)迭代突破。以“訊飛超腦 2030 計(jì)劃”為 牽引,公司關(guān)鍵技術(shù)持續(xù)突破,同時(shí),公司布局認(rèn)知智能大模型關(guān)鍵技術(shù),不斷推動(dòng)認(rèn)知智 能技術(shù)邁向新臺階。2017 年,訊飛智醫(yī)助理首次通過國家執(zhí)業(yè)醫(yī)師考試臨床綜合筆試,并以 456 分的成績超過了 96.3%的人類考生,讓機(jī)器首次具有擔(dān)任全科醫(yī)生的能力;在 2019 年全 球機(jī)器閱讀理解頂級水平測試 SQuAD 2.0 中,科大訊飛系統(tǒng)效果首次超過人類平均水平;2022 年 4 月的 CommonsenseQA 2.0 常識推理挑戰(zhàn)賽中,科大訊飛以 76.06%的成績獲得第一;
2022 年 7 月,面對特定領(lǐng)域的知識推理,科大訊飛在 OpenBookQA 科學(xué)知識推理挑戰(zhàn)賽中刷新最 好成績,成為全球首個(gè)超越人類平均水平(91.7%)的單模型;2022 年 12 月,在多模態(tài)閱讀 理解評測 VCR(Visual Commensense Reasoning)中再次獲得第一,標(biāo)志機(jī)器的閱讀理解能 力實(shí)現(xiàn)了從單模態(tài)到多模態(tài)的跨越。
2022 年 12 月,科大訊飛啟動(dòng)了“1+N 認(rèn)知智能大模型技術(shù)及應(yīng)用”專項(xiàng)攻關(guān),其中“1”指 的是通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練方案底座平臺,“N”指的是將認(rèn)知智能大模型 技術(shù)應(yīng)用在教育、醫(yī)療、人機(jī)交互、辦公、翻譯等多個(gè)行業(yè)領(lǐng)域。2023 年 5 月 6 日,公司成 功舉辦“訊飛星火認(rèn)知大模型”成果發(fā)布會。訊飛星火大模型是公司面向通用人工智能的技 術(shù)探索,也是對標(biāo)海外頭部產(chǎn)品如 ChatGPT 的技術(shù)演進(jìn)。與其他的大模型廠商產(chǎn)品發(fā)布不同, 訊飛的星火大模型系列成果不僅包含了通用人工智能大模型,還包含了多種搭載了大模型的 產(chǎn)品和落地場景,一方面展現(xiàn)了具體的應(yīng)用方向,另一方面也將為大模型的持續(xù)迭代提供豐 富的數(shù)據(jù)入口和數(shù)據(jù)資源。
星火大模型有望持續(xù)升級,年內(nèi)仍有三大關(guān)鍵里程碑值得期待。星火大 模型仍將持續(xù)迭代升級。6 月 9 日首先將突破開放式問答(即實(shí)時(shí)問答),不是簡單搜索,而 是通過類搜索插件抓取知識,以更人性化的方式呈現(xiàn)結(jié)果;再次升級多輪對話能力;數(shù)學(xué)能 力還會再上一個(gè)新的臺階。8 月 15 日,將會突破代碼能力,讓開發(fā)者、合作伙伴非常方便地 調(diào)用使用;多模態(tài)的交互能力也將正式開放。到今年 10 月 24 日的“1024 開發(fā)者節(jié)”,希望 星火大模型能夠在通用的認(rèn)知大模型能力上,通過科學(xué)的評測體系實(shí)現(xiàn)對標(biāo) ChatGPT,在中 文上實(shí)現(xiàn)能力超越,在英文上實(shí)現(xiàn)能力的對齊。
1.2.星火大模型聚焦七大核心能力,向通用人工智能邁進(jìn)
發(fā)布通用認(rèn)知智能大模型測評體系,聚焦七大核心能力??拼笥嶏w和中國科學(xué)技術(shù)大學(xué)共同 承建的認(rèn)知智能全國重點(diǎn)實(shí)驗(yàn)室牽頭設(shè)計(jì)了面向通用人工智能大模型的測評體系,從 7 個(gè)主 要方向、481 個(gè)細(xì)分任務(wù)類型對模型效果進(jìn)行細(xì)化評價(jià),包括文本生成、語言理解、知識問 答、邏輯推理、數(shù)學(xué)能力、編程能力和多模態(tài)能力等,從而促使大模型的能力呈現(xiàn)更加客觀。具體到星火大模型而言,發(fā)布會從七個(gè)方向?qū)δP湍芰M(jìn)行了全方位的展示,具備包括:多 風(fēng)格、多任務(wù)長文本生成;多層次、跨語種語言理解;泛領(lǐng)域、開放式知識問答;情境式、 思維鏈邏輯推理;多題型、可解析數(shù)學(xué)能力;多功能、多語言代碼能力;多模態(tài)輸入和表達(dá) 能力。
一是多風(fēng)格、多任務(wù)長文本生成。星火大模型可以實(shí)現(xiàn)多種文本生成功能,比如生成歡迎詞, 創(chuàng)作一個(gè)特定要求的故事,還可以根據(jù)要求寫作工作郵件等公文。此外,星火大模型可以實(shí) 現(xiàn)用多種語言生成文本,例如用英文生成一個(gè)品宣文案,并支持對文案進(jìn)行翻譯。不僅如此, 星火大模型還可以對文字用不同的風(fēng)格進(jìn)行再次創(chuàng)作,例如用小紅書的風(fēng)格重寫文案等。我 們認(rèn)為,多風(fēng)格、多任務(wù)的長文本生成式大預(yù)言模型的基礎(chǔ)應(yīng)用之一,星火大模型已經(jīng)具備 了相應(yīng)的能力,為其他的應(yīng)用奠定了基礎(chǔ)。
二是多層次、跨語種語言理解。星火大模型可以實(shí)現(xiàn)不同層次的語義理解。如最細(xì)粒度的單 詞和語法方面的檢查,以及對于句子含義的理解,乃至最高層次的關(guān)于句子情感的分析。語 義理解是認(rèn)知智能大模型的主要應(yīng)用領(lǐng)域和研究方向之一,能夠準(zhǔn)確進(jìn)行分詞和情感識別, 也是未來復(fù)雜場景下任務(wù)處理的基礎(chǔ)。三是泛領(lǐng)域、開放式知識問答。星火大模型針對生活常識、科學(xué)知識、工作技巧以及醫(yī)學(xué)知 識等大眾關(guān)注的領(lǐng)域,可以進(jìn)行相應(yīng)的回答,且仍在不斷地豐富學(xué)習(xí)和完善中。例如,可以 詢問專有名詞的解釋,一些醫(yī)學(xué)領(lǐng)域的常識等,這類應(yīng)用有望部分取代搜索引擎的功能,實(shí) 現(xiàn)知識的快速查詢。
四是情境式、思維鏈邏輯推理。星火大模型可以實(shí)現(xiàn)常識推理、科學(xué)推理以及時(shí)空推理等多 方面的邏輯推理。我們認(rèn)為邏輯推理能力是未來通用人工智能產(chǎn)生質(zhì)變的重要能力,當(dāng)前各 家大模型廠商均在嘗試,客觀而言邏輯推理能力相比人而言仍有較大差距,但是這是值得研 究和突破的重要方向。星火大模型具備了初步了邏輯推理能力,未來有望持續(xù)迭代升級。五是多題型、可解析數(shù)學(xué)能力。數(shù)學(xué)能力包括計(jì)算、代數(shù)、幾何、解方程、情景應(yīng)用等。數(shù) 學(xué)能力一定意義上代表了通用人工智能認(rèn)知大模型的智慧水平。公司目前的星火大模型,已 經(jīng)初步具備一定的數(shù)學(xué)解題能力。
六是多功能、多語言代碼能力。這一能力星火大模型仍在迭代過程中,公司將在 8 月 15 日的新版本中進(jìn)一步突破代碼能力,從而實(shí)現(xiàn)為開發(fā)者賦能。七是多模態(tài)輸入和表達(dá)能力。星火大模型一方面搭載了訊飛多年積累的語音識別和合成技術(shù), 能夠?qū)崿F(xiàn)語音的輸入和輸出。另一方面,發(fā)布會展示了星火大模型對圖像的識別,以及生成 虛擬數(shù)字人視頻的場景。我們認(rèn)為這些能力仍將進(jìn)一步持續(xù)迭代,從而拓展星火大模型的應(yīng) 用范圍和場景。
大模型持續(xù)迭代,仍有問題亟待攻克。雖然包括星火在內(nèi)的大模型已經(jīng)具備了在多種下游任 務(wù)中的通用化能力,但是目前仍有部分問題亟待解決。例如對于新知識難以及時(shí)更新的問題, 對于時(shí)事類問答容易“張冠李戴”的問題,對于史實(shí)、傳統(tǒng)典籍等容易“編造情節(jié)”的問題, 以及對于數(shù)學(xué)和邏輯推理方面仍需進(jìn)一步提升。我們認(rèn)為這是模型演進(jìn)的未來方向,訊飛有 望在原有模型的基礎(chǔ)上,通過多輪迭代,繼續(xù)提升產(chǎn)品性能,真正向通用人工智能邁進(jìn)。
圍繞 1+N 大模型體系,首發(fā)四大類應(yīng)用產(chǎn)品??拼笥嶏w除了做到核心技術(shù)“頂天”之外,也 在多個(gè)垂直應(yīng)用領(lǐng)域建立了“根據(jù)地”優(yōu)勢。結(jié)合公司在垂直行業(yè)多年的深耕優(yōu)勢和產(chǎn)品, 公司此次發(fā)布會了搭載星火大模型的四大類應(yīng)用產(chǎn)品。分別為:1)AI+教育:發(fā)布搭載星火 大模型的 AI 學(xué)習(xí)機(jī)新品,實(shí)現(xiàn)中英文作為的自動(dòng)化批改;2)AI+辦公:發(fā)布搭載星火大模 型的智能辦公本,實(shí)現(xiàn)會議語音轉(zhuǎn)寫和紀(jì)要的語篇規(guī)整和一鍵成稿;3)AI+汽車:發(fā)布搭載 星火大模型的汽車座艙人機(jī)交互系統(tǒng),提供多輪、多人、多區(qū)域、多模態(tài)的智能汽車人機(jī)交 互范式;4)AI+數(shù)字員工:發(fā)布搭載星火大模型的 AI 虛擬數(shù)字助手,實(shí)現(xiàn)導(dǎo)購、線上營銷 等多種功能,以及實(shí)現(xiàn)工作流程的自動(dòng)化(RPA)。未來,訊飛還將探索星火大模型在醫(yī)療、 智慧城市、司法、工業(yè)等場景下的落地產(chǎn)品。
我們認(rèn)為,大模型能力和垂直場景的結(jié)合才能凸顯相應(yīng)的競爭優(yōu)勢,訊飛在教育、醫(yī)療、消 費(fèi)者業(yè)務(wù)等領(lǐng)域深耕多年,掌握了大量垂直行業(yè)的專業(yè)數(shù)據(jù),有助于實(shí)現(xiàn)模型的產(chǎn)品級應(yīng)用, 從而真正跑通大模型的商業(yè)模式。
2.1.AI+教育:學(xué)習(xí)機(jī)實(shí)現(xiàn)自動(dòng)化閱卷和英語口語自然對話
全新升級訊飛學(xué)習(xí)機(jī) T20,搭載星火大模型實(shí)現(xiàn)類人教學(xué)。此次搭載星火大模型的第一個(gè)應(yīng) 用場景就是 AI+教育場景,也是訊飛深耕多年的優(yōu)勢賽道。訊飛 AI 學(xué)習(xí)機(jī)自上市以來,得到 用戶和行業(yè)的高度認(rèn)可。在競爭激烈的學(xué)習(xí)機(jī)行業(yè)中,訊飛 AI 學(xué)習(xí)機(jī)市場 份額和品牌知名度持續(xù)提升,用戶凈推薦值 NPS 持續(xù)保持行業(yè)第一。2022 年科大訊飛 AI 學(xué) 習(xí)機(jī)銷售額增長超 50%,繼續(xù)強(qiáng)勢增長并跑贏行業(yè)大盤。618 大促期間獲得線上全渠道全周 期(天貓&京東&抖音)累計(jì) GMV 排名第一,雙 11 期間線上銷量實(shí)現(xiàn) 100%增長;線下門店 數(shù)量增長 100%,線下銷量連續(xù)兩年增長超 100%。
此次星火大模型搭載后,學(xué)習(xí)機(jī)主要實(shí)現(xiàn)兩種功能的提升:1)實(shí)現(xiàn)自動(dòng)化中英文作文批閱: 作為一直占用老師非常多的批閱時(shí)間,且主觀性較強(qiáng)無法實(shí)現(xiàn)千人千面的個(gè)性化教學(xué),搭載 星火大模型的 AI 學(xué)習(xí)機(jī),可以針對中英文作文的語法、句子、修辭方式等做出全方位的批 改,從而實(shí)現(xiàn)類人的閱卷模式。2)實(shí)現(xiàn)英語口語自然對話:口語對話一直是學(xué)生學(xué)習(xí)英語 的難點(diǎn),搭載星火大模型后,學(xué)習(xí)機(jī)可以實(shí)現(xiàn)多輪自然的英語口語對話,助力學(xué)生實(shí)現(xiàn)口語 能力的提升。
2.2.AI+辦公:實(shí)現(xiàn)會議紀(jì)要語篇規(guī)整和一鍵成稿
星火大模型融入 AI 辦公全產(chǎn)品線,實(shí)現(xiàn)會議紀(jì)要語篇規(guī)整和一鍵成稿。訊飛擁有 AI+辦公全 系列產(chǎn)品,包括訊飛智能辦公本、訊飛智能錄音筆、訊飛聽見會議系統(tǒng)、訊飛耳機(jī)等各類產(chǎn) 品。其中,根據(jù)年報(bào)披露,訊飛智能辦公本產(chǎn)品體系逐步完善,連續(xù)兩年榮獲 618、雙十一 京東/天貓雙平臺電紙書類目品牌及單品銷售額冠軍,同時(shí)在線下市場領(lǐng)跑墨水屏辦公本品 類,市場占有率第一。訊飛智能錄音筆持續(xù)領(lǐng)跑智能錄音筆行業(yè)。618、雙十一期間,已連 續(xù)四年獲得京東&天貓雙平臺錄音筆品類銷售額第一;已入駐 3630 家線下門店或零售網(wǎng)點(diǎn); 用戶遍布全球日、韓、東南亞、北美、歐洲、澳洲等 180 個(gè)國家和地區(qū),連續(xù)三年榮獲德國 iF 設(shè)計(jì)大獎(jiǎng)。
此次搭載星火大模型的辦公系列產(chǎn)品,主要實(shí)現(xiàn)了三大功能:1)會議紀(jì)要語篇規(guī)整:應(yīng)用 星火大模型,可以將一篇轉(zhuǎn)寫的口語稿件變成書面稿,實(shí)現(xiàn)閱讀效率提升。根據(jù)發(fā)布會描述, 語篇規(guī)整后的原文忠實(shí)度保持在 96%以上,關(guān)鍵信息幾乎完全保留,同時(shí)將文章的篇幅縮短20%到40%;縮短之后由于看起來更規(guī)整、更通順,閱讀效率可以提升 50%以上。2)要點(diǎn)挖掘:通過星火大模型,實(shí)現(xiàn)會議紀(jì)要的摘要生成。例如對于一篇 7252 字的會議紀(jì) 要,可以生成 240 字的摘要,從而一目了然看懂會議重點(diǎn)。3)一鍵成稿能力:可以將一篇會議的轉(zhuǎn)寫紀(jì)要,通過一鍵生成的形式,形成不同風(fēng)格和內(nèi) 容的文稿,例如將其轉(zhuǎn)化為新聞稿、宣傳稿等,從而實(shí)現(xiàn)相應(yīng)內(nèi)容的一鍵成稿。
2.3.AI+汽車:實(shí)現(xiàn)更加智能的汽車人機(jī)交互
星火大模型賦能車載場景,實(shí)現(xiàn)更加智能的人機(jī)交互。訊飛車載智能座艙語 音交互系統(tǒng),能夠提供多輪、多人、多區(qū)域、多模態(tài)的智能汽車人機(jī)交互形式,服務(wù)車型超 過 1330 個(gè),服務(wù)用戶累計(jì) 4200 萬,在汽車中文語音市場占有率持續(xù)領(lǐng)先。2022 年,公司智 能汽車業(yè)務(wù)新增前裝出貨量超過 710 萬套,累計(jì)出貨量超過 4610 萬套,年度交互次數(shù)突破 30.4 億次,平均月活用戶 1488 萬。此次搭載星火大模型之后,可以讓汽車的人機(jī)交互再上 新臺階,實(shí)現(xiàn)更加自由、擬人化的人機(jī)溝通,真正實(shí)現(xiàn)系統(tǒng)對汽車的理解。
2.4.AI+數(shù)字員工:打造虛擬數(shù)字人和 RPA 平臺
星火大模型打造數(shù)字員工,實(shí)現(xiàn)虛擬人定制和 RPA 自動(dòng)生成。在數(shù)字員工方面,星火大模型 的賦能主要體現(xiàn)在兩個(gè)方面:1)自由定制虛擬數(shù)字人:2021 年底科大訊飛推出 AI 虛擬人交 互平臺之后,目前這個(gè)平臺已經(jīng)有超 1000 個(gè)虛擬形象資產(chǎn),有 300 多個(gè)專業(yè)且不同的聲音, 有 30 多萬用戶自定義的音庫,目前已經(jīng)在多個(gè)產(chǎn)業(yè)場景落地。搭載星火大模型的虛擬數(shù)字 人,能夠更加智能、人性化地實(shí)現(xiàn)與人之間的互動(dòng),例如進(jìn)行商場的虛擬導(dǎo)購,實(shí)現(xiàn) 24 小 時(shí)不打烊等。
2)打造生成式 RPA 平臺:過去的 RPA 平臺利用人工拖拽構(gòu)建自動(dòng)化流程,非 常依賴專業(yè)人員如業(yè)務(wù)流程專家和實(shí)施工程師,同時(shí)構(gòu)建流程耗時(shí)周期長、成本高?,F(xiàn)在有 了星火大模型的加持,RPA 就變成了深層次的自動(dòng)化流程平臺。只需要把需求流程場景描述 出來,就能自動(dòng)生成所有流程。RPA 加星火大模型讓企業(yè)與流程相關(guān)的工作,實(shí)現(xiàn)人人可操 作,降低了對專業(yè)人士的依賴,同時(shí)構(gòu)建流程的周期變短、成本下降。
2.5.開放合作,共建人工智能“星火”生態(tài)
依托訊飛開放平臺,構(gòu)建星火大模型開放生態(tài)。公司除了實(shí)現(xiàn)核心技術(shù)的源頭創(chuàng)新、垂直場 景的應(yīng)用落地和產(chǎn)品發(fā)布之外,也一直致力于生態(tài)環(huán)境的構(gòu)建。根據(jù)年報(bào)披露,訊飛人工智 能開放平臺作為首批國家新一代人工智能開放創(chuàng)新平臺,致力于向開發(fā)者提供業(yè)界領(lǐng)先的人 工智能核心技術(shù),圍繞開發(fā)者群體持續(xù)構(gòu)建生態(tài)。同時(shí),通過整合產(chǎn)業(yè)鏈多維度資源賦能開 發(fā)者創(chuàng)業(yè)團(tuán)隊(duì),協(xié)力共建千行百業(yè)的人工智能商業(yè)化標(biāo)桿案例。根據(jù)公司公告,截至 2022 年末,訊飛開放平臺已開放 559 項(xiàng) AI 能力及場景解決方案,聚集 398.1 萬開發(fā)者團(tuán)隊(duì), 總應(yīng)用數(shù)達(dá) 164.6 萬,鏈接超過 500 萬生態(tài)合作伙伴。此次星火大模型發(fā)布會,公司將在 未來推動(dòng)星火大模型的認(rèn)知能力開放、插件開放和行業(yè)共創(chuàng),真正實(shí)現(xiàn)星火大模型對千行白 業(yè)的賦能,也通過各領(lǐng)域的應(yīng)用來反哺大模型的迭代,從而實(shí)現(xiàn)良性的產(chǎn)業(yè)循環(huán)。
(本文僅供參考,不代表我們的任何投資建議。如需使用相關(guān)信息,請參閱報(bào)告原文。)