首頁
產(chǎn)品系列
行業(yè)應(yīng)用
渠道合作
新聞中心
研究院
投資者關(guān)系
技術(shù)支持
關(guān)于創(chuàng)澤
| En
 
  當前位置:首頁 > 新聞資訊 > 行業(yè)動態(tài) > 語言大模型能力提升主要體現(xiàn)為四方面:上下文窗口,知識密度增強和強化學(xué)習(xí)等  
 

語言大模型能力提升主要體現(xiàn)為四方面:上下文窗口,知識密度增強和強化學(xué)習(xí)等

來源:中國信息通信研究院      編輯:創(chuàng)澤      時間:2024/12/13      主題:其他   [加盟]

OpenAI 等基于大量工程實驗和反復(fù)驗 證提出縮放定律,揭示了模型能力與計算能力、參數(shù)量和數(shù)據(jù)量間 的定量關(guān)系,業(yè)界也遵循該定律指導(dǎo)資源要素投入、推動模型創(chuàng)新 發(fā)展,近年來在模型技術(shù)能力、通用泛化水平等方面取得一系列突 破性進展。目前,大模型支持模態(tài)已逐步從自然語言處理拓展到多 模態(tài)理解和生成等場景。

從 2023 年至今的基準測試結(jié)果來看,大模型能力已經(jīng)出現(xiàn) 階躍式提升。語言大模型能力提升主要體現(xiàn)為以下四方面。

一是上下文窗口長度擴展,提升全局能力。大模型的上下文窗口長度是指 模型在執(zhí)行文本生成任務(wù)時,能夠處理的前置文本的數(shù)量或長度, 決定了模型對信息的理解深度和廣度,對于理解和生成連貫、一致 且準確的文本具有重要意義。當前,國內(nèi)外主流大語言模型均具備 128k 以上的上下文長度處理能力,可一次性處理數(shù)十萬單詞或漢字。

二是知識密度增強,儲存更多知識。隨著數(shù)據(jù)、算力、算法協(xié)同發(fā) 展,大模型知識密度持續(xù)增強,平均每 8 個月翻一番。2020 年 6 月 發(fā)布的 GPT-3 大模型有 1750 億個參數(shù),2024 年 2 月面壁智能發(fā)布 MiniCPM-2.4B 模型在實現(xiàn)同等性能的同時,參數(shù)規(guī)模降至 24 億, 相當于知識密度提G了約 86 倍。

三是 MoE 混合專家架構(gòu)能夠容納更多知識,準確刻畫任務(wù)。MoE 稀疏激活多個專家子模型支路,加權(quán) 融合多個子模型結(jié)果,實現(xiàn)更加準確的輸出,提G推理計算效率。 目前,谷歌的 Gemini-1.5 Pro、Mistral AI 的 8x7B 與 8x22B、阿里云 Qwen-1.5 MoE、階躍星辰 Step-2 等頭部大模型均采用 MoE 架構(gòu), 已 成 為 當 前 大 模 型 的 重 要 演 進 趨 勢 。

四 是通過強化學(xué)習(xí) (Reinforcement Learning,RL)將思維鏈(Chain of Thought,CoT) 內(nèi)化進模型,提升復(fù)雜推理能力。2024 年 9 月 OpenAI 發(fā)布的 o1 系 列模型在后訓(xùn)練(Post-Training)階段采用強化學(xué)習(xí)和思維鏈的技術(shù)方案,不僅在“慢思考”后回答復(fù)雜問題的表現(xiàn)優(yōu)異(尤其是在 STEM L域的推理能力顯著增強),還具有了自我反思與錯誤修正能力, 使自博弈強化學(xué)習(xí)有望成為提升語言大模型邏輯推理能力的技術(shù)新范式。



人工智能產(chǎn)業(yè)穩(wěn)中有進迎來新動能:規(guī)模6233 億,增長21.5%

全球人工智能產(chǎn)業(yè)規(guī)模將達到 6233 億美元,同比增長 21.5%;超過 80%的企業(yè)將使用生成式人工智能 API,或部署生成 式人工智能的應(yīng)用程序,全球人工智能投融資金額達316 億美元

人工智能工程化邁向新階段:應(yīng)用工具鏈拓展大模型應(yīng)用廣度

Agent 的引 入,實現(xiàn)了復(fù)雜任務(wù)的自動化執(zhí)行與智能決策,多模型編排則有效解決了單一模型局限性問題,大小模型協(xié)同機制,極大增強了模型的知識推理與生成能力

人工智能技術(shù)演進走向新范式:單任務(wù)智能到多任務(wù)智能

以大模型為代表的人工智能技術(shù)展現(xiàn)出了類人智能的“涌現(xiàn)”能力,呈現(xiàn)規(guī)?蓴U展、多任務(wù)適應(yīng)及能力可塑三大特征,規(guī)?蓴U展,多任務(wù)適應(yīng),能力可塑

人工智能發(fā)展報告 (2024 年):技術(shù)創(chuàng)新方向,產(chǎn)業(yè)升級重點,行業(yè)落地趨勢和安全治理進展,展望人工智能發(fā)展機遇

大模型,多模態(tài)模型,智能體和具身智能等領(lǐng)域不斷出現(xiàn)突破性創(chuàng)新,推動人工智能邁向通用智能初始階段,人工智能在實體經(jīng)濟中的應(yīng)用場景將進一步拓展

全球人形機器人產(chǎn)品數(shù)據(jù)庫(2024 年):智元機器人 均勝集團 帕西尼感知科技 追覓科技 星動紀元

小鵬 逐際動力 MagicLab 北京仿人機器人創(chuàng)新中心 宇樹科技 奇瑞&Aim oga 智元機器人 均勝集團 帕西尼感知科技 追覓科技 星動紀元 均勝集團 浙江人形機器人創(chuàng)新中心 開普勒 星塵智能 福德機器人

2024全球人形機器人企業(yè)畫像與能力評估報告:企業(yè)總計超150家,任務(wù)級能力占40%,技能級能力占60%

人形機器人企業(yè)的現(xiàn)狀、能力評估及未來發(fā)展前景,客觀回顧產(chǎn)業(yè)歷程、識別爆發(fā)節(jié)點及背后動因,重新定義了人形機器人整機,企業(yè)總計超150家,中、美、日三國企業(yè)數(shù)量占全球份額>65%

人本智能的產(chǎn)業(yè)實踐:經(jīng)歷了三個階段,原則爆發(fā),共識尋求,倫理實踐

原則爆發(fā)階段提出了自己的 AI 倫理原則;共識尋求階段強調(diào) AI 技術(shù)應(yīng)該以人類的尊嚴和權(quán)利為核心;倫理實踐階段全面推進負責(zé)任 AI 的落地實施

人本智能的內(nèi)涵和原則:三個維度的升級,四個發(fā)展原則

在人與 AI 兩者之間的交互關(guān)系上構(gòu)建一種人機共生的新關(guān)系、新范式; 在人與 AI 的目標工具屬性關(guān)系上共情智能及人機物和諧智能;在人與 AI 發(fā)展的價值導(dǎo)向上助力克服健康、環(huán)境、教育等領(lǐng)域的關(guān)鍵挑戰(zhàn)

構(gòu)建新型“三線”人機關(guān)系:人機協(xié)作,人機共生,人在機器之上是底線

人類已經(jīng)進入一個“人機物”三元融合的萬物智能互聯(lián)時代,人與移動設(shè)備的交互方式更高階的智能體交互正在為人們創(chuàng)造全新的體驗,實現(xiàn)超能力替身

新一輪AI下的人機關(guān)系:人類社會治理和倫理中的AI

人工智能將被賦予以前只能由人類心智完成或嘗試的任務(wù),產(chǎn)生接近乃至超越人類智能所能完成的結(jié)果;從“以人類理性為中心”轉(zhuǎn)變?yōu)椤耙匀祟愖饑篮妥灾餍詾橹行摹?

新一輪AI下的人機關(guān)系:人類生產(chǎn)中的AI

通過機器學(xué)習(xí)和大數(shù)據(jù)分析,AI 能夠輔助醫(yī)生進行疾病診斷;根據(jù)用戶的風(fēng)險偏好,財務(wù)狀況以及市場動態(tài)進行資產(chǎn)配置和投資組合優(yōu)化;AI 使自動駕駛系統(tǒng)擁有超越人類的感知能力

新一輪AI下的人機關(guān)系:人類情感世界中的AI

全球三分之二(67%)的 Z 世代年輕人認為網(wǎng)絡(luò)和現(xiàn)實之間的自我表現(xiàn)存在脫節(jié),這進一步 加劇了他們的孤獨感和焦慮感;每個人都可以在這個與真實世界平行的虛擬世界中擁有自己的分身
 
資料獲取
新聞資訊
== 資訊 ==
» OpenAI的軟硬件生態(tài)布局與進展-硬件
» 2025年通向AGI之路-全球人工智能展
» 中國聯(lián)通《人工智能行業(yè)安全治理白皮書(2
» 浙江省 “人工智能+建筑業(yè)”創(chuàng)新應(yīng)用案例
» 機器人柔性關(guān)節(jié)的作用:自由度,防撞擊、防
» 柔性機器人的研究目的:科學(xué)的目的,工程的
» 兩輪機器人的運動原理:4個自由度:2個平
» 兩輪機器人的基本構(gòu)造:機體,底盤和輪系
» 機器龜?shù)慕Y(jié)構(gòu)制作材料:底盤,執(zhí)行器,傳感
» 機器人的避障功能原理:接觸式傳感器觸發(fā)的
» 4足機器人的制作材料:微型減速電機,車條
» 機器人CPG(中樞模式發(fā)生器)的制作材料
» 螞蟻機器人的制作材料:74HC240,光
» 3D光電跟蹤頭的制作材料:74HC240
» 2D光電跟蹤頭的構(gòu)造:兩個光敏二極管,
 
== 機器人推薦 ==
 
迎賓講解服務(wù)機器人

服務(wù)機器人(迎賓、講解、導(dǎo)診...)

智能消毒機器人

智能消毒機器人

機器人底盤

機器人底盤

 

商用機器人  Disinfection Robot   展廳機器人  智能垃圾站  輪式機器人底盤  迎賓機器人  移動機器人底盤  講解機器人  紫外線消毒機器人  大屏機器人  霧化消毒機器人  服務(wù)機器人底盤  智能送餐機器人  霧化消毒機  機器人OEM代工廠  消毒機器人排名  智能配送機器人  圖書館機器人  導(dǎo)引機器人  移動消毒機器人  導(dǎo)診機器人  迎賓接待機器人  前臺機器人  導(dǎo)覽機器人  酒店送物機器人  云跡科技潤機器人  云跡酒店機器人  智能導(dǎo)診機器人 
版權(quán)所有 © 創(chuàng)澤智能機器人集團股份有限公司     中國運營中心:北京·清華科技園九號樓5層     中國生產(chǎn)中心:山東日照太原路71號
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728