大模型長文本能力突破40萬token 推動行業應用新發展

2025-07-22 20:00:29

摘要生成中

大模型正在以驚人速度突破長文本技術

大模型的長文本能力正在飛速提升。從最初的4000 token到現在的40萬token，這一能力的增長可謂"肉眼可見"。

長文本處理似乎已成爲大模型廠商的新"標配"。國外方面，OpenAI通過多次升級將GPT-4的上下文長度提升至3.2萬token。Anthropic則一舉將其模型的上下文長度擴展到10萬token。LongLLaMA更是將這一數字推高至25.6萬token。

國內也不甘落後。某大模型初創公司推出的智能助手可支持輸入20萬漢字,約合40萬token。另有研究團隊開發的新技術LongLoRA,能將7B模型的文本長度拓展到10萬token。

目前,包括OpenAI、Anthropic、Meta等在內的衆多頂級大模型公司和機構都將拓展上下文長度作爲重點升級方向。這些公司無一例外都備受資本青睞。

那麼,大模型公司爲何如此重視長文本技術?上下文長度擴大100倍意味着什麼?

表面上看,這意味着模型可處理的輸入文本越來越長,閱讀能力越來越強。從最初只能讀懂短文,到現在可以輕鬆理解一本長篇小說。

更深層次看,長文本技術正在推動大模型在金融、法律、科研等專業領域的應用落地。長文檔摘要、閱讀理解、問答等能力是這些領域智能化升級的關鍵。

不過,需要注意的是,支持更長的上下文輸入並不等同於模型效果更好。研究表明,模型對上下文內容的使用才是關鍵。

目前,國內外對文本長度的探索還遠未達到極限。40萬token或許只是一個開始。

爲何要"卷"長文本?

某大模型公司創始人表示,正是由於輸入長度受限,才造成了許多大模型應用落地的困境。這也是衆多公司聚焦長文本技術的原因所在。

例如,在虛擬角色場景中,由於長文本能力不足,虛擬角色會遺忘重要信息。在開發劇本殺類遊戲時,輸入prompt長度不夠,只能削減規則和設定,影響遊戲效果。在法律、金融等專業領域,深度內容分析和生成也常常受挫。

長文本技術在通往未來Agent和AI原生應用的道路上也扮演着重要角色。Agent需要依靠歷史信息進行規劃決策,AI原生應用則需要上下文來保持連貫、個性化的用戶體驗。

該創始人認爲,大模型的上限由單步能力和執行步驟數共同決定。單步能力與參數量相關,而執行步驟數即上下文長度。

長文本技術可以解決大模型早期被詬病的一些問題,增強某些功能,同時也是推進產業應用落地的關鍵技術。這標志着通用大模型發展進入了從LLM到Long LLM的新階段。

某公司新發布的智能助手展示了Long LLM階段大模型的一些升級功能:

對超長文本進行關鍵信息提取、總結和分析
將文字直接轉化爲代碼,甚至可根據論文復現代碼生成過程
實現角色扮演,與公衆人物進行一對一對話

這些例子表明,對話機器人正朝着專業化、個性化、深度化方向發展,這或許是撬動產業應用和超級APP落地的新抓手。

不過,目前市面上的長文本對話場景仍有優化空間。如不支持聯網獲取最新信息、無法暫停修改生成過程、偶爾會出現胡說八道等情況。

長文本的"不可能三角"困境

長文本技術面臨文本長短、注意力和算力的"不可能三角"困境:

文本越長,越難聚集充分注意力
注意力受限,短文本難以完整解讀復雜信息
處理長文本需要大量算力,提高成本

這主要源於大多數模型基於Transformer結構。其中的自注意力機制使計算量隨上下文長度呈平方級增長。

一些研究表明,過長的上下文會導致相關信息佔比下降,加劇注意力分散。這構成了文本長短與注意力的矛盾。

同時,突破更長的文本技術就不得不消耗更多算力。但在實際部署中,企業端往往無法提供足夠算力支持。這又形成了文本長短與算力的矛盾。

目前主要有三種解決方案:

借助外部工具輔助處理長文本
優化自注意力機制計算
利用模型優化的一般方法

第一種方案是給模型開"外掛",將長文本切分爲多個短文本處理。

第二種方案是重構自注意力計算方式,如LongLoRA技術將長文本分組計算。

第三種方案專注於模型優化,如LongLLaMA通過微調實現更長序列的外推。

長文本的"不可能三角"困境暫時還無解,但也明確了探索路徑:在文本長短、注意力和算力三者間尋找最佳平衡點,既處理足夠信息,又兼顧注意力計算與算力成本限制。

TOKEN4.42%

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

17人點讚了這條動態

讚賞
17
9
分享

留言

0/400

Uncle Whale

· 07-25 17:35

牛叉也不是长久之计

回復0

ApeShotFirst

· 07-24 15:51

gm,40w token真的ape

回復0

FOMOSapien

· 07-23 07:50

40万token 吃得消这么大的开销？

回復0

SocialFiQueen

· 07-22 20:30

四十万token顶个啥续费要吃土

回復0

午夜卖币人

· 07-22 20:30

40w啊，智能还挺高

回復0

LiquidityHunter

· 07-22 20:25

40万token...啧啧算力开销得恐怖成啥样

回復0

NewDAOdreamer

· 07-22 20:21

token上新高卷起来

回復0

治理投票假装者

· 07-22 20:08

算力烧爆也得继续卷啊

回復0

Permabull Pete

· 07-22 20:04

四十万token?直接拿去炒币得了

回復0