精品欧美在线一区二区,亚洲国产中文在线视频,海角精产国品一二三区别,一区二区国产高清视频在线

          <legend id="o3rmf"><abbr id="o3rmf"><thead id="o3rmf"></thead></abbr></legend>
          中國質(zhì)量新聞網(wǎng)
          您當(dāng)前位置: 新聞中心>>財經(jīng)>>公司>>

          支持20萬字輸入,Moonshot AI開啟千億大模型的“長文本”時代

          2023-10-10 16:39:21 中國質(zhì)量新聞網(wǎng)

          2023年10月9日,成立僅半年的大模型初創(chuàng)公司——Moonshot AI宣布在“長文本”領(lǐng)域?qū)崿F(xiàn)了突破,推出了支持輸入20萬漢字的智能助手產(chǎn)品Kimi Chat。

          從技術(shù)上看,參數(shù)量決定了大模型支持多復(fù)雜的“計算”,而能夠接收多少文本輸入(即長文本技術(shù))則決定了大模型有多大的“內(nèi)存”,兩者共同決定模型的應(yīng)用效果。支持更長的上下文意味著大模型擁有更大的“內(nèi)存”,從而使得大模型的應(yīng)用更加深入和廣泛:比如通過多篇財報進行市場分析、處理超長的法務(wù)合同、快速梳理多篇文章或多個網(wǎng)頁的關(guān)鍵信息、基于長篇小說設(shè)定進行角色扮演等等,都可以在超長文本技術(shù)的加持下,成為我們工作和生活的一部分。

          相比當(dāng)前市面上以英文為基礎(chǔ)訓(xùn)練的大模型服務(wù),Kimi Chat具備較強的多語言能力。例如,Kimi Chat在中文上具備顯著優(yōu)勢,實際使用效果能夠支持約20萬漢字的上下文,在千億參數(shù)下實現(xiàn)了無損的長程注意力機制,不依賴于滑動窗口、降采樣、小模型等對性能損害較大的“捷徑”方案。

          目前,Moonshot AI 的智能助手產(chǎn)品Kimi Chat已開放了內(nèi)測。

          大模型輸入長度受限帶來的應(yīng)用困境

          當(dāng)前大模型輸入長度普遍較低的現(xiàn)狀對其技術(shù)落地產(chǎn)生了極大制約。

          對于大模型開發(fā)者來說,輸入prompt長度的限制約束了大模型應(yīng)用的場景和能力的發(fā)揮,比如基于大模型開發(fā)劇本殺類游戲時,往往需要將數(shù)萬字甚至超過十萬字的劇情設(shè)定以及游戲規(guī)則作為prompt加入應(yīng)用,如果模型輸入長度不夠,則只能削減規(guī)則和設(shè)定,從而無法達到預(yù)期游戲效果。

          在另一個大模型應(yīng)用的主要方向——Agent中,由于Agent運行需要自動進行多輪規(guī)劃和決策,且每次行動都需要參考歷史記憶信息才能完成,這會帶來了模型輸入的快速增加,同時也意味著不能處理更長上下文的模型將因為無法全面準確的基于歷史信息進行新的規(guī)劃和決策從而降低Agent運行成功的概率。

          在使用大模型作為工作助理完成任務(wù)的過程中,幾乎每個深度用戶都遇到過輸入長度超出限制的情況。尤其是律師、分析師、咨詢師等職業(yè)的用戶,由于常常需要分析處理較長的文本內(nèi)容,使用大模型時受挫的情況發(fā)生頻率極高。

          而上述所有的問題在大模型擁有足夠長的上下文輸入后都將會迎刃而解。

          長文本打開大模型應(yīng)用的新世界

          那么擁有超長上下文輸入后的大模型會有怎樣的表現(xiàn)?下面是一些Kimi Chat實際使用的例子:

          公眾號的長文直接交給Kimi Chat,讓它幫你快速總結(jié)分析:

          新鮮出爐的英偉達財報,交給Kimi Chat,快速完成關(guān)鍵信息分析:

          出差發(fā)票太多?全部拖進Kimi Chat,快速整理成需要的信息:

          發(fā)現(xiàn)了新的算法論文時,Kimi Chat能夠直接幫你根據(jù)論文復(fù)現(xiàn)代碼:

          只需要一個網(wǎng)址,就可以在Kimi Chat中和自己喜歡的原神角色聊天:

          輸入整本《月亮與六便士》,讓Kimi Chat和你一起閱讀,幫助你更好的理解和運用書本中的知識:

          通過上述例子,我們可以看到,當(dāng)模型可以處理的上下文變得更長后,大模型的能力能夠覆蓋到更多使用場景,真正在人們的工作、生活、學(xué)習(xí)中發(fā)揮作用,而且由于可以直接基于全文理解進行問答和信息處理,大模型生成的“幻覺”問題也可以得到很大程度的解決。

          不走捷徑,解決算法和工程的雙重挑戰(zhàn)

          長文本技術(shù)的開發(fā),存在一些對效果損害很大的“捷徑”,主要包含以下幾個方面:

          “金魚”模型,特點是容易“健忘”。通過滑動窗口等方式主動拋棄上文,只保留對最新輸入的注意力機制。模型無法對全文進行完整理解,無法處理跨文檔的比較和長文本的綜合理解(例如,無法從一篇10萬字的用戶訪談錄音轉(zhuǎn)寫中提取最有價值的10個觀點)。

          “蜜蜂”模型,特點是只關(guān)注局部,忽略整體。通過對上下文的降采樣或者RAG(檢索增強的生成),只保留對部分輸入的注意力機制。模型同樣無法對全文進行完整理解(例如,無法從50個簡歷中對候選人的畫像進行歸納和總結(jié))。

          “蝌蚪”模型,特點是模型能力尚未發(fā)育完整。通過減少參數(shù)量(例如減少到百億參數(shù))來提升上下文長度,這種方法會降低模型本身的能力,雖然能支持更長上下文,但是大量任務(wù)無法勝任。

          簡單的捷徑無法達到理想的產(chǎn)品化效果。為了真正做出可用、好用的產(chǎn)品,就不能走虛假的捷徑,而應(yīng)直面挑戰(zhàn)。

          訓(xùn)練層面,想訓(xùn)練得到一個支持足夠長上下文能力的模型,不可避免地要面對如下困難:

          如何讓模型能在幾十萬的上下文窗口中,準確的Attend到所需要的內(nèi)容,不降低其原有的基礎(chǔ)能力?已有的類似滑動窗口和長度外推等技術(shù)對模型性能的損害比較大,在很多場景下無法實現(xiàn)真正的上下文。

          在千億參數(shù)級別訓(xùn)練長上下文模型,帶來了更高的算力需求和極嚴重的顯存壓力,傳統(tǒng)的3D并行方案已經(jīng)難以無法滿足訓(xùn)練需求。

          缺乏充足的高質(zhì)量長序列數(shù)據(jù),如何提供更多的有效數(shù)據(jù)給模型訓(xùn)練?

          推理層面,在獲得了支持超長上下文的模型后,如何讓模型能服務(wù)眾多用戶,同樣要面臨艱巨挑戰(zhàn):

           Transformer模型中自注意力機制(Self Attention)的計算量會隨著上下文長度的增加呈平方級增長,比如上下文增加32倍時,計算量實際會增長1000倍,這意味著如果只是用樸素的方式實現(xiàn),用戶需要等待極其長的時間才能獲得反饋。

          超長上下文導(dǎo)致顯存需求進一步增長:以 1750億參數(shù)的GPT-3為例,目前最高單機配置(80 GiB*8)最多只能支持64k上下文長度的推理,超長文本對顯存的要求可見一斑。

          極大的顯存帶寬壓力:英偉達A800或 H800的顯存帶寬高達2-3 TiB/s,但面對如此長的上下文,樸素方法的生成速度只能達到2-5 tokens/s,使用的體驗極其卡頓。

           Moonshot AI的技術(shù)團隊進行了極致的算法和工程優(yōu)化,克服上述困難完成了大內(nèi)存模型的產(chǎn)品化,發(fā)布了支持20萬字輸入的千億參數(shù)LLM產(chǎn)品。

          “登月計劃”第一步:歡迎來到 Long LLM 時代

           Moonshot AI創(chuàng)始人楊植麟此前在接受采訪時曾表示,無論是文字、語音還是視頻,對海量數(shù)據(jù)的無損壓縮可以實現(xiàn)高程度的智能。

          無損壓縮的進展曾極度依賴「參數(shù)為王」模式,該模式下壓縮比直接與參數(shù)量相關(guān),這極大增加了模型的訓(xùn)練成本和應(yīng)用門檻,而Moonshot AI認為:大模型的能力上限(即無損壓縮比)是由單步能力和執(zhí)行的步驟數(shù)共同決定的。單步能力與參數(shù)量正相關(guān),而執(zhí)行步驟數(shù)即上下文長度。

           Moonshot AI相信,更長的上下文長度可以為大模型應(yīng)用帶來全新的篇章,促使大模型從 LLM時代進入Long LLM (LLLM)時代:

          每個人都可以擁有一個具備終身記憶的虛擬伴侶,它可以在生命的長河中記住與你交互的所有細節(jié),建立長期的情感連接。

          每個人都可以擁有一個在工作環(huán)境與你共生(co-inhabit)的助手,它知曉公域( 互聯(lián)網(wǎng))和私域(企業(yè)內(nèi)部文檔)的所有知識,并基于此幫助你完成OKR。

          每個人都可以擁有一個無所不知的學(xué)習(xí)向?qū)?,不僅能夠準確的給你提供知識,更能夠引導(dǎo)你跨越學(xué)科間的壁壘,更加自由的探索與創(chuàng)新。

          當(dāng)然,更長的上下文長度只是Moonshot AI在下一代大模型技術(shù)上邁出的第一步。Moonshot AI計劃憑借該領(lǐng)域的技術(shù),加速大模型技術(shù)的創(chuàng)新和應(yīng)用落地。

          登月計劃的伙伴說:

           Monolith礪思資本專注于新一代數(shù)字產(chǎn)業(yè)和科技智造領(lǐng)域的投資,是Moonshot AI第一輪融資的3家投資機構(gòu)之一,并一直以實際行動支持著公司發(fā)展。礪思資本創(chuàng)始合伙人曹曦表示,楊植麟團隊在人工智能技術(shù),特別是大語言模型LLM領(lǐng)域擁有深厚的技術(shù)積累,并已在國際上獲得了廣泛認可。眼下,美國硅谷的OpenAI和Anthropic等公司獲得了多方關(guān)注,實際上在國內(nèi),擁有足夠多技術(shù)儲備的Moonshot AI也正成長為AGI初創(chuàng)公司。多模態(tài)大模型是各家AI廠商競爭的關(guān)鍵領(lǐng)域,其中長文本輸入技術(shù)更是其核心技術(shù)之一,Moonshot AI團隊最新發(fā)布的大模型和Kimi Chat在這方面實現(xiàn)了重要突破,并已成功應(yīng)用于多個實際場景。礪思將繼續(xù)加碼并支持Moonshot AI團隊在AGI領(lǐng)域大膽創(chuàng)新和技術(shù)突破,助力中國人工智能技術(shù)的未來發(fā)展。

          真格基金合伙人戴雨森對公司的發(fā)展表達了肯定和期許:“我們認為近期AI應(yīng)用的爆火只是一場革命的序幕,AI技術(shù)要想真正改變世界創(chuàng)造巨大價值,在智能程度上還需要大的突破,這需要具備頂級技術(shù)能力的團隊,以堅持追尋Moonshot的勇氣,持續(xù)挑戰(zhàn)智能提升的邊界。楊植麟作為XLNet等多項知名科研工作的第一作者,具備非常豐富的科研和實踐經(jīng)驗,多年來他一直堅信通過大模型實現(xiàn)對高維數(shù)據(jù)的壓縮是人工智能發(fā)展的必經(jīng)之路,也團結(jié)了一支人才密度超高,配合默契,又充滿挑戰(zhàn)巨頭搖滾精神的創(chuàng)業(yè)團隊。真格基金非常榮幸能夠再次從天使輪開始支持楊植麟的新征程。”

          關(guān)于 Moonshot AI

           Moonshot AI創(chuàng)立于2023年3月,致力于尋求將能源轉(zhuǎn)化為智能的最優(yōu)解,通過產(chǎn)品與用戶共創(chuàng)智能。創(chuàng)始團隊核心成員參與了Google Gemini、Google Bard、盤古NLP、悟道等多個大模型的研發(fā),多項核心技術(shù)被Google PaLM、Meta LLaMa、Stable Diffusion等主流產(chǎn)品采用。Moonshot AI融資超2億美元。

          (責(zé)任編輯:加賀)
          最新評論
          聲明:

          本網(wǎng)注明“來源:中國質(zhì)量新聞網(wǎng)”的所有作品,版權(quán)均屬于中國質(zhì)量新聞網(wǎng),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其他方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:中國質(zhì)量新聞網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。若需轉(zhuǎn)載本網(wǎng)稿件,請致電:010-84648459。

          本網(wǎng)注明“來源:XXX(非中國質(zhì)量新聞網(wǎng))”的作品,均轉(zhuǎn)載自其他媒體,轉(zhuǎn)載目的在于傳遞更多信息,不代表本網(wǎng)觀點。文章內(nèi)容僅供參考。如因作品內(nèi)容、版權(quán)和其他問題需要同本網(wǎng)聯(lián)系的,請直接點擊《新聞稿件修改申請表》表格填寫修改內(nèi)容(所有選項均為必填),然后發(fā)郵件至 lxwm@cqn.com.cn,以便本網(wǎng)盡快處理。

          圖片新聞
          • 山西省晉城市陽城縣兩萬公頃玉米喜獲 ...

          • 浙江省湖州市南潯區(qū)市場監(jiān)管局在浙江 ...

          • 山東省無棣縣市場監(jiān)管局組織開展食品 ...

          • 河南全面實施標準化戰(zhàn)略服務(wù)標準河南 ...

          • 新疆維吾爾自治區(qū)昌吉回族自治州昌吉 ...

          最新新聞