月之暗面發(fā)布萬(wàn)億參數(shù)開源模型 Kimi K2,多位研發(fā)工程師在知乎“親自答”
“參與過(guò)Kimi K2的接生,自己的孩子怎么看都順眼”。7月11日晚,國(guó)內(nèi)大模型獨(dú)角獸月之暗面正式發(fā)布并開源了其最新一代MoE架構(gòu)基礎(chǔ)模型Kimi K2,總參數(shù)量達(dá)到1萬(wàn)億,這一消息迅速引發(fā)了AI領(lǐng)域的廣泛關(guān)注,Kimi內(nèi)部則將K2研發(fā)群戲稱為“接生群”。多位參與“接生”的Kimi研發(fā)人員隨后在知乎展開“親自答”,從多個(gè)角度深入講述了其背后研發(fā)歷程。
作為月之暗面 Infra側(cè)推理方面研發(fā)人員,知乎答主劉少偉談及了K2模型結(jié)構(gòu)的設(shè)計(jì)宗旨。他稱K2模型是在DeepSeek V3結(jié)構(gòu)的框架之下,如何選擇合適的參數(shù),使得模型在訓(xùn)練、推理成本與v3相當(dāng)?shù)那疤嵯?,獲得明顯更低的loss?!熬C合以上四個(gè)相比v3的改動(dòng),我們能夠得到一個(gè)在相同EP數(shù)量下,雖然總參數(shù)增大到1.5倍,但除去通信部分,理論的prefill和decode耗時(shí)都更小的推理方案”。
月之暗面研究員、知乎答主Flood Sung則表示,Kimi K2最值得關(guān)注的信息,除了MuonClip帶來(lái)的漂亮得起飛的loss曲線,還有就是Agent能力。他透露,為了實(shí)現(xiàn)更好的通用Agent能力,構(gòu)建了一個(gè)大規(guī)模的agent合成數(shù)據(jù)pipeline:簡(jiǎn)單的說(shuō)是一個(gè)完全自動(dòng)化的agent數(shù)據(jù)生產(chǎn)工廠,通過(guò)全流程的模擬來(lái)過(guò)濾出好的Agent軌跡數(shù)據(jù)。Flood Sung稱,“這個(gè)生產(chǎn)線非常符合老子的思想:‘一生二,二生三,三生萬(wàn)物’?!?/p>
另一位月之暗面研發(fā)人員、知乎答主Justin Wong談到Kimi K2為何會(huì)選擇開源時(shí)稱,開源意味著能夠借助社區(qū)力量完善技術(shù)生態(tài),“在我們開源不到24小時(shí)就看到有社區(qū)做出K2的MLX實(shí)現(xiàn)、4bit量化等等,這些憑我們這點(diǎn)人力真的做不出來(lái)”。月之暗面研究員、知乎答主Dylan則表示,K2實(shí)際上就是一個(gè)剛出生的baby,雖然略顯“靈性”,但和很多已久的frontier model相比,還是有很多、很明顯的缺點(diǎn),“作為post-train(后訓(xùn)練)相關(guān)的同學(xué),還是略感慚愧,希望后面的版本迭代里面能夠持續(xù)釋放K2 base model的潛力”。
開發(fā)者在AI成果發(fā)布的同時(shí),越來(lái)越多選擇來(lái)知乎發(fā)布背后的詳盡思考。6月,月之暗面也曾發(fā)布一款A(yù)gent產(chǎn)品,Kimi-researcher兩位主要研發(fā)人員也在知乎親自答,解讀產(chǎn)品背后的技術(shù)思考和亮點(diǎn)。更早之前,月之暗面開源MoBA框架研發(fā)人員鹿恩哲、蘇劍林分別在知乎上講述了研發(fā)思路,引發(fā)了業(yè)界對(duì)“稀疏注意力”框架的討論。
2025年以來(lái),伴隨AI技術(shù)新浪潮的蔓延,知乎引領(lǐng)了一系列全網(wǎng)重要的AI趨勢(shì)發(fā)布。3月,DeepSeek在知乎開設(shè)官方賬號(hào),并獨(dú) 家發(fā)布《DeepSeek-V3/R1 推理系統(tǒng)概覽》技術(shù)文章;智元機(jī)器人聯(lián)合創(chuàng)始人彭志輝在知乎以視頻形式發(fā)布了人形機(jī)器人靈犀X2;10年“老答主”王興興在知乎與網(wǎng)友大量互動(dòng),分享宇樹機(jī)器人最新研發(fā)動(dòng)態(tài)……
在頂流創(chuàng)業(yè)者們的一次次分享中,知乎見證了中國(guó)創(chuàng)新科技勢(shì)力的一次次突破,也凸顯了知乎作為AI領(lǐng)域核心交流陣地的獨(dú)特價(jià)值——以其濃厚的技術(shù)討論氛圍,搭建起開發(fā)者與行業(yè)、創(chuàng)新成果與大眾認(rèn)知之間的橋梁,讓前沿技術(shù)不再是晦澀難懂的孤島,持續(xù)推動(dòng)著AI行業(yè)在“思維鏈開源”交流下向前發(fā)展躍遷。
聲明:本網(wǎng)轉(zhuǎn)發(fā)此文章,旨在為讀者提供更多信息資訊,所涉內(nèi)容不構(gòu)成投資、消費(fèi)建議。文章事實(shí)如有疑問(wèn),請(qǐng)與有關(guān)方核實(shí),文章觀點(diǎn)非本網(wǎng)觀點(diǎn),僅供讀者參考。
相關(guān)新聞
- 法國(guó)推AI普及計(jì)劃賦能企業(yè),我國(guó)人工智能企業(yè)數(shù)量
- 衛(wèi)生巾新國(guó)標(biāo)出臺(tái),全國(guó)現(xiàn)存衛(wèi)生巾相關(guān)企業(yè)超860
- 小狗撿瓶子一個(gè)月賣860元,寵物近來(lái)受熱捧相關(guān)企
- 2025年二季度全國(guó)規(guī)模以上工業(yè)產(chǎn)能利用率為74
- 和訊投顧盧叢:科技大類上漲即將展開,寧可有先手也
- 科普|腰突“微創(chuàng)修理工”UBE技術(shù)
- “享界樣就界樣”的豪華愿景照進(jìn)每一個(gè)用戶的生活場(chǎng)
- 你沒讀懂比亞迪巴西工廠首車下線的意義丨一句話點(diǎn)評(píng)
- 悅意雙子星熱銷16000輛,一汽奔騰全面轉(zhuǎn)型新能
- 湖北咸安:“倍增行動(dòng)”戰(zhàn)鼓擂


- 箭牌 × 厚塘莊園|以徽韻為筆,繪就高端商用空
- 山東打出“組合拳”推動(dòng)外貿(mào)企業(yè)“精準(zhǔn)出?!?/a>
- 萬(wàn)益藍(lán)WonderLab官宣“萬(wàn)益藍(lán)有益推薦官
- 海關(guān)總署:上半年出口規(guī)模歷史同期首次突破13萬(wàn)
- “打飛的”出行,離我們還有多遠(yuǎn)
- 智能電冰箱新國(guó)標(biāo)發(fā)布,全國(guó)現(xiàn)存冰箱相關(guān)企業(yè)超1
- 暑期文旅“熱浪”來(lái)襲,旅游相關(guān)企業(yè)一年新增16
- “雪糕刺客”正退潮,全國(guó)雪糕相關(guān)企業(yè)超4.3萬(wàn)
- 寧波富邦預(yù)計(jì)2025年半年度凈利800萬(wàn)至12
- Penfolds奔富2021年份GrangeL

- 研究人員開發(fā)出人工智能雷達(dá)技術(shù)可用于高分辨率3
- 資深專業(yè)機(jī)構(gòu)投資者認(rèn)定標(biāo)準(zhǔn)細(xì)化持續(xù)持有發(fā)行人3
- 和訊投顧劉粵峰:大資金操作的核心邏輯——強(qiáng)度優(yōu)
- 上海之夏·精彩普陀〡以酒會(huì)友、乘風(fēng)入夏,鴻壽坊
- 結(jié)婚登記處“搬”到景區(qū),如何打造獨(dú)特體驗(yàn)?
- 翠微股份預(yù)計(jì)2025年半年度凈虧損不超過(guò)2.2
- 嵐圖FREE+上市,售價(jià)21.99萬(wàn)起
- 某團(tuán)住手吧,我真的不想長(zhǎng)胖了
- 石英股份預(yù)計(jì)2025年上半年凈利同比降54.4
- 游戲大佬轉(zhuǎn)行智駕攻礦區(qū),易控智駕豪取超18%市