国产熟女一区二区三区四区,久久久久久久久国产精品无码色欲 ,亚洲人网站,精品自拍18,色偷偷男人天堂av

萬(wàn)億參數(shù)KimiK2開源,月之暗面研發(fā)工程師知乎親述幕后故事

時(shí)間:2025-07-15 14:22:30 來(lái)源:投資界 閱讀量:12359

月之暗面發(fā)布萬(wàn)億參數(shù)開源模型 Kimi K2,多位研發(fā)工程師在知乎“親自答”

“參與過(guò)Kimi K2的接生,自己的孩子怎么看都順眼”。7月11日晚,國(guó)內(nèi)大模型獨(dú)角獸月之暗面正式發(fā)布并開源了其最新一代MoE架構(gòu)基礎(chǔ)模型Kimi K2,總參數(shù)量達(dá)到1萬(wàn)億,這一消息迅速引發(fā)了AI領(lǐng)域的廣泛關(guān)注,Kimi內(nèi)部則將K2研發(fā)群戲稱為“接生群”。多位參與“接生”的Kimi研發(fā)人員隨后在知乎展開“親自答”,從多個(gè)角度深入講述了其背后研發(fā)歷程。

作為月之暗面 Infra側(cè)推理方面研發(fā)人員,知乎答主劉少偉談及了K2模型結(jié)構(gòu)的設(shè)計(jì)宗旨。他稱K2模型是在DeepSeek V3結(jié)構(gòu)的框架之下,如何選擇合適的參數(shù),使得模型在訓(xùn)練、推理成本與v3相當(dāng)?shù)那疤嵯?,獲得明顯更低的loss?!熬C合以上四個(gè)相比v3的改動(dòng),我們能夠得到一個(gè)在相同EP數(shù)量下,雖然總參數(shù)增大到1.5倍,但除去通信部分,理論的prefill和decode耗時(shí)都更小的推理方案”。

月之暗面研究員、知乎答主Flood Sung則表示,Kimi K2最值得關(guān)注的信息,除了MuonClip帶來(lái)的漂亮得起飛的loss曲線,還有就是Agent能力。他透露,為了實(shí)現(xiàn)更好的通用Agent能力,構(gòu)建了一個(gè)大規(guī)模的agent合成數(shù)據(jù)pipeline:簡(jiǎn)單的說(shuō)是一個(gè)完全自動(dòng)化的agent數(shù)據(jù)生產(chǎn)工廠,通過(guò)全流程的模擬來(lái)過(guò)濾出好的Agent軌跡數(shù)據(jù)。Flood Sung稱,“這個(gè)生產(chǎn)線非常符合老子的思想:‘一生二,二生三,三生萬(wàn)物’?!?/p>

另一位月之暗面研發(fā)人員、知乎答主Justin Wong談到Kimi K2為何會(huì)選擇開源時(shí)稱,開源意味著能夠借助社區(qū)力量完善技術(shù)生態(tài),“在我們開源不到24小時(shí)就看到有社區(qū)做出K2的MLX實(shí)現(xiàn)、4bit量化等等,這些憑我們這點(diǎn)人力真的做不出來(lái)”。月之暗面研究員、知乎答主Dylan則表示,K2實(shí)際上就是一個(gè)剛出生的baby,雖然略顯“靈性”,但和很多已久的frontier model相比,還是有很多、很明顯的缺點(diǎn),“作為post-train(后訓(xùn)練)相關(guān)的同學(xué),還是略感慚愧,希望后面的版本迭代里面能夠持續(xù)釋放K2 base model的潛力”。

開發(fā)者在AI成果發(fā)布的同時(shí),越來(lái)越多選擇來(lái)知乎發(fā)布背后的詳盡思考。6月,月之暗面也曾發(fā)布一款A(yù)gent產(chǎn)品,Kimi-researcher兩位主要研發(fā)人員也在知乎親自答,解讀產(chǎn)品背后的技術(shù)思考和亮點(diǎn)。更早之前,月之暗面開源MoBA框架研發(fā)人員鹿恩哲、蘇劍林分別在知乎上講述了研發(fā)思路,引發(fā)了業(yè)界對(duì)“稀疏注意力”框架的討論。

2025年以來(lái),伴隨AI技術(shù)新浪潮的蔓延,知乎引領(lǐng)了一系列全網(wǎng)重要的AI趨勢(shì)發(fā)布。3月,DeepSeek在知乎開設(shè)官方賬號(hào),并獨(dú) 家發(fā)布《DeepSeek-V3/R1 推理系統(tǒng)概覽》技術(shù)文章;智元機(jī)器人聯(lián)合創(chuàng)始人彭志輝在知乎以視頻形式發(fā)布了人形機(jī)器人靈犀X2;10年“老答主”王興興在知乎與網(wǎng)友大量互動(dòng),分享宇樹機(jī)器人最新研發(fā)動(dòng)態(tài)……

在頂流創(chuàng)業(yè)者們的一次次分享中,知乎見證了中國(guó)創(chuàng)新科技勢(shì)力的一次次突破,也凸顯了知乎作為AI領(lǐng)域核心交流陣地的獨(dú)特價(jià)值——以其濃厚的技術(shù)討論氛圍,搭建起開發(fā)者與行業(yè)、創(chuàng)新成果與大眾認(rèn)知之間的橋梁,讓前沿技術(shù)不再是晦澀難懂的孤島,持續(xù)推動(dòng)著AI行業(yè)在“思維鏈開源”交流下向前發(fā)展躍遷。



聲明:本網(wǎng)轉(zhuǎn)發(fā)此文章,旨在為讀者提供更多信息資訊,所涉內(nèi)容不構(gòu)成投資、消費(fèi)建議。文章事實(shí)如有疑問(wèn),請(qǐng)與有關(guān)方核實(shí),文章觀點(diǎn)非本網(wǎng)觀點(diǎn),僅供讀者參考。
hhx6 精彩圖片