從代碼生成到智能開(kāi)發(fā):北大發(fā)布基于昇騰平臺(tái)軟件開(kāi)發(fā)解決方案
軟件開(kāi)發(fā)流程的智能化,能顯著解放開(kāi)發(fā)者生產(chǎn)力,并驅(qū)動(dòng)軟件工程領(lǐng)域的范式革新。北京大學(xué)計(jì)算機(jī)學(xué)院李戈教授團(tuán)隊(duì)深耕該技術(shù)方向并在鯤鵬昇騰科教創(chuàng)新卓越中心的算力支持下,成功研發(fā)出一套基于昇騰平臺(tái)的智能化軟件開(kāi)發(fā)系統(tǒng),通過(guò)大模型自動(dòng)代碼生成和優(yōu)化技術(shù)實(shí)現(xiàn)了軟件開(kāi)發(fā)效率的顯著提升。該成果完成了開(kāi)源代碼大模型 aiXcoder-7B在昇騰NPU硬件平臺(tái)上的適配,通過(guò)集成 torch_npu擴(kuò)展庫(kù)與 MindIE推理加速套件,實(shí)現(xiàn)了模型的高效運(yùn)行。同時(shí),構(gòu)建了基于 DeepSeek-V3 Agent的智能開(kāi)發(fā)系統(tǒng)。

針對(duì)大模型aiXcoder-7B的適配優(yōu)化,其核心依托于代碼生成技術(shù)所具備的意圖理解與自動(dòng)編碼能力。該技術(shù)通過(guò)深度解析海量代碼與注釋語(yǔ)料,精準(zhǔn)識(shí)別開(kāi)發(fā)者編程意圖,自動(dòng)生成符合工程規(guī)范的高質(zhì)量代碼。昇騰提供的高性能算力為技術(shù)實(shí)現(xiàn)奠定了堅(jiān)實(shí)基礎(chǔ),通過(guò)將模型從通用平臺(tái)向昇騰NPU高效遷移,使代碼生成的訓(xùn)練與推理過(guò)程全面獲得硬件加速;同時(shí)MindIE集成并優(yōu)化了Flash Attention等關(guān)鍵算法,使其能在昇騰上高效運(yùn)行,進(jìn)一步增強(qiáng)了數(shù)據(jù)處理與模型計(jì)算效能。最終,該模型推理速度相比原版實(shí)現(xiàn)大幅提升,首Token延遲時(shí)間降低至原版的四分之一。
而在DeepSeek-V3 Agent智能開(kāi)發(fā)系統(tǒng)中,代碼生成技術(shù)實(shí)現(xiàn)了從“單一編碼”到“復(fù)雜場(chǎng)景協(xié)同”的升級(jí)。該技術(shù)創(chuàng)新性地將代碼生成與工具調(diào)用能力結(jié)合,能應(yīng)對(duì)多步驟開(kāi)發(fā)任務(wù)并形成智能化運(yùn)轉(zhuǎn)。昇騰的 SmoothQuant量化技術(shù)通過(guò)構(gòu)造數(shù)學(xué)等價(jià)變換,使大模型難以量化的激活值得到縮放并被輕松量化,并針對(duì)量化可能出現(xiàn)的性能波動(dòng),團(tuán)隊(duì)借助昇騰特性優(yōu)化算法,有效抑制激活值異常,使能大模型高性能、低精度部署;昇騰 MindIE推理引擎提供類OpenAI高級(jí)封裝接口和底層Token ID接口,使用底層的Token ID接口,可支持系統(tǒng)直接調(diào)用底層開(kāi)發(fā)工具,實(shí)現(xiàn)更靈活定制開(kāi)發(fā),實(shí)現(xiàn)Agent工具調(diào)用能力,最終使系統(tǒng)具備代碼補(bǔ)全、研發(fā)問(wèn)答、缺陷檢測(cè)等一站式開(kāi)發(fā)能力。
此研究成果推動(dòng)軟件開(kāi)發(fā)進(jìn)入“高效、智能、自主化”新階段,對(duì)廣大開(kāi)發(fā)人員具備重要意義。未來(lái),北大團(tuán)隊(duì)將繼續(xù)依托北京大學(xué)鯤鵬昇騰科教創(chuàng)新卓越中心,探索新模型適配與領(lǐng)域化訓(xùn)練方法,讓智能開(kāi)發(fā)工具覆蓋金融、能源等行業(yè),為我國(guó)自主創(chuàng)新技術(shù)體系注入全新動(dòng)力。(北京大學(xué)計(jì)算機(jī)學(xué)院李戈教授團(tuán)隊(duì))







