一、成果簡介
2024年4月北大李戈團隊推出全新自研7B代碼大模型,代碼生成與補全功能效果超越同級别及更高參數規模開源模型。該模型在多個主流評估标準評測集中,與所有同量級開源模型對比,在代碼生成與補全的功能上效果最佳,彰顯出其作為百億參數天花闆級代碼大模型的非凡實力。
aiXcoder-7B模型自開源後,截止到9月初,在軟件源代碼托管服務平台GitHub上的Star數已超過2.2k,Hugging Face下載量5.8k。
1.代碼生成能力優異
7B模型在各大百億級參數規模代碼大模型上表現最佳,甚至超過參數規模是其5倍的CodeLlama。

2.上下文單行代碼補全效果最佳
在真實場景測評集上,7B Base版(開源)對比同參數量級模型,綜合效果最佳。

測評集:Santacoder(Ben Allal et al., 2023)
3.多行代碼補全表現優異
aiXcoder擴展基準測試集(aiXcoder Bench)上,aiXcoder 7B Base版表現出相較于其他代碼大模型的一大亮點,傾向于使用較短代碼來完成指定的任務。

4.跨文件代碼補全測評效果卓越
在評估代碼大模型提取跨文件上下文信息能力的CrossCodeEval測評集上,aiXcoder-7B拿到同級别模型的最好效果。

二、應用領域和市場前景
目前已為金融、軍工、航空航天、IT、能源、智能制造等行業頭部企業提供了專業軟件工程領域大模型,以及企業領域化大模型落地的定制化服務,覆蓋多元落地場景。
參考工信部前瞻産業研究院發布的數據,2023年,全國軟件和信息技術服務業規模以上企業超 3.8 萬家,累計完成軟件業務收入 12萬億元,同比增長13.4%。2013-2023 年,軟件行業收入占我國 GDP 的比重從 5.14% 上升至 9.78%。
Gartner将AI增強軟件開發列入2024十大戰略技術趨勢,并預測2028年預計有75%的企業軟件工程師将使用AI編碼助手輔助工作。根據我國專業開發者社區CSDN發布的《2024中國開發者調查報告》顯示,AI技術已成為我國軟件開發者工作中不可或缺的一部分,有69%的開發者表示正在使用AI工具。
三、合作方式
合作開發、技術服務及咨詢、技術許可、招商引資、企業合作等。
對接方式
1.合作意向方聯系beat365官方网站産學研合作辦公室;
2.産學研合作辦公室溝通了解意向方情況;
3.會同成果完成團隊與意向方共同研讨合作方案。
beat365官方网站産學研合作辦公室
郵箱:hecheng1213@pku.edu.cn
未經授權,請勿轉載