提升大模型自动修Bug能力豆包正式开源首个多语言类SWE数据集

更新时间：2025-04-13 07:20:10 发布时间：2天前浏览：2173 评论：0

内容摘要快科技4月10日消息，今日，字节跳动豆包大模型团队宣布，正式开源首个多语言类SWE数据集Multi-SWE-bench，可用于评估和提升大模型自动修 Bug”能力。在SWE-bench基础上，Multi-SWE-bench首次覆盖Pytho

快科技4月10日消息，今日，字节跳动豆包大模型团队宣布，正式开源首个多语言类SWE数据集Multi-SWE-bench，可用于评估和提升大模型自动修 Bug”能力。

在SWE-bench基础上，Multi-SWE-bench首次覆盖Python之外的7种主流编程语言（Java、Go、Rust、C、C、Typescript、Javascript），是真正面向全栈工程”的评测基准。

Multi-SWE-bench包含1632个实例，均来自GitHub issue，并经过统一的测试标准和专业开发者的审核筛选，确保每个样本具备清晰的问题描述、正确的修复补丁以及可复现的运行测试环境。

豆包大模型团队希望，Multi-SWE-bench能作为大模型在多种主流编程语言与真实代码环境中的系统性评测基准，推动自动编程能力向更实用、更工程化的方向发展。

团队表示，相比于以往聚焦Python的单语言任务，Multi-SWE-bench更贴近现实中的多语言开发场景，也更能反映当前模型在自动化软件工程”方向上的实际能力边界。

举报收藏打赏 评论 0

版权声明 本文仅代表作者观点，不代表本站立场。
如遇本文系为网络转载到本站发表，图片或文章有版权问题的请联系客服确认后会立即删除文章。
如遇本文系作者授权本站发表，未经许可，不得转载。

--结束END--

有问题投稿请发送至: 邮箱/

本文标题: 提升大模型自动修Bug能力豆包正式开源首个多语言类SWE数据集

本文链接: http://set.ztc188.com/news/show-379303.html (转载时请保留)

去ta空间

24小时热闻

今日推荐

提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集