【史上初の自律型エンジニアAI “Devin”】Cognitionが開発したDevinとは?
公開日:

2024.3.13

更新日:

2024.3.13

この記事をシェア:

2ヶ月前に誕生したスタートアップ、Cognitionが史上初の自律型エンジニアAIを開発しました。

そのAIの名前は、「Devin」です。(読み方はデヴィン!)

Devinは完全自律型のエンジニアAIとして、人間がレビューをする最後の段階までプロジェクトを仕上げてくれます。現在はデモ版のみの申し込みを募集しています。

Devinの凄いところは、AI企業のエンジニア面接を実際にクリアしていることです。また、Upworkというフリーランスマッチングサービスを提供するIT企業で実際に仕事をこなしてもいます。

DevinはAIですが、人間のように実社会で働きだしているのです。

また、DevinはSWE-Benchベンチマークと呼ばれる現実世界のコード問題を集めた指標においても、GPT-4やClaude 2を差し置いて最高得点を叩き出しています。

下の画像がDevinのパフォーマンスを他のAIモデルと比較したものです。ダントツでトップの性能を誇っていることがわかります。


https://aisodan.com/news/87

Cognition
@cognition_labs
Today we're excited to introduce Devin, the first AI software engineer.

Devin is the new state-of-the-art on the SWE-Bench coding benchmark, has successfully passed practical engineering interviews from leading AI companies, and has even completed real jobs on Upwork.

Devin is an autonomous agent that solves engineering tasks through the use of its own shell, code editor, and web browser.

When evaluated on the SWE-Bench benchmark, which asks an AI to resolve GitHub issues found in real-world open-source projects, Devin correctly resolves 13.86% of the issues unassisted, far exceeding the previous state-of-the-art model performance of 1.96% unassisted and 4.80% assisted.

午後10:50 · 2024年3月12日