머숨 미러

https://x.com/cognition_labs/status/1767548763134964000?s=20

Today we're excited to introduce Devin, the first AI software engineer.

Devin is the new state-of-the-art on the SWE-Bench coding benchmark, has successfully passed practical engineering interviews from leading AI companies, and has even completed real jobs on Upwork.

Devin is… pic.twitter.com/ladBicxEat
— Cognition (@cognition) March 12, 2024

29f3c028e2f206a26d81f6e74e86736b38

오늘은 최초의 AI 소프트웨어 엔지니어인 Devin을 소개하게 되어 기쁘게 생각합니다.

Devin은 SWE-Bench 코딩 벤치마크의 새로운 최첨단 기술이며 선도적인 AI 회사의 실무 엔지니어링 인터뷰를 성공적으로 통과했으며 Upwork에서 실제 작업도 완료했습니다.

Devin은 자체 셸, 코드 편집기 및 웹 브라우저를 사용하여 엔지니어링 작업을 해결하는 자율 에이전트입니다.

AI에게 실제 오픈 소스 프로젝트에서 발견된 GitHub 문제를 해결하도록 요청하는 SWE-Bench 벤치마크에서 평가했을 때 Devin은 지원 없이 문제의 13.86%를 올바르게 해결했습니다. 이는 이전의 최첨단 모델 성능을 훨씬 뛰어넘는 수치입니다. 도움을 받지 않은 경우는 1.96%, 도움을 받은 경우는 4.80%입니다.

아래 스레드에서 Devin이 무엇을 할 수 있는지 확인해 보세요.

###

SWE 벤치: 언어 모델이 실제 GitHub 문제를 해결할 수 있습니까?

https://arxiv.org/abs/2310.06770

캬 고생했다

dd(rladmstn78) 2024-03-12 23:55:00

익명(112.186) 2024-03-12 23:56:00

확장이네. - dc App

초존도초(htr3c654r6ft) 2024-03-12 23:57:00

싹!

익명(114.29) 2024-03-12 23:57:00

끝났다

익명(211.199) 2024-03-12 23:58:00

익명(211.212) 2024-03-13 00:00:00

익명(sukusuku7) 2024-03-13 00:00:00

문제의 13%를 해결 ㅋㅋㅋㅋ

익명(222.103) 2024-03-13 00:02:00

답글

나도 이거 보고 터짐 ㅋㅋㅋㅋㅋㅋㅋ

MoonChild(aowlr2001) 2024-03-13 00:03:00

답글

올해 말에 어떨 거 같음??

익명(125.191) 2024-03-13 00:22:00

답글

디시콘발사대(fcbjsjmu1t9f) 2024-03-13 00:48:00

답글

해당 오픈 소스 Github issue 에 등록된 issue 의 13프로를 해결했다는 거 아닐까

기능제어(210.221) 2024-03-13 15:00:00

언제나오냐

갸릉디노(silly8431) 2024-03-13 00:08:00

천사다천사(jjtheman999) 2024-03-13 00:13:00

자가발전 부분이라 아직 미약하긴하지. 자기 코드를 고칠수 있는 수준이 되면 그때부터는...

익명(116.125) 2024-03-13 00:33:00

[📪정보] 최초의 AI 소프트웨어 엔지니어 Devin 소개

댓글 15

[📪정보] 최초의 AI 소프트웨어 엔지니어 Devin 소개

댓글 15

다른 게시글

거기 정병 유동 씨팔새끼 필독

3.5->4보다 4->5차이가 더 큰거 맞음?

클로드 토큰 많이쓰면 끊기는거 나만그럼?

클로드는 확실히 정기결제 끊어도 될만한 성능이다

GPT5 3.5→4차이보다 4 →5차이가 더클텐데

영국 현재 국왕으로 살기 vs 그냥 살기

그런데 2030 안에는 반드시 기술혁명 이끌 AGI 나와야함

특이점이 2045년이라는 근거있음?

비만약의 선례로 봐도 한국은 좀 늦게 기술맛보겠지

그래서 저 열역학 칩 언제 상용화 되는거냐?