SW 개발자 시대의 종언···이젠 AI가 ‘처음부터 끝까지’ 코딩

소프트웨어(SW) 산업을 영원히 바꿔버릴 혁신적 기술이 개발됐다.

미국의 인공지능(AI) 스타트업인 코그니션(Cognitiion. www.cognition-labs.com)이 지난 12일(현지시각) ‘데빈’(Devin)이라는 완전 자율형 인공지능(AI) 소프트웨어 엔지니어(AI coder)를 발표했다.

인간 사용자는 데빈의 챗봇 스타일 인터페이스에 자연어 프롬프트를 입력하기만 하면 이 AI SW 엔지니어가 이를 받아 문제 해결을 위한 자세하고도 단계적인 계획을 수립한다. 그런 다음 인간 SW 기술자처럼 개발자 툴을 사용해 프로젝트를 시작하고 자체 코드를 작성하고 문제를 해결하며 실시간으로 진행 상황을 테스트하고 보고한다. 인간 사용자는 이 모든 과정을 주시할 수 있으며 인간 관찰자는 맘에 들지 않는 부분이 있을 경우 채팅 인터페이스를 사용해 이를 고치도록 AI에게 명령을 내릴 수도 있다.

이 AI 모델은 코드(SW) 완성을 위한 도구 역할을 할 뿐만 아니라 SW가 어떻게 개념화되고, 구성되고, 디버그되고, 배치되고, 인간의 SW개발 능력을 어떻게 매끈하게 복제하는지 보여준다.

이 AI SW 엔지니어의 등장은 인간이 여전히 SW프로그래밍을 주도하고 AI가 보조할 것으로 예상되던 AI 시대 SW 개발 방식이 퀀텀 점프하면서 온전히 AI의 손에 맡겨지게 될 것임을 예고하는 것이다.

개발사인 코그니션은 “‘데빈’(Devin)은 지칠 줄 모르고, 숙련된 팀 동료이며, 똑같이 여러분과 함께 만들거나 독자적으로 여러분이 검토할 과제를 완수할 준비가 되어 있다. 데빈과 함께 엔지니어들은 더 흥미로운 문제들에 집중할 수 있고, 엔지니어 팀들은 더 야심찬 목표들을 위해 노력할 수 있다”고 말했다.

인류 최초로 프롬프트만 입력하면 시작에서 끝까지 알아서 원하는 SW를 척척 개발해 주는 ‘데빈’이라는 AI SW엔지니어(AI 코더)와 개발사 코그니션 및 창업자들, 그리고 데빈이 SW 개발자들에게 미칠 영향과 의미 등에 대해 알아봤다. 블룸버그, 벤처비트, 미디엄, 데이터퀘스트를 참고했다.

데빈 등장으로 인간의 SW 개발은 대전환기 맞았다

SWE 벤치마크 테스크 결과. 데빈(맨 왼쪽)이 14%로 챗GPT(4.3%), SWE 라마 13b(3.97%), GPT-4(1.74%)등에 비해 월등히 높다.

두달 전까지만 해도 아직 회사가 아니었던 미국의 새파란 인공지능(AI) 스타트업 코그니션(Cognitiion)이 지난 12일(현지시각) ‘데빈’(Devin)이라고 불리는 완전 자율형 인공지능(AI) 소프트웨어(SW) 엔지니어를 발표했다.

이 회사는 피터 틸 파운더스 펀드 대표(간편 결제 서비스 페이팔 창업자), 그리고 엘라드 길 전 트위터 임원, 토니 쉬 도어대시 공동창업자 등으로부터 잠재력을 인정받아 투자를 유치한 회사다. 그동안 무명 AI회사에 머물러 있었지만 이번 제품 발표로 일약 스타가 됐다.

데빈의 등장은 AI의 도움을 받는 SW개발 분야에서 중대한 변화를 의미한다.

벤처비트는 데빈이 코드 작성 및 그와 관련된 버그 수정부터 최종 실행에 이르기까지 모든 SW 개발 프로젝트를 엔드-투-엔드로 처리할 수 있는 능력을 갖추고 있다는 점에서 AI 코딩분야의 군계일학(群鷄一鶴)으로 꼽히고 있다고 전했다.

그동안에도 저 유명한 깃허브 코파일럿을 포함해 인간 SW엔지니어의 작업을 돕는 여러 코딩 비서(AI SW 엔지니어)가 등장했지만 이들은 단순한 베어본 코드 작성이나 스니펫(재사용 가능한 소스 코드, 기계어, 텍스트의 작은 부분) 제안을 하는 코파일럿에 불과했다.

블룸버그는 “데빈을 사용해 본 결과 코딩 제안만 제공하고 일부 작업을 자동으로 완료하는 대신 SW 프로젝트 전체를 스스로 수행하고 완료할 수 있었다”고 보도했다.

예를 들면 인간이 데빈에게 “시드니의 모든 이탈리아 레스토랑을 지도에 표시하는 웹사이트를 만드세요”라고 말하면, 이 AI SW개발자는 시드니 시내의 이탈리아 레스토랑을 찾기 위한 검색을 수행하고, 그들의 주소와 연락처를 얻은 다음, 그 정보를 표시하는 사이트를 구축하고 게시한다. 데빈이 작동할 때 이 AI는 수행 중인 모든 작업을 (인간에게)보여주고 작성 중인 코드를 테스트하면서 버그를 스스로 찾아 수정한다.

데빈의 등장으로 인간 SW개발자들은 비로소 자신들의 프로젝트를 위한 완전한 AI 기술자를 제공받게 된 것이다. 사실 이 AI SW 엔지니어는 이러한 종류로는 첫 번째 제품이다.

다만 아직까지 데빈은 비공개로 남아 있으며, 코그니션은 블룸버그 기자인 애슐리 밴스를 포함해, 소수의 고객에게만 데빈에 액세스 할 수 있도록 허용하고 사용해 볼 수 있도록 했다.

애슐리 밴스 기자는 “내가 이 SW로 테스트해 본 결과, 데빈은 5~10분 만에 처음부터 웹사이트를 만들 수 있었고, 거의 같은 시간에 웹 기반의 퐁 버전을 다시 만드는 데 성공했다”고 썼다.

정확히 데빈이 할 수 있는 일이 뭐지?

데빈은 자체 AI모델로 스스로 훈련하고 미세조정하며, 전체 SW 개발 과정을 자율적으로 처리하는 능력에서 다른 AI 모델과 차별화된다. 이 AI코더는 오픈AI의 챗GPT와 구글의 제미나이에서 볼 수 있는 기존의 대규모 언어 모델(LLM)에 비해 일부 확장된 기능을 도입했다. (사진=코그니션 AI)

데빈은 오픈AI의 챗GPT와 구글의 제미나이에서 볼 수 있는 기존의 대규모 언어 모델(LLM)에 비해 일부 확장된 기능을 도입했다.

데빈이 갖춘 ‘전체 SW 개발 과정을 자율적으로 처리하는 능력’은 다른 AI 모델과 차별화된다. 이 AI모델은 독립적으로 작동하도록 돕는 자체 명령줄, 코드 편집기 및 브라우저를 갖추고 있다. 이러한 확장 기능은 데빈이 완전히 기능하는 SW 응용 프로그램을 제공하기 위해 작업을 단계적으로 분해하는 것을 돕는다.

데빈의 주요 기능 중 일부는 ▲전향적 사고(Forward-thinking) ▲복잡한 문제 해결(Complex problem solving) ▲자율적 의사결정 능력(Capability of making autonomous decisions) ▲경험을 통한 학습(Learning from experience) ▲오류 수정(Rectifying its errors)이다.

미디엄에 따르면 코그니션은 데빈에 대해 ▲자체 AI 모델을 훈련하고 미세 조정하고 ▲저작물 저장소 성숙에 기여하며 ▲낯선 기술을 사용하는 방법을 학습하며 ▲AI 선도기업들의 실무 엔지니어링 면접을 성공적으로 통과했고, 업워크에서 실제 직무까지 마친 상태라고 설명했다.

세계적 코딩대회 수상 실적에 빛나는 스포츠 프로그래머인 스콧 우 코그니션 창업자이자 최고경영자(CEO)는 이날 자사 웹사이트에 올린 블로그 게시물에서 “데빈이 샌드박스 컴퓨팅 환경 내에서 자체 셸, 코드 편집기 및 브라우저를 포함한 일반적인 개발자 도구에 액세스해 수천 개의 결정이 필요한 복잡한 엔지니어링 작업을 계획하고 실행할 수 있다”고 설명했다.

인간 사용자는 데빈의 챗봇 스타일 인터페이스에 자연어 프롬프트를 입력하기만 하면 AI SW 엔지니어(AI coder)가 이를 받아 문제를 해결하기 위한 세부적이고 단계적인 계획을 개발한다. 그런 다음 AI는 인간이 사용하는 방식과 마찬가지로 개발자 도구를 사용해 프로젝트를 시작하고 자체 코드를 작성하고 문제를 해결해가며 실시간으로 진행 상황을 테스트하고 보고해 사용자가 작업하는 동안 모든 것을 주시할 수 있도록 한다. 만약 어떤 것이 인간 관찰자에게 맞지 않게 보인다면 사용자는 채팅 인터페이스에 뛰어들어 그것을 고치도록 AI에게 명령을 내릴 수도 있다.

코그니션은 이것이 엔지니어링 팀들에게 그들의 프로젝트 중 일부를 AI에게 위임하고 인간의 지능을 요구하는 더 창조적인 작업에 집중할 수 있게 한다고 말한다.

이러한 방식으로 데빈은 가까운 미래에 인간 감독자/사용자에 의해 감독받는 AI 작업자에 의해 이뤄지는 모든 SW 개발 및 일반적인 컴퓨터 작업 방식을 엿보게 해주는 새로운 패러다임을 제공한다.

코그니션 AI가 데빈으로 할 수 있다는 큰 주장들 중 하나는 자사가 컴퓨터의 추론 능력에 있어서 돌파구에 이르렀다는 것이다. 인공지능 말(AI-speak)로 추론하는 것은 시스템이 한 문장의 다음 단어나 코드 한 줄의 다음 스니핏을 예측하는 것을 넘어, 문제들에 대한 생각하고 합리화하는 것에 더 유사한 것을 지향한다는 것이다.

광범위한 개발 작업 처리 가능

코그니션 AI의 데빈은 최초의 AI프로그래머(AI coder)다. (사진=코그니션 AI)

우 CEO가 공유한 시연에 따르면 데빈은 현재 만들어진 형태로 다양한 작업을 처리할 수 있다.

여기에는 앱/웹사이트를 엔드-투-엔드로 배포 및 개선하고 코드 베이스의 버그를 찾아 수정하는 것과 같은 일반적인 엔지니어링 프로젝트에서부터 깃허브의 연구 저장소에 링크를 사용해 대규모 언어 모델(LLM)에 대한 미세 조정을 설정하거나 낯선 기술을 사용하는 방법을 배우는 것과 같은 더 복잡한 작업이 포함된다.

한 사례에서 데빈은 숨겨진 메시지가 포함된 이미지를 생성하기 위해 코드를 실행하는 방법을 블로그 게시물을 통해 배웠다. 한편 다른 경우에 데빈은 코드를 작성하고 디버깅함으로써 컴퓨터 비전 모델을 실행하는 업워크(Upwork) 프로젝트를 처리했다.

코그니션의 AI SW 엔지니어인 데빈은 실제 오픈 소스 프로젝트의 깃허브 문제로 AI 어시스턴트에 도전하는 SWE-벤치 마크 테스트에서 이전 제품들을 큰 차이로 앞질렀다.

데빈은 인간의 어떤 도움없이도 엔드-투-엔드 코딩 사례에서 13.86%의 비율로 문제를 올바르게 해결할 수 있었다. 이에 비해 클로드 2는 4.80%, SWE-라마-13b는 3.97%, GPT-4는 1.74%의 문제를 각각 처리하는 수준에 그쳤다. 데빈은 제외한 이 모든 모델들은 심지어 어떤 파일을 고쳐야 하는지에 대해 알려줘야 할 정도의 도움을 필요로 했다.

코그니션 AI 창업자들

코그니션 AI는 뉴욕에 본사를 둔 스타트업으로서 스콧 우 CEO(사진)을 비롯, 스티븐 하오 최고기술책임자(CTO), 월든 얀 최고 제품책임자(CPO) 3명이 창업한 회사다. (사진=코그니션 AI)

코그니션 AI의 창업자는 스콧 우 CEO, 스티븐 하오 최고기술책임자(CTO), 월든 얀 최고 제품책임자(CPO) 3명이다.

하오는 AI 시스템을 훈련시키는 것을 돕는 매우 가치 있는 스타트업인 스케일AI(Scale AI)에서 최근까지 최고 엔지니어들 중 한 명으로 일했다. 얀은 하버드대에 재학중이다.

27세의 스콧 우는 이 회사에서 함께 일하는 닐 우와 형제다. 두 사람은 자신들의 코딩 실력으로 세계적으로 유명하다. 우 형제는 그들이 십대였을 때부터 국제 (스포츠)코딩대회에서 경쟁해 왔고 종종 우승했으며, 최근 몇 년 동안 중국과 동유럽의 경쟁자들을 상대로 미국 국가 코딩 팀을 더 존경할 만한 위치로 올려놓는 데 도움을 주었다.

스포츠 코딩은 사람들이 퍼즐을 풀고 속도와 정확성을 가지고 프로그램을 할 것을 요구한다. 그 과정에서 참가자들이 새로운 방식으로 문제에 접근하도록 훈련시킨다. 코그니션 AI는 인스포츠 코더로 가득 차 있다. 총 10명인 이 회사 직원들은 최고의 국제 대회에서 총 10개의 금메달을 획득했고, 스콧 우는 이러한 배경이 자사를 AI 전쟁에서 우위를 점하도록 한다고 말한다.

스콧 우는 “AI를 프로그래머가 되도로 가르치는 것은 매우 깊은 알고리즘 문제다. 이는 사실 복잡한 결정을 내리고 그것이 어떤 경로를 선택해야 하는지 결정하기 위해 미래를 몇 단계 보는 것을 요구하기 때문이다. 그것은 우리 모두가 수년 동안 우리 마음 속에서 해오고 있는 이 게임과 거의 비슷하고, 지금이 그것을 AI시스템으로 코딩할 수 있는 기회다”라고 말했다.

데빈의 핵심 기술 정체는?

SW를 개발하는 AI는 새로운 업적이 아니다.

이 분야에서는 꽤 오랫동안 SW개발 툴들이 사용돼 내려오고 있었는데 여기에는 대중적인 인기를 얻고 있는 깃허브 코파일럿과 스타코더(StarCoder)에서부터 허깅 페이스에 몇 개의 작은 AI 코딩 모델을 가지고 있는 리플릿(Replit), 그리고 최근 5억 달러의 가치로 시리즈 B 투자행사에서 6500만 달러의 투자금을 확보한 코데리움(Codeium) 등이 있다.

그러나 이러한 제품들의 대부분은 주로 코딩을 돕기 위해 AI를 사용하는 것에 초점을 맞추고 있다. 그들은 텍스트 프롬프트로부터 베어본 코드를 생성하고, 이를 관련 IDE 컨텍스트로 요약하거나 스니펫을 검색해 팀의 작업 흐름을 가속화할 수 있다. 코그니션은 데빈으로 여기서 한 단계(또는 여러 단계) 더 나아가 완전한 AI작업자(AI coder)로서 전체 프로젝트를 처리하도록 한다.

이 도구에 대한 시험이 남아 있지만, SW 엔지니어링 프로젝트를 완성하기 위해 설정 목표를 유지하면서 여러 단계를 처리하는 데빈의 능력은 가장 큰 독특한 판매 포인트다.

코그니션은 정확히 어떻게 이 위업을 달성했는지, 아니면 독자적인 모델을 사용하고 있는지, 아니면 제3자의 모델을 사용하고 있는지를 공유하지 않았지만, 이 작업이 ‘장기적인 추론과 계획의 발전’의 결과라고 밝혔다.

스콧 우 CEO는 자신의 팀이 “오픈AI의 GPT-4와 같은 LLM과 강화 학습 기술을 결합하는 독특한 방법을 발견했다는 것 이외에는 어떻게 그리 짧은 시간에 그런 혁신을 이끌어냈는지와 그 기술의 기반이 무엇인지 등 많은 궁금증에 대해 말하기를 거부했다.

다만 그는 “그것은 분명히 이 분야의 사람들이 오랫동안 생각해 온 것이다. 그것은 모델과 접근 방식과 사물을 올바르게 정렬하는 것에 크게 의존한다”고 밝혔다.

현재 코그니션은 용량을 늘리고 일부 사용자에게만 데빈에 대한 조기 액세스를 제공하는 과정에 있다. 이 회사는 엔지니어링 작업을 강화하고자 하는 관심을 가진 당사자들은 이메일로 연락해 액세스할 수 있다고 말했다. 데빈에 대한 더 넓은 액세스는 추후 열릴 것으로 예상된다.

코그니션은 또한 회사 웹사이트에서 코딩이 “이제 시작일 뿐”이라고 언급했는데 이는 다른 분야에서도 유사한 AI 에이전트/종사자를 출시하기 위해 데빈의 추론적 진전을 활용할 수 있음을 나타내는 것으로 보인다. 이 회사는 지금까지 2100만 달러의 투자금을 받았다.

코그니션은 또한 회사 웹사이트에서 코딩이 “이제 시작일 뿐”이라고 언급했는데 이는 다른 분야에서도 유사한 AI 에이전트/종사자를 출시하기 위해 데빈의 추론적 진전을 활용할 수 있음을 나타내는 것으로 보인다. 이 회사는 지금까지 2100만 달러의 투자금을 유치했다.

데빈은 인간 SW기술자들을 대체할 것인가?

데빈은 자율적으로 업무를 완수하는 탁월한 능력을 갖추고 있지만 인간 공학자를 대체하도록 설계된 것은 아니다. 실시간으로 협업하고 피드백을 수용하며 설계 토론에 참여하고 팀 생산성과 효율성을 높임으로써 그들의 전문성을 보완하는 방식으로 설계됐다.

데빈을 업워크와 같은 플랫폼에 통합한 것은 AI가 인간의 능력을 원활하게 보완하는 SW 개발 분야에서 새로운 시작을 알리는 것이다.

데이터퀘스트는 데빈의 도입이 인간과 AI의 협업을 촉진하면서 SW 개발 분야에서 중요한 이정표를 세웠다고 평가했다. 데빈이 앞선 역량과 협업 접근 방식, 주목할 만한 성과 지표로 AI 주도의 엔지니어링에 새로운 기준을 세우고 있다는 것이다.

AI 코더 개발 이어진다

AI SW개발자를 만드는 회사는 코그니션뿐이 아니다.

지난 달 스타트업 매직 AI(Magic AI는 대니얼 그로스와 냇 프리드먼, 그리고 다른 사람들로 이루어진 벤처 투자가 팀으로부터 그로스가 ‘초인적 SW 엔지니어’라고 묘사하는 것을 것을 만들기 위해 1억 달러 이상을 투자받았다.

매직 AI는 오픈AI, 앤트로픽 등의 LLM 위에 구축하고 있는 일부 회사와 달리 독립성 보장차원에서 자체 모델 및 기타 기반 기술을 처음부터 개발하고 있다.

이 스타트업은 인공지능 시스템을 공개적으로 보여주지 않아 코그니션AI의 제품과 비교하기 어렵고, 코그니션 AI는 다른 회사의 기존 LLM에 어느 정도 의존하는지 또는 의존하지 않는지 말하기를 거부하고 있다. 따라서 코그니션AI와 매직AI 두회사가 수행하는 작업이 어떻게 대비되는지 구분하기 어려운 상황이다.

이재구 기자

jklee@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

IT근로자 가장한 북한해커 ‘외국기업 암호화폐’ 어떻게 훔쳤나?

북한해커들이 북한 정권을 위해 암호화폐를 훔쳐 나르고 있다. 북한 IT 근로자들은 가짜 신원을 만들어 전세계 수백개의 조직에 이미 침투한 것으로 나타났다. 이들은 채용 담당자와 벤처 캐피털리스트로 위장했으며, 이 과정에서 가상회의를 진행해 회의가 부적절하게 로드되도록 설계했다. 또한 미국에 있는 중개업체를 통해 회사에서 발급한 워크스테이션을 이용하고 수입을 처리하면서 북한에 적용되는 재정 제재를 피해갔다.

젠슨황 “엔비디아 가치 지속 상승”···3가지 이유

최소 2027년까지 엔비디아 성장세 전망과 예상 수치까지 나오고 있는 가운데 디코더가 정리한 젠슨황 CEO의 어닝콜 발언에 주목해 본다. S&P 마켓 인텔리전스가 전망한 오는 2027년까지의 엔비디아 매출, 영억이익, 순익 전망치, EPS 그래프도 함께 소개한다.

[DMI 2025] 박민성 데이터라이즈 CSO, 매출 성장을 위한 5가지 CRM 전략은?

대표 CRM채널 카카오 톡채널은 현재도 지속 성장 중, 효율을 중시하는 디지털 마케팅 전략 필요 고객과 직접 접촉할 수 있는 온사이트...

베스핀글로벌, ‘2025년 성공하는 스타트업의 업무 효율 극대화 전략’ 웨비나 개최

AI 매니지드 서비스 전문 기업 베스핀글로벌은 구글 클라우드, 전자서명 솔루션 기업 모두싸인과 함께 ‘2025년 성공하는 스타트업의 업무 효율 극대화 전략’...