(사진=셔터스톡)
(사진=셔터스톡)

인공지능(AI)이 인간의 일자리를 변화시킬 것이라는 말은 이제 기정사실로 받아들여지고 있습니다. 이 때문에 주기적으로 AI가 대체할 직종에 대한 보고가 등장하고 있으며, 반대로 AI가 할 수 없는 일에 대한 이야기도 나오고 있습니다.

이 가운데 주목할 만한 보고서가 등장했습니다. 미국 최대의 구인 구직 업체인 업워크의 연구 논문입니다. 결론부터 말하자면, 앞으로 일자리의 중심은 AI가 아니라 여전히 인간이라는 내용입니다. 이를 '인간 중심의 AI(Human-Centric AI)'라고 표현했습니다.

최첨단 모델을 활용한다고 해도, 아직 에이전트의 성능은 그리 뛰어나지 않습니다. 이번 연구도 오픈AI의 'GPT-5'와 구글의 '제미나이 2.5 프로', 앤트로픽의 '클로드 소네트 4' 등을 대상으로 실시했습니다.

업워크에 올라온 실제 작업 322개를 8개 주요 카테고리로 분류해 ▲AI 단독 실행(AI-only) ▲인간의 개입(Human-in-the-loop) 두가지 경우에서 어떤 결과를 냈는지를 비교한 것입니다

8개 분야는 ▲웹/모바일/소프트웨어 개발 ▲디자인 & 크리에이티브 ▲글쓰기/번역 ▲마케팅 ▲데이터 분석 ▲관리·고객지원 ▲금융·비즈니스 등입니다.

이 가운데 AI 단독 실행과 인간 개입 두 경우 모두 가장 높은 성공률을 보인 작업은 글쓰기와 데이터 분석이었습니다. 요구 사항이 비교적 구조화돼 있기 때문에, AI가 형식과 내용 기준을 충족시키기 쉽다는 이유입니다.

AI 단독보다 인간 개입이 더 효과적인 중간 난이도의 업무로는 마케팅, 금융·비즈니스, 고객지원 등이 꼽혔습니다. 전략적인 판단과 특정 문맥에 대한 이해가 필요하기 때문입니다.

같은 이유로 AI에게 가장 어려운 업무는 디자인·크리에이티브, 소프트웨어 개발 등이 꼽혔습니다. 특히, 이 분야는 제출물의 형식이 까다롭고 외부 도구를 활용해야 하므로, AI 단독 수행 시 실패율이 매우 높은 것으로 나타났습니다.

그리고 이번 실험의 전체적인 수치를 살펴보면 AI 단독으로 업무를 완료한 경우는 19~40%였습니다. 여기에 인간이 개입하면 33~51%로 수치가 부쩍 올라갔습니다. 즉, 사람이 개입하면 전체 성과가 약 1.4~1.7배로 증가했다는 결론입니다.

예를 들어 데이터 과학 및 분석 프로젝트에서 클로드 소네트 4는 단독으로 작업할 때 64%의 완료율을 달성했지만, 인간 전문가의 피드백을 받은 후에는 93%로 급등했습니다. 영업 및 마케팅 작업에서 제미나이 2.5 프로는 인간의 도움을 받자 17%에서 31%로 증가했습니다. GPT-5도 엔지니어링 및 아키텍처 작업에서 30%에서 50%로 크게 향상했습니다.

특히, 인간 개입이 가장 효과적인 분야는 마케팅, 금융·비즈니스였습니다. 사람이 중간에 AI 결과를 점검하며 방향성과 사실관계를 바로잡아 줬다는 것입니다.

인간 개입이 비교적 덜 효과적인 분야로는 디자인, 소프트웨어 개발 등이 꼽혔습니다. 어차피 에이전트가 도구를 다루지 못하기 때문에, 차라리 인간이 혼자 업무를 처리하는 것이 더 효과적이라는 분석입니다.

이번 연구 결과가 흥미로운 이유는 단순한 성능 평가를 넘어, 업무별로 AI와 인간 개입, 그리고 인간 단독 중 어떤 것이 효율적인지를 가려냈다는 점입니다. 기존의 단순한 '직업 구분'을 넘어서는 내용입니다.

저복잡도 업무에서 AI 단독 및 인간 개입 개선도 (사진=업워크)
저복잡도 업무에서 AI 단독 및 인간 개입 개선도 (사진=업워크)

특히 업워크는 실제 구인 시 비용을 기준으로 ▲AI 단독 비용 ▲AI-인간 협업 비용 ▲인간 단독 비용 등을 비교했습니다.

그리고 이번 논문의 핵심이기도 한 3가지 경우를 구분했습니다.

우선 AI를 단독으로 쓰는 것이 경제적으로 유리한 경우는 작업 가치가 낮고, 요구 사항이 명확하며, 형식 제한이 적은 단순 작업이라는 결론입니다. 간단한 글 생성이나 요약, 변환 작업 등이 여기에 포함됩니다.

하지만, 대부분 업무에서는 AI와 인간이 협업하는 것이 경제적으로 가장 유리하다는 결론이 나왔습니다.

이는 중간 난이도에 해당하는 작업으로, 전략적 판단과 내용 생성, 형식 요구 등이 섞인 형태입니다. 이런 업무에 AI를 투입하면 인간을 최소한으로 투입해도 높은 품질 달성이 가능해진다는 것입니다.

마지막으로, AI를 배제하고 인간이 혼자 처리해야 하는 업무로는 "고부가가치, 전문성, 정성적 판단, 도구 사용/제작 능력 등이 필요한 작업"이라고 전했습니다. 전문 디자인이나 복잡한 소프트웨어 개발, 고급 분석 및 컨설팅 등을 예로 들었습니다.

이번 연구는 미국 시장의 데이터를 기반으로 했지만, 국내나 다른 국가에서도 충분히 참고할 내용입니다. AI가 인간을 대체하기 전에 업무 성격에 '형식 충족'이나 '자료 정확성', '도구 사용' 등의 비중이 어느 정도인지 따져보는 것이 효과적이기 때문입니다.

실제로 기업에서 AI 어시스턴트 도입을 검토할 때, 어떤 업무부터 AI 단독→인간 개입→인간 단독으로 배분할지 참고할 수 있습니다.

더 중요한 것은 'AI를 도입했으니, 사람은 물러나라'는 식의 도구 중심이 아니라, 기업이 가장 효과적으로 비용을 줄이며 업무 효율을 유지할 기준으로 인간을 중심에 내세웠다는 점입니다.

앞으로 AI 성능이 비약적으로 발전하면, 이런 기준도 바뀔 수는 있을 것입니다. 하지만, 인공일반지능(AGI)을 달성한다고 AI가 모든 업에서 인간보다 '저비용 고효율'을 달성할 수 있을지는 의문입니다.

이처럼 이번 연구는 비용 절감이라는 가장 현실적인 잣대에 맞춰 AI의 역할을 제시한 거의 첫번째 분석으로 여겨집니다.

앤드류 라비노비치 업워크 최고 기술책임자(CTO)는 벤처비트와의 인터뷰에서 "AI 에이전트는 그렇게 에이전트적인 역할을 하지 못하기 때문에 그다지 뛰어나지 않다"라고 말했습니다.

"하지만 전문가 수준의 인간과 일하면 프로젝트 완료율이 극적으로 향상된다. 이는 미래의 업무 방식이 인간과 AI가 협력해 더 많은 업무를 처리하는 방식으로 정의될 것이며, 인간의 직관과 해당 분야의 전문 지식이 중요한 역할을 할 것이라는 우리의 확고한 믿음을 뒷받침한다"라고 강조했습니다.

이어 13일 주요 뉴스입니다.

오픈AI, 'GPT-5.1' 출시..."대화 기능 향상에 초점"

오픈AI가 대화 기능을 향상한 GPT-5.1을 내놓았습니다. 사실 GPT-5는 기업용 서비스 강화에 초점이 맞춰져 있었고, 오픈AI도 AI 정신병 등의 문제로 시행착오를 거쳤습니다. 이번 업그레이드는 8억명에 달하는 소비자들을 위한 것으로 보입니다.

(사진=월드랩스)
(사진=월드랩스)

페이페이 리의 월드랩스, 세계 최초 상용 ‘월드 모델’ 출시

월드랩스가 최초로 상용화된 월드 모델을 내놓았습니다. 이제부터 주목되는 점은 과연 월드 모델이 어떻게 활용될지, 그리고 기존 언어 모델과 어떻게 결합할지입니다. 특히, 후자는 AGI에 도달할 방법으로 꼽힙니다.

앤트로픽, 오픈AI 맞서 70조 투자로 자체 데이터센터 건설

오픈AI가 잇달아 대규모 데이터센터 발표를 내놓자, 앤트로픽이 자체 데이터센터 건설 계획을 밝히며 반격에 나섰습니다. 물론 25GW나 되는 오픈AI와 비교할 규모는 아니지만, 아마존이나 구글 등의 파트너십을 포함하면 10GW에는 도달할 것으로 보입니다.

AI타임스 news@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지