마이크로소프트(MS)가 인간 의사보다 더 정확하게 질병을 진단할 수 있다는 인공지능(AI) 의료 도구를 공개했다. 타사의 첨단 모델을 한곳에 모아놓고 이를 조율하는 것이 핵심 기술이라고 강조했다.
파이낸셜 타임스는 30일(현지시간) MS가 인간 의사보다 4배 더 높은 정확도로 복잡한 질환을 진단할 수 있는 AI 기반 의료 진단 시스템 ‘MAI-DxO(Microsoft AI Diagnostic Orchestrator)’를 개발했다고 보도했다.
이번 연구는 지난해 MS에 합류한 무스타파 술레이만 CEO가 신설한 AI 헬스케어 전담 조직의 첫 성과다. 이 조직에는 딥마인드 출신 연구진이 다수 포진해 있으며, 기존 기술을 넘어서는 ‘의료 초지능(medicsl superintelligence)’ 개발을 목표로 한다.
술레이만 CEO는 이 시스템에 대해 "인간의 성능보다 조금 더 나은 것이 아니라 극적으로 더 뛰어나다"라며 "더 빠르고, 더 저렴하고, 4배 더 정확하다"라고 말했다.
MAI-DxO는 ‘오케스트레이터(Orchestrator)’라는 기술을 기반으로 작동한다.
오케스트레이터는 역할이 분담된 다섯개의 AI 에이전트로 이뤄진 팀을 조율하는 역할을 한다. 각 에이전트는 가설 설정, 검사 선택, 증상 해석 등 서로 다른 역할을 맡아 토론을 벌이고, 최종 진단을 도출하는 구조다. 이 과정을 MS는 ‘논쟁 사슬(Chain of Debate)’이라 불렀다.
이 시스템은 뉴 잉글랜드 의학저널(NEJM)에 게재된 난해한 의료 사례 304건을 학습 데이터로 활용했으며, MS는 이를 통해 AI의 추론 과정을 단계별로 설명할 수 있게 했다.
특히 MAI-DxO는 오픈AI와 메타, 앤트로픽, 구글, xAI, 딥시크 등 주요 AI 기업들의 첨단 대형언어모델(LLM)을 활용했다.
그중 오픈AI의 ‘o3’가 가장 뛰어난 성과를 보였는데, NEJM 사례의 85.5%를 정확하게 진단한 것으로 나타났다. 이는 숙련된 의사 그룹보다 4배 이상 높은 수치라는 설명이다.
정확도뿐만 아니라 비용 효율성 면에서도 탁월한 성과를 보였다고 전했다. 의료 AI 모델은 비용을 의식하도록 설계 의식을 갖도록 설계, 불필요한 검사 횟수를 줄이고 수십만달러에 달하는 비용을 절감했다고 설명했다.
이처럼 슐레이먼 CEO는 개별 모델보다 이를 잘 통합한 오케스트레이터 개발이 핵심이라고 강조했다. 그는 “차별화 요소는 모델이 아니라 여러 모델을 조율하는 오케스트레이터”라며 “오픈AI의 모델이 가장 뛰어난 성과를 냈지만, 특정 플랫폼에 의존하지 않는다”라고 말했다.
MS는 MAI-DxO의 기술을 코파일럿이나 빙 검색엔진 등 자체 서비스에 통합할 예정이다. 이를 통해 하루 5000만건에 달하는 건강 관련 검색 쿼리를 처리할 방침이다.
도미닉 킹 MS AI 팀 임원은 “우리가 본 어떤 시스템보다 뛰어난 성능”이라며 “이 기술은 의료 서비스의 새로운 ‘입구’ 역할을 할 수 있다”라고 평했다.
또 심장병 전문의인 에릭 토폴 스크립스 연구소장은 “이번 연구는 AI가 의료 분야에서 정확성과 비용 효율성을 동시에 향상할 수 있다는 가능성을 처음으로 보여준 획기적인 결과”라고 평했다.
물론, 이번 연구는 아직 초기 단계로 실제 임상 환경에 적용되기에는 이르다는 점에서 신중한 접근이 필요하다는 지적도 나온다.
박찬 기자 cpark@aitimes.com
