(사진=셔터스톡)
(사진=셔터스톡)

인공지능(AI)으로 개인의 기억과 성격, 성향 등을 파악하는 데 2시간의 인터뷰로 충분하다는 연구 결과가 나왔다. 이는 인간의 가상 복제본, 즉 디지털 트윈을 구축하는 데 유용하다는 설명이다.

스탠포드대학교와 구글 딥마인드, 노스웨스턴대학교, 워싱턴대학교 등으로 구성된 연구진은 최근 이런 내용이 담긴 '1000명의 생성 에이전트 시뮬레이션'이라는 논문을 아카이브를 통해 발표했다.

연구진은 연령과 성별, 인종, 지역, 교육, 정치적 이념이 다른 1000명을 모집했다. 참여에 따라 최대 100달러를 지급했다.

그리고 연구진은 인터뷰를 통해 개인들의 복제품인 에이전트를 만들었다. 에이전트가 인간을 얼마나 잘 모방하는지 테스트하기 위해 참가자들은 2주 간격으로 성격 테스트, 사회 조사, 논리 게임을 각각 두번씩 진행했다.

그리고 에이전트는 동일한 연습을 완료했다. 그 결과는 실제 인간과 85% 유사했다. 

연구를 주도한 박준성 스탠포드대 박사 과정은 "작은 '당신'들이 돌아다니며 실제로 당신이 내렸을 결정을 내릴 수 있다"라며 "이것이 궁극적으로 미래라고 생각한다"라고 말했다. 

시뮬레이션 에이전트는 사회 과학이나 기타 분야의 연구자들이 실제 인간 피험자를 대상으로 하는 데 비용이 많이 들거나 비실용적이거나 비윤리적인 연구를 수행하기 쉽게 만드는 것이다. 이를 인간 디지털 트윈이라고도 부른다. 이미 브록스 AI(Brox AI)나 언런(Unlearn)같은 회사는 인간 디지털 트윈을 구축해 여론 조사나 임상 시험에 활용하고 있다.

인간 디지털 트윈을 구축하기 위해서는 인구 통계, 행복, 행동 등에 대한 정보를 수집하는 일반 사회 조사와 경험에 대한 개방성, 성실성, 외향성, 친화성, 신경증이라는 5가지 성격 특성 평가를 포함하는 것이 일반적이다,

하지만 이런 방법은 통계치를 얻기 위한 사회 과학 연구에서 일반적이지만, 개인별 고유한 세부 사항을 반영하지는 못한다. 또 응답자가 제안자의 입찰을 거부하면 둘 다 보상이 없는 '독재자 게임'과 같은 행동 분석 테스트에서는 성능이 크게 떨어진다.

결국 연구진이 선택한 방법은 AI와의 '정성적 인터뷰'였다. 박 박사 과정은 "지난해 생성 에이전트에 대한 논문을 쓴 뒤 2시간 분량의 많은 팟캐스트에 출연한 뒤 '사람들이 이제 나에 대해 많이 알게 됐구나'라고 느꼈다"라며 "2시간은 매우 강력할 수 있다"라고 말했다.

연구 개요도 (사진=arXiv)
연구 개요도 (사진=arXiv)

이런 인터뷰는 일반 설문 조사에서는 어려운 특이성을 포착할 수도 있다고 덧붙였다. "누군가가 암에 걸렸지만 지난해 완치됐다고 상상해 보라"라며 "이는 매우 독특한 정보로, 당신이 어떻게 행동하고 사물에 대해 생각하는지에 대해 많은 것을 말해준다"라고 설명했다.

이는 다른 방법보다 덜 번거로우며 많은 데이터를 모을 필요도 없다는 것을 장점으로 들었다. 

물론 여기에서 말하는 에이전트는 현재 인간 대신 작업을 처리해 주는 에이전트와는 성격이 다르다. 하지만 존 호튼 MIT 슬론 경영대학원 정보 기술 교수는 "논문의 시뮬레이션 에이전트에 대한 연구는 전반적으로 더 강력한 AI 에이전트로 이어질 가능성이 높다"라고 말했다. 

윤리적인 문제도 지적됐다. 이 기술은 딥페이크보다 더 위험할 수 있다는 것이다. 온라인에서 사람을 대신해 하고 싶지 않은 말을 뱉을 수 있다.

연구진은 "우리의 아키텍처는"인구통계학적 설명으로 구축한 에이전트와 달리 인종 및 이념 집단 간의 정확성 편향을 줄인다"라며 "개인 및 집단행동을 조사하는 데 도움이 되는 새로운 도구"라고 강조했다.

임대준 기자 ydj@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지