센티언트, 기업용 AI 에이전트 검증 플랫폼 '아레나' 출시…파운더스펀드·판테라 등 참여
오픈소스 인공지능(AI) 연구소 센티언트(Sentient)는 기업용 AI 에이전트의 추론 성능을 검증하기 위한 실전 테스트 플랫폼 '아레나(Arena)'를 출시한다고 27일(현지시간) 밝혔다. 이번 프로젝트에는 파운더스펀드, 판테라캐피털, 프랭클린템플턴 등 주요 투자사와 알파엑시브(alphaXiv), 파이어웍스(Fireworks), 오픈라우터(OpenRouter) 등이 초기 참여 기관으로 합류했다. 센티언트에 따르면 아레나는 실제 기업 업무 환경을 가정해 AI에이전트의 추론 능력을 점검하는 테스트 환경이다. 불완전한 정보, 긴 문맥, 모호한 지시, 상충되는 데이터 등 현실적인 조건을 재현해 단순 정답 여부가 아닌 전체 추론 과정을 기록·분석하도록 설계됐다. 초기 과제는 기업 환경의 핵심 난제로 꼽히는 '문서 기반 추론(document reasoning)'이다. AI 에이전트는 비정형 데이터에 대한 분석과 계산을 수행하게 된다. 센티언트는 아레나를 글로벌로 운영하며, 수천 명의 AI 개발자를 대상으로 첫 참여 신청을 받을 예정이다. 오프라인 행사는 2026년 3월부터 샌프란시스코를 중심으로 진행된다.
