서비스 관점 컴플라이언스 평가 도입…AI 에이전트 검증 패러다임 전환
온프레미스·클라우드 모두 지원…금융·공공 등 보안 산업 적용 가능
에이아이웍스, 에이전트리거 정식 출시 (자료 제공: 에이아이웍스)
AI 에이전트 도입이 확산되면서 ‘신뢰성 검증’ 시장이 본격적으로 열리고 있다. AI 데이터·솔루션 기업 에이아이웍스(AIWORKX, 대표 윤석원)는 AI 에이전트 평가 솔루션 ‘AgentRigor(에이전트리거)’를 정식 출시한다고 밝혔다.
AgentRigor는 기존 AI 평가 방식의 한계를 보완해, 단순 응답 정확성 검증을 넘어 실제 서비스 환경에서의 행동과 리스크까지 종합적으로 분석하는 것이 핵심이다. 특히 콘텐츠 단위 평가에서 벗어나 ‘서비스 단위 컴플라이언스 평가’로 확장한 점이 특징이다.
“정답 여부” 넘어 “행동 방식” 평가로 확장
기존 AI 평가 방식은 벤치마크 데이터셋 기반으로 정답 여부를 판단하는 데 집중해, 실제 서비스 환경에서 요구되는 다양한 시나리오를 충분히 반영하지 못하는 한계가 있었다. 또한 기업별 목표나 산업 특성을 고려하지 못하고, 맥락 정보 반영이 어렵다는 문제도 지적돼 왔다.
AgentRigor는 이러한 문제를 개선해 산업별 서비스 맥락을 반영한 평가 체계를 제공한다. 통신·금융·의료 등 다양한 분야에서 AI 에이전트의 대응 방식과 리스크를 종합적으로 분석하며, 자체 구축한 한국어 특화 평가 데이터 자산을 활용해 정밀도를 높였다.
핵심 기능으로는 ▲LLM 응답 품질 정량 검증 ▲실제 사용자 시나리오 기반 안전성 평가 ▲공인 프레임워크 기반 컴플라이언스 대응 지원 등이 포함된다. 또한 테스트 데이터 자동 생성, 평가 지표 커스터마이징, 결과 시각화 및 리포트 자동화 등 다양한 기능을 제공한다.
해당 솔루션은 이미 국내 대형 IT 서비스 기업의 AI 검증 프로젝트와 화장품 플랫폼 베타 테스트에 적용되며 실효성을 입증했다.
기업은 AgentRigor를 통해 AI 서비스 배포 전 리스크를 사전 점검하고, 자동화된 검증 파이프라인으로 운영 효율성을 높일 수 있다. 멀티 모델 비교 평가도 가능하며, 온프레미스와 클라우드 환경을 모두 지원해 규제 산업에서도 활용할 수 있다.
에이아이웍스는 향후 다중 대화 검증, 워크플로우 연동, MCP 호환 기능 등을 추가해 글로벌 표준화에도 나선다는 계획이다.
한편 AgentRigor는 5월 6일부터 코엑스에서 열리는 ‘AI Expo Korea 2026’에서 라이브 데모로 공개될 예정이다.
The post 에이아이웍스, ‘에이전트 신뢰성 평가’ 시장 겨냥…AgentRigor 출시 appeared first on 벤처스퀘어.