-ACL 메인 컨퍼런스 채택(상위 19%)… 글로벌 NLP 학계 기술력 인정
-RAG 정확도 77.9% → 금융 8.5%·법률 5.0% 하락 원인 규명
올거나이즈코리아, ACL 2026 Main Conference 논문 채택 (자료 제공: 올거나이즈)
엔터프라이즈 AI 플랫폼 기업 올거나이즈가 글로벌 최고 권위 학회에서 기술력을 입증했다.
올거나이즈는 자연어처리(NLP) 분야 최고 권위 학회인 ACL 2026 Main Conference에 제출한 논문이 최종 채택됐다고 밝혔다. 채택된 논문은 기업 환경에서의 RAG(검색증강생성) 평가 한계를 분석한 ‘RARE(Redundancy-Aware Retrieval Evaluation Framework)’다.
ACL은 약 1만 2천 건의 논문 중 19%만 채택되는 세계적 수준의 학회로, 이번 성과는 엔터프라이즈 AI 분야에서 올거나이즈의 기술 경쟁력을 입증한 사례로 평가된다.
“현장에선 왜 안 되나”… RAG 성능 격차 구조적으로 분석
이번 연구의 핵심은 기존 RAG 성능 평가 방식이 실제 기업 환경을 반영하지 못한다는 점을 실증적으로 밝혀낸 데 있다.
기존 벤치마크(MS MARCO, HotpotQA 등)는 위키피디아처럼 문서 간 구분이 명확한 환경을 전제로 설계됐지만, 실제 기업 환경은 유사 문서와 반복 정보가 많은 구조다. 이로 인해 실험 환경에서는 높은 성능을 보이던 모델이 실제 적용 시 급격히 성능이 저하되는 문제가 발생한다.
실험 결과에서도 이러한 격차가 확인됐다. 위키 환경에서 77.9%의 정확도를 기록한 모델이 실제 기업 데이터에서는 금융 8.5%, 법률 5.0%까지 하락하는 것으로 나타났다.
이에 대해 논문 심사위원단은 “현실 기업 환경과 기존 학술 벤치마크 간의 격차를 예리하게 짚어냈다”며 전원 합의로 높은 평가를 내린 것으로 알려졌다.
맞춤형 RAG 평가 프레임워크 제시… 제품으로 바로 연결
올거나이즈는 이번 논문을 통해 기업 환경에 최적화된 두 가지 해결책을 제시했다.
첫째, 문서를 최소 단위 사실로 분해해 중복 정보를 추적하는 ‘Atomic Fact Decomposition’, 둘째, LLM이 생성한 평가 데이터의 품질을 안정화하는 ‘CRRF’ 기법이다. 이를 통해 기업이 자체 문서를 기반으로 도메인 맞춤형 RAG 벤치마크를 구축할 수 있는 구조를 제시했다.
해당 기술은 이미 올거나이즈 AI 플랫폼 ‘Alli’에 적용돼 실제 고객 환경에서 활용되고 있으며, 연구 결과를 제품으로 즉시 연결하는 구조를 구축했다는 점도 특징이다.
이창수 대표는 “이번 연구는 고객 현장에서 직접 관찰한 문제에서 출발했다”며 “현장의 문제를 학술적으로 검증하고 다시 제품으로 환원하는 선순환 구조를 만들어가겠다”고 밝혔다.
The post 올거나이즈, ACL 2026 논문 채택… “기업용 RAG 한계 짚었다” appeared first on 벤처스퀘어.