AI 에이전트 시대가 본격화되면서 기업들이 주목하는 기술도 달라지고 있다. 단순히 대화를 잘하는 AI보다 계약서와 보고서, 공문서 등 복잡한 문서를 정확하게 이해하고 구조화할 수 있는 능력이 핵심 경쟁력으로 떠오르고 있다. 실제 기업 업무의 상당수가 문서를 중심으로 이뤄지는 만큼 ‘문서를 읽는 AI’가 생성형 AI 다음 단계의 승부처로 부상하는 분위기다.
국내 AI 기업 한국딥러닝이 글로벌 문서 AI 분야에서 또 한 번 존재감을 드러냈다. 한국딥러닝은 글로벌 문서 파싱 벤치마크인 ‘파스벤치(ParseBench)’에서 비전언어모델(VLM) 부문 종합 1위를 기록했다고 밝혔다. 올해 3월 글로벌 광학문자인식(OCR) 벤치마크 ‘OCRBench v2’ 영어 부문 1위에 오른 데 이어 문서 인식과 구조화 분야에서 연속으로 세계 정상급 성과를 거뒀다는 평가다.
한국딥러닝, OCR 이어 글로벌 문서 파싱 부문도 ‘연속 1위’ (자료 제공: 한국딥러닝)
AI 에이전트 시대 핵심 인프라로 떠오른 문서 AI
최근 기업들은 AI를 활용해 문서 검색, 정보 추출, 보고서 작성, 업무 자동화 등을 구현하려 하고 있다. 하지만 AI가 문서의 레이아웃과 표, 이미지, 문맥 관계를 제대로 이해하지 못하면 잘못된 정보를 생성하거나 환각(Hallucination) 현상이 발생할 가능성이 높다. 이 때문에 업계에서는 문서를 정확하게 읽고 구조화하는 기술을 AI 에이전트 시대의 핵심 인프라로 보고 있다.
파스벤치(ParseBench)는 글로벌 AI 데이터 플랫폼 기업인 라마인덱스(LlamaIndex)가 운영하는 문서 파싱 전문 벤치마크다. 보험·금융·정부 기관에서 실제 활용되는 문서 약 2000페이지를 기반으로 문서 구조 이해와 정보 추출 능력을 평가한다.
한국딥러닝은 이번 평가에서 76.4점을 기록하며 비전언어모델(VLM) 부문 1위에 올랐다. 뒤를 이어 구글의 제미나이 3 플래시 싱킹 하이(Gemini 3 Flash Thinking High)가 75.0점을 기록했고, 오픈AI GPT-5.5는 67.8점으로 집계됐다.
특히 문서 레이아웃과 시각적 구조를 이해하는 능력을 평가하는 비주얼 그라운딩(Visual Grounding) 부문에서는 78.8점을 기록했다. 이는 같은 항목에서 59.8점을 기록한 구글 제미나이(Gemini)보다 약 19점 높은 수치다. 내용 충실도와 표 인식 등 세부 평가 항목에서도 상위권 성적을 거두며 전반적인 성능을 입증했다.
이번 성과를 이끈 것은 한국딥러닝의 문서 특화 비전언어모델 ‘KDL 프론티어(KDL Frontier)’다. 평가에 사용된 ‘KDL-프론티어-파서-나노(KDL-Frontier-Parser-nano)’는 12억 파라미터 규모의 초경량 모델로 설계됐다.
업계에서는 대규모 모델 경쟁이 이어지고 있지만 실제 기업 환경에서는 성능뿐 아니라 운영 비용과 보안성도 중요한 요소로 꼽힌다. 특히 금융, 보험, 공공기관은 민감한 데이터를 다루기 때문에 외부 클라우드가 아닌 내부 환경에 직접 설치할 수 있는 온프레미스 AI 수요가 높다.
한국딥러닝은 해당 모델이 외부 서버 연결 없이 내부 시스템에 구축 가능한 구조를 갖추고 있어 보안이 중요한 산업 현장에서도 활용할 수 있다고 설명했다.
또한 생성형 AI의 대표적 한계로 지적되는 환각 현상을 최소화하기 위해 문서 내 레이아웃과 위치 정보, 항목 간 관계를 함께 학습하는 ‘니어 제로 할루시네이션(Near-Zero Hallucination)’ 기술을 적용했다. 이를 통해 단순 텍스트 인식을 넘어 문서의 의미와 맥락을 이해하는 수준의 정보 추출이 가능하다는 설명이다.
한국딥러닝은 이미 경기도청에 문서 파싱 솔루션 ‘딥 파서(DEEP Parser)’를 공급해 HWP와 PDF 등 행정문서를 AI 서비스에 활용할 수 있는 데이터로 전환하고 있다.
김동현 한국딥러닝 최고전략책임자(CSO)는 “AI 에이전트가 복잡한 문서를 사람처럼 이해할 수 있도록 시각 구조 인지 기술 고도화에 집중해 왔다”며 “이번 성과는 문서 AI가 단순 정보 추출을 넘어 실제 업무를 수행하는 AI 에이전트의 핵심 기술이라는 점을 보여준 사례”라고 말했다.
The post “문서를 읽는 AI, 이제 빅테크도 넘었다”…한국딥러닝, 글로벌 문서 파싱 평가 1위 appeared first on 벤처스퀘어.