AI 도입이 본격화되면서 기업들의 고민도 달라지고 있다. 모델 성능 경쟁을 넘어 실제 현장에 AI를 운영하기 위한 인프라 비용과 전력 효율성이 중요한 과제로 떠오른 것이다. 특히 스마트팩토리와 지능형 CCTV, 자율주행 등 영상 데이터를 실시간으로 처리하는 비전 AI 시장에서는 높은 전력 소모와 구축 비용이 확산의 걸림돌로 지적돼 왔다.
이러한 가운데 NPU(신경망처리장치)를 활용한 저전력 AI 인프라가 새로운 대안으로 부상하고 있다.
IT 인프라 전문기업 한국정보공학은 파트너사를 대상으로 개최한 ‘HPE 딥엑스 비전 AI 비즈니스 토크’를 통해 딥엑스의 NPU를 탑재한 HPE 서버 기반 비전 AI 솔루션을 공개했다고 밝혔다.
딥엑스 전일 부장이 서버 영업망을 비전 AI 영업으로 전환하는 실전 세일즈에 대해 소개하고 있다. (사진 제공: 한국정보공학)
비전 AI 확산의 핵심 과제는 전력과 비용
최근 제조업과 물류, 보안 산업을 중심으로 비전 AI 도입이 빠르게 확대되고 있다. 카메라를 통해 수집한 영상을 실시간 분석해 불량을 검출하거나 이상 상황을 감지하는 수요가 늘어나면서 관련 인프라 시장도 성장하고 있다. 하지만 기존 GPU 기반 시스템은 높은 전력 사용량과 구축 비용 때문에 중소기업이나 지방 사업장에서는 도입 부담이 적지 않았다.
한국정보공학이 이번에 선보인 솔루션은 HPE 서버에 딥엑스의 초저전력 NPU를 탑재한 구조다. 딥엑스 NPU는 칩 내부에 LPDDR5 컨트롤러를 내장해 데이터 처리 병목을 줄였으며, GPU 서버 대비 전력 사용량을 크게 낮춘 것이 특징이다.
회사 측은 해당 솔루션이 기존 GPU 기반 인프라 대비 연간 전력 소비를 약 86% 절감할 수 있다고 설명했다. 또한 NPU 자체 가격 경쟁력과 장비 규모 축소를 통해 초기 구축 비용과 운영 비용을 포함한 총소유비용(TCO)도 대폭 낮출 수 있다고 덧붙였다.
확장성도 강조했다. 범용 PCIe 카드 형태로 설계돼 별도 복잡한 장비 변경 없이 서버에 장착할 수 있으며, 서버 한 대에서 최대 256채널 규모의 비전 AI 처리가 가능하도록 구성됐다.
최근 AI 반도체 시장에서는 GPU 중심 구조를 넘어 NPU와 ASIC 등 목적형 반도체가 빠르게 확산되고 있다. 생성형 AI 학습 시장에서는 여전히 GPU가 강세를 보이고 있지만, 실제 산업 현장의 추론(Inference) 영역에서는 전력 효율성과 비용 경쟁력이 중요한 요소로 떠오르고 있기 때문이다. 특히 국내 AI 반도체 기업들도 글로벌 빅테크 중심 시장에 대응하기 위해 엣지 AI와 온디바이스 AI, 비전 AI 분야를 중심으로 사업을 확대하고 있다.
한국정보공학은 지난해 온디바이스 AI 반도체 기업 딥엑스와 공식 총판 계약을 체결하며 AI 인프라 사업을 강화해 왔다. 이번 행사는 기존 서버 유통 사업자와 파트너사들이 비전 AI 시장에 보다 쉽게 진입할 수 있도록 지원하기 위해 마련됐다.
행사에서는 실제 비전 AI 구축 사례와 영업 전략, 시장 기회 등에 대한 논의도 진행됐다. 회사 측은 포스코DX와 현대차 등 주요 산업 현장에서 관련 기술 검증이 이뤄졌다고 설명했다.
한국정보공학 AI 비즈니스 총괄 담당자는 “비전 AI 사업 진출을 고민하는 파트너사들이 현장에서 바로 활용할 수 있는 인프라 전략을 제시하기 위해 행사를 마련했다”며 “딥엑스의 NPU 기술과 한국정보공학의 인프라 유통 역량을 결합해 AI 인프라 시장 확대에 나설 것”이라고 말했다.
The post GPU 대신 NPU…한국정보공학, 전력 부담 낮춘 비전 AI 인프라 시장 공략 appeared first on 벤처스퀘어.