노타, K-엑사원 NPU 최적화 성공

[사진=노타][디지털데일리 구아현기자] 노타는 퓨리오사AI의 데이터센터용 NPU에서 LG AI연구원의 K-엑사원 236B 모델 최적화에 성공했다고 밝혔다.K-엑사원은 과학기술정보통신부가 주관하는 '독자 AI 파운데이션 모델(독파모)' 사업을 통해 LG AI연구원이 개발한 국산 거대언어모델(LLM)이다. K-엑사원 236B는 약 2,360억 개 파라미터 규모의 대형 AI 모델로, 여러 전문가 모델을 선택적으로 활용하는 MoE 구조를 채택했다.노타는 모델 전체를 다시 조정하는 대신 성능 저하 우려 구간만 정밀 분석해 필요한 부분에만 최적화를 적용했다. 그 결과 모델 크기를 약 71% 줄이면서도 과학 추론(GPQA), 지시 이해(IFBench), 수학 문제 해결(AIME25) 등 3개 주요 평가 항목에서 원본 대비 평균 99.2%의 정확도를 유지했다. 항목별 점수는 각각 79.80점, 68.98점, 88.57점으로, 원본 모델의 79.1점, 67.3점, 92.8점과 비슷한 수준이다.이번 성과는 국산 NPU와 국내 AI 모델, 최적화 기술을 결합해 소버린 AI 인프라 가능성을 확인했다는 점에서 의미가 있다.채명수 노타 대표는 “이번 성과는 국산 NPU와 국내 AI 모델, 최적화 기술을 결합해 소버린 AI 인프라 가능성을 확인했다는 점에서 의미가 있다”고 말했다.
원문 보기 ↗