ICT·바이오 '표절 의혹' 잠재운다···NC AI, 기술보고서 선제 공개

ICT·바이오 인터넷·플랫폼

'표절 의혹' 잠재운다···NC AI, 기술보고서 선제 공개

등록 2026.01.09 06:00

유선희

  기자

업스테이지·SK텔레콤에 이어 NC AI도 공개해외 오픈소스 차용 논란 속 자립성 강조 행보

정부의 '독자 인공지능(AI) 파운데이션 모델 프로젝트'에 참여하는 NC AI가 멀티모달 생성용 파운데이션 모델 '배키'(VAETKI)의 기술보고서(테크니컬 리포트)를 공개한다. 해외 오픈소스 차용 논란 속에서 기술 독자성을 강조하려는 전략적 행보로 풀이된다.
ai 아이콘 AI한입뉴스

OpenAI의 기술을 활용해 기사를 한 입 크기로 간결하게 요약합니다.

전체 기사를 읽지 않아도 요약만으로 핵심 내용을 쉽게 파악할 수 있습니다.

Quick Point!

NC AI가 멀티모달 생성 AI 모델 '배키'의 기술보고서를 공개

해외 오픈소스 차용 논란 속 기술 독자성 강조 목적

정부 '독자 AI 파운데이션 모델 프로젝트' 참여 기업들 기술보고서 잇따라 발표

맥락 읽기

네이버, 업스테이지 등 주요 기업들 오픈소스 차용 논란에 휩싸임

AI 모델의 독자성 검증 요구 커짐

기술보고서 공개 통해 신뢰도와 투명성 확보 시도

숫자 읽기

과기정통부 프로젝트에 SK텔레콤, 네이버클라우드, LG AI 연구원, NC AI, 업스테이지 등 5개 팀 참여

6개월마다 평가 실시, 2027년까지 최종 2팀 선정 예정

15일 1개 팀 탈락 예정

어떤 의미

국가대표 AI 개발 사업에서 기술 자립성 논란 핵심 이슈로 부상

기술보고서 공개가 독자성 검증과 경쟁력 확보의 기준으로 작용

민간 영역에서도 기술 검증과 평가 움직임 확대 예상

'표절 의혹' 잠재운다···NC AI, 기술보고서 선제 공개 기사의 사진

9일 정보기술(IT) 업계에 따르면 NC AI는 배키의 기술보고서를 이르면 이날 오픈소스 플랫폼 '허깅페이스' 등에 공개할 예정이다. 해당 보고서는 오픈 액세스 학술 논문 저장소 '아카이브(arXiv)' 등록을 기다리는 것으로 보인다.

기술보고서는 AI 개발의 핵심 방법론과 매개변수, 학습 방법, 학습 데이터 등 세부 사항을 담은 일종의 논문으로, AI 모델 독자성 등에 대한 사용자 신뢰도를 높이는 데 필수적인 요소다. 구글과 같은 빅테크 기업들도 자사 AI의 특징을 기술보고서를 통해 설명하고 있다. 다만 법적으로 강제되는 것은 아니기에 오픈AI GPT-4 등 일부 상업 모델은 기술보고서는 물론 학습 데이터 수조차 비공개하는 경우도 존재한다.

최근 네이버, 업스테이지 등을 둘러싼 해외 오픈소스 차용 논란이 벌어진 가운데 NC AI가 배키의 기술보고서를 공개하기로 한 건 기술 독자성을 강조하려는 전략적 행보로 분석된다.

앞서 네이버클라우드는 중국 알리바바가 만든 AI 모델인 큐엔(Qwen)의 '비전 인코더'를 미세조정(파인튜닝)해 사용했다는 주장이 제기됐다. 네이버클라우드는 지난해 6월 '하이퍼클로바X 시드 32B 싱크'의 기술보고서를 선보였지만 이후 보고서 내 인코더 출처 항목을 수정한 바 있다. 이를 두고 일각에서는 중국 모델 차용 사실을 희석하기 위한 것 아니냐며 이번 논란이 불거졌다.

업스테이지는 모델 구조가 중국 AI 스타트업 즈푸AI의 AI 모델인 GLM과 흡사하다는 의혹이 제기됐다. 기술 독자성 논란 후 업스테이지는 '솔라 오픈 100B' 오픈소스와 자체 기술보고서를 허깅페이스에 선보이며 의혹 정면 돌파에 나섰다. 전날 SK텔레콤도 '에이닷엑스(A.X) K1'의 기술보고서를 공개했다. LG AI 연구원이 개발한 모델 'K-엑사원'의 기술보고서는 지난 5일부터 아카이브에 공개돼 열람할 수 있다.

지난달 30일 독자 파운데이션 모델 프로젝트 1차 대국민 보고회에서 NC AI 이연수 대표가 AI 모델 '배키'에 대해 소개하고 있다. 사진=NC AI 제공지난달 30일 독자 파운데이션 모델 프로젝트 1차 대국민 보고회에서 NC AI 이연수 대표가 AI 모델 '배키'에 대해 소개하고 있다. 사진=NC AI 제공

해외 오픈소스 차용이 논란으로 부상한 건 해당 AI 모델이 과학기술정보통신부가 추진하는 '독자 AI 파운데이션 모델 프로젝트'에 참여하고 있기 때문이다. AI 개발 과정에서 오픈소스를 활용하는 것은 일반적인 일이지만, '국가대표 AI' 개발이 목표인 프로젝트에서는 기술 자립성 논란으로 이어질 수 있기 때문이다.

한 업계 관계자는 "오픈소스 사용을 문제로 볼 순 없지만, 독자 개발을 전제로 추진하는 정부 사업에 참여한다면 의미가 달라진다"며 "차용 논란이 벌어진 가운데 기술보고서를 공개하는 건 검증 가능성을 강조하는 메시지"라고 말했다.

AI 모델의 독자성을 점검할 수 있는 보고서가 속속 공개되는 만큼 민간 영역에서도 기술 검증은 이어질 것으로 전망된다. 과학기술정보통신부는 오는 15일 독자 AI 파운데이션 모델 프로젝트에 참여하는 SK텔레콤, 네이버클라우드, LG AI 연구원, NC AI, 업스테이지 중 1개 팀을 탈락시킬 예정이다. 이들은 6개월마다 평가 받고 2027년까지 최종 2팀으로 압축된다.
ad

댓글