ICT·바이오 '표절 논란' 국가대표 AI 경선···1차 탈락팀은?

ICT·바이오 인터넷·플랫폼

'표절 논란' 국가대표 AI 경선···1차 탈락팀은?

등록 2026.01.08 07:00

유선희

  기자

SK텔레콤·네이버클라우드 등 5개사 프로젝트 대상 선정일부 中 오픈소스 표절·차용 의혹에 독자성 의구심 커져 '프롬 스크래치' 기준 모호 지적도···1차 평가에 이목 집중

정부가 추진하는 독자 인공지능(AI) 파운데이션 모델 프로젝트의 1차 탈락자 발표가 일주일 앞으로 다가온 가운데, 선발 기업들의 기술 독자성 여부가 주요 쟁점으로 부상하고 있다. 경합 중인 SK텔레콤, 네이버클라우드, NC AI, LG AI 연구원, 업스테이지 5개사 중 일부 기업의 해외 오픈소스 모델 차용, 베끼기 등 의혹이 제기된 여파다. 일각에선 정부가 제시한 '프롬 스크래치' 개발 기준이 불명확해 벌어진 일이라는 지적도 제기된다.
ai 아이콘 AI한입뉴스

OpenAI의 기술을 활용해 기사를 한 입 크기로 간결하게 요약합니다.

전체 기사를 읽지 않아도 요약만으로 핵심 내용을 쉽게 파악할 수 있습니다.

Quick Point!

정부가 추진하는 독자 AI 파운데이션 모델 프로젝트 1차 탈락자 발표 임박

SK텔레콤, 네이버클라우드, NC AI, LG AI 연구원, 업스테이지 5개사 경쟁

기술 독자성 논란과 표절 의혹이 주요 쟁점으로 부상

숫자 읽기

5개사 중 1개 팀 15일 1차 탈락 예정

2027년까지 2팀으로 압축

SK텔레콤 500B, 업스테이지 100B 등 초거대 모델 공개

자세히 읽기

네이버클라우드, 중국 알리바바 오픈소스 인코더 활용 사실 확인

아파치 2.0 라이선스 따라 사용 가능하지만 라이선스 명시 필요

업스테이지는 표절 의혹 해명 및 자체 개발 증명

맥락 읽기

정부의 '프롬 스크래치' 기준 모호성 논란 확대

AI 모델의 일부 구성 요소 차용 허용 범위 불분명

기술 주권 논의와 명확한 기준 필요성 제기

향후 전망

1차 평가에서 독자 개발 여부와 기술력 집중 심사

정부의 구체적 기준 마련 여부가 향후 논란 해소 관건

'표절 논란' 국가대표 AI 경선···1차 탈락팀은? 기사의 사진

8일 정보기술(IT) 업계에 따르면, 과학기술정보통신부는 독자 AI 파운데이션 모델 개발을 위해 ▲SK텔레콤 ▲네이버클라우드 ▲NC AI ▲LG AI 연구원 ▲업스테이지의 5개사를 프로젝트 대상으로 선정했다. 이들은 6개월마다 평가를 받아 2027년까지 최종 2팀으로 압축될 예정이다.

지난해 말에는 5개사가 개발한 AI 모델에 대한 성과발표가 진행됐다. SK텔레콤은 500B(5000억개) 규모의 초거대 AI 모델 'A.X K1'를 공개했고 ▲네이버클라우드는 차세대 옴니모달(omni-modal) AI 모델 '하이퍼클로바 X 시드 옴니 8B' ▲NC AI는 산업 AI 전환 위한 파운데이션 모델 'VAETKI'(배키) ▲LG AI 연구원은 'K-엑사원'을 내세웠다. 스타트업 연합체인 업스테이지는 독자 AI 프로젝트 모델 솔라 오픈 100B으로 승부수를 걸었다. 이들 가운데 한 팀은 오는 15일에 탈락하게 된다.

탈락자 결과 발표를 앞두고 해외 모델 표절·차용 의혹이 이어지고 있다. 네이버 정예팀이 중국 모델의 비전 인코더를 미세조정(파인튜닝)해 사용했다는 주장이 제기된 것이다. 네이버클라우드가 독자 AI 파운데이션 모델 프로젝트 1차 결과물로 공개한 '하이퍼클로바 X 시드 옴니 8B' 등은 모델 구성 요소 중 하나인 비전 인코더에 알리바바의 '큐원 2.5(Qwen 2.5 vl)' 언어모델을 차용한 것으로 확인됐다.

비전 인코더는 모델의 시신경 같은 역할로, 입력받은 시각 데이터를 AI 모델이 이해할 수 있는 형태로 변환한다. 네이버가 활용한 큐원 2.5 비전 인코더는 아파치 2.0 라이선스가 적용된 오픈소스다. 상업적 이용을 포함해 자유롭게 활용할 수 있지만 수정을 거쳐 사용할 경우 해당 사실을 포함해 라이선스 내용을 명시해야 한다.

네이버클라우드 측은 중국 오픈소스를 쓴 점은 인정했지만 모델의 완성도와 안정성을 향상하기 위한 조치였다는 입장이다. 회사 측은 "이번 모델에서는 글로벌 기술 생태계와의 호환성 및 전체 시스템의 효율적 최적화를 고려해 검증된 외부 인코더를 전략적으로 채택했다"며 "다만, 이는 기술적 자립도가 부족해서가 아니라 이미 표준화된 고성능 모듈을 활용해 전체 모델의 완성도와 안정성을 높이기 위한 고도의 엔지니어링 판단"이라고 강조했다.

앞서 지난달 30일에는 업스테이지 모델이 중국 모델을 베꼈다는 주장이 제기됐지만 업스테이지 측은 검증 절차를 공유하고 학습 로그를 공개하며 자체 개발을 증명한 바 있다. 의혹을 불러일으킨 측이 사과를 하며 논란은 일단락됐다.

일각에서는 정부가 AI 모델 개발에 있어 프롬 스크래치의 기준이 모호해 논란이 커졌다고 보고 있다. 프롬 스크래치는 AI 모델을 처음부터 직접 개발한다는 뜻이다. 과기정통부는 사업 공모에서 독자 파운데이션 모델을 '해외 모델 미세 조정 등으로 개발한 파생형 모델이 아닌 모델의 설계부터 사전 학습 과정을 수행한 국산 모델'이라며 '타사 모델에 대한 라이선싱 이슈 부재'로 규정한 바 있다. 그러나 네이버 사례처럼 인코더 등 AI 모델의 다양한 구성 요소에서 어떤 부분을 프롬 스크래치로 인정할 것인지 구체적인 기준이 제시되진 않았다.

우선 오는 15일 예정된 1차 평가를 통해 각 기업 모델 독자 개발 여부와 기술력에 대한 정부의 판단이 갈릴 것으로 전망된다. 이승현 포티투마루 부사장은 깃허브에 올린 게시물을 통해 "소모적인 논쟁을 넘어 무엇이 진정한 기술 주권인가에 대한 명확한 기준을 정립해야 한다"고 했다.
ad

댓글