지난달 챗GPT 4.0 출시···한국어 모델 탑재국내 IT 기업, 한국형 챗GPT 경쟁에 빨간불네카오, 서치GPT·KoGPT 상반기 발표 예정
지난달 14일 미국의 스타트업 기업 오픈 AI는 '챗GPT-4.0'을 출시했다. 챗GPT-4.0은 이전 챗GPT-3.5의 업그레이드 버전이다. 이번 업데이트로 챗GPT에는 대규모 AI 언어모델(LLM)이 적용됐다. 이로써 영어로만 제대로 된 답변을 내놓던 기존 모델과 달리 한국어를 포함한 27개 언어의 소통이 가능해졌다.
오픈 AI가 공개한 자료에 따르면 챗GPT-4.0의 한국어 답변 정확도는 77%로 기존 챗GPT-3.5의 영어 답변 정확도(70.1%)를 상회한다. 이에 자국어를 무기 삼아 '한국형 챗GPT' 왕좌를 차지하려던 국내 IT 기업들은 긴장의 고삐를 늦출 수 없는 상황이다.
국내 대표 포털 기업인 네이버는 검색 엔진에 AI를 도입해 시장 점유에 나선다는 방침이다. 네이버는 차세대 검색 프로젝트 '서치 GPT'를 상반기 선보일 예정이다.
서치GPT에 적용되는 하이퍼클로바는 국내 최대 규모 슈퍼컴퓨팅 인프라를 활용해 5600억개의 한국어 토큰을 학습했다. 이는 기존 네이버 한국어모델 데이터의 약 3000배, GPT3.0의 파라미터인 1750억개보다 많은 2040억개의 규모다.
오는 7월엔 '하이퍼클로바X'를 출시한다. 하이퍼클로바X는 기존 챗GPT 3.0 대비 한국어 데이터를 6500배 더 보유한 프로그램이다. 네이버는 앞으로 하이퍼클로바를 고도화해나가 이용자들에게 맞춤형 AI검색 경험을 제공하겠다는 입장이다.
네이버 관계자는 "지난 'DEVIEW 2023' 이후 하이퍼클로바X 출시 계획은 순조롭게 진행 중에 있다"며 "지난 발표 당시만 해도 챗GPT-3.0을 기준으로 발표했는데 어느덧 그 다음 버전이 잇따라 출시되고 있다"고 말했다.
이어 "기술의 변화 양상을 빠르게 검토하고 내부적으로 숙의를 거쳐 서비스를 고도화해 나갈 예정"이라고 강조했다.
카카오는 올 상반기 'KoGPT 3.5'발표를 앞두고 있다. 2021년 11월 카카오는 60억개 파라미터와 2000억개 토큰의 한국어 데이터를 바탕으로 하는 KoGPT 3.0을 공개한 바 있다.
이번 출시 예정인 KoGPT 3.5의 매개변수 수는 전 버전과 비슷할 전망이다. 대신 카카오는 전문 영역에 특화된 서비스(버티컬 서비스)를 제공할 방침이다.
카카오는 변화하는 AI 시장 대응책의 핵심 인터페이스로 채팅을 꼽으며 국내 최정상 메신저, 카카오톡을 운영하는 회사로서 채팅 데이터를 활용한 AI 시스템을 구축하고자 한다.
지난 20일 카카오톡은 본 어플 내 챗봇 서비스인 '다다음' 베타 서비스를 출시했다. 비록 내부 기대를 넘어선 사용자 폭주로 하루 만에 일시 중단했지만 카카오톡은 피드백을 반영해 빠르게 재오픈하겠다는 입장이다.
카카오톡 관계자는 "지난달 배타서비스로 제공했던 다다음은 당초 파일럿으로 준비한 터라, 준비가 미흡했다"며 "기대치보다 높은 고객들의 관심으로 예상보다 이르게 종료할 수밖에 없었다"고 설명했다.
이어 "이용자들에게 맞춤형 서비스를 제공하는 것을 목표로 둔 만큼 피드백을 통해 변화무쌍한 AI 시장에 경쟁력 있는 모델을 내놓을 계획"이라고 덧붙였다.
뉴스웨이 강준혁 기자
junhuk210@newsway.co.kr
저작권자 © 온라인 경제미디어 뉴스웨이 · 무단 전재 및 재배포 금지
댓글