LG AI연구원 '토크콘서트 2023'에서 엑사원 시연배경훈 "전문성 신뢰성에 있어 최고의 AI 모델""4500만건 전문 문헌 학습···글로벌 최고 수준"
LG AI연구원이 초거대 멀티모달 AI '엑사원 2.0'을 공개하고 그동안의 개발 성과를 공유했다.
LG AI연구원은 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 'LG AI 토크 콘서트 2023'을 개최했다.
배경훈 원장은 이날 '엑사원 2.0'을 공개하고 3대 플랫폼 ▲유니버스 ▲디스커버리 ▲아틀리에가 각각 어떻게 작동하는지도 직접 보여줬다.
"광고 카피·신약 개발에도 알아서 척척"
엑사원의 3대 플랫폼은 사용자가 질문을 입력한 뒤 5~6초 만에 결과를 도출해냈다.
엑사원 유니버스는 전문가용 대화형 AI 플랫폼으로 각 분야의 전문가들이 정보를 탐색하며 인사이트를 찾을 수 있는 플랫폼으로 만들어졌다. 다른 대화형 AI들과 달리 사전 학습한 데이터는 물론 각 도메인별 최신 전문데이터까지 포함해 근거를 찾아내며 추론한 답변을 생성한다.
엑사원 디스커버리는 신소재·신물질·신약 관련 탐색에 유용하다. 이를 활용하면 1만회가 넘었던 합성 시행착오를 수십회로 줄이고 연구개발 소요 시간은 40개월에서 5개월로 단축시킬 수 있다.
배 원장은 "엑사원을 활용할 경우 아주 소량의 데이터를 갖고도 의료, 제약 분야의 문제를 잘 풀 수 있었다"면서 "아직 밝힐 수 없지만 제약회사와 생성형 AI 모델을 갖고 문제를 푸는 과제를 하고 있다. 결과가 나오면 공개할 것"이라고 설명했다.
아틀리에는 이미지와 텍스트가 짝을 이룬 페어 데이터 3억5000만장을 학습한 엑사원 2.0을 기반으로 이미지 생성과 이미지 이해에 특화된 기능을 제공한다.
이날 간담회에서는 아틀리에에 제품 이미지를 업데이트한 뒤 마케팅 문구를 생성하는 서비스가 시연됐다. 아틀리에는 LG전자의 공기청정기 이미지에 대한 마케팅 문구를 생성해달라고 요청하자 'LG 퓨리케어로 공기의 힘을 믿으세요! 생활 공간을 건강하고 쾌적하게 만들어 드립니다'라는 문구를 5~6초 만에 만들어냈다.
"유니버스 플랫폼, 전문성·신뢰성 타사 대비 우수"
LG AI연구원은 유니버스 플랫폼의 언어모델에 대한 평가와 전체 플랫폼 결과도 공개했다.
우선 LG AI연구원과 국제머신러닝학회(ICML)가 언어모델을 개별 평가한 결과 메타의 갤럭티카, 오픈AI의 인스트럭트GPT 대비 유니버스 플랫폼이 우수한 성능을 가진 것으로 나타났다. 이는 AI분야에 대한 다양한 난이도의 과학적 질문 약 1800개 평가 결과를 바탕으로 분석됐다.
유니버스 플랫폼의 전문성과 신뢰성도 타사 대비 높게 측정됐다. 4개의 생성형 AI 플랫폼을 비교한 결과 '답변의 전문적 깊이'와 '새로운 시각과 유용성' 부문에서는 엑사원이 타사 플랫폼 대비 우수했으나 '답변의 전달력'은 부족한 것으로 조사됐다.
신뢰성 부분에서도 비교 대상 4곳 중 가장 높은 점수를 받았다. 엑사원은 '환각(hallucination, 오답) 없이 사실 답변', '답변할 수 없는 질문에 No', '적절한 근거와 출처를 제시' 3개 부분에서 모두 2위에 링크돼 전체 점수가 가장 높았다.
배 원장은 "실제 산업 현장에서는 현재 상용화된 생성형 AI에 만족하지 못한다. 결과에 대한 신뢰도가 높지 않고 대규모 모델을 학습하는 과정에서 많은 비용이 발생하며 적용 과정에서 데이터 보안에 대한 우려도 존재한다"면서 "이를 해결하기 위해 엑사원은 학습데이터 품질 강화에 집중했다"고 밝혔다.
환각 문제 해결에 대한 노력에 대해서도 "구조적 문제로 100% 해결했다고 할 수는 없다"면서 "전문가들이 엑사원을 답변을 보며 판단하는 과정이 필요하다. 답변에 대한 근거를 명확하게 밝혀주는 것에 주력해 서비스를 진행할 예정"이라고 말했다.
높은 전문성과 신뢰성은 LG 엑사원이 학습한 4500만건의 전문 문헌 덕분이기도 하다.
최정규 LG AI연구원 멀티모달 AI그룹장은 "4500만건의 전문 문헌은 오픈AI가 처음 학습한 학습데이터의 2~3배가량의 데이터"라며 "저희는 전문 데이터 학습에 주력했고 이는 글로벌 최고 수준"이라고 설명했다.
"유니버스·아틀리에 일부 서비스 B2C 적용 고민"
엑사원은 기업간거래(B2B) 모델이 중심이나 일부 서비스의 경우 기업·소비자간거래(B2C)로 공개하는 것도 검토하고 있다.
배 원장은 "현재는 B2B 파트너사를 중심으로 산업현장 내 사례를 만드는 데 집중하고 있다"며 "생성형 AI로 화학, 바이오, 의료, 제약 등의 분야에서 혁신적으로 생산성이 변화한다면 그 결과는 고객들에게 돌아간다. 지금은 성공 사례를 잘 만들고 성과를 입증하는 것이 중요하다"고 강조했다.
단, 유니버스 AI 분야에 있어서는 일반 AI연구자들이 사용할 수 있도록 공개하고 아틀리에 이미지 기술은 SNS 업데이트 등에 유용하게 사용할 수 있어 일부 B2C 전환도 고려하고 있다. LG AI연구원은 계열사를 통해 B2C 서비스를 진행하는 방안도 검토 중이다.
이화영 LG AI연구원 AI 사업개발 유닛장은 아틀리에 플랫폼 무료화 질문에 "일부 무료도 고민 중이나 결국엔 수익화해야 한다"면서 "다양한 비즈니스 모델을 갖고 수익화를 고민 중"이라고 말했다.
LG AI연구원은 AI 반도체 협력과 더불어 자연재해 등 다양한 예측모델 개발에도 힘쓰고 있다.
배 원장은 "AI를 개발할 때 인프라 비용이 가장 큰 부분을 차지한다. 현재는 미국 중심의 텐서처리장치(TPU)나 그래픽처리장치(GPU)를 많이 사용하는 실정"이라며 "국내 팹리스인 퓨리오사 AI와 협력하면서 성능이 확보되면 사용할 계획이 있다"고 말했다.
그러면서 "엑사원은 다양한 분야로 서비스 확장을 준비 중이다. 오늘 발표하진 않았지만 수요예측, 주식시장 예측 등 생성형 AI 기술이 예측 문제를 잘 풀어갈 수 있고, 풀어가야 한다고 생각한다"면서 "잘 접목된다면 기후변화, 홍수변화 등에도 대응할 수 있을 것"이라고 덧붙였다.
뉴스웨이 이지숙 기자
jisuk618@newsway.co.kr
저작권자 © 온라인 경제미디어 뉴스웨이 · 무단 전재 및 재배포 금지
댓글