'LG 글로벌 AI 챌린지' 개최...주제는 '제로샷 이미지 캡셔닝'

김지영 / 2023-01-31 23:49:23

LG AI연구원이 시각 AI와 언어 AI의 융합 트렌드를 주도하기 위해 전세계 AI 연구자 대상으로 'LG 글로벌 AI 챌린지'를 개최한다.

2월 1일부터 4월 말까지 온라인으로 진행되는 'LG 글로벌 AI 챌린지'는 '제로샷 이미지 캡셔닝(Zero-Shot Image Captioning)'을 주제로 AI가 처음 본 이미지를 얼마나 정확하게 이해하고 설명하는지 평가하는 대회다.

'제로샷 이미지 캡셔닝'은 AI가 마치 사람의 시각 인지 능력처럼 처음 본 사물이나, 동물, 풍경 등이 포함되어 있는 이미지를 봤을 때나 일러스트레이션, 그래픽 등 표현 방식이 다른 이미지를 봤을 때 기존 학습한 데이터를 기반으로 스스로 이해하고 유추한 결과를 텍스트로 설명할 수 있는 기술이다.

'제로샷 이미지 캡셔닝'은 인간의 학습 구조를 모방한 초거대 AI가 등장하며 기술 연구가 활발해지고 있으며, 최근 화두가 되고 있는 텍스트를 이미지로 변환하는 '생성형 AI 모델'의 성능은 물론 이미지 검색의 정확도를 높이는 데도 활용되고 있다.

특히, 최근 자연어 검색 분야에서 반향을 일으키고 있는 ChatGPT 처럼 AI가 스스로 이미지를 이해하고 설명하며, 해시태그도 달 수 있는 이미지 캡셔닝 기술은 이미지 검색 분야에 혁신을 가져올 것으로 예상된다.

LG는 사람의 시각 인지 능력에 가까이 다가서는 제로샷 이미지 캡셔닝이 이미지를 텍스트로 표현하고, 텍스트를 이미지로 시각화할 수 있는 초거대 멀티모달 AI인 '엑사원(EXAONE)'의 기술 개발 생태계에 크게 기여할 것으로 기대하고 있다.

LG AI연구원은 공동연구센터를 설립해 초거대 멀티모달 AI인 '엑사원(EXAONE)'을 연구 중인 '서울대학교 AI대학원', 이미지 캡셔닝 AI의 상용화 서비스를 공동으로 준비 중인 '셔터스톡'과 함께 이번 경진대회를 진행한다.

세계 최대 규모의 이미지를 보유한 크리에이티브 플랫폼 기업인 셔터스톡은 편향성과 선정성 등에 대한 AI 윤리 검증을 끝낸 고품질의 이미지-텍스트 데이터셋 2만6000개를 무료로 제공한다.

해당 데이터셋은 사진 뿐 아니라 일러스트레이션, 그래픽 등 다양한 형태의 이미지를 포함하고 있어 대회 참가자들은 저작권과 비용, 품질에 대한 고민 없이 자신들의 AI 모델 최적화와 성능 평가를 진행할 수 있다.

[ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

김지영

IT/Tech, 금융, 산업, 정치, 생활문화, 부동산, 모빌리티

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0