한국어 질의 시 타 언어로 답변 생성되는 오류 해소…모델 정렬 사용
[아이티데일리] 제논(대표 고석태, 구 마인즈앤컴퍼니)은 컴퓨터 비전·인공지능(AI) 분야 ‘국제컴퓨터비전학회(ICCV) 2025’에 논문이 채택됐다고 16일 밝혔다.
ICCV는 컴퓨터비전·패턴인식학회(CVPR), 유럽컴퓨터비전학회(ECCV)와 함께 컴퓨터 비전 분야를 대표하는 3대 국제학술대회다. 전기전자공학자협회(IEEE)와 컴퓨터비전재단(CVF)이 공동 주관하는 최상위 학회로 꼽힌다.
제논은 올해 10월 하와이 호놀룰루에서 개최되는 ICCV 2025에서 이번에 채택된 논문인 ‘혼란 인식 선호 최적화 파이프라인을 통한 멀티모달 기반 모델의 언어 혼란 완화(Mitigating Language Confusion for Multimodal Foundation Models via Confusion-Aware Preference Optimization Pipeline)’를 발표할 예정이다.
논문에서 제논은 사용자가 원하는 언어가 아닌 다른 언어로 답변하는 언어 혼동(Language Confusion) 문제를 해결하기 위한 파이프라인(Confusion-Aware Preference Optimization Pipeline)을 제시했다. 이번 논문에는 명대우 파트너(CTO)와 강병석 이사의 주도 아래 김현근 팀장, 황승현, 임성준, 김준철 매니저 등 제논 R&D팀 소속 AI 엔지니어들이 참여했다.
제논은 이번 논문에서 프롬프트 엔지니어링이 아닌 모델 정렬(Alignment) 적용을 제안했다. 오픈소스 LLM 모델을 사용할 때 한국어로 질의했는데도 답변이 중국어나 일본어 등 다른 언어로 생성되는 오류를 줄이기 위한 기술적인 대안이다.
구체적으로는 프롬프트 내 등장 토큰(Seen Token) 및 응답의 고유명사(NER)를 허용 목록으로 처리해 불필요한 언어 혼동을 줄였다. 문장 내 혼동 유무 여부에 따라 서로 다른 방법을 적용해 DPO(Direct Preference Optimization) 학습에 적합한 선호 쌍을 구성하는 방식을 제안했다. 이후 이 데이터 쌍을 기반으로 DPO 학습을 수행해 모델이 보다 일관되고 명확한 출력을 선호하도록 조정했다.
제논은 논문을 통해 기존 모델들과 비교해 주요 언어에서 성능이 개선됐고, 답변의 품질에도 손실이 없었다. 일부 답변에서는 오히려 답변 품질이 향상됐음을 확인했다. 제논은 기술에 대한 특허 출원 절차 또한 진행 중이다.
이번 논문을 주도한 제논 명대우 CTO는 “기존에 GPT나 큐웬과 같은 오픈소스 LLM 모델을 사용하면 사용자가 한국어로 질문하더라도 답변이 중국어로 생성되는 등의 오류가 자주 발생했는데, 이번 논문에서 이를 해결할 수 있는 방법을 제시한 것”이라면서 “논문 채택을 통해 기술적 우수성이 확인된 만큼, 많은 기업이 그동안 해결 방법을 고민했던 문제를 적은 비용으로 개선할 수 있는데다 실제 고객사에 적용되는 상용화 서비스의 품질 향상도 함께 꾀할 수 있다는 점에서 폭넓은 활용이 기대된다”고 말했다.
한편, 제논은 생성형 AI 플랫폼 전문 기업으로 관련 AI 기술의 연구·개발 역량 강화에 힘쓰고 있다. 자율형 AI 에이전트(Autonomous AI Agent), 맞춤형 AI 에이전트(Personalized AI Agent), 컴퓨터 유즈(Computer-Use) 기반의 업무 수행형 AI 에이전트(Actionable AI Agent) 등 차세대 AI 기술을 바탕으로 진화된 형태의 AI 에이전트를 구현할 수 있도록 선행 연구를 통해 기술 경쟁력을 확보하고 있다.
2023년 10월 허깅페이스 경량화 LLM 모델 성능에서 전체 2위를 차지하고, 한국어 모델 성능을 평가하는 오픈 Ko-LLM 리더보드에서 2023년 10월 1위를 달성 후 지난해 1월까지 상위 10위권을 유지하는 등의 기술적 성취도 이어가는 중이다.


