[오픈소스 도전과 기회 ③] 오픈소스 AI 모델 활용 위한 기업 자정 노력 필요

품질 검증 및 라이선스, 저작권 등 책임 있는 개발·활용 위한 정부 노력 필요

2025-06-30     박재현 기자

[아이티데일리] 최신 IT 기술의 중심에는 언제나 오픈소스가 있다. 빅데이터, 클라우드, 그리고 최근의 생성형 AI까지, IT 패러다임이 바뀔 때마다 오픈소스의 중요성은 오히려 더 커졌다. 오픈소스 활용 역량이 부족하면 새로운 기술을 제대로 구현하기 어렵다.

이러한 상황에서 생성형 AI로 인해 오픈소스 생태계에도 많은 변화가 일어나고 있다. 생성형 AI가 만드는 코드에 대한 품질 문제, 저작권 및 윤리 문제, 라이선스 관리에 대한 중요성이 강조되는 등 오픈소스에도 예측 불가능한 변화의 파도가 몰려오기 시작했다. 생성형 AI 시대, 오픈소스 생태계가 마주할 도전과 기회는 무엇인지 3회에 걸쳐 조명해 본다.

[오픈소스 도전과 기회 ①] 오픈소스 생태계, 생성형 AI로 저변 확대
[오픈소스 도전과 기회 ②] AI 코드 개발 트렌드 떠오르며 품질 검증 과제 대두
[오픈소스 도전과 기회 ③] 오픈소스 기반 AI 모델 활용 위한 기업 자정 노력 필요

부분적 개방 ‘오픈워싱’ 전략 대두…장기간 지속될 경우 생태계 악영향

최근 많은 기업이 자체적으로 학습·개발한 AI 모델을 오픈소스로 공개하고 있다. 이는 AI 기술을 민주화한다는 점에서 바람직한 일이며 더 많은 개발자와 연구자들이 AI 기술에 접근하고, 모델을 개선하며 새로운 기능을 추가할 수 있게 된다. 텐서플로우나 파이토치와 같은 오픈소스 프레임워크와 모델은 이미 AI 연구 및 개발의 표준으로 자리잡아 생태계를 확장하고 있다. 전 세계적으로 AI 경쟁이 촉진되는 상황에서 특정 기업의 독점을 막는 역할을 하고 있다.

하지만 그 이면에는 보안 취약성 증가, 악용 가능성, 독점적 활용을 통한 수익 창출이라는 문제를 야기하기도 한다. 누군가는 공개된 AI 모델을 딥페이크 등에 악의적으로 사용할 수 있고, 개발자가 모델에서 취약점을 발견하면 광범위한 피해가 발생할 수 있다.

최근에는 AI 모델을 전적으로 공개할 경우 여러 문제가 발생할 수 있다는 점 때문에 부분적으로 개방하는 ‘오픈워싱(Openwashing)’ 전략을 채택하는 기업들이 늘고 있다. 오픈워싱은 AI 모델을 구성하는 코드와 가중치는 공개하되, 학습 데이터와 훈련 과정은 비공개한다.

오픈AI가 GPT-2까지는 공개했지만, GPT-3부터 모델을 비공개로 운영하며 API 기반 서비스로 전환한 것이 대표 사례다. 오픈AI는 학습 데이터와 훈련 알고리즘을 비공개로 유지하면서도 GPT 기반의 유료 API 서비스를 제공하며 AI 생태계를 선점하는 전략을 택했다. 연구 초기 ‘AI 기술을 모두에게 개방한다’는 비전을 내세웠지만, AI 기술이 상업화되면서 기업 중심의 폐쇄적인 운영 방식을 선택한 것이다.

AI 모델의 훈련과 운영에는 막대한 비용이 들어가는데, 기업이 AI 모델을 전부 공개하면 경쟁사들이 해당 모델을 무료로 사용할 가능성이 높아지고 이는 결국 경쟁력 약화로 이어지게 된다. 이런 이유로 AI 기업들은 AI 모델 전체를 공개하지 않고 제한적으로 공개하는 오픈워싱을 채택하고 있다. 오픈워싱을 채택하는 또 다른 이유는 학습 데이터까지 다 공개하는 과정에서 AI 모델 개발 시 발생할 수 있는 저작권 문제 때문이다.

오픈워싱 전략이 장기화되면 오픈소스 생태계에 부정적인 영향을 미칠 수 있다. 예를 들어 메타는 라마(LLaMA) 모델에 제한적 라이선스를 적용해 오픈소스의 장점은 살리면서도 자사 이익을 보호하고 있다. 이런 전략은 단기적으로는 기업의 법적 리스크를 줄이고 투자 회수에 도움이 된다 하지만 오픈소스 생태계의 개방성과 혁신이 위축될 수 있다는 우려도 있다. 오픈소스 생태계가 건강해야 AI 모델과 비즈니스 모두 성장할 수 있다. 기업들이 오픈소스의 개방성과 자사 비즈니스 모델 간의 균형점을 신중히 찾아야 하는 이유이다.


오픈소스 기반 AI 모델 활용 위한 기업 자정 노력 필요

생성형 AI 시대 오픈소스의 가치와 중요성은 더욱 커지고 있다. 오픈소스 기반 AI 모델의 책임 있는 개발 및 활용을 위해서는 이를 활용하는 기업의 자정 노력과 정부의 지원 및 가이드라인이 필요한 상황이다.

AI 및 SW 업계 복수의 관계자들은 오픈소스 기반 AI 모델 활성화를 위해서는 산업 현장의 목소리를 정책에 적극적으로 반영해야 한다고 주장한다. 급변하는 AI 기술 트렌드와 오픈소스 생태계의 특성을 제대로 이해한 후 정책과 가이드라인을 제정해야 한다는 것.

이와 관련 AI 기업 한 관계자는 “국내 오픈소스 AI 모델인 카카오의 ‘카나나’, 네이버클라우드의 ‘하이퍼클로바X’는 기업이 단독으로 개발한 것이 아니라 연구자·개발자 커뮤니티 등 다양한 현장 주체의 참여와 협력을 통해 발전해왔다. 단순한 코드 공개를 넘어, 현장 의견이 반영돼야 연구자·기업의 실제 활용성이 높아지고 국내 AI 경쟁력 강화로 이어질 수 있다”고 말했다.

특히 공공사업 및 조달 정책에서 오픈소스 AI 모델의 진입장벽을 해소하는 노력도 요구된다. 현재 조달 정책은 오픈소스 기반 AI 솔루션 활성화를 고려하지 않아 현장의 다양한 혁신적인 모델이 공공 영역에 진입하기 어려운 상황이다.

한국오픈소스협회 심호성 부회장은 “생성형 AI 시대, 오픈소스가 AI 관련 정책에 담겨야 한다”며 “오픈소스 활용 내역을 명확히 할 수 있는 제도, 품질 관리 기준, 그리고 조달 체계 등 다각적인 정부의 노력이 필요하다”고 말했다.

또한 정부가 오픈소스 정책을 설계하는 과정에서 글로벌 표준을 지향해야 한다는 목소리도 제기되고 있다. 2027년부터 유럽은 소프트웨어 자재명세서(SBOM, Software Bill of Materials) 법제화를 시행하게 된다. 미국은 행정명령을 통해 소프트웨어 공급망 관리의 중요성을 강조하고 있다. 중국 정부에 제품을 공급하기 위해서는 코드를 공개해야 한다. 이에 발맞춰 우리 정부도 △SBOM 등 국제 표준 도입 △라이선스 및 보안 검증 강화 △오픈소스 활용 생태계 확장 △민관 협력 및 실질적 지원책 확대 등을 통해 국내 기업들이 오픈소스 기반 AI 모델로 서비스를 개발하고 수출할 수 있도록 해야 할 것이다.

KISA가 정의한 SBOM (출처: KISA)

물론 우리 기업들의 자정 노력도 필요하다. 현재 우리나라 SW 기업 대다수는 패키지 솔루션을 개발하는 과정에서 오픈소스 코드를 활용하고 있으나 이를 공개하는 것을 꺼리는 경향이 있다. SBOM과 같은 법·제도 시행을 눈앞에 둔 상황에서 오픈소스를 사용한 것을 숨기지 말아야 한다.

국내 기업들은 그동안 오픈소스를 활용했다고 밝히면 솔루션의 가치가 떨어진다는 우려를 갖고 있었다. 그러나 이제는 오픈소스 사용 사실을 숨길 수 없게 됐다. 오히려 기업이 오픈소스 활용 내역을 투명하게 공개할 경우 솔루션의 신뢰도와 가치가 높아질 수 있다.

한국오픈소스협회 심호성 부회장은 “생성형 AI 시대 오픈소스 생태계는 혁신의 토대가 됐고, 글로벌 SW 진출을 위한 신뢰 기반으로 자리매김하고 있다. 이를 잘 보여주는 사례가 국내 보안기업인 라온시큐어다.

라온시큐어는 인도네시아 국가 디지털 ID 설계 컨설팅을 마쳤다. 지난해에는 ‘옴니원 디지털아이디’를 오픈소스로 공개해 깃허브를 통해 ‘옴니원 오픈 DID 프로젝트’를 운영하며 개발자들의 참여를 도모하고 있다”면서 “글로벌로 진출을 고려한다면 기업의 솔루션에 적용된 오픈소스 코드를 숨겨선 안 된다. 오픈소스를 공개하는 글로벌 표준을 기준으로 삼아야 진출도 가능하다. 국내 기업들이 오픈소스 활용 공개에 대한 인식을 전환해야 하는 시점이다”라고 사례를 들어 설명했다.

[인터뷰] “AI 모델과 같은 제철 생선도 중요하지만 건강한 오픈소스 바다 가꿔야”
한국오픈소스협회 심호성 부회장

생성형 AI 시대, 오픈소스 생태계가 건강하고 지속 가능하게 발전하기 위해 가장 중요한 것은 특정 AI 모델에만 초점을 맞추는 것이 아니라, 다양한 AI 모델이 잘 자라고 자유롭게 활용될 수 있는 오픈소스 생태계 자체를 튼튼하게 가꾸는 일이다.

봄에는 도다리, 여름에는 민어, 가을에는 전어, 겨울에는 대방어처럼, 시기마다 주목받는 제철 생선이 있다. 제철 생선도 중요하지만, 이 생선들이 오랫동안 우리 식탁에 오르기 위해선 건강한 바다라는 환경이 뒷받침돼야 한다. 특정 오픈소스 기반 생성형 AI 모델(제철 생선)에 대한 관심도 필요하지만, 그보다 더 중요한 것은 AI 모델이 지속적으로 활용될 수 있는 생태계(바다)를 조성해야 한다.

AI라는 트렌드는 앞으로도 지속될 것이다. 이런 상황에서 오픈소스 생태계를 건강하게 지켜낼 방법을 고민해야 한다. 오픈소스 생태계라는 바다는 잔잔할 때도 있지만, 때로는 파도(위기)가 치기도 한다. 파도에 휩쓸리지 않고 안전하게 항해하기 위해서는 전략이 필요하다.

구체적으로 오픈소스 커뮤니티의 자율적인 검증과 협력 문화를 더욱 활성화해, AI가 생성한 코드의 품질을 높이고 문제 발생 시 신속히 대응할 수 있는 역량을 키워야 한다. 이를 위해 정부, 기업, 커뮤니티가 긴밀히 협력해 정보 공유, 표준 제정, 교육 등을 함께 추진해야 한다.

생성형 AI가 인류에 기여하는 혁신 기술로 자리 잡으려면, 오픈소스 생태계의 장기적 번영을 위한 전략이 필요하다. 우리는 오픈소스라는 바다를 안전하게 항해할 준비가 되어 있는가. 이 질문에 대한 답이 AI 시대 한국 오픈소스의 미래를 좌우할 것이다.