탑배너 닫기

노컷뉴스

'업스테이지 도용 의혹' 제기한 사이오닉AI "검증 엄밀하지 못해 사과"

  • 0
  • 0
  • 폰트사이즈

기업/산업

    '업스테이지 도용 의혹' 제기한 사이오닉AI "검증 엄밀하지 못해 사과"

    • 0
    • 폰트사이즈
    핵심요약

    사이오닉AI 대표 "검증 충분하지 못했다" 사과
    레이어 유사성 근거 도용 주장 제기…업스테이지 "통계적 착시…모델 대부분 달라" 반박
    정부 "기술 논쟁·검증, AI 생태계 성장 과정" 평가

    연합뉴스연합뉴스
    국내 독자 인공지능(AI) 파운데이션 모델 정예팀 가운데 한 곳인 업스테이지의 중국 AI 모델 도용 의혹을 제기했던 사이오닉AI 고석현 대표이사가 해당 주장이 충분한 검증을 거치지 못했다며 사과했다.

    4일 정보통신기술(ICT) 업계에 따르면 고 대표는 전날 자신의 소셜미디어(SNS)를 통해 "레이어놈 레이어 값의 코사인 유사도만으로는 모델 가중치 공유 여부를 결론 내리기 어렵다"며 "해당 근거를 엄밀하게 검증하지 않은 채 공개해 불필요한 혼란과 논란을 야기한 점에 대해 진심으로 사과한다"고 밝혔다.

    앞서 고 대표는 지난 1일 업스테이지의 AI 모델 '솔라 오픈'이 중국 AI 기업 지푸AI의 'GLM-4.5-에어'와 일부 레이어에서 결정적인 유사도를 보인다고 주장하며 도용 가능성을 제기했다.

    이에 대해 김성훈 업스테이지 대표는 2일 공개 검증회를 열고 해당 주장이 사실이 아니라고 반박하며 사과를 요구했다. 김 대표는 레이어놈 유사성을 근거로 모델 가중치 공유를 주장한 것은 통계적 착시에 불과하다고 설명했다.

    김 대표는 문제가 됐던 구간이 모델 전체에서 차지하는 비중이 약 0.0004%에 불과한 극히 일부라고 설명했다. 솔라 오픈의 나머지 99.9996%는 다른 모델과 구조적으로 다르다는 것이다.

    또 유사성 판단에 사용된 '코사인 유사도'는 벡터의 방향만 비교하는 단순한 지표로, 언어모델의 레이어 구조가 비슷할 경우 서로 다른 모델 사이에서도 높은 값이 나올 수 있다고 설명했다.

    김 대표는 솔라 오픈이 GLM-4.5-에어의 토크나이저를 사용했다는 주장도 사실과 다르다고 반박했다. GLM 계열의 어휘 수는 약 15만 개인 반면, 솔라 오픈은 약 19만6천 개로 두 모델의 어휘 규모 자체가 다르다는 설명이다. 공통으로 사용하는 어휘도 약 8만 개에 그쳐, 동일한 토크나이저로 보기 어렵다고 덧붙였다.

    김 대표는 "기술적 논의와 검증은 환영하지만, 충분한 검증 없이 허위 사실을 단정적으로 전달하는 행위는 업스테이지와 정부가 추진하는 AI 경쟁력 강화 노력의 의미를 훼손할 수 있다"고 말했다.

    이번 논란이 3일 만에 일단락되자 정부 인사들도 관련 입장을 밝혔다. 배경훈 부총리 겸 과학기술정보통신부 장관은 SNS를 통해 "AI 업계를 달군 기술적 논쟁을 지켜보며 대한민국 AI의 가능성을 확인했다"며 "의혹 제기와 공개 검증, 그리고 책임 있는 사과까지가 건강한 AI 생태계의 모습"이라고 평가했다.

    배 장관은 이어 "정부는 AI 생태계가 성숙하게 발전할 수 있도록 심판이자 페이스메이커 역할을 하겠다"며 "독자 AI 파운데이션 모델 정예팀 5곳에 대한 평가는 오는 15일까지 진행할 예정"이라고 밝혔다.

    하정우 대통령실 AI미래기획수석도 자신의 SNS에 "기술적이고 건설적인 토론과 검증, 그리고 깔끔한 승복까지가 한국 AI 생태계의 글로벌 경쟁력을 보여주는 장면"이라고 적었다.

    ※CBS노컷뉴스는 여러분의 제보로 함께 세상을 바꿉니다. 각종 비리와 부당대우, 사건사고와 미담 등 모든 얘깃거리를 알려주세요.

    이 시각 주요뉴스


    실시간 랭킹 뉴스

    노컷영상

    노컷포토

    오늘의 기자