탑배너 닫기

노컷뉴스

인공지능이 진짜같은 '가짜뉴스'를 만들었다

IT/과학

    인공지능이 진짜같은 '가짜뉴스'를 만들었다

    오픈AI "위험성 커 알고리즘 공개 안할 것"
    기존 2~3줄 단문형 AI봇 수준보다 뛰어나
    "아직 인간이 우세…언젠가 기자·작가 위협"

    (그래픽=노컷뉴스)

     

    2016년 러시아가 페이스북에 가짜뉴스를 유통해 미국 대선에 조직적으로 개입했다는 의혹이 파장을 일으켰다. 미연방수사국(FBI)까지 수사에 나섰지만 2년이 흐른 지금도 각국 정부와 정보기술(IT) 기업들이 벌이고 있는 '가짜뉴스와의 전쟁'은 여전히 진행중이다.

    '가짜뉴스'(Fake News)를 만들기 위해서는 실제 기사 작성에 익숙한 사람이 키보드를 두드려야 하지만 앞으로는 인공지능(AI)이 가짜뉴스를 유통하게 될 것이라는 우려가 나오고 있다.

    미국 샌프란시스코에 기반을 둔 비영리재단 오픈AI는 14일(현지시간) 가짜뉴스를 포함해 완벽에 가까운 뉴스 기사를 작성하는 기계학습 알고리즘(AI) 'GPT-2'를 공개했다. 이 알고리즘은 샘플로 제공된 글쓰기 스타일까지 모방할 수 있는 것으로 알려졌다.

    오픈AI가 인공지능에 제공한 문장은 사람이 작성한 단 두 줄.

    "오늘 신시내티에서 통제된 핵물질을 실은 열차가 탈취당했다. 이것의 행방은 알 수 없는 상태다. (A train carriage containing controlled nuclear materials was stolen in Cincinnati today. Its whereabouts are unknown.)"

    이 문장을 기반으로 오픈AI 알고리즘은 기사를 작성했다.

    오픈AI 인공지능 알고리즘이 작성한 기사
    이번 사건은 코빙턴과 애슐랜드역 사이에서 운행되는 도심 열차 노선에서 발생했다.

    The incident occurred on the downtown train line, which runs from Covington and Ashland stations.

    미국 에너지부는 오하이오 뉴스에 보낸 이메일에서 이 탈취범을 찾기 위해 연방철도청과 협력하고 있다고 밝혔다.

    In an email to Ohio news outlets, the U.S. Department of Energy said it is working with the Federal Railroad Administration to find the thief.

    톰 힉스 미 에너지부 장관은 성명을 통해 "이번 핵물질 탈취 사건은 공공 및 환경 보건, 우리의 노동력, 미국 경제에 중대한 악영향을 미칠 것"이라며 "우리의 최우선 과제는 탈취범을 찾아내 다시는 이런 일이 일어나지 않도록 하는 것"이라고 말했다.

    "The theft of this nuclear material will have significant negative consequences on public and environmental health, our workforce and the economy of our nation," said Tom Hicks, the U.S. Energy Secretary, in a statement. "Our top priority is to secure the theft and ensure it doesn't happen again."

    정부 관계자는 탈취당한 핵물질이 신시내티 대학 원자력 연구팀인 트라이앵글 파크 연구소의 것이라고 밝혔다.

    The stolen material was taken from the University of Cincinnati's Research Triangle Park nuclear research site, according to a news release from Department officials.

    원자력규제위원회는 아무런 입장도 내놓지 않았다.

    The Nuclear Regulatory Commission did not immediately release any information.

    에너지부에 따르면, 현재 이 사건은 에너지부 내 핵물질 안전 및 보안팀이 조사하고 있는 것으로 알려졌다.

    According to the release, the U.S. Department of Energy's Office of Nuclear Material Safety and Security is leading that team's investigation.

    힉스 장관은 "국민과 환경, 국가 비축 핵의 안전이 최우선"이라며 "진상을 규명하고 나쁜 선례가 생기지 않도록 하겠다"고 말했다.

    "The safety of people, the environment and the nation's nuclear stockpile is our highest priority," Hicks said. "We will get to the bottom of this and make no excuses.


    단순한 데이터만 입력했는데 거의 완벽한 수준의 기사가 만들어졌다. 하지만 이 기사는 AI가 만들어낸 가짜뉴스다. 오픈AI는 이 알고리즘이 가짜뉴스를 만드는데 악용될 수 있다며 알고리즘을 만드는 소스 코드와 훈련 데이터도 공개하지 않을 것이라고 밝혔다.

    오픈AI가 만든 기사작성 알고리즘 'GPT-2'는 이미 국내외 유명 미디어에서 시도중인 일명 'AI 로봇기자' 소프트웨어라고 할 수 있다. 필요한 데이터를 입력하면 AI가 자동으로 기사를 작성한다. 아직까지는 완벽하지 않아 스포츠나 금융과 같은 숫자 데이터를 기반으로 한 단문형 기사 작성에만 사용되고 있다. 하지만 오픈AI 기사작성 알고리즘은 데이터 소스 기반 기계학습 훈련을 통해 단 두 문장 만으로 사람이 작성한 것처럼 높은 수준의 기사를 작성할 수 있게 됐다.

    (사진=노컷뉴스DB)

     

    오픈AI는 민간 우주항공기업 스페이스X와 전기차 회사 테슬라를 소유한 억만장자 엘론 머스크가 설립한 비영리재단이다. 머스크는 평소 인공지능이 인류를 위협할 핵보다 더 위험한 존재라며 경계심을 늦춰서는 안된다고 비판해왔다.

    컴퓨터 과학자이자 자연어 처리 전문가인 뉴욕대의 샘 보우만은 블룸버그에 "프롬프트에서 만들어내는 문장은 매우 놀랍다"며 "우리가 이전에 본 어떤 것보다 질적으로 훨씬 더 정교한 문장을 만들어낼 수 있다"고 평가했다.

    지난 10년간 자연어 처리 기술이 비약적으로 발전하면서 특히 번역의 경우 거의 실시간 번역이 가능할 정도가 됐다. 구글은 번역기를 비롯해 유튜브 자막 번역, AI 음성비서인 구글 어시스턴트의 다중언어 번역 등 상당한 진전을 이룬 대표적인 선두 주자다.

    오픈AI의 'GPT-2'에 사용된 알고리즘도 2017년 구글이 만든 '트랜스포머(Transformer)'라는 새로운 신경망 설계를 기반으로 하고 있다. 알고리즘 훈련 방식은 비감독 학습법과 위노그라드 스키마 테스트, 람바다 등 크게 세 가지로 알려졌다.

    오픈AI의 정책실장은 "가짜뉴스에 대한 우려는 잘 알고 있다. 잘못된 정보가 생산·유통될 수 있다는 비판적 시각이 있지만 모든 면에서 다 맞는 얘기는 아니"라고 말했다. 다만 가짜뉴스 생산에 이용될 수 있어 내부적으로 공개하지 않기로 결정했다고 전했다.

    실제 인공지능이 적용된 자동화 시스템을 이용해 온라인 쇼핑몰의 리뷰를 가짜로 작성하거나 소셜미디어와 온라인에 가짜 정보를 조작해 유통, 국가 기관에 침투해 가짜 보고서를 만들어 핵전쟁을 유발하는 하는 등 인간의 가치 판단을 송두리째 흔들 수 있다는 우려가 여전히 제기되고 있다.

    복스 미디어의는 "문장은 거칠고 가끔 비연속적이며 기사의 문장이 길어질수록 일관성이 떨어진다"고 지적하면서도 "인간 저널리스트가 아직은 우세하지만 인상적인 잠재력으로 우리의 일자리를 넘보고 있다"고 전했다.

    최근 기술 기업들이 인공지능 기술을 활용해 가짜뉴스를 잡아낼 것이라고 공언하면서 머지않아 인공지능을 악용한 범죄가 발생하면 인공지능이 인공지능을 잡는 영화같은 시대가 올지도 모를 일이다.

    이 시각 주요뉴스


    실시간 랭킹 뉴스

    노컷영상

    노컷포토

    오늘의 기자