지난해 말부터 ‘ChatGPT’를 비롯한 다양한 생성형 인공지능(AI)이 대중들에게 공개되면서 큰 호응을 얻었다. 기초적인 대화가 가능한 모델부터 전문적인 분야에서 활용할 수 있는 다양한 생성형 인공지능은 우리의 일상생활에 편리함을 가져왔다. 특히 쉬운 사용 방법에 이용자들은 획기적인 속도로 창작물을 쏟아내고 있다. 그러나 AI 관련 전문가들은 생성형 인공지능의 창작물이 인터넷에 무분별하게 업로드되면서 오히려 정보 정확도가 떨어지는 ‘정보 오염’을 경고했다. 만약 정보 오염이 지속된다면, 사람들이 더 이상 인터넷을 믿을 수 없게 될지도 모른다는 섬뜩한 경고다.
인터넷상에서 정보 오염은 생성형 인공지능의 특성에 기반한다. 생성형 AI의 특성 중 하나는 인터넷에 공개된 대규모 데이터를 학습한다는 점이다. 생성형 인공지능은 정보 자원을 자동화된 방법으로 수집하는 방식인 크롤링 등을 통해 대규모 데이터를 입수하거나 공개된 데이터를 한데 모아 학습한다. 다만 지속적인 학습 과정에서 생성형 AI 모델은 환각을 겪을 가능성이 커진다. 인공지능이 겪는 환각이란 AI가 의미 없거나 틀린 대답, 잘못된 정보를 생성하는 행위를 말한다. 인공지능의 환각에는 수학 계산의 오류, 수리 논리에 대한 엉터리 추론, 역사적 사실에 대한 오류를 포함해 사회적 가치에 맞지 않는 편향 및 차별적 정보 생성까지 포함된다.
이 때문에 ChatGPT의 개발사인 ‘OpenAI’는 자사의 최신형이자 유료로 제공하는 인공지능 모델인 GPT-4의 정확성을 실험해 지난 3월에 발표했다. 발표 자료에 따르면 GPT-4는 부정확한 진술로부터 사실을 분리해 내는 확률이 GPT-3.5가 기록한 40%대는 넘어섰지만 60%에는 못 미쳤다는 게 드러났다. 이후 OpenAI는 자사의 인공지능이 개선되고 있다고 발표하면서도, 생성형 AI가 갖는 한계나 위험은 여전하다면서 사용 시 유의해달라고 당부했다.
한편 전문가들은 AI 기술이 정치적 허위 정보나 해킹 목적의 메시지 제작에 사용될 가능성에 대해서도 우려하고 있다. 실제로 지난 5월, 미국 국방부 건물인 펜타곤 인근에서 대규모 폭발이 있었다는 가짜뉴스가 생성형 인공지능에 의해 제작된 것으로 드러났다. 이로 인해 당시 미국 주식시장이 하락세로 전환하는 등, 실제로 대중에게 부정적인 영향을 끼칠 수 있다는 사실이 확인됐다.
명심해야 할 것은, 잘못된 정보를 수용하면서 발생하는 책임은 인공지능이 아닌 이용자에게 있다는 점이다. 따라서 생성형 인공지능이 대중화된 시대에 우리 학우들은 AI 콘텐츠를 순순히 수용하기보다는 능동적인 관점으로 바라볼 필요가 있다. 작은 습관 개선이 환경 보존에 도움을 줄 수 있는 것처럼, 인공지능 이용 윤리를 지키는 개개인의 노력을 통해 우리가 정보의 바다, 인터넷을 보호할 수 있길 바란다.