아페르투스(Apertus)는 챗GPT에 대항해 스위스가 개발한 거대언어모델(LLM) 및 멀티모달 인공지능(AI)이다. 2일 공개된 뒤 전 세계의 관심이 뜨거웠다. 사용해 보니 한국어 문답 능력에 손색이 없다. 앞서 공개된 프랑스의 미스트랄(Mistral)도 마찬가지다. 중국계 LLM이라면 딥시크(DeepSeek)가 떠오르지만, 사용자 저변이 넓은 모델은 큐웬(Qwen)이다. 큐웬도 우리말 사용에 불편이 없다. 아랍에미리트도 올해 K2 싱크(Think)를 내놓고 중동·아랍권 밖 전 세계 사용자를 늘리고 있다.
한글이 유창한 외국계 LLM이 쏟아지면서 디지털 세상에 격변이 일고 있다. 문서편집기 MS워드와 검색 포털 구글은 정보화 시대를 선도하며 전 세계를 장악했지만 한국에서는 독점은커녕 과점조차 이루지 못했다. 아래한글과 네이버·다음이 압도적 점유율로 시장을 지켰기 때문이다. 자국어 데이터 독보성을 지킨 사례가 전 세계에서 유일해서 디지털 세상의 한글 주권 독립에 비유되곤 했다. 한데, LLM이 검색 시장을 급속히 잠식하면서 검색 포털이 예전 같지 않다. AI가 관련된 추가 질문까지 제시하는 친절함을 내세워 국산 포털의 아성을 넘보는 것이다. 디지털 한글 생태계가 변곡점을 만났다.
챗GPT를 만든 오픈AI가 올해 한국 지사를 내면서 “한국 유료 구독자가 미국에 이어 전 세계 2위”라고 밝힌 바 있다. 외국계 AI 도구를 이용하면 한국어 대화 내용이 외국 서버에 쌓인다. 한국형 LLM이 퍼져 한국 서버에 축적된 데이터를 바탕으로 학습하고 발전하는 AI 생태계를 구축하지 못하면 기술·데이터 종속은 불가피하다. 세계 각국이 AI 경쟁력을 주권의 개념으로 보는 소버린(Sovereign) AI로 격돌하는 이유다.
IT 강국 한국이 LLM 분야에서 후발 주자가 된 처지가 무참하다. 하지만 추격전이 시작됐다. 네이버, LG, SK 등 대기업까지 참여하는 국가 프로젝트를 통해 전 세계 이용자를 겨냥한 AI 모델 개발이 진행 중이다. 배경훈 과학기술정보통신부 장관은 12일 “연내 한국형 LLM을 선보이겠다”고 발표했다. 이 모델을 오픈소스로 공개하고 개발자, 이용자 참여를 늘려 궁극적으로 전 세계인이 한국형 LLM을 사용하게 만들겠다는 포부다.
바야흐로 AI 민족주의(Nationalism, 혹은 국가주의) 시대다. 빛의 속도로 발전하는 AI 개발 경쟁에서 2, 3위는 의미가 없다는 각오가 필요하다. AI 시대 한글 주권, 아무리 강조해도 지나치지 않다. 김승일 논설위원 dojune@
김승일 논설위원 dojune@busan.com