리로케이션 2.0 매거진 | VietBiz Korea (https://vietbiz.kr)
출처: Adobe Stock, 2026. 5.

베트남, AI 데이터 인프라 구축 착수… 핵심 데이터세트 목록 공개

베트남 정부가 국가 차원의 인공지능(AI) 데이터 인프라 구축에 착수한다.

베트남 정부는 6일 총리 결정 제804/QĐ-TTg를 통해 ‘핵심 분야 인공지능 발전을 위한 데이터세트 목록’을 공식 발표했다.

이는 정부가 앞으로 어떤 데이터를 국가 전략 자산으로 관리하고 구축할 것인지를 구체적으로 명시한 것으로, 핵심 분야 AI 발전을 위한 데이터세트 목록과 우선 구축할 데이터 목록이 포함됐다.

데이터세트에는 베트남어와 소수민족 언어 데이터, 국가 지식 데이터, 법률·행정 데이터, 과학기술 데이터, 의료·교육 데이터, 농업 데이터, 교통·도시 데이터, 경제·금융 데이터, 지도·공간 데이터, 통신·디지털 인프라 데이터, 문화·관광 데이터 등이 망라됐다. 정부는 단순한 텍스트 데이터를 넘어 이미지·영상·음성·위성·원격탐사 데이터까지 국가 AI 인프라 범위에 포함했다. 이는 앞으로 AI 활용 범위를 행정, 도시 운영, 교통, 산업, 환경, 보건 등 국가 운영 전반으로 확대하겠다는 방향을 명확히 한 것이다.

리로케이션 2.0 매거진 | VietBiz Korea (https://vietbiz.kr)
출처: 베트남 정부, 2026. 5.

특히 정부는 공안부가 데이터 구축 상황을 총괄·감독하고, 데이터베이스 연계와 동기화, 정책 수정·보완 건의까지 맡도록 했다.

이는 베트남 정부가 AI를 단순 기술 산업이 아니라 국가 안보와 데이터 주권 차원에서 접근하고 있음을 보여 준다는 분석이다. 결정문에는 데이터 수집·생성·활용 과정에서 개인정보 보호, 국가기밀 보호, 지식재산권 관련 법률을 준수해야 한다는 내용이 포함됐다. 또한 각 부처와 지방정부는 관리 범위 내 데이터를 수집·생성·표준화·레이블링하고, 이를 국가 AI 데이터베이스와 연결해야 한다.

우선 구축 데이터 목록에는 베트남어 대규모 언어모델(LLM) 개발을 위한 언어 데이터, 음성 데이터, 대화 데이터, 다국어 데이터, 언론·미디어 데이터, 법률 데이터, 프로그래밍·소스코드 데이터, 과학기술 데이터 등이 포함됐다. 컴퓨터 비전 AI를 위한 영상·이미지 데이터도 포함됐다. 의료 영상, 농업 이미지, 교통 이미지, 도시·인프라 이미지, 위성 영상 등이 대표적이다.

리로케이션 2.0 매거진 | VietBiz Korea (https://vietbiz.kr)
출처: 베트남 정부, 2026. 5.

AI 평가와 안전성을 확보하기 위한 데이터도 지정됐다. 베트남어 이해 능력 평가 데이터, 법률 이해 데이터, 프로그래밍 능력 평가 데이터, 문화·사회 이해 데이터, 허위정보 탐지 데이터, 악성코드·사이버 위협 탐지 데이터 등이다. 이는 베트남 정부가 AI 개발뿐 아니라 AI 검증·통제·안전성 관리 체계까지 동시에 구축하겠다는 의도로 볼 수 있다.

베트남 정부는 이번 결정에 따라 2030년까지 단계적으로 관련 데이터세트를 구축할 예정이다.

비엣비즈

댓글 작성