인공지능(Artificial Intelligence, AI) 기술의 비약적인 발전과 산업화 흐름은 비교적 최근에 일어난 일입니다. 이렇게 AI가 급성장할 수 있었던 이유는 고성능 컴퓨팅, 대용량 데이터, 첨단 반도체, 고속 인터넷 등 AI 기반 기술과 관련 산업의 발전에 힘입은 결과입니다.
이러한 기술적 기반 위에서 개발되는 AI 기반 시스템은 실제 환경의 문제를 해결하기 위한 응용 솔루션으로 기능합니다. 예를 들어, 특정 업무를 자동화하거나 복잡한 의사결정을 지원하는 형태로 현실에 적용되고 있습니다.
AI 기반 시스템을 개발하기 위해서는 데이터 준비, AI 모델링, 시뮬레이션 및 테스트, AI 배포 단계를 거칩니다. 이때 데이터 수집은 전 과정의 출발점이자 핵심 단계로, 이 과정에서 오류가 발생할 경우 추후 잘못된 데이터 분석 결과 및 의사 결정을 초래할 수 있습니다. 따라서 데이터 수집의 정확성과 신뢰성을 확보하는 것은 AI 시스템 개발의 가장 중요한 과정이라고 할 수 있습니다.
하지만 데이터 수집을 안정적으로 진행하기란 쉽지 않은 일입니다. AI 기반 시스템의 데이터를 수집하고 학습하는 과정에서는 오염 공격(Poisoning Attack)과 백도어 공격(Backdoor Attack)이 발생할 수 있습니다. 이러한 공격은 AI 모델에 잘못된 데이터를 학습시켜 오작동하게 만듭니다. 특히, 학습 데이터셋을 조작해 AI 모델의 성능을 왜곡시키는 Poisoning Attack은 공격자가 의도적으로 잘못된 데이터를 지속적으로 주입하여 모델 자체를 오염시키는 결과를 초래합니다.
이러한 위협을 사전에 방지하기 위한 방안으로, 스마트 컨트랙트(Smart Contract) 기술의 활용이 주목받고 있습니다. 스마트 컨트랙트는 신뢰할 수 없는 당사자 간에도 제3자의 개입 없이 계약을 자동으로 체결하고 이행할 수 있도록 블록체인 위에서 실행되는 코드입니다. 쉽게 말해, 특정 조건이 충족되면 자동으로 계약이 실행되는 구조로, 별도의 관리자가 없어도 신뢰성과 투명성을 확보할 수 있습니다.
이 기술이 보안 측면에서 유효한 이유는 블록체인의 분산 저장 구조에 기반합니다. 블록체인 네트워크 내 일부 노드의 정보는 외부 공격으로 위변조될 수 있지만, 해당 내용이 네트워크 전체에 반영되려면 전체 노드가 저장하고 있는 체인 정보를 동시에 변조해야 합니다.
또한, 블록체인은 중앙 집중형 관리가 필요 없기 때문에 내부자에 의한 조작이나 정보 유출의 위험도 크게 줄일 수 있습니다. 이러한 구조적 특성 덕분에 스마트 컨트랙트는 AI 학습 과정에서 발생할 수 있는 데이터 위변조나 공격을 식별하고 방지하는 데 효과적으로 활용될 수 있습니다.
이러한 스마트 컨트랙트를 활용한 보호 방식은 크게 세 단계로 나누어 설명할 수 있습니다. ①보호 대상이 되는 학습 데이터셋을 선정하는 단계 ②이를 스마트 컨트랙트 형태로 구현하는 개발 단계 ③블록체인 네트워크에 해당 데이터셋의 해시값을 배포하는 단계입니다.
① AI 허브를 통한 학습 데이터셋 선정 단계
위변조 여부를 검증하기 위한 데이터셋은 AI 허브에서 수집합니다. AI 허브는 한국지능정보사회진흥원에서 운영하는 데이터셋 지원 통합 포털로, AI 기술 및 제품·서비스 개발에 필요한 AI 인프라를 지원함으로써 누구나 활용하고 참여하는 AI 통합 플랫폼입니다. 대표적으로, AI 데이터, AI 소프트웨어 애플리케이션 프로그래밍 인터페이스(Software Application Programming Interface, SW API) 컴퓨팅 자원이 여기에 해당됩니다.
데이터셋 선정을 이해하기 위해 다음과 같은 예시를 들 수 있습니다. <그림 1>은 AI 허브에서 ‘AI 기반 미술심리 진단을 위한 그림 데이터 구축’으로 데이터셋을 선정하여 7세~13세 연령대의 아동 7,000명으로부터 수집한 그림(집, 나무, 여자, 남자)입니다.
AI 허브의 다운로드용 팝업 화면에서 실제 다운로드한 학습 데이터셋은 <그림 2>와 같이 총 11,200개의 데이터로 이루어져 있습니다.
좌 <그림 1> 선정된 학습 데이터셋 / 우 <그림 2> 다운로드한 학습 데이터셋
다운로드한 원본 학습 데이터셋 중 하나의 이미지를 선택하여 <그림 3>과 같이 원본 이미지로 정의하고, <그림 4>처럼 이미지를 일부 수정해 변조 이미지로 설정합니다. 그러면 변조 이미지가 포함된 학습 데이터셋은 변조 학습 데이터셋으로 간주됩니다.
좌 <그림 3> 원본 이미지 / 우 <그림 4> 변조 이미지
② 스마트 컨트랙트 개발 단계
스마트 컨트랙트 개발에는 Solidity 언어를 사용합니다. Solidity는 이더리움(Ethereum) 기반의 블록체인 플랫폼에서 실행되는 프로그래밍 언어로, 현재 가장 널리 활용되고 있습니다. 이 언어는 다양한 정적 데이터 유형뿐만 아니라 동적 배열 및 매핑과 같은 일부 동적 데이터 유형도 지원합니다.
스마트 컨트랙트를 블록체인 네트워크에 배포하고 데이터를 블록에 저장하기 위해서는, 원본 학습 데이터셋의 해시값이 필요합니다. 이때 사용하는 해시 알고리즘은 SHA-256(Secure Hash Algorithm 256)입니다.
SHA-256은 입력된 데이터를 고정된 길이의 암호화된 문자열로 변환해 주는 알고리즘으로, 입력값이 조금만 바뀌어도 전혀 다른 해시값이 생성됩니다. 이를 통해 데이터가 변경되었는지를 손쉽게 검증할 수 있기 때문에, 블록체인에서 데이터 무결성을 확인하는 데 핵심적인 역할을 합니다.
③ 배포 단계
스마트 스마트 컨트랙트 개발이 완료되었다면 블록체인이 적용되는 여러 네트워크 중 하나인 이더리움 네트워크에 스마트 컨트랙트를 배포합니다. 이더리움 네트워크는 메인넷(Main net)과 테스트넷(Test net)으로 구분됩니다. 여기서 메인넷은 실제 가치가 거래되고 분산원장에 기록되는 공개 이더리움 운영 네트워크이며, 테스트넷은 개발자가 메인넷에 배포하기 전에 기능을 안전하게 검증할 수 있도록 마련된 개발용 테스트 환경입니다. 데이터셋의 목적이 원본 학습 데이터셋의 무결성을 실증하는 데 있는 만큼, 비용 효율성과 테스트의 안전성을 고려하여 테스트넷에 배포하는 것이 중요합니다.
이처럼 세 단계 과정을 거쳐 스마트 컨트랙트를 테스트넷에 배포하면, 해당 컨트랙트는 블록체인 내의 특정 블록에 기록됩니다. 이때 생성된 블록의 번호는 배포 결과를 통해 확인할 수 있습니다.
배포 결과 모습
스마트 컨트랙트의 배포는 하나의 트랜잭션(이하 배포 트랜잭션)으로 처리되며, 이는 블록체인 내의 특정 블록에 저장됩니다. 이렇게 블록체인에 저장된 원본 학습 데이터셋 해시값은 변조 위험이 매우 낮다고 볼 수 있습니다.
그 이유는 블록체인이 합의 알고리즘을 통해 네트워크 참여자 모두가 동일한 데이터를 유지하도록 하고, 정해진 조건을 충족할 때만 블록이 추가될 수 있도록 설계되어 있기 때문입니다. 만약 Poisoning Attack 등으로 원본 학습 데이터셋이 변경된다면, 그에 따라 해시값도 달라지고, 이후 연결된 블록들의 해시값까지 불일치하게 되어 체인의 무결성이 깨집니다. 이런 경우 블록체인을 조작하려면 네트워크의 과반수(이른바 51% 공격)를 장악해야 하는데, 이는 현실적으로 매우 어렵고 막대한 비용이 수반되기 때문에 사실상 불가능에 가깝습니다.
지금까지 AI 기반 시스템 개발 과정에서 발생할 수 있는 보안 위협, 특히 Poisoning Attack과 같은 공격에 대해 살펴보고, 이를 사전에 방지하기 위한 스마트 컨트랙트 기술의 적용 방안을 소개하였습니다.
스마트 컨트랙트를 활용하면 별도의 암호키 없이도 데이터를 안전하게 기록하고 검증할 수 있는 블록체인의 구조적 특성을 통해, 외부 공격이나 내부 조작으로부터 데이터셋을 효과적으로 보호할 수 있다는 가능성을 확인할 수 있었습니다.
데이터의 신뢰성이 보장될 때 비로소 AI 시스템 역시 그 가치를 인정받을 수 있습니다. 이제 기업은 AI의 성능뿐만 아니라 데이터 무결성과 보안성 확보를 위한 기술적 기반에도 주목해야 하며, 스마트 컨트랙트와 같은 구조적 보안 기술을 실질적으로 도입해야 할 시점입니다.
앞으로도 기업들이 신뢰할 수 있는 AI 환경을 구축하기 위해 데이터 보호의 중요성을 인식하고, 이를 기술적으로 뒷받침할 수 있는 체계적인 대응에 적극 나서기를 기대합니다.
본 콘텐츠는 저작권법에 의해 보호 받는 저작물로 LG CNS에 저작권이 있습니다.
사전 동의 없이 2차 가공 및 영리적인 이용을 금합니다
기업명을 두 글자 이상 입력해주세요.
소식을 받아 보시려면 마케팅 정보 활용과 마케팅 정보 수신에 모두 동의해 주셔야 합니다.
제출이 완료되었습니다.
제출이 완료되었습니다.
확인 버튼을 누르시면 자사 홈페이지 홈화면으로 이동됩니다.
요청하신 자료가 이메일로 발송되었습니다.
구독 설정이 저장되었습니다.
잘못된 접근입니다. 정상적인 경로를 통해 다시 시도해 주세요.
검색 중 오류가 발생했습니다. 다시 시도해주세요.
제출에 실패하였습니다.
다시 시도해주세요.
사업자등록번호는 10자리를 입력해주세요.