DNA에 데이터를 저장한다고?

현재 지구에는 약 10조 기가바이트의 디지털 데이터가 있으며 인간은 매일 250만 기가바이트 가량의 데이터를 이메일, 사진, SNS 활동 등을 통해 생성한다. 발생한 데이터는 엑사바이트 (1 엑사바이트 = 10억 기가바이트) 데이터 센터라는 축구장 여러 개 크기 규모의 시설에 저장되며 시설의 건설 및 유지 관리 비용은 약 10억 달러로 추정된다.

테크 컨설팅 기업인 Cambridge Consultants는 빠르면 2025년까지 데이터센터 만으론 인류의 데이터 저장 요구사항을 충족할 수 없을 것이라고 예측했다. 그리고 데이터센터는 냉각을 필요로 하므로 에너지 소모도 크다.

지속 가능하지 못한 기존의 데이터 저장 방식의 한계를 넘기 위해 연구되고 있는 방법 중 하나는 DNA에 데이터를 저장하는 것이다.

대량의 데이터를 DNA에 저장하다

DNA에 데이터를 저장하는 데 있어서의 가장 큰 강점은 작은 공간에 대량의 데이터를 저장할 수 있다는 것과 데이터 유지를 위한 에너지가 필요 없다는 점이다. MIT 생물 공학 교수 Mark Bathe는 “DNA는 플래시 메모리보다 밀도가 1000배 가량 높으며 DNA 폴리머를 생산해 놓으면 에너지 소비가 없고 1000년 동안 보존할 수 있다.” 라고 하며 이론적으로 DNA가 가득 찬 커피 머그잔 안에 전 세계의 모든 데이터를 저장할 수 있다고 했다.

최근 유전자를 자르는 가위로 불리는 CRISPR 기술의 발달로 인해 DNA 편집이 쉬워져 DNA를 원하는 염기서열로 손쉽게 합성하고 복제할 수 있다. 이런 특성을 활용해 DNA를 고분자 저장장치 재료로 사용하기 위한 연구가 활발히 이뤄지고 있다.

현재 우리가 생성하는 수많은 종류의 데이터는 0과 1을 사용하는 2진법을 통해 표현되며 저장된다. 하지만 DNA는 2진법으로 정보를 저장하지 않고 DNA를 구성하는 염기는 아데닌(A), 티민(T), 구아닌(G), 사이토신(C) 등 총 4가지가 존재하기 때문에 1개 비트에 총 4개의 정보를 저장하는 4진법이 쓰인다.

DNA에 데이터 저장을 상용화 하는 데 있어 가장 큰 걸림돌은 DNA를 부분구조합성하는 단계에서 발생되는 높은 비용이다. 현재 1 페타바이트(100만 기가바이트)의 데이터를 DNA에 기록하는데 1조 달러가 소요되며 기존의 데이터 저장방식과 경쟁력이 있기 위해서는 DNA 합성 비용이 최소 6배 이상 낮아져야 한다. Bathe 교수는 10~20년 사이에 경쟁력이 생길 것이라고 예측하고 있다.

2012년 하버드는 700 테라바이트를 1 그램의 DNA에 저장하는 데 성공했으며 2017년에는 살아있는 박테리아의 유전자에 GIF 애니메이션 파일을 코딩하는데 성공했다.

마이크로소프트, 웨스턴디지털, 시게이트, 그리고 카탈로그(CATALOG)와 같은 한국계 스타트업 등 40개 이상의 기업이 DNA Data Storage Alliance를 결합했으며 시장 조사기관인 가트너는 “2024년까지 디지털 비즈니스의 30%가 DNA 저장 기술 관련 시험을 의무화(mandate)할 것” 이라고 예측했다.