기사를 읽어드립니다Your browser does not support theaudio element.0:00백롱민 국가통합바이오빅데이터구축사업 단장은 국민이 기탁한 혈액 한 병과 건강 기록이 10년 뒤 암의 원인을 밝히고 치매를 예방하는 연구의 토대가 될 수 있다고 강조한다. 최지현 기자 광고같은 병에 걸려도 누구는 약이 잘 듣고, 누구는 그렇지 않다. 어떤 사람은 평생 담배를 피워도 폐암에 걸리지 않지만, 비흡연자인데 폐암 진단을 받는 이도 있다. 유전자와 생활습관, 환경이 복잡하게 얽혀 질병을 만들어내기 때문이다. 2000년대 접어들면서 기술의 발달과 함께 전문가들은 그 해답을 데이터에서 찾기 시작했다. 한 사람의 유전체 정보와 진료 기록, 생활습관을 함께 연결해 분석하면 지금까지 보이지 않던 질병의 경로가 드러날 수 있기 때문이다. 더불어 인공지능(AI) 기술이 급속도로 발전하면서 바이오 데이터의 가치는 한층 높아졌다. 유전체 정보와 임상 데이터를 동시에 학습하는 AI가 등장하면서, 바이오 데이터는 정밀의료와 신약 개발, 의료 AI를 움직이는 핵심 자원이 됐다. 선진국들은 이미 오래전부터 움직였다. 영국은 2006년부터 50만 명 규모의 UK 바이오뱅크를 구축했고, 미국은 100만 명 규모의 ‘올오브어스’(All of Us) 프로젝트를 진행하는 등 바이오 데이터 기반 구축은 필수적인 인프라로 자리 잡고 있다. 광고 한국도 속도를 내고 있다. 2024년 시작된 국가통합바이오빅데이터구축사업은 2032년까지 국민 100만 명의 임상·유전체·생활습관 데이터를 모아 통합하는 국가 프로젝트다. 출범 후 참여자는 17만 명을 넘어섰고, 올 하반기에는 첫 데이터 개방도 예정돼 있다. 사업을 총괄하는 백롱민 단장을 만나 자세한 이야기를 들었다. -사업이 2년째로 접어들고 있다. 간단히 소개해달라.광고광고 “사업 이름에 내용이 다 들어 있다. 국가가 주도해 국민의 건강 데이터를 통합적으로 수집하고 활용하는 인프라를 만드는 사업이다. 2024년부터 2032년까지 9년 동안 국민 100만 명의 유전체·임상 데이터와 혈액·소변 등 검체를 기탁받아 보관하고, 미래 보건의료 연구와 산업 발전에 활용하는 것이 목표다. 한 번 모은 데이터를 수십 년 동안 수많은 연구가 함께 활용하게 된다. 데이터가 일회성 연구 재료가 아니라 국가 자산이 되는 것이다. 지금은 배를 만들면서 동시에 조선소도 짓는 상황이라고 비유할 수 있다. 참여자 모집은 이미 시작됐지만 데이터를 저장하고 관리하고 활용할 시스템은 아직 구축 중이다. 처음에는 조선소 없이 손으로 배를 만든 셈이었다. 현재 시스템 구축이 진행 중이며, 올해 하반기에 시스템이 완성될 예정이다.”광고 -참여자에게서 구체적으로 어떤 데이터를 모으나. “크게 세 가지다. 첫 번째는 유전체 데이터다. 혈액 22.5㎖를 채취해 생명체를 구성하는 유전정보의 총합인 전장유전체를 분석한다. 두 번째는 임상 데이터다. 건강검진과 병원 진료 과정에서 생성된 혈압, 혈당, 간기능 수치, 질병 진단 기록 등을 활용한다. 세 번째는 생활습관 데이터다. 무엇을 먹는지, 얼마나 운동하는지, 수면은 어떤지 같은 일상 정보를 수집한다. 중요한 것은 세 데이터를 개인 단위로 연결하는 일이다. 예를 들어 어떤 사람이 체중 증가와 함께 혈당이 올라 당뇨 전 단계가 됐다고 하자. 그런데 운동과 식습관 개선을 통해 다시 정상으로 회복됐다. 동시에 유전체를 분석해보니 가족력에 당뇨 위험 인자가 있었다고 해보자. 이처럼 여러 데이터를 연결해서 보면 생활습관에 따라 질병 발생 위험이 달라질 수 있다는 사실을 알 수 있다. 이런 패턴이 10만 명, 100만 명 규모에서 반복적으로 확인된다면 그것은 매우 강력한 의학적 근거가 된다.” -생활습관 데이터는 모으기가 쉽지 않을 것 같다.광고 “맞다. 하지만 생활습관은 건강에 영향을 주는 가장 중요한 변수 중 하나다. 현재는 설문 방식을 활용하고 있다. 참여자가 하루 커피 섭취량, 음주량, 수면시간, 운동량 등을 직접 입력한다. 물론 설문만으로도 상당히 가치 있는 정보가 된다. 향후 웨어러블 기기를 활용해 자동으로 데이터를 수집하는 단계까지 발전시킬 계획이다. 참여자가 의식하지 않아도 수면과 활동량, 생체 정보가 기록되는 방식이다. 다만 예산과 기술적 준비가 필요한 만큼 향후 사업 단계에서 본격적으로 추진하게 될 것으로 본다.” -개인 건강정보를 다루는 만큼 보안에 대한 우려도 있다. “당연히 가장 많이 받는 질문이다. 하지만 설계 단계부터 개인 식별이 불가능하도록 만들었다. 이름이나 주민등록번호 같은 정보는 아예 데이터뱅크에 저장하지 않는다. 참여자에게는 무작위 암호 아이디가 부여된다. 연구자가 활용하는 것은 혈압, 혈당, 유전체 정보 같은 연구 데이터이지, 그 사람이 누구인지가 아니다. 연구자는 개인을 알 필요도 없고 알 수도 없다. 해커가 시스템에 침입하더라도 특정 개인을 식별할 수 없도록 설계했다. 개인정보 보호는 사업의 가장 기본적인 전제다.” -100만 명의 숫자가 가지는 의미는 무엇인가. “100만 명 안에는 일반인 71만 명, 희귀질환 7만 명, 중증질환 22만 명이 구분되어 있다. 질환별로 통계적인 의미가 있는 결론을 얻고, 지속적인 연구를 위해서는 100만 명의 참여자가 필요하다. 오늘 건강한 참여자가 10년 뒤 고혈압을 얻고, 20년 뒤 암 진단을 받을 수 있다. 반대로 유전적으로 위험성이 높더라도 생활습관을 바꿔 건강을 유지할 수도 있다. 이런 변화 과정 자체가 데이터다. 건강한 사람이 어떻게 병을 얻는지를 알아야 예방과 조기 진단이 가능하다. 이것까지 고려해 계산해보니 우리나라 인구 규모에서 100만 명 정도가 나왔다.” -현재까지의 성과와 앞으로의 계획은. “현재 하루 평균 700명 정도가 꾸준히 참여하고 있다. 데이터 기탁이 시작된 후 참여자는 17만 명을 넘어섰다. 속도는 계획대로 가고 있다고 본다. 동시에 참여자 모집뿐 아니라 데이터 시스템 구축도 함께 진행하고 있다. 사실 이 사업은 매우 복잡하다. 한국보건산업진흥원, 한국보건의료정보원, 한국과학기술정보연구원, 국가생명연구자원정보센터, 전국 48개 병원, 유전체 분석 기업, 시스템 구축 기업이 함께 움직여야 한다. 여기에 보건복지부, 과학기술정보통신부, 산업통상부, 질병관리청 등 4개 부처가 참여한다. 지금까지는 큰 방향에서 잘 협력하고 있다. 올해 하반기에 시스템이 완성된다. 이후 지난해 말까지 확보한 데이터 가운데 표준화와 품질 검증을 마친 데이터를 선별해 연구자들에게 처음 공개할 예정이다. 이 정도 규모의 한국인 데이터가 개방되는 것은 처음이다. 질병 원인 규명부터 신약 개발 표적 발굴, 의료 AI 연구까지 다양한 분야에서 활용될 것으로 기대한다.” -마지막으로 국민에게 전하고 싶은 말이 있다면. “기탁한 이 데이터의 혜택은 결국 우리 자신과 우리 자녀들에게 돌아간다. 내가 기탁한 혈액 한 병과 건강 기록이 10년 뒤 암의 원인을 밝히고, 치매를 예방하는 연구의 토대가 될 수 있다. 우리나라 국민은 우리만의 유전적 특성과 생활습관을 갖고 있다. 한국인의 질병은 결국 한국인의 데이터로 풀어야 한다. 데이터는 하루아침에 가치가 생기지 않는다. 쌓이고, 연결되고, 시간이 지나면서 성숙한다. 지금 참여해주시는 분들이 대한민국 미래 의료의 첫 페이지를 함께 쓰고 있다고 생각한다. 많은 관심과 참여를 부탁드린다.” 윤은숙 기자 sugi@hani.co.kr
“유전체-임상-생활습관 연결해 한국인 질병 경로 드러낼 것” [건강한겨레]
같은 병에 걸려도 누구는 약이 잘 듣고, 누구는 그렇지 않다. 어떤 사람은 평생 담배를 피워도 폐암에 걸리지 않지만, 비흡연자인데 폐암 진단을 받는 이도 있다. 유전자와 생활습관, 환경이 복잡하게 얽혀 질병을 만들어내기 때문이다. 2000년대 접어들면서 기술의 발달과







