합성 대조군: 위약군의 미래?

무작위 배정은 최적의 표준이지만, 빅데이터가 임상시험 설계에 새로운 방향을 제시하고 있습니다.

애브비 데이터 및 통계과학 담당 부사장, 에릭 풀크스테인즈(Erik Pulkstenis) 박사

임상시험 참여자 중 위약군에 배정되기를 원하는 이는 없을 것입니다. 위약은 마치 저축성 예금, 일상적인 운동, 설거지와 그 성격이 유사합니다. 즉, 그 과정을 좋아하지는 않지만, 최종 결과가 그 과정을 정당화해 줍니다. 실제로, 일부 사람들은 위약군에 배정될 가능성이 두려워 임상시험 참여 자체를 피하기도 합니다.

약물의 실제 효능을 알아 내려면 유사한 사람들로 구성된 집단을 대상으로 연구를 수행해야 합니다. 이 때 유일한 차이는 시험 약물이 됩니다. 이런 방식으로 진행하면 분명한 결과의 차이가 발생할 수 있습니다. 이러한 차이는 임상시험 참가자들을 신약을 투여하는 치료군이나 위약을 투여하는 위약군에 임의로 할당하는 무작위 배정을 통해 실현됩니다.

애브비의 데이터 및 통계과학 담당 부사장인 에릭 풀크스테인즈(Erik Pulkstenis) 박사는 "임상 연구의 목적은 환자, 의사 및 규제 당국 모두에게 명확한 답변을 제공하는 것입니다. 역사적으로 이러한 과정은 쉽게 해석하기 위해 무작위 위약 대조군 시험을 통해 진행됐습니다.”라고 했습니다. 

그러나 상황에 따라 전통적인 위약군을 기존 데이터를 포함하는 "합성 대조군"으로 대체할 할 경우, 어떤 상황이 발생할까요? 

합성 대조군은 무엇일까요?

대부분의 임상시험의 핵심은 위약 대조군과 대비되는 특정한 약제의 치료 효과를 확인하는 것입니다. 합성 대조군의 경우, 환자에게 위약을 투여하는 대신 이전에 수집된 정보에 근거하여 해당 위약군을 모델링합니다. 이 데이터는 과거의 관리 데이터, 실제 데이터 또는 다른 소스의 복합 데이터 세트 생성과 같은 소스를 통해 나오며 대조군의 역할을 담당하게 됩니다.

이미 위약 투여를 진행할 수 없는 상황들도 있습니다. 예를 들어, 종양학에서는 모든 사람이 임상시험 약물을 투여받는 단일군 시험에 기반하여 때때로 임상시험 승인이 이루어지기도 합니다.

풀크스테인스 박사는 "종양을 검사할 때, 치료받지 않은 환자의 반응률은 기본적으로 0으로 알려져 있는데 이는 종양 자체가 줄어들지 않음을 의미합니다. 결과적으로, 임상시험에 참가한 모든 환자가 치료를 받게 되면 종양 크기가 감소하고 그 감소 기간이 유지되는 데, 이는 치료 효과가 있는 것으로 인식되어 약물이 허가받는 근거가 되기도 합니다.”라며 “이 경우, ‘대조군’은 우리가 지금껏 알고 있었던 치료받지 않았을 때 질병 진행될 것이라는 것과 위약은 효과가 부족할 것이라는 사실에 기반합니다."라고 설명했습니다.

애브비의 데이터 및 통계과학 담당 부사장인 에릭 풀크스테인즈 박사(가운데)와 그의 팀원들은 임상시험을 설계하는데 필요한 데이터, 기술 및 통계적 방법론을 제공합니다.

효과를 알고 있는 낙하산 효과

그럼, 이 새로운 시스템으로 인하여 대조군의 필요성이 사라질까요? 안타깝지만 한 마디로 ‘아니오’라고 풀크스테인즈 박사는 답합니다.

“무작위 배정은 임상시험과 관련하여 매우 강력할 뿐만 아니라 거의 신성시되는 원칙입니다. 무작위 배정은 우리가 수행하는 모든 분석과 그 결과로 발생하는 임상시험 결론에 대한 근거가 됩니다. 임상시험의 결론은 실제로 유사한 대조군이 있는 경우에만 유효합니다. 따라서 무작위 배정이 제공하는 안전성을 포기하는 것은 간단한 문제가 아닙니다."라고 말했습니다.

합성 대조군에 내재된 위험을 설명하기 위해, 낙하산이 비행기에서 뛰어내리는 이들의 생존율을 개선하는지의 여부를 연구한다고 생각해 봅시다. 과거 데이터에 근거해 볼 때 특정 높이의 비행기에서 낙하산 없이 뛰어내리면 생존율이 0이라는 것을 알고 있습니다. 낙하산과 함께 5명이 비행기에서 뛰어내려 모두 살아남는다면, 낙하산이 생존 가능성을 엄청나게 높인다는 분명한 신호가 됩니다.

이 낙하산의 예에서 합성 대조군은 낙하산을 사용하지 않은 불운한 이들에 대해 우리가 보유 중인 모든 과거 데이터와 같습니다. 하지만 여기에서 중요한 것은 정확한 결과를 얻으려면 대조군에 속한 사람들이 새로운 연구에 속한 사람들과 매우 유사해야 한다는 점입니다. 낙하산을 사용하는 그룹의 사람들은 1만 피트 상공서 뛰어내렸고 기존의 대조군에 속한 이들은 비행기가 활주로에 정지했을 때 뛰어내린 경우에는 유효하지 않은 합성 대조군이 됩니다.

그러나 일부 제한적인 상황에서는 합성 대조군의 이점이 그 위험 보다 더 클 수 있습니다. 예를 들면, 희귀 질환으로 전통적인 임상시험 방법이 금지될 수 있는 경우, 해당 대조군의 성과가 시간 순서에 따라 잘 분류되어 있고, 임상시험마다 결과가 일관되게 나타나는 경우, 또는 측정하기 쉬운 확실하고 객관적인 평가변수가 존재하는 경우를 들 수 있습니다.

기계 학습(ML)과 인공지능(AI)의 역할

기계 학습(Machine learning)은 연구자들이 효과적으로 사용하기엔 매우 크고 복잡하며 방대한 양의 다차원 데이터에 액세스할 수 있도록 지원합니다. 기계 학습을 통해 적절한 대조군을 생성해 낼 수 있을까요?

풀크스테이즈 박사는  "기계 학습이 할 수 없는 것이 있다고 말하기가 주저되는 상황입니다. 기계 학습은 지속적으로 우리를 놀라게 할 정도로 스스로의 가치를 입증했으며, 기계 학습이 잘 분류된 대규모 데이터 소스에서 적절한 대조군을 이끌어 낼 수 있었습니다.” 며,  “하지만 측정되지 않거나 알려지지 않은 데이터는 도움이 될 수 없습니다. 이것이 종종 특정 모집단 내에서 중요한 차이를 유발할 수 있습니다. 이는 게임을 하기 위해 기계 학습을 가르치면서 모든 규칙을 알려주지 않는 것과 같습니다."라고 말합니다.

합성 대조군의 개념은 제약 연구 커뮤니티에서 주목을 끌고 있습니다. 미국 식품의약품청(FDA)조차도 합성 대조군이 제시하는 가능성에 관심을 보이고 있습니다.

애브비 개발 부문 부사장 겸 최고 의료 책임자인 롭 스코트(Rob Scott) 의학 박사는 "5년 전만 해도 데이터를 수집하는 합성 대조군 또는 원격 진료 또는 웨어러블 센서와 같은 기술에 대한 논의는 활발하지 않았습니다. 그러나 이제는 애브비 등 여러 기업에서 모든 임상시험에서 디지털적 요소를 고려합니다.” 라며, “이러한 기술을 통해 환자와 연구자에게 관련성이 보다 높은, 더 나은 데이터를 포함하는 임상시험 진행 방식을 새롭게 정립할 것이라고 믿습니다.”라고 말합니다.

애브비는 현재 합성 대조군의 요소들을 포함하여 규제기관과 긴밀하게 협력하면서 설계한 두 건의 임상시험을 진행하고 있습니다. 기존 데이터를 분류하기 위한 첨단 분석 방법을 활용해 연구원들은 대조군을 반으로 줄이고 대조군 성과에 대해 이미 학습된 정보의 지원을 받습니다. 또한 새롭게 설립된 개발 디자인 센터는 실존하는 현재의 데이터 액세스를 통해 가상 대조군 대상자를 등록하는 방법도 찾고 있습니다.

다른 많은 혁신 사례와 마찬가지로, 합성 대조군은 임상시험 수행과 관련된 기존 방법을 완전히 대체하는 것이 아니라 개선에 주안점을 두고 있습니다. 보다 효율적으로 설거지하기 위해 식기세척기가 등장했지만 우리는 여전히 주방 세제를 사용할 때도 있으며, 모바일 앱을 통해 수표책의 잔고를 맞출 수 있지만 펜과 종이로 이 작업을 수행하기도 하는 것과 마찬가지입니다.

풀크스테이즈 박사는 "합성 대조군은 무작위 임상연구가 직면한 모든 문제에 대한 해결책이 아닙니다. 신약 개발을 위한 실제적인 증거를 완전하게 제공하지 못할 수도 있습니다. 하지만 특정 상황에서는 합성 대조군이 더 나은 선택이 될 수 있을 것입니다."라고 말합니다.

KR-ABBV-190017-191014