불면증은 임상에서 흔하게 관찰되는 증상 중 하나이며, 전체인구의 30-48%가 불면증을 경험한 것으로 보고된다. 그중 16-21%의 사람들은 일주일에 3회 이상 불면증을 경험하고 있으며 9-15%의 사람들은 불면증으로 낮 동안의 활동에 지장을 경험하는 것으로 보고되었다. 불면증은 대부분 일시적으로 발생했다가 호전되지만, 잘못된 수면 습관이나 수면에 대한 인지왜곡, 조건화된 과각성 상태 등으로 만성화되고 고착되기도한다.1,2) 따라서 이러한 잘못된 수면 습관이나 수면에 대한 잘못된 믿음을 교정하는 불면증 치료를 위한 인지행동치료(Cognitive Behavior Therapy for Insomnia, CBT-I)를 약물치료에 앞서 우선적으로 실시하도록 권고되고 있다. CBT-I는 불면증을 만성화시키는 인지적인 오류를 바로잡고, 불면증을 고착화하는 잘못된 행동을 고치는 행동 치료적 기법으로 수면위생교육, 자극조절법, 수면제한법, 이완요법, 인지치료 등을 조합하여 4~6회 실시하며 각 회차당 40~60분의 시간이 소요된다. 불면증 인지행동치료 효과는 2008년 미국 수면학회에서발간한 성인 불면증의 평가 및 치료에 관한 임상지침에서 확인되었으며 2016년 미국, 유럽, 호주에서 발표된 수면장애 치료 가이드라인과 2019년 한국판 불면증 임상진료지침에서불면증 인지행동치료를 만성 불면증의 일차치료로 권장하였다.3-5)
하지만 실제 임상에서는 시간과 비용이 많이 드는 비약물적치료 시행이 쉽지 않다보니, 수면제를 우선적으로 처방하고있다. 수면제는 불면증 증상을 비교적 빠른시간안에 해결하는데 도움이 되지만 금단증상 및 의존의 위험이 있기 때문에 장기간 사용하는 것은 권장되지 않고 있다. 또한 의약품 특성상반동성 불면증, 주간의 졸림, 골절, 식이장애 등의 부작용이 발생할 수 있다. 특히 고령의 환자에서는 근이완으로 인한 낙상이나 기억력 장애로 인한 섬망 등의 문제에 대한 주의가 필요하다. 또한 수면제를 복용했다 할지라도 효과를 보지 못하는경우, 용량을 증량하거나 약을 교체하기도 하는데 그러다 보면 수면제 종류와 양이 점점 늘어나게 되어 어려움을 겪기도한다.3)
약물 치료로 빠른 효과를 보더라도 행태적 개선이 뒷받침되지 않는다면 효과가 제한적일 수밖에 없어, 행태적 개선을 위한 인지행동치료 및 비약물적 치료의 중요성이 커지고 있다.특히 2004년 등장한 디지털 기술(컴퓨터, 인터넷, 모바일 앱 등)을 이용한 디지털 인지행동치료(Digital Cognitive Behavioral Therapy, dCBT)는 기존의 인지행동치료의 단점을 보완하는새로운 치료수단으로 대두되었다. 디지털 인지행동치료는 환자가 디지털 기술을 이용하여 인지행동치료를 받기 때문에 병원에 내원하지 않아도 된다는 점에서 치료적 접근성이 수월하다.6) 또한, 디지털 인지행동치료는 환자 스스로 프로그램을 수행하고 피드백을 제공받을 수 있어 전통적인 인지 행동치료에비해 환자와 치료자의 시간을 효율적으로 사용할 수 있어 비용 대비 효용성이 증가된다.7) 기존의 불면증 치료를 위한 디지털 인지행동치료 및 중재의 효과성은 RCT나 메타분석 등다수의 선행 연구를 통해 입증된바 있다.8,9) 이러한 불면증 치료용 디지털 인지행동치료를 이용한 의료기기는 디지털 치료기기(Digital Therapeutics, DTx)에 해당되며, 디지털 치료기기는 의학적 장애나 질병을 예방, 관리, 치료하기 위해 환자에게 근거 기반의 치료적 개입을 제공하는 소프트웨어 의료기기를 의미한다.10) 허가 승인된 대표적인 불면증 디지털치료기기로는 영국 Big Health의 Sleepio (app-based CBT-I), 미국PEAR therapeutics의 Somryst (app-based CBT-I), 한국 에임메드의 Somzz (Wearable Device based on app-based CBT-I),웰트의 WELT-I (app-based CBT-I)가 있다.11-14) 다만, 현재 디지털 불면증 치료기기의 효과는 대부분 대기군이나 수면위생교육을 기준으로 평가되는 편이라서 대면 불면증 인지행동치료(CBT-I)나 의료기관 자체 프로그램 등 다른 대조군과 비교한 디지털 불면증 치료기기의 효과성에 대해선 아직 논란이되고 있다.10)
이에 본 연구에서는 불면증 치료를 위한 디지털 치료기기에대한 선행연구들에서 대조군 분류별 중재군의 수면 및 정신건강 개선 효과를 확인하고자 하였다. 본 연구에서는 디지털치료기기를 허가 받은 디지털 치료기기와 더불어 수면장애 개선을 위한 근거기반의 소프트웨어를 포함하는 것으로 정의하였다.
본 연구는 대조군 대비 불면증 개선용 디지털 치료기기의유용성을 확인하기 위한 체계적 문헌고찰 연구이다. 본 연구는 PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analysis)의 체계적 문헌고찰 보고지침15)과 한국보건의료연구원(National Evidence-based Healthcare Collaborating Agency, NECA)에서 제시한 체계적 문헌고찰매뉴얼에 따라 수행되었다.16)
문헌 탐색을 위한 본 연구의 PICOTSD는 다음과 같다.
1) 연구대상(P): 나이와 성별의 구분 없이 불면증이나 수면장애가 있는 환자
2) 중재군(I): 수면장애 개선을 위한 디지털 치료기기를 적용한 불면증 환자군
3) 대조군(C): 디지털 치료기기를 제외한 비약물적 중재를제공받은 불면증 환자군
4) 결과(O): 수면 및 정신건강 개선을 평가하기 위한 1차, 2차결과 지표
5) 결과 측정 시점(T): 디지털 치료기기 중재 전후
6) 연구설계(SD): 무작위 대조연구(Randomized controlled trial; RCT)
본 연구는 3개의 국외 데이터베이스 PubMed, EMBASE, Cochrane Library (CENTRAL)와 국내 데이터베이스 코리아메드, RISS, KMBASE에서 2022년 5월 5일 이전에 발행된 문헌을 대상으로 검색을 수행하였다. 검색식은 대상자, 중재, 연구 설계를 나타내는 용어들을 병합하여 구성했으며 주요 검색키워드는 Digital cognitive behavioral therapy, dCBT-I, insomnia, sleep disorder, RCT이다.
2) 문헌 선정 및 배제 기준선정 기준은 수면장애에 대해 디지털치료기기를 중재로 한연구이면서, 무작위 대조군 연구(Randomized controlled trial; RCT)를 선정하였다.
제외 기준은 전문이 아닌 연구, 한국어와 영어로 출판되지않은 연구, 사람을 대상으로 수행되지 않은 연구, 결과지표가불면증 치료 효과가 아닌 문헌, 두 군 이상의 중재연구가 아닌연구를 제외하였다.
3) 자료선정 및 자료추출자료선정은 국내외 데이터베이스에서 검색된 문헌의 제목과 초록을 토대로 세 명의 독립된 저자가 선정기준에 따라 수행하였으며, 자료 선정에 대한 의견이 일치하지 않을 경우는원문을 함께 검토하여 최종 결정하였다. 선정제외 조건에 맞춰 1차로 논문을 정리하였고, 문헌 전문을 검토하여 2차로 연관성이 낮은 논문을 제외하여 최종 대상 논문을 선정하였다.최종 선정된 논문으로부터 저자 및 발표 년도, 연구가 수행된국가, 연구설계, 대상자 특성, 중재특성 및 결과지표 값을 추출하였다. 수면개선 관련 결과 지표로는 ① 불면증 심각도 척도(Insomnia severity index, ISI), ② 피츠버그 수면의 질 지수Pittsburgh Sleep Quality Index, PSQI), ③ 수면 효율성(Sleep efficiency, SE), ④ 총 수면시간(Total Sleep time, TST), ⑤ 수면후 각성시간(Wake after sleep onset, WASO)를 선정하였다.이들 지표 중 ISI, PSQI는 수면관련 지침에서 대표적으로 권고하고 있는 결과변수이고 SE, TST, WASO는 15건 이상의 문헌에서 사용된 결과변수이다.17)
정신건강 관련 결과지표로는 우울증 선별도구(Patient Health Questionnaire-9, PHQ-9), 건강 관련 삶의 질 측정 도구(Short Form-12 Health Survey Questionnaire, SF-12), 불안장애 척도(Generalized Anxiety Disorder 7-item, GAD-7)로 우울과삶의 질, 불안장애 관련된 지표 중 분석가능한 논문의 갯수가5건 이상인 지표를 선정하였다.
4) 문헌의 질 평가선정된 문헌의 질 평가는 The Cochrane Bias Method Group이 개발한 Risk of Bias 2.0도구를 이용하였다.18,19) 평가는 각영역에 신호 질문의 응답에 따른 알고리즘을 통해 비뚤림 위험을 낮음(low), 약간우려(some concerns), 높음(high)으로 판정한다. 질 평가는 3명의 연구자가 수행하였으며, 의견이 불일치하는 경우 합의를 통해 최종 의견을 도출하였다.
자료 분석 시 최종 대상 문헌의 대조군은 치료자 개입정도및 중재방법에 따라 1) 의료진이 직접 진행하는 대면 치료(face-to face CBT-I, Group treatment (GCBT)), 2) 의료진이일부 개입하는 환자 주도적 치료(수면 위생교육, 환자교육, 온라인IRT 등), 3) 무처치 대기(Waiting list group 등)로 분류하였다(Table 1).
그리고 3개의 하위그룹에서 1) 중재군과 대조군간와 2) 중재 전후 결과지표의 효과크기를 분석하여 수면장애 개선 효과와 부가적인 정신적 개선 효과를 확인하고자 하였다. 효과크기와 이질성분석, 출판 비뚤림은 Cochrane Library의 RevMan 5.3 프로그램을 활용했으며, 시각적으로는 forest plot과funnel plot을 확인하였다. 결과 자료들이 연속형 변수이기 때문에 비교하고자 하는 두 값의 평균차가 효과 크기가 되며, 이를 위해 Cochrane Library의 RevMan 5.3 프로그램에 각 결과지표의 평균값과 표준편차, 대상자 수를 입력하고 각 연구들간의 이질성을 고려하여 가중치를 재설정하는 임의효과모형(random effects model), SMD를 이용하여 효과 크기와 95%신뢰구간을 산출하였다.16)
각 변수의 형식이 달라서 대상논문의 중재 전후 시점의 결과 지표값과의 표준편차가 표준 오차나 신뢰구간으로 표현되어 있는 경우, 연구결과 값을 변화하여 입력하였다.19,20)
효과크기의 해석은 Cohen (1988)의 효과 해석 기준에 따라ES=0.20 이상~0.50 미만은 작은 효과, ES=0.50 이상~0.80 미만은 중간 효과 그리고 ES=0.80 이상은 큰 효과를 의미한다.21)대상 연구들의 이질성평가를 위해 Higgin의 I2 값을 이용하였다. I2값의 0%는 이질성이 없을 경우, 25%는 낮은 이질성, 50%는 중등도의 이질성,75% 이상인 경우는 이질성이 큰 것으로해석하였다.18)
국외 데이터베이스의 경우 전자 DB에서 논문제목과 초록을통해 총 1618편이 검색되었고, 819편의 중복자료가 제외되고799편이 되었다. 국내 자료의 경우 0편이 검색되어 해당되는논문이 없었다. 총 799편중에서 전문이 아닌 연구 22건, Review 문헌 혹은 Cohort문헌과 같이 RCT 연구가 아닌 문헌13건, 논문 제목을 확인하였을 때 목적이 불면증치료 중재와관련이 없는 연구에 대한 문헌 551건으로, 1차 선정기준에 적합하지 않은 586편은 제외한 213편의 연구를 1차로 선정하였다. 1차 선정된 213편의 연구는 원문을 검토하였으며, 디지털치료기기를 이용한 불면증 중재가 아닌 서술연구 60편, 불면증 개선 효과를 확인할 수 없는 문헌 45편, 대조군 없는 디지털치료기기 단일군연구 10편, 임상시험계획서만 포함된 연구 33편, 평균값과 표준편차가 모두 없는 불충분한 자료가 있는 연구 14편, 보고자 하는 평가지표가 아닌 연구 8건으로 선정기준에 적합하지 않는 연구 170편을 제외하였다. 총 43편의 관련연구에 대해 질 평가를 진행하였고 문헌의 질 평가를 통해 질이 낮다고 판단된 5편의 문헌이 제외되어 최종 국내 연구 0편,국외연구 38편 총 38편이 포함되었다(Fig. 1).
총 RCT 43편 연구에 대해 Cochrane RoB 2.0를 이용하여 방법론적 질평가를 시행하였다. 다섯 가지 영역인 ‘무작위 배정절차’, ‘중재배정효과’, ‘중재결과 자료의 결측’, ‘중재결과 측정’, ‘선택적 결과보고’ 결과를 바탕으로 전반적인 비뚤림 영역을 평가한 결과, 위험이 낮은 연구는12편(27.91%) 이었고,일부 우려가 있는 연구는 26편(60.47%), 비뚤림 위험이 높은연구는 5편(11.63%)이었다(Fig. 2).
본 연구에 포함된 불면증 중재 연구 38편의 일반적인 특성은 다음과 같다(Table 2).22)-59) 연구의 출처는 국외 100%으로 미국에서 발표된 연구가 12편, 네덜란드 6편, 스웨덴 4편, 독일과 노르웨이, 영국이 각 3편, 사우디아라비아, 스위스, 이란, 일본, 중국, 캐나다, 호주가 각 1편순으로 나타났다. 연구 설계는모두 RCT 연구였으며 대상자는 주로 불면증을 가진 성인이었으며, 4편의 연구는 특정 연령층을 대상으로 했으며(2편은노년층, 2편은 청소년), 4편의 연구는 난민, 암생존자와 같이 특정 상황의 연구대상자를 모집했으며, 5편의 연구는 임산부나남성과 같은 특정 성별만을 대상으로 하였다. 총 연구 참여자수는 실험군 5,917명, 대조군 6,169명으로 총 12,086명이었으며, 실험군은 평균 44.3세, 대조군 평균 42.0세로 나타났다. 연구에 참여한 조사 대상자의 치료 전 중재군의 ISI 점수 분포는8~14점 1편, 15~21점 30편, 대조군은 8~14점 3편, 15~21점 28편으로 조사되었다. 실험군의 수면 개선을 위한 중재는 인지행동치료(CBT-I)를 기반으로 만들어진 프로그램 혹은 앱이 주를 이루었고 9건의 연구에서는 명상, 행동치료와 같은 다른 방법을 이용하였다. 대조군의 경우 의료진이나 간호사가 대면으로 하는 CBT-I가 5건, 수면위생교육과 같은 환자 교육이 16건,평상시 하는 치료 1건, 온라인 혹은 인터넷 기반의 프로그램이7건, 아무런 중재없이 대기하는 그룹이 20건으로 조사되었다.연구의 주요변수인 수면 질에 대해서는 ISI, PSQI, DBAS (Dysfunctional Beliefs About Sleep Scale), SCI (Sleep Condition Indicator), BIS (Bergen Insomnia Scale), SSQ (Split Sleep Questionnaire), ESS (Epworth Sleepiness Scale), AIS (Athens Insomnia Scale), PSAS (Presleep Arousal Scale), 수면패턴을 주관적으로 기록한 수면일기, 객관적 측정도구인 액티그라피(actigraphy)를 사용하였다.
디지털 중재를 이용한 중재군과 대조군에서의 수면과 정신건강 개선 효과를 확인하기 위해 대조군 분류에 따른 하위분석을 진행하였다.
선정된 자료에 대한 타당성 검증을 위해 깔대기 도표를 이용해 출판 비뚤림하였다. 시각적으로 판단한 결과 가운데 점선을 중심으로 전체적으로 큰 비대칭이 없으며, 고르게 분포되어 있어 출판 비뚤림의 위험이 낮은 것으로 판단하였다.
1) 중재군과 대조군 간의 수면 개선 효과 크기 비교(Fig. 3)ISI를 이용하여 불면증 심각도 개선 효과를 측정한 연구는 총 28편으로 대조군 분류 후 하위분석을 진행하였다. 대조군1은 총 4편의 연구로 이질적인 것으로 나타났다(I2=84%). 임의효과모형으로 산출된 효과 크기는 0.58 (95% CI:0.03 1.14)으로 의료진이 제공하는 CBT-I가 디지털 중재를 이용한 불면증치료보다 불면증 심각도 감소에 효과적인 것으로 나타났다.대조군 2는 총 17편의 연구로 중간정도 이질적인 것으로 나타났다(I2=59%). 임의효과모형으로 산출된 평균효과 크기는 -0.89 (95% CI: −0.100, 0.78)으로 디지털 중재가 대조군에 비해 불면증 심각도 감소에 효과적인 것으로 나왔으나 1개의 연구에서는 반대의 결과를 보였다. 대조군 3은 총 7편의 연구로 이질적이지 않은 것으로 나타났다(I2=38%). 임의효과모형으로 산출된 평균효과 크기는 -0.94 (95% CI: -1.15, -0.73)으로 디지털 중재가 아무것도 제공하지 않은 대조군에 비해 불면증 심각도 감소에 효과적인 것으로 나타났다.
PSQI 점수는 높을수록 수면의 질이 낮다는 것을 의미하며 총 9편의 연구에서 측정했다. 대조군1은 총 1편으로 산출된 효과크기는 -0.03 (95% CI: -0.34, 0.28)으로 통계적으로 유의미한 차이가 없었다. 대조군 2는 총 4편의 연구로 이질적으로나타났다(I2=94%). 임의효과모형으로 산출된 평균효과 크기는 -0.70 (95% CI: -1.69, 0.28)로 두 군간의 유의미한 차이가 없는 것으로 나타났다. 반면 대조군 3은 총 5편의 연구로 매우높은 이질성을 나타냈다(I2=92%). 임의효과모형으로 산출된평균효과 크기는 -1.12 (95% CI: -1.81, -0.42)로 디지털 중재가 아무것도 제공하지 않은 대조군에 비해 낮은 PSQI 점수로수면 질 개선에 효과적이었으며 유의미한 두 군간의 차이를보였다.
③ Sleep efficiencySleep efficiency을 측정하는 연구는 총 31편으로 대조군의 종류에 따라 분류하여 하위분석을 진행하였다. 대조군1은 총4편의 연구로 이질적이지 않은 것으로 나타났다(I2=18%). 임의효과모형으로 산출된 효과 크기는 -0.32 (95% CI: -0.58, -0.05)으로 의료진이 제공하는 CBT-I가 디지털 중재를 이용한 불면증 치료보다 sleep efficiency 개선에 효과적인 것으로나타났다. 대조군 2은 총 8편의 연구로 이질적인 것으로 나타났다(I2=88%). 임의효과모형으로 산출된 평균효과 크기는0.55 (95% CI: 0.26, 0.84)으로 중재군이 대조군에 비해 sleep efficiency 개선에 효과적인 것으로 나왔으나 2개의 연구에서는 두 군간의 유의미한 차이가 없었다. 대조군 3은 총 19편의연구로 중간정도 이질성을 나타냈다(I2=72%). 임의효과모형으로 산출된 평균효과 크기는 0.58 (95% CI: 0.39, 0.78)으로중재군이 아무것도 제공하지 않은 대조군에 비해 sleep efficiency개선에 효과적인 것으로 나타났지만 8개의 연구에서는 두 군간의 유의미한 차이가 없었다.
④ TST총 수면시간을 측정한 연구는 총 32편으로 대조군의 종류에 따라 분류하여 하위분석을 진행하였다. 대조군1은 총 5편의 연구로 중간정도 이질성을 나타났다(I2=55%). 임의효과모형으로 산출된 효과 크기는 0.08 (95% CI: -0.22, 0.39)로 두 군간 총 수면시간이 유의미한 차이를 보이지 않는 것으로 나타났다.대조군 2는 총 8편의 연구로 이질적이지 않은 것으로 나타났다(I2=0%). 임의효과모형으로 산출된 평균효과 크기는 0.09 (95% CI: 0.00, 0.18)으로 두 군간의 유의미한 차이가 없는 것으로 나타났다. 반면 대조군 3은 총 20편의 연구로 약한 이질성을 나타냈다(I2=47%). 임의효과모형으로 산출된 평균효과크기는 0.34 (95% CI: 0.20, 0.48)으로 전체 값은 디지털 중재가 아무것도 제공하지 않은 대조군에 비해 TST 개선에 효과적인 것으로 나타났지만 11개의 연구에서는 두 군간의 유의미한 차이가 없었다.
⑤ WASOWASO를 이용하여 수면에 든 이후 깨어 있던 시간을 측정하여 수면의 질을 확인하는 지표로 총 17편에서 측정되었다. 대조군1은 총 4편의 연구로 이질적이지 않은 것으로 나타났다(I2=11%). 임의효과모형으로 산출된 효과 크기는 0.39 (95%CI: 0.16, 0.63)으로 의료진이 제공하는 CBT-I가 디지털 중재를 이용한 불면증 치료보다 수면의 질 개선에 효과적인 것으로 나타났다. 대조군 2는 총 7편의 연구로 높은 이질성을 나타냈다(I2=87%). 임의효과모형으로 산출된 평균효과 크기는 -0.60 (95% CI: -0.82, -0.38)으로 중재군이 대조군에 비해 수면의 질 개선에 효과적인 것으로 나타났지만 1개의 연구에서는 두군간의 차이가 없는 것으로 나타났다. 대조군 3은 총 9편의 연구로 중간정도 이질성을 나타냈다(I2=60%). 임의효과모형으로 산출된 평균효과 크기는 -0.26 (95% CI: -0.48, -0.03)으로 중재군이 대조군에 비해 수면의 질 개선에 효과적인 것으로나타났지만 6개의 연구에서는 두 군간의 차이가 없는 것으로나타났다.
2) 중재군과 대조군간의 정신건강개선 효과 크기 비교(Fig. 4)PHQ-9을 이용한 우울에 대한 개선 효과를 측정한 연구는 총 4건이었다. 대조군1은 총 1편으로 −0.00 (95% CI: −0.31, 0.31) 의 효과크기를 나타냈다. 통계적으로 유의미한 차이가 없었다. 대조군2은 총 3건으로 이질적인 것으로 나타났다(I2=93%). 임의효과모형으로 산출된 평균효과 크기는 −0.48 (95% CI: −0.78, −0.18)으로 중재군이 대조군에 비해 효과적인 우울 감소를 보이는 것으로 나타났다. 대조군 3는 총 1편으로 −0.43 (95% CI: −0.75, −0.11)의 효과크기를 나타냈다. 중재군이 대조군에 비해 효과적인 우울 감소를 보이는 것으로 나타났다.
GAD-7을 이용한 불안에 대한 개선 효과를 측정한 연구는 총 4건이었다. 대조군1은 총 1편으로 0.16 (95% CI: −0.15, 0.47)의 효과크기를 나타냈다. 의료진이 제공하는 CBT-I가 디지털 중재를 이용한 불면증 치료보다 불안 감소에 효과적인 것으로 나타났다. 대조군2는 총 2편으로 −0.17 (95% CI: −0.29, −0.05)의 효과크기를 나타냈다. 중재군이 대조군에 비해 불안이 감소된 것으로 나타났다. 대조군 3는 총 1편으로 −0.03 (95% CI: −0.35, 0.28)의 효과크기를 나타났다. 통계적으로 두 군간의 유의미한 차이를 보이지 않았다.
③ SF-12 (삶의 질)SF-12을 이용하여 신체적 삶의 질과 정신적 삶의 질 개선 효과를 확인한 연구는 각 3편씩 총 6편이었다. 신체적 삶의 질 개선의 경우 대조군 2는 총 2편으로 약한 이질성을 나타냈다(I2= 46%). 임의효과모형으로 산출된 평균효과 크기는 0.09 (95% CI: −0.26, 0.43)으로 통계적으로 유의미한 차이가 없는 것으로 나타났다. 대조군 3은 1편으로 −0.52 (95% CI: −1.28, 0.23)의 효과크기를 나타냈다. 중재군이 대조군에 비해 신체적 삶의 질 개선에 효과적인 것으로 나타났다.
정신적 삶의 질 개선의 경우 대조군 2는 2편으로 0.31 (95% CI: 0.20, 0.43)의 효과크기를 나타냈다. 중재군이 대조군에 비해 정신적 삶의 질 개선에 효과적인 것으로 나왔다. 대조군 3은 1편으로 0.17 (95% CI: −0.57, 0.92)의 효과크기를 나타냈다. 두 군간의 유의미한 차이를 보이지 않았다.
3) 치료 전후 수면 개선 효과 비교(Table 2)모든 군에서 중재 전 후 유의미한 변화를 보였고, 대조군 그룹 2,3 외 모든 군에서 큰 효과 크기를 보이며 특히 그룹1의 경우 중재군이 대조군보다 더 큰 효과크기를 보였다.
모든 그룹의 중재군은 유의미한 변화를 보였고, 큰 효과크기를 보였다. 대조군에서 그룹1은 중간이상의 효과 크기가 추정되었으며, 유의미한 변화를 보였다. 대조군 그룹2,3은 유의미한 변화를 보이지 않았으며, 효과가 거의 없는 크기로 추정되었다.
③ Sleep efficiency모든 군에서 중재 전 후 유의미한 변화를 보였고, 중재군 그룹2는 큰 효과크기, 중재군 그룹1,3과 대조군 그룹1,2은 중간 효과크기, 대조군 그룹3은 작은 효과크기가 추정되었다. 특히 그룹1의 경우 중재군이 대조군보다 더 큰 효과크기를 보였다.
④ TST그룹1 외 나머지 그룹에서 유의미한 변화를 보였으며, 효과가 거의 없는 대조군 그룹3 이외의 나머지 모든 그룹에서 작은효과크기가 추정되었다. 특히 그룹1의 경우 중재군이 대조군보다 더 큰 효과크기를 보였다.
⑤ WASO모든 그룹의 중재군은 유의미한 변화를 보였고, 중재군 그룹2는 큰 효과 크기, 대조군 그룹1은 중간 효과 크기, 중재군 그룹 1,3 와 대조군 그룹2는 작은 효과 크기, 그룹3의 대조군은 효과가 거의 없는 크기로 추정되었다. 특히 그룹1의 경우 중재군이대조군보다 더 큰 효과크기를 보였다.
본 연구에서는 불면증에 대한 디지털 중재의 수면과 정신건강 개선 효과를 확인하기 위해 2022년 5월까지 발표된 국내외문헌을 대상으로 체계적 문헌고찰을 수행하였다. 연구 결과대조군과 비교한 불면증 개선용 디지털 치료 기기의 수면 및정신건강 개선 효과는 분류 별로 다르게 나타났다. 의료진이제공하는 대면 불면증 치료인 대조군 1은 대부분의 수면개선결과지표에서 디지털 중재군보다 불면증 심각도, 수면효율 개선에 효과적이었으며, 수면의 질이나 총 수면시간에서는 유사한 효과를 나타났다. 정신건강 지표의 경우 대조군과 중재군이 유사한 효과를 보였으나 대상문헌 수가 적었다. 의료진의개입 없이 일반적인 교육 자료를 제공하는 대조군2는 대부분의 수면 및 정신 건강 지표에서 디지털 치료중재군이 더 효과적인 것으로 나왔지만, 몇몇의 연구에서는 유사한 효과를 보이는 것으로 나타났다. 아무런 치료 없는 대기군인 대조군 3은문헌 수가 적은 불안장애 척도(GAD-7) 지표를 제외한 모든수면 및 정신건강 지표에서 디지털 치료중재가 더 효과적인것으로 나타났다.
디지털 기술을 이용한 dCBT-I는 시간과 인력의 제약으로 접근성이 낮은 CBT-I를 보완하기 위해 2004년에 처음 등장하여약 20년간 개발되어왔다. 디지털 치료기기를 활용한 불면증치료기기는 불면증 심각도, 수면 효율성, 수면의 질, 수면 개시 후 각성, 수면 개시 잠복기 등 개선에 유의미한 효과가 있다고입증된 바 있다.60) 또한 dCBT-I는 동반 질환(암, 이명, 고혈압)
이 있는 환자에서도 효과적이었으며 불면증 개선을 넘어 정신건강(우울, 불안) 및 웰빙에 대한 이점도 제공한다.61) 또한 기존 CBT-I보다 높은 수준의 비용 대비 효용성이 확인된 바 있다.53)
본 연구결과와 같이 선행 연구에서도 불면증 개선을 위한디지털 치료기기는 기존의 수면위생교육과 같은 비처치 대조군에 비해서는 우수한 효과를 보였고, 대면 CBT-I와 유사한 효과를 보이거나 낮은 효과성을 보였다.56) 다른 선행연구에서는다양한 디지털 CBT-I 접근법을 비교한 결과, 치료사가 있는웹 기반 CBT-I가 불면증 증상에 최적의 치료 효과를 제공하는것으로 나타났다.62) 이러한 결과는 치료의 순응도로부터 기인되었다고 볼 수 있다. 순응도는 dCBT-I를 포함한 모든 종류의디지털 행동 변화 개입 성공에 중요한 역할을 하며 상호작용스타일은 대상자 참여욕구를 촉진하는 것으로 나타났다.63) 최근 발표된 dCBT-I 연구에서도 순응도가 높은 집단이 낮은 집단보다 우울·불안·수면 개선의 큰 효과가 확인됐다.64) 본 연구의 분석 대상문헌들에서도 순응도를 높이기 위해 지속적으로 연락을 하거나 디지털리터러시가 높은 그룹을 대상자로 선정하였다. 그러나 실제 의료 현장에서는 지속적인 관리와 참여 독려가 어렵기 때문에 순응도 저하로 dCBT-I의 효과는 더떨어질 수 있다. 따라서 임상시험을 통해 불면증 개선에 대한dCBT-I의 효과가 입증되더라도, 임상시험 결과를 토대로 실제 의료현장에서도 동일한 효과성을 나타낼 수 있다고 확답하긴 어렵다. 통제된 임상시험 환경과 실제 의료 현장의 차이로디지털 치료기기의 시판 후 순응도는 더 낮을 수 있기 때문이다. 디지털 치료기기의 순응도를 높이기 위해서는 접근성, 충분한 교육, 환자와 의료 제공자간의 원만한 의사소통과 면담,지속적인 관리, 의료보장제도의 뒷받침을 고려해볼 수 있다.
본 연구는 아래와 같은 한계점을 포함하고 있다.
1) 본 연구의 체계적 문헌 고찰 이전에 PROSPERO에 리뷰 계획서를 등록하지 않았다.
2) 체계적 문헌 고찰시 검색 언어를 영어와 한국어로 제한하였기 때문에 제3 언어로 작성된 문헌이나 논문화되지 않은 실제 데이터 등은 분석 대상에 포함되지 않았다.65)
3) 일부 그룹의 경우 해당하는 문헌 수가 적어 결과를 일반화하기에는 한계를 나타냈다. 본 연구의 결과는 해당 연구 분야에서 선택된 문헌의 분석 결과로 더 많은 연구를 종합적으로 고려해야 일반화할 수 있는데, 현재 불면증 치료용 디지털치료기기를 이용한 연구는 특정 대조군에 치우치기 때문에 일부 결과지표 및 대조군에 대한 그룹의 결과를 일반화하기에는대상 문헌이 제한적이었다.
4) 본 연구에서는 중재군의 대조군 별 효과크기를 비교하였으나, 대조군별로 포함된 문헌들이 다르기 때문에 대조군 간의 결과지표의 효과크기 비교는 할 수 없었다.
5) 중재군의 대조군 별 25개 군을 대상으로 하위분석한 결과이질성 값이 75%이상으로 높은 결과군 6개가 있었다. 일반적으로 이질성은 임상적 다양성, 방법론적 다양성, 우연, 비뚤림에 의해 발생할 수 있다.66) 본 연구에서 같은 지표 내 이질성이높게 나타난 결과군은 해당 문헌의 수가 적은 반면 불면증 대상자의 결과지표 평균 및 표준편차가 문헌마다 차이가 크거나디지털 치료기기의 종류, 중재 기간, 결과지표를 측정하는 도구의 차이를 가지고 있었다.
디지털 치료기기의 유효성 평가 시 동일한 연구 디자인에서도 임상시험의 대조군이 무엇인지에 따라 평가 결과가 달라질수 있다. 현재 대조군 3을 이용한 임상시험을 토대로 시판된의료기기의 경우 실제 의료환경에서 임상적 유효성을 확인하기 위해 대조군 1, 2를 토대로 한 시판 후 임상시험이나 시판후 RWD를 활용한 검증이 필요할 것으로 사료된다. 따라서 이러한 문제를 해결하기 위해 인허가 단계에서 유효성 평가를위한 치료확증 임상시험의 대조군이 적절하게 설정되었는지검토가 필요하다.
저자들은 본 논문의 내용과 관련하여 그 어떠한 이해상충도없다.