[미국대전환]③ 미국은 응급실 뺑뺑이 없다... AI 도입∙규제해소로 푼다

reporter-profile
Sejin Kim 2024.09.15 21:21 PDT
[미국대전환]③ 미국은 응급실 뺑뺑이 없다... AI 도입∙규제해소로 푼다
(출처 : DALLE 김세진)

[미국대전환]③ 미국의 헬스케어
미국 병원, AI에 사활거는 이유... 인력부족+더 친절
미국도 의사 부족 아우성… 의료 문서 비효율 불만 높아
생성AI 도입, 환자보다 의사가 더 적극적
미국 학계, 생성 AI 활용 실험 활발.. 정부는 규제 완화로 호응

한국에 의료 대란이 장기화되는 가운데 미국에서는 의료 업무에 생성AI 기술 도입에 대한 논의와 실험이 활발하다. 의료진 수가 절대적으로 부족하고 의료 보험료가 비싼 상황에서 기술의 발전이 헬스케어의 질을 높여줄 것으로 기대되고 있기 때문. 비대면 커뮤니케이션이 늘어나도 의료진의 번아웃과 그에 따른 의료서비스 접근성 하락을 막을 수 있다는 점에서도 긍정적이다.

이에 환자보다 의료진의 생성AI 도입 의지가 더 적극적이라는 결과가 나왔다. 미국 학계에서는 의료행위 중 어떤 단계에서 생성AI를 활용할 수 있을지에 대한 논의까지 나온다. 의료진의 수요에 따라 신뢰할 수 있는 의료 데이터, 환자 의료기록 등 민감 데이터로 미세조정(파인튜닝)한 비즈니스 모델로 확장하는 추세다. 정부는 규제 완화로 이런 움직임에 발맞추고 있다.

👉 [관련기사] 한국은 의료공백인데... 미국 대형 병원은 의사 간호사에 AI 전면도입

미국도 의사 태부족

미 국가커뮤니티건강센터협회(NACHC)가 지난 2023년 2월 발표한 보고서에 따르면, 미국인의 30%는 일차 진료 의사(primary care provider)가 없다. 일차 진료 의사는 일종의 주치의로 가정 의학과와 유사하다. 미국은 환자가 아플 때 주치의에게 먼저 진찰받고, 그들의 의견을 거쳐 전문의에게 가는 구조가 일반적이다.

미국은 의료진 부족에 시달리고 있다. 미국 의과대학 협회는 2034년까지 의사가 최대 12만4000명 부족할 것으로 예상하고 있다. 그 중 3분의 1 이상이 일차 진료 제공자다. 아테나헬스(Athenahealth)의 최근 설문조사에 따르면, 의료진의 80%가 "이미 진료소에서 부터 인력이 부족하다"고 밝혔다.

의료 인력 부족의 원인으로는 과도한 행정 업무가 꼽힌다. 대다수 일차 의료진이 환자와 직접 대면하는 시간보다 더 많은 시간을 행정 업무에 할애하고 있다. 아담 카프니 하버드의학대학 박사가 2022년 3월 발표한 ‘2019년 미국 의사들의 의료 문서 부담(Medical Documentation Burden Among US Office-Based Physicians in 2019)’ 논문에 따르면 의사는 전자건강기록(EHR)을 위한 서류 작성에 주당 평균 9시간을 할애하는 것으로 나타났다. 때문에 대부분 저녁까지 연장근무한다.

이 현상은 너무 흔해서 의사들이 아이를 잠재운 후에도 차트 작업을 계속한다는 의미로 ‘파자마 타임’이라는 은어도 있다.

환자와의 메세지 교환에서 오는 의료진의 업무 부하도 큰 것으로 알려진다. 코로나 19로 인해 미국에서는 의사와 환자간 메시지 교환이 일반적이다. 한국 병원에서 검사를 하면 검사 결과를 받기 위해 재방문하지만, 미국은 의료비가 비싸고 접근성이 떨어져 검사 결과는 문서와 메시지로 대체하는 경우가 대부분이다.

2020년 10월 미국 의료정보학회의 저널에 게재된 ‘의료진의 전자사서함 작업 패턴 및 작업기관과 관련된 요인(Physicians’ electronic inbox work patterns and factors associated with high inbox work duration)’ 논문에 따르면 의사들은 근무일에 1시간 이상을 받은편지함 이메일을 처리하는 데 보냈다. 다른 전자의료기록을 포함하면 일부 의사는 매일 절반의 시간을 쓴다.

또 다른 주요 원인은 정보 과부하다. 의료진이 15분 진료 예약에서 환자에 대한 모든 데이터를 수집, 처리하고 종합해 개인화된 치료 계획을 세우는 것은 어려울 수 있다. 수니타 미슈라 아마존헬스서비스 최고의료책임자 및 박사는 2월 포춘에 하루에 100명 이상의 환자를 진찰한 적이 있다고 전했다.

지난 1년 동안 미국 의사의 3분의2 이상이 생성AI에 대한 생각을 바꿨다. (출처 : Wolters Kluwer Health)

생성 AI, 환자보다 의사들이 더 선호

때문에 생성 AI 도입은 환자보다 의사, 간호사, 병원 관계자 등 의료인이 더 적극적인 상황이 됐다.

의료 전문가 및 의학도를 위한 의학정보 제공업체 월터스 클로베 헬스(Wolters Kluwer Health)가 2월 설문조사에서 지난 1년 동안 미국 의사의 3분의2 이상이 생성AI에 대한 생각을 바꿨다. 설문조사는 대형 병원이나 의료기관에서 근무하고 환자를 진찰하며 임상 의사결정 지원 소프트웨어를 사용하는 의사 100명을 대상으로 실시했다.

보고서에서 미국 의사의 40%는 진료 시간에 생성AI를 사용할 의향이 있다고 밝혔다.

의료진이 기대하는 점은 행정업무다. 3분의 2 이상(68%)의 의사는 생성AI가 의학 문헌을 빠르게 검색하여 시간을 절약할 수 있다고 응답했고, 59%는 생성AI가 전자건강기록(EHR)에서 환자 데이터를 요약해 시간을 절약할 수 있다고 응답했다. 의료진의 절반 이상(54%)은 생성AI를 사용하면 임상적 의사결정에 도움이 되는 데이터를 찾는 데 걸리는 시간을 20% 이상 절약할 수 있을 것이라고 생각했다.

수니타 미슈라 아마존헬스서비스 최고의료책임자 및 박사는 2월 포춘에 “생성AI가 의사들에게 더 많은 시간과 에너지를 제공해 단기적인 일차 진료를 넘어서 환자와의 장기적인 관계를 구축하는데 쓸 수 있다”고 주장했다.

이때 의료진과 환자 간 온도차가 있다. 5명의 의사 중 1명만이 환자가 진단에 생각AI를 사용하는 것에 대해 우려할 것이라고 생각한 반면, 대부분의 미국인(80%)은 우려할 것이라고 답했다.

생성 AI에 관심을 보이는 쪽은 환자보다 의료인이다. (출처 : Wolters Kluwer Health)

챗GPT 답변이 인간 의사보다 친절했다

때문에 미국 학계에서는 챗GPT가 의료행위 중 어느 부분에서 활용될 수 있을지에 대한 논의가 활발하다. 가장 주목 받는 건 의료진의 행정 업무를 최소화할 수 있도록 기초적인 의료적 답변, 행정적 질문 등 커뮤니케이션에서 주목받고 있다. 나아가 진단에서도 활용될 수 있는지에 대한 실험이 계속되는 추세다.

일단 챗GPT의 의학 분야 답변은 일반인의 소위 ‘구글링(구글 검색)’ 보다는 나은 평가를 받으며 1차 상담에서의 활용 가능성을 보여줬다.

하버드대학 연구팀이 2023년 1월 발표한 ‘GPT-3 인공지능 모델의 진단 및 분류 정확도(The Diagnostic and Triage Accuracy of the GPT-3 Artificial Intelligence Model)’ 논문에서는 의사, 의료 교육을 받지 않은 사람, 챗GPT에 질병을 진단하도록 요청한 실험 결과를 발표했다.

의료교육을 받지 않은 사람은 구글 검색을 가능하도록 했다. 그 결과 챗GPT 진단 정확도는 80% 이상으로 일반인 70%보다 높았다. 의료진은 91%였다.

여기에 더해 공감력 부분에서는 챗GPT가 의료진보다 뛰어난 것으로 나타났다. 존 아이어스UCSD 의학부교수가 주도한 2023년 4월 ‘소셜미디어 포럼에 게시된 환자의 공개 질문에 대한 의사와 인공지능 챗봇 응답 비교(Comparing Physician and Artificial Intelligence Chatbot Responses to Patient Questions Posted to a Public Social Media Forum)’ 연구에서 연구진은 의료 전문가들이 미국 대형 커뮤니티 ‘레딧’ 내 사람들의 의학적 질문에 답하는 포럼인 r/AskDocs에 잠복했다.

연구진은 포럼에서 말도 안되는 질문(예: 이쑤시개를 삼켰는데, 친구가 내가 죽을 거라고 했어요)부터 의료적인 질문(예: 정상적인 초음파 검사 후 하루 만에 유산했어요)까지 약 200개의 질문을 선택했다. 이후 AI와 의사(MD)의 답변에 대한 맹검 평가를 별도의 의료전문가 그룹을 대상으로 실시했다.

그 결과 챗봇 답변은 인간의 답변보다 3~4배 더 신뢰할 수 있는 것으로 평가됐고, 챗봇의 답변이 인간의 답변보다 평균 7배 더 공감적이라는 평가를 받았다. 메시지가 정확하거나 공감되는지 여부뿐만 아니라 사람들이 더 건강하거나 더 오래 살 수 있도록 돕는지 여부도 평가한다.

아이어스 교수는 “사람들은 레딧의 r/AskDocs와 같은 포럼에서 아픈 곳에 대한 답을 찾고 있다”면서 “챗봇이 심장마비에서 회복 중인 환자가 저염식단을 유지하고, 약을 먹도록 상기시키고, 치료를 최신 상태로 유지할 수 있게 되면 어떨까? 이들의 메시지가 생명을 구할 수 있다”고 말했다.

챗봇이 커뮤니케이션에서 역할할 수 있다는 것을 보여준 것으로 평가된다. 실제 월터스 클로베 헬스(Wolters Kluwer Health)설문조사에서도 의료진 5명 중 4명(81%)이 생성AI가 환자와 의료진의 상호작용을 개선할 수 있다는 기대를 드러냈다.

공감력 부분에서는 챗GPT가 의료진보다 뛰어난 것으로 나타났다. (출처 : Insider)

진단 논의도 시작… 답은 미세조정?

이에 미국에서는 신뢰할 수 있는 의료 데이터로 훈련, 미세조정된 의료용 생성AI 언어모델을 만드는 기업이 속속 등장하고 있다.

챗GPT가 인터넷의 모든 것, 즉 편견과 잘못된 정보도 끌어와 답변을 내놓는 일반론자라면, 의료용 챗봇은 개별 의료 기록 등에 접근할 수 있게 해 정확한 의료조언을 내놓는 것을 목표로 한다.

이미 의사와 환자 간의 대화를 녹음하고 필사할 수 있을 뿐만 아니라 요약, 정리, 태그도 지정할 수 있는 플랫폼이 존재한다. 일부는 환자와 의사의 대화 후 임상 요약을 자동으로 생성한다. 미국 가정의학회는 2023년 3월 20일 연구에서 의사 그룹이 음성 지원 AI 비서를 시도한 결과, 문서 작업 시간이 72% 단축됐다고 밝혔다.

일부 플랫폼은 문서화를 자동화하는 것을 넘어 생성 AI를 사용해 의사가 검토할 치료 계획을 제안하고 있다. 임상 기록, 실험실 보고서, 의료 이미지 등의 데이터를 합성해 의사를 위해 환자의 병력에 대한 치료계획을 제안하려는 플랫폼도 있다.

물론, 과제는 산적해 있다. 미세조정한 언어모델이 작동하려면 전문적인 의료 데이터를 기반으로 훈련돼야 하며 환자 의료기록 등 민감 정보에 대한 접근이 필수적이다. 이는 의료기관의 협조 뿐만 아니라 개인정보 취급 관련 입법이 필요할 수 있다. 아이어스 교수는 "이 기술이 전자건강기록에 액세스할 수 있게 되면 그것이 진짜 게임 체인저”라고 말했다.

의료진이 생성AI 툴을 쓸 때 가장 중요하게 보는 것은 콘텐츠 출처와 투명성이다. 월터스 클로베 헬스 설문조사에서 의료진의 58%는 언어모델이 훈련될 때 의료 전문가가 만든 콘텐츠로 학습된 것인지 여부가 중요하다고 말했다.

의사 10명 중시 9명(91%)은 임상적 결정에서 생성AI 사용 시 생성AI가 출처한 자료가 의사 및 의료 전문가가 만든 것이라는 사실이 중요하다고 답했다.

공급업체가 정보의 출처, 작성자 및 출처를 투명하게 공개하는 경우, 응답자의 89%가 임상적 의사결정에 생성AI를 활용할 가능성이 더 높다고 밝혔다.

미국 정부 및 FDA, 기술 규제 완화에 총력

이런 움직임에 정부도 발 맞추고 있다. 미국 정부는 의료 기술 혁신을 촉진하기 위한 규제 완화가 의료 개혁의 중요한 부분이라고 인식하고 디지털 건강 도구의료 AI 사용을 허용하는 규제를 완화 중이다. 미 식품의약국(FDA)은 디지털 의료 기술의 승인을 간소화하기 위해 새로운 규제를 개발 중이다.

실제 미국 연방 정부 및 주정부는 코로나19 팬데믹 동안 원격 의료(텔레헬스)의 필요성이 급격히 증가하면서, 원격 의료 관련 규제를 완화했다. 의사 면허와 관련된 주(州)간 규제도 일부 완화했으며 여러 주(州)에서 면허 상호 인증을 허용, 다른 주에서도 원격 진료를 할 수 있게 했다.

FDA는 2017년부터 '디지털 헬스 소프트웨어 사전승인 프로그램'을 실행하고 있다. 이 프로그램은 소프트웨어 의료기기(SaMD, Software as a Medical Device)의 사전승인 프로세스 구축을 위한 새로운 규제를 포함하고 있는데, Total Product Lifecycle Approach(TPLC)가 그 중 하나로 제품 심사와 개발기업에 대한 심사를 병행해 제품을 출시한 후에도 유효성이나 안전성을 모니터하는 방식이다.

이는 기존 의료기기에 실시하던 '제품별'이 아닌 '기업이나 소프트웨어 개발자'에 초점을 맞춘 것이 특징이다. 시판 후 실적이나 품질관리 체제에 관한 정보제공, FDA와의 협의 및 현지시찰 대응 등 사이버 보안이나 투명성 등을 바탕으로 FDA가 사전인증을 부여하고 있다.

지난 2021년에는 AI 기반 소프트웨어 및 기기 출시를 장려하기 위해 AI/ML 기반 소프트웨어 의료기기(SaMD, Software as a Medical Device)에 대한 특별 가이드라인을 발표한 바 있다. AI와 머신러닝 알고리즘이 사용하는 소프트웨어의 안전성과 효과에 대한 기준을 제시하고, 이를 승인하는 절차를 간소화했다.

이에 따라 미국의 스타트업들이 봇물처럼 관련 제품(서비스)를 개발하고 시장에 내놓고 있다. 실제 IDx-DR이라는 AI 기반 당뇨병성 망막병증 진단 소프트웨어가 최초로 FDA 승인을 받은 바 있으며 AI 기반 뇌졸중 진단 시스템 비즈에이아이(Viz.ai), 지브라메티컬비전(Zebra Medical Vision) 심장 분석 소프트웨어 등도 FDA의 승인을 받아 AI 기술이 실시간 진단에 사용되는 사례를 만들고 있다.

(출처 : shutterstock)

더밀크 회원으로 가입하시면 실리콘밸리에서 나오는 혁신 비즈니스 트렌드와 자본의 흐름을 가장 먼저 파악하고 앞서갈 수 있습니다. 주 4회 뷰스레터를 무료로 제공합니다. 유료 회원으로 업그레이드하시면 더밀크 콘텐츠를 제한없이 보고 더밀크의 스페셜 리포트를 받아보고 이벤트에 참석하실 수 있습니다.
더밀크 회원 가입하기 

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.