[목차]
제2의 닷컴 시대? 이번엔 생명과학이다
생명과학의 지식 폭발과 생산성의 역설
AI 바이오사이언스의 등장을 통한 신약 개발의 전환점
molecular engines behind AI bioscience
단백질의 암호를 풀다: 구조와 기능을 예측하는 AI
새로운 단백질을 설계하다: AI가 여는 합성 생물학의 시대
유전체를 한 눈에: AI를 통한 Genomics의 혁신
AI, Medical Data and Precision Medicine
개인 맞춤형 암 면역 치료제를 가능하게 하는 AI
단일세포 분석을 바탕으로 선택한 ‘맞춤형 약재’
AI를 통해서 기존 약물에 새로운 적응증의 문을 열다
Industry Landscape: From Bench to Market
기전을 예측하여 신약개발의 첫 단추를 바꾸다
구조 기반 약물 설계를 통해서 후보 물질을 선별하다
ADMET 예측을 통해서 전임상 탈락 위험을 최소화하다
생성형 AI: 분자 구조 설계를 위한 파운데이션 모델
슈퍼컴퓨팅과 클라우드: 인프라 투자로 확장되는 플랫폼
Enabling in-Silico Drug Pipelines through Policy
FDA가 약제 심사의 혁신을 선언하다
AI 인프라 패권: 약물개발을 바꾸는 또 하나의 전장
AI Bioscience: 예측하는 과학에서 개입하는 의학으로
Appendix
Glossary of Terms
Footnotes
References
“If you’re a young person, and you’re wondering what to do with your life—go into bioscience. You’re going to be in the epicenter of the next AI revolution.”
엔비디아의 CEO 젠슨 황이 한 인터뷰에서 이렇게 말했다. AI의 중심지가 이제는 자연어 처리나 이미지 생성이 아닌 바이오사이언스로 이동하고 있으며, 이는 생명과학 산업이 구조적 변곡점을 맞이하고 있다는 신호였다. 그의 발언은 과거 기술 혁신의 중요한 전환점을 떠올리게 한다. 1994년 제프 베조스는 웹 사용량이 연간 2300%씩 폭발적으로 증가하는 것을 보고, 안정적인 월스트리트 경력을 뒤로하고 인터넷 사업에 뛰어들었다. 그는 이것이 단순한 유행이 아닌 산업의 근본적인 변화라고 판단했고, 결과적으로 아마존은 세계 최대 기업 중 하나가 되었으며 인터넷은 우리의 삶을 완전히 변화시켰다. 젠슨 황의 발언은 베조스가 인터넷의 미래를 내다보았던 그 순간과 닮아 있다. 다만 이번에는 그 무대가 '인터넷'이 아닌 '생명과학'이다.
실제로, 생명과학 분야는 지난 수십 년간 조용하지만 혁신적인 기술 발전을 이어왔다. DNA 시퀀싱 기술은 무어의 법칙보다 빠른 속도로 발전했고 (Figure 1), 인간 게놈 프로젝트를 통해 우리는 전체 유전체를 비교적 저렴한 비용으로 해독할 수 있게 되었다. 이로써 수천 가지 질환의 분자적 원인이 밝혀졌고, 질병에 대한 생물학적 이해도 크게 깊어졌다. 하지만 이러한 지식의 폭발적 증가가 신약 개발의 양적 성장으로 직접 이어지지는 않았다. 오히려 제약 산업은 "신약 발견의 생산성 위기"라는 구조적 한계에 직면해 있다. 이 위기를 상징적으로 보여주는 개념이 바로 이룸의 법칙(Eroom's Law)이다.
Figure 1: 무어의 법칙 (Moore’s Law)와 에룸의 법칙 (Eroom’s Law). 무어의 법칙은 트랜지스터의 집적도가 약 2년마다 두 배씩 증가하면서, 반도체의 성능이 지수적으로 향상된다는 이론이다. Eroom’s law는 반대로 새로운 신약 (new molecular entity, NME)를 개발하는데 드는 R&D의 비용이 9년마다 2배씩 증가하여 신약 개발의 ROI가 감소함을 말한다. [1]
무어 (Moore)의 법칙*을 거꾸로 쓴 이 용어는, 성공적인 신약을 개발하는데 드는 비용이 9년마다 두 배씩 증가하고 있다는 아이러니를 말하고 있다. 1950년대에는 백만 달러 정도면 신약을 개발할 수 있었지만, 오늘날에는 평균 25억 달러와 10년 이상의 시간이 소요된다. 생명과학 기술이 발전하면서 질병의 분자적 기전을 더욱 정밀하게 추적할 수 있게 되었지만, 치료제로 이어지는 전환은 훨씬 더디다. 이로 인해 전 세계 제약 기업(일명 “Big Pharma”)들은 대부분 주식 시장에서 S&P 500보다도 낮은 수익률을 기록하며 침체를 겪고 있다. 이러한 생산성의 붕괴는 단지 경제적 문제가 아니다. 신약 후보 물질은 우수한 생명과학적 근거에도 불구하고 90% 이상이 임상시험 단계에서 실패하고, 여전히 많은 질환들이 치료제가 존재하지 않는다.
AI 바이오사이언스는 Eroom's Law를 극복할 새로운 돌파구로 주목받고 있다. AI는 단순한 실험 자동화를 넘어, 약물 개발의 근본적인 패러다임을 변화시킬 수 있는 잠재력을 보여주고 있다. 이러한 흐름을 상징적으로 보여준 사례가 바로 2024년 노벨 화학상이다 [2]. 수상자는 단백질 구조 예측을 위한 인공지능 모델을 개발한 David Baker, John Jumper, 그리고 Demis Hassabis였다.
딥마인드(DeepMind)†의 Jumper와 Hassabis는 단백질의 아미노산 서열만으로 3차원 구조를 예측하는 AlphaFold를 개발했다. AlphaFold는 기존의 실험적 방법으로는 규명하기 어려웠던 복잡한 단백질 구조를 고도의 정확도로 예측함으로써, 실험실 기반 생물학의 한계를 넘는 계기를 마련했다. 한편 Baker는 이 기술을 한 단계 더 진전시켜, 단백질 구조 예측을 넘어서 특정 기능을 수행하는 새로운 단백질을 설계하는 데 성공했다. 이는 AI가 단순한 분석 도구가 아니라 생물학적 설계의 주체로 전환되고 있음을 보여준다.
이러한 배경을 이해하려면 과거의 컴퓨터 지원 약물 설계(computer-aided drug design, CADD)와 비교가 필요하다. CADD는 이미 1960년대부터 도입되었으며, 초기에는 리간드 기반 약물 설계(LBDD) 방식, 특히 정량적 구조-활성 관계(QSAR)를 중심으로 이루어졌다. 이후 1980년대 핵자기공명(NMR)과 X선 결정학(X-ray crystallography) 기술의 발달로 단백질 구조 규명이 가능해지며 구조 기반 설계(SBDD)로 발전했다. 1990년대에 이르러 CADD는 제약 실무에서도 널리 사용되는 도구로 자리 잡았다 [3]. 그렇다면 AI 바이오사이언스는 이러한 기존 접근과 어떻게 다른가?
첫째, 분자 수준에서의 구조 예측과 설계 능력이 획기적으로 향상되었다. AlphaFold3, ESM-3, Evo-2와 같은 파운데이션 모델은 고가의 실험 장비 없이도 단백질, 복합체, 유전체의 3차원 구조를 정밀하게 해석할 수 있게 되었으며, 이는 과거 CADD가 직면했던 높은 비용의 한계를 극복하는 전환점을 마련했다. 이러한 예측 기술은 구조 기반 약물 설계의 핵심 토대를 제공하며, RFDiffusion이나 AtomNet과 같은 생성형 AI 플랫폼은 수조 개에 달하는 화합물 공간을 신속히 탐색해, 수 주 내에 hit-to-lead‡ 단계를 완료하고 유망한 후보물질을 도출하고 있다 [4].
둘째, AI는 의료 데이터를 분석함으로써 신약 개발의 성공률을 실질적으로 높이고 있다. 대표적으로, scFPM(single-cell functional precision medicine) 모델은 환자 조직 내 세포 단위의 반응을 정밀하게 분석해 최적의 약물 조합을 제시하며, 기존 치료에 반응하지 않던 혈액암 환자에게서 완전 관해(remission)를 유도한 사례도 보고되었다. 이처럼 AI는 기초 생물학과 임상 데이터를 효과적으로 연결함으로써, 'bench to bedside'라는 신약 개발의 병목을 획기적으로 완화하고 있다.
이러한 기술 발전은 제도와 자본 시장 전반에도 중대한 변화를 불러오고 있다. 미국 FDA는 2025년 5월 AI 기반 약물 심사 파일럿을 성공적으로 완료한 뒤, 이를 전 부서로 확대할 계획이며, AI 기반 독성 예측 모델을 동물실험의 대체 수단으로 인정하는 규제 샌드박스§도 준비 중이다. 산업계에서는 Recursion과 Roche 간의 120억 달러 규모 계약에서 볼 수 있듯, 빅파마와 AI 바이오텍 간의 전략적 협력이 빠르게 확대되고 있다. 또한 2024년 Drug Discovery Today의 조사에 따르면, AI 기반으로 바이오텍 회사에서 개발한 약물은 기존 대비 약 20% 더 높은 임상시험 성공률을 보이고 있다 [4]. 이와 함께 미국과 아랍에미리트(UAE)는 'Stargate 프로젝트' 등을 통해 국가 차원의 AI 슈퍼컴퓨팅 인프라를 경쟁적으로 구축하고 있다.
결과적으로, AI 바이오사이언스는 단순한 실험 효율화를 넘어 정밀의학, 약물 재창출, 희귀질환 치료 등 다양한 분야에서 의학의 패러다임을 ‘사후 치료’에서 ‘사전 예측·설계’ 중심으로 전환시키는 핵심 동력으로 자리잡고 있다.
AI의 등장으로 생명과학의 핵심 질문들이 재정의되고 있다. 전통적인 생명과학이 관찰과 실험 중심이었다면, 이제는 복잡한 분자 시스템을 예측하고 설계하는 방식으로 진화하고 있다. AI는 구조 예측에서 시작하여 단백질의 기능 이해, 새로운 생체 분자 디자인, 나아가 유전체 수준의 조절 네트워크 해석까지 가능하게 했다. 이는 단순한 기술 도입을 넘어서 생명체의 작동 원리를 계산 가능한 문제로 환원시키는 패러다임의 전환이다.
이 장에서는 다음의 세 가지 영역을 중심으로 AI가 생명과학을 어떻게 모델링하고 생성하는지 살펴본다:
단백질 구조 예측
De novo 단백질 설계
유전체 조절 해석
단백질의 구조와 기능은 밀접하게 연관되어 있다. 따라서 아미노산 서열로부터 3차원 구조를 예측하는 것은 생물학적으로 매우 중요한 과제이며, structure-based drug design (SBDD)의 핵심이다. 전통적으로 단백질 구조 예측은 molecular dynamics와 같은 field theory 기반의 물리학적 계산에 의존했다. 하지만 이 방식은 계산 비용이 매우 높아 복잡한 단백질 구조를 예측하기 어려웠고, 물리학적 모델과 실험값 사이의 오차도 컸다. 이후 전자현미경 데이터를 활용한 cryo-EM이 등장했으나, 구조 규명은 여전히 시간과 비용 면에서 비효율적이었다.
이러한 한계를 극복하기 위해 최근에는 트랜스포머 기반의 AI 모델이 도입되며 패러다임의 전환을 이끌고 있다. 트랜스포머는 멀리 떨어진 서열 요소들 간의 관계도 한꺼번에 고려할 수 있는 attention이라는 메커니즘을 통해서, DNA, 아미노산 서열과 같은 고분자를 마치 언어 문장처럼 처리할 수 있게 한다. 이로써 과거 모델들이 놓쳤던 장거리 상호작용이나 문맥 정보까지 포착할 수 있게 되었다.
DeepMind의 AlphaFold는 두 차례의 혁신을 통해 생체분자 구조 예측의 범위를 점진적으로 확장해왔다. AlphaFold 2는 기존의 물리화학적 법칙 기반 예측 모델과 달리, 단백질의 진화적 계보를 활용하는 접근법을 도입했다. EvoFormer라는 전용 트랜스포머가 종간 아미노산 서열의 변화 패턴을 분석하여 아미노산 잔기 간 물리화학적 상호작용 모델을 정교화한다. 이렇게 얻어진 정보는 Structure Module을 통해 원자 수준의 3차원 좌표로 변환된다. 이 방식은 2020년 CASP14∥대회에서 단일 사슬 단백질 구조 예측에서 실험치에 근접한 정확도를 달성하며 혁신적 성과를 이뤘다 [5].
최신 버전인 AlphaFold 3는 단백질 복합체 구조 예측을 생성 문제로 재해석하여 Midjourney, StableDiffusion과 같은 이미지 생성 모델에서 사용되는 denoising diffusion probabilistic model(DDPM)을 도입했다. DDPM은 무작위 노이즈에서 시작해 점진적으로 더 현실적인 데이터를 생성하는 기법을 말한다. AlphaFold3는 이 원리를 그대로 차용하여 무작위 원자 배열에서 시작해 점진적으로 의미 있는 분자 구조를 생성한다. 단일 단백질의 구조를 예측하는 AlphaFold2와는 다르게, AlphaFold3는 단백질, 핵산, 소분자, 이온을 통합적으로 분석할 수 있게 되었으며, 단백질-단백질, 단백질-리간드와 같은 복잡한 상호작용도 자연스럽게 추론할 수 있다. 초기 평가에서 이 모델은 항체–항원 및 효소–기질 복합체 예측에서 기존 물리 기반 도킹 도구(AutoDock 등)를 뛰어넘는 성능을 보이며, 신약개발의 hit-to-lead 단계를 획기적으로 단축하고 있다 [6].
이러한 AI 모델들의 등장은 의학 연구에도 큰 변화를 가져왔다. DeepMind는 AlphaMissense라는 파생 모델을 통해 인간 유전체의 7만여 개 돌연변이의 병인성을 예측하여 89%를 양호 또는 유해로 분류하는 방대한 목록을 공개했다. 이는 전체 변이 중 0.1%만이 실험적으로 확인된 현실을 고려할 때 유전질환 연구의 획기적인 속도 향상을 의미한다. [7] 또한 항원 단백질의 3차원 구조를 파악해 백신 개발에도 활용되고 있다. 영국 옥스퍼드대와 미국 국립보건원(National Institute of Health, NIH)은 AlphaFold를 이용해 말라리아 백신 개발을 위한 Pfs48/45¶ 구조를 규명했다. [8]
AI는 단백질 구조 예측을 넘어 새로운 단백질을 설계하는 De Novo Protein Design에 활용되고 있다. 특히 AlphaFold3에도 쓰인 DDPM은 단백질 설계에도 큰 혁신을 가져왔다. DDPM에 대해서 부연설명하자면 . 단백질의 경우 무작위 구조에서 점차 안정적인 단백질 구조를 만들어내도록 응용된다. DDPM의 큰 장점 중 하나는, 3차원 공간의 특징을 단백질 구조문제에 그대로 반영할 수 있다는 점이다. 예를 들어, 3차원 공간에서 단백질이 위치나 방향이 바뀌어도 그 본질은 달라지지 않는다. 이러한 3차원적 대칭성을 고려해서, DDPM을 구조가 회전하거나 이동해도 같은 것으로 인식할 수 있게 설계할 수 있다. 노벨상을 수상한 워싱턴대 Baker 연구팀은 2023년 RFDiffusion이 이러한 접근의 대표적 사례다. RFDiffusion은 구조예측 신경망인 RoseTTAFold를 노이즈 제거용으로 미세조정하여, 주어진 제약을 만족하는 새로운 단백질 구조를 생성한다. 특정 활성 부위의 형태를 유지하면서 나머지 단백질 구조를 새롭게 생성하거나, 단백질 복합체를 설계하는 등 다양한 문제에 적용할 수 있다. 실제로 열대 풍토성 소외질환(neglected tropical diseases, NTD) 중 가장 치명적인 뱀독에 대한 해독 물질 설계에도 활용되었다. [9]
한편, 메타(Meta)의 AI 팀이 개발한 ESM(Evolutionary Scale Modeling) 계열의 모델은 대규모 언어모델(LLM)을 단백질 설계에 응용했다. 최신 버전인 ESM-3는 980억 파라미터 규모의 트랜스포머 모델로, 단백질의 서열, 구조, 기능을 통합적으로 고려하는 다중모달(multimodal) 생성형 모델이다. ESM-3는 단백질의 서열뿐 아니라 구조 정보와 기능 annotation까지 부분적으로 마스킹하고 예측하도록 훈련되었다. 그 결과 단백질의 1차 서열, 3차 구조와 기능 표현을 동시에 이해하고 생성할 수 있게 되었으며, 이를 통해 조건부 단백질 설계(예: 특정 기능을 가진 신규 단백질 생성) 등 다양한 생물학적 과제를 수행할 수 있다. 대표적으로, 자연계에 존재하지 않는 새로운 녹색형광단백질(esmGFP)**을 설계해 실험적으로 검증함으로써 합성생물학 분야에서의 활용 가능성을 입증했다. 또한 ESM-3는 프롬프트를 활용한 생성이 가능해, 사용자가 원하는 부분적 서열이나 기능 키워드를 제시하면 그 제약을 만족하는 새로운 단백질을 만들어낼 수 있다. 거대 언어모델의 규모 덕분에 작은 모델로는 어려웠던 원자 단위 정확도의 설계도 가능해지고 있다. [10]
Figure 2: ESM-3는 자연에서 발견된 단백질 (노란색)과 성능이 유사하나 서열과 구조가 다른 단백질 (파란색)을 다양하게 생성할 수 있는 능력이 있다 [10]
이와 같은 합성 단백질의 시대가 열리면 의약품은 천연 단백질에 의존하던 한계를 넘어서, 인간이 설계한 생체 분자를 바탕으로 질병을 정밀하게 공략하는 맞춤 의학(personalized medicine)으로 진화할 것이다. 나아가 AI를 통해 가상 단백질을 시험해볼 수 있어 약물 후보 탐색이나 단백질 엔지니어링의 비용이 크게 줄어들고 개발 속도는 빨라질 것으로 전망된다.
인간 게놈을 포함한 유전체(genome)는 생명의 청사진이지만, 방대한 ATGC 문자열 속에 담긴 정보를 해독하는 일은 매우 복잡하다. 유전체 해석이 어려운 이유는 DNA 서열이 단백질 서열보다 훨씬 길고, 유전자뿐 아니라 유전자의 조절 영역과 3차원 염색질의 구조까지 고려해야 하기 때문이다. 최근에 AI 기술, 특히 트랜스포머 기반 언어 모델은 단백질 구조 해석 뿐 아니라, 유전체 해석의 판도도 바꾸고 있다. 유전 정보를 다루는 트랜스포머들은 attention을 통해서 DNA 서열의 "단어"에 대응되는 유전자뿐 아니라 유전자의 조절 신호까지 읽어내고, 유전자 조절 네트워크와 생명체 암호의 지도를 밝혀내고 있다.
이 분야에서 주목할 만한 도약은 2023년 발표된 Evo-2 모델이다. 미국의 Arc Institute와 NVIDIA가 공동 개발한 Evo-2는 약 400억 개의 파라미터를 가지고 9.3조 개의 뉴클레오타이드로 이루어진 시퀀스 데이터를 학습했다. 학습 데이터에는 12만 8천 종의 다양한 생물종 게놈이 포함되어 있어, 광범위한 생물학적 지식을 습득할 수 있었다 [11]. Evo-2의 가장 주목할 만한 특징은 초장기 문맥 길이로, 한 번에 최대 100만 개의 염기쌍 서열을 처리할 수 있다. 이는 수천~수만 염기만 다룰 수 있었던 이전 유전체 언어 모델들과 비교하면 획기적인 발전이다.
이러한 능력 덕분에 Evo-2는 작은 조각 단위 예측을 넘어 전체 유전체와 그 조절 영역을 통합적으로 해석할 수 있다. 실제 게놈은 3차원 구조의 염색질 형태로 접혀 있으며, 한 유전자의 발현은 수십만 염기 떨어진 원거리 조절자(예: remote enhancer-promoter)의 접촉에 의해 조절된다. 또한 염색질의 물리적 배열이 유전자 기능에 영향을 주며, 이러한 접촉점의 이상은 암이나 유전 질환의 원인이 된다. 기존 AI는 문맥 길이가 짧아 이러한 장거리 효과를 포착하기 어려웠으나, Evo-2는 긴 서열의 맥락을 유지한 채 읽어내어 게놈 내 원거리 상호작용까지 학습할 수 있다.
고전적인 트랜스포머는 문맥 길이가 길어질수록 계산량과 메모리 요구량이 제곱으로 늘어나 학습과 추론에 지나치게 많은 시간이 걸린다. Evo-2 개발팀은 이 문제를 해결하기 위해 StripedHyena2라는 효율적인 architecture를 도입했다 [12]. Transformer는 모든 단어끼리 서로 비교하여서 맥락을 이해하려고 하지만, StripedHyena2에서는 hyena라는 일종의 필터를 통해서 빠르게 서열을 훑어본 후에, 중요한 유전자 서열 사이의 상호작용 만을 포작하는 striped attention을 사용했다. 이러한 하이브리드 방식의 설계를 통해서 메모리 요구량과 연산량이 획기적으로 감소하여, 거의 선형적인 비용으로 초장기 맥락을 인식할 수 있게 되었다. 그 결과 Evo-2와 같이 기존 transformer로는 불가능하였던 유전체 전체 (whole genome)에 대해서도 정밀한 추론을 할 수 있게 되었다.
이러한 기술 덕분에 Evo-2는 놀라운 응용력을 보여주고 있다. 우선 유전 변이의 효과를 빠르게 예측할 수 있다. 연구자들은 이를 응용하여 매머드 유전체 주석(annotation), BRCA1 돌연변이 효과 예측 등 다양한 생물학적 작업에서 유의미한 성능을 입증하였다. 비슷하게 희귀 유전질환 진단이나 암 돌연변이의 해석 등에 Evo-2가 응용될 수 있을 것으로 예상된다. 또한 Evo-2는 새로운 유전체나 유전체 서열을 설계할 수 있다. 장기적으로 이는 합성 생물학에서 원하는 기능을 수행하는 합성 게놈을 설계하는 방향으로 나아갈 수 있다. 이와 같이 AI가 생성한 새로운 DNA 서열은 백신 개발에 쓰이는 mRNA 서열 최적화나, 세포 치료용 키메라 항원 수용체를 사용한 CAR-T 유전자 설계 등에 활용될 수 있다.
AI를 이용한 개인 유전체 해석은 약물 개발 전반에 걸쳐 점점 더 중요한 역할을 차지하고 있다. 바이오 제약 산업은 정밀의학과 인공지능(AI)의 융합이라는 새로운 전환점을 맞이하고 있다. 최근 대표적인 사례로, 미국의 바이오 기업 Regeneron은 소비자 유전체 분석 기업인 23andMe를 인수함으로써 개인 유전체 데이터를 활용한 신약 개발 전략을 본격화했다 [13]. 23andMe는 수백만 명의 개인 유전체 데이터를 보유하고 있어, Regeneron은 이를 통해 질병의 유전적 원인을 보다 정밀하게 분석하고, 약물 반응성 및 이상반응 예측에 활용하여 맞춤형 치료 전략 수립에 속도를 낼 수 있게 되었다.
오라클(Oracle) 공동창업자 래리 엘리슨은 최근 암 진단 후 48시간 만에 환자 개개인의 종양 돌연변이에 맞춘 맞춤형 암 치료제를 제공하는 비전을 제시했다 [14]. 이 비전은 공상과학처럼 들리지만, 인공지능, 염기서열 분석, mRNA 기술의 융합으로 빠르게 현실이 되어가고 있다. 특히 래리 엘리슨이 주목한 기술은 개별 환자에 최적화된 "개인 맞춤형 신항원 치료"(individualized neoantigen therapy, INT)였다. INT는 생검된 종양 조직에서 암세포에만 존재하고 정상 조직에는 없는 돌연변이들을 선별하는 것으로 시작된다. 이 돌연변이들을 바탕으로 암세포가 가진 신항원을 예측하고, 이를 백신 형태로 환자에게 접종한다. 이를 통해 종양 조직에 대한 강력한 면역 반응을 유도하여 종양을 파괴하는 면역 치료제의 일종이다 [15].
Figure 3: INT의 전과정을 나타낸 그림 [15]. 종양 세포에만 존재하고 정상 조직에는 없는 돌연변이를 선별한 후, 이 돌연변이와 HLA를 바탕으로 백신을 on-demand로 설계할 수 있게 한다. 이 신항원은 memory CD8+와 CD4+ T-cell을 형성하여, tumor cell의 immune clearance를 돕는다.
이 돌연변이 중에서 약물이 표적으로 삼을 돌연변이를 선택하는 과정에서 AI가 핵심적인 역할을 수행한다. 대용량의 변이 펩타이드와 HLA(human leukocyte antigen) 복합체로 훈련된 딥러닝 모델이 있다. 서열 분석, 구조 예측, 면역원성 예측을 결합한 이 딥러닝 모델은 환자 개개인의 HLA 분자가 가장 잘 제시할 수 있고, 강한 T세포 반응을 유발할 수 있는 후보를 예측한다 [16][17]. 나아가 AI는 mRNA 백신 자체의 염기서열도 최적화하여, 번역 효율과 안정성, 면역원성이 극대화되도록 코돈 사용, 2차 구조, mRNA 서열의 UTR 등을 조정할 수 있다. 이를 통해 주사 후 체내에서 강력한 항원이 효과적으로 발현되도록 mRNA 약물이 설계된다 [18][19]. 마지막으로 AI는 백신 전달에 사용되는 지질 나노 입자(LNP, lipid nanoparticle)의 조성도 최적화할 수 있다. 생성 모델 등 AI 기법을 활용해 지질의 화학 구조를 미세 조정함으로써, 안정성과 세포 투과성을 극대화한 LNP를 생성할 수 있다 [20][21].
종양 염기서열 분석에서 시작하여 항원 선별, mRNA 백신 설계, LNP 조성에 이르는 모든 과정이 고속 자동화 및 클라우드 기반 AI 플랫폼을 통해 놀라운 속도로 진행될 수 있다. 래리 엘리슨이 언급했듯이, 과거에는 수년이 걸리던 약물 개발이 전반적으로 간소화되면서 불과 수일~수주 내에 개인 맞춤형 약재를 설계하는 일이 가능해지고 있다. 실제로 이 접근법은 이미 임상 시험 단계에 진입해 있다. Moderna와 Merck사에서 공동개발한 mRNA-4157/V940, 그리고 BioNTech에서 개발한 autogene cevumeran 등은 AI 기반 설계로 수십 개의 환자 맞춤형 신항원을 인코딩하여 흑색종, 췌장암, 비소세포성폐암 등 예후가 불량한 고형암에서 유의미한 결과를 보여주고 있다 [22][23]. 앞으로 AI와 자동화 기술이 발전됨에 따라, 래리 엘리슨이 약속한 미래, 즉 암 진단 후 48시간 만에 환자 개인의 질병에 맞춘 정밀 약재가 제공되는 시대가 현실이 될 수 있을 것이다.
실제 임상 사례에서도 AI의 유전체 기반 분석 역량은 입증되고 있다. 예컨대, 최근 세계 최대 암 학회 중 하나인 AACR에 발표된 논문에 따르면 비엔나 의과대학의 연구진은 기존 항암치료에 반응하지 않던 고령 환자를 대상으로 AI 기반 약물 스크리닝을 수행하였다 [24]. AI는 세포 단위 이미지 (single cell image)를 바탕으로 환자의 조직 샘플을 분석하고, 다양한 약물 조합에 대한 반응을 예측하는 single cell functional precision medicine (scFPM) 모델을 통해서 최적의 치료제를 제안했다. 그 결과, 환자는 완전 관해(remission)에 도달하였으며, 이는 AI가 임상적 의사결정에 실질적으로 기여할 수 있음을 보여준다. 이 연구는 영국의 AI 신약개발 회사 Exscientia와 협력하여 진행되었으며, 해당 기업은 이제 단순한 약물 매칭을 넘어, AI로 약물 분자를 처음부터 설계하는 기술을 보유하고 있다 [25]. 실제로 이들이 개발한 신약 후보 중 일부는 현재 임상시험 단계에 있다.
Figure 4: scFPM (single cell functional precision medicine)은 혈액암 환자들에서 악성 세포를 분류하고, 그 세포에 대한 약물 반응 실험을 분석할 수 있는 모델로 개개인에 최적화된 약물 선택을 가능하게 한다 [24].
한편 AI는 기존 약물을 새로운 질환 치료에 활용하는 ‘약물 재창출(drug repurposing)’ 전략에도 활발히 응용되고 있다. 약물 재창출은 이미 승인된 약물에 대해 새로운 적응증을 찾아내는 접근법으로, 안전성과 약효가 입증된 약물을 사용하기 때문에 신약 개발에 드는 비용과 시간을 줄이고 성공 가능성을 높일 수 있는 장점이 있다. 최근 네이처 자매지에서 출판한 연구에서는 S-PrediXcan이라는 AI 기반 유전자 발현 예측 모델과 GWAS(전장유전체연관분석) 데이터를 활용해 질병마다의 유전자 발현 시그니처(gene expression signature)를 예측했다 [26]. 유전자 발현 시그니처란 특정 질병 상태에서 어떤 유전자들이 얼마나 더 활발하거나 억제되어 있는지를 보여주는 분자적 패턴으로, 질병의 생물학적 특성을 반영하는 일종의 분자 지문이라 할 수 있다. S-PrediXcan은 GWAS 데이터를 바탕으로 실험 없이도 질병의 유전자 발현 양상을 예측할 수 있도록 해주는 AI 기반 분석 도구이다.
정밀의학(precision medicine)은 환자의 유전적, 생리적, 환경적 특성에 맞춘 치료를 목표로 하며, 2003년 인간 게놈 해독 이후 빠르게 발전해왔다. 이와 함께 약물유전체학(pharmacogenomics)은 개인의 유전자가 약물의 흡수, 분포, 대사, 배설 (ADME) 과 같은 약동학적 특징 그리고 약물에 대한 반응과 같은 약력학적 특징에 미치는 영향을 분석하는 분야로, 정밀의학의 핵심 축으로 자리 잡고 있다. 그러나 실제 임상에서 약물유전체 정보를 활용하기 위해서는 방대한 양의 유전체 데이터를 해석하고, 이를 환자 맞춤형 치료 전략으로 연결해야 하는 어려움이 존재한다. 이때 AI는 머신러닝과 딥러닝 알고리즘을 활용해 유전체 정보와 전자의무기록(EHR) 등의 다양한 생의학 데이터를 통합 분석함으로써 약물 반응 예측의 정밀도를 높인다.
연구진은 이렇게 구축한 질병별 유전자 발현 시그니처를 iLINCS라는 약물 반응 데이터베이스에 입력하여, 질병과 관련된 유전자 발현 변화를 되돌릴 수 있는 약물 후보를 탐색하였다 [26]. 예를 들어 고지혈증(hyperlipidemia) 환자에서는 PCSK9의 발현 증가와 LDLR의 발현 감소가 나타났고, 고혈압(hypertension) 환자에서는 ADRB1과 ACE의 발현 증가가 확인되었으며, 이를 바탕으로 각각 149개와 178개의 후보 약물이 도출되었다.
그러나 이론적으로 유망한 후보 약물이라도 실제 환자에게 효과가 있어야 의미가 있기에, 연구진은 Vanderbilt University Medical Center의 Synthetic Derivative(SD)와 NIH의 All of Us 프로그램에서 제공하는 대규모 전자의무기록 데이터를 확보하였다. [27] 이 데이터를 바탕으로, 후보 약물을 복용한 환자들이 복용 전후에 혈압이나 지질 수치가 어떻게 변화했는지를 평가하는 자가대조 사례군(self-controlled case series) 연구††를 수행하였다. 그 결과 고지혈증 치료제로 승인받지 않았던 5개 이상의 후보 약물이 다기관 데이터에서 실제 임상적으로 의미 있는 효능을 보이는 것으로 나타났다.
이러한 접근은 의료 데이터를 기반으로 약물 재창출(drug repurposing) 후보군을 미리 선별할 수 있게 하여, 기존의 동물실험 중심 방식이 가진 한계를 효과적으로 보완한다. 무엇보다도, AI 기반의 분석은 수백 개의 약물 후보 가운데 임상적으로 유망한 약물을 빠르게 찾아내고, 이미 안전성이 확인된 약물을 새롭게 활용할 수 있는 가능성을 제시한다. 이는 신약 개발 비용과 기간을 획기적으로 절감할 뿐 아니라, 환자 개개인의 특성에 맞는 정밀한 맞춤 치료를 구현하는 데에도 크게 기여할 것으로 기대된다.
약물의 전임상 단계는 크게 3가지 단계로 나뉜다. 우선 신약 개발 과정에서 잠재적인 약효를 갖춘 화합물을 찾는 첫 단계로, 히트(hit)라는 초기 활성 물질을 발견해야 한다. Hit를 확인하면, hit-to-lead를 통해서 hit의 약동학적, 약력학적 프로파일을 개선하여 약물로서의 가능성을 가진 약물 후보 물질인 lead를 만들어낸다. 마지막으로 다양한 동물실험을 통해서 lead를 최적화하는 lead optimization이 필요하다.
AI는 이와 같은 초기 후보물질 발굴부터 임상시험 설계에 이르기까지 신약개발 전 과정에서 투자 대비 성과(ROI)를 향상시키고 개발 기간을 단축하기 위해 널리 활용되고 있다. 대형 제약사들은 AI 기술을 도입하는 것을 전략적인 필수과제로 여기고 있으며, 빅파마와 AI 바이오텍 간의 협력이 활발해지고 있다. 예를 들어, AI 기반 디지털 생물학 기업 Recursion은 로슈(Roche)와 협력 계약을 맺어, Recursion의 AI 플랫폼 RecursionOS를 neurology, oncology를 비롯한 40개의 프로그램에 적용하고 있다. Recursion은 이 계약으로 upfront로 3천만 달러, 이후 프로그램 당 3억 달러의 milestone이 예정되어 있어서 계약의 총 규모는 120억 달러 (한화로 대략 16조원)으로 추산된다.
Figure 5. AI 신약개발 관련 시장 규모의 연도별 예측. 플랫폼, 하드웨어, 서비스 영역 모두에서 2028년까지 연평균 고성장세를 보일 것으로 전망됨. (출처: GlobalData, 2024)
이러한 흐름은 시장 성장 수치에서도 명확히 드러난다. GlobalData의 2024년 보고서에 따르면, AI 신약개발에 대한 기업의 투자는 2019년 약 5억 달러 수준에서 시작해, 연평균 25% 이상의 성장률로 2028년에는 40억 달러에 달할 것으로 예측된다. 특히 AI 플랫폼, 연산 하드웨어, 컨설팅 및 지원 서비스로 구성된 이 생태계에서 컨설팅 및 서비스 영역이 가장 빠르게 성장하고 있으며, 이는 AI 도입을 위한 전문 인력과 해석 역량에 대한 수요가 폭발적으로 증가하고 있음을 시사한다.
이번 장에서는 실험실 밖에서 AI 바이오사이언스를 조망하여, 과연 어떤 시장이 있는지, 또 어떤 회사들이 활약하고 있는지 알아보고자 한다.
AI는 대규모 오믹스 데이터와 생물학적 이미지, 논문 기반 지식그래프‡‡를 학습함으로써 질병의 숨겨진 생물학적 기전과 약물 표적을 예측하고 있다. 대표적으로 BenevolentAI는 3,500만 개 이상의 논문, 특허로 구축한 지식그래프와 딥러닝을 결합해 질병 관련 경로와 표적을 도출하고, AstraZeneca와 함께 섬유화 질환의 신규 타겟을 발굴한 바 있다. 이러한 기술력을 바탕으로 BenevolentAI는 2022년 SPAC 상장을 통해 2.89억 달러의 자금을 유치할 수 있었다. 앞서 언급한 Recursion은 세포 이미지 기반의 Phenotypic AI를 활용하여 약물의 작용기전을 역추적하고, 이를 통해 새로운 적응증 확장 전략과 표적 발굴을 제안하고 있다. 이러한 기전 예측 AI는 후보물질의 약리작용 경로를 가설 생성 단계에서 밝혀주어, 어떤 바이오마커를 추적할지, 병용효과는 어떨지 등의 개발 전략을 합리적으로 설계할 수 있게 한다. 특히, 환자 유래 세포 모델 실험 데이터와 AI를 결합하면, 인간 생물학에 근거한 질병 모델을 in silico로 구축하여 후보물질의 작용 메커니즘과 환자 반응까지 예측할 수 있으며, 이를 통해 임상 성공 확률을 높이고 표적 검증을 가속화할 것으로 예측된다.
AtomWise는 최초로 deep neural network 기반의 structure-based binding affinity prediction model인 AtomNet을 만들었다. AtomNet은 기존 리간드 기반 모델(알려진 활성 리간드들의 구조만 학습)과 달리 표적 단백질의 3차원 구조 정보를 함께 학습함으로써, 기존에 데이터가 부족했던 신규 표적에 대해서 affinity 예측이 가능하게 한 최초의 모델이다. 또한 CNN 구조를 활용해 수소결합이나 π-결합§§과 같은 국소적인 생화학적 상호작용을 자동으로 학습하고, 이를 계층적으로 조합해 분자 결합이라는 복잡한 현상을 정밀하게 모델링할 수 있다. 즉, “리간드”유사성 기반이 아닌, 구조와-리간드 사이의 관계에 대해서 알 수 있게 된 모델이라고 할 수 있다. 이는, 실험실에서 후보물질과- 타겟 사이의 affinity를 사람이 실험적으로 검증하던 시간을 단축하게 돕는다. AtomNet은 약 3조개에 달하는 합성 가능한 단백질의 라이브러리를 모두 탐색하고, 여기서 target 물질과 가장 affinity가 높은 단백질에 단백질을 골라내, 신약 후보물질을 제공한다. Atomwise는 이러한 기술력을 바탕으로 시리즈 B에서 1.23억 달러를 유치하고, Sanofi 및 Eli Lilly와 총 55억 달러 규모의 파트너십을 체결하며 글로벌 제약사와의 협력을 확대하고 있다.
신약 후보물질의 전임상 탈락 원인 중 하나는 예측되지 않은 독성과 낮은 생체적합성이다. 과거 QSAR(Quantitative structure-activity relationships)이나 rule based 규칙(사전에 프로그래밍된 규칙에 따라서 단백 구조를 만들어내는 것)에 의존했던 전산 예측은 복잡한 생체 내 독성 기전을 충분히 반영하지 못하는 한계가 있었다. 이에 따라 최근에는 ZINC, ChEMBL 등 대규모 퍼블릭 데이터셋을 기반으로, 그래프 신경망(GNN)과 사전학습된 대형 언어모델(LLM)을 활용한 통합 ADMET 예측 플랫폼이 빠르게 확산되고 있다. GNN은 분자를 그래프 구조로 표현해 원자 간의 결합 관계와 전자적 특성을 효과적으로 학습하고, LLM은 논문과 독성 리포트에서 축적된 생물학적 문맥 정보를 이해하여 복합 독성 패턴을 추론할 수 있다. 이러한 AI 기반 접근은 기존의 규칙 기반 모델보다 예측 정확도가 월등히 높으며, 특히 조기 탈락 가능성이 높은 후보물질을 전임상 단계에서 선별함으로써 개발 비용을 크게 절감하고 임상 진입 성공률을 제고할 수 있다.
규제기관 역시 이 변화를 적극적으로 수용하고 있다. 실제로 FDA는 2026년부터 AI 기반 독성 예측 모델과 인간 오가노이드 기반 실험 결과를 동물 실험의 대체 수단으로 인정하는 시범 프로그램을 도입할 계획이다. 이는 규제 차원에서 AI 기반 시뮬레이션을 신뢰 가능 데이터로 인정하겠다는 의지이며, 산업 전반에 걸쳐 비임상 전략의 재편을 촉진할 수 있다. 이러한 변화 속에서 ADMET 예측을 위한 약물 시뮬레이션 플랫폼 기업들도 주목받고 있다. Certara의 PBPK(Physiologically-Based Pharmacokinetic) 모델은 환자 특이적 대사 예측에 특화되어 있으며, Simulations Plus의 GastroPlus는 위장관 흡수 시뮬레이션에 강점을 갖고 있다. 각 플랫폼은 AI와 물리 기반 시뮬레이션을 접목해, 실제 임상과 유사한 환경에서의 약물의 분포를 가상 테스트할 수 있도록 지원하고 있다.
AlphaFold3의 등장은 생성형 AI가 신약개발의 핵심 엔진으로 부상했음을 잘 보여준다. AlphaFold3는 Google과 Isomorphic Labs가 공동 개발한 파운데이션 모델(foundation model∥∥)로, 기존의 단백질 구조 예측뿐 아니라 DNA, RNA, 리간드(ligand), 이온(ion)까지 함께 고려한 통합적인 3차원 구조 모델링을 목표로 하고 있다. 이 모델은 단백질의 염기서열 정보만으로 표적 단백질의 구조를 정확히 예측하여, 기존에는 구조가 밝혀지지 않아 약물 설계조차 시도하지 못했던 표적 단백질까지도 공략할 수 있게 되어 주목받고 있다.
AlphaFold3는 단백질 서열을 넘어 다양한 생체분자의 구조를 예측할 수 있도록 디퓨전 모델을 채택하여 3차원 구조를 생성한다. 또한 항원-항체, 전사인자-DNA와 같은 다양한 생체 고분자 사이의 상호작용을 반영하기 위해 Pairformer(Figure 6.)를 도입했다. 이로써 기존에 '약물화 불가능'하다고 여겨졌던 단백질 표적까지 타깃화할 수 있는 가능성이 열렸다. Isomorphic Labs는 이러한 기술력을 바탕으로 외부 벤처캐피털로부터 6억 달러의 투자금을 확보했으며, AI로 설계한 약물의 임상 진입을 계획하고 있다.
Figure 6: AlphaFold3의 구조. 이전과 다르게 regression이 아니라 diffusion을 이용한 모델을 채택하고 있으며, 단순히 단백질의 구조 예측을 넘어서 피규어에 나온 것과 같이 핵산과 단백질, 그리고 이들의 상호작용까지 모델링할 수 있는 성능을 갖추었다.
AI 기반 신약개발을 가능하게 하는 또 다른 핵심 요소는 연산 인프라이다. Recursion은 2023년 NVIDIA로부터 $50M 투자를 유치하며 자사 BioHive-2 슈퍼컴퓨터에 NVIDIA DGX 클라우드를 도입했고, Microsoft는 1910 Genetics와 협력해 Azure Quantum Elements에 AI 신약설계 플랫폼을 통합했다. Alphabet은 자회사 Isomorphic Labs를 통해 AI 기반 신약개발을 미래 핵심 사업으로 지정하고, 2025년까지 6억 달러의 추가 투자를 예고했다. NVIDIA의 BioNeMo 플랫폼 제공, Microsoft의 5년간의 클라우드 공동개발 계약, Google의 생명과학 집중 투자 등은 이 분야에서 인프라 빅테크와 AI 바이오 기업 간의 전략적 제휴가 점차 본격화되고 있음을 보여준다.
Enabling in-Silico Drug Pipelines through Policy
FDA가 약제 심사 과정에 생성형 AI를 공식적으로 도입했다. 2025년 5월에 이루어진 공식 발표에 의하면 [28], 이미 AI를 적용한 약제 심사 1건을 시범 시행했으며, 6월까지 FDA 내의 모든 센터로 확장할 계획이라 한다. 반복적인 작업에 소요되던 시간을 대폭 줄이겠다는 의도다. AI의 적용 범위에 대한 토론이 그간 많았지만 이제는 말만이 아닌, 행동으로 보여주겠다는 의지가 눈에 띈다. "Why does it take over 10 years for a new drug to come to market?" 같은 날에 FDA Commissioner의 X에 올라온 코멘트다 [29].
FDA의 이 같은 과감한 결정에는 관계자 모두가 주목할 수밖에 없다. 제약 업계에서는 그동안 AI로 얻은 결과를 규제기관이 이해할 수 있는 언어로 바꾸는 것이 중요했지만, 이제 FDA도 AI를 사용하므로 소통의 효율이 높아질 것이다. 동시에 자신들의 AI 리터러시를 올려 페이스를 맞추는 노력도 필요해질 것이다 [30]. 규제가 산업 발전을 따라가야 한다는 익숙한 구호의 반대로, 산업계가 규제 기관의 진보에 발맞춰야 하는 그림이 된 것이다. 공정성, 재현성, 신뢰성을 잃어서는 안 된다는 우려 역시 존재하지만, FDA의 이번 시도가 성공적일 경우 각국 규제기관은 이 선례를 즉각 참고하게 될 것이다.
약제 승인에 인공지능을 도입하는 것은 상당히 새로운 사건이지만, 약제 개발에 AI를 적용하는 것은 지난 수 년간 계속된 흐름이다. 이에 따라 FDA에서도 이미 여러 가이드와 리포트를 공개한 바 있다. 일례로 2023년에 발표된 "AI/ML for Drug Development Discussion Paper"[31]에서는 약제 개발의 전 과정을 짚으며 AI/ML의 사용 현황 및 위험 관리를 위해 고려해야 할 점을 제시하고 있다. 즉 후보물질 발견뿐만 아니라 전임상 및 임상 연구의 각 단계, 그리고 시장 도입 후의 조사(surveillance) 과정까지 다루고 있다. 예를 들어 임상 시험 참가자 선택 과정에서 예측 모델을 적용하여 약제에 반응할 가능성이 높은 고위험군을 선별할 수 있다는 언급이 있다. 이 중 부작용 위험이 높은 참가자도 따로 분류하여 제외하거나 모니터링 방법을 달리할 수 있다는 것도 제안하고 있다.
이 문서의 특징은 개방성과 협업 의지를 담은 표현이 곳곳에 등장한다는 점이다. FDA는 당사자들과 지속적으로 소통하고 AI의 최신 응용 방향을 적극적으로 '배우겠다'는 의지를 분명히 하고 있다. 이를 통해 약제의 안전성과 효과를 보장하면서도 혁신을 촉진하겠다는 메시지를 전달한다.
국내 식품의약품안전처 또한 AI 기반 의약품 개발 트렌드에 발맞춰 2023년 4월 미국 FDA와 상호협력을 위한 협력 각서를 체결한 데 이어, 2024년 6월에는 '인공지능(AI)을 활용한 의약품 개발 안내서'를 발간하며 국내 제약 바이오 기업들이 AI를 의약품 개발에 효과적으로 활용할 수 있도록 구체적인 지침을 제공하고 있다. 이 안내서는 의약품 개발 단계별 AI/ML 활용 범위와 기술적·윤리적 측면에서의 고려사항을 담고 있어, 국내 기업들이 AI 기반 의약품 개발을 추진하는 데 중요한 기준점이 되고 있다. 규제 기관은 이제 기술 발전을 방해하는 존재가 아니라, 함께 방향을 설계하는 파트너다. 잘 만들어진 규제는 기업이 더 신뢰받고 지속 가능한 혁신을 이룰 수 있는 기반이 된다.
한편 정부 차원에서도 주목할 만한 새로운 움직임이 있다. 바로 AI 인프라 구축이다. 컴퓨팅 자원은 늘 중요했지만, 생성형 AI가 연구와 산업의 핵심 도구로 자리잡은 현재, GPU의 필요성이 더욱 커지고 있다. 도널드 트럼프 미국 대통령은 2기 취임식에서 "The Stargate Project"를 발표했다 [32]. 이 프로젝트는 4년간 5천억 달러를 투자해 20개의 AI 데이터 센터를 건설하는 것이 목표다. 참여 기업으로는 OpenAI, SoftBank, Oracle, MGX, Microsoft, Nvidia, Arm이 있다 [32][33][34].
자매 프로젝트인 "Stargate UAE"의 존재도 주목할 만하다 [35]. 미국은 반도체 산업을 선도하고 있고, 아랍에미리트는 효율적인 에너지 생산이 가능하니 'AI 연합'을 이루려 하는 것으로 풀이된다 [36]. UAE는 인공지능, 디지털 경제, 원격 근무를 다루는 정부 부처가 있을 정도로 기술 혁신에 관심이 많으며, 앞에서 열거한 참여 기업 중 MGX도 AI에 투자하는 UAE의 국영 기업이다. 이 협력 프로젝트를 보면 AI 인프라가 점차 패권의 개념이 되고 있다 해도 과언이 아니다.
AI 인프라는 컴퓨팅 자원을 필요로 하는 어느 분야에든 필수적인 기반이며, 제약 산업도 마찬가지이다. 현대화된 규제와 곧 구축될 인프라가 결합되면 고도화된 ‘In-Silico Drug Pipeline'이 보편화될 것이다. 이처럼 AI 인프라는 단순한 기술 기반을 넘어, 국가 간 경쟁의 핵심 자산으로 자리 잡고 있다. 제약 산업에서도 이러한 인프라를 어떻게 활용하느냐에 따라 혁신의 속도와 주체가 근본적으로 달라질 수 있는 시점이 다가오고 있다.
생명과학은 지금, 2000년대 초 인터넷 혁명에 비견될 만큼의 구조적 전환기에 놓여 있다. AI는 생명과학에서 단순 실험 자동화의 범주를 넘어 생명현상의 복잡성을 수학적 모델로 환원하고 신약의 병목을 극복하는 강력한 도구로 진화하고 있다. 예컨대 AlphaFold3는 분자 상호작용을 통합적으로 예측하는 생성형 모델로서의 가능성을 열었고, Evo-2는 유전체 전체를 통째로 해석하는 초장기 문맥 인식의 새로운 지평을 보여주었다. 이러한 플랫폼은 단지 기술 그 자체를 넘어, 생명과학 연구 방식에서 변혁을 일으키고 있다.
나아가, AI는 정밀의학과 맞춤치료를 가능하게 하여 ‘평균적 환자’를 가정하지 않고, 환자 각각에 대한 개별적 대처를 하는 시스템의 중추가 될 가능성을 보여주고 있다. 이미 개인의 유전체에 맞춘 질환 치료를 제공하는 새로운 치료 모델이 등장하고 있다. 예를 들어서 scFPM과 같이 단일세포 이미지를 분석해 최적의 약물 조합을 추천하고, 실제로 완전 관해(remission)에 도달한 사례가 그 예시가 될 것이다. 이 전환을 앞두고 AI 바이오사이언스의 특징적인 여러 과학적, 사회적 과제들을 우리는 극복해야 한다.
첫째, AI의 예측력은 생명과학의 새로운 도구가 되었지만, 그 결과가 언제나 과학적 타당성을 보장하지는 않는다. 실제로, AlphaFold3나 ESM-3가 생성한 구조나 서열이 과학적 지식과 모순되거나 물리화학적 원리를 간과하는 경우도 적지 않다. 예를 들어, 미국 국립표준기술연구소(NIST)의 최근 연구에 따르면, AlphaFold3는 RNA 구조 예측에서 데이터 부족으로 인해 나트륨(Na⁺), 칼륨(K⁺) 같은 1가 이온과 마그네슘(Mg²⁺) 같은 2가 이온을 제대로 구분하지 못한다. 실제로 Mg²⁺는 RNA와 강력한 배위결합¶¶을 형성해 chelation이 가능한 반면, 1가 이온과 RNA의 상호작용은 대부분 정전기적 상호작용에 국한된다.그럼에도 불구하고, AI모델은 물리화학적 타당성이 아직 부족하기에 이 둘을 동일하게 처리해 예측에 오류가 발생한다 [37]. 또한, AlphaFold와 같은 AI 모델은 동적 구조***를 가진 단백질에 대해서도 ‘고정된 구조’를 단정하는 경향이 있어, 구조를 불안정하게 만드는 돌연변이(destabilizing mutation)에 대해서는 예측력이 현저히 떨어진다 [38]. 이처럼 AI가 내놓은 예측 결과를 무조건 신뢰하기 어렵기 때문에, 실제 연구 및 임상에서는 여전히 실험적 검증과 고전적 이론 모델의 병행이 필수적이다.
둘째, AI가 설계한 단백질이 예기치 못한 독성을 유발하거나 사회 안정을 위협했을 때, 책임 소재가 개발자, 데이터 제공자, 규제기관 등 여러 주체 간에 분산되어 불투명하다. 특히, 합성 생물학은 생물학적 무기의 위험성을 내포하고 있으며 AI를 사용하는 합성 생물학이 그러한 위험을 가중시킬 가능성 역시 간과되어서는 안 된다. 일례로, 2021년 Sean Ekins와 Fabio Urbina 등은 MegaSyn이라는 AI 기반 약물 설계 프로그램을 바탕으로 6시간 만에 VX 등 독성 화합물 40,000개를 생성해냈다. [39] 이러한 위험으로 인해 RoseTTAFold의 개발로 2024년 노벨상을 수상한 David Baker 등 주요 연구자들은 AI 기반 단백질 합성이 가지고 있는 바이오안보(biosecurity) 측면의 위협에 대해서 경고하였다 [40]. 이는 단순한 윤리 문제가 아니라, 과학기술과 국가안보가 맞닿은 전 지구적 정책 이슈이다.
우리는 지금 ‘예측하는 과학’이 ‘개입하는 의학’으로 이어지는 경계에 서 있다. 젠슨 황이 예견했듯이, AI 바이오사이언스는 인류의 건강과 수명을 근본적으로 변화시킬 21세기의 가장 강력한 기술 혁명 중 하나가 될 것이다. 그러나 기술의 진보가 생명의 존엄을 앞설 수는 없다. 질병의 예측보다 더 어려운 것은 신뢰의 설계이며, 분자의 조합보다 더 정교해야 할 것은 사회적 합의다. 결국 이 기술이 어떤 미래를 만들어낼지는, 우리가 어디까지 책임질 준비가 되어 있는가에 달려 있다. 이를 위해 기술적 투명성, 산업적 책임, 그리고 정책적 선도의 균형이 필요하다.
ADME (Absorption, Distribution, Metabolism, Excretion): 약물이 체내에 들어와 흡수(Absorption)되고, 몸 전체로 분포(Distribution)되며, 대사(Metabolism) 과정을 거쳐 최종적으로 배설(Excretion)되는 일련의 약동학적 과정을 통칭하는 용어다.
AtomNet: 딥러닝 기반의 최초 구조 기반 약물 결합 친화도 예측 모델이다. 표적 단백질과 리간드의 3차원 구조 정보를 모두 학습하여 둘 사이의 결합 강도를 예측한다.
Attention (Attention Mechanism): 트랜스포머 모델의 핵심 메커니즘으로, 입력 서열의 각 요소가 다른 요소들과 얼마나 관련성이 높은지를 가중치(attention score)로 계산한다. 중요한 정보에 더 집중하고 불필요한 정보는 덜 반영하여, 긴 서열에서도 핵심적인 관계를 효과적으로 파악할 수 있다.
컴퓨터 지원 약물 설계 (CADD, Computer-Aided Drug Design): 컴퓨터 시뮬레이션과 모델링 기술을 활용하여 신약 후보 물질을 설계하고 최적화하는 방법론이다. 1960년대부터 도입되어 약물 개발 효율성을 높이는 데 기여해왔다.
Cryo-EM (Cryo-Electron Microscopy, 저온전자현미경): 생체 분자를 극저온 상태로 급속 냉동한 후 전자빔을 투과시켜 3차원 구조를 고해상도로 분석하는 기술이다. 단백질 복합체나 바이러스 등 복잡한 생체 구조를 연구하는 데 유용하다.
Denoising Diffusion Probabilistic Model (DDPM): 노이즈가 많은 데이터에서 시작하여 점진적으로 노이즈를 제거해 원본 데이터(이미지, 분자 구조 등)를 재구성하는 방식으로 새로운 데이터를 생성하는 인공지능 모델이다. 이미지 생성 분야에서 뛰어난 성능을 보이며, 최근에는 분자 설계에도 활용된다.
Enhancer-Promoter: 유전자 발현을 조절하는 DNA 서열 요소다. 인핸서는 유전자 발현을 증폭시키는 역할을 하며, 프로모터는 유전자 발현이 시작되는 부위다.
ESM (Evolutionary Scale Modeling): 메타(Meta) AI 팀에서 개발한 단백질 관련 대규모 언어 모델 계열이다. 단백질 서열, 구조, 기능 등 다양한 정보를 학습하여 단백질 설계 및 예측에 활용된다.
Evo-2: Arc Institute와 NVIDIA가 공동 개발한 유전체(genome) 분야의 파운데이션 모델이다. 특히 수십만 염기쌍에 이르는 '초장기 문맥(long context)'을 한 번에 이해하고 분석할 수 있어, 유전자 조절 네트워크나 염색질 구조 해석에 강점을 보인다.
Field Theory: 물리학에서 물질의 상호작용을 '장(field)'의 개념으로 설명하는 이론이다.
전장유전체연관분석 (GWAS, Genome-Wide Association Study): 방대한 수의 사람들을 대상으로 유전체 전체에 걸쳐 수십만 개에서 수백만 개의 유전적 변이(단일 염기 다형성, SNP)를 분석하여 특정 질병이나 형질과 연관된 유전적 표지자를 찾아내는 연구 방법이다.
히트 (Hit): 신약 개발 초기 단계에서 대량 스크리닝(High-Throughput Screening)을 통해 발견되는, 특정 생물학적 표적에 대해 약한 활성을 보이는 초기 활성 물질을 의미한다. 아직 약물로서의 개발 가능성은 낮다.
HLA (Human Leukocyte Antigen, 인간 백혈구 항원): 인체 면역계에서 자기(self)와 비자기(non-self)를 구분하는 데 중요한 역할을 하는 단백질 복합체다. HLA 분자는 세포 표면에 외부 항원 조각을 제시하여 T세포가 이를 인식하고 면역 반응을 일으키도록 돕는다. 개인마다 HLA 유형이 다르다.
개인 맞춤형 신항원 치료 (INT, Individualized Neoantigen Therapy): 환자 개개인의 암세포에만 존재하는 특이적인 돌연변이 단백질 조각(신항원)을 분석하여, 이를 표적으로 삼는 맞춤형 백신을 개발하고 투여하는 암 면역 치료법이다. 환자의 면역계가 암세포를 효과적으로 인식하고 파괴하도록 유도한다.
리간드 기반 약물 설계 (LBDD, Ligand-Based Drug Design): 표적 단백질의 구조를 알 수 없을 때, 알려진 활성 리간드(약물 물질)의 특징(예: 화학 구조, 약리학적 특성)을 분석하여 새로운 약물 후보 물질을 설계하는 방법이다.
리드 (Lead): 히트 물질을 최적화하여 효능, 선택성, 안전성 등이 개선된 약물 후보 물질이다. 본격적인 전임상 개발로 이어질 수 있는 단계다.
지질 나노 입자 (LNP, Lipid Nanoparticle): 약물(특히 mRNA 백신)을 체내의 특정 세포나 조직으로 안전하고 효율적으로 전달하기 위해 사용되는 나노미터 크기의 지질 기반 운반체다.
Molecular Dynamics: 컴퓨터 시뮬레이션을 통해 원자 및 분자 간의 물리적 상호작용을 계산하여 시간에 따른 시스템의 움직임을 예측하는 방법이다.
NMR (Nuclear Magnetic Resonance): 강한 자기장 내에서 원자핵이 특정 주파수의 전자기파를 흡수하고 방출하는 현상을 이용하여 분자의 구조를 분석하는 기술이다. 주로 유기 화합물 및 단백질 구조 연구에 사용된다.
New Molecular Entity (NME): 기존에 존재하지 않던 새로운 화학 구조를 가진 물질로, 일반적으로 신약으로 승인될 가능성이 있는 후보 물질을 지칭한다.
PBPK (Physiologically-Based Pharmacokinetic) 모델: 약물의 체내 동태(흡수, 분포, 대사, 배설)를 인체의 생리적 특성과 약물의 물리화학적 특성을 기반으로 수학적으로 모델링하는 방식이다. 환자 특이적 약물 반응 예측 및 용량 조절에 활용된다.
정량적 구조-활성 관계 (QSAR, Quantitative Structure-Activity Relationship): 화학 물질의 구조적 특성과 생물학적 활성 간의 정량적 관계를 통계적 모델로 분석하여, 새로운 화합물의 활성을 예측하는 방법론이다.
RFDiffusion: Washington University의 David Baker 연구팀이 개발한 인공지능 모델로, 확산 모델(Diffusion Model)을 활용하여 특정 제약 조건(예: 활성 부위의 형태)을 만족하는 새로운 단백질 구조를 '생성'하는 데 특화되어 있다.
ROI (Return on Investment): 투자한 자본에 비해 얻은 이익의 비율을 나타내는 지표로, 투자의 효율성을 평가하는 데 사용된다.
구조 기반 설계 (SBDD, Structure-Based Drug Design): 약물 표적(주로 단백질)의 3차원 구조 정보를 활용하여, 이 구조에 가장 잘 결합하고 특정 기능을 조절할 수 있는 약물 후보 물질을 설계하는 방법이다.
합성생물학 (Synthetic Biology): 공학적 원리(설계, 구축, 시험)를 생물학 시스템에 적용하여 새로운 생물학적 기능이나 시스템을 만들거나, 기존 생물학 시스템을 재설계하는 학문 분야다.
StripedHyena2: Evo-2 모델에 사용된 효율적인 인공지능 아키텍처다. 기존 트랜스포머의 계산량 문제를 해결하기 위해 'hyena' 필터와 'striped attention'이라는 기술을 사용하여, 긴 서열에서도 효율적으로 중요한 상호작용을 포착하고 처리할 수 있다.
*: 인텔 공동 창립자인 고든 무어(Gordon Moore)가 1965년에 제시한 반도체 산업의 법칙으로, 마이크로칩의 트랜지스터 수가 약 2년마다 두 배로 증가하여 컴퓨팅 성능이 기하급수적으로 향상된다는 관찰이다.
†:구글의 모회사인 알파벳(Alphabet) 소유의 영국의 인공지능 연구 회사로, AlphaGo, AlphaFold 등 혁신적인 AI 기술을 개발했다.
‡:신약 개발 초기 단계에서 '히트(Hit)'로 발견된 초기 활성 물질을 약물 후보 물질인 '리드(Lead)' 화합물로 발전시키는 과정이다. 이 단계에서 물질의 효능, 선택성, 약동학적 특성 등을 개선한다.
§: 새로운 기술이나 서비스가 출시될 때, 기존 규제에 얽매이지 않고 일정 기간 동안 제한된 환경에서 시험해 볼 수 있도록 허용하는 제도이다.
∥:단백질 구조 예측 분야의 세계적인 학술 대회로, 다양한 예측 방법론들의 성능을 평가하고 비교하는 역할을 한다.
¶: Pfs48/45은 말라리아 기생충이 사람의 체내에서 생식세포(gamete) 단계일 때 표면에 발현하는 단백질로, 면역계가 이를 인식할 수 있다.
**: GFP는 녹색형광단백질로, 특정 파장의 빛(주로 푸른색 또는 자외선)을 받으면 녹색 형광을 방출한다. 원래 해파리(Aequorea victoria)에서 발견되었으며, 유전공학 기술을 통해 다른 생물체의 세포나 조직에서 발현되도록 조작될 수 있다. 생명과학 연구에서 유전자 발현 추적, 단백질 위치 확인, 세포 추적 등 다양한 생체 현상을 시각화하는 데 널리 사용된다. GFP를 발견한 시모무라 오사무, 마틴 챌피, 로저 첸이 2008년 노벨화학상을 수상했다.
††: 개인이 특정 자극(예: 미세먼지)에 노출되기 전과 후의 상태 변화를 비교하여, 그 자극이 특정 사건(예: 폐암발병)에 미치는 영향을 평가하는 역학 연구 방법이다. 같은 개인이 대조군 역할도 하므로 다른 교란 변수의 영향을 줄일 수 있다는 장점이 있다.
‡‡: 영어로 knowledge graph로, 실제 세계의 개체(사람, 질병, 약물 등)와 그들 간의 관계를 노드(개체)와 엣지(관계)로 표현한 네트워크 형태의 데이터 구조이다. 인공지능이 복잡한 정보를 이해하고 추론하는 데 활용됩니다.
§§:공유결합 시 형성되는 분자 오비탈의 일종으로, 단일 결합에서 형성된 σ-결합 이후에 이중 결합, 삼중 결합시 형성되는 종류의 오비탈을 말한다.
∥∥: Foundation model로, 방대한 양의 데이터를 기반으로 사전 학습되어, 다양한 작업에 범용적으로 활용될 수 있는 대규모 인공지능 모델이다. 특정 과제에 맞게 추가 학습(fine-tuning)하거나 그대로 사용할 수 있는 특징이 있다. 대표적인 예로는 GPT, AlphaFold 등이 있다.
¶¶:한 원자가 다른 원자에게 비공유 전자쌍을 제공하여 형성되는 공유 결합의 한 종류이다. 생체 분자에서는 금속 이온이 단백질이나 핵산과 특정 방식 으로 결합하는 데 관여한다.
***: 단백질은 고정된 모양만 갖는 것이 아니라, 시간에 따라 구조가 유연하게 변하는 동적(dynamic) 구조를 가진다. 특히 내재적으로 비정형 영역(IDR, Intrinsically Disordered Region)은 특정한 3차원 구조 없이 유동적인 상태로 존재하지만, 다른 분자와 결합할 때 구조를 형성한다.
[1] Fisher, C. (2023, December 3). Why Moore’s law will eat Eroom’s law. Radical Ventures, from https://radical.vc/why-moores-law-will-eat-erooms-law/
[2] Nobel Prize in Chemistry 2024. (2024, October 9). Nature, from https://www.nature.com/collections/edjcfdihdi
[3] Bassani, D., & Moro, S. (2023). Past, present, and future perspectives on computer-aided drug design methodologies. Molecules, 28(9), 3906.
[4] Jayatunga, M. K., Ayers, M., Bruens, L., Jayanth, D., & Meier, C. (2024). How successful are AI-discovered drugs in clinical trials? A first analysis and emerging lessons. Drug discovery today, 104009.
[5] Jumper, J., Evans, R., Pritzel, A., Green, T., Figurnov, M., Ronneberger, O., ... & Hassabis, D. (2021). Highly accurate protein structure prediction with AlphaFold. nature, 596(7873), 583-589.
[6] Abramson, J., Adler, J., Dunger, J., Evans, R., Green, T., Pritzel, A., ... & Jumper, J. M. (2024). Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature, 630(8016), 493-500.
[7] Cheng, J., Novati, G., Pan, J., Bycroft, C., Žemgulytė, A., Applebaum, T., ... & Avsec, Ž. (2023). Accurate proteome-wide missense variant effect prediction with AlphaMissense. Science, 381(6664), eadg7492.
[8] Ko, K. T., Lennartz, F., Mekhaiel, D., Guloglu, B., Marini, A., Deuker, D. J., ... & Higgins, M. K. (2022). Structure of the malaria vaccine candidate Pfs48/45 and its recognition by transmission blocking antibodies. Nature Communications, 13(1), 5603.
[9] Vázquez Torres, S., Benard Valle, M., Mackessy, S. P., Menzies, S. K., Casewell, N. R., Ahmadi, S., ... & Baker, D. (2025). De novo designed proteins neutralize lethal snake venom toxins. Nature, 1-7.
[10] Hayes, T., Rao, R., Akin, H., Sofroniew, N. J., Oktay, D., Lin, Z., ... & Rives, A. (2025). Simulating 500 million years of evolution with a language model. Science, eads0018.
[11] Brixi, G., Durrant, M. G., Ku, J., Poli, M., Brockman, G., Chang, D., ... & Hie, B. L. (2025). Genome modeling and design across all domains of life with Evo 2. BioRxiv, 2025-02.
[12] Ku, J., Nguyen, E., Romero, D. W., Brixi, G., Yang, B., Vorontsov, A., ... & Poli, M. (2025). Systems and algorithms for convolutional multi-hybrid language models at scale. arXiv preprint arXiv:2503.01868.
[13] Hirsch, L. (2025, May 19). Regeneron Pharmaceuticals to acquire 23andMe in court-supervised sale. The New York Times.
[14] Economic Times. (2025, January 22). Oracle’s Larry Ellison says AI‑driven cancer vaccine could be coming soon as Donald Trump announces a $500 billion investment. The Economic Times
[15] Lang, F., Schrörs, B., Löwer, M., Türeci, Ö., & Sahin, U. (2022). Identification of neoantigens for individualized therapeutic cancer vaccines. Nature reviews Drug discovery, 21(4), 261-282.
[16] De Mattos-Arruda, L., Vazquez, M., Finotello, F., Lepore, R., Porta, E., Hundal, J., ... & Griffith, M. (2020). Neoantigen prediction and computational perspectives towards clinical benefit: recommendations from the ESMO Precision Medicine Working Group. Annals of oncology, 31(8), 978-990.
[17]Kim, J. Y., Cha, H., Kim, K., Sung, C., An, J., Bang, H., ... & Choi, J. K. (2023). MHC II immunogenicity shapes the neoepitope landscape in human tumors. Nature Genetics, 55(2), 221-231.
[18] Zhang, H., Liu, H., Xu, Y., Liu, Y., Wang, J., Qin, Y., ... & Cao, J. (2024). Deep generative models generate mRNA sequences with enhanced translation capacity and stability. bioRxiv, 2024-06.
[19] Kim, Y. A., Mousavi, K., Yazdi, A., Zwierzyna, M., Cardinali, M., Fox, D., ... & Maruggi, G. (2024). Computational design of mRNA vaccines. Vaccine, 42(7), 1831-1840.
[20] Xu, Y., Ma, S., Cui, H., Chen, J., Xu, S., Gong, F., ... & Li, B. (2024). AGILE platform: a deep learning powered approach to accelerate LNP development for mRNA delivery. Nature communications, 15(1), 6305.
[21] Reker, D., Rybakova, Y., Kirtane, A. R., Cao, R., Yang, J. W., Navamajiti, N., ... & Traverso, G. (2021). Computationally guided high-throughput design of self-assembling drug nanoparticles. Nature nanotechnology, 16(6), 725-733.
[22] Weber, J. S., Carlino, M. S., Khattak, A., Meniawy, T., Ansstas, G., Taylor, M. H., ... & Zaks, T. (2024). Individualised neoantigen therapy mRNA-4157 (V940) plus pembrolizumab versus pembrolizumab monotherapy in resected melanoma (KEYNOTE-942): a randomised, phase 2b study. The Lancet, 403(10427), 632-644.
[23] Rojas, L. A., Sethna, Z., Soares, K. C., Olcese, C., Pang, N., Patterson, E., ... & Balachandran, V. P. (2023). Personalized RNA neoantigen vaccines stimulate T cells in pancreatic cancer. Nature, 618(7963), 144-150.
[24] Kornauth, C.; Pemovska, T.; Vladimer, G.I.; Bayer, G.; Bergmann, M.; Eder, S.; Eichner, R.; Erl, M.; Esterbauer, H.; Exner, R.; et al. Functional Precision Medicine Provides Clinical Benefit in Advanced Aggressive Hematologic Cancers and Identifies Exceptional Responders. Natl. Libr. Med. 2022, 12, 372–387.
[25] Philippidis, A. AI-Driven Pharma Tech Firm Expands Its Discovery Platform into Biologics: Exscientia intends to double the addressable target universe of its platform by combining generative AI design and virtual screening. Genet. Eng. Biotechnol. News 2022, 43, 10–11
[26] Gamazon, E. R. et al. A gene-based association method for mapping traits using reference transcriptome data. Nat. Genet. 47, 1091–1098 (2015).
[27] Wu, P., Feng, Q., Kerchberger, V.E. et al. Integrating gene expression and clinical data to identify drug repurposing candidates for hyperlipidemia and hypertension. Nat Commun 13, 46 (2022).
[28] U. S. Food and Drug Administration. (2025, May 08). FDA Announces Completion of First AI-Assisted Scientific Review Pilot and Aggressive Agency-Wide AI Rollout Timeline. FDA Newsroom. https://www.fda.gov/news-events/press-announcements/fda-announces-completion-first-ai-assisted-scientific-review-pilot-and-aggressive-agency-wide-ai.
[29] Makary, M. (2025, May 08). X. https://x.com/drmakaryfda/status/1920151300429185233
[30] Constantino, (2025, May 22). T. FDA Embraces AI To Accelerate Drug Review Process. Forbes. https://www.forbes.com/sites/torconstantino/2025/05/22/fda-embraces-ai-to-accelerate-drug-review-process/.
[31] U. S. Food and Drug Administration. (2025, Feb). Using Artificial Intelligence & Machine Learning in the Development of Drug & Biological Products - Discussion Paper and Request for Feedback. Center for Drug Evaluation and Research (CDER). https://www.fda.gov/media/167973/download?attachment
[32] Smith-Goodson, P., & Kimball, M. (2025, Jan 30). The Stargate Project: Trump Touts $500 Billion Bid For AI Dominance. Forbes. https://www.forbes.com/sites/moorinsights/2025/01/30/the-stargate-project-trump-touts-500-billion-bid-for-ai-dominance/.
[33] OpenAI. (2025, Jan 21). Announcing The Stargate Project. OpenAI Newsroom. https://openai.com/index/announcing-the-stargate-project/.
[34] SoftBank Group Corp. (2025, Jan 22). Announcing The Stargate Project. Press Releases | SoftBank Group Corp. https://group.softbank/en/news/press/20250122.
[35] OpenAI. (2025, May 22). Introducing Stargate UAE. OpenAI Newsroom. https://openai.com/index/introducing-stargate-uae/.
[36] Turak, N. & Kharpal, A. (2025, May 28). The U.S.' AI love affair with the UAE isn’t just about access — it’s about dominance. CNBC. https://www.cnbc.com/2025/05/28/the-us-ai-love-affair-with-the-uae-boils-down-to-dominance.html
[37] Bergonzo, C., & Grishaev, A. (2025). Critical assessment of RNA and DNA structure predictions via Artificial Intelligence: the imitation game. Journal of Chemical Information and Modeling, 65(7), 3544-3554.
[38] Agarwal, V., & McShan, A. C. (2024). The power and pitfalls of AlphaFold2 for structure prediction beyond rigid globular proteins. Nature Chemical Biology, 20(8), 950-959.
[39] Craig, J. (n.d.). Widely Available AI Could Have Deadly Consequences. Wired. Retrieved June 21, 2025, from https://www.wired.com/story/ai-dr-evil-drug-discovery/
[40] Baker, D., & Church, G. (2024). Protein design meets biosecurity. Science, 383(6681), 349-349.
신채범(Chaebeom Sheen)
LinkedIn | q.bio 팀 프로필 | GitHub: Cauch‑BS | Google Scholar
저는 서울대학교 의과대학 본과에 재학 중이며, 의학의 발전을 위해 데이터 기반의 정량적 방법론에 관심을 갖고 공부하고 있습니다. 이를 위해서 물리학을 부전공하고 데이터사이언스 학·석사 연계과정에 참여하며, 계산생물학을 탐구하고 있습니다. IBS RNA연구단 장혜식 교수님 연구실에서 RNA 구조 예측과 mRNA 백신 설계 알고리즘을 연구했고, ‘VaxPress’ 프로젝트를 통해 코돈 최적화 모델을 개발했습니다. 이 과정에서 GPU 병렬 계산, 베이지안 추론, 클라우드 컴퓨팅 등 정량적 생물학을 위한 기술적 기반을 실무에 적용해보았습니다.
또한 UTC Investment에서 벤처캐피탈 인턴으로 일했고, Nucleate 활동을 통해 기술과 시장, 커뮤니티가 만나는 접점을 경험했습니다. 저는 기술은 단순한 도구가 아닌, 사람과 과학을 연결하는 구조라고 믿습니다. 그래서 과학을 단지 실험실 안에서의 진리 탐구에 그치지 않고, 기술경영이라는 렌즈를 통해 다시 읽어내려는 시도를 계속하고 있습니다. 결국 제가 관심을 두는 것은 하나의 정답이 아니라, 과학과 기술이 사람에게 더 가까워지는 방식입니다.