Posts

단백질 구조 예측 AI 구글·페이스북 경쟁...'알파폴드' 대항마 'ESM폴드' 등장

Image
  단백질의 3차원 구조를 재현한 모식도. 메타가 개발한 단백질 구조 예측  AI 가 6억 개 이상의 단백질 구조를 예측하는 데 성공했다. 게티이미지뱅크 페이스북의 모회사인 메타가 직접 개발한 인공지능( AI )으로 단백질 구조 약 6억 개를 예측하는데 성공했다. 메타는 텍스트를 예측하는 '대형 언어 모델( LLM )'이 적용된  AI   'ESM 폴드( ESMFold )'로 박테리아와 바이러스 등 미생물의 단백질 약 6억 1700 개 이상을 예측한 결과를 논문 사전공개 사이트 '바이오 아카이브'  11 월 1일자에 공개했다. 대형 언어 모델이란 일부 글자만 적어도 전체 단어를 예측하는 자동완성 기능에 사용되는  AI 다. 단백질은  20 여 개의 아미노산이라는 단위체로 이뤄져 있고 각각의 아미노산은 알파벳 약자를 가지고 있다. 글리신은 ' G ', 세린은 ' S '로 표기하는 식이다. 연구팀은 단백질의 구조를  20 개의 아미노산 알파벳으로 이뤄진 서열정보로 표기한 뒤 이를 이용해 텍스트 예측  AI 를 학습시켰다. 그 결과 일부 아미노산의 서열이 가려져 있을 때도 단백질의 구조를 '자동완성' 하는  AI   'ESM 폴드'가 탄생했다. 메타는  ESM 폴드로 2주만에 6억 1700 개의 단백질 구조를 예측하는 데도 성공했다. 이중 3분의 1 이상은 전체 단백질의 모양이 정확하고 경우에 따라서는 원자 수준까지도 식별할 수 있도록 정교했다. 나머지 3분의 2는 낮은 신뢰도로 예측할 수 있었다. 세르게이 옵치니코프 미국 하버드대 교수는  ESM 폴드가 예측하지 못한 부분에 대해 "우리가 전혀 알지 못하는 단백질 부위가 있는 것으로 보인다"고 말했다. 찰덕출장마사지 찰덕출장마사지 찰덕출장마사지 광주출장마사지 대전출장마사지 대구출장마사지 부산출장마사지 울산출장마사지 서울출장마사지 인천출장마사지 세종출장마사지 서귀포출장마사지 제