최근 몇 년 동안 과학 분야에서 인공지능(AI)과 대형 언어 모델(LLM)이 많은 주목을 받으며, 그 활용도가 크게 증가하고 있다. 그러나 이와 동시에 LLM 기술을 어떻게 사용하는가에 대한 논의도 활발해졌다. 특히 연구자들이 자체적으로 LLM을 실행할 수 있는 로컬 모델의 등장은 AI의 활용 방식에 큰 변화를 불러일으키고 있다.
Chris Thorpe는 이러한 변화를 주도하는 대표적인 인물 중 한 명이다. 그는 면역 시스템 단백질 구조를 연구하는 사이트인 histo.fyi를 운영하면서 로컬 LLM을 사용해 MHC(주조직 적합 복합체) 분자에 대한 이미지, 데이터 테이블, 아미노산 서열 등을 요약하는 작업을 하고 있다. 놀라운 점은 그가 ChatGPT나 다른 웹 기반 LLM을 사용하지 않고, 자신의 노트북에서 이러한 AI를 실행한다는 것이다. 이는 최근 과학계에서 부상하고 있는 트렌드 중 하나로, 연구자들이 인터넷에 의존하지 않고 자신만의 로컬 환경에서 LLM을 실행하는 방법을 모색하고 있다.
LLM 기술의 발전과 로컬 모델의 대두
과거에는 수백억 개의 매개변수를 가진 LLM을 실행하기 위해 강력한 클라우드 컴퓨팅 자원이 필요했지만, 이제는 이러한 모델을 개인의 컴퓨터에서도 실행할 수 있는 시대가 되었다. 이와 같은 변화는 두 가지 큰 이유에서 가능해졌다. 첫째, 여러 기관과 기술 회사들이 '오픈 웨이트(open weights)' 버전의 LLM을 공개하여 누구나 사용할 수 있게 한 것이다. 이 오픈 웨이트 모델은 사용자가 직접 로컬에서 실행할 수 있도록 만들어졌으며, 필요한 컴퓨팅 자원도 과거보다 크게 줄어들었다. 둘째, 소형화된 모델이 등장하면서 소비자용 하드웨어에서도 LLM을 실행할 수 있는 기술이 개발되었다.
예를 들어, Google DeepMind, Meta, Allen Institute와 같은 여러 기술 기업들은 작지만 강력한 성능을 가진 모델들을 출시했다. 이러한 소형 모델들은 상대적으로 적은 매개변수(약 30억 개에서 70억 개)를 가지고 있지만, 여전히 강력한 성능을 자랑한다. 이 모델들은 과거에 비해 실행 속도가 빨라졌고, 복잡한 연산을 처리할 수 있는 능력도 향상되었다.
로컬 LLM의 장점
로컬 LLM의 주요 장점 중 하나는 비용 절감이다. 클라우드 기반 LLM 서비스는 사용량에 따라 비용이 크게 증가할 수 있기 때문에, 많은 연구자들은 로컬에서 LLM을 실행함으로써 경제적인 부담을 줄이려 하고 있다. 또한, 로컬 LLM은 데이터의 프라이버시를 보장한다. 의료 분야나 민감한 데이터를 다루는 연구자들은 외부 서버에 데이터를 전송할 때 프라이버시 문제가 발생할 수 있기 때문에, 로컬에서 데이터를 처리할 수 있는 방법을 선호한다. 실제로, 일부 연구자들은 이러한 이유로 로컬 모델을 사용하여 연구 데이터를 처리하고 있다.
또 다른 큰 이점은 재현성이다. 상업적 LLM은 지속적으로 업데이트되며, 이는 동일한 입력에 대해 다른 결과를 도출할 수 있다는 문제를 야기한다. 그러나 로컬 LLM을 사용하면 모델이 일정하게 유지되므로, 과학 연구에서 중요한 재현성을 보장할 수 있다. Chris Thorpe는 이러한 이유로 로컬 LLM을 선호하며, "과학에서는 재현성이 중요한데, 상업적 모델은 이를 보장하기 어렵다"고 말했다.
다양한 활용 사례
로컬 LLM은 과학, 의료, 기술 등 다양한 분야에서 활용되고 있다. 예를 들어, 미국 미주리주 스프링필드의 Mercy 의료 시스템에서 일하는 내분비학자 Johnson Thomas는 환자 데이터를 요약하고 인터뷰 내용을 정리하기 위해 로컬 LLM을 개발 중이다. 이 시스템은 오픈 웨이트 음성 인식 모델인 Whisper와 Google DeepMind의 Gemma 2를 결합하여 의사들이 환자와의 대화를 기록하고 이를 요약할 수 있도록 돕는다.
또한, Leiden 대학의 Onur Karakaslar는 로컬 LLM을 사용해 세포 유형을 주석 처리하는 ceLLama라는 파이프라인을 개발했다. 이 파이프라인은 세포의 유전자 발현을 분석하고, 이를 요약하여 과학 연구에서 활용할 수 있는 정보를 제공한다. 이 과정에서도 프라이버시가 중요한 역할을 한다. ceLLama는 데이터를 외부 서버에 전송하지 않고 로컬에서 처리함으로써 데이터 유출 위험을 최소화한다.
로컬 LLM의 활용 가능성과 전망
LLM 기술이 점점 더 발전함에 따라, 과학자들은 이를 다양한 방식으로 활용할 수 있는 가능성을 탐구하고 있다. Thorpe는 LLM을 사용해 MHC 분자의 3D 구조를 정렬하는 알고리즘을 개발하고 있으며, 이를 테스트하기 위해 ProtGPT2라는 모델을 사용하고 있다. ProtGPT2는 738백만 개의 매개변수를 가지고 있으며, 5천만 개 이상의 단백질 서열로 학습된 모델이다. 이를 통해 그는 자연적으로 존재하지 않는 새로운 단백질을 설계할 수 있다.
로컬 LLM을 사용한 연구와 개발은 이제 막 시작된 단계이지만, 그 잠재력은 매우 크다. Thorpe는 "아직은 실험적 단계에 있지만, 시간이 지남에 따라 로컬 LLM이 과학 연구에서 중요한 도구로 자리잡을 것"이라고 전망했다. 실제로, 많은 연구자들이 로컬 LLM을 사용해 연구의 효율성을 높이고 있으며, 이는 AI 기술이 앞으로 더 많은 과학 분야에 응용될 수 있음을 보여준다.
결론
로컬 LLM의 등장은 AI 기술의 새로운 국면을 열었다. 이제 연구자들은 클라우드 서비스에 의존하지 않고 자신만의 환경에서 AI를 실행할 수 있게 되었으며, 이는 비용 절감, 프라이버시 보호, 재현성 보장 등 많은 장점을 제공한다. 앞으로 로컬 LLM이 더 발전함에 따라, 과학 연구뿐만 아니라 다양한 산업 분야에서 AI의 활용이 더욱 증가할 것으로 예상된다. AI 기술이 더 이상 거대한 서버 팜에 국한되지 않고, 우리 손안에 들어온다는 점은 매우 흥미로운 변화라고 할 수 있다.
출처
Nature 지의 게시글
Forget ChatGPT: why researchers now run small AIs on their laptops
https://www.nature.com/articles/d41586-024-02998-y
'뉴스' 카테고리의 다른 글
메타(Meta)의 Llama 3.2 발표 소식 (0) | 2024.09.30 |
---|---|
샘 알트만(Sam Altman)의 (인공)지능의 시대 (0) | 2024.09.30 |
구글 서치 콘솔과 빙 웹마스터 도구에 티스토리 제출 자동화 (0) | 2024.09.29 |
내부링크와 백링크, 그리고 앞으로의 SEO 전략 (0) | 2024.09.24 |
인기 있는 웹 스크래퍼 도구들: 장점, 단점, 그리고 서비스의 특징 (0) | 2024.09.23 |