
지난 5월 8일 글로벌 오픈소스 소프트웨어 기업 레드햇은 기업들이 생성형 AI 모델을 보다 원활하게 개발・테스트・배포할 수 있도록 지원하는 파운데이션 모델 플랫폼인 ‘레드햇 엔터프라이즈 리눅스 AI’(Red Hat Enterprise Linux AI, 이하 ‘RHEL AI’)를 출시했다고 밝혔다.
레드햇에 따르면 RHEL AI는 IBM리서치(IBM Research) 오픈소스 라이선스 그래니트 LLM(Granite LLM, 거대 언어 모델) 제품군과 LAB(Large-scale Alignment for chatbot, 챗봇을 위한 대규모 정렬) 방법론에 기반한 인스트럭트랩(InstructLab) 모델 정렬 도구, 인스트럭트랩 프로젝트를 통한 커뮤니티 중심 모델 개발 접근 방식을 결합한 솔루션이다.
전체 솔루션은 하이브리드 클라우드 개별 서버 배포를 위해 최적화된 RHEL 이미지로 패키징돼 있으며, 분산 클러스터 환경에서 모델과 인스트럭트랩을 대규모로 실행하기 위해 레드햇 하이브리드ML옵스(MLOps, 머신러닝 운영) 플랫폼인 오픈시프트 AI(OpenShift AI)에 포함됐다.
레드햇에 따르면 챗GPT(ChatGPT)가 생성형 AI에 대한 폭발적인 관심을 불러일으킨 이래 혁신 속도는 더욱 빨라지고 있다.
기업들은 생성형 AI 서비스에 대한 초기 평가 단계에서 AI 기반 애플리케이션 구축 단계로 전환하기 시작했다.
레드햇은 생성형 AI 시장은 모든 것을 지배하는 하나의 모델 구도가 아니라 고객들이 다양한 선택지 중에서 특정 요구 사항 해결을 위한 모델을 선택할 수 있는 환경으로 진화할 것으로 보고 있다.
AI 전략 구현을 위해서는 단순히 모델을 선택하는 것만으로는 부족하며, 특정 사용 사례에 맞게 주어진 모델을 조정하고 AI 구현에 드는 막대한 비용을 처리할 수 있는 전문 지식을 필요로 한다.
이와 관련한 진입 장벽을 확실히 낮추기 위해 레드햇은 정렬 도구, 그래니트 모델, RHEL AI를 통해 접근과 재사용이 자유롭고 투명하며 기여에 개방적인 진정한 오픈소스 프로젝트 장점을 생성형 AI에 적용했다.
IBM리서치는 분류법(taxonomy) 기반 합성 데이터 생성과 새로운 다단계(multi-phase) 튜닝 프레임워크를 사용하는 모델 정렬 방식인 LAB 기술을 개발했다.
IB리서치의 접근 방식은 비용이 많이 드는 사람 주석이나 독점 모델에 대한 의존도를 줄임으로써 모든 사용자가 보다 개방적이고 접근하기 쉬운 AI 모델 개발을 가능하다.
LAB 방식이 모델 성능을 크게 향상시키는 데 도움이 될 수 있다는 것을 확인한 IBM과 레드햇은 LAB 방식과 IBM의 오픈소스 그래니트 모델을 중심으로 구축된 오픈소스 커뮤니티인 ‘인스트럭트랩’을 출범시켰다.
인스트럭트랩 프로젝트는 다른 오픈소스 프로젝트에 기여하는 것만큼 간단하게 LLM을 구축하고 기여할 수 있도록 함으로써 개발자들 LLM 개발을 돕는 것이 목표다.
IBM은 인스트럭트랩 출시 일환으로 그래니트 영어 모델 및 코드 모델 제품군도 공개했다.
아파치 라이선스에 따라 출시된 이들 모델은 학습에 사용된 데이터셋에 대한 투명성을 지원한다.
래니트 7B(Granite 7B) 영어 모델은 인스트럭트랩 커뮤니티에 통합됐으며, 최종 사용자는 다른 오픈소스 프로젝트에 기여할 때와 마찬가지로 이 모델 공동 개선을 위해 기술과 지식을 기여할 수 있다.
인스트럭트랩 내 그래니트 코드 모델에 대해서도 유사한 지원이 곧 제공될 예정이다.
‘RHEL AI’는 레드햇에 의해 지원되고 면책되는(indemnified) 오픈소스 라이선스 그래니트 언어 모델 및 코드 모델. LLM 기능을 향상하고 더 많은 사용자가 지식과 기술을 활용할 수 있도록 확장 가능하고 비용 효율적인 솔루션을 제공하는 인스트럭트랩의 라이프싸이클 지원, RHEL 이미지 모드를 통해 부팅 가능한 RHEL 이미지로 제공하며 엔비디아(NVIDIA), 인텔(Intel), AMD에 필요한 런타임 라이브러리 및 하드웨어 가속기와 파이토치(Pytorch)를 포함하고 있다.
사용자는 RHEL AI에서 새로운 AI 모델을 실험하고 조정할 때, RHEL AI가 포함된 레드햇 오픈시프트 AI를 통해 이러한 워크플로우를 확장할 수 있는 준비된 진입로를 확보할 수 있다.
AI 모델 대규모 학습을 위한 오픈시프트 쿠버네티스 엔진과 모델 라이프사이클 관리를 위한 오픈시프트 AI 통합 ML옵스 기능을 활용할 수 있다.
오픈시프트 AI와 RHEL AI는 엔터프라이즈 AI 개발과 데이터 관리, 모델 거버넌스를 위한 추가 기능을 제공하는 IBM 왓슨엑스(watsonsx)와 통합될 예정이다.
RHEL AI는 현재 개발자 프리뷰 버전으로 제공된다. IBM 클라우드는 그래니트 모델을 학습하고 인스트럭트랩을 지원하는 IBM 클라우드 GPU 인프라를 기반으로 RHEL AI 및 오픈시프트 AI에 대한 지원을 추가할 예정이다.
이러한 통합으로 기업은 미션 크리티컬 애플리케이션에 생성형 AI를 보다 쉽게 배포할 수 있을 것이라고 레드햇은 설명했다.
레드햇 아셰시 바다니(Ashesi Badani) 최고 제품 책임자 겸 수석 부사장 “생성형 AI는 기업에게 혁신적인 도약을 제시하지만, 이는 기술 조직이 그들 비즈니스 요구 사항에 맞는 방식으로 AI 모델을 실제로 배포하고 사용할 수 있을 때만 실현 가능하다.”면서 “RHEL AI와 인스트럭트랩 프로젝트는 레드햇 오픈시프트 AI와 큰 규모로 결합돼 제한된 데이터 과학 기술부터 필요한 리소스에 이르기까지 하이브리드 클라우드 전반에서 생성형 AI가 직면한 많은 허들을 낮추고 기업 배포와 업스트림 커뮤니티 모두에서 혁신을 촉진하도록 설계됐다.”고 말했다.