중국 AI 기업인 딥시크는 2024년 12월 딥시크 V3를 출시한 이후, 2025년 1월 20일 딥시크 R1, 딥시크 R1 제로, 딥시크 R1 디스틸 모델을 공개했다. 또한, 1월 27일에는 비전 기반 야누스 프로 7B(Janus-Professional 7B) 모델을 공개했다. 딥시크에 따르면, 해당 모델들은 기존 대비 90~95% 비용 절감 및 비용 효율성을 제공하며, 강화 학습 기법을 적용해 우수한 추론 능력을 갖췄다.
AWS는 고객이 딥시크 R1모델을 다양한 방식으로 활용할 수 있도록 지원한다. 아마존 베드록에서는 API를 통해 사전 학습된 모델을 쉽게 통합할 수 있으며, 아마존 세이지메이커 AI를 통해 맞춤형 학습과 배포가 가능하다. 또한, AWS 트레이니움과 AWS 인퍼런시아를 활용하면 딥시크 R1 디스틸 모델을 더욱 경제적으로 운영할 수 있다. AWS는 보안성과 확장성을 강화하기 위해 아마존 베드록 가드레일(Amazon Bedrock Guardrails)을 활용할 것을 권장했다. 아마존 베드록 가드레일은 생성형 AI 애플리케이션의 입력 및 출력 데이터를 모니터링하고 유해 콘텐츠를 필터링을 지원하는 도구다.
딥시크 R1모델은 현재 AWS에서 네 가지 방식으로 배포할 수 있다. 아마존 베드록 마켓플레이스에서는 모델 카탈로그에서 딥시크 R1을 검색하여 배포할 수 있으며, 아마존 세이지메이커 점프스타트를 통해 머신러닝 허브에서 클릭 한 번으로 배포 및 활용이 가능하다. 또한, 아마존 베드록 커스텀 모델 임포트를 활용하면 딥시크 R1 디스틸 모델을 맞춤형 모델로 가져와 활용할 수 있으며, AWS EC2 Trn1 인스턴스(AWS EC2 Trn1 Occasion)를 사용하면 딥시크 R1 디스틸 모델을 AWS 트레이니움 및 AWS 인퍼런시아 기반 인프라에서 최적의 성능과 비용 효율성을 제공하며 실행할 수 있다.
dl-ciokorea@foundryco.com