IT

아마존 노바: AWS의 새로운 세대 파운데이션 모델

esmile1 2024. 12. 9. 12:58

아마존웹서비스(AWS)가 최근 개최한 AWS 리인벤트 2024 컨퍼런스에서 차세대 파운데이션 모델(FM) 시리즈인 '아마존 노바(Amazon Nova)'를 공개했습니다. 이 새로운 모델 시리즈는 최첨단 인공지능 기술과 업계 최고 수준의 가격 대비 성능을 제공하며, 아마존 베드록(Amazon Bedrock)을 통해 독점적으로 이용할 수 있습니다[1][5].

아마존 노바의 주요 특징

아마존 노바는 다양한 작업에서 최첨단 인텔리전스와 뛰어난 가격 대비 성능을 제공하는 새로운 세대의 파운데이션 모델입니다. 이 모델 시리즈는 크게 두 가지 카테고리로 나뉩니다: 이해 모델(Understanding models)과 창의적 콘텐츠 생성 모델(Creative Content Generation models)[4][5].

이해 모델 (Understanding Models)

아마존 노바의 이해 모델은 텍스트, 이미지, 비디오 입력을 받아 텍스트 출력을 생성합니다. 이 카테고리에는 다음과 같은 모델들이 포함됩니다[4][5]:

  1. 아마존 노바 마이크로 (Amazon Nova Micro)
    • 텍스트 전용 모델
    • 매우 낮은 비용으로 가장 낮은 지연 시간의 응답 제공
    • 128K 토큰의 컨텍스트 길이 지원
    • 텍스트 요약, 번역, 콘텐츠 분류, 대화형 채팅, 브레인스토밍, 간단한 수학적 추론 및 코딩에 적합
  2. 아마존 노바 라이트 (Amazon Nova Lite)
    • 저비용 멀티모달 모델
    • 이미지, 비디오, 텍스트 입력 처리가 매우 빠름
    • 300K 토큰 또는 30분의 비디오 처리 지원
    • 실시간 고객 상호작용, 문서 분석, 시각적 질문-답변 작업에 적합
  3. 아마존 노바 프로 (Amazon Nova Pro)
    • 고성능 멀티모달 모델
    • 광범위한 작업에 대해 정확성, 속도, 비용의 최적 조합 제공
    • 300K 입력 토큰 처리 가능
    • 복잡한 워크플로우 실행 가능한 AI 에이전트 구축에 적합
  4. 아마존 노바 프리미어 (Amazon Nova Premier)
    • 아마존의 가장 강력한 멀티모달 모델
    • 복잡한 추론 작업과 맞춤형 모델 학습을 위한 최고의 교사 모델로 사용
    • 2025년 1분기 출시 예정

창의적 콘텐츠 생성 모델 (Creative Content Generation Models)

아마존 노바는 또한 이미지와 비디오 생성을 위한 모델도 제공합니다[4][5]:

  1. 아마존 노바 캔버스 (Amazon Nova Canvas)
    • 텍스트와 이미지 입력을 통해 전문가 수준의 이미지 생성
  2. 아마존 노바 릴 (Amazon Nova Reel)
    • 텍스트 프롬프트와 이미지를 통해 짧은 비디오 제작
    • 시각적 스타일과 페이싱 제어 가능
    • 전문가 수준의 비디오 콘텐츠 생성

아마존 노바의 성능과 벤치마크

아마존 노바 모델들은 다양한 업계 표준 벤치마크에서 경쟁력 있는 성능을 보여주었습니다[3]:

  • 아마존 노바 마이크로: 메타의 라마 3.1 8B와 구글의 제미나이 1.5 플래시-8B와 비교해 모든 적용 가능한 벤치마크에서 동등하거나 더 나은 성능을 보임. 초당 210개의 출력 토큰이라는 업계 최고 속도 달성.
  • 아마존 노바 라이트: 오픈AI의 GPT-4o 미니, 구글의 제미나이 1.5 플래시-8B, 앤스로픽의 클로드 하이쿠 3.5와 비교해 대부분의 벤치마크에서 동등하거나 더 나은 성능을 보임. 비디오, 차트, 문서 이해도에서 특히 뛰어난 성능 발휘.
  • 아마존 노바 프로: 오픈AI의 GPT-4o, 구글의 제미나이 1.5 프로, 앤트로픽 클로드 소네트 3.5v2와 비교해 대부분의 벤치마크에서 동등하거나 더 나은 성능을 보임. 종합 RAG 벤치마크(CRAG), 버클리 함수 호출 리더보드, 마인드2웹에서 탁월한 성능 발휘.

아마존 노바의 주요 기능

  1. 다국어 지원: 아마존 노바 마이크로, 라이트, 프로는 200개 이상의 언어를 지원합니다[3].
  2. 긴 컨텍스트 처리: 아마존 노바 라이트와 프로는 300K 토큰 또는 30분의 비디오 처리를 지원하는 긴 컨텍스트 길이를 제공합니다[3].
  3. 멀티모달 능력: 텍스트, 이미지, 비디오 입력을 처리하고 이해할 수 있습니다[4].
  4. 맞춤화 가능: 텍스트 및 멀티모달 파인튜닝을 지원하여 특정 사용 사례에 최적화할 수 있습니다[4].
  5. 비용 효율성: 아마존 노바 마이크로, 라이트, 프로는 아마존 베드록의 동급 최고 성능 모델들보다 최소 75% 저렴합니다[7].
  6. 빠른 속도: 각 지능 등급에서 아마존 베드록의 가장 빠른 모델들입니다[7].

아마존 노바의 활용 사례

아마존 노바 모델은 다양한 비즈니스 용도로 활용될 수 있습니다[4][7]:

  1. 문서 처리: 긴 문서(최대 300K 토큰)를 처리하고 분석할 수 있습니다.
  2. 멀티미디어 분석: 단일 요청으로 여러 이미지를 분석하고 최대 30분의 비디오 콘텐츠를 이해할 수 있습니다.
  3. 콘텐츠 생성: 자연어로 이미지와 비디오를 대규모로 생성할 수 있습니다.
  4. 고객 서비스: 빠른 고객 서비스 상호작용부터 기업 문서의 심층 분석까지 가능합니다.
  5. 광고 및 마케팅: 광고, 전자상거래, 소셜 미디어 애플리케이션을 위한 자산 생성에 활용할 수 있습니다.
  6. AI 에이전트 개발: 복잡한 워크플로우를 실행할 수 있는 정교한 AI 에이전트를 구축할 수 있습니다.

아마존 노바의 기술적 세부사항

아마존 노바 모델들의 기술적 세부사항은 다음과 같습니다[2]:

특성 아마존 노바 프로 아마존 노바 라이트 아마존 노바 마이크로

모델 ID amazon.nova-pro-v1:0 amazon.nova-lite-v1:0 amazon.nova-micro-v1:0
추론 프로필 ID us.amazon.nova-pro-v1:0 us.amazon.nova-lite-v1:0 us.amazon.nova-micro-v1:0
입력 모달리티 텍스트, 이미지, 비디오 텍스트, 이미지, 비디오 텍스트
출력 모달리티 텍스트 텍스트 텍스트
컨텍스트 윈도우 300k 300k 128k
최대 출력 토큰 5k 5k 5k
지원 언어 200+ 200+ 200+
지원 지역 미국 동부 (버지니아 북부) 미국 동부 (버지니아 북부) 미국 동부 (버지니아 북부)

아마존 노바의 미래 계획

아마존은 아마존 노바의 지속적인 발전을 위해 다음과 같은 계획을 가지고 있습니다[3][6]:

  1. 컨텍스트 길이 확장: 2025년 초까지 2M 이상의 입력 토큰 컨텍스트 길이를 지원할 예정입니다.
  2. 음성 AI 모델: 2025년 1분기에 음성 AI 모델 출시를 계획하고 있습니다. 이 모델은 스트리밍 음성 입력을 이해하고 음성 억양과 리듬 등 비언어적 신호를 해석하는 기능을 갖출 예정입니다.
  3. 멀티모달 모델 확장: 2025년 중반에는 문자뿐 아니라 이미지, 오디오, 비디오를 입력받아 어떤 형식으로든 출력할 수 있는 멀티모달 모델 출시를 계획하고 있습니다.
  4. 아마존 노바 프리미어: 2025년 1분기에 아마존의 가장 강력한 멀티모달 모델인 아마존 노바 프리미어를 출시할 예정입니다.

아마존 노바와 AWS 생태계

아마존 노바는 AWS의 생태계와 긴밀하게 통합되어 있습니다. 특히 아마존 베드록(Amazon Bedrock)을 통해 제공되며, 다른 AWS 서비스들과 함께 사용하여 더욱 강력한 AI 솔루션을 구축할 수 있습니다[1][5].

아마존 베드록과의 통합

아마존 베드록은 아마존 노바 모델을 쉽게 사용할 수 있도록 하는 플랫폼입니다. 베드록을 통해 다음과 같은 기능들을 활용할 수 있습니다[1]:

  1. 모델 디스틸레이션: 대형 모델의 복잡한 지식을 소형 모델로 쉽게 이전할 수 있습니다. 이를 통해 같은 지식을 가진 소형 모델은 대형 모델보다 최대 500% 더 빠르고 75% 더 저렴한 비용으로 작동할 수 있습니다.
  2. 지연 시간 최적화: 아마존 베드록 내 모델들에 '지연 시간 최적화 버전'을 적용하여 추론 속도를 크게 개선했습니다.
  3. 맞춤형 모델 학습: 기업의 고유한 데이터로 모델을 파인튜닝하여 특정 사용 사례에 최적화할 수 있습니다.

AWS 트레이니움 칩과의 시너지

아마존 노바는 AWS의 차세대 AI 칩인 '트레이니움3'와 함께 사용될 때 더욱 강력한 성능을 발휘할 수 있습니다[1]:

  • 트레이니움3는 3나노미터 공정으로 제작되었으며, 이전 세대인 트레이니움2 울트라서버보다 4배 높은 성능을 갖추고 있습니다.
  • 내년 말 출시 예정인 트레이니움3를 활용하면 고