Amazon Nova

Auf der AWS re:invent präsentierte Amazon Web Service Amazon Nova, eine neue Generation moderner Foundation Modelle.

At AWS re:invent Amazon Web Service introduced Amazon Nova, a new generation of state-of-the-art Foundation Models.

Amazon Nova ist eine neue Generation moderner Foundation Modelle (FMs) und exklusiv auf Amazon Bedrock verfügbar.

Sie können Amazon Nova nutzen, um die Kosten und Latenzzeiten für nahezu alle Aufgaben der generativen KI zu reduzieren. Sie können auf Amazon Nova aufbauen, um komplexe Dokumente und Videos zu analysieren, Diagramme und Graphen zu verstehen, ansprechende Videoinhalte zu generieren und hochentwickelte KI-Agenten aus einer Reihe von Intelligenzklassen zu erstellen, die für Unternehmens-Workloads optimiert sind.

Ganz gleich, ob Sie Dokumentenverarbeitungsanwendungen entwickeln, die Bilder und Text verarbeiten müssen, Marketing-Inhalte in großem Umfang erstellen oder KI-Agenten entwickeln, die visuelle Informationen verstehen und darauf reagieren können, Amazon Nova bietet die Intelligenz und Flexibilität, die Sie benötigen: Verstehen und kreative Inhaltserstellung.

Amazon Nova Verstehensmodelle (Understanding Models )akzeptieren Text-, Bild- oder Videoeingaben, um Textausgaben zu generieren. Amazon Creative Content Generation Modelle akzeptieren Text- und Bildeingaben, um Bild- oder Videoausgaben zu erzeugen.

Verstehensmodelle: Text und visuelle Intelligenz

Die Amazon Nova Modelle umfassen drei Verstehensmodelle (ein viertes folgt in Kürze), die auf unterschiedliche Bedürfnisse zugeschnitten sind:

Amazon Nova Micro – Ein reines Textmodell, das die niedrigste Latenz in der Amazon Nova Modellfamilie zu niedrigen Kosten bietet. Mit einer Kontextlänge von 128K Token und optimiert für Geschwindigkeit und Kosten, ist Amazon Nova Micro ideal für Aufgaben wie Textzusammenfassung, Übersetzung, Inhaltsklassifizierung, interaktive Chats und Brainstorming sowie einfache mathematische Schlussfolgerungen und Kodierung. Amazon Nova Micro unterstützt auch die Anpassung an proprietäre Daten durch Feintuning und Modelldestillation, um die Genauigkeit zu erhöhen.

Amazon Nova Lite – Ein kostengünstiges multimodales Modell, das sehr schnell Bild-, Video- und Texteingaben verarbeitet und Textausgaben erzeugt. Amazon Nova Lite ist in der Lage, Kundeninteraktionen in Echtzeit, Dokumentenanalysen und Aufgaben zur visuellen Beantwortung von Fragen mit hoher Genauigkeit zu verarbeiten. Das Modell verarbeitet Eingaben mit einer Länge von bis zu 300K Token und kann mehrere Bilder oder bis zu 30 Minuten Video in einer einzigen Anfrage analysieren. Amazon Nova Lite unterstützt auch Text- und multimodale Verfeinerungen und kann mit Techniken wie der Modelldestillation optimiert werden, um die beste Qualität und die besten Kosten für Ihre Anwendung zu liefern.

Amazon Nova Pro – Ein multimodales Modell, das die beste Kombination aus Genauigkeit, Geschwindigkeit und Kosten für eine Vielzahl von Aufgaben bietet. Amazon Nova Pro kann bis zu 300.000 Eingabetoken verarbeiten und setzt einen neuen Standard für multimodale Intelligenz und agentenbasierte Workflows, die den Aufruf von APIs und Tools zur Ausführung komplexer Workflows erfordern. Es erreicht die höchste Leistung bei wichtigen Benchmarks, einschließlich der Beantwortung visueller Fragen (TextVQA) und dem Verstehen von Videos (VATEX). Amazon Nova Pro zeigt Fähigkeiten bei der Verarbeitung sowohl visueller als auch textueller Informationen und bei der Analyse von Finanzdokumenten.

Mit einem Eingabekontext von 300K Token kann es Codebasen von mehr als fünfzehntausend Codezeilen verarbeiten. Amazon Nova Pro dient auch als Trainingsmodell für die Destillation benutzerdefinierter Varianten von Amazon Nova Micro und Lite.

Amazon Nova Premier wird das leistungsfähigste multimodale Modell für komplexe Argumentationsaufgaben sein und als bestes Lehrmodell für die Destillation benutzerdefinierter Modelle dienen. Amazon Nova Premier befindet sich noch in der Entwicklungsphase. AWS strebt die Verfügbarkeit für Anfang 2025 an.

Amazon Nova Verstehensmodelle zeichnen sich durch RAG (Request Assisted Generation), Funktionsaufrufe und agentenbasierte Anwendungen aus. Dies spiegelt sich in den Ergebnissen der Amazon Nova Modelle im Comprehensive RAG Benchmark (CRAG), Berkeley Function Calling Leaderboard (BFCL), VisualWebBench und Mind2Web wider.

Was Amazon Nova für Unternehmen so leistungsstark macht, ist seine Anpassbarkeit. Stellen Sie sich vor, Sie würden einen Anzug schneidern: Sie beginnen mit einer qualitativ hochwertigen Basis und passen diese genau an Ihre Bedürfnisse an. Sie können die Modelle mit Text, Bildern und Videos verfeinern, um die Terminologie Ihrer Branche zu verstehen, sie an Ihre Markensprache anzupassen und sie für Ihre spezifischen Anwendungen zu optimieren. Eine Anwaltskanzlei könnte Amazon Nova beispielsweise so anpassen, dass die juristische Terminologie und Dokumentenstruktur besser verstanden wird.

Die Amazon Nova Modelle umfassen auch zwei Modelle für die Erstellung kreativer Inhalte:

Amazon Nova Canvas – ein hochmodernes Bilderstellungsmodell, das Bilder in Studioqualität mit präziser Kontrolle über Stil und Inhalt produziert, einschließlich umfangreicher Bearbeitungsfunktionen wie Einfärben und Entfernen des Hintergrunds. Amazon Nova Canvas zeichnet sich durch menschliche Bewertung und wichtige Benchmarks wie Text-to-Image Fidelity mit Question Answering (TIFA) und ImageReward aus.

Amazon Nova Reel – Ein modernes Modell zur Erstellung von Videos. Amazon Nova Reel ermöglicht es, kurze Videos aus Textanweisungen und Bildern zu erstellen, den visuellen Stil und das Tempo zu kontrollieren und professionelle Videoinhalte für Marketing, Werbung und Unterhaltung zu generieren. Amazon Nova Reel übertrifft bestehende Modelle bei der Bewertung von Videoqualität und -konsistenz durch Menschen.

Alle Amazon Nova-Modelle verfügen über integrierte Sicherheitskontrollen, und die Modelle zur Erstellung kreativer Inhalte enthalten Wasserzeichenfunktionen, um den verantwortungsvollen Einsatz von KI zu fördern.

Amazon Nova, a new generation of state-of-the-art Foundation Models (FMs) that deliver cutting-edge intelligence and industry-leading price/performance, is available exclusively in Amazon Bedrock.

You can use Amazon Nova to reduce the cost and latency of almost any generative AI task. You can build on Amazon Nova to analyze complex documents and videos, understand charts and graphs, generate engaging video content, and build sophisticated AI agents from a range of intelligence classes optimized for enterprise workloads.

Whether you’re building document processing applications that need to process images and text, creating marketing content at scale, or building AI assistants that can understand and act on visual information, Amazon Nova provides the intelligence and flexibility you need with two categories of models: understanding and creative content generation.

Amazon Nova understanding models accept text, image, or video input to generate text output. Amazon Creative Content Generation models accept text and image inputs to generate image or video output.

Understanding models: Text and Visual Intelligence

The Amazon Nova models include three understanding models (with a fourth coming soon) designed to meet different needs:

Amazon Nova Micro – A text-only model that delivers the lowest latency responses in the Amazon Nova family of models at a very low cost. With a context length of 128K tokens and optimized for speed and cost, Amazon Nova Micro excels at tasks such as text summarization, translation, content classification, interactive chat and brainstorming, and simple mathematical reasoning and coding. Amazon Nova Micro also supports customization to proprietary data using fine tuning and model distillation to increase accuracy.

Amazon Nova Lite – A very low-cost multimodal model that is lightning fast at processing image, video, and text input to generate text output. Amazon Nova Lite can handle real-time customer interactions, document analysis, and visual question answering tasks with high accuracy. The model processes inputs up to 300K tokens in length and can analyze multiple images or up to 30 minutes of video in a single request. Amazon Nova Lite also supports text and multimodal fine tuning, and can be optimized with techniques such as model distillation to deliver the best quality and cost for your use case.

Amazon Nova Pro – A high-performance multimodal model that provides the best combination of accuracy, speed, and cost for a wide range of tasks. Capable of processing up to 300K input tokens, Amazon Nova Pro sets a new standard for multimodal intelligence and agent-based workflows that require calling APIs and tools to complete complex workflows. It achieves state-of-the-art performance on key benchmarks, including visual question answering (TextVQA) and video understanding (VATEX). Amazon Nova Pro demonstrates strong capabilities for processing both visual and textual information and excels at analyzing financial documents. With an input context of 300K tokens, it can process code bases of over fifteen thousand lines of code. Amazon Nova Pro also serves as a teaching model for distilling custom variants of Amazon Nova Micro and Lite.

Amazon Nova Premier will be the most powerful multimodal model for complex reasoning tasks and for use as the best teacher for distilling custom models. Amazon Nova Premier is still in training. AWS is targeting availability in early 2025.

Amazon Nova understanding models excel at retrieval-assisted generation (RAG), function calls, and agent-based applications. This is reflected in Amazon Nova model scores on the Comprehensive RAG Benchmark (CRAG) evaluation, the Berkeley Function Calling Leaderboard (BFCL), VisualWebBench, and Mind2Web.

What makes Amazon Nova so powerful for businesses is its customization capabilities. Think of it like tailoring a suit: you start with a high-quality base and customize it to your exact needs. You can fine-tune the models with text, images, and video to understand your industry’s terminology, align with your brand voice, and optimize for your specific use cases. For example, a law firm could customize Amazon Nova to better understand legal terminology and document structure.

The Amazon Nova models also include two models for creative content creation:

Amazon Nova Canvas – A state-of-the-art image creation model that produces studio-quality images with precise control over style and content, including extensive editing capabilities such as inpainting, outpainting, and background removal. Amazon Nova Canvas excels in human ratings and key benchmarks such as Text-to-Image Fidelity with Question Answering (TIFA) and ImageReward.

Amazon Nova Reel – A state-of-the-art video generation model. With Amazon Nova Reel, you can create short videos from text prompts and images, control visual style and pacing, and generate professional-quality video content for marketing, advertising, and entertainment. Amazon Nova Reel outperforms existing models in human ratings of video quality and video consistency.

All Amazon Nova models include built-in security controls, and creative content generation models include watermarking capabilities to promote responsible use of AI.

Jakob Jung

Dr. Jakob Jung ist Chefredakteur Security Storage und Channel Germany. Er ist seit mehr als 20 Jahren im IT-Journalismus tätig. Zu seinen beruflichen Stationen gehören Computer Reseller News, Heise Resale, Informationweek, Techtarget (Storage und Datacenter) sowie ChannelBiz. Darüber hinaus ist er für zahlreiche IT-Publikationen freiberuflich tätig, darunter Computerwoche, Channelpartner, IT-Business, Storage-Insider und ZDnet. Seine Themenschwerpunkte sind Channel, Storage, Security, Datacenter, ERP und CRM.
Kontakt – Contact via Mail: jakob.jung@security-storage-und-channel-germany.de

VonJakob Jung

Von Jakob Jung

Ähnlicher Beitrag

Exclusive Networks baut globale AWS-Kompetenzen aus

Dropbox: Rudall Head of EMEA

Wie KI das industrielle Geschäftsmodell erneuert

Schreibe einen Kommentar Antwort abbrechen