Benjamin Bohne, GroupVice President Sales Central EMEA bei Cloudera, beschreibt, wie der EU AI Act Daten als Arbeitstiere in den Fokus rückt.

Benjamin Bohne, GroupVice President Sales Central EMEA at Cloudera, describes how the EU AI Act focuses on data as the workhorse.

Niemand erzählt Geschichten von den fleißigen, nie müden Pferden, die die mutigen Cowboys im Wilden Westen von einem Abenteuer zum nächsten trugen. Genauso verhält es sich mit den Daten, auf denen Künstliche Intelligenz (KI) basiert.

Die Innovationen bei KI, und besonders bei Large Language Models (LLM), haben die Relevanz von Daten in den Vordergrund gerückt und führten zu verbesserten Datenanalysefähigkeiten. Das ist erst der Anfang einer Entwicklung, die weiterhin tiefgreifende Auswirkungen auf Mensch und Wirtschaft haben wird.

Da der Erfolg von KI datenbasiert ist, restrukturieren Unternehmen ihr Datennutzungsverhalten und die europäische Politik setzt mit Beschlüssen wie dem Artificial Intelligence Act (AI Act) die Weichen für einen verantwortungsvollen Umgang mit Daten und darauf basierender Technologie. Daten sind damit für Unternehmen nicht länger nur Werkzeug oder Luxus, sondern die Speerspitze des Produktportfolios. Um den „KI-Cowboy“ erfolgreich ans Ziel zu bringen, muss der Fokus auf dem treuen „Daten-Gaul“ liegen.

KI als Cowboy, Daten als Arbeitstier

Möchten Unternehmen heute ernst genommen werden, muss KI ganz oben auf der Agenda stehen. Wie sehr dieses Thema die Märkte dominiert, zeigte im Januar auch die US-Elektronikmesse CES in Las Vegas: Innovationen und „Game Changer“ überall. Doch wenn die KI-Systeme wirklich diese Versprechen halten sollen, sind sie auf große Mengen qualitativ hochwertiger Trainingsdaten angewiesen. Nur so können sie Muster erkennen, Zusammenhänge verstehen und Vorhersagen treffen. Der Erfolg von KI-Anwendungen beginnt somit bereits bei der Auswahl der richtigen Daten. Sind Qualität, Aktualität und Zuverlässigkeit nicht gegeben, kann KI nicht das angestrebte Ergebnis erzielen. Daher ist es unerlässlich, dass Unternehmen ihre Daten sorgfältig auswählen, überprüfen und bereinigen, bevor sie diese zur Schulung von KI-Systemen verwenden. Denn: Für den wirtschaftlichen Erfolg zählt nicht, ob ein Unternehmen KI anwendet oder anbietet, sondern wie fehlerfrei und präzise diese arbeitet – und das beeinflussen die Trainingsdatendaten. Deren Vor- und Aufbereitung ist damit für Organisationen eine klügere Investition als ein zu früher KI-Product-Launch, nur um schnellstmöglich auf der KI-Welle „mitreiten“ zu können.

Wegweiser und Geschwindigkeitsbegrenzung für KI-Innovationen

Auch die Politik bemüht sich, den Einsatz von KI in sichere Bahnen zu lenken. Der von der Europäischen Union beschlossene AI Act ist eine erste Antwort auf die Frage, wie sichergestellt werden soll, dass der Einsatz von KI ethisch und verantwortungsvoll erfolgt. Der Beschluss enthält Bestimmungen für „risikoreiche“ Anwendungen, wie beispielsweise kritische Infrastruktur, Sicherheitsbehörden und Personalverwaltung. Damit soll eine Kontrolle durch den Menschen über KI, eine technische Dokumentation und ein System zum Risikomanagement festgeschrieben werden.

Regulierungen – so wichtig sie auch sind – sind nicht unbedingt ein Freund von Innovationen. Erstere tendieren dazu, die Geschwindigkeit von Letzteren einzuschränken. Hinzu kommt: Eine Regulierung kommt selten allein. Weil das Thema KI aber bisher in bester Wild-West-Manier von Statten lief, werden die bereits beschlossenen und noch kommenden Regulierungen die Colts der Unternehmen abkühlen, mit denen sie neue KI-Innovationen auf den Markt geschossen haben. Das trägt zu einer weiteren Entwicklung bei, die den Markt bereits erfasst hat: eine Konsolidierung.

Ähnlich wie die Entwicklungen im Cloud-Sektor wird nun der KI-Markt erleben, wie größere Wettbewerber kleinere Innovatoren aus dem Markt drängen, absorbieren oder überholen. Die gut finanzierten Vorreiter in der KI-Szene nehmen damit eine dominierende Position ein und lassen neue Marktteilnehmer im Schatten stehen. Hierdurch haben sie auch einen größeren Spielraum, um auf Herausforderungen zu reagieren, die mit neuen politischen Regulierungen einhergehen.

High Noon bei der silofreien Produktentwicklung

Unabhängig von Politik oder der Technik selbst wird eines immer gelten: Zugängliche und vertrauenswürdige Daten bilden den Grundstein für Innovationen – besonders im KI-Bereich. Das Problem: Noch immer behindern Silostrukturen in Unternehmen die dringend benötigte Zugänglichkeit von Daten. Laut Clouderas Datenstudie von 2023 sehen 62 Prozent der IT-Entscheidungsträger in Deutschland Datensilos als Hindernis für ihr Unternehmen, Entscheidungen in Echtzeit zu treffen. Gleichzeitig befürchten fast zwei Drittel der Befragten einen Kontrollverlust aufgrund des Datenwachstums.

Um diesen Herausforderungen entgegenzuwirken, ist es wichtig, Daten als eigenständiges Produkt zu verstehen und zu nutzen. Das erfordert eine strategische Datenverwaltung, bei der Daten als Grundlage für Erkenntnisse und Entscheidungen dienen. Mit der Einführung von Positionen wie der eines „Data Product Owners“ stellen Unternehmen sicher, dass Daten kontinuierlich gepflegt, aktualisiert und genutzt werden, um innovativen Mehrwert zu schaffen. Ein solcher Ansatz fördert nicht nur die Zusammenarbeit zwischen den verschiedenen Abteilungen, sondern hilft Unternehmen eine verlässliche und aussagekräftige Datenbasis aufzubauen.

Diese Datenbasis wird dann über für KI-Innovationen entscheidende Stellen zur Verfügung gestellt: Data Lakehouses. Ein Unternehmen nutzt oder hat oft eine Vielzahl an Datenquellen, Programmierungsumgebungen und Frameworks zur Verfügung. Lakehouses lösen die schon lange existierende Herausforderung, Daten effektiv zwischen diesen Diensten zu verteilen – unabhängig davon, ob sie On-Premises oder in der Public Cloud gespeichert sind. Diese Entwicklung ist entscheidend. Sowohl um Silostrukturen aufzubrechen als auch um konkrete Anwendungen wie punktgenaue Daten-Snapshots für die Einhaltung der Compliance zu ermöglichen.

Je länger Data Lakehouses in Unternehmen im Einsatz sind, umso bedeutender werden sie für deren Erfolg. Mit ihnen besitzen sie eine detailliertere Kontrolle und schärfen das Verständnis für die eigenen Datensätze. Diese verbesserte Datenverwaltung ist für den Einsatz sowie Entwicklung von KI-Anwendungen oder anderer Produkte essenziell – jetzt und in Zukunft.

Fazit

Daten bilden den Grundstein für den Erfolg von KI und neuen Innovationen. Unternehmen sollten sie deshalb wie Produkte behandeln und sicherstellen, dass sie eine hohe Qualität aufweisen und verfügbar sind – unabhängig von ihrem Speicherort. Gleichzeitig müssen sie die rechtlichen und ethischen Aspekte des KI-Einsatzes berücksichtigen, wie es auch der AI Act der Europäischen Union vorschreibt. Indem Unternehmen also die Bedeutung von Daten als Zugpferd unter dem „KI-Cowboy“ erkennen, werden sie auch das Potenzial dieser Technologie ausschöpfen und Lösungen für die kommenden Herausforderungen der Zukunft entwickeln – so dass ihr „KI-Cowboy“ am Ende siegreich in den Sonnenuntergang reitet.

No one tells stories about the hard-working, never-tiring horses that carried the brave cowboys of the Wild West from one adventure to the next. The same is true of the data that powers artificial intelligence (AI).

Innovations in AI, particularly in Large Language Models (LLM), have brought the relevance of data to the forefront and led to improved data analysis capabilities. This is just the beginning of an evolution that will continue to have a profound impact on people and business.

As the success of AI is based on data, companies are restructuring their data usage patterns, and European policymakers are setting the course for the responsible use of data and the technology that is based on it with resolutions such as the Artificial Intelligence Act (AI Act). This means that data is no longer a tool or a luxury for companies, but the spearhead of their product portfolio. To successfully lead the „AI cowboy“ to his destination, the focus must be on the faithful „data horse“.

AI as cowboy, data as workhorse

If companies want to be taken seriously today, AI must be at the top of the agenda. The extent to which this topic is dominating the markets was demonstrated at the US electronics trade show CES in Las Vegas in January: Innovations and „game changers“ were everywhere. But if AI systems are really to deliver on these promises, they need large amounts of high-quality training data. Only then can they recognize patterns, understand correlations, and make predictions. The success of AI applications therefore begins with the selection of the right data. Without quality, timeliness and reliability, AI cannot deliver the desired results. It is therefore essential that companies carefully select, verify and cleanse their data before using it to train AI systems. After all, the key to commercial success is not whether a company uses or offers AI, but how accurate and precise it is – and this is influenced by the training data. Preparing and processing this data is therefore a smarter investment for companies than launching an AI product too early just to „ride the AI wave“ as quickly as possible.

Signposts and speed limits for AI innovation

Politicians are also trying to steer the use of AI in a safe direction. The European Union’s AI Act is an initial response to the question of how to ensure that AI is used ethically and responsibly. The resolution includes provisions for „high-risk“ applications, such as critical infrastructure, security authorities, and human resource management. The aim is to establish human control over AI, technical documentation and a risk management system.

Regulations – as important as they are – are not necessarily the friend of innovation. The former tend to limit the speed of the latter. What’s more, regulation rarely comes alone. But because AI has so far been a Wild West affair, the regulations that have been enacted and will be enacted will cool the guns of the companies that have launched new AI innovations. This is contributing to another trend that has already taken hold in the market: consolidation.

Similar to developments in the cloud, the AI market will now see larger competitors pushing smaller innovators out of the market, absorbing them, or overtaking them. The well-funded pioneers of the AI scene are thus assuming a dominant position, leaving new entrants in the shadows. This also gives them greater scope to respond to the challenges of new political regulations.

High Noon for AI Product Development

Regardless of the politics or the technology itself, one thing will always be true: Accessible and trustworthy data is the cornerstone of innovation – especially in AI. The problem is that siloed enterprise structures continue to impede much-needed data accessibility. According to Cloudera’s 2023 Data Study, 62% of IT decision makers in Germany see data silos as an obstacle to their company’s ability to make real-time decisions. At the same time, nearly two-thirds of respondents fear a loss of control due to data growth.

To address these challenges, it is important to understand and leverage data as a product in its own right. This requires strategic data management that uses data as the basis for insights and decisions. By introducing positions such as data product owner, companies can ensure that data is continuously maintained, updated and used to create innovative value. Such an approach not only fosters collaboration across departments, but also helps companies build a reliable and meaningful database.

This database is then made available to AI innovation through key locations: Data Lakehouses. An organization often uses or has a variety of data sources, programming environments, and frameworks. Lakehouses solve the long-standing challenge of effectively distributing data between these services-whether it is stored on-premises or in the public cloud. This evolution is critical both to break down silos and to enable specific applications, such as precise data snapshots for compliance.

As organizations continue to deploy data lakehouses, they become more critical to their success. They give them more granular control and a better understanding of their own data assets. This improved data management is essential for deploying and developing AI applications or other products – now and in the future.

The bottom line

Data is the cornerstone for the success of AI and new innovations. Companies should therefore treat it like a product and ensure that it is of high quality and available, regardless of where it is stored. At the same time, they must consider the legal and ethical aspects of using AI, as set out in the European Union’s AI Act. By recognizing the importance of data as the driving force behind the AI cowboy, companies will realize the potential of this technology and develop solutions for the challenges that lie ahead – so that their AI cowboy can ride off into the sunset victorious.

Von Jakob Jung

Dr. Jakob Jung ist Chefredakteur Security Storage und Channel Germany. Er ist seit mehr als 20 Jahren im IT-Journalismus tätig. Zu seinen beruflichen Stationen gehören Computer Reseller News, Heise Resale, Informationweek, Techtarget (Storage und Datacenter) sowie ChannelBiz. Darüber hinaus ist er für zahlreiche IT-Publikationen freiberuflich tätig, darunter Computerwoche, Channelpartner, IT-Business, Storage-Insider und ZDnet. Seine Themenschwerpunkte sind Channel, Storage, Security, Datacenter, ERP und CRM. Dr. Jakob Jung is Editor-in-Chief of Security Storage and Channel Germany. He has been working in IT journalism for more than 20 years. His career includes Computer Reseller News, Heise Resale, Informationweek, Techtarget (storage and data center) and ChannelBiz. He also freelances for numerous IT publications, including Computerwoche, Channelpartner, IT-Business, Storage-Insider and ZDnet. His main topics are channel, storage, security, data center, ERP and CRM. Kontakt – Contact via Mail: jakob.jung@security-storage-und-channel-germany.de

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

WordPress Cookie Hinweis von Real Cookie Banner