Faktenbasierte Bewertungen helfen mit optimierten Prozessen, Automatisierung und Maschinenlernen (AutoML) bessere  Entscheidungen zu treffen (English version below). 

Autor: Eswar Nagireddy, Senior Product Manager of Data Science, Machine Learning and Advanced Analytics, Exasol 


Unternehmen sind auf Daten und deren ausführliche Analyse angewiesen, um zukünftige Geschäftsentscheidungen fundiert zu treffen. Solch ein datengetriebenes Vorgehen wird leider in der Realität – abgesehen von Tätigkeiten in internen Data-Science-Teams – bislang immer noch kaum umgesetzt. Laut einer Studie von Capgemini sind nur 39% der befragten Organisationen in der Lage, datengesteuerte Erkenntnisse in einen dauerhaften Wettbewerbsvorteil umzuwandeln.

Der Hauptgrund liegt wohl in den Daten und ihrer Qualität. Denn oft werden Daten noch manuell aufbereitet und analysiert, meist nur punktuell und manchmal sogar überhaupt nicht. Eine Möglichkeit diesem Problem entgegenzuwirken: die Automatisierung des gesamten Prozesses, von der Analyse der Daten bis hin zu den daraus resultierenden Prognosen und Entscheidungen.

Machine Learning  (ML) verspricht genau das: Auf Basis der vorhandenen Daten erkennt der Algorithmus Muster und Zusammenhänge und kann daraus Prognosen und Vorhersagen treffen. Diese im Grunde augenscheinlich optimale Lösung für datengetriebenes Arbeiten birgt aber ein großes Hindernis. Die Modellierung von ML ist eine komplexe Aufgabe, die üblicherweise in den Händen von Datenspezialisten liegt. In den meisten Fällen sind die Mitarbeitenden und Führungskräfte keine Experten auf diesem Gebiet und können mit der technischen Komponente nicht adäquat umgehen. Hier kommt Automated Machine Learning (AutoML) ins Spiel – die Automatisierung des maschinellen Lernens, die jedem Mitarbeiter die Möglichkeit eröffnet, Daten zu analysieren und auf dieser Basis Entscheidungen zu fällen.

Nächste Stufe: Automated Machine Learning

Von Reportings über Analysen bis hin zu Performance Measurement – vor allem bei immer wiederkehrenden Aufgaben, die oftmals sehr zeitintensiv sind und so viele Ressourcen in Anspruch nehmen, die an anderer Stelle besser eingesetzt werden könnten, bietet automatisiertes ML eine Lösung. Anders als beim klassischen ML, das auf komplexen datenwissenschaftlichen Modellen basiert und dem eine sehr vielschichtige Logik zugrundeliegt, müssen die Nutzer von AutoML keine Datenanalytik-Experten sein.

Die User brauchen kein Fachwissen mehr über die einzelnen Abläufe. AutoML-Frameworks geben Einblick in diverse Simulationen und deren Resultate, mit dem Ziel, das beste Modell für einen konkreten Geschäftsfall zu bestimmen. So können verwertbare Erkenntnisse gesammelt werden, ohne dass anspruchsvolle Vorgänge wie die Modellierung der Daten praktiziert werden müssen. Bei der prädiktiven Modellierung soll alles so automatisiert sein, dass nur wenig menschliches Eingreifen benötigt wird. Die Anfälligkeit für Fehler und die Kosten werden reduziert. Die Mitarbeitenden und Führungskräfte können so das Beste aus ihren Daten herausholen, denn auf Basis der Prognosen können sie nun wichtige Geschäftsentscheidungen datenbasiert und sicher treffen.

Data First!

Bevor man allerdings überhaupt AutoML angeht, muss die Grundvoraussetzung gegeben sein: eine solide Datenbasis und ihre Aufbereitung. Statista geht bis 2025 von 181 Zettabyte Daten auf der ganzen Welt aus – eine Steigerung von 182 Prozent innerhalb von 5 Jahren. Die vorhandenen Primärdaten liegen in Unternehmen meist unterschiedlich vor. Für den Einsatz von KI besteht die maßgebliche Aufgabe darin, die Primärdaten zu extrahieren und neu zu speichern, und zwar in einem einfachen verständlichen Format und an einem gut zugänglichen Platz. In der Realität ist das leider oft nicht der Fall und viele Unternehmen tun sich schwer, die geeigneten Daten bereitzustellen, welche für die Analytik gebraucht werden.

Die Lösung sollte aus skalierbaren, flexiblen und wartbaren Daten-Pipelines bestehen. Eine robuste und leistungsfähige Datenbank mit den oben genannten Merkmalen würde dabei helfen, wesentliche Probleme zu lösen. Grundvoraussetzung für all das ist daher eine leistungsstarke Datenbank, in der die Daten gespeichert sind. Um AutoML in vollem Umfang zu nutzen und in praktischen Vorgehensweisen einsetzen zu können, sind zusätzlich unterstützende Add-Ons für die ETL/ELT- und Post-Modellierungsinfrastruktur wie die Datenbereitstellung und -Überwachung ausschlaggebend.

Die richtige Basis schaffen

In den letzten Jahren hat sich die Geschäftswelt rasant gewandelt. Der Blick richtet sich bei vielen Unternehmen mittlerweile nach innen. Daten nehmen dabei eine wichtige Rolle ein: Im Idealfall befähigen sie die Mitarbeitenden in allen Abteilungen, Entscheidungen zu treffen, die faktenbasiert und auf ihre Bedürfnisse zugeschnitten sind. Neben einem Kulturwandel in der Führungsriege und der Schulung von Datenkompetenz spielt KI eine entscheidende Rolle bei dem Prozess hin zu datengetriebenen Geschäftsentscheidungen und Prognosen. Unternehmen müssen dafür allerdings jetzt die Weichen stellen, um sich rechtzeitig zukunftssicher aufzustellen und gegenüber der Konkurrenz nicht das Nachsehen zu haben.

Eswar Nagireddy, Senior Product Manager of Data Science, Machine Learning and Advanced Analytics, Exasol

English version

Data-driven business decisions with Auto ML

Fact-based assessments help make better decisions with automation and machine learning (AutoML).

Author: Eswar Nagireddy, Senior Product Manager of Data Science, Machine Learning and Advanced Analytics, Exasol 

Organizations rely on data and its detailed analysis to make informed future business decisions. Unfortunately, such a data-driven approach is still hardly implemented in reality – apart from activities in internal data science teams. According to a study by Capgemini, only 39% of the organizations surveyed are able to turn data-driven insights into a lasting competitive advantage.

The main reason is probably the data and its quality. This is because data is often still prepared and analyzed manually, usually only selectively and sometimes not at all. One way to counteract this problem: automating the entire process, from the analysis of data to the resulting forecasts and decisions.

Machine Learning (ML) promises exactly that: based on the available data, the algorithm recognizes patterns and correlations and can use them to make forecasts and predictions. However, this basically apparent optimal solution for data-driven work has a major obstacle. Modeling ML is a complex task that is usually in the hands of data specialists. In most cases, employees and managers are not experts in this field and cannot adequately deal with the technical component. This is where Automated Machine Learning (AutoML) comes in – the automation of machine learning that opens up the ability for any employee to analyze data and make decisions based on it.

Next level: Automated Machine Learning

From reporting to analytics to performance measurement, automated ML offers a solution especially for repetitive tasks that are often very time-consuming and thus take up a lot of resources that could be better used elsewhere. Unlike classic ML, which is based on complex data science models and has a very layered underlying logic, AutoML users do not need to be data analytics experts.

Users no longer need expertise in the individual processes. AutoML frameworks provide insight into diverse simulations and their results, with the goal of determining the best model for a specific business case. Thus, actionable insights can be gathered without having to practice sophisticated operations such as modeling the data. In predictive modeling, everything should be automated so that little human intervention is needed. Vulnerability to errors and costs are reduced. Employees and managers can get the most out of their data because they can now make important business decisions based on predictions in a data-driven and secure manner.

Data First!

However, before even tackling AutoML, the basic prerequisite must be in place: a solid database and its preparation. Statista predicts that there will be 181 zettabytes of data around the world by 2025 – an increase of 182 percent within 5 years. The existing primary data is usually available in companies in different ways. For the use of AI, the relevant task is to extract and re-store the primary data in a simple understandable format and in an easily accessible place. Unfortunately, in reality, this is often not the case and many organizations struggle to provide the appropriate data needed for analytics.

The solution should consist of scalable, flexible and maintainable data pipelines. A robust and powerful database with the above features would help solve key problems. Therefore, the basic requirement for all of the above is a powerful database in which the data is stored. Additionally, in order to take full advantage of AutoML and use it in practical approaches, supporting add-ons for ETL/ELT and post-modeling infrastructure such as data provisioning and monitoring are crucial.

Creating the right basis

The business world has changed rapidly in recent years. Many companies are now looking inward. Data plays an important role in this: Ideally, it empowers employees in all departments to make decisions that are fact-based and tailored to their needs. In addition to a culture shift in leadership and data literacy training, AI plays a critical role in the process toward data-driven business decisions and forecasting. However, companies need to set the course for this now in order to future-proof themselves in good time and not lose out to the competition.

 

Von Jakob Jung

Dr. Jakob Jung ist Chefredakteur Security Storage und Channel Germany. Er ist seit mehr als 20 Jahren im IT-Journalismus tätig. Zu seinen beruflichen Stationen gehören Computer Reseller News, Heise Resale, Informationweek, Techtarget (Storage und Datacenter) sowie ChannelBiz. Darüber hinaus ist er für zahlreiche IT-Publikationen freiberuflich tätig, darunter Computerwoche, Channelpartner, IT-Business, Storage-Insider und ZDnet. Seine Themenschwerpunkte sind Channel, Storage, Security, Datacenter, ERP und CRM. Dr. Jakob Jung is Editor-in-Chief of Security Storage and Channel Germany. He has been working in IT journalism for more than 20 years. His career includes Computer Reseller News, Heise Resale, Informationweek, Techtarget (storage and data center) and ChannelBiz. He also freelances for numerous IT publications, including Computerwoche, Channelpartner, IT-Business, Storage-Insider and ZDnet. His main topics are channel, storage, security, data center, ERP and CRM. Kontakt – Contact via Mail: jakob.jung@security-storage-und-channel-germany.de

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

WordPress Cookie Hinweis von Real Cookie Banner