Freitag 17.10.2014. Kamer van Oranje, Oosterbeek (NL)
Das Treffen von Oosterbeek (NL) hat Freunde, Kollegen und Partner von Twenty54Labs zusammengebracht um über ein spannendes Thema über das „Bedürfnis nach Wissen“ zu sprechen. Informatica, Cortex, Consetto und Twenty54Labs stellen sich der Frage, welche Bedürfnisse aktuell und zukünftig den Datenmarkt treiben werden.
In der verzaubernden Umgebung einer alten Orangerie in Oosterbeek (dort wurden auch die Photographien gemacht) lassen wir leerzitierte Begriffe wie „Large Scale Data, Complex Data, Data Migration, Data Matching, Interfaces, Multi-Modale Datenbanken, Bi-Temporale Datenspeicherung, NoSQL, DataMining, Semantic Analytics, Natural Language Technology“ einfach mal links liegen und beschäftigen uns mit dem was dies bedeutet, und wie es nützlich gemacht werden kann.
Was bedeuten die Begriffe aus der Welt von „Big Data“ für die notwendige Wissensarbeit in Unternehmen, der Forschung, Verwaltung, Politik? Welche Tools können wir jetzt schon bereit stellen, um Fragen für und in der Zukunft etwas sicherer zu beantworten?
Wandel der wichtigsten Elemente der Wirtschaft: Noch immer Menschen, Kapital, Prozesse?
Nein, immer stärker werden Prozesse als wichtiger Faktor durch Daten ersetzt. Prozesse sind kopierbar geworden. Daten sind richtig behandelt „unique capital“.
Was benötigen Daten, um richtig behandelt zu werden und in einem „Verhüttungsprozess“ von Erz zu Metall zu werden?
Sensoren, IT basierte Prozesse, Produktionsinformationen, Kundeninformationen, Umgebungswerte für Prozesse liefern große Mengen an Daten, die in Relation gesetzt werden, mit einander verknüpft werden.
Was ist der Knackpunkt?
Unser Gehirn filtert sekündlich relevante Informationen aus einem Strom von etwa einem GigaByte Daten. In kritischen Situationen (Geisterfahrer auf meiner Spur in 200m Entfernung) werden nur wenige Byte genutzt. Wissensarbeit muss ebenfalls relevantes von nicht relevantem unterscheiden können. Aus Daten Informationen machen, um nicht in einem „information overflow“ zu ertrinken. Wenn man Durst hat, setzt man sich nicht in eine gefüllte Badewanne, sondern trinkt die gewünschte Portion.
Was wird benötigt?
- Textarbeiten werden die Grundlage der Ernte (Natural Language Processing) Etwa 70% der relevanten Daten eines Unternehmens liegen als Text vor. E-Mails, Handbücher, Unternehmensdarstellungen, Prozessbeschreibungen, Social Media Quellen, CRM Informationen, Produkt-Dokumentationen, Gesetzestexte liegen oftmals brach. Werden nicht ausgewertet – noch schlimmer: Werden nicht verknüpft. Nun sind aber Gesetzestexte oder juristisch relevante Verordnungen relevant für die Produktion und Wartung von Produkten. Rückmeldungen aus FaceBook und Co, den Hotlines und Emails machen auf Produktschwächen aufmerksam, die die Produktion wissen sollte. Oder sogar die Juristen eines Unternehmens interessieren.Ein Bestandteil zukunftssicherer Wissensarbeit ist der Umgang mit Texten. Das klappt am besten durch ein Zusammenarbeiten von inhaltssicheren Experten und maschinellen Prozessen, um große Datenmengen qualitativ hochwertig bearbeiten zu können. Die Verarbeitung von Texten hat in den letzten drei Jahren durch ausgefuchste Algorithmen der „Natural Language Technology“ mächtige Verbündete bekommen. Dabei sind keine monatelangen Lernprozesse für die Ziel-Sprachen notwendig. Vom Start weg verstehen Statistische Textanalysen jede Sprache (bis auf asiatische Sprachen) Consetto UG aus Darmstadt versteht die Kunst der Statistischen Textanalyse aufs Feinste.
- Speicherung wird intelligent sein (performante Datenbanken für große und komplexe Daten)
Nur sinnvoll verknüpfte Daten können für Systeme (Design, Produktion, Vertrieb, Wartung, End-of-Life) den notwendigen Input geben. „Vitamin B“ ist der Wachstumsfaktor für die intelligente Nutzung von Daten überhaupt. „B“ = Beziehungswissen der Daten untereinander stellt für herkömmliche Datenbanken bei großen und komplexen Datenmengen ein Schreckgespenst dar. „Süßes oder Saures?“ – die Frage stellt sich nicht bei Datenbanken mit Speicherungs- und Verknüpfungsprozessen, die unserem Gehirn sehr ähnlich sind.Ist man in der Lage, große Datenmengen systemisch verknüpft zu speichern und zu verwenden, macht auch das Problem der Komplexität keine Arbeit mehr, sondern Freude. Freude an phantasievollen, kreativen Arbeiten mit Daten. Querdenken statt „DataCubes“, konfigurieren statt Anstoßen von IT Change Requests sind dann Realität. Die Cortex AG aus Isernhagen bei Hannover stellte dies sehr deutlich dar.
- Daten aus unterschiedlichen Quellen werden zu einem größeren Ganzen verbunden (Wegebau und Logistik)
Jahrzehnte über werden bereits Daten in Unternehmen, der Verwaltung und Wissenschaft gesammelt. Eine große Anzahl von Programmen, Datenbanken und Systemen wurde installiert und dümpelt im Sinne einer Verknüpfung vor einsamen Inseln vor sich hin. Erst Schifffahrtslinien und Hafenbau können (übertragen) diese Inseln mit einander verbinden. Tools werden benötigt, um Daten auszulesen, zu transportieren in andere Systeme, diese zu bearbeiten und als Informationen weiter zu geben. Informatica gehört seit dem Anfang der Datenverarbeitung zu den großen großen und leistungsstarken Verknüpfern von Datenquellen und -senken.
- Integratoren verbinden Bedürfnisse mit Technologien (Manufakturen für Datenanbau, -ernte und Nutzung)
Querdenken und Verknüpfen von Datenmodellen, Prozessen und Ingenieurskunst der Datentechnik sind gefragt, wenn die Zukunft bedient werden soll. Die Integration von Prozessen und Daten lässt die richtigen Fanggebiete für die Daten erkennen. Durch multi-purpose-Geräte wie das iPad wird die Unterscheidung zwischen Hard- und Software überflüssig. Daten können mobil „on the fly“ erfasst werden oder aus Sammlern remote ausgelesen werden. Und auch die Nutzung wird mobiler: Informationen um Entscheidungen zu treffen werden in Echtzeit vor Ort benötigt – und können vor Ort remote aktualisiert werden. Das erleichtert u.a die Wartung von Maschinen und medizinischen Geräten. Die Schritte der Integration umfassen „going me“ (Individualisierung aus Datenmassen), „going mobile“ (Informationen vor Ort) „going realtime“ (Daten sind wirklich aktuell).
Das Treffen von Oosterbeek wird eine Institution werden. Zukunft wird gemacht, nicht erwartet.
*Im Original heisst es: „I skate to where the puck is going to be, not where it has been.“ (Der Eishockeyspieler Wayne Gretzky)