top of page

MUSTERERKENNUNG

Mustererkennung umschreibt die Wissenschaft, in Daten von Maschinen Muster erkennen zu lassen. Die Mustererkennung hat in den letzten Jahren massive Fortschritte gemacht und ist heute allgegenwärtig  (z.B. in der automatischen Handschrifterkennung oder in Bilderkennungssoftware). Wir verwenden und adaptieren neuste Methoden aus den Bereichen der statistischen und strukturellen Mustererkennung, um auf Ihren Daten Muster und Gesetzmässigkeiten zu entdecken. Die klassischen Forschungsgebiete der Mustererkennung sind das Entwickeln neuer, leistungsfähiger →Klassifikationsmodelle  und →Clustering-Algorithmen.

MACHINE LEARNING

Maschinelles Lernen ist ein Oberbegriff für die automatische Generierung von Wissen aus Daten. Auf grossen, komplexen Datenmengen ist es i.a. nicht möglich, manuelle Datenanalysen durchzuführen. Das heisst, die Daten selbst verhindern, dass manuell neue Muster, Regelmässigkeiten oder verborgene Zusammenhänge entdeckt werden können. Man spricht von überwachtem maschinellem Lernen, wenn eine Maschine Klassifikationsmodelle  aus den Daten ableitet und von unüberwachtem Lernen, wenn eine Maschine systematisch  →Clustering-Algorithmen auf den Daten anwendet.

 

KÜNSTLICHE INTELLIGENZ

Künstliche Intelligenz umfasst verschiedenste Aspekte, Methoden und Aufgabenstellungen. In unserem Kontext verwenden wir künstliche Intelligenz insbesondere dazu, um grosse Datenmengen effizient und möglichst optimal zu durchsuchen. Dies ermöglicht uns entscheidende Vorverarbeitungsschritte auf Ihren Daten durchzuführen, ohne die selbst die elaboriertesten Methoden des →Data Minings oder der →Musterkennung versagen.

DATA MINING

Data Mining bezeichnet die systematische Anwendung unterschiedlicher Methoden auf einem grossen Datenbestand mit dem Ziel, neue Muster, Regelmässigkeiten oder verborgene Zusammenhänge zu entdecken. Typische Aufgabenstellungen im Data Mining sind →Assoziationsanalysen,  das Ableiten von →Klassifikationsmodellen und das Anwenden von →Clustering-Algorithmen. Data Mining setzt insbesondere →Maschinelles Lernen und →Künstliche Intelligenz ein.

KLASSIFIKATIONSMODELLE

Das Ziel der Klassifikation ist es, Objekte in eine von mehreren Klassen einzuteilen. Im Gegensatz zu →Clustering-Algorithmen steht aber hier nicht die Segmentierung bestehender Daten im Vordergrund, sondern das Ableiten eines allgemein gültigen Modells zur Voraussage einer Zielvariable (→Predictive Analytics). Anhand eines z.B. manuell klassifizierten Datensatzes wird mit →Maschinellem Lernen ein Modell abgeleitet, das die Zielvariable der Datenobjekte voraussagen kann. Klassifikationsmodelle werden dabei so gelernt, dass diese auch ein neues, unbekanntes Datenobjekt korrekt einer Klasse zuordnen können. 

ASSOZIATIONSANALYSEN

Mit Assoziationsanalysen werden häufig auftretende Regeln in den Daten gesucht. Die gefundenen Regeln haben die Form «Wenn der Kunde A kauft und B gut findet, dann interessiert er sich auch für C». Solche Regeln ergeben eine für Menschen verständliche Beschreibung der zu Grunde liegenden Daten. Im Unterschied zu →Klassifikationsmodellen werden die zu voraussagenden Attribute aber nicht oder nur indirekt durch den Benutzer vorgegeben, sondern erfolgen direkt aus den Daten, indem mit →künstlicher Intelligenz nach häufig anwendbaren und zutreffenden Regeln gesucht wird.

CLUSTERING-ALGORITHMEN

Mit Clustering-Algorithmen werden vorhandene Daten in homogene Gruppen eingeteilt, so dass Objekte aus gleichen Gruppen eine grössere Ähnlichkeit aufweisen als Objekte aus unterschiedlichen Gruppen. Im Gegensatz zu herkömmlichen Segmentierungsverfahren basieren unsere Verfahren auf Methoden der  →Mustererkennung und nicht auf einer von Menschen vorgegebenen Regelmenge (z.B. Cluster 1 = männliche Kunden unter 25 Jahre). Das heisst,  die Segmentierungsregeln werden auf den Daten unter Berücksichtigung aller verfügbarer Merkmale gelernt (→Maschinelles Lernen). Dies ermöglicht eine absolut objektive Segmentierung von Objekten.

K-MEANS

Einer der bekanntesten →Clustering-Algorithmen ist der K-means Algorithmus. Die grosse Popularität verdankt dieses Verfahren seiner Einfachheit, welche es selbst Laien ermöglicht, Daten zu segmentieren. Wir setzen dieses Verfahren ebenfalls häufig ein - im Gegensatz zu Laien wissen wir aber auch um die Gefahren dieses Algorithmus. Z.B. ist das Grundverfahren extrem anfällig auf Ausreisser. Zudem ist K-Means nur in der Lage, sphärische Cluster aufzuspüren. Aus diesen und weiteren Gründen verwenden wir für die Analyse Ihrer Daten substantielle Erweiterungen dieses Paradigmas (z.B. der Kernel k-Means) bzw. andere Verfahren.

 

APRIORI-VERFAHREN

Die Algorithmen der Apriori-Klasse stellen das klassische Verfahren zum Auffinden von Assoziationsregeln dar. Die Assoziationsanalyse bei Apriori Algorithmen läuft in zwei wohldefinierten Schritten ab. Insbesondere der erste dieser beiden Schritte stellt wegen der kombinatorischen Explosion des Suchraumes eine immense Herausforderung dar. Wir begegnen dieser Herausforderung einerseits mit der Anwendung von Suchmethoden aus der →Künstlichen Intelligenz und andererseits durch die Entwicklung neuer Methoden basierend auf Netzwerkanalysen.

SUPPORT VECTOR MACHINES

Support Vector Machines sind ein konkretes  →Klassifikationsmodell, das wir häufig zur Voraussage von künftigem Kundenverhalten einsetzen (→Predictive Analytics). Obschon man mathematisch beweisen kann, dass es kein einzelnes Verfahren gibt, das für jedes Klassifikationsproblem optimal arbeitet, zeigen empirische Studien die Überlegenheit dieses Klassifikators gegenüber anderen Verfahren (wie z.B. neuronale Netze, Entscheidungsbäume u.a.).

MULTIDIMENSIONALE SKALIERUNG

Die Multidimensionale Skalierung ist ein Bündel von Verfahren der multivariaten Statistik zur 2- oder 3D-Visualisierung von komplexen Abhängigkeiten in Daten. Ihr Ziel ist es, Objekte räumlich so anzuordnen, dass die Abstände zwischen den Objekten im Raum möglichst exakt den erhobenen Ähnlichkeiten entsprechen. Wir verwenden multidimensionale Skalierung zur 2 und 3D-Visualisierung Ihrer Objekte und zur Validierung der  →Klassifikationsmodelle und →Clustering-Algorithmen.

PREDICTIVE ANALYTICS

Predictive Analytics ist ein Sammelbegriff für verschiedene Prognoseverfahren, die versuchen, künftige Entwicklungen vorherzusagen. Für die Prognose verwenden wir selber entwickelte, dem neusten Stand der Forschung entsprechende, →Klassifikationsmodelle. Diese werden auf einer Teilmenge Ihrer vergangenen Kundendaten trainiert und können bei entsprechender Modellgüte auf den gesamten, aktuellen Datenbestand angewendet werden.

bottom of page