Approximating distributed graph algorithms [article]

Michael Schramm, Universität Stuttgart, Universität Stuttgart
2019
Das Interesse, Algorithmen auf Graphen ausführen zu können, hat zuletzt stark zugenommen. Dies hat zur Entwicklung von verteilten Graph-Verarbeitungssystemen geführt. Aber diese Systeme brauchen zur Berechnung von gängigen Graph-Algorithmen mehrere Minuten oder sogar Stunden. Auch die Menge an Daten wächst ständig. Beispiele hierfür sind das World Wide Web oder die Graphen sozialer Netzwerke. Dies alles führt zu der Frage, ob immer das exakte Ergebnis eines Algorithmus nötig ist. In anderen
more » ... ist. In anderen Bereichen, wie Big-Data-Anwendungen, haben Approximationen zuletzt stark an Aufmerksamkeit gewonnen. Der Anwender kann über die Genauigkeit des Ergebnisses entscheiden, und wenn er ein weniger genaues Ergebnis akzeptiert, können die Berechnungen beschleunigt werden. Auch in Anwendungen zur verteilten Verarbeitung von Ereignissen und zur Verarbeitung von Datenströmen (Streams) existieren Techniken zur Approximierung. Für verteilte Graph-Verarbeitungssysteme existieren erst einige wenige Ansätze mit Techniken zur Approximierung. Die meisten dieser Ansätze behandeln die Ausdünnung des Graphen oder die Vereinfachung der Funktion auf dem Knoten selbst. Doch der limitierende Faktor bei der verteilten Verarbeitung von Graphen ist hauptsächlich der Nachrichtenaustausch zwischen den Knoten. Diese Arbeit untersucht das Löschen von Nachrichten am PageRank-Algorithmus. Zwei Arten von Nachrichtenlöschungen wurden untersucht. Das Löschen von Nachrichten auf der Basis von Nachrichteneigenschaften und das Löschen aller Nachrichten über eine Kante (das Löschen der Kante). Durch das Löschen soll die Laufzeit der Programme reduziert werden, wobei der Fehler so klein wie möglich bleiben soll. Beide Ansätze wurden mit unterschiedlichen Eigenschaften getestet. Eine detaillierte Analyse der Ergebnisse von beiden Ansätzen und der unterschiedlichen Eigenschaften erfolgte auf drei reellen Graphen. Auch die Metriken zur Bestimmung der Fehlers werden in der Arbeit beschrieben.
doi:10.18419/opus-10383 fatcat:fxnkryebsrcv3gwdr5silz7idq