Qualitative distances and qualitative description of images for indoor scene description and recognition in robotics
Zoe Falomir
2012
AI Communications
Als meus pares Maribel i Rafael, per criar-me i educar-me amb tanta estima, al meu germà Juan, per qué hem jugat, rist i aprés junts, i a tots aquells que m'estimen per compartir la seua vida amb mi. i ii Resümee Die Erzielung einer automatischen Wissensextraktion der Roboterumgebung auf eineähnliche Weise, wie wir Menschen die Umwelt mit unseren Sinnen erfassen, ist eine noch unerledigte Aufgabe der Künstlichen Intelligenz. Der Kontakt der Roboter mit ihrer Umgebung vollzieht sich anhand ihrer
more »
... Sensoren und weiterer elektronischer Elemente, die vor allem nummerische Daten erfassen und verarbeiten. Die Sonar-, Laser-und Infrarotsensoren ermitteln Entfernungsdaten. Die Digitalkameras erzielen Aufnahmen, die vom System als Koordinatennetz in Rot, Grün und Blau (RGB) dargestellt werden. Alle diese nummerischen Daten, die der Umgebung entnommen werden, müssen anschlieβend interpretiert werden, um den Roboter mit dem zur Ausübung einer bestimmten Aufgabe erforderlichen Wissen zu versorgen. Ganzähnlich werden Lichtwellen mit einer bestimmten Amplitude von den Zapfenzellen im menschlichen Auge erfasst und sorgen für neutrale Reize. Allerdings drücken Personen die Informationen, mit denen sie beschreiben oder sich ins Gedächtnis rufen, was sie sehen oder gesehen haben, mit Worten -also qualitativ -aus. Der Prozess, der in Gang gesetzt wird, sobald Lichtwellen von unseren Augen aufgefangen und von unserem Gehirn verarbeitet werden, ist nicht genau bekannt. Es gilt aber als Tatsache der menschlichen Kognition, dass wirüber die bloβe Erfahrung der Wahrnehmung hinaus Dinge in Kategorien ordnen und ihnen ein sprachliches Etikett zuteilen. Da es sich bei den Informationen, welche die Elektronikelemente eines Robotersübermitteln, um nummerische Daten handelt, folgten die ersten Methoden in der Fachliteratur mathematischen Approximationen. In der vorliegenden Dissertation wird das Problem aus einer anderen Perspektive behandelt, die vor allem darauf abzielt, diese nummerischen Werte zu verarbeiten, um qualitative Informationen zu erhalten, also genau so, wie wenn wir die mit unseren Sinnen erfassten Informationen verarbeiten. Die Forschungsarbeit im Rahmen dieser Dissertation versucht, die Lücke zwischen der Erfassung minderwertiger Informationen durch Robotersensoren und dem Bedarf an hochwertigen bzw. qualitativen Informationen zu verringern, um die Kommunikation zwischen Mensch und Maschine zu verbessern und konzeptbasierte logische Schlussfolgerungen zu ermöglichen. Auβerdem kann man den erzielten Qualitätskonzepten eine Bedeutung zuordnen und diese durch Verknüpfung mit anderen Konzepten optimieren. Die genannten Konzepte können auch für Schlussfolgerungen anhand von Qualitätsmodellen verwendet werden, die in den letzten zwanzig Jahren entwickelt wurden, um metrische und mathematische Konzepte wie Orientierung, Entfernung, Geschwindigkeit, Beschleunigung, usw. zu beschreiben und zu interpretieren. Qualitative Informationen werden ferner von den Menschen sowohl in schriftlicher als auch in v gesprochener Form verstanden. Die ersten der in dieser Dissertation präsentierten Beiträge sind die Bestimmung einer Methode zur Erzielung von Mustern für Fuzzy-Abstände (darunter qualitative Abstandsinformationen wie nah, weit entfernt, sehr weit entfernt, usw.) auf der Grundlage von Daten, die wiederum mit einem beliebigen Abstandssensor eines Roboters erfasst wurden, sowie die Bestimmung eines Faktors zur Messung der Unähnlichkeit dieser Muster. Beide Beiträge wurden bei der Integrierung der Abstände angewendet, welche von den Sonar-und Lasersensoren eines Roboters Pioneer 2 dx ermittelt wurden. Infolgedessen konnten besondere Hindernisse wie Glasscheiben, Spiegel, usw. entdeckt werden. Die ermittelten Muster fr Fuzzy-Abstände wurden in eine geringe Geschwindigkeit bei der Roboter-Annäherung an Hindernisseübertragen und zur Unterscheidung von Orientierungssystemen in offen (die näher erkundet werden können) und geschlossen (in denen der Roboter keine weiteren Informationen zur Lokalisierung und Orientierung erfassen kann) genutzt. Der zweite Beitrag ist die Definition eines Modells zur qualitativen Bildbeschreibung anhand der Anwendung neuer Qualitätsmodelle zur Form-und Farbbeschreibung sowie der topologischen Modelle von Egenhofer und Al-Taha [1992] und der Modelle zur qualitativen Orientierung von Hernández [1991] und Freksa [1992]. Dieses Modell kann ein beliebiges digitales Bild qualitativ beschreiben und ist unabhängig von der verwendeten Segmentierungsmethode. Auβerdem wurde das Modell in zwei echten Arbeitsszenarien mit Robotern getestet: (i) zur Beschreibung digitaler Aufnahmen, die von der Kamera eines mobilen Roboters Pioneer 2 dx stammen; und (ii) zur Beschreibung digitaler Aufnahmen von Fliesenmustern, die eine Industriekamera auf einer Plattform erstellt, von der ein Roboterarm Keramikteile zur Zusammenstellung von Mosaiken nimmt. Als dritter Beitrag wurde eine auf Beschreibungslogik basierende Ontologie aufgebaut, um der qualitativen Bildbeschreibung eine förmliche, ausdrückliche Bedeutung zu geben. Die erzielte Methode kann automatisch jedes beliebige Bild verarbeiten und einen Satz beschreibungslogischer Axiome erzielen, die das Bild optisch und räumlich beschreiben. Die im Bild enthaltenen Objekte werden dem ontologischen Schema entsprechend mithilfe eines Beschreibungslogik-Reasoners klassifiziert. Zur Bewertung der erzielten Methode wurden Tests mit Aufnahmen eines mobilen Roboters Pioneer 2 dx durchgeführt, der sich durch die Flure eines Gebäudes der Universität Jaume I bewegte. Dabei konnten die auf diesen Aufnahmen erfassten Objekte bei unterschiedlichen Beleuchtungsbedingungen und unter verschiedenen Gesichtspunkten des Betrachters als Wände, Boden, Bürotüren und Feuerlöscher klassifiziert werden. Der letzte Beitrag der Dissertation besteht aus der Definition eines Maβes für dieÄhnlichkeit zwischen qualitativen Form-, Farb-, Topologie-und Orientierungsbeschreibungen und der Eingliederung dieser Maβe in die Definition eines allgemeinenÄhnlichkeitsmaβes zwischen zwei qualitativen Bildbeschreibungen. DieseÄhnlichkeitsmaβe wurden angewandt auf: (i) die Extraktion von Objekte aus dem MPEG7-CE-Shape-1-Datensatz; (ii) die Zusammensetzung von Mosaiken anhand von Fliesenübereinstimmungen, die aufÄhnlichkeitsmaβen für qualitative Form-und Farbbeschreibungen basieren; (iii) den Vergleich und die Klassifizierung von Aufnahmen von Keramiksätzen; und (iv) den Vergleich von Aufnahmen von Fluren und Ecken zur Identifizierung von Bezugspunkten zur Lokalisierung und Orientierung unseres Roboters. Die Beiträge im Rahmen dieser Dissertation sind nur ein kleiner Fortschritt vi hin zu einem besseren Wissenserwerb von Robotern in Bezug auf ihre Umgebung. Sie sollen andere Wissenschaftler bei ihren Forschungen inspirieren und künftig gröβere Beiträge ermöglichen, um die Lebensqualität unserer Gesellschaft zu verbessern. vii viii x escritas con la intención de inspirar a otros en sus investigaciones, para que mayores contribuciones se puedan alcanzar en el futuro que mejoren la calidad de vida de la sociedad.
doi:10.3233/aic-2012-0535
fatcat:wo4w4kx3rfaq7ogfpthw4l5dsu