Projektmanagement mit SemProj. Kollaboratives Arbeiten im Semantic Web

von: André Langer

Diplomica Verlag GmbH, 2008

ISBN: 9783836612609 , 186 Seiten

Format: PDF, OL

Kopierschutz: frei

Windows PC,Mac OSX geeignet für alle DRM-fähigen eReader Apple iPad, Android Tablet PC's Online-Lesen für: Windows PC,Mac OSX,Linux

Preis: 53,00 EUR

Mehr zum Inhalt

Projektmanagement mit SemProj. Kollaboratives Arbeiten im Semantic Web


 

Kapitel 3.1,Was bedeutet Semantik?:Soll im Weiteren ein semantikbasiertes Projektmanagementsystem mit den Grundvorstellungen des Semantic Web entworfen werden, so steht am Beginn zunächst die Frage, was unter dem Begriff „Semantik” eigentlich zu verstehen ist. Für einen menschlichen Benutzer ist die Bedeutung eines Konzeptes intuitiv erfassbar. So können strukturelle Informationen wie in der Zeichenkette „01.11.2007“ direkt dazu benutzt werden, abzuleiten, dass damit wahrscheinlich eine Datumsangabe ausgedrückt wird. Die Zeichenfolge „Diplomarbeit“ innerhalb eines Textes wird direkt mit einer wissenschaftlichen Ausarbeitung assoziiert, welche meist um die 100 Seiten umfasst und sich mit einer Thematik kontrovers auseinandersetzt. Automatisch werden damit weitere Konzepte der realen Welt assoziiert, sodass die Begriffe „Paper“ oder „Thesis“ in eine ähnliche Relation zu dem Begriff „Ausarbeitung“ gesetzt werden können und entsprechend gleiche oder ähnliche Eigenschaften zugeschrieben bekommen, welche von der abstrakten Gesamtgruppe bekannt sind, und entsprechend dann auch im gleichen Kontext verwendet werden können. Warum ist diese Vorgehensweise nicht direkt auf eine rechnergestützte Verarbeitung übertragbar? Ein Computerprogramm ist prinzipiell genauso in der Lage, einzelne Buchstaben als zusammenhängende Zeichenkette zu erkennen und bestimmte Anforderungen an die Struktur und das erlaubte Verwendungsumfeld zu stellen (vgl. Datentyp). So kann ein Typ date definiert werden, der nur aus Ziffern zwischen 0-9 sowie zwei Punkten nach dem zweiten und vierten Zeichen besteht, wobei die Gesamtlänge der Zeichenkette 10 Zeichen nicht übersteigen darf und weitere Bedingungen an die erlaubten Zahlenwerte je Position existieren. Wird dieses Muster beispielsweise auf einer Webseite gefunden, könnte eine Applikation diese Datumsangaben auslesen, weiterverarbeiten oder für einen Export bereitstellen. Eine alternative Möglichkeit wäre, ein Datum explizit auszuzeichnen (bspw. 01.11.2007). Das Problem besteht darin, dies auf alle anderen Konzepte der realen Welt zu übertragen, wie das Diplomarbeits-Beispiel recht gut darstellt. Ohne große Probleme könnte ein XML Schema entworfen werden, welches syntaktisch korrekt die Bestandteile eines einzelnen Objektes sowie gültige Eigenschaftswerte definiert und einzuschränken vermag. Erfüllen die angegebenen Daten in einer vorhandenen XML-Datei diese Schemadefinition, so werden diese unter der durch den Programmierer angegebenen Struktur weiterverarbeitet. Ob der angegebene Inhalt einen „Sinn“ ergibt, ist dabei der Deutung durch den menschlichen Benutzer überlassen. Die Ursache dafür ist, dass eine Computeranwendung nur vorhandene Daten verarbeiten kann, der Transformationsschritt der Daten in eine Information jedoch ohne weiteres nicht durchführbar ist. Definition 7: Syntax: Syntax ist die Lehre vom strukturellen Satzbau und umfasst ein System an Regeln, wie aus einer Menge von Grundsymbolen durch spezifische syntaktische Mittel gültige und wohlgeformte Worte, Wortgruppen und Sätze einer Sprache abgeleitet werden können.Definition 8: Semantik: Semantik ist die Lehre von der inhaltlichen Bedeutung sprachlicher Ausdrücke, sowie deren Beziehungen untereinander. Definition 9: Kontext: Kontext kennzeichnet den Zusammenhang oder die Bedingung, unter dem eine Aussage Gültigkeit erlangt.Daten werden nach definierten Syntaxregeln aus Zeichen eines bestimmten Zeichenvorrats gebildet. Informationen werden aus Daten unter einer bestimmten Bedeutungszuordnung gewonnen. Die Bedeutung der Daten ist dabei von einem verwendeten Kontext abhängig. Informationen können anschließend als eine Repräsentationsform für Konzepte der realen Welt verwendet werden. Abbildung 18 verdeutlicht diese Begriffshierarchie, wobei die suggerierte scharfe Trennung zwischen den Begriffswelten nach Bodendorf in der Realwelt nicht immer zu finden, sondern eher als kontinuierlicher Übergang zu verstehen ist.Die Herausforderung ist es also, syntaktisch korrekte Daten so mit weiteren Angaben zur Bedeutung der Daten zu versehen, dass die daraus abgeleitete Information rechnergestützt weiterverarbeitet werden kann. Interessant ist dabei die Grundannahme, dass dies ohne eine direkte Beteiligung einer „intelligenten“ Prozessorinstanz vonstatten gehen kann, was in direktem Widerspruch zu dem Ansatz aus dem Bereich der künstlichen Intelligenz steht, welche die Entwicklung intelligenter Agenten anstrebt. Praktisch bedeutet dies das Ziel, Informationen zueinander in Beziehung setzen zu können, semantische Widersprüche auflösen zu können und aus den zugrunde liegenden Daten Informationen so extrahieren zu können, dass sie einer bestimmten Fragestellung genügen und diese semantisch korrekt beantworten. Ein Computerprogramm muss dazu nicht wissen, wie ein „Diplomarbeit“ in der Realwelt aussieht, sondern muss in die Lage versetzt werden, hierarchische Beziehungen zwischen verschiedenen Konzepten herstellen zu können und in der Lage sein zu entscheiden, ob eine konkrete Information einem Konzept angehört oder nicht.Gelingt dies, so wird entsprechend Abbildung 16 dadurch der Schritt in eine darüber liegende Ebene des Wissens möglich.Definition 10: Wissen: „Wissen kann beschrieben werden als in einen bestimmten Kontext gestellte Information, die für denjenigen, der über diese Information verfügt, von Wert ist und ihn dazu befähigt, etwas zu tun, wozu er ohne dieses Wissen nicht in der Lage gewesen wäre.“Wissen entsteht durch dabei durch die Verknüpfung und Interpretation von Informationen. Ohne Einordnung in einen bestimmten Problemkontext bzw. eine bestimmte Fragestellung, welche durch ein Individuum unter Rückgriff auf eine bestimmte Wissensbasis versucht wird zu beantworten, ist der Wissensbegriff inhaltsleer. Übertragen auf das Internet mit den darin enthaltenen Millionen von Daten und daraus ableitbaren Informationen stellt dies die Motivation dar, warum eine Vernetzung und domainübergreifende Auswertung der Daten in einem Semantic Web weitreichende positive Ergebnisse hätte. Der Bereich des Wissensmanagements beschäftigt sich darüber hinausgehend mit vielen weiteren Fragestellungen, inwieweit Wissen veraltern, neu generiert oder verfälscht wird kann, was an dieser Stelle aber nicht weiter vertieft werden soll. Wichtig ist, dass allein durch die Vernetzung verschiedener Aussagen, die in unterschiedlichen Ressourcen enthalten sind, neue Informationen so abgeleitet und aggregiert werden können, dass sie dem Fragesteller eine zweckgerichtete Antwort auf eine konkrete Problemstellung geben können (Pragmatik). Diese Ableitung aus partiell vorhandenem Wissen wiederum erfordert kein vollständiges Weltbild, sondern lediglich ein Wissen über bestimmte Zusammenhänge und kann strukturell abgebildet werden, wodurch bisher individuell durchgeführte Suchaufträge automatisiert werden können.Wissensbeschreibung:Bevor Techniken zur informationstechnischen Beschreibung der Bedeutung von Daten vorgestellt werden können, ist noch eine prinzipielle Fragestellung zu klären, wie Bedeutungen generell beschrieben werden können, nachdem in Kapitel 3.1. bereits gezeigt wurde, dass zu einer Wissensanalyse der Rückgriff auf grundlegende Zusammenhänge zwischen Konzepten der realen Welt ausreicht. Damit diese allgemeingültig verstanden, aber auch zwischen verschiedenen Individuen ausgetauscht werden können („Begriffsverständigung“), definiert Bodendorf drei wesentliche Anforderungen an eine Wissensbeschreibung zur Auflösung semantischer Konflikte und zur Sicherung von Wiederverwendbarkeit des Wissens: (1) Symbole: Es muss zur Referenzierung das gleiche Begriffssymbol verwendet werden (es wird von einem Objekt mit der Bezeichnung „Diplomarbeit“ gesprochen) - Terminologie nötig, (2) Zuordnungen: Unter einem konkreten Kontext muss das Begriffssymbol von jeder Verarbeitungsinstanz den gleichen Konzepten zuordbar sein (eine „Diplomarbeit“ ist eine „wissenschaftliche Ausarbeitung“) - semantische Schemata nötig, (3) Konzepte: Jede der Verarbeitungsinstanzen muss einem gewissen Konzept die gleiche Bedeutung zumessen (Eine wissenschaftliche Ausarbeitung umfasst mehere hundert Seiten und beschäftigt sich mit einer konkreten Fragestellung.) - Ontologien nötigDies bedeutet jedoch nicht, dass keine Umbenennungsoperationen existieren können (bspw. Eine „Diplomarbeit“ ist eine „Abschlussarbeit“). Es wird lediglich die Forderung aufgestellt, dass der Verarbeitungsinstanz zum jeweiligen Analysezeitpunkt die verwendeten Symbole des Ursprungssystems bekannt sein müssen. Wurde Wissen durch Verwendung von Symbolen formuliert, deren Bedeutung zum aktuellen Zeitpunkt nicht hergeleitet werden kann, so kann dieses Wissen nicht benutzt werden. Um eine Verständigung auf symbolischer Ebene erreichen zu können, werden von Anwendungen Terminologien benutzt.Definition 11: Terminologie: Eine Terminologie ist die Gesamtheit aller gültigen Bezeichnungen in einer Anwendungsdomain.Mit Terminologien können beispielsweise alle gültigen Eigenschaftswerte aufgelistet werden, die eine konkrete Objekteigenschaft annehmen kann. Da diese Auflistung applikationsabhängig lokal innerhalb der Systemgrenzen definiert ist, birgt diese eine Gefahr bei zukünftiger Anpassung oder Änderung der Symbolmenge. Wird beispielsweise für gültige Werte eines Projektstatus die Menge {nicht begonnen, laufend, abgeschlossen} definiert und später der Wert {abgebrochen} hinzugefügt, so wird dieser von Anwendungen, welche die alte Terminologie verwenden, nicht verstanden. Eine Terminologie definiert damit eine syntaktische Norm auf Symbolebene, der semantische Aspekt hingegen wird mithilfe weitreichenderer Repräsentationen dargestellt.Definition 12: Semantisches Schema: Ein semantisches Schema stellt die systemweit einheitliche Zuordnung von Symbolen zu Konzepten sicher, indem eine Menge von Konzepten definiert und aufgezählt wird.Semantische Schemata dienen der Zuordnung von Begriffen zu Konzepten, wobei damit auch unterschiedliche Bezeichnungen, die das gleiche Objekt repräsentieren, in das gleiche Konzept eingeordnet werden können. Praktisch kann dies so aussehen, dass einem Konzept dc:language beispielsweise die Symbole „german“, „english“, „ger“, „en“, „de“ oder „deutsch“ zugeordnet werden können. Dadurch wird eine bedeutende Interoperabilität in verteilten Systemen ermöglicht, da diese eine Norm auf Zuordnungsebene definieren. Ohne eine entsprechende Zuordnungsvorschrift könnte ein beliebiges System das vorangestellte Konzept ebenso als dc:lang, dc:sprache oder dc:verfasstin kennzeichnen, wodurch kein Gewinn auf Bedeutungsebene im Gegensatz zur Symboldefinition zu erkennen wäre. Symbole erhalten durch die Zuordnung eine semantische Identität, indem sie in Mengen mit gleichen Grundbedeutungen gruppiert werden. Um nun auf der obersten Abstraktionsebene der Wissensbeschreibung eine Aussage über die Bedeutung der Konzepte treffen zu können, werden Ontologien verwendet. Die Bezeichnung Ontologie stammt aus dem Griechischen (ontos-Lebenwesen, logos-Wort) und wurde ursprünglich in der Philosophie des Neunzehnten Jahrhunderts von Rudolf Gockel dazu verwendet, die Untersuchung des Wesens von existierenden Objekten von der biologischen Untersuchung von Lebewesen abgrenzen zu können. Im Mittelpunkt steht die Erforschung von Objektkategorisierungen einer bestimmten Domain, primäres Hilfsmittel dazu „is a catalogue of the types of things that are assumed to exist in a domain of interest D from the perspective of a person who uses a language L for the purpose of talking about D“ [Sow03]. Im Grunde genommen verbirgt sich dahinter die Klassifizierung von Objekten einer bestimmten Umgebung sowie deren Beziehungen untereinander. Im Gegensatz zu einer Taxonomie sind diese Beziehungen jedoch nicht auf eine streng hierarchische Struktur begrenzt.Definition 13: Ontologie: Eine Ontologie ist eine formale, explizite Spezifikation eines gemeinsam verwendeten, abstrakten Modells zur Repräsentation des darin enthaltenen Wissens.Eine Ontologie leistet damit zwei Dinge: Zum Einen wird explizit ein Vokabular (d.h. eine Liste an Begriffen) bereitgestellt, welches systemübergreifend verstanden und benutzt werden und damit eine Kommunikation ohne Mehrdeutigkeiten zwischen diesen Systemen ermöglicht wird. Zum anderen wird die Bedeutung eines Konzeptes eingegrenzt, indem typische Eigenschaften der zugeordneten Objektinstanzen des Konzeptes benannt und zu anderen Konzepten in Beziehung gesetzt werden. Diese Beschreibung basierend auf Beziehungen zwischen verschiedenen Konzepten kann unterschiedlich komplex sein und sich je nach Anwendungsfall einer informellen Komplettbeschreibung mehr oder weniger stark annähren, wodurch die Bedeutung eines Konzeptes mit Schwerpunkt auf die wesentlichen, innerhalb einer Anwendungsdomain zu betrachtenden Aspekte, eindeutig und maschinell verarbeitbar dargestellt werden kann. Die durch ein semantisches Schema definierten Konzepte können unter Zuhilfenahme einer Ontologie miteinander verknüpft werden, wobei dabei eine Computeranwendung in die Lage versetzt wird, unter Zuhilfenahme der Konzeptdefinition innerhalb einer Ontologie festzustellen, ob eine gewisse Beziehung zwischen zwei Konzepten gültig ist und welche Bedeutung dieser zukommt.Ontologien werden dazu unter dem Anspruch entworfen, innerhalb einer bestimmten Problemdomain unabhängig von einem konkreten Anwendungsfall nutzbar zu sein und darin vorhandene Konzepte allgemeingültig zu beschreiben. Die Idee dahinter ist, bereits vorhandene Ontologien für ähnliche Problemstellungen weiternutzen zu können. Die Feingranularität einer Ontologiebeschreibung kann dabei stark variieren, es darf nur nicht möglich, unter der Verwendung einer Ontologie eine Aussage zu formulieren, welche dem durch die Ontologie modellierten Weltbild direkt widerspricht. So entstanden neben einfachen bis komplexen Domain-spezifischen Ontologien ebenso Versuche, generalistische Ontologien zu entwickeln, welche den Anspruch erheben, eine allumfassende Weltbeschreibung (Top Level Ontologies) bereitzustellen. Bekannte Vertreter davon sind die Suggested Upper Merged Ontology (SUMO) sowie die CYC-Ontologie. Abbildung 19 illustriert das Trade-Off-Problem zwischen Verwendbarkeit und Wiederverwendbarkeit von Ontologien, weswegen die Entwicklung von Top-level/Upper Ontologies von vielen Forschern momentan eher der Grundlagenforschung zugeschrieben wird, und sich um den Aufbau eines allumfassenden Begriffkataloges bemüht.