Suchen und Finden
Vorwort
5
Inhaltsverzeichnis
6
Teil I Grundlagen
13
1 Einleitung
14
1.1 Daten, Information und Wissen
15
1.2 Wissen im Alltag: Ein menschliches Beispiel
16
1.2.1 Beispielszenario
17
Personenbeschreibung Rudi Baispilov
17
Kontaktdaten
18
Personenbeschreibung Dr. Gesine Mustermann
18
Kontaktdaten
19
1.2.2 Wissensarbeit – Wunsch und Wirklichkeit
19
1.3 Semantik und semantische Technologien
21
1.4 Metadaten
24
1.5 Der weitere Inhalt dieses Buches
26
2 Wissensrepräsentation
31
2.1 Prinzipien der maschinellen Wissensverarbeitung
33
2.2 Fakten und Regeln
33
2.2.1 Formalisierung von Aussagen
33
2.2.2 Fakten
34
2.2.3 Inferenz mit Regeln
35
2.2.4 Anfragen
36
2.3 Logik und Inferenz
37
2.3.1 Logische Operatoren
38
2.3.2 Inferenzmechanismen
38
2.4 Pr¨adikatenlogik
41
2.4.1 Symbolformen
41
2.4.2 Quantoren
41
2.5 Semantische Netze
43
2.5.1 Wissensdarstellung mit Graphen
44
2.5.2 Relationen und ihre Eigenschaften
45
2.5.3 Eigenschaften Semantischer Netze
46
2.5.4 Kardinalit¨at von Relationen
48
2.6 Frames
49
2.6.1 Der Schemabegriff
49
2.6.2 Frames als Denkmodell
51
2.6.3 Klassifikation
53
2.6.4 Generalisierung und Spezialisierung
54
2.6.5 Vererbung
55
2.6.6 Instanziierung
57
2.7 Taxonomien
58
2.7.1 Multi-perspektivische Schemahierarchien
59
2.7.2 Probleme bei unterschiedlichen Rollen
61
2.8 Conceptual Dependencies
62
2.8.1 Handlung und Zustand
63
2.8.2 Handlungsoptionen
63
2.8.3 Mentale Drehb¨ucher
65
2.9 Taxonomien mit formaler Semantik: Die KL-ONE-Familie
68
2.9.1 Superkonzepte
69
2.9.2 Rollen
70
2.9.3 Vererbung und Rollenrestriktionen
70
2.9.4 Wohlgeformte Terme und ihre Semantik
71
2.9.5 Subsumption und Klassifizierung
72
2.10 Ontologien
74
2.10.1 Der Ontologiebegriff in der Informatik
74
2.10.2 Aufbau von Ontologien
76
2.10.3 Nutzen von Ontologien
80
2.11 Fazit
81
2.12 Weiterf¨uhrende Literatur
82
3 Semantische Netze, Thesauri und Topic Maps
83
3.1 Grundlagen
84
3.1.1 Struktur Semantischer Netze
84
3.1.2 Klassifikation Semantischer Netze
85
3.2 Grafische Notationen
88
3.2.1 Mind-Maps
89
Geschichte und Motivation
90
Werkzeuge
90
3.2.2 Concept-Maps
90
Geschichte und Motivation
91
Anwendungen von Concept-Maps
92
Erstellung von Concept-Maps
93
Formale Semantik von Concept-Maps
95
Werkzeuge
97
3.2.3 Conceptual Graphs
98
Conceptual Graphs
98
3.2.4 Grafische vs. Lineare Notationen
99
3.3 Weitere Repr¨asentationstechnologien
102
3.3.1 Thesauri
102
Linguistische Thesauri
103
Thesauri zur Dokumentation
104
Standardisierung
104
3.3.2 Topic Maps
104
Datenmodell
105
Standards und Standardisierungsprojekte
110
Anwendungsbereiche
111
Werkzeuge und Systeme
113
3.4 Fazit
114
3.5 Weiterf¨uhrende Literatur
116
4 Das Resource Description Framework
118
4.1 Von der Pr¨asentationszur Inhaltssicht
121
4.1.1 Pr¨asentationsebene: Die Hypertext Markup Language HTML
121
4.1.2 Die Strukturierungssprache XML
122
4.1.3 Umgang mit Mehrdeutigkeit: Disambiguierung durch Zuweisung von Namensr¨aumen
125
4.2 Das RDF-Datenmodell
127
4.2.1 Container
128
4.2.2 Aussagen ¨uber Aussagen: Reifizierung
131
4.3 Ontologische Strukturierung von Daten: RDF-Schema
133
4.4 (X)HTML-Erweiterung: RDFa
135
4.5 Die Web Ontology Language (OWL)
136
4.6 Fazit
137
4.7 Weiterf¨uhrende Literatur
137
5 Ontologien und Ontologie-Abgleich in verteilten Informationssystemen
139
5.1 Motivation: Ontologien in verteilten IT-Systemen
140
5.1.1 Explizite Konzeptualisierungen als Basis semantischer IT-Systeme
140
5.1.2 Ontologien in verteilten Informationslandschaften
143
5.2 Abgleich von Ontologien
145
5.2.1 Repr¨asentation von Abbildungen zwischen Ontologien
147
5.2.2 Heuristiken zur automatischen Berechnung von Beziehungen zwischen Ontologien
151
Die lexikalische Ebene der Ontologien
151
Die Ontologie-Struktur
155
Ontologie-Nutzung als Evidenz f¨ur Korrespondenzen
156
5.2.3 Integration von Mapping-Vorschl¨agen
158
Integration einzelner Matching-Heuristiken
158
Integration mehrerer Abbildungsvorschl¨age
160
5.2.4 Zusammenfassung: Der generelle Matching-Prozess
160
5.3 Werkzeuge
162
5.3.1 Alignment API
162
5.3.2 S-Match
164
5.3.3 Die PROMPT-Suite
164
5.4 Fazit
166
5.5 Weiterf¨uhrende Literatur
167
6 Anfragesprachen und Reasoning
169
6.1 Anfragesprachen
169
6.1.1 Einfache SPO-Anfragen
170
6.1.2 SPARQL
170
Abk¨urzende Schreibweisen
172
Filter
172
Weitere Graph-Pattern
173
L¨osungslistenmodifikatoren
174
Weitere Anfrageformate
174
RDF-Datasets und benannte Graphen
175
SPARQL und RDFS
176
6.1.3 Anfragesprachen f¨ur OWL
177
6.2 Reasoning
178
6.2.1 Hornlogik und F-Logik
178
Regeln in Jena
178
6.2.2 Reasoning f¨ur OWL
182
SWRL (Semantic Web Rule Language)
182
6.3 Fazit
184
6.4 Weiterf¨uhrende Literatur
184
Teil II Fundamentale Dienste und Funktionen
189
7 Linked Open Data, Semantic Web Datensätze
190
7.1 Linked Open Data die Grundlagen
192
7.2 Ver¨offentlichen von Linked Open Data
193
7.2.1 Wrapping von existierenden Datens¨atzen
194
Wrapper-Ans¨atze
195
7.3 Beispiele f¨ur LOD-Services
197
7.3.1 Dump-Konversion: DBpedia
198
7.3.2 Online-Konversion: DBTropes
199
7.4 Zugriff auf Linked Data
200
7.4.1 REST & HTTP Content Negotiation
201
7.4.2 Zugriff durch menschliche Nutzer
201
Generische Linked-Data-Browser
202
Suchmaschinen f¨ur Linked Data
204
Linked-Data-basierte Anwendungen
204
7.4.3 Zugriff in Anwendungen
204
Zugriff durch automatische Navigation im Web of Data
205
Automatischer Zugriff auf Linked-Data-Suchmaschinen
206
Anfrageausf¨uhrung ¨uber dem Web of Linked Data
206
7.5 Beispiel
208
7.6 Fazit
209
7.7 Weiterf¨uhrende Literatur
209
8 Semantik in der Informationsextraktion
211
8.1 Informationsextraktion
213
8.2 Generischer Aufbau einer Informationsextraktion
214
8.2.1 Syntaktische Analyse
214
Textextraktion
215
Spracherkennung
215
Segmentierung von W¨ortern
216
Segmentierung von S¨atzen
216
Part-of-Speech-Tagging
217
Erkennung von Phrasen
218
8.2.2 Semantische Analyse
219
Erkennung von benannten Entit¨aten
219
Erkennung von strukturierten Entit¨aten
220
Koreferenzanalyse
220
Aufl¨osung sprachlicher Mehrdeutigkeiten
221
Erkennung von Fakten
221
8.2.3 Templates
223
8.3 Ontologien in der Informationsextraktion
225
8.3.1 Formale Modellierung von sprachlichem Hintergrundwissen
225
8.3.2 Extraktionsontologien
226
8.3.3 Formale Modellierung von Dom¨anenwissen
227
8.3.4 Formale Anfragesprachen zur Spezifikation von Templates
228
8.4 Formale Repr¨asentation von Extraktionsresultaten
229
8.4.1 Semantisches Anreichern von Dokumenten
229
8.4.2 Semantische Annotationen
230
8.5 Fazit
234
8.6 Weiterf¨uhrende Literatur
234
9 Semantische Suche
236
9.1 Der Begriff Semantische Suche
237
9.1.1 Grundlagen
237
9.1.2 Viele Definitionen ein Ziel
238
9.2 Kategorien semantischer Suchmaschinen
239
9.2.1 Formularbasierte Suche
240
9.2.2 Suchmaschinen mit RDF-basierten Anfragesprachen
241
9.2.3 Faceted Browsing
242
9.2.4 Semantikbasierte Schl¨usselwortsuchmaschinen
243
9.2.5 Question Answering Tools
244
9.2.6 Schl¨usselwortsuche mit semantischer Nachverarbeitung
245
9.2.7 Semantikbasierte intelligente Visualisierung
246
9.3 Architektur und Ans¨atze
246
9.3.1 Wissensbasis, Suchraum
248
Suchraum vs. Wissensbasis
248
Beschaffenheit des Suchraumes und der Wissensbasis
249
9.3.2 Anfrageverarbeitung
250
Formalit¨at der Anfrage
250
Anfragemodifizierung
250
9.3.3 Ans¨atze, Suchalgorithmen
252
9.3.4 Beispiele
256
9.4 Benutzerkontext, Personalisierung und Transparenz
258
9.4.1 Benutzerkontext und Personalisierung
258
9.4.2 Transparenz
259
9.5 Fazit
260
9.6 Weiterf¨uhrende Literatur
261
10 Erklärungsfähigkeit semantischer Systeme
262
10.1 Szenario
263
10.2 Der Begriff der Erkl¨arung
265
10.2.1 Erkl¨arungen im Alltag
266
10.2.2 Wissenschaftliche Erkl¨arungen
267
10.3 Erkl¨arungen in Expertensystemen
268
10.3.1 MYCIN
269
10.3.2 NEOMYCIN
269
10.3.3 RED
270
10.3.4 PEA
271
10.3.5 REX
272
10.4 Aspekte von Erkl¨arungen
273
10.4.1 Arten von Erkl¨arungen
273
10.4.2 Ziele von Erkl¨arungen
274
10.4.3 Darstellungen von Erkl¨arungen
275
10.4.4 Wahrheit und Erkl¨arung
275
10.4.5 Anforderungen an Erkl¨arungen
275
10.4.6 Erkl¨arungsszenario
277
10.5 Erkl¨arungen im Semantic Web
278
10.5.1 Inference Web
279
10.5.2 Erkl¨arungskomponente von RadSem
283
10.6 Fazit
285
10.7 Weiterf¨uhrende Literatur
287
Teil III Anwendungen
288
11 Semantische Webservices zur Steuerung von Produktionsprozessen
289
11.1 Einleitung
290
11.2 Grundlagen
292
11.2.1 Steuerungen in heutigen Produktionsanlagen
292
11.2.2 Serviceorientierte Architekturen
293
WSDL – Beschreibung von Webservices
294
UDDI – Verzeichnisdienste f¨ur Webservices
297
BPEL – Orchestrierung von Webservices
297
11.2.3 Semantische Webservices
298
SAWSDL
298
WSMO
300
OWL-S
301
11.3 Anwendungsfeld
303
11.3.1 Semantische Webservices in der Produktionsdom¨ane
303
11.3.2 Experimenteller Aufbau
304
11.4 Semantisches Auffinden von Webservices in der Produktion
305
11.4.1 Semantische Annotation der Webservices
305
Semantische Annotation mit SAWSDL
307
Semantische Beschreibung mit OWL-S
308
Ergebnisse des Vergleichs von SAWSDL und OWL-S
310
11.4.2 Erstellungsprozess und Struktur der Ontologien
310
11.4.3 Systemarchitektur und Ablauf des semantischen Auffindens von Webservices
312
11.5 Automatische Orchestrierung zur Erstellung flexibler Produktionsprozesse
313
11.5.1 Semantisch unterst¨utzte Prozessmodellierung
314
11.5.2 Konzeptioneller Ansatz zur flexiblen Steuerung von Produktionsprozessen
314
11.6 Fazit
317
11.7 Weiterf¨uhrende Literatur
318
12 Wissensarbeit am Desktop
319
12.1 Herausforderungen der Wissensarbeit auf dem Desktop
320
12.2 Semantische Modellierung des Wissensraums
321
12.2.1 Pers¨onliches Informationsmodell (PIMO)
323
Repr¨asentation des PIMOs in RDF
324
PIMO-Upper: Allgemeine Klassen
325
PIMO-Mid: Ontologien, die in einer Dom¨ane oder Gruppe geteilt werden
325
Pers¨onliche Klassen, Relationen und Erweiterungen
325
Beispiel
326
12.2.2 Die NIE-Ontologien zur Datenrepr¨asentation
327
Repr¨asentation eines Adressbucheintrages in RDF
329
12.2.3 Integration propriet¨arer Informationsquellen
332
Aperture
332
Gnowsis
333
12.3 Der Semantic Desktop
334
12.3.1 Ausgangssituation
335
12.3.2 Die Idee des Semantic Desktops
336
12.3.3 Nepomuk Semantic Desktop
337
12.3.4 Refinder
343
12.4 Wikis und Semantische Wikis
347
12.4.1 Annotationen bei dokumentbasierter Arbeit
349
12.4.2 Das pers¨onliche Wiki im Semantic Desktop
351
12.4.3 Feingranulare Annotationen – der Ansatz in Mymory
352
Die Technische Realisierung der Annotationen
354
Annotationsbasierte Suche
356
Visualisierung der strukturierten Daten
356
Beispiele
357
12.5 Aufgabenmanagement f¨ur Wissensarbeiter
358
12.5.1 Permanenter Aufgabenwechsel (Multitasking)
359
12.5.2 Ziele f¨ur die technische Unterst¨utzung
360
12.5.3 Task Management-Systeme
360
12.5.4 Semantische Aufgabenmodellierung
361
12.5.5 Kontext eines Wissensarbeiters
362
Semantische Kontextmodellierung
362
12.5.6 ConTask: Kontextsensitives Aufgabenmanagement
366
Benutzerverhalten und Historie
367
12.6 Fazit
371
12.7 Weiterf¨uhrende Literatur
371
13 Semantische Suche für medizinische Bilder
373
13.1 Medico-Ontologie-Hierarchie
374
13.1.1 Representational Ontologies
375
13.1.2 Upper Ontology
375
13.1.3 Information Element Ontology
376
13.1.4 Clinical Ontology
376
13.1.5 Annotation Ontology
377
13.1.6 Medical Ontologies
377
13.2 Semantische Technologien im Medico-System
378
13.2.1 MedicoServer
379
13.2.2 SemanticSearch and SemanticAnnotation
380
13.2.3 Tripel-Speicher
381
13.2.4 Semantisches Volumen-Parsing
382
13.2.5 Spatial DBMS
383
13.2.6 Der 2-D-Annotations-Prototyp RadSem
384
13.2.7 Die 3-D-Annotationsanwendung f¨ur den klinischen Betrieb
385
13.2.8 Semantische Navigation
385
13.2.9 Multimodal Dialogue Interface
386
13.3 Fazit
387
13.4 Weiterf¨uhrende Literatur
388
14 Semantische Musikempfehlungen
389
14.1 Grundlagen
390
14.1.1 Musikontologien
390
The Music Ontology
390
14.1.2 Social Music und das Semantic Web
391
14.2 Datensammlungen zu musikbezogenen Informationen
393
14.2.1 Traditioneller Musikjournalismus im Wandel der Zeit
393
14.2.2 Musik und das Linked Open Data Projekt
394
DBTune
394
DBpedia
395
Freebase
396
14.3 Algorithmen zur Musikempfehlung
397
14.3.1 Inhaltsbasierte Verfahren
397
14.3.2 Kollaboratives Filtern
398
14.3.3 Hybride Ans¨atze
398
14.4 Soziosemantische Musikempfehlungen
399
14.4.1 Kollaboratives Filtern und Semantische Social Networks
399
FOAF-ing the music
400
14.4.2 dbrec: DBpedia als Basis f¨ur Musikempfehlungen
400
14.4.3 HORST – Holistic Recommendation and Storytelling
402
¨Uberf¨uhren der semantischen Daten in einen Vektorraum
403
Merkmalsauswahl und Gewichtung
403
Berechnung der ¨Ahnlichkeit
404
Bereitstellung einer erkl¨arenden Geschichte
404
14.5 Fazit
405
14.6 Weiterf¨uhrende Literatur
405
15 Optimierung von Instandhaltungsprozessen durch Semantische Technologien
406
15.1 Einleitung
407
15.2 Grundlagen
409
15.2.1 Interpretation von Kontextinformationen als Grundlage kontextadaptiver Anwendungen
409
15.2.2 Systemarchitektur zur Interpretation und Nutzung von Ortsinformationen in Fabriksystemen
411
15.3 Anwendungsfeld und Szenario
413
15.3.1 Instandhaltungsprozesse in der industriellen Produktion
413
15.3.2 Szenario
414
15.4 Semantische nahtlose Navigationsanwendung
417
15.4.1 Ontologiebasierte Situationsinterpretation
417
Identifikation und Modellierung einzelner Situationen
418
Modellierung der Ontologie
421
Semantisches Reasoning
423
15.4.2 Anwendungsbezogene Nutzung von Ontologien
424
Interpretation Server als technische Grundlage
424
Semantische nahtlose Navigation als Anwendung
425
15.5 Fazit
426
15.6 Weiterf¨uhrende Literatur
429
Literaturverzeichnis
430
Akronyme
451
Index
454
Die Autorinnen und Autoren
460
Alle Preise verstehen sich inklusive der gesetzlichen MwSt.