Benutzer-Werkzeuge

Webseiten-Werkzeuge


dba:oracle_text_index_themes

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen RevisionVorhergehende Überarbeitung
Letzte ÜberarbeitungBeide Seiten der Revision
dba:oracle_text_index_themes [2016/02/20 16:39] – [Eine eigene Ontologie / Knowlege Base anlegen] gpipperrdba:oracle_text_index_themes [2016/04/01 13:41] gpipperr
Zeile 1: Zeile 1:
-==== Einen Oracle Theme Index aufbauen ====+==== Einen Oracle Text Theme Index aufbauen ====
  
 **Min ab Oracle 8i** **Min ab Oracle 8i**
  
-Einführung in Oracle Text => [[dba:oracle_text|Oracle Text - Volltext Suche über Text Dokumente]]+Für eine generelle Einführung in Oracle Text siehe hier => [[dba:oracle_text|Oracle Text - Volltext Suche über Text Dokumente]]
  
  
 Mit Hilfe eines Theme Indexe lässt sich der Inhalt eines Dokumentes besser verstehen, über ein Regelwerk schließen wir auf die ungefähre Bedeutung des Dokuments. Mit Hilfe eines Theme Indexe lässt sich der Inhalt eines Dokumentes besser verstehen, über ein Regelwerk schließen wir auf die ungefähre Bedeutung des Dokuments.
  
-Allerdings benötigen wir für eine solche Analyse ein entsprechendes Regelwerk, eine Ontologie (Kowledge base, hierarchical tree of concepts used for theme indexing) bzw eine Thesaurus, der die Beziehungen unter den Wörtern beschreibt.+Allerdings benötigen wir für eine solche Analyse ein entsprechendes Regelwerk, eine Ontologie (Kowledge base, hierarchical tree of concepts used for theme indexing) wie einen Thesaurus, der die Beziehungen unter den Wörtern beschreibt.
  
-Für die Englisch und Französisch liegt zwar einiges bereits vor, für Deutsch muss aber selber ein Regelwerk aufgestellt werden. Um ein eigenes Regelwerk aufzustellen, siehe dazu => [[dba:oracle_text_thesaurus|mit einem Thesaurus und Oracle Text arbeiten]]+Für die Englisch und Französisch Sprache liegt zwar einiges bereits vor, für Deutsch muss aber erst ein Regelwerk aufgestellt werden. 
  
 +Um ein eigenes Regelwerk aufzustellen, siehe dazu => [[dba:oracle_text_thesaurus|mit einem Thesaurus und Oracle Text arbeiten]]. 
  
-Automatisch wird nur ein Theme Index angelegt wenn NLS_LANG auf "American" in der Umgebung und in der Datenbank steht!  
  
-Für den Theme Index wird ein Oracle Context Index mit einer Eigenschaft für den [[https://docs.oracle.com/database/121/CCREF/cdatadic.htm#CCREF0217|Lexer]] (INDEX_THEMES) angelegt.+Automatisch wird nur ein Theme Index angelegt, wenn NLS_LANG auf "American" in der Umgebung und in der Datenbank steht! 
  
 +Für den Theme Index wird ein Oracle Context Index mit einer Eigenschaft für den [[https://docs.oracle.com/database/121/CCREF/cdatadic.htm#CCREF0217|Lexer]] INDEX_THEMES angelegt.
  
-Der große Nachteil an diesen Index ist die große Ungewissheit, ob die Datenbank das Dokument wirklich analysiert hat und die richtige Ontologie/Thesaurus in der richtigen Sprache auch angewandt hat. + 
 +Der große Nachteil an diesen Index ist die große Ungewissheit, ob die Datenbank das Dokument wirklich analysiert und die richtige Ontologie/Thesaurus in der richtigen Sprache auch angewandt hat. 
  
 Die Spracheinstellung werden über die Laufzeitumgebung und die DB Einstellungen gesteuert! Die Spracheinstellung werden über die Laufzeitumgebung und die DB Einstellungen gesteuert!
Zeile 27: Zeile 29:
  
 In den ersten Test konnte die Ergebnisse daher nicht ohne weiteres nachvollzogen werden. In den ersten Test konnte die Ergebnisse daher nicht ohne weiteres nachvollzogen werden.
 +
  
  
 ---- ----
  
-=== Vorbereitung - Oracle Text Knowledge Base überpürfen === 
  
-Die Oracle Text Knowledge Base liegt unter $ORACLE_HOME\D:\oracle\products\12.1.0.2\dbhome_1\ctx\data+=== Vorbereitung - Oracle Text Knowledge Base überprüfen ===
  
-Liegen hier die Daten nicht vor, kann vor 12c die Daten auf der Companion CD mit Demos und Beispielen gefunden werden.+Die Oracle Text Knowledge Base liegt unter **$ORACLE_HOME\ctx\data**.
  
-Es tritt dann der folgende Fehler auf:+ 
 +Tritt der folgende Fehler auf:
 <code> <code>
 DRG-11422: linguistic initialization failed DRG-11422: linguistic initialization failed
Zeile 43: Zeile 46:
 </code> </code>
  
 +Dann Liegen hier die Daten und Verzeichnisse hier nicht vor!
 +
 +Vor Oracle 12c lassen sich die Daten auf der Companion CD mit den Demos und Beispielen finden, einfach die ctx\data Stuktur kopieren.
  
  
Zeile 63: Zeile 69:
 --  -- 
 </code> </code>
-Immer darauf achten, das die Dokumententabelle auch einen Primary Key hat!+Immer darauf achten, das die Dokumenten Tabelle auch einen Primary Key hat!
  
  
Zeile 70: Zeile 76:
 === Oracle Text Index mit der Lexer Eigenschaft INDEX_THEMES anlegen=== === Oracle Text Index mit der Lexer Eigenschaft INDEX_THEMES anlegen===
  
-Der Lexer ist für den Aufbau eines Context Indexe mit Theme Daten notwendig.+Der Lexer ist für den Aufbau eines Context Indexe mit Theme Daten zuständig.
  
 Zuvor die Eigenschaften des LEXER definieren: Zuvor die Eigenschaften des LEXER definieren:
- 
 <code sql> <code sql>
  
Zeile 89: Zeile 94:
 / /
  
-#prüfen ob ein Fehler bei Indizieren aufgetreten ist:+--prüfen ob ein Fehler bei Indizieren aufgetreten ist:
    
 SELECT * FROM CTX_USER_INDEX_ERRORS; SELECT * FROM CTX_USER_INDEX_ERRORS;
  
  
-Neben dem normalen Tockens werden nun die Themen Token vom Typ 1 abgelegt:+--Neben dem normalen Tockens werden nun die Themen Token vom Typ 1 abgelegt:
  
 SELECT token_type FROM dr$idx_documents_docs$i group by token_type; SELECT token_type FROM dr$idx_documents_docs$i group by token_type;
Zeile 134: Zeile 139:
 Zum Prüfen welche Dateien er jezt wirklich für den Theme Index verwendet das Verzeichnis $ORACLE_HOME\ctx\data umbennen in $ORACLE_HOME\ctx\_data und den Index erneut anlegen Zum Prüfen welche Dateien er jezt wirklich für den Theme Index verwendet das Verzeichnis $ORACLE_HOME\ctx\data umbennen in $ORACLE_HOME\ctx\_data und den Index erneut anlegen
  
-Über die Fehlermeldung läßt sich erkennen wo der Indexer sucht:+Über die Fehlermeldung lässt sich erkennen wo der Indexer sucht:
 <code sql> <code sql>
 CREATE INDEX idx_documents_docs ON documents(docs) CREATE INDEX idx_documents_docs ON documents(docs)
dba/oracle_text_index_themes.txt · Zuletzt geändert: 2016/04/24 22:15 von gpipperr