dba:oracle_text_index_themes
Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen RevisionVorhergehende ÜberarbeitungNächste Überarbeitung | Vorhergehende Überarbeitung | ||
dba:oracle_text_index_themes [2016/02/20 16:39] – [Eine eigene Ontologie / Knowlege Base anlegen] gpipperr | dba:oracle_text_index_themes [2016/04/24 22:15] (aktuell) – [Themes in eine eigene Tabelle extrahieren] gpipperr | ||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
- | ==== Einen Oracle Theme Index aufbauen ==== | + | ==== Einen Oracle |
**Min ab Oracle 8i** | **Min ab Oracle 8i** | ||
- | Einführung in Oracle Text => [[dba: | + | Für eine generelle |
Mit Hilfe eines Theme Indexe lässt sich der Inhalt eines Dokumentes besser verstehen, über ein Regelwerk schließen wir auf die ungefähre Bedeutung des Dokuments. | Mit Hilfe eines Theme Indexe lässt sich der Inhalt eines Dokumentes besser verstehen, über ein Regelwerk schließen wir auf die ungefähre Bedeutung des Dokuments. | ||
- | Allerdings benötigen wir für eine solche Analyse ein entsprechendes Regelwerk, eine Ontologie (Kowledge base, hierarchical tree of concepts used for theme indexing) | + | Allerdings benötigen wir für eine solche Analyse ein entsprechendes Regelwerk, eine Ontologie (Kowledge base, hierarchical tree of concepts used for theme indexing) |
- | Für die Englisch und Französisch liegt zwar einiges bereits vor, für Deutsch muss aber selber | + | Für die Englisch und Französisch |
+ | Um ein eigenes Regelwerk aufzustellen, | ||
- | Automatisch wird nur ein Theme Index angelegt wenn NLS_LANG auf " | ||
- | Für den Theme Index wird ein Oracle Context | + | Automatisch |
+ | Für den Theme Index wird ein Oracle Context Index mit einer Eigenschaft für den [[https:// | ||
- | Der große Nachteil an diesen Index ist die große Ungewissheit, | + | |
+ | Der große Nachteil an diesen Index ist die große Ungewissheit, | ||
Die Spracheinstellung werden über die Laufzeitumgebung und die DB Einstellungen gesteuert! | Die Spracheinstellung werden über die Laufzeitumgebung und die DB Einstellungen gesteuert! | ||
Zeile 27: | Zeile 29: | ||
In den ersten Test konnte die Ergebnisse daher nicht ohne weiteres nachvollzogen werden. | In den ersten Test konnte die Ergebnisse daher nicht ohne weiteres nachvollzogen werden. | ||
+ | |||
---- | ---- | ||
- | === Vorbereitung - Oracle Text Knowledge Base überpürfen === | ||
- | Die Oracle Text Knowledge Base liegt unter $ORACLE_HOME\D: | + | === Vorbereitung - Oracle Text Knowledge Base überprüfen === |
- | Liegen hier die Daten nicht vor, kann vor 12c die Daten auf der Companion CD mit Demos und Beispielen gefunden werden. | + | Die Oracle Text Knowledge Base liegt unter **$ORACLE_HOME\ctx\data**. |
- | Es tritt dann der folgende Fehler auf: | + | |
+ | Tritt der folgende Fehler auf: | ||
< | < | ||
DRG-11422: linguistic initialization failed | DRG-11422: linguistic initialization failed | ||
Zeile 43: | Zeile 46: | ||
</ | </ | ||
+ | Dann Liegen hier die Daten und Verzeichnisse hier nicht vor! | ||
+ | |||
+ | Vor Oracle 12c lassen sich die Daten auf der Companion CD mit den Demos und Beispielen finden, einfach die ctx\data Stuktur kopieren. | ||
Zeile 63: | Zeile 69: | ||
-- | -- | ||
</ | </ | ||
- | Immer darauf achten, das die Dokumententabelle | + | Immer darauf achten, das die Dokumenten Tabelle |
Zeile 70: | Zeile 76: | ||
=== Oracle Text Index mit der Lexer Eigenschaft INDEX_THEMES anlegen=== | === Oracle Text Index mit der Lexer Eigenschaft INDEX_THEMES anlegen=== | ||
- | Der Lexer ist für den Aufbau eines Context Indexe mit Theme Daten notwendig. | + | Der Lexer ist für den Aufbau eines Context Indexe mit Theme Daten zuständig. |
Zuvor die Eigenschaften des LEXER definieren: | Zuvor die Eigenschaften des LEXER definieren: | ||
- | |||
<code sql> | <code sql> | ||
Zeile 89: | Zeile 94: | ||
/ | / | ||
- | #prüfen ob ein Fehler bei Indizieren aufgetreten ist: | + | --prüfen ob ein Fehler bei Indizieren aufgetreten ist: |
SELECT * FROM CTX_USER_INDEX_ERRORS; | SELECT * FROM CTX_USER_INDEX_ERRORS; | ||
- | # Neben dem normalen Tockens werden nun die Themen Token vom Typ 1 abgelegt: | + | --Neben dem normalen Tockens werden nun die Themen Token vom Typ 1 abgelegt: |
SELECT token_type FROM dr$idx_documents_docs$i group by token_type; | SELECT token_type FROM dr$idx_documents_docs$i group by token_type; | ||
Zeile 134: | Zeile 139: | ||
Zum Prüfen welche Dateien er jezt wirklich für den Theme Index verwendet das Verzeichnis $ORACLE_HOME\ctx\data umbennen in $ORACLE_HOME\ctx\_data und den Index erneut anlegen | Zum Prüfen welche Dateien er jezt wirklich für den Theme Index verwendet das Verzeichnis $ORACLE_HOME\ctx\data umbennen in $ORACLE_HOME\ctx\_data und den Index erneut anlegen | ||
- | Über die Fehlermeldung | + | Über die Fehlermeldung |
<code sql> | <code sql> | ||
CREATE INDEX idx_documents_docs ON documents(docs) | CREATE INDEX idx_documents_docs ON documents(docs) | ||
Zeile 177: | Zeile 182: | ||
begin | begin | ||
ctx_doc.themes ( index_name | ctx_doc.themes ( index_name | ||
- | , restab | + | , restab |
, textkey | , textkey | ||
, full_themes | , full_themes |
dba/oracle_text_index_themes.txt · Zuletzt geändert: 2016/04/24 22:15 von gpipperr