Data Integration Connector

Installation und Konfiguration

Copyright ©

Mindbreeze GmbH, A-4020 Linz, 2018.

Alle Rechte vorbehalten. Alle verwendeten Hard- und Softwarenamen sind Handelsnamen und/oder Marken der jeweiligen Hersteller.

Diese Unterlagen sind streng vertraulich. Durch die Übermittlung und Präsentation dieser Unterlagen alleine werden keine Rechte an unserer Software, an unseren Dienstleistungen und Dienstleistungsresultaten oder sonstigen geschützten Rechten begründet. Die Weitergabe, Veröffentlichung oder Vervielfältigung ist nicht gestattet.

Aus Gründen der einfacheren Lesbarkeit wird auf die geschlechtsspezifische Differenzierung, z.B. Benutzer/-innen, verzichtet. Entsprechende Begriffe gelten im Sinne der Gleichbehandlung grundsätzlich für beide Geschlechter.

InstallationPermanenter Link zu dieser Überschrift

Vor der Installation des Data Integration Connector Plugins muss sichergestellt werden, dass der Mindbreeze Server bereits installiert ist und dieser Connector auch in der Mindbreeze Lizenz inkludiert ist.

Installation des Data Integration ConnectorsPermanenter Link zu dieser Überschrift

Der Data Integration Connector ist als ZIP Datei verfügbar. Diese Datei muss wie folgt mittels mesextension.exe beim Fabasoft Mindbreeze Enterprise Server registriert werden:

mesextension  --interface=plugin  --type=archive  --file=DataIntegrationConnector<version>.zip  install

ACHTUNG: Ein Update des Connectors kann über den gleichen mesextention Aufruf durchgeführt werden, Fabasoft Mindbreeze Enterprise führt automatisch das benötigte Update durch.

Deinstallation des Data Integration ConnectorsPermanenter Link zu dieser Überschrift

Um den Data Integration Connector zu deinstallieren, müssen zuerst alle Data Integration Crawler gelöscht und danach der folgende Befehl ausgeführt werden:

mesextension  --interface=plugin  --type=archive  --file= DataIntegrationConnector <version>.zip uninstall

Erstellen eines „Data Integration Prozesses“Permanenter Link zu dieser Überschrift

Sie können den Data Integration Connector in Verbindung mit Talend Open Studio verwenden, um selbst Datenquellen anzubinden. Talend Open Studio steht unter https://www.talend.com/products/data-integration/data-integration-open-studio/ zum Download zur Verfügung.

Der Data Integration Connector enthält Komponenten für Talend Open Studio, die getrennt installiert werden müssen. Entpacken Sie die Datei components.zip aus dem Data Integration Connector Installationspaket in ein beliebiges Verzeichnis (z.B. C:\custom-talend-components).

Legen Sie nach der Installation von Talend Open Studio ein neues Projekt an.

Öffnen Sie im Menü von Talend Open Studio Window -> Preferences

Wählen Sie Talend -> Components aus und geben Sie im Feld „User component folder“ das Verzeichnis an, in das Sie die Komponenten entpackt haben.

Jetzt können Sie einen neuen Job anlegen. Fügen Sie Datenquellen nach Ihren Bedürfnissen hinzu. Genauere Information zum Arbeiten mit Talend Open Studio erhalten Sie in der Dokumentation zu Talend Open Studio.

Als Ziel einer Verarbeitungskette muss immer die Komponente namens "MindbreezeIndexOutput" stehen. Beachten Sie weiters, dass für die korrekte Funktionsweise dieser Komponente folgende Felder im Schema definiert sein müssen, alle vom Typ "String":

  • key
  • title
  • extension
  • categoryClass

Zusätzlich können auch noch folgende optionalen Felder für die Weiterverarbeitung im Mindbreeze Index verwendet werden:

  • acl (Liste von "String"-Werten) in folgendem Format: "TestUser1||GRANT"
  • date (Typ "Date")
  • modificationDate (Typ "Date")
  • content (Typ "String")

Sollten weitere Felder im Schema definiert sein, so werden diese als Metadaten übernommen. Es ist auch möglich, Annotationen in folgendem Format zu definieren:

  • val1|||mes:annotated|||categoryclass=cc1|||value=v1

"val1" wird in diesem Beispiel mit der categoryClass "cc1" und dem Wert "v1" zu einer Annotation.

Sämtliche Felder vom Typ "Liste" werden zu Listen von Metadaten, alle anderen Felder automatisch zum Typ "String" konvertiert.

Sobald Sie den Job fertig konfiguriert haben, können Sie den Job ausführen, um die Funktionsweise zu testen. Die Daten werden nicht an einen Index gesendet, sondern in Talend Open Studio ausgegeben.

Sollte der Funktionstest problemlos verlaufen, ist es noch notwendig, den Job zu exportieren. Dies lässt sich mittels Klick auf das Kontextmenü des jeweiligen Jobs erledigen:

Wichtig ist hierbei, dass das generierte ZIP-File auch entpackt wird.

Die für die Konfiguration von Fabasoft Mindbreeze Enterprise notwendige "Main-Class" kann in dem generierten Batch-File nachgesehen werden.

Konfiguration von MindbreezePermanenter Link zu dieser Überschrift

Klicken Sie auf das „Indices“-Tab und danach auf das „Add new index“-Symbol, um einen neuen Index zu erstellen.

Geben Sie den Indexpfad ein, z.B. „C:\Index“. Passen Sie gegebenenfalls den Display Name des Index Service und des zugehörigen Filter Service an

Fügen Sie eine neue Datenquelle mit dem Symbol “Add new custom source” rechts unten ein.

Zur Konfiguration des Crawler müssen Sie das Job-Verzeichnis in „Directory of Job“ und die Java-Klasse des Jobs in „Main Class“ eintragen.

Wenn die Option „Delete Unprocessed Documents“ aktiviert ist, werden nicht-prozessierte Dokumente vom Index gelöscht, wenn das Crawling erfolgreich war. „Erfolgreich“ heißt, dass der exportierte Talend-Job mit Exit-Code 0 beendet wurde.