JiveSoftware Jive Connector

Installation und Konfiguration

Copyright ©

Mindbreeze GmbH, A-4020 Linz, .

Alle Rechte vorbehalten. Alle verwendeten Hard- und Softwarenamen sind Handelsnamen und/oder Marken der jeweiligen Hersteller.

Diese Unterlagen sind streng vertraulich. Durch die Übermittlung und Präsentation dieser Unterlagen alleine werden keine Rechte an unserer Software, an unseren Dienstleistungen und Dienstleistungsresultaten oder sonstigen geschützten Rechten begründet. Die Weitergabe, Veröffentlichung oder Vervielfältigung ist nicht gestattet.

Aus Gründen der einfacheren Lesbarkeit wird auf die geschlechtsspezifische Differenzierung, z.B. Benutzer/-innen, verzichtet. Entsprechende Begriffe gelten im Sinne der Gleichbehandlung grundsätzlich für beide Geschlechter.

Konfiguration von MindbreezePermanenter Link zu dieser Überschrift

Konfiguration von Index und CrawlerPermanenter Link zu dieser Überschrift

Klicken Sie auf das „Indices“-Tab und danach auf das „Add new index“-Symbol, um einen neuen Index zu erstellen.

Geben Sie den Indexpfad ein, z.B. „C:\Index“. Passen Sie gegebenenfalls den Display Name des Index Service und des zugehörigen Filter Service an.

Weiter muss die Option „Use ACL References“ aktiviert werden.

Fügen Sie eine neue Datenquelle mit dem Symbol „Add new custom source“ rechts unten ein.

Wenn nicht bereits ausgewählt, selektieren Sie „JiveSoftware Jive“ bei der Schaltfläche „Category“ aus.

Über die Einstellung „Crawler Interval“ konfigurieren Sie die Zeitspanne, die zwischen zwei Indizierungsdurchläufen gewartet wird.

Web PagePermanenter Link zu dieser Überschrift

Im Feld Crawling Root können Sie Ein URL angeben wo ein Jive Sitemap erreichbar ist. Wenn Sie den Mindbreeze Sitemap Generator Add-On auf ihren Jive Server installiert ist und eine Sitemap erzeugt wurde, sollte hier die URL <Jive URL>/rpc/rest/mindbreeze/sitemap?jobid=full eingetragen werden.

Im Feld „URL Regex” können Sie einen regulären Ausdruck bestimmen, der ein Muster für die Links, die indiziert werden sollen, vorgibt.

Sollen bestimmte URLs vom Crawlen ausgenommen werden, so können diese mit einem regulären Ausdruck unter „URL Exclude Pattern“ konfiguriert werden.

Sollte aus netzwerktechnischen Gründen die DNS-Auflösung bestimmter Webserver nicht klappen, kann man mit dem „Additional Hosts File“ die IPs vorgeben.

Möchte man bestimmte HTTP Header hinzufügen (beispielsweise Accept-Language), so kann man das über die „Accept Headers“ einstellen.

Mit der „Use Stream Parser“ Option wird ein Stream Parser für die Bearbeitung der Sitemaps verwendet. Diese Option ist für Sitemaps mit sehr vielen URLs geeignet.

Mit der Option „Max Retries“ wird bestimmt, wie oft der Connector versucht ein Dokument herunterzuladen, wenn temporäre Fehler (z.B. Socket Timeouts) auftreten. Der Standardwert ist 0. (Kein weiterer Herunterladeversuch). Wenn über ein instabiles Netzwerk gecrawlt wird (das Timeouts verursacht), sollte dieser Wert auf z.B. 10 erhöht werden. Wenn die Timeouts durch eine überlastete Datenquelle entstehen, sollte der Wert auf 0 belassen werden, damit die Datenquelle nicht zusätzlich belastet wird.

Mit der Option „Retry Delay Seconds“ wird die Wartezeit (in Sekunden) bestimmt, die zwischen den Herunterladeversuchen vergehen (siehe „Max Retries“). Der Standardwert ist 1.

Resource ParametersPermanenter Link zu dieser Überschrift

In diesem Abschnitt (nur verfügbar, wenn „Advanced Settings“ ausgewählt ist) kann noch die Crawl-Geschwindigkeit adjustiert werden.

Mit der Anzahl der Crawler-Threads („Number Of Crawler Threads“) kann definiert werden, wie viele Threads gleichzeitig Webseiten vom Webserver abholen.

Das „Request Interval“ definiert die Anzahl an Millisekunden, die der Crawler(-Thread) zwischen den einzelnen Requests warten soll. Eine „Crawl-Delay“ Robots-Anweisung wird jedoch auf alle Fälle berücksichtigt und überschreibt diesen Wert.

ProxyPermanenter Link zu dieser Überschrift

Im Abschnitt „Proxy“ können Sie einen Proxy Server eintragen, falls Ihre Infrastruktur dies erfordert. Tragen Sie dazu den Computernamen und den Port des Proxy-Servers in „Proxy Host“ und „Proxy Port“ ein.

Der Jive Connector kann sich am Proxy auch mittels HTTP-BASIC anmelden. Tragen Sie in das Feld „Proxy User“ den Benutzer und in „Proxy Password“ das zugehörige Passwort ein, wenn die Verbindungen über einen Proxy mit Authentifizierung erfolgen sollen.

Jive LoginPermanenter Link zu dieser Überschrift

Basic AuthenticationPermanenter Link zu dieser Überschrift

Im Abschnitt „Basic access authentication“ kann ein „Credential“ ausgewählt werden, welches bei der Basic Authentifizierung für die http Anfragen verwendet wird. Hier sollte ein Credential vom Typ „Username/Password“ angegeben werden.

Dieses Credential kann im Reiter „Network“ unter „Credentials“ hinzugefügt und konfiguriert werden.

Formularbasierte AuthentisierungPermanenter Link zu dieser Überschrift

Wenn die Jive Sitemap mit HTTP formularbasierter Authentisierung erreichbar ist, können die Login Parameter im Abschnitt „Form Based Login“ folgendermaßen konfiguriert werden:

  • Login URL: die Jive URL, an die das Login Formular geschickt werden soll: z.B.
  • Form Elements: hier muss ein Element mit Name „username“ hinzugefügt werden. Der Wert („Value“) soll der Benutzername sein, der dazu berechtigt ist, die Sitemap runterzuladen.
  • Form Password Elements: hier muss ein Element mit Name „password“ hinzugefügt werden. Der Wert („Value“) soll das Passwort für den zuvor angegebenen Benutzer sein.

Access Check RulesPermanenter Link zu dieser Überschrift

Zusätzlich gibt es noch die Möglichkeit, sogenannte „Access Rules“ zu definieren, wobei diese aus folgenden Optionen besteht:

  • „Access Check Principal”, die Benutzernamen können im Format „username@domain“, „domain\username“ oder „distinguished name“ sein. Die Gruppennamen können nur im Format distinguished name sein. Weiters kann hier ein Verweis auf eine Capture-Group in der Selection Pattern verwendet werden.
  • „Access Check Action”, Grant order Deny.
  • „Metadata Key for Selection”, ein Metadatenname, kann leer sein (alle Dokumente werden selektiert)
  • „Selection Pattern”, eine Regularexpression, kann leer sein (alle Dokumente werden selektiert).

Jive URLPermanenter Link zu dieser Überschrift

  • Im Abschnitt „Jive URL“ muss die Basis URL des Jive Servers angegeben werden.

Jive Principal ResolutionPermanenter Link zu dieser Überschrift

In die Mindbreeze Konfiguration öffnen Sie die “Indizes” Reiter und fügen Sie ein Caching Jive Principal Resolution Service hinzu.

Geben Sie den „Jive Server URL an. Ist bei Jive der Zugriff für nicht angemeldete Benutzer erlaubt, bitte die Option „Jive Guest Access enabled aktivieren. Mit der Option „Groups Containing All Users können Gruppen definiert werden, sodass alle Benutzer so behandelt werden, als ob sie Mitglieder dieser Gruppen sind.

  1. Die notwendigen Anmeldeinformationen, um auf den „Jive Server URL zugreifen zu können, müssen im Reiter „Network konfiguriert und auf den „Jive Server URL Endpunkt abgebildet werden.

Geben Sie den Verzeichnispfad für den Cache im „Database Directory Path“ Feld an und ändern Sie, wenn notwendig, die „Cache In Memory Items Size“, abhängig vom verfügbaren Speicherplatz der JVM. Im „Cache Update Interval“ Feld geben sie die Zeit (Minuten) an, die gewartet wird bevor der Cache aktualisiert wird. Beim ersten Starten des Service wird diese Zeit ignoriert. Beim nächsten Starten des Services wird diese Zeit berücksichtigt. Die Einstellungen „Health Check Interval“, „Health Check max. Retries On Failure“ und „Heath Check Request Timeout“ ermöglichen es, dass dieser Service neugestartet wird falls es z.B. dauerhafte Verbindungsprobleme gibt.


Das Service wird am angegebenen “Webservice Port” verfügbar. Wenn mehrere Principal Resolution Services konfiguriert sind, stellen Sie sicher, dass die „Webservice Port“ Parameter unterschiedlich sind und die konfigurierte Ports verfügbar sind.

Mit der Option „Lowercase Principals“ werden alle Principals vom Cache kleingeschrieben geliefert.

Wenn Benutzer bei einer Suchanfrage nicht aufgelöst werden können, wird eine Anfrage direkt an Jive abgesetzt, wenn die Option „Supress JIVE Service Calls“ nicht aktiviert ist. Aus Performancegründen wird jedoch empfohlen, diese Option zu aktivieren, sodass keine Live-Anfragen an Jive gestellt werden.

Um den Caching Principal Resolution Service zu testen, können Sie die Principal Resolution Service REST API verwenden.