Copyright ©
Mindbreeze GmbH, A-4020 Linz, .
Alle Rechte vorbehalten. Alle verwendeten Hard- und Softwarenamen sind Handelsnamen und/oder Marken der jeweiligen Hersteller.
Diese Unterlagen sind streng vertraulich. Durch die Übermittlung und Präsentation dieser Unterlagen alleine werden keine Rechte an unserer Software, an unseren Dienstleistungen und Dienstleistungsresultaten oder sonstigen geschützten Rechten begründet. Die Weitergabe, Veröffentlichung oder Vervielfältigung ist nicht gestattet.
Aus Gründen der einfacheren Lesbarkeit wird auf die geschlechtsspezifische Differenzierung, z.B. Benutzer/-innen, verzichtet. Entsprechende Begriffe gelten im Sinne der Gleichbehandlung grundsätzlich für beide Geschlechter.
Das Mindbreeze Sitemap Generator Add-On erzeugt eine Sitemap der Pages und Spaces bzw. Blogs und Anhänge aus Atlassian Confluence. Die Auswahl der enthaltenen Inhalte erfolgt über den verwendeten Benutzer, da dessen Zugriffsrechte berücksichtigt werden, sowie über Ausschlüsse mittels Regulären Ausdrücken. Details dazu finden Sie im Abschnitt Konfiguration.
Das Mindbreeze Sitemap Generator Add-On benötigt die Remote API-Schnittstelle von Atlassian Confluence. Diese können Sie unter „Weitere Konfiguration > Remote API (XML-RPC & SOAP)“ aktivieren.
Das Add-On wird im Menüpunkt „Add-Ons verwalten“ mit der Aktion „Add-On hochladen“ installiert:
Die aktuell unterstützte Version finden Sie in der Produktinformation im Kapitel Unterstützte Datenquellen.
Die Plugin-Dateien befinden sich im Plugin-Ordner des Mindbreeze Confluence Konnektors und können über die Schaltfläche „Datei auswählen“ hochgeladen werden.
Bestätigen Sie ihre Auswahl mit „Upload“:
Das Plugin ist fertig installiert:
Die Einstellungen des Mindbreeze Sitemap Generator Add-Ons können mit der Schaltfläche „Konfigurieren“ angepasst werden:
Sitemap Generating User | Atlassian Confluence Benutzer, mit dem die Sitemap erzeugt wird. Empfohlener Wert: admin. |
Sitemap Downloader Group | Nur Mitglieder der angegebenen Atlassian Confluence Gruppe dürfen die Sitemap herunterladen. Es wird dringend empfohlen, dies auf eine Benutzergruppe zu beschränken, die alle Daten sehen darf. |
ACL Encryption Password | wenn dieser Parameter nicht leer ist, werden die ACL Elemente mit dem hier gesetzten Password verschlüsselt. |
Confluence Base URL | die Basisadresse der Seiten in der Sitemap (URL location). Dies sollte verwendet werden, wenn über ein dediziertes Front End Service die Inhalte runtergeladen werden. Standardmäßig wird der in Confluence konfigurierte Base URL verwendet. |
Sitemap Cache Directory | das Verzeichnis, in dem die erzeugte Sitemap abgelegt wird. Standaradwert: Confluence Home. |
Use Attachment Version | Wenn aktiv, wird die aktuelle Attachments Version in die URL mit aufgenommen. Damit können diese, falls sie editiert werden, aktualisiert werden. |
Disable Parent Reference Metadata for Pages | Wenn aktiv, wird kein Referenz Metadatum auf das übergeordnete Dokument für Confluence Seiten generiert. Dadurch wird die Anzahl der Datenbankabfragen geringer. |
Add Performance Metrics to Sitemap | Wenn aktiv, werden die benötigten Zeiten für Sitemap-Generierungs Tasks als Kommentar in die Sitemap eingetragen. |
ACL Exempt Group Name (ex. confluence-administrators) | Confluence befreit standardmäßig die Mitglieder der Gruppe confluence-administrators vor der Zugriffsüberprüfung. Bei den Mindbreeze Dokument ACLs sind diese standardmäßig nicht befreit. Sollten einer Gruppe Leserechte auf alle Inhalte zur Verfügung gestellt werden, kann diese hier erfolgen. |
Custom Content Property Key Pattern | Mit dieser Option können Custom Content Properties in die Sitemap aufgenommen werden. Es wird ein regulärer Ausdruck definiert, welcher auf den Namen der Custom Content Properties matched (ohne dem Prefix custprop_ ). Übereinstimmende Properties werden in die Sitemap aufgenommen. Hinweis: Custom Content Property Werte vom Typ JSON Objekt, werden in ein oder mehrere Metadaten ausgeflacht. Außerdem werden Custom Content Properties nur für Pages und nicht für Attachments unterstützt. Standardwert: nicht gesetzt. Beispielwerte: .* (inkludiert alle Custom Content Properties) oder myProp.* (inkludiert alle Custom Content Properies, die mit myProp beginnen, zb myPropLikes). Hinweis: Diese Funktionalität wird nur für Confluence Version 5.6+ unterstützt. |
Generate Delta sitemap for the Latest Changes (Minutes) | Die Delta-Sitemap enthält alle Dokumente, die in den letzten Minuten geändert wurden. Wie viele Minuten das konkret sind, kann mit dieser Option konfiguriert werden. Wenn diese Option nicht gesetzt ist, enthält die Delta-Sitemap keine <url> Elemente. |
Generate REST URLs | Anstelle von den normalen Confluence Sitemap URL werden REST API URLs erzeugt, die im Confluence Crawler als Dokument-Key gesetzt werden. Dies hat z.B. den Vorteil, dass bei einem Delta Crawl Run keine temporären Duplikate entstehen, wenn der Titel von Seiten geändert wurde. Wenn Sie diese Option aktivieren, stellen Sie bitte auch sicher, dass die Option „Use Rest API for Page Content“ im Atlassian Confluence Crawler aktiv ist. Achtung: Falls Sie bereits Confluence indiziert haben und diese Option im Nachhinein aktivieren oder deaktivieren möchten, brauchen Sie einen leeren Index, bevor sie diese Option ändern. Dies würde ansonsten zu Dokument-Duplikaten führen, da sich das mes:key Schema dabei ändert. |
REST URL Base Path | Falls sich der REST API Endpunkt nicht direkt auf <your-confluence-url>/rest/api befindet, kann der „REST URL Base Path“ angegeben werden. Befindet er sich z.B. auf <your-confluence-url>/mybasepath/rest/api, muss als “REST URL Base Path“ der Wert /mybasepath angegeben werden. |
Include Labels | Wenn aktiv, werden Label Metadaten („labels“) für Sites, Spaces und Attachments in der Sitemap inkludiert. |
Wenn aktiviert, erhalten alle Benutzer Zugriff auf Spaces, die Zugriff für anonyme Benutzer erlauben. Wenn diese Option deaktiviert ist, haben anonyme Benutzer keinen Zugriff. Achtung: Es ist möglich, Atlassian Confluence so zu konfigurieren, dass eingeloggte Benutzer keinen Zugriff auf Dokumente haben, anonyme Benutzer aber schon. In diesem Fall, wenn diese Einstellung aktiviert ist, finden Benutzer möglicherweise mehr Dokumente in Mindbreeze als in Atlassian Confluence. |
Die Sitemap wird mit einer geplanten Aufgabe erzeugt. Unter Administration > „Geplante Aufgaben“ steht die Aufgabe „scheduledjob.desc.mindbreezeGenerateSitemapJob“ zur Verfügung. Unter „Bearbeiten“ kann ein Cron-Ausdruck angegeben werden. Mit „Starten“ wird die Sitemap einmalig erzeugt.
Nach Abschluss des Sitemap-Generator-Jobs ist die Sitemap unter der folgenden URL verfügbar: <Atlassian Confluence URL>/plugins/servlet/sitemapservlet?jobbased=true
Die Delta-Sitemap ist unter
<Atlassian Confluence URL>/plugins/servlet/sitemapservlet?jobbased=true&delta=true verfügbar.
Standardmäßig ist nichts konfiguriert und die Log-Datei zeigt keine Meldungen bezüglich des Sitemap-Generators an.
Unter Administration > „Protokoll- und Profilerstellung“ können Sie die gewünschte Protokollierungsstufe für das Atlassian Confluence Sitemap Generator Add-On einstellen.
Dafür müssen Sie einen neuen Eintrag mit dem Paketnamen „com.mindbreeze.enterprisesearch.connectors“ anlegen und die gewünschte Ebene auswählen.
Die Protokollnachrichten sind in <Confluence Home>/logs/atlassian-confluence.log verfügbar.
Wenn der Connector keine Dokumente indiziert, überprüfen Sie den folgenden Pfad im Protokollverzeichnis des Connectors: jobs/logs/crawl.log. Wenn Sie die Fehlercodes 401 oder 403 feststellen, haben Sie möglicherweise Probleme mit der Anmeldung oder den Berechtigungen. Stellen Sie in diesem Fall sicher, dass alle Dokumente in der Sitemap für den Crawling-Benutzer erreichbar sind.
Sie können dies testen, indem Sie ein Dokument innerhalb der Sitemap in einem Inkognito-Tab öffnen.
Die Seite, die geöffnet wird, MUSS das Confluence-Login sein, mit einem Feld für den Benutzernamen und das Passwort. Wenn z.B. eine andere Anmeldeseite eines externen Identity Providers oder eine 2FA (Two-Factor Authentication) Anmeldung geöffnet wird, kann sich der Connector nicht anmelden und das Dokument crawlen. Wenden Sie sich in diesem Fall an Ihren Confluence-Administrator, um Confluence so einzurichten, dass sich der Connector anmelden kann.
Es ist möglich, die Einstellung Confluence Base URL so zu konfigurieren, dass die URLs in der Sitemap geändert werden, wenn dies notwendig ist, um zur richtigen Anmeldeseite zu gelangen.
Wenn Sie die Confluence-Anmeldeseite erreichen, geben Sie den Benutzernamen und das Passwort des Crawling-Benutzers ein und vergewissern Sie sich, dass die Anmeldung möglich ist und dass das Dokument zugänglich ist.