Home
Home
Englische Version
Support
Impressum
25.3 Release ►

Start Chat with Collection

Hauptnavigation

  • Vorbereitung
  • Datenquellen
  • Konfiguration
  • Betrieb
  • Anwenderhandbuch
  • SDK
  • Release Notes
  • Sicherheit
  • Produktinformation
Home

Pfad

Ressourcenengpass oder zeitlicher Stress?
Überlassen Sie unseren Experten die Wartung, während Sie sich auf Ihr Geschäft konzentrieren.
Consulting Services ansehen

Installation und Konfiguration
Microsoft Loop Connector

EinleitungPermanenter Link zu dieser Überschrift

Mithilfe des Microsoft Loop Connectors können Pages von Microsoft Loop mit ihren Metadaten und Inhalten indiziert werden. Der Loop Connector ist in seiner Funktionsweise anders als andere Konnektoren. Für das indizieren von Loop wird ein Loop Sitemap Generator erstellt, der eine Sitemap bereitstellt. Diese Sitemap wird danach von einem spezifisch für Loop konfiguriertem Web Connector gecrawlt.

Für mehr Informationen, siehe das Kapitel Limitationen.

Konfiguration von Microsoft LoopPermanenter Link zu dieser Überschrift

Bereitstellen eines Microsoft Loop UserPermanenter Link zu dieser Überschrift

  • Legen Sie in Microsoft Loop einen neuen Benutzer an, der im Mindbreeze Microsoft Loop Sitemap Generator zum Erstellen einer Sitemap von Microsoft Loop verwendet werden kann. Der Benutzer muss dabei Zugriff auf alle zu indizierenden Inhalte haben.

Konfiguration von MindbreezePermanenter Link zu dieser Überschrift

Öffnen Sie im Mindbreeze Management Center die „Configuration“ um den Microsoft Loop Sitemap Generator und Microsoft Loop Principal Resolution Service zu konfigurieren.

Konfiguration des Microsoft Loop Sitemap GeneratorsPermanenter Link zu dieser Überschrift

Fügen Sie im Tab „Indices“ mit „+Add Service“ einen neuen Service hinzu. Wählen Sie dann im neuen Service bei der Einstellung „Service“ den Service „Microsoft Loop Sitemap Generator“ aus.

Konfigurieren Sie nun den Microsoft Loop Sitemap Generator mit den Einstellungen im Abschnitt „Connection Settings“.

Connection SettingsPermanenter Link zu dieser Überschrift

Einstellung

Beschreibung

Beispiel/Standardeinstellung

User Credentials*

Gibt den Crawling User in Microsoft Loop an.

Beispiel:

Loop Mindbreeze User

Bind Port*

Der Port, wo die erstelle Sitemap zur Verfügung steht.

Beispiel:

23950

Sitemap Generation Interval (Minutes)

Definiert das Interval in dem eine neue Sitemap generiert wird.

Standardeinstellung:

60

Page Size
(Advanced Settings)

Definiert die Anzahl an Objekten die gleichzeitig von Microsoft Loop abgeholt werden.

Standardeinstellung:

100

Log All Requests
(Advanced Settings)

Ist diese Option aktiviert, werden alle Anfragen gegen Microsoft Loop in das Logfile „request-log.csv“ geschrieben, solange der Login erfolgreich ist.

Standardeinstellung:

Deaktiviert

* = Diese Einstellungen müssen zwingend konfiguriert werden, damit der Sitemap Generator funktioniert und aufgebaut wird. Alle weiteren Einstellungen müssen je nach Anwendungsfall konfiguriert werden.

Einstellungen, die mit „(Advanced Settings)“ markiert sind, benötigen die Aktivierung der „Advanced Settings“ in der Konfiguration. Diese Einstellungen sind nur in speziellen Anwendungsfällen notwendig.

Konfiguration des Microsoft Loop Principal Resolution ServicePermanenter Link zu dieser Überschrift

Fügen Sie im Tab „Indices“ mit „+Add Service“ einen neuen Service hinzu. Wählen Sie dann im neuen Service bei der Einstellung „Service“ den Service „Microsoft Loop Principal Resolution Service“ aus.

Konfigurieren Sie nun den Microsoft Loop Principal Resolution Service mit den Einstellungen im Abschnitt „Connection Settings“.

Hinweis: Für mehr Informationen über das Erstellen, das grundlegende Konfigurieren eines Cache für einen Principal Resolution Service und weitere Konfigurationsoptionen, siehe Installation & Konfiguration - Caching Principal Resolution Service.

Connection SettingsPermanenter Link zu dieser Überschrift

Einstellung

Beschreibung

Beispiel/Standardeinstellung

User Credentials*

Gibt den Crawling User in Microsoft Loop an.

Beispiel:

Loop Mindbreeze User

Page Size
(Advanced Settings)

Definiert die Anzahl an Objekten die gleichzeitig von Microsoft Loop abgeholt werden.

Standardeinstellung:

100

Log All Requests
(Advanced Settings)

Ist diese Option aktiviert, werden alle Anfragen gegen Microsoft Loop in das Logfile „request-log.csv“ geschrieben, solange der Login erfolgreich ist.

Standardeinstellung:

Deaktiviert

* = Diese Einstellungen müssen zwingend konfiguriert werden, damit der Cache funktioniert und aufgebaut wird. Alle weiteren Einstellungen müssen je nach Anwendungsfall konfiguriert werden.

Einstellungen, die mit „(Advanced Settings)“ markiert sind, benötigen die Aktivierung der „Advanced Settings“ in der Konfiguration. Diese Einstellungen sind nur in speziellen Anwendungsfällen notwendig.

Konfiguration des IndexPermanenter Link zu dieser Überschrift

Fügen Sie im Tab „Indices“ mit „+Add Index“ einen neuen Index hinzu. Wählen Sie den gewünschten „Index Node“ und „Client Service“ aus und wählen Sie als „Data Source“ die Datenquelle „Web“ aus. Bestätigen Sie Ihre Eingaben anschließend mit „Apply“.

Einrichten des Web KonnektorsPermanenter Link zu dieser Überschrift

Zur Einrichtung des Web Connectors können Sie das Config XML aus dem Kapitel Web Connector Import/Export XML kopieren und mithilfe der „Import/Export“-Funktion importieren:

Zusätzlich sind folgende Änderungen noch notwendig:

  1. Verknüpfen Sie den Web Crawler mit dem Microsoft Loop Principal Resolution Service. Wählen Sie dafür bei der Einstellung „Caching Principal Resolution Service“ den hinzugefügten Microsoft Loop Principal Resolution Service aus.

  1. Weiters, muss der angegebene Port bei der Einstellung „Crawling Root“ mit dem konfigurierten „Bind Port“ des Microsoft Loop Sitemap Generator übereinstimmen.

  1. Zuletzt, muss bei den konfigurierten „Credential Scripts“ das Credential des Loop Users für die beiden Skripte „MS Login Username“ und „MS Login Password“ hinzugefügt werden. Aktivieren Sie „Advanced Settings“, um „Credential Scripts“ hinzufügen oder bearbeiten zu können.

AppendixPermanenter Link zu dieser Überschrift

LimitationenPermanenter Link zu dieser Überschrift

Die folgenden Limitationen gilt es zu beachten:

  • Es können nur Workspaces indiziert werden, worauf der angegebene Loop User auch Zugriff hat.
  • Der Loop Sitemap Generator kann bis zu maximal 1000 Workspaces verarbeiten.
  • Ein Workspace kann maximal 1000 Benutzer beinhalten.

Web Connector Import/Export XMLPermanenter Link zu dieser Überschrift

Das folgende XML kann unter anderem für das Einrichten des Web Konnektors verwendet werden. Für mehr Informationen, siehe das Kapitel Einrichten des Web Konnektors.

<settings>

    <id>plugin:com.mindbreeze.datasource.Crawler/Web</id>

    <attributes>

        <attribute name="category" value="Web"/>

        <attribute name="categoryinstance" value="Microsoft Loop"/>

        <attribute name="datasource" value="Web"/>

        <attribute name="processtype" value="command"/>

        <attribute name="interval" value="6"/>

        <attribute name="intervalmult" value="3600"/>

        <attribute name="launchedservice" value="true"/>

    </attributes>

    <properties>

        <property name="com.mindbreeze.datasource.enable_javascript" value="true"/>

        <property name="com.mindbreeze.datasource.include_network_resources_hostname">

            <![CDATA[login.microsoftonline.com

aadcdn.msauth.net

aadcdn.msftauth.net

login.live.com

.*data.microsoft.com

graph.microsoft.com

substrate.office.com

ecs.office.com

odc.officeapps.live.com

clients.config.office.net

.*sharepoint.com

config.edge.skype.com

.*cdn.office.net

.*hubblecontent.osi.office.net

loop.cloud.microsoft]]>

        </property>

        <property name="com.mindbreeze.datasource.credential_scripts" value="composite">

            <property name="com.mindbreeze.datasource.credential_scripts.script_name" value="MS Login Username"/>

            <property name="com.mindbreeze.datasource.credential_scripts.script_allowed_hosts" value="login.microsoftonline.com"/>

            <property name="com.mindbreeze.datasource.credential_scripts.script_selector_type" value="XPATH"/>

            <property name="com.mindbreeze.datasource.credential_scripts.script_trigger_selector" value="//*[@type=\&quot;email\&quot;]"/>

            <property name="com.mindbreeze.datasource.credential_scripts.script" value="// 24.7&#xA;event = new Event('change')&#xA;usernameField = document.evaluate(&quot;//*[@type=\&quot;email\&quot;]&quot;, document, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null).singleNodeValue;&#xA;submitButton = document.evaluate(&quot;//*[@type=\&quot;submit\&quot;]&quot;, document, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null).singleNodeValue;&#xA;usernameField.value = mesCredential.username;&#xA;usernameField.dispatchEvent(event);&#xA;submitButton.click(); "/>

            <property name="com.mindbreeze.datasource.credential_scripts.scrip_credential" value="377777061136392"/></property>

        <property name="com.mindbreeze.datasource.maxhopsfromcrawlingroot" value="1"/>

        <property name="com.mindbreeze.datasource.crawlingroot" value="http://localhost:23950/sitemap.xml"/>

        <property name="com.mindbreeze.datasource.robotshonoringpolicytype" value="IGNORE"/>

        <property name="com.mindbreeze.datasource.presence_selectors" value="composite">

            <property name="com.mindbreeze.datasource.presence_selectors.content_presence_selector_url_patterns" value="https://loop.cloud.microsoft/.*"/>

            <property name="com.mindbreeze.datasource.presence_selectors.content_selector_type" value="XPATH"/>

            <property name="com.mindbreeze.datasource.presence_selectors.content_presence_selector" value="//meta[@name=\&quot;isready\&quot;]"/></property>

        <property name="com.mindbreeze.datasource.exclude_javascript_url_pattern">

            <![CDATA[.*robots.txt]]>

        </property>

        <property name="com.mindbreeze.datasource.enable_verbose_logging" value="false"/>

        <property name="com.mindbreeze.datasource.allowed_resource_types">

            <![CDATA[DOCUMENT

          STYLESHEET

          IMAGE

          MEDIA

          FONT

          SCRIPT

          XHR

          FETCH

          PING

          CSPVIOLATIONREPORT

          OTHER]]>

        </property>

        <property name="com.mindbreeze.datasource.skip_head_request" value="true"/>

        <property name="com.mindbreeze.datasource.parallelqueuecount" value=""/>

        <property name="com.mindbreeze.datasource.crawlerthreadcount" value="5"/>

        <property name="com.mindbreeze.datasource.scripts" value="composite">

            <property name="com.mindbreeze.datasource.scripts.script_name" value="Reload Loop"/>

            <property name="com.mindbreeze.datasource.scripts.script_url_patterns" value="https://loop.cloud.microsoft/.*"/>

            <property name="com.mindbreeze.datasource.scripts.script_selector_type" value="XPATH"/>

            <property name="com.mindbreeze.datasource.scripts.script_trigger_selector" value="//*[@id=\&quot;loopApp-menu2\&quot;]"/>

            <property name="com.mindbreeze.datasource.scripts.script" value="// 24.7&#xA;location.reload();"/></property>

        <property name="com.mindbreeze.datasource.scripts" value="composite">

            <property name="com.mindbreeze.datasource.scripts.script_name" value="Press KMSI"/>

            <property name="com.mindbreeze.datasource.scripts.script_url_patterns" value="https://login.microsoftonline.com/common/login"/>

            <property name="com.mindbreeze.datasource.scripts.script_selector_type" value="XPATH"/>

            <property name="com.mindbreeze.datasource.scripts.script_trigger_selector" value="//*[@type=\&quot;submit\&quot;]"/>

            <property name="com.mindbreeze.datasource.scripts.script" value="// 24.7&#xA;document.evaluate(&quot;//*[@type=\&quot;submit\&quot;]&quot;, document, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null).singleNodeValue.click();"/></property>

        <property name="com.mindbreeze.datasource.credential_scripts" value="composite">

            <property name="com.mindbreeze.datasource.credential_scripts.script_name" value="MS Login Password"/>

            <property name="com.mindbreeze.datasource.credential_scripts.script_allowed_hosts" value="login.microsoftonline.com"/>

            <property name="com.mindbreeze.datasource.credential_scripts.script_selector_type" value="XPATH"/>

            <property name="com.mindbreeze.datasource.credential_scripts.script_trigger_selector" value="//*[@id=\&quot;idA_PWD_ForgotPassword\&quot;]"/>

            <property name="com.mindbreeze.datasource.credential_scripts.script" value="// 24.7&#xA;passwordField =  document.evaluate(&quot;//*[@type=\&quot;password\&quot;]&quot;, document, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null).singleNodeValue;&#xA;submitButton =  document.evaluate(&quot;//*[@type=\&quot;submit\&quot;]&quot;, document, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null).singleNodeValue;&#xA;passwordField.value = mesCredential.password;&#xA;passwordField.dispatchEvent(event);&#xA;submitButton.click();"/>

            <property name="com.mindbreeze.datasource.credential_scripts.scrip_credential" value="377777061136392"/></property>

        <property name="com.mindbreeze.datasource.page_load_timeout_seconds" value="20"/>

        <property name="com.mindbreeze.datasource.network_timeout" value="20"/>

        <property name="com.mindbreeze.datasource.isdeltarun" value="complete"/>

        <property name="com.mindbreeze.datasource.on_new_document_script">

            <![CDATA[// 24.7

window.open = function(...args) {

console.log("Popup blocked: window.open was called, but no action was taken.");

};

window.print = function () {

     window.onbeforeprint();

     const meta = document.createElement('meta');

     meta.name = "isready";

     meta.content = "true";

     document.head.appendChild(meta);

};]]>

        </property>

        <property name="com.mindbreeze.datasource.match_network_resources_hostnames_as_regex" value="true"/>

        <property name="com.mindbreeze.datasource.content_presence_selector" value=""/>

    </properties>

</settings>

PDF herunterladen

  • Konfiguration - Microsoft Loop Connector

Inhalt

  • Einleitung
  • Konfiguration von Microsoft Loop
  • Konfiguration von Mindbreeze
  • Appendix

PDF herunterladen

  • Konfiguration - Microsoft Loop Connector