Home
Home
Englische Version
Support
Impressum
25.2 Release ►

Start Chat with Collection

    Main Navigation

    • Vorbereitung
      • Einrichten InSpire G7 Primärsystem und Standby Appliances
      • Erstellen einer InSpire-VM auf Hyper-V
      • Initiale Inbetriebnahme für G7 Appliances
      • Konnektoren
    • Datenquellen
      • Anleitung zur Datenintegration mithilfe eines SQL Datenbank-Beispiels
      • Handbuch - Mindbreeze InSpire Insight Apps in Salesforce
      • Indizierung benutzerspezifischer Eigenschaften (SharePoint 2013 Connector)
      • Indizierung benutzerspezifischer Objekttypen (Documentum)
      • Installation & Konfiguration - Atlassian Confluence Sitemap Generator Add-On
      • Installation & Konfiguration - Caching Principal Resolution Service
      • Installation & Konfiguration - Mindbreeze InSpire Insight Apps in Microsoft SharePoint On-Prem
      • Konfiguration - Atlassian Confluence Connector
      • Konfiguration - Best Bets Connector
      • Konfiguration - Box Connector
      • Konfiguration - COYO Connector
      • Konfiguration - Data Integration Connector
      • Konfiguration - Documentum Connector
      • Konfiguration - Dropbox Connector
      • Konfiguration - Egnyte Connector
      • Konfiguration - GitHub Connector
      • Konfiguration - Google Drive Connector
      • Konfiguration - GSA Adapter Service
      • Konfiguration - HL7 Connector
      • Konfiguration - IBM Connections Connector
      • Konfiguration - IBM Lotus Connector
      • Konfiguration - Jira Connector
      • Konfiguration - JVM Launcher Service
      • Konfiguration - LDAP Connector
      • Konfiguration - Microsoft Azure Principal Resolution Service
      • Konfiguration - Microsoft Dynamics CRM Connector
      • Konfiguration - Microsoft Exchange Connector
      • Konfiguration - Microsoft File Connector (Legacy)
      • Konfiguration - Microsoft File Connector
      • Konfiguration - Microsoft Graph Connector
      • Konfiguration - Microsoft Loop Connector
      • Konfiguration - Microsoft Project Connector
      • Konfiguration - Microsoft SharePoint Connector
      • Konfiguration - Microsoft SharePoint Online Connector
      • Konfiguration - Microsoft Stream Connector
      • Konfiguration - Microsoft Teams Connector
      • Konfiguration - Salesforce Connector
      • Konfiguration - SCIM Principal Resolution Service
      • Konfiguration - SemanticWeb Connector
      • Konfiguration - ServiceNow Connector
      • Konfiguration - Web Connector
      • Konfiguration - Yammer Connector
      • Mindbreeze InSpire Insight Apps in Microsoft SharePoint Online
      • Mindbreeze Web Parts in Microsoft SharePoint
      • Whitepaper - Web Connector Erweiterte JavaScript Anwendungsfälle
    • Konfiguration
      • CAS Authentifizierung
      • Cookie Authentifizierung
      • Handbuch - AI Chat
      • Handbuch - Erstellung einer AWS 10M InSpire Applikation
      • Handbuch - Erstellung einer AWS 1M InSpire Applikation
      • Handbuch - Erstellung einer AWS 2M InSpire Applikation
      • Handbuch - Erstellung einer Google Compute Cloud Virtual Machine InSpire Applikation
      • Handbuch - Erstellung einer Oracle Cloud 10M InSpire Applikation
      • Handbuch - Erstellung einer Oracle Cloud 1M InSpire Applikation
      • Handbuch - MMC_ Services
      • Handbuch - Natural Language Question Answering (NLQA)
      • Handbuch - SSO mit Microsoft AAD oder AD FS
      • Handbuch - Text Classification Insight Services
      • I18n Item Transformation
      • JWT Authentifizierung
      • Konfiguration - Alternative Suchvorschläge und automatische Sucherweiterung
      • Konfiguration - Backend Credentials
      • Konfiguration - Benachrichtigungen
      • Konfiguration - CJK Tokenizer Plugin
      • Konfiguration - CSV Metadata Mapping Item Transformation Service
      • Konfiguration - Entity Recognition
      • Konfiguration - Export Funktionalität
      • Konfiguration - External Query Service
      • Konfiguration - Filter Plugins
      • Konfiguration - Gesammelte Ergebnisse
      • Konfiguration - GSA Late Binding Authorization
      • Konfiguration - Identity Conversion Service - Replacement Conversion
      • Konfiguration - InceptionImageFilter
      • Konfiguration - Index-Servlets
      • Konfiguration - InSpire AI Chat und Insight Services für Retrieval Augmented Generation
      • Konfiguration - Item Property Generator
      • Konfiguration - Kerberos Authentfizierung
      • Konfiguration - Management Center Menü
      • Konfiguration - Metadata Reference Builder Plugin
      • Konfiguration - Metadaten Anreicherung
      • Konfiguration - Mindbreeze InSpire
      • Konfiguration - Mindbreeze Proxy Umgebung (Remote Connector)
      • Konfiguration - Outlook Add-In
      • Konfiguration - Personalisierte Relevanz
      • Konfiguration - Plugin Installation
      • Konfiguration - Principal Validation Plugin
      • Konfiguration - Profile
      • Konfiguration - Reporting Query Log
      • Konfiguration - Reporting Query Performance Tests
      • Konfiguration - Request Header Session Authentisierung
      • Konfiguration - Verteilte Konfiguration (Windows)
      • Konfiguration - Vokabulare für Synonyme und Autovervollständigung
      • Konfiguration von Vorschaubildern
      • Mindbreeze Personalization
      • Mindbreeze Property Expression Language
      • Mindbreeze Query Expression Transformation
      • SAML Authentifizierung
      • Spracherkennung mit dem LanguageDetector Plugin
      • Trusted Peer Authentication für Mindbreeze InSpire
      • Verwendung von InSpire-Snapshots in einer CI_CD-Umgebung
    • Betrieb
      • Anpassung der InSpire Host OpenSSH Einstellungen - LoginGraceTime auf 0 setzen (Mitigation für CVE-2024-6387)
      • app.telemetry Statistiken zu Suchanfragen
      • Bereitstellen von app.telemetry Informationen mittels SNMPv3 auf G7 Appliances
      • CIS Level 2 Hardening - SELinux in den Modus Enforcing versetzen
      • Handbuch - Administration von Insight Services für Retrieval Augmented Generation
      • Handbuch - Filemanager
      • Handbuch - Indizierungs- und Suchlogs
      • Handbuch - Kommandozeilenwerkzeuge
      • Handbuch - Sichern & Wiederherstellen
      • Handbuch - Updates und Downgrades
      • Handbuch - Verteilter Betrieb (G7)
      • Index Betriebskonzepte
      • Inspire Diagnose und Ressourcen Monitoring
      • Konfiguration - app.telemetry Dashboards für Nutzungsanalyse
      • Konfiguration - Nutzungsanalyse
      • Löschung der Festplatten
      • Wiederherstellen des Lieferzustandes
    • Anwenderhandbuch
      • Browser Extension
      • Cheat Sheet
      • iOS App
      • Tastaturbedienung
    • SDK
      • api.chat.v1beta.generate Schnittstellenbeschreibung
      • api.v2.alertstrigger Schnittstellenbeschreibung
      • api.v2.export Schnittstellenbeschreibung
      • api.v2.personalization Schnittstellenbeschreibung
      • api.v2.search Schnittstellenbeschreibung
      • api.v2.suggest Schnittstellenbeschreibung
      • api.v3.admin.SnapshotService Schnittstellenbeschreibung
      • Debugging (Eclipse)
      • Einbetten des Insight App Designers
      • Entwicklung eines API V2 Search Request Response Transformer
      • Entwicklung eines Query Expression Transformer
      • Entwicklung von Insight Apps
      • Entwicklung von Item Transformation und Post Filter Plugins mit der Mindbreeze SDK
      • Java API Schnittstellenbeschreibung
      • OpenAPI Schnittstellenbeschreibung
      • SDK Übersicht
    • Release Notes
      • Release Notes 20.1 Release - Mindbreeze InSpire
      • Release Notes 20.2 Release - Mindbreeze InSpire
      • Release Notes 20.3 Release - Mindbreeze InSpire
      • Release Notes 20.4 Release - Mindbreeze InSpire
      • Release Notes 20.5 Release - Mindbreeze InSpire
      • Release Notes 21.1 Release - Mindbreeze InSpire
      • Release Notes 21.2 Release - Mindbreeze InSpire
      • Release Notes 21.3 Release - Mindbreeze InSpire
      • Release Notes 22.1 Release - Mindbreeze InSpire
      • Release Notes 22.2 Release - Mindbreeze InSpire
      • Release Notes 22.3 Release - Mindbreeze InSpire
      • Release Notes 23.1 Release - Mindbreeze InSpire
      • Release Notes 23.2 Release - Mindbreeze InSpire
      • Release Notes 23.3 Release - Mindbreeze InSpire
      • Release Notes 23.4 Release - Mindbreeze InSpire
      • Release Notes 23.5 Release - Mindbreeze InSpire
      • Release Notes 23.6 Release - Mindbreeze InSpire
      • Release Notes 23.7 Release - Mindbreeze InSpire
      • Release Notes 24.1 Release - Mindbreeze InSpire
      • Release Notes 24.2 Release - Mindbreeze InSpire
      • Release Notes 24.3 Release - Mindbreeze InSpire
      • Release Notes 24.4 Release - Mindbreeze InSpire
      • Release Notes 24.5 Release - Mindbreeze InSpire
      • Release Notes 24.6 Release - Mindbreeze InSpire
      • Release Notes 24.7 Release - Mindbreeze InSpire
      • Release Notes 24.8 Release - Mindbreeze InSpire
      • Release Notes 25.1 Release - Mindbreeze InSpire
      • Release Notes 25.2 Release - Mindbreeze InSpire
    • Sicherheit
      • Bekannte Schwachstellen
    • Produktinformation
      • Produktinformation - Mindbreeze InSpire - Standby
      • Produktinformation - Mindbreeze InSpire
    Home

    Path

    Sure, you can handle it. But should you?
    Let our experts manage the tech maintenance while you focus on your business.
    See Consulting Packages

    Spracherkennung
    LanguageDetector Plugin

    EinleitungPermanenter Link zu dieser Überschrift

    Mindbreeze bietet eine Spracherkennung für Dokumente. Dazu wird beim Indizieren das LanguageDetector ItemTransformer Plugin verwendet.

    LanguageDetector PluginPermanenter Link zu dieser Überschrift

    Um die Spracherkennung zu nutzen, muss das LanguageDetector zu Ihrer Mindbreeze-Installation hinzugefügt werden, indem das entsprechende Plugin geladen wird (die Item Transformation Services werden mit dem Paket “ Mindbreeze Item Transformation Plugins” ausgeliefert).

    Das Plugin muss auch in Ihrer Mindbreeze Lizenz inkludiert sein.

    KonfigurationPermanenter Link zu dieser Überschrift

    • Aktivieren Sie das Plugin für jeden gewünschten Index mithilfe der Manager UI:
      • Wechseln Sie zum Reiter „Indices“ und aktivieren Sie „Advanced Settings“
      • Scrollen Sie runter zum Abschnitt „Item Transformation Services”
      • Wählen Sie das “TextPlugin.LanguageDetector” Plugin und klicken Sie auf „Add“

    • Language Probability Threshold: Legt fest, ab welcher Wahrscheinlichkeit eine Sprache als erkannt gilt.
    • Source Property Pattern: Legt das Metadatum fest welches zur Spracherkennung herangezogen wird.
    • Language Target Property: Legt das Metadatum fest in dem das Ergebnis der Spracherkennung festgehalten wird. Um nach diesem Metadatum filtern zu können, muss dieses aggregierbar sein. Aktivieren Sie dazu die Advanced Settings und fügen Sie das Metadatum in der Option Aggregated Metadata Keys in der Indexkonfiguration hinzu.
    • Language Property: Legt das Metadatum fest in dem die Sprache bereits angegeben ist. Dadurch wird keine Spracherkennung durchgeführt und das Metadatum Language Target Property wird direkt gesetzt.
    • Language Property Pattern: Legt alle gültigen Sprachen vom Language Property Metadatum fest. Falls Language Property einen ungültigen Wert hat wird die Spracherkennung durchgeführt und das Metadatum Language Target Property gesetzt.
    • Included Languages: Legt die Sprachen für Spracherkennung fest (verwenden Sie die Sprachkürzel, siehe Tabelle unten im Appendix Abschnitt, mit Beistrichen getrennt, z.B. en,de). Falls keine Sprachen angegeben werden, versucht das Plugin alle unterstützten Sprachen zu erkennen. Es wird empfohlen, die benötigten Sprachen anzugeben, da dies die Qualität der Spracherkennung deutlich verbessert.
    • Force Included Languages: Wenn aktiviert, werden die Warscheinlichkeiten nur auf Basis der „Included Languages“ berechnet. (und nicht auf Basis aller unterstützten Sprachen) Wenn nur wenige Sprachen in „Included Languages“ konfiguriert sind, wird empfohlen diese Option zu deaktivieren.
    • Short Text Algorithm Text Length: Bei kurzen Texten kann die Qualität der Spracherkennung verbessert werden, wenn der „Short Text Algorithm“ verwendet wird. Diese Einstellung bestimmt die maximale Länge des Textes (in Buchstaben) für den der „Short Text Algorithm“ verwendet wird. Längere Texte werden mit dem „normalen“ Algorithmus analysiert.
    • Max Text Length (Characters): Bestimmt die maximale Länge des Textes (in Anzahl von Buchstaben), der für die Analyse verwendet wird. Aus Performanzgründen werden bei längeren Texten nur die ersten Buchstaben zur Analyse verwendet, der Rest wird übersprungen. Zur Länge des Textes zählen aufsummiert der Inhalt aller Metadaten, die mit dem Source Property Pattern gefunden werden. Standardwert: 100000
    • No Language found set Property Key und No Language found Property Value: Wenn die Spracherkennung keine Sprache ermitteln konnte, kann ein Metadatum mit einem Namen (Key) und einen Wert (Value) gesetzt werden. Dies kann nützlich sein, um Dokumente ohne erkannter Sprache explizit zu markieren.

    Betrieb als eigenständiger ServicePermanenter Link zu dieser Überschrift

    Das LanguageDetector Plugin kann nicht nur als Item Transformation Service genutzt werden, sondern auch als eigenständiger Service. Dies kann bei großen Installationen mit mehreren Indizes Performancevorteile bringen, da nur ein einzelner LanguageDetector Service für alle Indizes betrieben wird und nicht je Index eine Instanz.

    Um das LanguageDetector Plugin als eigenständigen Service zu betreiben, installieren Sie das Plugin MetadataTransformationService-<version>.zip. Fügen Sie im „Indices“-Tab in der Sektion „Services“ einen neuen Service hinzu und wählen Sie „ItemTransformationServicePlugin.LanguageDetector“ aus. In den Einstellungen des neuen Service setzen Sie einen sprechenden „Display Name“, sowie den „Bind port“ auf einen freien TCP-Port. Die restlichen Einstellungen sind laut dem Abschnitt „Konfiguration“ zu setzen. Zuletzt wechseln Sie im „Indices“-Tab in die Sektion „Indices“ und fügen Sie bei dem betreffenden Index einen Item Transformation Service hinzu und referenzieren Sie den angelegten Service.

    AppendixPermanenter Link zu dieser Überschrift

    SprachprofilePermanenter Link zu dieser Überschrift

    Hier finden Sie eine Liste an Sprachprofile, die vom LanguageDetector unterstützt werden. Die angeführten Sprachen können in der Konfiguration des LanguageDetectors (Option „Included Languages“) verwendet werden. Die Option „Short Text Algorithm Text Length“ definiert dabei, für welche Textlängen das Lang- oder Kurztextprofil der jeweiligen Sprachen ausgewählt wird.

    Kürzel
    („Included
    Languages“)

    Sprache

    Langtextprofil
    vorhanden

    Kurztextprofil
    vorhanden

    af

    Afrikaans

    X

    an

    Aragonisch

    X

    ar

    Arabisch

    X

    ast

    Asturisch

    X

    be

    Weißrussisch

    X

    br

    Bretonisch

    X

    ca

    Katalanisch

    X

    bg

    Bulgarisch

    X

    bn

    Bengalisch

    X

    cs

    Tschechisch

    X

    X

    cy

    Walisisch

    X

    da

    Dänisch

    X

    X

    de

    Deutsch

    X

    X

    el

    Griechisch

    X

    en

    Englisch

    X

    X

    es

    Spanisch

    X

    X

    et

    Estnisch

    X

    eu

    Baskisch

    X

    fa

    Persisch

    X

    fi

    Finnisch

    X

    X

    fr

    Französisch

    X

    X

    ga

    Irisch

    X

    gl

    Galicisch

    X

    gu

    Gujarati

    X

    he

    Hebräisch

    X

    hi

    Hindi

    X

    hr

    Kroatisch

    X

    ht

    Haitianisch

    X

    hu

    Ungarisch

    X

    id

    Indonesisch

    X

    X

    is

    Isländisch

    X

    it

    Italienisch

    X

    X

    ja

    Japanisch

    X

    km

    Khmer

    X

    kn

    Kannada

    X

    ko

    Koreanisch

    X

    lt

    Litauisch

    X

    lv

    Lettisch

    X

    mk

    Mazedonisch

    X

    ml

    Malayalam

    X

    mr

    Marathi

    X

    ms

    Malaysisch

    X

    mt

    Maltesisch

    X

    ne

    Nepali

    X

    nl

    Niederländisch

    X

    X

    no

    Norwegisch

    X

    X

    oc

    Okzitanisch

    X

    pa

    Punjabi

    X

    pl

    Polnisch

    X

    X

    pt

    Portugiesisch

    X

    X

    ro

    Rumänisch

    X

    X

    ru

    Russisch

    X

    sk

    Slowakisch

    X

    sl

    Slowenisch

    X

    so

    Somalisch

    X

    sq

    Albanisch

    X

    sr

    Serbisch

    X

    sv

    Schwedisch

    X

    X

    sw

    Suaheli

    X

    ta

    Tamilisch

    X

    te

    Telugu

    X

    th

    Thailändisch

    X

    tl

    Tagalog

    X

    tr

    Türkisch

    X

    X

    uk

    Ukrainisch

    X

    ur

    Urdu

    X

    vi

    Vietnamesisch

    X

    X

    yi

    Jiddisch

    X

    zh-cn

    Vereinfachtes Chinesisch

    X

    zh-tw

    Traditionelles Chinesisch

    X

    PDF herunterladen

    • Spracherkennung mit dem LanguageDetector Plugin

    Inhalt

    • Einleitung
    • LanguageDetector Plugin
    • Appendix

    PDF herunterladen

    • Spracherkennung mit dem LanguageDetector Plugin