Home
Home
Englische Version
Support
Impressum
25.2 Release ►

Start Chat with Collection

    Main Navigation

    • Vorbereitung
      • Einrichten InSpire G7 Primärsystem und Standby Appliances
      • Erstellen einer InSpire-VM auf Hyper-V
      • Initiale Inbetriebnahme für G7 Appliances
      • Konnektoren
    • Datenquellen
      • Anleitung zur Datenintegration mithilfe eines SQL Datenbank-Beispiels
      • Handbuch - Mindbreeze InSpire Insight Apps in Salesforce
      • Indizierung benutzerspezifischer Eigenschaften (SharePoint 2013 Connector)
      • Indizierung benutzerspezifischer Objekttypen (Documentum)
      • Installation & Konfiguration - Atlassian Confluence Sitemap Generator Add-On
      • Installation & Konfiguration - Caching Principal Resolution Service
      • Installation & Konfiguration - Mindbreeze InSpire Insight Apps in Microsoft SharePoint On-Prem
      • Konfiguration - Atlassian Confluence Connector
      • Konfiguration - Best Bets Connector
      • Konfiguration - Box Connector
      • Konfiguration - COYO Connector
      • Konfiguration - Data Integration Connector
      • Konfiguration - Documentum Connector
      • Konfiguration - Dropbox Connector
      • Konfiguration - Egnyte Connector
      • Konfiguration - GitHub Connector
      • Konfiguration - Google Drive Connector
      • Konfiguration - GSA Adapter Service
      • Konfiguration - HL7 Connector
      • Konfiguration - IBM Connections Connector
      • Konfiguration - IBM Lotus Connector
      • Konfiguration - Jira Connector
      • Konfiguration - JVM Launcher Service
      • Konfiguration - LDAP Connector
      • Konfiguration - Microsoft Azure Principal Resolution Service
      • Konfiguration - Microsoft Dynamics CRM Connector
      • Konfiguration - Microsoft Exchange Connector
      • Konfiguration - Microsoft File Connector (Legacy)
      • Konfiguration - Microsoft File Connector
      • Konfiguration - Microsoft Graph Connector
      • Konfiguration - Microsoft Loop Connector
      • Konfiguration - Microsoft Project Connector
      • Konfiguration - Microsoft SharePoint Connector
      • Konfiguration - Microsoft SharePoint Online Connector
      • Konfiguration - Microsoft Stream Connector
      • Konfiguration - Microsoft Teams Connector
      • Konfiguration - Salesforce Connector
      • Konfiguration - SCIM Principal Resolution Service
      • Konfiguration - SemanticWeb Connector
      • Konfiguration - ServiceNow Connector
      • Konfiguration - Web Connector
      • Konfiguration - Yammer Connector
      • Mindbreeze InSpire Insight Apps in Microsoft SharePoint Online
      • Mindbreeze Web Parts in Microsoft SharePoint
      • Whitepaper - Web Connector Erweiterte JavaScript Anwendungsfälle
    • Konfiguration
      • CAS Authentifizierung
      • Cookie Authentifizierung
      • Handbuch - AI Chat
      • Handbuch - Erstellung einer AWS 10M InSpire Applikation
      • Handbuch - Erstellung einer AWS 1M InSpire Applikation
      • Handbuch - Erstellung einer AWS 2M InSpire Applikation
      • Handbuch - Erstellung einer Google Compute Cloud Virtual Machine InSpire Applikation
      • Handbuch - Erstellung einer Oracle Cloud 10M InSpire Applikation
      • Handbuch - Erstellung einer Oracle Cloud 1M InSpire Applikation
      • Handbuch - MMC_ Services
      • Handbuch - Natural Language Question Answering (NLQA)
      • Handbuch - SSO mit Microsoft AAD oder AD FS
      • Handbuch - Text Classification Insight Services
      • I18n Item Transformation
      • JWT Authentifizierung
      • Konfiguration - Alternative Suchvorschläge und automatische Sucherweiterung
      • Konfiguration - Backend Credentials
      • Konfiguration - Benachrichtigungen
      • Konfiguration - CJK Tokenizer Plugin
      • Konfiguration - CSV Metadata Mapping Item Transformation Service
      • Konfiguration - Entity Recognition
      • Konfiguration - Export Funktionalität
      • Konfiguration - External Query Service
      • Konfiguration - Filter Plugins
      • Konfiguration - Gesammelte Ergebnisse
      • Konfiguration - GSA Late Binding Authorization
      • Konfiguration - Identity Conversion Service - Replacement Conversion
      • Konfiguration - InceptionImageFilter
      • Konfiguration - Index-Servlets
      • Konfiguration - InSpire AI Chat und Insight Services für Retrieval Augmented Generation
      • Konfiguration - Item Property Generator
      • Konfiguration - Kerberos Authentfizierung
      • Konfiguration - Management Center Menü
      • Konfiguration - Metadata Reference Builder Plugin
      • Konfiguration - Metadaten Anreicherung
      • Konfiguration - Mindbreeze InSpire
      • Konfiguration - Mindbreeze Proxy Umgebung (Remote Connector)
      • Konfiguration - Outlook Add-In
      • Konfiguration - Personalisierte Relevanz
      • Konfiguration - Plugin Installation
      • Konfiguration - Principal Validation Plugin
      • Konfiguration - Profile
      • Konfiguration - Reporting Query Log
      • Konfiguration - Reporting Query Performance Tests
      • Konfiguration - Request Header Session Authentisierung
      • Konfiguration - Verteilte Konfiguration (Windows)
      • Konfiguration - Vokabulare für Synonyme und Autovervollständigung
      • Konfiguration von Vorschaubildern
      • Mindbreeze Personalization
      • Mindbreeze Property Expression Language
      • Mindbreeze Query Expression Transformation
      • SAML Authentifizierung
      • Spracherkennung mit dem LanguageDetector Plugin
      • Trusted Peer Authentication für Mindbreeze InSpire
      • Verwendung von InSpire-Snapshots in einer CI_CD-Umgebung
    • Betrieb
      • Anpassung der InSpire Host OpenSSH Einstellungen - LoginGraceTime auf 0 setzen (Mitigation für CVE-2024-6387)
      • app.telemetry Statistiken zu Suchanfragen
      • Bereitstellen von app.telemetry Informationen mittels SNMPv3 auf G7 Appliances
      • CIS Level 2 Hardening - SELinux in den Modus Enforcing versetzen
      • Handbuch - Administration von Insight Services für Retrieval Augmented Generation
      • Handbuch - Filemanager
      • Handbuch - Indizierungs- und Suchlogs
      • Handbuch - Kommandozeilenwerkzeuge
      • Handbuch - Sichern & Wiederherstellen
      • Handbuch - Updates und Downgrades
      • Handbuch - Verteilter Betrieb (G7)
      • Index Betriebskonzepte
      • Inspire Diagnose und Ressourcen Monitoring
      • Konfiguration - app.telemetry Dashboards für Nutzungsanalyse
      • Konfiguration - Nutzungsanalyse
      • Löschung der Festplatten
      • Wiederherstellen des Lieferzustandes
    • Anwenderhandbuch
      • Browser Extension
      • Cheat Sheet
      • iOS App
      • Tastaturbedienung
    • SDK
      • api.chat.v1beta.generate Schnittstellenbeschreibung
      • api.v2.alertstrigger Schnittstellenbeschreibung
      • api.v2.export Schnittstellenbeschreibung
      • api.v2.personalization Schnittstellenbeschreibung
      • api.v2.search Schnittstellenbeschreibung
      • api.v2.suggest Schnittstellenbeschreibung
      • api.v3.admin.SnapshotService Schnittstellenbeschreibung
      • Debugging (Eclipse)
      • Einbetten des Insight App Designers
      • Entwicklung eines API V2 Search Request Response Transformer
      • Entwicklung eines Query Expression Transformer
      • Entwicklung von Insight Apps
      • Entwicklung von Item Transformation und Post Filter Plugins mit der Mindbreeze SDK
      • Java API Schnittstellenbeschreibung
      • OpenAPI Schnittstellenbeschreibung
      • SDK Übersicht
    • Release Notes
      • Release Notes 20.1 Release - Mindbreeze InSpire
      • Release Notes 20.2 Release - Mindbreeze InSpire
      • Release Notes 20.3 Release - Mindbreeze InSpire
      • Release Notes 20.4 Release - Mindbreeze InSpire
      • Release Notes 20.5 Release - Mindbreeze InSpire
      • Release Notes 21.1 Release - Mindbreeze InSpire
      • Release Notes 21.2 Release - Mindbreeze InSpire
      • Release Notes 21.3 Release - Mindbreeze InSpire
      • Release Notes 22.1 Release - Mindbreeze InSpire
      • Release Notes 22.2 Release - Mindbreeze InSpire
      • Release Notes 22.3 Release - Mindbreeze InSpire
      • Release Notes 23.1 Release - Mindbreeze InSpire
      • Release Notes 23.2 Release - Mindbreeze InSpire
      • Release Notes 23.3 Release - Mindbreeze InSpire
      • Release Notes 23.4 Release - Mindbreeze InSpire
      • Release Notes 23.5 Release - Mindbreeze InSpire
      • Release Notes 23.6 Release - Mindbreeze InSpire
      • Release Notes 23.7 Release - Mindbreeze InSpire
      • Release Notes 24.1 Release - Mindbreeze InSpire
      • Release Notes 24.2 Release - Mindbreeze InSpire
      • Release Notes 24.3 Release - Mindbreeze InSpire
      • Release Notes 24.4 Release - Mindbreeze InSpire
      • Release Notes 24.5 Release - Mindbreeze InSpire
      • Release Notes 24.6 Release - Mindbreeze InSpire
      • Release Notes 24.7 Release - Mindbreeze InSpire
      • Release Notes 24.8 Release - Mindbreeze InSpire
      • Release Notes 25.1 Release - Mindbreeze InSpire
      • Release Notes 25.2 Release - Mindbreeze InSpire
    • Sicherheit
      • Bekannte Schwachstellen
    • Produktinformation
      • Produktinformation - Mindbreeze InSpire - Standby
      • Produktinformation - Mindbreeze InSpire
    Home

    Path

    Sure, you can handle it. But should you?
    Let our experts manage the tech maintenance while you focus on your business.
    See Consulting Packages

    Entity Recognition
    Konfiguration

    EinführungPermanenter Link zu dieser Überschrift

    Dieses Dokument beschäftigt sich mit dem Konzept, dem Setup und den Troubleshooting Methoden für die Konfiguration von Entity Recogntition.

    Konfiguration Entity RecognitionPermanenter Link zu dieser Überschrift

    In diesem Kapitel wird das Konzept von Entity Recognition anhand eines einfachen Beispiels erklärt.

    Führen Sie zum Einrichten folgende Schritte durch:

    • Verbinden Sie sich zum Management Center
    • Navigieren Sie zu jenem Index, den Sie mit Entity Recognition konfigurieren möchten.
    • Aktivieren Sie die Advanced Settings und öffnen Sie diesen
    • Suchen Sie nach der Einstellung "Entity Recognition Parameter" im Management Center
    • Definieren Sie ihre Entity Recognition Regeln im Feld pattern-rules, die Ihrem Metadatum matchen sollen.
    • Folgende Regelformate werden unterstützt: https://github.com/google/re2/wiki/Syntax
    • In unserem konkreten Beispiel:

      rule=/\// digits /\//. 
      digits=/\d+/.


      Erklärung

      Die erste Regel definiert, dass alle Zahlen zwischen zwei slashes matchen sollen (Regex).: 
      Beispiel: test/1234test1234/test/543/test (543 wird extrahiert)
    • Fügen Sie nun eine neue Metadata-Definition hinzu um die Regeln für Metadaten anzuwenden
    • In diesem Beispiel sucht Mindbreeze im String des existierenden Metadatums In the "fullstring nach Zahlen zwischen 2 Slashes.  Sind Zahlen zwischen 2 Slashes vorhanden,   dann nimmt Mindbreeze den Teil der Matches heraus der in der Subregel „digits" konfiguriert ist und schreibt diesen als String in das neue Metadataum „myextractedVal“.

      Beispiel: 
      fullstring: xyz/1234/herbert543/345test
      Match der Regel  “rule”: /1234/
      Wert der Regel “digits”: 1234
      Wert des Metadataums myextractedVal==1234

    Entity Recognition ParameterPermanenter Link zu dieser Überschrift

    Die Konfiguration der Parameter für die Entity Recogniton ermöglicht es dem Index Service, Metadaten aus den Dokumentinhalten zu extrahieren. Die folgenden Einstellungen sind verfügbar:

    Einstellung

    Beschreibung

    Pattern Rules

    Definiert eine Reihe von Regeln, die bei der Extraktion von Metadaten angewendet werden. Die Regeln werden mit einem Regex-Muster definiert. Bitte beachten Sie, dass die regulären Ausdrücke ebenfalls mit einem "/" umschlossen sein müssen.

    Pattern Add Region Annotations

    Fügt den Wert der Einstellung "Link HREF-Muster verwenden" zur Annotation hinzu.

    Process HTML Attributes

    Ermöglicht der Entity Recognition auch innerhalb von Link-Referenzen zu suchen.

    Wie <a href=link zu suchen.> Link </a> im HTML-Quelltext.

    HTML Attribute Name Pattern

    Legt fest, welche Attributnamen durchsuchbar sein sollen. Es wird mit einem Regex-Muster definiert.

    In den meisten Fällen ist ein "href" ausreichend. Es kann auch einfach mit einem '|' ("OR") wie folgt erweitert werden: "href|link|..." .

    Im Abschnitt "Add Metadata Definition" können für jedes Metadatum Regeln definiert werden. Die folgenden Einstellungen sind verfügbar:

    Einstellung

    Beschreibung

    If Rule Matches

    Eine Regel, die den Bereich im Inhalt definiert, aus dem Metadaten extrahiert werden sollen. Sie sollte den Namen der Regel tragen, die in der Einstellung "Pattern Rules" definiert ist.

    Name

    Der Name der Metadaten, die einem Dokument hinzugefügt werden, wenn die definierte Regel zutrifft.

    Value

    Eine Regel, die den Wert von Metadaten definiert. Der Wert der Regel {{month}} kann normaler Text oder zusammengesetzt sein.

    Scope

    Eine Regel, die einen Bereich oder mehrere Bereiche mit einer Entity Recognition Regel definiert, in denen die Regeln für die Extraktion angewendet werden sollen. Dazu ist der Name der Regel zur Auswahl des/der Bereiche(s) anzugeben. Im Gegensatz zur Wertextraktion müssen Sie den Namen ohne "{{}}" eingeben.

    Format

    Ermöglicht die Extraktion von typisierten Metadaten wie Datum aus String. Die bekannten Typen sind "String", "Date", "Number". Nur "Date" benötigt zusätzliche Parameter "Format Options" und "Locale".

    Format Options

    Obligatorisch für Format "Datum".

    Option zur Einstellung der Formatierung der Ausgabe. Die genaue Definition finden Sie hier: https://github.com/unicode-org/icu/blob/main/docs/userguide/format_parse/datetime/index.md#datetime-format-syntax.

    Definieren Sie die Reihenfolge und was ausgegeben werden soll, z.B.: "jjjjj.MMMM.tt HH:mm" zum Drucken 2024.Juli.05 11:33.

    Locale

    Wird nur für das Format "Datum" verwendet.

    Legen Sie das Gebietsschema "Locale" fest, wenn sich das Gebietsschema des Computers und des Benutzers unterscheiden. Wie ja_JP zur Anzeige im japanischen Standard-Datumsformat. Prüfen Sie https://github.com/unicode-org/icu/blob/main/docs/userguide/format_parse/datetime/index.md#datetimepatterngenerator.

    In Existing Metadata

    Legt fest, für welche Metadaten diese Regeln gelten sollen. Zum Beispiel: content, title, datasource/mes:key, <ownmetadatum>, etc.

    Aggregateable

    Wenn diese Option aktiviert ist, ist das erzeugte Metadatum statisch aggregierbar.

    Use Value for Sentence Embeddings

    Wenn diese Einstellung aktiviert ist, können die erkannten Entitäten mit einer Sentence Similarity Search (NLQA) gefunden werden.

    Annotate As

    Legt fest, wie die Entität zu den Metadaten hinzugefügt wird. Die folgenden Optionen sind verfügbar:

    • Entity - Die erkannte Entität wird als Annotation hinzugefügt. Erkannte Entitäten werden in der Dokumentenvorschau hervorgehoben.
    • Link - Die Entität wird als Link-Anmerkung hinzugefügt. In der Vorschau werden Links durch eine blaue Unterstreichung hervorgehoben.
    • Entity And Link - Kombiniert die beiden Optionen "Entität" und "Link".
    • Disabled - Entität und Link werden nicht hinzugefügt.

    Add Link With URL Pattern

    Definiert ein Muster für den Annotation-Link, wenn die Einstellung "Annotate As" auf "Link" oder "Entity And Link" gesetzt ist. Es kann die Regex-Definitionen aus der Einstellung "Pattern Rules" verwenden, die auf die gleiche Weise wie die Einstellung "Value" konfiguriert werden kann.

    Verwendet für etwas wie: www.mindbreeze.com/link_to_item?item={{RuleName}}

    Entity Label

    Name der erstellten Entität, wenn die Einstellung "Annotate As" auf "Entity" oder "Entity And Link" gesetzt ist.

    Entity Recognition (Beispiel Filesystem)Permanenter Link zu dieser Überschrift

    Dieses Kapitel beschäftigt sich mit der Einrichtung und Erklärung von Entity Recognition mit Mindbreeze unter Anlehnung an ein einfaches Beispiel.

    Konfiguration von Entity Recognition für ein Filesystem:Permanenter Link zu dieser Überschrift

    Zuerst müssen die Regeln für die Extraktion angelegt werden:

    host=/[^\\]+/.

    share=/[^\\]+/.

    directory=/[^\\]+/.

    UNCPath="\\\\" host "\\" share "\\" directory "\\".

    If Rule Matches: UNCPath

    Name: Laufwerk

    Value: {{share}}

    In Existing Metadata: datasource/mes:key

    If Rule Matches: UNCPath

    Name: Projektpfad

    Value: {{directory}}

    In Existing Metadata: datasource/mes:key

    Aggregated Metadata Keys (; separated)

    Laufwerk;Projektpfad

    Date-Formate für Entity Recognition basieren auf den ICU-Patterns (z.B. Locale … de_AT)

    Konfiguration für Entity Recognition für Filesystem Pfade (Variante 2) – mit Ausnahmen:Permanenter Link zu dieser Überschrift

    Sind die Regeln mehrdeutig, kann über alternative Regeln und einer Reihung durch Benennung sowie die korrekte Reihung der mehrfachen Metadaten-Extraktion auch solch ein komplexer Fall erreicht werden. Der Pfad (path) als Metadatum ist lower-case und somit besser für CSV-Mapping.

    Ein ODER (|) von Sub-Regeln funktioniert nicht!

    > einfache Lösung ohne Ausnahme:

    Pattern Rules:

    LWPath=/\\\\[^\\]+\\[^\\]+\\[^\\]+\\[^\\]+/.

    FilePath=/[^\\]+/.

    FullPath=LWPath "\\" FilePath.

    > Lösung mit einer Ausnahme (data\it):

    Pattern Rules:

    ASpecialPath="data\\it".

    OtherPath=/[^\\]+/.

    BaseShare=/\\\\[^\\]+\\[^\\]+\\[^\\]+/.

    LWPathA= BaseShare "\\" ASpecialPath.

    LWPathOther= BaseShare "\\" OtherPath.

    FilePathA=/[^\\].*/.

    FilePathOther=/[^\\].*/.

    FullPathA=LWPathA "\\" FilePathA.

    FullPathOther=LWPathOther "\\" FilePathOther.

    Im nachstehenden Screenshot wird die Konfiguration der Regeln visualisiert.

    EntityRecognition-Laufwerkspfade-3_CSV

    CSV-Transform: der extrahierte Wert (fileshare) muss case-sensitive matchen, somit sollte der path als Quell-Metadatum verwendet werden.

    fileshare;letter

    \\fileserver.myorganization.com\qa\fstest\projekte;U:

    \\fileserver.myorganization.com\qa\fstest\vorlagen;T:

    \\fileserver.myorganization.com\qa\fstest\allgemein;G:

    \\fileserver.myorganization.com\qa\fstest\spezial;M:

    \\fileserver.myorganization.com\qa\fstest\data\it;H:

    \\fileserver.myorganization.com\qa\fstest\data;H:

    \\fileserver.myorganization.com\qa\fstest\data-services;H:

    \\fileserver.myorganization.com\qa\fstest\allgemein-retail;G:

    Der Match auf mes:key ist in CSV-Transformation (sowie in ER-rules) nur möglich mit: In Property = datasource/mes:key.

    Achtung: /documents-Servlet liefert keine Werte die nur über Index Re-Invert entstehen!

    Troubleshooting Entity RecognitionPermanenter Link zu dieser Überschrift

    Dieses Kapitel beschäftigt sich mit dem Troubleshooting der Entity Recognition Regeln.

    Wichtige HinweisePermanenter Link zu dieser Überschrift

    1. In Mindbreeze InSpire werden die regulären Ausdrücke zusätzlich mit einem „/“ umschlossen.
    2. Dabei muss jeder Regeleintrag durch einen Punkt getrennt sein.
    3. Regelnamen dürfen keine „_“ beinhalten
    4. Regeln sind greedy (gierig – matchen so viel wie möglich Achtung bei „.*“ bzw. „.+“ Konfigurationen)
    5. Regeln werden alphabetisch abgearbeitet (Groß-/Kleinschreibung beachten!)
      Zuerst kommen Großbuchstaben von A bis Z, danach Kleinbuchstaben a bis z.
    6. Trifft eine Regel einen Bereich, so kann keine zweite Regel treffen Annahme: Befindet sich sowohl in Gremium als auch in Schlagwort das Wort „Vorstand“, so wird nur das  Metadatum mit der Regel „Gremium“, das Wort „Vorstand“ beinhalten
    7. Entity Recognition Rules können nur pro Index, also über alle darin befindlichen Datenquellen angelegt werden.

    IndexPermanenter Link zu dieser Überschrift

    Index-Status prüfen über http://localhost:8443/index/<Indexport>/statistics

    Privileged Servlets:Permanenter Link zu dieser Überschrift

    • Verbinden Sie sich zum Management Center
    • Navigieren Sie zum Index
    • Aktivieren Sie die Advanced Settings
    • Öffnen Sie den Index für den Sie Entity Recognition testen möchten
    • Deaktivieren Sie die Checkbox "Disable Unrestricted Privileged Servlets"
    • Anschließend speichern Sie die Einstellungen und Starten Sie sie Services neu
    • Nachdem die Services neugestartet sind:
      • Öffnen Sie https://yourappliance:8443/index/Indexport (In unseren Beispiel 23101/processitems) https://yourappliance:8443/index/23101/processitems
      • Auf dieser Seite können Sie die Regeln (Pattern-Rules) mit einer bestimmten Abfrage (z.B.: ALL) testen
      • Klicken Sie dazu nach dem Ausfüllen auf process. Wenn Sie Syntax der Regeln richtig ist, haben Sie nach Betätigung des Knopfes mehr Optionen zum Testen zur Verfügung.
      • Wählen Sie die Regel aus, die Sie matchen möchten und konfigurieren Sie die Werte der Regel(n).
      • Klicken Sie anschließend auf process, um das Testen der Regel(n) anzustoßen:

    Deaktivierung von gierigen Verhalten der Entity Recognition RegelnPermanenter Link zu dieser Überschrift

    Entity Recognition Regeln sind normalerweise gierig Im folgenden Beispiel werden die markierten Zeilen gematcht:

    Regel

    R1=/ (?s)(test)(?P<line>.+)\s+(.*Page) /.

    Match:

    Wird gierig deaktiviert würde jedoch nicht mehr alles gematchet werden, sondern nur jene Blöcke die mit test beginnen und mit Page enden:

    Regel:

    (?U)(?s)(test)(?P<line>.+)\s+(.*Page)(?U)

    Match:

    Häufige FehlerursachenPermanenter Link zu dieser Überschrift

    Bei folgender Fehlermeldung ist ein Fehler beim Parsen der ER-Regeln aufgetreten:

    “MesQuery::Text::RE2Tokenizer ERROR: Matched empty (epsilon) token, pattern is”

    … z.B. wird ein „\“ am Ende einer Regex nicht unterstützt (LWPath=/\\\\[^\\]+\\/. … liefert Fehler besser: LWPath=/\\\\[^\\]+/ “\\“.).

    Eventuell kann es auch zu Problemen mit “.*“ in Regeln kommen.

    Entity Recognition Rules werden in alphabetischer Reihenfolge ausgewertet und der erste vollständige Match gewinnt.

    Regex-Rules nach deutschen Wörtern treffen mit \w nicht alle Zeichen (Umlaute, etc.). Stattdessen können Sie mit \pL alle Unicode-Buchstaben matchen.

    Keine Erkennung von Entitäten bei InhaltenPermanenter Link zu dieser Überschrift

    Wenn die Entity Recognition auf Inhalte angewendet werden soll, indem der Name auf „content“ oder „.*“ gesetzt wird, muss der Inhalt manuell als aggregierbar hinzugefügt werden. Dies kann mit einer der beiden Methoden geschehen:

    1. Hinzufügen von „@content“ zu den Aggregated Metadata Keys

    2. Oder fügen Sie ein Precomputed Synthesized metadata mit dem Name „@content“, Property Expression “""”, Transformation Pipeline Slot “Before Entity Recognition”, Merge Strategy “Replace Existing”, Aggregatable “Static Aggregatable” hinzu.

    Typische AnwendungsfällePermanenter Link zu dieser Überschrift

    Personal InformationPermanenter Link zu dieser Überschrift

    SVNRPermanenter Link zu dieser Überschrift

    RegEx

    \d{4}(\s|\.|\-)\d{6}

    Example

    1237 010180

    1237.010180

    1237-010180

    Telephone numberPermanenter Link zu dieser Überschrift

    RegEx

    (\+)([\s.\(\)]*\d{1}){8,13}(-)?(\d{1,5})

    Example

    +43 732 606162-0

    +43 732 606162-609

    +49(732)606162-609

    Number (With delimiters)Permanenter Link zu dieser Überschrift

    RegEx

    z1=/\d/.z2=/\d/. (…)Dlmtr=/[\s\-_.:]?/.

    z1 Dlmtr z2 Dlmtr z3 Dlmtr z4 Dlmtr z5 Dlmtr z6.

    Example

    12-34567

    12 34 56-7

    1-2 3456.7

    AmountPermanenter Link zu dieser Überschrift

    RegEx

    ((\d{1,3}(\.(\d){3})*)|\d*)(,\d{1,2})

    Example

    0,84

    100.000,49

    100.000,00

    1.000.000.000.000,00

    DatumPermanenter Link zu dieser Überschrift

    Handbuch zu den Datumsformaten: http://userguide.icu-project.org/formatparse/datetime

    • dd(.|-|/)MM(.|-|/)yyyy
      • RegEx
        ((0[1-9])|[1-9]|([1-3][0-9]))(\.|\/|-)((0[1-9])|[1-9]|10|11|12)(\.|\/|-)((19|20)\d{2})
      • Beispiel
        11.03.2014
        11.3.2014
        3.3.2014
        03.2.2010
        11/03/2014
        11/3/2014
        3/3/2014
        03/2/2010
        11-03-2014
        11-3-2014
        3-3-2014
        03-2-2010
    • dd. MMM yyyy
      • RegEx
        ((0[1-9])|[1-9]|([1-3][0-9]))\..(|Januar|Februar|März|April|Mai|Juni|Juli|August|September|Oktober|November|Dezember).((19|20)\d{2})
      • Example
        3. Jänner 2014
        4. Februar 2012
        30. November 2013
    • MMM yyyy
      • RegEx
        (Januar|Februar|März|April|Mai|Juni|Juli|August|September|Oktober|November|Dezember).((19|20)\d{2})
      • Example
        Februar 2014
        September 2014
    • MM(.|-|/)yyyy
      • RegEx
        (Januar|Februar|März|April|Mai|Juni|Juli|August|September|Oktober|November|Dezember).((19|20)\d{2})|((0[1-9])|[1-9]|10|11|12)(\.|\/|-)((19|20)\d{2})
      • Example
        03-2014
        03.2014
        03/2014
    • yyyy(.|-|/)mm(.|-|/)dd
      • RegEx
        ((19|20)\d{2})(\.|\/|-)((0[1-9])|[1-9]|10|11|12)(\.|\/|-)((([1-3][0-9]|0[1-9])|[1-9]))
      • Example
        2014-03-21
    • Datums-Regex Gesamt
      ((0[1-9])|[1-9]|([1-3][0-9]))(\.|\/|-)((0[1-9])|[1-9]|10|11|12)(\.|\/|-)((19|20)\d{2})|((0[1-9])|[1-9]|([1-3][0-9]))\..(Januar|Februar|März|April|Mai|Juni|Juli|August|September|Oktober|November|Dezember).((19|20)\d{2})|(Januar|Februar|März|April|Mai|Juni|Juli|August|September|Oktober|November|Dezember).((19|20)\d{2})|((0[1-9])|[1-9]|10|11|12)(\.|\/|-)((19|20)\d{2})|((19|20)\d{2})(\.|\/|-)((0[1-9])|[1-9]|10|11|12)(\.|\/|-)((([1-3][0-9]|0[1-9])|[1-9]))
    • Datums-Regex Gesamt II
      ((((0?[1-9]|[12]\d|3[01])[\.\-\/](0?[13578]|1[02])[\.\-\/]((1[6-9]|[2-9]\d)?\d{2}))|((0?[1-9]|[12]\d|30)[\.\-\/](0?[13456789]|1[012])[\.\-\/]((1[6-9]|[2-9]\d)?\d{2}))|((0?[1-9]|1\d|2[0-8])[\.\-\/]0?2[\.\-\/]((1[6-9]|[2-9]\d)?\d{2}))|(29[\.\-\/]0?2[\.\-\/]((1[6-9]|[2-9]\d)?(0[48]|[2468][048]|[13579][26])|((16|[2468][048]|[3579][26])00)|00)))|(((0[1-9]|[12]\d|3[01])(0[13578]|1[02])((1[6-9]|[2-9]\d)?\d{2}))|((0[1-9]|[12]\d|30)(0[13456789]|1[012])((1[6-9]|[2-9]\d)?\d{2}))|((0[1-9]|1\d|2[0-8])02((1[6-9]|[2-9]\d)?\d{2}))|(2902((1[6-9]|[2-9]\d)?(0[48]|[2468][048]|[13579][26])|((16|[2468][048]|[3579][26])00)|00))))
    • Example
      31.12.2005
      12.12.12
      1.2.2003
      1.3.98
      04-05-2004

    ZeitPermanenter Link zu dieser Überschrift

    RegEx

    (([0-1]?[0-9])|([2][0-3])):([0-5]?[0-9])(:([0-5]?[0-9]))?

    Example

    11:00:23

    12:30

    EmailPermanenter Link zu dieser Überschrift

    RegEx

    ([a-zA-Z0-9_\-\.]+)@([a-zA-Z0-9_\-\.]+)\.([a-zA-Z]{2,5})

    Example

    david.porter@inspire.mindbreeze.com

    egov@mindbreeze.com

    IBANPermanenter Link zu dieser Überschrift

    RegEx

    AT\d{18}

    Example

    AT002105017000123456

    Kommagetrennte Liste von InhaltenPermanenter Link zu dieser Überschrift

    In diesem Beispiel wird eine Liste von Inhalten getrennt mit einem Beistrich als Liste in Mindbreeze interpretiert.

    Input: Liste aus Wort, Wort,

    Wert=/[^\s,][^,]*[^,\s]?/.

    Regel=/\s*/value/\s*(,\s*|$)/.

    PDF herunterladen

    • Konfiguration - Entity Recognition

    Inhalt

    • Einführung
    • Konfiguration Entity Recognition
    • Entity Recognition (Beispiel Filesystem)
    • Troubleshooting Entity Recognition
    • Typische Anwendungsfälle

    PDF herunterladen

    • Konfiguration - Entity Recognition