Copyright ©
Mindbreeze GmbH, A-4020 Linz, 2024.
Alle Rechte vorbehalten. Alle verwendeten Hard- und Softwarenamen sind Handelsnamen und/oder Marken der jeweiligen Hersteller.
Diese Unterlagen sind streng vertraulich. Durch die Übermittlung und Präsentation dieser Unterlagen alleine werden keine Rechte an unserer Software, an unseren Dienstleistungen und Dienstleistungsresultaten oder sonstigen geschützten Rechten begründet. Die Weitergabe, Veröffentlichung oder Vervielfältigung ist nicht gestattet.
Aus Gründen der einfacheren Lesbarkeit wird auf die geschlechtsspezifische Differenzierung, z.B. Benutzer/-innen, verzichtet. Entsprechende Begriffe gelten im Sinne der Gleichbehandlung grundsätzlich für beide Geschlechter.
Die Produktinformation zu Mindbreeze InSpire definiert den Leistungsumfang der Mindbreeze InSpire Services. Des Weiteren wird eine Übersicht über die Applikationsschnittstelle sowie die unterstützten Plattformen gegeben.
Mindbreeze InSpire ist ein Softwareprodukt für die Suche nach Informationsobjekten im Unternehmenskontext. Unter Informationsobjekten sind generell Informationen aus strukturierten, teil- sowie unstrukturierten Speichersystemen zu verstehen. Typische Anwendungsfälle sind dabei Dateien im Dateisystem, elektronische Post (E-Mail) in einem Postfachsystem bzw. Dokumente in einem Dokumentenmanagementsystem oder Archiv (sofern an Mindbreeze InSpire via dem Mindbreeze InSpire SDK angebunden).
Die dem Servicepaket zugrunde liegende Nutzung des Softwareproduktes beruht auf einem Lizenzmodell, für das
die Anzahl der Dokumente die mit Hilfe des Softwareproduktes indiziert werden und
die Anzahl der Aufrufe der Insight Services des Softwareproduktes in einem Zeitraum von jeweils 12 Monaten (=12 Monatsperiode) maßgeblich ist. Das Startdatum für die 12 Monatsperiode der Aufrufe ist jeweils das Startdatum des Servicepaketes. Der Zählstand wird mit Beginn einer neuen 12 Monatsperiode jeweils einmalig (auf ‘0‘) zurückgesetzt, sodass erneut die gesamte Anzahl an Aufrufen für die nächste 12 Monatsperiode genutzt werden können. Wechselt der Kunde während einer 12 Monatsperiode zu einem Servicepaket mit höheren Leistungsparametern, so wird das dafür zu leistende aliquote Entgelt für die verbliebene Zahlperiode des ursprünglichen Servicepakets verrechnet. Dem Kunden steht die aliquote Anzahl an Aufrufen aus dem höheren Servicepaket für die restliche Laufzeit zur Verfügung. Während der Laufzeit des Servicepakets ist der Wechsel zu einem Servicepaket mit niedrigeren Leistungsparametern ausgeschlossen.
Ein Dokument ist eine Datei, die durch ein Programm verwaltet oder bearbeitet werden kann, eine Verbund-Datei und deren beinhaltete Dateien (eine Datei, die andere Datenformate enthält, wie beispielsweise Word-Dokument oder PDF-Dokument) oder ein elektronisches Dokument (Text-, Bild- und/oder Audioinformationen), das durch Digitalisierung in eine oder mehrere Dateien/Dokumente (im Index) erstellt und konvertiert wurde.
Ein Aufruf besteht aus einer Anfrage eines Benutzers oder Services und einer Antwort vom jeweils aufgerufenen Insight Service. Jede Anfrage/Antwort wird als ein Aufruf gezählt. Sind bei einer Anfrage mehrere Insight Services involviert, so werden diese internen Aufrufe ebenfalls als einzelne Aufrufe gezählt.
Welche Aufrufe gezählt werden, ist in dieser Produktinformation im Detail erläutert.
Das Softwareprodukt erfasst lückenlos die vom Kunden mit Hilfe des Softwareproduktes indizierte Anzahl von Dokumenten sowie die Anzahl der Insight Service Aufrufe und zeigt diese Anzahl in der für den Kunden sichtbaren Benutzeroberfläche fortlaufend an. Diese Erfassungstechnologie ist alleine maßgeblich für die Feststellung, welche Anzahl an Dokumenten mit Hilfe des Softwareproduktes indiziert worden sind. Ist die mit dem Kunden vereinbarte maximale Anzahl an Dokumenten erreicht, können und dürfen keine weiteren Dokumente mit Hilfe des Softwareproduktes indiziert werden. Ist die mit dem Kunden vereinbarte maximale Anzahl an Aufrufen von Insight Services erreicht, können und dürfen keine weiteren Aufrufe mit Hilfe des Softwareproduktes beantwortet werden.
Zum Lizenzmaterial gehört auch die Anwendungsdokumentation. Das Lizenzmaterial ist vor Vervielfältigung geschützt. Zum Lizenzmaterial gehören Neuauflagen oder Ergänzungen des Lizenzmaterials, das der Kunde während der vereinbarten Vertragsdauer von Mindbreeze erhält. Dasselbe gilt für fehlerbereinigte Versionen. Das Softwareprodukt ist durch einen elektronischen Lizenzschlüssel gesichert, der ebenfalls zum Lizenzmaterial gehört.
Mindbreeze InSpire besteht aus einer mehrstufigen serviceorientierten Architektur zur Indizierung und Suche nach Dokumentdateien und E-Mails auf Server - Computer in Organisationen.
Zur Anbindung von Systemen, deren Inhalte der Indizierung (zur Suche) zugeführt werden sollen - so genannten „Datenquellen“ - wird immer auf folgende Architekturbausteine zurückgegriffen: Index Service, Filter Service, Crawler Service, Query Service und Client Service. Die Darstellung zeigt auch die Skalierung dieser logischen Architekturbausteine in einer schematischen Darstellung.
Wie oben dargestellt ist das System für die Indizierung von typischen schematischen Datenquellen dargestellt. Die Komponenten entsprechen den wesentlichen Arbeitsschritten des Indizierungsprozesses und werden in den folgenden Abschnitten beschrieben.
Die Kommunikation der Komponenten passiert dabei via HTTP/S.
Der Crawler durchsucht das Quellsystem exhaustiv nach neuen bzw. geänderten Inhalten, die der Indizierung zugeführt werden müssen. Dabei können zwei Arten zur Anwendung kommen:
Das Mindbreeze InSpire – Filter Service dient dazu, aus den verschiedenen Dateitypen die textuelle Information zu entnehmen und zu filtern. Hierzu werden die Dokumentdateien vom Mindbreeze InSpire – Crawler Service an das Mindbreeze InSpire - Filter Service übergeben.
Hinweis: Aufgrund von proprietären Formaten und rasch ändernden Formatstandards kann das Filter Service nicht in allen Fällen garantieren, dass die Text/HTML – Ausgabe dem Ausgangsformat 100% entspricht.
In diesem Arbeitsschritt wird der eigentliche Index für die Volltextsuche erstellt bzw. auf den aktuellen Stand gebracht, wenn Änderungen im Quellsystem vorgenommen wurden. Der Index kann ähnlich der Funktionalität einer Datenbank betrachtet werden, die verwendet wird, um Suchanfragen zu beantworten.
Mindbreeze InSpire - Index Services verwalten Objekte/Dokumente mit bis zu maximal 200 Metadaten und 10MB Größe pro Metadatum. Unterstützt werden maximal 200 Annotationen pro Inhalt. Die unterstütze maximale Inhaltsgröße ist 50MB. Die theoretisch maximale Dokumentgröße ist 1GB inklusive Metadaten. Pro Dokument werden maximal 100000 eindeutige Wörter verarbeitet. Pro Index ist der durchschnittliche Verbrauch (Plaintext-Inhalt, Invertierter Index, Termlexikon, …) eines Dokuments von maximal 500KB unterstützt.
Die Clients verbinden sich mit dem Mindbreeze InSpire - Query Service, um ihre Anfragen an den Index zu stellen. Die Verteilung von Abfragelasten kann durch mehrere Einheiten des Mindbreeze InSpire – Client Services erreicht werden. Es kann mehrere Arten von Clients geben (z.B. ein in einem Drittprodukt integrierter Client), welche auf Basis des Mindbreeze InSpire SDK realisiert werden können.
Der Mindbreeze InSpire – Web Client verbindet sich mit dem Client Service um Abfragen gegen die Query Services zu senden.
Die Insight Services erlauben es Insights aus Daten zu extrahieren und über APIs zur Verfügung zu stellen. Insight Services werden Aufruf-basiert lizenziert. Ein Aufruf besteht aus einer Anfrage und der zugehörigen Antwort. Werden für einen Aufruf Unteraufrufe getätigt werden diese ebenso als weitere Aufrufe gezählt.
Insight Services kommen unter anderem bei folgenden Anwendungsfällen zum Einsatz:
Die Insight Services for RAG bilden die Basis für GenAI Use-Cases auf Basis von Mindbreeze InSpire. Die Insight Services for RAG verwenden zum einen die semantische Suche von Mindbreeze InSpire und zum anderen ein Large Language Model (LLM). Damit können Antworten auf Fragen in natürlichsprachiger Formulierung auf Basis von Fakten, die aus dem Index dazu extrahiert werden, generiert.
Wie im Abschnitt 6.7 InSpire AI Chat ersichtlich können dabei verschiedene LLMs verwendet werden. Werden von Mindbreeze gehostete LLMs verwendet, ist in diesem Fall nicht nur der Aufruf selbst relevant, sondern kann auch ein Token-Limit, je nach dem welches LLM verwendet wird, zur Anwendung kommen.
Die semantische Suche ist im Abschnitt 5.5.3 Semantic Sentence Similarity Search näher erläutert.
Das Mindbreeze InSpire – Management Service ermöglicht die zentrale Konfiguration und das Deployment von Services für Mindbreeze InSpire. Eine entsprechende web-basierte Konfigurationsoberfläche wird durch das Mindbreeze InSpire – Management Service bereitgestellt.
Mit der Mindbreeze InSpire – Advanced Configuration wird die zentrale Konfiguration einer verteilten Mindbreeze InSpire Szenarios ermöglicht.
Eine wesentliche Komponente zur Sicherung der Zugriffsberechtigungen ist die Rechteprüfung (ACL in der schematischen Darstellung). Dabei werden die Berechtigungen in Hinblick auf ein potenziell anzuzeigendes Ergebnis einer Suche, im Kontext eines am System angemeldeten Benutzers ausgewertet. Die Rechteprüfung erfolgt dabei direkt gegen die jeweilige Datenquelle (online check) oder es wird gegen die im Index abgelegte ACL (Access Control List) Information geprüft. Dies ist abhängig von der angebundenen Datenquelle bzw. dem verwendeten Connector.
Der Kontext von Daten und Dokumenten, welche im Zuge einer Query als Suchergebnis in einem Client angezeigt werden, wird über diese Komponente zur Verfügung gestellt. Damit ist es beispielsweise möglich, den Daten und Dokumenten entsprechende anwendungsspezifische Kontextmenüeinträge zuzuordnen.
Dieses Kapitel erläutert die Eigenschaften von Mindbreeze InSpire.
Mindbreeze InSpire SDK beinhaltet folgende Schnittstellen:
Das Mindbreeze InSpire SDK wurde auf die neuen Schnittstellen des Produkts umgestellt.
Die Mindbreeze InSpire 24.7 Version ist kompatibel zu allen SDK Versionen seit: Mindbreeze InSpire SDK 2013 Summer Release.
Die Mindbreeze InSpire Java SDK ist mit Java 8 kompatibel.
Mindbreeze InSpire beinhaltet ein zentrales Konfigurationswerkzeug, welches das Erstellen, die laufende Wartung und Administration von Indexkatalogen erlaubt. Darüber hinaus übernimmt dieses eine zentrale Werkzeug auch die Verteilung der Systembestandteile auf die Server des Gesamtsystems. Die zentrale Administration umfasst sämtliche Komponenten von Mindbreeze InSpire (Mindbreeze InSpire - Crawler Service, - Filter Service, - Index Service, - Query Service, -Client Service) von einer einzigen Stelle.
Um Dateien auf der lokalen Appliance zu betrachten und zu bearbeiten steht im Management Center ein Web File Manager zur Verfügung.
Bearbeiten und Betrachten von Textdateien die mit UTF-8 kodiert sind wird unterstützt.
Dateien die größer als 10MB sind können nur lesend geöffnet werden.
Details zu unterstützten Formaten für Syntax-Hervorhebungen finden sich in der Dokumentation der verwendeten Komponente CodeMirror in der Version 5.51.0.
Binärdateien können weder betrachtet noch bearbeitet, sondern nur heruntergeladen werden.
Die Indizierung serverseitiger Inhalte wird durch die Komponente Mindbreeze InSpire – Crawler Services in regelmäßigen Zeitabständen vorgenommen. Diese Abstände sind pro Datenquelle in Sekundeneinheiten definierbar.
Das Update von der 2016 Spring Release auf die aktuelle Mindbreeze InSpire Version erfordert keine Neuindizierung.
Indizes erstellt mit oder verändert von einer aktuellen Version können nicht von älteren Versionen geöffnet werden.
Mindbreeze InSpire 24.7 unterstützt produktseitig unten angeführte Datenquellen für die Indizierung sowie Navigation und Interaktion bei der Suche. Weitere Datenquellen sind über die Mindbreeze InSpire Connector-Schnittstelle und das bereitgestellte Mindbreeze InSpire Software Development Kit (SDK) integrierbar.
Dateisysteme
Mailserver
OpenText Documentum 6.6, 7.3, 16.7
Data Integration
Wichtiger Hinweis: Das Softwareprodukt Talend Open Studio wurde am 31. Januar 2024 eingestellt. Daher kann der Data Integration Connector in der aktuellen Form nicht mehr weiterentwickelt werden und erhält nur noch Wartungsupdates.
Für Alternativen und Fragen zur Wartung von bestehenden Lösungen wenden Sie sich bitte an den Mindbreeze Support unter support@mindbreeze.com.
LDAP / Microsoft Active Directory
Microsoft SharePoint 2013/2016/2019 und Microsoft SharePoint Online
Web
Mindbreeze InSpire unterstützt die Indizierung von Webseiten im Intranet und Internet. Die Verfolgung von Hyperlinks dient als technische Basis um sich von konfigurierbaren Ausgangsseiten zu weiteren Verzweigungsseiten zu gelangen. Rechteprüfungen für Autorisierung werden nicht im Standardproduktumfang abgedeckt, jedoch sind diesbezügliche Erweiterungen mit dem Mindbreeze InSpire – Connector Framework (SDK) abdeckbar.
Es sind vier Strategien zur Verfolgung von Hyperlinks in Verwendung, dabei ist es möglich auf einem Webserver zu verbleiben, innerhalb einer Domäne Hyperlinks nachzuverfolgen, uneingeschränkt alle aktiven Hyperlinks nachzuverfolgen oder die Nachverfolgung auf die Hyperlinks einer "Sitemap" (Inhaltsverzeichnis) zu beschränken (Linktiefe: 1).
Ab Version 20.5 (nur auf Mindbreeze InSpire G7) ist es optional möglich während der Indizierung den JavaScript-Code der Webseiten auszuführen.
Atlassian Jira 8
Atlassian Confluence 7.19 (LTS), 8.5 (LTS), 8.9
HCL Notes/Domino 8.5 und 9.0
Komponenten von Dritten
Die Unterstützung von Authentifizierungsmechanismen (wie zertifikatsbasierte Authentifizierung, formularbasierte Authentifizierung, „Basic Authentication“) kann via einer SAML 2.0 Infrastruktur mit dem Mindbreeze InSpire - Web Client durchgeführt werden.
OAuth Version 2.0 Authentifizierung mittels Bearer-Tokens wird in Verbindung mit dem OAuth Server Keycloak in der Version 14 unterstützt.
Hinweis: Die Zusammenarbeit des Mindbreeze InSpire Client Service mit SAML 2.0 Indentity Provider (IdP) wurde vom Hersteller ausschließlich unter der Verwendung der SAML 2.0 kompatiblen Produkte Shibboleth 4.0.1 Identity Provider, Microsoft Azure getestet.
Wichtig: Eine 100% vollständige und korrekte Extraktion aller Inhalte kann nicht gewährleistet werden.
Zur Autorisierung von Suchergebnissen werden die Rollen und Gruppen des Suchbenutzers aufgelöst und mit der Zugriffskontrollliste des Ergebnisdokuments abgeglichen.
Falls vorhanden, werden datenquellenspezifische Rollen und Gruppen durch die angegebenen Mindbreeze InSpire Konnektor Plugins aufgelöst. In diesen Fällen sind die unterstützten Anwendungsversionen für die Rollen- und Gruppenauflösung die gleichen, wie im Abschnitt "Unterstützte Datenquellen" angegeben.
Zusätzlich unterstützt Mindbreeze InSpire standardmäßig die Auflösung von Gruppen den folgenden Directory Servern:
Microsoft Microsoft Active Directory (Windows Server, Version 2012 bis 2022)
Novell eDirectory (Open Enterprise Server, 2018.1)
Azure Active Directory (via Microsoft Graph)
Filter für die folgenden Dateiendungen werden unterstützt
Microsoft Office:
Mail: MBOX, EML
Kalender: ICS
Kontakte: VCF
Open Document Format: ODT, ODS, ODP
Open Office:
Textdateien: TXT
Images: BMP, GIF, JPEG, JPG, PNG, TIF, TIFF, PNM, PGM, PPM, PBM, SVG
Web: HTML: CFM, HTM, HTML / XHTML: XHT, XHTM
Audio: MP3, AU, AIF, WAV, MID
E-Book: EPUB
ASCII- und ANSI-basierende Textdateien (UTF-8)
Dateiarchive: ZIP, JAR
Weitere unterstützte Formate: PDF (Adobe PDF-Format), RTF, URL, XML, COOML, RDF, FLV (Flash-Video), CLASS (Java Class Files)
Das Mindbreeze InSpire - Filter Service unterstützt Abbyy FineReader Engine 12 für das OCR von Inhalten durch die Verwendung entsprechender Plugins. Die Drittkomponenten (sind vom Hersteller Abbyy) gesondert zu lizenzieren.
Wichtig: Das Mindbreeze InSpire – Filter Service analysiert und filtert Dateien entsprechend deren Inhalte. Eine 100% vollständige und korrekte Filtrierung aller Inhalte kann nicht gewährleistet werden.
Für Microsoft Outlook PST Dateien und deren Inhalte gelten folgende Einschränkungen:
Mindbreeze InSpire unterstützt durchgängig den UNICODE-Standard (UTF-8 und UTF-16), damit werden alle darin definierten Sprach- und Schriftsysteme unterstützt.
Wichtig: Bei der semantischen Extraktion und der semantischen Suche über trainierte Modelle kann keine 100% vollständige und korrekte Extraktion und Suche gewährleistet werden. Ist eine Anpassung der Modelle unterstützt, handelt es sich um ein dediziertes Projekt, bei der von der Kundenumgebung entsprechend gelabelte Trainings- und Testdaten bereitgestellt werden.
Unterstütze Sprachen:
Die Zerlegung, wenn aktiviert, erfolgt während der Indizierung. Für ein erneutes Verarbeiten ist eine Reindizierung erforderlich. Aktuell ist keine Anpassung der Modelle unterstützt. Weitere Einschränkung siehe oben.
Unterstütze Sprachen:
Die Extraktion, wenn aktiviert, erfolgt während der Indizierung. Für ein erneutes Verarbeiten ist eine Reindizierung erforderlich. Aktuell ist keine Anpassung der Modelle unterstützt. Weitere Einschränkung siehe oben.
Wichtiger Hinweis: Für die Similarity Search wird wesentlich mehr Rechenleistung für die Aufbereitung der Daten verwendet. Um die volle Dokumentanzahl in optimaler Geschwindigkeit zu gewährleisten, kann je nach Anwendungsfall und Datenbasis eine zusätzliche Mindbreeze InSpire AI Instanz bzw. Appliance notwendig sein. In diesem Fall nehmen Sie bitte mit unserem Vertriebsteam (sales@mindbreeze.com) Kontakt auf.
Um die Funktionalität bereitzustellen, können beim Index Service zwei Elemente geladen werden:
Bei dieser Funktionalität werden Dokumente in Sätze zerlegt. Die Sätze werden über dem Vokabular in Tokens transformiert und das Modell liefert für einen Satz einen Vektor mit Gewichten. Bei der Suche wird die Query ebenfalls, wie ein Satz, als Vektor repräsentiert und daraus werden ähnliche Sätze berechnet, welche dann weiterverarbeitet werden.
Die Qualität der Ähnlichkeit hängt somit von den Gewichtungen des trainierten Modells ab. Der Schwellwert der Ähnlichkeit kann bei der Suche mitgegeben werden. Daher ist es nicht Teil der Gewährleistung, dass die Ähnlichkeitssuche optimale Treffer liefert.
Grundsätzlich können Modelle der Sentence Transformer Familie im ONNX Format geladen werden, wenn diese das geeignete Format aufweisen (Dense Tensors, Tokens in Int64, Output Gewichte in Float Repräsentation). Die Tokenizer-Konfiguration muss ein im HuggingFace PreTrainedTokenizer JSON Format repräsentierter Tokenizer sein. Getestet wurde mit den Tokenizer Modelltypen „WordPiece“, „Unigram“.
Ausgeliefert wird das Modell basierend auf dem Sentence-Transformer Modell mit der ID „multi-qa-mpnet-base-dot-v1“.
Das Modell ist auf Basis des ImageNet Large Scale Visual Recognition Challenge (ILSVRC) 2012-2017 Image-Classification-Datensets trainiert. Das Datenset umfasst 1000 Objektklassen. Das Datenset umfasst mehr als 1 Million Trainingsbilder, die den Klassen zugeordnet sind. Die Objektklassen werden in 68 Kategorien zusammengefasst. Die Kategorien werden übersetzt, sodass auch mehrsprachig gesucht werden kann.
Die Extraktion, wenn aktiviert, erfolgt währen der Indizierung. Für ein erneutes Verarbeiten ist eine Reindizierung erforderlich. Aktuell ist keine Anpassung der Modelle unterstützt. Weitere Einschränkung siehe oben.
Dieses Kapitel liefert eine kurze Übersicht über Abfragesprache und Behandlung sowie die Darstellung der Suchergebnisse.
Die Abfragen des Mindbreeze InSpire - Web Client gegen die serverseitigen Inhalte werden vom Mindbreeze InSpire – Client Service der Mindbreeze InSpire Architektur übernommen.
Die Benutzer können mit dem Mindbreeze InSpire - Web Client in einem oder mehreren Indexkatalogen gleichzeitig suchen. Dabei können sich diese Kataloge auch auf verschiedenen Servern befinden. Die Suchergebnisse aus den verschiedenen Indizes können vom Benutzer nach Belieben in das Suchergebnis ein- oder ausblendet werden.
Mindbreeze InSpire bietet eine Möglichkeit für die exakte Suche nach einem Wort („Wortbasierte Suche“) bzw. nach einer Wortgruppe („Phrasensuche“). Dabei werden nur mehr jene Ergebnisse angezeigt, die den gesuchten Begriff (einzelnes Wort oder Phrase) als Ganzes enthalten.
Wörter, die länger als die maximale Länge von 50 Zeichen sind, werden für die Suche nicht unterschieden.
Mindbreeze InSpire verfügt über eine intuitive, von Internet-Suchmaschinen bekannte Abfragesprache.
Standardmäßig werden alle durch Leerzeichen getrennten Suchbegriffe über eine logische UND-Verknüpfung an die Suchmaschine weitergegeben. Eine Suche nach ganzen Phrasen kann über die Eingabe von Anführungsstrichen abgesetzt werden. Die Ergebnisse können durch den Dateityp (Endung) sowie nach Kategorie (E-Mail, Datei etc.) eingeschränkt werden (siehe Benutzerhandbuch).
Zusätzlich zu der automatischen UND Verknüpfung können boolesche Operatoren, wie „AND“ bzw. „OR“, sowie Klammerungen verwendet werden, um noch detaillierter nach Objekten suchen zu können.
Die Wortnähe kann mittels „NEAR“ verwendet werden um jene Treffer bevorzugt anzuzeigen deren beide Suchwörter näher beisammenstehen.
Die Suche führt in einem Spezialfall eine sogenannte „Wildcard“-Suche durch. Für die Suche im Metadatum „Titel“ werden implizite Wildcards am Anfang und am Ende des Suchbegriffes unterstützt. Die Suche zum Beispiel nach „report“ liefert für das Metadatum „Titel“ also Ergebnisse für *report*.
Für die Suche werden Teilwörter ab einer Länge von 3 bis maximal 50 Zeichen berücksichtigt.
Die Suchergebnisse werden im Hauptfenster nach Kategorien angezeigt. Je nach Ergebnis können folgende Kategorien zur Anzeige kommen (sofern Ergebnisse in der betreffenden Kategorie aufscheinen):
Es werden pro Kategorie die Anzahl der Ergebnisse, die der Benutzer ausgewählt hat, angezeigt. Neben den Schaltflächen zur weiteren Navigation (Weiter, Zurück) werden die Ergebnisse pro Kategorie dynamisch geteilt, um schneller zum Ergebnis zu finden. Die Art und Weise nach der die Unterteilung stattfindet, hängt von der Sortierung des Ergebnisses ab. Wird das Ergebnis nach Datum sortiert, so wird die Sortierung innerhalb der Kategorien in Zeitabschnitten erfolgen. Es wird auch je nach Größe des Zeitraumes aller Ergebnisse in dieser Kategorie in Jahre, Quartale und Monate unterschieden (sog. „Drill Down“ über die Zeit).
Dieses Kapitel beschreibt die Vorschau und Markierung von Suchbegriffen, sowie das Ranking und die Navigation durch die Suchergebnisse.
Das Hauptfenster stellt die Suchergebnisse in zwei Detailstufen dar. In der Übersicht werden nur wesentliche Elemente, wie z.B. Name, Ort oder Datum angezeigt, um relativ schnell einen Überblick über die Resultate zu bekommen, diese Anzeige variiert entsprechend der Metadaten die für Treffer zur Verfügung stehen. In der detaillierten Ansicht wird eine Textvorschau auf den Inhalt angeboten, wobei versucht wird, relevante Stellen des Textes aus der im Index gespeicherten Zusammenfassung anzuzeigen. Die Suchbegriffe werden in verschieden Farben hervorgehoben.
Die Ergebnisse werden bei der Suche innerhalb der Kategorie nach semantischer Relevanz oder auch chronologisch sortiert, wobei wichtigere oder aktuellere Elemente zuerst angezeigt werden. Bei der chronologischen Sortierung wird das Datum der letzten Änderung herangezogen.
Alternativ kann ein Ranking-Algorithmus gewählt werden, der mehrere Kriterien, unter anderem die Anzahl und die Position des Suchbegriffes innerhalb des gefundenen Dokumentes heranzieht („inhaltsbasiertes Ranking“), um einen Rang für die Qualität des Suchergebnisses zu berechnen. Bei der Suche mit mehreren Phrasen wird die Nähe der gefundenen Begriffe zueinander berücksichtigt, wie auch beim Suchen mit dem Schlüsselbegriff „NEAR“.
Mindbreeze InSpire ermöglicht eine einfache und sehr schnelle Navigation durch die Ergebnisse der Suche mittels der im Kontext mit den Suchergebnissen angebotenen Navigationselemente. Diese sind einerseits die Schaltflächen zum Blättern und andererseits die dynamisch und online berechneten Teilungen. Damit wird ein in der Datenbanktechnologie als „Drill-Down“ bezeichnetes Verfahren zur schnellen Navigation ermöglicht. Auch bei nicht guter Kenntnis des Gesuchten (wenig Suchbegriffe) ist es damit möglich, einfach und schnell zum Ergebnis zu navigieren.
Mindbreeze InSpire bietet neben dem Öffnen eines Resultates (Starten der damit verknüpften Anwendung) viele Möglichkeiten, mit dem gefundenen Objekt weiter zu arbeiten. Das Kontextmenü bietet je nach Typ die Option, es mit anderen Programmen zu öffnen, den enthaltenden Ordner zu öffnen, es in die Zwischenablage von Microsoft Windows zu kopieren oder es im Microsoft Windows Explorer anzuzeigen. Dieses Menü kann je nach Datenquelle (Quellsystem) über die Mindbreeze InSpire - Kontext-Schnittstelle den Gegebenheiten der jeweiligen Datenquelle implementiert werden.
Mindbreeze InSpire bietet über sogenannte Suchreiter die Möglichkeit eine Suche gezielt einzuschränken. Suchreiter werden in den Benutzer-Profil Dateien definiert und können
verwendet werden.
Die Sucheinschränkungen für Suchreiter verwenden die Sprachelemente der Mindbreeze InSpire Abfragesprache. Die Verwendung von beliebigen Metadaten zur Einschränkung ist möglich.
Mindbreeze InSpire zeigt dem aktuellen Benutzer nur jene Ergebnisse an, für die dieser ausreichende Zugriffsberechtigungen (zumindest Leseberechtigung) verfügt. Für die Prüfung werden von Mindbreeze InSpire, abhängig von der jeweiligen Datenquelle folgende Möglichkeiten unterstützt:
Mit dem Mindbreeze InSpire AI Chat wird die Möglichkeit geboten auf Basis von Generativer AI und via Large Language Models (LLMs) und Retrieval Augmented Generation (RAG) auf rechtegeprüfte Fakten in Mindbreeze InSpire zuzugreifen. Zusätzlich zu einem Index und einem Client Service, kann auch ein Insight Services for RAG eingerichtet werden.
Für das Generieren selbst ist ein Large Language Model (LLM) notwendig. Mindbreeze liefert bei Bedarf ein LLM (zum aktuellen Zeitpunkt basiert das ausgelieferte Modell auf FastChat-T5 - lmsys/fastchat-t5-3b-v1.0). Für das On-Premises bzw. Betrieb eines LLMs ist eine zusätzliche Hardware / GPU notwendig. Bitte kontaktieren Sie Mindbreeze Sales (sales@mindbreeze.com), wenn Sie ein LLM betreiben möchten. Als Mindest-Anforderung für ein GPU-Modell wird eine Nvidia A40 mit 48 GB RAM empfohlen.
Mindbreeze SaaS Kunden besitzen die Möglichkeit ein Remote LLM zu verwenden. Bitte kontaktieren Sie hierfür Mindbreeze Sales (sales@mindbreeze.com).
Externe LLMs können aktuell mit dem Huggingface TGI API über HTTPs angebunden werden. Als Authentisierung wird aktuell OAuth2 Tokens unterstützt.
Für die Verwendung von Retrieval Augmented Generation (RAG) benötigt die aktuelle Version ein Indize im Sentence Transformer Format.
Um LLMs von KI-Anbieter wie OpenAI, Microsoft Azure OpenAI und Aleph Alpha als Modelle für Pipelines in Insight Services for RAG nutzen zu können, ist es zwingend erforderlich den Haftungsausschluss zur Nutzung dieser APIs zu akzeptieren. Dieser wird in Form eines Dialogs beim Anlegen eines LLMs in der Insight Services for RAG Administration dargestellt. Unten sehen Sie ein Beispiel basierend auf OpenAI:
Initialer Dialog ohne Akzeptieren, Anlegen nicht möglich | Anlegen erst nach Akzeptieren möglich |
Der Text zum Haftungsausschluss zur Datenschutzerklärung lautet allgemein wie folgt:
Bei Verwendung der Aleph Alpha, Azure OpenAI oder OpenAI API werden Chat Eingaben des Benutzers und von Ihrer Organisation indizierte Informationen über Prompts an die jeweiligen Endpunkte übermittelt. Der Umgang mit den übermittelten Informationen richtet sich nach den Datenschutz-Bestimmungen des entsprechenden KI-Anbieters. Mindbreeze ist für die weiterführende Datenverarbeitung nicht verantwortlich. Der KI-Anbieter ist weder Erfüllungsgehilfe noch Unterauftragsverarbeiter von Mindbreeze. Wir weisen darauf hin, dass eine rechtmäßige Nutzung von KI-Dienstleistungen nach gegenwärtiger Einschätzung nicht sichergestellt ist (vorsorglicher Hinweis nach Art 28 Abs. 3 S. 3 DSGVO). Für weitere Informationen und Risiken wird auf die jeweiligen Datenschutzhinweise des jeweiligen KI-Anbieters verwiesen.
Mehr Informationen erhalten Sie unter
Aleph Alpha: https://aleph-alpha.com/de/datenschutz/
Azure OpenAI: https://learn.microsoft.com/de-de/legal/cognitive-services/openai/data-privacy
OpenAI: https://openai.com/enterprise-privacy
Durch Bestätigung der Checkbox weisen Sie als Datenverantwortlicher Mindbreeze an, diese Übermittlung dennoch durchzuführen und nehmen den oben beschriebenen Hinweis zur Kenntnis.
Für die Nutzung des Retrieval Augmented Generation (RAG) ist in der aktuellen Version ein Indices im Sentence Transformer Format notwendig.
Bei der Nutzung von generativen AI und semantischer Suche über trainierte Modelle kann keine 100% vollständige und korrekte Extraktion und Suche gewährleistet werden. Die Antwortqualität des InSpire AI Chats ist von vielen Faktoren abhängig, welche auch über Insight Services for Retrieval Augmented Generation (RAG) angepasst werden können. Insbesondere ist es wichtig ein Datenset zu definieren, um die Qualität der Antworten zu messen. Es werden vordefinierte Prompts ausgeliefert, welche auch angepasst werden können.
Neben browserbasierten Lösungen bietet Mindbreeze weitere Möglichkeiten an, um Suchergebnisse darzustellen.
Das Outlook Add-In ermöglicht es, neben den Standard Outlook Treffern auch Mindbreeze Suchtreffer anzeigen zu lassen.
Es ist möglich, in der iOS App für Apple-Geräte die Suchtreffer im vertrauten Design am Smartphone darzustellen.
Dazu ist es notwendig, die URL des gewünschten Mindbreeze InSpire – Web Clients in der App zu hinterlegen.
Die Mindbreeze Browsererweiterung für Chrome und Edge bietet eine weitere Möglichkeit, Suchtreffer anzeigen zu lassen.
Mindbreeze InSpire bietet folgende Services:
Mindbreeze InSpire - File System Crawler Service
Mindbreeze InSpire – Microsoft Exchange Crawler Service
Mindbreeze InSpire – Web Connector
Mindbreeze InSpire – Data Integration Connector
Mindbreeze InSpire – OpenText Documentum Connector
Mindbreeze InSpire - ServiceNow Connector
Wenn ‘Extended User Criteria Conditions’ oder ‘Advanced User Criteria Resolution‘ verwendet werden, gewährleisten wir nicht, dass die Permissions in Mindbreeze tatsächlich den ServiceNow Permissions entsprechen. In diesem Fall müssen auf Seite des Deployments entsprechende Zugriffstests durchgeführt werden.
Unterstützte Browser und Betriebssysteme:
Folgende Komponenten sind nach dem W3C-Standard WCAG 2.1 – AA Silber zertifiziert:
Suchfeld
Tabs
Resultatsliste
Einstellungen
Gespeicherte Suchen
Filter
Datumspicker
Weitere Treffer nachladen
Hilfe
Unterstützte Browser und Betriebssysteme:
Unterstützte Microsoft Outlook Versionen und Betriebssysteme:
Der MSI-Installer unterstützt sowohl die 32bit als auch die 64bit Version von Microsoft Outlook.
Der Click-Once-Installer unterstützt sowohl die 32bit als auch die 64bit Version von Microsoft Outlook.
Unterstützte Browser und Betriebssysteme:
Benutzeroberfläche des Softwareprodukts:
Dokumentation:
Die Spezifikation und Ausstattung der Hardware ist abhängig von der jeweiligen Mindbreeze InSpire Ausbaustufe. Es gibt Hardwarekonfiguration für die Varianten 500K, 1M, 2M, 5M und 10M.
Die Hardwarekonfigurationen 2M, 5M und 10M unterstützen Self-Encrypting Drives (SED) zur Verschlüsselung der Festplatteninhalte. Bei 500K und 1M findet keine Verschlüsselung der Daten statt, die auf den Festplatten gespeichert sind.
Die Hardware wird mit folgendem Servicevertrag geliefert:
Mindbreeze InSpire ist auch als Image für Virtual Machines verfügbar. Dies ist entweder über Amazon Web Services, Microsoft Azure, Google Cloud oder die Oracle Cloud möglich. Auch hier kann man zwischen den Varianten 1M, 2M, 5M und 10M wählen. Nachfolgend werden die minimalen Hardwareanforderungen für die jeweiligen Varianten gelistet.
Achtung: Die folgenden Spezifikationen sind Empfehlungen und beinhalten keine Gewährleistung.
Ohne GPU | |||||
CPU | 1M | 2M | 5M | 10M | |
Amazon Web Services | Vergleichbar mit Intel Xeon Gold x86_64 | 12 Cores (ohne Hyper-Threading) 128 GB RAM 1,7 TB SSD Storage | 24 Cores (ohne Hyper-Threading) 256 GB RAM 4 TB SSD Storage | 24 Cores (ohne Hyper-Threading) 384 GB RAM 8 TB SSD Storage | 32 Cores (ohne Hyper-Threading) 512 GB RAM 16 TB SSD Storage |
Google Cloud | |||||
Oracle Cloud | |||||
Microsoft Azure (nur Gen 2 VMs) |
Eine GPU Memory wird nicht zwingend benötigt, um ein Virtual-Machine-Image zu betreiben. Falls Large Language Models verwendet werden sollen, wird eine GPU Memory benötigt. Es gelten die folgenden Mindest-Hardwareanforderungen.
Achtung: Die folgenden Spezifikationen sind Empfehlungen und beinhalten keine Gewährleistung.
Mindbreeze InSpire beinhaltet einen Next-Business-Day Basissupport der sich ausschließlich auf Produktprobleme, mit den in dieser Produktinformation beschriebenen Funktionalitäten bezieht.
Eingebrachte Produktprobleme müssen isolierbar und reproduzierbar sein.
Ein eingebrachtes Support-Ticket muss dabei folgende Basisinformationen enthalten:
Support-Tickets sind ausschließlich via https://tickets.mindbreeze.com einzubringen.
Die Erstreaktion erfolgt jeweils am nächsten Arbeitstag nach der Ticket-Erstellung zu folgenden Zeiten (ausgenommen Feiertage):
Zeitzone: Central European Standard Time
Wichtig: Technische Consulting Leistungen sind nicht im inkludierten Basissupport enthalten und müssen gesondert beauftragt/bestellt werden.