Copyright ©
Mindbreeze GmbH, A-4020 Linz, .
Alle Rechte vorbehalten. Alle verwendeten Hard- und Softwarenamen sind Handelsnamen und/oder Marken der jeweiligen Hersteller.
Diese Unterlagen sind streng vertraulich. Durch die Übermittlung und Präsentation dieser Unterlagen alleine werden keine Rechte an unserer Software, an unseren Dienstleistungen und Dienstleistungsresultaten oder sonstigen geschützten Rechten begründet. Die Weitergabe, Veröffentlichung oder Vervielfältigung ist nicht gestattet.
Aus Gründen der einfacheren Lesbarkeit wird auf die geschlechtsspezifische Differenzierung, z.B. Benutzer/-innen, verzichtet. Entsprechende Begriffe gelten im Sinne der Gleichbehandlung grundsätzlich für beide Geschlechter.
Mindbreeze bietet eine Spracherkennung für Dokumente. Dazu wird beim Indizieren das LanguageDetector ItemTransformer Plugin verwendet.
Um die Spracherkennung zu nutzen, muss das LanguageDetector zu Ihrer Mindbreeze-Installation hinzugefügt werden, indem das entsprechende Plugin geladen wird (die Item Transformation Services werden mit dem Paket “ Mindbreeze Item Transformation Plugins” ausgeliefert).
Das Plugin muss auch in Ihrer Mindbreeze Lizenz inkludiert sein.
Das LanguageDetector Plugin kann nicht nur als Item Transformation Service genutzt werden, sondern auch als eigenständiger Service. Dies kann bei großen Installationen mit mehreren Indizes Performancevorteile bringen, da nur ein einzelner LanguageDetector Service für alle Indizes betrieben wird und nicht je Index eine Instanz.
Um das LanguageDetector Plugin als eigenständigen Service zu betreiben, installieren Sie das Plugin MetadataTransformationService-<version>.zip. Fügen Sie im „Indices“-Tab in der Sektion „Services“ einen neuen Service hinzu und wählen Sie „ItemTransformationServicePlugin.LanguageDetector“ aus. In den Einstellungen des neuen Service setzen Sie einen sprechenden „Display Name“, sowie den „Bind port“ auf einen freien TCP-Port. Die restlichen Einstellungen sind laut dem Abschnitt „Konfiguration“ zu setzen. Zuletzt wechseln Sie im „Indices“-Tab in die Sektion „Indices“ und fügen Sie bei dem betreffenden Index einen Item Transformation Service hinzu und referenzieren Sie den angelegten Service.
Hier finden Sie eine Liste an Sprachprofile, die vom LanguageDetector unterstützt werden. Die angeführten Sprachen können in der Konfiguration des LanguageDetectors (Option „Included Languages“) verwendet werden. Die Option „Short Text Algorithm Text Length“ definiert dabei, für welche Textlängen das Lang- oder Kurztextprofil der jeweiligen Sprachen ausgewählt wird.
Sprache | Langtextprofil | Kurztextprofil | |
af | Afrikaans | X | |
an | Aragonisch | X | |
ar | Arabisch | X | |
ast | Asturisch | X | |
be | Weißrussisch | X | |
br | Bretonisch | X | |
ca | Katalanisch | X | |
bg | Bulgarisch | X | |
bn | Bengalisch | X | |
cs | Tschechisch | X | X |
cy | Walisisch | X | |
da | Dänisch | X | X |
de | Deutsch | X | X |
el | Griechisch | X | |
en | Englisch | X | X |
es | Spanisch | X | X |
et | Estnisch | X | |
eu | Baskisch | X | |
fa | Persisch | X | |
fi | Finnisch | X | X |
fr | Französisch | X | X |
ga | Irisch | X | |
gl | Galicisch | X | |
gu | Gujarati | X | |
he | Hebräisch | X | |
hi | Hindi | X | |
hr | Kroatisch | X | |
ht | Haitianisch | X | |
hu | Ungarisch | X | |
id | Indonesisch | X | X |
is | Isländisch | X | |
it | Italienisch | X | X |
ja | Japanisch | X | |
km | Khmer | X | |
kn | Kannada | X | |
ko | Koreanisch | X | |
lt | Litauisch | X | |
lv | Lettisch | X | |
mk | Mazedonisch | X | |
ml | Malayalam | X | |
mr | Marathi | X | |
ms | Malaysisch | X | |
mt | Maltesisch | X | |
ne | Nepali | X | |
nl | Niederländisch | X | X |
no | Norwegisch | X | X |
oc | Okzitanisch | X | |
pa | Punjabi | X | |
pl | Polnisch | X | X |
pt | Portugiesisch | X | X |
ro | Rumänisch | X | X |
ru | Russisch | X | |
sk | Slowakisch | X | |
sl | Slowenisch | X | |
so | Somalisch | X | |
sq | Albanisch | X | |
sr | Serbisch | X | |
sv | Schwedisch | X | X |
sw | Suaheli | X | |
ta | Tamilisch | X | |
te | Telugu | X | |
th | Thailändisch | X | |
tl | Tagalog | X | |
tr | Türkisch | X | X |
uk | Ukrainisch | X | |
ur | Urdu | X | |
vi | Vietnamesisch | X | X |
yi | Jiddisch | X | |
zh-cn | Vereinfachtes Chinesisch | X | |
zh-tw | Traditionelles Chinesisch | X |