Datenanalyse: Elastic 8.0 bringt neue Funktionsweisen für die Vektorsuche

Das Datenanalyse-Tool erweitert seine Vektorsuchfunktionen und stellt Nutzern native Unterstützung für NLP-Modelle und die ANN-Suche zur Verfügung.

In Pocket speichern vorlesen Druckansicht 10 Kommentare lesen

(Bild: Gorodenkoff/Shutterstock.com)

Lesezeit: 3 Min.
Inhaltsverzeichnis

Version 8.0 des Softwareportfolios Elastic Stack liegt vor. Mit dem Update erweitern die Elastic-Entwickler die Suchfunktion für Vektoren in Elasticsearch und führen native Unterstützung für Modelle zur Verarbeitung von natürlicher Sprache ein. Laut Blogbeitrag soll das Release "eine neue Ära der Geschwindigkeit, Skalierung und Relevanz" einläuten.

Elastic 8 hält neue Suchfunktionen für Vektoren bereit, die es Nutzerinnen und Nutzern ermöglichen sollen, in eigenen Worten und der eigenen Sprache nach Vektoren in Elasticsearch zu suchen. Bereits Elasticsearch 7.0 hatte Feldtypen für hoch-dimensionale Vektoren eingeführt. Die Versionen 7.3 und 7.4 hatten Unterstützung für Vektorähnlichkeitsfunktionen im Gepäck.

Das aktuelle Release geht einen Schritt weiter und stellt Nutzern native Unterstützung für Modelle zur Verarbeitung natürlicher Sprache (NLP) zur Verfügung. Bisher war es offenbar notwendig, neben dem Schreiben aufwendiger Plug-ins einen Teil der NLP-Verarbeitung außerhalb von Elasticsearch zu betreiben. Mit der Version 8.0 können Nutzer unter anderem die Named Entity Recognition, Sentiment Analysis und Textklassifikation direkt in Elasticsearch durchführen. Zusätzliche Komponenten oder Programmierung sind offenbar nicht notwendig.

Darüber hinaus bietet Elasticsearch 8.0 native Unterstützung für die ANN-Suche (Approximate Nearest Neighbour), eine Form der Näherungssuche bei der Datenanalyse. Sie soll es Nutzern ermöglichen, vektorbasierte Abfragen mit einem vektorbasierten Dokumentenkorpus schnell und in großem Umfang zu vergleichen.

PyTorch-Modelle für Maschine Learning lassen sich ab sofort direkt in Elasticsearch verwenden und darüber hinaus Inference direkt in Elasticsearch durchführen – die Modelle können sowohl selbst definiert sein, als auch von der Community zur Verfügung gestellt werden. Die Unterstützung soll den Verarbeitungsprozess vereinfachen und NLP beschleunigen, da die Daten nicht in einen separaten Prozess oder ein System ausgelagert werden müssen.

Außerdem führt Elastic zwei neue AWS-Integrationen für Lambda und S3 Storage Lens ein. Dies lässt aufhorchen, befindet sich der Anbieter doch in einer Lizenzauseinandersetzung mit dem Cloud-Anbieter. Elastic war es ein Dorn im Auge, auf welche Weise Cloud-Provider wie Amazon vom eigenen ELK-Stack profitierten. Dies resultierte im Ende der freien Apache-Version und AWS startete einen Fork der Software namens OpenSearch. Letzteres liegt mittlerweile in einer stabilen Version vor. Die kostenlose Elastic-Lizenz sehen Organisationen wie die OSI nicht als Open Source an.

Elastic 8 steht Interessierten über die Elastic Cloud zum Download zur Verfügung. Weitere Informationen zum Release finden sich im Ankündigungsbeitrag auf dem offiziellen Elastic-Blog.

(mdo)