SQL-Engine: Apache Drill 1.20 abwärtskompatibel zu Hadoop 2

Apache Drill bringt eine Rückportierung zu Hadoop 2 und eine Anbindung an die Datenbank-Engine Apache Phoenix. Auch neue Dateiformate sind nun möglich.

In Pocket speichern vorlesen Druckansicht

(Bild: Gorodenkoff/Shutterstock.com)

Lesezeit: 2 Min.

Die Apache Software Foundation (ASF) hat Apache Drill 1.20 veröffentlicht. Die SQL-Query-Engine lässt sich mit NoSQL-Datenbanken und -Dateisystemen wie HBase, MongoDB, Amazon S3, Azure Blob Storage, Google Cloud Storage, NAS und lokalen Dateien nutzen. Die neue Minor-Version bringt Bugfixes, Usability-Neuerungen und Anbindung an Apache Phoenix mithilfe eines neuen Connectors. Neben Apache Hadoop 3 lässt sie sich auch mit dem älteren Apache Hadoop 2 einsetzen.

Das Big-Data-Framework Apache Hadoop 2 erschien im Jahr 2013, vier Jahre danach stand Version 3 bereit. Nach Version 1.16 wechselte Apache Drill zu Hadoop 3 und war fortan nicht mehr mit Hadoop 2 kompatibel. Das hielt scheinbar einige Unternehmen, die Hadoop 2 nach wie vor im Einsatz haben, von einem Upgrade ab. In Zusammenarbeit mit Deutsche Bahn Cargo hat das Apache-Drill-Team daher im aktuellen Release eine Rückportierung zu Hadoop 2 eingeführt, sodass Hadoop-2-Nutzer nicht länger auf die zwei Jahre alte Version 1.16 zurückgreifen müssen.

Apache Drill 1.20 lässt sich durch einen neuen Connector mit Apache Phoenix nutzen – einer relationalen, massiv-parallelen Open-Source-Datenbank-Engine. Mithilfe des Connectors sind aus Drill heraus Query- und Join-Funktionen für Daten von Apache Phoenix verfügbar. Neu in Apache Drill ist auch die Möglichkeit, Daten in relationale Datenbank-Managementsysteme (RDBMS) zu schreiben, die mit Java Database Connectivity (JDBC) konform sind. Dazu zählen Oracle, MySQL und PostgreSQL.

Als neue Dateiformate lassen sich in Drill das High-Performance-Format für analytische Datensätze Apache Iceberg sowie das SAS-Dateiformat nutzen. Dieses hat das SAS Institute entwickelt, das hinter der statistischen Software-Suite SAS steht.

Alle weiteren Informationen zum neuen Release bietet der Blog der Apache Software Foundation.

(mai)