オムニダクト

さまざまなデータソースからデータを抽出するためのインターフェイス
90
ダニエル・フランク、マシュー・ワードロップ

オムニダクトは、多種多様な(おそらくリモートの)データストア(HDFS、Hive、Presto、MySQLなど)に接続し、そこからデータを抽出するための統一インターフェイスを提供します。

ドキュメント: http://omniduct.readthedocs.io
ソース: https://github.com/airbnb/omniduct
バグの報告: https://github.com/airbnb/omniduct/issues

以下を提供します

  • さまざまなサービス間で一貫した方法でデータにアクセスするための、一般的なプラグインベースのプログラミングAPI(サポートされているプロトコルを参照)。
  • データソースに接続し、関連するPythonセッションのライフタイム全体でこれらの接続を維持するための、怠惰な接続フレームワーク。
  • 直接接続できないリモートサービスのSSH経由での自動ポート転送。
  • IPythonとJupyter Notebookセッション内でデータプロバイダーとインタフェースするための、便利なIPythonマジック関数。
  • 便利なサービスのレジストリを維持するための、ユーティリティクラスとメソッド。

オムニダクトは、直接使用したり(各ユーザーが独自のサービス定義を設定できる)、または別のパッケージ(会社などの事前定義されたサービスのライブラリを作成可能)を介して使用したりできるように設計されています。オムニダクトを展開する方法の詳細については、展開を参照してください。

リンク