2016-07-13 11 views
2

私はCassandra(3.7)クラスタよりもHadoop(2.7.2)セットアップを持っています。 Hadoop MapReduceの使用には問題ありません。同様に、私はCQLSHでテーブルとキースペースを作成することに問題はありません。しかし、私はCassandraのテーブルにアクセスするために、hadoopにPIGをインストールしようとしていました。 (PIGのインストールはそれほどうまくいきません)どこに問題があるのですか?PiG + Cassandra + Hadoop

私は数多くのウェブサイトに出くわしました。ほとんどの場合、古いバージョンのカサンドラまたは曖昧です。 私がこのウェブサイトから収集したことの1つは、CqlStorage/CqlNativeStorageを使用して豚にcassandraテーブルへのアクセスをロードできることです。しかし、最新バージョンでは、このサポートは(2015年以降)削除されたようです。 Changes noted from Cassandra Git Tree 私の質問は、回避策はありますか?

私はmapreduceジョブをcassandraテーブルで実行しており、主にクエリのためにPiGを使用しています。

ありがとうございました。

答えて

1

すべてのブタのサポートは2.2で廃止され、3.0では削除されました。 https://issues.apache.org/jira/browse/CASSANDRA-10542

ここであなたは少し運が悪いと思います。あなたは現代のC *で古いクラスを使用することができるかもしれませんが、Pigは現在非常にニッチです。 SparkSqlは間違いなく現在のお気に入りの子供です(私はSpark + Cassandra Connectorで作業しているので偏っている可能性があります)、C *データのクエリを柔軟に行うことができます。

+0

ありがとうございました。私は今、同じ結論に達しました。私の仕事は主に時系列の予測分析に焦点を当てており、Sparkがより良いライブラリをサポートすることを発見しました。だから私はSpark + Cassandraに行くだろう...!もう一度ありがとう....! – ABCD