私は次の解決策に来て、いくつかは学んだ後:
- 私は実際に完全なKerberosのソリューションを必要としない、それは、クライアントが任意のユーザからHDFSの要求を実行することができ、現在は十分です。環境そのものは安全だと考えられています。
- これは、私がhadoop UserGroupInformationクラスに基づいた解決策を提供します。将来、Kerberosをサポートするように拡張することができます。
両方の「偽の認証」とリモートHDFSへのアクセスのための人々のために、おそらく便利なサンプルコード:
package org.myorg;
import java.security.PrivilegedExceptionAction;
import org.apache.hadoop.conf.*;
import org.apache.hadoop.security.UserGroupInformation;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.FileStatus;
public class HdfsTest {
public static void main(String args[]) {
try {
UserGroupInformation ugi
= UserGroupInformation.createRemoteUser("hbase");
ugi.doAs(new PrivilegedExceptionAction<Void>() {
public Void run() throws Exception {
Configuration conf = new Configuration();
conf.set("fs.defaultFS", "hdfs://1.2.3.4:8020/user/hbase");
conf.set("hadoop.job.ugi", "hbase");
FileSystem fs = FileSystem.get(conf);
fs.createNewFile(new Path("/user/hbase/test"));
FileStatus[] status = fs.listStatus(new Path("/user/hbase"));
for(int i=0;i<status.length;i++){
System.out.println(status[i].getPath());
}
return null;
}
});
} catch (Exception e) {
e.printStackTrace();
}
}
}
同様の問題を抱えている人のための有用な参照:
UPDATE:必要なローカルユーザーせずに、コマンドラインhdfs
またはhadoop
ユーティリティを使用する人のため
オルタナティブ:
HADOOP_USER_NAME=hdfs hdfs fs -put /root/MyHadoop/file1.txt/
あなたが実際に行うことは、あなたの地元の権限に応じたローカルファイルの読み込みですが、ユーザーがhdfs
のように認証されたHDFS上にファイルを置く。
これは、APIコードにかなり類似した性質を持っているが示さ:
- をあなたが
sudo
は必要ありません。
- 実際には適切なローカルユーザー 'hdfs'は必要ありません。
- 以前の点が原因で、何もコピーしたりパーミッションを変更する必要はありません。
私はあなたと同じ問題を偶然見つけました。リモートクライアントからHadoopジョブを実行するクラスタに、Hadoopジョブを送信しようとしています。私の場合、問題は** ClouderaのHadoop 2.0.0(Hadoop 2.0.0-cdh4.3.1)は、あなたが使ったUserGroupInformationクラス**を提供していないということです。それに対応するApache Hadoopのバージョンは、それを提供していないようです。 UserGroupInformation - [リンク](http://archive.cloudera.com/cdh4/cdh/4/hadoop/api/org/apache/hadoop/security/UserGroupInformation.AuthenticationMethod.html)という名前の列挙体があります。そのような場合には、あなたの意見でどうすればできますか? – falconepl
それはそこにあります、ただそれはクロウデラではありません。私は現在、2.0.0-cdh4.3.1のhadoopクライアントを使用しています。 –
それはそこにあると言ってどういう意味ですか?私はApache Hadoop 2.0.6 API [[link](http://hadoop.apache.org/docs/r2.0.6-alpha/api/index.html)]と2.1.0 API [[link ](http://hadoop.apache.org/docs/r2.1.0-beta/api/index.html)](ApacheがWebサイトで提供するJavadoc)、残念ながら 'UserGroupInformation'クラスはなく、列挙型それはあまり役に立たない。ところで、あなたがClouderaのHadoopディストリビューションを言及した '2.0.0-cdh4.3.1' Hadoopではありませんか? – falconepl