マッパー関数はすべての行で実行されるため、最初の行をスキップする方法を知ることはできますか。いくつかのファイルについては、私が無視したいカラムヘッダーで構成されていますマップ内の.csvの最初の行をスキップするreduce java
4
A
答えて
8
{// を発する} {// スキップ}、データはキー値として読み出されますペア。キーは、次の行が始まるバイトオフセットです。 1行目は常にゼロです。だからマッパー関数では、次の操作を実行します
@Override
public void map(LongWritable key, Text value, Context context) throws IOException {
try {
if (key.get() == 0 && value.toString().contains("header") /*Some condition satisfying it is header*/)
return;
else {
// For rest of data it goes here
}
} catch (Exception e) {
e.printStackTrace();
}
}
1
ファイルは複数のノードに格納できるため、どのマシンにヘッダーパーツが存在し、どのマッパーがファイルのその部分を処理しているのかはわかりません。 Mapper自体のヘッダーを除外することができます。このためにヘッダーを知る必要があります。たとえば、 String [] cols = line.tokenize(); IF(COLS [0] .equals( "ヘッダ"))ファイルの読み取り中に他のマッパーで
関連する問題
- 1. Javaでcsvの最初の行をスキップする方法はありますか?
- 2. JavaでCSVファイルを読み込んでいる最初の行をスキップする
- 3. PHP CSVファイルを表示する、最初の行をスキップする
- 4. CSVファイルデータの最初の行をスキップする
- 5. csvファイルの最初の行の読み込みをスキップ
- 6. ロードXML-スキップ最初の行
- 7. Sparkの最初の数行をスキップ
- 8. JMeterがCSVファイルの最初の行のデータをスキップしています
- 9. CSVファイルを使用してループの最初の行(フィールド)をスキップしますか?
- 10. インポートCSVテーブルとMySQLのテーブルからの最初の列をスキップ
- 11. スパークCSVは、最初の行
- 12. jQuery Zebra Striping:最初の行をスキップ
- 13. gnuplotの - スキップ最初の二行
- 14. プロパティファイルのマップ(ATG/Java)の最初のエスケープ
- 15. Jinjaでテーブルデータをレンダリングするときの最初の行をスキップ
- 16. MySQLにテキストファイルをロードする - 最初の行をスキップする
- 17. Django - 配列の最初の行をスキップする
- 18. Excelファイルの最初の行をスキップする
- 19. Pythonでファイルの最初の行をスキップする方法
- 20. RecyclerView - 最初のレイアウトパスをスキップするオフスクリーンアイテム
- 21. PHPスキップ行のCSVファイル
- 22. VBA最初の行をスキップしてデータをコピー&ペーストする
- 23. CSVからアイテムの最初の行をスキップするにはどうすればよいですか?
- 24. JSX配列内の最初のオブジェクトのみをマップする
- 25. SQL Server 2005の最初の行をスキップしますか?
- 26. Jsコードは、クリックイベントの後に最初の行をスキップします
- 27. R data.table:各ファイルの最後の行をスキップするフォルダ内のすべての.csvファイルにfreadを使用
- 28. streamreaderを使用してcsvを読み込んでいる最初の行をスキップする方法
- 29. .batの使用 - 最初の.csv内の特定の最初の列データから2番目の.csvを作成
- 30. 複数のCSVファイルの最初の行を比較する
私はたくさんの試してみた後、同じことを使用していた! – Kunal
'keys == 0'は' keys.get()== 0'であるべきだと思います。 LongWritableはintと直接比較できません。私が間違っているなら、私を訂正してください。 – yusong
である。 'get()'を使う必要があります。ありがとう! @yusong – ViKiG