私の質問は、スペースで区切られた100ワードのテキストファイルがあり、ワードカウントプログラムを実行する必要があるということです。Hadoop Mapreduce HDFSブロック分割
私の名前ノードでファイルをHDFSブロックに分割すると、分割が単語の最後でのみ行われることをどのように確認できますか?
つまり、テキストファイルで50番目の単語がHadoopの場合、64MBのブロックに分割すると、現在のブロックの記憶域がHadoopという単語の中央に64MBに達し、もう片方のブロックには「持っていた」と他の「うん」があります。
ご迷惑をおかけするかもしれませんが、答えをご提供ください。ありがとうございます。