Rubyのeachの機能がちょっと混乱しています。私はテキスト行を持っている場合、eachループは、個々の文字ではなくスペースで区切られた単語を私に与えます。 だから、タブ文字で区切られた文字列のセクションを取得する最良の方法は何ですか。現時点では、私は持っています: line.split.each do |word|
...
end
しかしそれは間違いです。
タブ区切りのテキストファイルを効率的にストリーミングする交差/結合を得るために、UNIXベースの高速ユーティリティ(理想的にはC言語で書かれています)をお勧めしますか?たとえば、「ファイルBの任意の列Kに表示されない列値Kを持つ、ファイルA内のすべてのエントリを与える」などのクエリを許可します。 例えば、ファイルAの場合: bob sally sue
bob mary john
とファイルB