2016-09-04 5 views
1

gsubで逆参照を使用してローマ数字に変換しようとしていますが、私は奇妙な不一致を発見しました。ruby​​ regex inconsistancy

$ ruby -v 
ruby 2.2.5p319 (2016-04-26 revision 54774) [x86_64-linux] 

$ irb 
irb(main):001:0> BASES = { 
irb(main):002:1*  1000 => 'M', 
irb(main):003:1*  500 => 'D', 
irb(main):004:1*  100 => 'C', 
irb(main):005:1*  50 => 'L', 
irb(main):006:1*  10 => 'X', 
irb(main):007:1*  5 => 'V', 
irb(main):008:1*  1 => 'I' 
irb(main):009:1> } 
=> {1000=>"M", 500=>"D", 100=>"C", 50=>"L", 10=>"X", 5=>"V", 1=>"I"} 
irb(main):010:0> BASE_KEYS = BASES.keys 
=> [1000, 500, 100, 50, 10, 5, 1] 
irb(main):011:0> rom = 'IIII' 
=> "IIII" 

は、上記の私は4回、 を繰り返し、任意の文字を識別し、その文字の1と1次BASEの文字に置き換えることをしようとしています下のセットアップ

です。

例:IIII => IV

irb(main):012:0>  rom.gsub(/((.)\2{3})/, 
irb(main):013:1*  "#{ 
irb(main):014:0>   BASES[BASE_KEYS.select.with_index{ |bk, i| 
irb(main):015:2>   BASES[BASE_KEYS[i]] == $2 
irb(main):016:2>   }.first] 
irb(main):017:0>  } 
irb(main):018:1"  #{BASE_KEYS.select.with_index{ |bk, i| 
irb(main):019:1>   BASES[BASE_KEYS[i]] == $2 
irb(main):020:1>   }.first} 
irb(main):021:1"  #{ 
irb(main):022:0>   BASES[BASE_KEYS.select.with_index{|bk, i| 
irb(main):023:2>   BASES[BASE_KEYS[i+1]] == $2 
irb(main):024:2>   }.first] 
irb(main):025:0>  } 
irb(main):026:1"  #{BASE_KEYS.select.with_index{ |bk, i| 
irb(main):027:1>   BASES[BASE_KEYS[i+1]] == $2 
irb(main):028:1>   }.first} 
irb(main):029:1"  " 
irb(main):030:1> ) 
=> "\n  \n  I\n  1\n  " 

ので、私は

irb(main):031:0>  rom.gsub(/((.)\2{3})/, 
irb(main):032:1*  "#{ 
irb(main):033:0>   BASES[BASE_KEYS.select.with_index{ |bk, i| 
irb(main):034:2>   BASES[BASE_KEYS[i]] == $2 
irb(main):035:2>   }.first] 
irb(main):036:0>  } 
irb(main):037:1"  #{BASE_KEYS.select.with_index{ |bk, i| 
irb(main):038:1>   BASES[BASE_KEYS[i]] == $2 
irb(main):039:1>   }.first} 
irb(main):040:1"  #{ 
irb(main):041:0>   BASES[BASE_KEYS.select.with_index{|bk, i| 
irb(main):042:2>   BASES[BASE_KEYS[i+1]] == $2 
irb(main):043:2>   }.first] 
irb(main):044:0>  } 
irb(main):045:1"  #{BASE_KEYS.select.with_index{ |bk, i| 
irb(main):046:1>   BASES[BASE_KEYS[i+1]] == $2 
irb(main):047:1>   }.first} 
irb(main):048:1"  " 
irb(main):049:1> ) 
=> "I\n  1\n  V\n  5\n  " 
irb(main):050:0> 

確かに私の正規表現のコードはかろうじて理解できるが、なぜ(より多くの洞察力のためのデバッグ情報付き)..間違った答えを得ます私は同じコードの2番目の呼び出しで別の結果を得るのですか?

irb(main):050:0> rom 
=> "IIII" 

予告ROMが

+1

誰もが、彼らが最初の各行の先頭にIRB bumphを取り除く必要がありますあなたのコードを実行したい場合。彼らのためにそれをやって、カット&ペーストできるのはどうですか?ありがとう。 –

答えて

3

あなたのコードでは、正規表現を評価する前に$2を使用しています...変わっていません。最初に実行した後、$2が設定され、コードは意図したとおりに動作します。文字列の代わりにブロックを使用することを検討してください。これは、文字列が一致する前に補間されるためです。ブロック形式で

、現在の一致文字列をパラメータとして渡され、そしてそのような$ 1、$ 2、$ `、$ &、および$」のような変数を適切に設定します。ブロックによって返された値は、各呼び出しの一致の代わりに使用されます。

これは一貫している:

rom.gsub(/((.)\2{3})/) { |s| 
    "#{ 
    BASES[BASE_KEYS.select.with_index{ |bk, i| 
     BASES[BASE_KEYS[i]] == $2 
    }.first] 
    } 
    #{BASE_KEYS.select.with_index{ |bk, i| 
     BASES[BASE_KEYS[i]] == $2 
    }.first} 
    #{ 
    BASES[BASE_KEYS.select.with_index{|bk, i| 
     BASES[BASE_KEYS[i+1]] == $2 
    }.first] 
    } 
    #{BASE_KEYS.select.with_index{ |bk, i| 
     BASES[BASE_KEYS[i+1]] == $2 
    }.first} 
    " 
} 
# => "I\n 1\n V\n 5\n " 
+0

ありがとう。私はargとブロックの間の優先順位の違いを理解していませんでした。完璧! –

+1

このような長い畳み込みの補間を使うと、このコードを読みにくくすることができます。それは本当にメソッド呼び出しにする必要があります。 @ tadmanが合意した。 – tadman

+0

ブロックは私にこれをさせる。コードが今すぐ消去されます。 –

関連する問題