2016-12-29 24 views
0

、Scalaのコードは次のとおりです。のpython関数型プログラミングpyspark

val artistByID = rawArtistData.map { line => 
val (id, name) = line.span(_ != '\t') 
(id.toInt, name.trim) 
} 

は、誰かがそうするのpythonを使用する方法を知っていますか?大いに感謝する!あなたは、以下の入力を持つテストファイルを持っている場合、あなたが望むものを達成するために

+0

何ですか?それは "1234名"のようなものですか? – Har

+2

linesFromFile = ["1234 name"、 "5555 name2"]; [(id、name)for id、line.split()の名前(linesFromFileの行) – Har

+0

が正しい!ありがとうございました! – Jingwei

答えて

0

一つの方法は、次のとおりです。あなたは次のようなペアのリストを与えるだろう

1234 name1 
1235 name2 
1236 name3 
1237 name4 

with open("test.txt", "r") as test_file: 
    id_name_lines = test_file.readlines() 

id_name_records = [(id, name) for l in lines for id,name in [tuple(l.split())]] 

[('1234', 'name1'), ('1235', 'name2'), ('1236', 'name3'), ('1237', 'name4')] 
関連する問題