私は、行ごとに分析している大きなデータセットを持っています。例示的なデータラインは100 0 0 100 1 0 100 2 0 100 3 0 100 4 0
である。ここでは、100
に続く2つのエントリには、データについての情報(英語に解読された)が含まれています。したがって、100
の後の最初のエントリは常にその値(0,1,2,3または4のいずれか)に基づいて解読され、100
の後の2番目のエントリは常にエントリ1の値に基づいて解読されます(つまりエントリ1 = 0エントリ2 = ____、またはエントリ1 = 1エントリ2 = _____などなど)。異なるリストの長さのインデックスによるPython変数の割り当て
データラインをdata
にリストとして保存しました。 100
の後には常に2つのエントリがありますが、100
が何行あるかはわかりません。例のデータ行は100
という5つのインスタンスがありますが、他の行にはインスタンス数はありません。
現在のコード:
data = [num for num in column[2:] if num != 100]
entry1 = data[1]
entry2 = data[2]
info_dict1 = {0: 'absolute', 1: 'minimum', 2: 'maximum', 3: 'median', 4: 'mode'}
info1 = info_dict1.get(entry1, 'not found')
info_dict2 = {'absolute': 'value', 'minimum': 'increase', 'maximum': 'increase'}
info2 = info_dict2.get(info1, 'not found')
print(info1, info2)
私は100
の未知の出現とデータラインのために働くために、これを取得する問題を抱えています(無視column
が、それは私がdata
を確立するために使用されるオリジナルのリストです)。私はまた、正確なPythonicソリューションを見つけることに苦労しています。私は結果がどのように見えることを期待してサンプルデータについては
は: absolute value minimum increase maximum increase median not found mode not found
100の次のエントリは、常に(提供される例のラインのように、すなわち最初のエントリを命じていないことをノートに重要です0〜4の数字が可能で、2番目の入力は最初の入力に応じて変わります)