はscript.py
と呼ばれ、私はプログラムを持っているとしますスクリプトを再実行するとrandom_stateが維持されますか?
import pandas as pd
import numpy as np
from sklearn.cross_validation import train_test_split
if __name__ == "__main__":
df = pd.DataFrame({"x": [1,2,3,4,5,6,6,5,6,3], "y": [1,1,0,0,0,0,1,0,0,1]})
train, test = train_test_split(df, test_size = 0.20, random_state = 100)
私はかつて私のコマンドラインからこのスクリプトを実行する場合:
H:\>python script.py
は、どのように私は(以降の実行でtrain
とtest
データフレームことを確認することができますすなわち、私がscript.py
を再度実行したとき)は、以前の反復のデータフレームのtrain
とtest
と同じですか?私はrandom_state
が動作していないことを知っていますが、明日戻ってPCの電源を入れなおしてscript.py
を再実行すれば、train
とtest
セットの同等性は維持されますか?
異なる機械学習アルゴリズムの精度をテストしています。これらはすべて異なるスクリプトに保存されています。そのため、電車とテストセットがスクリプト全体で同一であることを確認したいのです。
同じ形状のDataFrameの場合、同じ分割が返されます。あなたはあなたの例でそれを試すことができます。私はテストデータセットにインデックス7と6を持っています。あなたは同じものを持っているべきです。 – ayhan