は、私は簡単な辞書でsklearn
からLabelBinarizer
のパフォーマンスを比較しようとしています:2.9169740676879883秒---SklearnのLabelBinarizerが遅いのはなぜですか? ---:
start_time = time.time()
result = lb.transform(sample_list*1000000)
print("--- %s seconds ---" % (time.time() - start_time))
そして、このコードが実行---:
from sklearn.preprocessing import LabelBinarizer
import time
sample_list = list('abcdefg')
lb = LabelBinarizer()
lb.fit(dep_tag_list)
lb_t = lb.transform(sample_list)
sample_dict = {key:value for (key,value) in zip(sample_list, lb_t)}
このコードは走りました0.6299951076507568秒---
start_time = time.time()
result = [sample_dict[el] for el in sample_list*1000000]
print("--- %s seconds ---" % (time.time() - start_time))
りんごとリンゴを比較していますか?なぜLableBinarizerが遅いのですか?
ご回答いただきありがとうございます。私はそれをパンダのget_dummiesと比較することがより適切だと思う。 get_dummiesはまだ高速です – user1700890
@ user1700890 get_dummiesはまだ私が言及したすべてのチェックを実行しないので、 –
申し訳ありませんが、私は明確ではありませんでした。 get_dummiesはlabelbinarizerより高速です – user1700890