データフレームのt検定ループの速度を向上させようとしています。 大きなデータフレーム(〜15000行と205列)があります。各列は細胞であり、各行は遺伝子である。別の参照表で提供されているIDに基づいて列を2つのグループにグループ化できます。ここで は、私が書いたループです: for (i in 1:nrow(EC)){
ttest_result[i,2] <- rowMeans(EC)
私はデータフレームを通り、ttestsを実行し、各ttestのp値を別のデータフレームに格納します。 ここで、 'mydata'はttestsが実行されているデータフレームです。 'マイデータ' は4列のデータフレームである:ここでは df <- mydata
mydf <- data.frame(c(1:4))
# this is the new dataframe being initi
私は、pandasモジュールを使用してPythonでt検定を試みています。ただし、ターゲットファイルが見つからない同じエラーが発生し続ける。この場合、ターゲットファイルはbrain_size.csvで、セパレータはセミコロンです。空白のままの値はピリオドで表されます。 import pandas as pd
data = pd.read_csv('This PC\Desktop\brain_si