sparse-matrix

    2

    1答えて

    私はNAの要素をいくつか含んだ行列を持っています(例えば、mat)。NA値を隠して(つまり、funとして)印刷する新しい関数を作りたいと思います。どうすればこれを達成できますか? mat <- cbind(c(1,2,NA,NA),c(3,3,3,NA),c(NA,4,4,4),c(NA,NA,5,5)) print(mat) [,1] [,2] [,3] [,4] [1,] 1

    1

    1答えて

    私が作業しているライブラリをスピードアップしたいと思います。ほとんどの行列はかなり小さいサイズです(たとえば最大10x40)。ほとんどが実行時に知られているスパース性のパターンで、スパースなブロックです。線形代数演算を高速化するために希薄化を使用したいと思います。 基本的な線形代数演算に加えて、私はSVD分解を使用します。ブロックスパース行列は、ゼロの列/行を検出するのに役立ち、分解時間を短縮でき

    1

    1答えて

    (正規化された)スパース隣接行列とそれぞれの行列行のラベルのリストが与えられました。いくつかのノードは別のサニタイズ関数によって削除されているため、行列にNaNを含む行がいくつかあります。これらの行を見つけて、とそれぞれのラベルを削除したいと思います。ここで私が書いた機能は次のとおりです。 def sanitize_nan_rows(adj, labels): # convert to

    1

    1答えて

    hstack関数の助けを借りて、2スパース行列を連結しようとしています。 xtrain_catはDictVectorizer(カテゴリ値をコード化する)の出力であり、xtrain_numはpandas cvsファイルです。 xtrain_num = sparse.csr_matrix(xtrain_num) print type(xtrain_num) print xtrain

    -1

    1答えて

    これは私の最初の何かを投稿するので、素敵にしてください! 私はランダムウォーカーアルゴリズムに関するコードを勉強しています。スパースの使用で失われてしまい、ポイントとエッジのスパースラプラシアン行列を作ることはできません。私はスパース関数の独自のコードを作成するつもりですが、どのように動作するのか、それの出力を理解するのに問題がありますので、どんなヘルプも完璧です。 ありがとうございました!

    1

    1答えて

    私は2つのCSVファイルを持っています - 列車とテスト、それぞれ18000件のレビュー。列車ファイルを使用して、特徴抽出を行い、列車ファイル内の各レビューとテストファイル内の各レビューとの間の類似性メトリックを計算する必要があります。 列車の単語とテストセットに基づいてボキャブラリを生成しました。私はストップワードを削除しましたが、タイプミスとステムは削除しませんでした。 私が直面している問題は

    2

    1答えて

    私はpandas DataFrameオブジェクトに基づいてツーリングを開発しています。私は、それを行ごとにdtype( 'O')のリスト/ numpy配列に変換することなく、Scipyの疎な行列をDataFrameの列として保持したいと考えています。 パンダは、行列をスカラーとして扱い、インデックスを追加することを提案しているため、以下のスニペットは機能しません。行列の行インデックスにpd.Ran

    2

    1答えて

    私は巨大な&の機械学習アルゴリズムを書いています(私の行列は形状です(347,5186 812 801)が、非常にまばらです。データのわずか0.13%はゼロではありません。 マイスパース行列のサイズは、105 000バイト(< 1Mバイト)であるとcsr型である。 私はそれぞれの例インデックスのリストを選択することにより、別の列車/テスト・セットにしようとしている。 だから私 training_s

    0

    2答えて

    を推測することはできませんここでのpython SSCCEだ: import scipy.sparse data = [] row = [] col = [] csr = scipy.sparse.csr_matrix((data, (row, col))) #error happens here print(type(csr)) print(csr) 私はエラーを取得するpyth