graphlab

9熱

2答えて

私は約20GBの巨大なデータセットを持っています。私はgraphlab.SFrame.read_csv（）を使ってデータを読みました。私はyyyy-dd-mmの形式で文字列として読み込まれる日付列を持っています。しかし、私は列をdatetimeオブジェクトとして読み取る必要があります。どうしたらいいですか？私は1つの方法は、それぞれの行を反復し、Pythonコードを使用してそれを変更することであ

5熱

3答えて

与えられた分布に基づいてデータフレームをサンプリングする

与えられたクラス\ラベル分布値に基づいてpandasデータフレームまたはグラフラブsframeをサンプリングするにはどうすればいいですか？たとえば、\ classカラムを持つデータフレームをサンプリングして、各クラスラベルは均等にフェッチされ、それによってクラスラベルの一様な分布に対応する各クラスラベルについて同様の頻度を有する。あるいは、私たちが望むクラスの分布に従ってサンプルを得ることが最善で

0熱

1答えて

sframeロジスティッククラシファイアを作成する

私はgraphlab-createを使ってロジスティッククラシファイアを構築しています。：私はこのコードを実行するとただし products = sframe.SFrame('amazon_baby.gl/' products = products[products['rating'] != 3] products['sentiment'] = products['rating'].appl

0熱

1答えて

Pythonの日時 - 計算の速度 - 大きなデータ

データフレーム内の2つの列（具体的にはgraphlab SFrameデータ構造）の違いを（日単位で）探したいと思います。これを行うためにいくつかの関数を記述しようとしましたが、十分に速い関数を作成できないようです。処理速度は8000万〜8000程度です。私は2つの異なる機能を試してみましたが、両方は遅すぎる： t2_colname_strとt1_colname_str引数は、私が使用したいの列

1熱

1答えて

GraphlabまたはPythonで特定の行を探す

Graphlabで私は大きなリストからムービーの小さなサブセットを使って作業しています。 movieIds_5K_np = LL_features_SCD_min.to_numpy()[:,0] ratings_33K_np = ratings_33K.to_numpy() movieIds_5K_npは、私のmovieIdsを含む配列です。 `ratings_33K_np 'は、

0熱

1答えて

Graphlab recommend（）を使用して新規ユーザーに推奨を提供するには？

Graphlab 私はgive（）メソッドを使用して、与えられたデータセットから準備された訓練されたモデルには存在しない新しいユーザー（user_id）の推奨方法を確認しようとしています。目的は、この推奨モデルを使用して同様のユーザーを決定することですので、new_user_dataをrecommend（）に渡しますが、既存のユーザーのアイテム評価と同じ評価で同じ評価を返すかどうかを確認します。こ

5熱

2答えて

分割を考えると、3つのカラム（年月日）

にGraphlab SFrame日付欄graphlab日付を持つ列、たとえばありますSFrame： +-------+------------+---------+-----------+ | Store | Date | Sales | Customers | +-------+------------+---------+-----------+ | 1 | 2015-07-31 | 5