graphlab

    9

    2答えて

    私は約20GBの巨大なデータセットを持っています。私はgraphlab.SFrame.read_csv()を使ってデータを読みました。私はyyyy-dd-mmの形式で文字列として読み込まれる日付列を持っています。しかし、私は列をdatetimeオブジェクトとして読み取る必要があります。どうしたらいいですか? 私は1つの方法は、それぞれの行を反復し、Pythonコードを使用してそれを変更することであ

    5

    3答えて

    与えられたクラス\ラベル分布値に基づいてpandasデータフレームまたはグラフラブsframeをサンプリングするにはどうすればいいですか?たとえば、\ classカラムを持つデータフレームをサンプリングして、各クラスラベルは均等にフェッチされ、それによってクラスラベルの一様な分布に対応する各クラスラベルについて同様の頻度を有する。あるいは、私たちが望むクラスの分布に従ってサンプルを得ることが最善で

    0

    1答えて

    私はgraphlab-createを使ってロジスティッククラシファイアを構築しています。 :私はこのコードを実行するとただし products = sframe.SFrame('amazon_baby.gl/' products = products[products['rating'] != 3] products['sentiment'] = products['rating'].appl

    0

    1答えて

    データフレーム内の2つの列(具体的にはgraphlab SFrameデータ構造)の違いを(日単位で)探したいと思います。 これを行うためにいくつかの関数を記述しようとしましたが、十分に速い関数を作成できないようです。処理速度は8000万〜8000程度です。 私は2つの異なる機能を試してみましたが、両方は遅すぎる: t2_colname_strとt1_colname_str引数は、私が使用したいの列

    1

    1答えて

    Graphlabで 私は大きなリストからムービーの小さなサブセットを使って作業しています。 movieIds_5K_np = LL_features_SCD_min.to_numpy()[:,0] ratings_33K_np = ratings_33K.to_numpy() movieIds_5K_npは、私のmovieIdsを含む配列です。 `ratings_33K_np 'は、

    0

    1答えて

    Graphlab 私はgive()メソッドを使用して、与えられたデータセットから準備された訓練されたモデルには存在しない新しいユーザー(user_id)の推奨方法を確認しようとしています。目的は、この推奨モデルを使用して同様のユーザーを決定することですので、new_user_dataをrecommend()に渡しますが、既存のユーザーのアイテム評価と同じ評価で同じ評価を返すかどうかを確認します。こ

    5

    2答えて

    にGraphlab SFrame日付欄graphlab日付を持つ列、たとえばありますSFrame: +-------+------------+---------+-----------+ | Store | Date | Sales | Customers | +-------+------------+---------+-----------+ | 1 | 2015-07-31 | 5