data-science

0熱

1答えて

私のウェブサイトで検索したユーザーのログと、入力した検索結果と、クリックした結果があります。私は検索アルゴリズムを改善したいと思います。しかし、まず品質を測定する方法が必要です。私はAmazon Turkなどでデータを収集し、人間にテストスイートを作成させることができます。しかし、私は自分のウェブサイトのログですでに利用可能なデータを使用したいと思います。どのように私はこれを行うことができ、ど

2熱

1答えて

H2o MOJOモデルを見て、訓練されたトレーニングデータのデータ型をどのように把握できますか？

H2o MOJOモデルを見て、訓練されたトレーニングデータのデータ型を把握する方法はありますか？

-3熱

1答えて

ビジネスデータ分析の問題を対象としたデータセットとチュートリアル

私は、特にビジネスデータ分析の問題を対象とするデータセットとチュートリアルを探しています。私はKaggleについて知っていますが、主な焦点は機械学習と関連する問題/問題です。データ分析の問題に関するブログやダンプを知ることは素晴らしいことでしょう。または、良い読書であるかもしれませんか？

0熱

2答えて

Tensorflow CNNでメモリが多すぎるのはなぜですか？

私は深く学ぶのが初めてで、私はTensorflow train a cnnを使って画像認識を行っています。トレーニング画像はすべて128ピクセル* 128ピクセル* 3チャネルです。私のネットワークでは、3つのconvレイヤー、3つのmaxpoolingレイヤー、1つの完全に接続されたレイヤーがあります。私は180,000以上のラベル画像を持っているので、私はそれぞれのバッチで4000枚の画像を練

2熱

1答えて

機械学習モデルの機能としてテキストセンチメントを使用しますか？

私は、私が持っているデータを使って、私のマシン学習モデルにどのような機能があるのかを研究しています。私のデータには多くのテキストデータが含まれているので、貴重な機能を抽出する方法が不思議でした。私のこれまでの考え方とは異なり、これはしばしばBag-of-wordsやword2vecのような表現で構成されています：（http://scikit-learn.org/stable/modules/f

0熱

1答えて

XLRD by Pandas

pd.read_excel（）を試してみると、次のエラーが表示されます。このエラーはコンピュータに固有のものです。同じファイルを持つ別のコンピュータでスクリプトを実行すると、エラーは発生しません。 Python 3.6.1のAnacondaディストリビューションパンダのバージョン'0.20.3'、Xlrdのバージョン'1.1.0'： XLRDError: Unsupported format, o

0熱

2答えて

特定の列のdplyr行を結合または反復する

2人の間のチャットの会話を含むデータセットがあります。私はデータセットを結合してPerson 1とPerson 2の行ごとの会話にしたいと思っています。人は複数の文章を入力することがあり、データフレーム内で複数のレコードとして表示されることがあります。これは私が把握しようとしている疑似コードです。 line_textは、最新の時間で更新されるようにタイムスタンプを組み合わせることするならば

0熱

1答えて

機械学習を使用したJSONドキュメントクラスタリング

ドキュメントクラスタリングを実行しようとしています。入力形式は、String型とNumber型のさまざまなキーと値を持つJSON Stringです。キーの種類と値に応じて、自分のようなタイプの文書をクラスタリングできるはずです。例：JSONドキュメント：マッチングパラメータに基づいて {"title":0, "brand":"Levis", "length":"28,30,32,34,36",

-1熱

1答えて

機械学習をプロジェクトに適用できるかどうかを確認するには？

私は自分の街が持っている自転車レンタルサービスのデータをMySQLデータベースに記録する個人プロジェクトに取り組んでいます。スクリプトは30分ごとに実行され、各自転車ステーションと無料の自転車のデータを記録します。次に、私のデータベースでは、その時点での各日の各ステーションの可用性を平均して、現在のように2か月間のデータロギングを伴う予測としています。機械学習で少し読んだことがありますが、少し勉