sqldf

    8

    1答えて

    約250個の変数を持つデータフレームがあります。残念ながら、これらの変数はすべて、sqldfを使用してSQLデータベースから文字クラスとしてインポートされました。 問題:すべてが文字クラスであってはいけません。数値変数、整数、および日付があります。私はすべての変数を実行するモデルを構築したいと思います。これを行うには、変数に正しいクラスがあることを確認する必要があります。それを1つずつ行うのがおそ

    0

    1答えて

    からその名前で列を取得します。 このSQLデータベースのdata.frameの名前から特定の列を取得する方法があるかどうかは疑問でした。 その名前で行をフェッチするために、このコードは動作します: #let's say the row names I want to select from the data.frame are in a vector called selected_row_nam

    1

    1答えて

    私はRの中で、NULLでないすべての非X.1変数を選択するためにsqldfを使って、 "11/12/2015"と9AMでループクエリを実行したいと思います。例: StartDate X.1 11/12/2015 09:14 A 11/12/2015 09:36 11/12/2015 09:54 A 日は、他のクエリから nullob<-0 dayminnull<-as.n

    1

    1答えて

    背景: Iが正常read.csv()関数を使用してインターネットから(以下のコードに示されている)特定のデータセットを引っ張ることができます。しかし、read.csv.sql()を使用して処理を高速化するためにsqldfパッケージを使用しようとすると、エラーが発生します。私は様々な解決策を試しましたが、この問題を解決できないようです。私が正常にデータを引っ張って、私は次のコードを使用してread.

    3

    2答えて

    1つのデータセット内の変数(またはゲノムに沿った位置)が2番目(遺伝子開始/停止位置)の範囲内に収まる2つのデータセットに参加しようとしています。ただし、位置はユニークではなく、追加の列(染色体)内にネストされます。遺伝子開始/停止位置についても同じことが言えます。私の目標は、それぞれの位置を対応する注釈と効果とリンクさせることです。例えば : library(sqldf) set.seed(1

    1

    2答えて

    次の表があります。同じ訪問者(ブラウザ)に30分以上の差がある2つの固有のタイムスタンプがある場合、これらは次のように仮定して固有セッションの数を計算します。 2つのユニークセッションとみなされます。 ブラウザが独自に各ユーザーを識別している タイムスタンプは、時間 ページで日付であるので、論理与えられ、上記ダミーテーブルに基づいて、私は3つのユニークなセッションを取得する必要がありますURLペー

    1

    1答えて

    私はsqldf()とunique()の2つのベクトルを持っています。それらは同一でなければなりません。 forループを使って各要素を検査すると、2つのベクトルは同じですが、2つのベクトルのsame()はFALSEを返します。何か案は? options(sqldf.driver = "SQLite") options(gsubfn.engine = "R") library(sqldf) ur

    0

    2答えて

    pandasqlを使用して「SELECT 1」というsql-queryを実行します。しかし、エラーがあります: import pandas as pd import pandasql as ps s = """ SELECT 1 """ print(ps.sqldf(s, locals())) 、私を助けてください:ここ Traceback (most recent call la

    -2

    1答えて

    私は日のデータを持つデータセット(1行は1行)を扱っています - 製品の(それが宣伝されている)それはユーザによって見られているか、またはアクションがとられているかどうかです。 このデータセットで分析を実行する前に、Rのデータセットを分析する前に、製品の数とアクションの回数の差があるすべての日を除外する方法でデータをフィルタリングする必要があります取られて2で、ビューは3 ある私はR内のSQL文に

    6

    3答えて

    私のデータフレームには、欠損値を含む変数が"NA"のような文字列として含まれています。これらを含むデータフレーム内のすべての列を解析し、is.na()などの機能によってキャッチされた実際のNAsに変換する最も効率的な方法は何ですか? 私はsqldfを使用してデータベースに問い合わせています。 再現例: vect1 <- c("NA", "NA", "BANANA", "HELLO") vect2