2012-03-07 7 views
1

私は10のフィールドと3,000万以上の行を持つ単一のデータベーステーブルを持っています。これはテーブルの格納には理想的ですが、1つの列を検索するだけで済みますが、残りは返す必要があります。大きなSQLデータベースをAzureテーブルストレージにアップロード

データベースから行を取得してテーブルストレージにアップロードするプログラムを作成しましたが、この速度で完了するには最低9〜10日かかります。

完全なテーブルをazureテーブルのストレージに簡単にアップロードする方法はありますか?ここで

答えて

0

クラウドストレージメーカー、ある私は、彼らがアップロードをマルチスレッドと信じに建てられたこの機能を備えている。けれども私の避難所」特にチェックされていません。それはまだインターネット上でしばらく時間がかかります。

生データをBLOBストレージにアップロードし、BLOBを読み込んでテーブルストレージに書き込む同じデータセンターで実行できるWorkerRoleを書き込むことが、おそらく最も速いことでしょう。たくさんのスレッドと優れたパーティショニング戦略があれば、かなり速く進むことができます。しかし、それを実装する時間は、単に「遅い」方法を実行することによる節約よりも大きいかもしれません。

2

は、あなたのパフォーマンスを改善しようとすることができますいくつかのヒントhttp://social.technet.microsoft.com/Forums/en-US/windowsazuredata/thread/d84ba34b-b0e0-4961-a167-bbe7618beb83 Cerebrataからcommmercialパッケージです

+0

を、これは素晴らしいですし、私はまだ証拠弾丸たいと思い、わずかな量の速度を助け一方で、「ここに私のテーブル/ csvファイルがありますファイル "と私のクラス定義は、ここに行くとそれをインポートします。 – LongArm

1

データセンター内で最高のパフォーマンスを発揮します。そのような多くのデータを本当に持っているならば、すべてをブロブとして圧縮し、ブロブをストレージにアップロードしてから、同じデータセンターで実行しているコンテンツをダウンロードし、解凍して挿入しておく価値があります。それは遠隔で試みるよりもはるかに速いです。

パーティションキーでデータを注文することもできます。一度にデータをバッチ(100エントリまたは4MB相当)で挿入できます。バッチで並列化することもできます。

これはあなたのためにこれを行うことはわかりませんので、あなたは今すぐ自分でこれを書く必要があります。

0

非常に大きなデータセットをロードできるストアドプロシージャはここにあります。一度に1つのテーブルを作成しなければならず、いくつかの注意点がありますが、これで10分で7GBまたは約1,000万行をアップロードしました。

私はここで作成したコードプロジェクトの記事の詳細情報: http://www.codeproject.com/Articles/773469/Automating-Upload-of-Large-Datasets-to-SQL-Azure

/*--------------------------------------------------------------------------------------------------------------------------------------------------------- 

    Document Title: usp_BulkAzureInsert.sql 
    Script Purpose: Dynamically insert large datasets into Azure 

    Script Notes: 1) This assumes the current user has write access to the C drive for file copy 
         If the current windows user does not have access override by hardcoding in an export folder location 
         Leave ExportFolder as 'NULL' for C:\User\CurrentUser\AzureExports 
        2) User must have permission to create permanent tables (dropped at the end of the script but used for staging) 

    Parameters: @DB_Schema_Table = DatabaseName.Schema.TableName (3 part no server) 
       @AzureTableName = DatabaseName.Schema.TableName (3 part no server) 
       @AzureServer  = Azure Server location ending in .net (no HTTP) 
       @AzureClusteredIDX = Azure requires each table to have a clustered index. Comma delimited index definition. 
       @AzureUserName  = Azure User Name 
       @AzurePassword  = Azure Password 
       @ExportFolder  = 'NULL' defaults to C:\User\CurrentUser\AzureExports - Use this to override 
       @CleanupDatFiles = Set to 1 to delete the directory and files created in the upload process 
       @ViewOutput  = Set to 1 to view insert information during upload    

     --Sample Execution 
     EXECUTE usp_BulkAzureInsert 
       @DB_Schema_Table = 'MyDatabase.dbo.Customers', 
       @AzureTableName = 'AZ001.dbo.Customers', 
       @AzureServer  = 'abcdef123.database.windows.net', 
       @AzureClusteredIDX = 'CustomerID, FirstName, LastName', 
       @AzureUserName  = 'AzureUserName', 
       @AzurePassword  = 'MyPassword123', 
       @ExportFolder  = 'NULL', 
       @CleanupDatFiles = 1, 
       @ViewOutput  = 1 

-----------------------------------------------------------------------------------------------------------------------------------------------------------*/ 

    IF OBJECT_ID (N'usp_BulkAzureInsert', N'P') IS NOT NULL 
    DROP PROCEDURE usp_BulkAzureInsert; 
    GO 

    CREATE PROCEDURE usp_BulkAzureInsert     
      @DB_Schema_Table NVARCHAR(100), 
      @AzureTableName  NVARCHAR(100), 
      @AzureClusteredIDX NVARCHAR(100), 
      @AzureServer  NVARCHAR(100), 
      @AzureUserName  NVARCHAR(100), 
      @AzurePassword  NVARCHAR(100), 
      @ExportFolder  NVARCHAR(100), 
      @CleanupDatFiles BIT, 
      @ViewOutput   BIT 
    AS 

/*--------------------------------------------------------------------------------------------------------------------------------------------------------- 
    Start with Error Checks 
-----------------------------------------------------------------------------------------------------------------------------------------------------------*/ 

    IF (SELECT CONVERT(INT, ISNULL(value, value_in_use)) FROM sys.configurations WHERE name = N'xp_cmdshell') = 0 
     BEGIN 
      RAISERROR ('ERROR: xp_cmdshell is not enable on this server/database',16,1) 
      RETURN 
     END 

/*--------------------------------------------------------------------------------------------------------------------------------------------------------- 
    Declare and Set Script Variables 
-----------------------------------------------------------------------------------------------------------------------------------------------------------*/ 

    IF (@ViewOutput = 1) 
     BEGIN 
      SET NOCOUNT ON; 
     END 

    DECLARE @CMD NVARCHAR(1000), @SQL NVARCHAR(MAX), @i TINYINT = 1, @NTILE VARCHAR(10), @NTILE_Value TINYINT, @TempTableName VARCHAR(1000), 
      @ColumnNames NVARCHAR(MAX), @TableName VARCHAR(100), @Server NVARCHAR(100) 

    --Set the export folder to the default location if the override was not used 
    IF @ExportFolder = 'NULL' 
     BEGIN 
      SET @ExportFolder = N'C:\Users\' + 
           CAST(REVERSE(LEFT(REVERSE(SYSTEM_USER), CHARINDEX('\', REVERSE(SYSTEM_USER))-1)) AS VARCHAR(100)) + 
           N'\AzureExports'; 
     END; 

     --Set a permanent obejct name based on 
     SET @TempTableName = (LEFT(@DB_Schema_Table, CHARINDEX('.',@DB_Schema_Table)-1) + 
           '.dbo.TempAzure' + 
           CAST(REVERSE(LEFT(REVERSE(@DB_Schema_Table), CHARINDEX('.', REVERSE(@DB_Schema_Table))-1)) AS VARCHAR(100))) 

/*--------------------------------------------------------------------------------------------------------------------------------------------------------- 
    Calculate the amount of files to split the dataset into (No more than 250,000 lines per file) 
-----------------------------------------------------------------------------------------------------------------------------------------------------------*/ 

     SET @SQL = ' SELECT @NTILE = CEILING((CAST(COUNT(*) AS FLOAT)/250000)) FROM ' + @DB_Schema_Table +'; ';  

     EXECUTE sp_executesql @SQL, N'@NTILE VARCHAR(100) OUTPUT', @NTILE = @NTILE OUTPUT;  
     SET @NTILE_Value = CAST(@NTILE AS TINYINT); 

     SET @TableName = CAST(REVERSE(LEFT(REVERSE(@DB_Schema_Table), CHARINDEX('.', REVERSE(@DB_Schema_Table))-1)) AS VARCHAR(100)); 
     SET @Server = (SELECT @@SERVERNAME); 

/*--------------------------------------------------------------------------------------------------------------------------------------------------------- 
    Create a folder to stage the DAT files in 
-----------------------------------------------------------------------------------------------------------------------------------------------------------*/ 

    --Remove the directory if it already exists and was not previously deleted 
    SET @CMD = N'rmDir /Q /S ' + @ExportFolder; 
    EXECUTE master.dbo.xp_cmdshell @CMD, NO_OUTPUT; 

    --Create a folder to hold the export files 
    SET @CMD = N' mkDir ' + @ExportFolder; 
    EXECUTE master.dbo.xp_cmdshell @CMD, NO_OUTPUT; 

/*--------------------------------------------------------------------------------------------------------------------------------------------------------- 
    Create a staging table that breaks the file into sections based on the NTILE_Value 
-----------------------------------------------------------------------------------------------------------------------------------------------------------*/ 

     --Find the names of the columns in the table 
     IF OBJECT_ID('tempdb.dbo.#ColumnNames') IS NOT NULL 
     DROP TABLE #ColumnNames 
     CREATE TABLE #ColumnNames 
     (
      ColumnOrder INTEGER IDENTITY(1,1) NOT NULL, 
      ColumnName NVARCHAR(100) NOT NULL 
     ); 
      INSERT INTO #ColumnNames 
      SELECT COLUMN_NAME 
      FROM information_schema.columns 
      WHERE table_name = @TableName 
      ORDER BY ordinal_position 

     --Create a list of the column names 
     SELECT @ColumnNames = COALESCE(@ColumnNames + ', ', '') + CAST(ColumnName AS VARCHAR(MAX)) 
           FROM #ColumnNames; 

     --Split the results by the NTILE_Value 
     DECLARE @Column1 NVARCHAR(100) = (SELECT ColumnName FROM #ColumnNames WHERE ColumnOrder = 1); 

     SET @SQL = ' IF OBJECT_ID(''' + @TempTableName + ''') IS NOT NULL 
        DROP TABLE ' + @TempTableName + ' 

        SELECT ' + @ColumnNames + ', ' + ' 
          NTILE(' + @NTILE + ') OVER(ORDER BY ' + @Column1 + ') AS NTILE_Value 
        INTO ' + @TempTableName + ' 
        FROM ' + @DB_Schema_Table 
     EXECUTE (@SQL); 

     --Now split the dataset into equal sizes creating a DAT file for each batch 
     WHILE @i <= @NTILE_Value 
      BEGIN 

       SET @SQL = 'IF OBJECT_ID(''' + @TempTableName + 'DatFile'') IS NOT NULL 
          DROP TABLE ' + @TempTableName + 'DatFile 

          SELECT ' + @ColumnNames + ' 
          INTO ' + @TempTableName + 'DatFile 
          FROM ' + @TempTableName + ' 
          WHERE NTILE_Value = ' + CAST(@i AS VARCHAR(2)) + ' 

          CREATE CLUSTERED INDEX IDX_TempAzureData ON ' + @TempTableName + 'DatFile (' + @AzureClusteredIDX + ')'; 
       EXECUTE (@SQL); 

       SET @CMD = N'bcp ' + @TempTableName + 'DatFile out ' + 
        @ExportFolder + N'\' + @TableName + 'DatFile' + 
        CAST(@i AS NVARCHAR(3)) + '.dat -S ' + @Server + ' -T -n -q'; 

       IF (@ViewOutput = 1) 
       BEGIN 
        EXECUTE master.dbo.xp_cmdshell @CMD; 
       END 
       ELSE 
        EXECUTE master.dbo.xp_cmdshell @CMD, NO_OUTPUT; 

       SET @i += 1; 
      END 

     --Clean up the temp tables 
     SET @SQL = ' DROP TABLE ' + @TempTableName; 
     EXECUTE (@SQL); 

     SET @SQL = ' DROP TABLE ' + @TempTableName + 'DatFile' ; 
     EXECUTE (@SQL); 

/*--------------------------------------------------------------------------------------------------------------------------------------------------------- 
    Insert the data into the AzureDB 
-----------------------------------------------------------------------------------------------------------------------------------------------------------*/ 

     --Reset the Variable 
     SET @i = 1; 

     --Move each batch file into the DB 
     WHILE @i <= @NTILE_Value 
      BEGIN    
       SET @CMD = N'Bcp ' + @AzureTableName + ' in ' + 
          @ExportFolder + N'\' + @TableName + 'DatFile' + CAST(@i AS NVARCHAR(2)) + '.dat -n -U ' + 
          @AzureUserName + '@' + LEFT(@AzureServer, CHARINDEX('.',@AzureServer)-1) + 
          N' -S tcp:' + @AzureServer + 
          N' -P ' + @AzurePassword;  

       IF (@ViewOutput = 1) 
       BEGIN 
        EXECUTE master.dbo.xp_cmdshell @CMD; 
       END 
       ELSE 
        EXECUTE master.dbo.xp_cmdshell @CMD, NO_OUTPUT; 

       SET @i += 1; 
      END 

/*--------------------------------------------------------------------------------------------------------------------------------------------------------- 
    Cleanup the finished tables 
-----------------------------------------------------------------------------------------------------------------------------------------------------------*/ 

    IF (@CleanupDatFiles = 1) 
     BEGIN 
      SET @CMD = N'rmDir /Q /S ' + @ExportFolder; 
      EXECUTE master.dbo.xp_cmdshell @CMD, NO_OUTPUT; 
     END 

/*--------------------------------------------------------------------------------------------------------------------------------------------------------- 
    Script End 
-----------------------------------------------------------------------------------------------------------------------------------------------------------*/ 

    IF (@ViewOutput = 1) 
     BEGIN 
      SET NOCOUNT OFF; 
     END 
+0

大量のT-SQLですが、Azure SQLへのアップロードを扱っているので質問に正しく答えることはできません。Azure Table Storage(NoSQL)にアップロードする方法を質問しています。 Azure SQLにアップロードするための素晴らしい手順ですか、何か不足していますか? –

関連する問題