Azureデータレイクストアに格納されている巨大なファイルをネストJSONからCSVに変換する必要があります。 Pythonモジュールpandas、numpyはAzureデータレイク解析でサポートされているので、標準モジュールとは別にPythonを使用してこれを実現することは可能です。誰もこれを達成するためのPythonコードを持っていますか?AzureデータレイクストアでJSONをCSVに変換するPythonを使用したU-SQL
ソース形式:
{ "のLoc": "TDM"、 "トピック": "位置"、 "LocMac":「位置/ FE:7A:XX:XX:XX:XX "、" seq ":" 296083773 "、"タイムスタンプ ":1488986751、" op ":" OP_UPDATE "、" topicSeq ":" 46478211 "、" sourceId ":" AFBWmHSe "、" location ":{" staEthMac " "addr": "/ xxxxx"}、 "staLocationX":1643.8915、 "staLocationY":571.04205、 "errorLevel":1076、 "associated":0、 "campusId": "n5THo6IINuOSVZ/cTidNVA =="、 "buildingId" "ALETM"、 "unit": "FEET"}、 "EventProcessedUtcTime"は、 "7hY/xx =="、 "floorId": "xxxxxxxxxx + BYoo0A =="、 "hashedStaEthMac": "xxxx/pMVyK4Gu9qG6w ="、 "locAlgorithm": "ALGORITHM_ESTIMATION" ":" 2017-03-08T15:35:02.3847947Z "、" PartitionId ":3、" EventEnqueuedUtcTime ":" 2017-03-08T15:35:03.7510000Z "、" IoTHub ":{" Mess 「EnqueuedTime」:「0001-01-01T00:00:00.0000000」、「StreamId」:NULL}}:null、「CorrelationId」:null、「ConnectionDeviceId」:「xxxxx」、「ConnectionDeviceGenerationId」:「636243184116591838」、「EnqueuedTime」
期待出力
TDM、位置、場所/ 80:7A:BF:D4:D6:50,974851970,1490004475、OP_UPDATE、151002334、XXXXXXX、GHQ/1NZQ、977.7259、 638.8827,490,1、n5THo6IINuOSVZ/cTidNVA ==、7hY/jVh9NRqqxF6gbqT7Jw ==、LV/ZiQRQMS2wwKiKTvYNBQ ==、H5rrAD/jg1Fnkmo1Zmquau/Qn1U =、ALGORITHM_ESTIMATION、FEET