2016-11-07 8 views
-4

私はPythonに読み込む必要のある.txtファイルを持っていますが、フォーマットによって単純なpandas.read_csv関数が使用できなくなっています。Python - フォーマットされた列を持たないtxtファイルを読む

"giver_username_if_known", "N/A" 

"in_test_set", false 

"number_of_downvotes_of_request_at_retrieval", 2 

"number_of_upvotes_of_request_at_retrieval", 6 

"post_was_edited", false 

"request_id", "t3_w5491" 

"request_number_of_comments_at_retrieval", 7 

"request_text", "I'm not in College, or a starving artist or anything like that. I've just been a bit unlucky lately." 

"request_text_edit_aware", "I'm not in College, or a starving artist or anything like that. I've just been a bit unlucky lately. I'm a 36 year old single guy with a job. But rent, and other bills killed me this month." 

"request_title", "[Request] Ontario, Canada - On my 3rd of 5 days without food, and it's getting unbearable. Can anyone help?" 

"requester_account_age_in_days_at_request", 14.416875 

"requester_account_age_in_days_at_retrieval", 531.9697222222222 

"requester_days_since_first_post_on_raop_at_request", 0.0 

"requester_days_since_first_post_on_raop_at_retrieval", 517.5111805555556 

"requester_number_of_comments_at_request", 8 

"requester_number_of_comments_at_retrieval", 93 

"requester_number_of_comments_in_raop_at_request", 0 

"requester_number_of_comments_in_raop_at_retrieval", 4 

"requester_number_of_posts_at_request", 1 

"requester_number_of_posts_at_retrieval", 6 

"requester_number_of_posts_on_raop_at_request", 0 

"requester_number_of_posts_on_raop_at_retrieval", 2 

"requester_number_of_subreddits_at_request", 8 

"requester_received_pizza", true 

"requester_subreddits_at_request", { 
    "AdviceAnimals" 
    "WTF" 
    "funny" 
    "gaming" 
    "movies" 
    "technology" 
    "todayilearned" 
    "videos" 
    } 

%%%%%%%%%% 

%%%%%%%%%% 

と同じ書式を持つ別のエントリ(5671全体的な)がある「%」の各セットの後:.txtファイルは、次のようになります。各行の最初の文字列は列名で、次の文字列/整数はデータエントリです。各列名の後にデータを抽出するにはどうすればよいですか?

1)お電話で、read_csv STR = '' を追加する:

+0

正規表現 – Olian04

+1

あなたが試したコードはどこですか? – user2728397

+0

@Rakesh_Kは、コードはありません。ただの常識です。それで私はコメントを残したのですが、答えではありません.... – Olian04

答えて

0

は、私は2つの提案があります。これは、各行の列/データをどのように区切るかをパーサーに伝えます。

2)read_csvの呼び出しでも、comment = "%%%%%"を追加します。これはパーサに、 "%%%%%"で始まる行をコメントとして扱い、無視することを指示します。

関連する問題