を仕事を楽にする
Pandas Lib:Python Data Analysis Libraryを使用すると、ファイルを素早く解析して、目的の方法を提供するDataFrameにすることができます。
as_matrixメソッド(下記)がnumpyArrayを返すので、Numpyライブラリも必要です。
セパレータとして空白を含むcsv(カンマ区切り値)ファイルとしてデータファイルを見ることができます。あなたはas_matrixメソッドを使用する列を選択するための
import pandas as pd
import numpy as np
dataFrame = pd.read_csv("file.txt", sep = ' ')
:
selection = dataFrame.as_matrix((A,C,D))
その後、あなたはおそらく継続するDATAFRAMEに戻って、それをキャストすることができますしたいあなたは簡単にread_csvでファイルを解析することができ、PDで
そのメソッドを使用して:
newDataFrame = pd.DataFrame(selection)
"abcdef"値の "cdef"を削除する列Dの中には、の単純なと、Pythonが提供する[String] [5]の方法で解決できるもののように見えます。その非常に特定の指示と私はこれを達成するライブラリの実装されたメソッドを知りません。
私はあなたを助けたと思います。
PD:私はリンクをたくさん投稿しようとしましたが、システムは私をさせませんでした。私はあなたがそれらを持っていない場合Googleにナンシーとパンダを探すことをお勧めします。 pandas DataFrameドキュメントをチェックしてメソッドを確認する必要があります。私は、あなたがGoogleでpandas.read_csv、pandas.dataFrame.as_matrix docsを探すのをあなたが理解できなかった場合です。
文字列を操作する方法がわからない場合は、Pythonのドキュメントで文字列を調べます。
編集:とにかく、あなたがライブラリを使用したくない場合は、マトリックスを模倣するリストの一覧にtxtファイルを解析したり、その答えにwimが言及しているcsv構造体を使用したりできます。次に列を削除する関数を作成し、各列の最初の要素(列識別子)をチェックし、の場合はを他の行列にエクスポートします。
次に、の別のを使用して、列の目的の値を削除する別の関数を作成します。
要点は、目的を達成するために関数を使用すると、マトリックスとして管理されているすべてのテーブルに対してソリューションが一般的になります。
それがテキストファイルでない場合は、どのような種類ファイルですか? – wim
私はOPがフォーマットではなく拡張について話していると思います。 –