text-processing

    3

    3答えて

    これが繰り返し質問の場合は申し訳ありません。どのように私は行のストリームとしてデータを処理するPythonスクリプトを記述するのですか?私は処理しているファイルが膨大で、ファイルをメモリに読み込まないため、これを行う必要があります。 私は、一度に1行のファイルを読む可能性があることを知っていますが、テキストストリームを処理するものが必要です。あなたは、標準入力から読み込みたい場合

    6

    3答えて

    数十万行におよぶ可能性のあるファイルを処理するインポートスクリプトを作成しています(ログファイル)。非常にシンプルなアプローチ(下記)を使用することで、MBPをいつでも取り出せるような時間と記憶が得られたので、私はそのプロセスを犠牲にしました。 #... File.open(file, 'r') do |f| f.each_line do |line| # do stuff

    1

    1答えて

    GIF形式で保存されたMathTypeの方程式をMathMLに変換したいと考えています。まず、これらのGIFファイルを開いてMathType 6.7に保存しました。その結果、MathMLテキストがGIFファイルの最後に挿入されます。 <mn > XXX </MN> :私はPerlスクリプトを使用して、これらのGIFファイルからのMathMLテキストを抽出する場合しかし、私は、次のテキストとしての

    31

    1答えて

    ファイルを見つけるにはにはLinuxでテキストが含まれていませんか?基本的に私はあなたが記述まさにん皮肉なことに、以下の find . -print | xargs grep -iL "somestring"

    2

    2答えて

    私はプログラミングが非常に新しいです。私は、多くのLinuxシェルコマンドを実行し、シェル出力を解析し、それらの情報をWebページに表示する必要があるPHPアプリケーションを作成しています。 私が直面している問題 いくつかのLinuxシェルコマンドの出力は非常に長く、「テキスト処理が面倒」ではありません。それらは人間が読むのは簡単ですが、PHPでは解析が難しい方法で配置されています。たとえば、PH

    0

    2答えて

    私は現在、HTMLをインポートしてプレーンテキストに変換するperlスクリプトを持っています。私はHTML :: TagFilterを使ってすべてのHTMLタグを削除していますが、私たちが1つの問題に遭遇した場合を除き、ほぼ完全に動作しています。 HTMLが含まれている場合など、これらのタグ以下の例の入力で「キャプション」などの非スタンドHTMLタグが削除されていない:私は助けを必要と何 Lore

    2

    2答えて

    「RESTful」であることがわかっているURLのリストがある場合、同じ「コントローラ/アクション/ビュー」にマッピングされるURLがグループ化されるようにグループ化するための適切なアルゴリズム?次のようにそれは希望のグループにそれらを http://www.example.com/foo http://www.example.com/foo/1 http://www.example.com/

    0

    1答えて

    記事が与えられたときにaptタイトルを与えるプログラムを書こうとしています(通常は要約)。利用可能な標準アルゴリズムはありますか?

    0

    3答えて

    ReportLabでtxtからpdfファイルを作成する方法はありますか?このようにするには +------+-------+------------+ | Name | Age | Nickname | +======+=======+============+ | 107 | Ella | Fitzgerald | +------+-------+------------+ | 108

    4

    2答えて

    文字列の入力を与えられた場合、文字列の終わりを指定の長さに切り捨てることによって、非常に単純な形式の要約を生成する必要があります。 // Take an array of strings and generate a summary within a given length function stringSummaryFromMetadata($inArray,$len=80,$sep='§'