text-processing

    6

    4答えて

    Mathematicaで遅延読み込みを実装する必要があります。私は処理する必要がある600 MbのCSVテキストファイルを持っています。このファイルには、重複したレコードがたくさん含まれていますメモリにそれらすべてをロードするので、代わりに 1;0;0;13;6 1;0;0;13;6 .......... 2;0;0;13;6 2;0;0;13;6 .......... etc.

    0

    1答えて

    私は、システムがファイルを読み込んだときにデータベースのデータが書き込まれるシステムを作った。このファイルは後の段階で埋め込まれ、同じファイルを再度読み取る要求が作成されます。 データそのものはファイルの各行に表示されていますが、難しい部分は固有の値を見つけることです。その理由を説明します。 ファイルは次のようになります。 123 20110101 4123 Hello 123 20110101

    0

    2答えて

    ユーザは実行時に "asdf" "qwer"、 などの実行時に2文字列を提供するようになりました。 'a'が現れるたびに 'q'、 's'が 'w'、 'd' 'e'および 'f' by 'r' 文字列の長さは異なる場合があります。 ここでは、操作対象のファイルが3〜4テラバイトの巨大なファイルなので、 "n"または "n(log(n))"の効率的なプログラムが必要です。そうでなければ助けてくださ

    1

    1答えて

    私は非常に簡単なETLジョブを持っています.txtから別のファイルへの単純なファイル変換です。 5分、そう?まあ、一つのことを除いて - 出力ファイルは.SLKである必要があります。 これはちょっとグーグルで、フォーマットされたデータがファイル自体に埋め込まれた「プログラム」形式のようです。誰もフォーマットの詳細に関するリンクを持っていますか?私を助けてくれよ、みんな!

    0

    1答えて

    私は何をしたいのか理解していただければ幸いです。英語は私の母国語ではなく、私は自動翻訳者を不信に思っています。私はできるだけ説明するように努めます。 長いテキストを分析することを考えていました。たとえば、段落に分割された文字列があるとします。 Loremのイプサムの悲しみは、AMET consecteturのadipiscingのELIT座ります。 Nulla vitae elit libero、

    0

    2答えて

    <option>sを次のHTML形式で選択する方法はありますか<select> ['a'、 'b'、 'c'、 'd']のようにpythonリストに入れる? <select name="sel"> <option value="a">a</option> <option value="b">b</option> <option value="c">c</option>

    -2

    3答えて

    テキストがあり、すべての行から最後の3単語を削除したいと思います。どのようにそれを行うことが可能ですか?この非常に具体的な説明に

    2

    1答えて

    図に示すように、私たちはIPアドレスのリストを持っています(128.3。*と131.243。*は私たちのサブネットの中にあります)。私たちは、* nix環境で歓迎するよりも、他の良いアイデアをPerlでやるのが好きです。 - dest_portは - ソースIP- Source_Port スペースを区切り文字として使用されている(ソート) 送信先IP: 写真はとしてフォーマットされます。 私たちは

    2

    1答えて

    Gmailは、メール本文の右側にある列に実際に優れた広告を表示します。 Facebookにも同じことが起こります。 Facebookに表示される広告は、多くの場合、興味のあるものと(非常に)関連しています。明らかに彼らは利用可能な情報を前処理する。 Gmailは自分のメールのテキストをスキャンし、キーワードを抽出して関連する広告を配信します。同じことがFacebookにも当てはまります。彼らには利

    0

    1答えて

    私は今、モノスペースでないフォントのためのワープロを実装しようとしているときに少し問題があります(フォントは異なる場合があります)。私はどこでもこれを検索しようとしましたが、解決策を見つけることができませんでした。任意のヒント?