私は巨大なコーパスのテキストを(行ごとに)持っており、特殊文字を削除したいが、文字列のスペースと構造を維持したい。Pythonでファイルからスペースを除く特殊文字を削除するには?
hello? there A-Z-R_T(,**), world, welcome to python.
this **should? the next line#followed- [email protected] an#other %million^ %%like $this.
hello there A Z R T world welcome to python
this should be the next line followed by another million like this
あなたが望む文字のリストを作成するだけで、AZ、az、0-9など。そして、リスト内にない文字をスペースで置き換えて文字列内の各文字を繰り返し処理するために 'for'ループを使います。 – Wright
は、百万行のテキストの膨大なコーパスに対して効率的ですか? – pythonlearn