-1
私は、文章を段落に区切るためにpythonを使用する必要があります。私はnltk.tokenize.texttilingを使用しようとしましたが、何の結果も得られませんでした。 ここでは、テキストの抜粋:文章を段落に区切るためのpythonの使用
– [Voiceover] Bob Dylan is,
you must be 20 years old now,
aren't you?
– [Voiceover] Yeah, I must be 20.
(laughing)
– [Voiceover] Are you?
– [Voiceover] Yeah, I'm 20, I'm 20.
(guitar music)
My hands are cold.
It's a pretty cold studio.
– [Voiceover] The coldest studio.
– [Voiceover] Usually can do this.
There I just want to do it once.
(guitar strumming)
– [Voiceover] When I first heard Bob Dylan
was, I think, about three
years ago in Minneapolis.
– [Voiceover] At that time I
was just sort of doing nothing.
I was there working, I guess.
I was making pretend I was
going to school out there.
I'd just come there from South Dakota.
– [Voiceover] You've sung
now at Goody's here in town.
Have you sung at any of the coffee houses?
私は決してそのようなことの頭をしたことはありません。いずれにせよ、あなたは人間の会話の写しを解析しようとしていますか?それらをパラグラフにすることは、全く無意味なようです。段落は、人間の文章を整理する方法であり、人間の会話には適用されません。 –
どのように文章を段落に区切りますか?段落は文章で構成されていますが、文章は単語で構成されています。 – direprobs
NLTKモジュールを使用して文を見つけることができます。次に、文の間でトピックが完全に変更された場合は、新しい段落が表示されます。これがTextTilingの仕組みです。 – Shurik