2017-07-09 16 views
1

パーソナリティ・インサイトをテストしていますが、Twitterのプロファイル・タイムラインの文字列をIBMに送る前にデータ・クレンジングを行う必要があるのか​​どうか不思議です。IBMパーソナリティ・インサイトのベスト・データ・クレンジング・プラクティス

たとえば、つぶやきに含まれるURLや、ハットタグやプロファイルツールのような他のツイッター機能を削除する必要があります。

現在のところ、データを削除していません。しかし、私は現在、つぶやきを完全停止し、text+=". "+tweetfulltextを使用してスペースを連結しています。

答えて

2

パーソナリティにはカウントされないので、クリーンアップモジュールをすでに持っている場合は、単語カウントに役立ちます。あなたはリツイートを削除するためにフィルタをかけたいでしょう。

関連する問題