ScalaとSparkの新機能です。私は、編集距離を計算することによって、データフレームの既存の列から新しい列を派生させたいと考えています。例えば、FNAMEとLNAMEはデータフレームの2つのカラムであり、FNAMEとLNAMEの編集距離を維持するNAMESCOREという新しいカラムを追加したかったのです。作業または擬似コードで助言してください。編集距離データフレーム列(String)を派生させてsparkのデータフレームに新しい列を追加する方法
ここに私はいくつかの部分的な答えがあります。
Derive multiple columns from a single column in a Spark DataFrame