これは、Stanford GLOVEプロジェクトで提供されている、よく訓練された単語ベクトルファイルです。これは自然言語アプリケーションによく使用されます。h2oで不一致の引用解析エラーを防止するimportFile
解析エラーは、私が修正しようとしている予測できない動作の根本的な原因かもしれません。この16進数のフレームでas.data.frameを実行すると、不思議なもの(図示せず)が表示されます。だから私はこの初期のエラーを何らかの形で修正したいと思います。
# How to eliminate parse error?
g6B = h2o.importFile(path = "/mnt/fastssd/glove/glove.6B/glove.6B.100d.txt", header=FALSE, na.strings=NA, sep=" ")
WARNING: ParseError at file nfs://mnt/fastssd/glove/glove.6B/glove.6B.100d.txt at byte offset 7674; error = 'Unmatched quote char "'
|======================================================================| 100%
Warning message in doTryCatch(return(expr), name, parentenv, handler):
“ParseError at file /mnt/fastssd/glove/glove.6B/glove.6B.100d.txt at byte offset 7674; error = 'Unmatched quote char "'”
このエラーを解決する方法はありますか?そうでない場合、別の方法は何ですか?ありがとう
は、そのファイルに何のスナップショット(頭を)提供することはできますか?私はそのファイルの形式が何であるかを知る必要があります:スパースかCSVか他の何か? –
はKaggleの "Two Sigma Connect:Rental Listing Inquiries"コンテストでテストファイルを読んでいる間も同様のエラーが発生しました:https://www.kaggle.com/c/two-sigma-connect-rental-listing-inquiries/data –