2012-06-19 5 views
8

でプログラミングでエラーが私が得たエラーメッセージはでしたデータ - PythonのDjangoの

Traceback (most recent call last): 
    File "./test.py", line 416, in <module> 
    startup() 
    File "./test.py", line 275, in startup 
    writer.save(r,data) 
    File "/home/user/project/test/output.py", line 91, in save 
    self.save_doc(r, data, pid) 
    File "/home/user/project/test/output.py", line 130, in save_doc 
    cursor.execute(dbquery) 
    File "/usr/local/lib/python2.6/site-packages/django/db/backends/util.py", line 34, in execute 
    return self.cursor.execute(sql, params) 
    File "/usr/local/lib/python2.6/site-packages/django/db/backends/mysql/base.py", line 86, in execute 
    return self.cursor.execute(query, args) 
    File "/usr/local/lib/python2.6/site-packages/MySQL_python-1.2.3c1-py2.6-linux-x86_64.egg/MySQLdb/cursors.py", line 175, in execute 
    File "/usr/local/lib/python2.6/site-packages/MySQL_python-1.2.3c1-py2.6-linux-x86_64.egg/MySQLdb/cursors.py", line 89, in _warning_check 
_mysql_exceptions.Warning: Data truncated for column 'url' at row 1 

URL文字列が長いフィールド長を超える場合、私がチェックしていた最初の事はあります実際にははるかに短いです。 データベース設計

+----------+-------------------------------------------------------------------+ 
| Database | Create Database             | 
+----------+-------------------------------------------------------------------+ 
| myurlcol | CREATE DATABASE `myurlcol` /*!40100 DEFAULT CHARACTER SET utf8 */ | 
+----------+-------------------------------------------------------------------+ 

テーブルデザイン

CREATE TABLE `document` (
    `id` int(11) NOT NULL auto_increment, 
    `url` varchar(255) collate utf8_bin NOT NULL, 
    `md5` varchar(32) collate utf8_bin NOT NULL, 
    `host` varchar(255) collate utf8_bin default NULL, 
    `content_sha1` varchar(40) collate utf8_bin NOT NULL, 
    `add_date` datetime NOT NULL, 
    PRIMARY KEY (`id`), 
    UNIQUE KEY `url` (`url`), 
    UNIQUE KEY `md5` (`md5`), 
    KEY `main_crawl_document_content_sha1` (`content_sha1`), 
    KEY `main_crawl_document_discover_date` (`add_date`), 
    KEY `main_crawl_document_host` (`host`), 
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COLLATE=utf8_bin; 

私は(私は1つのURLのみを使用してテストしてい)私はテーブルに挿入しようとしているデータの長さをプリントアウト:

len(url) = 89 
len(md5) = 32 
len(host) = 20 
len(content_sha1) = 40 
len(add_date) = 19 

Django.db.connectionによって作成されたカーソルを使用していました。より有益であるために、私は私がcursor.execute()

INSERT INTO main_document SET url='ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/0a/39/Arthritis_Res_2000_Jun_5_2%284%29_315-326.tar.gz',md5='b6ba3adde8de87e4dc255092b04d07ea',host='ftp.ncbi.nlm.nih.gov',content_sha1='9aeab4412cc9b1add84a6d2bca574664e193b56e',add_date='2012-05-15 00:00:00'; 

面白いことは、私はコピーして、MySQLのコマンドラインに貼り付けた時には、上記のコマンドが動作する、ということであるに渡された完全なデータベース照会コマンドを貼り付けます。エラーメッセージが表示されず、データが正しく挿入されました。

何が問題になりますか?

+0

これは警告で、エラーではありません。 –

+0

@Secator MySQLの警告かもしれませんが、Pythonのエラーとして返されます。私はあなたがそれをクリアする編集まで見ることができなかったと思う。 – Jordan

+2

コメントを残していただきありがとうございますが、ここに私の質問です:(1)これらの警告を削除する方法。 (2)それらを保持しなければならない場合、それらを無視してデータをデータベースに書き込ませる方法。現在、データはデータベースに書き込まれません。 – fanchyna

答えて

0

URLにunquoteを入力する前に、urllib.unquote(url)を試してからdbに挿入してください。あなたの文字列にある引用文字マーカ%は、MySQLの場合はspecial characterであり、トランザクションをマングルするかもしれません。

あなたのインサートを読んでください:

INSERT INTO main_document SET url='ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/0a/39/Arthritis_Res_2000_Jun_5_2(4)_315-326.tar.gz',md5='b6ba3adde8de87e4dc255092b04d07ea',host='ftp.ncbi.nlm.nih.gov',content_sha1='9aeab4412cc9b1add84a6d2bca574664e193b56e',add_date='2012-05-15 00:00:00'; 

注意MySQLはパターンマッチングコンテキストでのみなどの特殊%を扱うこと。だから、最後にDjango ORMに何か問題があるかもしれません。

+0

fanchynaがcursor.execute()を使用している場合、 '%'文字は問題ではありません。なぜなら%sは前に置き換えられるからです。 – madtyn

1

cursor.executeは、正しく使用すると、エスケープするMySQLを処理します。 Some Examples Here

基本的な考え方は、現在、生の値を含むされている生のSQL文字列で%sを使用し、その後、順番に値のタプル(又はアレイ)であるcursor.execute()の二番目の引数を渡すことです。あなたの場合、これは次のようになります:

url = 'ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/0a/39/Arthritis_Res_2000_Jun_5_2%284%29_315-326.tar.gz' 
md5 = 'b6ba3adde8de87e4dc255092b04d07ea' 
host = 'ftp.ncbi.nlm.nih.gov' 
content_sha1 = '9aeab4412cc9b1add84a6d2bca574664e193b56e' 
add_date = '2012-05-15 00:00:00' 
sql = "INSERT INTO main_document SET url = %s, md5 = %s, host = %s, content_sha1 = %s, add_date = %s" 
cursor.execute(sql, (url, md5, host, content_sha1, add_date)) 
+0

execute文の構文で "md5"の値が指定されていません。それはタイプミスですか? – daemon12

+0

はい、私はmd5を含むように修正しました。ありがとう! –

関連する問題