2009-04-05 21 views

答えて

3

parsedatetimeを試しましたか?

+0

ありがとうございます!私はそれを前に見たことがありませんでした。 –

0

私はStephen Russettとchronicで話していました。彼がトークン化を提案した後、私はPythonの例を思いつきました。

ここにPythonの例を示します。あなたは慢性的に出力を実行します。

import nltk 
import MySQLdb 
import time 
import string 
import re 

#tokenize 
sentence = 'Available June 9 -- August first week' 
tokens = nltk.word_tokenize(sentence) 

parts_of_speech = nltk.pos_tag(tokens) 
print parts_of_speech 

#allow white list 
white_list = ['first'] 

#allow only prepositions 
#NNP, CD 
approved_prepositions = ['NNP', 'CD'] 
filtered = [] 
for word in parts_of_speech: 

    if any(x in word[1] for x in approved_prepositions): 
     filtered.append(word[0]) 
    elif any(x in word[0] for x in white_list): 
     #if word in white list, append it 
     filtered.append(word[0]) 

print filtered 

#normalize to alphanumeric only 
normalized = re.sub(r'\s\W+', ' ', ' '.join(filtered)) 
print filtered 
0

スタンフォードNLPのSUTimeを試すことができます。関連するPythonバインディングは次のとおりです:https://github.com/FraBle/python-sutime

すべてのJava依存関係がインストールされていることを確認してください。