我想了很久,想不出解决这个问题的办法。
我有一个java程序,它从mysql中读取一个处于活动状态的表。这张table看起来像这样:
UniqueID FilePath Status
1 C:\Folder1\abc.pdf Active
2 C:\Folder1\def.pdf Active
3 C:\Folder1\efg.pdf Error
想法很简单:我从filepath定位文件位置,调用一些函数来提取文件并对其执行索引处理。在整个过程中,程序完成后,状态将从“活动”变为“处理”,然后变为“完成”。
代码如下:
public void doScan_DB() throws Exception {
try {
Statement statement = con.connect().createStatement();
ResultSet rs = statement.executeQuery("select * from filequeue where Status='Active'");
while (rs.next()) {
// get the filepath of the PDF document
String path1 = rs.getString(2);
int getNum= rs.getInt(1);
// while running the process, update status : Processing
updateProcess_DB(getNum);
// call the index function
Indexing conn = new Indexing();
conn.extractDocuments(path1);
// After completing the process, update status: Complete
updateComplete_DB(getNum);
// if error occurs
// call this method updateError_DB(getNum);
}
}catch(SQLException|IOException e){
e.printStackTrace();
}
}
提取文档方法:
public void extractDocuments(String path) throws Exception{
ArrayList<String> list = new ArrayList<String>();
try (PDDocument document = PDDocument.load(new File(path))) {
if (!document.isEncrypted()) {
PDFTextStripper tStripper = new PDFTextStripper();
String pdfFileInText = tStripper.getText(document);
String lines[] = pdfFileInText.split("\\r?\\n");
for (String line : lines) {
String[] words = line.split(" ");
// words.replaceAll("([\\W]+$)|(^[\\W]+)", ""));
for (String word : words) {
// check if one or more special characters at end of string then remove OR
// check special characters in beginning of the string then remove
// uniqueWords.add(word.replaceAll("([\\W]+$)|(^[\\W]+)", ""));
list.add(word.replaceAll("([\\W]+$)|(^[\\W]+)", ""));
// uniqueWords.add(word.replaceAll("([\\W]+$)|(^[\\W]+)", ""));
}
}
}
} catch (IOException e) {
System.err.println("Exception while trying to read pdf document - " + e);
}
String[] words1 =list.toArray(new String[list.size()]);
// String[] words2 =uniqueWords.toArray(new String[uniqueWords.size()]);
// MysqlAccessIndex connection = new MysqlAccessIndex();
index(words1,path);
System.out.println("Completed");
}
}
问题是假设.pdf不存在,所以它会抛出一个文件异常错误。我传递参数来更新每一行以进行如下处理:
public void updateProcess_DB(int argument){
try{
Statement test = con.connect().createStatement();
test.executeUpdate("update filequeue SET STATUS ='Processing' where UniqueID= "+argument);
}catch(Exception e){
e.printStackTrace();
}
}
我有另一种方法来更新表的错误状态,还有另一种方法来完成这个过程。
是否有方法将.pdf的状态更新为error,将def.pdf的状态更新为complete?
到目前为止,我的代码将为文件抛出一个异常,但仍然更新这两个状态以完成。正确的想法是只更新抛出fileexception错误的状态 extractDocuments() method
. 因为它捕获了异常,所以它仍将始终运行 updateComplete_DB
在 doScan_DB
.
有没有一个适当的方法来处理这一点,因为任何建议是赞赏的?
1条答案
按热度按时间nfs0ujit1#
有几种方法可以处理这个问题,但是我会从extractdocuments中删除try/catch,并在doscan\u db中调用相同的方法
也许你也应该换一种方法来更新状态