2009年4月21日星期二

【毕设】周报-第9周

本周完成情况:

  之前使用JDOM包来处理XML,但这种方式不适合规模巨大的XML文件。后来转用SAX重写了Web对象抽取及插入数据库的部分代码。SAX(Simple API for XML)是一种古老的XML处理方案,它从上到下一行一行的读入文件,基于事件处理方式边读边解析。与毕设同组的同学一起讨论了获取数据库的实现方法,完善了接口功能的设计。

  为实验室的服务器重装Redhat Enterprise Linux 5.3系统,导入部分数据到MySQL数据库中,方便后续开发者使用数据。为数据库设计了关系描述表和关系实例表,作为补充。

  周日晚上开会汇报了本周的工作。与师兄们交流后,明确了下一步工作内容。上周我们组毕设中期答辩的效果还算不错,受到师兄的表扬。本周进度勉强算可以,但是需要加强危机意识。

存在的问题:

  弃用JDOM方法,转用SAX耽误了很多时间和精力,部分工作相当于白做。这种问题出现的原因在于前期调研不够充分,被网上某些教程误导。今后要避免这种情况再度发生。

  用SAX解析XML并不如想象中容易,遇到的问题都与XML数据量过大有关。如org.xml.sax.SAXParseException等,还需要再研究。

  服务器RHEL5.3系统里集成的MySQL不好用,连接时出现超时的问题。

下周计划:

  继续基本关系抽取,完善外部接口功能,尽快处理好服务器的数据,解决连接问题。

没有评论:

发表评论