2009年3月16日星期一

【毕设】每周情况-第4周

本周完成情况:

  本周主要完成了需求规格说明文档,以及构建工具的模块功能图和知识库的结构图。

  WordNet是对本毕设有重要参考价值的一项工程,本人阅读了它提供的C语言API。其中主要包括数据库查询函数、词法函数、实用函数等。因此,对本毕设的构建工具外部接口应该提供查询、遍历等功能。而对于知识库的结构,目前已确定的有以下几项:对象(实体、类别)、关系(类别—类别、实体—实体、子类—父类、实体—类别)。后半周主要在调试一些开源的爬虫代码,如Jspider、Heritrix-1.14.3,前者是02年的代码,后者一直到现在还在更新。

  周日晚上开了组内交流会,汇报了本周工作,交流了一些问题,明确了下周工作计划。

存在的问题:

  本周花了一些时间参加招聘会,以及两个公司的笔试。所以毕设方面进度较慢。

  另外,开源代码的调试过程中存在一些小问题。知识库的存储格式尚未最终确定。需求规格说明文档写的不够详细,还需要补充。

下周计划:

  修改需求规格说明文档。开始做工具的爬取网页模块,开展实质性的工作。

没有评论:

发表评论