本周完成情况:
本周主要完成了需求规格说明文档,以及构建工具的模块功能图和知识库的结构图。
WordNet是对本毕设有重要参考价值的一项工程,本人阅读了它提供的C语言API。其中主要包括数据库查询函数、词法函数、实用函数等。因此,对本毕设的构建工具外部接口应该提供查询、遍历等功能。而对于知识库的结构,目前已确定的有以下几项:对象(实体、类别)、关系(类别—类别、实体—实体、子类—父类、实体—类别)。后半周主要在调试一些开源的爬虫代码,如Jspider、Heritrix-1.14.3,前者是02年的代码,后者一直到现在还在更新。
周日晚上开了组内交流会,汇报了本周工作,交流了一些问题,明确了下周工作计划。
存在的问题:
本周花了一些时间参加招聘会,以及两个公司的笔试。所以毕设方面进度较慢。
另外,开源代码的调试过程中存在一些小问题。知识库的存储格式尚未最终确定。需求规格说明文档写的不够详细,还需要补充。
下周计划:
修改需求规格说明文档。开始做工具的爬取网页模块,开展实质性的工作。

没有评论:
发表评论