
harmonize,vt. 使和谐。
river crab,n. 河蟹。
狱炎岛主 拳を極めし者








本周完成情况:
本周主要完成了需求规格说明文档,以及构建工具的模块功能图和知识库的结构图。
WordNet是对本毕设有重要参考价值的一项工程,本人阅读了它提供的C语言API。其中主要包括数据库查询函数、词法函数、实用函数等。因此,对本毕设的构建工具外部接口应该提供查询、遍历等功能。而对于知识库的结构,目前已确定的有以下几项:对象(实体、类别)、关系(类别—类别、实体—实体、子类—父类、实体—类别)。后半周主要在调试一些开源的爬虫代码,如Jspider、Heritrix-1.14.3,前者是02年的代码,后者一直到现在还在更新。
周日晚上开了组内交流会,汇报了本周工作,交流了一些问题,明确了下周工作计划。
存在的问题:
本周花了一些时间参加招聘会,以及两个公司的笔试。所以毕设方面进度较慢。
另外,开源代码的调试过程中存在一些小问题。知识库的存储格式尚未最终确定。需求规格说明文档写的不够详细,还需要补充。
下周计划:
修改需求规格说明文档。开始做工具的爬取网页模块,开展实质性的工作。
很偶然的机会,看到豆瓣这两个书标签:“奇书”、“弱智书籍”。网友们实在太有爱了,陈年旧事都能翻出来 ... 联想到前些天豆瓣迫于压力解散一些小组的新闻,不禁感慨:如此低俗,被河蟹是活该的 ... 虽然这些都是正规出版物 ...
豆瓣成员把这些标注为“奇书”:
http://www.douban.com/book/tag/%E5%A5%87%E4%B9%A6
摘要:《怎样鉴别黄色歌曲》、《党的知识幼儿读本》、《葫芦娃大战变形金刚》、《金日成花金正日花栽培方法》、《少林达摩易筋经图解》、《怎样加入中国GCD》、《贪污贿赂案件审讯技巧》、《相会外星-黑猫警长大战外星人》、《社会主义中国不容诬蔑》、《打飞机英雄集》、《怎样打飞机》...
豆瓣成员把这些标注为“弱智书籍”:
http://www.douban.com/book/tag/%E5%BC%B1%E6%99%BA%E4%B9%A6%E7%B1%8D
摘要:《中国不高兴》、《金正日论歌剧艺术》、《爷爷激励我成长》、《三鹿人成功之路》、《身体腾空特异功能修持密法》...

本周完成情况:
周一晚上进行第一次组内预答辩,我和同组的曹俊超同学都暴露出了一些问题。晚上回寝改文档,由于思路较慢,改到凌晨4点才完。周二下午,周师兄对我的PPT演示文稿作了很多修改和建议,晚上的第二次预答辩,我们的表现明显要好得多。
周三上午是正式答辩,答辩委员会有熊桂喜老师、李炜老师等。作为第一个答辩的学生,我整个答辩过程比较顺利,也回答了老师们提出的两个问题,分别是树的存储结构和毕设实现环境。
之后的两天主要对一些关键技术的细节作了研究,精读了两篇英文论文。周五下午,开组内交流会,马师兄给我们布置了下一周的工作内容。周六周日主要在编写需求分析文档。
存在的问题:
预答辩时暴露出的问题主要有:毕设背景模糊,让人看不出为什么要去做;国内外研究现状介绍太多,缺乏条理逻辑。正式答辩存在的问题是,由于怕超时,所以压缩了汇报时间,导致个别老师对我毕设的细节理解有误。实际上不需要考虑时间的问题,因为其他人都超时了,老师也没有记时。
这一周工作比较累,后几天的工作进度较慢,需要迅速调整好工作状态。
下周计划:
继续需求分析,完成需求规格说明文档。与马师兄讨论确定知识库的存储结构。调研其他知识库的存储技术,选取合适的爬虫,下周五汇报工作内容。