2009年5月1日星期五

【毕设】日志-2009.04.26-28

-------------------
[日志] 2009.04.28

  上午来到实验室,修改数据库的ER图。下午主要在编写数据库设计说明文档。另外,与同学交流了一下正则表达式处理字符串的相关问题,感悟颇多。

  下午近4点的时候,欣喜的发现,服务器的Categorylinks.sql数据已经导完了。但是在MySQL里查询该数据库的时候,却出现 ERROR 1018 (HY000): Can't read dir of './wikikb/' (errno: 13) 的错误,吓得我差点绝望。后来才想到,也许是之前测试连接数据库的时候,乱改了 /var/lib/mysql/ 目录的权限。在命令行中输入 sudo chown -R mysql:mysql /var/lib/mysql/ ,成功解决问题。整个文件有2.42GB,导入后占硬盘空间5.42GB,31692204Rows,耗时5天(每导入13000Rows需3分钟),真是可怕。





  晚上班级有球赛,看完之后直接回寝室修改数据库文档。

遇到的问题:

  代码可能需要很多修改。

下一步计划:

  测试基本关系抽取代码,测试连接服务器的数据库。

-------------------
[日志] 2009.04.27

  上午来到实验室,整理上周完成的工作,并制作工作汇报PPT。下午与同学交流,发现我们本周完成的工作都不尽如人意。

  晚上汇报了工作情况,被师兄委婉地批评了一顿。不过明确了维基的根节点问题,写论文时又可以多凑些字了。



下一步计划:

  开始基本关系代码的改写。

-------------------
[日志] 2009.04.26

  中午来到实验室,发现英文实体表仍未抽取完,目前已运行超过20个小时。

  晚上去看了大班毕业系列活动之唱歌比赛,心情调整的不错。

遇到的问题:

  英文实体的抽取耗时给了我一些启示。由于维基的数据量太大,我没有必要完全处理。但是处理太少的话,又很难体现出深层的关系。如何把握这个度,还需要进一步研究。目前想到的方法是,将代码交给服务器,让服务器来完成完整的处理。

下一步计划:

  由于去看唱歌比赛,耽误了每周例会,明天准备开会时要用到的工作汇报PPT。

没有评论:

发表评论