2009年5月11日星期一

【毕设】日志-2009.05.05

【按:好久没发了 ... 】

-------------------
[日志] 2009.05.05

  上午来到实验室,发现师兄已经把服务器的MySQL成功启用了,查看了一下命令的历史记录,学到了一些东西。用本机测试连接,还是有点小问题。后来修改了 /etc/mysql/my.cof 文件,把 bind-address = 127.0.0.1 一行注释掉,重启MySQL服务后,可以正常连接到服务器了。

  下午找师兄讨论了类别关系建立方法。实体基本关系表RelationEnt中既包括实体,也包括类别,这样就不必大幅修改之前写好的程序。类别关系表RelationCat中的内容由程序自动建立:首先分析RelationEnt中的存在基本关系的两个实体a和b(分别处于re_sortkey和re_to列),到层次关系表CategoryLinks中查找两者的父类(以cl_sortkey为关键词查找cl_to),结果假定为A1、A2和B1、B2。以a的父类为主体(作为rc_sortkey),在RelationCat中建立两者父类的关系(A1,B1)、(A1,B2)、(A2,B1)、(A2,B2),权值rc_value置为0。然后分析RelationEnt中的下一项,如果期间发现在RelationCat有重复,将权值加1。处理完RelationEnt后,再为RelationCat中每一项的建立父类关系,同时累加权值。整个过程看似简单,但是程序实现起来较难,尤其越到最后时间复杂度会变得很高。

  另外,昨天在维基XML的正文描述中找到了信息表格。它以“{{Infobox 表格名”开头,至“}}”结束,里面的信息类似于“name = Mao Zedong birth = 1893 ... ”的形式。而且维基百科为每一类的实体提供了推荐模板,即规定了每个信息表格的标志属性。但是用户在实际编辑中往往并不遵守模板,形式相对灵活。

  晚上试着用服务器运行实体抽取代码,有些问题。

遇到的问题:

  服务器运行程序,在处理几千条后会停住。导致出错的XMLStreamException以及SAXParseException是我在Windows平台运行时从未遇到的,查看了JAVA文档[1]也没弄明白是什么原因。

下一步计划:

  继续写类别关系建立的代码。并与马师兄讨论接口还需要哪些功能。

相关资料:
[1] 类javax.xml.stream.XMLStreamException的使用. http://gceclub.sun.com.cn/Java_Docs/jdk6/docs/zh/api/javax/xml/stream/class-use/XMLStreamException.html

没有评论:

发表评论