2009年5月26日星期二

Blogger被封,更新很麻烦

不知什么时候能解封,估计7月差不多。

新浪博客继续更新:http://blog.sina.com.cn/goukijiang

2009年5月13日星期三

【毕设】日志-2009.05.07-09

-------------------
[日志] 2009.05.09

  中午来到实验室,由于数据库索引没有建好,很难处理大规模的类别关系。这段时间写程序还是比较郁闷的。

  下午写了一个关于实体基本关系的计数程序,想看看全部数据库到底能有多大。本以为会需要很长时间来处理,但即便有循环式的正则表达式判断,计数器的执行效率仍然很高。大概运行了两个小时就把Abstract.xml和Pages-Articles.xml跑了一遍。结果是惊人的:实体数有825万条,其中应该有很多都是无意义实体,因为Abstract中只有260万条;按照目前的实体关联关系建立方法,总的实体关系达到8300万个以上。单一实体的关系数统计结果如下(rel10+ num表示某实体与10-30个其他实体有关系,以此类推):rel10+ num = 1225642,rel30+ num = 299359,rel50+ num = 197980,rel100+ num = 77193,rel200+ num = 23194,rel300+ num = 15059,rel500+ num = 4417,rel800+ num = 2888。有的实体页面竟然有超过800其他实体链接,也许这种文章是超长类型的。

遇到的问题:

  数据库索引建立要耗费很多时间,目前只能基于小数据库来展开测试,接口功能暂时无从下手。

下一步计划:

  整理一周工作,准备开会PPT。


-------------------
[日志] 2009.05.08

  主要在准备思想道德评价答辩。


-------------------
[日志] 2009.05.07

  上午来到实验室,把之前写的代码重新整理了一遍。理清了关系权值的计算方法,目前实体的直接父类关系权值可以自动累加。

  下午在测试服务器代码时偶然发现,虽然早就安装了jre1.6,但运行程序时默认使用是1.5。这就是代码总在一段时间后自动停止的原因:或许旧版jre对SAX解析方法有数量限制。更改版本之后,错误消除。测试了一下英文实体摘要抽取速度,处理10万条大概需要6小时,太慢了。目前想到的方法是,改写MySQL插入方式为批量插入,即分析时先存进ArrayList,待积满100条后执行批量插入的SQL语句。想起来似乎很简单,还没写代码。

  晚上与师兄讨论了当前存在的一些问题。

遇到的问题:

  CategoryLinks表的子类名cl_sortkey索引没建完,估计要比导入的时间还长。

下一步计划:

  明晚7点是小班思想道德答辩,需要准备PPT。

2009年5月11日星期一

【毕设】日志-2009.05.06

-------------------
[日志] 2009.05.06

  上午来到实验室,继续写类别关系建立代码。期间发现之前写的查询接口不好用,重写了针对层次关系的数据库查询、插入接口函数。

  下午修正了之前实体抽取的小问题。维基有一个页面重定向的设置,即几个实体名都指向一个页面,如“熊猫”和“大熊猫”其实都会指向“大熊猫”页面,但是在维基XML正文中是以[[大熊猫熊猫]]形式存在。在处理时只需要前半部分即可,减少了无用实体的数量。晚上写完了RelationCat类别关系表的建立代码,但是权值累加的部分还有问题。

  晚上与师兄讨论了接口以及必要的数据结构,另外明确了几个问题。

遇到的问题:

  下午与同组同学讨论时发现,在CategoryLinks表中,以子类名(cl_sortkey)作为条件查询父类(cl_to),返回结果需要很长时间。也许是由于cl_sortkey没有索引,如果为其建立索引,不知需要多长时间,也许需要数天。这个问题不解决,想大规模建立类别关联关系是不可能的。服务器运行写好的代码,一段时间后仍然会因出错而停住,或许Linux平台比较特殊,目前没有解决的办法。

  类别关系权值的处理方法是,如果数据库中存在当前将要插入的类别对,则将其权值加1。目前的处理方法是,把rc_to和rc_sortkey设为约束键,如果插入的新项是数据库中已存在的,则程序抛出异常,如 java.sql.SQLException: Duplicate entry 'Ruwanda-Afurika' for key 'sortkey_to' ,在异常处理部分添加查询、更新代码。不过目前仍存在错误,添加的新代码会抛出新的异常,导致程序卡死。

下一步计划:

  完成类别关系抽取功能,开始写接口的遍历功能。

【毕设】日志-2009.05.05

【按:好久没发了 ... 】

-------------------
[日志] 2009.05.05

  上午来到实验室,发现师兄已经把服务器的MySQL成功启用了,查看了一下命令的历史记录,学到了一些东西。用本机测试连接,还是有点小问题。后来修改了 /etc/mysql/my.cof 文件,把 bind-address = 127.0.0.1 一行注释掉,重启MySQL服务后,可以正常连接到服务器了。

  下午找师兄讨论了类别关系建立方法。实体基本关系表RelationEnt中既包括实体,也包括类别,这样就不必大幅修改之前写好的程序。类别关系表RelationCat中的内容由程序自动建立:首先分析RelationEnt中的存在基本关系的两个实体a和b(分别处于re_sortkey和re_to列),到层次关系表CategoryLinks中查找两者的父类(以cl_sortkey为关键词查找cl_to),结果假定为A1、A2和B1、B2。以a的父类为主体(作为rc_sortkey),在RelationCat中建立两者父类的关系(A1,B1)、(A1,B2)、(A2,B1)、(A2,B2),权值rc_value置为0。然后分析RelationEnt中的下一项,如果期间发现在RelationCat有重复,将权值加1。处理完RelationEnt后,再为RelationCat中每一项的建立父类关系,同时累加权值。整个过程看似简单,但是程序实现起来较难,尤其越到最后时间复杂度会变得很高。

  另外,昨天在维基XML的正文描述中找到了信息表格。它以“{{Infobox 表格名”开头,至“}}”结束,里面的信息类似于“name = Mao Zedong birth = 1893 ... ”的形式。而且维基百科为每一类的实体提供了推荐模板,即规定了每个信息表格的标志属性。但是用户在实际编辑中往往并不遵守模板,形式相对灵活。

  晚上试着用服务器运行实体抽取代码,有些问题。

遇到的问题:

  服务器运行程序,在处理几千条后会停住。导致出错的XMLStreamException以及SAXParseException是我在Windows平台运行时从未遇到的,查看了JAVA文档[1]也没弄明白是什么原因。

下一步计划:

  继续写类别关系建立的代码。并与马师兄讨论接口还需要哪些功能。

相关资料:
[1] 类javax.xml.stream.XMLStreamException的使用. http://gceclub.sun.com.cn/Java_Docs/jdk6/docs/zh/api/javax/xml/stream/class-use/XMLStreamException.html

2009年5月10日星期日

Nobodyknows+《メバエ》:奥特曼的爱情

  偶然看到优酷上讲奥特曼爱情的MV视频[1],歌曲是周杰伦的《我不配》。本以为是纯恶搞,看了几秒钟之后对MV专业的拍摄手法感到惊讶,这绝不是业余爱好者能做出来的。于是对此产生了兴趣,便到网上去查。

  多数搜索结果都是网友毫无技术含量的转帖,配以“爆笑”、“雷人”等字眼,跟帖也没什么信息量。再配以视频最后的署名“制作人:人型牲口”来回搜索,查到一些有用的信息。

  MV女主角是日本女星香椎由宇[2],已经与曾在特摄片中扮演假面骑士的小田切让结婚了[3]。这段MV是日本说唱组合Nobodyknows+的作品,为了纪念奥特曼40周年而特摄制作,片名《メバエ》[4],据说是萌芽的意思。原版MV的说唱风格显得凌乱,那种悲情的表现力比“人型牲口”网友改编的《我不配》差些。

  还搜到几位网友的博客[5][6],写的不错,虽然弄错了MV的来源。“在这部MV中,他的感情世界和感情经历得到了很好的诠释,让我们看到了一个全新的奥特曼。”

  幸福是什么?幸福就是猫吃鱼、狗吃肉、奥特曼打小怪兽 ...

相关资料:
[1] 奥特曼版《我不配》. http://v.youku.com/v_show/id_XMzI3NjkxODA=.html
[2] 维基百科-香椎由宇. http://zh.wikipedia.org/wiki/%E9%A6%99%E6%A4%8E%E7%94%B1%E5%AE%87
[3] 假面骑士大战超人力霸王!小田切让 香椎由宇电击结婚. 2007-12-28. http://mypaper.pchome.com.tw/news/quiff/3/1300946663/20071228002009/
[4] Nobodyknows+ メバエ. http://tieba.baidu.com/%CF%E3%D7%B5%D3%C9%D3%EE/shipin/play/1c0793d955d20014c720449a
[5] 向风刎颈送公子. 奥特曼版《我不配》. http://blog.sina.com.cn/s/blog_4e1dbed30100a770.html
[6] Negroo. 奥特曼大神的爱情. http://hi.baidu.com/buzhaofeng/blog/item/c153bd3c77fa93cf9f3d62fd.html

2009年5月9日星期六

就这样像狗熊一样笨死 ...

【按:中国的悲哀 ... 此人“匆匆走出放映厅”从5楼跑到1楼的“不会后悔”的行为,已经能够说明一切了 ... 】

看完《南京!南京!》怒砸影院银幕
日期:[2009年5月9日] 版次:[AA16] 版名:[城事] 稿源:[南方都市报]
http://epaper.nddaily.com/A/html/2009-05/09/content_785816.htm

本报讯(记者王文杰)前晚10时前后,中山金逸电影城1号放映厅内,看完《南京!南京!》的观众正陆续步出影厅,后排座位上的一名男子突然扔出一瓶奶茶,“啪”的一声砸到了银幕上。该男子称是因看了电影感到愤恨。受此影响,影院取消了下一场要放的《拉贝日记》。

  记者当晚在放映厅看到,银幕上,一条明显的印痕从银幕偏上方一直流到底部。事发后,影院取消了原本计划下一场放映的《拉贝日记》,已购票的观众退票或转看其它影片。影院技术人员指着污渍表示,用一般手段难以清洗涂了特殊涂料的银幕。

  当晚记者找到了砸银幕的男子姜某。姜某在中山市工作,是一名景观设计师。对于为什么要把奶茶瓶扔到银幕上,姜某说:“看了《南京!南京!》后,有种从来没有过的难受,对参与南京大屠杀的日本人充满了憎恨。实在承受不了,刚好有个瓶子,就砸了过去。”姜某还说,他已很久没有流泪了,但这部影片放映不久,他就哭了【交完3000块钱回家,他还会再哭一遍】。

  姜某还说,他从这部影片中看到,南京大屠杀时,中国人的人性被肆意践踏。姜某告诉记者,最刺激他的一个镜头是,日本兵到难民营找100名女人做慰安妇,而难民营只能接受。姜某说,这个情节让他感觉“中国男人都到哪里去了【此人不懂得战争的基本常识】?只剩下这些女人做无谓的救援,一点意义都没有。假如是我,我肯定会去拼,直到死!肯定会拼命地逃跑,一直到累死!】”姜某还说,现在的人被很多很小的社会琐事困扰,却把民族大义和民族情感遗忘了,生活压力让人累得没有心情去考虑民族大义【3000块钱一交,就更没有心情去考虑了】。

  对于扔银幕的后果,姜某说:“不管给我一个什么处理,我都不会后悔不后悔下一场观众看不了《拉贝日记》】。这件事对我以后的人生道路有更大的激发,会考虑为国家民族做更多事情喝更多的奶茶,砸更多的电影屏幕】。”

  男子行迹:1. 电影开播不久就哭了;2. 电影放映结束,一声“去他妈的”,从最后一排扔出一瓶喝剩的奶茶,砸到银幕上;3. 砸了银幕后匆匆走出放映厅,工作人员从5楼追至1楼追回此乃全文亮点】;4. 和影院协商后,交纳3000元维修押金后离去。

2009年5月7日星期四

只憾欠时机,回顾增感叹

【按:午饭前后都在新主楼等了一会,竟还是错过了。无法一睹君之真容,足抱憾一生矣 ... 】


习近平视察民航数据通信及新航行系统科研基地
2009年05月07日15:21 来源:人民网-中国民航新闻网
http://caac.people.com.cn/GB/114124/9259566.html

  人民网民航频道5月7日电 2009年5月6日上午,中央政治局常委、国家副主席习近平来到北京航空航天大学就高校深入开展学习实践科学发展观活动进行调研。在校党委书记杜玉波、校长李未等校领导陪同下,习副主席一行人视察了中国民航局与北京航空航天大学共建的民航数据通信及新航行系统科研基地。

  科研基地副主任、电子信息工程学院院长张军教授向习副主席汇报科研基地的建设情况,重点汇报了空天地一体化网络、航空导航与空域监视等空管新技术的最新研究成果,以及与民航局、民航数据通信公司通过“产学研用”联合实现成果转化,在全行业推广应用的情况。

  习副主席视察了空管教学与研发平台,饶有兴趣地观看了科研基地研制的飞机全球动态监视系统、卫星导航完好性监测系统、空地协同的民航空域监视设备等系统的实时演示,包括:

  1、基于ARCARS(飞机通信与寻址报告系统)的飞机全球动态监视系统;
  2、飞机发动机运行状况报文系统;
  3 、民航空管运行中心保障系统(流量系统一期),展示了全国航班当前执行进度和一小时预测流量总图;
  4、专机保障系统,回放了习副主席2月8日出访拉美五国和马耳他的专机飞行的历史动态航迹;
  5、缩小垂直间隔(RVSM)空域评估系统;
  6、林芝到拉萨的RNP航路(程序)三维飞行模拟系统;
  7、卫星导航完好性监测和自主完好性监视(RAIM)预测系统;
  8、航空导航综合测试平台系统;
  9、首都机场多雷达融合系统(实时数据和飞行实况);
  10、成都双流机场雷达和ADS-B(广播式自动相关监视)信息融合系统(实时);
  11、ADS-B完好性评估系统;
  12、航路安全评估系统。

  视察中,习副主席关心的提到了学科教材建设、林芝等高原机场运行、新空管监视技术手段对南中国海空域主权的保障、低空空域开放、民航发展与国家大飞机建设、二代卫星导航系统产业结合等问题。

  习副主席对北航在空管领域做出的贡献给予了充分肯定,希望结合学习实践科学发展观活动,针对国家重大战略需求,结合国家重大专项,如国产大飞机、中国第二代卫星导航系统等,建设空管创新研究平台,加强空管创新人才培养,增强持续创新研究能力,为国家经济发展和民航飞行安全做出更大贡献。

  陪同习近平副主席视察的领导还有教育部部长周济,中央组织部副部长李建华和欧阳淞,工业和信息化部副部长、国防科工局局长陈求发,中央政策研究室副主任何毅亭。(通讯员 李欣)

【毕设】日志-2009.05.01-04

-------------------
[日志] 2009.05.04

  上午来到实验室,查看实体基本关系抽取测试情况:运行30小时,处理74万实体,590万基本关系。整理一周以来的工作,制作工作汇报PPT。





  晚上开会,在交流过程中暴露出很多问题,如对类别关联关系的处理方法理解有误、接口高级功能的定位等。

下一步计划:

  重写类别关系建立代码。

-------------------
[日志] 2009.05.02

  中午来到实验室,发现程序在处理英文XML时仍然有些小问题,于是在实体关系表中加入编号作为主键,解决了问题。运行程序半个小时,处理2千实体,抽取到4万条基本关系。效率还是很低的。

  同组同学的Graph重新做了设计,修改了获取数据的方法。因此,我的接口仅有两条关系还不够,目前想到的方法是用三层ArrayList构成三维数组。

下一步计划:

  继续写接口功能。

-------------------
[日志] 2009.05.01

  中午来到实验室,人果然很少。准备用英文维基的pages-articles.xml测试基本关系抽取。enwiki-20090306-pages-articles.xml.bz2压缩包就有4.8GB,解压之前先清理了一下硬盘,花了一个半小时解压完毕,得到的整个文件竟然达到21.2GB。虽然这段时间总是处理大数据,但这样的级别还是让我吃了一惊。加上正则表达式的低效率问题,最终处理起来肯定费时费力。

  解压等待的过程中,又随手调试了昨天的代码,改进了准确度。之前对java.util.regex包中Matcher类的groupCount理解不深,误认为是匹配次数,其实是捕获组数。

晚上在寝室电脑的Ubuntu系统测试代码。

遇到的问题:

  服务器的MySQL仍然无法启用。目前的代码需要频繁executeUpdate数据库,效率肯定很低,不知数据库的批量插入如何实现。

下一步计划:

  明天中午有事,下午再去实验室,主要完成接口的两步关系查询代码。

相关资料:
[1] JAVA文档-软件包java.util.regex. http://gceclub.sun.com.cn/Java_Docs/html/zh_CN/api/java/util/regex/package-summary.html

2009年5月5日星期二

朝鲜日报新闻两则

【按:现在出来了,说不定以后还要回去 ... 】

中国大力开发图们江流域 经朝俄走向东海
珲春、延吉=朝鲜日报驻北京特派记者 崔有植 (2009.05.05 11:30)
http://chn.chosun.com/site/data/html_dir/2009/05/05/20090505000014.html



  中国政府组成了由国家发改委和商务部、财政部、科技部等5个部门参加的图们江开发特别机构,去年11月推出了“图们江地区合作开发计划”草案。

  达200页的该草案的主要内容是,借北韩和俄罗斯的港口,确保走向东海的出海权,以此为基础吸引韩国、日本、香港等地的外国企业。从珲春到东海只有20多公里,但中国被俄罗斯和北韩的国境隔离不能直接走向东海。其中包括投入2860亿元人民币建设该地区基础设施的计划。

  地区行政体系的改制工作也在进行之中。其构想是,将朝鲜族聚居地延吉和龙井、图们合并成一个总人口达120万的城市,为能够吸引外部人口流入打下基础。


“图们江区域前景广阔,希望韩企积极投资”专访中国珲春市委副书记夏友照
珲春=朝鲜日报驻北京特派记者 崔有植 (2009.05.05 11:32)
http://chn.chosun.com/site/data/html_dir/2009/05/05/20090505000015.html

  夏友照提到,当初UNDP的构思是计划在30年间共投入300亿美元开发这一地区。他说:“还剩下10余年。目前中央政府对这一项目的关注度极高,相信今后有更快更好的发展。”

【转载】数据揭示日本有多少街霸4顶尖高手

【按:不知原始作者是谁,转自腾讯。不过令我惊异的是,梅原竟然不是最高分,被MAGO超过了 ... 欲知MAGO其人,请看街霸4 斗神降临!梅原大吾/Daigo挑战6大高手。】



表格统计了截至2009年4月中旬,日本街霸4顶尖高手的数量

解读表格数据:

1.使用率:指街机上被选择最多的角色,可以看到隆是最常用的角色,而达尔希姆是最冷门的角色。

2.G.Master:是街霸4街机上的最高称号“Grand Master”,只有BP分数在5万以上,并且保持很高胜率,再达成很多苛刻条件的玩家才能取得这个称号,图中可以看到,即使在日本,取得GM称号的玩家也屈指可数。

3.Master:次级称号,BP分数在4万以上的玩家可以取得。

4.BP分数:全称“Battle Point”,在街霸4与人对战中,取胜比赛可以获得BP积分,输掉比赛则扣掉相应的BP分,因此BP分数可以大致代表玩家的水平。(可以理解成龙珠中的战斗力数值。)

5.水平依次:“G.Master”强于“BP5万”强于“Master”

6.表中可以看到使用沙加特的GM最多,而即使在日本,还有五个角色没有GM,可见这五个角色使用难度之大。

7.截至2009年4月底,不完全统计一些知名玩家的BP分数:梅原大吾/17万;RF(斗志再击亚军)/15万;MAGO(マゴ,著名2D玩家,现痴迷SF4)/21万。(这几位可以理解成龙珠中的超级赛亚人。)

附表:BP分数对应的等级

2009年5月4日星期一

【毕设】日志-2009.04.29-30

-------------------
[日志] 2009.04.30

  中午来到实验室,主要还是解决正则表达式的问题。text标签的内容是词条正文描述,里面除了有实体的链接外,还有一些无关链接,如类别链接[[Category:Iyobokamana]],语言链接[[yo:Europe]],文件链接[[Image:Europe_satellite_globe.jpgthumbright300pxUburayi]]等,在存进ent_text之前,最好将这些内容删去。目前用StringBuffer来避免逐行解析时漏掉某些链接的问题,或许会牺牲效率。

  在匹配正则表达式时,采用的Matcher.appendReplacement(StringBuffer, String)方法似乎存在问题,输出的时候多打了一遍。后来仔细核对文档,发现必须用两个StringBuffer才行。基本关系抽取的代码到此也差不多了,只是没有用英文维基XML测试。原本这种处理是比较复杂的,但修改数据库后变得简单一些:把删除了无关链接的正文文存进entity表的ent_text项;同时通过ent_id和ent_title来更新relationent表的re_from、re_sortkey,将正文中的其他实体名存进re_to项。暂时通过实体名,而不是编号来查询数据信息,回避当前实体表不全的缺点。



遇到的问题:

  服务器的MySQL服务仍然无法启用。

下一步计划:

  劳动节继续劳动 ... 写高级接口功能。


-------------------
[日志] 2009.04.29

  中午来到实验室,发现服务器的MySQL服务无法启用。昨天是可以用的,但是大三学弟昨晚调试PHP的时候重启了服务器,之后就无法启用了。花了两个小时,没有解决这个问题。几天前曾为了连接服务器修改过一些文件夹的权限,可能改乱了。下午与学弟一起,把服务器搬回了机房,用PuTTY测试连接,暂时没有问题。

  晚上与同学讨论了一些毕设的进展问题。把UDMGrid-DOC0-数据库设计说明-20090429-0-jyb.doc上传到了FTP的设计文档目录中。

遇到的问题:

  修改关系抽取代码时,正则表达式抽取到的信息并不准确,原因可能与SAX的抽取方式有关。SAX是逐行解析,会将段落中的每行割裂开,这样会漏掉一些实体的链接。本想用StringBuffer来解决,但是效果不好。

下一步计划:

  尽快解决问题,然后写接口高级功能。

2009年5月3日星期日

推荐软件:RayDown狂雷FLV视频下载软件

  原本下载FLV都用维棠[1],但这个软件经常崩溃,速度也并不稳定。今天搜索才发现已经有后起之秀了,而且大有赶超之势,这便是狂雷视频平台。

  为什么被称为平台?狂雷官网[2]是这样说明的:“狂雷视频平台是一款集FLV视频搜索、FLV视频下载、视频播放、视频转换、视频修复等一系列功能的综合性视频平台,视频搜索可以搜索多达796个视频网站的视频,具体有深度挖掘视频信息的功能,视频下载采用多线程下载与多CDN下载技术,下载速度飞快。视频播放器可以播放主流的在线视频格式,视频转换可以把下载的视频转换成3GP、MP4、AVI等格式供手机、IPHONE、PSP等手持设备使用。”



  可以对比一下ViDown和RayDown的宣传语:前者是“全球最好用的FLV视频下载软件”;后者是“全球最好的FLV视频下载软件”。都不怎么谦虚,前者市场占有率高,后者技术更强。

  在用的时候也感觉狂雷确实很强大,界面非常漂亮,而且速度快、稳定,支持网站也多。不过稍有些伤感:去年冯如杯我和寝室同学就打算做这种软件的,当时的设想是集下载、播放、搜索为一体。但后来没用心去做,只是在最后完成了论文。算是一种遗憾 ...

相关资料:
[1] 维棠. http://www.vidown.cn/
[2] 狂雷视频平台. http://www.raydown.com/

2009年5月2日星期六

试用Windows 7 RC Build 7100

  前些天在学校FTP下了Windows 7最新的RC版,直到现在刚装。7100与原来的7000相比,并没有太大变化。在下AMD3000+、512MB*2的老机器明显带不动了,而且已没有当初试用Vista时的热忱。

  老了。





  附上中文语言包下载链接[1],和查到的安装方法[2]。

相关资料:
[1] Windows 7 RC 官方简体中文语言包. http://dl.pconline.com.cn/download/53202.html
[2] 给Windows7 beta1安装官方中文包. http://publish.it168.com/2009/0310/20090310027101.shtml

2009年5月1日星期五

读西风独自凉《我心目中的美丽日本》

  今天在Google Reader看到西风独自凉的博客《我心目中的美丽日本》[1]。文章还是那么大气,读来淋漓畅快。虽然题目看似主观色彩强烈,但文中引用了许多事例,是一种理性的论述。

  西风在文末提到此文2007年在媒体发表过,什么样的媒体如此大胆开明?我细查了一下,是《新华时报》[2]。看了它的宣传语未免有几分失望“日本最具权威性和可读性,最有影响、最受欢迎的华文报纸。哪里有在日华人和中文爱好者,哪里就有《新华时报》。”果然不是国内的媒体。这篇文章发表在第163期[3],有一些删节。



  不过,最令我感兴趣的是文章最后一段:“至于道歉,老冰认为:美国在南海撞机事件后的‘I am sorry’可以算道歉的话,日本已经道过多少次歉了?田中首相,日本天皇,包括国人最恨的小泉,小泉在卢沟桥抗战纪念馆说了些什么可能国人都不去记忆了吧?”

  脑海里没有一点印象,赶紧去查网络,原来小泉早在2001年10月8日参观卢沟桥纪念馆时就已发表过道歉。小泉还提笔写下了“忠恕”二字。据他本人介绍,这两个字源出中国《论语》,在《论语》中,曾子认为,“夫子之道,忠恕而已矣”[4]。“忠”者,诚心诚意; “恕”者,充分尊重对方感情[5]。他在结束参观后对记者们说,“我带着对受侵略的中国受害者衷心的歉意和哀悼的心情观看了各种展品”,“我们一定不能再次发动战争,这不是对那些在战争的灾难中倒下的人最好的回答吗?”[6]

  国内媒体后来都有点选择性失忆,总是在小泉数次参拜靖国神社的问题上纠缠。至于靖国神社,我一直都没弄明白,还是不妄加评论了。


相关资料:

[1] 西风独自凉. 我心目中的美丽日本. 2009-05-01. http://www.de-sci.org/blogs/dzl/?p=29882
[2] 新华时报. http://www.xinhuatimes.net:8089/index.asp
[3] 新华时报第163期:我心目中的美丽日本. 2007-08-24. http://www.xinhuatimes.net:8089/read.asp?id=3852
[4] 南方网:小泉纯一郎参观卢沟桥及抗战纪念馆并向中国人民表示道歉. 2001-10-09. http://www.southcn.com/today/hotpicnews/200110090008.htm
[5] 人民网:日本首相小泉卢沟桥畔的“道歉”和“反省”. 2001年10月8日. http://www.tanghu.net/sitehtml/news/gn/2001/10616.htm
[6] 商报:小泉闪电访华表歉意,参观卢沟桥纪念馆敬献花篮. 2001年10月9日. http://pdf.sznews.com/gb/content/2001-10/09/content_242358.htm

【毕设】日志-2009.04.26-28

-------------------
[日志] 2009.04.28

  上午来到实验室,修改数据库的ER图。下午主要在编写数据库设计说明文档。另外,与同学交流了一下正则表达式处理字符串的相关问题,感悟颇多。

  下午近4点的时候,欣喜的发现,服务器的Categorylinks.sql数据已经导完了。但是在MySQL里查询该数据库的时候,却出现 ERROR 1018 (HY000): Can't read dir of './wikikb/' (errno: 13) 的错误,吓得我差点绝望。后来才想到,也许是之前测试连接数据库的时候,乱改了 /var/lib/mysql/ 目录的权限。在命令行中输入 sudo chown -R mysql:mysql /var/lib/mysql/ ,成功解决问题。整个文件有2.42GB,导入后占硬盘空间5.42GB,31692204Rows,耗时5天(每导入13000Rows需3分钟),真是可怕。





  晚上班级有球赛,看完之后直接回寝室修改数据库文档。

遇到的问题:

  代码可能需要很多修改。

下一步计划:

  测试基本关系抽取代码,测试连接服务器的数据库。

-------------------
[日志] 2009.04.27

  上午来到实验室,整理上周完成的工作,并制作工作汇报PPT。下午与同学交流,发现我们本周完成的工作都不尽如人意。

  晚上汇报了工作情况,被师兄委婉地批评了一顿。不过明确了维基的根节点问题,写论文时又可以多凑些字了。



下一步计划:

  开始基本关系代码的改写。

-------------------
[日志] 2009.04.26

  中午来到实验室,发现英文实体表仍未抽取完,目前已运行超过20个小时。

  晚上去看了大班毕业系列活动之唱歌比赛,心情调整的不错。

遇到的问题:

  英文实体的抽取耗时给了我一些启示。由于维基的数据量太大,我没有必要完全处理。但是处理太少的话,又很难体现出深层的关系。如何把握这个度,还需要进一步研究。目前想到的方法是,将代码交给服务器,让服务器来完成完整的处理。

下一步计划:

  由于去看唱歌比赛,耽误了每周例会,明天准备开会时要用到的工作汇报PPT。