I like winter, it's cool. I can feel myself in the crowd people, it's nice feeling.
这种天气里,我可以自己控制我自己.
春蚕到死丝方尽,我明白老师为什么死的快了,哈哈.就像我这样一天一天地浪费生命,浪费时间,I'm wasting my life here.
还好是对付学生,一波一波的,要是换成农作物,换成森林,那就更郁闷了.
-
It's my season
@ 2007-10-31 – 00:43:22
-
nutch study
@ 2007-10-30 – 00:43:26
1. download nutch0.7.2,因为0.9存在一个与lucene兼容的问题,
ArrayIndexOutOfBoundsException
该问题的修改方法见http://blog.sina.com.cn/s/blog_537c07f6010009t9.html2. touch a new file about url
$vi urls/site.txt
input a url, for example "http://www.cnn.com"3. modify configuration file
$vi conf/crawl-urlfilter.txt# accept hosts in MY.DOMAIN.NAME
+^http://([a-z0-9]*\.)*MY.DOMAIN.NAME/=====TO=======
+^http://([a-z0-9]*\.)*cnn.com/
4 run nutch
$bin/nutch crawl urls/site.txt -dir cnn.com -depth 3 -threads 4 >& cnn.log
then wait the program finish
5. see the result
$bin/nutch readdb cnn.com/db -statsit may show show something like blow:
---------------
071026 174805 parsing file:/root/nutch-0.7.2/conf/nutch-default.xml
071026 174805 parsing file:/root/nutch-0.7.2/conf/nutch-site.xml
071026 174805 No FS indicated, using default:local
Stats for org.apache.nutch.db.WebDBReader@1a16869
-------------------------------
Number of pages: 1096
Number of links: 5023
------------------6. config tomcat
modify /webapps/nutch/WEB-INF/classes/nutch-site.xml
add follows:/home/nic/dev/nutch-0.7.2/testsite/
7. 很多情况下throw ClassNotFoundException or ClassNotInistialException or NutchBeanException , etc. I think its version problems.
-
Manage struts.xml
@ 2007-10-22 – 05:39:53
Pay attention to the struts config file, struts.xml and other sub config files, it's import to make sure that there is no same name actions.
Today morning i meet a problem, because there are same named java classes files and same named actions, so the validation framework didn't work rightly. And i can't confirm where the bug is. Finally i guessed something above, hoooo, it is!
I think because there's homonymy files, so the struts doesn't know what to do, so it strikes.在编写struts时,要保证类文件和配置文件中没有重名的现象,不然会扰乱struts框架的工作。比如如果action的名称相同,validation就不能正常工作了。
-
Eclipse problems
@ 2007-10-18 – 08:13:12
I made a new project of struts, and i need some libraries to run the project, following is the libraries:
commons-logging-1.0.4.jar
freemarker-2.3.8.jar
ognl-2.6.11.jar
struts2-core-2.0.9.jar
xwork-2.0.4.jar
i config the project properties on "Java build path", and add library, but the eclipse show me a warning:Classpath entry org.eclipse.jdt.USER_LIBRARY/struts2 libs will not be exported or published. Runtime ClassNotFoundExceptions may result.
and it works as it said.......
in the log, it reports ClassNOTFoundException.i find some way to solve this temporarily, i copy the libs to the webapps floder. it works fine, but i don't think its the right way.
Add it to me Todo list.
-
矛盾
@ 2007-10-17 – 10:41:29
社会主义社会要推崇平等,但是现在的社会却是在推崇阶级。吃了什么营养品就能比别人强,住了什么放就能享受尊贵。但是这种等级的差距的来头确实人们痛恨的垄断,不管是行业垄断也好,政治垄断也好,这都是祸根啊。
无聊的网络封锁令人生气。就像户籍制度一样,把人都一片一片地分区管理,让每个区域的人相对独立,即使某一块出了问题,也不会影响到大局,局部监管和清除就可以了。
软件业中的模块化方法应用到了政治上,效果奇佳。比如有个地方的人们受不了压迫了,想反抗,但是其它地方的人不知道啊,有同类想法的人不能及时相应。好了,统治阶级的目的实现了。
统治阶级说:我们没有阶级,我们的社会是人民的社会,人民是国家的主人,通过选举出来的代表来管理国家。通过这种共和方式,虚伪的共和方式来糊弄大家。
代表选出来的就是统治阶级的代表。。。。。。。
可恶的不是这种制度,而是这种虚伪。 -
Me today
@ 2007-10-16 – 06:52:26
通过fetch mail得到了这样一个网址,
http://www.thebeijinger.com/
貌似是为老外准备的,可以充斥了大量的国人,而且大都是年轻小姑娘在look forward for a friend, even knight.....
不说什么了,这个东西讨论不清了。
==========================================
白天红旗飘飘,晚上警灯闪闪。
17大搞得气氛挺紧张的,跟俺关系不大,等开完会看看评论吧。 -
install and config Solaris
@ 2007-10-16 – 06:50:05
Solaris,在晓得这个名词五年后终于有一天实际安装了一次。
配置机型是HP460C刀片,不能直接在物理机上装,只能通过iLO来远程,慢啊~~~
Solaris做的太绝了,为了达到无值守安装,给有些选项设置了timeout 30 seconds,为此我错过了好多配置项,很重要的一项就是apply drivers updates,这个item不是defalut,如果错过这一项的话,就不能安装Memory dirvers,无法识别硬盘,哭死。
这个问题的解决还多亏了HP的客服,讲解的非常明白,还把driver mail me,nice guy! There is a ISO file in the drivers files. Mount the iso file, the the system can install the drivers automaticly.
When solved this problem, the system can intall successfully.
The Solaris interface is so urgly! though the java interface is better.
i spent a whole morning to make it connect to the network.First i try to config the network scripts like red hat or ubuntu,but it doesn't work properly.
i type the commend "ifconfig -a" in console, it display some information of lo0, with its address 127.0.0.1, i thought this is right the NIC, so i try run configrations on it, including config its IP address, defalut router(gatewar) and DNS,but it didn't work.
I type ping commed,it response ICMP errors, i try everything i can, however, nothing happend.
Then i found sth unnormal, the NIC didn't work because it haven't been drivern!Here the problem is!faint.......
So, i download the network card driver from the HP website, unzip the file i got a second ISO file, mount it to the system, run INSTALL script, reboot the machine, then i got a really network card.
but i still have something difficult to make it connect to the net properly. I cann't rightly config the DNS, so it can only have ping responses from the ethernet, but nothing from internet through a domain name. i lost patient to config it again and again, then i run sys-unconfig commend, then reboot the system and config the system manually by kindly interface, it worked nice this time!The last thing is disable telnet funtions by this commend: svcadm disable svc:/network/telnet, it is became more safe now.
the solaris' defalut commend environment is not friendly, then type bash, it trun to your familiar environment.
-
Me today
@ 2007-10-15 – 10:07:12
LY最终还是去Intel了,高薪啊。
每个人都有自己的选择,自己的选择也要赶紧定啊,不然年纪大了就没有资本了。BL460C自带的SmartStart只能支持windows和Novell,如果直接安装Solaris的话,就提示找不到硬盘,打8008103888资讯了一下,搞定,在选择Sorlaris Interactive的时候,要选择Apply driver updates,这样就可以先手动安装驱动,然后再装系统。
但是,慢死了!!!!!Eclipse原版本来将Ctrl+Space作为了Assistent,但是在China这个hot key是切换输入法的,所以就只能用Alt+/了。习惯了都一样。
-
study Struts2 关于模块组织机制
@ 2007-10-10 – 06:59:53
每个人都有自己的任务,每个人都干好自己任务就能完成大的任务。
模块化的分工可以更好的完成自己的专长,而组织者就负责协调这些模块之间的交互。
这也体现了国内外对“组织者”,或者直接说“领导”的不同认识。
组织者应该也是一种职业,完成一项工作模块的岗位,而不是高高在上的领导。
希望Struts2里的机制能再人类社会中实施。 -
lucene study note
@ 2007-10-09 – 09:12:17
Lucene使用一种高效的索引机制,并对搜索过程进行优化,从而决定了它的高性能。
高效的索引机制表现在:1.索引中关键字是按照字符顺序排列的,检索时不需要遍历所有内容。2.使用倒排索引可以快速定位文件位置。3.增量的索引分批次地调整索引文件,避免频繁索引更新影响性能。4.复合索引格式减少了索引文件数量,避免了搜索时要打开多个文件造成的资源浪费。5.Lucene对索引使用了压缩技术,减小了索引文件的大小。
搜索过程优化体现在:1.在收集结果的过程中将匹配度低的结果自动过滤掉,将匹配度高的结果输出。2.内存索引速度更高。英文句子的分词借助空格得到单词。中文的句子是连起来的,分词有三种技术:1.单字切分。2.二分法,即所有连接的两个字都是一个词。3.词库分词。用建立好的词库匹配目标,匹配成功则切分出来。
英文分词的时候也有问题发生,比如词性的变化,单复数的变化,时态变化,大小写变化等待。
Lucene缺省按照自己的相关度算法(score)对结果进行排序。基于其它字段的排序需要在搜索过程中访问存储字段,这样导致检索性能大幅度下降,除了匹配度score外,唯一能用来排序的就是索引记录的ID,所以一个较为高效的实现定制排序的方法是,在索引时,让进入lucene全文的顺序对应一定的规则,在搜索时,让搜索结果按照索引记录的ID进行排序。
可以给某一项内容评分,0~100,初始值是50,用户可以对其内容评分,加分或减分。这个分数为所有用户评分和初始分数的平均分取整。内容提交时间为CD年EF月,GH日IJ时,KL分MN秒,,A~N连接起来形成一个字段,为索引字段,可以按要求每隔一个月或一段时间对内容重新建立一次索引。
这种方法把用户对内容的评价和更新时间作为内容对搜索用户的价值体现出来,首先以用户的评价排序,如果评价相同,则按评价时间排序。
对于数据库的like查询来说,lucene全文搜索引擎优势很大。Lucene将数据源中的数据都通过全文索引一一建立反向索引,而like查询中的索引是没有作用的,要对数据进行GREP式的遍历。Lucene通过词元进行匹配,对语言的支持效果很好。Lucene有匹配度算法,结果出现5次的结果肯定比只出现一次的靠前。
-
GFW?
@ 2007-10-09 – 04:08:12
blog还是登录不了,到底还要封多少网站!!!!可恶!!!!
在《机会》记者一再恳求下,比尔·盖茨答应在他前往非洲的飞机上接受采访。《机会》杂志随即决定买头等舱机票同行。在飞机上,记者为了达到既定目标,提出采访提纲全是与“机会”有关的提问:一、你是怎么想到不等大学毕业就抓住“机会”离校创办微软?二、你对这个发展机会,有多大把握?可有什么条件来判断,它就是“机会”?三、你对“机会”与人生、与事业的影响,怎么看?……《机会》就是要逼比尔·盖茨多说一些“机会”内容。
比尔·盖茨打开采访提纲就笑了。他说:根据你的提问,我谈三点。第一,最近我母亲病逝,我深感对母亲的孝顺是不能等待的。第二,我认为在爱情上也不能等待,只要你真的爱她,就不要迟疑,直接向她求爱,不然她就属于别人了。第三,就是企业要回报社会,不能等待,如慈善事业。只要你认可这是很重要的,也不要等待。投入慈善事业是我的理想和追求。
记者吃惊地发现:他所要的“机会”二字,在比尔·盖茨嘴里始终没有出现。
故事的哲理
人,不能为投机而工作。当你把自己的精力集中在事业追求上,只要你从社会大众、人们根本利益与需求出发,去从事一项事业,“机会”就会很多。相反,如果一味投机,你总有一天会发现:你已经一再错失了其实最值得你珍惜的“机会”。
http://news.csdn.net/n/20071008/109348.html
============================================
这个跟我对憧憬与努力的认识有些类似.看来我的认识还是比较正确的,不要投机,努力埋头工作. -
圣白树开花
@ 2007-10-08 – 04:08:21
外观:长而优雅的树叶,在它的顶冠上有许多白色的花朵,像是在阳光下的积雪一般反射着光芒。
作用:象征古代努曼诺尔的容光,只要这树存在,努曼诺尔人的国度就会兴盛,白树枯死,国家也会衰亡愿珊瑚虫重新崛起.
-
努力的过程要忘掉结果
@ 2007-10-06 – 04:24:57
午觉醒来,明白了一些事情。
做梦回到了高中,也过渡到了现实。成功并不是通过期盼得到的,而是通过努力得到的。当对成功,对美好的未来充满憧憬的时候,往往事得其反;而对未来报以坚定的决心,并付出努力行动时,反而更容易成功。
如果把心思都用在了处理憧憬上,则现实的工作肯定收到了影响,没有达到一步一步的目标的时候,又容易气馁。而忘掉这些不应该浪费心思的东西,沉下心去一步一步去把自己的事情做好做实,在不经意的瞬间,梦想实现了
。最近blog更新的很慢,这也跟新工作的适应有关系,没有个人时间来精心理顺自己的心情,也就没有了心情记录。
最近虽然在学习英语的过程中,但是总体进度很慢,想到了原因和解决办法,努力去实现吧。哦,对了,还要把去鹫峰的blog和pix补上。
-
一山更比一山高
@ 2007-10-01 – 04:12:32
今天去爬鹫峰了。成功逃了票。前300米的海拔都是走了夜路,不过很有意思。后来峰回路转,转到了鹫峰的官路上了。鹫峰和望京塔的分岔口犹豫了一会,然后选择了去更高一些的望京塔。到了塔顶,和火警检测员聊了一会天,才知道自己的海拔才700多米,更高的地方要去罗伯地才行,那里是1300米。没得说,继续走吧,翻了一个山头后才到达目的地。到了之后发现后面的妙峰山比这里更高。只不过在爬的时候看不见更高的风景。或许这就是爬山的最大乐趣吧。爬山就是不断的征服和不断的挑战。山高人为峰,现在才觉得这句广告词是这么的有意义。
山顶的风景果然和别的地方不一样,不光是望远,连心情也舒畅了。也有了当初看大海时的那片平静。人太渺小了。
