别了,我爱的北京!   北京,我从小向往的城市,祖国的首都,红色中国的心脏...   我就要走了,和你告别了!   你这个可恶的城市!   我实在是受不了你的愚昧无知了!   每一年我心甘情愿向zf、d上缴2w的rmb...   换不来一个居住的资格!   我誓死不办狗屁的暂住证!   你狂你的吧!   同志们,是有一腔热血的都走吧!   你个狗屎的北京!   永别了!  
2008-03-29

实现MHT文件格式的解析和内容抽取

关键字: mht parser decoder encoder
由于我们的业务系统中有大量的MHT格式的资料,需要对其建立索引,搜索很久了一直没有找到相关解析的类库,只好自己动手丰衣足食了。已实现内容的提取以及和lucene的整合,稍后会完善编码检测及其他内容的提取,做一个完整的parser出来。    文本内容提取:  首先提取html部分的内容,解码之后使用nekoHtml提取文本内容;public class MhtDocHandler extends HtmDocHandler { private DOMFragmentParser parser = new DOMFragmentParser( ...
在JDBC应用中,如果你已经是稍有水平开发者,你就应该始终以PreparedStatement代替Statement.也就是说,在任何时候都不要使用Statement.基于以下的原因:一.代码的可读性和可维护性.虽然用PreparedStatement来代替Statement会使代码多出几行,但这样的代码无论从可读性还是可维护性上来说.都比直接用Statement的代码高很多档次:stmt.executeUpdate("insert into tb_name (col1,col2,col2,col4) values ('"+var1+"','"+var2 ...
代码行计算(包括注释、配置、jsp): n=文本文件大小(M)*1024*1024/80/2 【80:最大行字符数,除以2为平均长度】
2008-03-26

NekoHTML 处理转义字符的问题

关键字: nekohtml 中文 乱码
NekoHTML在处理html文档时,如果碰到&开始的转义字符(如 空格),会出现乱码问题! 现象: 此问题在网络上多次出现,但没有解决办法,经过跟踪nekoHtml的执行,发现其处理&转义字符时需要读取org\cyberneko\html\res\HTMLlat1.properties属性文件,查找&转义字符的对应字符,但是由于某种原因,java.util.Properties类在读取此文件会产生乱码; 解决办法: 由于我提取html内容后最终还是要已html的形式在页面展示,所以对转义字符的处理并不希望在内容提取时进行,而是有浏览器在显示时做转换;所以可以 ...
真是见鬼啊! 当年在学校写的一个破程序,竟然被到处转,nnd。。。。。。。。java 代码import java.io.IOException;    public class CtrWDS {        private static CtrWDS ourInstance = null;        p ...
2007-11-27

JBPM与SPRING事务框架完全整合

关键字: jbpm spring 事务
经过一段事件的摸索终于将jpbm与spring完全整合,主要是事务处理的整合,工作流代码与业务代码在一个事务上下文进行; 使用了springmodules的封装,对jbpm稍有修改,稍后附上解决办法及代码; ======================================================== spring modules中包含了spring集成JBPM的机制,在使用的发现其并没有彻底解决两者的事务处理统一的问题,经过一段事件的摸索终于将jpbm与spring完全整合,主要是事务处理的整合,工作流代码与业务代码在一个事务上下文进行;使用了springmodu ...
betafox
搜索本博客
我的相册
677a5c9b-1465-359d-bda8-6ea11d9a7725-thumb
20071125132003e3f32
共 2 张
最近加入圈子
存档
最新评论