2000字范文,分享全网优秀范文,学习好帮手!
2000字范文 > 这两天一直在捣腾lucene

这两天一直在捣腾lucene

时间:2021-03-14 11:23:49

相关推荐

这两天一直在捣腾lucene

开始看了下java的,弄不太明白,没学过java,后来找了了.net的,主要是研究下dotlucene,由于刚刚接触c#,对这样一个开源的项目研究还是有点困难,不过我比较喜欢搜索类的,所以还是看了起来,看了大量的资料,英文的和中文的,现在终于是调试成功了,而且加了一个基于词表的中文分词。

现在还有Highlighter高亮显示的没弄出来,正在研究中!

还有就是自己写的html2text,感觉效率不是很好,老是程序一运行程序就卡死!不知道什么原因

1publicstringhtml2text(stringcontent,strings,stringe)

2{

3ints_pos=content.IndexOf(s);//查找开始字符串位置

4while(s_pos!=-1)

5{

6inte_pos=content.IndexOf(e,s_pos);//结束字符串位置

7if(e_pos!=-1)//如果存在结束字符串则进去替换处理

8{

9stringreplacestr=content.Substring(s_pos,e_pos+e.Length-s_pos);//夹在开始和结束字符串之间的被替换字符

10content=content.Replace(replacestr,"");

11s_pos=content.IndexOf(s);

12}

13}

14content=content.Replace("\n","");

15content=content.Replace("\r","");

16content=content.Replace("","");

17content=content.Replace("","");//tab键过滤

18//content=content.Replace(" ","");//空格过滤

19returncontent;

20}

以前用VB写的感觉没这么卡的,可能也跟一边索引有关吧!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。