该用户从未签到
|
揭密搜索引擎开发——Lucene+Nutch搜索引擎开发
h8 K+ Z* N8 U3 Y" E
8 ]9 @% n7 W9 E; b7 g$ o7 U7 y- Z继人民邮电出版社推出《开发自己的搜索引擎--LUCENE 2.0+HERITRIX》后,推出新的重量级开发经典——《开发自己的搜索引擎--LUCENE 2.0+HERITRIX》
' |. U1 a' Q6 W# M6 W( w
0 D% }* C. |4 N T
6 ~/ D3 O+ C7 L1 N/ v$ Q 搜索引擎技术是互联网资源导航和访问的重要手段。但是对于一般开发者而言,搜索引擎的底层开发技术过于复杂,加上各大搜索引擎厂商对核心技术严格保密,使搜索引擎开发有很高的门槛。开源搜索引擎项目Lucence和Nutch的出现改变了这一现状。使用这两个软件,普通开发者能够快速搭建搜索引擎应用。
! M9 X; i3 ]4 q% g3 }7 l& t! a* e% u% ~5 F5 w
Lucence和Nutch系统使用Java语言开发,内部的代码和技术细节全部公开,为搜索技术提供了快速实现方法。由于采用了跨平台的开发语言,在各种应用开发、各种平台的应用中有很好的适用性。
+ M2 F9 E* Z; W$ z1 P Lucence提供了强大的全文检索功能,在桌面检索系统、网站级邮件列表、网站站内索引、企业级内部文档管理与检索、情报分析系统、知识管理系统、图书馆检索系统中都能够很好的应用。甚至在部分覆盖了上亿乃至数十亿网页的搜索引擎中也可以应用。Nutch是Lucence得到广泛应用和认可之后出现的搜索引擎系统,内部使用了Lucence的索引管理、存储和检索技术,并进一步封装成一个真正的搜索引擎。两个系统一起完成了搜索引擎从网页下载、文本分析、索引生成、索引存储、信息检索等各个层面的应用。$ y7 p* l G* g0 A/ Q0 _" Y* e
1 x, I( }# G) \6 i4 _本书适合+ k/ _% F& l4 i* f# r7 r1 w
搜索引擎初学者 C1 R4 }1 C4 w7 s
高校信息专业学生
0 A7 ]% N$ Q' s; p3 r 从事搜索开发的程序设计人员
( A4 _' R5 C, K- u5 i) p 希望了解搜索技术的编程爱好者, i3 Q: p! \% o' }) m7 t# G" h6 F! X
熟悉Java语言的各类开发人员
% ^( ?8 R% G+ D2 n5 k% p( r# o具体信息参考:
6 @' D# v0 j% {6 }http://www.china-pub.com/41701; S5 P6 w" z) }5 K% ?( s) Q
http://www.huachu.com.cn/itbook/itbookinfo.asp?lbbh=10084714( Z* X* X- f+ ~: ^+ L! E/ j6 Z5 X# q( Q3 O
http://product.dangdang.com/product.aspx?product_id=20308327 |
|