|
揭密搜索引擎开发——Lucene+Nutch搜索引擎开发
3 S( ], [. c! a u2 l1 a6 F
" r. z. u% z g* G0 t% x% x继人民邮电出版社推出《开发自己的搜索引擎--LUCENE 2.0+HERITRIX》后,推出新的重量级开发经典——《开发自己的搜索引擎--LUCENE 2.0+HERITRIX》5 g% U; Q& l' Y! j. ]
5 `2 d5 r4 {: n: q. o# D% m0 I0 i3 F9 I. P- l
- s3 B! F# ~) }& h' ^% _9 X
搜索引擎技术是互联网资源导航和访问的重要手段。但是对于一般开发者而言,搜索引擎的底层开发技术过于复杂,加上各大搜索引擎厂商对核心技术严格保密,使搜索引擎开发有很高的门槛。开源搜索引擎项目Lucence和Nutch的出现改变了这一现状。使用这两个软件,普通开发者能够快速搭建搜索引擎应用。
0 S2 `8 `, X4 Y' E
8 @+ y2 n! {! f5 u2 ]8 P6 G Lucence和Nutch系统使用Java语言开发,内部的代码和技术细节全部公开,为搜索技术提供了快速实现方法。由于采用了跨平台的开发语言,在各种应用开发、各种平台的应用中有很好的适用性。: K4 `1 ], Q0 j, ~+ l6 ~, g
Lucence提供了强大的全文检索功能,在桌面检索系统、网站级邮件列表、网站站内索引、企业级内部文档管理与检索、情报分析系统、知识管理系统、图书馆检索系统中都能够很好的应用。甚至在部分覆盖了上亿乃至数十亿网页的搜索引擎中也可以应用。Nutch是Lucence得到广泛应用和认可之后出现的搜索引擎系统,内部使用了Lucence的索引管理、存储和检索技术,并进一步封装成一个真正的搜索引擎。两个系统一起完成了搜索引擎从网页下载、文本分析、索引生成、索引存储、信息检索等各个层面的应用。' }) }+ v1 |. F' l
2 r# ~5 G; J r, E7 v! r/ c! q! X
本书适合
/ V& N* N7 b6 ~ 搜索引擎初学者
! u# w. E5 o% ]( @ 高校信息专业学生
- j4 X0 S: B; C$ ?1 Y6 Z 从事搜索开发的程序设计人员9 N3 C5 t4 ]; j* d) z$ F
希望了解搜索技术的编程爱好者- ]* f* [6 Z9 V" t9 t
熟悉Java语言的各类开发人员5 y1 \, S8 t4 s$ ]& o+ F
具体信息参考:
, h! o1 z; G9 F8 |http://www.china-pub.com/41701
3 C0 t8 F, U$ W" m( g; s$ ^% ihttp://www.huachu.com.cn/itbook/itbookinfo.asp?lbbh=10084714 c: l% I. Q/ d. g+ y! U
http://product.dangdang.com/product.aspx?product_id=20308327 |
|