全文検索エンジン【NAMAZU】における画像検索設定方法


全文検索エンジン「NAMAZU」では、
デフォルトで画像のファイル名をインデックスしてはくれないようです。
画像ファイル名を検索でヒットさせたい場合は、
フィルタの追加やフィルタリング項目の修正、
フィルタを使うためのモジュールをインストールする必要があります。



下記ページよりimage.plをダウンロードし、
c:\namazu\share\namazu\filter\win32\へ配置する

http://www.interq.or.jp/japan/koi_san/trash/2004/namazu_filter2.htm


image.plを仕様する為に、ppmにて下記をインストールする


>ppm install Image::Info
>ppm install Image::ExifTool
>ppm install IO::String




この段階で、>mknmz -c では画像形式が追加されている事が確認出来るかと思います。


しかし、この状態では画像は拒絶されたり不許可で引っかかったりします。
その制御を変更する為に、次のステップを踏む必要があります。


C:\namazu\share\namazu\pl\conf.pl内では、
拒絶と許可を正規表現で指定されている。

$ALLOW_FILEへは許可する形式を正規表現で指定する。
今回は下記の様な正規表現を追加した。

"|.*\\.png|.*\\.jpg|.*\\.jpeg|.*\\.gif"


続いて、$DENY_FILEでは拒絶する対象を表す正規表現に、
画像形式がデフォルトで入っているので、
画像を拒絶する記述を削除する

#$DENY_FILE = ".*\\.(gif|png|jpg|jpeg)|.*\\.tar\\.gz|core|.*\\.bak|.*~|\\..*|\x23.*";
$DENY_FILE = ".*\\.tar\\.gz|core|.*\\.bak|.*~|\\..*|\x23.*"; # 画像の拒否を解除する



改めてインデックスを作成すると、許可した形式の画像がインデックスされ、
画像のファイル名が検索でヒットするようになります。

コメントをお待ちしています

人気の投稿

Category

Algorithm (2) Android (8) ASP/aspx (1) Blogger (2) C/C++ (1) Chrome (5) CSS (9) Firefox (4) Fortran (1) Google (9) GoogleMap (2) HTML (12) IE (3) Information (4) iOS (2) iPhone/iPad/iPod (2) Java (6) JavaScript (16) jQuery (9) JSP (1) LifeRecipe (5) Linux (2) Macintosh (2) MapKit (4) Marketing (7) MySQL (3) NAMAZU (2) Objective-C (7) Other (7) Perl (1) PHP (9) Python (1) RSS/Atom (2) Ruby (1) Safari (2) SEO (11) Smarty (2) SQL (2) Tex (1) Three.js (1) Twitter (1) TwitterLog (313) UIKit (5) Unix (1) VBA/VBS (1) Windows (5) WordPress (3) Writing (5) XAMPP (1) XML (1) Yahoo (2) ZendFramework2 (14)