表題番号:1994B-035 日付:2002/02/25
研究課題並行分散協調の基本原理の研究
研究者所属(当時) 資格 氏名
(代表者) 理工学部 教授 村岡 洋一
(連携研究者) 理工学部 教授 筧 捷彦
(連携研究者) 理工学部 教授 深沢 良彰
(連携研究者) 理工学部 助教授 上田 和紀
研究成果概要
 本研究の主要な成果の一つは、Internetの中のWebのホームページを全て探し出して、これからページのタイトルに含まれるキーワードを指定することによって、希望する内容のページを検索することができる、検索サーチエンジン「千里眼」を実装して、サービスに供することができたことである。
 千里眼は、日本国内(jpドメイン)の全てのWebのページを、リンクを辿って探索する。これに要する時間は約1週間である。探し出された全ページのデータベースから希望するページを検索するには、ほぼ1/100秒以下の時間で済むので実用上は問題はない。
 千里眼を使って日本中のWeb全ページを探索した結果、現在約10万以上のページがあり、この数は半年で2倍になる勢いで増加していることが分かった。また、他のページから張られているリンク数で比べると、www.asashi.com(朝日新聞のページ)が最も多い。千里眼には現在1日に約1万件以上のアクセスがあり、早稲田大学へのアクセスのトラフィックの大部分を占めている状況である。また、検索に使われたキーワードの統計もとって、インターネットの利用傾向の調査に資することができた。
 ページ探索の時間の縮小のために、サーチエンジンの分散並行化も行なった。複数のサーチエンジンを設けて、それぞれがエリアを分けて並行に実行することによって、全体の探索時間を縮小する。この結果約10台のエンジンを設けることによって、探索時間を1日に短縮できることが分かった。
 現在この分散サーチエンジンの実装・試験中であり、4月からサービスを開始する計画である。