検索エンジンはいかにして動くのか?第7回 転置索引の構築2010年2月3日山田浩之検索エンジン, 転置索引, Sort-based Inversion, Merge-based Inversion構築方法はじめにこれまで,転置索引の構造や具体的なデータ構造を見てきました。今回は,検索したいテキスト... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
都会よりも田舎が好きなfujisawaです。Bayesian Setsというアルゴリズムを使って、関連する文書を高速・高精度に検索できるシステムを作成しましたので、そのご紹介をさせていただきます。Bayesian SetsとはBayesian Setsはいくつかアイテムを入力すると、それを補完する... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
|
インディアナポリス(インディアナ州)のChaChaは、いつもすごくおもしろい。‘人力’検索エンジンとして2007年に立ち上がった同社は、文字どおり人間が検索の答えを見つけてくれる。当然ながら、いたずらや悪ふざけにも愛用されている。それに本誌も指摘したが、Googleで検索してその結果をユーザに返す... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
Googleが200以上の要素からランクを決定しているという話は聞かれたことがある方も多いかと思われます。とはいえ、正確に200要素が一体どのような内容で成り立っているのか、ということを知っている人はいないのではないでしょうか。海外では実際にこのGoogleのアルゴリズムを構成する要素の中身を解明... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
先月ハワイに行ってきてオルオルな (ハワイ語で ’楽しい’ という意味) 気分の takahi-i です。最近ログデータの有効活用が話題になっていますが、検索エンジンが出力する検索クエリログを使用してどんなことができるのかについて紹介させていただきます。検索クエリログ検索クエリログ (以下検索ログ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
米Googleは7日、Android携帯電話のカメラで写した物についての情報を検索してくれる新サービス「Google Goggles」をGoogle Labsにて公開した。Android 1.6以上に対応しており、現在、実験的サービスとしてAndroid Marketplaceからダウンロードでき... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
実験エントリです。予習してみる「転置インデックス」というキーワードで検索して、しばらく勉強してみます。転置インデックス - Wikipediamixi Engineers’ Blog » 転置インデックスを実装しようASCII.jp:悟空、秘剣「転置インデックス」を手に入れる |Googleはなぜ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
ネットビジネス | 09:49 | アクセス解析というのは、実際に意味のあるフィードバックを得ようと思うととても難しい。PVやUUはちょっとツールを使えば誰でも測定できる。Google Analytics等を導入すれば、滞在時間やどのようなキーワードで検索されてそのサイトに至っているか、くらいは分... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
本ウェブサイトは現在工事中です.ソースコード公開は10/24頃を予定しています.概要Miniseは最小限必要な機能をサポートした非常にコンパクトな検索エンジンです.検索対象の文章に対し索引を構築し,検索クエリに対する全文検索を行うことができます.索引の種類として逐次検索,転置ファイル,N-gram... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
突然Cでコードを書きたくなったので,なんちゃって転置インデクスを用いた検索プログラムを書いてみた.転置インデクスとは,索引語と呼ばれる単語が出現する文書情報 (場合によっては位置情報も) を保持したデータ構造のことで,索引語と,それに対応する転置リストによって構成される.# 索引語 -> 転置リス... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
|
昨日、東工大で開催されたSIGMOD日本支部第42回支部大会の発表資料です。* 大規模検索エンジンとレコメンドシステムを支える仕組み [pdf] [pptx]- 近年の全文索引手法の解説 -- 転置ファイル, N-gram,半転置ファイル,格納 (VarByte, Rice, Simple9, ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
Seasar, WebService昨日のSeasar Conference 2009 Autumnで発表させていただいた『Blogopolisの裏側』の資料を公開します。Blogopolisの裏側View more documents from kaiseh.資料の28枚目に、重み付きボロノイ図... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
インターネット検索エンジンの月間延べ利用者数(2008年)は4,775万人、 PC向け検索連動型広告市場規模(2008年)は1,254億円に総務省情報通信政策研究所では、インターネット検索エンジンの利用者数等に関する現状と関連する市場規模等の推計を取りまとめましたので、公表します。情報消費が進展す... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
今回は実際にLinuxマシン上にSolr/Luceneをインストールします。インデックスにデータを投入した上で,Solr/Luceneに組み込まれている管理機能の画面から検索を実施するところまでを紹介します。今回の作業で必要になるモジュール類は以下の通りとなります。- Solr(Luceneは同こ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
『 MartiHearstの本! 』 [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
梅雨。部屋干しした洗濯物による異臭騒ぎに苦しむmikioです。今回は、Tokyo Cabinetのテーブルデータベースで超お手軽に全文検索をする方法について説明します。使い方テーブルデータベースについてまずおさらいしておきましょう。PerlやRubyのハッシュのようにコラム名とその値を関連づけた構... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
日本語のサイトにも対応していそうだし、わりと便利そうなのでご紹介。SimilarSitesは似たようなサイトを探してくれる検索エンジンだ。「このサイトと同じようなサイトないかなぁ」というときに便利だ。URLをいれるだけというシンプルなインターフェースも心地よい。またFirefoxやInternet... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
『 色と位置(ブロック分割?)が強いっぽい/中心付近からの段階的類似検索?/1000次元の中身が気になる。Σ{色3次元(+α)x分割数}? 』 [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
『 とうとうここまでやる「検索」エンジンがどんどん出てきたかぁ。研究もうかうかしていられない 』 [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
SIGIR 2009 の採択論文が発表されていたようだ。SIGIR というのは情報検索に関する世界で一番権威ある国際会議で、情報系の国際会議ランキングでもトップ10にランクインしている。その採択数が一番多いのは Microsoft、二番目が Yahoo! 次いで Google (でも3本だけ)とい... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|