検索エンジンはいかにして動くのか?第7回 転置索引の構築2010年2月3日山田浩之検索エンジン, 転置索引, Sort-based Inversion, Merge-based Inversion構築方法はじめにこれまで,転置索引の構造や具体的なデータ構造を見てきました。今回は,検索したいテキスト... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
都会よりも田舎が好きなfujisawaです。Bayesian Setsというアルゴリズムを使って、関連する文書を高速・高精度に検索できるシステムを作成しましたので、そのご紹介をさせていただきます。Bayesian SetsとはBayesian Setsはいくつかアイテムを入力すると、それを補完する... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
検索エンジンはいかにして動くのか?第5回 転置索引の実装2010年1月6日山田浩之検索エンジン, 2分探索, B+木, 転置索引, ポスティングリスト12はじめに前回,前々回と転置索引の論理的構造について見てきました。今回は,転置索引の具体的なデータ構造や実装について説明していきます。辞書の実装辞... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
検索エンジンはいかにして動くのか?第4回 転置索引の詳細 2009年12月22日山田浩之検索エンジン, 転置索引, ポスティングリスト, ブーリアン前回は転置索引の概要を説明しました。今回は転置索引をもう少し詳しく見ていきます。転置索引=辞書+転置リスト転置索引は大きく分けて2つの部分から構成され... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
浜本階生計算幾何学は,図形に関するアルゴリズムを研究するコンピュータサイエンスの一分野です。本連載では,ビジュアルブログ検索エンジン「Blogopolis」で採用されている計算幾何のアプローチを例に取り上げながら,計算幾何の初歩を実践的に学習します。第1回 直線の幾何計算幾何学とはBlogopol... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
Googleが200以上の要素からランクを決定しているという話は聞かれたことがある方も多いかと思われます。とはいえ、正確に200要素が一体どのような内容で成り立っているのか、ということを知っている人はいないのではないでしょうか。海外では実際にこのGoogleのアルゴリズムを構成する要素の中身を解明... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
先月ハワイに行ってきてオルオルな (ハワイ語で ’楽しい’ という意味) 気分の takahi-i です。最近ログデータの有効活用が話題になっていますが、検索エンジンが出力する検索クエリログを使用してどんなことができるのかについて紹介させていただきます。検索クエリログ検索クエリログ (以下検索ログ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
実験エントリです。予習してみる「転置インデックス」というキーワードで検索して、しばらく勉強してみます。転置インデックス - Wikipediamixi Engineers’ Blog » 転置インデックスを実装しようASCII.jp:悟空、秘剣「転置インデックス」を手に入れる |Googleはなぜ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
検索エンジンはいかにして動くのか?第1回 検索エンジンとは2009年11月10日山田浩之検索エンジン, 全文検索, インデックス, grep12はじめに検索エンジンと聞くと,みなさんは何を思い浮かべるでしょうか? GoogleやYahoo!などの検索ページを思い浮かべる方がほとんどだと思います。近... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
突然Cでコードを書きたくなったので,なんちゃって転置インデクスを用いた検索プログラムを書いてみた.転置インデクスとは,索引語と呼ばれる単語が出現する文書情報 (場合によっては位置情報も) を保持したデータ構造のことで,索引語と,それに対応する転置リストによって構成される.# 索引語 -> 転置リス... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
|
商品の説明内容紹介 Googleはウェブ検索エンジンで世界的大企業となった。本書では,Googleのウェブ検索エンジンの基礎であるPageRankアルゴリズムや,他の代表的なHITSアルゴリズムなどを,それらの初歩から,数学的側面や関連するエピソードも含めて紹介する。基本的なアルゴリズムの解説から... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
C++版のOpenCVを使ってカラーヒストグラムを用いた類似画像検索を実験してみました。バッチ処理などのスクリプトはPythonを使ってますが、PerlでもRubyでも似たような感じでできます。指定した画像と類似した画像を検索するシステムは類似画像検索システムと言います。GoogleやYahoo!... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
Google,Yahooを中心とした、検索エンジンの動向をいち早くお届けするインフォキュービック・ジャパンのオフィシャルSEOブログバックリンクとリンク先の関連性 普段からバックリンクの質やタイプに着目しているSEO技術者の間で必ずと言っていいほど登場する言葉が「関連性」だろう。 関連性の高いバッ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
Seasar, WebService昨日のSeasar Conference 2009 Autumnで発表させていただいた『Blogopolisの裏側』の資料を公開します。Blogopolisの裏側View more documents from kaiseh.資料の28枚目に、重み付きボロノイ図... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
第6回 全文検索を実装したソースコードを読もう倉貫 義人 松村 章弘 TIS株式会社 SonicGarden2009/9/3優れたプログラマはコードを書くのと同じくらい、コードを読みこなせなくてはならない。優れたコードを読むことで、自身のスキルも上達するのだ(編集部)いよいよオープンソースの社内S... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
WebServiceブログランキングサービス『TopHatenar』に登録された20万件超のブログを3Dの仮想都市景観に凝縮したサイト、『Blogopolis』を公開しました。ビジュアルブログ検索エンジン [Blogopolis]BlogopolisとはBlogopolisは、昨年6月に公開したは... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
GoogleやYahoo!の検索結果の上位に来ないページやサイトは存在していても存在していないのと同等の扱いを受けてしまうため、検索エンジン対策最適化、すなわち「SEO(Search Engine Optimization)」を専門に行う業者が無数に存在しており、まことしやかにいろいろな噂や都市伝... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
かの有名な検索エンジン「Google」にはページランクという概念がありますが、そのページランクを支える理論の一つがこの「マルコフ連鎖」というもの。さまざまなジャンルに応用されていることでも有名で、人工知能ならぬ「人工無能(いわゆるチャットボット、会話ボットなど)」にも使われることがあります。 で、... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
梅雨。部屋干しした洗濯物による異臭騒ぎに苦しむmikioです。今回は、Tokyo Cabinetのテーブルデータベースで超お手軽に全文検索をする方法について説明します。使い方テーブルデータベースについてまずおさらいしておきましょう。PerlやRubyのハッシュのようにコラム名とその値を関連づけた構... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
Java | 統計的に正しいランキングを行う方法を見たのでちょっとJavaで書いてみる。はじめになにがしたいかというと、「レイティング」というのをご存じでしょうか。Amazonとかで商品を購入者が星つけて評価したりしてるやつ。ああいうので「良かったランキング」というのを作りたい。みんなが「購入して... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|