都会よりも田舎が好きなfujisawaです。Bayesian Setsというアルゴリズムを使って、関連する文書を高速・高精度に検索できるシステムを作成しましたので、そのご紹介をさせていただきます。Bayesian SetsとはBayesian Setsはいくつかアイテムを入力すると、それを補完する... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
先月ハワイに行ってきてオルオルな (ハワイ語で ’楽しい’ という意味) 気分の takahi-i です。最近ログデータの有効活用が話題になっていますが、検索エンジンが出力する検索クエリログを使用してどんなことができるのかについて紹介させていただきます。検索クエリログ検索クエリログ (以下検索ログ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
『 類語をみつける方法:同じカテゴリの単語を複数見つける:同位語検索:大阪やでググると「大阪や埼玉」「大阪や鳥取」などが出る:単語ひとつだけ使うならGoogleSetsを使うか「や」を使う:複数単語を使えるならBoo!Wa!は最強 』 [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
かの有名な検索エンジン「Google」にはページランクという概念がありますが、そのページランクを支える理論の一つがこの「マルコフ連鎖」というもの。さまざまなジャンルに応用されていることでも有名で、人工知能ならぬ「人工無能(いわゆるチャットボット、会話ボットなど)」にも使われることがあります。 で、... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
|
こんにちは、日本語処理技術部の阿久津剛之です。 Yahoo!デベロッパーネットワークにて、キーフレーズ抽出APIを公開しましたので紹介します。キーフレーズ抽出APIとは、与えられた文章から、その文章を特徴づける重要な部分(キーフレーズ)を抽出し、独自の算出方法により点数付けを行って返すAPIです。... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
ポジティブ/ネガティブ投票による正しいランキング方法が以下の記事で紹介されています。How Not To Sort By Average Ratingこの計算方法では、投票数が少ない場合には分散が大きく不正確な評価で、投票数が多くなるにつれて分散が小さく正確な評価が得られているという事を考慮してい... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
先週の Amit の記事 では、Dr と Doctor/Drive のような例を使って Google の同義語システムについて説明しました。このシステムはもちろん日本語でも有効です。Google は[ファミマ] と [ファミリーマート] が同じ意味だと知っています。また、[Webサーバ 作り方] ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
ニュースGoogleよりも賢い(?)ナレッジエンジンが5月に登場理論物理学者スティーブン・ウルフラム氏の「Wolfram|Alpha」は、「円周率の300けた目は?」といった質問に答えてくれるという。2009年03月09日 13時14分 更新理論物理学者で数学ソフトを扱う米Wolfram Rese... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
ネタ帳は、売れない、人が来ないホームページにならない為の、インターネットの知識とブログネタに使えるエントリを書いています。
実にユニークなFirefox拡張アプリとして使っていたpopInに、ブロガーの文章力を調べる機能が実装された。これはやばい。 正確には文章の難易度を測定する機能なので、わかり... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
そろそろ落ち着いて来たころ合いなので、はてなブックマーク全文検索機能の裏側について書いてみることにします。PFI側は、8月ぐらいからバイトに来てもらっているid:nobu-qと、id:kzkの2人がメインになって進めました(参考: 制作スタッフ)。数学的な所は他のメンバーに色々と助言をしてもらいま... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
JReK(ジェイレック)は、 日本語のウェブページのテキストを 巨大な例文集(コーパス, Corpus)とみなし、 それを検索するサイトです。 日本語作文の際に役に立つかと思います。 JReK is a Japanese web corpus search site. It is usefull ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
はじめまして、ライブドアキャリアを担当している小俣といいます。 いきなりですが、ライブドアにはたくさんの広告枠があることは、皆様ご存知かと思います。トップ以外の各コンテンツのヘッダー部分に出ている横長のバナーや、ニュース面に掲載されているテキストなどがその代表例でしょう。 その広告枠、常に完売状態... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
|
カリフォルニア州サンノゼ発--Microsoftは、Googleの圧倒的な検索エンジンに対抗する手段を見つけたと考えている。その手段とは、人が何をウェブページで検索するか、何がウェブページに掲載されているのかをより深く理解することだ。 具体的に言うと、Microsoftは、ユーザークエリ全体を検証... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
Yahoo!デベロッパーネットワーク(YDN)に 「日本語係り受け解析Webサービス」が登場しました。 - Yahoo!デベロッパーネットワーク - テキスト解析 - 日本語係り受け解析 http://developer.yahoo.co.jp/jlp/DAService/... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
Yahoo!ウェブ検索APIで検索結果100件を取ってきて、日本語の場合は形態素解析をかけて、 単語の出現頻度をカウントして表示します。 Unigram は1語単位でのカウント、Bigram は連続2語単位でのカウント、 Trigram は連続3語単位でのカウントです。 [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
『 日本大学文理学部国文学科荻野網男氏の作成した現代日本語名詞シソーラスを利用した 』 [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
検索市場は「ゲームオーバー」だという前提から話を始めよう。Googleは勝利した。Googleの優位性については、このRead/WriteWebへの投稿で十分に説明されている。Googleキラーがもし存在するとしても、それは次のような検索業界への新規参入者ではないだろう。 面白い新機能:新しいユー... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
キーウォーカーが開発した日本語自然文検索技術は「KeyWalker Search」と呼ばれ、「意味ネットワーク」「Preference Analyzer(嗜好等個人の特徴分析)」「Situation Analyzer(シチュエーション分析)」の3つの技術から構成される。 意味ネットワークは、独自の... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
連絡先 &n... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
弊社森(オラの上司)が大阪市立大学で発表をしてきました。 発表資料は以下からどぞー。 検索エンジンの歴史的意義と未来 発表の前半は、コミュニケーション技術の歴史を踏まえ、 多対1のコミュニケーション技術として検索エンジンを捉える試みです。 発表の後半は、コミュニケーション技術としての検索エンジンが... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|