SEO・Yahoo・Googleのトピックとテクニック・検索エンジン最適化のまとめ

■ 「はてな流大規模データ処理」を見てきた - もぎゃろぐ ■

2008/11/11 17:05:37 はてなブックマーク数805 ライブドアクリップ数55 del.icio.us数15 blog.mogya.com [ この元コンテンツへ ]
「はてな流大規模データ処理」を見てきた - もぎゃろぐ

KOF2008:関西オープンソース2008というイベントに来ています。はてなの伊藤さんの講演があったので、講演メモを公開。 #ボクがメモした内容であって、100%言ったとおりに書いてあるわけじゃないので、参考としてご覧ください。 (続き)アジェンダ 大規模なデータ OSのキャッシュ MySQLの運用 大規模データアプリケーションの開発 データの例 はてなブックマークのデータ量:五千万件くらいのデー...

[ ← 前の画面 ]  【 PR 】 SNSネタ・情報まとめ [ ニコニコ風 ] [ 関連記事 ] [ Feeling Lucky ]
[ スポンサード リンク ]
[ スポンサード リンク ]
■ この情報のコメント・メモ ■

そうだよなあDB分割すっとJOIN出来ねえよなあ。JOINしないという発想は完全に無かった。はてなみたいなサイトなら十分可能なんだろう。  [ flytales ]

はてな流大規模データ処理  [ wazgo ]

はず  [ mahler-5 ]

自分には関係なさそだけど、いちおうブクマ  [ kiichan1115 ]

いいまとめ。おつかれさまです。  [ kazz7 ]

はてなの負荷分散のお話。→資料公開された!http://d.hatena.ne.jp/naoya/20081111/1226395400  [ nitoyon ]

IIRの輪読会やら業務提携やらのアウトプット。グーグルのデータ処理なんかよりは少し身近に感じられ役立ちそうな内容。  [ makoto0631 ]

アウトラインだけでこれだけ面白いとは。  [ kohedonian ]

2008.11現在「こういう問題があります→なるほど」←これを「こういう問題があります→こうしたらいいですよ!」まで伸びたい。。日々精進です。  [ ginju ]

多くの問題は古典的な理論に帰着する」「一番難しいのは、『やりたいこと』を古典的な問題に置き換えること」/「あえて大量データにアクセスしたい場面ではRDBMSは使わない  [ AKIY ]

>データ量<メモリを維持する参考になるなぁ・・  [ teckl ]

実は、DBは「高度なソート機能付きストレージ」として使われている;なんかなるほど..と。  [ kskmeuk ]

メモリ活用が要点、やっぱ大規模データのDBは分割しちゃだめ  [ youhey ]

こういう話ができる人にならないと。  [ Kmusiclife ]

はてなの負荷分散のお話。  [ nitoyon ]

多くの問題は古典的な理論に帰着する  [ bayashi_net ]

MapReduceとかHadoopとか使ってるのかな。。  [ nomuran7 ]

はてなサマーインターン2008のエンジニア向け講義7日目の内容とほぼ同じのようだ。  [ Yuichirou ]

JOINを使わない。つかわなくても、O/Rマッパーが結構吸収してくれる。/言われてみればそうだ、もう少し意識して使おう  [ bongkura ]

へぇー。  [ kiichi55 ]

負荷分散  [ poafag ]

専ブラ使って負荷が下がるのは、2chのような「即時レスを必要とする分野」では?とかオモタ。/縁の下の力持ちというか、いろいろ頑張ってるね。安易なネット批判をする人たちにこそ、知ってほしい“場所”。  [ guldeen ]

はてなサーバの負荷分散話  [ mpresso ]

スライド一枚づつ撮影していた方がいたな。あの方はレポートをあげないんだろうか/KOFの発表者に対し、スライド全部CC-BY-SAを要請してみるって無謀ですかね?/本人公開きたー。  [ Britty ]

OS起動後すぐにサーバを投入しない→キャッシュが利いていないので負荷があがってしまって落ちる。  [ oooooooo ]

うまくメモリにキャッシュを乗せられるように。  [ hiro_y ]

あとで  [ dk19810313 ]

一番難しいのは、「やりたいこと」を古典的な問題に置き換えることが最大の問題⇒結局、大規模データ処理に限らず、色々な課題でここに行き着くんだよなあ。特に、コンピュータサイエンス分野は。  [ hiromark ]

要するにメモリ増やしゃいいんですね  [ ext3 ]

「*game」KOF2008-ついにHatenaからnaoyaが参戦!!  [ DameKinoko ]

最初の数行しか見てないけどこれはいいまとめ  [ yappo ]

ISTMthatit'snotdifficulttoscalethesystemwhichhasalittleupdate.  [ vierger ]

はてなが実施している大規模データ処理の中身。  [ adsty ]

参考にあげられてる文献は読みたい。  [ ite ]

多くの問題は古典的な理論に帰着する/一番難しいのは、「やりたいこと」を古典的な問題に置き換えることが最大の問題』  [ mitsuki ]

とりあえずmixiくらいに高速で落ちないようになって欲しいなぁ。mixiが成功したのは単に速かったからだけだと思うし。  [ xevra ]

すごくタメになる。というか、このエントリー随分さがしました。  [ kazuki2life ]

いろいろメモ  [ abe_hn ]

humm...  [ t-murachi ]

JOINつかわないってどういうことだろう?  [ nsta ]

スライド一枚づつ撮影していた方がいたな。あの方はレポートをあげないんだろうか/KOFの発表者に対し、スライド全部CC-BY-SAを要請してみるって無謀ですかね?  [ Britty ]

「はてな流大規模データ処理」を見てきた-もぎゃろぐ  [ sankaseki ]

なるほど.といったってこれを読んだだけで大規模データ処理ができるようになるわけではないが.  [ y_r ]

うれしいメモ。  [ akiyan ]

見事なバッドノウハウの山(もちろんええ意味で)。mysqlでパーティショニングしてJOINなしなんて、いかにもプログラマの発想で面白い(だからええ意味で)  [ rhosoi ]

タグのレコード数すげーなさすがに。きっちり正規化して実装してるのね。  [ orangecrush ]

実は、DBは「高度なソート機能付きストレージ」として使われている;  [ miya2000 ]

「SSDがあっても、精々HDDの数倍程度」現状だと電力消費が最大のメリットかも/古典の勉強は重要なのですね  [ gomis ]

はてな大好き  [ yhira0202 ]

昔の圧縮は、ディスクの節約のための技術だったけど、今使っているのは、いかにディスクI/Oを減らすかのための技術  [ tinsep19 ]

はてなのサーバ構成の工夫。IO負荷の改善が難。メモリを増やすことで対応。mysqlはインデックスを貼ること。99%参照なのでスレーブを用意する。JOINを減らす  [ LukeSilvia ]

Thriftが便利。<facebook多言語RPC  [ toton ]

それでもはてブは重い(涙)  [ urawareds ]

『多くの問題は古典的な理論に帰着する/一番難しいのは、「やりたいこと」を古典的な問題に置き換えることが最大の問題』  [ ka-wara ]

伊藤、負荷軽減、分散、MySQL  [ brazil ]

はてなサーバーの裏側  [ AzukiPochette ]

「JOINを使わない。」これスケーリングを考えた開発では常識だと思ってたら、うちの会社の開発者が「JOINしちゃったせいでDBの分割ができない!」って騒いでた。びっくりだ。  [ shinpei0213 ]

おもしろそう  [ mangakoji ]

感想と写真を追加しました。  [ mogya ]

性能  [ hmabu ]

まとめありがとうございます/資料upしました→http://d.hatena.ne.jp/naoya/20081111/1226395400  [ naoya ]

元ネタよむのがいいかも、、、ってプレゼン見ても断片なので、聴いてきた人のエントリ詳細希望~~  [ T-miura ]

当たり前だけど大事なこと。「一番難しいのは、「やりたいこと」を古典的な問題に置き換えることが最大の問題」  [ otonasi_kaoru ]

Thrift初めて聞いた。:何より定期的に技術をdiscloseする企業には頭が下がります。なかなかできないです。  [ orangevtr ]

尽きるところ、いかにI/Oとうまく付き合うか、なんだよね。どんなシステムだってディスクの回転数以上の読み書きクエリは発生させることができないんだから。  [ napsucks ]

はてなの基盤について。あとでよくみなおす。  [ a-know ]

はてブの重さを解決するには右記のいずれかの方法しか残されてないのかも1.専用ブラウザ限定アクセス2.専用プラグイン導入ブラウザ限定アクセス3.専用アドオン(もしくはGreasemonkeyスクリプト)導入firefox限定アクセス  [ mk16 ]

具体的な技術の話はないけれど、負荷分散の観点としてメモ  [ bean-jam ]

『あえて大量データにアクセスしたい場面』  [ kamataro ]

やっぱりメモリですよねー  [ hidesuke ]

『DBは「高度なソート機能付きストレージ」として使われている』その通り、大規模ではJOINしないて使うのが正しい。R/TマッピングとR/Fマッピング。参考:http://www.itarchitect.jp/issue/-/124529.html  [ bull2 ]

大規模ではJOINしないが鉄則。できるだけ単純取得にすべきと。そういう意味でもO/RMappingは対して機能ないほうがいいのかな。でも業務アプリだとそうはいかないと思うけどなぁ。  [ futa23 ]

参考にする  [ Rewish ]

正にそれが正しい。R/TマッピングとR/Fマッピング。『DBは「高度なソート機能付きストレージ」として使われている』参考:http://www.itarchitect.jp/issue/-/124529.html  [ bull2 ]

あまり機会はないかもしれないけど、知識として  [ field_combat ]

いいまとめ。  [ toriaezu ]

いつか悩みたい。  [ Aoba ]

サーバの負荷分散やらなんやらかんやら。読んだら面白い。  [ rokujyouhitoma ]

はうー  [ furukatsu ]

とにかくメモリに載せろと。  [ Itisango ]

一番難しいのは、「やりたいこと」を古典的な問題に置き換えることが最大の問題  [ plugnus ]

これOSCKansai08で聞いたな。あん時取ったメモとかどうしたっけか。。。  [ tyoro1210 ]

ニコ割ゲームの結果集計もメモリとの戦いだったな。  [ yo-net ]


[ ← 前の画面に戻る ]
3 ネット 事例 b.へぇ p.サーバー 性能 service cs GTD資料(いつか読む) コンピュータ システム運用 HPC プログラム naoya DBMS サーバー 開発環境 運用管理 OPERATION あとで見る mng ニュース algorism network トラブル スケーラビリティ Reference サーバ構築 thrift kernel 近藤淳也 ネットワーク hateb 経営 @必読 その他 later tuning 運用 プレゼンテーション 伊藤CTO システム管理 高速化 iir まとめ SI RDB hardware 技術 システム data a.☆☆☆ ソフトウェア 保守・運用 vectorspacemodel 資料 db レポ concurrent サイト運営 @興味深い unread 仕事 スケール 生活 開発 cluster pg internet sql システム開発 scalability 負荷 サーバ atd technology 負荷分散 あとで読め Web開発 一応参考資料 はてなデータ comp ram wiki memory p.データベース パフォーマンス改善 pc データ処理 loadbalance 伊藤直也 全文検索 document データベース 情報基盤整備 hdd Architecture パフォーマンス プログラミング k-of mysql チューニング 負荷対策 hatena dev system it study database 設計 KOF tech research web制作 なるほど server untreated-- 大規模データ処理 インフラ mapreduce storage presentation 参考資料 検索エンジン メモ あとでよむ 2008 あとで読む Webアプリケーション 環境 infrastructure web KOF2008 know-how あとで 検索 fulltextsearch はてなブックマーク あとで書く 大規模 バックエンド 構造 はてな アルゴリズム DataMining io webサービス サービス net スケーリング os Reading blog company developer 学習 webservice program サーバ運営 development ToRead system論 メモリ 後で読む スケールアウト performance エンジニアリング memo 読み物 Computing linux programming

“はてな村”は求心力を持ったユーザーが集まるコミュニティ“はてな村”は求心力を持ったユーザーが集まるコミュニティ [ 情報元へ ]
Web2.0 EXPOのコンファレンスでは、はてな取締役副社長である川崎裕一氏が登壇し、はてなの現状やはてなならではの魅力について講演を行なった。● 「電車の中吊り」感覚を狙った「はてなブックマーク」川崎氏ははてなについて「非常に説明するのが難しいサービスが多く、サービスの種類も多い」と前置いた上...

はてなダイアリーのPageRank - 鯨飲馬食コードはてなダイアリーのPageRank - 鯨飲馬食コード [ 情報元へ ]
雑談前回の「個人ニュースサイトのPageRank - 鯨飲馬食コード」の連なりとして、今回はソーシャルブックマークとPageRankの相関を見てみたかったので、被はてなブックマーク数が多いはてなダイアリーのPageRankを調べてみた。対象としたのは2009年01月15日に「TopHatenar ...

TopHatenar - あなたのはてなー順位が分かりますTopHatenar - あなたのはてなー順位が分かります [ 情報元へ ]

はてな検索はてな検索 [ 情報元へ ]

はてながこだわるWebサービス提供の本音 - CNET JapanはてながこだわるWebサービス提供の本音 - CNET Japan [ 情報元へ ]
企業の持つコアデータやそれにまつわる各種機能をコンポーネント化してウェブ上で公開し、あらゆるアプリケーションからその機能を利用可能とするもの、それがWebサービスです。Webサービスは、ウェブサイトとウェブサイトが連携し、新しいウェブの機能を形成するとして、次世代のウェブに欠かせない技術だと当時は...

betaグループ - 別冊はてな話 - 数世紀後のはてなbetaグループ - 別冊はてな話 - 数世紀後のはてな [ 情報元へ ]
書き残していた大きいヨタ話を。 最近読んでたいへん面白かった科学読み物で「パラレルワールド」という本がありまして、この宇宙のほんの1センチ隣にあるのかもしれない、でもこの宇宙にほとんど干渉しないゆえに見えないのかもしれない平行宇宙について、真面目に、素人の私にも分かるように、とほうもないスケールの...

はてな、検索ベンチャーと提携 はてブ新機能を共同開発 - ITmedia Newsはてな、検索ベンチャーと提携 はてブ新機能を共同開発 - ITmedia News [ 情報元へ ]
ニュースはてな、検索ベンチャーと提携 はてブ新機能を共同開発はてなとプリファードインフラストラクチャーが提携。協業第1弾として「はてなブックマーク」に、ブクマしたURLに関連するページを自動抽出する新機能を実装。2008年07月15日 13時23分 更新はてなは7月15日、検索エンジンやリコメンド...

川o・-・)<2nd life - はてなダイアラー2006川o・-・)<2nd life - はてなダイアラー2006 [ 情報元へ ]
アルファブロガー2006 - アルファブロガー-ニュース で、アルファブロガー2006 というのが発表されていたので、2006年に人気の記事を書いたはてなダイアラーをはてブの合計数順で集計して*1みました。 10011 id:fromdusktildawn 分裂勘違い君劇場 9091 id:fin...


[ ← 前の画面に戻る ]
[ スポンサード リンク ]
[ 今日のWebデザイン ]
追加
[ 追加された期間を表示 ]
ユーザー
[ コメントの多いユーザー ]
ピックアップ
あとで読む』 の注目情報

『坊っちゃん』自筆原稿 読みやすい文章とは、流れるように読める文章だ。難しい言葉はいらない。気のきいた言葉もいらない。文頭から文末まで振り返ることなく読める文章が、最も美しい。読みやすさの基準は客観的なものだ。読み手には様々な人がいる。老若男女すべての人に対して読みやすい文章を書くのは難しい。ただ...

2010/08/27 5:50:12
   文章 文章術 あとで読む まとめ お役立ち
滅べばいいのにと思うSEOの10の迷信(都市伝説) | Web担当者Forum SEO・Yahoo・Googleのトピックとテクニック・検索エンジン最適化のまとめ

» SEOmoz - 検索マーケティングのニュース&テクニック のバックナンバーを見る[海外情報] SEOmoz 検索マーケティングのニュース&テクニック検索エンジンは網羅的なガイドラインを提示するわけではない(それどころかSEOを正しく行うのに必要な要素の十分の一すら出さない)。この記事では、S...

2010/06/14 17:50:28
   seo あとで読む マーケティング web制作 まとめ
60人の成功者から学ぶネットで影響力を強める60の方法 » SEO Japan SEO・Yahoo・Googleのトピックとテクニック・検索エンジン最適化のまとめ

コピーブロガーからインターネットで影響力のあるブロガー60人に、インターネットで自分の影響力を高める方法について一言ずつ語ってもらうというユニークな企画を紹介。ガイ・カワサキからロバート・スコーブル、マーケティング・シャーパのアン・ホランドなどまさにトップオンラインマーケッターが大集合した集合知な...

2010/08/19 5:50:24
   マーケティング あとで読む 考え方 seo ビジネス
人気のタグ
ブックマーク
RSS配信中
SEOのトピックとテクニック集 || SEO Cafe