Hadoop Conference Japan 2011 Fall に参加してきました

月曜日の話ですが、ベルサール汐留で開催されたHadoop Conference Japan 2011 Fallに参加してきました。

そもそもHadoopを使い始めたのが最近で、カンファレンスの参加は初めてなのですが、コミッターの方や大規模に運用されている方の話が聞けて大変参考になりました。

当日は速攻でMacbook Airの電池が切れてしまったため手書きだったのでメモが大変でした…。

Keynote

"The role of the Distribution in the Apache Hadoop Ecosystem" by Todd Lipcon, Cloudera Inc

Hadoop Distributionの一つであるCDHに関する説明。
何故Distributionを使うのか？→バージョン管理、インストールを簡単にできる

エンタープライズ向けのSCM Expressはサポートと管理用GUIツールが充実している。50ノードまでは無料。

"About Hortonworks" by Owen O'Malley, HortonWorks

Yahoo IncのHadoop部門が2011年7月に独立してできた会社。
HadoopへのContributionはYahoo Incと同じくらい。

検索の運用ではScience用クラスタとProduction用クラスタを分離して運用している。

質問
- Yahooで4000台のクラスタをどのように管理していたか？ → ほとんど手で運用。環境構築などにスクリプトを使ったりはしていた。ノードを管理するツールを将来Apacheプロジェクトでリリースする予定。

"How Hadoop needs to evolve and integrate into the enterprise" by Ted Dunning, MapR Technology Inc

Web企業やスタートアップ企業と大企業とでHadoopの採用率が違うのはなぜか？
- スタートアップ企業などは生き残るために新しい技術を導入していく必要がある
- スタートアップの初期の設備と成長してからの設備は変わりすぎるので互換性が必要ない→導入しやすい
- 大企業などで既に導入されているRDBMSやNASとHDFS間のファイルのやり取りのコストが大きい→導入しにくい
- MapRは分散ファイルシステムを実装しなおしたもので、RDBMSやNASをサポートしているのでこのコストを低減できる

Lunch Time LT

"MapReduceをコーディングなしで？新しいデータ探索ツール BigSheets" by 土屋敦, IBM

IBM製のツールの紹介。
表計算ソフトのようにHDFS上のデータを処理できる。
グラフなどのVisualizationもプラグイン(js)で簡単に実装できる。
コーディングがないのでビジネスの人も簡単に使える。

"Hadoopログを全員で使う方法と課題" by 宵勇樹, DeNA

モバゲーにおけるHadoopの利用事例の紹介。

HadoopのWebGUI(GitHubで公開中)のHUEを使ってマイニングエンジニア以外でもセキュアにデータを見れるような環境構築。
HUEによってPigやHiveを権限付きで実行できるようにしている。
グループ管理でユーザの追加などにNameNodeの再起動が必要だが、LDAPで管理することで回避している。

"Hadoop+HBaseを基盤としたPaaSプラットフォームの構築" by 岡本晴芳

HadoopとHBaseを使ったPaaSプラットフォームの開発基盤の構築の紹介。
Hadoop, HBase, ZooKeeper, Mahout, JMX, JDOなどを使う。

"パネルログ分析" by 小林隆

Hadoopを使ったパネルログ(ユーザの行動ログ)の紹介。
ユーザの行動ログを使うので、サイトの時系列分析・リピート分析・サイト間の分析を行うことができる。

Technical Track

"Apache HBase: an Introduction" by Todd Lipcon, Cloudera Inc

HBaseのアーキテクチャ紹介と他のファイルシステムとの比較。
途中から入室したので後半しか聞けていません。

HBaseにアクセスするための方法
- Java API, REST/HTTP, Apache Thrift, Hive/Pig

HBase vs HDFS
- ランダムRead/WriteはHBaseが速い。しかし、扱えるデータ量が少ない(〜1PB, 〜1000node)等デメリットがある。
- ランダムRead/Writeしない限りはHDFSのほうが良い。

HBase vs RDBMS
- HBaseはColumn-family
- RDBMSはRow-oriented

HBaseのUse Case
- FireFox bug report, Facebook, OpenTSDB

"Architectural details and implications of MapR technology" Ted Dunning, MapR Technology Inc

MapReduceのボトルネック

Read only file
Many copies in I/O path
Shuffle based on HTTP
Spills go to local file space

MapRはファイルシステムとMapReduceを再実装してパフォーマンスを向上させた

Hadoopよりも倍以上のRead/Writeのパフォーマンス
小容量で大量のファイルの処理でパフォーマンスが向上
Random ReadのパフォーマンスはHBaseの倍
NameNodeの冗長化

"NTTデータ流 Hadoop活用のすすめ〜インフラ構築・運用の勘所〜" by 猿田浩輔, NTTデータ

Hadoopインフラ構築・運用のベストプラクティスの紹介。

マスタノードの可用性向上
- スレーブは冗長だがマスタには改善の余地あり
- MapReduce → JobTrackerが停止するとアウト
- HDFS → NameNodeが停止するとアウト
- MapReduce → ZooKeeper、HDFS → AvatarNode, BackupNodeなど

しかし、実際にはHadoopの可用性だけではなくシステム全体としての可用性を考慮しないといけないので実績のある技術を駆使したほうが良い場合も

採用した方式
- Pacemaker(Heartbeat) - HAクラスタリングソフトウェア
- DRBD - ディスクミラーリングソフトウェア

数千台規模のクラスタ運用
- 初期設定・設定変更・増設のコスト、障害時のコスト → オペレーションのパターンを最小限に
- OSの自動インストール、一貫した設定による構成管理 → 共通的な方法で簡潔に

例 :
- PXEブート+kickstartでボタンひとつでOSインストール(CentOS)
- Puppetで複数サーバに一貫した設定
- 機器交換に伴うヘテロな構成も考慮 → 100台のサーバを90分で構築・設定変更は3分

ある程度の割り切りは必要
- OSが入らないときは代替機
- あらかじめ許容出来る縮退率を把握して機器交換のタイミングの計画をする

クラスタリソース情報の取得
- Gangliaによるリソース情報の可視化

トポロジ設計
- エッジスイッチごとにラックアウェアネスを設計すると電源ごとにデータが分散されるとは限らない

まとめ
- 部分最適ではなく全体最適
- よく知ってる方法で
- シンプルに
- 最悪のケースを考慮

"Hadoop 0.23 and MapReduce v2" by Owen O'Malley, HortonWorks

Hadoop 0.23 Highlight
- next stable release
- new feature
  - HDFS federation
  - HDFS write-pipeline improvement
  - MapReduce shuffle optimized by 30%
  - small MapReduce optimize
  - MapReduce v2

HDFS federation
- namenode scaling
- split namespace between namenodes
- all datanodes are shared between all namenodes

JobTrackerを2つのコンポーネントに
- Cluster resource management
- Application life-cycle managements

SPOFの解消やスケールの向上(6000-10000台のマシン)
Wire Compatibilityの解消
MapReduce以外のparadigmsのサポート

Community Track

"リクルート式Hadoopの使い方" by 石川信行, リクルート

リクルートにおけるHadoop利用事例の紹介。

Sqoop+Hiveで集計
Mahoutで分析
BIツール

Hadoopの真価
- 高速に処理できるのでTry and Errorを繰り返せる
- 全データを使えるのでサンプリングに頼らなくても良い

MapRとCDHの比較
- MapRは約2倍速い

"ミクシィにおけるhadoopの利用" by 伊藤敬彦, ミクシィ

ミクシィにおけるHadoopの利用

ログデータ : 保存サーバからHDFSへ日ごとにコピー

LSHを利用した推薦システム

推薦 → 類似インスタンス(文書・ユーザなど)集合の抽出
類似インスタンスの特徴の抽出(例: ユーザの商品購買履歴)
LSHｈで高速に抽出

LSH

速いが精度はあまりよくない
1. インスタンスのベクトルを入力として関数を適用(関数は似たベクトルに対して同じ値を返す)
2. 同じ関数値を持つものを類似インスタンスとして抽出
key-関数値、value-インスタンスとしてMapReduce

実験

mixiのニュース記事で実験
速度: 1週間分で30分弱
精度: イマイチ
ユーザはカテゴリを横断して記事を見るのでカテゴリが精度を下げているのでは
カテゴリ毎に分割してLSHを適用

おわりに

Oluolu: スペル訂正の辞書抽出
Anuenue: Solrのラッパー