CassandraSF2011に行ってきた!

MyCassandraの宣伝の為にCassandra SF2011@Mission Bay Conference Centerに行ってきたので、
いち早く報告ブログを書いてみます。

発表内容は録画されており、また人によってはスライド公開もされるので、
深い話については述べずに、あくまで一参加者として、どんなイベントだったのか、
ずらずらと並べておきます。

CassandraSFの話をする前にまず前日にあったPre-CassandraSFについて。
Pre-CassandraSFはAcunu (Cassandraを使ったスタートアップベンチャー)主催の前夜祭で、こんなシャレオツなBarで行われました。

Acunuの人やNateさん始め、Data Staxの人がいたので、宣伝活動。
Cassandraに毎日のごとく関わっていると、「あっ、この人はあの部分を作ってるコミッターだ!」とか分かるわけで。。
Acunuのプロジェクトはとても興味深いので皆さん注目ですよ!!





この日はイベント終わってホテル戻って、爆睡しました。


さて、慣れない海外で時差ボケに苦しめられる中、CassandraSF本体です。

8時受付、9時開始という、とても健康的なイベントだったので、
まだ霧がかった天候の中、レンタカーで移動。

会場はUCSF (カリフォルニア大学)のホールらしく、サンフランシスコの栄えてるところから少し遠ざかったところにありました。
右の茶色の建物です。

会場入口。
ホール名が変わっていて、Datastaxの看板が無いと分からなかった;

受付を済ませて、ホールへ移動。
受付時にDatastaxのjake (Briskのプロジェクトリーダ&Solandraの開発者)が"MyCassandra guy?"
と話しかけてくれて嬉しかったです。
おそらくNateさんが伝えてくれてるのでしょう。




さて、ホールへ行く前にプログラムを見てみましょう。
見てもらえば分かるんですが、1日でCassandra関係のイベントを全て詰め込んでいて、朝から晩までCassandraの話という感じでお腹いっぱいでした。

3並列セッションのうち、最初の基調講演があるメインのホールへ。




参加者は450人と多く、Cassandraコミッターや、利用ユーザー、これから利用を考えてるユーザーと様々。
でも、日本の勉強会と比べるとギーク色が強い印象を受けましたw
ちなみに一番前列に並んでる緑の人たちがdatastaxのスタッフです。
モニタには、Cassandraを利用してる企業のインタビュー動画が流れており、
おー力いれてるなぁという印象を受けました。


Datastaxの人たちによるイントロダクションが開始。
Bily Bosworth (CEO)。
スポンサーへの感謝や会社の目標など。





Jonathan Ellis (CTO)。
Cassandraを利用した各プロジェクトの紹介 (知らないものが沢山)や
昨年のCassandraSFからどのようなところに技術的に力を入れてきたのか。
基調講演なのに、かなり技術の詳細まで踏み込んだ講演でした。




Cassandra-0.8は機能の追加 (secondary index, atomic counter, CQL)だけでなく、
基本的な性能向上にも力を入れており、
特にBest in class performance (not just writes!)であることを強調していました。
普通に機能追加すると、元々の性能が気になるところですが、
0.6と0.8のスループットの対比。
基本的にreadもwriteも向上してることを表してますが、
ただ、実験環境の詳細やレコード数1,000万と少ないので、正しい性能評価と言えるかは少し怪しい感じはします。




休憩時間にCTOのJonathan Ellisにコンタクト。
MyCassandraを宣伝しました。
写真で見ると、いかつい兄ちゃんって感じがしていたのですが、
意外と体はスマートな感じで驚きました。

ジョナサン&スタッフにお願いして、MyCassandraのbrochureを置かせてもらいました。
こうゆうのは本来、スポンサーとしてお金払わないと置かしてと思うのですが、
元々スペースを借りていたスポンサーが会場に来ないので、どかして置いていいよ!とのこと。
なんと、ありがたい。


Chris Goffinet (Twitter) – Cassandra at Twitter
ここからは箇条書きで。

  • スライド: http://www.scribd.com/doc/59830692/Cassandra-at-Twitter
  • Twitterでのユースケースの紹介
    • twitter button
    • Chuckoo
    • Rainbirdの話は無かった・・・
  • 300+ Cassandra nodes in production
  • CassandraのJava GCの問題に言及していて、
    • Cassandraの中にmemcacheを組み込んで利用しているとのこと
      • twitter社に限らず、素のCassandraではなく、少し拡張・改造して利用しているという話が幾つかあった
    • 「If you select not Java-based storage engine with MyCassandra, you need not to worry about GC problems. #CassandraSF2011」とアピールしてみる
  • Custom framework that uses YCSB
    • YCSBをテスト時に利用して性能評価を行うっていうのが面白い
    • YCSBのパラメータ表記はMyCassandraのベンチマークや研究の参考になるので超ありがたい
  • Cassie: Light-weight Cassandra Client


  • ちょうど今日 (07/12)、Twitter社を訪問するので、いろいろ疑問に思ったことを聞いてみたいと思ってます



  • Eric Evans (Rackspace) – CQL – Not just NoSQL, It’s MoSQL
  • Sylvain Lebresne (DataStax) – Counters in Cassandra
    • Cassandraの新機能ごとに1時間のセッションが設けられていた
    • 意外とどれも人気
    • 僕自身はあまりクライアント周りの話に興味を持てないのでCQLの話はあまりちゃんと聞けませんでした
    • Atomic Counterの実装は一度自分でソースを読んでいて、その答え合わせをしに聞きにいった感じです
      • Vector Clockを利用した実装になってる
      • やっぱり実装は単純には行かないわけで、ストレージ周りだけではなく、プロキシ部分にも手を入れていて、通常のwrite pathとは異なるワークフローとなってる
      • ZooKeeperを利用すれば良いとか思うかもしれませんが、それはCassandraのdecentralized = no SPOFの利点に反するわけで。


ランチ

  • サンドイッチ
  • 惣菜サラダ×2
  • スナック
  • りんご
  • クッキー

少食なので、これだけで僕はお腹いっぱい。



Jake Luciani (DataStax) – Introduction to Brisk


Jake Luciani (DataStax) – Scaling Solr with Cassandra

  • JakeさんのSolaandraの話
    • Lusandra (2010)は以下のような制限があった
      • Thrift for 100k hit data
      • Read performance
      • Only Order partitioner, load balancing
    • それでSolandraを作ったという話の流れ
      • 基本のアイデアは主キーをtoken名+検索用キーというふうにして、Solandra用のPartitionerを新たに拡張して作ったという感じ



追記:CassandraSFについて何かしら追記しようかと思ったのですが、
スライドは以下に全てあがっていて、そちらを見てもらう方が早いです。

http://www.datastax.com/events/cassandrasf2011/presentations

生で聴いていた感じとしては、
午前中のDatastax CTOのテッキーな基調講演、Twitter社のユースケース紹介、Netflix社のOracle on 自社DCからの移行話といったどれも面白い話でお腹いっぱいになってしまい、後半のBriskやSolandraといったCassandra応用やCounter/CQLといったCassandra新機能の紹介は割と聴き流す感じになってしまいました。