MySQLのバルク処理は書かなきゃ駄目。

前回のYCSBのload phaseがMyCassandra(Cassandra+MySQL)ではめちゃくちゃ遅いという件でしたが、タイトル通りです。

さて大量のインサートをするときに、以下の3つの手法によってどれくらい差が出るのだろうか?

  1. singleインサートを何度もやる
  2. マルチプルインサート(複数レコードのインサートを1クエリで)
  3. バルクインサート(csvファイルでインサート)

答えは以下のサイトを参照あれ。

http://www.inter-office.co.jp/contents/194/

実行時間が1>>2>3というふうになっています。バルクインサートは単純インサートの800倍も早くなるという結果です。

バルク処理は書かなきゃ駄目。以上。