MySQLのバルク処理は書かなきゃ駄目。
前回のYCSBのload phaseがMyCassandra(Cassandra+MySQL)ではめちゃくちゃ遅いという件でしたが、タイトル通りです。
さて大量のインサートをするときに、以下の3つの手法によってどれくらい差が出るのだろうか?
- singleインサートを何度もやる
- マルチプルインサート(複数レコードのインサートを1クエリで)
- バルクインサート(csvファイルでインサート)
答えは以下のサイトを参照あれ。
http://www.inter-office.co.jp/contents/194/
実行時間が1>>2>3というふうになっています。バルクインサートは単純インサートの800倍も早くなるという結果です。
バルク処理は書かなきゃ駄目。以上。