クラウドDWH「Amazon Redshift」価格どんなもん?

         

最近こういった分析関連に近いところで働いていることもあって、色々調査をしているんですが、AmazonがクラウドDWHサービスをはじめるってので、どんなもんか見てみました。

[速報]Amazonクラウド、新サービス「Redshift」発表。データウェアハウスの価格破壊へ

なんとなく安上がりになりそうみたいなんだけども、詳細がよくわからないので本家のページヘ。

Amazon Redshift

書いてあることは上記の記事とほとんど同じ模様。

さて、肝心の価格を見てみた。

 

スペックは以下のものを想定

CPU: 16コア

メモリ: 120GB

ストレージ: 16TB

 

○1年契約の場合

1年目の費用としては

初期費用$20,000 + $2,190/TB × 16TB = $55,040

1ドル≒80円として

$55,040/年 ≒ 4,403,200円/年

 

2年目以降は

$2,190/TB × 16TB ≒ 2,803,200円/年

 

○3年契約の場合

1年目の費用としては

初期費用$24,000 + $999/TB × 16TB = $39,984

$39,984/年 ≒ 3,198,720円/年

 

2年目以降は

$999/TB × 16TB ≒ 1,278,720円/年

 

となると思います。

さてこれが本当に安いかどうか??

 

わかりません・・・。

 

その他、色んな条件によると思います。例えばパフォーマンスとか。

 

よくわからんので、例えばFusionIO社のiodriveを使ったとすれば・・・容量だけで比較すると

ioDrive Octal 5.12TB + ioDrive Octal 10.24TB + ioDrive 640GB

の価格と比較するとして、こちらの価格表を参考にさせていただくと、おそらく購入価格だけで○千万円はかかります。これに保守費用が入ってくるとなると・・・。

他にもサーバ購入費用やその保守費用、ラック費用、電気代・・・なども乗ってきます。

そう考えると紹介記事の通り、かなり安いと思います。
2台構成にしてもまだ安い。

 

あとはクラウド上にデータを送るためのネットワーク回線も気になるところで、1Gbbsの線を使ったとして、125MByte/sの転送ができるとすれば1TByteの転送には8000秒かかるわけですが、まあそんなに効率的には転送できないとして、2倍時間かかっても5時間もあれば終わるでしょう。

実際のところ1日で1TByteも転送することは無いと思うので、気にしなくても良さそう。

(バージニア州しか今のところ無いっぽいので、もっとかかるかもしれない・・・)

 

あとは使い勝手ですが、PostgreSQL JDBC対応と書いてるので、おそらく標準的なJDBCでいけそう。

そこまで書いてあるので、実際のところはPostgreSQLをカスタマイズしたものが動いているのでしょうか?

ただ、気になるのは分散処理がどこまで出来るのか。
勝手に各ノードで分散処理してくれるのか?
また1ノードの中でOracleのパラレルクエリのようなことを自動でしてくれるのか?

普通にJDBCでクエリ投げるだけではできなさそうですが・・・。

結局コアをいくら積んでても1コアでしかSQLを処理できなければ、処理速度を早めることはできないので。

とはいえ、このサービス気になるな。試しに使ってみたい!

 

参考にさせていただきました: Fusion-io ioDrive の“非公式”標準価格/販売価格表

 


コメントを残す