2013年01月

capistrano-colorized-stream で複数ホストのログを1度に見る! #shibuyarb

こんにちは @sonots です。capistrano-colorized-stream という gem をリリースしたので紹介します。

できること

capistrano を使って複数ホストにアプリをデプロイしたあとに
$ bundle exec cap log
とかやると、このようにcapistrano-colorized-stream
デプロイ先複数ホストのログを同時に見る事ができるようになります。foreman みたいなかんじで先頭に色付きのホスト名が追加されてていいですね!

デプロイ直後にエラーが出ていないかリアルタイムでログを見たい時に大変便利です!

使い方

$ gem install capistrano-colorized-stream
としてインストールした後、capistrano の config/deploy.rb に
require 'capistrano/colorized_stream'

task :log do
  stream "tail -f /path/to/your/app/log"
end
のように書いてください。これで
$ bundle exec cap log
すると、デプロイ先のホスト(複数なら複数ホスト)に対して /path/to/your/app/log のログをリアルタイムで参照できるようになります。

詳細

開発秘話なんかは shibuya.rb で発表してきましたのでスライドをみてください!

まとめ

この gem を作るにあたって@niku4i に大変お世話になりました。謝辞。

私自身はたいしたことやっていないのですが、すごい便利な仕組みができた気がするので是非使ってみてください!Enjoy!

Passengerのアーキテクチャ解説

こんにちは @sonots です。rails アプリを動かすためのデファクトなアプリケーションサーバーの組み合わせである nginx/passenger のアーキテクチャを解説してみます。

間違っていたら教えてください。※ 以前社内向け(前職)に書いた資料の再掲です。

#いやいや、passenger よりも今は thin だ!unicorn だ!とかいう意見もあるかもしれませんが、デファクトなのは passenger と言っていいんじゃないかなぁ。

典型的なウェブアプリケーション

(1) 例えば Webrick

Webrick の場合は、HTTPリクエストを受け付けるウェブサーバと Rails アプリを実行するアプリケーションサーバ一体化しており、

HTTPリクエスト → Rails アプリの内部処理 → HTTPレスポンス

の処理がシングルプロセスで実行される。並列リクエストを受け付けることはできない

(2) 例えば古きよき CGI

perl CGIで掲示板とか作ったよね。リクエストが来るたびにプロセスが生成される。

cgi

(3) 例えば Java Servlet

スレッドだから Java Servlet は速い!と自慢していた。※でもスレッドセーフなプログラムを書かないといけなくなってめんどいよね....

servlet

(4) 例えば mod_php

Apache のモジュールと動作するので速い!Javaより格段に速い!と自慢していた。

mod_php

Passenger (mod_rails)

mod 系(mod_php、mod_perl、mod_python とか)に基本は同じ。

Worker MPM で動作させるのが通常(nginx も worker モデル)

passenger1

Passenger の本家サイトによると、さらに passenger 部分と同一のアプリケーションコードの部分はメモリを共有化して、各ワーカープロセスが使用するメモリ消費量を抑える工夫をしているらしい(子プロセスとして起動すると、通常メモリを共有できるので、その仕組みを利用しているはず)

passenger2

nginx/passenger の設定をみてみる

手元の nginx.conf はこうなってました。

  worker_processes  1;
  events {
    worker_connections  1024;
  }
  passenger_max_pool_size 30;
  passenger_max_instances_per_app 8;
  • worker_processes
    • HTTPリクエストを処理する (nginx) workerプロセスの数。
  • worker_connections
    • workerが処理することができる処理の数。スレッド数。つまり、
    • max_clients = worker_processes * worker_connections
  • passenger_max_pool_size
    • 同時に起動できるrailsのインスタンスの最大数。数値を大きくするとたくさんのリクエストを裁けるけどメモリをたくさん使う。デフォルトは6。いろいろ数値を変えて試さないといけない設定。最低でもCPUのコアの数にするべき。2GBのメモリだったら30がおすすめ。VPSでメモリが256MBでMySQLも一緒に動かしてるとかなら2がおすすめ。※ ruby プロセスの数
  • passenger_max_instance_per_app
    • 一つのアプリで同時に起動できるインスタンスの最大値。passenger_max_pool_sizeより小さい値にしないとダメ。0に設定するとpassenger_max_pool_sizeの設定値まで同時起動可能になる。デフォルト0。

つまりこの設定は、30並列リクエスト、そのうちアプリ単体だと 8並列リクエストしか受け付けないことになる。ただし、静的ファイルに対しては1024並列処理。

CPUが 8コアだったら、8並列が実質ベストなんじゃないかなー。要確認

おまけ:Passenger のステータス確認

以下のコマンドで status やメモリ使用量を調べられます。passenger-memory-stats を使うと子 worker はアプリ自体のロードをしていない(その分のメモリを使っていない)のがわかりますね。

rvmsudo passenger-status
passenger-memory-stats

http://doruby.kbmj.com/yoppi_on_rails/20101119/Passenger_

参考サイト

A Ruby and Fluentd committer working at DeNA. 記事本文および記事中のコード片は引用および特記あるものを除いてすべて修正BSDライセンスとします。 #ruby #fluentd #growthforecast #haikanko #yohoushi #specinfra #serverspec #focuslight
はてぶ人気エントリー