【R】EZRを使ってコードを書かずにデータ分析

2023-01-08

情報処理技術者試験は受けていますが、正直コードを書くのは苦手です。ですが、Rを使う時はどうしてもコードを書かないといけません。

もちろん必要な場合はコードも書きますが、分析や解析の前段階でデータの雰囲気を眺める時などは簡単に終わらせたいのが本音です。

そんな時は、EZRを使ってマウスだけで一通りのデータ分析や解析をできるようにしておくと便利です。

EZRの解説は主に医学統計が中心になっていますが、グラフ作成はもちろん一通りの線形モデルの比較までEZRで解析できるので、おおよそのデータ分析にも十分使う事ができます。

*ただし、医学統計が基本のため時系列データのモデリングや解析には不適です。

ここでは、EZRの簡単な紹介とインストール、Rと一緒に起動するための手順を記載しています。

EZR

EZRはRコマンダーのプラグインとして動作する統計解析ツールです。

臨床医(血液内科医)の神田先生が開発したこともあり、解析方法は医学統計でよく使う表現になっていますが、慣れれば必要な解析がすぐわかると思います。

無料統計ソフトEZR (Easy R) 解析機能一覧

  1. 名義変数の解析
  2. 連続変数の解析
  3. 連続変数の解析(ノンパラメトリック)
  4. 生存期間の解析
  5. 検査の有用性の評価
  6. メタアナリシスとメタ回帰
  7. マッチドペア解析
  8. 必要サンプルサイズの計算
  9. グラフと表

解析機能の中でも、「4.生存期間の解析」や「6.メタアナリシスとメタ回帰」はデータ分析ではあまり使う事は無いと思いますが、他の機能は一般的な分析で使われる手法です。

個人的には、「9.グラフと表」で簡単にグラフを作ってくれるのが一番助かっています。

EZRのメリット

やはりコードを書かずに分析できるので、Rを始めて使う場合でも分析・解析に専念できる事がメリットです。

特に初めてのデータを使う場合、まずは全体像の把握やデータの傾向をつかんでから分析や解析に取り掛かりますが、通り一遍だけでなくちょっと気になった場合にマウスだけで追加の分析ができるので大幅に手間が省けます。

正直、それなりの規模のプロジェクトではコードを書きながら分析するメリットがありますが、データも規模も小さいプロジェクトでは分析・解釈にかける時間を優先して、コードを書く時間はできるだけ削る方がコストパフォーマンスも高くなります。

以前は簡単な分析やデータの傾向把握にはJMPを使っていたのですが、どんどん値上がりして個人で購入するのは難しい金額になったので、EZRを使うメリットが大きくなりました。

EZRでできない事

基本的には医学統計に使う統計解析ツールのため、機械学習や時系列データを分析するには適していません。

グラフについても基本的なグラフは簡単に作れますが、自分好みの手の込んだグラフを作るにはEZRだけでなくコードを書く必要があります。

注意点

マウスだけで操作できるので、データ分析や統計の知識が少なくても分析自体は実施できます。

が、よくある話で、簡単に操作できるので適切な分析方法が使われずに結果だけ報告されていたり、データクレンジングが行われないまま分析されて本来の結果と違う場合も出てきます。

操作が楽になるだけであって、基本的なデータ分析や統計学の知識と経験が必要な事は注意してください。

インストール方法

RとRコマンダーのインストール

使用している環境に応じたRのインストールの後、Rコマンダーをインストールします。

とは言え、Rのコンソールからinstall.packages(“Rcmdr")を入力するだけなので、特に問題は起きないと思います。

最初にRコマンダーを起動する場合、追加パッケージのインストールが必要になります。

RStudioのプロジェクトとrenvを使っている場合は、事前にインストールしないとrenvの管理外になるので注意してください。

EZRのインストール(注意点あり)

Windows、Mac版ともダウンロード版のEZRがありますが、個人的にはLinuxと同様にRのコンソールからのインストールを使っています。

ここは使用状況によりますので、お好みの方法でインストールしてください。

EZRのサイトでは、OSに合わせたダウンロード版のインストールが勧められています。

私自身は、個人的な都合でrenvを使っているのでコンソールからインストールしています。

Rと一緒にEZRの起動

ホームディレクトリに作成されている「.Rprofile」に以下を記述します。

options(Rcmdr=list(plugins="RcmdrPlugin.EZR"))
library(Rcmdr)
.Renviron、Rprifile.site、.Rprofileの順に読み込まれるので、独自の設定をしている場合は環境に応じて記述してください。

これで、Rの起動時にEZRも一緒に開かれますので、後は手を動かしながら分析をするだけです。

Library (Package)

Posted by ううら