CRAN Task View: Design of Experiments & Analysis of Experimental Data (の日本語訳)

twitterで#RtransというRのドキュメント翻訳プロジェクトに関わっているのですが、Task Viewの方に浮気してしまいました。。。

いやでもこっちのドキュメントも重要だよね?と自分を納得させつつ、とりあえず訳します。



実験計画法の部分の訳です(ソースは→http://cran.r-project.org/web/views/ExperimentalDesign.html

どこかwikiでRドキュメントの訳をまとまているところがあったら転載して頂いて構いません。

(@yokkunsが運営していたような。。。

→無事転載されました!http://rwiki.tkul.jp/index.php?CRANTaskView



以下、和訳です。

英語苦手なんで誤訳があったらすみません。

また、分野によって若干訳し方が違うかもしれませんがご了承下さい。





タスクビュー:実験計画(Design of Experiments, DoE)と実験データの解析


メンテナンス者:Ulrike Groemping

連絡先:groemping at bht-berlin.de

バージョン:2010-09-06


このタスクビューは実験計画と実験から得られたデータの解析に関するRパッケージの情報を集めています。改良に関する示唆はお気軽にご連絡下さい。またこの分野に属すと思われる新しいパッケージや大きなパッケージのアップデートがあればご連絡下さい。このwebに詳細が書いてあります。http://prof.beuth-hochschule.de/groemping/DoE


実験計画は様々な分野で適用されており、いろいろなフィールドの需要のために手法が調整されている。このタスクビューは最も一般的なパッケージのセクションから始まり、農学・工業のような専門的なセクション、専門的な実験計画の目的のために作られたパッケージに関するセクションへと続いていく。もちろん、分野への分割はいつも明確なわけではないが、より専門的なセクションは一般的な文脈で適用することができる。



一般的な目的のための実験計画

一般的な目的の実験計画のために作られたパッケージはほとんどない。まず最初に、baseパッケージにある一般化線形モデルは、実験が計画されたデータを解析するためにとても重要である(特にlm()関数、aov()関数、線形モデルオブジェクトから作られるメソッド関数)。これらはKuhnert and Venables (2005, p. 109 ff)に詳しく書いてあるが、Vikneswaran (2005)は実験計画のための特殊な利用方法を指摘した(contrasts()関数、多重比較関数、model.tables()、replications()、plot.design()のなどような便利な関数を使って)。granovaは単純な構造の実験(一元配置、二元配置、対応のあるデータ)を少し変わったグラフィックで表示する。AlgDesignは量的変数がある場合と無い場合の完全要因実験、混合デザイン(つまりデザインは要因を足すと1=100%となる)、正確または近似的なD-、A-、I-最適デザインを作る。注意:AlgDesignの作者・メンテナンス者であるBob Wheelerはこの仕事から退きたがっており、引き継いでくれる人を探している。興味のある方はBobに連絡して下さい。conf.designはブロックに交互作用のあるデザインを作ることが出来(conf.design関数)、既存のデザインを組み合わせることが出来る(例えば、工業実験における田口の配列内、外デザインに有用である)。daeは実験計画やR因子に関するいくつかの有用な関数がある。例えば、いくつかの入れ子構造を扱うことのできる実験方法(Bailey 1981)、いくつかの因子を組み合わせて1つにしたり1つの因子をいくつかに分けたりする関数がある。さらにaov()関数によって返される処理された後のオブジェクトの機能を提供することができる。例えば、2段階実験のイェーツの効果を抽出できる。blockToolsはブロックのサイズが小さい場合に、均一なブロックで終わるように割り付けを行う。



農学・植物育種実験のための実験計画

agricolae農学や植物育種のために特化した実験計画のための豊富な機能を提供する。この実験計画は他の目的にも有用である。これは格子デザイン、要因デザイン、乱塊デザイン(ブロックランダム化)、完全ランダム化デザイン、(グレコ・)ラテン方格デザイン、不完全ブロックデザイン、αデザインの計画を行う。例えば治療比較の目的やノンパラメトリック検定などの実験データの解析のための機能もあるが、特殊なタイプの実験のための限られた可能性もある。



工業(産業)実験のための実験計画

いくつかのパッケージは工業実験を扱う。工業実験は意図的な交絡を非常に分別し、誤差のための余分な自由度を持つ。

DoE.baseFrF2DoE.wrapperなどの一連のパッケージは主要な文法やアウトプットの構造が同じであり、中心的な特徴は実験計画のオブジェクトのためのdesignクラスである。4つめのRcmdrPlugin.DoE(βバージョン)パッケージはこれら3つのパッケージの機能を、コマンドラインプログラミングを使えない・使いたくないユーザーのためにRコマンダー(Rcmdrパッケージ、Fox 2005)に統合している。

DoE.baseは完全要因実験や主効果の実験のための直行配列を作る(Kuhfeld 2009で144もの実行がリストされ、???)。このパッケージは他の2つのためのインフラを作る。それは実験計画データフレームのためのdesignクラスや、このメソッドのためのいくつかのクラスである。直行配列の質を評価するためのいくつかの実験機能もある。FrF2はプラケット・バーマン(Plackett-Burman)型スクリーニングのような2段階の部分要因実験を行う。部分要因実験は最高分解能最小収差(maximum resolution minimum aberration)デザインがデフォルトであり、デザインの併合分類(incorporated catalogue)によって様々な方法でカスタマイズできる(Chan, Sun and Wu 1993によって分類されたデザイン、Block and Mee 2005、とXu 2009に分類されたさらに大きなデザインを含む。加えてFrF2.catlg128はとても大きい完全分類(分解能IVの、特殊な目的のための23因子128実行デザイン)を作ることができる)。解析の視点からは、FrF2は簡単なグラフィカル解析ツールである(正規、半正規効果プロットBsMDで改良された)、主効果プロットMinitabソフトのような交互作用プロット行列、3因子の組み合わせの立方プロット)。また2段階因子の部分要因のための別の構造を示すことができる。DoE.wrapperrsmlhsDiceDesignAlgDesignの機能を他の2つのパッケージの文脈に継承させ、便利な機能や他の可能性を付け加えることができる。特にこのパッケージは自動的にCCDs(central composite designs、中央複合デザイン)のキューブ部分を選ぶ、または既にあるキューブをCCDに付け足すことができる。

BHH2はBox, Hunter and Hunter第2版に書いてあり、いくつかのデータセットがある。おおくの因子と関係の定義リストから2段階の完全・部分要因実験を作る(ffDesMatrix()関数FrF2パッケージより快適ではない)。2段階要因実験データを解析するためのいくつかの関数がある。anovaPlot()関数は残差と比較した効果の大きさを評価し、lambdaPlot()はBox-Cox変換した効果の統計的有意差を評価する。BsMDはBox and Meyer(1986)が提案したベイジアンチャートや、2段階部分要因実験の中で効果が発現しているかを評価する効果プロット(正規、半正規、レンス(Lenth))を作成する。要因実験の計画や解析を行うツールから離れて、Rはrsmパッケージによって曲面最適化surface optimization)を行う。このパッケージは1次・2次反応曲面モデルの逐次最適化を行い、急上昇するように近づく最適化と線形モデルの応答関数の視覚化を提供している。また反応曲面の探索コーディングが促進されている。



コンピュータ実験のための実験計画

質的因子を使ったコンピュータ実験は特殊なタイプの実験デザインを必要とする。多くの異なる段階の因子が含まれることがよくあり、繰り返しが有益ではない。さらに調査している現象を適切に表現するために、線形や2次モデルを仮定するには実験の範囲がとても広い。その結果、実験空間を可能な限り埋めること(空間充填デザイン、space-filling designs)が理想的である。例えいくつかの要因が無関係であると判明しても、それぞれの実行(run)は追加の情報を生み出す。lhsパッケージはこの目的のためにラテン超立方デザイン(latin hypercube designs)を作る。さらに、実行しているフォローアップ実験を強調したコンピュータ実験の解析方法も提供する。同じような姿勢のもう1つのDiceDesignパッケージは、さらに空間充填デザインを実行する方法やコンピュータ実験の質の指標を追加する。DiceKrigingコンピュータ実験からメタモデルを生成するクリック手法を提供する。



その他の目的の実験計画

さらにいくつかのパッケージは特殊な状況での実験計画を扱う。desirailityは多基準解析を単純にするために、いくつかのターゲットの基準を望ましい関数に組み合わせる。experimentは臨床実験のツールを含む。例えばランダム化ツールや臨床試験のためのいくつかの特別な解析である。DoseFindingは用量発見実験のデザインと解析を行う関数を提供する(例えば薬剤のフェーズII臨床試験)。これはMCPModパッケージ(メンテナンスはされていない、Bornkamp, Pinheiro and Brets 2009で紹介されている)に、用量発見デザインのための特殊な最適化デザイン(MED最適デザイン、D-最適デザイン、両方の混合、Detteら 2008)の便利さを組み合わせている。idDesign連鎖平衡デザインを、crossdesは計量センサー(sensometrics)に利用できるいくつかのタイプのクロスオーバーデザインを(ラテン方格、多直交ラテン方格、ヨーデン方格も含む)利用できる。SensoMineRは例えば三角テスト(triangle test)のような計量センサー研究のための特殊なデザインを含んでいる。





  • Atkinson, A.C. and Donev, A.N. (1992). Optimum Experimental Designs . Oxford: Clarendon Press.
  • Bailey, R.A. (1981). A unified approach to design of experiments. Journal of the Royal Statistical Society, Series A 144 , 214-223.
  • Ball, R.D. (2005). Experimental Designs for Reliable Detection of Linkage Disequilibrium in Unstructured Random -Population Association Studies. Genetics 170 , 859-873.
  • Block, R. and Mee, R. (2005). Resolution IV Designs with 128 Runs. Journal of Quality Technology 37 , 282-293.
  • Bornkamp B., Pinheiro J. C., and Bretz, F. (2009). MCPMod: An R Package for the Design and Analysis of Dose-Finding Studies . Journal of Statistical Software 29 (7), 1-23.
  • Box G. E. P, Hunter, W. C. and Hunter, J. S. (2005). Statistics for Experimenters (2nd edition). New York: Wiley.
  • Box, G. E. P and R. D. Meyer (1986). An Analysis for Unreplicated Fractional Factorials. Technometrics 28 , 11-18.
  • Box, G. E. P and R. D. Meyer (1993). Finding the Active Factors in Fractionated Screening Experiments. Journal of Quality Technology 25 , 94-105.
  • Chen, J., Sun, D.X. and Wu, C.F.J. (1993). A catalogue of 2-level and 3-level orthogonal arrays. International Statistical Review 61 , 131-145.
  • Collings, B. J. (1989). Quick Confounding. Technometrics 31 , 107-110.
  • Daniel, C. (1959). Use of Half Normal Plots in Interpreting Two Level Experiments. Technometrics 1 , 311-340.
  • Derringer, G. and Suich, R. (1980). Simultaneous Optimization of Several Response Variables. Journal of Quality Technology 12 , 214-219.
  • Dette, H., Bretz, F., Pepelyshev, A. and Pinheiro, J. C. (2008). Optimal Designs for Dose Finding Studies. Journal of the American Statisical Association 103 , 1225-1237.
  • Federov, V.V. (1972). Theory of Optimal Experiments . Academic Press, New York.
  • Fox, J. (2005). The R Commander: A Basic-Statistics Graphical User Interface to R . Journal of Statistical Software 14 (9), 1-42.
  • Groemping, U. (2009). Design of Experiments in R . Presentation at UseR! 2009 in Rennes, France.
  • Hoaglin D., Mosteller F. and Tukey J. (eds., 1991). Fundamentals of Exploratory Analysis of Variance . Wiley, New York.
  • Jones, B. and Kenward, M.G. (1989). Design and Analysis of Cross-Over Trials . Chapman and Hall, London.
  • Johnson, M.E., Moore L.M. and Ylvisaker D. (1990). Minimax and maximin distance designs. Journal of Statistical Planning and Inference , 26 , 131-148.
  • Kuhfeld, W. (2009). Orthogonal arrays. Website courtesy of SAS Institute Inc., accessed August 4th 2010. URL http://support.sas.com/techsup/technote/ts723.html .
  • Kuhnert, P. and Venables, B. (2005) An Introduction to R: Software for Statistical Modelling & Computing . URL http://CRAN.R-project.org/doc/contrib/Kuhnert+Venables-R_Course_Notes.zip . (PDF document (about 360 pages) of lecture notes in combination with the data sets and R scripts)
  • Kunert, J. (1998). Sensory Experiments as Crossover Studies. Food Quality and Preference 9 , 243-253.
  • Lenth, R.V. (1989). Quick and Easy Analysis of Unreplicated Factorials. Technometrics 31 , 469-473.
  • Lenth, R.V. (2009). Response-Surface Methods in R, Using rsm . Journal of Statistical Software 32 (7), 1-17.
  • Mee, R. (2009). A Comprehensive Guide to Factorial Two-Level Experimentation . New York: Springer.
  • Myers, R. H. and Montgomery, C. M. (1995). Response Surface Methodology: Process and Product Optimization Using Designed Experiments . New York: Wiley.
  • Plackett, R.L. and Burman, J.P. (1946). The design of optimum multifactorial experiments. Biometrika 33 , 305-325.
  • Rosenbaum, P. (1989). Exploratory Plots for Paired Data. The American Statistician 43 , 108-109.
  • Sacks, J., Welch, W.J., Mitchell, T.J. and Wynn, H.P. (1989). Design and analysis of computer experiments. Statistical Science 4 , 409-435.
  • Santner T.J., Williams B.J. and Notz W.I. (2003). The Design and Analysis of Computer Experiments . Springer, New York.
  • Sen S, Satagopan JM and Churchill GA (2005). Quantitative Trait Locus Study Design from an Information Perspective. Genetics 170 , 447-464.
  • Stein, M. (1987). Large Sample Properties of Simulations Using Latin Hypercube Sampling. Technometrics 29 , 143-151.
  • Stocki, R. (2005). A Method to Improve Design Reliability Using Optimal Latin Hypercube Sampling. Computer Assisted Mechanics and Engineering Sciences 12 , 87-105.
  • Vikneswaran (2005). An R companion to "Experimental Design". URL http://CRAN.R-project.org/doc/contrib/Vikneswaran-ED_companion.pdf . (The file accompanies the book "Experimental Design with --Applications in Management, Engineering and the Sciences" by Berger and Maurer, 2002.)
  • Xu, H. (2009). Algorithmic Construction of Efficient Fractional Factorial Designs With Large Run Sizes. Technometrics 51 , 262-277.

ページTOPへ