おしゃれStatistics II を開催しました!
お陰様で、おしゃれStatistics IIを開催することができました!!
20人弱の方が参加して下さり、とても楽しい会となりました。
皆さんいろいろ質問して下さり、どれも本質を突くような良い質問ばかりでした。
それでは、今日出た議論を記録しておきます。
使った資料はこちらです↓
http://www.slideshare.net/isseing333/ii-8523815
- エビデンスってどういう意味で使う?
- 「名義尺度」「順序尺度」「間隔尺度」「比率尺度」って何?
- 心理学などの調査票データはどうやって解析する?
- ヒストグラムの幅はどうやって決める?
- 何か式はあるらしいけど、視覚化のツールなので「データをうまく表現できてそう」レベルで決めていいのでは?
- 解釈しやすい(区切りが意味のある)幅にする
- 狭すぎると山がいくつも出て来てしまうが、小さい山は気にしない。大きな山(傾向)を掴む
- 幅がバーによって変わっているヒストグラムもあるけど、解釈しにくいのでお勧めしません
- ヒストグラムの左右は日本では「以上・未満」だけど海外は?
- 「at least 15 but less than 20 minutes」これって「より大きい・以下?」
- http://en.wikipedia.org/wiki/Histogram
- ヒストグラムでチェックすべき事は?
- 分布の位置と広がり方
- 左右対称か右に歪んでいるか左に歪んでいるか
- 山の数:1峰性か2峰性か
- 箱ひげ図はどういう使い方をする?
- いくつかの群を並べて、中央値とばらつきを比較できる
- 箱の上下は四分位偏差なので、箱の中に50%が入っている
- 「交絡」の日本語的な意味は?
- 何でしょうね、、、「からみあっている?」英語では「confounding」なので「混乱させるもの」みたいな意味です
- 「真の効果をゆがめる因子」という意味です
- 「交絡」を調整する方法は?
- サンプル調査の「2,000人くらい集めれば良い」説って何?
- 性別2×年代7 = 14カテゴリで、1カテゴリ150人くらいだとちょうどそれくらいの数になるけど、、特に統計学的な根拠は無いです
- じゃあ「母集団の5%をサンプルしたら良い」説は?
- サンプルサイズ設計について
- 介入の効果を確かめたい(AB test)
- まず目的を定めて、それを達成するために必要なサンプル数を計算する
- A群とB群でどれくらいの差が見込めるか?を事前に決める
- 差が大きければ少ないサンプルで効果を証明できるし、差が小さければ多くのサンプル数が必要
- 設計されたサンプル数でランダム化試験を行う
- ランダムサンプリングとランダム化は言葉は似ているけど全く違う概念