ここでいつでも、聞きたいこと、言いたいこと、伝えたいこと、疑問、知っトク情報などを共有しましょう。
1437253d99
kimuakisan
通報 ...
三島市医師会 糖尿病の説明 わかりやすいので おすすめです。
https://website2.infomity.net/8120000094/course/dm2.html
糖尿病の運動療法の至適運動強度について合併症がある場合は強度を低くしたり制限する必要があると思うのですが合併症がない場合は至適運動強度は高くしても良いのでしょうか
課題例
https://xgf.nu/L8Lw
plot(ge.sf,lty=1:2) これK-M曲線の描出コマンドです。
ビックデータを活用するための有料サービスもあります。
https://www.mdv.co.jp/ebm/column/article/02.html
https://medysis.jp/opendata-link
https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000061944.html
https://14.gigafile.nu/0708-b1de8833c9345aa9c337c125f2954e4a3
https://40.gigafile.nu/0708-c1e4ae5cd707493434f4be5936a20b0bc
https://15.gigafile.nu/0708-bb7f02f038fd0204dca166ac3be08c59b
質問です。2群の母分散比の取り得る範囲についてF値を求めて有意差5%で検定せよ、という問題についてです。
F値を求めよということで等分散のF検定をしました。
手計算をまず行いました。
Aの平方和が1192.86、Bの平方和が770.86となりました。
データ数が同じなので自由度で割る必要がないので、そのまま平方和の比が母分散比になる。
よって、
F値:1192.86/770.86=1.5474
これは、有意差5%のF分布表で自由度(6,6)でみた4.284>1.5474だから、有意差があるとは言えない。
このような解答でいいでしょうか?
実際に
A群{15,25,20,35,45,55,35}
B群{15,30,30,35,45,50,34}
をRとRGで「等分散のF検定」にかけてみると、
F=1.5474、p-value=0.6093←偶然で起こる確率が60%程と計算されました。
ただ、問題文にあった「両群の理想の母分散を180とする」の使いどころが分かりませんでした。
東大出版会の教科書では、二つの母分散の信頼区間を計算する際、二つ群の母分散が分母分子に来てお互いを相殺するようなことが書かれてましたが、同じ母分散だから180/180=1となって、結果的には考慮する必要がないということでよろしいでしょうか?
例題中の両群の理想の母分散を180とする、という部分はバグです。削除してください。手計算結果は正しいものと判断できます。この場合、帰無仮説は等分散していない、となります。P値が0、05より大きくなっていますので、帰無仮説は棄却できません。したがって、等分散するとしてデータを扱って良いと考えます。これは、そのまま2群のt検定において等分散性を前提とするデータの処理をしてよい、として独立2群のt検定を行った結果を、そのまま評価してよい、ということにつながるものです。
stat-MINIMUM_v3の問1の穴埋め問題を解いてみました。3つ目の空欄は人によって書くことが変わってきそうですが。
統計学を活用して、データの要約とA."データからの推測"を行うことを考える。
要約の例として、外れ値の影響を受ける場合にB."中央値"をデータの代表値として用いることがある。
データからの推測の例としては、キャンプでのカレーの味見が挙げられる。一杯のカレーから鍋全体の味の様子を探ることは、C."標本から母集団の構造"について見立てている。
ほぼ設問者の要求通りの回答だと思います。Cは具体的には母集団の”構造”としておられますが、サンプルで得られた代表値のうち平均は一致推定量であるが、分散は一致推定量ではないという記述が統計学入門にある通り、このサンプルから全体の構造を把握するには無理があるので、ここでは”標本から母集団の代表的な性質を知ることができる”とすることが出来ると思います。この性質は要するに”平均”ですね。標本の平均はランダムに繰り返して測定した場合、母集団の平均(母平均)に一致する、という概念を想起してみて下さい。
調和平均
n
XH=---------------
1 + 1+ +1
-- -- … --
X1 X2 Xn
傾向と対策の修正解答をDLできるようにしました。
答えが合わなくて、困った人、すみませんでした。
では、本試頑張ってください。
優秀な学生さんから指摘がありました。
問12
"クロス表を利用した適合度の検定は、カイ二乗値を求めることからカイ二乗検定と呼ばれる。以下のデータのカ
イ二乗値を求め、5%有意水準で検定してください。χ2 統計表値での自由度 1 の片側確率 0.05%は 3.84 である。
検査陽性で発症+ 65
検査陰性で発症+ 25
検査陽性で発症ー 35
検査陰性で発症ー 75"
選択肢5が正解です。解答例 選択肢4を訂正します。
追加の訂正です。
問題と回答には間違いがありませんが、
解説のところ(肝心なところです)に誤植がありました。
問題 16. 解説
×回帰式の係数=相関係数/xの分散
〇回帰式の係数=共分散/xの分散
このように訂正します。
ベイズ統計問題の解説を更新します。
P(D)を実際に病気である確率、P(T)を検査1で陽性となる確率とする。P(Dc)は実際に病気でない確率(P(D)の補集合で表される確率)を表す。ベイズの定理より、本問題はP(D|T)=P(T|D)P(D)/P(T)と表現できる。P(D|T)を求める。P(T|D)=0.95、P(T)=0.01、P(D)=P(T|D)P(D)+P(T|Dc)P(Dc)とあらわせる。したがってP(D)=0.95×0.01+0.1×0.99、P(T|D)P(D)=0.01×0.99である。これらを代入して解いても良い。ここでスモールcは補集合を表す。図を描いて値を書き込んで計算すると直感的に求めることができる。
Q17.t検定対応ありの解答
自由度5、有意水準5%で検定
t=1.16
2.571>1.16
より有意差ありとは言えない。
Q18.t検定対応なしの解答
自由度10、有意水準5%で検定
t=0.31
2.228>0.31
より有意差ありとは言えない。
となりました。
Q19.カイ二乗検定
カイ二乗値が2.8ではなく、3.2になっている人へ。
カイ二乗値=(|観測度数-期待度数|-0.5)^2/期待度数 の和
として計算してみてください。2.8いくらかになると思います。
補足:カイニジョウ値を求める時、設問の設定にイェーツの補正をすることが要求されない場合、とマイナス0.5を分子に加えることになりますが、セルの中が、5以上ある場合には、補正をしません。
Rは、補正値を出力することがありますので、問題をみて時々注意して下さい。
設定
イェーツの補正を要求する場合
→|観測度数-期待度数|-0.5をしてカイ二乗値を求める。
ただし、|観測度数-期待度数|の値が、5以上の時は補正をしない。
という解釈でいいですか?
セルの中の個数が5以下の場合、検出力が不十分になります。テキストを参照してみてください。
実務統計では、補正の有無は、扱うデータ次第で決めます。初学者においては、一般的なことが分かっていれば大丈夫です。
解答例が、17と18で逆になっていますので、例題かの設問と選択肢ごと、訂正します。
なお、統計学のページから、アイスクリーム統計学のURLに入り、対応あるなしのt検定を見ると、計算方法が解ります。
問題 17 対応のある t 検定ができるか?テキスト p240~241
以下の 2 群のデータは、正規分布すると仮定した母集団から抽出した、ある取り組みを行った前後のデータである。このデータのt統計量を求め、5%有意水準で検定したときの判断を示してください。
前{15,25,20,35,45,55 }
後{15,20,25,35,40,45 }
1 0.31 有意差あり
2 1.16 有意差があるとは言えない*
3 1.39 有意差あり
4 1.49 有意差あるとは言えない
5 1.59 有意差あり
正解2
問題 18 対応のない t 検定ができるか?テキスト p242~244
"以下の2群のデータは、正規分布すると仮定した母集団から抽出した、独立した 2 群である。A 群・B 群ともある取り組みを行った後のデータである。このデータの平均値の差について、5%有意水準で検定したときの判断 を示してください。
"A群{15,25,20,35,45,55 } B群{15,20,25,35,40,45 }"
1 0.31 有意差あり
2 0.31 有意差があるとは言えない
3 1.16 有意差あり
4 1.95 有意差があるとは言えない
5 2.05 有意差あり
A群の平均が 32.5、B群の平均が 30
正解2
70 180
30 120
のクロス表だと、|観測度数-期待度数|が全て7.5になります。
名無しさんの補足によると、5以上だと補正をかけないのですよね?
そうすると答えのカイ二乗値は3.2になるんじゃないんですか?
イェーツの補正をかけると選択肢通りの2.7が出てきますが。
問題文には、イェーツの補正をして、という文言はないです。適切な検定方法でとあるので、選択肢にイェーツの補正の答えだけを入れているのは出題者のミスでは?
また、イェーツの補正は授業でもやってなかったと思います。
他の問題でもミスが散見されます。出題者のミスが多すぎるため、答えが合わないことがしばしば。(少なくとも6問以上)
答えが合わないと、自分のやり方が合っているのかどうかわからないですよ。
問題と答えが一致しない試験問題を配ると、1、2個ならまあ仕方ないとなるかもしれないけど、ミス量があまりに多いと、予備校なら信用をかなり失いますぜ。教員の方も同じかどうかは知りませんけど。
授業の最初に『だまされないようにしましょうね。』と言ってから、先生は意図的に間違いを多くして、間違い探しをさせていたのでは?と勝手に思ってる。
教員が提示するもの全てが真実だと思うな!というメッセージ的な。
もっと
ベイズ問題のコツ
分母に「陽性者全員」を持ってくる。
分母は陽性者全員!分母は陽性者全員!
陽性者は
「発症していると診断され、検査を受けて陽性の人」
と
「発症してないと診断されたけど、検査を受けて陽性の人」
2種類いる。
実際に病気だと判定されるのは、「発症していると診断され、検査を受けて陽性の人」
「発症かつ陽性」/(「発症かつ陽性」+「未発症かつ陽性」)
できるだけ分数ですすめてから最後に計算機を使うとよい。
公平な情報開示を保つため、有益なコメントも非表示にします。