kimuakillabokeijiban

51 コメント

views

0 フォロー

49 件中 1 から 40 までを表示しています。

掲示板を始めました

公平な情報開示を保つため、有益なコメントも非表示にします。

掲示板を始めました

実務統計では、補正の有無は、扱うデータ次第で決めます。初学者においては、一般的なことが分かっていれば大丈夫です。

掲示板を始めました

セルの中の個数が5以下の場合、検出力が不十分になります。テキストを参照してみてください。

掲示板を始めました

ベイズ問題のコツ

分母に「陽性者全員」を持ってくる。

分母は陽性者全員！分母は陽性者全員！

陽性者は
「発症していると診断され、検査を受けて陽性の人」
と
「発症してないと診断されたけど、検査を受けて陽性の人」
2種類いる。

実際に病気だと判定されるのは、「発症していると診断され、検査を受けて陽性の人」

「発症かつ陽性」/（「発症かつ陽性」＋「未発症かつ陽性」）

できるだけ分数ですすめてから最後に計算機を使うとよい。

掲示板を始めました

設定
イェーツの補正を要求する場合
→|観測度数－期待度数|－0.5をしてカイ二乗値を求める。
ただし、|観測度数－期待度数|の値が、5以上の時は補正をしない。

という解釈でいいですか？

掲示板を始めました

問題と答えが一致しない試験問題を配ると、1、2個ならまあ仕方ないとなるかもしれないけど、ミス量があまりに多いと、予備校なら信用をかなり失いますぜ。教員の方も同じかどうかは知りませんけど。

授業の最初に『だまされないようにしましょうね。』と言ってから、先生は意図的に間違いを多くして、間違い探しをさせていたのでは？と勝手に思ってる。
教員が提示するもの全てが真実だと思うな！というメッセージ的な。
もっと

掲示板を始めました

70 180
30 120

のクロス表だと、｜観測度数-期待度数｜が全て7.5になります。

名無しさんの補足によると、5以上だと補正をかけないのですよね？
そうすると答えのカイ二乗値は3.2になるんじゃないんですか？

イェーツの補正をかけると選択肢通りの2.7が出てきますが。
問題文には、イェーツの補正をして、という文言はないです。適切な検定方法でとあるので、選択肢にイェーツの補正の答えだけを入れているのは出題者のミスでは？

また、イェーツの補正は授業でもやってなかったと思います。

他の問題でもミスが散見されます。出題者のミスが多すぎるため、答えが合わないことがしばしば。(少なくとも6問以上)
答えが合わないと、自分のやり方が合っているのかどうかわからないですよ。

掲示板を始めました

解答例が、17と18で逆になっていますので、例題かの設問と選択肢ごと、訂正します。

なお、統計学のページから、アイスクリーム統計学のURLに入り、対応あるなしのt検定を見ると、計算方法が解ります。

問題 17 対応のある t 検定ができるか？テキスト p240～241

以下の 2 群のデータは、正規分布すると仮定した母集団から抽出した、ある取り組みを行った前後のデータである。このデータのｔ統計量を求め、５％有意水準で検定したときの判断を示してください。

前{15,25,20,35,45,55 }
後{15,20,25,35,40,45 }

1 0.31 有意差あり
2 1.16 有意差があるとは言えない*
3 1.39 有意差あり
4 1.49 有意差あるとは言えない
5 1.59 有意差あり

正解2

問題 18 対応のない t 検定ができるか？テキスト p242～244

"以下の２群のデータは、正規分布すると仮定した母集団から抽出した、独立した 2 群である。A 群・B 群ともある取り組みを行った後のデータである。このデータの平均値の差について、５％有意水準で検定したときの判断を示してください。

"Ａ群{15,25,20,35,45,55 } Ｂ群{15,20,25,35,40,45 }"

1 0.31 有意差あり
2 0.31 有意差があるとは言えない
3 1.16 有意差あり
4 １.95 有意差があるとは言えない
5 2.05 有意差あり

Ａ群の平均が 32.5、Ｂ群の平均が 30

正解2

掲示板を始めました

補足:カイニジョウ値を求める時、設問の設定にイェーツの補正をすることが要求されない場合、とマイナス0.5を分子に加えることになりますが、セルの中が、5以上ある場合には、補正をしません。
Rは、補正値を出力することがありますので、問題をみて時々注意して下さい。

掲示板を始めました

Q19.カイ二乗検定

カイ二乗値が2.8ではなく、3.2になっている人へ。

カイ二乗値＝(｜観測度数－期待度数｜－0.5)^2/期待度数　の和

として計算してみてください。2.8いくらかになると思います。

掲示板を始めました

Q17.t検定対応ありの解答
自由度5、有意水準5％で検定

t=1.16
2.571>1.16

より有意差ありとは言えない。

Q18.t検定対応なしの解答
自由度10、有意水準5％で検定

t=0.31
2.228>0.31

より有意差ありとは言えない。

となりました。

掲示板を始めました

ベイズ統計問題の解説を更新します。

Ｐ（Ｄ）を実際に病気である確率、Ｐ（Ｔ）を検査１で陽性となる確率とする。Ｐ（Ｄｃ）は実際に病気でない確率（P（D）の補集合で表される確率）を表す。ベイズの定理より、本問題はＰ（D｜Ｔ）＝Ｐ（Ｔ｜D）Ｐ（D）/Ｐ（Ｔ）と表現できる。Ｐ（D｜Ｔ）を求める。P（T｜D）＝0.95、P（T）＝0.0１、P（D）＝P（T｜D）P（D）＋P（T｜Dｃ）Ｐ（Dｃ）とあらわせる。したがってP（D）＝0.95×0.01＋0.1×0.99、P（T｜D）P（D）＝0.01×０．99である。これらを代入して解いても良い。ここでスモールｃは補集合を表す。図を描いて値を書き込んで計算すると直感的に求めることができる。

掲示板を始めました

追加の訂正です。
問題と回答には間違いがありませんが、
解説のところ（肝心なところです）に誤植がありました。

問題 16.　解説
×回帰式の係数＝相関係数/ｘの分散
〇回帰式の係数＝共分散/ｘの分散

このように訂正します。

掲示板を始めました

優秀な学生さんから指摘がありました。

問12
"クロス表を利用した適合度の検定は、カイ二乗値を求めることからカイ二乗検定と呼ばれる。以下のデータのカ
イ二乗値を求め、5%有意水準で検定してください。χ2 統計表値での自由度 1 の片側確率 0.05%は 3.84 である。
検査陽性で発症＋ 65
検査陰性で発症＋ 25
検査陽性で発症ー 35
検査陰性で発症ー 75"

選択肢5が正解です。解答例　選択肢４を訂正します。

掲示板を始めました

傾向と対策の修正解答をDLできるようにしました。
答えが合わなくて、困った人、すみませんでした。
では、本試頑張ってください。

掲示板を始めました

調和平均
          n
XH=---------------
      1 + 1+   +1
      -- --  … --
      X1 X2    Xn

掲示板を始めました

ほぼ設問者の要求通りの回答だと思います。Cは具体的には母集団の”構造”としておられますが、サンプルで得られた代表値のうち平均は一致推定量であるが、分散は一致推定量ではないという記述が統計学入門にある通り、このサンプルから全体の構造を把握するには無理があるので、ここでは”標本から母集団の代表的な性質を知ることができる”とすることが出来ると思います。この性質は要するに”平均”ですね。標本の平均はランダムに繰り返して測定した場合、母集団の平均（母平均）に一致する、という概念を想起してみて下さい。

掲示板を始めました

例題中の両群の理想の母分散を180とする、という部分はバグです。削除してください。手計算結果は正しいものと判断できます。この場合、帰無仮説は等分散していない、となります。P値が0、05より大きくなっていますので、帰無仮説は棄却できません。したがって、等分散するとしてデータを扱って良いと考えます。これは、そのまま２群のｔ検定において等分散性を前提とするデータの処理をしてよい、として独立２群のｔ検定を行った結果を、そのまま評価してよい、ということにつながるものです。

掲示板を始めました

stat-MINIMUM_v3の問1の穴埋め問題を解いてみました。3つ目の空欄は人によって書くことが変わってきそうですが。

統計学を活用して、データの要約とA."データからの推測"を行うことを考える。
要約の例として、外れ値の影響を受ける場合にB."中央値"をデータの代表値として用いることがある。
データからの推測の例としては、キャンプでのカレーの味見が挙げられる。一杯のカレーから鍋全体の味の様子を探ることは、C."標本から母集団の構造"について見立てている。

掲示板を始めました

質問です。2群の母分散比の取り得る範囲についてF値を求めて有意差5％で検定せよ、という問題についてです。
F値を求めよということで等分散のF検定をしました。

手計算をまず行いました。

Aの平方和が1192.86、Bの平方和が770.86となりました。
データ数が同じなので自由度で割る必要がないので、そのまま平方和の比が母分散比になる。
よって、
F値:1192.86/770.86=1.5474

これは、有意差5％のF分布表で自由度（6,6）でみた4.284＞1.5474だから、有意差があるとは言えない。

このような解答でいいでしょうか？

実際に
A群｛15,25,20,35,45,55,35｝
B群｛15,30,30,35,45,50,34｝
をRとRGで「等分散のF検定」にかけてみると、
F=1.5474、p-value=0.6093←偶然で起こる確率が60%程と計算されました。
　

ただ、問題文にあった「両群の理想の母分散を180とする」の使いどころが分かりませんでした。
東大出版会の教科書では、二つの母分散の信頼区間を計算する際、二つ群の母分散が分母分子に来てお互いを相殺するようなことが書かれてましたが、同じ母分散だから180/180＝1となって、結果的には考慮する必要がないということでよろしいでしょうか？

掲示板を始めました

https://15.gigafile.nu/0708-bb7f02f038fd0204dca166ac3be08c59b

掲示板を始めました

https://40.gigafile.nu/0708-c1e4ae5cd707493434f4be5936a20b0bc

掲示板を始めました

https://14.gigafile.nu/0708-b1de8833c9345aa9c337c125f2954e4a3

掲示板を始めました

https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000061944.html

掲示板を始めました

https://medysis.jp/opendata-link

掲示板を始めました

ビックデータを活用するための有料サービスもあります。
https://www.mdv.co.jp/ebm/column/article/02.html

掲示板を始めました

plot(ge.sf,lty=1:2) これK-M曲線の描出コマンドです。

掲示板を始めました

https://xgf.nu/L8Lw

掲示板を始めました

課題例

掲示板を始めました

糖尿病の運動療法の至適運動強度について合併症がある場合は強度を低くしたり制限する必要があると思うのですが合併症がない場合は至適運動強度は高くしても良いのでしょうか

掲示板を始めました

三島市医師会　糖尿病の説明　わかりやすいので　おすすめです。
https://website2.infomity.net/8120000094/course/dm2.html

掲示板を始めました

参考データ　PTのエビデンス　世界最大の情報サイト

https://pedro.org.au/japanese/

掲示板を始めました

参考データURL
https://www.e-stat.go.jp/stat-search/files?page=1&layout=datalist&toukei=00200502&tstat=000001141146&cycle=0&tclass1=000001141147&result_page=1&tclass2val=0

掲示板を始めました

個数ー１というのは自由度と言ったりします。　分析対象のデータの集合が、標本と見做せるとき、母集団の平均を推定するときに不偏分散としてn―1で演算します。
データが母集団そのものと見做せるときは、標本ではないので、分散はｎで割って求めることになります。

掲示板を始めました

分散などを求める時に全体の個数−1をする時はどんな時か、また、しない時はどんな時なのかがいまいちよくわかりません。

掲示板を始めました

区間推定の際、小数点第何位まで計算するか、また、小数点何桁まで丸めるかという問題では、私の期末試験では、選択肢で小数点3桁目のみが、異なるものが複数挙げられている場合、その桁が一意で決められるところまで、計算して欲しいと思います。　授業で示した式に数値を代入して計算してください。

掲示板を始めました

第3回の授業の区間推定の問題の平均は3.2じゃないんですか？3.2の場合って範囲はどうなりますか？

掲示板を始めました

　3群のデータの平均値の差を検定する問題について

この問題は、3群のデータから、それぞれの群の平均、偏差、平方和を求め、さらに分散を求めるための表をそれぞれの群のデータについて３つ作ります。この作業がわからない場合、代表値が求められないのなら、最初からやり直してください。
代表値は求められるが、表がつくれないのであれば、ゆっくり表の作り方をみて、真似してみてください。
表は作れるが、意味が分からないのであれば、個々の群の中の代表値を求める作業から、一転して3群まとめた（合体させた）全体の群のデータの代表値を計算し、その結果と個々の群のデータの代表値の比較をしていることを確かめてください。
ここが、分からないと、その先の結果の解釈ができません。

この流れは、それぞれのパートを覚えながら、次に進む作業をしないと理解できないと思います。
ひとつひとつ順を追って作業を進めて下さい。

最後に分散分析表が得られたら、このF値が、このデータの自由度を用いたカイ二乗統計表の自由度のところ（カテゴリー数―１）すなわち２と、求められたp値の水準すなわち0.05のところの交点にあたる値より大きければ、このF値は偶然の範囲を超えている、すなわち偶然では起こらない確率にあると判断します。これが、F値を構成する要因が結果に及ぼす影響が有意である、または3群の平均値は等しくないと言える、と判断することにつながります。

　このような手続きを経て、この問題の回答を導いてください。

掲示板を始めました

イーラーニングで学んでいる皆さんへ

　1群の標本データに対し、ｔ統計量を求め、母平均の95%信頼区間の上限を求める問題について、よくある間違いでは、ｔ統計量を求めるときに、ＳＤの平方根をｎで割る部分で、このｎを自由度と間違ってn―1で処理していたり、分散を求める際に、逆にn―1ではなくｎで割っている例が多々見受けられます。

　標本データの分散は、高校で習ってない、大学以降、平方和をn―1（自由度）で計算しますす。
　ただ、これが母集団のデータであるならば、分散はｎで求めます。この見分けが出来るか、が問われていることにも注意して下さい。
　その上で、計算して求めた解が、例示した解と異なっていれば、手順があっていればＯＫと考えます。

　がんばってください。

掲示板を始めました

https://xgf.nu/fowy

0714

kimuakillabokeijiban

最新トピック