変則隔週日曜日 22:00~23:00 けもがたりの場所
11・12月の予定 🐸<もう今年も終わりでありますなぁ
11/3 黄色い生き物の話 モンキチョウ、キビタキ、ウデフリツノザヤウミウシなど
11/17 赤い生き物の話 アカゲザル、タンチョウヅル、ベニザケ(繁殖期)など
・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
12/1 緑・青色の生き物の話 ミドリムシ、ウグイス色のメジロ、アオツラカツオドリ、マルタタイガーなど
12/15 雪と氷と生き物と ユキヒョウ、ニホンザル、アザラシ、ワカサギなど
12/29 これまでのけもフレとこれからのけもフレ プロジェクト10周年!
けもがたり保管庫
(けもがたり過去ログまとめ)
アンケート時の度数分布からですけど…
ハッまた統計学の授業が始まる逃げなきゃ(名無しの意味がまるでない)
度数分布から平均値を求める方法を数学で習ったのかな。
まずは階級値を求めよと言われたかもしれませんが、それは各階級内でランダムにサンプルが散らばっているという前提があるのですね。
階級:10-19歳の平均が今回は14.5歳で良いのでしょうか?
はてさて、この掲示板を見る限り10ー14歳は比較的少なそうですね。
階級:15-19歳の方が真実に近いと思われます。
他の年代については年齢の情報がさっぱり無いので、階級値を25,35,...とするしかありません。
10代に関してはもっと情報があり、また人数的に影響力が多いので、補正した方が真実に近づく。
(20代も大学生が多いとすれば平均値24歳ぐらいの方が良いかもしれない。)
(17✕30+24✕21+35✕5+45✕2+65✕2)/60=23.4833…≒23.5
これでいいですかね?
60台は取り敢えず65で計算しました
信頼区間も出せるかなと思ったけど流石に階級値参照は乱暴かな。
しかもこの年齢分布はそのままでは正規性を仮定するのには無理があるから
ボックスコックス変換必要になりそうでめんどくさい。
(アンケートに答えたかどうかに年齢の影響はないと仮定していることもお忘れなく)
標本の平均値を求めるという観点からはより良くなったでしょう。
母集団を代表する値は平均値のほかに中央値、最頻値があることも習いましたね。
どれが最適かということや、23.5歳という数字にどういう意義を見出すかを考えるようになると、統計マジックに騙されない大人になれるでしょう…
>> 1128
非正規分布を正規分布らしくするための処理は私は受け入れられませんねえ。
正規分布しか処理できない手法を用いる場合、実務的には役に立つと思うのですが、それは真実なのか?と疑念が止まりません。
アンケートらしく素直にノンパラメトリックな検定が良いかと考えます。
しかし、アンケートに答えたかどうかを気にするのもおもしろいですね。
>> 1129
それもそうですね。
統計のマジックで前提が狂ってること(ランダムな抽出という仮定)が
結構あるので用心に越したことないです。