- このトピックには139件の返信、1人の参加者があり、最後に
1000マイルにより20年、 3ヶ月前に更新されました。
-
投稿者投稿
-
2005年10月22日 8:24 AM #29114
1000マイル
キーマスターさて皆さん、第1章の進み具合はいかがでしょうか?
まだ導入部、という感じですが、いくつか不明瞭な点が出てきましたので、こちらにアップしておきます。P36
度数分布表を作成する手順が書かれています。
この3.3)の「級間隔と級の数は、分析や観察の目的に応じて『適当に』決めればよい」とあるのですが、この「適当に」が引っかかってしまい、昨日図書館で調べてみました。
ある程度経験を積むと「目的に応じて」上手に作れるのでしょうけど、今の段階で「目的に応じて適当に作ってください」と言われても、「どうすれば?」とう感じでした。統計解析入門(内田治 東京図書 P32)によると、
1)データ数nを数える
2)最大値と最小値を求める
3)範囲Rを求める R=最大値-最小値
4)区間の数(ヒストグラムの柱の数)Kを決める。
Kは√nに近い整数値を目安にすると良い
5)区間の幅(ひとつの柱の幅)hを求める。
h=R/kとして、hを計算し、データの測定単位の整数倍に丸める。
6)最初の区間の下側境界地aを求める。
a=最小値-(測定単位/2)
となっています。実際にこれを行なうと、k1の境界値が138.5~147.5となり、実際によりわかりづらい度数分布表となる可能性があります。
ここは、こんな目安もある程度でいいのかもしれません。
結局はある程度の場数を踏んで、要領をつかみましょう、ということなのでしょう。2005年10月22日 9:05 AM #291151000マイル
キーマスター今度は質問。
P49の[練習問題1]についてです。
母集団が3桁(ここでは180個)ある場合の、標本抽出はどのようにすればいいのでしょうか。1.(1)で20の標本を作る際、P24の乱数表からRNを20個選んだとします。
2.私は、誕生日が8月10日なので、8行10列から2桁づつ、20個選びました。
3.具体的には04 34 71 48 98 08 12 65 12 74…..となっていきます。
4.このRNに該当する標本Xiを抽出することになりますが、2桁のRNを選んでいるため、母集団のうち100番目以上の数字は選択対象外になっていることになります。結果、乱数から選んだとしても偏った標本となってしまいます。
5.解決策として、
1)上記3.から選んだRNは、復元抽出となっていますので、重複しているものに百の位を足して、3桁にする(たとえば12の片方を112にする)?
2)それとも、もっと合理的な方法があるのだろうか?ご存知の方、教えてください。
2005年10月22日 11:25 AM #29116Kafka
キーマスターこの問題では154~180は海外駐在社員のデータと偏りがあるので
2桁の乱数でやると全体のデータにはならないですね。
例題の場合で2桁を採取して+100をすると、181~199は存在しない為
偏ってしまいます。例題のように後半だけ数字が大きくなってしまう標本は
3桁で乱数を採って出た数字から180×nを引くといいです。(回答は1~180にする)
そして901~999の数字が出た場合は読み飛ばしてください。 ∵ 180×5=900043→43 471→471-180×2=111 こうすれば偏らないはずです。
2005年10月22日 1:59 PM #291171000マイル
キーマスターKafkaさん!!!レスありがとうございます!!!!
「目からうろこ」とはこのことかも。3桁にして180で割った余りをRNにすればいいのですね。
どうもありがとうございます。スパッと解決して、とっても気持ち良いです!!
これからも、見守ってやってください。ありがとうございました。2005年10月22日 8:40 PM #291181000マイル
キーマスター夏スク打ち上げでoutbackさんにいただいた「スタディガイド」を見ていたら、統計学のところにこんなことが書いてありました。
「統計学の学習に当たっては、①講義を大切にし、②学んだことを応用する、ことが非常に重要です。まず講義に出席して講義担当者の解説を聞いた上で、ノート、テキストなどで復習し、練習問題をたくさん解くという姿勢が望まれます。」(「別冊三田学会雑誌スタディガイド2005」慶応大学経済学会編集 P59)テキストを理解した上で、練習問題を解くことは重要ですね。明日以降、余裕があれば各章に関連する問題をアップしてみたいと思います。何か良い問題がありましたら、ご紹介くださいね。
2005年10月22日 10:32 PM #29119ひまわり59
キーマスターお、遅れてます。。。(-_-;)
すっごい遅れとってます。。。(T_T)
追いつけるんでしょうか???(汗)
今日、土曜日だし、今晩、頑張りますっ!2005年10月23日 5:00 AM #291201000マイル
キーマスターひまわり59さん。おはようございます。
大丈夫ですよ~。繰り返し読めば、第2章ぐらいまでは理解が早いと思いますよ。
ひっかかるところは、このトピに書いて解決しちゃいましょう。2005年10月24日 5:29 AM #291211000マイル
キーマスター「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「
第2章 標本分布の特性値
「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「
そろそろ統計学っぽくなってきました!
10月24日から30日までは、第2章を攻略しましょう。
もちろん第1章の話題もOKです。質問・疑問については、ささいなことでも投稿していきましょう。理解したあとには、自信につながると思います。
プロジェクト参加の皆さんはもちろん、既に単位を修得した方々からのアドバイスもお待ちしております。では、がんばっていきましょう!
2005年10月25日 12:24 AM #29122森野にゃんこ
キーマスター質問です。
第2章、61ページ「度数分布表の中央値」の
中央値を出す計算ですが、Me=(Meが入っている階級の左端の数字)+・・・・
と、ありますが、
この(Meが入っている階級の左端の数字)が
80.5になってますよね?これがどうしてなのか分からないんです。
「左端の数字」とは、どういう意味なのでしょうか?2005年10月25日 12:40 AM #29123まりか
キーマスター>にゃんこさん
えーっと、これは第7階級が80で終わっていますよね。
それで、第8階級はここでは81からになっています。
ということは、80から81の間がここでは表れていないんです。
でも、データとしては、80から81の間ってあるんですよ。
でその間となる80.5が第8階級の左端の数字、その階級の最小のデータです。このような説明でお分かりでしょうか?
って、言い切っちゃったけれど・・・
合っていると思うのですが・・・
きゃー、間違っていたらごめんなさい。
(だんだん自信がなくなってきました・・・)2005年10月25日 1:25 AM #29124てきーら
キーマスターにゃんこさんの問題ですが
60ページのMe=200+226/2=213の公式に
あてはめて計算すると私は覚えこみました。
この場合、全体を半分に分ける境界にデータがないから
中点を計算する
Me=80+81/2=80.5
例えば62ページの練習問題も同じ理由から中点をもとめる
Me=20+21/2=20.5
てなかんじでずっと私は思ってました。
間違ってたら教えてください・・・(^^;2005年10月25日 5:17 AM #291251000マイル
キーマスターまりかさんの説明、わたしもどこかで聞いたことがあります。てきーらさんも同じことをおっしゃっているのだと思います。
P60では「階級幅」という言葉になっており、階級間に空白があるんです。たとえば、階級7は「76-80」なのに階級8は「81-85」で「80-81」がない。
これはまりかさんご指摘のとおりです。テキストではいままでこの「階級幅」ではなく「境界値」という言葉を使ってきたはずです。P38などをみると、「以上、未満」としてきっかり隙間なくなっていますね。
この違いについて詳しくはわかりませんが、P32とP60で同じなのは、「階級値」です。階級値とはP36にあるように「境界と境界の間、すなわち各級の中央値」です。これなら、空白がありません。したがって、中央値と中央値の中間こそが、P62でいう(Meが入っている階級の左端の値)にあたるのではないかと考えています。つまり、P61の(例5)では、階級7と階級8の中間という意味で、(78+83)/2=80.5がこれに該当するのではないでしょうか。
これは私の勝手な理解ですが、なんとなぁくこれでいいような気がしています。2005年10月25日 6:51 AM #29126まりか
キーマスターあ、そうか!階級幅と境界値の違いですね。
中央値と中央値の中間っていうことで、納得です。
これは、問題こなさないと混乱しそうですね♪2005年10月25日 7:56 AM #29127森野にゃんこ
キーマスターうわ、みなさん早~い!!
的確なご回答と解説、ありがとうございました。
もう一度、教科書を見て確認しますね。ありがとうございました。
2005年10月27日 2:08 PM #291281000マイル
キーマスターP69にある、「自由度n-1」で割る理由はなんなんでしょうねぇ。「複雑な証明が必要なので、入門統計学の段階では省略するが、」ってありますから、気にしないほうがいいのでしょうねぇ。
標本サイズの平均で割るのが単純でいいのだけど、統計学は奥が深いなぁ。
高校生(とぉい昔)時代の数学は、あんまり考えなくて公式知っていて、それを知恵の輪のように上手に使えばなんとか点数になっていたような気がするんだけど、高校卒業して今更になって、「なんでだろ」「どうしてだろ」という単純な好奇心でいっぱいになってきました。
数学はもともと得意じゃないので、なんとも深入りするのは勇気がいるんだけどね。ちょっとだけ教えてほしいなぁ。 -
投稿者投稿
- このトピックに返信するにはログインが必要です。