[×]【期間限定】みんなで統計学プロジェクト【12月31日まで】

トップ フォーラム 雑談掲示板 [×]【期間限定】みんなで統計学プロジェクト【12月31日まで】

  • このトピックには139件の返信、1人の参加者があり、最後に1000マイルにより20年、 3ヶ月前に更新されました。
15件の投稿を表示中 - 31 - 45件目 (全140件中)
  • 投稿者
    投稿
  • #29114
    1000マイル
    キーマスター

    さて皆さん、第1章の進み具合はいかがでしょうか?
    まだ導入部、という感じですが、いくつか不明瞭な点が出てきましたので、こちらにアップしておきます。

    P36
    度数分布表を作成する手順が書かれています。
    この3.3)の「級間隔と級の数は、分析や観察の目的に応じて『適当に』決めればよい」とあるのですが、この「適当に」が引っかかってしまい、昨日図書館で調べてみました。
    ある程度経験を積むと「目的に応じて」上手に作れるのでしょうけど、今の段階で「目的に応じて適当に作ってください」と言われても、「どうすれば?」とう感じでした。

    統計解析入門(内田治 東京図書 P32)によると、
    1)データ数nを数える
    2)最大値と最小値を求める
    3)範囲Rを求める R=最大値-最小値
    4)区間の数(ヒストグラムの柱の数)Kを決める。
      Kは√nに近い整数値を目安にすると良い
    5)区間の幅(ひとつの柱の幅)hを求める。
      h=R/kとして、hを計算し、データの測定単位の整数倍に丸める。
    6)最初の区間の下側境界地aを求める。
      a=最小値-(測定単位/2)
    となっています。

    実際にこれを行なうと、k1の境界値が138.5~147.5となり、実際によりわかりづらい度数分布表となる可能性があります。
    ここは、こんな目安もある程度でいいのかもしれません。
    結局はある程度の場数を踏んで、要領をつかみましょう、ということなのでしょう。

    #29115
    1000マイル
    キーマスター

    今度は質問。

    P49の[練習問題1]についてです。
    母集団が3桁(ここでは180個)ある場合の、標本抽出はどのようにすればいいのでしょうか。

    1.(1)で20の標本を作る際、P24の乱数表からRNを20個選んだとします。

    2.私は、誕生日が8月10日なので、8行10列から2桁づつ、20個選びました。

    3.具体的には04 34 71 48 98 08 12 65 12 74…..となっていきます。

    4.このRNに該当する標本Xiを抽出することになりますが、2桁のRNを選んでいるため、母集団のうち100番目以上の数字は選択対象外になっていることになります。結果、乱数から選んだとしても偏った標本となってしまいます。

    5.解決策として、
      1)上記3.から選んだRNは、復元抽出となっていますので、重複しているものに百の位を足して、3桁にする(たとえば12の片方を112にする)?
      2)それとも、もっと合理的な方法があるのだろうか?

    ご存知の方、教えてください。

    #29116
    Kafka
    キーマスター

    この問題では154~180は海外駐在社員のデータと偏りがあるので
    2桁の乱数でやると全体のデータにはならないですね。
    例題の場合で2桁を採取して+100をすると、181~199は存在しない為
    偏ってしまいます。例題のように後半だけ数字が大きくなってしまう標本は
    3桁で乱数を採って出た数字から180×nを引くといいです。(回答は1~180にする)
    そして901~999の数字が出た場合は読み飛ばしてください。 ∵ 180×5=900

    043→43 471→471-180×2=111 こうすれば偏らないはずです。

    #29117
    1000マイル
    キーマスター

    Kafkaさん!!!レスありがとうございます!!!!
    「目からうろこ」とはこのことかも。3桁にして180で割った余りをRNにすればいいのですね。
    どうもありがとうございます。

    スパッと解決して、とっても気持ち良いです!!
    これからも、見守ってやってください。ありがとうございました。

    #29118
    1000マイル
    キーマスター

    夏スク打ち上げでoutbackさんにいただいた「スタディガイド」を見ていたら、統計学のところにこんなことが書いてありました。
    「統計学の学習に当たっては、①講義を大切にし、②学んだことを応用する、ことが非常に重要です。まず講義に出席して講義担当者の解説を聞いた上で、ノート、テキストなどで復習し、練習問題をたくさん解くという姿勢が望まれます。」(「別冊三田学会雑誌スタディガイド2005」慶応大学経済学会編集 P59)

    テキストを理解した上で、練習問題を解くことは重要ですね。明日以降、余裕があれば各章に関連する問題をアップしてみたいと思います。何か良い問題がありましたら、ご紹介くださいね。

    #29119
    ひまわり59
    キーマスター

    お、遅れてます。。。(-_-;)
    すっごい遅れとってます。。。(T_T)
    追いつけるんでしょうか???(汗)
    今日、土曜日だし、今晩、頑張りますっ!

    #29120
    1000マイル
    キーマスター

    ひまわり59さん。おはようございます。
    大丈夫ですよ~。繰り返し読めば、第2章ぐらいまでは理解が早いと思いますよ。
    ひっかかるところは、このトピに書いて解決しちゃいましょう。

    #29121
    1000マイル
    キーマスター

    「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「

    第2章 標本分布の特性値

    「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「

    そろそろ統計学っぽくなってきました!
    10月24日から30日までは、第2章を攻略しましょう。
    もちろん第1章の話題もOKです。

    質問・疑問については、ささいなことでも投稿していきましょう。理解したあとには、自信につながると思います。
    プロジェクト参加の皆さんはもちろん、既に単位を修得した方々からのアドバイスもお待ちしております。

    では、がんばっていきましょう!

    #29122
    森野にゃんこ
    キーマスター

    質問です。

    第2章、61ページ「度数分布表の中央値」の
    中央値を出す計算ですが、

    Me=(Meが入っている階級の左端の数字)+・・・・

    と、ありますが、

    この(Meが入っている階級の左端の数字)が
    80.5になってますよね?

    これがどうしてなのか分からないんです。
    「左端の数字」とは、どういう意味なのでしょうか?

    #29123
    まりか
    キーマスター

    >にゃんこさん
    えーっと、これは第7階級が80で終わっていますよね。
    それで、第8階級はここでは81からになっています。
    ということは、80から81の間がここでは表れていないんです。
    でも、データとしては、80から81の間ってあるんですよ。
    でその間となる80.5が第8階級の左端の数字、その階級の最小のデータです。

    このような説明でお分かりでしょうか?
    って、言い切っちゃったけれど・・・
    合っていると思うのですが・・・
    きゃー、間違っていたらごめんなさい。
    (だんだん自信がなくなってきました・・・)

    #29124
    てきーら
    キーマスター

    にゃんこさんの問題ですが
    60ページのMe=200+226/2=213の公式に
    あてはめて計算すると私は覚えこみました。
    この場合、全体を半分に分ける境界にデータがないから
    中点を計算する
    Me=80+81/2=80.5
    例えば62ページの練習問題も同じ理由から中点をもとめる
    Me=20+21/2=20.5
    てなかんじでずっと私は思ってました。
    間違ってたら教えてください・・・(^^;

    #29125
    1000マイル
    キーマスター

    まりかさんの説明、わたしもどこかで聞いたことがあります。てきーらさんも同じことをおっしゃっているのだと思います。

    P60では「階級幅」という言葉になっており、階級間に空白があるんです。たとえば、階級7は「76-80」なのに階級8は「81-85」で「80-81」がない。
    これはまりかさんご指摘のとおりです。

    テキストではいままでこの「階級幅」ではなく「境界値」という言葉を使ってきたはずです。P38などをみると、「以上、未満」としてきっかり隙間なくなっていますね。

    この違いについて詳しくはわかりませんが、P32とP60で同じなのは、「階級値」です。階級値とはP36にあるように「境界と境界の間、すなわち各級の中央値」です。これなら、空白がありません。したがって、中央値と中央値の中間こそが、P62でいう(Meが入っている階級の左端の値)にあたるのではないかと考えています。つまり、P61の(例5)では、階級7と階級8の中間という意味で、(78+83)/2=80.5がこれに該当するのではないでしょうか。
    これは私の勝手な理解ですが、なんとなぁくこれでいいような気がしています。

    #29126
    まりか
    キーマスター

    あ、そうか!階級幅と境界値の違いですね。
    中央値と中央値の中間っていうことで、納得です。
    これは、問題こなさないと混乱しそうですね♪

    #29127
    森野にゃんこ
    キーマスター

    うわ、みなさん早~い!!
    的確なご回答と解説、ありがとうございました。
    もう一度、教科書を見て確認しますね。

    ありがとうございました。

    #29128
    1000マイル
    キーマスター

    P69にある、「自由度n-1」で割る理由はなんなんでしょうねぇ。「複雑な証明が必要なので、入門統計学の段階では省略するが、」ってありますから、気にしないほうがいいのでしょうねぇ。
    標本サイズの平均で割るのが単純でいいのだけど、統計学は奥が深いなぁ。
    高校生(とぉい昔)時代の数学は、あんまり考えなくて公式知っていて、それを知恵の輪のように上手に使えばなんとか点数になっていたような気がするんだけど、高校卒業して今更になって、「なんでだろ」「どうしてだろ」という単純な好奇心でいっぱいになってきました。
    数学はもともと得意じゃないので、なんとも深入りするのは勇気がいるんだけどね。ちょっとだけ教えてほしいなぁ。

15件の投稿を表示中 - 31 - 45件目 (全140件中)
  • このトピックに返信するにはログインが必要です。
上部へスクロール