統計入門
1 統計とは
「統計」という言葉は,現代のあらゆる分野で広く日常的に使われていますが,改めてその意味を問われたら,答えることが難しい人が案外多いのではないでしょうか。
統計という言葉を公式に定義付けしたものはないのですが,一般的には,
「一定の条件(時間・空間・標識)で定められた集団について調べた(あるいは集めた)結果を,集計・加工して得られた数値」
と表現することができます。
(注) 時間は,その集団が存在している時を示し,空間は,一般に地域範囲を示す場所を意味し,標識は,集団を構成する個々の特性(集団を「人」でとらえると,性別,年齢,所得額など)を示します。
2 統計の利用
(1)行政における利用
国,県,市町村など行政機関にとっては,統計は実態の把握(はあく)や計画の策定,施策の評価などに利用されます。かみくだいて言うと,「国民・住民の皆さまから集められた税金を効率的・効果的に使い,無駄使いしないようにするための道しるべとなるもの。」とも言えます。
(2)民間における統計利用
多くの民間企業で,統計的手法を駆使して,市場調査をはじめ様々な統計的活用がなされていますが,これらの基礎的資料として,国や地方公共団体の各種の統計が多角的に使われています。
3 統計の種類
統計は,次のような種類分けができます。
・一次統計
統計調査の結果などから直接得られた統計のことです。一般的な統計表に見られる統計の大部分がこれに当たります。
調査統計:統計の作成を主目的とする調査から作成された統計のことです。(国勢調査や工業統計調査,商業統計調査など)
業務統計:登録,届出,業務記録など,行政機関や民間団体が行政上・業務上の必要から集めた,または作成した業務記録をもとに作成される統計のことです。(有効求人倍率,建築着工統計など)
・加工統計(二次統計)
一次統計の結果を指数化したり,総合的に推計するなど一次統計に何らかの加工処理を行って得られる統計です。(消費者物価指数,国民経済計算など)
4 調査の方法
(1)全数調査(センサス)
世帯あるいは事業所といった調査対象となる集団の全部について調べる調査のことです。悉皆(しっかい)調査とも言います。
国勢調査,経済センサス,農林業センサスなどは全数調査により行われています。
(2)標本調査
全体を調べる代わりに,その一部(標本)を抜き取って調べ,その結果から全体を推定しようとする調査のことです。抽出(ちゅうしゅつ)調査,サンプル調査とも言います。
(3)調査員調査
調査対象者への調査票の配布・回収を,統計調査員が行う調査のことです。
(4)郵送調査
調査対象者への調査票の配布・回収を,郵便によって行う調査のことです。
なお,最近では,情報通信技術を活用した統計調査として,インターネットにより調査票の配布・回収を行う「オンライン調査」の推進が図られています。
5 統計法規
国や地方公共団体などの公的機関が行う統計調査は,「統計法」という法律に基づいて行われます。
統計法では,統計調査に対する国民の信頼を確保するため,集められた情報の保護に関し,次のことが定められています。(守秘義務に違反した場合の罰則も定められています。)
○ 調査によって集められた情報に関する秘密は守らねばならないこと
○ 集められた情報は,原則として,本来の目的である統計の作成以外に使用してはならないこと
○ 集められた情報は,適正に管理しなければならないこと
また,統計法では,国が行う統計調査について,その取扱いの違いから「基幹統計調査」と「一般統計調査」に区分しています。
(1)基幹統計調査
特に重要な統計(基幹統計)を作成するために行われる統計調査のことで,その実施に当たっては,事前に総務大臣の承認が必要です。
また,統計法によって,調査対象者に報告義務が課せられており,報告を拒否したり,うその報告をした場合には,罰則が科せられることになっています。
国勢調査,経済センサス,農林業センサス,工業統計調査など,国民に広く知られた大規模な統計調査のほとんどは基幹統計調査になっています。
(2)一般統計調査
基幹統計調査以外の国の統計調査の総称で,基幹統計調査と同様,事前に総務大臣の承認が必要となりますが,基幹統計調査とは異なり,調査対象者に報告義務は課せられていません。なお,比較的大規模な統計調査を実施する都道府県・政令指定都市や日本銀行が行う統計調査についても,統計法によって,事前に総務大臣への届出が必要となるほか,集められた情報の保護に関しても同法が適用されます。
6 統計調査の組織
我が国では,各府省がそれぞれ所管する業務に必要な統計を作成することを原則としています。
しかし,各府省それぞれが統計調査を実施すると,調査が重複したり,統計の相互比較に支障が生じたりします。そこで,総務省政策統括官(統計基準担当)が各府省の統計計画の内容を審査・調整したり,統計の比較ができるよう産業分類などの各種の基準を設定したりしています。
各府省では,これらの統計調査を直接実施したり,出先機関を通じて実施したりしていますが,全国的に行う大規模な統計調査のほとんどは,都道府県を経由して行われています。
また,国勢調査をはじめ,経済センサス,農林業センサス,工業統計調査などの全数調査や,住宅・土地統計調査などの大規模な標本調査などは,更に市区町村を経由して行われています。
7 統計調査員
(1)統計調査員の役割
統計調査員は,調査対象の世帯や事業所を訪問し,調査票の記入依頼や調査票の回収・点検といった統計調査の仕事の中でも基本的で重要な部分を受け持っています。
なお,統計調査の方法としては,統計調査員が行う調査(調査員調査)のほか,調査対象者に直接調査票を郵送する方法(郵送調査)インターネットを利用した方法(オンライン調査)などがあります。
(2)統計調査員の身分
国が実施主体となる統計調査の統計調査員は,調査実施の都度任命される公務員であり,任命期間中は,国勢調査の場合は国家公務員(総務大臣の任命)として,その他の統計調査の場合は,ほとんどが地方公務員(県知事の任命)として調査に従事しています。
また,県や市町が実施主体となる統計調査の統計調査員は,地方公務員として調査に従事しています。
統計調査員は,任務期間中は,国・都道府県・市区町村に勤務する職員と同様に公務員の身分を有しますが,その業務が一時的なものであるため,非常勤の公務員とされています。
なお,職務の特殊性から,一般の公務員とは異なった取扱いがされており,例えば,営利事業の従事制限はありません。
(3)統計調査員の守秘義務
統計法では,調査対象から報告された内容や,その他調査活動を通じて知り得た秘密は保護されなければならないことが定められており,統計調査員が秘密を漏らした場合は,同法によって罰せられます。8 標本調査
(1)企画と設計
統計調査を実施するには,当然のことながら「調査の目的」を明確にする必要があります。つまり,どういう調査結果を求め,どういう統計調査を実施しようとするのか,それは既存の資料で補完できないものかなどと,企画する調査の必要性について事前に十分検討することが大切です。
その上で,1.調査対象 2.調査時期 3.調査事項 4.調査の方法などを検討し,5.集計計画 6.公表方法まであらかじめ検討して調査に当ることが調査実施者には求められます。
次に実際に「調査票の設計」を行い,調査に要する経費の積算を行った上で,全体のスケジュール表を作成することが必要です。
また,大規模な調査などの実施については,試験調査を行うことも大切なことです。
(2)標本設計
ア 統計調査の区分統計調査は,全数調査と標本調査に分かれます。(4 調査の方法を参照)
イ 標本抽出の方法
標本抽出の方法は,無作為(むさくい)抽出法と有意(ゆうい)抽出法に大別されますが,いわゆる統計調査は無作為抽出により調査されたものをいいます。
無作為抽出法 | 標本抽出を確率に基づいて行う方法 平たくいえば,なべのみそ汁の味見をするのに,よくかき混ぜてスプーンなどですくって味見しないと偏った味見になりますが,このよくかき混ぜて味見することが,無作為抽出と例えることができます。 もちろん全部飲めばみそ汁全体の味はよくわかりますが,これはいわば全数調査をしたことになります。 |
単純無作為抽出法 | どの抽出単位が抽出される確率も等しい抽出法のことで,最も基本的な抽出方法です。 |
系統抽出法 | 何らかの基準に基づいて規則的に抽出する方法です。 系統抽出法のうち最も基本的な方法が,等間隔抽出法といわれる方法で,一定の間隔ごとに標本を抽出し,所定の標本数を抽出するもので,ほかの方法より簡単で最も実用的な抽出方法です。 |
集落抽出法 | 母集団の構成単位の一部の集まりを集落といい,集落を抽出単位とする抽出方法のことです。 全国的な大規模統計調査の場合は,全国を幾つかの調査区に区分し,1調査区内の全ての調査対象を調査することがありますが,これも集落調査に相当します。 |
層化抽出法 | 母集団からいくつかの集団に分割して層(部分母集団)を作り,各層から標本を抽出することによって全標本を抽出する方法です。 分割した母集団(層)の全てから標本抽出する点で,選択した集落に含まれる調査単位のみ調査し,選択しなかった集落については一切抽出しない集落抽出法とは異なります。 |
不等確立抽出法 | 抽出単位ごとに抽出確率が異なる抽出法です。個々の抽出単位に,ある種の尺度による指標を設け,それに比例して抽出確率を決める確率比例抽出法もこの方法に含まれます。 |
二段抽出法 | 集落抽出によって抽出した標本集落の一部を抽出した後,その中から再度抽出して標本とする方法です。 |
二相抽出法 | 標本調査の精度を高めるために,調査項目に関係する既存の情報を利用して,例えば系統抽出の際の配列や層化,ウエイト付けなどの工夫をしますが,既存情報がない場合は,本来の標本調査を行う前に,こうした情報を得るために特別に調査を行うことが考えられます。 この場合本来の目的とする項目の調査を第二相の標本調査,事前の調査を第一相の標本調査といい,こうした抽出方法を二相抽出法といいます。 |
有意抽出法 | 標本抽出を恣意(しい)的に行う方法です。 これは,例えばある町の意見を,各町内会長さんに代表して各々述べてもらうとか,日本全体を調べる代わりに広島県をモデルケースで調査するようなことです。 |
統計における誤差
ア 誤差とは
測定値と真の値との差異を誤差といいます。
イ 誤差の種類
標本誤差 | 標本を確率的に抽出することを原因とする誤差のことです。 標本調査では標本誤差をさけることはできませんが,管理することはできます。 |
非標本誤差 | 標本誤差以外の誤差のことで,調査対象の把握もれ,回答の誤り,集計誤差など統計調査のあらゆる段階で発生する可能性があります。 |
9 統計分類
統計を利用する上においては,時系列としての比較,場所系列としての比較を行い,各々の数値を関連付けて理解することが大切です。
この場合,統計の作成者や作成時期が異なっていても,同じ基準の分類項目が使用されていれば,その調査結果を比較することが可能となります。
我が国では,四つの標準統計分類が作成されており,代表的な分類として,以下のものがあります。
(1)日本標準産業分類
統計調査の対象における産業の範囲を確定し,統計調査の結果を産業別にとりまとめ公表する場合に用いられます。
[産業とは]
事業所において社会的な分業として行われる財貨,サービスの生産または提供に係る全ての経済活動のことです。
[事業所とは]
経済活動の場所的単位のことで,経済活動が単一の経営主体のもとで一定の区画を占めて行われており,財貨,サ-ビスの生産または提供が,人及び設備を有して継続的に行われている場所のことです。
中分類 | 小分類 | 細分類 | |
---|---|---|---|
A 農業,林業 | 2 | 11 | 33 |
B 漁業 | 2 | 6 | 21 |
C 鉱業,採石業,砂利採取業 | 1 | 7 | 32 |
D 建設業 | 3 | 23 | 55 |
E 製造業 | 24 | 177 | 595 |
F 電気・ガス・熱供給・水道業 | 4 | 10 | 17 |
G 情報通信業 | 5 | 20 | 45 |
H 運輸業,郵便業 | 8 | 33 | 62 |
I 卸売業,小売業 | 12 | 61 | 202 |
J 金融業,保険業 | 6 | 24 | 72 |
K 不動産業,物品賃貸業 | 3 | 15 | 28 |
L 学術研究,専門・技術サービス業 | 4 | 23 | 42 |
M 宿泊業,飲食サービス業 | 3 | 17 | 29 |
N 生活関連サービス業,娯楽業 | 3 | 23 | 69 |
O 教育,学習支援業 | 2 | 16 | 35 |
P 医療,福祉 | 3 | 18 | 41 |
Q 複合サービス事業 | 2 | 6 | 10 |
R サービス業(他に分類されないもの) | 9 | 34 | 66 |
S 公務(他に分類されるものを除く) | 2 | 5 | 5 |
T 分類不能の産業 | 1 | 1 | 1 |
(計)20 | 99 | 530 | 1,460 |
(2)日本標準職業分類
個人が従事している仕事の種類を,体系的に区分したもので,各種統計調査の結果を職業別に表示する場合に用いられます。
【職業とは】
個人が継続的に行い,かつ収入を伴う仕事のことです。
大分類 | 中分類 | 小分類 |
---|---|---|
A 管理的職業従事者 | 4 | 10 |
B 専門的・技術的職業従事者 | 20 | 91 |
C 事務従事者 | 7 | 26 |
D 販売従事者 | 3 | 19 |
E サービス職業従事者 | 8 | 32 |
F 保安職業従事者 | 3 | 11 |
G 農林漁業従事者 | 3 | 12 |
H 生産工程従事者 | 11 | 69 |
I 輸送・機械運転従事者 | 5 | 22 |
J 建設・採掘従事者 | 5 | 22 |
K 運搬・清掃・包装等従事者 | 4 | 14 |
L 分類不能の職業 | 1 | 1 |
(計)12 | 74 | 329 |
10 統計データの見方,表し方
ここでは,各種統計調査の結果とりまとめられた統計データの見方,表し方について,基本的な事項を説明します。
(1)統計データについて
属地主義 | 統計データを地域に着目して把握する方法のことです。(国内総生産額など) |
属人主義 | 統計データを人に着目して把握する方法のことです。(国民総生産額など) |
ストック,フロー | 統計データは基本的タイプとして,特定の時点に対応するデータ(ストック)と,特定の期間に対応するデータ(フロー)とがあります。 |
暦年,年度 | 統計データは,一般的には暦年(1月1日から12月31日まで)で把握する方法と,年度(4月1日から3月31日まで)で把握する方法に分かれます。 |
(2)定義の検討
データを利用する場合に,時勢の変化によって定義や調査方法が変更されていないか,利用目的に合致した定義であるかどうかよく調べることが必要です。
表題 | 統計表の内容を表す目録となるものです。 |
頭注,脚注 | 統計表の個々の数値に対する補足説明のことで,表の上部に記載されるものが頭注,下部に記載されるものが脚注です。 |
表題頭 | 基本的には表側の事項を説明するものです。 |
表頭 | 数字の意味付けを説明するもので表体の頭にくるものです。 |
表側 | 数字の意味付けを説明するもので表体の側面にくるものです。 |
表体 | 表の本体部分で本欄ともいわれるものです。 |
こま(セル) | 個々の数値を記載する部分です。 |
棒グラフ | 対比しようとする集団一つひとつに対応する一定の幅の棒をグラフ上に並べ,その長短・高低によって,数値の大小を対比できるもので,最も基本的なグラフです。 |
帯グラフ | 一本の柱を構成比に応じて区分したグラフで,全体に対する内訳区分の大きさや差を示すのに適しています。 |
円グラフ | 円の中心角360度を各区分の構成比に応じて分割して作成されるグラフで構成比の大小を比較するのに便利です。 |
点グラフ | 2種類の指標値を縦軸と横軸に対応させて,グラフ上の位置として示して,各データの分布を表現するグラフです。 |
線グラフ | 2種類以上の集団区分に対応する線をグラフ上に描き,データの推移を表現するグラフです。 |
統計地図 | 地図上で区切られた地域区分ごとに,数値に対応して塗り分けて,比較する地図のことです。 |
(3)集団の相互比較について
集団の相互比較を行う場合,単純に数量を比較するのではなく,面積1平方キロメートル当たりの人口,人口一人当たりの県民所得などのように相対比で比較した方が適切な場合もあります。
<人口比,面積比の使い分け>
一般的には,人口比にすると地方が相対的に高くなり,面積比にすると都市部が相対的に高くなります。
<妥当な区分で集団を区切る>
相対比する場合,市町村単位とするか,都道府県単位とするか内容に応じて区切る必要があります。
(例えば,保育所設置数は市町村単位,大学設置数は都道府県単位で区切って比較するなど)
<対比可能な範囲で対比する>
全国の市町村を対象に自然公園の面積を比較するなど,そもそも比較すること自体無意味と思われる比較は避け,例えば都市部を対象に都市公園の相対比を比較するなど,対比可能な比較方法を検討する必要があります。
集団の特徴把握について
<分布による把握>
統計データを大きさの順に並べ替え,階級区分を設け,各区分に属する単位を数えて,その結果を表にしたものを分布表といい,図示したものを分布図といいます。
最類値 | 度数分布のピ-クの位置に対応する値です。モードともいわれます。 |
中央値 | 集団に属する全ての単位の値を,大きさの順に並べたとき中央にあたるものです。メジアンともいわれます。 |
平均値 | 集団に属する全ての単位の値を合計し,単位数で割ったものです。 |
標準偏差 | 個々のデータと平均値の差を偏差といい,その一種の平均値として定義されるものであり,集団のバラツキの度合いを表す指標です |
指数 | 基準となる時点での値との比率のことで,消費者物価指数などがあります。 |
変化率 | 一定の期間中に推移した量の大きさをあらわす指標です。 (期間中の変化率=期末の値 ![]() |
前年比 | 前年を前期とする変化率です。 |
前期比 | 主に前四半期を前期とする変化率ですが,趨勢的変化と季節的要因による変化が混在しています。 |
前月比 | 前月を前期とする変化率です。 直近の変更を示すものですが,季節ごとの変化と時勢による変化が重なっているため,変化の意味を説明しにくい場合があります。 |
前年同月比 | 前年同月を前期とする変化率です。 前年同月比は,1年前との時勢による変化は読み取れますが,1年もの時間差があるため,直近の変化とは言い難い面があります。 |
季節調整値 | 季節ごとの変化を除去した値であり,直近の変化を求めることが要求される統計は,このような処置を施して公表されます。 |
寄与率 | 全体の変化に対して内訳部分の変化がどの程度貢献したかを示す指標です。(寄与率=内訳部分での変化÷全体の変化) |
11 各種統計について
(1)人口統計
人口とは,個々の人間を単位とした集団のことであり,人口に係る現象の実態把握や分析のために用いられる統計を人口統計といい,各種統計の中で最も基本的な統計です。静態統計 | ある時点の切断面を捉える統計です。(国勢調査など) |
動態統計 | ある期間を限定し,その期間に起こった変化をその都度観察して得られた統計です。(1年間の出生数等) |
(2)現時点の人口推計(総務省統計局の場合)
全国の人口推計は,国勢調査の結果を基に毎月まとめられる次の動態統計の結果を加えて推計されます。
自然動態 | 人口動態統計調査(出生数-死亡数) |
社会動態 | 住民基本台帳(転入者数-転出者数)+出入国管理統計 (入国者数-出国者数) |
(3)経済指標
経済活動の水準,景気の動向を把握し,適切な経済運営・景気対策などを行うための指標です。
生産 | 鉱工業生産指数など |
設備投資 | 機械受注統計,建築着工統計,法人企業統計など |
家計消費 | 家計調査,商業販売統計など |
物価指数 | 企業物価指数,消費者物価指数など |
労働力市場 | 労働力調査,有効求人倍率など |
金融財政 | マネーサプライなど |
国際収支 | 貿易統計,国際収支表など |
景気動向 | 景気動向指数,主要企業短期経済観測調査など |
(4)社会指標
私たちの「暮らしの指標」を総称して,社会指標または福祉指標と呼ばれています。
この社会指標については,国際連合が「社会人口統計体系(SSDS)」として,ガイドラインを示しており,我が国においてもSSDSを基にして,国民生活全般の実態を示す統計データを収集・加工し,体系的に作成することにより,行政の各種施策や地域分析の基礎資料として提供しています。
(5)県民経済計算
県経済の規模・経済構造・所得水準などを明らかにする総合的な経済指標です。多くの一次統計や関連の統計資料をもとに各都道府県において作成され,毎年11月ごろに公表されています。
(6)広島県県民経済計算四半期速報
広島県県民経済計算の支出面について,四半期ごとに推計するもので,国の四半期別GDP速報に相当するものです。
(7)産業関連表
財・サービスの生産に伴うフローを対象に,生産と消費・投資の活動に伴う財・サービスの流れを経済を構成する多数の部門間の相互関連として把握するもので,経済の総体的構造を掌握できるものです。12 統計の日(毎年10月18日)
「統計の日」は,統計の重要性に対する国民の関心と理解を深め,統計調査に対する国民の一層の協力を得るため,昭和48年7月3日の閣議了解によって定められたものです。「統計の日」は,毎年10月18日とされていますが,これはわが国最初の近代的生産統計といわれている「府県物産表」に関する太政官布告(だじょうかんふこく)が公布された明治3年9月24日を太陽暦に直すと10月18日になることにちなんだものです。