瑞士各州身高差异的分析
数据来源
我们从瑞士联邦体育局(Bundesamt für Sport, BASPO)的网站上获取到了瑞士2016—2020年兵役体质测试(Fitnesstest der Armee, FTA)的数据。
样本量与代表性
2016年拥有完整体质测试数据的男性应征者为32329人,占男性总征兵数81%,2017年30638人,占83%,2018年26005人,占83%,2019年25725人,占86.3%,2020年20240人,占88.9%,列入下表。网站上文档还提供了瑞士各州的样本量和占总征兵数的比例。2016—2020年各州体质测试比例均在70%以上,保证了较好的代表性。
| 年份 | 样本量 | 比例 |
|---|---|---|
| 2016 | 32329 | 81% |
| 2017 | 30638 | 83% |
| 2018 | 26005 | 83% |
| 2019 | 25725 | 86.3% |
| 2020 | 20240 | 88.9% |
身体形态
瑞士2016—2020年的平均身高和体重如下。
| 年份 | 样本量 | 平均身高(cm) | 平均体重(kg) |
|---|---|---|---|
| 2016 | 32329 | 178.4 | 74.3 |
| 2017 | 30638 | 178.4 | 74.2 |
| 2018 | 26005 | 178.5 | 74.2 |
| 2019 | 25725 | 178.5 | 74.7 |
| 2020 | 20240 | 178.4 | 74.87 |
我们以州别对2016—2020年的身高、体重数据使用各年份样本量进行加权平均,得到如下的结果。
| 州 | 州代码 | 样本量 | 平均身高(cm) | 平均体重(kg) |
|---|---|---|---|---|
| 阿尔高 | AG | 10640 | 178.6 | 75.1 |
| 内阿彭策尔 | AI | 399 | 177.2 | 71.2 |
| 外阿彭策尔 | AR | 1114 | 178.5 | 72.9 |
| 伯尔尼 | BE | 16380 | 178.6 | 75.0 |
| 巴塞尔乡村 | BL | 4962 | 178.8 | 75.5 |
| 巴塞尔城市 | BS | 2039 | 179.1 | 77.0 |
| 弗里堡 | FR | 5558 | 178.3 | 74.3 |
| 日内瓦 | GE | 7370 | 177.8 | 73.8 |
| 格拉鲁斯 | GL | 643 | 178.0 | 74.0 |
| 格劳宾登 | GR | 3318 | 178.9 | 73.4 |
| 汝拉 | JU | 1416 | 177.6 | 73.1 |
| 卢塞恩 | LU | 8009 | 178.6 | 74.5 |
| 纳沙泰尔 | NE | 2700 | 177.8 | 73.1 |
| 下瓦尔登 | NW | 799 | 178.8 | 73.8 |
| 上瓦尔登 | OW | 718 | 178.5 | 73.7 |
| 圣加仑 | SG | 8888 | 178.5 | 74.2 |
| 沙夫豪森 | SH | 1228 | 178.9 | 75.9 |
| 索洛图恩 | SO | 4588 | 178.3 | 75.0 |
| 施维茨 | SZ | 2636 | 179.3 | 75.3 |
| 图尔高 | TG | 5120 | 178.4 | 74.6 |
| 提契诺 | TI | 5712 | 177.5 | 73.4 |
| 乌里 | UR | 828 | 178.0 | 72.6 |
| 沃 | VD | 10709 | 178.3 | 73.7 |
| 瓦莱 | VS | 5100 | 178.1 | 73.0 |
| 楚格 | ZG | 1916 | 179.2 | 74.2 |
| 苏黎世 | ZH | 22147 | 178.6 | 74.8 |
身高与语言的关系
我们从瑞士联邦统计局(Bundesamt für Statistik, BFS)的网站上获取了2019年瑞士各州的主要语言分布数据,选取并计算了永久居留人口中15—24岁年龄层说各种语言的人口比例,按照下面的统计模型进行了回归分析。
\[h_c = k_l p_{c, l} + b_l + \varepsilon_c\]
我们取\(l = \text{德语、法语、意大利语}\),分三次进行统计回归。变量\(c\)为瑞士的26个州,\(h_c\)为各州2016—2020年的男性平均身高,而\(\varepsilon_c\)为统计模型中各州的残差,\(p_{c, l}\)为\(c\)州15—24岁人群中\(l\)作为主要语言的比例,\(k_l, b_l\)为该线性模型中身高与语言比例的相关系数和截距。
我们使用各州的样本量进行加权回归,结果如下。我们发现瑞士各州平均身高与该州的德语人口比例呈显著的正相关关系,而与法语、意大利语人口比例呈显著的负相关关系。
| 分析的语言\(l\) | 截距\(b_l\) | 相关系数\(k_l\) | |||||||
|---|---|---|---|---|---|---|---|---|---|
| 系数 | 标准误差 | \(\text{P}_{2.5}\) | \(\text{P}_{97.5}\) | 系数 | 标准误差 | \(\text{P}_{2.5}\) | \(\text{P}_{97.5}\) | \(t\)检验的\(p\)值 | |
| 德语 | 177.9457 | 0.107 | 177.725 | 178.166 | 0.7575 | 0.138 | 0.473 | 1.042 | 0.000* |
| 法语 | 178.5922 | 0.079 | 178.430 | 178.754 | -0.5758 | 0.183 | -0.953 | -0.199 | 0.004* |
| 意大利语 | 178.5276 | 0.072 | 178.379 | 178.677 | -1.0231 | 0.360 | -1.767 | -0.279 | 0.009* |
基于以上结论,我们建立如下的新统计模型
\[h_c = k^\prime_{\text{法语}} p_{c, \text{法语}} + k^\prime_{\text{意大利语}} p_{c, \text{意大利语}} + b^\prime + \varepsilon^\prime_c\]
以非法语、非意大利语人口为基准(绝大部分为德语人口),进行二元统计回归,得到的结果如下。
| 变量 | 系数 | 标准误差 | \(\text{P}_{2.5}\) | \(\text{P}_{97.5}\) | \(t\)检验的\(p\)值 |
|---|---|---|---|---|---|
| \(k^\prime_\text{法语}\) | -0.6679 | 0.135 | -0.947 | -0.388 | 0.000* |
| \(k^\prime_\text{意大利语}\) | -1.2100 | 0.259 | -1.746 | -0.674 | 0.000* |
| \(b^\prime\) | 178.6972 | 0.062 | 178.569 | 178.825 | - |
小结
- 瑞士非法语、非意大利语的男性人口平均身高为178.70 ± 0.06 cm(基准值)
- 法语人口的平均身高低于基准值0.66 ± 0.13 cm
- 意大利语人口的平均身高低于基准值1.21 ± 0.26 cm。
身高与社会经济因素的关系
我们从瑞士联邦统计局的网站是获取了瑞士各州的人均GDP和最高学历分布数据。我们计算下面的变量:
- 2018年各州的人均GDP的对数(以10为底数,以现价瑞士法郎计价)
- 2016年各州最高学历为第三级别(高等学校和高等职业教育)的人口比例
并对各州身高按照各州身高的样本量加权,进行线性回归分析,得到的结果如下。
| 变量 | 线性相关系数 | 标准误差 | \(\text{P}_{2.5}\) | \(\text{P}_{97.5}\) | \(t\)检验的\(p\)值 |
|---|---|---|---|---|---|
| \(\log_{10}\)人均GDP | 0.4317 | 0.759 | -0.575 | -1.136 | 0.575 |
| 高等教育人口比例 | 0.6461 | 1.372 | -2.186 | 3.478 | 0.642 |
我们发现各州平均身高与该州的人均GDP和高等教育人口比例均有正相关关系,但是这些相关关系并不显著。
巴塞尔城乡的身高差异
1833年,瑞士原巴塞尔州分裂成巴塞尔城市州和巴塞尔乡村州。我们比较这两个州兵役体质测试的男性身高,发现城市州高于乡村州。我们按照男性身高标准差为6.5 cm估算平均身高的误差,发现两州身高的差异边缘显著(p = 0.03)。
| 州 | 样本量 | 平均身高(cm) | 标准误差(cm) | 高等教育比例 | 人均GDP(瑞士法郎) |
|---|---|---|---|---|---|
| 巴塞尔乡村 | 4962 | 178.84 | 0.09 | 33% | 72639 |
| 巴塞尔城市 | 2039 | 179.13 | 0.14 | 44% | 197491 |
结论
瑞士各州的身高与该州的语言比例有着显著的关系:德语人口平均身高更高、法语人口次之、意大利语人口再次之,但与该州的人均GDP和高等教育人口比例仅存在微弱的正相关关系。