本文根据刘老师的讲座视频整理而成,文稿未经专家本人审阅。

作者简介:

刘老师,华南师范大学体育科学学院教授/博士研究生导师,“爱思唯尔(Elsevier)中国高被引学者(体育学2020/2021)”,中国足球协会超级联赛技术调研组成员,广东省和华南师范大学高层次人才计划入选者。博士毕业于西班牙马德里理工大学身体锻炼与体育科学学院,主要研究方向为足球比赛表现与训练监控、运动表现分析。近年来,公开发表国际期刊论文30余篇、中文核心期刊论文20余篇,论文被引用1300余次(谷歌学术数据)。主持国家社会科学基金、广东省科技厅/教育厅课题、广州市社会科学基金等国家/省/市厅级课题多项。目前担任《Journal of Sports Sciences》等20余份国际期刊,《中国体育科技》等多份国内期刊特邀审稿人、评委。曾任波兰足球乙级联赛、西班牙足球丙级联赛俱乐部助理教练、表现分析师。

本节,与大家分享数据统计中的一些基础知识,比如“数据统计到底是怎么统计?”“统计之后能做什么?”“能反映什么东西?”“数据统计具体要怎么去操作”等一系列问题。这就涉及数据统计的目的、功能以及它们的实现方法。

一、数据统计的目的

定量研究和数据统计是结合的。数据统计是为了实现定量研究的目的,定量研究通过数据统计去解读这个数据背后的现象、意义、价值,这是统计的价值所在。它的出发点,就是出于我的导师霍普金斯经常讲的一句话:“人们讨厌数字”(People hate numbers)。但我们讨厌的不是具体的某个数字,而是大量的数字。

邵老师在“体育学论文选题的‘黑箱’”这场讲座中提到,现在的研究要尽量做定量,尽量用数据去说话。即使社会科学也是要尽量用数据去说话。那么,现在的问题就在于“用数据去说话”。因为,大家是讨厌数据的,我们讨厌杂乱无章的、乱七八糟的、大量繁琐的数据。我们喜欢的是什么样的数据呢?我们喜欢的是简单的、明确的数据。所以,运用统计工具的终极目标,就是从杂乱无章的、繁杂的、庞大的数据当中,去提取出能体现出价值和意义的简单数据。

如果你可以用一个数字说明一大堆数据的特征,那么就说明你的水平越高。所以,我们写论文、做定量研究时,论文里的数据不是越多越好。你用的数据越少,但同时又能够把事情说清楚,那么你就是成功的。相反,如果你要用大量的数据才能把一件事情说清楚,那么这就证明你是失败的,因为大家都讨厌数据。

二、数据统计的两大功能

数据统计有两大作用或者两大功能,第一个是“概括特征”(Summarizing Data),第二个则是“推断总体”(Generalizing to a Population)。

(一)概括特征

所谓“概括特征”就是用简单的数字或者用少量的数字,去概括大量数据的特征。这个就是统计要实现的第一个功能或者价值。

(二)推断总体

所谓“推断总体”就是用少量样本的数据,去推断总体的数据。我们取得的数据,用统计学术语来说就是测量值,也就是你的测量值的特征。你可以用简单的数据把它概括出来。但是,你概括出来的只是你测得的这些部分的数据。而我们希望得到的研究结果,是需要让它的研究价值和意义得到提升。这就需要通过已测得的数据去推断,即我们没有直接测的那些数据,它们大概会是什么样的情况。这就叫推断总体,或者有的时候也叫“推断真实值”,即用测量值推断真实值。

三、如何实现数据统计的两个功能

上面提到的数据统计的这两个“概括特征”的功能,其实可以通过两类统计学数据来实现。第一类统计学数据叫做“描述数据”或“简单数据”。第二类统计学数据叫做“效果数据”,这个我们后面还会讲到。而“推断总体”必须要用推断数据去做,之后我们还会讲到三种类型的数据分别是什么样的。我们说,统计的时候要讲到定量研究,就是这个原因。我给研究生讲课都是这样去讲的。所以,我们实际做的一个定量研究往往是什么呢?基本都是需要先圈定一个研究对象总体。研究对象总体才是你的关键,因为,你要研究的是一个群体。

邵老师的讲座里给大家讲过很多个例子,比如说,雪上、冰上项目中的空中技巧。那么,对于空中技巧这个项目而言,哪些因素能够影响它的成绩?影响空中翻滚的起跳高度,或者腾空的时间?如果你要去研究这些因素,那你就必须要选出一个研究对象总体。这个研究对象总体可能是在“广义总体”当中。所谓的广义总体,就是说,既然我们是研究空中滑雪,那么这一项目的所有运动员都可能成为你的整个总体。你不可能去研究所有的运动员,但你可以从这所有的运动员当中,确定一个你的目标对象。你的对象是什么呢?你的研究目标就是:对争夺奥运奖牌的,或者至少是全国最优秀的这一群运动员,将他们作为一个整体,并定义为“广义总体”,从中圈出一部分作为研究对象总体。然而,即使是到这一步,还是不够的。因为,你不可能对所有有资格冲击奥运奖牌的运动员进行研究。所以,你只能进行抽样。

也就是说,在这研究对象总体中抽取一部分样本,对这一部分样本进行研究。通过对这一部分样本的数据测量,如测量他们的分数,或测量在不同的气温、气压条件下,他们的动作有没有什么不一样,等等诸如此类。那么,对这个样本在各种环境下的研究,叫做“运动表现”,这是我的研究领域。对它进行分析,同时去对比环境对这一类运动员是怎么造成影响的。这就叫从样本数据出发去测量,测得之后,再去进行推断总体。

请尊重原创,未经许可,拒绝转载

GET NEWSLETTER

Advertisement

Featured News