1. 简单百科
  2. 面板数据

面板数据

面板数据,也称为混合数据(pool 数据),是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。面板数据是一批在不同时间、不同统计单位或地点的具有相同统计指标的数据列,简单地说面板数据就是既有时间序列又有截面成员(截面单位)的数据组合。例如2000~2018年全国各省、自治区、直辖市高级人民法院和中级人民法院管辖第一审民商事案件标准(自治区、直辖市)的地区生产总值就是面板数据。作为面板数据的地区生产总值可以用一个二维表来表示。

面板数据数量经济学模型是数量经济学理论方法的重要发展之一,已经形成了与截面数据模型相对应的完整的模型体系,具有很好的应用价值。

概念

其有时间序列和截面两个维度,当这类数据按两个维度排列时,是排在一个平面上,与只有一个维度的数据排在一条线上有着明显的不同,整个表格像是一个面板,所以把panel 数据译作“面板数据”。但是,如果从其内在含义上讲,把panel data译为“时间序列—截面数据”更能揭示这类数据的本质上的特点。也有译作“平行数据”或“TS-CS数据(时间 Series - Cross Section)”。

举例

1如

城市名:北京、上海市重庆市天津市的GDP分别为10、11、9、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不同就是截面数据。

如:2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不同就是时间序列。

2如

2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为:

北京市分别为8、9、10、11、12;

上海市分别为9、10、11、12、13;

天津市分别为5、6、7、8、9;

重庆市分别为7、8、9、10、11(单位亿元)。

这就是面板数据。

面板数据是按照英文的直译,也有人将Panel 数据翻译成综列数据、平行数据等。由于国内没有统一的说法,因此直接使用Panel data这种英文说法应该更准确一些。说面板数据也是比较通用的,但是面板数据并不能从名称上反映出该种数据的实际意义,故很多研究者不愿使用。

研究方法

面板数据分析方法是最近几十年来发展起来的新的统计方法,面板数据可以克服时间序列分析受多重共线性的困扰,能够提供更多的信息、更多的变化、更少共线性、更多的自由度和更高的估计效率,而面板数据的单位根检验和协整分析是当前最前沿的领域之一。

面板数据的单位根检验的方法主要有 Levin,Lin and CHU(2002)提出的LLC检验方法。Im,Pesearn,Shin(2003)提出的IPS检验 , Maddala和Wu(1999),Choi(2001)提出的ADF和PP检验等。面板数据的协整检验的方法主要有Pedroni (1999,2004)和Kao(1999)提出的检验方法,这两种检验方法的原假设均为不存在协整关系,从面板数据中得到残差统计量进行检验。Luciano(2003)中运用Monte Carlo模拟对协整检验的几种方法进行比较,说明在T较小(大)时,Kao检验比Pedroni检验更高(低)的功效。具体面板数据单位根检验和协整检验的方法见参考文献[5-10]。

实证分析

1.指标选取和数据来源

经济增长:本文使用地区生产总值,以1999年为基期,根据各地区生产总值指数折算成实际,单位:亿元。

能源消费:考虑到近年来我国能源消费总量中,煤炭和石油供需存在着明显低估,而电力消费数据相当准确。因此使用电力消费更能准确反映能源消费与经济增长之间的内在联系(林伯强,2003)。所以本文使用各地区电力消费量 作为能源消费量,单位:亿千瓦小时。

环境污染:污染物以气休、液体、固体形态存在,本文选取工业废水排放量作为环境污染的量化指标,单位:万吨。

本文采用1999-2006年全国30个省(直辖市,自治区)的地区生产总值、电力消费量 和工业废水排放量 的数据构建面板数据集。30个省(直辖市,自治区)包括北京、天津市河北省辽宁省上海市江苏省浙江省福建省山东省广东省山西省内蒙古自治区吉林省黑龙江省、安徽、江西省河南省、湖北、湖南省海南省广西壮族自治区重庆市四川省贵州省云南省陕西省西藏自治区、甘肃、青海、宁夏、新疆,由于西藏数据不全故不包括在内。数据来源于《中国统计年鉴2000-2007》。为了消除变量间可能存在的异方差,本文先对地区生产总值、地区电力消费量和工业废水排放量进行自然对数变换。

参考资料