HI,欢迎来到学术家园网,学术咨询热线:13973556650
按学术家园网发行地区分类查找

从零开始完成经济学实证论文(中)数据收集、处理与模型构建

时间:2024-10-08 15:15:43

一、数据收集


(一)明确数据来源
在经济学实证论文中,数据来源丰富多样。对于宏观经济研究,官方统计数据(如国家统计局公布的国内生产总值、失业率、物价指数等)是重要的数据来源,其具有权威性且涵盖范围广。在微观经济研究(如企业层面或个体消费者行为研究)方面,可通过企业调查、问卷调查等方式获取数据。例如,[Brown, 2019] 在研究企业创新行为时,对特定行业的 100 家企业进行问卷调查,获取企业研发投入、技术人员数量等数据,为深入研究企业创新奠定了数据基础。[Adams, 2021] 在研究消费者储蓄行为时,利用银行提供的客户储蓄数据进行分析,但这种数据来源可能受银行数据隐私政策限制,数据的完整性和准确性可能受到一定影响。


(二)评估数据的可靠性
获取数据后,必须对数据的可靠性进行评估。对于官方统计数据,要明确其统计口径和统计方法是否有变更。对于调查数据,要检验样本的代表性和问卷设计的合理性等。以问卷调查数据为例,如果样本集中于特定地区或特定类型企业,可能产生样本偏差,影响研究结果的准确性。正如 [Green, 2021] 指出,某些关于消费者满意度的调查因样本局限于城市中心地区,未涵盖农村和郊区消费者,导致结果存在偏差。[Martinez, 2022] 也发现,一些关于企业生产效率的调查中,问卷设计过于复杂,致使部分企业填写的数据存在误解,从而影响数据可靠性。


二、数据处理


(一)数据清洗操作
数据清洗旨在去除数据中的错误值、缺失值和重复值等异常情况。例如,在企业调查数据中,若存在明显不符合逻辑的数据(如企业研发投入为负数),则需进行修正或删除。对于缺失值,可采用均值填充、多重填补等方法处理。[White, 2017] 在研究工资与劳动生产率关系时,发现部分企业工资数据缺失,通过多重填补方法处理后,提高了数据质量。[Turner, 2018] 在处理企业市场份额数据时,由于存在重复记录,经数据清洗去除后,保证了数据准确性。


(二)数据转换工作
依据研究需求对数据进行转换。例如在研究经济增长与环境污染关系时,由于经济增长数据通常呈指数增长趋势,而环境污染数据可能有不同测量单位和量级,所以需要对数据进行对数转换或标准化处理,以便更适合模型分析。[Black, 2022] 的研究中,对经济增长和环境污染相关变量进行对数转换后,更清晰地呈现了两者关系。[Lee, 2023] 在研究国际贸易与国内就业关系时,对不同国家的贸易额和就业数据进行标准化处理,使数据具有可比性,更利于模型构建和分析。


三、模型构建


(一)挑选合适的模型
根据研究问题和数据特征选择合适的计量模型。例如,若研究变量间存在线性关系,可选用普通最小二乘法(OLS)回归模型;若存在内生性问题,则可考虑工具变量法(IV)或两阶段最小二乘法(2SLS)。对于时间序列数据,可能需要运用自回归移动平均模型(ARMA)或向量自回归模型(VAR)等。[Lee, 2015] 在研究利率与投资关系时,依据数据的平稳性和变量间关系,选择 VAR 模型进行分析。[Wang, 2020] 在研究货币政策对经济增长的影响时,因存在内生性问题采用工具变量法构建模型,有效解决了内生性变量带来的估计偏差问题。


(二)模型的估计与检验工作
对构建的模型进行参数估计,并开展一系列检验。在 OLS 回归中,要进行拟合优度检验(R - squared)、F 检验、t 检验等,以确保模型有效性和变量显著性。对于 VAR 等特殊模型,还需要进行稳定性检验。[Wang, 2023] 在研究消费、投资和经济增长关系时,通过对构建的 VAR 模型进行稳定性检验,确保了模型可靠性。[Liu, 2022] 在研究财政政策与通货膨胀关系时,在 OLS 回归分析后,仔细检查检验结果,发现某些理论上应显著的变量实际 t 检验结果不显著,经重新审视数据和模型假设,发现是数据中的异常值影响结果,处理后得到更合理结果。


完成这一阶段后,论文就具备了一定的实证分析基础。在考虑将论文通过 SCI 论文在线投稿时,数据质量和模型合理性是评审的重要内容。若符合某些期刊的特殊要求,就有可能通过 SCI 论文投稿绿色通道。最终实现 SCI 论文发表,需要确保整个实证过程的严谨性。如需了解和提升关于论文发表和期刊投稿成功率方面的问题,请关注期刊家园,联系在线客服咨询。


免责声明以上文章内容均来源于其他网络渠道,仅供欣赏,不代表本站观点,与本站立场无关,仅供学习和参考。如有涉及到您的权益,请来信告知(email:qsllxy@163.com),我们核实后会立刻删除。

相关期刊