论文的数据分析部分怎么写

作者:PaperPP  日期:2020年04月24日

论文的分析部分离不开三方面的构成要素:第一是理论基础。经济学、管理学等学科的研究多是建立在特定的分析框架和理论基础上。前文已经探讨了如何提出理论问题并构建分析框架和模型。第二是数据(或案例)。数据是论点的支撑,数据是科学分析的原材料。甚至可以说,研究因为有了良好的数据支撑,研究本身就已经成功了一半。来自现实世界的经验材料是进行经济学、管理学等学科研究的先决条件,研究材料的完整性和准确性也直接关系到研究结果的效度与信度。第三是方法。狭义的方法是指如何处理数据的方法。在经济学、管理学等学科中常常指统计、计量、模拟、仿真等方法。广义的方法泛指以实践现象为研究起点的实证分析方法或以理论观点为研究起点的规范分析方法。

一、、如何准备数据?

针对研究的目标问题,研究者在建立分析框架、选择了理论基础和模型之后,下一步需要考虑的是如何收集所需的数据支撑。我们可以将支撑研究的数据分为数据型资料和案例型资料两类。

1、数据资料的获取

利用现成数据(二手数据)

现有的可供学术研究使用的数据库主要分为调查数据(Survey Data)和政府数据(Administration Data)。调查数据一般是高校、科研机构等基于特定目的开展调研所获得的数据资料。目前在经济学、管理学等相关学科中有一些常用的数据库资源(表1)。这类数据源多是微观层面的数据,比如个体、家庭、企业等主体的相关数据,具有大样本、多变量、长时段、严格的调查规程等特点。此类数据库能够帮助研究人员降低研究成本、提高研究效率、开拓研究思路等。

表1 部分常用调查数据库

政府数据也是研究者获取实证数据的重要来源,如国家统计局的各类年鉴、人口或农业普查数据,此类数据以宏观数据为主。目前,我们可以非常便捷地从网络上获取此类数据。比较典型的数据源是CNKI中国经济社会大数据研究平台,该平台覆盖了我国所有国家级、省级及其主要地市级统计年鉴和各类部门统计资料,能够实现年鉴导航、报表在线生成、指标可视化、数据挖掘分析等功能。此外,国研网、搜数网等网站也提供宏观数据的在线检索与展示。

自建数据(一手数据)

研究者也可以根据研究目的收集一手数据。主要包括通过调查问卷收集、或者通过网络爬虫等软件收集等。

通过调查问卷获取实证研究所需数据是常见的数据获取方法。该方法最为重要的是保证数据的质量。需要从指标设计、抽样方法、样本容量、调查方法、问卷设计、组织计划与质量控制等方面增强调查数据的有效性和可信度。

运用网络爬虫技术对互联网的数据进行筛选和整理是建立研究数据集合的另一个重要方法。互联网数据涉及的样本量大,散落在不同的网页上且不断更新,此时可以通过爬虫技术来获取这些数据并整理成为研究所用的数据集合。

2、案例资料的获取

案例资料是案例研究方法所需要获取的支撑资料,往往不以数据的形式存在,而是以文本的方式记载了研究目标所关注的一个或一系列的事件过程。在事件过程中包含着支撑这类研究方法的所有信息。

收集案例资料一般包括调研方案设计、预调研和正式调研等步骤。调研方案设计是联结研究问题和现实材料之间的逻辑纽带,通常包括问题的提出、理论假设、提出分析框架、界定分析单位、制定调研方案等环节,并且最终形成一套能够指导案例调研的案例筛选与证据收集标准。在案例筛选方面,案例研究一般根据理论基础和分析路径对潜在案例进行筛选,不仅要兼具典型性和多样性原则,也要适当考虑案例调研的便利性。正式研究前可以实施预调研来确定调研方案的可行性,预调研的案例选择应当以便利性和典型性为标准,适当降低研究的整体成本。

为了提高研究材料的信度与效度,在案例资料收集阶段尤其要注意充分利用多样化的证据源,收集同一个问题下的不同类型的支撑材料,以避免调研中由于信息不对称等原因导致的主客观偏差,例如被受访者误导、忽视政策内容与实际执行的偏差等。研究者应当掌握案例调研中常见的几种证据来源(见表2),并根据研究需要和数据可得性决定收集哪些类型材料,以实现不同来源证据之间的相互验证。

表2 案例调研中的五种证据来源

3、数据的呈现

在充分收集研究所需的数据后,研究者需要在论文中清楚地介绍数据来源以及是如何对原始数据进行“加工”的。论文中的这一部分被Day(1998)称为“材料”部分。一篇好的材料部分应当起到两个主要目的:一是尽可能详细地描述研究过程,提供足够多的细节,以便同行能重复研究过程。二是为读者提供足够的信息,以便判断论文的研究方法是否合理、研究结果是否有效以及是否存在理论和现实意义。

对于数据型资料,一般需要按照研究需要或目标期刊要求呈现研究所用到的数据。要交代清楚数据的来源、数据的内涵以及数据“加工”方法。在运用自行调研数据时,应当写清楚数据采集和整理的情况。样本选择原则、抽样调查技术、样本量、调研结果的效度与信度等。还可以简明扼要地将数据的统计特征呈现给读者。由于此类研究的指标数量与分类特征通常比较复杂,因此纯文字的表述难以直观传达数据的基本特征,一般采取图表等形式进行呈现。例如,图1通过表格比较清晰地展示了论文数据部分的变量定义和统计特征。

图1 数据的定义及统计特征的展示

对于案例型资料,由于案例研究的“讲故事特性”,案例材料在形式上一般可以按照事件发展顺序呈现,形成包含开头、过程和结局的闭环。由于案例“故事”所包含的材料通常是与分析过程密切结合的,因此不同于数据型材料,案例材料的呈现大多结合分析框架和研究方法的需要而分散在分析的过程中。

二、如何呈现数据分析结果?

1、尽可能使用图表

如果可以用图或表来呈现数据的话就用图或表,避免用文字对结果进行描述。确保每个图提供的信息都是清晰和真实可信的,图片表达简明扼要。图表使用的字体,标签和缩写都必须是一致的。数据少的用表好一些,数据多则使用图。趋势的比较用图比表格更适合一些。每个图形跟表格都应该有一个简短的说明,即使读者不看文章的内容,仅仅通过图表及其标注,也可以得到一些有用的信息。

2、不要重复呈现数据

不要在文中重复描述图表中列出的数据。研究结果只需要提及图表并对其内容给出一个尽可能简短的描述,而不是具体陈述它们的内容。另外,只选择与论文整体结论相关的信息。可以把不太重要的图表放到附录。但是,不要避讳添加负面的结果。

3、按一定顺序组织

可以按照方法介绍部分中描述的研究方案的顺序,或者从最重要到最不重要的顺序来组织这个部分的撰写。

4、避免在结果部分就开始解释

避免包含任何对方法的重复或对结果的解释。把解释留到论文的讨论部分——讨论部分的写作要达到展现数据(图表)和讲述(在文中描述结果)之间的良好平衡。

三、如何讨论(Discussion)?

科学研究通常需要对研究结果进行讨论。在讨论部分,论文作者基于本文研究背景和研究结果,着重阐述整篇论文中有创造性的内容和独到的见解,并归纳其内在联系,然后总结几个观点或回应论文的论点。好的讨论是对数据分析结果的“升华”,能够给读者以深刻的启发和引导。

1、讨论的主要作用

Day(1998)认为讨论部分有两点主要作用,并且进一步解释了撰写讨论部分的基本要求。

揭示事实现象之间的关系

在研究结果部分中,研究者应当客观明晰地报告本研究取得哪些结果。进一步地,研究者在讨论部分要基于研究结果以及其他限制性条件,得出一系列的研究推断,以揭示研究结果所能反映的科学真理。如果用“三段论”的形式进行类比,科学论文的“材料与方法”是前提条件,“研究结果”可视为论据,而“讨论”就是通过“论证”得到最终“论点”的过程。如果不进行“讨论”,就难以提出研究结论。

阐释论文的重要意义

读者可能会问“这些科研结果有什么意义?”。讨论部分的另一个重要作用就是在一篇论文的结尾深入讨论研究结果(以及整个研究)背后潜藏的学术意义、实践价值或应用前景。正如Anderson和Thistle(1947)对讨论部分的看法:“同好的音乐一样,好的作品也要有一个适时的高潮。许多论文没能达到预期的效果,就是因为结尾都绵软苍白,而没有做到铿锵有力。”

2、讨论部分的经典结构(倒漏斗型)

初学者应当如何着手完成一篇完整的讨论部分呢?“倒漏斗型”的结构或许能够为我们提供一些启示。

1)首先对研究结果进行简短的陈述。

2)描述本研究结果与现有文献的关系,包括:研究结果是否与现有文献相一致?结果如何填补现有文献的空缺?

3)阐明本研究结果与相关理论的关系。

4)描述和讨论研究所存在的不足或局限性。目的是预测审稿人或编辑可能提出什么问题并在他们提出之前给予回答。

5)解释研究结果可能的实际应用,即存在的意义和应用价值。

6)最后根据研究结果,提出有关未来研究的建议。

我们可以在很多文献中发现按照“倒漏斗型”组织讨论部分的实例。例如,下面的示例就展现了讨论部分的核心要素。

这几句话对整篇文章的研究思路和研究意义作了简要的概述。

本文通过估计H市土地非农化政府治理和市场治理两种治理结构的交易费用函数……,为交易费用经济学在公共领域的拓展提供了实证,……,为中国土地非农化寻找合适的治理结构提供了交易费用经济学视角的参考。

这几句话与“盲目市场论”的观点进行对话,提出了与现有文献观点的不一致,并得到本文的关键结论,即层级制治理结构在土地非农化治理中具有重要意义,填补现有文献的空缺。

现有一些“盲目市场论”的观点认为,……,才能提高土地非农化的效率。诚然,通过市场来提高资源的利用效率,符合新古典经济学的理论,因为市场能够“自动地”、“高效地”配置资源。然而,新古典经济学忽视了市场制本身也是一种治理结构,忽视了市场制也是有成本的,……,离开特定的交易的范围,市场配置产生的交易费用可能很大。……本文的研究表明,对于中国的土地非农化,单纯的市场并不是适宜的治理结构……其他被新古典经济学称为外部性的部分,则需要通过层级制来治理。

这几句话基于研究结果和结论提出在实际治理中的应用建议,即论述了研究的现实意义和应用价值。

对于现阶段的中国土地非农化来说,适宜采用政府治理为主,市场治理为辅的治理结构。……在确定了政府和市场的边界之后,更进一步的建议有……。

这几句话指出了研究在理论和方法上存在的局限和不足,同时对进一步完善研究方法提出展望。

本文实证中对政府和市场两种治理结构交易费用的衡量和比较是基于制度环境不变的这一假设前提下的。本文以上提出的建议没有突破现有制度环境,即,不需要改变现有的正式制度,所以符合理论的假设。当然,不排除实际情况可能是当治理结构发生改变时,很可能已经引起了制度环境的改变,……,那样市场治理所产生的交易费用将不同于本文所计算的交易费用,治理结构选择的结果因此也会不同……除了上述在制度环境上的假设限制,本文还有很多缺陷。首先,……第二,……,第三……。

参考文献

[1]谭荣,曲福田.市场与政府的边界:土地非农化治理结构的选择[J].管理世界,2009(12):39-47+187.

[2]Anderson, J. A.and M. W. Thistle. 1947. On writing scientific papers.

Bull. Can. J. Res., 31 December 1947, N.R.C.No.1691.

推荐阅读:《收集论文数据和代码的途径有哪些

分享到:
在线客服在线客服