大数据时代定量与定性研究方法的对立与统合【摘要】:中国社会科学研究历来注重定性分析而忽视定量分析,大数据时代的到来将从根本上改变这一传统。
然而,学术界目前在定量与定性分析孰轻孰重问题上仍然莫衷一是。
面对信息量的快速增长和数据结构的差异化,社会科学研究方法也必须在对立与统合中实现新的平衡。
无论定量与定性方法以何种形式展现,它们始终都属于工具主义范畴。
从工具主义走向建构主义和实证主义是学术研究者们在大数据时代的首要任务。
研究方法是开启新的思想认知的钥匙。
【关键词】大数据定量定性科学是人类社会发展的动力之源。
无论是自然科学还是社会科学,它们共同构成了群体认知的智慧。
纵观东西方自然科学和社会科学发展史,我们会发现它们的发展并不均衡。
文艺复兴和思想启蒙一直被看做是西方世界文明崛起的标志,从哥白尼与伽利略时代的日心说到牛顿三定律,再到三次工业革命,自然科学技术的发展速度总体上要领先于社会科学,但两者间的差距并不明显。
相比之下,东方世界的科学发展脉络则更有趣。
很多人认为在1860 年洋务运动兴起之前,中国不存在真正意义上的自然科学,或者说尚未形成系统化、理论化的科学体系。
换言之,社会科学的繁荣遮住了自然科学的光芒。
《论语》《大学》和《中庸》等似乎更多体现了古代哲学、文学和史学等领域的兴盛。
有西方学者认为,中国人更擅长于形象思维,即善于运用具体的场景或情节思考问题,其流传已久的四大名著无不是以具体的故事情节和思想内涵见长,而在抽象思维方面则劣势明显。
事实也的确如此,我们在自然科学的理性探索方面确实建树不多,而在社会科学方面也普遍缺少深层次的思辩精神。
对此,笔者认为上述观点表面上是在阐述东西方科学发展失衡的原因,但却没有抓住问题的本质——社会科学研究方法的滞后,尤其是在定量方法和定性方法的运用方面。
这也是困扰中国当代社会科学发展的现实问题。
大数据时代下,中国社会科学将面临前所未有的信息超载挑战,如何能够在大量的抽象数据中发现基本规律和进行规范与实证分析是学术界必须正视的问题。
鉴于此,笔者对大数据时代下社会科学方法的对立与统合进行了深入的思考,其研究视角是基于定量方法和定性方法的差异性而展开。
一、相关概念梳理“大数据”的英文表述是“big data”,中国电子科学研究院学报对它的描述是4V+1C,即多样化(Variety)、海量(Volume)、快速(Velocity)、灵活(Vitality)和复杂(Complexity)的非结构化和半结构化数据。
“大数据”一词首次进入公众视野是在2011 年5月,EMC 在美国拉斯维加斯第11 届EMC World大会以“云计算相遇大数据”为主题着重展现当今世界两个最重要的技术趋势。
此后,大数据概念陆续进入了麦肯锡全球研究院报告《大数据:创新、竞争和生产力的下一个新领域》、2012 年达沃斯世界经济论坛报告《大数据,大影响》和2012 年3 月奥巴马政府提出的《大数据研究和发展倡议》等文件中。
目前,我国尚未正式提出这一概念,但在许多领域都已展开与“大数据”相关的若干技术创新工程,在此不一一论述。
大数据的出现绝非偶然,它是信息化、网络化社会高度发达的结果。
大数据的规模与形式早已超出了传统数据处理方法所能管理和分析的能力。
对于从事社会科学研究的学者们而言,数据架构与数据整合的调整已经迫在眉睫。
从学理上讲,如果能从纷繁复杂的大数据中提取出最有价值的信息并进行科学的分析处理,那么我们就能更精确地把握社会科学的研究导向。
定量与定性分析是社会科学研究常见的方法,前者倾向于使用直观的数据、模型或数学公式来分析论证复杂的问题,其作用是化繁为简,逻辑性和准确性更高,故而受到很多学者的青睐;后者注重价值和事实判断,它以经验描述为基础、以归纳逻辑为核心。
虽然定性分析能够在一定程度上弥补定量方法的不足,但其缺陷在于它的推理往往缺乏严格的公理化系统的逻辑约束,从而导致其具有很大的主观性和不确定性。
如果从定义角度加以阐述的话,我们可以做如下总结:定量方法是采用标准程序检验理论、建立事实、说明事物内在关系的统计性描述,其事实与价值相互分离;定性方法是采用非标准程序描述和理解多种事实或现象,其事实与价值难以分离。
哲学上阐释的质量互变规律同样适用于此,质性研究突出思辩性和价值判断,而量化研究侧重于连续性和价值中立。
谈到定量与定性分析就不能不提及工具主义、建构主义和实证主义。
工具主义研究途径强调研究方法的重要性,正确的方法是所有研究的基础。
对此,笔者表示赞同。
在信息量迅速膨胀的大数据时代,社会科学的确应该思考新的研究路径和信息处理方法,而不能继续在浩如烟海的数据中无法自拔。
然而,工具主义所倡导的至上性却是笔者反对的。
工具不能取代思想成为主题,否则岂不是舍本逐末? 至于建构主义,其基本出发点还是认知论,只不过它不再刻意强调工具的主导性,而是将目光转向具体的研究背景。
与工具主义相比,建构主义在研究主题方面前进了一步。
实证主义则是朴素的现实主义,是客观主义的认识论,其实证研究主要体现在定量分析方面。
二、定量与定性之间的分歧近年来,学术界对于定量与定性研究的必要性和发展前景一直争论不休,大体上可以分为激进和保守两大派别。
激进派认为,大数据时代的到来将进一步推动定量方法在社会科学的应用范围,定量取代定性研究已成为大势所趋。
保守派则认为,思想是研究价值的终极所在,而这正是注重思辩性分析的定性研究的长处,所谓的定量研究充其量不过是实证工具而已。
从上述观点来看,两派的观点尽管针锋相对,但它们都并没有彻底否定对方所持的观点。
分歧在于哪一种方法能够在未来社会科学研究中占据主导性地位。
令人欣慰的是,两派学者都认可研究方法和分析路径在社会科学中的重要角色,并未否认思想主体的价值。
此外,一个值得关注的现象就是,激进派大都是年轻学者,他们深受西方社会科学研究传统的影响,主张采取以量化分析为主,运用严密的逻辑推理和完善的论证体系来做学问;保守派主要以老一代的学术前辈为代表,他们积极倡导学术的思辩性,排斥过度量化社会科学研究内容。
在他们看来,定量研究方法在社会科学中大行其道,只会导致后者丧失独立地位,从而成为自然科学的附庸。
双方之间的论战一直延续到了大数据时代,似乎有愈演愈烈之势。
众所周知,经济学是社会科学中量化程度最高的学科,它以精确的图形、方程式和数学模型来表述抽象的基本原理,并得到了自然科学界人士的认可。
计量经济学更是成为整个社会科学中最璀璨的明珠。
世界著名的诺贝尔奖评选中就包括经济学奖。
如果我们仔细关注那些获得诺贝尔经济学奖的研究者的学术背景的话,你会发现他们当中有一大半是计量经济学的杰出代表。
或许有人会提出诺贝尔文学奖的例子。
毋庸置疑,它确实是定量研究支持者们无法回避的问题,其中也包括我本人。
除了经济学以外,量化研究方法应用较多的就是公共管理学。
这里我们无需再去论述公共行政学的研究范式,因为它已超出了本文的方法论研究范围。
公共管理学虽然融入了多学科的研究方法,而且也提出了许多颇有代表性的观点,但却从未建立过属于自己的基础理论,只是一味地借用其他学科早已成熟的研究成果。
对于保守派而言,这的确是一个最佳的反驳依据。
无论定量研究还是定性研究,其最终目的在于认知和理解研究对象。
如果过度地纠结于方法本身,那就真正落入了工具至上主义的陷阱。
与此相反,如果只是沉迷于认知和思辩,轻视研究方法和分析路径,那么我们将很难摆脱大数据时代信息泛滥的困扰。
作为一名理性严谨的学者,我们不仅需要工具主义的支撑,更需要建构主义的认知视阈和实证主义的量化描述。
三、从工具主义到建构主义、实证主义的转变实证主义从辩证唯物论观点来看,客观对象是“属性”和“数量”两类信息的有机统一体,定性或定量并非元方法划分结果,定量研究以定性研究为先导,它是社会学的高级实证形态。
从目前来看,以定量研究为代表的实证主义在大数据时代下似乎逐渐占据了上风。
定性研究的哲学基础是人文主义,它采用的是理论建构主义下的文字描述,其目的是要深入了解社会现象。
从理性探索的角度来看,无论是定量分析还是定性分析都属于工具主义范畴,而实证主义和建构主义则是不同哲学倾向在社会学各研究范式的投影。
如果我们能够厘清它们之间的关系,那么定量与定性研究方法之间的争论问题也就迎刃而解。
工具本身不是目的,它只是学术中研究者们思想表达的外在手段或方式,而内在的思想精华才是我们孜孜不倦、苦苦追求的真谛。
目前国内学术界似乎有这样一个认识,即一篇经管类论文如果没有定量方法的支持就很难登上学术研究的殿堂,原因是它可能充斥着主观臆断的成分。
于是,很多所谓的学术论文莫名其妙地使用了大量画蛇添足的图表、模型或复杂的方程式。
不容否认的是,我国社会科学领域确实长期存在重思辩、轻定量的传统,而定性研究中又缺少对国际主流学界认同的规范方法论的应用。
事实上,自20 世纪80 年代,西方社会科学就掀起了“计量风暴”,当时的西方学术界“言必定量”。
如今,这股潮流开始蔓延至中国学术界。
尽管如此,但笔者认为中国社会科学界在定量研究方面还是取得了不俗的成绩,越来越多的年轻学者将定量与定性分析用于学术研究,这对于中国社会科学的长期发展大有裨益。
但是,学者们仍然要反思“工具主义”的陷阱问题,即我们是否正在从一个极端走向另一个极端呢?研究方法与思想认知是否实现了真正的融合?面对信息量迅速扩展和信息结构多元的大数据时代,如何将工具主义、建构主义和实证主义等方法有机地结合起来,这些都需要学术界以理性态度加以分析和考量。
四、研究方法与思想创新研究方法既是探索未知对象的工具和路径,也是思想创新的驱动力。
多元的方法可以给学术研究带来不同的视角,而这正是激发新思想、挖掘深层内涵的切入点。
实际的社会科学研究往往是多元方法的交融,定性研究提出思想论点,定量分析做论证分析的铺垫,或其数据结果作为某个观点的支撑,相互形成一套严谨的逻辑推理体系,从而有效地增加学术研究的科学性与创新性。
大数据时代的到来意味着原有的研究对象和研究内容都发生了质或量的变化,信息不仅仅是以几何级指数的增长速度扩展,更重要的是数据结构和形式亦呈现出新的不规则变化。
如此一来,我们就不可能再墨守成规,继续沿用传统方法来认知新事物,而是要在方法论、基本方法和具体方法与技术等三个层面进行调整。
从方法论角度而言,定量研究和定性研究并不存在根本性的冲突。
在很多实证研究和规范研究过程中,它们恰恰能够取长补短,互为依托。
比如研究犯罪率与人均收入相关性问题,我们既需要前期的数据采集、中期的数据处理与分析,更需要后期的定性研究,其研究结果是建立在严密的定量分析基础上的事实判断与价值分析。
通过研究,我们需要检验此前的事实描述和价值判断是否准确,即人均收入越低(高),犯罪率越高(低)。