在社會抗爭研究等領域,研究對象往往涉及多案例,單獨的個案已經不能滿足研究的需要。 同時,作為一種復雜的社會現象,此類事件的成因存在著多元并發組合的原因變量,以線性因果關系為基礎的定量統計分析方法也很難提供有效的分析結論,而定性比較分析方法(qualitative compar-ative analysis ,下文簡稱QCA)由于能夠有效、系統地處理多案例比較的研究數據,其已在社會抗爭研究等領域得到廣泛運用。 QCA產生于20世紀80年代末, 由查爾斯·拉金 ( Charles C. Ragin) 在1987 年提出,它是一種以案例研究為導向的理論集合研究方法。①它強調通過實證資料以及相關理論的不斷對話, 從小樣本數據中建構出研究議題的因果性關系。 這是基于集合論與布爾代數的分析,即從集合而不是相關的角度考察條件與結果的關系,并使用布爾代數算法形式化人們分析問題時的邏輯過程。QCA嘗試超越傳統的個案研究方法,系統地考察事件發生的成因以及內部生成因子之間的互動關系、可能性關系組合,試圖解釋促成事件產生的關鍵因子、因子之間的相互聯系以及激發事件產生的復雜的成因組合,以期深化對事件產生的復雜因果關系的理解。
本文首先介紹了采用布爾代數算法的QCA的基本原理、分析邏輯及操作模式;其次,簡單梳理了QCA方法論的演變過程及具體操作方法的發展情況;最后,總結了QCA在中國社會科學研究中的應用狀況并簡要分析了其優缺點及發展趨勢。
一、QCA的基本分析邏輯
QCA采用布爾代數算法形式化人們分析問題時的邏輯過程。 在邏輯比較時,布爾代數方法將任何一個個案都看成是由多個原因條件與結果條件結合而成的。如果個案數量較多,這種關于原因條件與結果條件的深度分析將超出人腦力的可乘載負荷,就需要以基于變量的定量分析來做替代。而QCA的產生,使得在個案數較多的情況下仍然可以不用求助于傳統的定量分析方法,它利用布爾代數運算法則簡化原因條件與結果條件之間的關系。 以下將通過具體的例子對QCA的分析邏輯及具體操作程序進行說明。
首先,QCA方法的基礎是將變量先做兩分處理,即解釋變量和結果變量各有兩種,變量取值為0或1. 表示某條件發生或存在時,變量用大寫字母來表示,取值為1;反之,表示某條件不發生或不存在時,變量用小寫字母或-來表示,取值為0(其中,小寫字母表示不發生,-表示不存在)。 +代表“或”,*代表“和”,→及=均代表“導致”. 比如A*B=Y表示A和B同時發生導致Y的發生。
其次,QCA的分析邏輯與定量分析不同,主要體現在對因果關系的理解上。 定量研究假定社會現象的因果關系是線性的,而定性比較分析則假定社會現象的因果關系是非線性的,原因條件對結果的效應是相互依賴的,且同一個社會現象的發生可能是由不同的原因組合所導致的。由于QCA假定因果關系是多樣的復雜的(complexity)且是可替代的(substitutability),所以更加關注社會現象發生的多重原因組合(multiple conjectural cause),即一個條件對結果的影響同時取決于其他條件。 比如原因條件A和B同時出現導致結果Y的產生,C和D同時出現也能導致結果Y(A*B+C*D=Y),即同一個結果的產生可能是由多個不同的原因組合所致。 再比如在社會情景B下,原因條件A出現可能導致Y的產生,即A*B=Y;在社會情景D下,原因條件A不出現也可能導致Y,即a*D=Y. 也就是說,同一個原因條件的發生或不發生與不同的社會情景相結合,都能產生同樣的結果,即A*B+a*D=Y.
再次,QCA的分析單位是條件組合而不是案例, 研究者以所有的條件組合作為分析的基礎,根據布爾代數(Boolean algebra)算法簡化條件組合。布爾代數最基本的運算邏輯是尋找不同組合的共同點:如由A*B+A*b=Y可以得到A=Y,即如果兩個不同的原因組合A*B和A*b同時導致結果Y的產生,并且這兩個組合當中有且僅有一個原因條件的取值不同(如本例中的B和b),則原因條件B是冗余的。
最后,QCA是基于必要條件和充分條件的推斷邏輯,而不是統計推斷的邏輯,因此,定性比較分析持“非對稱因果關系”,即研究者不能從A=Y直接推斷出a=Y. 反之,研究者既可以分析社會現象發生的原因(Y),也可以分析其不發生的原因(y)。 分析Y時,y對應的數據并不納入分析過程,反之亦然。
二、QCA的基本操作程序
在操作層面,研究者首先要確定案例,案例的選擇是以研究問題為基礎的,這是一個在理論與經驗之間不斷互動的過程。其次是確定原因變量,變量的選擇可以遵照不同的原則(Rihoux&Ragin,2009),因為QCA的分析單位是條件組合而不是案例,所以研究者需要根據不同的策略確定原因變量,然后以個案為單位對數據進行匯總,得到原因變量與結果變量的所有組合(configurations),這些組合以表格的形式呈現出來,即真值表(truth table)。 在這個過程中可能會需要處理同樣的原因條件組合對應不同的結果,即矛盾條件組合的問題。最后,研究者將所有的組合作為分析的基礎,根據布爾代數對由所有條件組合所構成的真值表進行簡化, 從而得出導致結果變量發生或不發生的原因條件組合。
假設我們想知道導致社會現象Y產生的原因條件,A、B、C是Y產生的三個候補原因條件,導致Y產生的原因組合有多個,由A、B、C這三個原因條件的不同組合形式構成。我們在具體觀察到的事例中,對原因條件與結果條件存在與否分別賦值1與0,由此得到的各個事例的數據用真值表表示。 真值表的行數由原因條件的個數決定,如果有k個原因條件,那么真值表的行數就是2k,表示有2k個邏輯條件組合。 真值表的各行表示原因條件的各種不同邏輯組合,以及不同組合所產生的結果,即事件發生(1)或不發生(0),-表示事件不存在。 事例數表示每一種原因結果的邏輯組合所實際觀察到的事例的數量,Y發生的事例數表示每一種導致Y發生的原因條件組合所對應的實際觀察到的事例的數量。表1所用的真值表的例子,預設了同樣的原因條件組合形式導致同樣的結果。 但在實際分析應用中, 存在同一個原因條件組合對應不同結果的事例。 這樣的原因條件組合被稱為矛盾條件組合(contradictory row),相應地,QCA發展出許多處理矛盾條件組合的方法。 上表第三行的原因條件組合形式對應的事例數為0,所以無法確定結果Y的值。 這樣的組合被稱作“邏輯剩余項”(logical re-mainder),產生原因是事例收集不足。 小樣本數據意味著有一部分原因變量組合是沒法觀察到的,即拉金(Ragin, 1987)指出的所謂有限的多樣性(limited diversity)。 在實際分析中,QCA既可以把沒有觀察到的案例排除在分析過程之外,即將“邏輯剩余項”所對應的結果變量賦值為0,也可以引入一些沒有觀察到的但與現有理論不相沖突的“虛擬”組合,即簡化假設(simplifying assumption)。 引入沒有觀察到的個案, 有利于理論模式的簡化、 證實、 或證偽。 表1所呈現的多重因果關系組合(multiple conjunctional causation)用布爾代數表示如下:Y=ABC+ABc+Abc+abc (1)根據布爾代數的運算邏輯進一步將方程式簡化為:Y=AB+bc (2)運算過程用集合的圖示法表示如下:參照集合圖示,我們可以知道方程式(2)表示“當A和B同時存在或者B和C同時不存在時,結果Y產生”. 如果進一步把邏輯殘余項引入,則可以得到更簡潔的方程式。 即把真值表第三行的原因條件組合對應的結果賦值為1進行簡化假設(simplifying assumption)處理,得到的方程式為:Y'=A+bc (3)引入簡化假設以后,A單獨存在就能導致Y的發生,A是Y的充分條件。 引入實際沒有觀察到的原因條件組合,可以得到更簡約的理論模式,同時也有助于指導進一步的經驗研究,以檢驗現有的理論模型。然而,方程式(3)是在對實際沒有觀察的原因條件組合做簡化假設后得到的,所以在進行因果解釋時有必要做充分考慮。
三、QCA方法論的演化與拓展
QCA主要包括確定集(crisp set)、模糊集(fuzzy set)和多值集(multi value)三種具體操作方法 .
拉金(1987)將布爾代數和集合理論結合起來,發展出二分變量的 QCA 技術,用于處理兩分變量的解釋變量和結果變量,即確定集定性比較分析(crisp-sets QCA,csQCA)。 此后,拉金(Ragin,2000)將模糊集合引入定性比較分析,提出了模糊集定性比較分析( fuzzy-sets QCA,fsQCA) 技術。 克隆維斯特于2004年將QCA擴展到可以處理多值的條件變量, 并提出多值集定性比較分析 (multi valueQCA,mvQCA)。