99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁(yè)精彩閱讀大數(shù)據(jù)時(shí)代傳統(tǒng)社會(huì)調(diào)查過時(shí)了嗎
大數(shù)據(jù)時(shí)代傳統(tǒng)社會(huì)調(diào)查過時(shí)了嗎
2017-04-17
收藏

大數(shù)據(jù)時(shí)代傳統(tǒng)社會(huì)調(diào)查過時(shí)了嗎

大數(shù)據(jù)時(shí)代是否需要社會(huì)調(diào)查?大數(shù)據(jù)時(shí)代憑借智能設(shè)備,通過數(shù)據(jù)挖掘技術(shù)可以獲得海量數(shù)據(jù),利用這些數(shù)據(jù)由此還興起了計(jì)算社會(huì)學(xué)這一學(xué)科。有學(xué)者提出,依賴于問卷調(diào)查的傳統(tǒng)社會(huì)調(diào)查所能獲得的數(shù)據(jù)與大數(shù)據(jù)相比,就是小數(shù)據(jù)。那么社會(huì)調(diào)查在大數(shù)據(jù)時(shí)代是否還有必要?在大數(shù)據(jù)技術(shù)興起背景下,傳統(tǒng)的社會(huì)調(diào)查方法如何彰顯其優(yōu)勢(shì)和獨(dú)特價(jià)值?

為此,中國(guó)社會(huì)科學(xué)報(bào)張清俐專訪了中國(guó)人民大學(xué)李丁,以下是訪談實(shí)錄。

大數(shù)據(jù)給傳統(tǒng)社會(huì)調(diào)查帶來的挑戰(zhàn)

張清俐

請(qǐng)您談一談大數(shù)據(jù)給傳統(tǒng)社會(huì)調(diào)查帶來的挑戰(zhàn),比如大數(shù)據(jù)技術(shù)所依賴的是現(xiàn)代先進(jìn)的網(wǎng)絡(luò)信息技術(shù)、智能設(shè)備等,這些技術(shù)已經(jīng)非常普及,而傳統(tǒng)的社會(huì)調(diào)查以專門人員進(jìn)行問卷調(diào)查為主要形式,以您所在團(tuán)隊(duì)所發(fā)起的“中國(guó)綜合社會(huì)調(diào)查”為例,以年度為單位,每年大概要耗費(fèi)多少人力物力?再如信息量的比較,“中國(guó)綜合社會(huì)調(diào)查”已經(jīng)開展了多久,以年度為單位,每年可以獲得的數(shù)據(jù)量多大?能夠反映的信息面多寬?而此番比較之下,大數(shù)據(jù)在獲取數(shù)據(jù)信息的渠道以及信息量等方面具有怎樣優(yōu)勢(shì)?

李丁

移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展和迅速普及,使得社會(huì)行動(dòng)者的態(tài)度、行為被迅速的信息化,并被互聯(lián)網(wǎng)設(shè)備記錄下來,這為科研人員研究各類社會(huì)行動(dòng)者的態(tài)度、行為提供了新的、以往的信息收集手段無法采集的大量信息,無論是從變量意義上,還是從案例意義上,都大大提高了人類記錄和采集相關(guān)信息的能力。


今天的社會(huì)行動(dòng)者是quantified actors,而互聯(lián)網(wǎng)和智能設(shè)備成為時(shí)時(shí)刻刻在采集大家的信息的大型感應(yīng)器,人在與這些設(shè)備互動(dòng)的過程中,也成為這個(gè)大型social sensor(社會(huì)感應(yīng)器)的一部分。這極大降低了人們獲取某些信息的成本。比方說,以前要了解一個(gè)人的收入和支出很難,在現(xiàn)金使用越來越少,大家都更多依賴銀行和手機(jī)支付的情況下,要了解大家的收入、支出,甚至收入支出的流水都非常容易。以前我們要了解一個(gè)社區(qū)的流動(dòng)人口很難,在手機(jī)基本普及的情況下,我們通過手機(jī)信號(hào)數(shù)據(jù)就能夠相對(duì)比較準(zhǔn)確地估計(jì)一個(gè)小區(qū)的外來人口的占比和相關(guān)結(jié)構(gòu)。以往我們要采集10000個(gè)人的信息成本是很高的,需要知道這1萬(wàn)個(gè)人在什么地方,需要詳盡辦法找到將問卷投遞給這1萬(wàn)個(gè)人的渠道(通過單位介紹信,行政命令;’通過熟人網(wǎng)絡(luò);通過電話,郵件,派調(diào)查員直接登門造訪)耗費(fèi)大量的成本才能獲得這么多案例的信息。但是在大家普遍使用某些互聯(lián)網(wǎng)設(shè)備的情況下,不管你在哪里,只要你聯(lián)網(wǎng),只要你同意了某些協(xié)議,你的信息就會(huì)源源不斷地提交到相關(guān)的數(shù)據(jù)庫(kù)中。因此,要獲得1萬(wàn)個(gè)案例數(shù)據(jù),甚至千萬(wàn),上億案例數(shù)據(jù)都是可能。

在這樣的背景下,誰(shuí)能夠先占有這些數(shù)據(jù),并能夠從中提取出有價(jià)值的信息和知識(shí),誰(shuí)就有可能獲得有關(guān)行動(dòng)者的新的知識(shí),社會(huì)運(yùn)行的新的規(guī)律。一部分研究者和領(lǐng)域?qū)鹘y(tǒng)信息采集手段(例如抽樣調(diào)查,包括案例訪談等等)的依賴就會(huì)降低,就是說,我不用傳統(tǒng)的渠道仍然能夠生產(chǎn)出有價(jià)值的知識(shí)產(chǎn)品。這個(gè)大趨勢(shì)是不可避免的,無視這一趨勢(shì),看不到新數(shù)據(jù)中所蘊(yùn)藏的有價(jià)值的信息和規(guī)律是不可取的。

傳統(tǒng)社會(huì)調(diào)查的必要性和獲得的信息的獨(dú)特性,大數(shù)據(jù)獲得的信息的局限性

張清俐

有學(xué)者提出,社會(huì)調(diào)查不僅耗費(fèi)巨大,且獲得的信息有限。那么傳統(tǒng)以問卷為主要形式的社會(huì)調(diào)查其獨(dú)特價(jià)值在哪些方面,也就是說,社會(huì)調(diào)查這種研究方式的必要性以及由此獲得的數(shù)據(jù)信息的獨(dú)特價(jià)值在哪里?較之于社會(huì)調(diào)查,大數(shù)據(jù)獲得數(shù)據(jù)信息存在哪些局限性?

李丁

在大數(shù)據(jù)條件下,對(duì)傳統(tǒng)抽樣調(diào)查的絕對(duì)需求是增長(zhǎng)的。這與傳統(tǒng)信息采集方式的相對(duì)優(yōu)勢(shì),以及大數(shù)據(jù)的局限性是緊密相關(guān)的。大數(shù)據(jù)雖然很大,但是仍然是有邊界的,無論在案例意義上,還是在變量意義上都是有邊界的。


首先,被互聯(lián)網(wǎng)、職能設(shè)備感知和記錄的社會(huì)行動(dòng)者并不覆蓋全部的行動(dòng)者。大數(shù)據(jù)到底覆蓋了哪些主體、對(duì)哪些主體覆蓋得更嚴(yán)密,沒有線下數(shù)據(jù)(普查數(shù)據(jù)或者嚴(yán)格的抽樣數(shù)據(jù))的校驗(yàn),很有可能出現(xiàn)偏差。尤其當(dāng)我們關(guān)注的主體不是網(wǎng)民、現(xiàn)有用戶,而是全部居民和潛在用戶的情況下。就像1936年《讀者文摘》預(yù)測(cè)錯(cuò)美國(guó)總統(tǒng)選舉一樣,如果你認(rèn)識(shí)不到大數(shù)據(jù)的覆蓋率或者代表怎樣的群體,即便樣本規(guī)模再大,得出來的知識(shí)和規(guī)律都有可能是誤導(dǎo)性的。要從案例規(guī)模上挑戰(zhàn)科學(xué)抽樣調(diào)查是很難的,實(shí)際上,傳統(tǒng)抽樣調(diào)查正是因?yàn)樵诎咐?guī)模競(jìng)爭(zhēng)中戰(zhàn)勝普查和非概率大樣本,才成為現(xiàn)代量化研究的主要選擇的。


其次,在變量意義上,大數(shù)據(jù)也是有邊界的。盡管今天采集和儲(chǔ)存數(shù)據(jù)的成本越來越低了,但仍然是要耗費(fèi)成本的。對(duì)于每一個(gè)企業(yè)和研究單位而言,采集什么數(shù)據(jù),采集那些數(shù)據(jù)都是有取舍的,不可能什么數(shù)據(jù)都采集,而且通常優(yōu)先采集的是關(guān)涉業(yè)務(wù)流程的信息流、資金流數(shù)據(jù)。這些數(shù)據(jù)社會(huì)意義密度很低,要從總提取出有社會(huì)價(jià)值的信息成本很高。盡管現(xiàn)在通過數(shù)據(jù)開放、黑客攻擊、數(shù)據(jù)交易、勾兌,很多企業(yè)和單位都試圖將能夠獲得的信息都串并起來,增加關(guān)于這些主體的信息量(也就是增加變量的個(gè)數(shù)),但是仍然面臨很多的利益的壁壘、技術(shù)的壁壘甚至倫理的壁壘,成本很高。每個(gè)單位都有很大的樣本量,但是每個(gè)樣本的變量信息很少。例如,一些數(shù)據(jù)集中有基本人口特征信息,一些數(shù)據(jù)中有健康信息,有的數(shù)據(jù)集有生活方式信息,如果這些信息沒有串并起來,要做出新的、更深入的健康研究是很難的。因此,我們可以看到不管是政府部門,還是企業(yè)都在強(qiáng)調(diào)數(shù)據(jù)的開放共享,倡導(dǎo)建立數(shù)據(jù)共享標(biāo)準(zhǔn),而一些信息販子都在拉群勾兌,為什么呀?從根本上講,就是為了將這不同的信息串并起來,將行動(dòng)主體嵌入到一定的社會(huì)網(wǎng)絡(luò)或者情境中,增加各個(gè)研究對(duì)象的有效信息量。如果串并不起來,大家在朋友圈里看那個(gè)“什么叫大數(shù)據(jù),情人節(jié)訂披薩”那個(gè)段子就不可能出現(xiàn),也不用擔(dān)心。


傳統(tǒng)的社會(huì)調(diào)查是在理論指導(dǎo)下在短時(shí)間內(nèi),高強(qiáng)度地獲取大量信息的過程。不管是實(shí)地調(diào)查、訪談,還是問卷調(diào)查,實(shí)際上都是研究者利用信息采集工具試圖短時(shí)間內(nèi)獲得大量關(guān)鍵信息的努力,信息密度非常高。問卷調(diào)查的目的直接性、設(shè)計(jì)性、標(biāo)準(zhǔn)化程度更強(qiáng),而且基于概率抽樣理論做了成本削減,效率是非常高的。這與目前大數(shù)據(jù)大多數(shù)都是生產(chǎn)過程中順帶產(chǎn)生的痕跡數(shù)據(jù)有很大的不同,要從這些痕跡數(shù)據(jù)中提取出同等價(jià)值和密度的信息成本很高。例如傳統(tǒng)調(diào)查我們直接詢問受訪者的收入情況,盡管會(huì)存在測(cè)量誤差,但信度和效度可以討論。而如果要根據(jù)大數(shù)據(jù)來進(jìn)行估計(jì),你首先需要有他的銀行賬戶的信息,現(xiàn)金收入信息,然后將很多很多次的收支記錄進(jìn)行計(jì)算和統(tǒng)計(jì)才能得到。要理清這些收支關(guān)系,做好關(guān)于收入的界定,其技術(shù)實(shí)現(xiàn)其實(shí)成本是很高的。可以這么說,如果不使用傳統(tǒng)的社會(huì)調(diào)查方式,今天即便世界上能力最強(qiáng)的互聯(lián)網(wǎng)公司將他們所有資產(chǎn)和人力都匯集起來,可能也無法從現(xiàn)有互聯(lián)網(wǎng)痕跡數(shù)據(jù)中獲得一個(gè)和CGSS一樣具有同等代表性,同等信度、效度、信息密度、相同變量的數(shù)據(jù)集——除非從網(wǎng)上下載了北大調(diào)查中心或社科院采用傳統(tǒng)方式收集的數(shù)據(jù)來充數(shù)。


在這種情況下,傳統(tǒng)社會(huì)調(diào)查研究仍有發(fā)揮作用的巨大空間。我認(rèn)為,要獲得某些高密度的、具有統(tǒng)計(jì)代表性的數(shù)據(jù),傳統(tǒng)的調(diào)查方式目前來說,還是最經(jīng)濟(jì)、最便宜的方式之一。只要傳統(tǒng)的調(diào)查方式在獲取這些新信息上具有成本優(yōu)勢(shì)和科學(xué)性優(yōu)勢(shì),傳統(tǒng)的信息采集方式就會(huì)有生存的空間。而且大數(shù)據(jù)再大,人們總會(huì)有新的信息需求,絕對(duì)的信息飽和是不可能的,大數(shù)據(jù)會(huì)帶來更多的信息需求,傳統(tǒng)數(shù)據(jù)采集方式會(huì)有更大的發(fā)展空間。對(duì)于研究人員而言,信息越多,質(zhì)量越好是最高興的事情,沒有信息的情況下我們只能做假定,靠猜和推測(cè)。但是信息數(shù)量和信息質(zhì)量都是需要代價(jià)和成本的,大數(shù)據(jù)的出現(xiàn)降低了獲取某些信息的成本,這對(duì)研究人員是一件幸事。但是確實(shí)應(yīng)該明了大數(shù)據(jù)的局限性,以及傳統(tǒng)研究方式的優(yōu)勢(shì),避免盲目崇拜。

如何看待大數(shù)據(jù)技術(shù),在社會(huì)學(xué)研究中是否有可能結(jié)合社會(huì)調(diào)查與大數(shù)據(jù)兩者的優(yōu)勢(shì),進(jìn)行數(shù)據(jù)獲取

張清俐

社會(huì)調(diào)查獲得數(shù)據(jù)對(duì)于社會(huì)學(xué)尤其是社會(huì)學(xué)量化研究不可或缺,現(xiàn)在有些社會(huì)學(xué)者已然開始積極“擁抱”大數(shù)據(jù)技術(shù),比如將交通、通訊、社會(huì)服務(wù)產(chǎn)品等產(chǎn)生的數(shù)據(jù)信息為社會(huì)學(xué)分析所用,乃至由此產(chǎn)生計(jì)算社會(huì)學(xué)這一學(xué)科。也有些學(xué)者對(duì)大數(shù)據(jù)技術(shù)持拒斥態(tài)度。這背后似乎隱含著量化研究與質(zhì)性研究的分歧。您本人主持參與過大量社會(huì)調(diào)查,您是如何看待大數(shù)據(jù)技術(shù)的?在社會(huì)學(xué)研究中,是否有可能結(jié)合傳統(tǒng)的社會(huì)調(diào)查與大數(shù)據(jù)兩者各自的優(yōu)勢(shì),進(jìn)行數(shù)據(jù)獲???

李丁

有些學(xué)者對(duì)大數(shù)據(jù)持拒斥態(tài)度,讓我們看到了質(zhì)性和量化研究的分歧

關(guān)于大數(shù)據(jù)目前已經(jīng)引發(fā)了很多爭(zhēng)論,我想真正拒斥大數(shù)據(jù)的研究者是沒有的,大家拒斥的是對(duì)大數(shù)據(jù)的錯(cuò)誤使用,或者對(duì)于大數(shù)據(jù)不帶反思的盲目使用。這不僅是質(zhì)性研究者反對(duì)的,同時(shí)也是量化研究者反對(duì)的。目前質(zhì)性研究者對(duì)大數(shù)據(jù)的質(zhì)疑和警告的聲音更大,引發(fā)了大家的討論,量化研究者確實(shí)應(yīng)該借此機(jī)會(huì)認(rèn)真的反思和改進(jìn)大數(shù)據(jù)的生產(chǎn)和研究過程,避免頭腦發(fā)熱、盲目冒進(jìn)和大數(shù)據(jù)崇拜。但如果只是沒有真憑實(shí)據(jù)的空口放炮,逗大家玩,這就有點(diǎn)為老不尊了。倘若甚至還真利用學(xué)術(shù)權(quán)威妨礙學(xué)科布局、梯隊(duì)發(fā)展,這就有點(diǎn)逆歷史潮流而動(dòng)了。我想,給予建設(shè)性的批評(píng)、意見,大家在協(xié)同進(jìn)步才是正確的姿態(tài)。


在潘綏銘老師和劉林平老師的爭(zhēng)論中,潘老師的一些細(xì)節(jié)論述劉老師已經(jīng)進(jìn)行了細(xì)致回應(yīng),大家可以看到大數(shù)據(jù)巨大的發(fā)展空間,但這些都不是潘老師關(guān)注的重點(diǎn)。潘老師的要點(diǎn)是:第一,大數(shù)據(jù)你需要認(rèn)識(shí)到自己的不足,承認(rèn)自己有原罪,你不能太狂妄,搞大數(shù)據(jù)崇拜;第二,你再怎么厲害,你也不可能取代傳統(tǒng)的方式和方法,特別是在人文社會(huì)領(lǐng)域;第三,似乎有一點(diǎn)大家是各干各,各留空間,永遠(yuǎn)不要有交集的好的意思。我認(rèn)為部分有些道理,但又不全對(duì)。有道理的地方在于,大數(shù)據(jù)確實(shí)應(yīng)該注意自己的不足,要謹(jǐn)慎,要在社會(huì)情境中理解信息的含義,明了大數(shù)據(jù)的片面之處和代表性不足之處,要對(duì)自己的數(shù)據(jù)加工過程保持反思性,并充分利用其它研究的成果和經(jīng)驗(yàn),包括非量化的人文社科研究的長(zhǎng)處。但說大數(shù)據(jù)有其獨(dú)特的原罪,兩種研究方法不具交集,就過于將大數(shù)據(jù)研究、量化研究方法和質(zhì)性研究方法(包括人類既有認(rèn)知過程和方法)割裂開了。


實(shí)際上,大數(shù)據(jù)面臨的幾乎所有問題也是質(zhì)性研究、傳統(tǒng)抽樣實(shí)證研究同樣或多或少面臨的問題。人類只能憑借自己有限的感覺能力、脆弱的理性思維、波動(dòng)的理解能力來獲取來自這個(gè)世界的數(shù)據(jù)、從中加工總結(jié)出有用的信息、知識(shí)與理論。世界是不是真是我們理解或總結(jié)出來的樣子,只能繼續(xù)憑借這些有限的能力獲得反饋信息來驗(yàn)證。從這個(gè)意義上講,認(rèn)識(shí)的過程,不管是量化的研究和質(zhì)性的研究,都存在割裂、篡改、人為的成分,但這并不妨礙我們?nèi)カ@得有價(jià)值的信息,除了人力,人還能依賴什么,信賴什么呢?多數(shù)人也并不完全迷信自己獲得的知識(shí)和理論是永恒的真理,相反,總是傾向于認(rèn)為它們是值得改進(jìn)的。我們沒有必要對(duì)大數(shù)據(jù)提這樣過分的要求,大數(shù)據(jù)也不要輕狂或者為了獲得發(fā)展資源而向社會(huì)許諾這樣不切實(shí)際的愿望。關(guān)鍵在于,我們能否公開獲得這些新信息、新知識(shí)、新理論的方法和過程,被其他人在科學(xué)意義上理解、檢驗(yàn)、認(rèn)同和支持,變成人類的共同知識(shí)財(cái)富。當(dāng)然,現(xiàn)實(shí)社會(huì)中,知識(shí)和觀點(diǎn)的形成、傳播、理解、認(rèn)同和支持有太多社會(huì)、權(quán)力因素的影響,甚至并不主要依據(jù)科學(xué)邏輯而被支持或反對(duì)。但對(duì)于科學(xué)研究者而言,不管是量化研究,還是質(zhì)性研究,應(yīng)該就科學(xué)研究最值得堅(jiān)持的基本價(jià)值、邏輯、原則達(dá)成共識(shí)。加里·金的觀點(diǎn)值得參考:研究的目在于推論,研究過程是公開的(方法是可學(xué)習(xí)和共享的,結(jié)論是可對(duì)比和復(fù)制的),研究結(jié)論是不確定的,研究的主要內(nèi)容就是研究方法等等。在這些共識(shí)的基礎(chǔ)上,量化研究和質(zhì)性研究所做的眾多不同努力和取舍都可以擺到臺(tái)面上來討論、對(duì)比、交流,如果大家在一些價(jià)值取舍上出現(xiàn)分歧,我們也可以在有所保留的基礎(chǔ)上做到相互理解,尊重,各美其美。彼此之間相互隔絕、對(duì)立、攻擊,甚至連嘗試相互理解都不愿意,這其實(shí)不是在做科學(xué)研究、做學(xué)術(shù),而是玩權(quán)術(shù)和權(quán)力。

如何看待大數(shù)據(jù)技術(shù),在社會(huì)學(xué)研究中是否有可能結(jié)合社會(huì)調(diào)查與大數(shù)據(jù)兩者的優(yōu)勢(shì),進(jìn)行數(shù)據(jù)獲取

當(dāng)我們有了一些基本的共識(shí),了解不同方法的優(yōu)勢(shì)與不足,并且掌握不同方法的使用之后,不同方法之間的取舍、綜合利用是可能的。一直以來很多研究者就在綜合利用質(zhì)性的研究方法和量化的研究方法。具體到大數(shù)據(jù)和傳統(tǒng)研究方法的結(jié)合上:


第一,傳統(tǒng)的質(zhì)性研究方法和抽樣調(diào)查方法能夠補(bǔ)充大數(shù)據(jù)的不足,幫助我們理解大數(shù)據(jù)的社會(huì)含義,幫助我們進(jìn)行大數(shù)據(jù)的采集和加工。比方說,有時(shí)候,互聯(lián)網(wǎng)痕跡數(shù)據(jù)不知道如何解釋和理解,拍腦袋是不行的,有時(shí)候憑借我們的先驗(yàn)知識(shí)也不夠,這個(gè)時(shí)候我們將用戶找過來,深入訪談,了解一些使用的過程和情境,就能對(duì)這樣的痕跡的意義有更確切的把握,為未來采集什么數(shù)據(jù)提供指導(dǎo),防止數(shù)據(jù)加工過程掉進(jìn)胡編亂造或者篡改的陷阱里面。有時(shí)候,在大數(shù)據(jù)中變量信息不足,我們就可以抽取一些案例,通過傳統(tǒng)方式收集一部分信息,然后與既有信息串并起來,就有可能做出很好的研究。比方說,微信采集了我們大量的日常交流、閱讀信息,但是缺乏一個(gè)人性行為的信息,我們就可以爭(zhēng)取抽取一個(gè)代表性的用戶樣本,派訪問員去接觸、爭(zhēng)取信任,獲得有關(guān)信息,從而估計(jì)出微信使用行為習(xí)慣與性行為之間的關(guān)系。當(dāng)我們估計(jì)出一定的規(guī)律之后,可以將相關(guān)的參數(shù)作為先驗(yàn)信息放到模型中,對(duì)那些沒有線下調(diào)查信息的用戶的性行為進(jìn)行預(yù)測(cè)。有時(shí)候,大數(shù)據(jù)的案例代表性不確定,或者覆蓋不全,我們就可以通過傳統(tǒng)調(diào)查方式,在更完備的抽樣框抽取一個(gè)小樣本,收集一部分信息,來評(píng)估當(dāng)前的用戶屬于人群中的哪一部分,哪些特征的潛在用戶更有可能變?yōu)檎鎸?shí)用戶,等等。


第二,大數(shù)據(jù)也能為傳統(tǒng)調(diào)查研究提供重要的信息補(bǔ)充。質(zhì)性研究如果能夠在既有的訪談、觀察的基礎(chǔ)上,還能獲得受訪對(duì)象在互聯(lián)網(wǎng)的痕跡數(shù)據(jù)、社會(huì)交往數(shù)據(jù)、經(jīng)濟(jì)往來數(shù)據(jù)、行動(dòng)軌跡數(shù)據(jù)、所在社區(qū)的社會(huì)背景信息等等,就能對(duì)研究對(duì)象有更全面的了解和把握。就像今天的技術(shù)在公安破案過程中扮演重要作用,社交媒體數(shù)據(jù)及其他互聯(lián)網(wǎng)痕跡數(shù)據(jù)能夠有利于招聘單位對(duì)應(yīng)聘者的全面了解一樣,懂得低成本、高效地采集和利用多源數(shù)據(jù),無疑會(huì)有所助益。做這樣的個(gè)案數(shù)據(jù)的采集和串并是可能的,但是成本還很高,風(fēng)險(xiǎn)很大,特別是那些需要獲得授權(quán)并不公開的隱私數(shù)據(jù)。由于大數(shù)據(jù)的信息密度低,分割性、零碎性很高,做到大規(guī)模的個(gè)體層面的數(shù)據(jù)串并成本還很高(確實(shí)有一定的價(jià)值,有些公司和單位在努力通過用戶的手機(jī)號(hào)、手機(jī)識(shí)別碼、身份證號(hào)等進(jìn)行信息串并)。目前,基于宏觀單位例如地區(qū)、社區(qū)、組織、上市公司等的公開信息匯總和串并相對(duì)容易,并且已經(jīng)涌現(xiàn)了大量研究。現(xiàn)在大家看到的各種空間數(shù)據(jù)可視化,其實(shí)就是通過地理坐標(biāo)這一共同的變量,將零散的、低密度的信息都匯總疊加到特定的坐標(biāo)點(diǎn)上形成的新信息。例如將眾多的用戶及其使用的智能設(shè)備作為一個(gè)一個(gè)的社會(huì)感應(yīng)器,反映出一個(gè)社區(qū)的人口屬性、活動(dòng)特征、態(tài)度傾向等信息。這些信息可以與傳統(tǒng)的社區(qū)調(diào)查串并起來使用。現(xiàn)在城市研究和規(guī)劃行業(yè),社會(huì)感應(yīng)數(shù)據(jù)和衛(wèi)星遙感數(shù)據(jù)的串并就非常常見。這些匯總信息也可以作為社會(huì)背景信息增進(jìn)對(duì)案例的理解。比方說,CGSS全國(guó)調(diào)查了480個(gè)村居,如果我知道這些村居的地理坐標(biāo),就可以將互聯(lián)網(wǎng)上的所有帶有這些坐標(biāo)信息的數(shù)據(jù)都匯總出來,例如我們可能知道每個(gè)村平均每天有多少人使用微博、周邊有多少商業(yè)點(diǎn)、有多少人進(jìn)行網(wǎng)購(gòu),有多少人往北京打電話等等,從而讓我們知道自己的受訪對(duì)象嵌入在怎樣的互聯(lián)網(wǎng)環(huán)境、關(guān)系網(wǎng)絡(luò)及社會(huì)環(huán)境中。


第三,在移動(dòng)互聯(lián)網(wǎng)時(shí)代和大數(shù)據(jù)環(huán)境下為試驗(yàn)研究、質(zhì)性研究、抽樣調(diào)查提供了新的條件和機(jī)會(huì)。相關(guān)的技術(shù)可以幫助我們進(jìn)行刺激控制、隨機(jī)分組、結(jié)果信息采集;幫助我們進(jìn)行在線的訪談和互動(dòng);為我們提供抽樣框,進(jìn)行問卷的投放、回收,并監(jiān)控調(diào)查的整個(gè)過程等等。只要我們?cè)O(shè)計(jì)合理,新技術(shù)和新數(shù)據(jù)都有可能給我們帶來超過成本的回報(bào)。當(dāng)然,前提條件是我們確實(shí)掌握了不同方法的技術(shù),知道他們的不足或限制。作為年輕人即便對(duì)某種方法情有獨(dú)鐘,也應(yīng)該花一些心思了解一下其他方法是怎么做的,做到知己知彼。記住老人的提醒,但又不能全信老人的忽悠,進(jìn)而固步自封,應(yīng)該保持一種開放的、終生學(xué)習(xí)的姿態(tài)。

每個(gè)人的精力是有限的,能將這些方法全部融會(huì)貫通是對(duì)青年學(xué)者提出的比老一輩更高的要求;另一方面,更應(yīng)該強(qiáng)調(diào)不同方法之間的分工合作,每個(gè)人都不得不有所取舍,但作為一個(gè)團(tuán)隊(duì),其成員可以發(fā)揮各自的優(yōu)勢(shì),通力合作。不管對(duì)于個(gè)人,還是團(tuán)體,都需要我們彼此加強(qiáng)交流、學(xué)習(xí)、互動(dòng)和理解,不斷積累和提高共識(shí)的程度,共同推進(jìn)知識(shí)的累積性增長(zhǎng)。社會(huì)學(xué)應(yīng)該給予自己的學(xué)生全面的研究方法訓(xùn)練,要充分利用全球的開放教育資源提升學(xué)生的數(shù)據(jù)收集、信息處理能力,不斷學(xué)習(xí)和自我提升,不能局限于自己已經(jīng)懂的,擅長(zhǎng)的那點(diǎn)東西。


數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }