
用spss將詞篇矩陣轉(zhuǎn)成相似矩陣_spss相關(guān)矩陣
下文是關(guān)于用spss將詞篇矩陣轉(zhuǎn)成相似矩陣相關(guān)內(nèi)容,希望對(duì)你有一定的幫助:
用spss將詞篇矩陣轉(zhuǎn)成相似矩陣(一)
spss實(shí)驗(yàn)報(bào)告六
實(shí)驗(yàn)報(bào)告六
實(shí)驗(yàn)項(xiàng)目:因子分析和主成分分析
實(shí)驗(yàn)的目的:
利用SPSS進(jìn)行因子分析和主成分分析。
實(shí)驗(yàn)內(nèi)容:
1.因子分析
2.主成分分析
一、因子分析
1、因子分析是指研究從變量群中提取共性因子的統(tǒng)計(jì)技術(shù)。
2、[數(shù)據(jù)集1] C:Documents and Settingsuser桌面案例數(shù)據(jù)資料因子分析(基本建設(shè)投資分析).sav 相關(guān)矩陣
國(guó)家預(yù)算
內(nèi)資金
(1995國(guó)內(nèi)貸利用外自籌資其他投
億元)
相關(guān) 國(guó)家預(yù)算內(nèi)資金
(1995年、億元)國(guó)內(nèi)貸款
利用外資
自籌資金
其他投資 款 資 金 資 由上表可以看出,變量其他投資和自籌資金相關(guān)性比較強(qiáng),其次變量自籌資金和利用外資也具有很強(qiáng)的相關(guān)性。
KMO 和 Bartlett 的檢驗(yàn)
取樣足夠度的
Kaiser-Meyer-Olkin 度量。
Bartlett 的球近似卡方
形度檢驗(yàn)
df
Sig.
通過(guò)KMD和 Bartlett 的檢驗(yàn),顯著性檢驗(yàn)值為0,小于0.05,因此拒絕原假設(shè),可以進(jìn)行因子分析。 119.61經(jīng)濟(jì)與管理學(xué)院 國(guó)貿(mào)09(1)班 姓名:丁敏 學(xué)號(hào):2009165074
公因子方差
初始 提取
國(guó)家預(yù)算內(nèi)資金(1995年、國(guó)內(nèi)貸款 利用外資 自籌資金 其他投資 提取方法:主成份分析。
從解釋的總方差的表格中可以看出,成份1和成份2 的方差貢獻(xiàn)率的和為88.970%,大于85%,因此僅提取成份1 和成份2 就可以。成份1和成份2的命名分別為經(jīng)濟(jì)因素和文化技術(shù)因素。
成份矩陣a
成份
1 2
國(guó)家預(yù)算內(nèi)資金(1995年、億元)國(guó)內(nèi)貸款 利用外資 自籌資金 其他投資 經(jīng)濟(jì)與管理學(xué)院 國(guó)貿(mào)09(1)班 姓名:丁敏 學(xué)號(hào):2009165074
提取方法 :主成份。
a. 已提取了 2 個(gè)成份?!居胹pss將詞篇矩陣轉(zhuǎn)成相似矩陣】
通過(guò)旋轉(zhuǎn)成份矩陣,可以寫(xiě)出成份1和成份2的方程,用x1、x2、x3、x4、x5、x6分別代表上述六個(gè)變量: F1=0.443X1+0.877X2+0.906X3+0.959X4+0.906X5【用spss將詞篇矩陣轉(zhuǎn)成相似矩陣】
F2=0.882X1+0.160X2-0.199X3-0.132X4-0.247X5
因此,F(xiàn)的方程為:
F=0.944F1+0.056F2 旋轉(zhuǎn)成份矩陣a
成份
1 2
國(guó)家預(yù)算內(nèi)資金(1995年、億元)國(guó)內(nèi)貸款 利用外資 自籌資金 其他投資 提取方法 :主成份。
旋轉(zhuǎn)法 :具有 Kaiser 標(biāo)準(zhǔn)化的正
交旋轉(zhuǎn)法。
a. 旋轉(zhuǎn)在 3 次迭代后收斂。
成份轉(zhuǎn)換矩陣
成份1 2
1 2 提取方法 :主成份。
旋轉(zhuǎn)法 :具有
Kaiser 標(biāo)準(zhǔn)化的正
交旋轉(zhuǎn)法。
經(jīng)濟(jì)與管理學(xué)院 國(guó)貿(mào)09(1)班 姓名:丁敏學(xué)號(hào):2009165074
成份得分協(xié)方差矩陣
成份1 2
1 2 提取方法 :主成份。
旋轉(zhuǎn)法 :具有
Kaiser 標(biāo)準(zhǔn)化的正
交旋轉(zhuǎn)法。
經(jīng)濟(jì)與管理學(xué)院 國(guó)貿(mào)09(1)班 姓名:丁敏學(xué)號(hào):2009165074
根據(jù)變量F得到的基本建設(shè)投資綜合排名如下:
經(jīng)濟(jì)與管理學(xué)院 國(guó)貿(mào)09(1)班 姓名:丁敏 學(xué)號(hào):2009165074
用spss將詞篇矩陣轉(zhuǎn)成相似矩陣(二)
SPSS中詞語(yǔ)中英文對(duì)照
SPSS中詞語(yǔ)中英文對(duì)照
1. mean–平均數(shù)
2. std.deviation–標(biāo)準(zhǔn)差
3. dependent list–因變量
4. independent list–自變量
5. option–選擇
6. data editor–數(shù)據(jù)編輯窗口,顯示并編輯數(shù)據(jù)
7. syntax editor–命令語(yǔ)句窗口,用戶可以直接編寫(xiě)spss程序語(yǔ)句,然后運(yùn)行,所起的作用
與菜單操作是一樣的
8. spss viewer–結(jié)果輸出窗口,統(tǒng)計(jì)結(jié)果、操作錯(cuò)誤提示及警告等信息都在這個(gè)窗口顯示
9. number of cases–樣本量
10. Spss菜單下方的快捷鍵按鈕分別表示open–打開(kāi)已創(chuàng)建的文件 save–保存新建或已
創(chuàng)建的文件 print–打印文件 dialog recall–重新打開(kāi)使用過(guò)的對(duì)話框 undo–撤銷(xiāo)上一步的數(shù)據(jù)或變量操作 redo–回復(fù)撤消操作 goto chart–定位圖表 goto case–定位觀測(cè)量 variables–顯示變量信息 find–查找變量值 insert cases–在數(shù)據(jù)中插入新的觀測(cè)量 insert variable–在數(shù)據(jù)中插入新的變量 split file–用指定變量分隔一個(gè)數(shù)據(jù)文件 weight cases–為觀測(cè)量分配權(quán)重 select cases–使用特定標(biāo)準(zhǔn)選擇觀測(cè)量集合 value labels–顯示或隱藏變量值標(biāo)簽 use sets–創(chuàng)建變量集合
11. Spss窗口最下方的狀態(tài)欄在沒(méi)有運(yùn)行命令時(shí)通常顯示為spss processor is ready,表示可
以接受用戶的操作。在運(yùn)行命令時(shí)通常顯示為running……,后面顯示相應(yīng)的統(tǒng)計(jì)命令關(guān)鍵字。如果spss不能正常使用,則狀態(tài)欄會(huì)有相應(yīng)的消息顯示。
12. 把菜單操作過(guò)程轉(zhuǎn)化為程序語(yǔ)句:?jiǎn)螜C(jī)主菜單edit,在下拉菜單中選擇options,進(jìn)入主
對(duì)話框,在該對(duì)話框上部的一系列標(biāo)簽中單擊viewer,然后選中左下方的可選項(xiàng)“display commands in the output”。同時(shí)在上方的item 選項(xiàng)中的log下選中contents are shown。現(xiàn)在,您的每一次操作都會(huì)在結(jié)果輸出窗口中顯示相應(yīng)的程序語(yǔ)句。
13. 在initial output state 中的item包含了多項(xiàng)控制spss基本輸出形式的選項(xiàng),當(dāng)選中其中
一項(xiàng)時(shí),下面的contents are 都對(duì)應(yīng)著兩個(gè)可選項(xiàng):shown或hidden,即表示在結(jié)果窗口中顯示或隱藏相應(yīng)的內(nèi)容。Item的各項(xiàng)內(nèi)容如下:
Log運(yùn)行記錄,以語(yǔ)句形式記錄spss從啟動(dòng)到關(guān)閉期間所有的用戶操作。 Warning是否顯示所用程序語(yǔ)句中的錯(cuò)誤警告信息。
Notes是否顯示說(shuō)明
Titles是否顯示統(tǒng)計(jì)過(guò)程的標(biāo)題
Pivot tables是否顯示統(tǒng)計(jì)表格
Chart是否顯示統(tǒng)計(jì)圖
Text output 是否顯示文本形式的輸出結(jié)果。Spss大多數(shù)統(tǒng)計(jì)結(jié)果以表格形式輸出,但也有一些以文本形式輸出。
用spss將詞篇矩陣轉(zhuǎn)成相似矩陣(三)
spss學(xué)習(xí)筆記
你的旋轉(zhuǎn)方法有問(wèn)題,一般是用方差最大化旋轉(zhuǎn)來(lái)分析的
說(shuō)明你的數(shù)據(jù)不太好,可以考慮斜交
用旋轉(zhuǎn)成份矩陣,里面的數(shù)值最好保留0.45以上的,叫因素負(fù)荷量。這樣你各個(gè)維度有多少題就出來(lái)了。
用直交旋轉(zhuǎn)的圖 直交旋轉(zhuǎn)后因素解釋更為顯著
在進(jìn)行主成分分析時(shí),一般取初始因子載荷系數(shù)絕對(duì)值大于幾的變量?(大于0.4)
你肯定是選擇了正交或斜交旋轉(zhuǎn)才會(huì)產(chǎn)生“旋轉(zhuǎn)成分矩陣”,你可以用主成分分析法來(lái)做一下就會(huì)發(fā)現(xiàn)沒(méi)有“旋轉(zhuǎn)成分矩陣”了,所以兩者是沒(méi)有關(guān)系的,因?yàn)椤俺煞志仃嚒笔侵鞒煞址治龇ǖ玫降?,“旋轉(zhuǎn)成分矩陣”是因子分析得到的,(主成分分析和因子分析的關(guān)系應(yīng)該知道吧,理解一下就ok了)。
因子載荷的意思是左邊的和因子的相關(guān)系數(shù)。因子載荷在“成分矩陣”里分別是0.778、0.453、0.553、0.785,這是左邊的那些TB對(duì)上面的因子的載荷——因此可以說(shuō)是因子1=0.778*TB3+0.453*TB4+0.553*TB1+0.785*TB2,(我這么說(shuō)我像你應(yīng)該能理解因子2的公式了吧)。 因子載荷在旋轉(zhuǎn)成分矩陣?yán)镆彩且粯拥倪@種縱向的公式。
不知道你的問(wèn)題解決了么,我回答你的三個(gè)問(wèn)題。
第一個(gè):成分矩陣是各個(gè)原始變量的主成分表達(dá)式的系數(shù);旋轉(zhuǎn)成分矩陣是成分矩陣正交變換(還有其他方法)得到的;成分得分矩陣表示各項(xiàng)指標(biāo)變量與提取的公因子之間的關(guān)【用spss將詞篇矩陣轉(zhuǎn)成相似矩陣】
系。簡(jiǎn)單來(lái)說(shuō)通過(guò)成分矩陣可以得到原始指標(biāo)變量的線性組合,如TB3=0.778*F1-0.414*F2,其中F1、F2分別為提取的公因子;通過(guò)成分得分矩陣可以得到公因子的線性組合,如F1=0.56*TB30.97*TB4+0.02*TB1+0.57*TB2。
第二個(gè)問(wèn)題:因子載荷量也就是成分載荷量,因子矩陣與成分矩陣可以理解為同一個(gè)意思。所以因子載荷量就是成分矩陣中的數(shù)字。
第三個(gè)問(wèn)題:你這四個(gè)元素的因子載荷量就是成分矩陣中的數(shù)字。
這些問(wèn)題可以歸結(jié)到一起就是,因子的載荷是什么?怎么看?其實(shí)因子載荷就是提取出的公因子的系數(shù)。
額外給你說(shuō)一下旋轉(zhuǎn)成分矩陣,這個(gè)一般是在分析每個(gè)公因子受什么影響時(shí),才會(huì)用到。
因子旋轉(zhuǎn)
在對(duì)社會(huì)調(diào)查數(shù)據(jù)進(jìn)行分析時(shí),除了把相關(guān)的問(wèn)題綜合成因子并保留大的因子,研究者往往還需要對(duì)因子與測(cè)度項(xiàng)之間的關(guān)系進(jìn)行檢驗(yàn),以確保每一個(gè)主要的因子(主成分)對(duì)應(yīng)于一組意義相關(guān)的測(cè)度項(xiàng)。為了更清楚的展現(xiàn)因子與測(cè)度項(xiàng)之間的關(guān)系,研究者需要進(jìn)行因子旋轉(zhuǎn)。常見(jiàn)的旋轉(zhuǎn)方法是VARIMAX旋轉(zhuǎn)。旋轉(zhuǎn)之后,如果一個(gè)測(cè)度項(xiàng)與對(duì)應(yīng)的因子的相關(guān)度很高(>0.5)就被認(rèn)為是可以接受的。如果一個(gè)測(cè)度項(xiàng)與一個(gè)不對(duì)應(yīng)的因子的相關(guān)度過(guò)高(>0.4),則是不可接受的,這樣的測(cè)度項(xiàng)可能需要修改或淘汰。
用spss將詞篇矩陣轉(zhuǎn)成相似矩陣(四)
關(guān)鍵詞共詞分析法:高等教育研究的新方法
摘要:關(guān)鍵詞共詞分析法是一種較新的科學(xué)計(jì)量分析方法,它主要通過(guò)對(duì)高頻關(guān)鍵詞對(duì)在同一篇文章中出現(xiàn)的頻次進(jìn)行統(tǒng)計(jì)分析,生成共被引矩陣。在此基礎(chǔ)上,通過(guò)統(tǒng)計(jì)軟件,進(jìn)行聚類(lèi)分析、多維尺度分析、因子分析、主成分分析、社會(huì)網(wǎng)絡(luò)分析等高級(jí)統(tǒng)計(jì)處理,繪制出二維或者三維的可視化圖形,客觀系統(tǒng)的展示出所關(guān)注資料的直觀量化信息。在我國(guó)高等教育研究領(lǐng)域較少有學(xué)者對(duì)此方法進(jìn)行論述,為了幫助大家更好地了解和掌握此方法,本文以2000-2012年《教育研究》文獻(xiàn)熱點(diǎn)知識(shí)圖譜作為實(shí)例,詳細(xì)展示了此方法的使用過(guò)程和注意事項(xiàng)。
一、引言
隨著研究成果的激增,數(shù)字化期刊的盛行及互聯(lián)網(wǎng)使用的便捷化,可以通過(guò)網(wǎng)上搜索引擎快捷的查詢并獲得這些成果。在應(yīng)對(duì)海量數(shù)字信息的今天,傳統(tǒng)文獻(xiàn)計(jì)量和綜述方式,不僅耗費(fèi)時(shí)間、效率低下、查詢資料的時(shí)間跨度短,而且難以全面搜集海量文獻(xiàn)信息,造成文獻(xiàn)研究偏于定性歸納、過(guò)于主觀。[1]激增的數(shù)據(jù)背后隱藏著許多重要的信息,缺乏挖掘數(shù)據(jù)背后隱藏的知識(shí)的手段,導(dǎo)致了“數(shù)據(jù)爆炸但知識(shí)貧乏”。[2]如何在浩如煙海的數(shù)字文獻(xiàn)中,將這些零散的信息全面、快速綜合起來(lái),挖掘出有深度的信息為我所用,已經(jīng)成為眾多研究者關(guān)注的熱點(diǎn)。隨著計(jì)算機(jī)技術(shù)的不斷提升,以及數(shù)理統(tǒng)計(jì)方法的完善,研究者使用計(jì)算機(jī)進(jìn)行數(shù)據(jù)挖掘(Data Mining,DM)的能力得以大大提升。在此背景下,科學(xué)知識(shí)圖譜開(kāi)始成為當(dāng)前國(guó)際科學(xué)計(jì)量學(xué)領(lǐng)域熱門(mén)的方法之一。它是通過(guò)將科學(xué)計(jì)量學(xué)的引文分析方法與可視化技術(shù)相結(jié)合達(dá)到對(duì)信息的有效組織和利用,生成新的知識(shí)。[3]該方法首先,通過(guò)計(jì)算機(jī)和互聯(lián)網(wǎng)搜索引擎強(qiáng)大的自動(dòng)查詢功能,在極短的時(shí)間里面完成對(duì)海量信息的準(zhǔn)確查詢。其次,通過(guò)計(jì)算機(jī)對(duì)已查詢到的海量分散信息進(jìn)行文獻(xiàn)計(jì)量統(tǒng)計(jì)分析,不僅可以通過(guò)量化模型將其以科學(xué)的、可視化的形式直觀的呈現(xiàn)出來(lái),而且還可以發(fā)現(xiàn)它們之間的深層次關(guān)系和趨勢(shì),對(duì)將要進(jìn)行的同領(lǐng)域的研究提供科學(xué)的指導(dǎo)。該方法被國(guó)內(nèi)外的許多科學(xué)計(jì)量學(xué)研究者應(yīng)用于學(xué)科前沿的研究。但是,國(guó)內(nèi)教育研究方法方面還比較落后。許多現(xiàn)代科學(xué)研究方法在教育科研中應(yīng)用得很少,現(xiàn)代數(shù)學(xué)遲遲未被引進(jìn)到教育科學(xué)中來(lái)。[4]對(duì)于科學(xué)計(jì)量方法在教育研究中應(yīng)用的專(zhuān)題介紹性文獻(xiàn)并不多見(jiàn)。我們?cè)谧珜?xiě)本文前,使用關(guān)鍵詞共詞分析方法分別對(duì)國(guó)內(nèi)特殊教育和自閉癥(孤獨(dú)癥)[5]相關(guān)研究成果進(jìn)行了梳理和總結(jié),積累了一定的經(jīng)驗(yàn),同時(shí),該方法對(duì)大量文獻(xiàn)綜合處理的高效性、準(zhǔn)確性、客觀性和直觀性給我們留下了深刻的印象。為了幫助國(guó)內(nèi)的高等教育研究者能夠?qū)@種方法有所了解,并且能夠在今后的研究中更多的使用這種方法,提升自己教育科研的準(zhǔn)確性和科學(xué)性,下面,我們以代表國(guó)內(nèi)教育最高研究水準(zhǔn)的教育類(lèi)的核心期刊《教育研究》在2000-2012年發(fā)表的所有文獻(xiàn)作為研究資料,向大家展示該方法的具體使用過(guò)程和注意事項(xiàng)。
二、關(guān)鍵詞共詞分析方法
(一)關(guān)鍵詞共詞分析方法簡(jiǎn)介
共詞分析(Co-word Analysis)是一種較新的文獻(xiàn)計(jì)量學(xué)方法,其屬于內(nèi)容分析方法的一種。其主要原理是對(duì)一組詞兩兩統(tǒng)計(jì)它們?cè)谕黄墨I(xiàn)中出現(xiàn)的次數(shù),以此為基礎(chǔ)對(duì)這些詞進(jìn)行聚類(lèi)分析,從而反映出這些詞之間的親疏關(guān)系,進(jìn)而分析這些詞所代表的學(xué)科或主題的結(jié)構(gòu)與變化。[6]共詞分析法可分別以文獻(xiàn)的主題詞和關(guān)鍵詞進(jìn)行共詞分析,但我們傾向于主張采用關(guān)鍵詞進(jìn)行共詞分析來(lái)得出結(jié)論,主要原因有:第一,關(guān)鍵詞是論文中起關(guān)鍵作用的、最能說(shuō)明問(wèn)題的、代表論文內(nèi)容特征的、或最有意義的詞[7];第二,關(guān)鍵詞不僅準(zhǔn)確地反映論文的主題,而且其本身應(yīng)具有獨(dú)立的檢索功能;第三,由于一篇文獻(xiàn)的關(guān)鍵詞或主題詞是文章核心內(nèi)容的濃縮和提煉,因此,如果某一關(guān)鍵詞或主題詞在其所在的領(lǐng)域的文獻(xiàn)中反復(fù)出現(xiàn),則可反映出該關(guān)鍵詞或主題詞所表征的研究主題是該領(lǐng)域的研究熱點(diǎn)[8];第四,通過(guò)對(duì)高頻關(guān)鍵詞共現(xiàn)關(guān)系分析,可以進(jìn)一步明晰若干熱點(diǎn)研究領(lǐng)域。[9]關(guān)鍵詞共詞分析主要是通過(guò)共詞分析軟件,對(duì)符合條件的查詢到的海量信息的關(guān)鍵詞對(duì)在同一篇文章中出現(xiàn)的頻次進(jìn)行統(tǒng)計(jì)分析(共詞分析),生成共被引矩陣。在此基礎(chǔ)上,利用統(tǒng)計(jì)軟件,進(jìn)行聚類(lèi)分析、多維尺度分析、因子分析、主成分分析、社會(huì)網(wǎng)絡(luò)分析等高級(jí)統(tǒng)計(jì)處理,繪制出二維或者三維的可視化圖形,客觀系統(tǒng)的展示出所關(guān)注資料的直觀量化信息。
(二)關(guān)鍵詞共詞分析方法的具體操作過(guò)程
1.準(zhǔn)備研究工具
下載并安裝Bicomb共詞分析軟件和SPSS20作為主要研究工具。Bicomb共詞分析軟件由中國(guó)醫(yī)科大學(xué)醫(yī)學(xué)信息學(xué)系崔雷教授和沈陽(yáng)市弘盛計(jì)算機(jī)技術(shù)有限公司開(kāi)發(fā)。下載獲取地址為崔雷教授科學(xué)網(wǎng)的博客網(wǎng)址:https://skydrive.live.com/?cid=3adcb3b569c0a509&id=3ADCB3B569C0A509%211195。
2.準(zhǔn)備研究資料
首先,進(jìn)入網(wǎng)絡(luò)搜索引擎,根據(jù)自己研究目的限定文獻(xiàn)來(lái)源,進(jìn)行文獻(xiàn)檢索。根據(jù)自己研究需要和目的對(duì)文獻(xiàn)進(jìn)行取舍和保留。再次,對(duì)選取的文獻(xiàn)按照統(tǒng)一格式進(jìn)行保存。第三,對(duì)保存的文獻(xiàn)進(jìn)行標(biāo)準(zhǔn)化。最后,將保留文獻(xiàn)的格式轉(zhuǎn)化為Bicomb共詞分析軟件能夠識(shí)別的ANSI編碼,供后續(xù)量化統(tǒng)計(jì)分析使用。這里值得注意的是,如果不將文本格式編碼轉(zhuǎn)為ANSI編碼,Bicomb共詞分析軟件將無(wú)法識(shí)別有效信息。
3.進(jìn)行量化統(tǒng)計(jì)分析
首先,使用Bicomb軟件進(jìn)行關(guān)鍵詞統(tǒng)計(jì)并確定提取、導(dǎo)出高頻關(guān)鍵詞詞篇矩陣。有關(guān)Bicomb軟件進(jìn)行關(guān)鍵詞統(tǒng)計(jì)的詳細(xì)操作過(guò)程請(qǐng)閱讀相關(guān)操作手冊(cè)。[10]其次,采用SPSS20對(duì)高頻關(guān)鍵詞進(jìn)行聚類(lèi)分析并生成Ochiai系數(shù)相同矩陣。再次,采用SPSS將高頻關(guān)鍵詞的相同矩陣轉(zhuǎn)化為相異矩陣并進(jìn)行多維尺度分析。最后,對(duì)上述量化結(jié)果進(jìn)行定量和定性結(jié)合的分析,得出相應(yīng)的結(jié)論和建議。 概括而言,關(guān)鍵詞共詞分析法的一般過(guò)程包括:明確研究的問(wèn)題、選定并標(biāo)準(zhǔn)化研究材料、高頻關(guān)鍵詞的選定、共現(xiàn)矩陣的提取、進(jìn)行高級(jí)統(tǒng)計(jì)處理(相同矩陣、相異矩陣的轉(zhuǎn)化、聚類(lèi)分析、多維尺度分析)。
三、關(guān)鍵詞共詞分析方法示例
為了更好的使大家掌握該方法,下面,我們以“2000-2012年《教育研究》文獻(xiàn)熱點(diǎn)知識(shí)圖譜”為例向大家進(jìn)行詳細(xì)的示范說(shuō)明。
(一)查找準(zhǔn)備文獻(xiàn)
首先,進(jìn)入中國(guó)學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫(kù),進(jìn)入標(biāo)準(zhǔn)檢索對(duì)話框,將發(fā)表時(shí)間欄的具體日期定義為從“2000-01-01”到“2012-12-31”,文獻(xiàn)出版來(lái)源限定為“《教育研究》”。根據(jù)限定好的條件進(jìn)行文獻(xiàn)檢索,檢索到文獻(xiàn)2908條。其次,根據(jù)研究需要?jiǎng)h除研討會(huì)綜述、課題介紹、會(huì)議通知、卷首語(yǔ)、會(huì)議記錄、課題通過(guò)鑒定、讀后感、簡(jiǎn)介、研討會(huì)簡(jiǎn)介、書(shū)評(píng)、成果鑒定會(huì)、學(xué)院以及學(xué)校簡(jiǎn)介信息、人物專(zhuān)訪、投稿須知、會(huì)議紀(jì)要、出版信息、目錄信息、公告等,得到有效論文2550篇。再次,對(duì)上述文獻(xiàn)統(tǒng)一按照題名、作者、關(guān)鍵詞、單位、摘要、年、期等信息以文本形式保存。最后將保存的文本信息編碼格式統(tǒng)一改為ANSI編碼后保存。
(二)進(jìn)行量化統(tǒng)計(jì)
1.進(jìn)行關(guān)鍵詞詞頻統(tǒng)計(jì)分析并提取高頻關(guān)鍵詞頻次
一個(gè)學(xué)術(shù)研究領(lǐng)域較長(zhǎng)時(shí)域內(nèi)的大量學(xué)術(shù)研究成果的關(guān)鍵詞集合,可以揭示研究成果的總體內(nèi)容特征、研究?jī)?nèi)容之間的內(nèi)在聯(lián)系、學(xué)術(shù)研究發(fā)展的脈絡(luò)與發(fā)展方向等。[11]如果在統(tǒng)計(jì)文獻(xiàn)時(shí),關(guān)鍵詞出現(xiàn)的頻次越高,則表示與該關(guān)鍵詞有關(guān)的研究成果越多,研究?jī)?nèi)容的集中性就越強(qiáng)。一個(gè)研究領(lǐng)域的少量高頻次的關(guān)鍵詞,擁有該學(xué)科明顯大的信息密度與知識(shí)密度,成為信息與知識(shí)需求者檢索文獻(xiàn)的重點(diǎn),它們被稱(chēng)為核心關(guān)鍵詞。[12]詞頻分析法是利用能夠揭示或表達(dá)文獻(xiàn)核心內(nèi)容的關(guān)鍵詞或主題詞在某一研究領(lǐng)域文獻(xiàn)中出現(xiàn)的頻次高低來(lái)確定該領(lǐng)域研究熱點(diǎn)和發(fā)展動(dòng)向的文獻(xiàn)計(jì)量方法。[13]
對(duì)2550篇文章中的15976個(gè)關(guān)鍵詞進(jìn)行詞頻統(tǒng)計(jì)分析,發(fā)現(xiàn)關(guān)鍵詞出現(xiàn)的頻次范圍是1-107。為了減輕工作量,對(duì)關(guān)鍵詞頻次大于20的高頻關(guān)鍵詞進(jìn)行提取,結(jié)果見(jiàn)表1。
從表1可以看出,頻次大于等于20的有52個(gè)關(guān)鍵詞,占關(guān)鍵詞總數(shù)的3.25%,其出現(xiàn)的頻次合計(jì)為1839次,詞均35.37次,占關(guān)鍵詞總頻次(15976)的11.51%。這些高頻關(guān)鍵詞表述的研究?jī)?nèi)容,是2000-2012年《教育研究》發(fā)表文章的核心內(nèi)容。從高頻關(guān)鍵詞分布順序可看出,《教育研究》涉及的前10個(gè)研究熱點(diǎn)依次為:高等教育(107)、基礎(chǔ)教育(69)、教育公平(63)、教育改革(59)、教師(59)、教育研究(54)、課程改革(52)、教師教育(52)、教育發(fā)展(48)、教育理論(44)。這一統(tǒng)計(jì)結(jié)果,與2000-2009年八種教育學(xué)期刊文獻(xiàn)前10位高頻關(guān)鍵詞(高等教育、課程改革、教育研究、教育改革、素質(zhì)教育、教學(xué)改革、基礎(chǔ)教育、課堂教學(xué)、教師、教育理論)對(duì)比,有7個(gè)高頻關(guān)鍵詞完全重合,排在第一位的高等教育和最后一位的教育理論在排序上完全吻合,其它5個(gè)僅在排列順序上發(fā)生差異。這一結(jié)果不僅驗(yàn)證了本研究中統(tǒng)計(jì)方法的可信,而且還進(jìn)一步說(shuō)明相對(duì)于其它教育研究刊物,《教育研究》起著風(fēng)向標(biāo)的作用。
為深入挖掘這52個(gè)高頻關(guān)鍵詞的詞頻之間的關(guān)系以及它們背后隱藏的有效信息,還需要進(jìn)一步采用關(guān)鍵詞共現(xiàn)技術(shù)來(lái)進(jìn)行深入的計(jì)量學(xué)研究。
2.生成高頻關(guān)鍵詞的相同和相異矩陣
首先,生成高頻關(guān)鍵詞詞篇矩陣。對(duì)各個(gè)高頻關(guān)鍵詞是否在其它論文中成對(duì)出現(xiàn)(出現(xiàn)為1,否則為0),利用Bicomb軟件生成高頻關(guān)鍵詞詞篇矩陣。詞篇矩陣考察各高頻關(guān)鍵詞間的親疏關(guān)系,詞篇矩陣表示的是兩目標(biāo)之間的相似程度的矩陣,即兩者數(shù)字越大表明兩者關(guān)系越近,越小表明兩者關(guān)系越遠(yuǎn)。[14]其次,生成高頻關(guān)鍵詞相似系數(shù)矩陣。以關(guān)鍵詞詞篇矩陣為基礎(chǔ),在SPSS20中進(jìn)行相關(guān)分析,數(shù)據(jù)類(lèi)型選擇“binary”二元變量,相似系數(shù)選擇“Ochiai”系數(shù),構(gòu)造出高頻關(guān)鍵詞相似系數(shù)矩陣。[15]相似矩陣中的數(shù)字表明數(shù)據(jù)間的相似性,數(shù)字的大小表明了相應(yīng)的兩個(gè)關(guān)鍵詞之間的距離遠(yuǎn)近,其數(shù)值越接近1,表明關(guān)鍵詞之間的距離越近、相似度越大;反之,數(shù)值越接近0,則表明關(guān)鍵詞之間的距離越大、相似度越小。最后,生成高頻關(guān)鍵詞相異系數(shù)矩陣。為了消除由于關(guān)鍵詞共現(xiàn)次數(shù)差異所帶來(lái)的影響,根據(jù)相似系數(shù)矩陣,采用相異系數(shù)矩陣=1-相似系數(shù)矩陣,產(chǎn)生相異系數(shù)矩陣。相異系數(shù)矩陣中數(shù)字表明數(shù)據(jù)間的相異性,其含義與相似系數(shù)矩陣意義相反,數(shù)值越接近1,表明關(guān)鍵詞之間的距離越大。相異系數(shù)矩陣結(jié)果見(jiàn)表2。
從表2可以看出,各關(guān)鍵詞分別與高等教育距離由遠(yuǎn)及近的順序依次為:教師(1.000)、教育研究(1.000)、課程改革(1.000)、教師教育(1.000)、基礎(chǔ)教育(0.988)、教育改革(0.908)、教育公平(0.963)。這個(gè)結(jié)果說(shuō)明,研究者在論及高等教育時(shí),會(huì)更多的將其與教師、教育研究、課程改革與教師教育結(jié)合在一起討論,而較少和基礎(chǔ)教育、教育改革、教育公平結(jié)合起來(lái)。采用上述原理,綜合表2中的關(guān)鍵詞相異系數(shù)矩陣數(shù)據(jù),可以初步得出的結(jié)論為:2000-2012年在《教育研究》發(fā)表的成果中,涉及到基礎(chǔ)教育與課程改革的資料較少,大量研究主要以高等教育為探討對(duì)象,關(guān)注高等教育中涉及的教師、教育研究、課程改革及教師教育等主要因素,對(duì)這些因素予以了更多的關(guān)注。出現(xiàn)這一結(jié)果的原因,一方面是《教育研究》從2004年開(kāi)始增大了對(duì)“教師”這一關(guān)鍵詞的關(guān)注,開(kāi)辟了專(zhuān)欄。另一方面的原因是,2001年“教師教育”被國(guó)務(wù)院首次提出后,引起了多方面尤其是教育界對(duì)此問(wèn)題的高度重視。
3.進(jìn)行高頻關(guān)鍵詞聚類(lèi)分析
聚類(lèi)分析是選定一些分類(lèi)標(biāo)準(zhǔn),將不同的觀察體加以分類(lèi),同一類(lèi)(集群)之內(nèi)觀察體彼此的相似度愈高愈好,而不同一類(lèi)之間觀察體彼此的相異度愈高愈好。[16]高頻關(guān)鍵詞聚類(lèi)分析是通過(guò)高級(jí)統(tǒng)計(jì)對(duì)已經(jīng)發(fā)表文獻(xiàn)的高頻關(guān)鍵詞組的相似性與相異性分析,來(lái)發(fā)現(xiàn)它們之間的遠(yuǎn)近關(guān)系,挖掘隱藏在它們背后的研究者關(guān)心的知識(shí)信息。關(guān)鍵詞聚類(lèi)分析時(shí),先以最有影響的關(guān)鍵詞(種子關(guān)鍵詞)生成聚類(lèi);再次,由聚類(lèi)中的種子關(guān)鍵詞及相鄰的關(guān)鍵詞再組成一個(gè)新的聚類(lèi)。關(guān)鍵詞越相似它們的距離越近,反之,則越遠(yuǎn)。 將上述52個(gè)高頻關(guān)鍵詞構(gòu)成的52×52的相似系數(shù)矩陣,導(dǎo)入SPSS20進(jìn)行聚類(lèi)分析。結(jié)果見(jiàn)圖1。
從圖1可以直觀的看出2000-2012年《教育研究》高頻關(guān)鍵詞被分為8個(gè)種類(lèi),它們的具體分布結(jié)果見(jiàn)表3。
從表3可以看出,2000-2012年《教育研究》8類(lèi)研究具體分布為:
種類(lèi)1為教學(xué)過(guò)程中的活動(dòng)和改革,包括14個(gè)關(guān)鍵詞,其可以細(xì)分為6小類(lèi):小類(lèi)1基礎(chǔ)教育教學(xué)活動(dòng)及過(guò)程,包括3個(gè)關(guān)鍵詞(教學(xué)過(guò)程、教學(xué)活動(dòng)、基礎(chǔ)教育課程);小類(lèi)2教學(xué)改革與教學(xué)論,包括2個(gè)關(guān)鍵詞(教學(xué)改革、教學(xué)論);小類(lèi)3教學(xué)模式與課堂教學(xué),包括2個(gè)關(guān)鍵詞(教學(xué)模式、課堂教學(xué));小類(lèi)4學(xué)生、教師及其發(fā)展,包括3個(gè)關(guān)鍵詞(學(xué)生、發(fā)展 、教師);小類(lèi)5師生關(guān)系,包括1個(gè)關(guān)鍵詞(師生關(guān)系);小類(lèi)6基礎(chǔ)教育及素質(zhì)教育的課程改革,包括3個(gè)關(guān)鍵詞(基礎(chǔ)教育、課程改革、素質(zhì)教育)。
種類(lèi)2為道德教育與生活,包括2個(gè)關(guān)鍵詞(道德教育、生活世界)。
種類(lèi)3為教育與課程,包括2個(gè)關(guān)鍵詞(教育、課程)。
種類(lèi)4為學(xué)校教育、義務(wù)教育及教育政策、觀念,包括16個(gè)關(guān)鍵詞,其可以細(xì)分為7小類(lèi):小類(lèi)1學(xué)校教育與職業(yè)教育,包括2個(gè)關(guān)鍵詞(學(xué)校教育 、職業(yè)教育);小類(lèi)2農(nóng)村教育和農(nóng)村義務(wù)教育,包括2個(gè)關(guān)鍵詞(農(nóng)村教育、農(nóng)村義務(wù)教育);小類(lèi)3義務(wù)教育和均衡發(fā)展,包括2個(gè)關(guān)鍵詞(義務(wù)教育、均衡發(fā)展);小類(lèi)4教育公平、質(zhì)量及政策,包括3個(gè)關(guān)鍵詞(教育公平 、教育質(zhì)量、教育政策);小類(lèi)5教育資源,包括1個(gè)關(guān)鍵詞(教育資源);小類(lèi)6教育發(fā)展與教育科研,包括2個(gè)關(guān)鍵詞(教育發(fā)展、教育科研);小類(lèi)7教育理念及對(duì)學(xué)習(xí)者的關(guān)注,包括4個(gè)關(guān)鍵詞(以人為本 、科學(xué)發(fā)展觀、教育理念 、學(xué)習(xí)者)。
種類(lèi)5為大學(xué)及學(xué)科建設(shè),包括2個(gè)關(guān)鍵詞(大學(xué) 、學(xué)科建設(shè))。
種類(lèi)6為教師教育、教育理論與教育思想,包括10個(gè)關(guān)鍵詞,其可以細(xì)分為3小類(lèi):小類(lèi)1教師教育及其專(zhuān)業(yè)發(fā)展,包括3個(gè)關(guān)鍵詞(教師教育 、教師專(zhuān)業(yè)發(fā)展、中小學(xué)教師);小類(lèi)2教學(xué)理論、研究及實(shí)踐與改革,包括6個(gè)關(guān)鍵詞(教育理論、理論與實(shí)踐 、教育研究 、教育實(shí)踐 、教育學(xué) 、教育改革);小類(lèi)3教育思想,包括1個(gè)關(guān)鍵詞(教育思想)。
種類(lèi)7為高等職業(yè)教育和民辦教育,包括2個(gè)關(guān)鍵詞(高等職業(yè)教育、民辦教育)。
種類(lèi)8為高等教育、高等學(xué)校與價(jià)值取向,包括4個(gè)關(guān)鍵詞,可以細(xì)分為2小類(lèi):小類(lèi)1高等教育與大學(xué)生價(jià)值取向,包括3個(gè)關(guān)鍵詞(高等教育 、大學(xué)生 、價(jià)值取向);小類(lèi)2高等學(xué)校,包括1個(gè)關(guān)鍵詞(高等學(xué)校)。
4.進(jìn)行高頻關(guān)鍵詞的多維尺度分析
多維尺度分析(MDS)是一種可以幫助研究者找出隱藏在觀察資料內(nèi)的深層結(jié)構(gòu)的統(tǒng)計(jì)方法,其目的是在發(fā)掘一組資料背后之隱藏結(jié)構(gòu),希望用主要元素所構(gòu)成的構(gòu)面圖來(lái)表達(dá)出資料所隱藏的內(nèi)涵,尤其是在觀察資料體很多時(shí),利用多維尺度法更能適切地找出資料的代表方式。[16]采用多維尺度分析時(shí),要匯報(bào)其 Stress和RSQ值,它們分別為多維尺度分析中的信度和效度估計(jì)值。其中,壓力系數(shù)(Stress)是擬合度量值,用于維度數(shù)的選擇,Stress越小,表明分析結(jié)果與觀察數(shù)據(jù)擬合越好,其值越小,說(shuō)明模型的適合度越高。Kruskal(1964)給出了一種根據(jù)經(jīng)驗(yàn)來(lái)評(píng)價(jià)Stress優(yōu)劣的尺度:若Stress≥20%,則近似程度為差(Bad);≤10%,為滿意(Fair);≤5%,則為好(Good);≤2.5%,為很好(Excellent);其理想的狀況為Stress=0,稱(chēng)為完全匹配(Prefect)。[17] 模型距離解釋的百分比(RSQ),表示變異數(shù)能被其相對(duì)應(yīng)的距離解釋的比例,也就是回歸分析中回歸分析變異量所占的比率,RSQ值越大,即越接近1,代表所得到的構(gòu)形上各點(diǎn)之距離與實(shí)際輸入之距離越適合。一般認(rèn)為,RSQ在0.60以上是可接受的。[18]
采用spss20對(duì)上述52個(gè)高頻關(guān)鍵詞構(gòu)成的52×52的聚類(lèi)分析產(chǎn)生的矩陣進(jìn)行多維尺度分析,標(biāo)準(zhǔn)化方法選擇Z分?jǐn)?shù)。結(jié)果顯示,Stress= 0.120,RSQ= 0.823,說(shuō)明其擬合效果較好,可以反映出《教育研究》高頻關(guān)鍵詞間的學(xué)術(shù)聯(lián)系狀況。多維尺度分析結(jié)果見(jiàn)圖2。
多維尺度繪制出的坐標(biāo)稱(chēng)為戰(zhàn)略坐標(biāo),它以向心度和密度為參數(shù)繪制成二維坐標(biāo),可以概括地表現(xiàn)一個(gè)領(lǐng)域或亞領(lǐng)域的結(jié)構(gòu)。[19]戰(zhàn)略坐標(biāo)中,各個(gè)小圓圈代表各個(gè)高頻關(guān)鍵詞所處的位置,圖中圓圈間距離越近,表明它們之間的關(guān)系越緊密;反之,則關(guān)系越疏遠(yuǎn)。影響力最大的關(guān)鍵詞,其所表示的圓圈距離戰(zhàn)略坐標(biāo)的中心點(diǎn)越近。坐標(biāo)橫軸為向心度(Centrality),表示領(lǐng)域間相互影響的強(qiáng)度;縱軸為密度(Density),表示某一領(lǐng)域內(nèi)部聯(lián)系強(qiáng)度。[20]在戰(zhàn)略坐標(biāo)劃分的四個(gè)象限中,一般而言,第一象限的主題領(lǐng)域內(nèi)部聯(lián)系緊密并處于研究網(wǎng)絡(luò)的中心地位。第二象限的主題領(lǐng)域結(jié)構(gòu)比較松散。這些領(lǐng)域的工作有進(jìn)一步發(fā)展的空間,在整個(gè)研究網(wǎng)絡(luò)中具有較大的潛在重要性。第三象限的主題領(lǐng)域內(nèi)部鏈接緊密,題目明確,并且有研究機(jī)構(gòu)在對(duì)其進(jìn)行正規(guī)的研究,但是在整個(gè)研究網(wǎng)絡(luò)中處于邊緣。第四象限的主題領(lǐng)域在整體工作研究中處于邊緣地位,重要性較小。[21]
結(jié)合上述理論,從圖2可以看出,首先,2000-2012年《教育研究》熱點(diǎn)知識(shí)圖譜分為8個(gè)區(qū)域,雖然種類(lèi)1、4和6所占的區(qū)域較大,種類(lèi)2、3、5、7、8所占區(qū)域較小,但從其分布位置可以看出,這些小的區(qū)域處于戰(zhàn)略坐標(biāo)的核心附近,表明這些區(qū)域是其關(guān)注的重點(diǎn)。種類(lèi)7和種類(lèi)8所處的領(lǐng)域距離戰(zhàn)略坐標(biāo)軸心位置最近,表明近幾年高等職業(yè)教育和民辦教育、高等教育、高等學(xué)校與價(jià)值取向成為了《教育研究》發(fā)文的熱點(diǎn)領(lǐng)域。其次,從各個(gè)種類(lèi)所處戰(zhàn)略坐標(biāo)的象限分布特點(diǎn)來(lái)看,種類(lèi)4的大部分關(guān)鍵詞位于戰(zhàn)略坐標(biāo)的第一象限,說(shuō)明其不僅是《教育研究》雜志組稿的核心領(lǐng)域,而且其文章數(shù)量相對(duì)于其它7個(gè)種類(lèi)所占領(lǐng)域更為多,也更成熟,該領(lǐng)域的研究是我國(guó)教育研究的中心領(lǐng)域。種類(lèi)1、8主要位于第二象限,說(shuō)明其主題相對(duì)松散,對(duì)其關(guān)注度還有待于進(jìn)一步加強(qiáng),其今后在《教育研究》文獻(xiàn)成果質(zhì)量提升方面還具有較大的潛在價(jià)值。種類(lèi)2、3、6主要位于第三象限,說(shuō)明這3個(gè)種類(lèi)所占的領(lǐng)域內(nèi)部鏈接緊密,題目明確,并且有研究機(jī)構(gòu)正在對(duì)其展開(kāi)正規(guī)的研究,但在整個(gè)研究網(wǎng)絡(luò)中仍處于邊緣。種類(lèi)6大部分位于戰(zhàn)略坐標(biāo)的第四象限,說(shuō)明它們所處的主題在整個(gè)研究中處于邊緣地位,重要性較小。種類(lèi)7不僅橫跨四個(gè)象限,而且緊緊圍繞在戰(zhàn)略坐標(biāo)軸心,說(shuō)明它所占的領(lǐng)域是《教育研究》發(fā)文的重點(diǎn)核心領(lǐng)域,該領(lǐng)域的研究不僅與國(guó)家中長(zhǎng)期教育改革和發(fā)展規(guī)劃綱要(2010-2012年)提出的大力發(fā)展職業(yè)教育和大力支持民辦教育的內(nèi)容相一致,而且還與《教育研究》“2006中國(guó)教育研究前沿與熱點(diǎn)問(wèn)題年度報(bào)告”中“創(chuàng)新高等教育發(fā)展思路”、“拓展高等教育辦學(xué)多樣化”、“職業(yè)教育的轉(zhuǎn)型與發(fā)展取向”[22]等內(nèi)容相一致。此研究結(jié)果也被潘黎、王素的研究所驗(yàn)證。 四、總結(jié)和展望
通過(guò)上述實(shí)例,大家可以更直觀的感受到關(guān)鍵詞共詞分析方法的使用效果,但是,在使用的具體過(guò)程中,還應(yīng)該值得關(guān)注和思考下述問(wèn)題。
(一)進(jìn)行關(guān)鍵詞共詞分析前要確保對(duì)其進(jìn)行標(biāo)準(zhǔn)化
我們主要針對(duì)《教育研究》進(jìn)行計(jì)量分析,因?yàn)槠滹L(fēng)格基本一致,所以在標(biāo)準(zhǔn)化處理關(guān)鍵詞方面比較容易處理,但是,如果涉及到多個(gè)雜志間的文獻(xiàn)關(guān)鍵詞處理,就要特別注意對(duì)查詢到的文獻(xiàn)的關(guān)鍵詞進(jìn)行規(guī)范和統(tǒng)一。比如,我們?cè)谶M(jìn)行自閉癥熱點(diǎn)研究時(shí),要將在不同刊物中表達(dá)同樣含義的關(guān)鍵詞“自閉癥”與“孤獨(dú)癥”統(tǒng)一為“自閉癥”。遲景明和吳琳在研究中,將“高職院?!?、“職業(yè)技術(shù)學(xué)院”和“職技高?!睒?biāo)準(zhǔn)化為“高職院?!保瑢ⅰ案叩葘W(xué)?!?、“高等院校”、“高?!?、“大學(xué)”等標(biāo)準(zhǔn)化為“高校”。對(duì)關(guān)鍵詞的標(biāo)準(zhǔn)化處理,能確保最后量化材料的準(zhǔn)確,進(jìn)而保證最后科學(xué)計(jì)量的精確、科學(xué)。但很多進(jìn)行科學(xué)計(jì)量的研究忽視了此問(wèn)題,導(dǎo)致了其研究結(jié)果的科學(xué)和準(zhǔn)確性大打折扣。
(二)可以嘗試使用社會(huì)網(wǎng)絡(luò)分析法更清晰地展示關(guān)鍵詞間的強(qiáng)弱關(guān)系
本研究采用的多維尺度雖然可以較好的觀察到變量間的關(guān)系,但是無(wú)法表現(xiàn)他們之間的強(qiáng)弱。要更好的表達(dá)各個(gè)關(guān)鍵詞之間的強(qiáng)弱關(guān)系,大家以后可以嘗試進(jìn)行社會(huì)網(wǎng)絡(luò)分析。社會(huì)網(wǎng)絡(luò)分析(Social Network Analysis)(簡(jiǎn)稱(chēng)SNA,有的文獻(xiàn)稱(chēng)為“社會(huì)網(wǎng)”或“網(wǎng)絡(luò)分析”)是包括測(cè)量與調(diào)查社會(huì)系統(tǒng)中各部分(“點(diǎn)”)的特征與相互之間的關(guān)系(“連接”),將其用網(wǎng)絡(luò)的形式表示出來(lái),然后分析其關(guān)系的模式與特征這一全過(guò)程的一套理論、方法和技術(shù)。[23] 采用社會(huì)網(wǎng)絡(luò)分析得出的三位立體網(wǎng)絡(luò)圖,更能直觀地反應(yīng)各個(gè)體(節(jié)點(diǎn))的位置及它們之間的相互關(guān)系(線段)。在原始圖線條密集,不易分析時(shí),還可進(jìn)行凝聚子群分析,使圖的直觀性增強(qiáng),更容易分析理解。[
(三)關(guān)鍵詞共詞分析法和定性方法結(jié)合使用才能更好解讀研究結(jié)果
雖然熱點(diǎn)知識(shí)圖譜是采用科學(xué)計(jì)量法繪制出來(lái)的,但是該方法的使用并非完全依賴定量技術(shù),其還依賴于定性分析技術(shù)。在進(jìn)行了聚類(lèi)分析和多維尺度分析之后,對(duì)于各個(gè)種類(lèi)及其所在區(qū)域的劃分和命名均需要雄厚的專(zhuān)業(yè)功底。它就像采用因子分析之后,對(duì)于各個(gè)因子的命名需要結(jié)合專(zhuān)業(yè)知識(shí)來(lái)命名一樣。因此,要進(jìn)行科學(xué)知識(shí)圖譜的繪制,需要將定量研究與定性分析結(jié)合起來(lái),具有一定的專(zhuān)業(yè)背景,才能夠?qū)τ?jì)量結(jié)果進(jìn)行準(zhǔn)確、客觀的解讀。
(四)進(jìn)行關(guān)鍵詞共詞分析方法時(shí)軟件的選取也至關(guān)重要
雖然現(xiàn)在國(guó)內(nèi)很多研究者,在社會(huì)學(xué)科、管理學(xué)科、醫(yī)學(xué)等研究領(lǐng)域?qū)χ形奈墨I(xiàn)的熱點(diǎn)知識(shí)圖譜的繪制采用了陳朝美博士研發(fā)的CiteSpace軟件,但是該軟件的優(yōu)勢(shì)在于處理外文,尤其是英文文獻(xiàn)上,對(duì)于中文文獻(xiàn)的處理還存在一定的不足,而我們所介紹的Bicomb軟件在中文文獻(xiàn)的共詞分析方面較有優(yōu)勢(shì),因此,我們建議大家對(duì)中文材料進(jìn)行科學(xué)計(jì)量研究時(shí)更多的采用此軟件。
通過(guò)本文的介紹,我們衷心希望能夠幫助高等教育研究者對(duì)關(guān)鍵詞共詞分析法有所了解,同時(shí),也真誠(chéng)的希望越來(lái)越多的高等教育研究者投入到教育研究成果的科學(xué)計(jì)量研究中來(lái)!
用spss將詞篇矩陣轉(zhuǎn)成相似矩陣(五)
基于關(guān)鍵詞共現(xiàn)的國(guó)內(nèi)用戶研究主題探討
【摘要】以2002-2011年我國(guó)圖情領(lǐng)域關(guān)于用戶研究的文獻(xiàn)為對(duì)象,從關(guān)鍵詞共現(xiàn)分析、聚類(lèi)分析、社會(huì)網(wǎng)絡(luò)分析等幾個(gè)方面對(duì)文獻(xiàn)中的高頻關(guān)鍵詞進(jìn)行定量研究,并將其歸類(lèi)為六大主題。
引言
隨著信息化和網(wǎng)絡(luò)化時(shí)代的來(lái)臨,人們的信息交流日益頻繁,信息用戶日漸龐大。對(duì)用戶進(jìn)行研究已成為我國(guó)圖情領(lǐng)域研究的前沿和熱點(diǎn),其研究成果可以為信息服務(wù)機(jī)構(gòu)開(kāi)展以用戶為中心的服務(wù)提供依據(jù)。在這一趨勢(shì)的引領(lǐng)下,圖情界同仁迫切希望了解近10年來(lái)關(guān)于用戶研究的熱點(diǎn)領(lǐng)域和動(dòng)態(tài)信息,為未來(lái)完善用戶研究提供有用的借鑒。因此,筆者采用共詞分析法和社會(huì)網(wǎng)絡(luò)分析法對(duì)2002-2011年我國(guó)圖情領(lǐng)域關(guān)于用戶研究文獻(xiàn)中的高頻關(guān)鍵詞進(jìn)行分析,以揭示用戶研究的主題,把握其發(fā)展趨勢(shì)。
共詞分析法主要是利用文獻(xiàn)集中關(guān)鍵詞對(duì)共同出現(xiàn)的情況來(lái)確定該文獻(xiàn)集所代表學(xué)科中各主題之間的關(guān)系。一般做法是統(tǒng)計(jì)一組文獻(xiàn)的關(guān)鍵詞兩兩之間在同一篇文獻(xiàn)中出現(xiàn)的頻率,便可形成一個(gè)由這些詞對(duì)關(guān)聯(lián)所組成的共詞網(wǎng)絡(luò)。利用聚類(lèi)、因子分析等多元統(tǒng)計(jì)分析方法對(duì)共詞網(wǎng)絡(luò)進(jìn)行分析,進(jìn)而展現(xiàn)該學(xué)科的研究結(jié)構(gòu)[1]。
社會(huì)網(wǎng)絡(luò)分析法原本是社會(huì)學(xué)用于研究社會(huì)成員之間關(guān)系的一種定量方法,后來(lái)被引入到了圖情領(lǐng)域的相關(guān)研究。它在關(guān)鍵詞分析中應(yīng)用的主要原理是將關(guān)鍵詞作為網(wǎng)絡(luò)的節(jié)點(diǎn),關(guān)鍵詞之間的共現(xiàn)關(guān)系則構(gòu)成節(jié)點(diǎn)之間的連線,構(gòu)建社會(huì)網(wǎng)絡(luò)關(guān)系圖譜,然后應(yīng)用中心度、小世界效應(yīng)等方法進(jìn)行分析,進(jìn)而發(fā)掘出關(guān)鍵詞之間的關(guān)系 [2]。
2.1 數(shù)據(jù)來(lái)源
為了盡可能保證查全率,筆者以“用戶”、“信息用戶”為題名和關(guān)鍵詞,對(duì)中國(guó)知網(wǎng)和維普網(wǎng)收錄的19種圖情領(lǐng)域核心期刊進(jìn)行檢索。共得到2002-2011年發(fā)表的論文2 632篇,剔除非學(xué)術(shù)論文、重復(fù)等無(wú)效部分后,最終有效篇數(shù)為2 115篇。
19種核心期刊分別是:《情報(bào)學(xué)報(bào)》、《圖書(shū)情報(bào)工作》、《國(guó)家圖書(shū)館學(xué)刊》、《圖書(shū)與情報(bào)》、《圖書(shū)館學(xué)研究》、《圖書(shū)館工作與研究》、《圖書(shū)館理論與實(shí)踐》、《情報(bào)雜志》、《情報(bào)科學(xué)》、《圖書(shū)館雜志》、《圖書(shū)館建設(shè)》、《圖書(shū)館論壇》、《圖書(shū)館》、《圖書(shū)情報(bào)知識(shí)》、《情報(bào)理論與實(shí)踐》、《中國(guó)圖書(shū)館學(xué)報(bào)》、《大學(xué)圖書(shū)館學(xué)報(bào)》、《情報(bào)資料工作》、《現(xiàn)代圖書(shū)情報(bào)技術(shù)》。除了《情報(bào)學(xué)報(bào)》上發(fā)表的文獻(xiàn)來(lái)自于維普網(wǎng)外,其他均來(lái)自于中國(guó)知網(wǎng)。
2.2 數(shù)據(jù)預(yù)處理
由于關(guān)鍵詞是論文作者自行選擇的自然語(yǔ)言,因此會(huì)存在一些不規(guī)范、不統(tǒng)一的現(xiàn)象。為了讓研究結(jié)果更加準(zhǔn)確,筆者采用歸并、吸收和丟棄三種方法對(duì)關(guān)鍵詞進(jìn)行逐一的人工處理。
歸并法是指對(duì)同一內(nèi)容用不同詞語(yǔ)來(lái)表達(dá)或者同一詞語(yǔ)用不同語(yǔ)種來(lái)表示的情況,歸并為統(tǒng)一的詞語(yǔ)。如用戶、讀者和信息需求者等,歸并為用戶; Lib2.0、Library2.0和圖書(shū)館2.0,歸并為圖書(shū)館2.0。
吸收法是指針對(duì)同一研究?jī)?nèi)容,但卻采用上下位關(guān)系來(lái)表示的關(guān)鍵詞,如用戶、圖書(shū)館用戶和信息用戶,采用上位類(lèi)代替下位類(lèi)的方式進(jìn)行吸收,即采用用戶來(lái)表示。有些詞需要采用下位類(lèi)吸收上位類(lèi)的方式,如模型和用戶模型,這需要結(jié)合文獻(xiàn)的具體內(nèi)容而定。
丟棄法是指針對(duì)一些與用戶研究無(wú)關(guān)或者太寬泛的關(guān)鍵詞,如學(xué)校機(jī)構(gòu)的名稱(chēng)(中央財(cái)經(jīng)大學(xué))、趨勢(shì)、google工具欄、中國(guó)招生考試網(wǎng)絡(luò)關(guān)系圖譜。該方法能夠直觀地揭示各個(gè)元素之間的緊密程度和所處地位。通過(guò)構(gòu)建高頻關(guān)鍵詞的圖譜,可以分析出高頻關(guān)鍵詞在整個(gè)網(wǎng)絡(luò)中所處的地位 [6]。
3.1 總體趨勢(shì)
論文的數(shù)量能夠直接反映圖情領(lǐng)域?qū)τ脩粞芯康年P(guān)注度,2002-2011這10年間共有2 115篇相關(guān)論文,年均211.5篇??牧繌?002年的98篇增長(zhǎng)到了2011年的309篇,增長(zhǎng)了近3.15倍,年均增長(zhǎng)率達(dá)到12.2%。上述數(shù)據(jù)表明,近10年來(lái)我國(guó)學(xué)者對(duì)于用戶的研究越來(lái)越關(guān)注和重視。正如普賴斯文獻(xiàn)指數(shù)增長(zhǎng)規(guī)律所反映的現(xiàn)象,圖情領(lǐng)域關(guān)于用戶的研究正處于發(fā)展階段,會(huì)引起許多不同學(xué)者進(jìn)行思想交流,不同學(xué)科內(nèi)容的相互滲透、交叉,推動(dòng)了用戶研究的蓬勃發(fā)展。 同時(shí),筆者對(duì)關(guān)鍵詞進(jìn)行規(guī)范化處理之后,共整理出頻次大于20的34個(gè)高頻關(guān)鍵詞。其中信息服務(wù)、用戶需求、數(shù)字圖書(shū)館、高校圖書(shū)館、個(gè)性化服務(wù)這5個(gè)關(guān)鍵詞的頻次都大于100,說(shuō)明在網(wǎng)絡(luò)越來(lái)越發(fā)達(dá)的今天,圖書(shū)館等信息服務(wù)機(jī)構(gòu)更加關(guān)注用戶的個(gè)性化需求,根據(jù)不同用戶的需求特征,有針對(duì)性地提供信息服務(wù)。
為了更加清楚、形象地展現(xiàn)近10年我國(guó)圖情領(lǐng)域關(guān)于用戶研究的主題和核心領(lǐng)域,筆者對(duì)得到的高頻關(guān)鍵詞進(jìn)行共詞和社會(huì)網(wǎng)絡(luò)分析,并繪制相應(yīng)的關(guān)系圖。
3.2 主題歸類(lèi)
3.2.1 主題類(lèi)數(shù)的確定
利用SPSS17.0 進(jìn)行因子分析, 結(jié)果見(jiàn)表4。按照提取因子的方差累積百分比要超過(guò)60 %的原則, 從關(guān)鍵詞矩陣中提取符合條件的因子個(gè)數(shù)為6。這6個(gè)因子的方差累積貢獻(xiàn)率達(dá)到63.503%,即能夠解釋全部信息的63.503%。由此可以確定用戶研究的主題類(lèi)數(shù)為6類(lèi)。
3.2.2 歸類(lèi)結(jié)果
根據(jù)因子分析的結(jié)果,將關(guān)鍵詞采用系統(tǒng)聚類(lèi)的方法聚為六大主題(見(jiàn)表5),分別是新形勢(shì)下高校圖書(shū)館用戶教育研究、網(wǎng)絡(luò)環(huán)境下圖書(shū)館用戶需求研究、數(shù)字圖書(shū)館用戶個(gè)性化服務(wù)研究、網(wǎng)絡(luò)模式下用戶服務(wù)滿意度研究、網(wǎng)絡(luò)信息資源的用戶體驗(yàn)研究、信息組織中的用戶參與研究。為了更加直觀形象地展示歸類(lèi)主題結(jié)果,筆者采用多維尺度分析法構(gòu)建了主題圖譜(見(jiàn)圖1)。
新形勢(shì)下高校圖書(shū)館用戶教育研究。由于高校圖書(shū)館是高校的文獻(xiàn)信息中心,是教師、科研人員、學(xué)生查找資料的主要場(chǎng)所。因此,國(guó)內(nèi)外對(duì)于高校圖書(shū)館的用戶教育研究歷來(lái)都很重視,將之貫穿于圖書(shū)館各個(gè)工作環(huán)節(jié)中。隨著Web 2.0和圖書(shū)館2.0的發(fā)展,高校圖書(shū)館在文獻(xiàn)載體、信息構(gòu)建、服務(wù)手段等諸多方面都發(fā)生了巨大的變化。如何將Web 2.0和圖書(shū)館2.0的一些元素應(yīng)用于用戶教育,提高用戶信息檢索能力以及有效利用信息的能力,已成為高校圖書(shū)館一項(xiàng)十分緊迫而重要的任務(wù)[8]。
網(wǎng)絡(luò)環(huán)境下圖書(shū)館用戶需求研究。隨著網(wǎng)絡(luò)的不斷發(fā)展,用戶對(duì)信息的需求也處于不斷變化中。用戶不再滿足于簡(jiǎn)單地獲取文獻(xiàn)信息,而是希望利用快捷、豐富的網(wǎng)絡(luò)資源全方位獲取各種相關(guān)的信息。圖書(shū)館傳統(tǒng)的服務(wù)模式已經(jīng)跟不上網(wǎng)絡(luò)環(huán)境下用戶的需求,用戶流失現(xiàn)象日益嚴(yán)重。在這種形勢(shì)下,學(xué)者對(duì)網(wǎng)絡(luò)環(huán)境下用戶需求的特點(diǎn)進(jìn)行了大量的研究,以期圖書(shū)館等信息服務(wù)機(jī)構(gòu)創(chuàng)建與之相適應(yīng)的服務(wù)方式,為用戶提供綜合化的信息服務(wù)[9]。
數(shù)字圖書(shū)館用戶個(gè)性化服務(wù)研究。數(shù)字圖書(shū)館是隨著網(wǎng)絡(luò)技術(shù)的成熟而蓬勃發(fā)展起來(lái)的,用戶通過(guò)檢索就能夠獲取所需信息。由于需要用戶的參與,因此這種信息獲取往往是被動(dòng)的,獲得的信息質(zhì)量不盡如人意。在這樣的情況下,個(gè)性化服務(wù)應(yīng)運(yùn)而生,并已經(jīng)成為數(shù)字圖書(shū)館信息服務(wù)研究的主要問(wèn)題。圍繞這個(gè)問(wèn)題,學(xué)者對(duì)用戶信息行為、信息偏好、用戶模型、用戶咨詢、搜索引擎等方面進(jìn)行了大量的研究,以便系統(tǒng)、全面地獲取用戶興趣特點(diǎn),主動(dòng)推送其所關(guān)注的信息資源。
網(wǎng)絡(luò)模式下用戶服務(wù)滿意度研究。網(wǎng)絡(luò)環(huán)境下圖書(shū)館的用戶滿意度是從用戶角度出發(fā),即用戶在獲取網(wǎng)絡(luò)信息資源時(shí)是否達(dá)到或者超過(guò)預(yù)期滿足程度的一種心理狀態(tài)。學(xué)者對(duì)用戶滿意度研究有利于優(yōu)化網(wǎng)絡(luò)檢索系統(tǒng),提高查全率和查準(zhǔn)率,提升信息的服務(wù)質(zhì)量。
網(wǎng)絡(luò)信息資源的用戶體驗(yàn)研究。對(duì)圖書(shū)館等信息服務(wù)機(jī)構(gòu)而言,用戶體驗(yàn)是指用戶在使用信息產(chǎn)品過(guò)程中所獲得的心理感受。根據(jù)用戶體驗(yàn)結(jié)果可以有效地進(jìn)行網(wǎng)絡(luò)信息資源整合、基本術(shù)語(yǔ)規(guī)范以及創(chuàng)新服務(wù)模式等。用戶體驗(yàn)對(duì)于圖書(shū)館等信息服務(wù)機(jī)構(gòu)來(lái)說(shuō)是一種全新的觀念,近年來(lái)對(duì)其關(guān)注度不斷加大。但是相對(duì)其他主題來(lái)說(shuō),用戶體驗(yàn)研究的內(nèi)容寬泛而且沒(méi)有一個(gè)相對(duì)統(tǒng)一的標(biāo)準(zhǔn),導(dǎo)致該領(lǐng)域的研究深度有限。
信息組織中的用戶參與研究。信息組織是信息資源開(kāi)發(fā)利用的關(guān)鍵環(huán)節(jié),由于當(dāng)前以博客、微博、社交網(wǎng)絡(luò)等為代表的微內(nèi)容不斷興起,用戶越來(lái)越多地參與到信息組織中來(lái)。用戶參與圖書(shū)館信息組織一方面有益于改善圖書(shū)館信息資源組織與服務(wù),同時(shí)也給圖書(shū)館信息組織帶來(lái)了挑戰(zhàn)。因此,圖書(shū)館將來(lái)必須變革傳統(tǒng)的信息組織模式,創(chuàng)新信息組織模式與方法[10]。
3.3 核心主題
3.3.1 核心主題的確定
在確定了近10年來(lái)關(guān)于用戶研究的主題后,接下來(lái)筆者將進(jìn)一步分析這6類(lèi)主題的聯(lián)系程度及所處地位。為此,筆者借鑒社會(huì)網(wǎng)絡(luò)分析方法,繪制主題的社會(huì)網(wǎng)絡(luò)關(guān)系圖譜(見(jiàn)圖2)。圖譜中節(jié)點(diǎn)的大小代表在整個(gè)網(wǎng)絡(luò)中的地位,節(jié)點(diǎn)越大越接近中心地位,屬于核心主題。據(jù)此可以看出“數(shù)字圖書(shū)館用戶個(gè)性化服務(wù)研究”和“網(wǎng)絡(luò)環(huán)境下圖書(shū)館用戶需求研究”是整個(gè)主題網(wǎng)絡(luò)中的核心節(jié)點(diǎn),其中前者與所有的主題都有聯(lián)系,核心地位更突出。這表明在互聯(lián)網(wǎng)的沖擊下,傳統(tǒng)圖書(shū)館在向數(shù)字圖書(shū)館邁進(jìn)的過(guò)程中,更加注重以用戶需求為導(dǎo)向的個(gè)性化服務(wù)模式的運(yùn)用。
3.3.2 核心主題的分析
社會(huì)網(wǎng)絡(luò)關(guān)系圖譜中兩節(jié)點(diǎn)間的連線情況反映兩個(gè)節(jié)點(diǎn)的聯(lián)系強(qiáng)度,如果存在連線,代表兩個(gè)節(jié)點(diǎn)有聯(lián)系;連線越粗,表示兩者關(guān)系越緊密。根據(jù)這個(gè)原理,筆者對(duì)核心主題――“數(shù)字圖書(shū)館用戶個(gè)性化服務(wù)研究”所囊括的高頻關(guān)鍵詞進(jìn)行圖譜分析(見(jiàn)圖3)。從圖中可以看出,個(gè)性化服務(wù)與數(shù)字圖書(shū)館、用戶模型、搜索引擎以及知識(shí)服務(wù)聯(lián)系緊密。可見(jiàn)在數(shù)字圖書(shū)館背景下,用戶模型的建立、搜索引擎的優(yōu)化以及原始資料的知識(shí)抽取對(duì)個(gè)性化服務(wù)的開(kāi)展至關(guān)重要。同時(shí),數(shù)字圖書(shū)館與用戶研究、用戶服務(wù)聯(lián)系緊密,表明數(shù)字圖書(shū)館與傳統(tǒng)圖書(shū)館相比,更加注重以用戶為中心的服務(wù)理念。
結(jié)論
筆者利用共詞和社會(huì)網(wǎng)絡(luò)分析技術(shù),對(duì)2002-2011年我國(guó)圖情領(lǐng)域以用戶研究為主題的論文進(jìn)行了研究。結(jié)果表明,學(xué)者對(duì)用戶研究的主題主要集中在六個(gè)方面。其中,數(shù)字圖書(shū)館用戶個(gè)性化服務(wù)研究和網(wǎng)絡(luò)環(huán)境下圖書(shū)館用戶需求是目前關(guān)注的重點(diǎn)領(lǐng)域?,F(xiàn)有的用戶研究主題都與互聯(lián)網(wǎng)技術(shù)密切相關(guān),這表明將網(wǎng)絡(luò)技術(shù)引入到對(duì)圖情領(lǐng)域用戶的信息服務(wù)已成為這一學(xué)科的未來(lái)發(fā)展趨勢(shì)。
用spss將詞篇矩陣轉(zhuǎn)成相似矩陣(六)
北京體育大學(xué)體操方向碩士學(xué)位論文研究熱點(diǎn)分析
中圖分類(lèi)號(hào):G807 文獻(xiàn)標(biāo)識(shí):A 文章編號(hào):1009-9328(2013)12-000-01
摘 要 對(duì)北京體育大學(xué)2003-2012年體操方向碩士學(xué)位論文的關(guān)鍵詞詞頻統(tǒng)計(jì)與分析,研究高頻詞之間的結(jié)構(gòu)關(guān)系,探究北京體育大學(xué)體操方向碩士學(xué)位論文的選題方向、研究?jī)?nèi)容及其不同的特點(diǎn),分析熱點(diǎn)的形成原因與未來(lái)發(fā)展趨勢(shì)。
關(guān)鍵詞 北京體育大學(xué) 碩士學(xué)位論文 研究熱點(diǎn)
一、研究方法與對(duì)象
研究方法主要采用詞頻統(tǒng)計(jì)法與共詞聚類(lèi)分析法。詞頻統(tǒng)計(jì)法能夠揭示或表達(dá)文獻(xiàn)核心內(nèi)容的關(guān)鍵詞或主題詞在某一研究領(lǐng)域中出現(xiàn)的頻次高低來(lái)確定該領(lǐng)域研究熱點(diǎn)和發(fā)展動(dòng)向的文獻(xiàn)計(jì)量法。共詞聚類(lèi)分析法是一種內(nèi)容分析方法,通過(guò)對(duì)一組詞兩兩統(tǒng)計(jì)它們?cè)谕黄墨I(xiàn)中出現(xiàn)的頻率,以此為基礎(chǔ)對(duì)這些詞進(jìn)行聚類(lèi)分析,從而反映出詞與詞之間的親疏關(guān)系,進(jìn)而分析這些詞所代表的學(xué)科和主題的研究結(jié)構(gòu)。
二、研究生學(xué)位論文的共詞聚類(lèi)分析
(一)關(guān)鍵詞詞頻統(tǒng)計(jì)與分析
本文利用《CNKI中國(guó)優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(kù)》,搜索出2003―2012年北京體育大學(xué)體操方向碩士學(xué)位論文共73篇,以73篇學(xué)位論文中的關(guān)鍵詞為調(diào)研對(duì)象,通過(guò)共詞分析法中的聚類(lèi)分析探索各高頻關(guān)鍵詞之間的內(nèi)在關(guān)系,歸納出北京體育大學(xué)體操碩士學(xué)位論文研究的熱點(diǎn),以及各個(gè)不同研究方向的親疏性。本研究利用Excel對(duì)前期檢索出的學(xué)位論文進(jìn)行關(guān)鍵詞統(tǒng)計(jì),共得到碩士學(xué)位論文關(guān)鍵詞283個(gè),平均每篇碩士學(xué)位論文含關(guān)鍵詞3.9個(gè)。然后對(duì)統(tǒng)計(jì)結(jié)果進(jìn)行以下處理:去除對(duì)反應(yīng)主題沒(méi)有積極意義的詞,如“展望”、“問(wèn)題”等,對(duì)表達(dá)同一個(gè)意思的關(guān)鍵詞進(jìn)行標(biāo)準(zhǔn)化處理,如“高職院?!?、“職業(yè)技術(shù)院?!?、“職技高?!钡葮?biāo)準(zhǔn)化為“高職院校”,“高等院校”、“高等學(xué)?!?、“高?!薄ⅰ按髮W(xué)”等標(biāo)準(zhǔn)化為“高?!?。
經(jīng)過(guò)多次比較,最終選擇詞頻大于的關(guān)鍵詞作為高頻關(guān)鍵詞,從而確定個(gè)體操方向碩士學(xué)位論文的高頻關(guān)鍵詞(表1)。這個(gè)關(guān)鍵詞總的出現(xiàn)頻次為65次,占關(guān)鍵詞總頻次的36.3%。從高頻關(guān)鍵詞分布可以看出,北京體育大學(xué)體操方向碩士研究生重點(diǎn)關(guān)注的研究對(duì)象集中在“體育教育專(zhuān)業(yè)”、“分析”、“普通高?!薄ⅰ案?jìng)技體操”、“北京市”、“教學(xué)理念”、“現(xiàn)狀”、“發(fā)展對(duì)策”等。
表1 碩士學(xué)位論文高頻關(guān)鍵詞表
序號(hào) 關(guān)鍵詞 詞頻
1 體育教育專(zhuān)業(yè) 12
2 分析 10
3 普通高校 8
4 競(jìng)技體操 8
5 北京市 7
6 教學(xué)理念 7
7 現(xiàn)狀 7
8 發(fā)展對(duì)策 6
(二)構(gòu)造詞篇矩陣、相似矩陣
對(duì)于高頻關(guān)鍵詞共現(xiàn)頻次的統(tǒng)計(jì),本研究利用SPSS17.0,以每篇學(xué)位論文為一條記錄,記錄的內(nèi)容為高頻關(guān)鍵詞是否在學(xué)位論文的關(guān)鍵詞出現(xiàn)(出現(xiàn)為1,否則為0),構(gòu)造出詞篇矩陣。以詞篇矩陣為基礎(chǔ),在SPSS軟件中進(jìn)行相關(guān)分析,數(shù)據(jù)類(lèi)型選擇“binary”二元變量,相似系數(shù)選擇“Ochiai”系數(shù),構(gòu)造出高頻關(guān)鍵詞的相似矩陣(見(jiàn)表2)。相似矩陣中的數(shù)字為相似數(shù)據(jù),數(shù)字的大小則表明詞與詞之間的距離遠(yuǎn)近,數(shù)值越大則表明詞與詞之間的距離越近,相似度越好;反之,數(shù)值越小,表明詞與詞之間的距離越遠(yuǎn),相似度越差。相似矩陣對(duì)角線的數(shù)據(jù)為1,表明某高頻關(guān)鍵詞自身相關(guān)度。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱(chēng) BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專(zhuān)注于從單 ...
2025-07-09year_month數(shù)據(jù)類(lèi)型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類(lèi)型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專(zhuān)業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03