問題描述: 調(diào)節(jié)作用和交互作用的區(qū)別是什么? 思路辨析: 調(diào)節(jié)效應和交互效應在統(tǒng)計處理上是一樣的,但理論含義不同 區(qū)別點在于能否調(diào)節(jié)效應可以指定自變量、調(diào)節(jié)變量的歸屬,而交互作用是等價的,或者叫作位置平行,沒有固定位置 M調(diào)節(jié)X-->Y的關系,不一定交互,而在此基礎上,X也調(diào)節(jié)M-->Y的關系,可能就是交互了
朝陽Tim
2019-03-06
問題描述: 在統(tǒng)計模型中,常常涉及中介和調(diào)節(jié)變量的辨析問題,那么如何簡單理解這兩個概念呢? 概念辨析: 從位置上來看,中介處于X和Y之間;調(diào)節(jié)處于Y之前 從功能上來看,中介代表一種機制,X通過它來影響Y;調(diào)節(jié)是指影響Y和X之間關系的方向(正或負)或強弱 從檢驗上來看,中介需要依次檢驗,甚至要做sobel檢驗;調(diào)節(jié)需要做層次回歸分析,檢驗交乘項系數(shù)的顯著性 舉例子,例如工資和幸福感的關系中,
朝陽Tim
2019-03-05
問題描述: 我們在使用spss進行建模分析的時候,常常會忽略輸出文件的保存,如果想回過頭來看操作記錄又會比較麻煩,如何快速有效地查看歷史操作記錄呢? 解決思路: spss作為點擊式軟件,降低了使用門檻的同時,也造成了運行過程不能有效記錄的問題 實際上,點擊式操作只是封裝了代碼運行的過程,我們找到spss的代碼歷史記錄,即可恢復全部的歷史操作記錄
朝陽Tim
2019-03-05
如題,如何簡單理解隱馬爾可夫模型呢? --隱馬爾可夫模型的定義,關于時序的概率模型,描述由一個隱藏的馬爾可夫鏈隨機生成不可觀測的狀態(tài)隨機序列,再由各個狀態(tài)生成一個觀測而產(chǎn)生觀測隨機序列的過程。隱藏的馬爾可夫鏈隨機生成的狀態(tài)的序列,稱為狀態(tài)序列(state sequence);每個狀態(tài)生成一個觀測,而由此產(chǎn)生的觀測的隨機序列,稱為觀測序列(observation sequence),序列的每一個位
朝陽Tim
2019-03-05
問題描述: 在excel處理數(shù)據(jù)過程中,涉及到消除數(shù)據(jù)的操作,可以delete直接清除,也可以右鍵-刪除,這兩種方式有什么區(qū)別嗎? 思路辨析: 清除操作可以使用delete/backspace實現(xiàn),后者會進入編輯模式;清除之后只會消除單元格內(nèi)容,而不會影響單元格格式-->操作對象是單元格內(nèi)的內(nèi)容 刪除操作的最小操作對象是單元格,也可以是整列、整行,或者整個工作表、工作簿的刪除操作;快捷鍵是“
朝陽Tim
2019-03-05
問題描述: 在mysql中,如何實現(xiàn)長型結構到寬型結構的轉(zhuǎn)化呢? 解決思路: 可以利用sum(if)予以實現(xiàn) select CustomerID, sum(if(year(OrderDate)=2016,Quantity,0)) as '2016購買數(shù)量' , sum(if(year(OrderDate)=2017,Quantity,0)) as '2017購買數(shù)量' from
朝陽Tim
2019-02-25
問題描述: 透視功能是excel最常用的操作之一,對于取數(shù)需求來說非常常見,如何利用mysql予以實現(xiàn)呢? 解決思路: 用臨時表 表鏈接的形式即可實現(xiàn),例如 create temporary table aa as (select CustomerID as '客戶ID',sum(Quantity) as '2017購買數(shù)量' from orderinfo where y
朝陽Tim
2019-02-25
問題描述: 循環(huán)是編程控制流(順序、判斷、循環(huán))中的經(jīng)典思路之一,那么在sql中,如何實現(xiàn)循環(huán)? 解決思路: 在sql中,循環(huán)一般出現(xiàn)在procedure中,有眾多實現(xiàn)函數(shù),例如while、repeat、loop,這里以while...do..示例 delimiter // CREATE PROCEDURE ttest ( ) begin DECLARE a INT; SET a =
朝陽Tim
2019-02-25
問題描述: 當我們在用procedure的時候,常常要涉及delimiter進行轉(zhuǎn)義,如何理解這個功能呢? 解決思路: 轉(zhuǎn)義字符,例如“;”本來是一條代碼的終結標記,但是procedure里面,要把多條代碼合并,因此要防止“;”對代碼運行的影響,即要轉(zhuǎn)義成其他終結標記,舉例來說: 如下圖,單獨執(zhí)行“select*from aaa;”是可以顯示結果的,但是執(zhí)行了delimiter的轉(zhuǎn)義字符,“
朝陽Tim
2019-02-25
問題描述: 當我們在處理數(shù)據(jù)的時候,特別是某個字段的連續(xù)變量,如果存在異常值,例如極大值或極小值,會對模型產(chǎn)生較大影響,一般有哪些處理思路呢?又如何處理缺失值? 解決思路: 對于異常值,可以直接剔除,也可以用平均值填補,極大值、極小值可以采用蓋帽法(99%分位點、1%分位點)填充;spss中常用箱線圖來觀察,劃出離群點并進行異常值處理 對于缺失值,可以用平均值、眾數(shù)進行填補,填補依據(jù)要結合業(yè)
朝陽Tim
2019-02-25
問題描述: 當我們在描述定距變量和定比變量的時候,如何理解它們之間的差別呢? 解決思路: 變量的層次,對應著運算功能,例如分類的可以做“=”、“!=”,順序的在這基礎上還可以做“>”、“<” 由此可以理解所謂定距變量沒有絕對零,而定比變量有絕對零的含義 像溫度、時間,0是人為定出來的,大自然并不存在,因此對于定距變量,只可以在定序基礎上,做“ ”和“-” 而像人數(shù)、身高、體重,0就是0,絕對
朝陽Tim
2019-02-25
問題描述: 聚類(clustering)和分類(classification)有什么區(qū)別與聯(lián)系呢?各自的適用場景是什么? 思路辨析: 聚類是因人設崗,分類是因崗設人,區(qū)別就在于有沒有分類的標準 常見的聚類算法有k-means、系統(tǒng)聚類、二階聚類等,適合做用戶畫像 常見的分類算法有支持向量機、貝葉斯、決策樹、神經(jīng)網(wǎng)絡等等,適合做分類預測
朝陽Tim
2019-02-24
問題描述: 在做變量設計的時候,常常遇到控制變量和調(diào)節(jié)變量概念拎不清的情況,例如人口特征,在研究因自變量關系時候是作為控制變量,還是調(diào)節(jié)變量呢? 思路辨析: 兩者在數(shù)學上是一回事,但是解釋角度不同 控制變量是指和研究目標無關的信息,為了防止影響因自變量而排出的非研究影響 調(diào)節(jié)變量是確定因果變量的邊界條件,是為了證明它對因自變量的干擾而存在 而人口特征,如果不是特定研究的問題,一般視作控制變量
朝陽Tim
2019-02-24
問題描述: spss中長型數(shù)據(jù)如何轉(zhuǎn)化成寬型數(shù)據(jù)? 解決思路: 長型數(shù)據(jù)和寬型數(shù)據(jù)的概念,和excel透視表的功能很接近,在這里理解為: 長型數(shù)據(jù)--表結構數(shù)據(jù) 寬型數(shù)據(jù)--分類一作為列變量,分類二作為行變量,取值為值 spss中的實現(xiàn)操作為 Data-->Restructure 反過來寬型轉(zhuǎn)長型
朝陽Tim
2019-02-24
問題描述: navicat對于數(shù)據(jù)的導出,封裝了很多人性化的設置,諸如mysql要設置安全模式或者導出到固定位置的限制,在這里都不存在。 特別是設置表頭的導出,以及導出路徑,會很容易設置 那么如何利用navicat愉悅地導出數(shù)據(jù),它又可以做哪些設置呢? 解決思路: 自選格式導出 自選導出路徑 包括導出表頭等諸多設置 navicat導出數(shù)據(jù),就是這么輕松、愉快;但是對于
朝陽Tim
2019-02-24
問題描述: 當我們在使用sql進行批量處理的時候,例如為表新增10列,涉及了很多重復操作,對于重復操作,能否利用編程思想予以優(yōu)化呢? 解決思路: prepare、procedure和while...do的組合,即可實現(xiàn)復雜需求的實現(xiàn) 其中prepare是預處理語句;procedure是存儲過程,可以理解為封裝函數(shù);while...do...即循環(huán)的實現(xiàn)形式;delimiter是轉(zhuǎn)義字符,將“
朝陽Tim
2019-02-24
問題描述: 在理解用戶變量和局部變量的時候,除了發(fā)生位置和生命周期,還有沒有其他的理解方式? 解決思路: 可以通過procedure參數(shù)的out類型,來更好地理解用戶變量和局部變量 delimiter // create procedure test(in a int,in b int,out c int) begin set c=a*b; select c; end// delimit
朝陽Tim
2019-02-24
問題描述: 當我們在使用mysql進行存儲的時候,特別是涉及procedure的過程,會涉及到用戶變量和局部變量,那么如何理解這兩者的差別呢? 解決思路: 用戶變量只存在于procedure的begin...end的過程,生命周期很短,就是call該procedure的調(diào)用期間 局部變量,就是自定義的某個值,賦值方式可以是@a='aaa'或者select 'aaa' into @a,生命周期
朝陽Tim
2019-02-24
問題描述: 如何理解mysql procedure的存儲過程? 解決思路: 有點類似于python的封裝函數(shù)過程,涉及到的知識點有 參數(shù)類型,in、out、inout delimiter的理解,改變結束符(用“//”替代“;”作為結束符,從而實現(xiàn)多段sql語句的封裝) 局部變量與用戶變量,賦值方式、生命周期 delimiter // create procedure test2(in a
朝陽Tim
2019-02-24
問題描述: 當我們需要對數(shù)據(jù)庫中某文本字段進行處理時,例如把“計算機”換成“電腦”,應該用什么操作予以實現(xiàn)呢? 解決思路: update...set...和replace的組合應用即可實現(xiàn) SELECT * FROM student; UPDATE student set sdept = REPLACE(sdept,'計算機','電腦');
朝陽Tim
2019-02-24