
SAS的數(shù)據(jù)導(dǎo)入導(dǎo)出大法
正所謂巧婦難為無米之炊,數(shù)據(jù)分析首要的問題是數(shù)據(jù)的獲取。 SAS 作為老牌的統(tǒng)計(jì)軟件發(fā)展至今,已經(jīng)集成了豐富的數(shù)據(jù)獲取與管理功能組件。本章我們就SAS如何獲取數(shù)據(jù)做重點(diǎn)介紹,并順帶介紹 SAS 如何導(dǎo)出數(shù)據(jù)文件。
3.1 讀取對象與讀取方式
說到數(shù)據(jù)讀取這個問題,我們可以從 SAS 讀取的對象來說 , 當(dāng)然也可以從讀取的方式來說。從 SAS 讀取的對象來說,我們可以把外部數(shù)據(jù)文件歸為四類。
(1)數(shù)據(jù)庫管理系統(tǒng)(Data
Base Management System, DBMS)數(shù)據(jù)文件,市面的DBMS 非常之多,常見的如 DB2、 Sybase、 mySQL、
MS SQL Server、 Oracle、 Teradata 以及 Hadoop 等。
(2)單機(jī)文件(PC file),單機(jī)文件應(yīng)是相對 DBMS 數(shù)據(jù)文件而言的,常見的單機(jī)數(shù)據(jù)文件包括 MS Access、 MS Excel、 Lotus、 DBF 以及大家更熟悉的 JMP、 SPSS、Stata、 Paradox 等軟件的數(shù)據(jù)文件。
(3)平面文件(Flat
file),這是一種記錄間沒有結(jié)構(gòu)關(guān)系的文件,一個 Flat file 既可以是純文本文件 (Plain text
file),也可以是二進(jìn)制文件 (Binary file),對于我們而言,最常見的是純文本 TXT 文件和 CSV 文件。
(4)流式數(shù)據(jù)(Instream data),即 SAS 程序中 DATA步里 DATALINES語句后的數(shù)據(jù)行。
從 SAS 讀取的方式來說,筆者總結(jié)為 7 類(更準(zhǔn)確地講,應(yīng)該是 SAS 和外部數(shù)據(jù)交互的方式,因?yàn)椴粌H僅讀入,還有導(dǎo)出等其他交互操作)
(1) LIBNAME 語句, LINAME 語句其實(shí)是動用了我們前面提到的數(shù)據(jù)庫引擎來實(shí)現(xiàn) SAS 與其他數(shù)據(jù)庫文件的互通,這是 SAS 獲取外部數(shù)據(jù)庫文件最為快速、直接的方式。
(2) SQL 直通設(shè)施(SQL pass-through facility),這是直接在 SAS 會話中使用其原生 SQL 語法的方式。
(3) ACCESS/DBLOAD 過程,這是間接訪問外部數(shù)據(jù)庫數(shù)據(jù)文件的方式,不過 SAS已不再推薦。
(4)
IMPORT/EXPORT 過程,前面的三種方式都是包含在 SAS/ACCESS 模塊中的, IMPORT/EXPORT 過程則是 Base
SAS 與外部數(shù)據(jù)集溝通的方式,當(dāng)然我們在利用IMPORT/EXPORT 過程時,如果安裝且擁有 SAS/ACCESS
模塊的權(quán)限,能夠支持的數(shù)據(jù)類型會更豐富。
(5) INFILE+INPUT 語句,這是通過 DATA 步編程的方式讀取外部數(shù)據(jù)或者流式數(shù)據(jù)。
(6) INPUT+DATALINES 語句,這是通過 DATA 步編程的方式讀取流式數(shù)據(jù)。
(7) IO 函數(shù),通過輸入輸出函數(shù)打開數(shù)據(jù)文件,這是一種比較少見的方式
3.2 數(shù)據(jù)讀取策略
在實(shí)際工作中,我們的思維模式通常是碰到一種數(shù)據(jù),然后思考采用何種方式讀入。因此,筆者將數(shù)據(jù)類型和讀入方式做一個綜合,從需求出發(fā)找解決方法,即從數(shù)據(jù)類型出發(fā),總結(jié)可用的讀入方式,并推薦合適的讀入方式。具體見表 3-1 的總結(jié)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫的日常操作中,我們經(jīng)常會遇到需要整合多張表數(shù)據(jù)的場景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動的時代,面對海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價值、驅(qū)動決策的 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時用t.test,何時用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08