Echarts是由百度開發(fā)的一款免費、強大的圖表生成和可視化庫,使其可以方便地對數(shù)據(jù)進行展示、交互和定制。
Recharts是基于Echarts開發(fā)的R版本,由Yang Zhou和Taiyun Wei開發(fā),通過該包的echartR函數(shù)可以完成很多可視化的任務(wù),圖表美觀且有動態(tài)效果,是一款優(yōu)秀的數(shù)據(jù)可視化產(chǎn)品。以下是Recharts繪圖的知識地圖(基本圖形):

百聞不如一見,今天我們使用一則案例來演示使用echartR進行繪圖的流程。
一、舉例Showcase
“世界很復(fù)雜,百度更懂你”。百度搜索風(fēng)云榜以數(shù)億網(wǎng)民的單日搜索行為作為數(shù)據(jù)基礎(chǔ),以關(guān)鍵詞為統(tǒng)計對象建立權(quán)威全面的各類關(guān)鍵詞排行榜,盤點中國最新最熱的人、事、物信息,為最具代表性的“網(wǎng)絡(luò)風(fēng)向標(biāo)”。

我們想通過從百度熱詞榜獲取熱詞并通過詞云的形式實時展現(xiàn)網(wǎng)名關(guān)注的人、事、物。
二、前置準(zhǔn)備
1.本機測試環(huán)境:R最新版 R3.4.4
2.Recharts安裝與加載方法

三、echartr詞云WordCloud語法介紹

四、正式繪圖
1.數(shù)據(jù)準(zhǔn)備
從百度熱詞榜獲取熱詞,并解析為數(shù)據(jù)框,包含熱詞和頻數(shù)。為此構(gòu)建一個函數(shù)getBaiduHot,解析_百度熱詞趨勢_ 網(wǎng)頁。

預(yù)覽一下數(shù)據(jù)集前十位:

3. 基本圖形繪制
只要提供x和y

制圖結(jié)果如下:

上圖根據(jù)關(guān)鍵詞和詞頻繪制了Top30的百度熱詞,抓取的時間是2018-3-18 12:44:08??梢钥闯鼍W(wǎng)友比較關(guān)注的話題有娛樂話題、政治話題、生活話題、體育話題等。如“姚笛被成功求婚”、”iPhoneX撒一地”、”中超一方最差開局”等等。
4. 按數(shù)據(jù)系列著色
我們希望將熱詞分組。定義一個series變量’Trend’?!痳ise’系列和’fall’系列用不同的顏色標(biāo)注。

繪制結(jié)果如下:

5. 帶時間軸With Timeline
比較實時熱點、今日熱點和七日熱詞趨勢。
首先,獲取今日熱點和七日熱點兩個榜單的網(wǎng)頁并轉(zhuǎn)為數(shù)據(jù)框,合并。

然后作圖:

效果如下:

備注:此圖為動態(tài)圖片,可以通過拖動X軸動態(tài)展示實時熱點、今日熱點和七日熱詞趨勢。
6. 設(shè)置主題setTheme

設(shè)定主題背景和調(diào)色板顏色。效果如下:

熟悉此案例之后,你可以通過R來抓取公開網(wǎng)頁的詞語(需要注意合法性的問題)并進行動態(tài)詞云展示。EchartR的語法并不復(fù)雜,通過簡單的幾行命令即可實現(xiàn)強大的自定義可視化圖表制作。
這個正式R最吸引人的地方,它可以用幾行簡單的代碼生成圖表和圖以及完成強大的任務(wù)功能。同時作為開源工具,目前尚無行業(yè)應(yīng)用限制,方便的拓展性,不僅可以同Python,Java,C,C++等語言進行互調(diào),其他統(tǒng)計軟件也大部分均可調(diào)用R,如SAS,SPSS statistic等。








暫無數(shù)據(jù)