99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話：13121318867

登錄

首頁精彩閱讀高效構(gòu)建基于Python的商品評論文本挖掘網(wǎng)頁APP

高效構(gòu)建基于Python的商品評論文本挖掘網(wǎng)頁APP

2022-06-28

高效構(gòu)建基于Python的商品評論<a href='/map/wenbenwajue/' style='color:#000;font-size:inherit;'>文本挖掘</a>網(wǎng)頁APP

CDA數(shù)據(jù)分析師出品

作者：CDALevel Ⅰ持證人

崗位：數(shù)據(jù)分析師

行業(yè)：大數(shù)據(jù)

背景

電子商務(wù)行業(yè)在近幾年發(fā)展得極為迅猛，很多在傳統(tǒng)行業(yè)就業(yè)但是薪資不理想的都在網(wǎng)電子商務(wù)行業(yè)去轉(zhuǎn)。這種趨勢造就了越來越多老百姓使用電子商務(wù)價值下的產(chǎn)品，不言而喻，比如網(wǎng)購等行為。換句話說，大量的網(wǎng)購會帶來的結(jié)果就是數(shù)據(jù)量的增大。面對這種大數(shù)據(jù)，且時非結(jié)構(gòu)化的數(shù)據(jù)如商品評論，怎么處理呢？怎么從中提取有用的信息呢？自然語言處理技術(shù)給出了答案，從規(guī)則提取到統(tǒng)計建模到如今非常火熱的深度學(xué)習(xí)，都能從文本中提取到有用的商業(yè)價值，無論時為商家還是買家。本文就某電商平臺上AirPods智能耳機產(chǎn)品的售賣情況及相關(guān)商品信息進行情感分析與快速詞云圖搭建。情感分析也是自然語言處理中的一個方向

除了對文本進行挖掘以外，本文還欲搭建一個網(wǎng)頁APP。Python是目前比較流行的編程語言，利用Python搭建一個網(wǎng)頁APP常用的是Python結(jié)合Flask或者Django框架來貫穿前后端來搭建網(wǎng)頁。利用這個方法一般需要一定的前端經(jīng)驗，來修改CSS、HTML、JAVASCRIPT這些文件。而對于沒有前端經(jīng)驗的coder，讀者這里推薦一款友好的全程基于Python的庫streamlit，也就是本文所用到的庫。利用streamlit可以輕松快速的搭建一個網(wǎng)頁APP，再加入文本挖掘功能。這樣，就做出了一個小產(chǎn)品。下面，進入正題。

本文采用Anaconda進行Python編譯，主要涉及的Python模塊：

streamlit
pandas
cnsenti
stylecloud
time

本章分為三部分講解：

1.數(shù)據(jù)探索性分析與商品評論文本提取

2.商品評論詞云圖可視化與情感分析

3.網(wǎng)頁結(jié)構(gòu)設(shè)計與實現(xiàn)

4.功能整合與效果呈現(xiàn)

01、數(shù)據(jù)探索性分析與商品評論文本提取

本文采取的數(shù)據(jù)為某寧電商平臺上的商品評論數(shù)據(jù)。數(shù)據(jù)字段有商品標(biāo)題、價格、評價內(nèi)容。其中，價格為近期4月份的實時價格。評價內(nèi)容是按時間順序從近到遠的展現(xiàn)。下面為前五行的展示：

需要注意的是，上面五行顯示的是AirPods第2代的商品信息。原因是數(shù)據(jù)原本分為3張表，每張表的字段都是一樣的，總共3個，2個維度字段和1個度量字段（這個在CDA I課程中的數(shù)據(jù)結(jié)構(gòu)會有提及）。因此，這份數(shù)據(jù)是3張表通過縱向合并方式對記錄進行拼接。最后生成的Index是新表生成的主鍵。

接著可以對數(shù)據(jù)進行適當(dāng)?shù)奶剿餍苑治?，首先?xí)慣性的觀察數(shù)據(jù)形狀、數(shù)據(jù)類型以及有沒有缺失值、異常值、重復(fù)值。缺失值利用pandas庫的isnull().sum()函數(shù)即可查閱。重復(fù)值利用duplicated().sum()即可。而重復(fù)由于本文探索的是商品評論文本且數(shù)據(jù)量較少，因此本文忽略不做。下面為各部分結(jié)果

數(shù)據(jù)形狀為(1020,3)，這很好理解，就是1020條記錄行，3個字段。數(shù)據(jù)類型利用info()函數(shù)即可，結(jié)果如下：

上面結(jié)果解析：Non-NULL Count為各個字段的非空數(shù)值和?？梢钥吹?，評價內(nèi)容這個維度字段有2個空值。右邊Dtype表明三個字段都是字符串object類型。memory usage為這張上商品信息表格的占用字節(jié)空間，有24kb。這里額外提醒一下，如果一張表格有5G以上，也就是Excel軟件都較難打開時，可以換一種實現(xiàn)方式，使用dask庫，是一種分布式的數(shù)據(jù)處理package。

從上圖info信息中可以知道，這張商品信息表的空處有2個，也就是缺失值為2。而重復(fù)值計算得到為19個。接下來就是解決缺失值和重復(fù)值的方法，考慮到重復(fù)值多次出現(xiàn)會影響到后續(xù)詞頻統(tǒng)計的結(jié)果，本文考慮將重復(fù)值剔除。而缺失值會影響后面對評價內(nèi)容分詞的步驟，因此這里選擇用空格進行替換。整段代碼如下，剛開始轉(zhuǎn)用Python的小伙伴可以牢記這段代碼，這幾乎是每次數(shù)據(jù)分析必用的。

import pandas as pd # 讀取數(shù)據(jù) df = pd.read_excel('蘇寧易購_airpods系列.xlsx')




df.isnull().sum() # 缺失值匯總 df.duplicated().sum() # 重復(fù)值匯總 df.info() # 表格信息abstract df.dtypes #數(shù)據(jù)類型 df['評價內(nèi)容'] = df['評價內(nèi)容'].fillna(' ') # 空格填充 df = df.drop_duplicates() # 剔除重復(fù)值

在3個字段中，最需要提取的是評價內(nèi)容，因為本文的目的是建立一個商品評論文本信息挖掘系統(tǒng)，功能包括情感分析、詞云圖可視化。而每個用戶ID的評價內(nèi)容都是不一致的，因此，需要去做聚合運算。整合所有評價內(nèi)容，同時去除停用詞，最后形成一句話，雖然這句話是不通順，但是對后面的詞頻統(tǒng)計沒有影響。

整合評價內(nèi)容采用Python的內(nèi)置函數(shù)split()完成，首先利用Pandas庫中的tolist()函數(shù)將評價內(nèi)容字段的記錄變?yōu)橐粋€列表，接著將列表轉(zhuǎn)換為字符串，這里需要用到split()函數(shù)完成。以空格字符串作為連接符，連接列表里的每一個元素。最終形成的效果截取一部分如下：

之后就是去除停用詞，停用詞無論是中文NLP任務(wù)還是英文NLP任務(wù)，都需要用到這一步。這一步不僅可以去除大部分噪音，同時也能節(jié)省計算資源，更加高效。去除停用詞的算法其實很簡單，就是遍歷需要做統(tǒng)計挖掘的文本，如果文本中有單詞是屬于指定的停用詞的，就剔除。顯然，這里就需要停用詞庫，停用詞庫有很多，有百度的停用詞表、有哈工大停用詞表、有四川大學(xué)機器智能實驗室停用表等。本文選擇哈工大停用詞表，因為此表相較于其他表有對電子商務(wù)領(lǐng)域較好的單詞。讀者若是想做一個理想的項目，可以考慮自建電子商務(wù)領(lǐng)域的停用詞表。

去除停用詞具體的代碼及做法將在情感分析處講解。

02、商品評論詞云圖可視化與情感分析

上一部分我們提取了商品信息表格中的每個ID的商品評價內(nèi)容，同時對其整合進行去停用詞，得到了一份干凈的txt數(shù)據(jù)集。接下來就可以進行文本挖掘的事情了。首先是商品評論詞云圖構(gòu)建。

在Python中詞云圖構(gòu)建的庫有很多，常用的就是Wordcloud標(biāo)準(zhǔn)的詞云圖可視化庫，還有pyecharts的詞云圖API。前者在構(gòu)建詞云圖時，新手使用者往往會出現(xiàn)一大堆問題，比如pip安裝失敗、編碼錯誤、字體使用錯誤等，除此之外，其使用難度其實也是蠻大的。而后者則是常用于瀏覽器上的交互式圖表，其以代碼量，封裝性高所出名，聽起來是比較切合本文這個主題的，但是本文卻沒有考慮，原因是后面所用到的網(wǎng)頁開發(fā)庫streamlit要顯示交互式圖表通常不用pyecharts。

因此，這里本文引出新興的詞云圖可視化庫stylecloud，這個庫是基于wordcloud的。運用這個庫，新手可以以最少的代碼量畫出各色各樣的詞云圖，支持形狀設(shè)置。話不多說，直接上代碼：

start = time.time() #記錄初始時間 # 先在內(nèi)部畫出詞云圖并保存到image文件夾 stop_words = open('哈工大停用詞表.txt','r',encoding='utf8').readlines() # 讀取停用詞 stylecloud.gen_stylecloud(text=txt, collocations=True, # 是否包括兩個單詞的搭配(二字組) font_path=r'?C:WindowsFontssimkai.ttf', # 指定字體 icon_name='fab fa-jedi-order',size=(2000,2000), # 指定樣式 output_name=r'img詞云圖.png', #指定輸出圖像文件路徑 custom_stopwords=stop_words) # 指定停用詞表 end = time.time() # 記錄結(jié)束時間 spend = end-start # 畫圖時間總長

代碼解析：

首先引入stylecloud庫，而后使用.gen_stylecloud()對象來初始化畫圖對象（類）。

text參數(shù)代表著目標(biāo)文本，即我們已經(jīng)處理好的商品評論txt文本。
collocations代表為是否包括兩個單詞的搭配（二字組），默認(rèn)為True。
font_path為本機自帶的字體，默認(rèn)位置是?C:WindowsFonts這個文件夾，使用者可以根據(jù)喜好選擇這個文件夾里面任何一種字體，也可以額外下載。
icon_name這個參數(shù)可以說是stylecloud庫的靈魂之處，它可以設(shè)置蒙版圖的形式。當(dāng)然，這個參數(shù)不能亂寫。創(chuàng)作過詞云圖的朋友都知道，自己設(shè)置蒙版圖樣式是有趣但是會出現(xiàn)分辨率極低的問題。為解決這個問題，F(xiàn)ont Awesome實現(xiàn)了絕佳的方案，即構(gòu)造一套以矢量形式存放圖標(biāo)字體庫與CSS框架，供使用者調(diào)用。使用者不僅可以調(diào)出高清的圖標(biāo)，并且可以自定義其中的CSS文件，加入或者修改到合自己胃口的樣式。而stylecloud這個庫就是調(diào)用這個網(wǎng)站的所用內(nèi)容，使用者可以在stylecloud\static文件夾中找到fontawesome.min.cssCSS文件，這里面包含了很多矢量圖標(biāo)。
讀者會問，怎么知道這些圖標(biāo)的name？下面提供兩個網(wǎng)站：
https://fontawesome.dashgame.com/。這里面就是存放各種矢量圖標(biāo)的名稱，使用者可以使用不同類別的圖標(biāo)樣式，其中手勢相關(guān)樣式如下圖：

size為圖片大小。
output_name為輸出圖片的所在路徑及名字
custom_stopwords為引用我們自定義的停用詞庫，即一開始用open函數(shù)代碼調(diào)出哈工大停用詞表，下面截取停用詞表一部分作為展示，可以看到一開始都是去除無用的標(biāo)點負(fù)號

除此之外，本文還設(shè)置了時間間隔，因為眾說周知詞云圖的刻畫需要較長時間，如果文本較長，一分鐘也有可能。所以加上時間的概念，對使用者進行數(shù)據(jù)調(diào)入也會友好一些。

這樣，我們就構(gòu)建好了詞云圖，將在下一部分網(wǎng)頁端應(yīng)用，這里以Airpods第二代舉例，先上效果圖

詞云圖構(gòu)建完以后就是輪到情感分析，對干凈的商品評論信息做情感分析是非常有用的。對商家而言可以清楚知道買方使用此產(chǎn)品的感覺與評價，以便后面優(yōu)化產(chǎn)品，而對想要買此產(chǎn)品的人更加有借鑒。本文將對AirPods商品評論進行情感詞正負(fù)情感詞統(tǒng)計。

利用到的庫是cnsenti，這個庫是中文情感分析庫。在NLP任務(wù)領(lǐng)域中，大多庫與例子都是英文的，因此這個中文庫對于經(jīng)常對中文文本進行挖掘的人是個好消息！

首先先介紹下這個庫把吧，cnsenti模塊中分為兩大部分，一個是本文用到的情感分析對象Sentiment，另一個是沒有用到的情緒分析對象Emotion。情感分析使用的詞典是知網(wǎng)Hownet，支持自定義。情緒分析使用的是大連理工大學(xué)情感本體庫，可以計算文本中的七大情緒詞分布。由于本文只使用情感分析對象類，因此感興趣的讀者可以自行學(xué)習(xí)情緒分析類。

對AirPods商品評論信息進行情感分析，在默認(rèn)條件下，只用2句代碼即可。是的，就是那么方便！

senti = Sentiment() result = senti.sentiment_count(txt)

txt為我們的目標(biāo)文本，首先需要調(diào)用情感分析類Sentiment()，如果不設(shè)置任何參數(shù)，即表明以默認(rèn)條件初始化。接著使用sentiment_count()函數(shù)計算正負(fù)情感詞統(tǒng)計，以AirPods第二代舉例，實現(xiàn)結(jié)果如下：

上面結(jié)果說明：總共單詞有18128個，句子有625句。積極的情感詞語有2221，消極的情感詞語有322個。

在情感分析類中，除了sentiment_count()函數(shù)，還有sentiment_calculate()函數(shù)，有什么區(qū)別呢？這個可更加精準(zhǔn)的計算文本的情感信息。相比于sentiment_count只統(tǒng)計文本正負(fù)情感詞個數(shù)，sentiment_calculate還考慮了情感詞前后是否強度副詞去修飾，情感詞前后是否有否定詞的情感語義反轉(zhuǎn)作用。同樣以AirPods產(chǎn)品舉例，使用這個函數(shù)，得到的結(jié)果為

可以看到，識別出來的積極詞匯應(yīng)該是使用了加權(quán)的手段將頻率升維到數(shù)值。

03、網(wǎng)頁結(jié)構(gòu)設(shè)計與實現(xiàn)

接下來就是網(wǎng)頁結(jié)構(gòu)設(shè)計，做網(wǎng)頁首先就是構(gòu)造出一個思路圖，確定功能是什么，有哪些控件，控件擺放位置如何。對于功能，本文的主題是商品評論信息文本挖掘，先對商品評論初始文本進行整合于去停用詞。而后利用stylecloud庫進行詞云圖構(gòu)建，最后進行情感分析。除此之外，作者還希望完成一下功能：

各類產(chǎn)品(3代AirPods智能耳機)分開進行分析，即不同于上面部分步驟，不需要通過字段進行記錄縱向合并。
可以在網(wǎng)頁端顯示原本的表結(jié)構(gòu)類型數(shù)據(jù)。
加入一些由markdown編寫的簡介
通過一個dataframe原表格和文本挖掘結(jié)果分開顯示

確定功能就是以上這些了。通過上面的功能，本文可以確定有哪寫控件：

文本控件，用來存儲簡介、正負(fù)情感詞數(shù)值比、詞云圖構(gòu)建花費時間second。
圖像(graph)控件，用來存儲本地存儲好的詞云圖，以在web 端展示。
dataframe控件，用來顯示原始表結(jié)構(gòu)類型數(shù)據(jù)
sidebar側(cè)邊欄控件，相當(dāng)于平時我們在各大網(wǎng)站看到的側(cè)邊欄目錄一樣，不過本文在側(cè)邊欄的功能是不一樣的。
側(cè)邊欄下的文本控件。
selectbox單項下拉選擇框控件，存儲AirPods各型號，相當(dāng)于完成分類型分析的功能
radio單選按鈕控件，存儲顯示類型：原表結(jié)構(gòu)數(shù)據(jù)類型或者文本挖掘結(jié)果顯示。

按照常規(guī)的網(wǎng)頁構(gòu)建，控件位置的空間擺設(shè)是一定要設(shè)計的。但是對于新手來說，接下來講的超級web app建設(shè)streamlit則不需要考慮了。

streamlit的官方（https://streamlit.io/）簡介如下：

以最快的方式建立于分享數(shù)據(jù)app，將數(shù)據(jù)顯示在可分享的web app上，以python編程語言實現(xiàn)，無需前端經(jīng)驗。Streamlit是第一個專門針對機器學(xué)習(xí)和數(shù)據(jù)科學(xué)團隊的應(yīng)用程序開發(fā)框架，它是開發(fā)自定義機器學(xué)習(xí)工具的最快的方法，可以幫助機器學(xué)習(xí)工程師快速開發(fā)用戶交互工具。同時它是基于tornado框架，封裝了大量互動組件，同時也支持大量表格、圖表、數(shù)據(jù)表等對象的渲染，并且支持柵格化響應(yīng)式布局。Streamlit的默認(rèn)渲染語言就是markdown；除此以外，Streamlit也支持html文本的渲染，這意味著你也可以將任何html代碼嵌入到streamlit應(yīng)用里。

讀者可能會疑惑做網(wǎng)站，以為前后端都用Python+streamlit是一件普通的事情。其實不然，在streamlit建立之前，web creator with python一般采用的是前端使用html、css、JavaScript，后端使用python、Flask、Django。如果不用Python，則是前后端都使用D3。

因此，本文所使用的Python+streamlit前后端貫穿創(chuàng)建web app對新手是多么的友好！

接著，先展示streamlit的快速使用方法：

首先pip install streamlit安裝這個庫，而后在命令行輸入streamlit hello。這時會彈出一個窗口，這個是內(nèi)置的打開幫助文檔，里面有各種實例，下面為一部分截圖：

首先是，記錄著幫助信息的頁面，里面存放著各種連接

而后在下拉框選擇plotting demo，點擊后顯示如下：

這是一個加載了記錄條的畫圖程序，可以是交互式的。

綜上，就可以發(fā)現(xiàn)，運行streamlit不是在anaconda等python編譯器里面運行的，而是在命令框cmd中輸入streamlit run .py文件來運行程序的。

有興趣的讀者可以多泡一下streamlit的官網(wǎng)，可以學(xué)習(xí)到很多東西。

04、功能整合與效果呈現(xiàn)

最后就是本文的web app構(gòu)建與功能整合部分。先上代碼

import streamlit as st import pandas as pd from cnsenti import Sentiment import stylecloud import time




st.title('AirPods智能耳機商品評論分析系統(tǒng)')
st.markdown('這個數(shù)據(jù)分析系統(tǒng)將以可視化形式挖掘某電商公司下蘋果三種AirPods型號的商品評論信息')
st.markdown('Apple AirPods是蘋果品牌的無線耳機。目前有市場上銷售主流是3中機型：**AirPods2代**、**Airpods pro**、**AirPods三代**。這款耳機的主要特點是：耳機內(nèi)置紅外傳感器能夠自動識別耳機是否在耳朵當(dāng)中進行自動播放，通過雙擊可以控制Siri控制。帶上耳機自動播放音樂，波束的麥克風(fēng)效果更好，雙擊耳機開啟Siri，充電盒支持長時間續(xù)航，連接非常簡單，只需要打開就可以讓iPhone自動識別。')
st.sidebar.title('數(shù)據(jù)分析系統(tǒng)控件')
st.sidebar.markdown('選擇一款型號/可視化類型：')


DATA_URL=('蘇寧易購_airpods系列.xlsx') # @st.cache(persist=True)   #如果只有一份數(shù)據(jù)，就可以用這個持久化，加快效率 def load_data(): data=pd.read_excel(DATA_URL) return data


df = load_data()
df['評價內(nèi)容'] = df['評價內(nèi)容'].fillna(' ') #  填充缺失值 select = st.sidebar.selectbox('選擇一款型號',df['商品標(biāo)題'].unique()) # 在下拉框中得到選擇的型號值 state_data = df[df['商品標(biāo)題'] == select] # 創(chuàng)建單項按鈕選項值 select_status = st.sidebar.radio("可視化類型", ('表結(jié)構(gòu)數(shù)據(jù)','文本挖掘')) if select_status == '表結(jié)構(gòu)數(shù)據(jù)':
    st.text('該電商公司近期售賣產(chǎn)品的相關(guān)數(shù)據(jù)（以表結(jié)構(gòu)化顯示）')
    st.dataframe(state_data) if select_status == '評論可視化': # 判斷商品正負(fù)情感值 txt_list = state_data['評價內(nèi)容'].tolist()
    txt = ' '.join(txt_list)
    
    senti = Sentiment()
    result = senti.sentiment_count(txt)
    
    start = time.time() # 先在內(nèi)部畫出詞云圖并保存到image文件夾 stop_words = open('哈工大停用詞表.txt','r',encoding='utf8').readlines()
    stylecloud.gen_stylecloud(text=txt, collocations=True,
                              font_path=r'?C:WindowsFontssimkai.ttf',
                              icon_name='fab fa-jedi-order',size=(2000,2000),
                              output_name=r'img詞云圖.png',
                              custom_stopwords=stop_words)
    end = time.time()
    spend = end-start # 顯示情感正負(fù)值在網(wǎng)頁端 if result['pos'] > result['neg']:
        st.markdown("#### 該商品的正負(fù)情感值比為{}：{},呈積極信號".format(result['pos'],result['neg'])) if result['pos'] < result['neg']:
        st.markdown("#### 該商品的正負(fù)情感值比為{}：{},呈消極信號".format(result['pos'],result['neg'])) # 顯示詞云圖 st.image(r'img詞云圖.png',caption = '詞云圖')
    st.text('運行時長：{} s'.format(spend))

代碼解析：

首先引入包之后的前五行，是設(shè)置這個web app的標(biāo)題，為AirPods智能耳機商品評論分析系統(tǒng)。然后下面為記錄該程序的簡要信息作為副標(biāo)題。同時存儲一些AirPods這款蘋果公司旗下的智能手機簡介與它的功能獨特之處。除此之外，st.sidebar()這個函數(shù)是將目標(biāo)從主頁面轉(zhuǎn)到側(cè)邊欄中，在側(cè)邊欄填入需要填入的信息。

之后就是第一部分講解的加載數(shù)據(jù)、數(shù)據(jù)探索性分析，去除重復(fù)值，填充缺失值等操作。

select = st.sidebar.selectbox('選擇一款型號',df['商品標(biāo)題'].unique())這句話就是將商品信息表中的去重商品標(biāo)題，即AirPods三代的機型作為下拉框單選選擇的值。選擇這個值后，就可以利用pandas進行條件篩選，最后用st.dataframe()函數(shù)將這個表結(jié)構(gòu)類型進行顯示。

select_status = st.sidebar.radio("可視化類型", ('表結(jié)構(gòu)數(shù)據(jù)','文本挖掘'))代表的是設(shè)置單選選擇按鈕的值，即主頁面顯示哪種頁面，是表格類型數(shù)據(jù)，還是文本挖掘結(jié)果：詞云圖與情感分析結(jié)果。

if語句的設(shè)定如下：根據(jù)state_data結(jié)果，抽取的數(shù)據(jù)為為AirPods三代中的一代，那么記下來主頁顯示的表格數(shù)據(jù)類型或是情感分析都是基于這一代機型的相關(guān)商品信息。接著if語句是判定select_status是表結(jié)構(gòu)數(shù)據(jù)還是文本挖掘，因為在本文的初始設(shè)定中，主頁面上是只顯示兩種可視化的。

而后一個if語句時提供給文本挖掘，也即情感分析用的。在第二部分中有講到，本文時計算正負(fù)情感詞的比例。如果正面情感詞（積極情感詞匯）,則運行st.markdown("#### 該商品的正負(fù)情感值比為{}：{},呈積極信號".format(result['pos'],result['neg']))，顯示積極信號。反之，為消極信號。

這里有一個time模塊引用，這個引用時計算詞云圖構(gòu)建的時間，大約在30s左右。這種性能測試與評估在工作中也是經(jīng)常用到，因為工作中的數(shù)據(jù)可不像本文實例中的大小一般。

詞云圖構(gòu)建的代碼在第二部分也提及到，這里直接嵌入到里面即可。同時利用st.image函數(shù)進行本地圖片讀取與顯示。

除此之外，streamlit還有一個友好的點就是，可以支持寫markdown代碼，上面的文本控件大部分都是用markdown編寫，常使用markdown的讀者可以研究一波。

CDA數(shù)據(jù)分析師考試相關(guān)入口一覽（建議收藏）：

? 想報名CDA認(rèn)證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學(xué)習(xí)CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

詞云圖文本挖掘情感分析字段表結(jié)構(gòu) 重復(fù)值缺失值 python

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇明明已經(jīng)定義了變量e，為什么報notdefined的錯了？

下一篇Python網(wǎng)絡(luò)爬蟲逆向之frida rpc轉(zhuǎn)發(fā)案例(x物)

CDA報考指南

報考流程
考試時間
報名費用
聯(lián)系我們

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

京公網(wǎng)安備 11010802034615號經(jīng)營許可證編號：京B2-20210330

聯(lián)系電話：13321103290 (微信同號)

CDA教材
CDA題庫
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1：配置參數(shù) // 參數(shù)2：回調(diào)，回調(diào)的第一個參數(shù)驗證碼對象，之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式，包括：float，popup width: "280px", https: true // 更多配置參數(shù)說明請參見：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

高效構(gòu)建基于Python的商品評論文本挖掘網(wǎng)頁APP

01、數(shù)據(jù)探索性分析與商品評論文本提取

02、商品評論詞云圖可視化與情感分析

03、網(wǎng)頁結(jié)構(gòu)設(shè)計與實現(xiàn)

04、功能整合與效果呈現(xiàn)

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預(yù)期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務(wù)邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務(wù) ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

高效構(gòu)建基于Python的商品評論文本挖掘網(wǎng)頁APP

01、數(shù)據(jù)探索性分析與商品評論文本提取

02、商品評論詞云圖可視化與情感分析

03、網(wǎng)頁結(jié)構(gòu)設(shè)計與實現(xiàn)

04、功能整合與效果呈現(xiàn)

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預(yù)期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務(wù)邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務(wù) ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

01、數(shù)據(jù)探索性分析與商品評論文本提取

02、商品評論詞云圖可視化與情感分析

03、網(wǎng)頁結(jié)構(gòu)設(shè)計與實現(xiàn)

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...