我正在使用rvestR中的包來刮取股票市場價格。我想在使用時排除節(jié)點html_nodes()。
以下課程在網(wǎng)站上以股票價格出現(xiàn): [4] <span id="ctl00_ctl00_Content_LeftContent_IssueList_StockList_repIssues_ctl02_DifferenceBlock_lblRelativeDifferenceDown" class="ValueDown">-0,51%</span>
[5] <span id="ctl00_ctl00_Content_LeftContent_IssueList_StockList_repIssues_ctl02_ctl02_lblDifference" class="ValueDown Difference">-51%</span>
現(xiàn)在我想只包括之后的文本class="ValueDown",我想在之后排除文本class="ValueDown Difference"。
為此,我使用以下代碼:
urlIEX <- "https://www.iex.nl/Koersen/Europa_Lokale_Beurzen/Amsterdam/AMX.aspx"
webpageIEX <- read_html(urlIEX)
percentage_change <- webpageIEX %>%
html_nodes(".ValueDown") %>%
html_text()
但是,這給了我兩個值-0,51%和-51%。有沒有辦法包含所有內(nèi)容class="ValueDown"并排除所有內(nèi)容class="ValueDown Difference"?
解決辦法:應(yīng)該使用屬性選擇器:
percentage_change <- webpageIEX %>%
html_nodes("[class='ValueDown']") %>%
html_text()








暫無數(shù)據(jù)