
大數(shù)據(jù)時代下的稅務(wù)工作新貌
大數(shù)據(jù)技術(shù)從誕生到今天,已經(jīng)走過了第十個年頭。技術(shù)的發(fā)展是以需求為前提的,十年間Hadoop生態(tài)系統(tǒng)從最初只能應對海量數(shù)據(jù)的批處理,到如今涵蓋數(shù)據(jù)多維度統(tǒng)計分析和數(shù)據(jù)挖掘建模的方方面面,說明了數(shù)據(jù)處理需求更加細化也更加深入。這里的細化和深入是依托行業(yè)背景來講的,數(shù)據(jù)也有屬于自己的基因,它在不同行業(yè)中展現(xiàn)出來的特性是不同的,對其價值的挖掘必須要遵從其本身的特點和規(guī)律。
稅務(wù)機關(guān)作為國家重要的職能部門,是國家財政收入支出體系中最重要的一環(huán),隨著信息化的不斷深入,數(shù)據(jù)環(huán)境已經(jīng)逐見成效。明略數(shù)據(jù)獨樹一幟的從數(shù)據(jù)應用和數(shù)據(jù)處理角度進入稅務(wù)行業(yè),在兩年多時間里深入調(diào)研稅務(wù)數(shù)據(jù)類型、維度、質(zhì)量以及特征等方面屬性,并貼合數(shù)據(jù)情況和稅務(wù)業(yè)務(wù)痛點,總結(jié)出了稅務(wù)大數(shù)據(jù)資產(chǎn)管理實施路徑,經(jīng)由基礎(chǔ)平臺建設(shè)、數(shù)據(jù)匯集、數(shù)據(jù)治理、數(shù)據(jù)應用、數(shù)據(jù)開放五個階段來逐步挖掘稅務(wù)數(shù)據(jù)價值。
2014年,明略數(shù)據(jù)助力四川省地方稅務(wù)局開展稅務(wù)大數(shù)據(jù)平臺建設(shè),目標是實現(xiàn)對稅務(wù)數(shù)據(jù)資產(chǎn)的價值挖掘。經(jīng)過項目一期雙方的努力,已經(jīng)建立大數(shù)據(jù)基礎(chǔ)平臺和數(shù)據(jù)上下載平臺,階段性完成數(shù)據(jù)處理能力和數(shù)據(jù)匯集能力建設(shè)。
項目二期規(guī)劃了ETL可視化套件、數(shù)據(jù)資產(chǎn)可視化套件以及稅源探查分析平臺三個方面的內(nèi)容,涉及稅務(wù)數(shù)據(jù)資產(chǎn)管理中的數(shù)據(jù)治理和數(shù)據(jù)應用環(huán)節(jié)。
其中ETL可視化套件通過將傳統(tǒng)數(shù)據(jù)倉庫中ETL設(shè)計過程以一種友好的、圖形化的、流程化的方式呈現(xiàn)給稅務(wù)業(yè)務(wù)人員,使得數(shù)據(jù)加工過程實現(xiàn)去技術(shù)化和透明化。讓此前被屏蔽在數(shù)據(jù)處理過程之外的稅務(wù)人員清晰地看到數(shù)據(jù)從源數(shù)據(jù)到最終結(jié)果表的每一步,并借此調(diào)動他們的積極性,克服畏難情緒,實際參與到數(shù)據(jù)加工處理中去,一改過去數(shù)據(jù)處理需求只能求助于廠商的局面,打破數(shù)據(jù)處理的黑盒,將數(shù)據(jù)的業(yè)務(wù)含義和操作主動權(quán)交還到稅務(wù)管理人員。
數(shù)據(jù)資產(chǎn)可視化套件以圖形化的方式將大數(shù)據(jù)基礎(chǔ)平臺中的數(shù)據(jù)資產(chǎn)的元數(shù)據(jù)信息進行管理和展示。實際包含數(shù)據(jù)庫與庫、表與表之間的關(guān)聯(lián)關(guān)系和血緣關(guān)系以及細化到數(shù)據(jù)庫表字段的中文解釋,同時結(jié)合金三的權(quán)限設(shè)置對稅務(wù)人員自定義數(shù)據(jù)目前進行支持,使得數(shù)據(jù)管理的自由度和便利性大大提升。最終為稅務(wù)人員提供一幅稅務(wù)數(shù)據(jù)資產(chǎn)的全景圖以及數(shù)據(jù)之間關(guān)系的展示圖,幫助他們了解手里已有數(shù)據(jù)的真實情況,實時掌握數(shù)據(jù)資產(chǎn)變動情況。
稅源探查分析平臺以稅源全信息檢索、稅源關(guān)系圖譜、稅源納稅額預測、稅源涉稅事件追蹤等新型大數(shù)據(jù)應用為基礎(chǔ)構(gòu)建,目標是解決稅務(wù)工作的痛點和難點。稅源全信息檢索以稅源的手機號、注冊地址、名稱等為關(guān)鍵字對稅源進行檢索。稅源關(guān)系圖譜利用發(fā)票信息和互聯(lián)網(wǎng)數(shù)據(jù)描繪出稅源間的復雜關(guān)系。稅源納稅額預測結(jié)合外部的銀聯(lián)商務(wù)刷卡數(shù)據(jù)對稅源的營業(yè)額做估算,進一步預測出納稅額。稅源涉稅事件追蹤通過將數(shù)據(jù)庫中的信息還原為涉稅事件,并結(jié)合外部數(shù)據(jù)對事件的合規(guī)性進行校驗,同時還負責預測稅源未來可能的涉稅事件。
2015年末,云南國稅在金稅三期單軌上線穩(wěn)定運行的基礎(chǔ)之上,按照國家稅務(wù)總局的要求開展電子稅務(wù)局應用,目標鑄造一個基于Openstack云計算和Hadoop大數(shù)據(jù)技術(shù)的數(shù)據(jù)交換、處理、存儲平臺,連接內(nèi)外兩個網(wǎng)絡(luò),提供PC(個人計算機)、APP(應用)、SA(服務(wù)號)三種訪問入口,智慧服務(wù)經(jīng)濟社會、政府部門、社會大眾、納稅(費)戶、辦稅人員、稅務(wù)人員等六類對象,具有全天候、全方位、全覆蓋、全流程、全聯(lián)通、全智能等六個顯著特點的電子稅務(wù)局。
在項目前期明略數(shù)據(jù)助力云南省國家稅務(wù)局已經(jīng)完成了Hadoop大數(shù)據(jù)基礎(chǔ)平臺以及Openstack云計算平臺的搭建工作,并且部署了相關(guān)應用。下一步就是基于各個渠道的用戶行為數(shù)據(jù)對用戶特征進行多層次、多維度的感知和智能、主動的辨識,識別出用戶的偏好和習慣,實行稅源正向激勵和反向監(jiān)督,最終實行以用戶為中心的稅源精細化管理。
除上述客戶外,明略數(shù)據(jù)還在其他多個稅局積極參與數(shù)據(jù)平臺建設(shè)工作,新型數(shù)據(jù)應用的探討工作。隨著各省市對涉稅數(shù)據(jù)應用的認識加深,大數(shù)據(jù)時代下的稅收工作正在發(fā)生極大的改變,數(shù)據(jù)的價值和潛力將得到更大的發(fā)揮,稅務(wù)機關(guān)和技術(shù)廠商的關(guān)系也在圍繞數(shù)據(jù)發(fā)生變化。大數(shù)據(jù)只是技術(shù)手段,雙方的共同目標歸根到底還是樹立數(shù)據(jù)思維,優(yōu)化數(shù)據(jù)環(huán)境,建立一致、統(tǒng)一、規(guī)整的稅務(wù)數(shù)據(jù)資產(chǎn)管理體系,通過先進的科學分析幫助提升多種稅務(wù)業(yè)務(wù)應用,實現(xiàn)智能化、精細化的稅收管理方式。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03