在這個信息爆炸的時代,大數據的意義不僅在于“大”,而且在于“有用”。對于財稅行業而言,如何利用這些大規模數據是贏得競爭的關鍵。如果能結合大數據、深度學習等技術,通過分析商品名稱特征來確定其稅碼歸屬,對于企業財務、內審、稅務稽查及審計領域將有不可限量的應用前景。
2017廈門國際大數據大賽·唯你網賽題解析
大數據在財稅發票稽核與信息分析中的應用
唯你網依托在財稅行業深耕多年的海量的經過專業化標記的票據資源以及行業領先的票據智能識別能力,運用互聯網和大數據手段,在智能識別、智能審核、智能分析領域進行了探索和實踐,推動了財稅行業的變革。
發票大數據稽核應用
國家稅務總局從2016年開始推行《商品和服務稅收分類與編碼》,編碼表上列示了超過4000個稅碼;據不完全調查某國有大型超市就售賣15萬種商品,京東有超過100萬種商品,淘寶則更多,面對如此浩繁的商品品類,沒有一個企業財務、稅務或審計人員敢保證開票稅碼的100%準確。
大數據通過對發票信息深度分析、挖掘,解析發票關鍵信息轉化成結構化數據,定義規則引擎,幫助審核會計進行初步財務處理。從而提高財務人員開票稅碼的準確率,實現全方位的實時監控,對相關涉稅行為進行分析,快速找出風險點。
企業購銷行為分析及應用
發票承載著企業購銷兩端的信息,以及企業采購和銷售什么品類的商品、用什么樣的價格進行買賣、購銷行為發生的大致時間;依托這些脫敏的數據,充分發揮大數據的作用,從中分析挖掘企業的購銷行為信息,判斷企業大量銷售或采購的商品信息,促進企業購銷撮合、集中采購等商機實現價值轉化;同時,還可以結合其他數據,提出基于發票明細的相關創新性應用。
數據時代,財務領域的崛起必定是企業在激烈的市場競爭中最敏感的,也是最善于從大數據里嗅到時代發展機遇和未來趨勢的。唯你網大數據正以其高效、專業的處理技術服務于產業鏈上眾多的大中小微企業,打造全鏈條大生態圈。
應題要求
本題為發散性課題,要求參賽者根據自身對該課題應用的理解,基于發票大數據資源,同時收集和補充其他相關數據,以政府、企業和個人等角度為出發點,運用自然語言處理、語義分析建模、深度學習等方法,提出基于發票明細的創新性應用;結合應用進行分析,以論文和實現原型的形式展開,要求包含詳細分析過程、模型以及展現實際應用效果,并得出結論。