<noframes id="ixm7d"><noframes id="ixm7d"><rt id="ixm7d"><delect id="ixm7d"></delect></rt><noframes id="ixm7d"><rt id="ixm7d"><rt id="ixm7d"></rt></rt><rt id="ixm7d"></rt> <noframes id="ixm7d"><rt id="ixm7d"><delect id="ixm7d"></delect></rt><delect id="ixm7d"></delect><bdo id="ixm7d"></bdo><rt id="ixm7d"></rt><bdo id="ixm7d"></bdo><noframes id="ixm7d"><rt id="ixm7d"><rt id="ixm7d"></rt></rt><rt id="ixm7d"><rt id="ixm7d"></rt></rt><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><rt id="ixm7d"></rt> <noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><noframes id="ixm7d"><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><noframes id="ixm7d"><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d">

財務數據可視化分析范文

2023-09-21

財務數據可視化分析范文第1篇

一、何為數據可視化新聞

數據可視化新聞是以數據為核心, 以信息為支撐, 以可視化為基本載體的跨媒體新聞報道形式。數據可視化新聞包含三個要素:數據分析、視覺呈現、新聞報道。

近兩年來, 隨著新媒體的迅猛發展, 各種類型的媒體都在嘗試數據可視化新聞。以傳統紙媒為例, 《新京報》“新圖紙”專版, 《南方都市報》數據版, 《京華時報》“京華圖解”專版等都發揮了信息制圖優勢, 豐富了新聞報道的手段和視覺效果。

融合類新媒體也在數據可視化新聞中做出了積極探索。財新傳媒主要致力于對政經新聞的專業化報道, 他們的數據可視化新聞以龐雜但精確著稱, 而《壹讀》的數據可視化新聞則糅合了很多趣味性要素, 對于時政新聞的普及有促進作用。

由此可見, 數據可視化新聞不等同于簡單的圖表新聞, 表格化新聞, 新聞可視化改變了以往新聞報道的基本模式, 筆者以2015年4月1日至4月30日共計30天的財新傳媒 《數字說》 欄目中的新聞作品 (29 篇) 為例, 分析數據可視化新聞的制作特點。

1.話題分布

財新傳媒 《數字說》 作品話題分布圖 (2015 年4 月1日—4月30日)

2.呈現形式

財新傳媒《數字說》欄目中的數據可視化形式主要包括:數據模塊 (柱形、餅狀) 、信息圖+文字、時間軸、圖解、地圖、表格變形等。

以“財新網數據新聞與可視化作品”中呈現的19 個作品為例, 讓人印象深刻的呈現方式及其對應的新聞內容有:關系圖 (《周永康的人與財》、《金道銘的紅顏白手套》) , 地圖+實拍圖 (《青島中石化管道爆炸事故——財新記者實拍圖集》、《北京污水處理藏貓膩污泥偷排達數年》、《財新記者赴魯甸震中實拍圖集》) , 時間軸 (《曼德拉的世紀人生》、《光耀人生》) , 數據模塊 (《2015中國社交媒體影響報告》、《速度與激情:中國品牌崛起2015》) 。

3.數據來源

可靠、精準、即時化的數據是可視化新聞的核心, 因為真實與準確是新聞的生命。在財新傳媒數據可視化新聞中的數據來源列表中可見:中央紀委監察部、最高人民檢察院、牛津經濟研究院、Wind資訊、相關公司財報、胡潤研究院, 以及趕集網、智聯招聘等分類信息網站。

由此可見, 數據來源的多渠道、權威性和即時更新, 是數據可視化新聞真實準確的基礎。

二、數據可視化在新聞報道上的突破

數據可視化新聞拓展了既有新聞主題的廣度和深度, 并為讀者提供客觀、系統的報道以及良好的閱讀體驗。

通過數據挖掘手段的介入, 媒體可以尋找出對公眾、對社會有意義、有價值的新聞, 并獲得更加全面、客觀、直觀, 并且有深度的新聞表達。在新聞日趨同質化的今天, 媒體的差異化也體現在對相同新聞事件的不同解讀上。

在2014年全國“兩會”召開期間, 《南方都市報》共刊發了約110個“兩會”報道專版, 共計約200篇報道。其中很多報道是通過大量數據的搜集、分析、重組來完成的, 特別是3月6日的“圖解政府工作報告”的11個版面以及3月7日“圖解財報”4個版面尤為出色。此外, 南都網上還開辟了“2014全國兩會南都數圖匯”的專題頁面, 這讓更多的公眾對原本枯燥的時政、會議類新聞產生興趣。

2014 年8 月云南魯甸地震, 財新傳媒在其網站上發布實時更新的震區地圖, 用戶點擊某一地點, 記者在此拍攝的現場圖片及具體傷亡人數等信息都會出現, 新聞的互動性大大增強。

三、數據可視化新聞的發展趨勢

(一) 新聞數據的來源須權威準確

路透社做數據新聞時, 如果選題能夠讓記者進行原創采訪是最好的。如果不能通過采訪得到, 則借助公開數據資源, 如政府網站、企業披露資料、權威數據機構的發布或其他網絡資源。此外, 已發表或出版的新聞稿件、圖書也是獲取數據的來源。

《南方都市報》 在全國兩會期間成立專門的“南都兩會數據報道組”, 多途徑獲取數據, 并設有專職的統籌采編, 還與凱迪數據研究中心、南方輿情研究院等單位開展合作。報道中大量的數據來源于歷屆全國政協常委會報告和全國兩會會議資料, 還有少量來源于歷屆政協發布會的文字直播、國際貨幣基金組織《世界經濟展望》報告、中國官方數據報告、媒體公開報道中的相關數據等。

(二) 程序員介入新聞生產流程

為適應數據可視化新聞的發展趨勢, 財新傳媒成立了“財新數據新聞與可視化實驗室”, 在2013 年11 月22日發生的青島中石化管道爆炸事故的報道中, 財新網制作了《青島中石化管道爆炸——財新記者實拍圖集》數據可視化效果圖, 這個效果圖的制作過程中, 程序員開始介入到新聞生產流程中, 通過將記者在前線拍攝到的圖片, 進行數據整理, 為后方編輯提供指揮的地圖。

“現在財新的程序員已經從三樓搬到二樓, 和記者們坐到一起?!?/p>

(三) 數據新聞記者應具備跨界技能

數據新聞制作需要掌握的技能包括社科研究方法、計算機數據處理、平面與交互設計、網絡編程、數據獲取能力等。雖然專業性強的數據處理技術新聞記者難以深入了解, 但如何與程序員溝通, 了解技術的發展現狀, 知道如何將新技術與新聞敘事融合, 以及具備基本的數據挖掘、統計能力, 是從事此類新聞報道的媒體人必須掌握的技能。

(四) 可視化由平面向立體轉化

國內可視化新聞若想取得進一步發展, 必須更新觀念, 不應狹義地把可視化新聞等同于圖表新聞, 表格化新聞。

可視化新聞除了二維平面呈現方式以外, 還可以分為三維及多維可視化①新聞和網絡可視化新聞。這是可視化新聞利用通用的視覺語言, 對紛雜的信息進行富有想象力的設計。在這種設計方式中, 空間時間化、時間空間化、邏輯節點化三者之間互相共生又互相作用, 共同體現信息的價值, 使得原本平面的新聞立體起來, 這才是可視化新聞發展的高級階段。

摘要:大數據時代背景下, 數據在給各個領域帶來深刻變革的同時也引領了新聞報道發展方向和新聞敘事方式的新變化。其中, 可視化新聞成為近年來一種新興的新聞傳播樣式和報道方式。本文結合近期的數據新聞案例, 探究當前數據可視化新聞的呈現特征, 以及此類新聞報道的發展趨勢。

關鍵詞:數據新聞,新聞可視化,敘事方式,財新傳媒

參考文獻

[1]滕瀚, 張雙弜.大數據時代的可視化新聞.采寫編.2014年第4期

[2]張春紅.數據新聞的挖掘與可視化處理.中國新聞出版網.2014年6月10日

[3]馬金馨.數據新聞的國際趨勢和大中華區發展.在中山大學傳播與設計學院的講座.2014年5月29日

財務數據可視化分析范文第2篇

當今信息時代,形式各異的信息載體如移動智能設備、電子商務網站等,幾乎每時每刻都在產生并傳遞大量商業數據,數據的背后隱藏著信息,而信息之中蘊含著知識和智慧,及時地發現這些知識并將其應用于現實的生產環境中可以為人們正確分析形勢和作出決策提供依據。數據可視化是從大型數據集中以某種概要形式抽提信息,并將其以圖形圖像的形式表達呈現,是數據的一種視覺表現形式。在商業智能中,決策者通常需要根據歷史數據總結出經驗教訓,以便在未來競爭中處于有利地位。但是人工地從紛繁復雜的數據中抽取關鍵信息是一件費力費時的工作,相對于從一堆數據中去抽取和抽象出具體信息而言,人類更善于處理圖形化的信息,通常能夠一眼洞悉圖片中所傳達的信息,因此數據可視化技術是商業數據分析的不可或缺的一部分。

目前,國內已有傳統電子商務系統的建設大多采用價格昂貴的大型服務器,數據庫采用關系型數據庫系統,隨著云計算的發展和互聯網+時代的到來,數據呈爆炸式增長,傳統的單臺主機在計算與存儲方面也越來越不能滿足數據分析處理的需求[4]。由此產生了Hadoop平臺技術,該平臺技術包括兩大核心設計:分布式文件系統HDFS(Hadoop Distributed File System)和并行計算框架Map Reduce。HDFS設計部署在廉價的硬件上,成本低且具有高容錯性,為海量數據提供存儲,Map Reduce為海量數據提供并行計算。作為一個開源大數據處理平臺,在業界已得到廣泛的研究與應用,各大知名企業也大都在各自核心領域運用了此技術。國外著名社交網站Facebook運用Hadoop技術構建了整個網站的數據倉庫,國內騰訊、百度和阿里巴巴等互聯網知名企業也都采用了Hadoop技術用于海量數據處理分析??梢?研究并使用Hadoop技術解決商業數據的可視化,具有十分重要的意義,本文提出了一種基于Hadoop平臺實現商業數據可視化的解決方案并論證其可行性。

2 相關研究

2.1 Hadoop相關技術

Hadoop有狹義和廣義之分,狹義的Hadoop通常是指Hadoop Core,其包括最底層的分布式文件系統HDFS和并行運算框架Map Reduce引擎。廣義的Hadoop通常泛指Hadoop生態系統(Hadoop Ecosystem),其范疇更廣,除了Hadoop本身(HDFS+Map Reduce),還包含HBase、Hive、Pig、Sqoop、Mahout和Zoo-keeper等其他開源工具。

1)HDFS框架

HDFS[1]存儲Hadoop集群中所有存儲節點上的文件,主要包含兩個功能組件Name Node和Data Node。Name Node管理文件系統的命名空間,存儲文件的元數據信息,并維護文件系統樹。Data Node存儲文件的數據塊信息,定期向Name Node發送其所存儲的塊列表信息。

2)Map Reduce框架

Map Reduce[1]是Hadoop下的分布式數據處理模型,主要由Job Tracker和Task Tracker組成。Hadoop將作業分成若干個map任務和reduce任務來執行,Job Tracker是任務調度器,通過調度Task Tracker上運行的map或reduce任務,來協調系統作業。Task Tracker是任務跟蹤器,向Job Tracker報告其任務執行情況。

3)Hive數據倉庫

Hive是基于Hadoop的一個分布式數據倉庫工具,其數據存儲在HDFS上,可以將結構化數據文件映射成一張數據庫表,并提供基于SQL的查詢語言(由運行時自動翻譯成Map Reduce作業)用以查詢數據。

4)HBase數據庫

HBase是一個分布式的、面向列的非關系型數據庫,通過Hadoop文件系統API來持久化存儲數據,所有數據都存儲在HDFS上,支持Map Reduce的批量式計算和海量數據的實時隨機查詢。

2.2 數據可視化技術

當前主流的數據可視化形式有云圖、平行坐標圖、矩陣圖、直角坐標圖、散點圖等[5]。每種可視化方式都不是完美的,選擇恰當的可視化方法,集中展現數據的某個角度,幫助我們分析洞察數據,轉換為決策才是最重要的。

可視化圖形由主區、圖元、圖例、圖文說明等基本要素組成[8],其中主區是用于繪制可視化圖形的區域畫板,通常是一個長度和寬度確定的矩形,用于確定在屏幕的具體區域繪制可視化圖形。不同類型的可視化形式在可視化基本要素的組織方式和內容上有所不同,例如條形圖和地圖,條形圖以直角坐標系為基準,通常以縱軸條形的長度表示各類別的度量值,以橫軸條形的寬度(通常是等長)表示類別,而地圖以地理地圖為基準,通過色彩比重來顯示各個行政分區的度量值。這表明我們在進行可視化的時候需要對數據進行不同的組織變換,而通常同主題的可視化的展現形式基本相同,例如用條形圖展示不同類別的商品的銷售額、銷售量等,這就意味著可以將條形圖的一些基本要素抽象出來,以數值的形式組合起來構成一個可視化分析模型,每次重用此模型即可而不用每次可視化都進行一次數據重組。本文研究的是如何將同一類型的可視化組織起來形成一個主題模型,針對于這個主題的可視化,都可以通過此模型方便地構建可視化形式。

3 基于Hadoop的商業數據可視化分析模型

本研究以Hadoop云計算平臺為基礎,提出了基于Hadoop平臺構建商業數據可視化分析模型的方案,技術方案如圖1所示。原始業務數據存儲在關系型數據庫中,首先需要將數據從關系型數據庫集成到Hadoop的HDFS存儲上,然后建立Hive數據庫,將數據加載進Hive中,通過Hive QL語句對數據進行查詢分析,將查詢的結果存入HBase數據庫中,將相應的查詢結果與已有的可視化參考模型結合,構造可視化分析模型,將模型以固定形式存儲在HBase中,然后通過high Chart、echarts等可視化插件對分析模型進行圖形可視化。

3.1 數據集成

首先從原始企業數據庫中抽取出需要的業務數據存入到Hadoop的HDFS文件系統中,具體分為兩個階段,第一階段初始數據全量導入,第二階段數據增量導入。實驗中采用Sqoop技術實現數據導入,Sqoop是Hadoop生態系統的一員,主要用于Hadoop與關系型數據庫的數據傳遞,可以通過Hadoop的Map Reduce將關系型數據庫的數據導入到Hadoop的HDFS中,也可以將HDFS中的數據導入到關系型數據庫中[2]。具體的使用如圖2所示

圖2中已標注的是服務器的路由信息,未標注的參數--ta-ble是指定數據表名稱,--columns指定導入指定表的哪些字段,--target-dir是指定數據的HDFS文件存儲路徑。

在進行第一階段的全量導入時,一次性導入所需的所有數據,由于商業數據每日數據都有更新,所以需要第二階段的增量導入??紤]到HDFS不支持隨機修改和刪除數據,只能在文件末尾追加,需要分情況處理待更新數據,本文中將數據劃為兩類,一類是一些用于表示實體屬性或狀態的數據,如商品類別表、公司表等,此類數據具有數據量小,更新頻率低的特點,但有修改刪除等操作。一類是基礎業務數據,如訂單表和訂單詳情表等,此類數據新增頻繁,但無修改刪除操作。第一類數據的更新策略,先刪除HDFS上的此類數據,然后通過圖2中的Sqoop import命令導入此類數據經過修改后的數據。第二類數據的更新策略是直接使用Sqoop import--append命令導入新增部分的數據,如圖3所示,圖中標注的--append表追加,不可省略,標注的where是SQL查詢語句中的條件查詢。數據需每日更新,實驗中采用linux系統自帶的定時任務crontab每日定時執行數據導入程序。

3.2 數據轉換存儲

數據通過Sqoop完成數據導入以后,為了保證數據的質量和可用性,需要對數據進行格式轉換存儲。在實際操作中,通常會進行兩種轉換,字段組合和字段拆分。

字段組合:各個企業數據之間是相互獨立的,集中到同一平臺時可能會有關鍵數據沖突問題,解決策略通過建立臨時的Hive表,將數據加載到臨時表中,再通過Hive QL(Hive Query Language)語句重組關鍵字段,保證其唯一性和正確性。

字段拆分:業務數據中的時間屬性是一個完整的時間信息,為了提高查詢效率,通常將數據的時間字段拆分成單獨的年月日,使數據在Hive中按照時間分區存儲。解決策略是通過建立臨時的Hive表和最終的分區表,將數據加載到臨時表中,再通過Hive QL語句拆分數據的時間字段并插入到分區表中。其中建立分區表使用的命令見圖4,數據分區存儲使用的命令如圖5所示:

3.3 數據分析與模型建立

數據進入Hive數據庫以后,結合實際業務需求,設計可視化分析主題,通過Hive QL語句對數據進行分析,從Hive數據庫中查詢相關的數據,記錄查詢結果,然后構建可視化分析模型,將模型結果存入Hbase數據庫中??梢暬黝}分析就是在分析商業數據類型、存儲結構的基礎上對具有可視化意義的主題概念進行提煉和取舍的過程。

數據可視化在響應的速度方面具有很高的要求,本文研究采用Hbase存儲Hive QL查詢結果和可視化分析模型。Hbase是一個列式數據庫,僅支持行鍵檢索數據,所以對行鍵的設計至關重要。

本文對行鍵的設計采用兩類設計標準,如圖6所示,第一類采用“分析主題+生成時間”的形式,分析主題是每類Hive QL查詢設計的類別名,用于區分統計分析結果;生成時間采用“yyyy MMdd”的形式,用于標識統計分析結果的生成時間。其對應一個列族,但有多個列,且列數不固定,列中主要是用于存放成員屬性集和分析模型。成員屬性是每類查詢結果中能夠唯一標識一條查詢記錄的屬性值。分析模型是該類查詢結果集針對于某種可視化形式的數據存儲模型。分析模型的建立是以現有可視化圖形為依據,抽象出其圖形化屬性,將其數值化,然后以json字符串的形式存入HBase中。例如圖7中針對于地域維度的銷售分析,將area Sale設置為分析主題類別名,第一行采用的是第一類行鍵設計,content是列族名稱,allproperty列存儲的是成員屬性值集合,salepie列存儲的是針對于銷售額分析的餅圖模型。

第二類行鍵設計采用“分析主題+成員屬性+生成時間”的形式,其與第一類擁有相同的列族,但不同列,每列存儲查詢結果的屬性值。例如圖中salequatity列表示銷售量,sale表示銷售額,buyerquatity表示買家數量,sellerquatity表示買家數量。

4 實驗方案

4.1 Hadoop集群配置

本研究利用實驗室提供的計算機網絡中心搭建Hadoop云計算平臺,具體的參數如下:

Hadoop集群:1個Master節點,3個slave節點

硬件配置:4G內存,100G硬盤

系統版本:

軟件版本:Hadoop-1.2.1,HBase-0.98.12,Hive-1.1.0,Zoo-keeper-3.4.6,Sqoop-1.4.6

4.2 實驗驗證

1)數據來源

本文以電子商務領域中的具體應用(面向小微企業的進銷存管理平臺)為實例來驗證本文提出的可視化分析模型。平臺系統的系統架構如圖8所示,此系統采用分布式數據庫,由一臺路由服務器和若干臺數據庫服務器組成,企業需要通過路由服務器查找到其數據所在的數據庫服務器才能進行訪問。數據庫采用oracle,每臺數據庫服務器對應一個數據庫實例,每個數據庫示例對應多個表空間。目前平臺中企業可分為獨立企業和連鎖企業兩種,獨立企業擁有獨立的表空間,連鎖企業共同擁有獨立表空間。整個平臺最多擁有106個企業,每個企業每日最多生成103個訂單,即整個平臺每日最多生成109條訂單記錄。目前一個企業有70余張數據表,隨著業務的增加,數據表的數量也可能增加。本文研究的可視化模型是基于平臺所有企業的相關業務數據建立,由于采用的是分布式系統,數據分散在不同的數據庫服務器上,首先需要進行數據集成,把分散的企業數據從分布式數據庫系統集成到Hadoop平臺,然后對整體數據進行可視化分析建模。

2)實驗分析

本文在存儲數據分析的結果和數據可視化模型時采用的是HBase數據庫,由于數據可視化在響應速度方面具有較高要求,所以對HBase在查詢性能方面做了實驗對比,實驗結果如圖9所示,圖中統計了在不同數據量下,五次查詢用時以及平均用時。

結論:首次查詢需要建立客戶端與集群的連接,需要較長時間,具體時間的長短受網絡擁塞狀況、集群運行狀態等多方面因素影響。連接建立后查詢時間基本穩定在毫秒級,實驗測試的結果顯示Hbase能滿足這方面的要求。

3)實驗結果

以銷售分析為例,可以從商品類別、時間、地點三個維度出發,分析商品的銷售量、銷售額、買家數量和賣家數量,為經營者進行銷售歷史統計和未來業務調整提供決策支持。例如,從地域維度進行分析,統計商品的銷售量、銷售額、買家數量和賣家數量,設計的Hive QL語句為:

圖形可視化采用的是百度的echarts插件,首先從HBase中讀取已建立的分析模型數據,前臺通過js進行數據解析,然后由echarts實現畫圖和渲染,最后的可視化圖形如圖10所示。

5 結束語

本文提出了基于Hadoop平臺構建商業數據可視化分析模型的設計方案,通過對商業數據特性的分析和數據可視化技術的研究,將數據從關系型數據庫集成到Hadoop平臺,使用統計分析等方法對數據進行處理和分析,重點介紹了數據分析、分析模型的建立及其存儲,并在特定的應用背景下實現和驗證了所提出的商業數據可視化分析模型建立的可行性。

參考文獻

[1]劉文峰,顧君忠,林欣,等.基于Hadoop和Mahout的大數據管理分析系統[J].計算機應用與軟件,2015,32(1).

[2]戴中華,盛鴻彬,王麗莉.基于Hadoop平臺的大數據分析與處理與處理[J].通訊世界,2015(6).

[3]孟志青,段智華.商業銷售分析數據倉庫的數據可視化的一種設計[J].計算機工程與應用,2000,36(10).

[4]諶頏.基于Hadoop的標簽推薦系統設計[J].應用技術與研究,2015(7).

[5]劉勘,周曉崢,周洞汝.數據可視化的研究與發展[J].計算機工程,2002,28(8).

[6]李偉,張爽,康建東,等.基于hadoop的電網大數據處理探究[J].電子測試,2014(1).

[7]黃輝,陸利忠,閆鑌,等.三維可視化技術研究[J].信息工程大學學報,2010,11(2).

財務數據可視化分析范文第3篇

隨著勘探開發難度的提高,石油鉆井作業的難度越來越大。在石油鉆井作業中,由于所鉆地質條件復雜多變,實鉆井眼軌跡不可避免地與設計井眼軌跡產生各種偏差,為了更直觀地觀察和對井眼軌跡進行動態實時監控,研究井眼軌跡三維可視化是很有必要的。利用隨鉆測井工具實時提供的數據,通過三維仿真技術實時地反映所鉆地層的地質情況和井眼軌跡,能夠方便鉆井人員直觀觀察、分析和控制井眼軌跡,防止實鉆井眼間的碰撞以及減少與設計軌跡的偏差,進而提高油層鉆遇率、采收率和節約鉆井成本[1]。

結合三維可視化井筒動態監控系統的開發給出了基于井斜數據的井眼軌跡三維可視化方法,并給出了其建模過程,進行了算法分析和設計。

2 三維井眼軌跡建模

2.1 基本概念

所謂井眼軌跡,就是井眼軸線形狀的圖形,它是一條空間曲線,為了進行井眼軌跡控制,就要了解這條空間曲線的形狀,就要進行軌跡測量,也即“測斜”。目前常用的測斜方法并不是連續測斜,而是每隔一定長度的井段測一個點,這些井段被稱為“測段”,這些點被稱為“測點”。軌跡

基本參數:井深、井斜角、井斜方位角[2]。

圖1顯示了井眼軌跡的空間圖和平面圖。

(1)井深(L)

指井口(通常以轉盤面為基準)至測點的井眼長度,也有人稱之為斜深,國外稱為測量井深(Measure Depth,MD)。井深是以鉆柱或電纜的長度來量測。井深既是測點的基本參數之一,又是表明測點位置的標志。一個測段的兩個測點中,井深小的稱為上測點,井深大的稱為下測點。井深的增量(dl總是下測點井深減去上測點井深。

(2)井斜角(α)

在井眼軸線上某測點作井眼軸線的切線,該切線向井眼前進方向延伸的方向為井眼方向線。井眼方向線與重力線之間的夾角就是井斜角。

(3)井斜方位角(φ)

某測點處的井眼方向線投影到水平面上,稱為井眼方位線,或井斜方位線。以正北方位線為始邊,順時針方向旋轉到井眼方位線上所轉過的角度,即井斜方位角,簡稱方位角。一個測段內的井斜角增量總是下測點井斜角減去上測點井斜角。一個測段內的方位角增量總是下測點方位角減去上測點方位角。

(4)N坐標和E坐標的概念

將井眼軸線向水平面上投影,并以井口所在水平面上的投影為坐標原點,以正北方向為N軸,以正東方向為E軸,便得井眼軸線的水平投影圖,井眼軸線上任意一點在水平投影圖中的坐標(N,E),稱之為該點的N坐標和E坐標。

2.2 建?;具^程

建立三維井筒模型的基本過程為點→面→體的過程。

2.2.1 點->面

用來建立三維井筒模型的初始數據如井斜數據、離散點數據在計算機內都表示為離散點的集合,而一個三維井筒模型是由各個面圍成的,因此建模的第一步就是利用已有的點數據建立起三維井筒模型中的各個面。

曲面在計算機中可以表示為四邊形網格,也可表示為三角網格,如圖2所示。

三維井筒模型中的面都是邊界很任意的自由曲面,其形態有時會很復雜,而四邊形網格適合于表示形態比較規整的曲面,對于帶尖角邊界的曲面最好采用三角網格表示,這樣可以提高曲面的表示精度,因此三維井筒建模系統中的面采用了三角網格表示[3]。

由點集建立曲面,就是要將點的集合轉換為表示曲面的網格,因此需要用剖分技術對已有點集進行剖分,形成三角網格。

2.2.2 面->體

由于三維井筒是一個體,需要把這些井筒面按照一定的規則,實現無縫連接,把井筒由一條空間曲線,變成一個空間柱體??臻g曲面是具有多樣性的,將一個個曲面連接起一個體,需要注意連接規則。否則出現混亂的空間體。

3 算法分析與設計

3.1 基于井斜數據的井眼軌跡計算

如圖3所示,這是一條井眼軌跡曲線空間圖,設有一條空間曲線L,L上點A的定向要素為DA、NA、EA、αA、ΦA。井深增加到B點,設AB弧與整個井眼相比為較小量,其長設為dl,B點的定向要素為DA+dD、EA+dE、NA+dN、αA+dα、ΦA+dφ,AB線段水平投影為A’、B’線段??山普J為AB弧長=AB線段長=dl.

在垂直投影面中可得公式,如下式所示:

在水平投影面中可得公式,如下式所示:

坐標參數與基本參數之間的關系,如下式所示:

根據參數測點深度、井斜角以及方位角計算井身軌跡,算法如下:

Step1:從數據庫中讀取第一個點(A)及第二個點(B)的測點深度、井斜角、方位角,以第一個點為基本參數,算出第二個點坐標。

Step2:算出點A與點B之間的測量深度之差dl,點A與點B之間的井斜角之差da,點A與點B之間的方位角之差dφ。

Step3:以算出第二個點坐標為基本參數,計算第三個點坐標,依此類推得到整個井身點坐標。

3.2 井眼軸線筒狀化

基于井斜數據,已經算出每個測點的三維坐標,現在需要基于切片把每一個測點都變成一個圓面,然后計算這些井筒邊界點[4]。假設A、B倆測點,A點為起始點。A的圓面為水平的,A圓心為井口水平面坐標原點。計算B點的圓面。

Step1:定義一個n*3的數組arrA,存放A點水平圓周平面(以指定井筒的半徑為半徑)的n各等分點的坐標。

Step2:取測點A,測點B。計算向量BA,為B點圓面的法向量。

Step3:將向量BA經過平移旋轉矩陣運算,與井口水平面的法向量重合。記下運算矩陣Z。

Step4:定義一個n*3的數組arrB,計算以井口水平面坐標原點為圓心,套管外徑為半徑的圓周上n等分的點,存在數組里。

Step5:將圓周上的每個點再經過矩陣Z的逆變換運算,得到以B點為圓心,以BA為法向量,套管外徑為半徑的n個圓周邊界點仍舊存放在arrB數組里。

Step6:將arrA、arrB數組里的點,按照三角條帶[3,4]的順序連接,就構成井筒。

4 結語

給出了一種基于井斜數據的井眼軌跡三維可視化建模方法。即,首先根據井斜數據計算出個測點的三維坐標,然后基于切片方法將每個測點按指定井筒半徑在垂直法線方向的圓周上取n個等分點,最后將臨近測點的2*n個點按三角條帶順序連接構成三維井眼軌跡。該方法運用在《三維可視化井筒動態監控系統》的三維井眼軌跡顯示模塊,并取得了很好的效果。

參考文獻

[1]曹偉,張愛軍,高春緒,等.三維井眼軌跡地質導向軟件的開發與應用.錄井工程,2011,(02).

[2]百度文庫.井眼軌跡.http://wenku.baidu.com/view/71139ddc7f1922791688e80b.html.

[3]亓永民.基于錄井導向的井眼軌跡三維信息處理研究[D].大連海事大學,2011:59-60.

財務數據可視化分析范文第4篇

一、數據可視化的概念與意義

數據可視化技術誕生于二十世紀八十年代, 其定義可以被概括為:運用計算機圖形學和圖像處理技術, 以圖表、地圖、標簽云、動畫或任何使內容更容易理解的圖形方式來呈現數據, 使通過數據表達的內容更容易被理解。據研究表明, 人類獲得的關于外在世界的信息80%以上是通過視覺通道獲得的, 因此對大量、復雜和多維的數據信息進行可視化呈現具有重要的意義。它與虛擬現實技術、計算機動畫技術、人工智能、數據挖掘、數字地球、經濟趨勢, 甚至與人類基因組計劃等誘人的前沿學科領域都有著密切的聯系。如何有效處理和解釋這些包含大量信息的海量數據將是人類面臨的巨大挑戰, 同時, 這也是數據可視化技術所呈現給人類的誘人的應用前景!

二、大數據時代的機遇與挑戰

物聯網、云計算、移動互聯網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器, 無一不是數據來源或者承載的方式。隨著社交網絡的普及, 使得人們的行為和情緒的細節化測量成為可能。挖掘用戶的行為習慣和喜好, 凌亂紛繁的數據背后找到更符合用戶興趣和習慣的產品和服務, 并對產品和服務進行針對性地調整和優化, 這就是大數據的價值。大數據也日益顯現出對各個行業的推進力。大數據技術的戰略意義不在于掌握龐大的數據信息, 而在于對這些含有意義的數據進行專業化處理。換言之, 如果把大數據比作一種產業, 那么這種產業實現盈利的關鍵, 在于提高對數據的“加工能力”, 通過“加工”實現數據的“增值”。

三、大數據環境下的數據可視化技術發展趨勢

伴隨著大數據時代的來臨, 普通人越來越多的開始消費數據信息, 形成了龐大的“數讀”族群;同時, 進行數據可視化應用開發的人群也迅速擴大, 促進了更加智能的數據可視化工具的出現, 為更大范圍的人們提供了接觸可視化思想的機會。[3]自從計算機開始應用于可視化技術以后, 人們發現了許多新穎的可視化技術, 現有的技術也得到了改進;新技術和新平臺的出現, 使可視化技術可以實現用戶與可視化數據之間的交互, 從采集分析數據到呈現數據可視化也做到一體化實現。

1. 多維疊加式數據可視化應用

這類數據可視化應用常見為社交網絡或者生活消費類應用與數字地圖的疊加, 這種疊加模式針對年輕化的人群很有吸引力, 基于地理位置的網絡數據信息分享傳播具有某種互動娛樂性。比如在微信這款應用中.用戶可以依靠對方和自己的距離信息來篩選好友;在世紀佳緣網上, 有一種地圖搜索的模式, 用戶可以通過其他人所標注的地理信息來對一張交友地圖進行搜索;在大眾點評這款智能手機應用中, 可以基于地理信息輕松找到附近的酒店、餐廳, 用戶可以在地圖上對店鋪進行留言評價, 還可以在地圖的對應位置留下圖片供其他用戶參考。在此類數據可視化應用中, 用戶所獲取的視覺信息不再是單一維度而是多維的。

2. 即時的數據關聯趨勢可視化服務

數據可視化除單純呈現數據狀態之外, 還有一個非常實用的功能, 就是通過對若干存在關聯性的可視化數據進行比較中, 能夠挖掘出數據之間的重要關聯或者是呈現一個有理有據的數據發展趨勢。在大數據環境下, 這種數據可視化服務已經能夠輕松做到即時生成;也就是說, 數據采集完成后可以立刻生成可視化方案。支付寶的一項電子對賬單服務就是這樣, 通過用戶使用支付寶交易所產生的數據信息, 月末自動生成出一套屬于用戶個性化的數據圖表, 用戶借由這組數據圖可以輕松的分析出自身的消費狀況, 即時的做出調整與規劃。這類服務能即時的為用戶創建出數據可視化, 同時又能快捷、便利的揭示出數據間的關聯和趨勢。

3. 全媒體多平臺的數據可視化展示

大數據時代不僅處理著海量的數據, 同時也加工、傳播、分享它們。不知不覺中, 數據可視化已經遍布我們生活的每一個細節。例如我們手中的智能手機, 既是數據采集工具, 同時也是一個多媒體的數據可視化展示平臺?,F在的新聞播報也越來越多的用到數據圖表, 動態演示且立體化的呈現報道內容;影視劇和電子游戲中頻繁出現的數據可視化元素, 無疑讓作品的科技與未來感更加豐滿;教育與科普方面則是數據可視化更大的應用領域, 人們開始對單調保守的講述方式失去興趣, 期待更加直觀、高效的信息呈現方式, 數據可視化正好彌補這項需求。在智能手機、平板電腦和車載電腦等平臺日漸普及的當下, 新的交互手段將成為數據可視化的趨勢。

四、總結

隨著網絡技術發展到今天, 由量變轉化為質變的大數據時代已經來臨。全球用戶對傳感數據的訪問量飛速增長, 關注數據挖掘和分析的發展具有相當重要的現實意義。隨著用戶對數據分析需求的增長, 對數據可視化的要求也會變得越來越強烈, 普通用戶也不斷地被要求或主動參與到設計和創建可視化項目的過程中。更加有效的呈現出用戶需要的數據, 使其更易于理解進而幫助用戶做出決策, 同時能體驗和參與更有趣更多元化的數據可視化技術將大有作為。

摘要:在近十年時間里, 數據采集、存儲和數據分析技術飛速發展, 大大降低了數據儲存和處理的成本, 使得一個大數據時代逐漸展現在我們的面前。曾經, 枯燥的數據統計和分析只是統計學家、數據分析師和科研學者們的專利, 而大數據革新性的將海量數據處理變為可能, 并且大幅降低了成本, 使得越來越多跨專業學科的人投入到大數據的開發應用中來。大數據能夠幫助人們更明智的制定決策、更清晰的傳達理念。面對大數據瑰麗且深奧的面貌, 如何才能讓大型數據集變得親切和易于理解, 可視化無疑是最有效的途徑。對大數據背景下的數據可視化應用展開研究, 將有助于我們發展和創新數據可視化技術。

關鍵詞:大數據,數據可視化,數據圖表,信息設計

參考文獻

[1][美]Nathan Yau、向怡寧譯.鮮活的數據——數據可視化指南[M].人民郵電出版社, 2012

財務數據可視化分析范文第5篇

“在互聯網+的大背景下,新奧能源正在思考未來管理的模式以及公司戰略升級的方向。我們需要打造出基于大數據驅動的智能運營體系,通過持續的大數據治理和大數據應用迭代,推動公司管理的變革提升和業務的創新發展。同時,針對于燃氣產業的特點,我們希望通過業務數據的深度挖掘來保障公司資源的高效整合與利用?!毙聤W能源控股有限公司信息副總監崔占海這樣表述新奧能源啟動大數據項目的初衷。

新奧的困惑

其實,新奧能源的大數據項目還有一個現實的背景:從全球范圍看,政府為改善環境質量,大力推廣清潔能源發展,而公民環保意識整體提升,清潔能源可謂集萬千寵愛于一身,市場前景看好。而與此同時,新能源企業正面臨著日趨嚴格的政府監管、激烈的可替代能源的競爭和更嚴苛的消費者需求。新能源企業如果繼續以現有的業務模式來面對當前的市場環境,往往會捉襟見肘,而大數據為其提升管理效率和拓展業務邊界提供了前所未有的可能性。

原始數據是零散和沒有規律的,經過篩選和組織后會成為信息,而把相關聯的信息整合并有效地呈現最終轉化為知識與價值才是最關鍵的?!叭绾慰焖?甚至是實時)和準確地對這些海量數據進行建模、分析與展現,從而真正實現數據的價值”是新奧大數據平臺重點解決的問題?!皵祿梢暬治鍪亲詈玫墓ぞ??!贝拚己Uf,“不是人人都能夠成為數據科學家,這需要有極高的專業知識和深厚的行業經驗和洞察力。而有了數據可視化分析工具,一個普通人也能看出一些關鍵指標和一些重要的趨勢性暗示?!?/p>

只有看得見才能做得好

大數據整體產業鏈基本分為這樣幾個環節:數據收集、數據處理、數據分析、數據可視化在簡化數據量和降低大數據應用的復雜性中,大數據分析發揮著關鍵的作用。對于大數據的存儲、管理和處理任務離不開云計算,而與人交互離不開數據可視化。數據可視分析解決的是大數據落地問題。當經過數據可視分析和可視化的方法以邏輯形式呈現,企業決策層就能輕松通過數據實現輔助決策和預判了,從而讓數據與行業結合,成為商品、產生價值。

數據可視化是指將大型數據集中的數據以圖形圖像形式表示,并利用數據分析和開發工具發現其中未知信息的處理過程,是大數據信息處理最為重要的環節。數據可視化不僅能夠幫助數據的最終呈現,也對發現數據中新的信息氣到了非常關鍵的作用。舉個例子,錯綜的關系是眾多大數據場景中的重要一環,社交網絡或許就是最顯著的例子,想要通過文本或表格的形式理解其中的大數據信息是非常困難的;相反,可視化卻能夠將這些網絡的趨勢和固有模式展現地更為清晰。

總結來說,可視化可以幫助大數據獲得完整的數據視圖并挖掘數據的價值,讓普通人也能變成“數據科學家”,這是其最大價值所在。正如中國傳媒大學教授沈浩所說:除了上帝,每個人都須用數據說話!怎么說?顯然“可視化”很重要,因為“只有看得見才做得好,看得見才能做得到”。

友好的人機交互不是那么容易

可視化方法可通過創建表格、圖標、圖像等直觀地表示數據。但與一般性存儲應用的可視化方案不同,由于面對的是大數據,所以在數據獲取和統計方面是難點。

比如統計當前云存儲系統的文件總量是一個相對困難的問題:一方面時效性難以把握,另一方面文件總量是不斷變化的,導致結果的誤差總是存在。而要解決這個問題必須從底層、從云存儲系統入手??梢栽谠獢祿掌鞔鎯ΡM量多的文件元數據,同時計算和存儲統計模型數據等等,同時必須意識到:當數據集達到一定數量級,那么必須允許統計值存在允許的誤差。而在數據的呈現與交互方面,基于大數據的可視化分析也面臨著挑戰。統計圖和主題圖,不同的需求導致了不同的數據呈現和交互方式。但每次根據不同的需求去更改設計是個勞心費力的工作,需要同時帶有用戶驅動的數據簡化模型、高可擴展性與多級層次的數據可視化工具。

所以,大規模數據和高維度數據會使可視化工作變得困難。對于像新奧能源這樣的企業用戶來說,首先應該保證網絡與硬件設備能夠滿足數據的高速獲取以及完整性,并通過數據治理或信息管理確保數據準確與安全,必要的時候可以請專業人士比如數據科學家來對數據進行解讀。

平臺很關鍵

但是可視化只是讓企業的數據講述方式更加豐富了一些而已,要成功的完成數據講述,關鍵還是在于數據的質量。

Qlik亞太及日本區副總裁Phillip Beniac是可視化分析領域的技術專家,在該領域有20多年的經驗。而Qlik是一家可視化分析廠商,該公司不久前剛剛宣布在中國成立外商獨資企業。Phillip Beniac認為,企業在進行大數據的可視化分析時,最重要的一點是數據的完整性和準確性。

財務數據可視化分析范文第6篇

隨著數據庫技術的不斷發展和數據庫管理系統的廣泛應用,數據庫中存儲的數據量急劇增加。在這些大量數據的背后隱藏了很多有意義的信息。但是,現今數據庫的大多數應用仍然停留在數據的錄入、查詢、統計、檢索階段,無法發現數據中存在的關系和規則,無法根據現有的數據預測未來的發展趨勢,因而數據庫中隱藏的豐富的知識遠遠沒有得到充分地發掘和利用。知識發現為解決這一問題提供了有效途徑。

知識發現(Knowledge Discovery in Database,KDD)起源于從數據庫中發現知識,它還有許多意義相近的名稱,如信息發現(1nfomation Discovery)、知識提取(Knowledge Extraction)等。知識發現是在數據庫技術、機器學習、人工智能、統計分析、人工神經網絡、高性能計算和專家系統等多個領域的基礎上發展起來的新概念和新技術,是指從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中提取隱含的、未知的、潛在的、有用的信息的過程。KDD的核心技術是數據挖掘(Data Mining),因此,人們常常將數據挖掘與知識發現相提并論。

“在正確的時間獲取正確的信息對做出正確的決策是至關重要的”,可視化技術不僅可以實時地、直觀地反映當前發生的情況,而且可以預測將來的發展趨勢。為了在海量數據中獲取有效的信息,必須使用有效的數據挖掘技術。在數據挖掘中使用可視化技術,采用多種可視化方法對多維數據進行表示,進而利用人類的認知能力來對大型多維數據集進行數據挖掘和知識發現是解決這一問題最有效的方法,可以說,數據挖掘可視化是數據挖掘技術的新的發展趨勢。本文試圖將數據挖掘技術和數據可視化技術結合起來,對數據挖掘可視化的含義、內容、應用現狀及發展趨勢進行探討。

1 數據挖掘可視化的含義

1.1 可視化

所謂“可視化”(Visualization),是指在人通過視覺觀察并在頭腦中形成客觀事物的影像的過程,這是一個心智處理過程[1]??梢暬岣吡巳藗儗κ挛锏挠^察能力及整體概念的形成等;可視化結果便于人的記憶和理解,同時其對于信息的處理和表達方式用其他方法無法取代的優勢;可視化技術以人們慣于接受圖形、圖像并輔之以信息處理技術,將被感知、被認知、被想象、被推理、被綜合及被抽象了的對象屬性及其變化發展的形式和過程,通過形象化、模擬化、仿真化、現實化的技術手段表現出來;可視化不僅是客觀現實的形象再現,也是客觀規律、知識和信息的有機融合;可視化技術不僅用來表現靜態的知識,同時可用于動態地描述和表達客觀對象的發展演化規律以及進行動態知識的獲取。

1.2 信息可視化

信息可視化是網絡信息空間形成與發展的必然產物。一般來說,信息可視化是指非空間數據的可視化,它用圖像來顯示多維的非空間信息,使用戶加深對信息含義的理解。目前的研究重點在于,設計和選擇什么樣的顯示方式才能便于用戶了解龐大的多維數據及它們相互之間的關系,其中更多地涉及心理學、人機交互技術等問題。

1.3 數據挖掘可視化

可視化數據挖掘現在還沒有一個公認的定義,文獻[2]中提出的定義:數據挖掘可視化是指使用可視化技術在大量的數據中發現潛在有用的知識的過程。其中,“可視”是指“將某些不可見的或抽象的事物表示成為看得見的圖形或圖像”;“可視化”是指使用計算機創建可視圖像,從而為理解那些大量的復雜數據提供幫助[2]。

基于可視化方法的知識挖掘是信息可視化中的重要部分。在數據挖掘中,可視化可用于多個方面,它能使人在視覺上理解多維數據中的復雜模式。通過觀察數據在多重維數和多重圖形窗體中的存在形態,可以直觀、迅速地揭示數據趨勢和外露層。在數據挖掘過程中,數據挖掘也可以幫助在建模之前考察數據,可以驗證其數據挖掘工具的結果。此外,可視化對局部數據模式發現也有重要作用。

2 數據挖掘可視化的內容

可視化技術在數據挖掘中具有重要地位??梢暬夹g按目的可分三類:探索型、驗證型、表示型。探索型:人們事先沒有關于數據的任何知識,而利用可視化技術分析數據的結構,變化趨勢,得到有關數據的假設;驗證型:人們事先有關于數據的假設,而利用可視化技術驗證或拒絕這些假設;表示型:選擇有效的手段或技術表示數據。數據挖掘中的可視化分為以下三類[4,5]:

2.1 數據可視化

數據庫和數據倉庫中的數據可看作具有不同的粒度或不同的抽象級別,也可以看作是由不同屬性和維組合起來的。數據能用多種可視化方式進行描述,比如盒狀圖、三維立方體、數據分布圖表、曲線、曲面、連接圖等,或者以上幾種方法的任意組合,完成數據組織的可視化。傳統的幾何方法如點圖、線圖、柱狀圖、餅圖等。數據分析的目的不同,采用的方法也不同。

(1)離散點圖。它可能是數據挖掘中用得最廣泛的可視化工具。它幫助人們分析數據聚類,觀察數據的分布、有無奇異點。對于只有兩個或三個屬性的數據,可采用平面或立體的表現方式,而對于有多個屬性的數據集,要用到離散點矩陣。

(2)離散點矩陣。它是離散點圖功能上的擴展,可以表示多維數據分布。矩陣的每一單元為數據基于某兩維的表示。由于對稱性,離散點矩陣畫出一半即可(通常是左下角)。

(3)平行坐標系。它是另一種表示多維數據的方法。如果數據有M維,則有M條平行線,每條線表示一維。每一點用一條折線表示,折線與坐標軸的交點表示該點在這一維的值。

2.2 數據挖掘過程可視化

數據挖掘過程的可視化指數據挖掘過程的各個環節用可視化的方式表現出來,用戶可從中直觀地看到內容,如:數據從哪個數據倉庫或數據庫抽取出來;數據怎樣被抽取;所選擇的數據是怎樣被預處理和挖掘的;數據挖掘過程中選擇了什么方法;結果怎樣被存儲、顯示的。

知識發現過程的可視化使得知識發現過程易于理解并有助于知識的運用。目前,基于可視化的知識發現是指利用可視化的知識發現工具通過可視化的操作過程完成空間數據的知識發現。主要體現在兩個方面:(1)可視化的知識發現系統界面和可視化的知識發現過程的導航;(2)可視化的查詢和描述。

2.3 數據挖掘模型可視化

并不是每個用戶都是數據挖掘方面的專家,用戶事先也不知道數據挖掘能發現什么樣的信息。有些模型很難被理解。因此,必須把數據挖掘模型轉換成最然的表示。只有這樣,才能更有效地理解模型,然后采取行動。另外,有些模型得到的結果很龐大,如關聯規則。有可能一次數據挖掘得到許多的規則,如何從這些規則中發現感興趣的信息是一個辣手的問題。

模型可視化可從兩個方面考慮:(1)讓模型輸出可視化,即模型用一種有意義的方式表示;(2)交互,允許用戶操縱模型,改變模型輸人以觀察模型輸出的變化。另外,模型可視化還可利用虛擬技術,模型的輸出結果可呈現在虛擬設備上,使用戶置身其中。用戶通過導航技術尋找自己感興趣的信息。

2.4 數據挖掘可視化的應用現狀

目前,在一般的知識發現系統中,對可視化技術而言,其內容是已知的,只是將挖掘的中間結果或最終結果顯示出來,完成人機交互的信息傳輸功能。而在一般的數據挖掘可視化系統中,內容是未知的,用戶是一個分析研究者,而系統將數據以可視的形式表現出來,協助用戶獲得觀察的結果。如果將知識發現和可視化技術相結合,形成可視化數據挖掘系統,則有利于人們從海量數據中提取各種信息。

目前比較有影響的知識發現系統有:IBM開發的Intelligent Miner、SAS公司的Enteprise Miner、SGI公司的Mine Set、Thinking Machines開發的Dar Win、Integral Solutions Ltd.開發的Clementine、SPSS公司的Clementine、IBM Almaden研究中心開發的Quest系統等。其中,SGI公司的Mine Set挖掘器和IBM公司的Intelligent Miner挖掘器將關聯規則生成、聚類、決策數分類等數據挖掘操作與數據可視化捆綁在一起,這樣,既能對結果進行評估,又能實時調整挖掘過程中的算法及其參數。其它大部分系統提供的數據可視化工具遠遠不能滿足用戶的需要。

2.5 數據挖掘可視化的發展趨勢

目前,知識發現和數據可視化技術的集成問題已經引起研究者們的高度重視,越來越多的人開始了這方面的研究。一般認為,成功地將知識發現和信息可視化技術結合起來的關鍵在于:建立共享的數據模型,幫助用戶進行直觀地引導和選擇工具集(包括挖掘工具和可視化)。在此基礎上,建立一個任務驅動的交互式的智能化知識發現系統,使用戶能夠隨時根據計算機所得到的中間結果,對發現過程加以監控和引導,從而使計算機的挖掘過程結合到用戶自己的決策過程中去,直到得到滿意的結論為止。

國外推出了一些成熟的面向可視化的軟件系統,如Ex Vis、Xmdv Tool以及IBM的Parallel Visual Explorer,但在國內的應用并不廣泛。東華大學的余世銀等人提出了一個數據挖掘可視化模型DVM(Data-Mining Visual Model)[3],包括主題數據源、數據對象、可視化對象和查詢語言等部分,在可視化數據挖掘方面進行了有益地探索。

參考文獻

[1]宋紹成,畢強等.信息可視化的基本過程與主要研究領域[J].情報科學,2004,(1):13-18.

[2]鄭奕.數據挖掘可視化組態模型及其實現[D].上海東華大學,1999.

[3]余世銀,樂嘉錦等.數據挖掘可視化研究[K].東華大學學報(自然科學版),2001,(4):102-106.

[4]韓子良,畢杼.數據可視化在數據挖掘中的應用[J].計算機應用與軟件,2003,(11):71-73.

[5]周寧.21世紀信息組織與檢索的可視化、智能化發展方向[K].現代圖書情報技術,2002,(4):4-6.

[6]劉勘,周曉峰等.基于平行坐標法的可視數據挖掘[J].計算機工程與應用,2003,39(5):193-195.

上一篇:專業技能與職業素養專題報告范文下一篇:高層建筑平面設計范文

91尤物免费视频-97这里有精品视频-99久久婷婷国产综合亚洲-国产91精品老熟女泄火