翻譯|行業(yè)資訊|編輯:凌霄漢|2022-04-12 16:39:58.060|閱讀 301 次
概述:數(shù)據(jù)可視化在各個行業(yè)都有越來越廣泛的應(yīng)用, LightningChart作為一個這方面的圖表報表控件,有著不可或缺的作用。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
幾天前我在進(jìn)行谷歌搜索,特別是,我想知道需要在應(yīng)用程序中可視化大量數(shù)據(jù)點(diǎn)的開發(fā)人員有哪些選擇。令我驚訝的是,我真的找不到那么多解決方案,事實(shí)上,我得到的大部分結(jié)果都是多年前的結(jié)果。
但是有一個結(jié)果引起了我的注意,那是一篇關(guān)于用戶詢問如何繪制數(shù)十億個數(shù)據(jù)點(diǎn)的 Reddit 帖子?雖然其他用戶回答說“嘗試使用 Power BI 或 Excel”,但其他用戶建議在 Python 環(huán)境中使用 Pandas DataFrame 等變通方法來存儲和操作數(shù)據(jù)。但是發(fā)布問題的用戶不想存儲和操作數(shù)據(jù),用戶想要可視化數(shù)據(jù)!
那么,如何可視化數(shù)十億個數(shù)據(jù)點(diǎn),為什么要這樣做?
繼續(xù)分析 Reddit 用戶的問題,一些用戶表示,試圖將數(shù)十億個數(shù)據(jù)點(diǎn)可視化超出了大多數(shù)人的工作范圍。
事實(shí)上,該帖子的作者后來解釋說,作為一名與物理學(xué)家合作設(shè)計(jì)大功率電源的開發(fā)人員,他們需要了解有源元件在高頻下的影響。
例如,醫(yī)學(xué)可視化是需要特定技術(shù)特征和圖表類型來處理大量數(shù)據(jù)的要求苛刻的行業(yè)之一。
醫(yī)學(xué)可視化是可以在從管理或醫(yī)療保健數(shù)據(jù)監(jiān)控到研究、分子分析或醫(yī)療設(shè)備開發(fā)的幾乎每個過程中使用數(shù)據(jù)可視化的行業(yè)之一。
Power BI 等解決方案可用于可視化醫(yī)療管理數(shù)據(jù)的數(shù)千個數(shù)據(jù)點(diǎn),而在可視化復(fù)雜數(shù)據(jù)以進(jìn)行高端分析時,圖表組件是必不可少的。
另一個真實(shí)案例是賽車運(yùn)動,數(shù)十億數(shù)據(jù)點(diǎn)從高性能(F1、Nascar 等)車輛實(shí)時傳輸?shù)綌?shù)據(jù)記錄系統(tǒng),這些系統(tǒng)即時處理數(shù)據(jù)并支持賽車工程師做出決策.
需要可視化數(shù)十億數(shù)據(jù)點(diǎn)的行業(yè)列表可以繼續(xù)……振動分析、工業(yè)自動化、衛(wèi)星、3D 移動測繪等等……但是從 Reddit 帖子中強(qiáng)調(diào)的第二個學(xué)習(xí)是實(shí)施變通辦法。
Reddit 用戶分享說,具有高采樣率的快速變化的屬性可能需要數(shù)小時才能渲染,而臨時解決方案(例如縮小數(shù)據(jù)集)會導(dǎo)致信息丟失,這種情況也經(jīng)常發(fā)生在下采樣方法中。
第三個學(xué)習(xí)讓我們評估用戶試圖實(shí)施的圖表解決方案。例如,用戶實(shí)現(xiàn)了 M atplotlib,使用 WebGL 和 d3.js 實(shí)現(xiàn)了 Plotly,用用戶自己的話來說:“所有解決方案似乎都難以擴(kuò)展到這個 [十億數(shù)據(jù)點(diǎn)] 大小”。
現(xiàn)在,這些都是數(shù)據(jù)可視化的好解決方案,但它們不是面向高性能的,這需要我們定義什么是高性能數(shù)據(jù)可視化?或者高性能圖表的特點(diǎn)是什么?
讓我們從高性能的定義開始,它指的是“比其他東西更好、更快或更高效”的東西,在數(shù)據(jù)可視化或圖表(也稱為圖表控件或組件)的上下文中,高性能數(shù)據(jù)可視化指的是那些比其他解決方案更好、更快、更高效的圖表控件。
我們確定了高性能圖表庫的 6 個特征、它們的影響以及它們在現(xiàn)實(shí)世界中的使用方式。
| 高性能可實(shí)現(xiàn): | 為什么? | 實(shí)際用例: |
| 以高數(shù)據(jù)速率流式傳輸實(shí)時圖表。 | 可視化實(shí)時發(fā)生,支持平滑滾動的圖表和多達(dá)數(shù)千個數(shù)據(jù)饋送同時進(jìn)行。 |
使用它的行業(yè):振動研究、機(jī)器狀態(tài)監(jiān)測、儀器儀表、工業(yè)自動化、醫(yī)療應(yīng)用(ECG、EEG)、地震監(jiān)測、金融科技等。 |
刷新率非常高。 ? |
圖表可以更新 100 次/秒,而不是 1 次/分鐘。它不會抽搐,提供更愉快的可視化和交互。 | 應(yīng)用程序需要以盡可能低的延遲顯示動態(tài) 2D 或 3D 圖表。 |
| 最小的滯后。 | 允許立即可視化數(shù)據(jù),而不會在數(shù)據(jù)流中出現(xiàn)延遲。以最小的延遲支持有效和實(shí)時的決策。 |
使用它的行業(yè):賽車遙測系統(tǒng)、航空、貿(mào)易、醫(yī)藥等。? |
| 完整的準(zhǔn)確度數(shù)據(jù)。 | 所有數(shù)據(jù)都可以完全精確地可視化,而無需使用可能導(dǎo)致丟失有價值信息的下采樣等變通方法減小數(shù)據(jù)集的大小。 | 在醫(yī)學(xué)可視化中,心電圖 (ECG) 數(shù)據(jù)通常以 1000 個數(shù)據(jù)點(diǎn)/秒的速度傳輸。通過下采樣減少可視化值會丟失重要信息。 |
| 減少資源消耗(能源、工作、時間)。 | 智能算法降低了對計(jì)算能力的要求和能源的消耗。高性能可視化不需要超級計(jì)算機(jī)。 大型復(fù)雜數(shù)據(jù)集的即時可視化顯著節(jié)省了工作時間。 |
使用傳統(tǒng)圖表可視化數(shù)據(jù)集可能需要數(shù)小時,而 CPU 100% 被最大能耗占用。 顯著節(jié)省能源和工作時間。 |
| 更好的用戶體驗(yàn)。 | 更吸引人的圖表外觀和感覺以及交互式使用。 | 所有應(yīng)用程序都受益。 |
這是對數(shù)據(jù)可視化中被確定為高性能的廣泛但必要的回顧,因?yàn)椴⒎撬袛?shù)據(jù)可視化工具都是面向高性能的,而是面向更基本的用途。
現(xiàn)在,讓我們談?wù)勏蛳虏蓸樱c僅提供高性能相反,是可視化百萬/十億數(shù)據(jù)點(diǎn)的最常見解決方法之一。在所謂的“高性能”圖表工具的范圍內(nèi),下采樣問題很普遍,因?yàn)橥ǔJ菫榱虽秩敬笮蛿?shù)據(jù)集而實(shí)現(xiàn)的,但是,什么是向下采樣?
下采樣是一種僅處理部分?jǐn)?shù)據(jù)的技術(shù),例如,僅對每 100 個數(shù)據(jù)點(diǎn)進(jìn)行可視化,并丟棄其余 99% 的數(shù)據(jù),從而導(dǎo)致大量信息丟失。
首先,這是一個示例,當(dāng)所有數(shù)據(jù)都已正常呈現(xiàn)時,數(shù)據(jù)集的外觀:
相反,當(dāng)數(shù)據(jù)集被下采樣并且大量信息丟失時,數(shù)據(jù)集的外觀如下:
因此,考慮當(dāng)數(shù)據(jù)集包含 1,000,000 個點(diǎn)并且應(yīng)用了 100 的下采樣因子時,將僅處理 10,000 個數(shù)據(jù)點(diǎn)。信息丟失將是巨大的實(shí)時應(yīng)用程序,這些應(yīng)用程序依賴于實(shí)時數(shù)據(jù)流,因?yàn)獒t(yī)學(xué)可視化或賽車遙測系統(tǒng)中的實(shí)時監(jiān)控將顯示不完整信息的圖表和分析。
基本用例可能支持下采樣的使用,但我們談?wù)摰氖轻t(yī)療可視化、賽車運(yùn)動、電信、金融科技等需要處理所有傳入數(shù)據(jù)的行業(yè)的高性能數(shù)據(jù)可視化。在這種情況下,現(xiàn)實(shí)世界的應(yīng)用程序要求更高,簡單的解決方案,例如開源庫或簡單的數(shù)據(jù)可視化工具,無法完成工作。
分析Reddit 用戶的真實(shí)案例場景,我們可以發(fā)現(xiàn)該用戶正在努力尋找一種可以可視化數(shù)十億數(shù)據(jù)點(diǎn)的解決方案,而無需應(yīng)用下采樣技術(shù),也不會放棄縮放和縮放等高性能功能。平移。 如何解決問題?
如果您對該圖表控件感興趣,歡迎加入圖表控件QQ交流群:740060302
如果你想了解LightningChart.NET正版價格,歡迎查看產(chǎn)品介紹或
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@ke049m.cn