翻譯|行業(yè)資訊|編輯:況魚杰|2021-02-23 10:33:40.740|閱讀 290 次
概述:Cloudera數(shù)據(jù)平臺(CDP)通過解決所有現(xiàn)有和未來的分析需求,代表了現(xiàn)代數(shù)據(jù)架構(gòu)的范式轉(zhuǎn)變。它基于CDH(Cloudera Data Hub)和HDP(Hortonworks Data Platform)技術(shù)的基礎(chǔ),并提供了從Edge到AI的整體,集成的數(shù)據(jù)平臺,可幫助客戶加速復(fù)雜的數(shù)據(jù)管道并使數(shù)據(jù)資產(chǎn)民主化。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
Cloudera數(shù)據(jù)平臺(CDP)通過解決所有現(xiàn)有和未來的分析需求,代表了現(xiàn)代數(shù)據(jù)架構(gòu)的范式轉(zhuǎn)變。它基于CDH(Cloudera Data Hub)和HDP(Hortonworks Data Platform)技術(shù)的基礎(chǔ),并提供了從Edge到AI的整體,集成的數(shù)據(jù)平臺,可幫助客戶加速復(fù)雜的數(shù)據(jù)管道并使數(shù)據(jù)資產(chǎn)民主化。
在本篇文章中,提出了一個(gè)總體框架,該框架捕獲了CDP對技術(shù)和業(yè)務(wù)涉眾的好處。開發(fā)了這個(gè)框架,不僅可以幫助組織建立投資CDP的業(yè)務(wù)案例,還可以提供一種機(jī)制,根據(jù)特定的業(yè)務(wù)目標(biāo)對分析性投資進(jìn)行優(yōu)先排序(例如,降低技術(shù)成本,加快有機(jī)增長計(jì)劃)。
評估框架包括四個(gè)方面:1)業(yè)務(wù)價(jià)值加速,2)技術(shù)成本降低/避免,3)基礎(chǔ)設(shè)施成本優(yōu)化,4)運(yùn)營效率。在以下各節(jié)中,我們將介紹量化這些維度中每個(gè)維度的方法。
此類別描述了CDP通過以下方式加速用例(以及由此產(chǎn)生的相關(guān)業(yè)務(wù)價(jià)值)部署的獨(dú)特能力:
為整個(gè)數(shù)據(jù)生命周期(數(shù)據(jù)流,數(shù)據(jù)工程,數(shù)據(jù)倉庫,操作數(shù)據(jù)庫和機(jī)器學(xué)習(xí))中的不同用例提供一套全面的多樣化分析框架,同時(shí)通過共享數(shù)據(jù)體驗(yàn)(SDX)無縫集成數(shù)據(jù)內(nèi)容, 將計(jì)算和存儲分開的一層。
支持多種數(shù)據(jù)格式和類型,以豐富不同使用案例的數(shù)據(jù)資產(chǎn)。
通過SDX提供強(qiáng)大的安全性和治理框架,以支持越來越多的利用數(shù)據(jù)平臺的用戶。
不斷提高業(yè)務(wù)價(jià)值始終是特定于行業(yè)和客戶環(huán)境的。對于正在實(shí)施CDP的主要醫(yī)療保健提供者,能夠通過闡明加快無機(jī)增長計(jì)劃(例如)的上市時(shí)間的能力來證明其所帶來的價(jià)值。
對于將來的資產(chǎn)剝離和資產(chǎn)剝離,CDP公共云可在彈性和可擴(kuò)展的云環(huán)境中加速數(shù)據(jù)資產(chǎn)和分析工作負(fù)載的分離。該優(yōu)勢來自CDP的一項(xiàng)關(guān)鍵功能Replication Manager,該功能使用戶可以將現(xiàn)有的本地用例遷移到具有相同安全性和治理配置的公共云中。
對于未來的收購,兩種不同的CDP形式因素(CDP私有云和CDP公共云)將用作被收購實(shí)體所有大數(shù)據(jù)工作負(fù)載的單一著陸區(qū),從而加快IT集成活動并確保客戶與客戶之間的技術(shù)標(biāo)準(zhǔn)化和合理化被收購實(shí)體。該優(yōu)勢來自CDP的廣泛分析能力,這種能力轉(zhuǎn)化為一種獨(dú)特的能力,可以遷移CDH / HDP的早期版本或其他云數(shù)據(jù)倉庫以及所收購實(shí)體可能是舊有的本地?cái)?shù)據(jù)倉庫中的不同大數(shù)據(jù)工作負(fù)載使用。
CDP幫助客戶減少(或完全避免)與競爭性分析解決方案結(jié)合使用的輔助技術(shù)工具的成本。這些輔助工具為企業(yè)級部署提供了“必備”功能,例如細(xì)粒度的訪問控制,工作負(fù)載可觀察性,數(shù)據(jù)抽象和數(shù)據(jù)發(fā)現(xiàn)。CDP公共云通過提供以下功能消除了使用這些工具的需要:
Cloudera Control Plane取代了基礎(chǔ)架構(gòu)監(jiān)視工具,該工具可用于從單個(gè)窗格監(jiān)視本地部署和不同云上部署的群集
Apache Ranger(共享數(shù)據(jù)體驗(yàn)的一部分– SDX)通過本地啟用列級和行級過濾以及數(shù)據(jù)屏蔽來替換數(shù)據(jù)安全工具,以部署細(xì)粒度的數(shù)據(jù)訪問策略機(jī)制
Cloudera數(shù)據(jù)目錄(SDX的一部分)替代了數(shù)據(jù)治理工具,以促進(jìn)集中式數(shù)據(jù)治理(數(shù)據(jù)分類,數(shù)據(jù)搜索/沿襲,數(shù)據(jù)問題的跟蹤等)
Workload Manager(SDX的一部分)替代了大數(shù)據(jù)應(yīng)用程序性能監(jiān)視工具,該工具用于分析性能并對特定作業(yè)或工作負(fù)載進(jìn)行故障排除(例如查詢失敗,成本超支)
最后,SDX將數(shù)據(jù)上下文從計(jì)算/存儲中分離出來,并從特定的分析框架中提取數(shù)據(jù)資產(chǎn)。結(jié)果,它替代了數(shù)據(jù)編排/抽象工具,這些工具試圖在點(diǎn)解決方案引入的異類數(shù)據(jù)孤島中實(shí)現(xiàn)某種程度的語義一致性,這些點(diǎn)解決方案具有自己的專有格式和體系結(jié)構(gòu)特質(zhì)
總之,CDP減少了對第三方工具的需求,這些工具會帶來大量成本,并導(dǎo)致具有許多依賴性的復(fù)雜技術(shù)堆棧。
基礎(chǔ)架構(gòu)成本是在本地或公共云中部署的分析用例的總擁有成本(“ TCO”)公式中最大的成本組成部分,這是因?yàn)樗鼈兊挠?jì)算復(fù)雜性。因此,對于企業(yè)數(shù)據(jù)平臺而言,重要的是,通過提供托管類型(公共云,本地或混合)和托管供應(yīng)商(例如AWS,Google或Azure)方面的可選性,使用戶能夠最大程度地降低基礎(chǔ)架構(gòu)成本因此可以在最經(jīng)濟(jì)有效的地方執(zhí)行用例。CDP通過支持各種形式的因素(私有,公共和混合云)和所有主要的公共云提供商來提供該功能。另外,它以動態(tài)方式提供托管可選性,即,它通過充當(dāng)狀態(tài)和托管抽象層的共享數(shù)據(jù)體驗(yàn)(SDX),以最小的努力實(shí)現(xiàn)了尺寸因素或云供應(yīng)商之間的無縫過渡。尤其是,SDX使客戶端能夠:
通過使用基于使用模式和基礎(chǔ)結(jié)構(gòu)經(jīng)濟(jì)性的將本地工作負(fù)載突發(fā)到公共云,可以使用Replication Manager優(yōu)化本地成本。這樣,客戶可以利用公共云的彈性來滿足高峰容量需求,從而避免本地容量擴(kuò)展
通過啟用多云部署模型來優(yōu)化計(jì)算和存儲云支出,該模型可幫助客戶通過針對特定用例,環(huán)境或區(qū)域選擇計(jì)算和存儲成本最低的云供應(yīng)商來最大程度地降低總擁有成本
除了最大程度地減少基礎(chǔ)架構(gòu)成本外,CDP還使組織能夠避免供應(yīng)商鎖定。這種優(yōu)勢不僅確立了Cloudera數(shù)據(jù)平臺的價(jià)值主張,而且不僅實(shí)現(xiàn)了短期成本降低目標(biāo),而且還確立了戰(zhàn)略性供應(yīng)商多元化目標(biāo)。
最后一個(gè)價(jià)值類別涵蓋了Cloudera數(shù)據(jù)平臺(CDP)在“數(shù)據(jù)生命周期”中各個(gè)階段活動的運(yùn)營效率方面向技術(shù)和業(yè)務(wù)涉眾提供的實(shí)用程序。這些活動可以分為以下幾類:
最終用戶操作:CDP通過提供一個(gè)集成的技術(shù)平臺來加速數(shù)據(jù)操作(“ DataOps”)和機(jī)器學(xué)習(xí)操作(“ MLOps”),該平臺可讓數(shù)據(jù)科學(xué)家,數(shù)據(jù)工程師和BI分析師快速合成數(shù)據(jù)并與之交互,實(shí)現(xiàn)最終目標(biāo)。端數(shù)據(jù)流水線等,而沒有集成延遲或必須處理零碎的數(shù)據(jù)孤島,這些孤島會導(dǎo)致操作效率低下。
安全和數(shù)據(jù)治理運(yùn)營:CDP為信息安全和數(shù)據(jù)治理團(tuán)隊(duì)提供了完善的安全和治理功能。這些功能簡化了安全性操作(“ SecOps”),例如管理用戶身份驗(yàn)證和授權(quán)。此外,它通過共享數(shù)據(jù)體驗(yàn)(SDX)提供了強(qiáng)大的數(shù)據(jù)管理功能,可對數(shù)據(jù)資產(chǎn)(例如,數(shù)據(jù)沿襲和發(fā)現(xiàn))進(jìn)行集中管理和可觀察性。
平臺管理:平臺管理團(tuán)隊(duì)無需在集成方面(例如,建立專有的集成機(jī)制,如API),依賴管理,配置等方面就可以處理各種技術(shù),從而受益于所有分析框架和安全/治理功能之間的本地集成,開銷等
總而言之,Cloudera數(shù)據(jù)平臺使分析環(huán)境的所有直接和間接用戶能夠最大程度地減少在非增值任務(wù)上花費(fèi)的精力,并專注于最重要的事情:從數(shù)據(jù)中提取價(jià)值。
關(guān)于Cloudera
在 Cloudera,我們相信數(shù)據(jù)可以使今天的不可能,在明天成為可能。我們使人們能夠?qū)?fù)雜的數(shù)據(jù)轉(zhuǎn)換為清晰而可行的洞察力。Cloudera 為任何地方的任何數(shù)據(jù)從邊緣到人工智能提供企業(yè)數(shù)據(jù)云平臺服務(wù)。在開源社區(qū)不懈創(chuàng)新的支持下, Cloudera推動了全球最大型企業(yè)的數(shù)字化轉(zhuǎn)型歷程。了解更多,請聯(lián)系。
慧都大數(shù)據(jù)專業(yè)團(tuán)隊(duì)為企業(yè)提供Cloudera大數(shù)據(jù)平臺搭建,免費(fèi)業(yè)務(wù)咨詢,定制開發(fā)等完整服務(wù),快速、輕松、低成本將任何Hadoop集群從試用階段轉(zhuǎn)移到生產(chǎn)階段。
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@ke049m.cn
文章轉(zhuǎn)載自: