在线免费观看麻豆_国产+日韩+欧美_欧美色插_国产无限免费av在线播放_夜色阁亚洲一区二区三区_亚洲男女羞羞无遮挡久久丫

解析百度開放云分布式計算平臺對大數據的處理
  • 更新時間:2025-05-05 11:09:06
  • 開發經驗
  • 發布時間:3年前
  • 708

百度開放云總經理劉旸看來,當今世界正面臨著由技術突破帶來的全行業升級,在這場商業劇變中,背后是三個重要的「重新定義」:第一,云計算重新定義了「IT」。它改變了企業所需要的 IT 資源的擁有與供給的方式,基于互聯網級的資源管理平臺,徹底改變了傳統企業的 IT 模式,為新的商業創新提供了可能;


第二,大數據重定義了「資產」,相較于以往的重資產,企業在經營中不斷生成的數據,將成為企業未來繼續生存并保持競爭力的砝碼;第三,人工智能重定義了「效率」,通過語音、圖像、視頻、自然語言識別和智能處理等技術,讓傳統的計算機具備更為強大的能力,大幅提升工作效率。


基于以上三個重新定義,百度開放云的重新堆棧也分為三層:云計算層、大數據應用層、和人工智能層。


處理大數據無非以下四個步驟:

收集:原始數據種類多樣,格式、位置、存儲、時效性等迥異。數據收集從異構數據源中收集數據并轉換成相應的格式方便處理。

存儲:收集好的數據需要根據成本、格式、查詢、業務邏輯等需求,存放在合適的存儲中,方便進一步的分析。


變形:原始數據需要變形與增強之后才適合分析,比如網頁日志中把IP地址替換成省市、傳感器數據的糾錯、用戶行為統計等。


分析:通過整理好的數據分析what happened、why it happened、what is happening和what will happen,幫助企業決策。


其實,如果涉及到“大數據”,不得不提百度最大的業務——搜索。百度搜索已經收錄全世界超過一萬億的網頁,每天響應中國網民大約幾十億次的請求。除此之外,百度還有另外20多個用戶過億的產品線,而且各個產品底層的大規模數據處理,都需要使用百度團隊維護的大數據處理平臺。



百度分布式計算平臺:離線引擎優化

關于MapReduce

首先介紹主要的離線計算模型——MapReduce,百度從2007年開始引進Hadoop 0.15.1,隨后快速發展,2011年百度的MR單集群規模達到5000臺,到2013年已經多達1.3萬臺,這也是截止到目前為止全世界最大的單集群。Hadoop全集群規模為10萬量級, 作業量達到了百萬量級,日均CPU利用率超過80%,遠超業界同行,百度開放云(http://cloud.baidu.com)底層依賴的大規模集群調度、資源隔離等技術能力世界領先。除了在規模方面不斷擴大,百度一直在Hadoop性能分析方面進行了大量的優化。2013年的測試結果顯示,百度內部MR實現相比于開源Hadoop性能提升30%。典型優化,例如Hadoop中的Shuffle,百度將其做成一個統一的shuffle服務,不再占用Map或Reduce槽位。比如對關鍵熱點函數采用SSE向量化等。

2014年,百度繼續對計算引擎做了大幅優化, Native C++實現的DAG引擎正式上線。下圖是一個 4輪MR Job實現的典型業務流示例,DAG引擎上線后,可以優化成一個DAG作業,可以避免3次Reduce寫多副本引入的磁盤IO及網絡IO,還可以規避2次Map讀HDFS的IO以及處理耗費。

下圖是一個真實業務由SQL計算表示層翻譯下來的,基于MR引擎時,SQL會翻譯成25個MR JOB,如果百度把它優化成DAG,能夠避免很多次磁盤IO操作。在優化之后,運行時間直接縮減到1個小時,優化前后的差異非常顯著。

內存流式Shuffle

2014年,百度對Shuffle進行重大重構,初期實習生同學完成的Demo以BaiduSort名義參與了2014年Sort BenchMark大數據排序國際大賽,并獲得冠軍(2015年百度沒再參加,國內其他公司以同樣技術通過更大規模集群刷新記錄)。2015年,新Shuffle技術完成全面上線。Hadoop默認Shuffle實現為基于磁盤Pull模式,計算過程顯式分成Map、Shuffle、Reduce過程;Baidu研發的新Shuffle采用內存流式Push模式,Map端完成部分記錄處理后直接從內存中將計算結果推送給下游。

舉例來說,Map處理256MB輸入數據,在內存流式Shuffle模式下,處理完100條記錄以后,直接通過內存推送到下游,這樣就形成流水線方式處理。不再有顯式的Shuffle階段。

目前,該Shuffle組件為通用組件,正逐步推廣到其他分布式計算平臺中。

百度分布式計算平臺:系統架構演進

前面重點介紹了百度開放云BMR服務中涉及到的規模、性能方面優化思路和效果,接下來跟大家一起分享一下,百度遇到的整體架構方面挑戰以及優化思路。

2012年系統架構中,最主要的兩個離線計算平臺,左邊是以MapReduce模型為主的批量計算平臺BMR,右邊是MPI /BSP模型為主的大規模機器學習平臺BML。從最下面可以看到,MapReduce和MPI模型底層硬件就有較大差異。Hadoop分布式文件系統多副本以及強大的故障處理機制,使得Raid卡完全沒有必要,采用多塊超大容量SATA硬盤非常適合。

而MPI差別較大,MPI是一個消息傳輸框架,它在設計之初就沒有考慮太多異常處理,因此它對底層系統可靠性要求非常高。百度采用了非常高配置的服務器,例如帶Raid卡的sas硬盤,超大內存、萬兆互聯等。

BMR Hadoop由大量SATA硬盤的服務器構成,存儲系統為HDFS,資源調度層面百度有自研的調度器ARK(與社區Yarn比較類似)。而BML大規模機器學習平臺上,支持的業務樣本超過數百億計量級,特征規模也遠超百億。百度在運行機器學習時,需要先啟動MapReduce,然后再將數據從HDFS分發到各個MPI節點,這種方式對網絡帶寬的要求很高。

系統部同事持續改進內網帶寬的同時,BML平臺層面也在思考應該如何解決跨MR和MPI倆大集群間的日益嚴重的網絡帶寬問題。

另外還有一個需求:MPI是一種事務性調度模型,比如一個業務需要200臺機器,如果平臺此時只有199臺機器空閑,實際也很難用起來(除非修改提交參數,但涉及輸入數據重新分塊處理等比較復雜)。另外MPI計算往往顯式分為計算、傳輸、計算等階段(即BSP模型),因此資源利用波動性較大,例如CPU計算階段,網絡空閑;網絡傳輸或全局同步階段,CPU空閑。為解決這個問題,百度在MPI集群中引入IDLE計算,IDLE業務資源占用充分可控,典型的IDLE任務如MapReduce任務,而執行MR任務又會進一步加劇MR集群和MPI集群間網絡帶寬問題。

基于以上考慮,百度正式將MPI底層硬件替換為替換成高配置存儲型服務器,硬盤同構,文件系統都采用HDFS,BML算法輸入和輸出均通過HDFS,不再是本地文件系統。

BML機器學習執行引擎層面,百度基于MPI封裝了DVCE(Distributed VectorComputingEngine)分布式向量計算引擎,屏蔽MPI過于低層的編程接口,通過高層抽象自動翻譯為MPI任務,這就是百度第二代專門針對“并行計算”開發的系統框架。

2014年,BML機器學習執行引擎遷移到ELF第三代并行計算框架, ELF采用ParameterServer架構,大幅降低機器學習算法開發代價,對比于百度的第二代框架DVCE,在開發效率方面有大幅度的提升。離線計算方面,完成了Native C++ DAG引擎上線,百度內部叫DCE(Distributed ComputingEngine)。

2014年BMR和BML底層都采用Matrix完成資源分配與隔離,其他平臺如小批量計算系統TaskManager和毫秒級計算延遲的Dstream系統,都基于業務需求特殊性,采用獨立的資源隔離和調度系統。

2015年的架構改進,主要是將所有的計算模型均遷移到Matrix+Normandy架構。Normandy兼容社區Yarn調度接口,開源社區新型興計算平臺可以很輕松的接入到百度的計算生態里。

百度已經介紹了百度大數據分析和挖掘平臺主要的底層引擎和架構,接下來談一下最新思考。

系統底層是IDC硬件,接著是Matrix,再是Normandy,然后是幾個主要的引擎。之前介紹底層架構的統一,比如在硬件、調度、存儲等方面的統一。實際上各個系統對外的結果,都有自己的接口,如果要使用MR,很多人寫MR程序都是直接調用Hadoop原生接口,配置涉及到的多個參數。部分業務還需要流式系統完成日志清洗,在經過MapReduce模型批量預處理,隨后通過ELF完成機器學習模型訓練,最后再通過MapReduce模型完成模型評估,可見一個業務需要跨越多個模型,需要業務線同學同時熟悉很多模型和平臺,而每一個模型又有各自特點和接口。只有足夠了解模型的細節和接口后,才能真正的利用好該模型。

于是百度正式立項BigFlow項目(原項目名DataFlow,圖片未來及修改),將模型的細節屏蔽。平臺自動決定選擇合適的并發度,甚至智能選擇應該把這個翻譯到哪個計算模型。BigFlow可以支持多個不同的計算引擎(每個引擎在其適合的領域做到極致),充分發揮各引擎性能和功能。所以用戶使用同一套接口,便能對應到不同的任務。由于采用高層抽象,業務開發效率獲得大幅提升,代碼量大幅減少,其維護成本也大幅降低。BigFlow集成常見優化手段,因此將大幅提升平臺有效資源占用。

百度開放云——大數據+智能

最后,向大家簡要介紹百度開放云。2014年,百度正式決定將服務內部業務多年的云計算技術正式對外提供服務,即百度開放云,對應官網http://cloud.baidu.com。百度開放云大數據方面,BMR已經對外開放,而更多的大數據分析和服務都還未對外開放。BMR集群上可以做到按需部署,用戶專享,更關鍵的是完全兼容開源的Hadoop/Spark平臺,開放云客戶基于Hadoop、Spark、Hbase等已經實現的大數據業務幾乎不用修改就可以平滑遷移到云上。多維分析服務Palo,它完全兼容MySQL網絡協議,因此,客戶朋友們熟悉的Mysql Client的工具均可使用。

同時,Palo支持JDBC、ODBC的編程接口,如果已有程序采用的是JDBC、ODBC,那么遷移成本幾乎為零。最后看到它與業界主流的BI工具商業分析的工具對接的,比如Tableau、Saiku、BIEE、R。

最后再介紹機器學習云服務BML,BML中提供的深度學習技術,曾獲得2014年百度最高獎。BML提供端到端的解決方案,里面提供的算法均服務百度內部業務多年,典型如網頁搜索、百度推廣(鳳巢、網盟CTR預估等)、百度地圖、百度翻譯等。

使用開放云BMR和BML、Palo等,就可以立刻、直接享用與百度搜索同等品質的大數據分析和挖掘服務!

我們專注高端建站,小程序開發、軟件系統定制開發、BUG修復、物聯網開發、各類API接口對接開發等。十余年開發經驗,每一個項目承諾做到滿意為止,多一次對比,一定讓您多一份收獲!

本文章出于推來客官網,轉載請表明原文地址:https://www.tlkjt.com/experience/7349.html
推薦文章

在線客服

掃碼聯系客服

3985758

回到頂部

主站蜘蛛池模板: 超碰在线久_中文字幕けのぁ一般男女_91福利在线观看_7777日本精品一区二区三区_四虎永久地址www成人_在线天堂中文在线资源网_成人午夜天堂_旧里番高h无码无修在线观看 国产乱子伦精品免费女_AV人摸人人人澡人人超碰妓女_亚洲高清中文字幕免费_我爱我爱色成人网_亚洲一区不卡在线_夜夜未满十八勿进的爽爽影院_J97久久国产亚洲精品超碰热_日本高清久久久 | japanese日本护士xxxx18一19_日本三级视频网站_内射人妻少妇无码一本一道_runaway韩国动漫免费_亚洲久草av_糙汉猛H1v1她想被C_丁香五月激情综合亚洲_www亚洲精品少妇裸乳一区二区 | 午夜福利09不卡片在线机视频_最新超碰_国产视频999_粉嫩国产一区二区三区免费_亚洲福利一区二区_国产xxxx色视频在线观看_欧美一级特黄aaaa_亚洲av伊人久久青青草原 | 别插我b嗯啊视频免费_色婷婷av一本二本三本浪潮_182午夜免费_青青青草伊人_久久久免费国产_综合色91_最近中文mv字幕免费高清在线7_色噜噜狠狠色综合成人网 | 人人妻人人澡人人爽欧美一在内谢_亚洲成aⅴ人片久青草影院_亚洲AV无码一区东京热蜜芽_性刺激久久久久久久久九色_一級特黃色毛片免費看_免费看无码特级毛片_日本成人免费在线_国产福利日本一区二区三区 | 琪琪的色原网站_av毛片在线_欧美精品日韩在线_日韩一级网_91caoporn超碰_欧美一级毛片ⅹxx_成人免费av片在线观看_三级毛片子 | 最近最新MV在线观看免费高清_午夜免费剧场_神马老子影院午夜观看网站_国产1区2区3区中文字幕_国产五十路毛片_色综合人人_日韩一区久久_亚洲欧洲美洲在线观看 | 中文字幕制服丝袜一区二区_午夜香港三级A三级三点_夜夜躁狠狠躁日日躁欧美_91九色丨porny最新地址_黄色片网站免费看_最新Av中文字幕无码专区_久久伊人一区_在线小视频你懂的 | 国产a区_99精品欧美一区二区三区_在线观看一区不卡_国产成人片无码视频在线观看_亚洲精品乱码久久观看网_国产精品久久这里只有精品_先锋中文字幕在线资源_久草在线中文888 | 日本黄色一级_国产精品三p一区二区_国产成人片《羞羞》上映_欧美日日日日bbbbb视频_日本视频在线观看一区二区_开心亚洲五月丁香五月_免费国产视频在线观看_中文字幕视频在线播放 | 亚洲性日韩精品一区二区三区_5566成人网_毛片毛片毛片毛片毛片毛片毛片_国产精品美女久久久久高潮_成人九色_青青成线在人线免费啪_av中字幕久久_欧美最猛性bbbbxxxx | 青春草国产_国产精品一区二区四区_欧美精品一区二区三区A片_国产V综合V亚洲欧美大_成人毛片a_福利色播_无码人妻一区二区三区A片_最新国产成人av网站网址麻豆 | 日韩国产高清在线_亚洲成人日本_亚洲综合播放_色九九影院_在线一级成人_亚洲午夜精品视频_欧美a级在线观看_亚洲自偷自偷偷色无码中文 | 曰韩免费视频_中文字幕丝袜第1页_视频精品久久_久久国产午夜精品理论片_成人免费国产精品视频大全_人妻被丑老头玩的潮喷_亚洲av无码国产一区二区三区不卡_天堂亚洲欧美在线中文 | 国产xxxxx18_亚洲综合在线不卡_草视频在线_99久热精品免费观看四虎_欧美日韩一区二区三区在线观看视频_亚洲avav天堂av在线网爱情_欧美国产偷国产精品三区_老师的双乳好大下面水好多视频 | 日韩av黄色网址_久久99国产精品一区二区_国产自在自线午夜精品视频在_韩国久草_91爱网_免费看成人毛片无码视频_娇喘抽搐高潮喷水A片免费观看_亚洲国产精品久久久久久女王 | 色婷婷91_亚洲第一狼人伊人AV_国产一区二区免费在线播放_少妇裸体长淫交视频免费观看_日本久久久免费高清_粉嫩91精品久久久久久久99蜜桃_日本韩国在线观看_国产精品久久久久久久久久大牛 | 国产亚韩_亚洲一区二区视频网站_国产三级黄色片_国产成AV人片在线观看天堂无码_狠狠干综合网_午夜精品在线视频_美妙人妻瑶瑶1一7_人人玩人人添人人澡欧美 亚洲国产精_97伦理影院_国产放荡AV剧情演绎麻豆_国产不卡一区在线_亚洲天堂地址_又大又黄又粗又爽的免费视频_亚洲一及片_日产福利视频在线观看 | 波萝蜜A毛黄AAA片_国产高清在线精品_久久久视频免费观看_欧美一区二区三区性视频_免费无码成人av在线播_91av国产在线_亚洲第一AAAAA片_米奇777在线观看 | 在线精品自拍亚洲第一区_狠狠综合久久久久综合网_可以免费看av的网址_久久久久青草大香综合精品_亚裔av_欧美日韩在线亚洲一区蜜芽_欧美在线免费观看视频_色久视频 | 国产91足控脚交在线观看_午夜精品久久久久久久99热蜜臀_免费日p视频_亚洲人成无码网站_国产精品久久久久久久新郎_国产www在线_国产一女三男3p免费视频_久久久精品成人 久久成人精品一区二区三区_中文字幕V亚洲日本在线_精品无码久久久久久久动漫_成年午夜无码AV片在线观看_91色精品_一个人看的视频www免费_国产肉丝袜在线观看_中文字幕av播放 | 亚州欧美在线_亚洲第一av在线播放_99er在线观看_日本欧美日韩_国产强被迫伦姧在线观看无码_啊灬啊灬啊灬啊高潮了_午夜看片网址_免费一级毛毛片 | 国产一区二区影视_不卡一区在线_西西人体大胆啪啪实拍_一级黄色aaaa_国产中文字幕在线看_欧美一区=区_中文字幕亚洲高清_国产原创三级 | 国产精品1_777me米奇影院_99精视频_欧美无吗_成人羞羞国产免费软件动漫_国产美女精品在线观看_久久第一区_成人国内精品久久久久影院VR 亚洲视频三_久草在线视频看看_中国业余老太性视频_91.com在线_精品无码一区二区三区的天堂_久久久久久久亚洲国产精品87_成在线人免费视频_成人久久久久爱 | 特黄三级又爽又粗又大_国产精品99久久久久久一二区_成人看片人aa_综合成人_欧美激情一区三区_亚洲www在线观看_韩日在线观看视频_久久无码欧美一二三区 | 婷婷成人丁香七月综合激情_中文字幕制服丝袜一区二区三区_东京一本一道一二三区_亚洲免费黄色_久久午夜免费观看_日本护士毛茸茸高潮_成人动漫网站入口_国产鲁鲁视频在线播放 | 福利中文字幕_一级婬片a级中文字幕_欧美激情亚洲激情_亚洲精品视频免费在线_亚洲午夜无码毛片av久久久久久_欧美激情一区二区久久久_日本13一15一级毛片_国产欧美久久精品 | 国产福利自产拍_色一情一区_日韩一区精品视频_天色综合网_日本性色_a级录像_饥渴少妇AV无码影片_免费av黄色 | 女女同性一区二区三区免费观看_国产一级久久_日韩欧美成人精品_無码一区中文字幕少妇熟女_91porny国产_激情久久久久久_色综久久综合桃花网国产精品_18禁强伦姧人妻又大又 | 5060午夜_中文字幕午夜精品一区二区三区_精品亚洲国产成人av不卡_日本三级bd高清_成人三级影院_91嫩草入口_а中文在线天堂_伊人无码高清 | 邻居少妇人妻互换_天天插日日插_91九色磁力_91tv最新地址入口_免费无人区男男码卡二卡_久久精品国产欧美日韩_扒开美女内裤狂揉下部_日本无限资源 | 99久久自偷自偷国产精品不卡_性做久久久久免费观看_综合久久2o19_黄色动漫视频在线观看_欧美一级黄色片免费观看_手机看片久久国产免费_综合久久久久久久青青_欧美久久国产 | 性做久久久久久久_97久久超碰国产精品最新_亚洲国产av无码精品果冻传媒_1000黄色片_美女露100‰奶头18禁_国内自拍99_亚洲人午夜_欧美XXXXX高潮喷水 | 超碰人人透人人爽人人看_亚洲av片不卡无码av_草草草在线视频_欧美色另类天堂2015_久久人妻无码aⅴ毛片花絮_国产成人午夜影院_亚洲成人一级片_japanese成熟丰满人妻 | 国产裸体写真av一区二区_337p日本大胆欧美人_久久久久久久亚洲AV无码_国产在线高清精品_亚洲成色精品一区二区三区_99久久免费精品国产免费高清_激情五月人体_国产iv一区二区三区 | 久操视频免费在线观看_亚洲免费自拍_视频在线播放国产_小草毛片_av黄色一级_国产精品天码无卡在线观看_乱色熟女综合一区二区三区_美女一级毛片免费观看 | 色欲视频综合免费天天_麻豆网站在线看_久久久久久久久久一区二区_91国内视频在线_欧美毛多水多肥妇_无码裸模视频在线观看_国产精品久人妻精品老妇_a级毛片免费 | 国产精品久久免费_日韩av免费一区二区_a人片在线观看苍苍影院_亚洲日本无码AA在线播放_一区二区亚洲_久久久精品视频免费看_看毛片网_伊人久久久AV老熟妇色 | av乱码av免费aⅴ成人_国产四区视频_www.888www看片_亚洲欧美激情小说另类_免费A级毛片无码免费视_亚洲精品在线视频播放_久久精品96_国产亚州精品美女久久久免费 | 亚洲黄色视频网站在线观看_午夜免费福利小视频_插我一区二区在线观看_亚洲精品无码乱码成人_又大又硬又爽又黄又粗又长_色999在线_五月久久婷婷精华油_国内精品福利视频 | 狠色狠狠色狠狠狠色综合久久_99精品视频一区二区_操操操av_一级视频在线观看视频在线啦啦_久久93_chengren网站_国产经典1区2区3区_A毛片免费全部播放 |