五月天堂网_免费看影片_1024手机看毛片_亚洲综合四区_男人的天堂影院_在线亚洲自拍

中培偉業(yè)IT資訊頻道
您現(xiàn)在的位置:首頁 > IT資訊 > 大數(shù)據(jù) > 從基礎(chǔ)到深度解析Hadoop與Spark

從基礎(chǔ)到深度解析Hadoop與Spark

2017-02-06 16:53:12 | 來源:中培企業(yè)IT培訓(xùn)網(wǎng)

Hadoop與Spark是當(dāng)前兩個流行的大數(shù)據(jù)架構(gòu),也是非常重要的開源技術(shù)。對于Hadoop與Spark,業(yè)內(nèi)很多專業(yè)人士都進(jìn)行了對比分析。中培偉業(yè)《大數(shù)據(jù)平臺搭建與高性能計算最佳實踐》培訓(xùn)蔣老師在這里就Hadoop與Spark兩大架構(gòu)的認(rèn)識發(fā)表了自己的看法。

Hadoop——Apache Hadoop 是受Google 的兩篇Paper( Mapreduce , Google File System )啟發(fā)誕生的。最早在Nutch項目里,2006年移入Hadoop,命名也成為行業(yè)內(nèi)的一段談資。

Hadoop 主要包括兩步分,** Hadoop Distributed File System (HDFS) Hadoop MapReduce**。很 明顯了HDFS解決了存儲,MapReduce 更多情況下是一個編程框架。入門者最開始使用MapReduce 的例子基本都是進(jìn)行詞頻統(tǒng)計。使用Map進(jìn)行分詞,然后Reduce得到詞頻。

那經(jīng)常聽到的Hive,Hbase 是什么? Hive 是建立在Hadoop 之上的數(shù)據(jù)倉庫,可以通過Sql查詢和實現(xiàn)一些MapReduce 操作。 Hbase 是建立在Hadoop之上的一種分布式非關(guān)系型數(shù)據(jù)庫。模型也是產(chǎn)生于Google的一篇research Bigtable: A Distributed Storage System for Structured Data 。用過的Cassandra也是一種Bigtable的實現(xiàn)。

你可能會聽到 Hadoop YARN ,YARN 是作業(yè)管理框架,蔣老師認(rèn)為MapReduce 是建立在YARN上的。

Spark——在Spark 出來之后看到有人說Spark會代替Hadoop 。但經(jīng)老師根據(jù)自己的認(rèn)識給出了不同的觀點。蔣老師指出, Spark 的重點在于數(shù)據(jù)的處理和計算能力,它并沒有解決數(shù)據(jù)存儲問題。換句話說它相當(dāng)于Hadoop Mapreduce的升級版。通常Spark都是和Hadoop 一起使用的。因為Spark需要HDFS這樣的存儲系統(tǒng),Spark又比Hadoop Mapreduce 更快,個人感覺Api更豐富,對于機器學(xué)習(xí)算法來說更友好。 當(dāng)然Spark 可以不需要Hadoop ,Hadoop 也可以不需要Spark. Spark 還提供了Spark Sql, Spark Stream,Spark Mlib, Spark GraphX 一些豐富的功能,而且支持Java, Scala, Python,R等多種語言。

標(biāo)簽: 大數(shù)據(jù)平臺
主站蜘蛛池模板: 欧美成人免费网址 | 一区二区三区免费在线视频 | 日本xxx裸体xxxx偷窥 | 91视频综合网 | 亚洲拍拍视频 | 国产欧美日韩视频免费 | 亚洲一区二区精品在线 | 欧美成年人网 | 亚洲欧美aaa| 亚洲国产成人在线观看 | 日韩精品成人无码专区免费 | 丰满少妇夜夜爽爽高潮水网站 | 日日碰狠狠添天天爽超碰97久久 | 亚洲国产成人av | 欧美在线视频网 | 久久天天躁狠狠躁夜夜躁2020 | av久久天堂三区 | 粉嫩av网| 成人综合站 | 性xxx国产| 国产成人一二 | 黄女人xxwww 日本a级大片 | 艳妇臀荡乳欲伦交换gif | 日韩精品无码成人专区 | 男人爆操女人 | 四虎影视无码永久免费 | 国产成年女人免费视频播放a | 第一亚洲中文久久精品无码 | 日韩一级久久 | 精品人妻午夜一区二区三区四区 | 欧美色欧美亚洲另类二区 | 精久久久久久 | 亚洲一区中文字幕永久在线 | 黑人猛交 | 黄色av网站入口 | 国产精品俺来也在线观看 | 欧美xxxxwwww| 日韩在线字幕 | 精品裸体秀hd | 国产精品亚洲一线Av | 黄色片91|