靚麗時尚館

位置:首頁 > 健康生活 > 心理

spark sparksql 區別

心理3.32W
spark sparksql 區別

Spark為結構化數據處理引入了一個稱為Spark SQL的編程模塊。簡而言之,sparkSQL是Spark的前身,是在Hadoop發展過程中,為了給熟悉RDBMS但又不理解MapReduce的技術人員提供快速上手的工具。

sparkSQL提供了一個稱為DataFrame(數據框)的編程抽象,DF的底層仍然是RDD,並且可以充當分佈式SQL查詢引擎。

SparkSql有哪些特點呢

1)引入了新的RDD類型SchemaRDD,可以像傳統數據庫定義表一樣來定義SchemaRDD。

2)在應用程序中可以混合使用不同來源的數據,如可以將來自HiveQL的數據和來自SQL的數據進行Join操作。

3)內嵌了查詢優化框架,在把SQL解析成邏輯執行計劃之後,最後變成RDD的計算。

標籤:spark sparksql