靚麗時尚館

位置:首頁 > 健康生活 > 心理

spark,dataframe詳解

心理6.22K
spark dataframe詳解

1、spark dataframe是一種以 RDD 為基礎的分散式資料集,是一種特殊的RDD,是一個分散式的表,類似於傳統資料庫中的二維表格。

2、spark dataframe與RDD的主要區別在於,前者帶有schema元資訊,即spark dataframe所表示的二維表資料集的每一列都帶有名稱和型別。

標籤:dataframe spark