如何将dataframe转换为rdd类型

默认分类 未结 1 802
_P_erhaps
_P_erhaps 2023-03-21 17:30
相关标签:
1条回答
  • 2023-03-21 18:07

    RDD:A Resilient Distributed Dataset (RDD), the basic abstraction in Spark.rdd是一个分布式的数据集,数据分散在分布式集群的各台机器上A DataFrame is equivalent to a relational table in Spark SQL, and can be created using various functions in SQLContextdataframe更像是一张关系型数据表,是一种spark独有的数据格式吧,这种格式的数据可以使用sqlcontext里面的函数

    0 讨论(0)
提交回复