所以,我在spark(scala)中有两个列表。它们都包含相同数量的值。第一张单子 a
包含所有字符串和第二个列表 b
包含所有长的。
a: List[String] = List("a", "b", "c", "d")
b: List[Long] = List(17625182, 17625182, 1059731078, 100)
我还有一个模式定义如下:
val schema2=StructType(
Array(
StructField("check_name", StringType, true),
StructField("metric", DecimalType(38,0), true)
)
)
将列表转换为一个具有模式的Dataframe的最佳方法是什么 schema2
柱子是用 a
以及 b
分别?
2条答案
按热度按时间ttcibm8c1#
您可以创建
RDD[Row]
并转换为具有给定模式的sparkDataframe:qqrboqgw2#
使用数据集: