使用pyspark向配置单元表添加注解

z31licg0 于 2021-06-25 发布在 Hive

关注(0)|答案(3)|浏览(590)

我正在通过pyspark创建hive表。
在写入配置单元之前，是否有方法向每个列添加注解？
例子：
df=spark.table（'sometable'）#添加注解df.write.saveastable（'mytablewithcomments'）

Hive apache-spark pyspark

来源：https://stackoverflow.com/questions/58917626/add-comments-to-hive-tables-using-pyspark

3条答案

按热度按时间

ftf50wuq1#

这个 alias column类的方法采用 metadata 可包含注解的选项。

df_with_column_comment = df.select( df.col.alias( 'col',
    metadata = { 'comment': 'Column description' }
) )

据我所知，列是不可变的，因此不能在创建注解后添加注解。

赞(0）回复(0）举报 2021-06-26

sqougxex2#

CREATE TABLE table_name( column1 STRING, column2 STRING COMMENT "some comment", column3 LONG) USING csv OPTIONS (header true, path '/data/table.csv')

赞(0）回复(0）举报 2021-06-26

eoxn13cs3#

登录到 pyspark shell ```
bash$ pyspark

spark.sql("create table cmnt(id string COMMENT 'new')")
`Then login to hive cli:`
hive> desc formatted cmnt;
OK

col_name data_type comment

id string new

然后您可以在配置单元表中看到注解！

赞(0）回复(0）举报 2021-06-26

我来回答

使用pyspark向配置单元表添加注解

3条答案

col_name data_type comment

相关问题

热门标签

最新问答