from pyspark.sql.functions import col, count, when
# Converts all unmatched filters to NULL and drops them.
df = df.select([when(col(c).contains('substring'), col(c)).alias(c) for c in df.columns]).na.drop()
或 您可以简单地遍历列并应用相同的过滤器:
for col in df.columns:
df = df.filter(df[col].contains("substring"))
2条答案
按热度按时间70gysomp1#
你可以一次概括过滤器的语句:
或
您可以简单地遍历列并应用相同的过滤器:
57hvy0tb2#
您可以搜索所有列并填充下一个 Dataframe 和联合结果,如下所示:
结果将包含前2行,因为它们在某些列中具有值“Python”。