我想知道正确的方法是什么 backpressure
在 spark streaming
通过 pyspark
. 我好像收到了太多的邮件 Kafka
很快就爆炸了。下面是我的密码 spark streaming
. 有人能给我指出正确的地方吗 back pressure
?
sc = SparkContext(appName="PythonStreamingDirectKafka")
ssc = StreamingContext(sc, 5)
ssc.checkpoint("/spark_check/")
kvs = KafkaUtils.createDirectStream(ssc, [kafka_topic],
{"metadata.broker.list": bootstrap_servers_ipaddress})
parsed_msg = kvs.map(lambda (key, value): json.loads(value))
## do something below
1条答案
按热度按时间insrf1ej1#
下面是我如何设置我的Kafka流代码背压。希望有帮助。