我正在本地运行Apache Druid插件。我正在从Kafka流加载数据。
在Druid上,我可以看到列名称:
的数据
然后使用druiddb(https://github.com/betodealmeida/druid-dbapi),我编写了一个SQL查询,并将数据阅读到Python环境中,并将其放入pandas框架中。然而,某些列名没有出现:
from druiddb import connect
# https://github.com/betodealmeida/druid-dbapi
import pandas as pd
druid_host = "localhost"
druid_port = 8888
druid_path = "/druid/v2/sql"
druid_scheme = "http"
druid_query = """SELECT * FROM malaria_cases_full"""
druid_connection = connect(host=druid_host, port=druid_port, path=druid_path, scheme=druid_scheme)
druid_cursor= druid_connection.cursor()
df = pd.DataFrame(druid_cursor.execute(druid_query))
df.head(n =10)
字符串
的
2条答案
按热度按时间rmbxnbpk1#
我建议你使用Druid的(官方的?)Python连接器,也就是
pydruid
。或者简单地使用sqlalchemy引擎的
read_sql
:字符串
输出量:
中文(简体):
的数据
6yt4nkrj2#
这是一个pandas列显示功能。如果你想查看数据集的所有列,用途:
字符串