通过向量R到Python子集化

t3psigkw  于 2023-01-15  发布在  Python
关注(0)|答案(1)|浏览(125)

我是一个python新手,但有一些R的经验。在R中,如果我想子集化一个data.frame,我可以使用一个变量来做这样的事情:

# Columns

# Assign column names to variable
colsToUse <- c('col1','col2','col3')

# Use variable to subset
df2 <- df1[,colsToUse]

# Rows

# Assign column names to variable
rowsToUse <- sample(1:nrows(df1), 500)

# Use variable to subset
df3 <- df1[rowsToUse,]

在python中我该怎么做呢?

ma8fv8wu

ma8fv8wu1#

根据您对pandas的使用说明

colsToUse = ['col1', 'col2', 'col3']
rowsToUse = np.random.choice(range(len(df1)), 500)

df2 = df1.ix[:, colsToUse]
df3 = df1.ix[rowsToUse, :]

还有其他一些DataFrame辅助函数用于索引:df1.locdf1.ilocdf1.xs
看一下NumPy for MATLAB Users指南也很有帮助,它也经常回答R用户的问题,至少在处理numpy.ndarray时是这样)。

相关问题