我是一个python新手,但有一些R的经验。在R中,如果我想子集化一个data.frame,我可以使用一个变量来做这样的事情:
# Columns
# Assign column names to variable
colsToUse <- c('col1','col2','col3')
# Use variable to subset
df2 <- df1[,colsToUse]
# Rows
# Assign column names to variable
rowsToUse <- sample(1:nrows(df1), 500)
# Use variable to subset
df3 <- df1[rowsToUse,]
在python中我该怎么做呢?
1条答案
按热度按时间ma8fv8wu1#
根据您对
pandas
的使用说明还有其他一些
DataFrame
辅助函数用于索引:df1.loc
、df1.iloc
和df1.xs
。看一下NumPy for MATLAB Users指南也很有帮助,它也经常回答R用户的问题,至少在处理
numpy.ndarray
时是这样)。