pandas 如何使用训练数据的分组最小最大值来分组最小化测试数据?

amrnrhlw  于 2023-10-14  发布在  其他
关注(0)|答案(1)|浏览(92)

例如,数据集是这样的:
| 组|一|B| C|
| --|--|--|--|
| 1 |0.1| 0.2| 0.3|
| 1 |0.7|零点三四|零点六七|
| 2 |0.3| 0.1| 0.5|
| 2 |零点五四|0.6| 0.2|
我想使用训练数据集每列的最小值和最大值来分别缩放每列的测试数据,它们也具有类似的结构。谢谢您的支持!

6rvt4ljy

6rvt4ljy1#

您可以使用此工作如下;

import tensorflow as tf 

import pandas as pd

from sklearn.preprocessing import MinMaxScaler as scaler

df = pd.DataFrame([[0.1,0.2,0.3],[0.7,0.34,0.67],[0.3,0.1,0.5],[0.54,0.6,0.2]],columns=['A','B','C'])

df

输出量:

A   B   C
0   0.10    0.20    0.30
1   0.70    0.34    0.67
2   0.30    0.10    0.50
3   0.54    0.60    0.20

def transform(df):
  scaler.fit(df)
  return scaler.transform(df)
df

输出量:

A   B   C
0   0.10    0.20    0.30
1   0.70    0.34    0.67
2   0.30    0.10    0.50
3   0.54    0.60    0.20

数据集已在范围{0,1}之间。
MinMaxScaler将每个值转换为0-1的范围。
因此,对于不同的输入数据,值将相应地反映。

相关问题