pandas 如何将csv文件中的所有值传递给fit_transform?

pcrecxhr  于 2023-02-11  发布在  其他
关注(0)|答案(1)|浏览(161)
for i in range(1,6):
    df1 = pd.read_csv('./starReviews/' + str(i)  + 'Star.csv')
    tfidf_vectorizer = TfidfVectorizer()
    doc_vec = tfidf_vectorizer.fit_transform(df1.loc[0])

我想把csv文件的所有值传递给fit_transform,但是目前我只能传递第一行,有人知道我是如何一次传递所有值的吗?

j8ag8udp

j8ag8udp1#

我希望这对您的解决方案有效,使用 Dataframe 的.values属性

from sklearn.feature_extraction.text import TfidfVectorizer
import pandas as pd
df = pd.read_excel('./TfidfVectorizer_sklearn.xlsx')
for i in df.columns: # loop through every column
    tfidf_vectorizer = TfidfVectorizer()
    print(df.loc[:, i].values)
    X = tfidf_vectorizer.fit_transform(df.loc[:, i].values) # select column all values
    print(tfidf_vectorizer.get_feature_names_out())
    print(X.shape)

相关问题