R语言 如何强制statmodels/patsy将分类变量(1,2,3,...)视为连续变量?

zqdjd7g9  于 2023-03-05  发布在  其他
关注(0)|答案(1)|浏览(169)

我知道C(variable, Treatment(reference="variable reference"))可以用来将连续变量视为分类变量,但我想做的恰恰相反,即我希望分类变量被视为连续变量。
我想复制本文中的结果:https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3164764 .本文将一个类别为“A”、“B”、...、“F”的变量转换为值1、2、...、6,并将其视为连续变量。
在有人向我推荐patsy文档之前,我找不到任何相关的东西。

4c8rllxm

4c8rllxm1#

最简单的方法可能是对数据本身进行预处理。有很多方法可以做到这一点,使用pandas库的一个简单方法是使用pandas.factorize

>>> codes, uniques = pd.factorize(['b', 'b', 'a', 'c', 'b'])
>>> codes
array([0, 0, 1, 2, 0]...)
>>> uniques
array(['b', 'a', 'c'], dtype=object)

相关问题