根据Wikipedia条目以及Intel手册,只要设置了CR4
的bit 8
,rdpmc
就应该对用户模式进程可用。然而,当我试图从用户空间运行rdpmc
时,即使设置了该位,我仍然会遇到general protection
错误。
我运行在一个8核Intel X3470
内核2.6.32-279.el6.x86_64
上。
下面是我尝试执行的用户模式程序:
#define _GNU_SOURCE
#include <stdio.h>
#include <stdlib.h>
#include <inttypes.h>
#include <sched.h>
#include <assert.h>
uint64_t
read_pmc(int ecx)
{
unsigned int a, d;
__asm __volatile("rdpmc" : "=a"(a), "=d"(d) : "c"(ecx));
return ((uint64_t)a) | (((uint64_t)d) << 32);
}
int main(int ac, char **av)
{
uint64_t start, end;
cpu_set_t cpuset;
unsigned int c;
int i;
if (ac != 3) {
fprintf(stderr, "usage: %s cpu-id pmc-num\n", av[0]);
exit(EXIT_FAILURE);
}
i = atoi(av[1]);
c = atoi(av[2]);
CPU_ZERO(&cpuset);
CPU_SET(i, &cpuset);
assert(sched_setaffinity(0, sizeof(cpuset), &cpuset) == 0);
printf("%lu\n", read_pmc(c));
return 0;
}
下面是设置位并读取CR4
的内核模块,这样我就可以手动验证位是否已设置。
/*
* Enable PMC in user mode.
*/
#include <linux/module.h>
#include <linux/kernel.h>
int init_module(void)
{
typedef long unsigned int uint64_t;
uint64_t output;
// Set CR4, Bit 8 to enable PMC
__asm__("push %rax\n\t"
"mov %cr4,%rax;\n\t"
"or $(1 << 7),%rax;\n\t"
"mov %rax,%cr4;\n\t"
"wbinvd\n\t"
"pop %rax"
);
// Read back CR4 to check the bit.
__asm__("\t mov %%cr4,%0" : "=r"(output));
printk(KERN_INFO "%lu", output);
return 0;
}
void cleanup_module(void)
{
__asm__("push %rax\n\t"
"push %rbx\n\t"
"mov %cr4,%rax;\n\t"
"mov $(1 << 7), %rbx\n\t"
"not %rbx\n\t"
"and %rbx, %rax;\n\t"
"mov %rax,%cr4;\n\t"
"wbinvd\n\t"
"pop %rbx\n\t"
"pop %rax\n\t"
);
}
2条答案
按热度按时间xoefb8l81#
显然,当英特尔说
Bit 8
时,他们指的是从右边开始的第9位,因为他们的索引从0
开始。将$(1 << 7)
替换为$(1 << 8)
可以全局解决问题,并允许从用户模式调用rdpmc
。这里是更新的内核模块,也使用
on_each_cpu
来确保它在每个核心上都被设置。nxagd54h2#
返回“2”到/sys/bus/event_source/devices/cpu/rdpmc允许用户进程通过rdpmc指令访问性能计数器。请注意,行为发生了变化。在4.0之前,“1”表示“启用”,而“0”表示禁用。现在“1”表示只允许有活动的perf事件的进程。更多详情:http://man7.org/linux/man-pages/man2/perf_event_open.2.html