Kernel-4.18.0-80.el8_kernel_user_helpers

Chinese translated version of Documentation/arm/kernel_user_helpers.txt

If you have any comment or update to the content, please contact the
original document maintainer directly. However, if you have a problem
communicating in English you can also ask the Chinese maintainer for
help. Contact the Chinese maintainer if this translation is outdated
or if there is a problem with the translation.

Maintainer: Nicolas Pitre nicolas.pitre@linaro.org
Dave Martin dave.martin@linaro.org
Chinese maintainer: Fu Wei tekkamanninja@gmail.com


Documentation/arm/kernel_user_helpers.txt 的中文翻译

如果想评论或更新本文的内容,请直接联系原文档的维护者。如果你使用英文
交流有困难的话,也可以向中文版维护者求助。如果本翻译更新不及时或者翻
译存在问题,请联系中文版维护者。
英文版维护者: Nicolas Pitre nicolas.pitre@linaro.org
Dave Martin dave.martin@linaro.org
中文版维护者: 傅炜 Fu Wei tekkamanninja@gmail.com
中文版翻译者: 傅炜 Fu Wei tekkamanninja@gmail.com
中文版校译者: 宋冬生 Dongsheng Song dongshneg.song@gmail.com
傅炜 Fu Wei tekkamanninja@gmail.com

以下为正文

内核提供的用户空间辅助代码

在内核内存空间的固定地址处,有一个由内核提供并可从用户空间访问的代码
段。它用于向用户空间提供因在许多 ARM CPU 中未实现的特性和/或指令而需
内核提供帮助的某些操作。这些代码直接在用户模式下执行的想法是为了获得
最佳效率,但那些与内核计数器联系过于紧密的部分,则被留给了用户库实现。
事实上,此代码甚至可能因不同的 CPU 而异,这取决于其可用的指令集或它
是否为 SMP 系统。换句话说,内核保留在不作出警告的情况下根据需要更改
这些代码的权利。只有本文档描述的入口及其结果是保证稳定的。

这与完全成熟的 VDSO 实现不同(但两者并不冲突),尽管如此,VDSO 可阻止
某些通过常量高效跳转到那些代码段的汇编技巧。且由于那些代码段在返回用户
代码前仅使用少量的代码周期,则一个 VDSO 间接远程调用将会在这些简单的
操作上增加一个可测量的开销。

在对那些拥有原生支持的新型处理器进行代码优化时,仅在已为其他操作使用
了类似的新增指令,而导致二进制结果已与早期 ARM 处理器不兼容的情况下,
用户空间才应绕过这些辅助代码,并在内联函数中实现这些操作(无论是通过
编译器在代码中直接放置,还是作为库函数调用实现的一部分)。也就是说,
如果你编译的代码不会为了其他目的使用新指令,则不要仅为了避免使用这些
内核辅助代码,导致二进制程序无法在早期处理器上运行。

新的辅助代码可能随着时间的推移而增加,所以新内核中的某些辅助代码在旧
内核中可能不存在。因此,程序必须在对任何辅助代码调用假设是安全之前,
检测 __kuser_helper_version 的值(见下文)。理想情况下,这种检测应该
只在进程启动时执行一次;如果内核版本不支持所需辅助代码,则该进程可尽早
中止执行。

kuser_helper_version

位置: 0xffff0ffc

参考声明:

extern int32_t __kuser_helper_version;

定义:

这个区域包含了当前运行内核实现的辅助代码版本号。用户空间可以通过读
取此版本号以确定特定的辅助代码是否存在。

使用范例:

#define __kuser_helper_version (*(int32_t *)0xffff0ffc)

void check_kuser_version(void)
{
if (__kuser_helper_version < 2) {
fprintf(stderr, “can’t do atomic operations, kernel too old\n”);
abort();
}
}

注意:

用户空间可以假设这个域的值不会在任何单个进程的生存期内改变。也就
是说,这个域可以仅在库的初始化阶段或进程启动阶段读取一次。

kuser_get_tls

位置: 0xffff0fe0

参考原型:

void * __kuser_get_tls(void);

输入:

lr = 返回地址

输出:

r0 = TLS 值

被篡改的寄存器:

无

定义:

获取之前通过 __ARM_NR_set_tls 系统调用设置的 TLS 值。

使用范例:

typedef void * (__kuser_get_tls_t)(void);
#define __kuser_get_tls (*(__kuser_get_tls_t *)0xffff0fe0)

void foo()
{
void *tls = __kuser_get_tls();
printf(“TLS = %p\n”, tls);
}

注意:

  • 仅在 __kuser_helper_version >= 1 时,此辅助代码存在
    (从内核版本 2.6.12 开始)。

kuser_cmpxchg

位置: 0xffff0fc0

参考原型:

int __kuser_cmpxchg(int32_t oldval, int32_t newval, volatile int32_t *ptr);

输入:

r0 = oldval
r1 = newval
r2 = ptr
lr = 返回地址

输出:

r0 = 成功代码 (零或非零)
C flag = 如果 r0 == 0 则置 1,如果 r0 != 0 则清零。

被篡改的寄存器:

r3, ip, flags

定义:

仅在 *ptr 为 oldval 时原子保存 newval 于 *ptr 中。
如果 *ptr 被改变,则返回值为零,否则为非零值。
如果 *ptr 被改变,则 C flag 也会被置 1,以实现调用代码中的汇编
优化。

使用范例:

typedef int (__kuser_cmpxchg_t)(int oldval, int newval, volatile int ptr);
#define __kuser_cmpxchg (
(__kuser_cmpxchg_t *)0xffff0fc0)

int atomic_add(volatile int *ptr, int val)
{
int old, new;

do {
    old = *ptr;
    new = old + val;
} while(__kuser_cmpxchg(old, new, ptr));

return new;

}

注意:

  • 这个例程已根据需要包含了内存屏障。

  • 仅在 __kuser_helper_version >= 2 时,此辅助代码存在
    (从内核版本 2.6.12 开始)。

kuser_memory_barrier

位置: 0xffff0fa0

参考原型:

void __kuser_memory_barrier(void);

输入:

lr = 返回地址

输出:

无

被篡改的寄存器:

无

定义:

应用于任何需要内存屏障以防止手动数据修改带来的一致性问题,以及
__kuser_cmpxchg 中。

使用范例:

typedef void (__kuser_dmb_t)(void);
#define __kuser_dmb (*(__kuser_dmb_t *)0xffff0fa0)

注意:

  • 仅在 __kuser_helper_version >= 3 时,此辅助代码存在
    (从内核版本 2.6.15 开始)。

kuser_cmpxchg64

位置: 0xffff0f60

参考原型:

int __kuser_cmpxchg64(const int64_t *oldval,
const int64_t *newval,
volatile int64_t *ptr);

输入:

r0 = 指向 oldval
r1 = 指向 newval
r2 = 指向目标值
lr = 返回地址

输出:

r0 = 成功代码 (零或非零)
C flag = 如果 r0 == 0 则置 1,如果 r0 != 0 则清零。

被篡改的寄存器:

r3, lr, flags

定义:

仅在 *ptr 等于 *oldval 指向的 64 位值时,原子保存 *newval
指向的 64 位值于 *ptr 中。如果 *ptr 被改变,则返回值为零,
否则为非零值。

如果 *ptr 被改变,则 C flag 也会被置 1,以实现调用代码中的汇编
优化。

使用范例:

typedef int (__kuser_cmpxchg64_t)(const int64_t oldval,
const int64_t *newval,
volatile int64_t *ptr);
#define __kuser_cmpxchg64 (
(__kuser_cmpxchg64_t *)0xffff0f60)

int64_t atomic_add64(volatile int64_t *ptr, int64_t val)
{
int64_t old, new;

do {
    old = *ptr;
    new = old + val;
} while(__kuser_cmpxchg64(&old, &new, ptr));

return new;

}

注意:

  • 这个例程已根据需要包含了内存屏障。

  • 由于这个过程的代码长度(此辅助代码跨越 2 个常规的 kuser “槽”),
    因此 0xffff0f80 不被作为有效的入口点。

  • 仅在 __kuser_helper_version >= 5 时,此辅助代码存在
    (从内核版本 3.1 开始)。