Skip to the content.

从C语言的数组参数退化为指针谈起


Contact me:

Blog -> https://cugtyt.github.io/blog/index
Email -> cugtyt@qq.com
GitHub -> Cugtyt@GitHub


当我们写下如下代码:

void fun(int arr[]);
// 等同于void fun(int *arr);

int a[10];
fun(a);

我们知道a原来是个数组,但是当我们调用fun传入的时候,arr不再是数组的形式,而是退化为指针,假设读者有这个理解基础。

那么问题来了,这个转变过程我们要注意什么?

首先考虑如果是个数组我们可以求数组长度:

// 为了避免歧义,假设int是4个字节,指针也是4个字节
sizeof(a);   // 40
sizeof(a) / sizeof(a[0]);    // 10

但是指针就不一样了:

sizeof(arr);    // 4

我们丢失了数组长度的信息,因此从本质上来说,我们用退化的指针来表示数组是有点问题的,真实的数组指针应该怎么写呢?

void fun(int (*arr)[10]);

int a[10];
fun(&a);

注意到我们不再简单传入a,而是传入&a,这样就是取数组的地址,函数的参数类型也要改变。如果我们做一下测试:

#include <stdio.h>

void fun1(int *arr) {
    printf("%p\n", arr);
    printf("%p\n", arr + 1);
}
void fun2(int (*arr)[10]) {
    printf("%p\n", arr);
    printf("%p\n", arr + 1);
}
int main() {
    int a[10];
    fun1(a);
    fun2(&a);
}

Output:
    0x7fffeadf1b30
    0x7fffeadf1b34
    0x7fffeadf1b30
    0x7fffeadf1b58

可以看到fun1,就是原来的方式,指针增加1,沿着数组元素后移,我们无法得知数组有多长,而fun2是传入数组指针,指针增加1,地址增加28,注意这里是16进制,转为10进制就是40,正好就是数组的长度,也就是说这个指针包含了数组长度的信息。

好像我在表达原来的写法是错的,这样才对,但是并不是。因为虽然保留了数组信息,但是函数的声明必须把数组长度表示出来,这意味着我们必须事先知道长度,而且不能改变,这就限制了函数的能力。所以C的处理方式是退化数组为指针,然后加上数组长度!

C++加入了std::array<type, length>的容器,但是正如我们上面讨论的,由于我们要把长度写死,因此在函数传递的时候就很不方便了,这个容器带来的好处除了可以用标准库的函数外,似乎在这方面并没有什么值得称赞的地方。当然用指针,我们得人工保证传入的东西是正确的。

希望读者通过这个简短的分析理解为什么会有数组退化为指针。