从C语言的数组参数退化为指针谈起

Contact me:

Blog -> https://cugtyt.github.io/blog/index
Email -> cugtyt@qq.com
GitHub -> Cugtyt@GitHub

当我们写下如下代码：

void fun(int arr[]);
// 等同于void fun(int *arr);

int a[10];
fun(a);

我们知道a原来是个数组，但是当我们调用fun传入的时候，arr不再是数组的形式，而是退化为指针，假设读者有这个理解基础。

那么问题来了，这个转变过程我们要注意什么？

首先考虑如果是个数组我们可以求数组长度:

// 为了避免歧义，假设int是4个字节，指针也是4个字节
sizeof(a);   // 40
sizeof(a) / sizeof(a[0]);    // 10

但是指针就不一样了：

sizeof(arr);    // 4

我们丢失了数组长度的信息，因此从本质上来说，我们用退化的指针来表示数组是有点问题的，真实的数组指针应该怎么写呢？

void fun(int (*arr)[10]);

int a[10];
fun(&a);

注意到我们不再简单传入a，而是传入&a，这样就是取数组的地址，函数的参数类型也要改变。如果我们做一下测试：

#include <stdio.h>

void fun1(int *arr) {
    printf("%p\n", arr);
    printf("%p\n", arr + 1);
}
void fun2(int (*arr)[10]) {
    printf("%p\n", arr);
    printf("%p\n", arr + 1);
}
int main() {
    int a[10];
    fun1(a);
    fun2(&a);
}

Output:
    0x7fffeadf1b30
    0x7fffeadf1b34
    0x7fffeadf1b30
    0x7fffeadf1b58

可以看到fun1，就是原来的方式，指针增加1，沿着数组元素后移，我们无法得知数组有多长，而fun2是传入数组指针，指针增加1，地址增加28，注意这里是16进制，转为10进制就是40，正好就是数组的长度，也就是说这个指针包含了数组长度的信息。

好像我在表达原来的写法是错的，这样才对，但是并不是。因为虽然保留了数组信息，但是函数的声明必须把数组长度表示出来，这意味着我们必须事先知道长度，而且不能改变，这就限制了函数的能力。所以C的处理方式是退化数组为指针，然后加上数组长度！

C++加入了std::array<type, length>的容器，但是正如我们上面讨论的，由于我们要把长度写死，因此在函数传递的时候就很不方便了，这个容器带来的好处除了可以用标准库的函数外，似乎在这方面并没有什么值得称赞的地方。当然用指针，我们得人工保证传入的东西是正确的。

希望读者通过这个简短的分析理解为什么会有数组退化为指针。