从C语言的数组参数退化为指针谈起
Contact me:
Blog -> https://cugtyt.github.io/blog/index
Email -> cugtyt@qq.com
GitHub -> Cugtyt@GitHub
当我们写下如下代码:
void fun(int arr[]);
// 等同于void fun(int *arr);
int a[10];
fun(a);
我们知道a原来是个数组,但是当我们调用fun传入的时候,arr不再是数组的形式,而是退化为指针,假设读者有这个理解基础。
那么问题来了,这个转变过程我们要注意什么?
首先考虑如果是个数组我们可以求数组长度:
// 为了避免歧义,假设int是4个字节,指针也是4个字节
sizeof(a); // 40
sizeof(a) / sizeof(a[0]); // 10
但是指针就不一样了:
sizeof(arr); // 4
我们丢失了数组长度的信息,因此从本质上来说,我们用退化的指针来表示数组是有点问题的,真实的数组指针应该怎么写呢?
void fun(int (*arr)[10]);
int a[10];
fun(&a);
注意到我们不再简单传入a,而是传入&a,这样就是取数组的地址,函数的参数类型也要改变。如果我们做一下测试:
#include <stdio.h>
void fun1(int *arr) {
printf("%p\n", arr);
printf("%p\n", arr + 1);
}
void fun2(int (*arr)[10]) {
printf("%p\n", arr);
printf("%p\n", arr + 1);
}
int main() {
int a[10];
fun1(a);
fun2(&a);
}
Output:
0x7fffeadf1b30
0x7fffeadf1b34
0x7fffeadf1b30
0x7fffeadf1b58
可以看到fun1,就是原来的方式,指针增加1,沿着数组元素后移,我们无法得知数组有多长,而fun2是传入数组指针,指针增加1,地址增加28,注意这里是16进制,转为10进制就是40,正好就是数组的长度,也就是说这个指针包含了数组长度的信息。
好像我在表达原来的写法是错的,这样才对,但是并不是。因为虽然保留了数组信息,但是函数的声明必须把数组长度表示出来,这意味着我们必须事先知道长度,而且不能改变,这就限制了函数的能力。所以C的处理方式是退化数组为指针,然后加上数组长度!
C++加入了std::array<type, length>
的容器,但是正如我们上面讨论的,由于我们要把长度写死,因此在函数传递的时候就很不方便了,这个容器带来的好处除了可以用标准库的函数外,似乎在这方面并没有什么值得称赞的地方。当然用指针,我们得人工保证传入的东西是正确的。
希望读者通过这个简短的分析理解为什么会有数组退化为指针。