从Entry Point到main函数调用（6）：exit

driftcloudy

浏览: 130750 次
性别:
来自: 上海

最近访客更多访客>>

loren_mt

limars

myohmy1

hanpeng136

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

XP C C++C#VC++

本章是该系列最后一篇，打算看一下 exit 函数中究竟做了些什么。

main函数的返回值

在第（5）篇里完成了_cinit() 的分析之后，mainCRTStartup中接下来代码是：

__initenv = _environ;
mainret = main(__argc, __argv, _environ);
exit(mainret);

很显然，其实main函数是可以接受第三个参数的，_environ是一个环境变量的指针，只不过一般情况下写程序的时候用不到。从代码中可以看出，调用完main函数后，其返回值mainret会被传递给exit 用作参数。

这里首先要解决一个问题，如果main函数的返回值类型是void呢？

其实准确说写成void main是不对的T T...根据C99的规定，main的返回类型必须是int，并且如果 main 函数的最后没有写 return 语句，编译器要自动加入 return 0 ，表示程序正常退出。例如：

#include <stdio.h>
void main()
{
	printf("%d",100);
}

利用VS2010进行build，OD进入main函数：

注意倒数第二行，这里将EAX清0。其实 main 函数也是一个标准的__cdecl 函数，其return的值会存放在EAX中，因此这里等于会返回一个0 。可见VS2010 这点上还是满足C99 标准的，即使程序员写的是 void main，它依然悄悄的在最后添上 return 0。

来看看VC 6，如果用VC 6来build同样一段代码，则main函数为：

很显然，这里并没有将EAX的值清0再retn，但是接下来依然会从EAX 中拿值赋给mainret 。换句话说，用VC6 编译的时候，main函数并不会有默认的返回值，真正传进exit函数的还是main调用完后的EAX值，不过鬼知道这个时候EAX 是什么。这里可以看出 VC6并没有遵循C99的规范，貌似VC6是98年出来的，想想也算情有可原了...

exit _exit _cexit _c_exit

由于有一系列和 exit 类似的函数，这里一起顺便看下~

void __cdecl exit ( int status )
{
        doexit(status, 0, 0); /* full term, kill process */
}

void __cdecl _exit ( int status)
{
        doexit(status, 1, 0); /* quick term, kill process */
}

void __cdecl _cexit ( void )
{
        doexit(0, 0, 1);    /* full term, return to caller */
}

void __cdecl _c_exit ( void )
{
        doexit(0, 1, 1);    /* quick term, return to caller */
}

在crt0dat.c中定义了上面四个乍一看名字让人很纠结的函数。根据代码中的注释，它们的大概作用为:

exit 函数先进行清理工作（比如析构处理、关闭所有标准IO流），然后利用main 函数返回的status 来终结当前进程
_exit 函数用于快速终结进程，它并不进行那些“高层次”的清理
_cexit 同exit 函数一样执行清理，它并不终结进程
_c_exit 同_exit 一样执行清理，它并不终结进程

用通俗的话说，exit 是 _exit 的安全增强版，_cexit是_c_exit 的安全增强版。不过从它们的实现上看，本质上都是 doexit 函数在起作用。在doexit 的内部负责进行各种清理，然后再终结进程或者返还控制权给程序。

来看一下doexit 的大概实现，这里忽略了一些条件编译：

// 是否需要终结进程，0表示终结当前进程，1表示返回控制权给程序
char _exitflag = 0;

/*
 * 两个标志
 * 一旦进入了doexit ，_C_Termination_Done会被设置为true
 * 在doexit 完成了所有清理工作后（进入内核之前），_C_Exit_Done 会被设置为true
 */
int _C_Termination_Done = FALSE;
int _C_Exit_Done = FALSE;

static void __cdecl doexit ( int code, int quick, int retcaller )
{
        if (_C_Exit_Done == TRUE)                          /*如果doexit()被递归的调用*/
                TerminateProcess(GetCurrentProcess(),code);/*直接TerminateProcess终结当前进程*/
        _C_Termination_Done = TRUE;

        /* 在执行其他清理的时候可能会用到retcaller，因此先将它赋值给全局变量_exitflag */
        _exitflag = (char) retcaller;  /* 0 = term, !0 = callable exit */

        if (!quick) {
            /*
             * 如果该程序曾经利用_onexit 或者 atexit  注册过函数，那么在退出前需要执行这些函数。
             * 执行的顺序与被注册的顺序相反，即采用LIFO的模式。
             * 利用atexit 来注册函数的时候，内存中会生成一张函数指针列表，
             * __onexitbegin 和__onexitend 分别指向列表的头部和尾部。
             *
             * 注意：
             * 是先从__onexitend指针开始，逐渐向前遍历，直到__onexitbegin，
             * 这样就能确保LIFO的调用顺序。
             */

            if (__onexitbegin) {
                _PVFV * pfend = __onexitend;

                while ( --pfend >= __onexitbegin )
                /*
                 * if current table entry is non-NULL,
                 * call thru it.
                 */
                if ( *pfend != NULL )
                    (**pfend)();
            }

            /*
             * 会进行endstdio之类的操作，进行清理
             */
            _initterm(__xp_a, __xp_z);
        }

        /*
         * 调用C terminators，貌似实际上没调用什么函数
         */
        _initterm(__xt_a, __xt_z);

        /* 如果定义了retcaller，那么需要将控制权返回 */
        if (retcaller) {
            return;
        }

        _C_Exit_Done = TRUE;

        /* 结束进程 */
        ExitProcess(code);
}

从上述实现可以看出，如果是对于正常的退出，doexit 进行4个步骤操作：

1. 执行 _onexit 或者 atexit 中已经注册了的函数

2. _initterm(__xp_a, __xp_z)

3. _initterm(__xt_a, __xt_z)

4. ExitProcess(code)

析构

如果对象是定义在一个函数的内部，相当于局部变量，那么在函数调用结束之前，会自动析构该对象。

如果是一个全局对象，那么析构其实运行在上面4个步骤中的第1步，即调用_onexit、atexit 注册过的函数时发生。

可以用一段简单的示例代码来说明这些问题：

#include <stdio.h>
#include <stdlib.h>

typedef struct foo1 {
	foo1() { printf("1"); }
	~foo1() { printf("2"); }
	static void bar() { printf("3"); }
} Foo1;

typedef struct foo2 {
	foo2() { printf("4"); }
	~foo2() { printf("5"); }
} Foo2;

Foo1 f1;

void main()
{
	Foo2 f2;
	atexit(&Foo1::bar);
}

这是一段C++代码，因为C中的struct是不被允许定义方法的。最终的输出结果是：

运行结果

14532

这段示例代码中定义了两个变量，全局变量f1和局部变量f2，并且利用atexit注册了一个函数bar 。

根据第（5）篇中的描述，f1 的初始化工作在_cinit 函数中调用_initterm( __xc_a, __xc_z )时完成，至于f2 的初始化，肯定是在运行至main函数中Foo2 f2 一句时才开始进行。当main函数中的语句都执行完毕（此时尚未退出main函数），开始对f2 执行析构。析构完毕随后就退出main 调用，进入exit----> doexit，开始上述的4个步骤。在第1步中会运行注册的bar函数，然后调用f1 的析构函数，在第2步中调用endstdio 关闭IO，第3步没做啥，第4步ExitProcess。

因此从 cinit ----> main ----> exit 大概发生的事情顺序如下所示：

0
顶

0
踩

分享到：

逆向C++学习手记（1） | 从Entry Point到main函数调用（5）：_cin ...

2011-05-28 20:31
浏览 3348
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论