[网鼎杯 2020 青龙组]jocker

首先我们查看一下信息，32位程序，无壳：

704ac44f-be8d-4a29-8c61-3a8c1d1b3d88

然后用IDA打开，提示// positive sp value has been detected, the output may be wrong!

出现了栈不平衡的问题，导致ida无法生成伪代码。那为什么会出现这种情况呢？

一般是程序代码有一些干扰代码，让IDA的反汇编分析出现错误。比如用push + n条指令 + retn来实际跳转，而IDA会以为retn是函数要结束，结果它分析后发现调用栈不平衡，因此就提示sp analysis failed.

还有一些比如编译器优化，因为ida是用retn指令来识别函数结束的，如果函数不是以这种方式结束，IDA就会分析为栈不平衡。也就是IDA找不到函数结束的位置。

例如以下代码：

int one_function( int a,int b);

int another_function( int a, int b)
{
    if ( a == 0 || b == 0 )
    return -1;
    return one_function(a,b);
}

其中return one_function(a,b)这条语句，在某些新的编译器，可能会编译成这样的指令序列：

1
2
3

mov esp, ebp
pop ebp
jmp one_funcion

本段转自：https://blog.csdn.net/dj0379/article/details/8699219

所以我总结：IDA识别出栈不平衡，是由于IDA的伪代码生成引擎无法识别程序的汇编逻辑结构导致的。所以我们要手动对栈的值进行修正。

勾选显示栈指针的选项

f756efa2-8bf4-4b9e-a9f9-b49c3a871756

cb5c0060-350e-4c76-b47a-86f4cb33ca05

可以看到这两个地方，都是调用了一个函数，结果栈指针都不一样了。至于为什么不一样，后面就知道了。

2b477adc-6cce-4fc2-8f9c-edfbf574ee55

所以我们到这个函数的位置按下alt+k，修改新旧sp指针的差值，这里我们改为0.对于不同的函数调用，我们要改的值当然是不同的。例如：

1、_stdcall调用约定:函数的参数自右向左通过栈传递，被调用的函数在返回前清理传送参数的内存栈。
2、__cdecl是C和C++程序的缺省调用方式。每一个调用它的函数都包含清空堆栈的代码，所以产生的可执行文件大小会比调用_stdcall函数的大。函数采用从右到左的压栈方式。注意:对于可变参数的成员函数，始终使用__cdecl的转换方式。

针对每一条指令执行完后,看看栈是否正常,如果不对,则通过ALT + K来修改.重点检查虚函数的调用, 如call [esi + n] , 这里不一定非得是esi,以及跳转前后的栈是否一致.另外还需要通过ALT + P 来确认下变量起始地址,清除个数与保存个数是否正常.

3b16e1a8-720f-466f-9801-1bd1afde8f77

修改后可以看到两次函数调用前后的栈相等了。于是再次生成伪代码，IDA未出现错误：

5bf4b72e-30bd-475c-b29c-aa3292dbb222

发现逻辑很简单，先用wrong函数加密，然后omg函数校对

ad87eba2-8b3c-4ab1-afe8-3a96520f402a

wrong() :

c466397e-d19c-4de8-ad38-1fdc8c5472d6

omg() :

8005893e-851e-45ac-903a-dcabbec107e5

可以看到加密后和&unk_4030C0地址的字符串校对，解密看一下：

# coding:utf-8

key = 0x66, 0x6B, 0x63, 0x64, 0x7F, 0x61, 0x67, 0x64, 0x3B, 0x56, 0x6B, 0x61, 0x7B, 0x26, 0x3B, 0x50, 0x63, 0x5F, 0x4D, 0x5A, 0x71, 0x0C, 0x37, 0x66
fake_flag = ''


for i in range(24):
    if i % 2 == 1:
        fake_flag += chr(key[i] + i)
    else:
        fake_flag += chr(key[i] ^ i)


print(fake_flag)

# flag{fak3_alw35_sp_me!!}

结果是错的，还以为很简单，果然是小丑

可以看到前面第20行复制了一次flag，用在下面的encrypt函数里，才是真正的加密函数。

所以现在重点就是这个ebcrypt函数，我们点进去看，发现依然出现错误，并且一堆乱七八糟的东西：

8498accd-d3f5-4cf6-b37b-b33bcf99dfe9

5a7a9e13-77fd-4c8b-bd3d-94fe845dc8d8

所以我们观察到这层循环：

c6d24426-5141-433a-af00-213fd19a0e24

可以推测，出题者这里先给函数的代码段进行了加密，然后在运行的时候再用这层循环进行解密，相当于加了一层壳。

所以我们这里可以使用IDC脚本，或者动态调试查看到解密后正确的函数指令。我们用ollydbg打开，中文智能搜索定位到解密的位置：

31033823-02e3-4c53-b6d9-cc3f2f2ead6e

可以看到这里，非常符合for循环优化后的指令序列，[ebp-0xC]就是i，jocker.00401500就是ecrypt()的地址。因此我们下断点到循环结束的地方，然后F9，再F7步入解密后的ecrypt函数内部：

4573417a-6117-48e8-b5af-88b5c75830be

可以看到正确的汇编指令。然后dump出来：

f1e40cff-6386-4456-a46b-320cd04a65c5

9ebc1ed6-300e-491d-8407-3c5e85c5dc4f

然后将新的可执行文件拖入IDA，可以看到ecrypt函数已经解出，函数名为start：

3d51c30a-172a-4bab-b6fd-23e51c19f0af

这里对前19个flag进行加密比较，&unk_403040就是flag前19个字节加密后的字符串，我们提取：

55750c1a-1515-45de-a0a8-5bb3ee70bc91

解密


hahaha = 'hahahaha_do_you_find_me?'
v2 = [0x0E, 0x0D, 0x9, 0x6, 0x13, 0x5, 0x58, 0x56, 0x3E, 0x6,
      0x0C, 0x3C, 0x1F, 0x57, 0x14, 0x6B, 0x57, 0x59, 0x0D]
true_flag = []


for i in range(19):
    true_flag.append(chr(v2[i] ^ ord(hahaha[i])))

# flag{d07abccf8a410c

可以看到只出了前一部分的flag。但是别忘了，encrypt()之后还有一个finally函数。我们查看：

cfda5b3a-373b-4464-8422-c85340b2f2b0

到这里，我没看懂这段代码的逻辑含义，但是它提示了：我把最后一部分藏起来，你不会成功的！！！

还记得前面用的异或加密算法吗，所以v3应该就是相同的方法继续加密后的五个密文字符，所以我们就需要知道他用什么key来加密的。前面用的是hahaha字符的前19个，这里我们继续用后面五个进行解密的话肯定不是flag。但是flag的最后一位肯定是}，所以我们猜测是用某个数字和 ‘}’ 异或，可以得到 ‘:’ 这个字符。于是进一步猜测前面四个都是用相同的key加密的，于是我们解密：


v3 = [37, 116, 112, 38, 58]
key = ord('}') ^ 58

for i in range(5):
    true_flag.append(chr(v3[i] ^ key))

print(''.join(true_flag))

得到flag：flag{d07abccf8a410cb37a}

所以回到前面的问题，为什么调用前面的两个函数，会出现栈失衡的问题？因为IDA在静态反汇编时，encrypt函数并没有解密，指令序列是乱的，IDA根据反汇编的结果进行栈的操作，自然在调用前后出现栈失衡的问题。

Page View