由于 Python(解释型语言)的性质,保护源代码是一项具有挑战性的任务。为了执行源代码,它必须以某种形式可用。
在整篇文章中,我将详细介绍使用 Cython 方法/解决方案编译模块,以应对保护基于 Python 的代码库的挑战。
Cython是 Python 和 Cython 编程语言的静态编译器,它简化了编写 Python C 扩展的工作。Cython 允许我们编译 Python 代码,结果是动态库也可以用作 Python 模块。
Cython导入流程如下:
共享库(.so、.pyd)python字节码(.pyo,.pyc)蟒蛇文件(.py)那么……使用 Cython 编译模块有什么好处?
二进制模块将带来更难的任务来获取原始 Python 代码,因此必须使用逆向工程技术。Cython 生成的 C 代码可以修改以引入更改、改进保护等。编译库时可以使用 GCC 优化标志Tracebacks 不会显示代码,而只会显示行号(除非 disabled )。Cython 获取 Python 代码并将其转换为 C,然后由 GCC(或类似)编译,编译后的代码将比纯 Python 版本运行得更快。让我们回顾一下 Cython 的基本功能
从 HashiCorp Vault 中提取秘密很棒,但是如果您考虑一下……如果用户可以访问/修改代码,他/她可以添加一个简单的打印语句来揭示秘密(检查第 19 行至第 21 行)
进口getpass 进口暖通空调 VAULT_ADDR = http://127.0.0.1:8200 VAULT_TOKEN = getpass。getpass ( Hashicorp Vault 令牌 ID: ) 客户=暖通空调。客户() 客户=暖通空调。客户( 网址 = VAULT_ADDR, 令牌 = VAULT_TOKEN ) 响应 =客户。秘密。千伏_ read_secret_version(路径= ap) client_id = response[ data ][ data ][ client_id ] client_secret = response[ data ][ data ][ client_secret ] repo_token = 响应[ 数据][ 数据 ][ repo_token ] print ( “客户 ID:” + client_id) print ( “客户密码:” + client_secret) print ( “回购令牌:” + repo_token)嗯……我们需要防止其他人修改文件……让我们看看 Cython 如何提供帮助。
1. 为了这个 POC,让我们留下三个打印语句(第 19 行至第 21 行)。最好删除这些行
2. 确保安装了“ python3-devel ”包(例如,sudo yum install python3-devel)
3.安装Cython- sudo pip3 install Cython
$ sudo pip3 安装 Cython 收集赛通 下载 https://files.pythonhosted.org/packages/40/67/36322cf0387cf65e6be80ba2d9a33db227ecbc624902f0cb2e4bf456261f/Cython-0.29.23-cp38-cp38-manylinux1_x86_64.whl (1.9MB) |████████████████████████████████| 1.9MB 23.3MB/秒 安装收集的包:Cython 成功安装 Cython-0.29.234. 将python代码转换成C代码–cython hello.py –embed (注意:添加–embed标志来创建一个独立的程序。如果不使用–embed,c代码将没有main,因为这意味着创建一个共享对象而不是独立的可执行文件。发出并执行以下命令后,应在同一目录下创建 ac 源文件 hello.c)
$ cython hello.py -o cython.c /usr/local/lib64/python3.8/site-packages/Cython/Compiler/Main.py:369:FutureWarning:未设置 Cython 指令“language_level”,目前使用 2(Py2)。这将在以后的版本中更改!文件:/home/ec2-user/hello.py 树 = Parsing.p_module(s, pxd, full_module_name)5. 将c代码编译成可执行文件 – gcc `python3-config –cflags –ldflags` hello.c -o hello(注意:必须指定包含和库路径python。执行以下命令应该会创建一个可执行文件你好。这将是一个可分发的二进制文件)
$ gcc `python3-config –cflags –ldflags` hello.c -o hello $ [无输出]6.查看文件夹内容——ls -rtl
$ ls -rtl 总共276 -rw-rw-r–。1 ec2-user ec2-user 545 Jul 11 16 : 06你好。py -rw-rw-r–。1 ec2-user ec2-user 139572 Jul 11 17 : 27你好。c -rwxrwxr-x。1 ec2-user ec2-user 132312 Jul 11 17 : 29你好7. 运行 hello 脚本 – ./hell o(当被问到时,输入HashiCorp Vault Secret Manager 文章中的“ Root Token ”,第 4 步)
$ ./你好 Hashicorp Vault 令牌 ID:[–> 根令牌:s.4Gl4TLJb1D82OWxxxxxxxxxx] 客户编号:123456789 客户密码:987654321 回购令牌:a1b2c3d4e58.查看hello文件内容——cat hello(注意:文件输出被截断)
$猫你好 ELF>?J@@?@ 8 @ &@@@@@h??@?@@@HUHU 0]0]`0]`? ?HX[cBE??j??@?@Cֻ?|??V?T?????@?@P?td`P`P@`P@??Q?tdR?td0]0]` 0 ]`??/lib64/ld-linux-x86-64.so.2GNU?GNUGNU?M?;>P??¸????ȡX?d! 😕 @h`(?E@F @b`5`L@??F@<J?J@/?h`Q?K@ea@L@libpython3.6m.so.1.0_ITM_deregisterTMCloneTable__gmon_start___ITM_registerTMCloneTablelibpthread.so.0libdl.so .2libutil.so.1libm.so。6_PyThreadState_UncheckedGetPyFrame_NewPyEval_EvalFrameExPyObject_GetAttrPyObject_CallPyThreadState_Get_Py_CheckRecursionLimit_Py_CheckRecursiveCallPyErr_OccurredPyExc_SystemErrorPyErr_SetStringPyObject_GetAttrString_Py_NoneStructPyDict_SetItemStringPyExc_AttributeErrorPyErr_ExceptionMatchesPyErr_ClearPyExc_ImportErrorPyModule_NewObjectPyModule_GetDictPyDict_GetItemWithErrorPyTuple_PackPyExc_KeyErrorPyErr_SetObjectPyExc_NameErrorPyErr_Format_PyDict_GetItem_KnownHashPyList_NewPyDict_NewPyImport_ImportModuleLevelObjectPyExc_RuntimeErrorPyOS_snprintfPy_GetVersionPyErr_WarnExPyFrame_TypePyTuple_NewPyBytes_FromStringAndSizePyUnicode_FromStringAndSizePyImport_AddModulePyObject_SetAttrStringPyUnicode_InternFromStringPyUnicode_DecodePyObject_HashPyObject_SetAttrPyImport_GetModuleDictPyDict_GetItemStringPyDict_SetItem_PyObject_GetDictPtrPyObject_Not_Py_FalseStruct_Py_TrueStructPyUnicode_FromStringPyFunction_TypePyEval_EvalCodeExPyCFunction_TypePyDict_TypePyObject_GetItemPyNumber_AddPyUnicode_FromFormatPyCode_NewPyMem_MallocPyMem_ReallocPyTraceBack_HerePyModuleDef_InitPyModule_TypePyType_IsSubtypePyModule_ExecDefPyErr_PrintPy_FinalizeExPyMem_RawFreePy_InitializePy_SetProgramNamePySys_SetArgvlibc.so.6setlocalembrtowcmbstowcs__stack_chk_failstrdupstrlenmallocstderrfwrite__libc_start_mainfree_edata__bss_start_end__pyx_module_is_main_helloPyInit_hello_IO_stdin_used__data_start__libc_csu_init__libc_csu_finiquiBC_2。{`_`BC_2h_`5?二{`_`BC_2h_`5?ii{`_`BC_2h_`5?ii6setlocalembrtowcmbstowcs__stack_chk_failstrdupstrlenmallocstderrfwrite__libc_start_mainfree_edata__bss_start_end__pyx_module_is_main_helloPyInit_hello_IO_stdin_used__data_start__libc_csu_init__libc_csu_finiquiBC_2.{`_`BC_2h_`5?ii6setlocalembrtowcmbstowcs__stack_chk_failstrdupstrlenmallocstderrfwrite__libc_start_mainfree_edata__bss_start_end__pyx_module_is_main_helloPyInit_hello_IO_stdin_used__data_start__libc_csu_init__libc_csu_finiquiBC_2.{`_`BC_2h_`5?ii p_` x_`?_`?_`?_`!?_`#?_`)?_`8?_`;?_`@?_`A?_`G?_`J?_`K?_ `N?_`P?_`R?_`S“`(“0“8“@“H“P`X“ h“p“x“?“?“?“?“?“?“?“?“ “?“$?“%a`a`a`(a`* a`+(a`,0a`-8a`.@a`/Ha`0Pa`1Xa`2`a`3ha`4pa `5xa`6?a`7?a`9?a`:?a`<?a`=?a`>?a`??a`B?a`C?a`D?a`E?a `F?a`H?a`I?a`L?a`Mb`b`Qb`Tb`U b`V(b`W??H?H?AC H??t??H??? 5BC ??%CC ??h?????????h?????????h?????????h?????????h??? ?????h????????h??????????h??q?????????a??????h??Q?????? ??h ??A??????h ?? 1 ??????h ??????????h??????????h?????????h?????????h?????????h?? ???????h??????????h??????????h?????????h??????????h??q??? ???h??a??????h??Q??????h??A??????h? 1 ??????h??!??????h?????????h?????????h?????????h?????? ?????h!?????????h”?????????h#??????????h$?????????h%?????????h&????????h ??q??????h(??a??????h)??Q??????h*??A??????h+??1??? ???h,??!??????h-????????h.??????????h/?????????h0???? ?????h1?????????h2?????????h3??????????h4??????????h5?????? ??h6????????h7??q????? D????%? D????%?> D????%?> D????%? > D????%?> D????%?> D????%?> D????%?> D????%?> D????%?> D ????%?> D????%?> D????%?> D????%?> D????%?> D????%?>> D? ???%> D????%?= D????%?= D????%?= D????%?= D????%?= D???? %?= D????%?= D????%?= D????%?= D????%?= D????%?= D????%? = D????%?= D????%?= D????%?== D????%= D????%?< DA????A??A ??xIc?H??D9|D1?1?A?D9?}%D??)șA???Hc?H??D9}?H??A????Hc?H??D9} ???AVI??AUI??ATI??USH??????H??1?L??H??H???????H??H??tGH?D 1?H ?L9?}I?T?H?H??H????1?H???????EH? 我??你 []A\A]A^????H??H??I???O???L?%? 9 ?H ???HA;AVAUATUSH?L???M??u $3H??H??L??A??H???&????p?V??PA?$?H?=???? @?H?=?%?{?????t? 1 ?? 59 ?} ??????@$H??u#?|???H??H??u?H??8 H?5?%H?8????H??[] A\A]A^?AVE??AUI??ATI??H??US?y???H??t5H;]8 H??1?A??tH??L??L??? ?????H? u)H?H???P0?H? 08 ???? 8 ?]?????t?????1?[??]A\A]A^???AUI??ATUSQ?$???H?PH??@ H??u H? ?@ ? “H9?tH?8 H?%1?H?8?????H?-?BH??t H?E??H?5?%L??????I??H? ???H???A???我? $H??u w%L??L??H?s%?I?????xH???H? I?DL???P0H????H??????I??H????A?H? 你 H?H???P0ZH??[]A\A]?USH??Q?-???H??H??ub?`???H??u[H?H????? t7?1??o???H??H??t7H??H?E6 H?8?e???H?最后的想法
本文试图找到解决问题的方法。Cython 似乎是一个值得考虑的有前途的选择。确实,任何用户都可以访问可用于对应用程序进行逆向工程的二进制文件,但这需要大量的时间和工作。