Changed content

# cmitmproxy **Repository Path**: gentheaven/cmitmproxy ## Basic Information - **Project Name**: cmitmproxy - **Description**: 全球唯一，纯c语言实现，windows运行的MITM代理 - **Primary Language**: Unknown - **License**: LGPL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-12-23 - **Last Updated**: 2026-01-10 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # MITM 代理 MITM代理，解密/修改 https 流量 ## 开发环境运行平台： windows 11 专业版（版本 25H2）开发工具：VS2026 社区版开发语言：C 语言 ## 开源代码以下是本项目采用的开源代码： | 开源代码 | 版本 | 备注 | | -------- | ------ | ---------------------------------------------- | | openssl | 3.5.4 | SSL 协议，网站下载编译好的SDK，动态链接库 | | libevent | 2.1.12 | 异步事件库，静态链接库 | | zlib | 1.3.1 | gzip/deflate 算法，HTTP 内容解压缩，静态链接库 | | Brotli | 1.2.0 | Brotli 算法，HTTP 内容解压缩，静态链接库 | | PCRE2 | 10.46 | 正则表达式查找和替换，静态链接库 | ## 特征 1. 支持本机 http/https 代理 2. 支持字符串的正则表达式查找和替换 3. 支持查看和修改 HTTP 响应的内容 4. 支持 HTTP 响应内容的压缩格式： gzip, deflate, br 5. 提供示例程序：修改“雪球”网站内容 6. 基于此代理，开发了微信短视频下载程序 7. 支持查看和修改 HTTP chunked 响应微信短视频下载程序： [WeChatVideo: 下载微信短视频](https://gitee.com/gentheaven/we-chat-video) ## 限制 1. **不支持修改 HTTP 请求**，只可以查看 HTTP 请求 1. 需要**手动安装证书**（第一次运行时） 1. http request，只支持查看第一个消息体或最后一个消息体，而且消息体没有经过压缩有些 HTTP 请求是压缩的，而且分为多个包发送。当前支持的不够完善。 ------ # 软件架构 ## 设计原则代理设计原则： - 代理尽可能简洁 - 代理只负责加密和解密 - 其它逻辑尽量放在应用层应用层：只负责**事务逻辑**，Transaction Logic 中间层：只负责**解析** http，parse http header 代理层：只负责**破解** https 流量，crack https ```mermaid graph LR app[app
应用层
事务逻辑] mid[mid
中间层
解析http头] proxy[proxy
代理层
解密https] app <--> mid mid <--> proxy ``` ## 总体架构整体架构 ```mermaid graph LR subgraph proxy[proxy with libevent] bufferevent openssl[openssl
libssl] end client <-- SSL
密文 --> proxy bufferevent <-- 明文 --> openssl proxy <-- SSL
密文 --> server ``` 代理的内部结构 ```mermaid graph LR proxy TCP subgraph openssl[openssl内部完成加密和解密] libssl libcypto libssl <--> libcypto end subgraph libevent_all[libevent封装了openssl] libevent openssl end proxy <-- 明文 --> libevent[libevent
bufferevents模块] libevent <--> openssl libcypto <-- 密文 --> TCP ``` ## 2层过滤系统默认：代理可以设置为2种工作模式。 1. 直通模式 WORK_MODE_FORWARD：代理不解密，只是转发数据 2. 解密模式 WORK_MODE_MITM：解密 https，这是默认模式如果代理工作在 WORK_MODE_MITM，则开始解密 https。此时，过滤系统生效。 ```mermaid flowchart filter1[filter by
host name] filter2[filter by
http header] subgraph filter_system[filter_system] filter1 decoder filter2 end client --> filter1 filter1 --not pass --> forward filter1 --pass --> decoder decoder --> filter2 filter2 --not pass --> forward filter2 --pass --> app app --> encoder encoder --> server forward --> server ``` 有2次过滤机会： 1. 客户端和服务器刚**开始建立连接**时。此时还**没有破解 https**，只知道服务器的名称，根据服务器名破解。比如应用程序只需要破解包含 “xueqiu”，即只想破解“雪球”网站，则代码如下： ``` enum FILTER_RESULT cb_host_localhost(const char* host_name) { if (strstr(host_name, "xueqiu")) { return FILTER_RESULT_SPLIT; //crack this website } return FILTER_RESULT_PASS; //forward only } register_filter_cb_host(mitm, cb_host_localhost); ``` 2. 第2次过滤：发生在**破解之后**。此时，代理**已经破解了 https**，并且得到了客户端和服务器通讯的 http 头。包含 http request 和 http response 头。这其中的信息，足够让应用程序做出二次过滤，看是不是真的需要这些数据。比如下面的代码：想破解微信短视频，则关注所有 "qq.com" 的流量。但是，"qq.com" 的相关网站很多，所以需要二次过滤。 **register_filter_cb_cared**(mitm, is_cared_info); is_cared_info：代理在得到客户端和服务器通讯的 http 请求和响应头之后，将调用这个函数。如果关注，is_cared_info 返回1；否则返回 0 ```c++ enum FILTER_RESULT cb_host_wechat(const char* host_name, void* arg) { if (strstr(host_name, "qq.com")) { return FILTER_RESULT_SPLIT; } if (strstr(host_name, "httpbin")) { return FILTER_RESULT_SPLIT; } return FILTER_RESULT_PASS; //forward only } register_filter_cb_host(mitm, cb_host_wechat); const char js_type_str[] = "application/javascript"; const char virtual_svg_str[] = "virtual_svg-icons-register.publish"; int is_cared_info(http_info_t* phi, void* arg) { //not find Content-Type in http header if (!phi->http_content_type || !phi->http_uri) return 0; if (_strnicmp(js_type_str, phi->http_content_type, strlen(js_type_str))) { return 0; } //here, Content-Type: application/javascript\r\n ///uri: t/wx_fed/finder/web/web-finder/res/js/virtual_svg-icons-register.publishDJmRcesj.js //start point to virtual_svg-icons-register.publishDJmRcesj.js char* start = get_file_name_from_uri(phi->http_uri); if (!start) return 0; if (_strnicmp(start, virtual_svg_str, strlen(virtual_svg_str))) { return 0; } //virtual_svg-icons-register.publish... return 1; } register_filter_cb_cared(mitm, is_cared_info); ``` 上面的代码，只关注：文件类型：application/javascript URI 路径中包含：virtual_svg-icons-register.publish 其他不关注。 2次过滤后：如果没有通过过滤，则代理直接转发数据，不会调用应用程序的回调函数。通过过滤后，代理才会调用回调函数。 ```c int http_response(void* arg, http_info_t* http_ctx, char** out, size_t* out_len, int* need_free) { if (!http_ctx->http_content_length) return 0; if (!http_ctx->response) { //handle http request http_request(http_ctx); return 0; } //here, http response printf("http_response: %s len is %lld\n", http_ctx->http_uri, http_ctx->http_content_length); char* chg; chg = replace_js(http_ctx->http_content, http_ctx->http_content_length, out_len); *out = chg; printf("replace OK, len is %lld\n\n", *out_len); *cb_free = free; return 1; } register_action_cb_http(mitm, http_response); ``` 以上代码，实现了网页内容修改。 ### 为什么需要2次过滤？因为微信视频服务器和浏览器的数据量很大。默认的，大多数的数据流：**直接转发**，应用无需关心。比如视频流，音频流，图片等。真正关心的是**视频的标题，加密种子，视频链接**，这些信息在特定网页中。应用只关心这些网页。代理给应用传送特定网页内容即可。这些网页的内容，往往是http服务器压缩过的，代理还负责解压。如果网页内容修改了，代理还要负责压缩后再发出。为了节省CPU 和内存资源，所以定义2层过滤系统。 ## TLS握手代理对于客户端：假扮远程服务器，好像客户端和真正的Web服务器通讯；代理对于Web服务器：假扮客户端。一次典型的 TLS 握手过程如下： ```mermaid sequenceDiagram autonumber participant client as 客户端 participant proxy as 代理 participant server as 服务器 client ->>proxy: clientHello proxy ->>server: 转发clientHello server ->>proxy: 回应clientHello
包含证书 proxy ->>client: 生成假证书 client ->>proxy: 完成握手 proxy ->>server: 完成握手 ``` 完成握手后，代理同时管理2条链接： - 和客户端的连接：代理作为服务器，有服务器私钥，可以加密和解密 - 和服务器的连接：代理作为客户端，有客户端私钥，可以加密和解密 # 使用MITM sample 目录下有一个简单的示例。 ## 资源使用MITM 代理，需要3个文件： **头文件**： mitm\mitm.h **动态链接库**：release\cmitmproxy.dll 动态链接库符号表：cmitmproxy.lib 资源文件： **CA证书**：release\res\RootCA.crt **CA私钥**：RootCA.key 安装 RootCA.crt 证书，安装到受信任的根证书颁发机构。 ## 示例代码示例代码的作用：这个代理不仅可以破解https 流量，还可以修改流量。只关注主机名是 xueqiu 的流量；访问其它网站不受影响。当浏览器访问 xueqiu 网站时，无论之前的网页内容如何，统一修改为 html_changed 这个网页。 ```c #include "mitm.h" static char html_changed[] = "\ \n\ \n\ \n\ Changed content\n\ \n\ \n\

hello world.

\n\ \n\ \n\ "; enum FILTER_RESULT cb_host_localhost(const char* host_name, void* arg) { if (strstr(host_name, "xueqiu")) { return FILTER_RESULT_SPLIT; //crack this website } return FILTER_RESULT_PASS; //forward only } int http_response( void* arg, http_info_t* http_ctx, //in char** out, size_t* out_len, FreeFunc* cb_free) { //only care http response if (!http_ctx->response) return 0; //not find Content-Type in http header if (!http_ctx->http_content_type) return 0; //Content-Type: text/html\r\n if (_strnicmp("text/html", http_ctx->http_content_type, strlen("text/html"))) return 0; //printf("%s body len is %lld\n", http_ctx->http_uri, http_ctx->http_content_length); //changed html content *out = html_changed; *out_len = strlen(html_changed); *cb_free = NULL; //no need free return 1; } int cb_cared(http_info_t* http_ctx, void* arg) { if (!http_ctx->http_content_length || !http_ctx->http_host) return 0; if(!strcmp(http_ctx->http_host, "xueqiu.com")){ printf("app will inject website \"%s\", arg is \"%s\"\n", http_ctx->http_host, (char*)arg); return 1; } return 0; } int main(int argc, char** argv) { int ret = -1; mitm_ctx* mitm = mitm_init(DEFAULT_PROXY_ADDR, DEFAULT_PROXY_PORT); if (!mitm) goto fail; //define filter system register_filter_cb_host(mitm, cb_host_localhost); register_filter_cb_cared(mitm, cb_cared); register_action_cb_http(mitm, http_response); char* app_arg = malloc(32); strcpy(app_arg, "hello world"); mitm_run(mitm, app_arg); //main loop free(app_arg); ret = 0; fail: mitm_exit(mitm); return ret; } ``` ## 大框架初始化：mitm_init 注册回调函数：register_filter_cb_host， register_action_cb_http 运行代理：mitm_run，直到用户按下 ctrl + c ，代理才会结束清理内存：mitm_exit ## 回调函数 ```c enum FILTER_RESULT cb_host_localhost(const char* host_name, void* arg) { if (strstr(host_name, "xueqiu")) { return FILTER_RESULT_SPLIT; //crack this website } return FILTER_RESULT_PASS; //forward only } ``` ```c int http_response( void* arg, http_info_t* http_ctx, //in char** out, size_t* out_len, FreeFunc* cb_free) { //only care http response if (!http_ctx->response) return 0; //not find Content-Type in http header if (!http_ctx->http_content_type) return 0; //Content-Type: text/html\r\n if (_strnicmp("text/html", http_ctx->http_content_type, strlen("text/html"))) return 0; //printf("%s body len is %lld\n", http_ctx->http_uri, http_ctx->http_content_length); //changed html content *out = html_changed; *out_len = strlen(html_changed); *cb_free = NULL; //no need free return 1; } ``` ## 默认值如果不注册回调函数，则默认情况下，代理工作在 MITM 模式。即破解所有流量，但是不修改流量。 register_filter_cb_host：注册自己的处理函数，可以只破解关注的流量，其它流量不破解； ```c typedef enum FILTER_RESULT (*cbfilter_by_host)(const char* host_name, void* arg); ``` register_action_cb_http：注册自己的处理函数。只破解关注的流量，并且可能修改流量 ```c typedef void (*FreeFunc)(void*); /* * in: arg: in/out used for app info: http info out: if changed html content, put changes to out[out_len] free_func: proxy will call cb_free(out) after use it if cb_free is NULL, proxy not free e.g. *cb_free = NULL, proxy not free memory; *cb_free = free, proxy will call free(out) return: if changed html content, return 1; otherwise return 0 */ typedef int (*cb_http_response)( void* arg, http_info_t* info, //in char** out, size_t* out_len, FreeFunc* cb_free); //out /* if need change content, should call register_filter_cb_cared(); and cbfilter_by_http_header() return 1 if change specified content. this is called after TLS cracked. when proxy got first http response packet, after proxy parsed http response header, will call this function app tell proxy: app need peek or modify http content return 1, if want to modify it return 0, just peek */ typedef int (*cbfilter_by_http_header)(http_info_t *phi, void* arg); void register_filter_cb_cared(mitm_ctx* ctx, cbfilter_by_http_header cbfunc); ``` 修改网页内容，回调函数返回1；如果没有修改，则返回0 ------ # demo 以下操作都在本机 Win10 系统上操作。 ## 1 - 编译 VS2022 编译。打开 vsproj\cmitmproxy.sln，release/x64，编译结果：动态链接库：cmitmproxy.dll 和 cmitmproxy.lib 打开 sample\sample.sln，编译结果： sample.exe 编译结果都放在 release 目录下。 ## 2 - 测试再次强调：先要安装证书。安装 release\res\RootCA.crt 证书，安装到“**受信任的根证书颁发机构**”。右键点击证书，选择“安装证书”即可。运行 sample.exe 的启动界面如下： ```bash proxy mode: decrypt specified https traffic proxy mode: filter by cared MITM proxy listening at 127.0.0.1:8080 ("stop this proxy by press key: ctrl+c") Starting main loop. Accepting connections. ``` 用浏览器访问 ```url https://xueqiu.com/ ``` 原始的网页内容： ![xueqiu](./resources/xueqiu.jpg) 运行 sample.exe 后，将会修改网页，内容如下： ![changed](./resources/changed.jpg) # 注意 ## 修改网页如果想修改网页，必须同时注册以下 3个函数： ```c register_filter_cb_host(mitm, xxx); // 1次过滤，https 破解之前调用 register_filter_cb_cared(mitm, xxx); // 2次过滤，https 破解之后调用 register_action_cb_http(mitm, xxx); // 处理破解后的内容 ``` 当前只支持修改文本内容：即http 头部的 content type 字段为以下类型： - text/xxx - application/json - application/javascript ```c enum app_right proper_type(char* content_type) { if(!content_type) return APP_RIGHT_PEEK; //text/xxx, application/json, application/javascript if(strstr(content_type, "text/")) return APP_RIGHT_MAY_MODIFY; if(!strncasecmp(content_type, "application/json", strlen("application/json"))) return APP_RIGHT_MAY_MODIFY; if(!strncasecmp(content_type, "application/javascript", strlen("application/javascript"))) return APP_RIGHT_MAY_MODIFY; return APP_RIGHT_PEEK; } ``` 如果想支持更多类型，请修改函数 proper_type ## 正则表达式工具用 regex_match 查找字符串； regex_replace 替换字符串。 ```c typedef int (*regex_on_match)(char* head, size_t item_offset, size_t item_len, void* list); int regex_match(char* regex, char* str, unsigned int str_len, int find_all, regex_on_match on_match, void* list); int regex_replace(char* content, unsigned int content_len, char* regex_match, char* regex_replace, char* chg_content, size_t* chg_len, int reg_extend_flag); ``` 这个功能由代理提供。注意：字符串编码格式必须是纯英文或者 UTF8 的。这个功能为什么在代理中提供？因为 mitmproxy 提供 python 接口，python 可以很容易实现正则表达式查找和替换。这里只是证明本代理也可以做到，而且是 c 语言版本的。例如，以下是 python 代码： ```python modified_js = re.sub( r'async finderGetCommentDetail$(\w+)$\{return(.*?)\}async', # 匹配 r"async finderGetCommentDetail(\1){const feedResult=await\2;var data_object=feedResult.data.object;var media=data_object.objectDesc.media[0];var fetch_body={duration:media.spec[0].durationMs,title:data_object.objectDesc.description,url:media.url+media.urlToken,size:media.fileSize,key:media.decodeKey,id:data_object.id,nonce_id:data_object.objectNonceId,nickname:data_object.nickname,createtime:data_object.createtime,fileFormat:media.spec.map(o => o.fileFormat)};fetch('https://www.httpbin.org/post',{method:'POST',headers:{'Content-Type':'application/json',},body:JSON.stringify(fetch_body)}).then(response=>{console.log(response.ok,response.body)});return feedResult;}async", # 替换 original_js, flags=re.MULTILINE ) ``` 3个输入参数：match 字符串，replace 字符串，原始内容 original_js 1个输出：modified_js 实现同样功能，用 c 代码： ```c char* regex_match_str = "async finderGetCommentDetail\$(\\w+)\$\\{return(.*?)\\}async"; char *regex_replace_str = "async finderGetCommentDetail(\\1){const feedResult=await\\2;var data_object=feedResult.data.object;var media=data_object.objectDesc.media[0];var fetch_body={duration:media.spec[0].durationMs,title:data_object.objectDesc.description,url:media.url+media.urlToken,size:media.fileSize,key:media.decodeKey,id:data_object.id,nonce_id:data_object.objectNonceId,nickname:data_object.nickname,createtime:data_object.createtime,fileFormat:media.spec.map(o => o.fileFormat)};fetch('https://www.httpbin.org/post',{method:'POST',headers:{'Content-Type':'application/json',},body:JSON.stringify(fetch_body)}).then(response=>{console.log(response.ok,response.body)});return feedResult;}async"; int ret = regex_replace(ori, (unsigned int)ori_len, regex_match_str, regex_replace_str, chg_content, chg_len, 1); ``` 3个输入参数： match 字符串，replace 字符串，原始内容 **ori**[ori_len] 1个输出参数：**chg_content**[chg_content] 这个缓存由调用者提供返回值：匹配次数 ### reg_extend_flag reg_extend_flag 的取值 ```c /* * regex replace * reg_extend_flag = 0, not set PCRE2_SUBSTITUTE_EXTENDED * reg_extend_flag = 1, set PCRE2_SUBSTITUTE_EXTENDED * * * out: chg_content[chg_len] * chg_len: in/out, input chg_len = sizeof(chg_content) output chg_len = The actual number of bytes output * return match count return negatvie if error */ int regex_replace(char* content, unsigned int content_len, char* regex_match, char* regex_replace, char* chg_content, size_t* chg_len, int reg_extend_flag); ``` `PCRE2_SUBSTITUTE_EXTEDED` 是 PCRE2（Perl Compatible Regular Expressions version 2）库中的一个选项标志，用于 `pcre2_substitute()` 函数。它**启用扩展的替换字符串语法**。举例说明： ```c char* match = "(test)"; char* replace = "\\U$1\\E"; char* ori = "this is a test string"; char chg_content[32]; size_t chg_len = sizeof(chg_content); regex_replace(ori, strlen(ori), match, replace, chg_content, &chg_len, 1); //chg_content: this is a TEST string regex_replace(ori, strlen(ori), match, replace, chg_content, &chg_len, 0); //chg_content:this is a \Utest\Eing ``` ``` \U - 开始大写转换 \L - 开始小写转换 \u - 下一个字符大写 \l - 下一个字符小写 \E - 结束大小写转换 ``` reg_extend_flag = 1, 打印结果： ``` this is a TEST string ``` reg_extend_flag = 0, 打印结果： ``` this is a \Utest\Eing ``` | **有 reg_extend_flag** | **无 reg_extend_flag** | | :------------------------- | :------------------------ | | `\Utest\E` → `TEST` | `\Utest\E` → 原样输出 | | `${1:+yes:no}` → 条件替换 | `${1:+yes:no}` → 原样输出 | | `${3:-default}` → 带默认值 | `${3}` → 只是普通引用 | ------ # 相关文章 [mitm-1-实现思路 - 知乎](https://zhuanlan.zhihu.com/p/1979186130697082266) [mitm-2-使用 mtim库 - 知乎](https://zhuanlan.zhihu.com/p/1981354362463859347) [mitm-3-mitm实现1-总体架构 - 知乎](https://zhuanlan.zhihu.com/p/1981642421898085460) [mitm-4-mitm实现2-破解https - 知乎](https://zhuanlan.zhihu.com/p/1984344015877997443) [mitm-5-mitm实现3-假证书 - 知乎](https://zhuanlan.zhihu.com/p/1986144605582942558) [mitm-6-mitm实现4-中间层 - 知乎](https://zhuanlan.zhihu.com/p/1986694682420483092) [mitm-7-mitm实现5-修改网页 - 知乎](https://zhuanlan.zhihu.com/p/1986733580605473879) [mitm-8-项目总结 - 知乎](https://zhuanlan.zhihu.com/p/1987420613028118838)