# InfoCollector **Repository Path**: yijingsec/InfoCollector ## Basic Information - **Project Name**: InfoCollector - **Description**: 一款整合网站信息提取与指纹识别的浏览器扩展插件 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-01-21 - **Last Updated**: 2026-01-21 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # InfoCollector InfoCollector 信息收集器 - 一款整合信息提取与指纹识别的浏览器扩展插件 ## 简介 InfoCollector 是一款基于 Chrome Extension Manifest V3 开发的浏览器扩展,专为安全测试人员和渗透测试工程师设计。它能够从网页中自动提取敏感信息,并通过指纹识别技术探测网站使用的技术栈。 **版本**: 1.0.0 **许可证**: GNU GPL v3 **兼容**: Chrome、Edge 及其他基于 Chromium 的浏览器 - 弹出菜单 ![image-1.png](img/image-1.png) - 全局悬浮窗 ![image-2.png](img/image-2.png) ![image-3.png](img/image-3.png) ![image-4.png](img/image-4.png) ## 主要功能 ### 🔍 信息提取 自动从当前网页提取各类敏感信息: #### 基础信息 - **IP 地址**: 提取所有 IPv4 地址 - **IP:PORT**: 提取带端口的 IP 地址 - **域名**: 识别所有域名和子域名 - **URL 地址**: 提取完整的 URL 链接 #### 路径信息 - **完整路径**: 提取标准化的 URL 路径 - **不完整路径**: 识别可能被遗漏的路径片段 - **静态资源**: 提取 CSS、JS、图片等静态资源路径 #### 敏感信息 - **手机号**: 识别中国大陆手机号码 - **身份证**: 匹配中国身份证号码 - **邮箱地址**: 提取所有邮箱地址 - **JWT Token**: 识别 JSON Web Token - **加密算法**: 检测使用的加密算法标识 - **密码密钥**: 提取可能的 API 密钥和密码 ### 🔎 指纹识别 基于多种技术识别网站技术栈: - **关键词匹配**: 分析页面标题和内容中的 CMS 特征 - **Favicon 哈希**: 使用 MurmurHash3 算法计算网站图标哈希值进行匹配 - **HTTP 头分析**: 检查响应头中的服务器特征 - **自定义指纹**: 支持用户添加自定义指纹规则 - **指纹导出**: 导出指纹库为 JSON 格式便于分享 ### 📊 数据展示 #### 弹出菜单 - **四个标签页**: 基础信息、敏感信息、路径信息、指纹识别 - **来源追踪**: 显示每条信息的来源 URL - **一键复制**: 快速复制各类信息 - **批量操作**: 支持批量复制所有路径 - **统计显示**: 实时显示各类信息数量 - **卡片折叠**: 支持折叠/展开数据卡片 #### 全局悬浮窗 - **实时更新**: 页面内实时显示收集的信息 - **可拖动**: 支持拖动调整位置 - **可折叠**: 展开查看详情或折叠为摘要视图 - **四个标签**: 与弹出菜单一致的数据分类 - **来源分组**: 按来源 URL 自动分组显示 ### ⚙️ 设置管理 #### 扫描设置 - **安全模式**: 仅扫描 JavaScript 文件,减少误报 - **全局悬浮窗**: 启用页面内悬浮窗 - **显示来源**: 在提取结果中显示来源 URL - **启用指纹识别**: 自动识别网站技术栈 #### 白名单管理 - 添加不需要扫描的域名 - 支持通配符匹配 - 一键移除白名单项 #### Webhook 通知 - 配置 Webhook URL 接收扫描结果 - 支持多种触发事件(扫描完成、发现敏感信息、发现指纹) - 兼容企业微信、钉钉、飞书、Slack 等平台 - 内置测试功能验证配置 #### 指纹管理 - 添加自定义指纹规则 - 编辑现有指纹 - 导出指纹库为 JSON - 支持多种匹配方式(关键词、Favicon 哈希) - 支持多种匹配位置(页面内容、页面标题、HTTP 头) ## 安装方法 ### 开发模式安装 1. 克隆或下载此项目 ```bash git clone cd InfoCollector ``` 2. 打开 Chrome/Edge 浏览器,访问 `chrome://extensions/` 3. 启用右上角的「开发者模式」 4. 点击「加载已解压的扩展程序」 5. 选择 `InfoCollector` 项目根目录 6. 扩展安装完成,浏览器工具栏会出现 InfoCollector 图标 ## 使用方法 ### 基本使用 1. **访问目标网页** - 打开需要测试的网站 2. **打开扩展** - 点击浏览器工具栏中的 InfoCollector 图标 3. **查看结果** - 在弹出菜单中查看提取的信息和指纹识别结果 ### 全局悬浮窗 1. 在设置中启用「全局悬浮窗」 2. 刷新页面,悬浮窗会自动出现在页面右上角 3. 悬浮窗功能: - **拖动**: 点击标题栏拖动到任意位置 - **展开/折叠**: 点击 + 按钮查看详情或 × 按钮隐藏 - **复制数据**: 点击任意数据项快速复制 - **打开来源**: 点击 🔗 按钮在新标签页打开来源 URL ### 数据复制 #### 单项复制 - 点击任意数据项即可复制到剪贴板 #### 批量复制 - **复制所有路径**: 将所有路径信息复制到剪贴板 - **复制域名+路径**: 自动拼接完整 URL 后复制 ### 卡片折叠 - 点击卡片标题区域可折叠/展开内容 - 默认折叠状态,节省空间 - 三角图标指示当前状态 ## 项目结构 ``` InfoCollector/ ├── manifest.json # 扩展配置文件 ├── LICENSE # GNU GPL v3 许可证 ├── README.md # 项目说明文档 │ ├── src/ # 源代码目录 │ ├── js/ # JavaScript 文件 │ │ ├── background.js # Service Worker(后台服务) │ │ ├── content.js # Content Script(内容脚本) │ │ ├── popup.js # 弹出窗口逻辑 │ │ ├── settings.js # 设置页面逻辑 │ │ ├── fingerprint-manager.js # 指纹管理模块 │ │ │ │ │ ├── modules/ # 功能模块 │ │ │ ├── info-extractor.js # 信息提取模块 │ │ │ ├── fingerprint-matcher.js # 指纹匹配模块 │ │ │ └── murmurhash3.js # MurmurHash3 算法 │ │ │ │ │ └── components/ # UI 组件 │ │ ├── tab-manager.js # 标签页管理 │ │ ├── resizable.js # 可调整大小组件 │ │ └── glass-ui.js # 毛玻璃 UI 组件 │ │ │ ├── html/ # HTML 页面 │ │ ├── popup.html # 弹出窗口页面 │ │ └── settings.html # 设置页面 │ │ │ ├── css/ # 样式文件 │ │ ├── glass-ui.css # 毛玻璃风格样式 │ │ └── animations.css # 动画效果 │ │ │ └── assets/ # 资源文件 │ ├── icons/ # 扩展图标 │ │ ├── icon16.png │ │ ├── icon48.png │ │ └── icon128.png │ └── finger.json # 指纹特征库 │ └── _locales/ # 国际化文件 ├── zh_CN/messages.json # 简体中文 ├── en/messages.json # 英文 └── ar/messages.json # 阿拉伯文 ``` ## 技术架构 ### 核心技术栈 - **Chrome Extension Manifest V3**: 最新的扩展开发规范 - **Vanilla JavaScript**: 纯 JavaScript 实现,无框架依赖 - **Chrome Storage API**: 本地数据持久化 - **Chrome Tabs API**: 标签页操作 - **Chrome Runtime API**: 消息传递 ### 关键算法 - **MurmurHash3**: 用于 Favicon 哈希计算的非加密哈希算法 - **正则表达式**: 用于信息提取的精确模式匹配 - **事件委托**: 高效的事件处理机制 ### UI 设计 - **Glassmorphism**: 毛玻璃风格设计 - **响应式布局**: 适配不同屏幕尺寸 - **平滑动画**: 60fps 流畅过渡效果 - **深色主题**: 护眼的深色配色方案 ## 快捷功能 ### 数据统计 - 顶部统计栏显示 IP、域名、URL、路径、敏感信息的总数量 - 每个数据卡片标题显示该项的数量 ### 快速操作 - 点击数据项立即复制 - 点击来源 URL 复制链接 - 点击来源按钮在新标签页打开 - 复制按钮可一键复制整类数据 ### 智能分组 - 自动按来源 URL 分组显示 - 区分当前页面和外部来源 - 来源信息一目了然 ## 开发指南 ### 修改代码后重新加载 1. 在 `chrome://extensions/` 页面 2. 找到 InfoCollector 扩展 3. 点击「重新加载」按钮(🔄 图标) 4. 刷新测试网页查看效果 ### 调试方法 #### 1. 调试弹出窗口 - 右键点击扩展图标 - 选择「检查弹出内容」 #### 2. 调试后台服务 - 在 `chrome://extensions/` 页面 - 点击「Service Worker」查看日志 #### 3. 调试内容脚本 - 在网页中按 F12 打开开发者工具 - 在 Console 中查看日志输出 #### 4. 调试设置页面 - 右键点击设置页面 - 选择「检查」 ### 添加自定义指纹 1. 打开扩展设置页面 2. 找到「指纹管理」部分 3. 填写以下信息: - **CMS 名称**: 如 WordPress、Discuz - **匹配方式**: 关键词 或 Favicon哈希 - **匹配位置**: 页面内容、页面标题 或 HTTP头 - **关键词**: 添加一个或多个特征关键词 - **类型**: CMS、框架、中间件等 - **重要标记**: 勾选标记为重要指纹 4. 点击「保存指纹」 ### 导出指纹库 1. 在设置页面的「指纹管理」部分 2. 点击「导出指纹」按钮 3. 指纹库将保存为 `custom_fingerprints.json` 文件 ## 配置 Webhook 通知 支持通过 Webhook 接收扫描结果通知: ### 支持的平台 | 平台 | 特点 | |------|------| | 企业微信 | 需要配置机器人 Webhook 地址 | | 钉钉 | 需要配置群机器人 Webhook | | 飞书 | 支持富文本消息 | | Slack | 支持自定义集成 | ### 配置步骤 1. 在设置页面找到「Webhook 通知」部分 2. 输入 Webhook URL 3. 选择触发事件: - ✅ 扫描完成时发送 - ✅ 发现敏感信息时发送 - ✅ 发现指纹时发送 4. 点击「测试发送」验证配置 5. 点击「保存设置」 ### 消息格式 ``` [InfoCollector] 扫描完成 URL: https://example.com 时间: 2026-01-21T10:30:00.000Z ``` ## 安全说明 ### 适用场景 ✅ **合法使用场景**: - 授权的渗透测试 - 安全研究与学习 - 漏洞挖掘与报告 - 自有系统的安全检测 ❌ **禁止使用场景**: - 未经授权的网站扫描 - 恶意攻击与入侵 - 数据窃取与滥用 - 任何非法用途 ### 隐私保护 - 所有数据仅存储在本地浏览器 - 不会上传任何信息到远程服务器 - 用户完全控制收集的数据 - 支持随时清除扩展数据 ## 常见问题 ### Q: 为什么某些网站无法提取信息? A: 可能的原因: 1. 网站使用了 Content Security Policy (CSP) 限制了扩展运行 2. 网站是单页应用 (SPA),内容动态加载 3. 网站在扩展白名单中,已被跳过 ### Q: 如何提高信息提取准确性? A: 可以: 1. 启用「安全模式」仅扫描 JS 文件 2. 使用白名单排除不相关的网站 3. 添加自定义指纹提高识别率 ### Q: 悬浮窗挡住了页面内容怎么办? A: 可以: 1. 点击悬浮窗标题栏拖动到其他位置 2. 点击 × 按钮隐藏悬浮窗 3. 在设置中关闭「全局悬浮窗」功能 ### Q: 数据可以批量导出吗? A: 可以通过以下方式: 1. 使用「复制」按钮复制单类数据 2. 使用「复制所有路径」批量复制路径 3. 开启 Webhook 将结果发送到外部系统 ### Q: 指纹库如何更新? A: 指纹库位于 `src/assets/finger.json`,可以: 1. 手动编辑文件添加指纹 2. 通过设置页面添加自定义指纹 3. 导出指纹库备份或分享 ## 更新日志 ### v1.0.0 (2026-01-21) - ✨ 初始版本发布 - 🔍 信息提取功能(IP、域名、URL、敏感信息) - 🔎 指纹识别功能(关键词、Favicon 哈希) - 📊 全局悬浮窗实时显示 - ⚙️ 完整的设置管理 - 🔔 Webhook 通知支持 - 🌍 多语言支持(中文、英文、阿拉伯文) - 🎨 现代化毛玻璃风格 UI ## 参考 - [FindSomething](https://github.com/momosecurity/FindSomething) - [Finger24](https://github.com/24-2021/Finger24) ## 许可证 本项目采用 GNU GPL v3 许可证开源。 ``` InfoCollector Copyright (C) 2026 This program is free software: you can redistribute it and/or modify it under the terms of the GNU General Public License as published by the Free Software Foundation, either version 3 of the License, or (at your option) any later version. This program is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License for more details. ``` **免责声明**: 本工具仅供学习和授权的安全测试使用,使用本工具进行任何非法活动由用户自行承担法律责任。