统计指定文件夹下所有Python文件的代码行数,并检测重复的代码片段。它会生成一个Markdown文件,展示每个文件的统计信息,按唯一代码行数降序排列,并高亮重要指标,如代码行数和相似度。 主要功能: - 扫描指定目录下的所有Python文件 - 统计每个文件的代码行数、注释行数、文档字符串行数、空行等 - 检测重复的代码片段并计算相似度(相似度阈值默认92%) - 结果以Markdown格式输出
最近更新: 1年多前“涉诈APP智能识别分析系统”项目。该项目采用了加权投票的集成学习方法,综合运用了六种不同的机器学习与深度学习技术,包括Attention + MLP、多模态深度学习方法、基于二进制代码转换为灰度图像的CNN分类模型、以及BERT模型(分析APP描述及权限等文本信息,利用BERT的语义理解能力进行分类)。
最近更新: 1年多前