# extractTxt **Repository Path**: tauh8/extractTxt ## Basic Information - **Project Name**: extractTxt - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-04-05 - **Last Updated**: 2025-04-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 中文字符语义单元提取工具 这是一个基于Web的工具,用于从文本中提取包含指定汉字的语义单元,包括两字名字和两字组合。 ## 功能特点 - 提取包含指定字符的语义单元 - 提取以指定字符开头的两字组合(如姓名) - 提取以指定字符结尾的两字组合 - 支持文件上传和文本直接输入 - 支持使用jieba分词进行更准确的提取 - 结果可视化展示及下载 ## 安装说明 1. 克隆本仓库或下载代码 2. 安装依赖: ```bash pip install -r requirements.txt ``` ## 使用方法 1. 运行Flask应用: ```bash python app.py ``` 2. 在浏览器中访问 `http://localhost:5000` 3. 在网页界面上: - 输入要搜索的字符(单个汉字) - 选择上传文件或直接输入文本 - 选择是否使用jieba分词(更准确但可能更慢) - 点击"开始提取"按钮 - 查看并下载结果 ## 系统要求 - Python 3.6+ - 现代浏览器(Chrome, Firefox, Edge等) - 建议使用UTF-8编码的文本文件 ## 技术栈 - 后端:Flask - 前端:HTML, CSS, JavaScript, Bootstrap 5 - 分词:jieba (可选)