# big-data-study **Repository Path**: strifecross/big-data-study ## Basic Information - **Project Name**: big-data-study - **Description**: 大数据学习项目 - **Primary Language**: Java - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-02-06 - **Last Updated**: 2026-02-10 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Big Data Study 这是一个用于学习和实践大数据技术的 Maven 项目。 ## 📂 项目结构 目前主要包含以下子模块: ### `spark-v1` 专注于 **Apache Spark 3.5.1** 的学习与实践(基于 Java 17)。 * **入口类**: `com.strife.sparkstudy.SparkApp` * 统一的程序入口,负责初始化 `SparkSession`。 * 通过命令行参数调度具体的任务示例。 * **示例任务**: * `wordcount`: 词频统计 * `sql`: Spark SQL 基础操作 ## 🛠️ 技术栈 * **构建工具**: Maven * **开发语言**: Java 17 * **核心框架**: * Apache Spark Core 3.5.1 * Apache Spark SQL 3.5.1 ## 🚀 如何运行 项目采用统一入口模式。 1. **构建项目**: ```bash mvn clean package ``` 2. **运行示例**: 可以在 IDE 中直接运行 `SparkApp.main()`,或者使用打包后的 jar: ```bash # 运行 WordCount 示例 java -jar spark-v1/target/spark-v1-0.0.1-SNAPSHOT.jar wordcount # 运行 SQL 示例 java -jar spark-v1/target/spark-v1-0.0.1-SNAPSHOT.jar sql ```