# MapReduce_ItemCF

**Repository Path**: AuspicL/MapReduce_ItemCF

## Basic Information

- **Project Name**: MapReduce_ItemCF
- **Description**: 基于MapReduce实现物品协同过滤算法（ItemCF）
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2021-11-09
- **Last Updated**: 2021-11-09

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 基于MapReduce实现物品协同过滤算法（ItemCF）

## 具体参考[博客](https://blog.csdn.net/u011254180/article/details/80353543)


#### 补充：hadoop三种执行方式

MR执行环境有两种：本地测试环境，服务器环境
	
本地测试环境(windows)：
	在windows的hadoop目录bin目录有一个winutils.exe
  
	1、在windows下配置hadoop的环境变量
	2、拷贝debug工具(winutils.ext)到HADOOP_HOME/bin
	3、修改hadoop的源码 ，注意：确保项目的lib需要真实安装的jdk的lib
	4、MR调用的代码需要改变：
		a、src不能有服务器的hadoop配置文件
		b、在调用是使用：
		  Configuration config = new  Configuration();
		  config.set("fs.defaultFS", "hdfs://node7:8020");
		  config.set("yarn.resourcemanager.hostname", "node7");

服务器环境：
首先需要在src下放置服务器上的hadoop配置文件

1、在本地直接调用，执行过程在服务器上（真正企业运行环境）

	a、把MR程序打包（jar），直接放到本地
	b、修改hadoop的源码 ，注意：确保项目的lib需要真实安装的jdk的lib
	c、增加一个属性：config.set("mapred.jar", "C:\\Users\\Administrator\\Desktop\\wc.jar");
	d、本地执行main方法，servlet调用MR。
	
	
2、直接在服务器上，使用命令的方式调用，执行过程也在服务器上

	a、把MR程序打包（jar），传送到服务器上
	b、通过： hadoop jar jar路径  类的全限定名
	       如：hadoop jar wc.jar com.zxl.mr.wc.RunJob
注：一些jar包可以通过 java jar xxx.jar 运行,使用hadoop则默认会把hadoop所依赖包添加