# news **Repository Path**: core00077/news ## Basic Information - **Project Name**: news - **Description**: No description available - **Primary Language**: Java - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2019-03-26 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 互联网新闻分类 使用lda模型结合tfidf清洗数据,使用中国新闻网爬取的数据进行训练。 此后台为该思路的应用。同时web页面与apk也已发布。 单纯记录一下。 啊差点忘了引言 >随着互联网的发展,大量新闻快速涌现,信息严重过载,使用户较难在有限时间得到符合自身需求的信息。采用大数据技术和LDA对新闻进行有效分类是帮助用户快速准确获取信息,改善用户互联网体验的重要方法。 > >本作品依托学校的虚拟平台搭建了大数据平台,实现了新闻的有效分类方法。首先我们从互联网上爬取海量新闻数据,然后将获取到的数据在搭建的云平台上使用LDA算法进行海量文本主题建模,同时解决了在聚类算法不能自动确定主题的问题。随后将新闻分类结果进行可视化展现,最后在已经分类的基础上,向用户推荐其感兴趣的新闻内容,利用安卓app和web应用展现。实践表明本作品可在大数据平台上较好地完成新闻分类与个性化推荐任务。 [news.whutosa.com](http://news.whutosa.com) # 作者 ## 后台 [陈小睿](mailto:i@corechan.cn) ## 安卓端 未获得作者授权,暂时不表 ## 前端 未获得作者授权,暂时不表