知览论文网
  • 网站首页
  • 合作期刊
  • 硕士论文范文
  • 原创论文
  • 写作流程
  • 常见问题
  • 联系我们

写作说明

硕士毕业论文
本科毕业论文
专科毕业论文
毕业论文题目
毕业论文参考文献
毕业论文提纲
毕业论文致谢
法学法律毕业论文
MBA硕士论文
MPA硕士论文
毕业论文开题报告

关于我们

知览论文网是业内有序经营时间最长的综合性论文网站之一,因为专注,所以专业。论文辅导的老师全部是由武大、浙大、华中科大、中科大、西南交大、复旦等高校名牌院校的硕士及博士生,目前已为上千位客户解决了毕业论文的困扰、职称论文发表的难题。自成立以来,客户一直放在我们的首要位置,客户满意是知览论文网的终极目标,在络绎不绝的好评声成就了知览论文的品牌。历经12载,打造了一个及硕士论文范文,毕业论文范文,毕业设计论文,期刊论文为一体的免费论文范文分享官方平台。拥有海量的高质量的原创论文,可以提供经济、管理、法律、医学、会计、体育、历史、教育教学、建筑等专业的毕业论文范文参考及硕士论文写作等服务。服务范围:职称论文发表,论文降重,论文修改,外文翻译等

最新动态

小型国际货运代理X公...
奇信装饰公司电子商务...
蚌埠港港口发展战略之...
长沙高创投公司运行机...
互联网背景下BB报社商...
中小型寿险企业市场营...
快消行业时尚公司供应...
mba在职研究生论文选...
mba论文哪个方向好写_...
MBA研究生论文范文:新...

当前位置:首页 > 毕业论文 > MBA硕士论文
MBA硕士论文

本站提供免费毕业论文范文,硕士论文范文参考!

第二章:大数据概念和相关理论(三),免费论文发表

发布时间:2019年04月15号,星期一 快速评论

2 研究理论基础概述jPt知览论文网

2.1 大数据相关概念。jPt知览论文网

2.1.1 大数据概念。jPt知览论文网

  什么是大数据?大数据(large data)指在一定时间范围内、使用常规软件无法进行捕捉、管理和处理的数据集合,需要全新的处理模式才能拥有更强的决策力、洞察力和流程优化力的海量、高增长率与多样化数据集合。jPt知览论文网

  IBM 提出大数据的 5V 特点,大量(Volume)、高速(Velocity)、多样(Variety)、价值(Value)、真实性(Veracity)[31]。jPt知览论文网

2.1.2 数据建模与数据挖掘和算法。jPt知览论文网

  数据建模是个过程,它通过对数据行业理解、数据的预处理、算法的选取、测试评估、部署应用这几个环节。算法只是其中的一个模块。数据挖掘是从大量数据中挖掘出有用信息,根据用户的特定要求,从海量数据中找出所需信息,以满足用户的特定需求。数据挖掘侧重解决分类、聚类、关联和预测四类数据分析的问题,重点在寻找模式与规律。jPt知览论文网

  数据算法是根据数据的创建、数据的挖掘模型的一组试探算法和计算算法。为创建模型,数据算法要先分析提供的海量数据,并查找特定类型的模式和趋势。数据算法有分类(决策树算法)、 聚类(K-Means 算法)、 关联(PageRank)等算法。jPt知览论文网

2.1.3 数据湖。jPt知览论文网

  数据湖或 hub[32]是承载在基于可向外扩展的 HDFS 廉价存储硬件之上的。但数据量越大,越是需要考虑各种不同种类的存储。企业中的数据都可以被认为是大数据,但所有的企业数据并不都适合存放在廉价的 HDFS 集群之上,尤其是非常重要的营业数据。jPt知览论文网

2.1.4 冷数据、温数据和热数据。jPt知览论文网

  冷数据是较长时间之前的状态数据,未及时更新的数据;温数据是非即时的状态和行为数据,但这些数据是一段时间内更新后的数据;热数据指即时的位置状态、交易和浏览行为,是及时甚至是实时更新的数据。jPt知览论文网

2.2 大数据理论。jPt知览论文网

2.2.1 日志分析理论。jPt知览论文网

  网站日志又叫服务器日志(Web log)[33],是记录 web 服务器接收处理请求以及运行错误时等各种原始信息的文件,以.log 结尾。网站日志记录网站运营的各种信息,比如空间的运营情况,被访问请求的记录。包括用户的 IP、访问时间、操作系统、浏览器、屏幕分辨率的情况及访问的网站和相关页面,是否访问成功等信息。jPt知览论文网

jPt知览论文网

  通过访问次数、停留时间、抓取量可计算平均每次抓取页面数、单页抓取停留、平均每次停留时间。平均每次抓取页面数是总抓取量除以访问次数的结果;单页抓取停留是每次停留除以每次抓取的结果;平均每次停留时间是总停留时间除以访问次数。根据平台页面访问量的结果,优化各页面展示的层级关系;根据产品访问量的多少优化产品显示顺序的权重。jPt知览论文网

2.2.2 推荐理论。jPt知览论文网

  内容推荐(Content-based Recommendation)[34]主要来自于信息的查询和过滤。内容推荐方法主要是基于用户已浏览过的记录向用户推荐他没有浏览过的内容形成推荐项。基于内容的推荐方法有启发式和模型式。启发式方法是用户凭借以往的经验值定义计算公式,再根据计算结果与实际结果的比较进行验证,然后再通过不断修正公式达到最终的目的。基于模型方法是通过对历史数据作为依据,然后根据这个历史数据集来学习出一个模型。协同推荐(Collaborative Filtering Recommendation)[35]也称为协同过滤推荐。jPt知览论文网

  基于协同过滤算法是通过对未评分项进行评分预测来实现。用户的协同过滤算法是基于假设产生,“A、B 两客户的喜好相似度很近,A 客户喜欢的产品 B 客户很有可能也会喜欢。”,所以基于用户的协同过滤的主要任务是找出具有相似度的客户,从而根据最近邻客户的喜好推断出当前客户可能喜好的产品进行推荐。这种推荐算法分为三步,一是给客户进行评分、二是寻找最近邻客户、三是产品推荐。jPt知览论文网

  知识推荐(Knowledge-based Recommendation)[36]方法先通过交互、会话等方式直接了解到用户需求,然后进行产品匹配的过程。需要对“知识”进行形式化的定义和表示。效用知识(Functional Knowledge)是一个产品满足某一类特定客户的知识,它可以解释客户需要和推荐之间的关系,所以客户信息可以是任何支撑推理的知识结构,它可以是客户已经规范化后的查询,也可以是一组描述客户更详细需求的表示。jPt知览论文网

2.2.3 用户画像理论。jPt知览论文网

  用户画像 (User Profile)[37]是真实用户的虚拟代表,它是基于真实的且不是一个具体的人。另外根据目标的行为观点的差异迅速组织区分为不同类型,然后把新得出的类型提炼出来,形成一个类型的用户画像。用户画像作为实际用户的虚拟代表,不能脱离产品和市场之外进行构建,它必须具有代表性,能代表产品的主要受众和目标群体。jPt知览论文网

本章小结。jPt知览论文网

  本章主要介绍与大数据相关的概念和理论知识,为后续章节使用这些概念和理论做好了铺垫,易于读者更好的理解。jPt知览论文网

相关推荐

  • MBA硕士学位论文质量现状及提升对策2018-03-19
  • 基于规范工商管理收费的民营经济发展促进思考2018-05-02
  • 写作MBA商科研究生论文答疑2018-02-08
  • 房地产企业履行社会职责现状分析2018-01-06
  • 工商管理系统性风险及防范措施,代写mba多少钱2019-03-27
  • 如何完善长影世纪城采购流程研究结论与参考文献(完结)2019-04-15
  • 我国工商管理工作现状及提升路径2018-01-18
  • 写作MBA论文:探究企业会计信息化内部控制中存在的问题及对策2017-08-04
  • 5.1:大数据在优化课程产品设置方面的应用(六),免费论文2019-04-15
  • 新时期工商管理的职能探索2018-04-17

文章评论

    共有条评论来说两句吧...

     QQ号:

    验证码:

    选择头像: *

关于我们| 联系我们| 行业动态| 论文参考| 论文案例| 论文服务 | 网站地图

本站提供免费论文范文,论文仅供参考学习,请勿直接复制!如需定制论文请联系客服老师

移动端|电脑端|