大数据架构商业之路:从业务需求到技术方案
为什么要写这本书? 李克强总理提出“大众创业,万众创新”。在如此美好的大环境下,互联网创业如火如荼。各种模式的O2O,各种精彩的移动App,突然之间都冒了出来,正所谓“忽如一夜春风来,千树万树梨花开”。而在其中,大数据因为蕴含着巨大的商业价值,成为这个时代的趋势之一。众人都希望利用好这个“魔棒”,为自己的事业开疆扩土。可是,就笔者在业界的经历来看,真正能挖掘大数据潜力的公司少之又少。笔者一直很好奇,中国的相关人才如此之多,商业市场又如此之大,何以至如此境地呢?为了找到答案,笔者阅读了不少观察性文章,也走访了一些业内的从业者,发现目前的一大窘境是:大数据技术、产品和商业的结合度还远远不够。导致这个现状的原因有很多,具体分析主要有以下几点: 涉及范围广:“ 大数据”本身是一个比较抽象的概念,任何关乎大规模数据的处理,都可以称为“大数据”。因此它既包括了很多已有的技术,如数据挖掘、机器学习、商业智能等,又包括了近几年诞生的新技术,如NoSQL相关的生态系统。而且,一个商业需求也可能会涉及多个相关技术。 技术含量高:数据挖掘和机器学习之类的算法和大规模数据处理的架构,相对于普通的应用开发而言,需要更多的理论知识和实践经验积累。而商业价值的挖掘程度却往往取决于使用的技术深度。越是钻研得深入,所产生的价值就会越大。 发展速度快:最近几年,算法方面有不少的创新,如深度学习(Deep Learning);系统架构也在不断升级,如Hadoop的第二代框架Yarn、Storm、Spark等实时流式计算,技术的更新换代非常频繁。但是,商业的发展需要技术系统能够随时应变,快速响应,这与技术的飞速发展本身又存在冲突。 成熟方案少:大数据的技术多数是免费的,这对于盈利模式而言无疑是有利的,不过代价就是存在一定的稳定性和易用性问题。现在有一些大型的技术公司提供了更成熟的解决方案,但是价格不菲,对于经费并不宽裕的初创公司而言选择余地太少。 以上这些因素都会形成进入大数据领域的门槛,而高门槛势必会导致大数据在工业界应用的步伐放缓。为了解决这个问题,企业需要培养自己的复合型人才,要求业务人员懂技术、技术人员懂业务。只有如此才能让公司使用合适的工具、获得准确的数据、制定合理的方案。 然而,激烈的市场竞争,膨胀的用户需求,不会给创业公司太多的时间去挥霍。在黑夜之中不断摸索的人们,需要明灯指引前进的方向。虽然目前市面上已有一些相关图书做了不错的尝试,但是它们大多数偏向两个极端:一端是面向金融、经济、社会和管理类等非技术型读者,讲述概念、定义、背景和业界的成功案例等;另一端是面向程序员、算法工程师、架构师和数据科学家等纯技术型读者,讲述具体的技术框架、编程范例、系统调试等。能同时覆盖两者的图书可谓凤毛麟角。因此,笔者萌生了通过一本书来帮助企业快速地建立复合型团队,将合理的业务需求尽快转化为实际产品的想法。笔者在写作过程中,力求: 易读易懂。通过生动的案例和形象的比喻来解读难点,降低技术理解的门槛。这样就能够让偏向业务的人员更容易理解大数据背后的运作原理,促进他们和技术人员的沟通及协作。 可实践性强。通过分享需要大量实践才能积累的宝贵经验,最大程度地针对业务需求和技术方案之间的空白进行弥补。这将有利于技术人员针对不同的业务需求,规划更为合理的技术方案。 本书通过讲述一个虚拟的(如有雷同纯属巧合)互联网O2O创业故事,逐步展开介绍各个阶段可能遇到的大数据课题、业务需求,以及相对应的技术方案,甚至是实践解析。让读者身临其境,一起来探寻大数据的奥秘。对于想进一步深入研究技术实现细节的读者,也给出了继续阅读的方向和指导性建议。笔者衷心希望,无论是技术专家、产品经理,还是业务人员,只要阅读了本书便都能愉快地遨游在大数据的海洋中。 大数据”本身是一个比较抽象的概念,任何关乎大规模数据的处理,都可以称为“大数据”。因此它既包括了很多已有的技术,如数据挖掘、机器学习、商业智能等,又包括了近几年诞生的新技术,如NoSQL相关的生态系统。而且,一个商业需求也可能会涉及多个相关技术。 技术含量高:数据挖掘和机器学习之类的算法和大规模数据处理的架构,相对于普通的应用开发而言,需要更多的理论知识和实践经验积累。而商业价值的挖掘程度却往往取决于使用的技术深度。越是钻研得深入,所产生的价值就会越大。 发展速度快:最近几年,算法方面有不少的创新,如深度学习(Deep Learning);系统架构也在不断升级,如Hadoop的第二代框架Yarn、Storm、Spark等实时流式计算,技术的更新换代非常频繁。但是,商业的发展需要技术系统能够随时应变,快速响应,这与技术的飞速发展本身又存在冲突。 成熟方案少:大数据的技术多数是免费的,这对于盈利模式而言无疑是有利的,不过代价就是存在一定的稳定性和易用性问题。现在有一些大型的技术公司提供了更成熟的解决方案,但是价格不菲,对于经费并不宽裕的初创公司而言选择余地太少。 以上这些因素都会形成进入大数据领域的门槛,而高门槛势必会导致大数据在工业界应用的步伐放缓。为了解决这个问题,企业需要培养自己的复合型人才,要求业务人员懂技术、技术人员懂业务。只有如此才能让公司使用合适的工具、获得准确的数据、制定合理的方案。 然而,激烈的市场竞争,膨胀的用户需求,不会给创业公司太多的时间去挥霍。在黑夜之中不断摸索的人们,需要明灯指引前进的方向。虽然目前市面上已有一些相关图书做了不错的尝试,但是它们大多数偏向两个极端:一端是面向金融、经济、社会和管理类等非技术型读者,讲述概念、定义、背景和业界的成功案例等;另一端是面向程序员、算法工程师、架构师和数据科学家等纯技术型读者,讲述具体的技术框架、编程范例、系统调试等。能同时覆盖两者的图书可谓凤毛麟角。因此,笔者萌生了通过一本书来帮助企业快速地建立复合型团队,将合理的业务需求尽快转化为实际产品的想法。笔者在写作过程中,力求: 易读易懂。通过生动的案例和形象的比喻来解读难点,降低技术理解的门槛。这样就能够让偏向业务的人员更容易理解大数据背后的运作原理,促进他们和技术人员的沟通及协作。 可实践性强。通过分享需要大量实践才能积累的宝贵经验,最大程度地针对业务需求和技术方案之间的空白进行弥补。这将有利于技术人员针对不同的业务需求,规划更为合理的技术方案。 本书通过讲述一个虚拟的(如有雷同纯属巧合)互联网O2O创业故事,逐步展开介绍各个阶段可能遇到的大数据课题、业务需求,以及相对应的技术方案,甚至是实践解析。让读者身临其境,一起来探寻大数据的奥秘。对于想进一步深入研究技术实现细节的读者,也给出了继续阅读的方向和指导性建议。笔者衷心希望,无论是技术专家、产品经理,还是业务人员,只要阅读了本书便都能愉快地遨游在大数据的海洋中。
用户评论