首页| 范文论文| 戏剧歌舞| 时尚资讯| 汽车资讯| 健康资讯| 站长资讯| 软件资讯| 新能源| 养生资讯| 体育资讯| 农药资讯| 创业交流| 更多

大数据的特性

【发表时间:2021-09-14 12:33:32 来源:晨蝶网】

(1) [大数据的特性]大数据的定义和特征

麦肯锡(美国首屈一指的咨询公司)是研究大数据的先驱。在其报告《Big?data:?The?nextfrontier?for?innovation,?competition,and?productivity》中给出的大数据定义是:大数据指的是大小超出常规的数据库工具获取、存储、管理和分析能力的数据集。但它同时强调,并不是说一定要超过特定TB?值的数据集才能算是大数据。国际数据公司(IDC)从大数据的四个特征来定义,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value)。亚马逊(全球最大的电子商务公司)的大数据科学家John?Rauser?给出了一个简单的定义:大数据是任何超过了一台计算机处理能力的数据量。维基百科中只有短短的一句话:“巨量资料(big?data),或称大数据,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯”大数据是一个宽泛的概念,见仁见智。上面几个定义,无一例外地都突出了“大”字。诚然“大”是大数据的一个重要特征,但远远不是全部。笔者在调研多个行业后,给出了自己的定义:大数据是“在多样的或者大量数据中,迅速获取信息的能力”。前面几个定义都是从大数据本身出发,我们的定义更关心大数据的功用。它能帮助大家干什么?在这个定义中,重心是“能力”。大数据的核心能力,是发现规律和预测未来。发现规律,预测未来任何行为,皆有前兆。但在现实世界中,缺少实时记录的工具,许多行为看起来是“人似秋鸿有来信,事如春梦了无痕”。在互联网世界则完全不同,是“处处行迹处处痕”。要买商品,必先浏览、对比、询价;要搞活动,必先征集、讨论、策划。互联网的“请求”加“响应”机制恰恰在服务器上保留了人们大量的前兆性的行为数据,把这些数据搜集起来,进一步分析挖掘,就可以发现隐藏在大量细节背后的规律,依据规律,预测未来。收集分析海量的各种类型的数据,并快速获取影响未来的信息的能力,就是大数据技术的力所在。1993?年,《纽约客》刊登了一副漫画,标题是“互联网上,没有人知道你是一条狗”,如图1-10?所示。据说作者彼得·施泰纳因为此漫画的重印而赚取了超过5?万美元。彼时关注互联网社会学的一些专家,甚至担忧“计算机异性扮装”而引发的社会问题。譬如,同性恋和恋童癖可能会借助互联网而大行其道。查看原图20?年后,互联网发生了巨大的变化,移动互联、社交网络、电子商务大大拓展了互联网的疆界和应用领域。人们在享受便利的同时,也无偿贡献了自己的“行踪”。现在互联网不但知道对面是一条狗,还知道这条狗喜欢什么食物、几点出去遛弯、几点回窝睡觉。人们不得不接受这个现实,每个人在互联网进入到大数据时代都将是透明性存在的。事实上,对于未来的不确定性是人类产生恐惧的根源之一,也是各类组织最为头痛的问题。大数据技术让人们看到解决未来预测问题的一丝曙光。通过利用大数据技术,可以预测预测自然、天气的变化,预测个体未来的行为,甚至预测某些社会事件的发生。它会让我们的生活更为从容,让决策不再盲目,让社会更加高效的运转。这就是大数据技术带给我们的好处。全球复杂网络权威巴拉巴西认为,人类行为93%是可以预测的。我的确不知道这位老先生是怎么计算出来93%这个数字的,但大数据可以预测未来是显而易见的,这是首个使人类具备了预测短期未来的技术。听起来似乎很玄妙,大数据不就是算命先生么?其实,或多或少,人们都具备预测的能力。譬如,儿子跟小伙伴们疯玩,我知道他肯定在7?点之前会回家,因为他饿了。再如,家乡流传的很多,其中一句“八月十五云遮月,正月十五雪打灯”,说明大自然就有许多规律性的东西。估计现在的科学也没有办法解释几乎半年跨度内气象间的因果关系,但是几千年的观察和积累,却发现了它。自然、社会、商业无不服从某些规律,大国兴衰、王朝更替亦有规律可循。只是过去囿于技术条件人们无法记录下造成某件事情发生的先兆数据,无法去计算其中的因果关系。这些规律要么被神秘化,要么被庸俗化。任何事情的发生,都会有蛛丝马迹的前兆表露出来。如果我们不去关注一支股票的行情走势,就不会去买卖这支股票;如果我们从不去询问某件商品的价格,也很难产生购买行为;如果事先没有联络沟通,人们就很难聚在一起;如果没有闷热的天气,似乎就没有透心凉的大雨。关于地震前种种异象,更是被许多书籍、文章大肆渲染。假定有一种技术可以记录下所有这些先兆,人们就获得了未卜先知的能力。利用大数据技术,能够广泛采集各种各样的数据类型,进行统计分析,从而预测未来。大数据影响之深远,波及之广泛,远非一般的信息技术可比。?“过去我认为我的工作就是追捕罪犯,而现在对这项工作有了全新的认识,我们分析犯罪数据,识别犯罪模式,并部署警力,帮助美国部分城市重大犯罪率降低了30%。终结犯罪,在案发之前。”这是IBM?公司的一则广告,宣传利用大数据构建智慧的地球。“2008?年初,阿里巴巴平台上整个买家询盘数急剧下滑,欧美对中国采购在下滑。海关是卖了货出去以后再获得数据,而我们提前半年时间从询盘上就推断出世界贸易发生变化了。”通常而言,买家在采购商品前,会比较多家供应商的产品,反映到阿里巴巴网站统计数据中,就是查询点击的数量和购买点击的数量会维持一个相对的比例。统计历史上所有买家、卖家的询价和成交数据,可以形成询盘指数和成交指数,这两个指数是强相关的。询盘指数是前兆性的,前期询盘指数活跃,就会保证后期一定的成交量。所以,当马云观察到询盘指数异乎寻常的下降后,自然就可以推测未来成交量的萎缩。这种统计和分析,如果缺少大数据技术的支持,是难以完成的。这次事件,马云提前呼吁、帮助成千上万的中小制造商准备过冬粮,从而赢得了崇高的声誉。中国建设银行 的电子商务金融平台——“善融商务于2012?年6?月28?日正式开业。官方的宣传是“善融商务”是建设银行顺应电子商务发展潮流,结合传统金融服务优势和新兴电子商务服务应用而搭建的全流程、综合性的电子商务服务平台。”据说建行内部推进电子商务的力度非常大,分行考核严厉,甚至亏本也要把小商家搬到网上。银行建立电子商务交易平台,听起来像不务正业,其实是醉翁之意不在酒。银行需要那些小商家的经营数据,来预测商家的贷款需求和还款能力,从而大幅降低小额借贷风险。建行此举,不论成功与否,都足以证明建行高层深刻地理解了大数据的重要性和其惊人的预测能力。这种能力,对建行而言,就意味着低风险,高收益,是每家金融机构都梦寐以求的境界。常常说富贵险中求,传统经营一般是高风险,高收益;不料有了大数据在手,就能低风险,高收益,难怪金融机构趋之若鹜。如果金融机构再不重视大数据的潜在价值,行将成为21?世纪的恐龙,不复往日的荣光。?

(2) [大数据的特性]大数据时代面临的挑战及对策

共计4477字 | 阅读时间5分钟 ? 文∕李 港? 于海旭 ? ? 随着移动网络、云计算、物联网等新兴技术迅猛发展,全球数据呈爆炸式增长,标志着我们迎来又一伟大时代——大数据时代,它的到来在不知不觉中改变着人们的生活方式和思维方式,而它对企业产生的影响也更为深远。过去技术水平和财力是衡量一家企业竞争力的主要标准,而现在企业对“大数据”的应用程度也成为提升企业的竞争力的主要手段。 ? 大数据的概念与特征 (一)大数据的概念  ? IDC(互联网数据中心)研究表明,有40%的组织认为大数据就是指大量的数据。其实大数据不仅是数据海洋,它还代指了实时的数据和流数据及其他数据,它和人们的生活息息相关。比如,我们每天逛淘宝、京东、易购,通过对海量产品信息的抓取与对比,将价格排序,这就是大数据的应用。大数据就在我们身边,我们每天都在使用和大数据相关的工具。在商业方面它的应用更为广泛,比如,京东、淘宝商城会根据用户登录浏览、关注和交易所产生的数据信息来分析用户喜好、购买力等详细信息,以此推送那些符合用户心意的商品信息。这就是大数据的应用。 ? 麦肯锡咨询公司公布了一份详细分析大数据领域的关键技术和应用的报告,并在报告中对“大数据时代”作了定义:“数据已近渗透到当今每一个行业和业务职能领域,成为重要的生产因素。”维基百科对大数据的定义是:“无法在一定时间里用常规的软件工具对内容进行抓取、管理和处理的数据集合”。简单说,“大数据”就是超越了传统IT技术和数据库软件处理能力的海量数据。 ? ? ?(二)大数据的特征 虽然大数据的概念至今还未统一,但其四大特征均已基本认同。大数据的四大特征也称为4V特性。 1.规模性(Volume) 这是指搜集和分析的数据量不断扩大,大量的数据由不同的源头持续产生,最后汇聚在一起形成海量的数据。如今,数据的量级越来越高,已从GB、TB、PB发展至EB,甚至是ZB。 2.多样性(Variety) 这是指大数据来源于多种数据源。数据的结构、类型多,数据不仅有结构化数据,还有半结构化数据和非结构化数据;数据的类型也不仅包括网页、文本、图片,也包含视频、点击流和地理位置等。 3.高速性(Velocity) 这是指数据的流动性非常快,该特性可能导致数据的价值急速降低甚至消失,所以数据具有特别强的时效性。数据的生成也十分快速,维克托在《大数据时代》中提到,数据增长速度是时间经济增长速度的5倍。 4.价值性(Value) 这是指大数据中含有大量可挖掘的价值。虽然大数据蕴含的价值大,但其价值密度低,也就是说,大数据蕴含着巨大价值,但并非所有数据都是有用的,只有一部分数据具有核心的价值。 ? 大数据时代面临的挑战 ? 在大数据时代,企业管理人员需要充分挖掘大数据中所蕴含的价值,将其转化成企业管理的有效资源,由此制定更准确的决策,为企业发展带来持续不断的竞争力。但是大数据作为一项新技术,与其相关的诸多方面还不够成熟。现阶段,人们都隐约的知道大数据价值性很高,但具体到如何充分挖掘出大数据中所蕴含的价值、如何高效利用这些价值、如何保证信息安全,尚未有明确的做法,企业也由此陷入困境。 ? ?(一)企业在数据处理方面的问题 ? 现阶段,多数企业仅能够处理结构化数据,而结构化数据在数据总量中只占数据总量的15%,企业对85%以上的半结构化数据和非结构化数据的处理技术尚且不够成熟,提高数据处理分析技术对企业来说是一个挑战。而且企业的数据信息大多存储在多个业务数据库中,各个业务模块之间的数据很难做到共享和关联,如何实现跨业务平台进行数据信息的关联和整合是企业现面临的另一大挑战。此外,商业智能是大数据时代的核心技术,然而商业智能并未普及,只在与IT关联比较密切的行业(金融、电信、网络、电子商务等)中有所应用。学会应用商业智能对很多企业来说是一个不小的挑战。另外,在大数据时代,企业面对海量的数据,数据的安全防护工作变得异常困难,这些数据中不仅有企业的商业机密还包含很多个人隐私,如果安全防护工作没做好,极容易被一些心怀不轨的“黑客”所利用,损坏企业利益,企业在处理信息安全问题是当前的又一大挑战。 ? ? ?(二)企业传统管理观念根深蒂固 目前,我国只有少部分企业重视大数据在决策方面的应用,多数企业管理人员还未真正认识到大数据的价值,一些企业管理者认为,大数据不过是简单的数据归纳和整理,其运用不能给企业带来直接的效益。归根结底还是传统管理观念根深蒂固导致一些企业难以接受大数据在企业管理决策方面的应用。殊不知,在这个大数据时代,一个企业数据占有量越多、数据整合越有效,企业的经营和发展就越占有优势。 ?还有一些企业虽然在作数据的整理和分析,但是其管理者还是遵循着传统的管理模式,过于追求事情的因果关系。而在大数据时代,我们追求的并不是因果关系而是相关关系。在海量的数据中,只要挖掘出与提高企业利润相关性比较大的因素,就可在一定程度上为企业决策管理提供战略支持。这就要求企业的管理者要有敏锐的洞察力,这对管理决策者的思维方式提出了一种新的挑战。 (三)大数据对企业管理决策的影响 1.企业管理决策环境变得更为复杂 在大数据时代下,企业决策信息的采集与分析、决策方案的制定与选择均会受到错综复杂的环境因素影响,此外,与企业决策相关的信息价值甄别难度大,这在一定程度上令决策者在进行决策管理的时候变得更加困难。 2.企业决策速度不及市场变化快 企业决策一般要经过搜集资料、调查研究、分析判断、方案评比与评估等十分复杂的程序,这期间会历经一段时间。并且,随着大数据在企业普及率的上升,会在一定程度上导致市场变化速度加快,这就对企业在决策速度上提出更高的要求,要求企业制定出更科学的决策模式。 3.企业面临决策主体多元化问题 在大数据时代下,要求企业具有更人性化的产品和服务,因此一个企业利用的数据源需要更多的来源,需要更多的人参与到决策中来。但同时,企业被要求构建级层决策管理系统,以提高决策管理的科学化程度。 ? ? ?(四)大数据人才匮乏 现阶段,我国极度缺乏大数据方面的高素质人才。大数据人才的培养主要由学校和社会承担。 1.学校的大数据人才培养问题 高校对大数据人才的培养发展缓慢。例如,贵阳市是大数据中心之一,但贵州省唯一一所“211工程”大学——贵州大学的大数据学院在2014才成立,可见该省培养的与大数据相关的人才数量不会有多少。 2.社会的大数据人才培养问题 社会大多注重培养实践应用型人才,培养出的人才在理论能力方面相对匮乏。在大数据时代,需要具有综合能力的人才,因为对数据的处理和分析已超出了信息化的范畴、超出了市场营销的范畴,也超出了运营管理的范畴。传统单方面能力突出的人才难以利用大数据做出高效的决策,如今的企业需要综合素质高的管理人才,这对企业来说无疑又是一种挑战。 ? 大数据时代企业管理对策 ? 一项来自《经济学家》杂志的调查报告显示,近年来大数据成为企业经营管理的热门话题。企业如何利用大数据成为提升竞争力的关键。研究表明,财务和运营状况好的企业大多为数据驱动的企业,从某种程度上讲,利用大数据来提升竞争力是未来所有企业都要面临的问题。大数据的作用将不再是目前数据的产生、存储、管理、分析、利用那么简单,它将在一种新的处理模式下做出决策并洞察未来发展趋势。大数据对企业管理问题的影响不容小觑,这不仅是企业管理的技术问题,还是一种管理决策的方式。面对诸多挑战,企业必须意识到大数据对企业管理的重要性,顺应时代做出改变。 (一)转变管理理念 随着数据的快速增长和信息的广泛传播,企业管理越来越依赖数据的支持,封闭管理思维越来越行不通,因为它已无法应对外部变化的环境。为了可更好地利用大数据这一宝贵资源,企业需要进行理念上的变革。 1.对数据分析有清楚的认知 应注意收集到的大量数据具有不准确性。原来小数据的“精确”处理数据方法力求所使用数据的准确性,而如今大数据的运用则可适度忽略细微的偏差,可视由个别混杂性数据对最终处理结果产生的细微差错不会影响其理论发展规律。 2.寻求大数据变量之间的关联性 相比于小数据环境下的数据处理是追求解决两变量的因果关系,大数据背景下其数据利用的目标是寻求变量之间的关联性。在大数据时代,企业搜索、汇集、整理、处理大量数据,对其深入分析挖掘,预测未来相关市场行情、发展中各因素所占竞争比重大小等,进而获得更有效的管理制度。 ? ? 3. 转变传统的决策方式 在传统的管理模式中,企业中的商业精英和管理者一直被视为作决策的人员,但在大数据背景下,一线员工逐步上升为企业的决策主体,公众的反映状况成为企业进行实时决策的重要依据。一线员工对企业管理决策有真实的感受,由公众反映出的数据更时效、更真实,由此看来,转变传统的决策方式具有一定的正确性。同时,企业对大数据的运用要求实时了解市场发展动向,要对一线员工的评价作出理性分析,合理预测企业发展动向,以便更好地进行企业创新。 (二)丰富数据平台 传统的企业管理模式的驱动因素大多是问题驱动,而在云计算、数据挖掘等技术的提高前提下,基于大数据下的企业管理更多的是利用数据驱动来解决创新问题,可见大数据可作为企业管理创新的关键要素。大数据对企业的重要性,决定了数据平台在企业中的地位。 来源:《经营与管理》杂志第3期

(3) [大数据的特性]2015年你本不该错过的演讲|大数据·精华导览

关注笔记侠,回复“红包和邮件地址”,有机会抽到课件和音频,拼运气啦!赶快发给团伙一起跨年学习。各大平台转载务必联络微信号:kezhou20,违者必究 英特尔首席工程师吴甘沙:大数据是上帝智能 吴甘沙,英特尔中国研究院院长、英特尔首席工程师、大数据深度研究者 一、大数据之道 ? 我认为把一件事情讲清楚,就要从这五个方面阐述:势、道、法、术、器。我今天主要从道、法、术三方面阐述大数据。 ? 2010年,谷歌每两天产生的数据量相当于人类文明曙光到2013年数以万计的时间长河所产生的数据总和,数据产生了指数级增长,我们可以看下指数曲线当中有一个有趣的特征:一开始的进展是非常缓慢的,但是突然到了一个转折点后,就以爆炸式的方式发展,下一步的进步可以是前面所有步的总和。因此,我们说,任何一个时间点的进步都不会太晚,而不是说机会都被前人拿走了。 ? 二、大数据为什么会产生指数级的增长? ? 因为摩尔定律,一旦一个事情可以形成规律,就可以有预测能力,就有自我实现能力;摩尔定义不仅仅是技术的规律,也是经济的规律,如果两年以后你生产的东西和今天的东西一模一样,你的营业额会下降一半,因此,这意味着你必须得不停地奔跑,光跑得快,还不够,还得“更快”。 ? 人是大数据的第一推动力;我认为有三个特点:最小化信息不对称,消费者有选择权;交易成本趋向于零,消费者行为高频化,比如电商;覆盖长尾人群,更多消费者参与。 杰文斯悖论指出技术进步导致资源利用率的提升,进而导致价格降低,最终增加资源的使用量,形成正向反馈。 ? 三、从大数据理论的层面理解: ? 第一,第四范式; ? 数据探索可能会超越实践、理论和模式,成为新的范式。未来大家会看到越来越多社会科学和大数据的结合,比如通过和社会学的结合,你会看到计算社会学。 ? 第二,理论已死,数据方法论(经验主义)万岁? 我们如何获得理论呢?传统的科学方法是先大胆假设、小心求证,先建立一个模型,做实验,从实验中看到一个数据,然后看到更多数据,从而发现有些假设是不对的,同时又留下了一些假设,形成我们对于世界的理解。·牛顿的机械力学理论、爱因斯坦的相对论,再到量子力学,我们发现当我们采集的数据越多,越缺乏一个最简单的理论可以解释。当数据多到一个程度,理论已经是奢望,数据即是模型。大数据只能发现当下知识疆域里面隐藏的未知部分,你还是需要靠你的天才想象力和理性拓展新的知识疆域。 第三,大数据的结论具有或然性; ? 大数据顶多不过是一个消息比较灵通的算命先生而已,大数据获得的任何一个结论都是以概率的视角去审视的。下面我给大家介绍三本书:《黑天鹅》(论点:这个世界是不可预测的)、《爆发》(论点:人类行为是可预测的)、《随机漫步的傻瓜》(虽然世界不可以预测,但是可以找到其中的概率)。 ? 四、大数据的特征 ? 第一,大的量度; 现在说大数据,都是ZB(十万亿亿字节:1000,000,000GB)的概念。制造业总量非常大,但是平均每家公司很小,它有非结构化、颗粒度细、多维度、高活性四个特征。其实,大不如“杂”和“快”重要,当你数据增长的速度够快的话,都可以称之为大数据,它强调多元化和高速的流转。 ? 第二,杂; 数据来源具有结构化、非结构化、多样性。一个人有没有思想,就在于他能不能从各个侧面找到信息之后,从彼此的关联中总结出规律。 ? 第三,快; 数据跟新闻和金融行情一样,具有时效性,你比别人快,就占有了先机。反映“快”的一个属性就是数据活性,这是数据价值的另外一个重要维度。 ? 五、大数据三大思维的思辨 ? 1、要全集,不要采样 传统采样带来了一些好处,但是它有百分之几的误差,更会丢失黑天鹅的信号,所以要全集。大家一直形容大数据是一个矿山,但其实它是贫矿。更多的数据,就一定可以胜过采样吗?好的采样优于不均匀的大量。 ? 2、要混杂,不要精确 拥抱混杂性,等于喜欢混杂性吗?否。数据失去辨识度、失去有效性,就该扔了。“少量高质量数据+复杂算法”被“大量低质量数据+简单算法”打败吗?未必。 ? 3、要相关性,不要因果性 人容易快思考,根据一些表面的相关性得出一个结论。比如服用中药,被治好和中药的服用存在相关性,但是不是因果性?未必。西药如果治好了你,它会做大规模的、随机的对照,把治好病的相关因素都列出来,然后一个个排除,看最终是哪个药治好了你的病。因此,我们要防止伪因果性,有些伪因果性是弱向性。 ? 六、大数据的价值变现方式 1、知著(见天地、见众生) 传统收视率的调查是通过打电话问询,现在是通过数据机顶盒。同样,我们可以在Twitter上预测股民的情绪指数,这是从定性向定量计算的。我们常说个体是理性的,群体是非理性的,但是通过大数据,可以看到非理性的轨迹。 ? 2、见微(见自己) 人群可以从细分到微分再到个人,对个人的刻画已经从个性化变成个体化。作为消费者,我们也希望商户以个性化的方式来对待我们。 ? 3、当下 当下的价值是提高时间效率,抓住先机,就是快鱼吃慢鱼的概念。 ? 4、皆明 皆明是同时考虑过去、当下和未来。预测性分析是预料未来会发生什么,而处方性预测是希望未来发生什么,然后提前做一些事情让未来发生。比如预测东风会来,这是预测性分析,而草船借剑就是处方性分析。 ? 5、辩讹(求真) 湖南发现有一个地方用电异常,后来发现竟然有人在偷偷制造枪支。 ? 6、晓意 电影《魔球》里面,一位棒球经理利用数据分析找到被忽略的人才,然后把他们集合在一起获得了很好的成绩。数据分析的秘密是让球探去评估,这是传统数据分析没有办法响应的地方。 ? 七、大数据的境界 1、量化 ? 量化虽然不能带来直接的好处,但是量化相当于给你的企业加上仪表盘,相当于数据史观,完成日志化、无纸化、自动化、工具化、移动化、社交化。我们说我们创造了技术,其实技术也影响了人,我们通过数据的不断刻画,成了“数据人”,“数据人”也会对真实人的行为发生影响和改变。 ? 2、效率 ? 通过量化、洞察、行动这三步可以提高效率。因为数据有噪声、有欺骗性、不全面,这个时候你把它泛化成所有数据是有问题的。我们很容易受到相关“快思考”的诱惑,其实大数据只能做预测,不能预言,它能够告诉你的是概率。 ? 3、个性 首先你要获得客户数据,不断对客户做画像,然后实现基于兴趣图谱、社交图谱、事件图谱的个性化和精准广告、推荐、促销,甚至完成交叉销售等。 ? 4、创造(新产品和服务) ? 从营销的个性化到产品的个性化;从产品设计的人性化到产品设计的新奇性;产品的拟人化;从数据换取免费服务;利用前后“皆明”获取跨时空的价值。 ? 5、生态 ? 互联网一直强调生态是“应用+终端+平台”,形成真正的价值,它既是数据的提供者,也是数据的创意者,也可以进一步提供数据的基础设施服务,它可以丰富自己的生态系统。 ? 未来,我们会基于云计算的开放生态,解决计算速度的问题,现在我们有一个愿景:2020年前,做完全基因检测序、锁定癌症相关基因,形成个性化治疗。注意,主义,生态是开放创新的温床。 《吴军:大数据不是让机器更聪明,而是接近智能》 Google科学家、硅谷风险投资人、原腾讯副总裁、《浪潮之巅》作者 一、从摩尔定律说起 50年来,摩尔定律已经改变了人们的很多生活方式,是一个浪潮,是持续的增长,它可以再走一段时间,但今年是转折点,接下来的30年还有个新机会:大数据。以前社会需求带动科技发展,现在科技先被造出来,你甚至不知道它干么用的,但是一旦它产生出来,就会产生社会需求。如果一个企业家在摩尔定律时代,却还是延续过去经济学教科书说的来做,就落伍了。因为有了摩尔定律,你尽管去做一件事情。 ? 在农业时代,种田后会留一些种子,第二年接着用,这是过去的方法,今天中国的农村已经不留种子了,可以直接从种子公司购买。为什么种子公司可以研发出更好的种子?因为他们运用了IT技术。过去,我们理解的服务业是旅游、家政等等,今天不是,今天IT作为服务业,光在美国就有1万亿市场,中国的第一、第二产业也正在向第三产业转型,这个时候不是仅仅为它们简单的法律等服务,而是用IT输出。 ? 不过,摩尔定律在经济学上有一个很大的问题:通缩。但问题出现的时候,常常就会出现一个解决方案。这个解决方案是:“安迪-比尔定律”(与摩尔定律、诺威格定律并称的IT产业三大定律。),即“安迪给你的时候,比尔就会全部拿走(“Andygives, Bill takes away.)”。安迪指英特尔前CEO安迪·格鲁夫,比尔指微软前任CEO比尔·盖茨,这句话的意思是,硬件提高的性能,很快被软件消耗掉了,这对IT产业中软件和硬件升级换代关系的一个概括。这是微软要和大家做对吗?不是的。微软在和英特尔一起打造了IT的产业链。 ? 二、人们对机器智能认知的发展 ? 到底什么算是机器智能呢?1950年,阿兰图灵提出了一个测试:“当计算机回答问题的时候,当你分不清给出答案的是人还是机器,这台机器就开始具备智能了。”图灵测试是以结果判定。那么怎么做呢?拆分条件:要能听懂,要会回答。 ? 1972年发生一个事情:有一位教授从康奈尔大学离开,他做的一件事就是怎么让计算机聪明起来?他开始做了语音识别,语音识别和机器翻译是用数据驱动解决智能问题的最早范例。这位教他是基于数学研究通讯的,他认为语音交流的过程可以分解为:当你用语言把大脑中的概念表达出来(编码过程),然后通过空气传播(传输过程),然后你听到后进行理解(解码),这其实是一个通讯问题。 ? 要解决这几个问题,第一要数据(为什么IBM能够做这件事情?因为它当时有超级计算机,有大量商业客户和数据),于是产生了“数据驱动”概念。运动这些数据就可以加以识别,从而实现了语音识别系统,最初的错误率30%,且只能解决100多个字,后来,经过升级,到22000字,误率从对30%降到10%,这就基本能看懂意思了。这给人们启发,原来不需要非得模拟人,还有另一条路可以走:数据驱动。 ? 四、什么是大数据? ? 大数据三特征:数据量足够大、多维度、数据的完备性。数据维度非常多,维度一多,数据就相对非常稀疏,所以需要更大的数据量。数据的完备性很可怕,回顾1996年,卡斯帕罗夫大师第一盘棋战胜IBM深蓝计算机,但是后面几盘计算机嬴了,因为它具备了数据的完备性,它把卡斯帕罗夫过去的棋局数据都收集起来了,包括全世界其它高手的历史数据记录都收集了。我们现在正在把很多智能的问题变成大数据的问题。 ? 五、大数据的关键技术 ? 1、数据的收集(无目的性、非结构化) ? 数据采集很重要,它一定要无目的性和非结构化,在不知不觉中采集下来。 2、数据的存储 ? 3、数据的表示、检索和随机访问 以前我们处理的数据:文本,很容易索引,数据量大了之后怎么检索,如图片、DNA片断? 4、数据的使用和挖掘 ? 当你从沙子里能够挖出金子,这就是挑战,所以数据的使用和挖掘非常重要。有了数据,你才知道产品怎么改进。 5、其它挑战:安全、隐私 ? 数据还有一个挑战,就是泄露,数据的安全和隐私不能丢和损坏,这些都是挑战,这不只是法律的问题。 ? 六、机器智能的鼎足三立 ? 计算机不是思考,它是算,所以它要有思维模型。机器智能未来是三足鼎立:摩尔定律、大数据和数学模型。大数据不是说让它比人更聪明,而是按照机器自己的方式解决问题。 ? 七、如何看待大数据将带来的变化? 如果未来的世界,智能机器无所不在,大家可能会疑惑一个问题:这到底会是机器人的世界还是人的世界? ? 未来的社会,连高大上的职业都会受到机器智能的影响。在美国写一份好的专利报告,要收1万多美元,有时候为了打嬴一个专利,要花1亿美元,三星和苹果也打过专利官司,苹果和三星两家光为打官司这几年就花了几亿美元。后来有一个人做了一个用自然语言处理器,搜寻了所有类似的官司案例,最后只花了10万美元解决了问题。可以想象,这个技术未来也会让很多律师的职位受到威胁。 ? 机器人是不会控制人类的,但是制造智能机器的公司和人,其实是通过机器来控制人。就某种程度,你是不是在被腾讯给控制了?它们是这个机器时代的受益人,其它人怎么办?要么加入他们,相信这个未来,成为2%的人,要么你沦为反对者,成为98%的人,被2%的人控制。 大数据给我们社会带来的影响不仅仅是产业的变化和生意,对人类也是非常有帮助。大数据的思维就是未来细到每一个人、商品、交易,可以全面性拥有数据。一个酒吧老板发现,有24%的酒是被偷喝掉的,后来他在每一个酒瓶下贴3毛钱成本的传感器,能够接收“酒倒了多少”、“什么时候被拿”等信息,通过手机或者平板电脑都知道,每一笔交易业都清清楚楚,这就是大数据时代和思维的特点。 ? 最后我们总结下:摩尔定律带来IT的革命,互联网和摩尔定律带来大数据,大数据和摩尔定律导致机器智能,机器智能改变未来社会。要么成为这个时代的2%,要么成为这个时代的98%。 LinkedIn李玥:只有挖掘出金子,大数据才有商业价值 LinkedIn商业分析高级总监,曾就职于第一资本和Ebay,大数据宣传者和实践者 数据的收集、管理是非常基础性的工作,只是告诉你发生了什么事情,并没有商业回报,但是这一步没有走好,就不会发生后面的事情。当有了规模化的数据架构,从数据挖掘知识和信息,这个时候对商业回报的可能性有了进一步的增加,第三步是根据收集、整理、理解、分析的数据预测会发生什么,从而帮助业务部门,最后一步是为商业决策提供有力的洞察力,帮助业务部门做出最有用、最好的决定。这是一个进化的过程,不是一步就可以达到最理想的要求。 ? EOI是我们用大数据手段持续推动商业价值的方法,即助力empower、优化optimize、创新innovate。 ? 1、助力empower ? 助力是我们团队的核心价值和任务,满足大家对数据最基本的需求,这个事情不是很好做,但要做好。然后用数据优化各个部门,提高效率和生产力,最后你一定要有冒险的精神,不断去尝试用最新的技术和方式帮助你创新地应用数据。 2、优化optimize ? 当你有了数据,如何优化呢?可以做一个倾向模型。LinkedIn有一个收费的高级订阅服务,在大众群体里面找出愿意增值付费的产品,找到有需求的群体。主要是三种数据类型:用户个体数据、用户行为数据、用户网络数据,这三个数据类型对绝大多数公司都用得上。物以类聚、人以群分,相关联的人在一个社群,关系会更强。 ? 3、创新innovate 假如你是一个销售人员,B2B里面有一个拍板的人,他在决策中将起到重要作用,如何把这些人分析出来?我们做决策者指数和产品倾向模型建造个人兴趣指数,用这个整合的数据帮助销售团队决定要跟进哪家公司和哪个人员,从而花更多时间跟进优质客户以获得订单。根据兴趣指数看大客户,发现平均订单成功率会B2B企业会大大变好,帮助B2B企业极大地提高销售效率和生产力的提高。大客户兴趣指数是我们非常大的创新,也获得了专利。 ? 如何让数据工作?从大到小,从繁到简,从慢到快。 ? 第一,从大到小; 根据客户和用户想做的事情结合起来,帮助他们拿到想要的数据。 第二,从繁到简; 工作很复杂,但最后的呈现要简单。 第三,从慢到快。 数据即使做得再好,但是如果要等很长时间,用户也会失去耐心。 ? 大数据的分析人才应该具备:技能5%、情商和智商15%、热情80%。 ? 技能在招聘当中只占5%,因为技术发展实在太快了,情商和智商相比之下更重要,占15%,IQ显得很重要,学得快比懂得多重要得多,情商也是很重要的。因为要跟技术和商业部门交流很多,内部合作也很重要。除此之外,还要具备热情,认同团队的理念,对工作拥有真正的热情,这是招聘人员最核心的标准。 ? 员工至少要共同认同我们团队的文化。我不可能每个人都盯得很近,但是每个进来的人我都会面试,他们每个人都要认同团队的文化。 ? 第一,聘用聪明到不可思议的青年才俊,致力于数据分析驱动商业影响; 第二,团队第一,我们不需要以自我为中心的人;互相协作,充分利用我们作为一个集体团队支持公司各项业务的优势; 第三,一起在团队里工作过的永远是团队的一员; 第四,从公司至上的角度看问题,你是公司的最高决策人的话会怎么做; 第五,诚实守信是不可商榷的员工品质; 第六,偏重实干和快速解决问题,根据实际情况决定方法(商业直觉:需要的时候要有无与伦比的精确); 第七,总是寻求创造杠杆:让对业务的影响力10倍甚至100倍地增加。 同系列内容,点击 2015年你本不该错过的演讲|互联网新方法·精华导览(一) 更多春节知识红包,点击 2015年你本不该错过的演讲:互联网新思维·精华导览(一) 2015年你本不该错过的演讲:互联网新思维·精华导览(二) 2015年你本不该错过的演讲:互联网新思维·精华导览(三) 2015年你本不该错过的演讲:互联网新思维·精华导览(四) 2015年你本不该错过的演讲|互联网新思维·精华导览(五) 2015年你本不该错过的演讲|互联网新方法·精华导览(一) 2015年你本不该错过的演讲|互联网新方法·精华导览(二) 2015年你本不该错过的演讲|人工智能·精华导览 点击下面,还有惊喜 打开有惊喜:不用给红包,也能看笔记 点击大咖名字,查看精彩笔记 李善友丨傅盛|余晨丨龚焱丨徐新丨 阎焱丨程维|张小龙|张一鸣|俞敏洪丨李丰|蔡文胜丨段永朝丨罗振宇|罗胖|罗振宇2|吴晓波|吴伯凡|宗毅|熊俊|吴声|秋叶|伊光旭丨李欣频|王东岳... 回复大咖名字,查看精彩笔记 KK丨克莱·舍基丨周鸿祎|张邦鑫丨季琦|刘德|雕爷|王信文|齐俊元|凯兹|赵迎光|行动派琦琦丨张怡筠...... 互联网笔记合作伙伴 混沌研习社|创业邦|领英中国|36氪|中欧商业在线|中欧战略系|黑马会|复旦大学哲学课堂|李欣频私塾课|互联网大篷车|行动派|中关村国际创业节|省互联网年会|俺来也青春创业营|葡萄创投|碳九学社|广州创大....


汉沽二手房信息 https://tj.c21.com.cn/

最新新闻
图片新闻
新闻推荐