通过写心得体会,我们可以激励自己在学习和工作上不断进步。那么如何写好一篇心得体会呢?首先,要先明确总结的目的和范围,然后结合自己的实际情况进行思考和梳理。在写作过程中,要注意语言表达的准确性和简洁性,同时注重展示个人的思考和感受。最后,可以结合实例或引用相关材料来加强论述的可信度。以下是一些精选心得体会的例子,希望能帮助大家更好地理解和运用这种写作形式。
大数据时代心得体会篇一
4月13日下午,在湖南大学东楼205参加了关于《大数据时代》的读书交流活动。通过相互交流学习,使我更深层次的理解了大数据时代的利与弊,机遇和挑战。在写心得体会前,我想再重新审视一下关于大数据的历史沿革和现实意义。
首先,最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”“大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。大数据作为云计算、物联网之后又it行业又一大颠覆性的技术革命。云计算主要为数据资产提供了保管、访问的场所和渠道,而数据才是真正有价值的资产。企业内部的经营交易信息、物联网世界中的商品物流信息,互联网世界中的人与人交互信息、位置信息等,其数量将远远超越现有企业it架构和基础设施的承载能力,实时性要求也将大大超越现有的计算能力。如何盘活这些数据资产,使其为国家治理、企业决策乃至个人生活服务,是大数据的核心议题,也是云计算内在的灵魂和必然的升级方向。
其次,进入20xx年,大数据(bigdata)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。它已经上过《纽约时报》《华尔街日报》的专栏封面,进入美国白宫官网的新闻,现身在国内一些互联网主题的讲座沙龙中,甚至被嗅觉灵敏的国金证券、国泰君安、银河证券等写进了投资推荐报告。数据正在迅速膨胀并变大,它决定着企业的未来发展,虽然很多企业可能并没有意识到数据爆炸性增长带来问题的隐患,但是随着时间的推移,人们将越来越多的意识到数据对企业的重要性。正如《纽约时报》20xx年2月的一篇专栏中所称,“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”
最后,随着云时代的来临,大数据(bigdata)也吸引了越来越多的关注。著云台的分析师团队认为,大数据(bigdata)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像mapreduce一样的框架来向数十、数百或甚至数千的电脑分配工作。“大数据”在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用g或t来衡量。大数据到底有多大?一组名为“互联网上一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张dvd;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……,截止到20xx年,数据量已经从tb(1024gb=1tb)级别跃升到pb(1024tb=1pb)、eb(1024pb=1eb)乃至zb(1024eb=1zb)级别。国际数据公司(idc)的研究结果表明,20xx年全球产生的数据量为0.49zb,20xx年的数据量为0.8zb,20xx年增长为1.2zb,20xx年的数量更是高达1.82zb,相当于全球每人产生200gb以上的数据。而到20xx年为止,人类生产的所有印刷材料的数据量是200pb,全人类历史上说过的所有话的数据量大约是5eb。ibm的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了20xx年,全世界所产生的数据规模将达到今天的44倍。
首先,谈谈大数据带给生活的转变。大数据已经是信息产业发展的必然趋势,可以说,大数据现在已经开始慢慢渗透入我们的生活,如:现在流行的打车软件、三维立体化社区的建立、某些从事生产销售的行业利用大数据来优化规模和实现利益最大化。而我们很多人对大数据还很陌生,只是被动的适应着大数据给生活带来的改变。大数据时代是以云计算为基础的,所以,要实现大数据,相关的很多的硬件设备都要更新换代,信息处理系统、信息传输系统、信息反馈系统、信息决策系统都将面临新的挑战,相关产业都要重新调整产业结构,在那时,可以夸张的说,信息就是黄金,信息就是石油。大数据时代的到来会解放更多的劳动生产力,势必将会更加加剧生产力过剩的现状,社会两极分化现象会更加明显,掌握不了信息资源,很难再翻身,要防止信息垄断带来的可怕局面。大数据时代的到来会使人们的生活节奏急速加快,信息的时效性决定了它的流通速率,人们的生活节奏要跟上信息流通的速率,就不得不加快自己的节奏,人们会越来越忙,到那时,就像现在的日本,可能想找个人听你说说话,真的是一件很难的事。
第二,关于数据管理的看法。大数据时代,数据管理是一件很重要的工作,如何才能避免自己的数据被非法窃取、丢失和被盗?我的看法是,人防、技防、物防一体化。人防,即我们要从思想上牢固树立信息安全防范的意识,不主动泄露信息,要管理好自己身边的信息设备;技防,就是要运用软件来管理和处理数据,经常检查更新数据库,定时查杀电脑病毒,确保电脑状况安全;物防,就是重要的数据一定要备份保留,而且应当做到备份与原始文件是物理隔离,无关的信息应当及时删除,减轻硬盘的压力。
三、怎么保护自己的隐私。隐私,顾名思义,就是不愿意让别人看到的东西,所以,在大数据时代,更要管理好自己的隐私,以免对自己和家人造成麻烦和损失。越是隐私的信息,越要远离网络,不要再公开的社交网络储存和展示个人图片、资料等信息,免得被非法人士采用和窃取。建议还是用纸质的日记代替电脑日记,避免信息传播范围太大,管理好自己的日记本。研发一种新的硬件连接器,总是以随机码来保护自己真实ip地址,提高网络安全的可靠性,加强对联网信息的管理和保护。
不论我们情不情愿,大数据时代都会到来,现实社会是我们高喊着走向大数据时代,其实大数据时代已经向我们走来,所以与其被动接受,不如主动学习,从中找到自己的出路,成为大数据时代的建设者和受益者。
大数据时代心得体会篇二
大数据时代的到来,给人们的生活、工作、学习等方方面面带来了巨大的变革。信息爆炸和海量数据的涌现,使得人们既感到兴奋也感到困惑。为了更好地适应这个新时代,我观看了《大数据时代第集》这部纪录片,对于大数据时代带来的影响有了更深入的理解和体会。
第一段:纪录片揭示数据充斥我们生活的方方面面。
《大数据时代第集》的开场,向观众展示了一个庞大而精密的数据收集系统。从各个环境中,包括手机定位、购物产生的交易记录、社交媒体上的消息等,都不断产生并被收集起来。这使得我们的生活无时不在与数据相交,几乎人人都成为数据的生成者与被生成者。
第二段:大数据对商业和消费者的影响。
大数据不仅为商业带来了前所未有的机遇,也为消费者带来便利。通过对海量数据的分析,企业可以更好地了解市场趋势和消费者的行为模式,从而调整产品策略和市场推广方案。例如,纪录片中提到了亚马逊利用大数据优化仓储和物流,从而提高了交易效率和客户满意度。消费者也因此受益,他们可以通过推荐算法等技术获得更符合个人需求的产品和服务。然而,大数据也为消费者带来了隐私泄露和信息滥用的风险。
第三段:大数据在社会管理中的应用。
纪录片进一步揭示了大数据在社会管理中的广泛应用。政府通过对交通数据、公共卫生数据等的深度分析,可以更好地制定交通规划和疫情防控策略。大数据还帮助警察从海量监控视频中找到犯罪线索,提高了犯罪侦查的效率。然而,大数据的应用也带来了一些争议,例如在抗击新冠疫情过程中,社交媒体上的大数据分析被用于实名制和处罚非法外出等措施,引发了个人隐私权和公共安全之间的权衡和讨论。
第四段:个人隐私保护的重要性。
大数据时代的到来,使得个人隐私保护变得愈发重要。纪录片中提到了欧盟制定的《通用数据保护条例》,旨在加强对个人数据的保护。我们也需要在日常生活中保护好自己的个人信息,不随意泄露给他人。同时,社会各界也应加强法律法规的制定和监管力度,确保大数据应用的合理性和合法性。
纪录片最后提到了大数据时代对个人发展和教育的影响。大数据使得人才需求不再仅仅停留在专业技能层面,数据科学和数据分析技能成为了追求职业发展的热门方向。在教育方面,大数据也可以为学生提供个性化的学习和教学方案,促进学生的全面发展。
总结:
《大数据时代第集》这部纪录片给我带来了对大数据时代的全新认识。大数据的涌现为商业、消费者、社会管理和个人发展等带来了巨大的机遇和挑战。我们需要认识到大数据的广泛应用并保护好个人隐私,同时也应关注大数据在社会中的不公正应用,并寻找解决之道。只有合理应用和平衡发展,才能使大数据更好地为社会进步和个人发展作出贡献。
大数据时代心得体会篇三
近年来,随着数据技术和网络技术的飞速发展,我们正处于一个大数据信息化时代。随之而来的是海量数据的爆发式增长,对数据的审查、处理和分析带来了前所未有的挑战。大数据信息化时代的到来也改变了人们的生活方式和工作方式,促进了科技进步。在这个时代,我们不仅需要拥有海量的数据,更需要的是对数据的利用价值。因此,大数据信息化时代需要不断地关注数据的价值和意义,以更好地适应信息化时代的发展。
第二段:论述大数据在企业经济效益中的应用。
大数据为企业带来了经济效益,企业可以更好地收集和分析数据,发现并分析出自身经营情况的薄弱环节,及时采取措施,提升管理能力,有效降低成本。同时,大数据能够带来巨大的商业价值,为企业提供更加精准的服务。在这个信息化时代,企业需要关注大数据的价值,通过数据分析找到企业更好的发展之路。
第三段:阐述大数据在医疗行业中的应用。
大数据对于医疗行业来说也是非常重要的。通过收集和分析医疗领域的数据,医疗领域可以更好地预测疾病的发展和预防措施。同时,大数据还能够帮助医疗领域提高诊疗效率,减少医疗成本。医疗领域非常关注如何将现有的数据信息,转换为医疗罕见病的战斗力,科学家们希望能够通过大数据的助力,探索新的治疗方案,并更好地提供医疗服务。
第四段:说明大数据在教育领域的应用。
作为广博的知识体系,教育领域同样需要大数据的帮助。通过收集和分析学生的学习数据,教育领域可以更好地了解学生的学习情况,精准地预测学生未来的学习方向和职业发展。同时,教育领域也可以通过大数据获得学习资源的优化配置,提升学生的学习效果,推动区域教育更好地发展。
大数据信息化时代已经到来,数据是未来时代的核心竞争力。我们需要更加深入地理解大数据背后的价值和意义,结合实际应用,充分挖掘数据的潜在价值。只有这样,我们才能更好地抓住大数据带来的发展机遇,实现我们的个人和企业的发展目标。在未来,大数据的发展将会更加快速和广泛,我们需要不断地跟随时代发展,积极掌握新技术,抓住大数据时代带来的发展机遇。
大数据时代心得体会篇四
读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。
本书从思维、商业、管理三个方面阐述了在大数据时代在下的变革,这些变革涉及到我们生活的方方面面,几乎其影响程度可以与两次工业革命相媲美。作者在第一部分提出了三个比较令人震惊的观点,也就是大数据的精髓在于我们分析信息时的三个转变,这三个转变将改变我们的理解和组建社会的方法。并且作者将生活,工作思维的大变革和这几个方面紧紧联系在一起。
第三个改变是不是因果关系而是相关关系,在大数据时代,我们更需要了解一个东西是什么,而不是为什么,要找到关联无,通过一个良好的关联物的相关关系可以帮助我们捕捉预测未来。
这三个方面是大数据时代所给我们带来的思维上的改变,所谓思路决定出路,思路有了创新,有了拓展,相应的社会也就会有很大的变化。紧接着第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力。第三部分则是阐述了大数据时代下的弊端以及在管理上的措施。个人认为本书的精髓部分是第一部分,第一部分的三个观点涉及的面很广,包括统计学、逻辑学、哲学等。后两个部分都是以第一部分这三个观点为基础展开阐述的。
这本书给我感触最深的.就是这三个转变,或者说是三个观点,可以说是哲学上说的世界观,因为世界观决定方法论,所以这三个观点对传统看法的颠覆,就会导致各种变革的发生。
首先是第一个,作者认为在抽样研究时期,由于研究条件的欠缺,只能以少量的数据获取最大的信息,而在大数据时代,我们可以获得海量的数据,抽样自然就失去它的意义了。放弃了随机分析法这种捷径,采用所有的数据。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义,列举了日本“相扑”等来证明使用全体数据的重要性。
这个观点足以引起统计学乃至社会文明的变革,因为统计抽样和几何学定理、万有引力一样被看做文明得以建立牢固的基石。我对这个观点还是比较认同的,如果真能收集到整体的数据而且分析数据的工具也足够先进,自然是全体数据研究得出的结果更令人信服。但是这个观点也过于绝对,就算是在大数据时代要想收集到全体数据还是不太可能实现的,因为收集全体数据要付出的代价有时会很大。比如说,你要检测食品中致癌物质是否超标,你不可能每一件食品你都检测一遍吧。
第二,要效率不要绝对的精确。作者说,执迷于精确性是信息缺乏时代和模拟时代的产物,只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用。作者是基于数据不可能百分之百正确的考虑而做出这样的判断的,如果采用小数据一个数据的错误就会导致结果的误差很大,但是如果数据足够多、数据足够杂那得出的结果就越靠近正确答案。大数据时代要求我们重新审视精确性的优劣,甚至还说到大数据不仅让我们不再期待精确性,也让我们无法实现精确性。谷歌翻译的成功很好地证明了这一点,谷歌的翻译系统不像candide那样精确地翻译每一句话,它谷歌翻译之所以优于ibm的candide系统并不是因为它拥有更好的算法机制,和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。
而在阅读这本书时,发现这本书中争议最大的一个观点,不仅是读者,就算是本书的译者也在序言中明确地说到他不认同“相关关系比因果关系更重要”的观点。作者觉得相关关系对于预测一些事情已经足够了,不用花大力气去研究他们的因果关系。作者用林登的亚马逊推荐系统的成功,证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分利用并挖掘各类数据信息的代表,从啤酒和尿布的案例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于他们策略的帮助。
一句话,知道是什么就够了,不用知道为什么。很明显作者所举的例子都是属于商业领域的,但是对于其他领域来说这个观点就值得商榷了。比如说,在科学研究领域,你需要知其然也需要知道其所以然,找到事件发生的原理。用文中的一个例子说明,乔布斯测出整个基因图谱来治疗癌症,但是你治疗癌症你必须知道癌症发病的原理,知道哪一段基因导致了这种疾病,不可能只是说收集各种数据,然后利用其相关性来判断哪里出现了问题。
过度依赖所带来的后果。也用《少数派的报告》这部电影来说明如果痴迷于数据会导致我们将生活在一个没有独立选择和自由意志的社会,如果一切变为现实,我们将被禁锢在大数据的可能性之中。所以书中提出了几种解决方法,一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。毫无疑问,大数据将会给社会管理带来巨大的变革。
在这个信息爆炸的时代,大数据给人类社会的方方面面带来了巨大的变革,这是社会发展的潮流,不可逆转,我们只有顺应这种潮流,把握住大数据时代变革的思想,才能在时代潮流中成为佼佼者,在思维上思路上略高一筹,才能在行动中占得先机!
大数据时代心得体会篇五
随着信息技术的快速发展,大数据教育正成为教育领域的新热点。在大数据背景下的教育,为教育提供了更全面、更准确的数据支持,同时也给教师和学生带来了更广阔的教学和学习空间。在实践的过程中,我深刻地体会到了大数据教育这一新时代的优势与挑战。下面我将从教学设计、学习评估、个性化教育、教育研究和信息安全五个方面,谈一谈自己对大数据教育的心得体会。
首先,大数据教育为教学设计提供了更有力的支持。传统教育往往根据教师的经验和直觉进行教学设计,难以做到针对每个学生的个性化需求。而有了大数据的介入,教师可以更准确地了解学生的学习情况和表现,从而有针对性地进行教学设计。例如,通过分析学生在课堂上的表现,教师可以了解到学生的薄弱环节,并据此调整教学内容和方法,帮助学生更好地掌握知识。此外,教师还可以通过数据分析来发现学生的学习兴趣和潜能,为学生提供个性化的学习资源和指导,提高教学效果。
其次,大数据教育改变了传统的学习评估方式。在传统教育中,评估往往依赖于考试和作业,对学生的全面能力评估有所欠缺。而大数据教育可以帮助实现全方位的学习评估。通过收集和分析学生的学习数据,可以对学生的学习进程、学习过程和学习结果进行实时监测和评估。例如,通过分析学生在学习过程中的行为数据和学习输出数据,可以了解到学生的学习态度、学习策略和学习效果,并及时进行反馈和调整。这种全方位的评估方式更能真实地反映学生的学习情况,有助于引导学生更好地提高学习效果。
第三,大数据教育推动了个性化教育的发展。大数据的应用使教育走出了一刀切的教学方式,实现了因材施教。通过分析学生的学习数据,可以获得学生的学习特点、习惯、喜好等信息,使教师能够更准确地把握学生的个性化需求,采用针对性更强的教学方法和手段。同时,学生也可以根据自身的需要和兴趣进行学习,选择适合自己的学习路径和资源。个性化教育以学生为中心,让每个学生都能在适合自己的学习环境中得到最大程度的发展,提高教育的质量和效果。
第四,大数据教育为教育研究提供了更多可能。教育研究一直致力于探索教育规律和提高教育效果,而大数据的应用为教育研究提供了更多的研究对象和研究方法。通过分析大数据,可以揭示学生学习行为、学习难点、学习效果等方面的规律,发现教育领域的问题和挑战,并为教育改革和教育政策提供参考和支持。此外,大数据还可以用于教师培训和教学团队建设,帮助教师和学校提高教学效果和管理水平。
最后,大数据教育也面临着信息安全的挑战。大数据的应用涉及到大量的个人隐私数据,保护学生和教师的个人隐私和信息安全成为一项重要任务。在大数据教育中,不仅需要加强对学生和教师的隐私保护,还需要建立健全的数据安全管理体系,加强数据权限控制和访问控制,保证数据的安全性和可靠性。
综上所述,大数据教育为教学设计、学习评估、个性化教育、教育研究和信息安全提供了新的可能和挑战。这一新时代的到来,使教育变得更加科学、智能和人性化。但同时也需要我们不断探索和创新,解决其中的问题和挑战,使大数据教育更好地发挥其优势,推动教育的深入发展。
大数据时代心得体会篇六
随着信息技术的迅猛发展,大数据已经成为了我们生活中不可或缺的一部分。在教育领域,大数据的应用也已经渗透到了各个环节。在这个大数据教育新时代,我有幸参与了一些大数据教育项目,并且有了一些深入的体会与感悟。本文将从以下五个方面来谈谈在大数据教育新时代的心得体会。
首先,大数据教育让教学更个性化。传统的教育模式往往是以教师为中心,一刀切地对所有学生进行教学。而在大数据教育的时代,人们可以通过大数据技术来收集和分析学生的学习数据,了解每个学生的学习情况和特点。这样一来,教育者可以根据学生的实际情况来制定个性化的学习计划,使学生能够更好地发挥自己的潜力,从而提高学习效果。
其次,大数据教育让教学更科学化。在大数据时代,教育者可以收集和分析大量的学习数据,从中找到规律和蛛丝马迹。通过数据分析,可以发现学生的学习习惯、偏好、困难点等,从而为教育者提供科学依据。教育者可以根据这些数据结果来调整教学策略,创新教学方法,提高教学效果。同时,教育者还可以利用大数据分析来评估教学的成效,及时发现问题并加以解决。
第三,大数据教育让教学变得更高效。在传统的教学模式下,教育者需要花费很多时间和精力来收集、整理和分析学生的学习数据。而在大数据时代,可以借助大数据分析工具自动进行数据的收集和分析。这样,教育者就可以把更多的时间和精力投入到教学过程中,提高教学的效率和质量。另外,大数据教育还可以根据学生的学习特点和需求,为每个学生量身定制学习资料和学习计划,进一步提高学习效果。
第四,大数据教育促进了教育信息化的发展。大数据技术使得教育信息化变得更加便捷和高效。通过大数据技术,教育者能够轻松地获取学生的学习数据,了解学生的学习情况。同时,大数据技术也可以帮助教育者更好地管理教育资源,制定教育政策。除此之外,大数据技术还能为教育者和学生提供更多的学习资源和学习工具,提供了更多的学习机会和途径。
最后,大数据教育也带来了一些新的问题和挑战。随着大数据技术的不断进步,个人隐私保护和数据安全问题也变得越来越重要。在大数据教育时代,教育者需要更加注重学生隐私保护,并加强数据安全管理。同时,大数据教育也会对教育者的专业能力提出更高的要求,教育者需要不断学习和提升自己的大数据分析能力。
综上所述,大数据教育已经成为了教育领域的一大趋势。通过大数据教育,教育者可以更好地了解学生的学习情况和需求,制定个性化的学习计划,提高教学效果。同时,大数据教育也促进了教育信息化的发展,提高了教学效率和质量。然而,大数据教育也带来了一些新的问题和挑战,我们需要加强对个人隐私保护和数据安全的重视,并提升自己的大数据分析能力。只有这样,我们才能更好地利用大数据教育的优势,推动教育事业的发展。
大数据时代心得体会篇七
这本书里主要介绍的是大数据在现代商业运作上的应用,以及它对现代商业运作的影响。
《大数据时代》这本书的结构框架遵从了学术性书籍的普遍方式。也既,从现象入手,继而通过对现象的解剖提出对这一现象的解释。然后在通过解释在对未来进行预测,并对未来可能出现的问题提出自己看法与对策。
下面来重点介绍《大数据时代》这本书的主要内容。
《大数据时代》开篇就讲了google通过人们在搜索引擎上搜索关键字留下的数据提前成功的预测了20xx年美国的h1n1的爆发地与传播方向以及可能的潜在患者的事情。google的预测比政府提前将近一个月,相比之下政府只能够在流感爆发一两个周之后才可以弄到相关的数据。同时google的预测与政府数据的相关性高达97%,这也就意味着google预测数据的置信区间为3%,这个数字远远小于传统统计学上的常规置信区间5%!而这个数字就是大数据时代预测结果的相对准确性与事件的可预测性的最好证明!通过这一事以及其他的案例,维克托提出了在大数据时代“样本=总体”的思想。我们都知道当样本无限趋近于总体的时候,通过计算得到的描述性数据将无限的趋近于事件本身的性质。而之前采取的“样本总体”的做法很大程度上无法做到更进一步的描述事物,因为之前的时代数据的获取与存储处理本身有很大的难度只导致人们采取抽样的方式来测量事物。而互联网终端与计算机的出现使数据的获取、存储与处理难度大大降低,因而相对准确性更高的“样本=总体”的测算方式将成为大数据时代的主流,同时大数据时代本身也是建立在大批量数据的存储与处理的基础之上的。
接下来,维克多又通过了ibm追求高精确性的电脑翻译计划的失败与google只是将所有出现过的相应的文字语句扫描并储存在词库中,所以无论需要翻译什么,只要有联系google词库就会出现翻译,虽然有的时候的翻译很无厘头,但是大多数时候还是正确的,所以google的电脑翻译的计划的成功,表明大数据时代对准确性的追求并不是特别明显,但是相反大数据时代是建立在大数据的基础住上的,所以大数据时代追求的是全方位覆盖的数字测度而不管其准确性到底有多高,因为大量的数据会湮埋少数有问题的数据所带来的影响。同时大量的数据也会无限的逼近事物的原貌。
之后,维克托又预测了一个在大数据时代催生的重要职业——数据科学家,这是一群数学家、统计学与编程家的综合体,这一群人将能够从获取的数据中得到任何他们想要的结果。换言之,只要数据充足我们的一切外在的与内在的我们不想让他人知道的东西都见会在这一群家伙的面前展现得淋漓尽致。所以为了避免个人隐私在大数据时代被这一群人利用,维克托建议将这一群人分为两部分,一部分使用数据为商业部门服务,而另一群人则负责审查这一些人是否合法的获得与应用数据,是否侵犯了个人隐私。
无论如何,大数据时代将会到来,不管我们接受还是不接受!
我觉得《大数据时代》这本书写的很好,很值得一读。因为会给我们很多启发,比如你在相关的社交网站发表的言论或者照片都很有可能被“数据科学家”们利用,从而再将相关数据卖给各大网店。不过,事实就是我们将会成为被预测被引诱的对象。所以说,小心你在网上留下的痕迹。
我喜欢这本书是因为它给我展现了一个新的世界。
大数据时代心得体会篇八
如今说起新媒体和互联网,必提大数据,似乎不这样说就out了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典著作——舍恩佰格的《大数据时代》。维克托·迈尔——舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和ibm等全球顶级企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,如果能做足功课又具备相应的理论功底,就能与之进行一场思想上的对话。
一读。
舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分“大数据时代的思维变革”中,舍恩伯格旗帜鲜明的亮出他的三个观点:一、更多:不是随机样本,而是全体数据;二、更杂:不是精确性,而是混杂性;三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。
我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。“大数据的简单算法比小数据的复杂算法更有效。”更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。“不是因果关系,而是相关关系。”不需要知道“为什么”,只需要知道“是什么”。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。
世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出“不是因果关系,而是相关关系。”这一论断时,他在书中还说道:“在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。”[i]由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。
大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可“量化”,大数据的定量分析有力地回答“是什么”这一问题,但仍然无法完全回答“为什么”。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。在风险社会中信息安全问题日趋凸显,数据独裁与隐私保护成为一对矛盾。如何摆脱大数据的困境?舍恩伯格在最后一节“掌控”中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:“大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。”谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考答案。
此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。
再读。
概念是研究的逻辑起点,“大数据”到底是什么?在百度上搜索到的解释是,“大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。”大数据的4v特点:数量(volume)、速度(velocity)、品种(variety)和真实性(veracity)。但舍恩伯格认为大数据并非一个确切的概念。他在书中的一段诠释更具人文色彩和社会意义:“大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。”[ii]其实,概念的界定要看研究者从哪个角度来研究它而定。
科学家的治学态度是严谨的,而人文学家更具有想象力。一些对大数据不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格认为大数据的核心是预测。“大数据不是要教机器像人一样思考。相反,把数学算法运用到海量的数据上来预期事情发生的可能性。”[iii]舍恩伯格甚至不回避大数据所产生的负面影响,他在第七章里谈到让数据主宰一切的隐忧。我觉得这是实事求是的科学态度。在量子力学里有一个测不准原理:一个微观粒子的某些物理量(如位置和动量,或方位角与动量矩,还有时间和能量等),不可能同时具有确定的数值,其中一个量越确定,另一个量的不确定程度就越大。它是解释微观世界的物理现象,信息社会中的大数据会不会也有类似情况呢?如果我们再把凯文·凯利的《失控》对比来读的话就更有意思了,这样我们对整个物质世界及至人类社会就有了更全面更深刻的洞察,从物理王国到生物世界,再到信息社会。从公共卫生到商业应用,从个人隐私到政府管理,大数据无处不在。与此同时,从哪个角度探讨用什么方法研究,舍恩伯格都不会忘记大数据服务人类造福人类的终极目的和价值所在。“大数据并不是一个充斥着运算法则和机器的冰冷世界,其中仍需要人类扮演重要角色。人类独有的弱点、错觉、错误都是十分必要的,因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。偶尔也会带来屈辱或固执的同样混乱的大脑运作,也能带来成功,或在偶然间促成我们的伟大。这提示我们应该乐于接受类似的不准确,因为不准确正是我们之所以为人的特征之一。”[iv]用中国话来说就是“人无完人”,人类在收获大数据带来的红利的同时也要承受它带来的危害。这不是对立统一的辩证唯物主义?我把它看作带着欧洲批判学派色彩的科学发展观。
问题是研究的价值基点,“大数据”不是舍恩伯格研究的问题,而是研究对象,他研究的是数据处理和信息管理问题,同时也讨论信息安全和网络伦理问题,还引发哲学上的思考,哲学史上争论不休的世界可知论和不可知论转变为实证科学中的具体问题。可知性是绝对的,不可知性是相对的。“大数据”之所以为大是因它引发人类生活、工作和思维的大变革,从这个意义上来看,《大数据时代》的意义不仅在于它讨论了若干重大问题,而且对研究者开出了一个问题清单,从而引发更多人来探讨这些有趣的问题。
《大数据时代》实际上主要是一本讨论数据挖掘的书,数据挖掘与数据分析是不同的概念,数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。而数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。数据挖掘主要运用计算机来进行处理,而数据分析既要用计算机也要人工分析,是计算机科学与人文价值判断的统一结合。换言之,《大数据时代》并不是一本讨论大数据所有问题的书。
《大数据时代》也是一本讨论互联网发展的书,从数字化到数据化,同时有浓厚的未来学色彩。当文字变成数据,我们进入了互联网;当方位变成数据,我们进入了物联网;当沟通变成数据,我们进入了下一代互联网。一切可量化,万物皆数据,正是当今互联网世界的真实写照。面对于这样的世界及世界的未来,在《大数据时代》出现最多的词是“思维”和“方法”,因此也可以把这本书视为思维科学应用研究的书。
此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。
三读。
今年国庆节前一天,中共中央政治局们来到中关村搞集体学习,调研、讲解、讨论创新驱动发展战略。包括、在内的七位全部出动来到中关村,这是历史上没有过的,百度、联想和小米的负责人,有了一次直面最高层汇报工作的机会。雷军和柳传志,讲解的都是本公司的各种情况,李彦宏则没有讲百度的广告业务发展得如何好,而是讲起了大数据。在讲解中,李彦宏认为大数据有两个重要价值,一是促进信息消费,加快经济转型升级;二是关注社会民生,带动社会管理创新。这些价值也是目前党和国家领导人最为重视的,可见《大数据时代》既有理论价值也有现实意义。
当今大数据正在影响着新闻传媒业,大数据新闻、大数据营销、舆情分析、受众(用户)研究……数据分析师变身新闻编辑,大数据正改变新闻生产流程、大数据在创造传媒新业态。“不妨想象一下,随着数据的进一步增加,坐拥用户资源的新媒体们完全有能力通过数据挖掘,分析用户癖好,向电视台定制一部电视剧甚至向好莱坞定制一部电影。到那个时候,电视台一如那些家电厂商们,曾经产业链的上游‘王者’,将彻底成为一个产业链最低端的内容代工厂。”[v]然而,情形也远没有人们想象的那么乐观,李彦宏指出目前多数所谓的大数据公司其实还是空壳子,因为数据还没有完全开放。他认为必须在政府层面上推动才能真正实现大数据的开发与利用。我在讨论大数据时代的舆情监测与预警时说道:“经典自由主义传播学说对媒体的定位:秉持公正、客观立场的媒体被称为代表公众监督政府行为的‘看门狗’。其实,媒体既是公众利益也是国家利益的‘看门狗’。要看好门就要瞭望、洞察社情民意,传统媒体信息反馈渠道单一,视野、人力十分有限。而开放互动的新媒体平台却大有可为。作为公共信息发布平台的微博可以成为政府及时了解社情民意,从而选择正确治理路径的‘导盲犬’。”[vi]遗憾的是目前我国的数据平台还没有完全开放,真正的大数据时代还没有到来。
与国内不少教科书写法的专著相比,国外的书写得更有趣,尤其是大学者写的,不仅视野开阔,而且能够深入浅出。《大数据时代》不到22万字,却有上百个学术和商业的实例,丰富翔实的例子让读者感到通俗易懂,深奥的理论看起来也不费劲。这恐怕与舍恩伯格既是学者也是专家,既有理论又有实践有关。反观我们些学者故弄玄虚而示高明,实际上是把读者拒之门外。我觉得优秀的科学家也应该是一个科普作家,优秀的学者也应该是一个不错的传播者。当然国外学术著作也有一个翻译问题,这本书译得还不错。此外,《大数据时代》还附有不少it界名流的推荐意见,虽是出版商的发行所为,对解读此书也不无益处。
除了《大数据时代》,舍恩伯格还有一本《删除》也值得一读。要研究大数据不能只读一本书,该书译者周涛教授还推荐了三部国内出版的大数据方面的专著:《证析》、《大数据》、《个性化:商业的未来》。相比《大数据时代》的宏大视野,这些书就大数据某一局部问题给出深刻的介绍和洞见。我也推荐读一读中国工程院李国杰院士和中科院计算所副总工程学旗合写的文章《大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考》。
虽说开卷有益,但是由于每个人的时间精力有限,对于一个研究者来说,不读什么书甚至比读什么书更重要。我认为书有三种:有用的书,主要是应用类的专业书;无用的书,主要是形而上的思想类;无字的书,人间百态,社会现实。可偏重但不应偏废。对于学生来讲这三类“书”都该读一些,对于研究者则要读哪些解决关键问题的书,《大数据时代》就是这样一部书。当然,并非第一个读者都是研究大数据的,但进入大数据时代,还有什么东西与数据完全没有关系呢?麦肯锡全球研究机构认为,未来十年里有12项对经济发展产生重大影响的技术,其中包括三项新媒体技术:移动互联网、物联网和云计算。这三项新媒体技术都与大数据密切相关,而这些新媒体新技术的发展都影响着当今的新闻传播业。阅读此书至少给我们研究新闻传播学带来一些启迪。我觉得一本书的价值不在于让你顶礼膜拜,而是引发广泛而深入的讨论。
“凡是过去,皆为序曲。”读完此书,我们对大数据的认识才刚刚开始。
大数据时代心得体会篇九
描述小组在完成平台安装时候遇到的问题以及如何解决这些问题的,要求截图加文字描述。
问题一:在决定选择网站绑定时,当时未找到网站绑定的地方。解决办法:之后小组讨论后,最终找到网站绑定的地方,点击后解决了这个问题。
问题二:当时未找到tcp/ip属性这一栏。
解决办法:当时未找到tcp/ip属性这一栏,通过老师的帮助和指导,顺利的点击找到了该属性途径,启用了这一属性,完成了这一步的安装步骤。
问题三:在数据库这一栏中,当时未找到“foodmartsaledw”这个文件。
问题四:在此处的sqlserver的导入和导出向导,这个过程非常的长。
解决办法:在此处的sqlserver的导入和导出向导,这个过程非常的长,当时一直延迟到了下课的时间,小组成员经讨论,怀疑是否是电脑不兼容或其他问题,后来经问老师,老师说此处的加载这样长的时间是正常的,直到下课后,我们将电脑一直开着到寝室直到软件安装完为止。
问题五:问题二:.不知道维度等概念,不知道怎么设置表间关系的数据源。关系方向不对。
解决办法:百度维度概念,设置好维度表和事实表之间的关系,关系有时候是反的——点击反向,最后成功得到设置好表间关系后的数据源视图。(如图所示)。
这个大图当时完全不知道怎么做,后来问的老师,老师边讲边帮我们操作完成的。
问题六:由于发生以下连接问题,无法将项目部署到“localhost”服务器:无法建立连接。请确保该服务器正在运行。若要验证或更新目标服务器的名称,请在解决方案资源管理器中右键单击相应的项目、选择“项目属性”、单击“部署”选项卡,然后输入服务器的名称。”因为我在配置数据源的时候就无法识别“localhost”,所以我就打开数据库属性页面:图1-图2图一:
图二:
解决办法:解决办法:图2步骤1:从图1到图2后,将目标下的“服务器”成自己的sqlserver服务器名称行sqlservermanagementstudio可以)步骤2:点确定后,选择“处理”,就可以成功部署了。
问题七:无法登陆界面如图:
解决方法:尝试了其他用户登陆,就好了。
(1)在几周的学习中,通过老师课堂上耐心细致的讲解,耐心的指导我们如何一步一步的安装软件,以及老师那些简单清晰明了的课件,是我了解了sql的基础知识,学会了如何创建数据库,以及一些基本的数据应用。陌生到熟悉的过程,从中经历了也体会到了很多感受,面临不同的知识组织,我们也遇到不同困难。
理大数据的规模。大数据进修学习内容模板:
linux安装,文件系统,系统性能分析hadoop学习原理。
大数据飞速发展时代,做一个合格的大数据开发工程师,只有不断完善自己,不断提高自己技术水平,这是一门神奇的课程。
2、在学习sql的过程中,让我们明白了原来自己的电脑可以成为一个数据库,也可以做很多意想不到的事。以及在学习的过程中让我的动手能力增强了,也让我更加懂得了原来电脑的世界是如此的博大精深,如此的神秘。通过这次的学习锻炼了我们的动手能力,上网查阅的能力。改善了我只会用电脑上网的尴尬处境,是电脑的用处更大。让我们的小组更加的团结,每个人对自己的分工更加的明确,也锻炼了我们的团结协作,互帮互助的能力。
3、如果再有机会进行平台搭建,会比这一次的安装更加顺手。而在导入数据库和报表等方面也可以避免再犯相同的错误,在安装lls时可以做的更好。相信报表分析也会做的更加简单明了有条理。
总结。
大数据时代是信息化社会发展必然趋势在大学的最后一学期里学习了这门课程是我们受益匪浅。让我们知道了大数据大量的存在于现代社会生活中随着新兴技术的发展与互联网底层技术的革新数据正在呈指数级增长所有数据的产生形式都是数字化。如何收集、管理和分析海量数据对于企业从事的一切商业活动都显得尤为重要。
大数据时代是信息化社会发展必然趋势,我们只有紧紧跟随时代的发展才能在以后的工作生活中中获得更多的知识和经验。
三、
结语。
大数据时代心得体会篇十
随着科技的发展,我们已经进入了一个数据时代。无论是学校、企业还是政府,数据已经成为日常工作中不可或缺的一部分。在这样的时代里,我们应该如何看待数据以及如何利用它,这是我们每个人都需要思考的问题。在这篇文章中,我将分享我的数据时代心得体会,希望对大家有所启迪。
在数据时代,数据像水一样无处不在,对于各行各业来说,获取和处理数据成为了最基本的需求。数据涉及方面很广,不同行业、不同领域的数据都有不同的价值,但其中最重要的一点就是,数据是价值的源泉。对于企业而言,数据的分析和利用可以提高业务效率、减少成本、增加收益;对于政府而言,数据的分析和利用可以优化公共服务、提高效率、更好地满足民生需求。因此,可以说数据是当今社会创造价值的基础。
2.数据的正确性和分析能力至关重要。
在数据时代中,数据的正确性和分析能力是非常重要的,因为如果数据错误或者分析不准确,将会给企业或者政府带来巨大的风险。因此,需要保证数据的来源和准确性,并且需要具备专业的数据分析能力,准确地从大量的数据中抽取出有价值的信息。同时,数据的保密性和安全性也是需要重视的。
3.数据共享可以带来更多发展机会。
在数据时代,数据共享也成为了一个趋势。通过数据共享,可以让不同机构之间的数据更好地共享和利用,加快各个方面的发展。比如,政府可以公开数据,供社会各方使用和分析,带来公共服务的进步和效率的提升;企业可以与各种业务合作商进行数据共享,更好地满足用户需求,在商业领域实现可持续发展。
在数据时代下,个人隐私保护也成为了一个重要的话题。在收集、分析和利用大量数据的过程中,难免会涉及到个人信息的披露和利用,而这就需要更加完善的管理和监管。企业和政府都需要通过技术手段和法律途径,加强个人隐私的保护,让数据使用得到更加合理的平衡。
5.人类智慧和技术手段应该相互协作。
在数据时代下,人类智慧和技术手段是相辅相成的。数据的分析、利用离不开人类智慧的指导和辅助,而人类智慧的有限性也需要技术手段的帮助。因此,人类和技术应该相互协作,实现更好地数据分析和价值开发。只有这样,才能更好地推动科技的进步和社会的发展。
总的来说,数据时代可以给我们带来很多机遇和挑战。我们需要认真思考数据的价值和正确性,并且要用正确的态度对待数据,实现数据的合理化调用和运用。只有这样,才能在数据时代中赢得更多的发展机会。
大数据时代心得体会篇十一
数据时代是一个无处不在的数字世界,我们生活在这个数字化的时代当中,伴随着科技的不断发展和普及,数据也变得日益庞大、重要且不可倒退。在这个时代里,科技正在重塑着我们的社会形态和人类思维,同时也为我们带来了前所未有的机遇和挑战。通过对于数据时代的思考、探索和实践,我们可以更好地理解这个时代所面临的机遇与挑战,在其中找到我们自己的定位,并不断地完善自己。
数据时代有许多的机遇,它不仅仅是一种生产工具,更是一种创新方式和商业模式。在这个时代里,我们可以通过掌握相关技能、获得数据分析能力,集成多渠道的资源、掌握实时数据、深入挖掘数据,如此种种,才能更好的进入数据时代的角色,转化机遇。通过数据分析,我们可以做到精细化营销、用户需求细分以惠及用户、结合多种方式实现新的业务形态。当然,随着数据时代的到来,要充分利用好数据所提供的机遇并不只这些。
数据时代的挑战并不少。数据时代下的问题,已经不仅仅是如何收集和处理数据,而是如何高效地利用数据进行分析和应用。复杂的分析技术、不稳定的模型、部分数据隐私、多样性的数据资源等等,这些都是数据时代所要面对的挑战。同时,我们也需要提高对于数据的素养,了解大数据安全与数据合规的知识,从而提高数据的价值和安全保障。
第四段:探索数据价值的实践。
数据价值是数据时代的重要指标,它对于企业和个人都有着重要的意义。因此,如何获取和提高数据的价值,已成为我们进入数据时代的重要任务之一。首先,我们需要了解数据,并不断探索数据背后所蕴含的价值,从而实现数据资源的优化利用;其次,我们需要整合数据,建立包含全方位视角的数据管理体系,并实现对数据的全面监测;最后,我们需要通过开放数据共享与创新机制等手段,不断推进数据开放与应用,让数据价值得以最大化。
第五段:结语。
对于数据时代的思考不止于一篇文章,它不断地为改变着我们的生产模式,我们的思维模式和我们的价值观。只有不断探索和实践数据时代的价值,我们才能充分地提升我们的竞争力,成为这个数字化时代的中流砥柱。让我们在这样的时代里,积极拥抱变革、把握机遇,去发掘数据价值带来的更多可能。
大数据时代心得体会篇十二
《大数据时代》这本书写的很好,很值得一读,因为会给我们很多启发,比如你在相关的社交网站发表的言论或者照片都很有可能被“数据科学家”们利用,从而再将相关数据卖给各大网店。下面是本站小编为大家收集整理的大数据时代。
总结,欢迎大家阅读。
利用周末,一口气读完了涂子沛的大作《大数据》。这本书很好看,行文如流水,引人入胜。书中,你读到的不是大数据技术,更多是与大数据相关的美国政治、经济、社会和文化的演进。作为一名信息化从业者,读完全书,我深刻感受到了在信息化方面中国与美国的各自特色,也看到了我们与美国的差距。有几个方面的体会,但窥一斑基本能见全貌。
一是政府业务数据库公开的广度和深度。近年来,随着我国信息公开工作的推进,各级政府都在通过政府门户网站建设积极推进网上政务信息公开,但我们的信息公开,现阶段还主要是政府的政策、法律法规、标准、公文通告、工作职责、办事指南、工作动态、人事任免等行政事务性信息的公开。当然,实时的政府业务数据库公开也已经取得很大进步。在中国政府门户网,可以查询一些公益数据库,如国家统计局的经济统计数据、环保部数据中心提供的全国空气、水文等数据,气象总局提供的全国气象数据,民航总局提供的全国航班信息等;访问各个部委的网站,也能查到很多业务数据,如发改委的项目立项库、工商局的企业信用库、国土资源部的土地证库、国家安监总局的煤矿安全预警信息库、各类工程招标信息库等等。这是一个非常大的进步,也是这么多年电子政务建设所取得的成效和价值!但是,政务业务数据库中的很多数据目前还没有实现公开,很多数据因为部门利益和“保密”等因素,还仅限于部门内部人员使用,没有公开给公众;已经公开的数据也仅限于一部分基本信息和统计信息,更多数据还没有被公开。从《大数据》一书中记录的美国数据公开的实践来看,美国在数据公开的广度和深度都比较大。美国人认为“用纳税人的钱收集的数据应该免费提供给纳税人使用”,尽管美国政府事实上对数据的公开也有抵触,但民愿不可违,美国政府的业务数据越来越公开,尤其是在奥巴马政府签署《透明和开放的政府》文件后,开放力度更加大。是美国联盟政府新建设的统一的数据开放门户网站,网站按照原始数据、地理数据和数据应用工具来组织开放的各类数据,累积开放378529个原始和地理数据集。在中国尚没有这样的数据开放的网站。另外,由于制度的不同,美国业务信息公开的深度也很大,例如,网上公布的美国总统“白宫访客记录”公布的甚至是造访白宫的各类人员的相关信息;美国的网站,能够逐条跟踪、记录、分析联邦政府每一笔财政支出。这在中国,目前应该还没有实现。
二是对政府对业务数据的分析。目前,中国各级政府网站所提供的业务数据基本上还是数据表,部分网站能提供一些统计图,但很少能实现数据的跨部门联机分析、数据关联分析。这主要是由于以往中国政务信息化的建设还处于部门建设阶段。美国在这方面的步伐要快一些,美国的网站,不仅提供原始数据和地理数据,还提供很多数据工具,这些工具很多都是公众、公益组织和一些商业机构提供的,这些应用为数据处理、联机分析、基于社交网络的关联分析等方面提供手段。如上提供的白宫访客搜索工具,可以搜寻到访客信息,并将白宫访客与其他微博、社交网站等进行关联,提高访客的透明度。
三是关于个人数据的隐私。在美国,公民的隐私和自有不可侵犯,美国没有个人身份证,也不能建立基于个人身份证号码的个人信息的关联,建立“中央数据银行”的提案也一再被否决。这一点,在中国不是问题,每个公民有唯一的身份信息,通过身份证信息,可以获取公民的基本信息。今后,随着国家人口基础数据库等基础资源库的建设,公民的社保、医疗等其他相关信息也能方便获取,当然信息还是限于政府部门使用,但很难完全保证整合起来的这些个人信息不被泄露或者利用。
数据是信息化建设的基础,两个大国在大数据领域的互相学习和借鉴,取长补短,将推进世界进入信息时代。我欣喜地看到,美国政府20xx年启动了“大数据研发计划”,投资2亿美元,推动大数据提取、存储、分析、共享、可视化等领域的研究,并将其与超级计算和互联网投资相提并论。同年,中国政府20xx年也批复了“国家政务信息化建设工程规划”,总投资额估计在几百亿,专门有人口、法人、空间、宏观经济和文化等五大资源库的五大建设工程。开放、共享和智能的大数据的时代已经来临!
读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。
“在小数据时代,我们会假象世界是怎样运作的,然后通过收集和分析数据来验证这种假想。”“随着由假想时代到数据时代的过渡,我们也很可能认为我们不在需要理论了。”书中几乎肯定要颠覆统计学的理论和方法,也试图通过引用《连线》杂志主编安德森的话“量子物理学的理论已经脱离实际”来“终结”量子力学。对此我很高兴,因为统计学和量子力学都是我在大学学习时学到抽筋都不能及格的课目。但这两个理论实在太大,太权威,太基本了,我想我不可能靠一本书就能摆脱这两个让我头疼一辈子的东西。作者其实也不敢旗帜鲜明地提出要颠覆它们的论点,毕竟还是在前面加上了“很可能认为”这样的保护伞。
近几十年,我们总是在遇到各种各样的新思维。在新思维面前我们首先应该做到的就是要破和立,要改变自己的传统,跟上时代的脚步。即使脑子还跟不上,嘴巴上也必须跟上,否则可能会被扣上思想僵化甚至阻碍世界发展的大帽子。既然大数据是“通往未来的必然改变”,那我就必须“不受限于传统的思维模式和特定领域里隐含的固有偏见”,跟作者一起先把统计学和量子力学否定掉再说。反正我也不喜欢、也学不会它们。
当我们人类的数据收集和处理能力达到拍字节甚至更大之后,我们可以把样本变成全部,再加上有能力正视混杂性而忽视精确性后,似乎真的可以抛弃以抽样调查为基础的统计学了。但是由统计学和量子力学以及其他很多“我们也很可能认为我们不再需要的”理论上溯,它们几乎都基于一个共同的基础——逻辑。要是不小心把逻辑或者逻辑思维或者逻辑推理一起给“不再需要”的话,就让我很担心了!
《大数据时代》第16页“大数据的核心就是预测”。逻辑是——描述时空信息“类”与“类”之间长时间有效不变的先后变化关系规则。两者似乎是做同一件事。可大数据要的“不是因果关系,而是相关关系”,“知道是什么就够了,没必要知道为什么”,而逻辑学四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明确规定”任何事物都有其存在的充足理由。且逻辑推理三部分——归纳逻辑、溯因逻辑和演绎逻辑都是基于因果关系。两者好像又是对立的。在同一件事上两种方法对立,应该只有一个结果,就是要否定掉其中之一。这就是让我很担心的原因。
可我却不能拭目以待,像旁观者一样等着哪一个“脱颖而出”,因为我身处其中。问题不解决,我就没法思考和工作,自然就没法活了!更何况还有两个更可怕的事情。
其一:量子力学搞了一百多年,为了处理好混杂性问题,把质量和速度结合到能量上去了,为了调和量子力学与相对论的矛盾,又搞出一个量子场论,再七搞八搞又有了虫洞和罗森桥,最后把四维的时空弯曲成允许时间旅行的样子,恨不得马上造成那可怕的时间旅行机器。唯一阻止那些“爱因斯坦”们“瞎胡闹”的就是因果关系,因为爸爸就是爸爸,儿子就是儿子。那么大数据会不会通过正视混杂性,放弃因果关系最后反而搞出时间机器,让爸爸不再是爸爸,儿子不再是儿子了呢?其二:人和机器的根本区别在于人有逻辑思维而机器没有。《大数据时代》也担心“最后做出决策的将是机器而不是人”。如果真的那一天因为放弃逻辑思维而出现科幻电影上描述的机器主宰世界消灭人类的结果,那我还不如现在就趁早跳楼。
还好我知道自己对什么统计学、量子力学、逻辑学和大数据来说都是门外汉,也许上面一大篇都是在胡说八道,所谓的担心根本不存在。但问题出现了,还是解决的好,不然没法睡着觉。自己解决不了就只能依靠专家来指点迷津。
所以想向《大数据时代》的作者提一个合理化建议:把这本书继续写下去,至少加一个第四部分——大数据时代的逻辑思维。
在《大数据时代》一书中,大数据时代与小数据时代的区别:1、思维惯例。大数据时代区别与转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。作者语言绝对,却反思其本质区别。数据的更多、更杂,导致应用主意只能尽量观察,而不是倾其所有进行推理?这也是明智之举2、使用用途。小数据停留在说明过去,大数据用驱动过去来预测未来。笔者认为数据的用途意在何为,与数据本身无关,而与数据的解读者有关,而相关关系更有利于预测未来。3、结构。大数据更多的体现在海量非结构化数据本身与处理方法的整合。大数据更像是理论与现实齐头并进,理论来创立处理非结构化数据的方法,处理结果与未来进行验证。4、分析基础。大数据是在互联网背景下数据从量变到质变的过程。笔者认为,小数据时代也即是信息时代,是大数据时代的前提,大数据时代是升华和进化,本质是相辅相成,而并非相离互斥。
数据未来的故事。数据的发展,给我们带来什么预期和启示?银行业天然有大数据的潜质。客户数据、交易数据、管理数据等海量数据不断增长,海量机遇和挑战也随之而来,适应变革,适者生存。我们可以有更广阔的业务发展空间、可以有更精准的决策判断能力、可以有更优秀的经营管理能力„„可以这些都基于数据的收集、整理、驾驭、分析能力,基于脱颖而出的创新思维和执行。因此,建设“数据仓库”,培养“数据思维”,养成“数据治理”,创造“数据融合”,实现“数据应用”才能拥抱“大数据”时代,从数据中攫取价值,笑看风云变换,稳健赢取未来。
【本文地址:http://www.xuefen.com.cn/zuowen/9416505.html】