您现在所在位置：首页 > 睿道新闻

大数据技术怎么自学?能学明白吗?

发布时间：2020-09-23点击数：

　　对零基础想学大数据的同学来说，最好的办法就是：先关注一些大数据领域的动态，让自己融入大数据这样的大环境中。接着找一些编程语言的资料(大数据的基本必备技能)以及大数据入门的视频和书籍，基本的技术知识还是需要了解的。经过一段时间的学习后，如果感觉自己还是可以应付的，就继续寻找视频和大数据书籍。大数据如何自学?大数据如何自学?

　　(1)大数据学习业务驱动的回避技术驱动：解决问题是数据科学的核心能力。

　　大数据的核心目标是数据驱动的智能化，解决具体的问题，无论是科学研究，还是商业决策，或是政府管理。

　　研究前要弄清楚问题，弄清楚问题，所谓的问题导向，目标导向，这个清楚之后再研究选择适当的技术去应用，这样才有针对性，言必hadoop,spark的大规模数据分析是不严谨的。

　　各种商业领域需要不同的理论，技术和工具来支持。例如文本、网页要建立自然语言模型，需要对随时间变化的数据流进行序列建模，图像音频和视频多是时空混合的模型，对数据的采集需要进行可视化处理，对数据的返回和预处理需要支持，对存储需要分布式云存储、云计算资源管理等支持，对计算需要分类、预测、描述等模型支持，对应用需要可视化、知识库、决策评估等支持。因此，商业决定技术，技术决定商业，这是大数据学习要避免的第一个误区。

　　学习大数据要善于开放源代码，不要重蹈覆辙：数据科学的技术基因在于开放源代码。信息技术前沿的开放源代码已经成为不可逆转的趋势，Android开放源代码让智能手机平民化，让我们跨入移动互联网时代，让智能硬件开放源代码将引领进入物联网时代，迫使传统IT巨头拥抱开放源代码，谷歌和OpenAI联盟的深度学习开放源代码(Tensorflow,Torch,Caffe等)正在加速人工智能技术的发展。

　　(3)大数据学习应以点为面，不贪大求全：大数据科学应把握碎片和系统。从前面的大数据技术体系分析可以看出，大数据技术在深度和广度上都是传统信息技术无法比拟的。

　　由于精力有限，很难在短时间内在多个领域掌握大数据理论与技术，数据科学必须把握好碎片与系统的关系。

　　那么如何把握系统的系统性呢，不同领域的大数据应用有其共性的关键技术，其系统技术架构也有相通之处，比如系统的高度可扩展性，可以进行横向数据的大规模扩展，纵向业务的大规模扩展，高容错性，多源异构环境的支持，对原有系统的兼容与集成等，每一个大数据系统都要考虑到以上问题。

　　怎样抓住大数据碎片化学习和系统化设计这两个误区，建议从应用切入，以点带面，先从一个应用领域的实际需要入手，解决一个技术难点，有一定功底后，再举一反三横向扩展，逐步认识其系统化技术。

　　学习大数据要有勇气，不能一厢情愿：数据科学还是数据工程?

　　大数据只有与特定领域的应用相结合才能产生价值，数据科学或数据工程是研究大数据需要明确的关键问题，搞学术发paper数据科学当然可以，但是大数据应用要落地，如果要将数据科学成果转化为数据工程进行落地应用，就非常困难，这就是很多企业质疑大数据科学价值的原因。至于这种转变需要一个过程，实践者本身就是需要反思和思考的。

　　工业部门包括政府管理机构如何引进科研智慧，如何进行数据分析并实现价值?对于数据科学研究者和企业大数据系统开发工程师来说，必须考虑这些关键问题。

　　大数据如何走出实验室并在工程中落地，一是不能闭门造车，模型收敛了就想当然万事大吉了;二是要走出实验室，充分地与行业实际决策问题对接;三是不能减少关联关系和因果关系，不能描述因果关系的模型无助于解决现实问题;四是要注重模型的迭代和产品化，不断升级和优化，以解决增量学习和新数据动态调整的问题。

　　大数据如何自学?大数据如何自学?学大数据必须弄清楚自己是从事数据科学还是数据工程，需要哪方面的技术能力，自己所处的阶段等等，不能为了技术而技术，这样就很难学好和使用大数据。

　　谢谢阅读《大数据问答》分享的《大数据如何自学?大数据如何自我学习?但愿对你有帮助，了解更多的专业培训课程，请关注东软睿道培训机构官网。

上一篇：选一个好的大数据编程培训机构很重要?

下一篇：云计算大数据培训怎么学?