当前位置: > 关于睿道 > 新闻中心 > 行业动态
  • 睿道简介
  • 新闻中心
  • 园区环境
  • 联系我们
  • 相关推荐

    大数据技术怎么自学?能学明白吗?

    2020-09-23 来源:Neutech东软睿道

      对零基础想学大数据的同学来说,最好的办法就是:先关注一些大数据领域的动态,让自己融入大数据这样的大环境中。接着找一些编程语言的资料(大数据的基本必备技能)以及大数据入门的视频和书籍,基本的技术知识还是需要了解的。经过一段时间的学习后,如果感觉自己还是可以应付的,就继续寻找视频和大数据书籍。大数据如何自学?大数据如何自学?


      (1)大数据学习业务驱动的回避技术驱动:解决问题是数据科学的核心能力。


      大数据的核心目标是数据驱动的智能化,解决具体的问题,无论是科学研究,还是商业决策,或是政府管理。


      研究前要弄清楚问题,弄清楚问题,所谓的问题导向,目标导向,这个清楚之后再研究选择适当的技术去应用,这样才有针对性,言必hadoop,spark的大规模数据分析是不严谨的。


      各种商业领域需要不同的理论,技术和工具来支持。例如文本、网页要建立自然语言模型,需要对随时间变化的数据流进行序列建模,图像音频和视频多是时空混合的模型,对数据的采集需要进行可视化处理,对数据的返回和预处理需要支持,对存储需要分布式云存储、云计算资源管理等支持,对计算需要分类、预测、描述等模型支持,对应用需要可视化、知识库、决策评估等支持。因此,商业决定技术,技术决定商业,这是大数据学习要避免的第一个误区。


      学习大数据要善于开放源代码,不要重蹈覆辙:数据科学的技术基因在于开放源代码。信息技术前沿的开放源代码已经成为不可逆转的趋势,Android开放源代码让智能手机平民化,让我们跨入移动互联网时代,让智能硬件开放源代码将引领进入物联网时代,迫使传统IT巨头拥抱开放源代码,谷歌和OpenAI联盟的深度学习开放源代码(Tensorflow,Torch,Caffe等)正在加速人工智能技术的发展。


      (3)大数据学习应以点为面,不贪大求全:大数据科学应把握碎片和系统。从前面的大数据技术体系分析可以看出,大数据技术在深度和广度上都是传统信息技术无法比拟的。


      由于精力有限,很难在短时间内在多个领域掌握大数据理论与技术,数据科学必须把握好碎片与系统的关系。


      那么如何把握系统的系统性呢,不同领域的大数据应用有其共性的关键技术,其系统技术架构也有相通之处,比如系统的高度可扩展性,可以进行横向数据的大规模扩展,纵向业务的大规模扩展,高容错性,多源异构环境的支持,对原有系统的兼容与集成等,每一个大数据系统都要考虑到以上问题。


      怎样抓住大数据碎片化学习和系统化设计这两个误区,建议从应用切入,以点带面,先从一个应用领域的实际需要入手,解决一个技术难点,有一定功底后,再举一反三横向扩展,逐步认识其系统化技术。


      学习大数据要有勇气,不能一厢情愿:数据科学还是数据工程?


      大数据只有与特定领域的应用相结合才能产生价值,数据科学或数据工程是研究大数据需要明确的关键问题,搞学术发paper数据科学当然可以,但是大数据应用要落地,如果要将数据科学成果转化为数据工程进行落地应用,就非常困难,这就是很多企业质疑大数据科学价值的原因。至于这种转变需要一个过程,实践者本身就是需要反思和思考的。


      工业部门包括政府管理机构如何引进科研智慧,如何进行数据分析并实现价值?对于数据科学研究者和企业大数据系统开发工程师来说,必须考虑这些关键问题。


      大数据如何走出实验室并在工程中落地,一是不能闭门造车,模型收敛了就想当然万事大吉了;二是要走出实验室,充分地与行业实际决策问题对接;三是不能减少关联关系和因果关系,不能描述因果关系的模型无助于解决现实问题;四是要注重模型的迭代和产品化,不断升级和优化,以解决增量学习和新数据动态调整的问题。


      大数据如何自学?大数据如何自学?学大数据必须弄清楚自己是从事数据科学还是数据工程,需要哪方面的技术能力,自己所处的阶段等等,不能为了技术而技术,这样就很难学好和使用大数据。


      谢谢阅读《大数据问答》分享的《大数据如何自学?大数据如何自我学习?但愿对你有帮助,了解更多的专业培训课程,请关注东软睿道培训机构官网。