网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
03月10日
漏签
0
天
大数据世界吧
关注:
17,373
贴子:
130,881
看贴
图片
吧主推荐
游戏
18
回复贴,共
1
页
<返回大数据世界吧
>0< 加载中...
想从事大数据、海量数据处理相关的工作,如何自学打基础?
只看楼主
收藏
回复
Python大数据
见习维序
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
想做数据处理尤其是大数据量处理的相关工作必须兼具计算机科学基础和统计基础。
现在有一个高大上的职业叫数据科学家,有人说数据科学家就是一个比程序员更懂统计的统计学家,一个比统计学家更会编程的程序员。觉得说得很形象。
送TA礼物
1楼
2018-04-11 14:16
回复
Python大数据
见习维序
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
有很多知识还需要作为基础来学习和巩固。 是学习和巩固,不是必须会,是要知道了解,用的时候知道去哪里翻书找资料
比如:线性代数,概率论、数理统计等
2楼
2018-04-11 14:19
回复(3)
收起回复
2026-03-10 20:13:19
广告
不感兴趣
开通SVIP免广告
Python大数据
见习维序
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
计算机:
数学软件:强大矩阵运算和优化功能的matlab,专而精的mathematica。
语言:python(很流行的科学语言,潜力也很大,ipython这样交互式环境十分有利),fortran(强大的计算语言,充分优化的现成代码),R(相比于matlab,java,c,R是个高富帅)
可视化
3楼
2018-04-11 14:20
回复
收起回复
Python大数据
见习维序
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
这是数据分析各类语言使用度的图表,R占的比例还是相当高啊。想利用现在动辄TB级的数据大显身手,光靠excel可不够啊。你真的需要写很多代码…
统计:时间序列分析
应用回归(很简单,亦很实用)
多元统计分析
4楼
2018-04-11 14:24
回复
收起回复
Python大数据
见习维序
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
一切还是要去动手实践的
1. 自己装个小集群跑hadoop/hive,可以到cloudera网站上下现成的打包虚拟机。看看hadoop in action. 这本书比权威指南容易懂很多。
2. 装个cassandra什么的玩玩,在上面架个小项目,比如留言板什么的。。
3. 读一些著名的paper,nosql的或者mapreduce。
4. 看看apache hadoop家族的其他几个项目,比如zookeeper,pig,了解一下生态圈
到这里为止你大概有个概念,知道bigdata怎么回事了
找个开源项目,看看ticket list,看看能不能自己修。。
能的话看看能不能混进项目组
5楼
2018-04-11 14:26
回复
收起回复
Python大数据
见习维序
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
个人觉得,大数据要靠实践多一点
在真的上百上千节点的cluster上跑hadoop和自己虚拟机架的完全不同。cluster上跑各种奇葩的事情单机都是碰不到的。
就好比dba靠读书考证很难牛*一样。所以最终还是要找个公司实战。
不过如果上面几个都做到的话,基本上应聘大数据公司问题不大了。
6楼
2018-04-11 14:27
回复(3)
收起回复
Python大数据
见习维序
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
有很多知识和课程还需要作为基础来学习和巩固。 是学习和巩固,不是必须会,是要知道了解,用的时候知道去哪里翻书找资料
基础中的基础:线性代数,概率论
核心知识:数理统计、预测模型、机器学习
7楼
2018-04-12 14:57
回复
收起回复
Python大数据
见习维序
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
有很多知识和课程还需要作为基础来学习和巩固。 是学习和巩固,不是必须会,是要知道了解,用的时候知道去哪里翻书找资料
基础中的基础:线性代数,概率论
核心知识:数理统计、预测模型、机器学习
8楼
2018-04-12 14:57
回复
收起回复
2026-03-10 20:07:19
广告
不感兴趣
开通SVIP免广告
Python大数据
见习维序
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
转行的问题可以问我
9楼
2018-04-19 09:48
回复(1)
收起回复
明年今日77
vip玩家
4
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
大数据的学习还是系统性的学习比较好,里面涉及到的组件还是比较多的。
当初我是JAVA开发,自学转的大数据,现在想想那段时间也是挺艰辛的,不过只要坚持下来,终会有收获。
现在我们公司正处于发展阶段,自己有机会接触新的东西,我前段时间刚报了一个人工智能的班。
不停的奋斗下去吧!!!
IP属地:北京
10楼
2018-04-27 11:20
回复(1)
收起回复
加米谷大数据
见习维序
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
学习大数据首先要了解大数据的学习路线,首先搞清楚先学什么,再学什么,
大的学习框架知道了,剩下的就是一步一个脚印踏踏实实从最基础的开始学起。
首先需要学习Java,Java编程技术是大数据学习的基础,是大数据工程师最喜欢的编程工具,想学好大数据,掌握Java基础是必不可少的。
12楼
2019-04-24 10:51
回复
收起回复
百度小说人气榜
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
遗憾收场!Rookie小钰官宣分手
2264400
2
懂王要停战,伊朗秒拒
2153801
3
幽默老日秀专业,狂怼日语小白
1540224
4
雨夜送餐遇伤者,吧友弃单救人
1147905
5
跨省奔现翻车,吧友惨成流浪哥
1055002
6
头婚娶三婚,8.8w拿下娇妻
895975
7
剑指东大!岛国部署远程导弹
652656
8
LPL大瓜:中单密会女网红
639837
9
逐玉播放量造假,注水像开闸
478500
10
活拧巴了!小孩哥cos减速带
379680
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示