网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
12月15日漏签0天
浙江师范大学吧 关注:212,195贴子:3,893,311
  • 看贴

  • 图片

  • 吧主推荐

  • 视频

  • 游戏

  • 4回复贴,共1页
<<返回浙江师范大学吧
>0< 加载中...

浙师大大数据创新创业班招生公告—(适合15级本科生和17级研究生

  • 只看楼主
  • 收藏

  • 回复
  • gordon0825
  • 微风细雨
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
不会数据分析的你,正在失去职业竞争力......
“为什么要学习数据分析?如果你想到找一个拥有大量需求的职业,你需要为一些越来越常见以及廉价的东西提供稀缺且附带额外价值的服务。什么东西正变得越来越常见和飞速积累?数据。什么是为数据提供稀缺且附带额外价值的服务?分析。”
——Hal Varian 加州大学伯克利分校 Google 首席经济学家
在依靠数据驱动的商业世界中,数据分析已经是IT互联网、咨询、广告等行业从业者必备的职业技能。
浙师大正阳旅游研究院再度携手北京CDA数据分析研究院,开展第二期正阳旅游大数据创新创业班,以学生就业为导向,为学生免费提供从零基础到入门,从入门到专业进阶,再落实到旅游行业,为优秀学生提供大型旅游互联网公司实习和工作机会,帮助学生完成由非专业到大数据,由学生到企业的双过渡,以填补目前旅游大数据分析人才的巨大缺口(每年缺口150万)。
课程简介:
进入2012年以来,大数据一词越来越多地被提及与使用,人们用它来描述和定义信息爆炸时代产生的海量数据。为了顺应时代的发展,为了适应大数据时代智慧旅游发展的实际需要,在我校战略合作单位义乌正阳旅游产业发展有限公司的大力支持下,校正阳旅游研究院联手北京CDA数据分析研究院举办第二期“浙江师范大学正阳旅游大数据创新创业班”。
该创新创业班以学生就业为导向,为学生免费提供从零基础到入门,从入门到专业进阶,再落实到旅游行业的全程学习机会,同时还向优秀学生提供大型旅游在线企业(OTA,如携程、去哪儿等)的实习机会,帮助学生完成由非专业到大数据,由学生到企业的双重过渡,最终为填补目前国内旅游大数据分析人才的巨大缺口做出我们力所能及的贡献。
招生对象:全校2015级本科生和2017级研究生,专业不限,男女不限,不收取任何学费,预计招收30名左右的学员。
上课模式:
第一阶段:远程视频课程
4月13日开始为期6周,课程内容为统计理论基础、R语言入门与数据分析员初级三门课程,期间校内专业教师与授课团队成员也会在线上线下对大家进行辅导和答疑;
第二阶段:入学测试
三门课程结束后将在6月初安排入学测试,将依据此次测试的成绩择优录取进入第三阶段的现场授课;
第三阶段:现场授课
课程大纲及具体时间安排:
时间安排 授课内容
第1天 主题:数据挖掘基础
理论介绍:数据挖掘在政府部门及各行业的应用数据挖掘的起源、定义及目标数据挖掘的发展历程数据库中的知识发掘步骤(KDD)数据挖掘技术的产业标准(CRISP DM)数据挖掘技术的功能分类数据挖掘相关网站介绍(KDnuggets & Kaggle)
IBM SPSS Modeler & 开源软件R实作,使用数据集:天气数据集、玻璃制品数据集
第2~3天 主题:R语言基础
理论介绍:R语言简介及R软件操作R语言的基本运算R语言的程序处理流程
开源软件R实作,使用数据集:疾病诊断数据集、寿险促销数据集
阶段练习一 2天
第4~5天 主题:数据爬虫技术
理论介绍:爬虫简介:爬取你第一个数据爬取数据:正则表达式、beautiful soup、LxmlHTML网页解析使用APIs爬虫数据储存容器:MongoDB、SQL用 NLTK 进行爬虫的自然语言处理实时多线程爬虫动态网页爬虫方法表格互动爬虫CAPTCHA爬虫Login爬虫spider shell命令爬虫爬虫可视化 Portia马尔科夫链方法避免爬虫陷阱高难度网页爬虫
数据爬虫实作:爬取去哪儿网站数据
阶段练习二 2天
第6~7天 主题:基础数据挖掘及数据前处理技术
理论介绍:描述性统计及可视化技术案例为本的学习(Case-based Learning): KNN(K Nearest Neighbors)数据前处理(Data Preprocessing)技术字段选择(Attribute Selection)数据清洗(Data Cleansing)字段扩充(Attribute Enrichment)数据编码(Data Coding)
IBM SPSS Modeler & 开源软件R及WEKA实作,使用数据集:新车设计数据集、信用评等数据集、药物治疗数据集、电信客户流失数据集、鸢尾花数据集、糖尿病数据集、电离层雷达侦测数据集
阶段练习三 2天
第8天 主题:进阶数据挖掘技术1
理论介绍:训练数据与测试数据的产生方法(随机取样切割法&分层抽样切割法)无效变量(不相关变量&多余变量)统计方式的变量选择模型方式的变量选择
IBM SPSS Modeler & 开源软件R及WEKA实作,使用数据集:信用评等数据集、玻璃制品数据集
第9天 主题:进阶数据挖掘技术2
理论介绍:分类之简单贝式网络(Naïve Bayes)及贝式网络(Bayes Net)分类之决策树(Decision Tree):ID3, C5.0, CART & CHAID分类模型的评估
IBM SPSS Modeler & 开源软件R及WEKA实作,使用数据集:银行客户营销数据集、电信产品跨销售(Cross-Selling)数据集、疾病诊断数据集、寿险推销数据集、糖尿病预测数据集、乳癌数据集、天气数据集、影像数据集
阶段练习四及期中测试 2天
第10天 主题:进阶数据挖掘技术3
理论介绍:分类之神经网络(Neural Network)分类之罗吉斯回归(Logistic Regression)分类模型的评估
IBM SPSS Modeler & 开源软件R及WEKA实作,使用数据集:细胞样本数据集、零售促銷数据集、电信客户分类(不同套餐选择)数据集、电信客户流失数据集、便利超商选点数据集、房价数据集、AISPACE神经网络系统介绍、可视化工具(Boundary Visualizer)实作
第11天 主题:进阶数据挖掘技术4
理论介绍:分类之支持向量机(Support Vector Machine)分类之多模型整合(Ensemble):装袋(Bagging)、增强(Boosting)学习分类之多模型整合(Ensemble):随机森林(Random Forest)
IBM SPSS Modeler & 开源软件R及WEKA实作,使用数据集:电信客户流失数据集、糖尿病数据集
阶段练习五 2天
第12天 主题:进阶数据挖掘技术5
理论介绍:预测之简单线性回归(Simple Linear Regression)、复回归(Multiple Linear Regression)及相关系数(Correlation Coefficient)预测之回归树(Regression Tree)预测之类神经网络(Neural Network)-非线性回归预测模型的效能评估(MAE, MSE, RMSE, R2, Adjusted R2, AIC & BIC)
IBM SPSS Modeler & 开源软件R及WEKA实作,使用数据集:汽车油耗数据集、CPU效能数据集
第13天 主题:进阶数据挖掘技术6
理论介绍:相似性的衡量及距离的计算阶层式聚类(Hierarchical Clustering)分割式聚类(Partitioning Clustering)群数的判断(R2, Semi-Partial R2)
IBM SPSS Modeler & 开源软件R及WEKA实作,使用数据集:银行客户数据集、鸢尾花数据集
阶段练习六 2天
第14天 主题:进阶数据挖掘技术7
理论介绍:关联规则的评估指针(支持度、信赖度及提升度)关联分析(Association Analysis): Apriori算法关联规则的延伸(虚拟商品、负向关联规则及相依性网络)序列分析的评估指针(支持度、信赖度)序列分析(Sequence Analysis): AprioriAll算法序列分析的延伸(状态移转网络)
IBM SPSS Modeler & 开源软件R及WEKA实作,使用数据集:零售购物篮数据集
第15天 主题:可视化技术
Power BI可视化报表 Pyecharts简介 R调用Echarts R语言ggplot2绘图
可视化实操:某女装淘宝店铺选品模型,某网站为用户提供旅游产品导购推荐
阶段练习七 2天
第16天 主题:项目操作一
涉及理论:数据探索及数据质量报告数据前处理(空值、离群值处理)分类技术(贝式网络、决策树、神经网络、罗吉斯回归等)进阶分类技术(支持向量机、多模型整合之装袋、增强、随机森林等)建模结果报告及模型解读
第17天 主题:项目操作二
涉及理论:样本期间及好坏客户定义数据探索及数据质量报告数据前处理(区隔化模型建置、数值型属性趋势离散化)单变量分析(母体稳定度指针、讯息价值)罗吉斯回归、WOE、Dummy Variable罗吉斯回归转评分卡建模结果报告(Gini系数、KS值、ROC曲线)及模型解读
主题:项目操作三
涉及理论:数据探索及数据质量报告数据前处理(空值、离群值处理、类别型属性趋势离散化、衍生字段处理)分类技术(贝式网络、决策树、神经网络、罗吉斯回归等)进阶分类技术(支持向量机、多模型整合之装袋、增强、随机森林等)建模结果报告及模型解读
综合练习+结业案例指导、期末测试 3天
预期收获:
通过几个月的学习,可以让全体学员得到以下收获:
(1)所有学员均可加入CDA免费成为CDA俱乐部会员,免费参与CDA会员相关活动。
(2)课程全部结束后的综合考核将采取小组项目汇报的形式进行,评审专家除了外聘讲师外还有部分业内知名专家。整个小组项目汇报CDA将进行全程推广,并安排全国现场直播,同时安排媒体进行跟踪报道,优秀作品CDA官微进行推广。
(3)综合考核成绩合格的学员可免费颁发北京经管之家CDA数据分析师结业证书。
(4)完成学习任务并综合考核合格后本科生可以获得14个学分,可依次抵扣创新性实践学分、通识课程②学分及个性化课程学分。
(5)综合考核成绩优秀者可以获得北京经管之家提供的简历修改指导及推荐就业(北上广为主)的机会。


  • gordon0825
  • 微风细雨
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
感兴趣的同学可以进入QQ群316394169详细了解,该群由经管学院创建


2025-12-15 08:19:57
广告
不感兴趣
开通SVIP免广告
  • gordon0825
  • 微风细雨
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
顶!d=====( ̄▽ ̄*)b一下


  • gordon0825
  • 微风细雨
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
7、8个人加群了也不在这里留个言,表示很不开心


  • gordon0825
  • 微风细雨
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
浙师大的学生都这么低调吗,报名的同学请回来帮忙顶一下啊


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 4回复贴,共1页
<<返回浙江师范大学吧
分享到:
©2025 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示