炼数成金 门户 培训 查看内容

基于案例学抽样技术

2014-12-9 10:33| 发布者: 仙豆| 查看: 398266| 评论: 0|原作者: cruiser

快速报名入口
课程简介:
这是一项高级统计课程。
在大数据的年代,很多数据分析的场景,数据规模很可能已经超出单台计算机的处理能力。纵观大数据的处理方法无非有三:一是采用Hadoop、Spark、Storm等分布式计算技术利用计算机集群硬扛负荷,二是通过降低求解精度然后改进算法,使之能以更高速度运行,三是采用抽样的方法,把大数据转化为小数据,这样就可以采用传统常规方法处理。所以抽样技术是当前处理大数据分析的重要手段之一。
对于抽样第一印象是简单随机抽样,好像不用学习什么高深的知识,谁都会懂。但实际情况要远远复杂得多,首先抽样方法远不止随机抽样一种,另外像样本大小的选取(选得太多成本高,太少则精度差),抽样方式的选择,甚至是调查问卷的设计,都是非常高技巧的工作,需要用到高端的概率统计甚至社会学,心理学等方面的知识,在某种角度看,抽样技术又是一种交叉学科。一个现实的例子, 1936年Literary Digest 杂志所做的美国总统民意调查结果因为抽样方法不对与实际大幅偏差,而统计学家盖洛普发明的民意调查方法则有非常较精确的表现,发展至今成为世界著名的品牌。如果抽样是简单的事情,那么人人几乎都可以当盖洛普了。
本课程将从实际案例出发学习各种抽样技术以及相应的数据处理技巧。使学习者成为用高端统计知识武装起来的大数据工作者:知道在什么场景该使用怎样的抽样方法,而不仅仅是生搬硬套。合理的抽样处理不仅可以为你的企业节约成本,还能让数据处理更加准确,计算更快速,从样本中推测的结果更有参考意义。

课程内容:
第1周:抽样调查的认识与概述:带你认识真正的抽样调查
第2周:身体素质调查:简单随机抽样的原理与应用
第3周:媒体受众抽样调查:总体差异的解决方法——分层抽样
第4周:互联网行为调查案例:多阶段抽样
第5周:服装公司对人的体型尺寸抽样调查:整群抽样
第6周:城市噪音问题调查:不等概抽样
第7周:收入调查:系统抽样
第8周:其他抽样调查介绍
第9周:调查中的复杂样本与其方差估计
第10周:调查中的非抽样误差
第11周:美国CPS案例分析

授课时间:
第1期课程将于2015年1月31日开课,课程预计持续时间为13课。

授课对象:
掌握《大数据的统计学基础》课程或同等水平统计知识的朋友

课程目标:
看简单的抽样不简单,看复杂的抽样不复杂,一切尽在掌握之中

授课讲师:
何翠仪,中山大学统计学专业毕业,炼数成金专职讲师,曾讲授《大数据的统计学基础》《大数据的矩阵计算基础》《量化投资》《金融时间序列》等课程。主持建设炼数成金的R语言认证题库系统(即将上线)。

新颖的课程收费形式:“逆向收费”约等于免费学习,仅收取100元固定收费+300元暂存学费,学习圆满则全额奖励返还给学员!

本门课程本来打算完全免费,某位大神曾经说过“成功就是正确的方向再加上适度的压力”。考虑到讲师本身要付出巨大的劳动,为了防止一些朋友在学习途中半途而废,浪费了讲师的付出,为此我们计划模仿某些健身课程,使用“逆向收费”的方法。
在报名时每位报名者收取400元,其中100元为固定 收费,另外300是暂存学费,即如果学员能完成全部课程要求,包括完成全部的书面和互动作业,则300元全款退回。如果学员未能坚持到完全所有的学习计划任务,则会被扣款。期望这种方式可以转化为大家强烈的学习愿望和驱动力!

课程授课方式:
1、 学习方式:老师发布教学资料、教材,幻灯片和视频,学员通过网络下载学习。同时通过论坛互动中老师对学员进行指导及学员之间相互交流。
2、 学习作业:老师每周布置书面及互动作业,学员需按时按质完成作业。
3、 老师辅导:根据作业批改中发现的问题,针对性给予辅导,帮助大家掌握知识。
4、 结业测验:通过测验,完成学业。

您是否对此课程还有疑问,那么请 点击进入 FAQ,您的问题将基本得到解答
全国统一咨询热线 4008-010-006

课程现开始接受报名,报名方式
网上报名 请点击:基于案例学抽样技术
咨询Email :edu01@dataguru.cnedu02@dataguru.cn
课程入门讨论咨询群:
303917420(群内有培训公开课视频供大家免费观看)
咨询QQ: 2222010006 (上班时间在线)


技术热点、 行业资讯,培训课程信息,尽在炼数成金官方微信,低成本传递高端知识!技术成就梦想!欢迎关注!
打开微信,使用扫一扫功能,即刻关注炼数成金官方微信账户,不容错过的精彩,期待您的体验!!!
快速报名入口

即将开课

    热门文章

       

      GMT+8, 2024-11-1 09:31 , Processed in 0.252124 second(s), 34 queries .