菜鸟看R游北京:第七届中国R语言会议

第七届中国R语言会议(北京)结束了,在落园园主的文艺范blog,以及粉丝日志吐槽版blog发布以后,会议的材料终于在前呼万唤中露面COS了。一直想写点什么,以对得起我这个菜鸟第一次去听R会议的事实,并纪念20多个小时的火车去,20多个小时的火车回,以及更多的一些值得记下来的事。

犹豫不决的报名

作为一个菜鸟,以前是从来没有去参加过R语言会议的,一个是太菜,另外一个是太远,四川距离北京实在是有点远,虽然飞机只要一个多小时就能到,但飞机票无人报销,。好一个人穷志短的借口。。。更何况恐怖的首堵、恐怖的雾霾,还有工作中加不完的班,给领导做不完的ppt等等。简单的说,可以找出一百个不去的理由,但很难找出几条可以去的理由。我想报名的唯一理由是:我想去听听,不知道为什么,木有什么理由。。。

在犹豫不决中,压死骆驼的最后一根稻草是家庭。5月初的一个周末,老婆看着电视,突然冒出一句:你什么时候带我们去北京看看呢?刹那间,让我决定去看看传说中的R语言会议。接下来就是忽悠领导,说有个免费的关于数据处理的会议,有意义有前途有作为,一直关心我的领导给我开了绿灯。。。然后就是订火车票,订房间,查地图,准备儿子的东西。。。

初到北京

20多个小时的火车,虽然是卧铺,依然难受,儿子一路上不是很开心,因为他要错过幼儿园里的六一表演,我一直纳闷,为什么他们幼儿园的表演会提前到5月23日!!直到遇到同一车厢里的另外一个小朋友,开始不停的上窜下跳。

下车时间是中午13点,空气出人意料的好,没有雾霾,没有早高峰晚高峰午高峰,真是奇怪,首都知道我要来吗?

感谢那个至今还没有见过面的业务单位的朋友,帮我找了一个廉价但很干净的小宾馆,距离人大很近,有窗户有空调有wifi,让我没有瞎订所谓的“大床房A”。趁会议前一天的时间,带老婆孩子逛了一下动物园和颐和园,感受了北京很大,北京地铁很便宜。。。

参会感受

一大早,带着报名单就直奔人大,到了明德楼还不到7点。当初报名的时候,感觉会议很有意义,直接上了二维码,中途还收到两次短信,提醒参会注意事项,不过在小雨中,艰难的找到换取门票的小广场以后,还是体会到了免费会议与商业会议的区别,神马二维码神马安保严密似乎只是提醒大家自律,我还以为会有一个扫描二维码的小终端扫一下就给换票了,结果是让我掏出身份证,核对一下报名单上和身份证上的名字是不是一样,然后留下报名单,拿着门票走人,在那忙活的一个小伙说这样是避免有人重复去领票,期间听到有人称呼“轩哥”,是邱怡轩大侠么?

自从离开学校以后,就很少走进如此大的礼堂了,人大气派,这是走进如论讲堂的第一感受。会议如期召开,主持人嘉宾逐一亮相,上午的会议全是大咖的舞台。

传说中的Hadley Wickham带着他的耳钉来了,遗憾的是我虽然认得26个字母,但听不懂他在说什么,我在心里安慰了一下自己,没关系,他也听不懂我说四川话,然后就释然了。。。

百度的余凯大牛来了,深度学习是众多玩数据的大专家小专家的追求,我只能仰望星空,从大讲堂的第五排望上去,在主席台上的灯光辉映下,我恍然有了一种追星的赶脚。。。

北大的王汉生教授来了,他用一种传经授道的朴实风格,将学术问题娓娓道来,我恍然如梦,考不起好学校,能在这些时候感受一下名师,也是千载难逢的。。。

微软的周明专家,既没有激情,也没有煽动,用平稳的语调,介绍了如何让计算机提高文学才华,以至于能对对联的轶事,非常有趣,我唯一的疑惑是,断断续续花了9年的时候做这个事,他的利益驱动力到底是什么?

下午去晚了,参会的人明显少多了。 走进讲堂时,腾讯的靳志辉的报告《广告定向中的用户分析》已接近尾声,算法、模型啥的,基本听不懂,最大的感受是qq能不用就不用,在大数据云计算的环境下,什么潜在的东西都能被挖出来,虽然靳志辉说不允许使用聊天记录的,但是,哈哈。。。

接下来的Lightning Talk,对于我来说是非常新奇的事,主持人林博士气场之大让人佩服,而1degreenorth来的专家的发言给了我一种震撼的感觉,等这个环节结束,我就去找他,可惜没找到人。。。

其他的讲演记不太清楚了,一个台湾来的教授,带来了一群学生,在舞台上表演了一个小节目,创意很好,但效果貌似不太好,优酷土豆的廖女士分享了一些有趣的关于看视频的数据分析结果。

大数据/数据科学主题讨论&提问环节,众多嘉宾分享了他们的感受和建议,对我来说,感受比较深的是“什么是大数据”?以前在很多材料里也不停的写上大数据,但是到底什么是大数据,还真没想过,现在对这个问题的认识要深入一点,至少,可以简单的表达为:普通人没有能力处理的数据就是大数据。虽然不严谨不科学,但更容易理解了。站在这个角度上,大数据无处不见,过去有,现在也有,将来也不会没有!

第二天的会议分为三个会场,让人纠结不已。。。最后选择了听C会场的上午,B会场的下午。

上午来自台湾的郭韦廷先生介绍了Data Analysis with R and Python,作为pandas的贡献人之一,郭先生在python方面应该是非常厉害的,不过这个报告更多是推介python,告诉大家R能做的事,python多数能做了,因为python和R一样,非常善于借鉴(抄袭)其他软件的优秀功能。。。看了郭先生的报告,我能感受到谢益辉大人长期以来的担忧,蟒蛇会不会把小众的R干掉?iPython和knitr犹如克隆兄弟,pandas把R中的很多优点吸收进去了,嗯,还是不想了。。。不过必须要吐槽,R中读文件的命令是read.csv,pandas中读文件的命令是pandas.read_csv,我在那翻江倒海,为什么又是小数点又是下划线的呢?你就不能全搞成下划线或者全搞成小数点?开源软件里由于规则不是那么强,长期以来类似的这样的随意的定义,很多时候,需要业余使用人员付出极大的学习成本。。。希望我的这些话不会让开源软件的贡献者伤心难过。

接下来的是李舰先生的:R与Office的整合,这个题目很吸引我,作为一个长期被ppt困扰的屌丝,从最初的喜欢ppt到做不完的ppt,很自然的快速转变为恨ppt,但是我还是离不开ppt,怎么让ppt自动化是非常吸引我的,李舰先生的包,从读入一个ppt开始,自动获取相关属性,在这个基础上操作编辑ppt,应该是一个很好的思路,只是暂时看不到这个包能给与提高生产力带来太多的效果。。。

在经历了主持人死板的休息30min后,迎来了林荟女士:数据分析在传统行业商业决策中的应用。林女士的上台,吸引人的不仅是她的美貌,首先以一个不能完全相信p值的例子显示了她的专业素养,然后分享了很多数据分析与业务部门之间交流沟通的经验教训,给了我很多感触和共鸣。

欧阳鹤先生的小而美的数据产品,同样给了我很多感触,世界上的数据如此之多,以至于我们每天都被淹得奄奄一息,每天的图画如此之多,以至于我们很多时候有审美疲劳。欧阳先生的很多观点深入我心,低调、和谐的配色,简明的图表,是我以后努力的方向,欧阳先生利用shiny架构的自动报表也给了我很多启示,有时间的时候,我也想尝试一下,自己架设一个生产动态的报表。。。

上午的最后一场,迎来了刘思喆先生,R与企业级数据挖掘这个题目已经非常吸引人了,更何况前一天北大的王教授在大会上公开赞赏刘先生,再加上这里是人民大学,陆陆续续来了更多的人来旁听,教室已经挤不下了,宣讲结束以后,主持人破例说可以提问,要知道前面两位,尤其是欧阳鹤先生是从上海过来的,一个提问的机会都没给,而再前面,休息时间是满满的30min,不过也可以理解,主场优势么,哈。 吐槽吐多了,并非对刘先生不敬,而是觉得免费会议,组织方面确实还是有一点点问题的,我有点太难为这些学生了。回归正题,刘先生的演讲很给力,我这个门外汉也听懂了不少,不过那个HTC的例子,我有点疑惑。。。对于手机这样的产品,我想对于大部分的消费者来说,应该很难在短期内再次购买同一型号的手机吧?也就是说,对于不同的商品,应该是不能放到统一的尺度上去衡量的,也许是我没听懂。。。

下午的会议,本来是想去听A会场的可视化,但人太多了,直接没地方站,于是跑到了B会场,首先听了任坤同学的《构建高效率的数据流水线:在R中使用管道操作》,面对面的听任同学的讲述前因后果,演示案例,比读他的博客直白得多。

张晔先生:科研角度下的R包开发,我听到了满满的信心和善意的总结,太过专业的内容也没太听明白。

最后一个是邱怡轩的演讲,不过看了他的题目我就发怵,跑到一楼去看hadley的耳钉了。

最后,必须要总结一下本次会议的参会感受,总体来说,感触多于收获,如同落园园主所说,感觉R已经沦为配角,大数据已经冲到最前面,当然对于我这样的业余使用R的菜鸟来说,更多的能体会到的是大咖在讲思路,技术达人在讲经验教训。

北京游玩

第一天上午:动物园

很大,花了很长时间看熊猫,我很感叹,我们大老远从四川跑过来看熊猫?

第一天下午:颐和园

很大很大很大。。。 没有请导游,为了省钱。。 然后就是围着湖转悠,儿子什么也不在意,不停的要吃零食,老婆不停的感叹:以前那些宫女住这么好的地方为什么还哭哭啼啼的不乐意呢?我很无语。

第二天:我参会,老婆带着孩子睡懒觉,逛超市。

第三天:一日游

老婆大人来北京的两个重要目标分别是看升国旗、爬长城,我头疼了很久,主要是行程太紧张,我抽不出时间陪她去,何况还带着儿子呢。虽然我一直觉得北京满大街的一日游不靠谱,但还是拗不过老婆,给她和儿子报了一日游,顺带查了一下升国旗时间:早上4:50,执着的老婆还是要带着儿子去,于是那天早上3点就被司机的电话闹醒了,收拾东西抱着睡梦中的儿子出门,把老婆送到天安门广场,在大巴司机的大喇叭忽悠声中,透过车窗看到了一眼中南海门口的小型升旗仪式,为了那2分零7秒,我还是很佩服我老婆的,同时是心疼儿子。。。

过了天安门广场,我下了大巴,老婆带着儿子去了长城,我在一片困意中昏昏的搭上地铁,回到人民大学继续听R会议。中午接到老婆的电话,他们已经从长城往回走,下午在鸟巢碰头,忙碌了一天的儿子虽然还想玩,但走路已经不利索了,我抱着他转了一下鸟巢,看了一下水立方,算是来过北京了。

第四天:全家重游天安门广场

退房以后,在人大西门新开的庆丰包子铺吃了物美价廉的一顿饭,然后再次来到天安门广场,由于是周一,很多地方闭馆,钱包没有大幅度减肥,拍拍照,晒晒太阳,本来计划要去全聚德吃午餐的,在烈日下找不到路了,又担心赶不上火车,放弃。。。

总结

最后总结了一下,这次北京之行,感触多于收获:

  • 学好数学很重要
  • 学好英语很重要
  • 有点钱很重要,这样就不用做这么久的火车去了。。。

最惊喜的收获:在小宾馆里,儿子喜欢上淋浴了,在家里教了好久,他都不乐意,真是人算不如天算!

菜鸟看R游北京:第七届中国R语言会议” 中有 2 条评论

    1. 太云大侠居然把这篇帖子挖出来了,在做关于R会议的总结么?

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注